L/O/G/O
TRƯỜNG ĐẠI HỌC NÔNG LÂM TPHCM
MÔN: XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC
CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ
GVHD: Thầy Võ Văn Việt
Nhóm 4
Thành Viên Nhóm
1.
2.
3.
4.
5.
6.
7.
8.
Nguyễn Thị Hằng
13132176
Mai Quang Trung
13132073
Hồng Thị Hường
12132044
Nguyễn Thị Oanh
12132181
Đỗ Viết Hùng
13132201
Hàm Thị Mỹ Duy
13132128
Nguyễn Lê Bảo Lộc 13132039
Lê Tuấn Anh
13132095
•
•
CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ CHO BẢNG TẦN SỐ
•
CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN
III
II
I
CÁC ĐẠI LƯỢNG ĐO LƯỜNG MỨC ĐỘ TẬP TRUNG CỦA TẬP DỮ LIỆU
MỤC LỤC
VÀ PHƯƠNG PHÁP MƠ TẢ HÌNH DÁNG CỦA TẬP DỮ LIỆU
•
PHÂN BIỆT MỘT SỐ CẶP KHÁI NIỆM
KHÁM PHÁ DỮ LIỆU QUA BIỂU ĐỒ HỘP VÀ RÂU (BOXPLOT)
•
SỬ DỤNG KẾT HỢP TRUNG BÌNH VÀ ĐỘ LỆCH TIÊU CHUẨN
•
VII
VI
V
IV
I.1. CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG
1.1 Trung bình cộng ( Arithmetic mean )
Trung bình cộng đơn giản (mean)
Trong đó:
=
: trung bình cộng đơn giản
n : số quan sát hay cỡ mẫu
xi: giá trị trên quan sát thứ i
Trung bình cộng có trọng số
(weighted mean )
Trong đó:
=
Xi: là các giá trị quan sát được
Wi: là các trọng số tương ứng với Xi
1.
Trung bình cộng có một nhược điểm lớn nhất là rất
nhạy cảm với giá trị ngoại lệ
Lưu ý
2. Khơng tính dữ liệu trung bình cho dữ liệu
định danh
3. Có nên tính trị trung bình cho dữ liệu định lượng
đo lường bằng thang đo khoảng hay không?
1.2 Trung vị (Median) - Me
● ● ● ● ● ● ●
1
3
7
2
5
9
6
● ● ● ● ● ● ●
Sắp xếp:
1
2
3
5
6
7
9
Me = 5
● ● ● ○ ● ● ●
1
2
3
5
6
7
Me = 4
Nếu
● ● ● ● ● ●
1
2
3
5
6
7
9
1.
Tránh nhầm lẫn giữa vị trí và giá trị của trung vị
Lưu ý
2. Trung vị không bị ảnh hưởng bởi giá trị ngoại lệ
1.3 Số Mode (Mo)
● ● ● ● ● ● ● ● ●
1
2
3
3
3
4
4
5
6
Số mode không bị ảnh hưởng bởi giá trị ngoại lệ
Lưu ý
Một tập dữ liệu có thể có một mode,có nhiều mode hoặc
Một mode:
1 2 3 3 3 4 4 5 6
Nhiều mode:
1 2 2 2 3 4 4 4 5
Không mode:
1 2 3 4 5 6 7 8 9
khơng có mode nào
1.4 Trung bình nhân ( Geometric mean)
Có bản chất và cách tính khác hẳn trung bình cộng
Tổng qt:
Nếu có n giá trị có quan hệ tích số kiểu:
* * …..* thì số trung bình nhân của n giá trị này được xác định theo cơng thức:
Trung bình nhân được vận dụng để tính tốc độ phát triển trung bình khi các giá trị là các con số có tốc độ phát triển liên hoàn
( sẽ được lý giải ở chương 13)
I.2. Sử dụng Excel để tính tốn các đại lượng thống kê mô tả độ tập trung.
Chọn tập dữ liệu cần tính tốn bằng Excel, sau đó vào Menu Tool
Data Analysis Descriptive Statistics Mở cửa sổ Descriptive
Statistics
I.3. Nhóm các đại lượng khác mơ tả sự phân bố của tập dữ liệu
3.1. Tứ phân vị (Quartiles)
Dùng để tính khoảng tứ phân vị ( độ trải giữa – R Q )
Chức năng
Có cơng dụng như phân vị
3.2. Phân vị (Percentiles)
Cơng thức xác định vị trí của phân vị thứ p:
i = (n+1)
Phân vị thường được dùng khi muốn biết:( các quan sát được sắp xếp từ thấp đến cao)
0
p%
p%
mức độ đạt cao nhất
100% mức độ đạt thấp nhất
Lưu ý: Khi tính bằng Excel thì cho kết quả khác một chút so với tính thủ cơng
I.4. Hình dáng của phân phối
Lệch Trái
Mean < Me
Cân đối
Mean = Me
Lệch phải
Mean > Me
Chú ý
Khi sử dụng Excel để tính tốn có 2 đại lượng cần quan tâm
Skewness ( hệ số bất cân xứng )
Kurtosis ( Độ lồi của phân phối )
II. CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN
II.1. Khoảng biến thiên
R = xmax – xmin
Cho dù tập dữ liệu có bao nhiêu quan sát đi nữa cũng khơng ảnh hưởng đến R nó bỏ
qua các phân bố bên trong 2 giá trị min, max
Lưu ý
Có 2 nhược điểm
Chỉ phụ thuộc vào giá trị min, max rất nhạy cảm với giá trị ngoại lệ
2. Độ trải giữa ( khoảng tứ phân vị - RQ)
RQ = Q 3– Q 1
II.3. Phương sai và độ lệch chuẩn
Trong đó:
Cơng thức Phương sai:
xi: là các giá trị quan sát thứ i
2
s =
Công thức Độ lệch chuẩn:
s=
của tập dữ liệu
: là số trung bình số học
n: là số quan sát của tập dữ
2
s : là phương sai
liệu
Lưu ý: khi sử dụng tính tốn bằng Excel
•
Sample Variance: Phương sai
•
Standard Deviation: Độ lệch chuẩn
•
Standard Error: s/ ( sẽ được nghiên cứu ở chương sau )
III. CÁC ĐẠI LƯỢNG THỐNG KÊ
MÔ TẢ CHO BẢNG TẦN SỐ.
III.1. Trung bình cộng
1.
Với bảng tần số khơng phân tổ
2. Với bảng tần số có phân tổ
Cơng thức Trung bình cộng trong mơ tả với bảng tần số
Trong đó:
xi: là giá trị quan sát của tổ thứ i hoặc
=
fi: là tần số của tổ thứ i
giá trị giữa tổ i (i = 1,2...k)
III.2. Trung vị
1.
Với bảng tần số không phân tổ
Trung vị sẽ là giá trị của tổ
có tần số tích lũy = (⅀f + 1)/2