Tải bản đầy đủ (.pptx) (55 trang)

XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.15 MB, 55 trang )

L/O/G/O

TRƯỜNG ĐẠI HỌC NÔNG LÂM TPHCM

MÔN: XÁC SUẤT THỐNG KÊ TRONG NGHIÊN CỨU KHOA HỌC

CHƯƠNG 4: TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ

GVHD: Thầy Võ Văn Việt
Nhóm 4


Thành Viên Nhóm

1.
2.
3.
4.
5.
6.
7.
8.

Nguyễn Thị Hằng

13132176

Mai Quang Trung

13132073


Hồng Thị Hường

12132044

Nguyễn Thị Oanh

12132181

Đỗ Viết Hùng

13132201

Hàm Thị Mỹ Duy

13132128

Nguyễn Lê Bảo Lộc 13132039
Lê Tuấn Anh

13132095






CÁC ĐẠI LƯỢNG THỐNG KÊ MÔ TẢ CHO BẢNG TẦN SỐ




CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN

III
II
I

CÁC ĐẠI LƯỢNG ĐO LƯỜNG MỨC ĐỘ TẬP TRUNG CỦA TẬP DỮ LIỆU

MỤC LỤC

VÀ PHƯƠNG PHÁP MƠ TẢ HÌNH DÁNG CỦA TẬP DỮ LIỆU




PHÂN BIỆT MỘT SỐ CẶP KHÁI NIỆM

KHÁM PHÁ DỮ LIỆU QUA BIỂU ĐỒ HỘP VÀ RÂU (BOXPLOT)



SỬ DỤNG KẾT HỢP TRUNG BÌNH VÀ ĐỘ LỆCH TIÊU CHUẨN



VII
VI
V
IV



I.1. CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ TẬP TRUNG
1.1 Trung bình cộng ( Arithmetic mean )

Trung bình cộng đơn giản (mean)

 

Trong đó:

 
 

=

: trung bình cộng đơn giản

n : số quan sát hay cỡ mẫu

xi: giá trị trên quan sát thứ i


Trung bình cộng có trọng số
(weighted mean )

Trong đó:
 
 
=


Xi: là các giá trị quan sát được

Wi: là các trọng số tương ứng với Xi


1.

Trung bình cộng có một nhược điểm lớn nhất là rất
nhạy cảm với giá trị ngoại lệ

Lưu ý

2. Khơng tính dữ liệu trung bình cho dữ liệu
định danh

3. Có nên tính trị trung bình cho dữ liệu định lượng
đo lường bằng thang đo khoảng hay không?


1.2 Trung vị (Median) - Me

● ● ● ● ● ● ●
1

3

7

2


5

9

6

● ● ● ● ● ● ●
Sắp xếp:

1

2

3

5

6

7

9

Me = 5

● ● ● ○ ● ● ●
1

2


3

5

6

7

Me = 4

Nếu

● ● ● ● ● ●
1

2

3

5

6

7

9


1.


Tránh nhầm lẫn giữa vị trí và giá trị của trung vị

Lưu ý

2. Trung vị không bị ảnh hưởng bởi giá trị ngoại lệ


1.3 Số Mode (Mo)

● ● ● ● ● ● ● ● ●
1

2

3

3

3

4

4

5

6

Số mode không bị ảnh hưởng bởi giá trị ngoại lệ
Lưu ý


Một tập dữ liệu có thể có một mode,có nhiều mode hoặc

Một mode:

1 2 3 3 3 4 4 5 6

Nhiều mode:

1 2 2 2 3 4 4 4 5

Không mode:

1 2 3 4 5 6 7 8 9

khơng có mode nào


1.4 Trung bình nhân ( Geometric mean)
Có bản chất và cách tính khác hẳn trung bình cộng

 

Tổng qt:
Nếu có n giá trị có quan hệ tích số kiểu:
* * …..* thì số trung bình nhân của n giá trị này được xác định theo cơng thức:

 

Trung bình nhân được vận dụng để tính tốc độ phát triển trung bình khi các giá trị là các con số có tốc độ phát triển liên hoàn

( sẽ được lý giải ở chương 13)


I.2. Sử dụng Excel để tính tốn các đại lượng thống kê mô tả độ tập trung.

Chọn tập dữ liệu cần tính tốn bằng Excel, sau đó vào Menu Tool 

Data Analysis  Descriptive Statistics  Mở cửa sổ Descriptive

Statistics


I.3. Nhóm các đại lượng khác mơ tả sự phân bố của tập dữ liệu

3.1. Tứ phân vị (Quartiles)

Dùng để tính khoảng tứ phân vị ( độ trải giữa – R Q )

Chức năng

Có cơng dụng như phân vị


3.2. Phân vị (Percentiles)

 

Cơng thức xác định vị trí của phân vị thứ p:

i = (n+1)

Phân vị thường được dùng khi muốn biết:( các quan sát được sắp xếp từ thấp đến cao)

0

p%

p%

mức độ đạt cao nhất

100% mức độ đạt thấp nhất

Lưu ý: Khi tính bằng Excel thì cho kết quả khác một chút so với tính thủ cơng


I.4. Hình dáng của phân phối

Lệch Trái

Mean < Me

Cân đối

Mean = Me

Lệch phải

Mean > Me



Chú ý

Khi sử dụng Excel để tính tốn có 2 đại lượng cần quan tâm

Skewness ( hệ số bất cân xứng )

Kurtosis ( Độ lồi của phân phối )


II. CÁC ĐẠI LƯỢNG ĐO LƯỜNG ĐỘ PHÂN TÁN


II.1. Khoảng biến thiên

R = xmax – xmin
Cho dù tập dữ liệu có bao nhiêu quan sát đi nữa cũng khơng ảnh hưởng đến R  nó bỏ
qua các phân bố bên trong 2 giá trị min, max

Lưu ý
Có 2 nhược điểm
Chỉ phụ thuộc vào giá trị min, max  rất nhạy cảm với giá trị ngoại lệ


2. Độ trải giữa ( khoảng tứ phân vị - RQ)

RQ = Q 3– Q 1


II.3. Phương sai và độ lệch chuẩn


 

Trong đó:

Cơng thức Phương sai:

xi: là các giá trị quan sát thứ i

 

2
s =

Công thức Độ lệch chuẩn:
 

s=

của tập dữ liệu

: là số trung bình số học
n: là số quan sát của tập dữ
2
s : là phương sai

liệu


Lưu ý: khi sử dụng tính tốn bằng Excel


 



Sample Variance: Phương sai



Standard Deviation: Độ lệch chuẩn



Standard Error: s/ ( sẽ được nghiên cứu ở chương sau )


III. CÁC ĐẠI LƯỢNG THỐNG KÊ

MÔ TẢ CHO BẢNG TẦN SỐ.


III.1. Trung bình cộng

1.

Với bảng tần số khơng phân tổ

2. Với bảng tần số có phân tổ


Cơng thức Trung bình cộng trong mơ tả với bảng tần số


 

 

Trong đó:

xi: là giá trị quan sát của tổ thứ i hoặc

=
 

fi: là tần số của tổ thứ i

giá trị giữa tổ i (i = 1,2...k)


III.2. Trung vị

1.

Với bảng tần số không phân tổ

Trung vị sẽ là giá trị của tổ
có tần số tích lũy = (⅀f + 1)/2


×