Tải bản đầy đủ (.pdf) (37 trang)

Bài giảng Thống kê cho khoa học xã hội: Bài 4 - ThS. Nguyễn Thị Xuân Mai

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.01 MB, 37 trang )

GIỚI THIỆU MÔN HỌC

THỐNG KÊ CHO KHOA HỌC XÃ HỘI
Giảng viên: ThS. Nguyễn Thị Xuân Mai

v1.0016104219

1


BÀI 4
KIỂM ĐỊNH PHI THAM SỐ

Giảng viên: ThS. Nguyễn Thị Xuân Mai

v1.0016104219

2


MỤC TIÊU BÀI HỌC


Trình bày phương pháp kiểm định Mann-Whitney
khi so sánh hai mẫu độc lập với các biến thứ bậc.



Trình bày phương pháp kiểm định dấu và kiểm định
tổng hạng có dấu Wilconxon khi so sánh hai mẫu
phụ thuộc với các biến thứ bậc.





Trình bày phương pháp kiểm định Khi bình phương
để thấy sự phù hợp.



Áp dụng phương pháp Khi bình phương để kiểm định mối liên hệ giữa hai tiêu thức
được trình bày qua bảng chéo.



Dựa vào phương pháp Khi bình phương để tính tốn các tham số đo lường mối liên
hệ giữa các biến định danh: Lambda, Hệ số Phi, Cramer’s V.

v1.0016104219

3


CÁC KIẾN THỨC CẦN CÓ

Kiến thức chung về kinh tế - xã hội.

v1.0016104219

4



HƯỚNG DẪN HỌC



Đọc tài liệu tham khảo.



Thảo luận với giáo viên và các sinh viên khác về
những vấn đề chưa hiểu rõ.



Trả lời các câu hỏi của bài học.



Đọc và tìm hiểu thêm về các phương pháp kiểm
định phi tham số.

v1.0016104219

5


CẤU TRÚC NỘI DUNG

4.1

4.2


4.3

v1.0016104219

Kiểm định Mann-Whitney

Kiểm định dấu và kiểm định tổng hạng có dấu Wilconxon

Kiểm định Khi bình phương

6


KIỂM ĐỊNH PHI THAM SỐ


Ưu điểm:
 Được sử dụng trong trường hợp dữ liệu khơng có phân phối chuẩn, hoặc cho các
mẫu nhỏ có ít quan sát.
 Được sử dụng khi dữ liệu định tính có thang đo định danh hoặc thang đo
thứ bậc.
 Được sử dụng khi kiểm định các giả thuyết khác bên cạnh các giả thuyết liên
quan đến các tham số của tổng thể.
 Trong một số trường hợp, tính tốn dễ dàng hơn so với kiểm định tham số.
 Dễ hiểu.



Nhược điểm:

 Có xu hướng sử dụng ít thơng tin hơn kiểm định tham số.
 Khả năng tìm ra được sự sai biệt kém, khơng mạnh như các phép kiểm định có
tham số (T student, phân tích phương sai…), đồng thời khó mở rộng để giải
quyết các mơ hình kinh tế phức tạp.

v1.0016104219

7


4.1. KIỂM ĐỊNH MANN-WHITNEY


Kiểm định Mann-Whitney U là một trong những kiểm định dựa trên xếp hạng. Các
quan sát sẽ được xếp hạng từ giá trị nhỏ nhất tới lớn nhất và sau đó thứ hạng sẽ
được sử dụng thay cho các giá trị thực trong tính tốn.



Kiểm định Mann-Whitney U dùng để kiểm định liệu có tồn tại sự khác biệt giữa hai
tổng thể, với điều kiện:
 Tổng thể khơng có phân phối chuẩn;
 Dữ liệu ít nhất phải có thang đo thứ bậc;
 Hai mẫu được chọn ngẫu nhiên độc lập với nhau.



Giả thuyết cần kiểm định:
 H0: Phân phối của hai tổng thể là giống hệt nhau (μ1= μ2).


Lưu ý: kiểm định Mann-Whitney U giống kiểm định tổng hạng Wilconxon.

v1.0016104219

8


4.1. KIỂM ĐỊNH MANN-WHITNEY

v1.0016104219

9


4.1. KIỂM ĐỊNH MANN-WHITNEY

v1.0016104219

10


4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo)


Trường hợp tạo mẫu lớn: n1, n2 > 10
 Kết hợp hai mẫu ngẫu nhiên và xếp hạng tất cả các quan sát từ nhỏ nhất tới lớn
nhất. Những giá trị bằng nhau sẽ nhận hạng trung bình của các hạng liên tiếp.
 Tính tổng các thứ hạng riêng cho từng mẫu, giá trị nào lớn hơn, ký hiệu là R1.
 Giá trị của thống kê U:


U  n1n2 

n1  n1  1
2

 R1

 Tiêu chuẩn kiểm định là thống kê z có phân phối xấp xỉ chuẩn:
U  U
z
U
n1n2
n n  n  n  1
là trung bình của U; U  1 2 1 2
2
12
chuẩn của U.

Với U 

là độ chênh lệch tiêu

 Tra bảng tìm giá trị tới hạn z với mức ý nghĩa 

v1.0016104219

Giả thuyết

H0: μ1= μ2
H1: μ1≠ μ2


H0: μ1≥ μ2
H1: μ1< μ2

H0: μ1≤ μ2
H1: μ1> μ2

Bác bỏ H0

z > z/2

z < -z

z > z
11


4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo)

Ví dụ: Để kiểm tra xem liệu hai phương pháp học ngoại ngữ mới có hiệu quả như nhau
không, ta thu thập một cách ngẫu nhiên điểm số của 15 người mỗi nhóm. Với số liệu
này, liệu có thể kết luận phương pháp thứ hai hiệu quả hơn không?
Phương pháp 1: 65, 57, 74, 43, 39, 88, 62, 69, 70, 72, 59, 60, 80, 83, 50
Phương pháp 2: 85, 87, 92, 98, 90, 88, 75, 72, 60, 93, 88, 89, 96, 73, 62


Kết hợp hai mẫu lại với nhau và xếp hạng theo thứ tự từ nhỏ đến lớn.
PP1

39 43 50 57 59


PP2

Xếp hạng



1

2

3

4

5

60

62

60

62

65 69 70

72
72


74
73

80 83
75

88
85 87 88 89 90 92 93 96 98
88

6.5 8.5 10 11 12 13.5 15 16 17 18 19 20 21 23 25 26 27 28 29 30

Dễ dàng thấy rằng phương pháp 2 có tổng xếp hạng cao hơn phương pháp 1, vậy
R1=6.5+8.5+13.5+15+16+17+20+21+23+23+25+26+27+28+29+30=312.5

v1.0016104219

12


4.1. KIỂM ĐỊNH MANN-WHITNEY (tiếp theo)


Giá trị của thống kê U là: U  n1n2 



Trung bình của U: U 




Độ lệch tiêu chuẩn của U: U 



Tiêu chuẩn kiểm định z:



Với mức ý nghĩa  = 0,05

n1  n1  1
2

 R1  15 15 

15  15  1
2

 312,5  32,5

n1n2 15 15

 112,5
2
2

z

n1n2  n1  n2  1

12



15 15  15  15  1
12

 24,1

U  U 32,5  112,5

 3,32
U
24,1

 H0: 1 = 2 bị bác bỏ vì z = 3,32 > z/2 = 1,96
 H0: 1  2 bị bác bỏ vì z = -3,32 < -z = -1,645
 H0: 1  2 được chấp nhận vì z = -3,32 < z = 1,645


Như vậy, có cơ sở cho rằng phương pháp 2 có hiệu quả hơn phương pháp 1.

v1.0016104219

13


4.2. KIỂM ĐỊNH DẤU VÀ KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON

4.2.1. Kiểm định dấu


4.2.2. Kiểm định tổng
hạng có dấu Wilconxon

v1.0016104219

14


4.2.1. KIỂM ĐỊNH DẤU


Kiểm định dấu dùng để kiểm định về giá trị trung vị của một tổng thể.
 Bài toán: Để kiểm định xem liệu giá trị trung vị có bằng một giá trị cho trước nào
đó (M), ta lấy một mẫu và so sánh các giá trị đó với giá trị trung vị phỏng
đoán trên.


Giả thuyết cần kiểm định: H0: Giá trị của số trung vị = M



Nếu số liệu có giá trị lớn hơn M, nhận dấu dương. Nếu số liệu có giá trị nhỏ
hơn M, nhận dấu âm. Nếu số liệu bằng M, nhận kết quả 0, loại khỏi
nghiên cứu.



Số dấu âm và số dấu dương sẽ được so sánh với nhau. Nếu số dấu âm và số
dấu dương bằng nhau, giả thuyết H0 là đúng.


 Trường hợp mẫu nhỏ, n < 20.


Tiêu chuẩn kiểm định là số dấu âm hoặc số dấu dương mà có giá trị nhỏ hơn.



Tra bảng giá trị tới hạn của kiểm định dấu với cỡ mẫu là tổng số dấu âm và số
dấu dương và mức ý nghĩa α.



Bác bỏ H0 nếu tiêu chuẩn kiểm định nhỏ hơn giá trị tới hạn tra bảng.

v1.0016104219

15


4.2.1. KIỂM ĐỊNH DẤU
Ví dụ: Có ý kiến cho rằng, giá trị trung vị về năng suất lao động của Doanh nghiệp A là
40 triệu đồng/tháng. Một mẫu ngẫu nhiên gồm 20 lao động được chọn ra để nghiên
cứu, cho thấy, có 15 người có năng suất lao động nhỏ hơn 40 triệu đồng/tháng, 3 người
có suất lao động lớn hơn 40 triệu đồng/tháng và 2 người có năng suất lao động bằng 40
triệu đồng/tháng.


Giả thuyết: H0: Me= 40




Số dấu âm là 15, số dấu dương là 3. Tiêu chuẩn kiểm định là min (15,3)=3.



Giá trị tới hạn ở mức 0,05 cho kiểm định hai phía với n = 18 là 4 → Bác bỏ H0.

v1.0016104219

H1: Me ≠ 40

16


4.2.1. KIỂM ĐỊNH DẤU (tiếp theo)
 Trường hợp mẫu lớn, n  20.
Khi mẫu lớn tiêu chuẩn kiểm định có phân phối xấp xỉ chuẩn, được tính như sau:
n
Trong đó: X = min (số dấu dương, số dấu âm)
 X  0,5 
2
z
n: qui mơ mẫu
n /2
Ví dụ: Theo một báo cáo, tuổi trung vị của người dân địa phương A là 36,4. Một nhà
nghiên cứu đã lựa chọn 50 người dân và thấy có 21 người nhiều hơn 36,4 tuổi. Với
mức ý nghĩa 0,05, liệu có thể khẳng định tuổi trung vị thấp nhất là 36,4 không?
 Giả thuyết cần kiểm định: H0: Me  36,4


H1: Me < 36,4

 Có 21 người nhiều hơn 36,4 tuổi. Vậy có 29 người nhỏ hơn hoặc bằng 36,4 tuổi.
 Vậy giá trị X = min(21,29) = 21
 Tiêu chuẩn kiểm định:

z

 X  0,5 
n

2

n
50
 21  0,5 
2
2  0,99
50
2

 Tra bảng tìm giá trị tới hạn với n = 50 và  = 0,05 cho kiểm định phía trái, giá trị
tới hạn là -1,65.
 Vì z = -0,99 > -1,65, chưa đủ cơ sở bác bỏ H0.
 Khơng có đủ bằng chứng để bác bỏ ý kiến trên (tuổi trung vị thấp nhất là 36,4).
v1.0016104219

17



4.2.1. KIỂM ĐỊNH DẤU (tiếp theo)


Kiểm định dấu dùng để kiểm định giả thuyết với hai mẫu tương đồng từng cặp.



Bài tốn: để kiểm tra trung bình của mẫu khi so sánh hai mẫu phụ thuộc, chẳng hạn
như kiểm định trước – sau.



Ví dụ: Một nghiên cứu cho rằng, nếu những người đi bơi có đeo nút bịt tai thì số lần
nhiễm trùng tai sẽ giảm xuống. Một mẫu gồm 10 người được lựa chọn để ghi lại số
lần nhiễm trùng tai trong 4 tháng. Trong 2 tháng đầu, họ khơng dùng nút bịt tai, 2
tháng sau có dùng nút bịt tai. Vào đầu của chu kỳ 2 tháng sau, mỗi người sẽ được
kiểm tra để chắc chắn là không bị nhiễm trùng tai.

v1.0016104219

18


4.2.1. KIỂM ĐỊNH DẤU (tiếp theo)
Ví dụ (tiếp)
 Giả thuyết:


H0: số người bị nhiễm trùng tai không
giảm xuống;


STT

Trước

Sau

Dấu của
chênh lệch

1

3

2

+

2

0

1

-

3

5


4

+

4

4

0

+

5

2

1

+

6

4

3

+

 Tiêu chuẩn kiểm định là min(2,7) = 2.


7

3

1

+

 Tra bảng với n = 2+7 = 9, α = 0,05 cho
kiểm định một phía, giá trị tới hạn là 1.

8

5

3

+

9

2

2

0

10

1


3

-



H1: số người bị nhiễm trùng tai
giảm xuống.

 Xác định dấu của chênh lệch giữa trước và
sau.
 Số dấu âm là 2, số dấu dương là 7.

 Do 2 > 1, bác bỏ H0.
 Nghiên cứu trên là có cơ sở, sử dụng nút
bịt tai sẽ làm giảm bệnh nhiễm trùng tai.
v1.0016104219

19


4.2.1. KIỂM ĐỊNH DẤU (tiếp theo)


Trường hợp mẫu lớn, n > 20
 Tính chênh lệch giữa hai mẫu để xác định số dấu âm, số dấu dương.
 Tương tự như với trường hợp kiểm định số trung vị, tiêu chuẩn kiểm định có
phân phối chuẩn và được tính theo cơng thức:
n

X

0,5



2
z
n
2
 Trong đó: X = min(số dấu dương, số dấu âm);
n: qui mô mẫu
 So sánh với giá trị tới hạn tra ở bảng để kết luận.

v1.0016104219

20


4.2.2. KIỂM ĐỊNH TỔNG HẠNG CĨ DẤU WILCONXON


Kiểm định tổng hạng có dấu Wilconxon được sử dụng nhằm so sánh hai tổng thể với
điều kiện:
 Số liệu định lượng nhưng giả thuyết về phân phối chuẩn của μ1 - μ2 bị vi phạm.
 Hai mẫu tương đồng từng cặp (phụ thuộc).



Trình tự kiểm định

 Tính chênh lệch giữa các cặp di = xi – yi và loại các trường hợp có chênh lệch
bằng 0. Số cặp có chênh lệch khác 0 là n.
 Xếp hạng giá trị tuyệt đối của các chênh lệch theo thứ tự từ nhỏ nhất đến lớn
nhất. Các giá trị bằng nhau có xếp hạng như nhau là trung bình của các hạng
liên tiếp.
 Tính tổng hạng của các chênh lệch dương, ký hiệu là T+ và tổng hạng của các
chênh lệch âm, ký hiệu là T-.

v1.0016104219

21


4.2.2. KIỂM ĐỊNH TỔNG HẠNG CĨ DẤU WILCONXON


Trường hợp mẫu nhỏ, n ≤ 20
 H0: μ1 ≤ μ2: tiêu chuẩn kiểm định là tổng hạng của chênh lệch âm. Bác bỏ H0 nếu
T- ≤ giá trị tới hạn.
 H0: μ1 ≥ μ2: tiêu chuẩn kiểm định là tổng hạng của chênh lệch dương. Bác bỏ H0
nếu T+ ≤ giá trị tới hạn
 H0: μ1 = μ2: Tiêu chuẩn kiểm định là tổng hạng của chênh lệch âm hoặc tổng
hạng của chênh lệch dương mà có giá trị nhỏ hơn: T = min (T+, T-).
Bác bỏ H0 khi: T ≤ giá trị tới hạn.
 Giá trị tới hạn được xác định từ bảng giá trị tới hạn của kiểm định tổng hạng có
dấu khi biết qui mơ n và mức ý nghĩa α.

v1.0016104219

22



4.2.2. KIỂM ĐỊNH TỔNG HẠNG CĨ DẤU WILCONXON
Ví dụ: Nhằm đánh giá hai phương pháp sản xuất mới có hiệu quả như nhau không, một
mẫu gồm 11 công nhân được lựa chọn, mỗi công nhân sẽ thực hiện một nhiệm vụ sản xuất
có sử dụng từng phương pháp mới này, thời gian thực hiện được tính theo phút. Phương
pháp sản xuất mà mỗi công nhân sử dụng đầu tiên cũng được lựa chọn ngẫu nhiên. Vậy 2
phương pháp này xét về mặt thời gian hồn thành nhiệm vụ có như nhau khơng?
• Tính chênh lệch về thời gian thực hiện nhiệm vụ bằng 2 phương pháp. Sự chênh
lệch dương trong thực hiện nhiệm vụ cho thấy phương pháp 1 cần nhiều thời gian
hơn, sự chênh lệch âm lại cho thấy phương pháp 2 cần nhiều thời gian hơn.
• Xếp hạng giá trị tuyệt đối của chênh lệch.
• Tổng hạng của các chênh lệch dương là: T+ = 49,5
• Tổng hạng của các chênh lệch âm là: T- = 5,5
• H0: μ1 = μ2: Tiêu chuẩn kiểm định là T = min(T+,T-) = 5,5
• Giá trị tới hạn tra bảng với n = 10 (có chênh lệch khác 0), α = 0,05 là: 8, bác bỏ H0.
• H0: μ1 ≤ μ2, Tiêu chuẩn kiểm định là T- = 5,5, Giá trị tới hạn cho kiểm định một phía
với n = 10, α = 0,05, là 11, bác bỏ H0.
• H0: μ1 ≥ μ2 Tiêu chuẩn kiểm định là T+ = 49,5, giá trị tới hạn cho kiểm định một phía
với n = 10, α = 0,05, là 11, chấp nhận H0.
• Vậy 2 phương pháp này là khác nhau và phương pháp 1 có thời gian hồn thành
nhiệm vụ cao hơn phương pháp 2.
23
v1.0016104219


4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON (tiếp theo)
Thời gian thực hiện (phút)

Giá trị tuyệt

đối của
chênh lệch

Xếp
hạng

Xếp hạng có
dấu dương
8

PP1

PP2

Chênh
lệch

1

10,2

9,5

0,7

0,7

8

2


9,6

9,8

-0,2

0,2

2

3

9,2

8,8

0,4

0,4

3,5

3,5

4

10,6

10,1


0,5

0,5

5,5

5,5

5

9,9

10,3

-0,4

0,4

3,5

6

10,2

9,3

0,9

0,9


10

10

7

10,6

10,5

0,1

0,1

1

1

8

10,0

10,0

0

9

11,2


10,6

0,6

0,6

7

7

10

10,7

10,2

0,5

0,5

5,5

5,5

11

10,6

9,8


0,8

0,8

9

9

STT

Tổng

v1.0016104219

Xếp hạng
có dấu âm

2

3,5

49,5

5,5

24


4.2.2. KIỂM ĐỊNH TỔNG HẠNG CÓ DẤU WILCONXON (tiếp theo)


v1.0016104219

25


×