Tải bản đầy đủ (.pdf) (32 trang)

Bài giảng Thống kê ứng dụng trong kinh doanh: Chương 7 - Trường Đại học Bách khoa Hà Nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.94 MB, 32 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH

CHƯƠNG 7

KIỂM ĐỊNH PHI THAM SỐ


Nội dung chính
7.1

Giới thiệu chung về kiểm phi tham số (Bài giảng video)

7.2

Kiểm định dấu và hạng Wilcoxon về trung vị một tổng thể (Bài giảng video)

7.3

Kiểm định tổng hạng Wilcoxon cho trung bình hai mẫu độc lập (Bài giảng video)

7.4

Kiểm định dấu và hạng Wilcoxon cho mẫu cặp (Bài giảng video)

7.5

Kiểm định Kruskal Wallis cho nhiều mẫu độc lập (Bài giảng video)

7.6



Kiểm định Chi-bình phương về tính độc lập

7.7

Kiểm định Chi-bình phương về sự phù hợp

7.8

Thực hành kiểm định phi tham số với SPSS

EM3230 Thống kê ứng dụng

2


7.1 Giới thiệu chung về kiểm định phi tham số
§

KN: Kiểm định phi tham số (non-parametric test) là loại kiểm định mà các đại lượng
đặc trưng của tổng thể hay của mẫu khơng có trong cơng thức tính đại lượng kiểm
định

§

§

Ứng dụng:
§


Dữ liệu định danh, dữ liệu thứ hạng

§

Dữ liệu khơng/ khơng chắc chắn có phân phối chuẩn/ bình thường

§

Cỡ mẫu nhỏ

Đặc điểm:
So với các kiểm định tham số, kiểm định phi tham số không mạnh bằng nhưng đơn
giản hơn.

EM3230 Thống kê ứng dụng

3


7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
§

Bước 1: Lập giả thuyết và lựa chọn mức ý nghĩa

H0: Me=Me0
H1: Me≠ Me0
§

H0: Me≤ Me0
H1: Me> Me0


H0: Me≥Me0
H1: Me
Bước 2: Thu thập thơng tin mẫu và tính toán chênh lệch di giữa từng giá trị quan sát
với giá trị trung vị giả thuyết

§

Bước 3: Loại bỏ các di =0 và xếp hạng các trị tuyệt đối của di
Nếu các có giá trị |di |bằng nhau thì tính hạng trung bình cho tất cả các quan sát có
giá trị |di |bằng nhau này.

§

Bước 4: Tách các hạng vừa xếp thành 2 cột R+ (di dương), R- (di âm)

§

Bước 5: Tính giá trị thống kê và xác định miền bác bỏ

EM3230 Thống kê ứng dụng

4


7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
§

Bước 5:

Quan điểm theo sách Hồng Trọng

Ø TH mẫu nhỏ n£ 20
§

KĐ 2 bên: W= min[S(cột R+); S(cột R-)]

§

KĐ 1 bên: Bên phải: W= S(cột R+); Bên trái W=S(cột R-)

§

Miền bác bỏ: W£Wa.

§

Wa tra bảng số 6, n để tra là số lượng di ¹0. Chỉ dùng giá trị cận dưới vì KĐ này ln
thực hiện ở bên trái.

Ø TH mẫu lớn n>20: Kiểm định Wilcoxon xấp xỉ pp bình thường
§

Giá trị kiểm định Z (n là số lng di ạ 0)

Đ

Min bỏc b:
Đ K 1 bờn: Z<-Z a
§ KĐ 2 bên: Z<-Z a /2


EM3230 Thống kê ứng dụng

𝒁=

𝒏(𝒏 + 𝟏)
𝟒
𝒏(𝒏 + 𝟏)(𝟐𝒏 + 𝟏)
𝟐𝟒
𝑾−

5


7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
§

Bước 5:

Giá trị thống kê

Quan điểm MBB khác

Miền bác bỏ

EM3230 Thống kê ứng dụng

6



7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
Ví dụ:
§

Một ngẫu nhiên 16 thiếu niên được cho xem một bộ phim mới và đánh giá sự hồi hộp tại phần
kết của phim. Một thang đo từ 10 đến 50 được sử dụng với 10 nghĩ là không hồi hộp và 50
nghĩa là rất hấp dẫn. Nếu giá trị trung vị của điểm hấp dẫn là dưới 40, hãng phim sẽ phải làm lại
đoạn kết. Những kinh nghiệm trước đó cho thấy rằng điểm đánh giá kiểu này sẽ khơng có phân
phối chuẩn. Dùng mức ý nghĩa alpha=0.05 hãy kiểm định về trung vị của điểm hấp dẫn. Điểm
đánh giá cho 16 thiếu niên như sau:
44

24.8

38.2

40

32.5

26.4

31

30.2

36

40.5


34.5

26.6

36.0

40

42

49.8

EM3230 Thống kê ứng dụng

7


7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
Lời giải
§

Quan điểm Sách
Hồng Trọng

Cặp giả thuyết
H0: Me≥40
H1: Me<40

§


Đại lượng kiểm định
Bên trái W=S(cột R-)=85.5

Tra bảng 6, n=14 (vì có 2 di=0)
Wa= (25; 80)

§

Miền bác bỏ W≤25

§

Chưa có cơ sở bác bỏ H0

EM3230 Thống kê ứng dụng

0
0
0.5
1.8
2
4
4
4
5.5
7.5
9
9.8
9.8
13.4

13.6
15.2

8


7.2 Kiểm định dấu và hạng Wilcoxon về trung vị 1 tổng thể
§

Quan
điểm MBB khác
Lời
giải

§

Cặp giả thuyết
H0: Me≥40
H1: Me<40

§

Đại lượng kiểm định
Wstat= S(cột R+)= 19.5

Tra bảng 6, n=14 (vì có 2 di=0)
Wa= (25; 80)

§


Miền bác bỏ W≤25

§

Có cơ sở bác bỏ H0

EM3230 Thống kê ứng dụng

9


7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
BT 4 và 8

§

Kiểm tra sự khác biệt của hai trung vị

§

Bước 1: Cặp giả thuyết, Me1 là trung vị của mẫu có cỡ mẫu nhỏ hơn
H0: Me1=Me2

H0: Me1≤ Me2

H0: Me1≥Me2

H1: Me1≠ Me2

H1: Me1> Me2


H1: Me1
§

Bước 2: Gộp các quan sát của cả 2 mẫu và xếp hạng từ nhỏ đến lớn. Nhỏ nhất
hạng 1, đồng hạng thì tính trung bình. Rồi tách thành hạng của từng mẫu

§

Bước 3: Tính giá trị kiểm định Wilcoxon T1 là tổng của các hạng trong mẫu có cỡ
mẫu nhỏ hơn hoặc của 1 trong 2 mẫu trong trường hợp 2 mẫu có cỡ bằng nhau

§

Bước 4: Miền bác bỏ

EM3230 Thống kê ứng dụng

10


7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
§

Bước 4: Miền bác bỏ

Ø TH mẫu nhỏ n1 và n2£ 10: Tra bang 7
§


KĐ 2 bên: T1³ giới hạn trên hoặc T1£ giới hạn dưới

§

KĐ Bên phải: T1³ giới hạn trên; Bên trái T1£ giới hạn dưới

Ø TH mẫu lớn (n1 hoặc n2 lớn hơn 10)
§

T1 xấp xỉ pp bình thường

z=

T1 - µT1

µT =

n1 (n + 1)
n1.n2 (n + 1)
sT =
12
2

§

Giá trị kiểm định Z

§

(n=n1+n2)


§

n1 là cỡ mẫu của mẫu có cỡ nhỏ hơn, tương tự T1

§

MBB tương tự các KĐ Z khác

EM3230 Thống kê ứng dụng

s

1

T1

1

11


7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
§

Ví dụ

§

Một phương pháp sản xuất piston mới vừa được đề xuất. Để kiểm tra xem phương

pháp mới có thực sự làm tăng sức nén của piston hay không, 12 mẫu pittong được làm
theo phương pháp mới và so sánh với 10 cái piston làm theo phương pháp thông
thường lâu nay. Sức nén được tính bằng pound/inch2 được thể hiện ở bảng dưới đây

§



145

141

146

137

144

135

134

80

138

141

Mới


145

150

148

143

138

145

141

142

146

139

136

140

Biết sức nén khơng theo phân phối chuẩn. Xác định xem có phải phương pháp mới tạo
ra piston mạnh hơn hay không. Sử dụng mức ý nghĩa 0.05

EM3230 Thống kê ứng dụng

12



7.3 Kiểm định tổng hạng Wilcoxon cho hai mẫu độc lập
§

Cặp giả thuyết H0: Me1≥ Me2
H1: Me1< Me2

§

Đại lượng kiểm nh
Mu ln, T1=91.5, n1=10

T= 115

z=

T= 15.166

Z=-1.55
Đ

àT =
1

MBB: Z<-1.645

sT =
1


T1 - µT1

s

T1

n1 (n + 1)
2

n1.n2 (n + 1)
12

KL: Chưa có đủ
cơ sở bác bỏ H0
EM3230 Thống kê ứng dụng

13


7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp
§

Bước 1: Các cặp giả thuyết

H0: MD=0
H1: MD≠ 0
§

H0: MD≤ 0
H1: MD> 0


H0: MD≥0
H1: MD<0

BT 1 và
11

Bước 2: Xác định sự khác biệt Di.
Khi đó cỡ mẫu thực tế n’= n - số lượng các quan sát có Di=0

§

Bước 3: Xếp hạng từ bé đến lớn giá trị tuyệt đối của các khác biệt nếu có các giá trị bằng
nhau thì hạng của chúng là hạng trung bình

§

Bước 4: Tính đại lượng kiểm định W= åRi(+)

§

Bước 5: Quy tắc ra quyết định
§

Mẫu bé n’≤20:

§

Mẫu lớn n’>20:


EM3230 Thống kê ứng dụng

14


7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp
§

Bước 5: Quy tắc ra quyết định
Mẫu bé n’≤20: Tra bảng phụ lục 6, bác bỏ H0 nếu:

§

KĐ 2 bên

KĐ bên phải

KĐ bên trái

W ≥giới hạn trên hoặc
W ≤ giới hạn dưới

W ≥giới hạn trên

W ≤ giới hạn dưới

Mẫu lớn n’>20: W phân phối xấp xỉ PP bình thường

z=


W - µw

sw

µw =

n' (n'+1)
4

sw =

n' ( n'+1)(2n'+1)
24

KĐ 2 bên

KĐ bên phải

KĐ bên trái

Z>Za/2 hoặc Z<- Za/2

Z> Za

Z<- Za

EM3230 Thống kê ứng dụng

15



7.4 Kiểm định dấu và hạng Wilcoxon cho mẫu cặp
Ví dụ:
§

§

Cặp giả thuyết:

KH
thử

Đánh giá
SP
gốc

SP
mới

Khác
biệt
Di

Xếp hạng Ri
(+)

(-)

§


H0: MD≤ 0

§

H1: MD> 0

A

6

8

+2

3

Đại lượng KĐ:

B

4

9

+5

6

§


W=25

C

5

4

-1

1,5

§

n’=7 mẫu bé

D

8

7

-1

1,5

E

3


9

+6

7

F

6

9

+3

4

G

7

7

0

H

5

9


+4

§

Chọn mức a =0,05

§

Giới hạn trên =25

§

Giới hạn dưới =3

§

W=åRi(+)=25 .

5
25

3

Có đủ bằng chứng thống kê để bác bỏ H0 với độ tin cậy 95%.
EM3230 Thống kê ứng dụng

16


7.5 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập

TH áp dụng: Áp dụng cho trường hợp các nhóm so sánh khơng chắc chắn có pp bình
thường và phương sai bằng nhau (Điều kiện áp dụng ANOVA)
Ho: μ1 = μ2 =….=μk
Các bước thực hiện
§

Gộp dữ liệu của k nhóm tương tự phần 9.3.

§

Xếp hạng liên tục tất cả các quan sát của k nhóm, sau đó phân bổ hang về các nhóm

§

Đặt n=n1+n2+..+nk

§

R1, R2,… Rk là tổng các hạng ở từng mẫu được sắp xếp theo thứ tự của k mẫu

§

Chỉ tiêu kiểm định W

§

&
Miền bác bỏ W>𝜒!"#,%

EM3230 Thống kê ứng dụng


k
Ri2
12
W =
- 3( n + 1)
å
n( n + 1) i =1 ni
17


7.5 Kiểm định Kruskal Wallis cho nhiều mẫu độc lập
§

Áp dụng cho trường hợp các nhóm so sánh khơng chắc chắn có pp bình thường và
phương sai bằng nhau (Điều kiện áp dụng ANOVA)

§

Xếp hạng liên tục các quan sát của k nhóm gộp lại

§

Đặt n=n1+n2+..+nk

§

R1, R2,… Rk là tổng các hạng ở từng mẫu được sắp xếp theo thứ tự của k mẫu

§


Ho: μ1 = μ 2 =….=μ k

§

Chỉ tiêu kiểm định W

§

&
Miền bác bỏ W>𝜒!"#,%

EM3230 Thống kê ứng dụng

k
Ri2
12
W =
- 3( n + 1)
å
n( n + 1) i =1 ni

18


7.6 Kiểm định Chi-bình phương về tính độc lập
§

KN: Là dạng kiểm định phi tham số xem có mối liên hệ giữa hai biến/ hiện tượng hay không?


Male
Female
Col. Totals

TV
280
115
395

Radio
175
275
450

NP Row Totals
305
760
170
560
475
1320

Percentages Based on Grand Total

Percentage

25.0
20.0
15.0


Male

10.0

Female

5.0
0.0
TV

Radio

NP

Media

EM3230 Thống kê ứng dụng

19


7.6 Kiểm định Chi-bình phương về tính độc lập
§

Các bước kiểm định
Bước 1: Đặt giả thuyết:

H0: Khơng có mối liên hệ giữa 2 biến/ hiện tượng
H1: Có mối liên hệ giữa hai biến/ hiện tượng


Bước 2: Lập bảng tổng hợp các quan sát được chia thành r hàng và c cột.
Phân tổ theo tiêu thức thứ nhất
Phân tổ
theo
tiêu
thức
thứ hai

….

Cộng

1

2

3

c

1

O11

O12

O13

O1c


R1

2

O21

O22

O23

O2c

R2

3

O21

O22

O23

O2c

R3

Or1

Or2


Or3

Orc

Rr

C1

C2

C3

Cc

n

….
r
Cộng
EM3230 Thống kê ứng dụng

Oij là số quan sát rơi
vào hàng i cột j
Ri là tổng số quan
sát ở hàng I
Cj là tổng số quan
sát ở cột j
20



7.6 Kiểm định Chi-bình phương về tính độc lập
§

Bước 3: Tính tần số lý thuyết Eij theo giả thuyết H0

Ei j =
§

Bước 4: Đại lượng kiểm định:

Ri xC j
n
r

c

c 2 = åå

(Oi j - Ei j ) 2

i =1 j =1

§
§

Bước 5: Quy tắc ra quyết định
Miền bác bỏ:

Ei j


χ 2 > χ 2 (r -1)(c-1);α
BT 9, 10

EM3230 Thống kê ứng dụng

21


7.6 Kiểm định Chi-bình phương về tính độc lập
Ví dụ:
§

300 công nhân của một công ty đã được lấy ngẫu nhiên và được hỏi xem liệu họ có đồng ý với
việc triển khai chính sách tiền lương mới hay khơng. Bảng sau chỉ ra các quan điểm và các loại
cán bộ nhân viên khác nhau trong cơng ty:

Bộ phận

§

Quan điểm
Đồng ý Lưỡng lự Phản đối
Sản xuất
89
42
9
Bán hàng
53
36
11

Quản lý
38
12
10

Hãy kiểm định xem liệu có bằng chứng về mối liên hệ giữa quan điểm và các bộ phận khác nhau
trong công ty hay không sử dụng mức ý nghĩa 5%.

EM3230 Thống kê ứng dụng

22


7.6 Kiểm định Chi-bình phương về tính độc lập
Lời giải
v Cặp giả thuyết cần kiểm định:
§

H0: Khơng có mối liên hệ giữa các bộ phận và quan điểm của các bộ phận đó

§

H1: Có mối liên hệ giữa các bộ phận và quan điểm của các bộ phận đó

v Tính Eij:

Ei j =

Quan điểm


Ri xC j
n

140 ´180
E11 =
= 84
300

EM3230 Thống kê ứng dụng

Đồng ý
Sản xuất
Bộ phận Bán hàng
Quản lý
Cộng

Cộng

Lưỡng lự

Phản đối
9

89

84

42

42


53

60

36

30 11

38

36

12

18

180

90

10
30

14

140

10


100

6

60
300

23


7.6 Kiểm định Chi-bình phương về tính độc lập
Lời giải (tiếp)
v Tính đại lượng kiểm định:
r

c

c 2 = åå
i =1 j =1

(Oi j - Ei j ) 2
Ei j

= 8,9778

v Quy tắc ra quyết định. Mức ý nghĩa 0.05 ; c2(r-1)(c-1)=9.4877
à Chưa có cơ sở bác bỏ H0
v Kết luận: Với mức ý nghĩa 5% chưa có đủ bằng chứng thống kê để nói rằng giữa các bộ phận
và quan điểm của các bộ phận đó có mối liên hệ với nhau.


EM3230 Thống kê ứng dụng

24


7.7 Kiểm định Chi-bình phương về sự phù hợp
Mục tiêu: Kiểm tra xem dữ liệu thu thập được có phù hợp giả thiết về phân phối của tổng thể.
Thường là PP đều và PP chuẩn
Các bước kiểm định:
BT 5,6,7
Bước 1: Đặt giả thuyết
H0: Dữ liệu phân phối đúng theo phân phối giả thuyết
H1: Dữ liệu không tuân theo phân phối giả thuyết
Bước 2: Đại lượng kiểm định
§ Giả sử 1 mẫu ngẫu nhiên n quan sát được phân tổ thành k nhóm
§ Gọi Oi là số quan sát rơi vào nhóm i
§ Gọi Ei là tần số lý thuyết rơi vào nhóm i
§ Đại lượng kiểm định (điều kiện Ei≥5), nếu Ei<5, cần chia lại tổ
Bước 3: : Quy tắc ra quyết định
χ 2 > χ 2 (k -1);α
Miền bác bỏ
h là số tham số (khơng có thơng tin từ tổng
Hoặc
2
2
χ > χ (k -h -1);α thể) cần ước lượng từ mẫu
EM3230 Thống kê ứng dụng

25



×