Tải bản đầy đủ (.pdf) (47 trang)

Bài toán kiểm định giả thuyết thống kê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (878.94 KB, 47 trang )

TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2
KHOA TOÁN

Trần Thanh Huyền

BÀI TOÁN KIỂM ĐỊNH
GIẢ THUYẾT THỐNG KÊ

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Toán ứng dụng


LỜI CẢM ƠN
Em xin chân thành cảm ơn các thầy cô giáo khoa Toán, Trường Đại
học Sư phạm Hà Nội 2 đã tạo điều kiện thuận lợi và giúp đỡ em trong học tập
và thực hiện khoá luận này.
Em xin chân thành biết ơn sâu sắc tới TS. Kiều Văn Hƣng đã giúp đỡ,
chỉ bảo tận tình trong việc triển khai thực hiện khoá luận.
Xin chân thành cảm ơn các bạn sinh viên K36 Toán, Trường Đại học
Sư phạm Hà Nội 2 đã cổ vũ, động viên, giúp đỡ trong suốt quá trình học tập
và nghiên cứu.

Hà Nội, ngày 15 tháng 5 năm 2014
Sinh viên

Trần Thanh Huyền


LỜI CAM ĐOAN
Đề tài của em được hoàn thành dưới sự hướng dẫn của thầy Kiều Văn
Hƣng cùng sự cố gắng của bản thân.


Em xin cam đoan những kết quả trong khóa luận tốt nghiệp là kết quả
nghiên cứu của em, không trùng với bất kì tác giả nào khác. Nếu sai em xin
chịu hoàn toàn trách nhiệm.

Hà Nội, ngày 15 tháng 5 năm 2014
Sinh viên

Trần Thanh Huyền


MỤC LỤC
MỞ ĐẦU ........................................................................................................... 1
Chương 1. MỘT SỐ KIẾN THỨC CƠ SỞ ...................................................... 3
1.1. Biến ngẫu nhiên.......................................................................................... 3
1.1.1. Định nghĩa biến ngẫu nhiên .................................................................... 3
1.1.2. Biến ngẫu nhiên rời rạc ........................................................................... 3
1.1.3. Biến ngẫu nhiên liên tục và hàm mật độ xác suất ................................... 4
1.1.3.1. Biến ngẫu nhiên liên tục ....................................................................... 4
1.1.3.2. Hàm mật độ xác suất ............................................................................ 4
1.2. Các đặc trưng của biến ngẫu nhiên ............................................................ 5
1.2.1. Kỳ vọng (Expectation) ............................................................................ 5
1.2.2. Phương sai ............................................................................................... 5
1.2.3. Độ lệch tiêu chuẩn ................................................................................... 6
1.3. Lý thuyết mẫu ............................................................................................ 6
1.3.1. Một số phương pháp lấy mẫu .................................................................. 6
1.3.2. Đặc trưng mẫu ......................................................................................... 7
1.3.2.1. Trung bình mẫu .................................................................................... 7
1.3.2.2. Mode..................................................................................................... 7
1.3.2.3. Độ lệch trung bình ................................................................................ 7
Chương 2. BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ ................. 8

2.1. Khái niệm ................................................................................................... 8
2.1.1. Giả thuyết thống kê và kiểm định giả thuyết thống kê ........................... 8
2.1.2. Cách đặt giả thuyết .................................................................................. 9
2.1.3. Miền bác bỏ - tiêu chuẩn kiểm định...................................................... 10
2.1.4. Sai lầm loại I và sai lầm loại II ............................................................. 11
2.2. Bài toán kiểm định giả thuyết .................................................................. 14


2.2.1. Các bước tiến hành kiểm định giả thuyết thống kê............................... 14
2.2.2. Bài toán kiểm định dùng một mẫu ........................................................ 14
2.2.2.1. Kiểm định giả thuyết cho kỳ vọng ..................................................... 14
2.2.2.2. Kiểm định giả thuyết cho tỷ lệ ........................................................... 17
2.2.3. Bài toán kiểm định dùng nhiều mẫu ..................................................... 19
2.2.3.1. So sánh hai kỳ vọng ........................................................................... 19
2.2.3.2. So sánh hai tỷ lệ ................................................................................. 23
Chương 3. MỘT SỐ BÀI TOÁN MINH HỌA .............................................. 25
3.1. Bài toán kiểm định dùng một mẫu ........................................................... 25
3.1.1. Kiểm định giả thuyết cho kỳ vọng ........................................................ 25
3.1.1.1. Kiểm định giả thuyết cho kỳ vọng, trường hợp biết  2 .................... 25
3.1.1.2. Kiểm định giả thuyết cho kỳ vọng, trường hợp chưa biết  2 ........... 27
3.1.2. Kiểm định giả thuyết cho tỷ lệ .............................................................. 30
3.2. Bài toán kiểm định dùng nhiều mẫu ........................................................ 32
3.2.1. So sánh hai kỳ vọng .............................................................................. 32
3.2.1.1. So sánh hai kỳ vọng, trường hợp phương sai  2 đã biết................... 32
3.2.1.2. So sánh hai kỳ vọng, trường hợp phương sai chưa biết ..................... 35
3.2.2. So sánh hai tỷ lệ .................................................................................... 38
KẾT LUẬN ..................................................................................................... 41
TÀI LIỆU THAM KHẢO ................................................................................................... 42



MỞ ĐẦU
Ngày nay sự phát triển của tất cả các ngành khoa học cơ bản cũng như
ứng dụng vào tất cả các ngành công nghiệp then chốt như: dầu khí, viễn
thông, hàng không,… đều không thể thiếu Toán học và càng gắn bó với Toán
học. Sự ra đời và phát triển mạnh mẽ của công nghệ thông tin đã dẫn tới sự
bùng nổ các ứng dụng của Toán học, đưa lại hiệu quả to lớn cho đời sống xã
hội.
Toán học ra đời bắt nguồn từ nhu cầu giải quyết các bài toán thực tiễn.
Sự phát triển của Toán học gắn liền với sự phát triển của xã hội. Cùng với
thời gian, Toán học ngày cáng phát triển và được chia làm hai lĩnh vực: toán
học lý thuyết và toán học ứng dụng. Nói đến toán học ứng dụng không thể
không nói đến bộ môn Xác suất – thống kê, sự ra đời và phát triển của nó đã
xác lập những quy luật tất nhiên ẩn dấu sau những hiện tượng manh tính ngẫu
nhiên khi nghiên cứu một số lớn các hiện tượng tương tự. Việc nắm bắt các
quy luật này sẽ cho phép dự báo các hiện tượng ngẫu nhiên xảy ra như thế
nào? Mà các hiện tượng ngẫu nhiên này thường gặp trong thực tế của các lĩnh
vực kinh tế, nông nghiệp, lâm nghiệp, sinh học, y học,… Trong đó, các bài
toán kiểm định giả thuyết thống kê là một vấn đề quan trọng của lý thuyết xác
suất – thống kê.
Dưới góc độ là một sinh viên chuyên ngành, được sự hướng dẫn tận
tình của thầy Kiều Văn Hƣng, em đã lựa chọn đề tài “Bài toán kiểm định
giả thuyết thống kê” trong khóa luận tốt nghiệp đại học của mình.
Nội dung chính của khóa luận gồm 3 chương:
Chương 1: Một số kiến thức cơ sở - Trình bày các kiến thức cơ sở về
mặt lý thuyết: biến ngẫu nhiên, các đặc trưng của biến ngẫu nhiên, lý thuyết
mẫu…

1



Chương 2: Bài toán kiểm định giả thuyết - Trình bày về bài toán kiểm
định tổng quát.
Chương 3: Một số bài toán minh họa. Chương này trình bày lời giải cụ
thể của một số bài toán kiểm định thông qua những tính chất và ứng dụng.
Do thời gian có hạn và điều kiện nghiên cứu, đặc biệt là về mặt tài liệu
nên khóa luận không tránh khỏi những thiếu sót, em rất mong được sự quan
tâm, góp ý, chỉ bảo của các thầy cô giáo và các bạn để khóa luận được hoàn
thiện hơn.

2


Chƣơng 1
MỘT SỐ KIẾN THỨC CƠ SỞ
1.1. Biến ngẫu nhiên
1.1.1. Định nghĩa biến ngẫu nhiên
Một đại lượng (hay một biến) nhận các giá trị của nó với xác suất tương
ứng nào đấy gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên.
Các biến ngẫu nhiên được kí hiệu bởi X,Y,Z,… hoặc , , ,…
Các giá trị mà biến ngẫu nhiên nhận thường kí hiệu là x, y, z,….
Ví dụ 1.1. Tung một con xúc xắc. Gọi X là số chấm xuất hiện trên mặt con
xúc xắc thì X là một đại lượng ngẫu nhiên nhận các giá trị có thể là 1, 2, 3, 4,
5, 6.
1.1.2. Biến ngẫu nhiên rời rạc
Định nghĩa 1.1. Nếu tập các giá trị mà biến ngẫu nhiên nhận là một tập gồm
một số hữu hạn điểm hoặc vô hạn nhưng đếm được, khi đó biến ngẫu nhiên
được gọi là biến ngẫu rời rạc.
Ta có thể liệt kê các giá trị của đại lượng ngẫu nhiên rời rạc x1 , x2 ,..., xn .
Ta kí hiệu đại lượng ngẫu nhiên X nhận giá trị xn là X= xn và xác suất
để X nhận giá trị xn là P( X  xn ) .

Ví dụ 1.2. Số chấm xuất hiện trên mặt con xúc xắc, số học sinh vắng mặt
trong một buổi học,… là các đại lượng ngẫu nhiên rời rạc.
Bảng phân phối xác suất
Bảng phân phối xác suất dùng để thiết lập luật phân phối xác suất của
đại lượng ngẫu nhiên rời rạc, nó gồm 2 thông tin: thông tin thứ nhất liệt kê
các giá trị có thể x1 , x2 ,..., xn của đại lượng ngẫu nhiên X và thông tin thứ hai
liệt kê các xác suất tương ứng p1, p2 ,..., pn của các giá trị có thể đó.

3


X

x1

x2



xn

P

p1

p2



pn


Nếu các giá trị có thể của đại lượng ngẫu nhiên X gồm hữu hạn số

x1, x2 ,..., xn thì các biến cố X  x1 , X  x2 ,…, X  xn lập thành một nhóm các
biến cố đầy đủ xung khắc từng đôi.
Do đó,

n

 p  1.
i 1

i

1.1.3. Biến ngẫu nhiên liên tục và hàm mật độ xác suất
1.1.3.1. Biến ngẫu nhiên liên tục
Định nghĩa 1.2. Nếu tập các giá trị mà biến ngẫu nhiên nhận lấp đầy một
khoảng trên trục số, khi đó biến ngẫu nhiên được gọi là biến ngẫu nhiên liên
tục.
Ví dụ 1.3. - Nhiệt độ không khí ở mỗi thời điểm nào đó.
- Khoảng thời gian giữa hai ca cấp cứu của một bệnh viện.
1.1.3.2. Hàm mật độ xác suất
Định nghĩa 1.3. Hàm mật độ xác suất của đại lượng ngẫu nhiên liên tục X là





hàm không âm f ( x) xác định với mọi x  ,  thỏa mãn


P  X  B   f  x dx
B

với mọi tập số thực B.

4


1.2. Các đặc trƣng của biến ngẫu nhiên
1.2.1. Kỳ vọng (Expectation)
Định nghĩa 1.4. Giả sử X là một biến ngẫu nhiên rời rạc có thể nhận các giá
trị x1 , x2 ,..., xn với các xác suất tương ứng p1, p2 ,..., pn . Kỳ vọng của biến ngẫu
nhiên X, kí hiệu EX, là số được xác định bởi

EX   xi pi
i

Giả sử X là một biến ngẫu nhiên liên tục có hàm mật độ xác suất p(x).
Kỳ vọng của biến ngẫu nhiên X được xác định bởi

EX 



 xp( x)dx



1.2.2. Phƣơng sai
Định nghĩa 1.5. Phương sai (độ lệch bình phương trung bình) của đại lượng

ngẫu nhiên X, kí hiệu Var(X) hay DX, được định nghĩa bằng công thức

DX  E( X  EX)2 .
- Nếu X là một biến ngẫu nhiên rời rạc có thể nhận các giá trị

x1, x2 ,..., xn với các xác suất tương ứng p1, p2 ,..., pn thì

DX   xi  EX  pi .
2

i

- Nếu X là đại lượng ngẫu nhiên liên tục có hàm mật độ xác suất là p(x)
thì


DX    x  EX

2

p  x  dx .



Trong thực tế người ta thường tính phương sai bằng công thức:
DX  E ( X  EX)2  EX 2  (EX)2 .

Ý nghĩa của phương sai: Ta thấy X  EX là độ lệch khỏi giá trị trung
bình nên DX  E  X  EX  là độ lệch bình phương trung bình. Do đó
2


5


phương sai phản ánh mức độ phân tán các giá trị của đại lượng ngẫu nhiên
chung quanh giá trị trung bình.
1.2.3. Độ lệch tiêu chuẩn
Đơn vị đo của phương sai bằng bình phương đơn vị đo của đại lượng
ngẫu nhiên. Khi cần đánh giá mức độ phân tán các giá trị của đại lượng ngẫu
nhiên theo đơn vị của nó, người ta dùng một đặc trưng mới đó là độ lệch tiêu
chuẩn.
Định nghĩa 1.6. Độ lệch tiêu chuẩn của đại lượng ngẫu nhiên X, kí hiệu là

  X  được định nghĩa như sau:
  X   DX
1.3. Lý thuyết mẫu
1.3.1. Một số phƣơng pháp lấy mẫu
- Một tập hợp chính  là tập hợp tất cả đối tượng có chung một tính
chất nào đó mà chúng ta đang quan tâm.
- Mỗi phần tử của tập hợp chính được gọi là một cá thể.
- Một biến lượng X (hay một dấu hiệu về lượng) là một ánh xạ từ tập 
lên trục số. Đó là một phép đo xác định trên mỗi cá thể của  . Tập tất cả các
số đo X trên tất cả các cá thể của  làm thành một tập hợp chính các giá trị
của X.
- Việc chọn ra từ tập hợp chính một tập con nào đó gọi là phép lấy mẫu.
Tập hợp con này được gọi là một mẫu.
- Một mẫu được gọi là mẫu ngẫu nhiên nếu trong phép lấy mẫu đó mỗi
phần tử của tập hợp chính đều được chọn một cách độc lập và có xác suất
được chọn như nhau.


6


- Ngoài ra còn có các phương pháp lấy mẫu khác: chọn mẫu với xác
suất không đều, theo nhóm trội xác suất đều, mẫu chuẩn.
1.3.2. Đặc trƣng mẫu
1.3.2.1. Trung bình mẫu
Kí hiệu x

x

1 n
 xi (1)
n i1

Nếu trong mẫu có m giá trị khác nhau x1  x2  ...  xm và giá trị xi có
tần số ri :
m

x

r x
i 1
m

i i

(2)

r

i 1

i

Nếu có bảng phân phối ghép lớp với m khoảng C1 , C2 ,..., Cm và tần số
của khoảng Ci là ri , thì trung bình mẫu x được tính bằng công thức (2), với

xi là trung điểm của khoảng Ci .
1.3.2.2. Mode
Nếu mẫu được chọn cho dưới dạng bảng phân phối tần số thì Mode là
giá trị có tần số max.
1.3.2.3. Độ lệch trung bình
Kí hiệu: M d
n

 xi  x ri

M d  i 1

n

trong đó, x - trung bình mẫu, ri - tần số của giá trị xi .

7


Chƣơng 2
BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
2.1. Khái niệm
2.1.1. Giả thuyết thống kê và kiểm định giả thuyết thống kê

Định nghĩa 2.1. Giả thuyết thống kê là những phát biểu về các tham số, quy
luật phân phối, hoặc tính độc lập của các đại lượng ngẫu nhiên. Việc tìm ra
kết luận để bác bỏ hay chấp nhận một giả thuyết gọi là kiểm định giả thuyết
thống kê.
Ví dụ 2.1. Giám đốc một nhà máy sản xuất bo mạch chủ máy vi tính tuyên bố
rằng tuổi thọ trung bình của một bo mạch chủ do nhà máy sản xuất ra là 5
năm; đây là một giả thuyết về kì vọng của biến ngẫu nhiên X bằng tuổi thọ
của một bo mạch chủ. Để đưa ra kết luận là chấp nhận hay bác bỏ giả thuyết
trên, ta cần dựa vào mẫu điều tra và quy tắc kiểm định thống kê.
Định nghĩa 2.2. Trong bài toán kiểm định giả thuyết, giả thuyết cần được
kiểm định gọi là giả thuyết không (null hypothesis), kí hiệu là H 0 . Mệnh đề
đối lập với H 0 gọi là đối thuyết (alternative hypothesis), kí hiệu là H1 .
Ví dụ 2.2. a) Gọi  là độ thay đổi trung bình trong huyết áp của một bệnh
nhân sau khi dùng thuốc; Bác sĩ điều trị cần quan tâm đến giả thuyết sau:

H 0 :   0

 H1 :   0
H 0 :   0 - Không có ảnh hưởng của thuốc lên huyết áp của bệnh
nhân;

H1 :   0 - Có ảnh hưởng của thuốc lên huyết áp của bệnh nhân.

8


b) Một khách hàng quan tâm đến tỷ lệ sản phẩm kém chất lượng trong
một lô hàng mua của một nhà cung cấp. Giả sử tỷ lệ sản phẩm kém tối đa
được phép là 5%. Khách hàng cần quan tâm đến giả thuyết sau


H 0 : p  0,05

H1 : p  0,05
H 0 : p  0,05 - Tỷ lệ sản phẩm kém cao hơn mức cho phép;

H1 : p  0,05 - Tỷ lệ sản phẩm kém ở mức chấp nhận được.
2.1.2. Cách đặt giả thuyết
- Giả thuyết được đặt ra với ý đồ bác bỏ nó, nghĩa là giả thuyết đặt ra
ngược lại với điều ta muốn chứng minh, muốn thuyết phục.
- Giả thuyết được đặt ra sao cho khi chấp nhận hay bác bỏ nó sẽ có tác
dụng trả lời bài toán thực tế được đặt ra.
- Giả thuyết được đặt ra sao cho nếu nó đúng thì ta sẽ xác định được
quy luật phân phối của đại lượng ngẫu nhiên được chọn làm tiêu chuẩn kiểm
định.
- Khi đặt giả thuyết, ta thường so sánh cái chưa biết với cái đã biết. Cái
chưa biết là điều mà ta cần kiểm định, kiểm tra, làm rõ. “ Cái đã biết” là
những thông tin trong quá khứ, các định mức kinh tế, kĩ thuật.
- Giả thuyết đặt ra thường mang ý nghĩa: “không khác nhau” hoặc “
khác nhau không có ý nghĩa” hoặc “ bằng nhau”.
Tổng quát: Một bài toán kiểm định giả thuyết cho tham số  sẽ có
một trong 3 dạng dưới đây ( 0 là giá trị kiểm định đã biết):
Hai phía:

 H 0 :   0

 H1 :    0

9



Một phía bên trái:

 H 0 :   0

 H1 :    0
Một phía bên phải:

 H 0 :   0

H1 :   0
2.1.3. Miền bác bỏ - tiêu chuẩn kiểm định
Định nghĩa 2.3. Xét bài toán kiểm định giả thuyết có giả thuyết H 0 và đối
thuyết H1 .
Giả sử rằng H 0 đúng, tiêu chuẩn kiểm định giả thuyết là một thống kê

G  G( X1, X 2 ,... X n ; 0 ) , lập từ mẫu ngẫu nhiên X  ( X1, X 2 ,..., X n ) kích
thước n (có thể phụ thuộc vào tham số đã biết trong H 0 là 0 ), thỏa mãn điều
kiện: Khi H 0 đúng thì luật phân phối xác suất của G hoàn toàn được xác định.
Khi đã có một tiêu chuẩn kiểm định G, với xác suất  đã cho, người ta
thiết lập một miền W (được gọi là miền bác bỏ giả thuyết) thỏa mãn điều
kiện:

P(G  W H 0 đúng) = 
Nếu  nhỏ (  có thể: 0,1; 0,05; 0,01;…) theo nguyên lý xác suất nhỏ
biến cố G  W  không xảy ra trong một phép thử  X1 , X 2 ,... X n  . Vì vậy với
một phép thử  X1 , X 2 ,... X n  nếu G( X 1 , X 2 ,..., X n )  W  xảy ra nghĩa là H 0
sai; ta bác bỏ H 0 chấp nhận H1 . Còn nếu
xảy ra ta chưa có cơ sở bác bỏ H 0 .

10


G( X1, X 2 ,..., X n )  W 

không


Tập hợp W gọi là miền bác bỏ giả thuyết H 0 và phần bù W gọi là
miền chấp nhận giả thuyết H 0 .
Đại lượng ngẫu nhiên G  G( X1, X 2 ,... X n ;0 ) gọi là tiêu chuẩn kiểm
định giả thuyết H 0 .
Giá trị  gọi là mức ý nghĩa của bài toán kiểm định.
2.1.4. Sai lầm loại I và sai lầm loại II
Trong bài toán kiểm định giả thuyết thống kê ta có thể mắc phải các
loại sai lầm sau:
Sai lầm loại I: Là sai lầm mắc phải khi ta bác bỏ H 0 trong khi thực tế giả
thuyết H 0 đúng.Sai lầm loại I kí kiệu là  , chính là mức ý nghĩa của kiểm
định

  P(G  W H 0 đúng).
Sai lầm loại II: Là sai lầm mắc phải khi ta chấp nhận giả thuyết H 0 trong khi
thực tế H 0 sai. Sai lầm loại II kí hiệu là 

  P(G  W H1 đúng).
Chú ý:
- Nếu ta muốn giảm xác suất sai lầm loại I thì sẽ làm tăng xác suất sai
lầm loại II và ngược lại.
- Đối với một tiêu chuẩn kiểm định và mức ý nghĩa  ta có thể tìm
được vô số miền bác bỏ W . Thường người ta ấn định trước xác suất sai lầm
loại I (tức cho trước mức ý nghĩa  ) chọn miền bác bỏ W nào đó có xác
suất sai lầm loại II nhỏ nhất.


11


Ví dụ 2.3. Khảo sát tốc độ cháy của một loại nhiên liệu rắn dùng để đẩy tên
lửa ra khỏi giàn phóng. Giả sử biến ngẫu nhiên X bằng tốc độ cháy của nhiên
liệu (cm/s) có phân phối chuẩn với kỳ vọng  và độ lệch chuẩn   2,5 .
Ta cần kiểm định giả thuyết

H 0 :   50

H1 :   50
Giả sử bác bỏ H 0 khi x  48, 5 hoặc x  51, 5 . Các giá trị 48,5 và 51,5
gọi là các giá trị tới hạn. Giả sử khảo sát mẫu ngẫu nhiên cỡ n  10 . Ta tìm
xác suất sai lầm loại I.

   (bác bỏ H 0 khi H 0 đúng).
Tức là

  ( X  48,5   50)  ( X  51,5   50)
 X  50

 X  50

48,5  50
51,5  50
 
10 
10    
10 

10 
2,5
2,5
 2,5

 2,5


   Z  1,90    Z  1,90
 0,5   (1,9)  0,5   (1,9)

 0,0287  0,0287  0,0574 . ( tra bảng hàm Láp-la-xơ ta được

 (1,9)  0,47128 )
Nghĩa là có 5,74% số mẫu ngẫu nhiên khảo sát được sẽ dẫn đến kết
luận bác bỏ giả thuyết H 0 :   50(cm / s) khi tốc độ cháy trung bình thực sự
là 50 (cm/s).
Ta có thể làm giảm sai lầm  bằng cách mở rộng miền chấp nhận. Giả
sử với cỡ mẫu n = 10, miền chấp nhận là 48  x  52 khi đó giá trị của  là

12


48  50
52  50




10     Z 

10 
2,5
2,5




 P( Z  2,53)  P( Z  2,53)
 0,0057  0,0057  0,0114

   Z 

Xác suất sai lầm loại II  được tính như sau

   (không bác bỏ H 0 khi H 0 sai).
Để tính  ta cần chỉ ra một giá trị cụ thể cho tham số trong đối thuyết

H1 .
Giả sử với cỡ mẫu n=10, miền chấp nhận của giả thuyết H 0 là

48,5  X  51,5 , trong khi giá trị thực sự của   52 .
Sai lầm  cho bởi

  (48,5  X  51,5   52)
 48,5  52

X  52
51,5  52
 
10 

10 
10 
2,5
2,5
 2,5

   4,43  Z  0,63

   Z  0,63    Z  4,43
 0,5   (0,63)  0,0000  0,2643
Giả sử giá trị thực sự của   50,5 . Khi đó

    48,5  X  51,5   50,5
 48,5  50,5

X  50,5
51,5  50,5
 
10 
10 
10 
2,5
2,5
2,5


   2,53  Z  1,27   0,8980  0,0057  0,8923 .

13



2.2. Bài toán kiểm định giả thuyết
2.2.1. Các bƣớc tiến hành kiểm định giả thuyết thống kê
Bước 1. Phát biểu giả thuyết H 0 và đối thuyết H1
Bước 2. Định mức ý nghĩa 
Bước 3. Chọn tiêu chuẩn kiểm định G
Bước 4. Thiết lập miền bác bỏ H 0 : W ;
Bước 5. Từ mẫu cụ thể ( x1 , x2 ,..., xn ) tính G( x1, x2 ,..., xn )
- G( x1 , x2 ,..., xn )  W : bác bỏ H 0 chấp nhận H1
- G( x1 , x2 ,..., xn )  W : chấp nhận H 0
2.2.2. Bài toán kiểm định dùng một mẫu
2.2.2.1. Kiểm định giả thuyết cho kỳ vọng
Kiểm định giả thuyết cho kỳ vọng, trƣờng hợp biết 

2

 Các giả định:
- Giả sử ( X1, X 2 ,..., X n ) là mẫu ngẫu nhiên rút từ biến ngẫu nhiên X có
phân phối chuẩn N (  , 2 ) với kỳ vọng  chưa biết.
- Phương sai  2 đã biết.
- Cho trước giá trị 0 , cần so sánh kỳ vọng  với 0 .
 Bài toán kiểm định có 3 trường hợp:

 H :   0
a)  0
 H1 :    0

 H :   0
b)  0
H1 :   0


 H :   0
c)  0
H1 :   0

Với mức ý nghĩa  cho trước.
 Các bước kiểm định:
Bước 1. Phát biểu giả thuyết không và đối thuyết.

14


Bước 2. Xác định mức ý nghĩa  .
Bước 3. Lấy mẫu ngẫu nhiên cỡ n: ( X1, X 2 ,..., X n ) và tính thống kê
kiểm định:

Z0 

X  0



n

Bước 4. Xác định miền bác bỏ W (Bảng 1)
Giả thuyết
H0 :

Miền bác bỏ


  0

W  z0 : z0  z1 2

H 1 :   0

H 0 :   0

W  z0 : z0   z1 

H1 :   0
H 0 :   0

W  z0 : z0  z1 

H1 :   0

Bảng 1: Miền bác bỏ với đối thuyết tương ứng
Bước 5 (Kết luận). Bác bỏ H 0 / chưa đủ cơ sở để bác bỏ.
Kiểm định giả thuyết cho kỳ vọng trƣờng hợp  chƣa biết, mẫu nhỏ
2

 Các giả định:
- Giả sử ( X1, X 2 ,..., X n ) là mẫu ngẫu nhiên rút từ biến ngẫu nhiên X có
phân phối chuẩn N (  , 2 ) với kỳ vọng  và phương sai  2 chưa biết.
- Sử dụng ước lượng không chệch S thay cho 
- Cỡ mẫu nhỏ: n

 30.


 Bài toán kiểm định có 3 trường hợp:

15


 H 0 :   0
a) 
 H1 :    0

 H 0 :   0
b) 
 H1 :    0

 H 0 :   0
c) 
 H1 :    0

Với mức ý nghĩa  cho trước.
 Các bước kiểm định:
Bước 1. Phát biểu giả thuyết không và đối thuyết.
Bước 2. Xác định mức ý nghĩa  .
Bước 3. Lấy mẫu ngẫu nhiên cỡ n: ( X1, X 2 ,..., X n ) và tính thống kê
kiểm định:

T0 

X  0
n
S


Biến ngẫu nhiên T0 có phân phối Student với n-1 bậc tự do.
Bước 4. Xác định miền bác bỏ W (Bảng 2
Giả thuyết

Miền bác bỏ

H 0 :   0

W  t0 : t0  tn1,1 2

H 1 :   0

H 0 :   0
H1 :   0
H 0 :   0
H1 :   0

W  t0 : t0  tn1,1 
W  t0 : t0  tn1,1 

Bảng 2. Miền bác bỏ với đối thuyết tương ứng (mẫu nhỏ).
Bước 5 (Kết luận). Bác bỏ H 0 / chưa đủ cơ sở để bác bỏ H 0 .

16


Kiểm định giả thuyết cho kỳ vọng trƣờng hợp  2 chƣa biết, mẫu lớn
 Các giả định:
- Giả sử ( X1, X 2 ,..., X n ) là mẫu ngẫu nhiên rút từ biến ngẫu nhiên X có
phân phối chuẩn N (  , 2 ) với kỳ vọng  và phương sai  2 chưa biết.

- Sử dụng ước lượng không chệch S thay cho  .
- Cỡ mẫu lớn: n  30.
 Khi cỡ mẫu lớn biến ngẫu nhiên

Z0 

X  0
n
S

sẽ hội tụ về phân phối chuẩn hóa Z

(*)

N (0,1) .Khi đó miền bác bỏ W sẽ

được tính tương tự như trường hợp biết phương sai, chỉ thay thế

X  0



n

bằng Z0 ở phương trình (*).
2.2.2.2. Kiểm định giả thuyết cho tỷ lệ
Bài toán: Cho biến ngẫu nhiên X có phân phối nhị thức B(1,p). Từ mẫu ngẫu
nhiên ( X1, X 2 ,..., X n ) hãy kiểm định giả thuyết H 0 : p  p0

H : p  p0

a)  0
H1 : p  p0

H : p  p0
b)  0
H1 : p  p0

H : p  p0
c)  0
H1 : p  p0

Với mức ý nghĩa  .
 Các giả định:
- Cỡ mẫu n lớn, để phân phối chuẩn xấp xỉ phân phối nhị thức cần có

np0  5 và n(1  p0 )  5 .

17


- Quan sát sự xuất hiện của biến cố “phần tử mang đặc tính A” trong n
phép thử độc lập. Gọi Y là số lần xuất hiện biến cố trên thì Y

P

Y

B(n, p) . Và

là ước lượng không chệch cho p.


n
- Nếu H 0 đúng, thống kê

Z0 

P  p0
p0 (1  p0 )
n

có phân phối chuẩn hóa N (0,1) . Chọn Z0 làm tiêu chuẩn kiểm định.
 Các bước kiểm định:
Bước 1. Phát biểu giả thuyết và đối thuyết.
Bước 2. Xác định mức ý nghĩa  .
Bước 3. Tính giá trị thống kê kiểm định

Z0 

P  p0
p0 (1  p0 )
n

Bước 4. Xác định miền bác bỏ (Bảng 3)
Giả thuyết

Miền bác bỏ

H 0 : p  p0
H1 : p  p0




W   z0 : z0  z  
1

2

H 0 : p  p0

W   z0 : z0   z1 

H1 : p  p0
W  z0 : z0  z1 

H 0 : p  p0
H1 : p  p0

Bảng 3: Miền bác bỏ cho bài toán kiểm định tỷ lệ

18


Bước 5 (Kết luận). Bác bỏ H 0 / chưa đủ cơ sở để bác bỏ H 0 .
2.2.3. Bài toán kiểm định dùng nhiều mẫu
2.2.3.1. So sánh hai kỳ vọng
So sánh hai kỳ vọng, trƣờng hợp phƣơng sai đã biết
 Các giả định:
- ( X1, X 2 ,..., X n ) là mẫu ngẫu nhiên được rút từ biến ngẫu nhiên X có
phân phối chuẩn với kỳ vọng 1 và phương sai  12 .
- (Y1,Y2 ,...,Ym ) là mẫu ngẫu nhiên được rút từ biến ngẫu nhiên Y có

phân phối chuẩn với kỳ vọng 2 và phương sai  22 .
- Biến ngẫu nhiên X và Y độc lập với nhau.
- Các phương sai  12 và  22 đã biết.
 Bài toán kiểm định giả thuyết trên hai mẫu độc lập gồm các dạng sau:

H :   2  D0
a)  0 1
H1 : 1  1  D0

H :   2  D0
b)  0 1
H1 : 1  2  D0

H :   2  D0
c)  0 1
H1 : 1  2  D0

Với mức ý nghĩa  cho trước.
 Các bước kiểm định:
Bước 1. Phát biểu giả thuyết H 0 và đối thuyết H1
Bước 2. Xác định mức ý nghĩa 
Bước 3. Tính thống kê kiểm định

Z0 

X  Y  (1  2 )

12
n


thống kê Z0



 22
m

N (0,1) .

Bước 4. Xác định miền bác bỏ (Bảng 4):

19


Đối thuyết

Miền bác bỏ

H 0 : 1  2  D0
H1 : 1  2  D0



W   z0 : z0  z  
1

2

H 0 : 1  2  D0


W   z0 : z0   z1 

H1 : 1  2  D0

H 0 : 1  2  D0

W   z0 : z0  z1 

H1 : 1  2  D0
Bảng 4: Miền bác bỏ cho so sánh hai kỳ vọng, phương sai đã biết
Bước 5 (Kết luận). Nếu bác bỏ H 0 ta kết luận H1 đúng với (1   )100%
độ tin cậy. Ngược lại ta kết luận chưa đủ cơ sở để bác bỏ H 0 với  cho
trước.
So sánh hai kỳ vọng, trƣờng hợp phƣơng sai chƣa biết, mẫu lớn
 Các giả định:
- ( X1, X 2 ,..., X n ) là mẫu ngẫu nhiên được chọn từ biến ngẫu nhiên X có
kỳ vọng 1 và phương sai  12 chưa biết.
- (Y1,Y2 ,...,Ym ) là mẫu ngẫu nhiên được chọn từ biến ngẫu nhiên Y có
kỳ vọng 2 và phương sai  22 chưa biết.
- Biến ngẫu nhiên X và Y đối lập với nhau.
- Cỡ mẫu lớn: n  30 và m  30 .
- Đối với trường hợp mẫu lớn, khi phương sai  12 và  22 chưa biết ta
thay thế bằng các phương sai mẫu S12 và S22 mà không tạo ra nhiều khác biệt.

20


×