Tải bản đầy đủ (.docx) (20 trang)

Tìm hiểu tổng quan về phương pháp thống kê và kiểm định giả thiết

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (420.37 KB, 20 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
──────── * ───────

BÁO CÁO BÀI TẬP LỚN
QUÁ TRÌNH NGẪU NHIÊN
ỨNG DỤNG
ĐỀ TÀI: Tìm hiểu tổng quan về phương pháp
thống kê và kiểm định giả thiết
Giáo viên hướng dẫn:
PGS.TS Nguyễn Thị Hoàng Lan
Sinh viên thực hiện :
Đồng Thị Ngọc
Lê Đức Nam
Nguyễn Thanh Tú
Nguyễn Bá Toản
Đinh Trọng Liên
Lê Quốc Đạt
Bùi Yên Bình
Nguyễn Trường Thịnh

Trang 1

20091900
20091827
20093199
20092788
20091578
20090667
20090225
20092595




MỤC LỤC

Trang 2


PHÂN CÔNG NHIỆM VỤ:
-

Đồng Thị Ngọc: Tìm hiểu về các khái niệm cơ bản + báo cáo
Lê Đức Nam: Mean ( Kiểm định kỳ vọng)
Nguyễn Thanh Tú : Phương Sai và Kiểm định độc lập
Nguyễn Trường Thịnh : Phân phối
Nguyễn Bá Toản : Kiểm định phân phối
Đinh Trọng Liên : Likelihood ratio test
Bùi Yên Bình: Bài tập
Lê Quốc Đạt : Ứng dụng Matlab để làm

Trang 3


Phần I. Giới thiệu chung
I.

Khái niệm cơ bản
Xác suất là một môn toán học phát triển trí óc và theo kiểu trừu
tượng, khó hiểu. Nó là những dự đoán và suy luận cơ bản về thực tế.
Thống kê dựa trên các áp dụng lý thuyết để giải quyết các vấn đề thưc tế
và nó là những dự đoán và diễn giải cơ bản dựa trên sự theo dõi và quan

sát thực tế.
Thống kê gồm hai phần là analysis và design.
• Analysis, hay thống kê toán học, là một phần của xác suất là sự
lặp lại chính của việc thử đi thử lại xem các sự kiện xác suất
được tiến gần tới 0 hoặc là 1. Đó là sự tiên quyết để suy ra việc
có thể chấp nhận gần với cái đúng nhất.
• Design, hay còn gọi là thống kê ứng dụng, nó bao gồm số lượng
các dữ liệu thu lượm và tạo ra được trong những thử nghiệm, nó
có thể miêu tả chính xác bởi kiểu xác suất. Trong chương này,
chúng ta sẽ mở đầu bằng các đối tượng cơ bản của toán học xác
suất.
Chúng ta bắt đầu quan sát sự kết nối giữa khái niệm xác suất và thực

tế :
(9-1)
Xác suất xảy ra của một sự kiện a với một số là xác suất thành công
trong n lần thử. Chúng ta sử dụng các cách thức thử nghiệm để làm sáng tỏ
sự liên kết của tất cả các khái niệm xác suất. Ví dụ, chúng ta đưa ra ý nghĩa
của η của một RV x có thể xấp sỉ bởi giá trị trung bình.
(9-2)
của các lần thử giá trị của x, và nó được thống kê bằng các lần
thử trước đây

Thống kê:
(9-3)
Trang 4


là số các giá trị , Giá trị của hàm không lớn hơn 1 . Mối quan hệ đó là
theo lối lặp lại các công việc ước lượng đoạn η và và một vấn đề chính của

người thống kê là mang tới cho mọi người một kết quả chính xác nhất.
Trong nghiên cứu thống kê, chúng ta giải quyết hai vấn đề cơ bản.
o Vấn đề thứ nhất, chúng ta giả sử rằng giả thuyết thống kê là
đúng và chúng ta muốn rằng làm được việc dự đoán một điều gì
đó trong tương lai. Ví dụ: Chúng ta biết được xác suất của một
RV x và chúng ta muốn nó dự báo được giá trị trung bình của
sau n thử nghiệm trong tương lai hoặc là chúng ta biết xác suất
p của một sự kiện A và chúng ta muốn dự đoán được số lần
thành công của xác suất thành công A trong n lần thử. Trong cả
hai trường hợp chúng ta đều tiến hành theo mô hình (Fig. 9 -1
a).
o Trong trường hợp thứ hai, một hay nhiều tham số , ko biết gì về
đối tượng mà chúng ta ước lượng, hoặc là những giá trị đó
(tham số ước lượng khác) phải chọn là , là một giá trị hằng (lấy
từ giả thuyết). Ví dụ, chúng ta theo dõi giá trị của một RV x và
chúng ta muốn có hoặc là sự đánh giá về ý nghĩa của hoặc là
thừa nhận giả thuyết rằng = 5.3. Chúng ta tung đồng xu 1000
lần và nó hiện lên mặt ngửa 465 lần. Sử dụng thông tin đó,
chúng ra sẽ có được ước lượng xác suất p xuất hiện mặt ngửa
xuất hiện ít hơn hoặc là quyết định là xác suất xảy ra hai sự hiện
là bằng nhau (theo giả thuyết). Trong cả hai trường hợp, thì
chúng ta đang tiến hành dựa trên sự quan sát (Fig. 9-b). Trong
chương này, chúng ta sẽ tập trung vào ước lượng tham số và
kiểm tra lí thuyết. Để chuẩn bị trước thì chúng ta sẽ tập trung
chú thích một cách ngắn gọn các vấn đề dự đoán (Prediction).
Prediction: Chúng ta đưa ra một RV x cùng sự thống kê của nó và
chúng ta muốn ước lượng giá trị của x ở một lần thử trong tương lai. Một
cách ước lượng x là quyết định chọn một hằng số c sao cho tổng các giá trị
-c là nhỏ nhất. Trong một số lần thử đặc biệt, RV x có thể mang một trong
nhiều giá trị. Có thể các giá trị đó ko thể nào dự đoán trước, nó chỉ có thể

ước lượng được. Vì vậy ước lượng của một RV x là dự đoán một giá trị
tiếp theo của x dựa vào giá trị của c. Nếu chúng ta sử dụng tiêu chuẩn cho

Trang 5


sự lựa chọn c ở mức độ nhỏ nhất có thể của độ lệch sai số MS E{(x - c) 2},
suy ra c = E{x}. Vấn đề là phải cân nhắc kĩ lưỡng.
o Một quá trình lấy rời rạc của x là một sự quyết định hai tham số
c1 và c2:
P{ c1 < x < c2 } = γ = 1- δ

Trên đây thì được gọi là hằng số riêng. Phương trình trạng thái trên,
nếu chúng ta dự đoán giá trị x của x ở lần thử tiếp theo thì nó sẽ nằm trong
khoảng cách (c1,c2), dự đoán của chúng ta sẽ chính xác 100. % trong
trường hợp này. Vấn đề là làm sao tìm được c 1 và c2 sao cho sự sai khác c2
– c1 là nhỏ nhất (9-4). Sự lựa chọn có hai vấn đề xung đột với nhau. Nếu
gần tới 1 thì dự đoán rằng x sẽ nằm trong khoảng (c1,c2) là đáng tin cậy
nhưng mà khoảng c2 – c1 quá lớn; nếu nhỏ bớt đi, c 2 – c1 được giảm đi
nhưng mà ước lượng là thiếu tin cậy. Giá trị đặc trưng của là 0.9, 0.95,
0.99. Để có được sự dự đoán tối ưu, chúng ta cần phải thêm vào một giá trị
vào để chúng ta xác định rõ c1 và c2 để cho khoảng cách c2 – c1 là nhỏ nhất
để thực hiện được (9-4). Chúng ta cần đưa ra rằng nếu như mật độ của x
một giá trị lớn nhất, c 2 – c1 là nhỏ nhất nếu như . Tạo ra c 1 và c2 bằng cách
thử và xác định độ lệch. Một điểm cực dễ dàng để tìm thấy nếu như chúng
ta các định rõ c1 và c2 giống như:

Mang lại c1 = và c2 = với xu là u % xuất hiện của x trong khoảng (c 1,c2)
(Fig. 9-2a). Cách giải quyết vấn đề này là tối ưu nếu như là đối xứng. Điều
đó có nghĩa là η là giá trị trung bình bởi vì thì sẽ đối xứng. Nếu x là chuẩn,

thì xu = η + zu là tỉ lệ % chuẩn (Fig. 9-2b).
II.
Bài tập ứng dụng

Trang 6


Ví dụ 9-1. Tuổi thọ dự tính của pin là một mẫu chuẩn RV với η = 4
năm và σ = 6 tháng. Xe ô tô dùng loại pin này. Tìm cách dự đoán độ lệch
so với tuổi thọ chuẩn với γ = 0.95.
Trong ví dụ này, δ = 0.05, = . Điều này tương đương với độ lêch
4 . Chúng ta có thể cho rằng sai số tuổi thọ của pin nằm trong khoảng 3 tới
5 năm.
Giống như phần thứ 2, chúng ta sẽ ước lượng số là số lần thành
công của sự kiên a trong n lần thử. Mục đích của sự ước lượng về là kết
quả . Độ lệch ước lượng (k1,k2) xác định rõ độ lệch nhỏ nhấ của k 2 – k1 đố
tượng tham chiếu.
Chúng ta giả sử rằng n là lớn và γ = 0.997. Để tìm tham chiếu , chúng
ta đặt .
Bởi vì 2G(3) 997. Kể từ đây chúng ta dự đoán với hệ số là 0.997 nó
có nghĩa là na sẽ nằm trong khoảng .
Ví dụ 2: Chúng ta tung đồng xu 100 lần và muốn dự đoán được số lần
na là mặt ngửa với γ = 0.997. Trong vấn đề này thì n = 100 và p = 0.5.
Chúng ta dự đoán, vì vậy, cùng với hệ số 0.997 là số mặt ngửa nằm
trong khoảng từ 35 tới 65.
Các ví dụ trên đã làm rõ vai trò của thống kê trong các ứng dụng xác
suất để giải quyết các vấn đề thực tế: Sự kiện được định nghĩa trong thực
nghiệm của trò chơi tung đồng xu. Nó mang lại những thông tin rằng xác
suất xảy ra không thể được sử dụng để xác thực dự đoán về sự kiện A thi
hành ở thực nghiệm . Sự kiện:

được khai báo ở thực nghiệm trong vòng lặp thử nghiệm và nó là xác
suất . Nếu như chúng ta có thể gần chắc chắn rằng sẽ xảy ra ở một quá
trình thực tế. Chúng ta có sự thay đổi suy nghĩ “chủ quan” về A dựa trên
thông tin cơ bản để có thể khách quan hơn để kết luận rằng sẽ chắc chắn
chính xác, dựa trên xác suất .
Chú ý: Tuy nhiên thì cả hai kết luận trên đều được dự đoán một cách
ngẫu nhiên, điểm khác giữa chúng chỉ là định lượng mà thôi

Phần II. Kiểm định
I.

Kiểm định kì vọng.
1. Bài toán đặt ra:
Đại lượng ngẫu nhiên X có trung bình E(X) = m chưa biết. Người
ta đưa ra giả thiết:
1.1. Trường hợp 1:
Trang 7


Phương sai Var(X) = đã biết và
hoặc ( và có phân phối chuẩn)
Chọn thống kê . Nếu đúng thì
Với mức ý nghĩa cho trước, xác định phân vị chuẩn . Ta tìm
được miền bác bỏ:
Vì:

1.2.

Lấy mẫu cụ thể và tính giá trị quan sát
So sánh và .

- Nếu
thì bác bỏ giả thuyết và chấp nhận .
- Nếu
thì chấp nhận .
Trường hợp 2:
Phương sai chưa biết. Và
Trong trường hợp này ta vẫn chọn thống kê như trên trong
đó độ lệch tiêu chuẩn như trên trường hợp 1 trong đó độ lệch
tiêu chuẩn được thay bởi độ lệch tiêu chuẩn của mẫu ngẫu
nhiên .
Nếu H đúng thì . Tương tự như trên ta có miền bác bỏ là:
Trường hợp 3.
Không biết phương sai và n<30.
- chưa biết.
- và có phân phối chuẩn.
Chọn thống kê:

1.3.

Nếu H đúng thì
Với mức ý nghĩa cho trước, ta xác định phân vị Student (n1) bậc tự do mức là .
Khi đó miền bác bỏ là:

Trang 8


Phần III. Phương sai và kiểm định độc lập
Kiểm định phương sai:
1. Bài toán đặt ra:
Đại lượng ngẫu nhiên X có phân phối N(ɳ, σ ) . Người ta đưa ra

giả thiết:

I.

1.1. Trường hợp 1:

Kỳ vọng ɳ đã biết. Ta sử dụng kiểm dịnh giả thiết với thống kê:
(9.69)
Nếu đúng thì q ).
Với mức ý nghĩa cho trước, xác định phân vị chuẩn . Ta tìm được
miền bác bỏ:
Vì:

-

Lấy mẫu cụ thể và tính giá trị quan sát
So sánh q và .
Nếu
thì bác bỏ giả thuyết và chấp nhận .
Nếu
thì chấp nhận .
1.2. Trường hợp 2:
Kỳ vọng ɳ chưa biết.
Trong trường hợp này ta vẫn chọn thống kê như trên trong đó kì
vọng như trên trường hợp 1 trong đó kì vọng được thay bởi giá trị
trung bình của mẫu ngẫu nhiên .
Nếu đúng thì q ). Tương tự trên, ta có miền bác bỏ là

II.


Kiểm định tính độc lập:
1. Bài toán đặt ra:
Chúng ta kiểm định giả thiết với hai sự kiện B và C là độc lập.
Giả thiết:
H0 : P(A∩B) = P(A) P(B) ngược lại (H1: P(A∩B) ≠ P(A) P(B)).
Giả sử xác suất của hai sự kiện b = P(B) và c = P(C) đã biết. Ta áp
dụng kiểm định chi bình phương để phân vùng các sự kiện :
A1 = B∩C

A2 = B∩

A3 = ∩C A4 = ∩
Ký hiệu p01 . p02, p03, p04 lần lượt là xác suất của các sự kiện
A1 ,A2 ,A3 ,A4.
Nếu H0 đúng, tức là các sự kiện Ai (i=1,4) là độc lập. Do đó:
Trang 9


p01 = bc
p02 = b(1-c) p03 = (1-b)c p04 = (1-b) (1-c)
Kết quả của kiểm định là
Chấp nhận H0 nếu <
Với ki là số xuất hiện của sự kiện Ai; ví dụ k2 là số lần B xuất hiện
nhưng C thì không.
2. Ví dụ:
Trong một trường đại học , tỷ lệ sinh viên năm thứ nhất là nam giới là
60 % còn tỷ lệ đó với toàn bộ sinh viên tốt nghiệp đại học là 75%.
Chọn ngẫu nhiên các hồ sơ của 299 nam và 101 nữ cùng với 168 nam
và 68 nữ tốt nghiệp.
Kiểm tra giả thuyết H0 rằng các sự kiện B={male} and C={graduate}

là độc lập.
Với α=0.05 với m= 400, p(B) = 0.6, p(C) = 0.75, pi = 0,45 0.15 0.3
0.1, ki = 168 68 131 33:
Áp dụng kiểm tra chi bình phương ta có:
q = = 4.1
2
Vì X 0.95(3) = 7.81 >4.1, chúng ta chấp nhận giả thiết H0.

Phần IV. Phân Phối

Trong ứng dụng này của lý thuyết kiểm định giả thuyết, giả thuyết
Ho không liên quan đến tham số, hàm phân bố F(x) của một biến ngẫu
nhiên x được giả thiết bằng một hàm F0(x).
ở đây H0 :F(x)=F0(x) <> H1 :F(x)≠ F0(x)
Để kiểm định giả thuyết này, có 2 phương pháp
• Phương pháp Kolmogoroff-Smirnov
• Phương pháp Chi-Square

I.

Phương pháp Kolmogoroff-Mirnov
Phương pháp này được thực hiện bằng việc hình thành 1 quá trình
ngẫu nhiên có phân phối £(x) để dự đoán vấn đề và sử dụng để kiểm tra
số liệu thống kê cho biến ngẫu nhiên
q= maxx| £(x)-F0(x)|
sự lựa chọn này được giả thích như sau: với mỗi tham số ¥ cụ thể , £( x)
có ước lượng phụ thuộc vào F(x), và nó có xu hướng tiến tới F(x) khi n
tiến tới vô cùng
Kì vọng E(£(x)) =F(x)
£(x)→F(x) khi n tiến tới vô cùng

Quay lại vấn đề

Trang 10


Biến ngẫu nhiên q có thể tiến về 0 nếu H0 đúng và tới 1 giá trị F(x)F0(x) nếu H1 đúng. Để phủ nhận giả thuyết H0 hay chấp nhận H0 ta đi so
sánh q với một hằng số c. điều này phụ thuộc vào mức ý nghĩa và phân
phối của biến ngẫu nhiên q. theo giả thuyết H0 chúng ta kiểm tra biến
ngẫu nhiên q bằng cách thay q vào biến ngẫu nhiên w trong công thức
(9.28) tức là q= maxx|£(x)-F(x)|
Sử dụng kết quả phân phối Kolmogoroff(9.29), chúng ta thu được
α =P (q>c|H0)= 1Từ đây có thể kết luận: Hình thành các sự toán thực nghiệm£(x) của
F(x)và quyết định q từ công thức q=maxx||£(x)-F(x)|
Ho được chấp nhận nếu q>
II.
Phương pháp Chi- Squared
Phương pháp này sử dụng kiểm tra thống kê Pearson. Và thực hiện
như sau
Đưa ra các phần vùng U=[ A1,……..,Am] của không gian P và muốn kiểm
tra giả thuyết các xác suất pi=P(Ai)của sự kiện Ai bằng m cho hằng số poi:
H0: pi=p0i với mọi i
ngược lại H1: pi≠p0i với 1 vài giá trị của i
dữ liệu đầu vào là số lần thử thành công ki trong n lần thử của mỗi sự
kiện Ai.
Xét biến ngẫu nhiên q=

1)

Biến ngẫu nhiên ki có phân nhị thức với kì vọng npi và phương sai
npiqi vì thế tỉ lệ ki/n có xu hướng tiến tới pi khi n .Kiểm tra giả thuyết

bằng việc so sánh q với 1 hàng số c.
Để tìm c, chúng ta phải xác định được phân phối của q. chúng ta sẽ
đi tìm theo hướng giả định n lớn. Với giả định như vậy , biến ngẫu nhiên
k là gần với phân phối chuẩn với kì vọng là kp i. theo giả thuyết H0, biến
ngẫu nhiên q có phân phối X2(m-1),trên thực tế, với hằng số p0i thỏa mãn
Quan sát số lượng ki và tính toán tổng q trong (9.75) , tìm χ 21-α(mChấp nhận Ho nếu q< χ21-α(m-1 )
(9.76)
Phương pháp Chi-Square được sử dụng trong việc kiểm định những
kiểm tra liên quan đến thỏa thuận các mô hình í thuyết với thực nghiệm.

Bài tập ứng dụng:
Thử nghiệm 300 lần và quan sát thấy rằng f có k i= 55 43 44 61 40 57 lần .
kiểm tra giả thiết với đọ chính xác α=0.05. có p0i=1/6, m=6, và npoi=50. Thay
nó vào công thức (9.75 )ta thu được q=7.6. do χ 20.95= 11.07 >7.6 nên chúng ta
chấp nhận giả thiết
Trang 11


Phần V: Kiểm định phân phối
I.

Các bước của việc kiểm định giả thiết thống kê

Gồm 6 bước:
• Bước 1:
Thành lập giả thuyết Ho
Ví dụ:
Ho: θ = θo
Ho: θ ≤ θo
Ho: θ ≥ θo

• Bước 2:
Thành lập giả thuyết H1
Ví dụ:
H1: θ < θo
H1: θ > θo
H1: θ ≠ θo
• Bước 3:
Xác định mức ý nghĩa α
• Bước 4:
Chọn các tham số thống kê thích hợp cho việc kiếm
định
và xác định các miền bác bỏ, miền chấp nhận và giá trị giới hạn.
• Bước 5:
Tính toán các giá trị của các tham số thống kê trong
việc kiểm định dựa trên số hiệu của mẫu ngẫu nhiên.
• Bước 6:
Ra quyết định: Nếu các giá trị tính toán rơi vào miền
bác bỏ Ho thì ra quyết định bác bỏ Ho. Ngược lại sẽ chấp nhận Ho.
II.
Kiểm định phân phối
, 1 m-1
, some i
 Áp dụng công thức :
và q < x21- α(m-1)
 Nếu công thức trên thỏa mãn thì
III.

Ví dụ

Chúng ta có 1 danh sách 500 phép toán tạo ra số thập phân xi và chúng

ta muốn kiểm tra giả thuyết cho rằng chúng là những mẫu của một BNN
x thống nhất phân phối trong khoảng thời gian(0, 1). Chúng ta chia
khoảng thời gian này thành 10 khoảng con với độ dài 0.1 và chúng ta
đếm số ki của mẫu xj trong khoảng con thứ i. kết quả là
Ki = 43 56 42 39 59 61 41 57 46 57
Trong vấn đề này, m = 500, p0i= 0.1 và
q = = 13.8
2
Vì X 0.95(9) = 16.9 > 13.8 , chúng ta chấp nhận giả thiết phù hợp.
Trang 12


Phần VI: Likelihood radio test
Vídụ 9-21: Chúng ta cóN(�, 1) RV x và chúng ta muốn kiểm tra
đơn giản các giả thuyết �= đối lập với � . Trong bài toán và
Đạt giá trị max nếu tổng :
Là min, có nghĩa là ,nếu = . Từ = và
�=
Từ phía trên nó sau �> c nếu<. Điều này cho thấy rằng các kiểm tra tỷ
số hợp lệ trung bình của một RV bình thương tương đương một để kiểm tra.
Lưu ý trong bài toán này rằng, m = 1 vàmo = 0.Hơn nữa,
w= -ln� = n=
Nhưng ở bên phải là RV với hàm phân phối(1). Từ đó, RV w có hàm phân
phối(m - ) không chỉ có tiệm cận, nhưng đối với bất kỳ n.
Giả lập tính toán trong kiểm định giả thuyết.
Như chúng ta thấy, kiểm định 1 một giả thuyếtgồm các bước sau :Chúng ta xác
định giá trị X của vector ngẫu nhiên X =[] trong điều kiện quan sátcủa m RVs
và tính toán giá trị tương ứng q = q(X) của bài toán phân tích
q = g(X).Chúng ta đồng ý nếu q không phải là một giá trị quan trọng trong bài
ví dụ như , nếu q là giá trị trong khoảng () với và là các giá trị được lựa chọn

thích hợp của u phần trăm củaq.
Điều này liên quan đến việc xác định hàm phân phối F(q)của q và giá trị nghịch
đảo = (u) củaF(q). Vấn đề đảo ngược có thể tránh được nếu chúng ta sử dụng
biện pháp sauđây.
HàmF(q) là hàm đơn điệu tăng . Từ đó,
nếu a = F()< F(q)< F() =b.
Điều này cho thấy rằng tương đương với kiểm tra
Đồng ý nếua Liên quan đến việc xác định hàm phân phối F(q) của q.Như chúng ta đã thể
hiện trong phần 8.3 , hàm F(q) có thể được xác định bằng giả lập tính toán :
Đề ước tính số lượng F(q)chúng ta xây dựng chuỗi vector RV
=[] i=1,…,n
vớilà các mẫu tính toán tạo ra của m RVs Sử dụng theo trình tựchúng ta hình
thành được chuỗi và chúng ta đếm số của nhỏ hơn so với tính toán q.Thêm vào
(8-163), chúng ta có được F(q)=.Với F(q)được xác định, công thức 9-84 được
kiểm tra:
Trang 13


đồng ý nếu
Như trên, q=g(X) là một số được xác định trong điều kiện của dữ liệu
kiểm định. Theo trình tự , tuy nhiên, các tính toán được tạo ra.
Các phương pháp trên được sử dụng nếu gặp khó khăn để xác định và
phân tích hàm F(q). Đây là trường hợp xác định số liệu thống kê kiểm tra
Pearson.

Phần VII: Bài tập
Bài 9.27
Cân nặng của hộp ngũ cốc là một biến ngẫu nhiên với kỳ vọng . Chúng ta đo 64
hộp và tính được . Kiểm định giả thuyết: H0 = ngược lại H1: với

Giải
Vì chưa biết nên ta có:



Với :

Vì nên chúng ta chấp nhận giả thiết H0
• Với :
Vì nên chúng ta chấp nhận giả thiết H0
Bài 9.28
Pin loại A có giá cao hơn pin loại B. Tuổi thọ của chúng là 2 biến ngẫu nhiên x,
y. Chúng ta kiểm định 16 pin loại A , 26 pin loại B và tính được các giá trị sau:
sx = 1,1
sy = 0,9
Kiểm định giả thiết: H0: ηx=ηy ngược lại H1: ηx ηy với α = 0,05
Ta có:
Vì nên chúng ta chấp nhận giả thiết H0
Bài 9.31
Một con xúc sắc tung lên 102 lần và lần thứ i có mặt ki =18, 15, 19, 17, 23,20
lần.
Kiểm định giả thiết con xúc sắc là công bằng với dùng kiểm định Chi-Square.
Giải
P0i = 1/6 , m=6, np0i = 17
Trang 14


Vậy ta chấp nhận H0
Phần VIII: Ứng dụng Matlab
1.


Các hàm thường sử dụng:



ztest: Kiểm định 1 mẫu, mẫu đó có phân phối chuẩn đã biết trước kỳ
vọng và phương sai, đối thuyết là nó không có kì vọng như vậy.



ttest: Kiểm định 1 mẫu, mẫu đó có phân phối chuẩn đã biết kỳ vọng
nhưng chưa biết phương sai, đối thuyết là nó không có phương sai như
vậy.



ttest2: Kiểm định 2 mẫu, 2 mẫu đó độc lập nhau có phân phối chuẩn đã
biết kì vọng nhưng chưa biết phương sai, đối thuyết là các kì vọng không
bằng nhau.



kstest: Kiểm định Kolmogorov-Smirnov trên 1 mẫu, mẫu đó có phân phối
liên tục với các tham số được chỉ rõ, đối thuyết là nó không có phân phối
như vậy.



kstest2: Kiểm định Kolmogorov-Smirnov trên 2 mẫu có phân phối liên
tục giống nhau, đối thuyết là chúng không có phân phối giống nhau.




vartest:Kiểm định phương sai Chi-square trên 1 mẫu, mẫu đó có phân
phối chuẩn đã biết phương sai, đối thuyết là nó có phân phối với phương
sai khác.



chi2gof: Kiểm định Chi-square (goodness-of-fit), với 1 mẫu có phân phối
được chỉ rõ, đối thuyết là nó không có phân phối như vậy.

*Một số hàm khác:





Ansaribradley: kiểm định Ansari-Bradley



Dwtest: kiểm định Durbin-Watson

Jbtest: kiểm định Jarque-Bera


Lillistest: kiểm định Lilliefors
Trang 15





...

2. Ví dụ
VD1:
Cho mẫu ngẫu nhiên 100 phần tử, kiểm định giả thuyết H0 có phân phối chuẩn
với kì vọng 0,1 và độ lệch chuẩn bằng 1:
x = normrnd(0.1,1,1,100);
ztest(x,0,1)
Ans= 0
( Ans=0 chứng tỏ chấp nhận giả thuyết H0 với mức ý nghĩa mặc định 0,05)

Thay đổi kì vọng có thể dẫn đến thay đổi tính đúng đắn của giá thuyết:
ztest(x,0.8,1)
ans = 1
( Ans=1 chứng tỏ bác bỏ giả thuyết H0 với mức ý nghĩa mặc định 0,05)
VD2:
Cho mẫu ngẫu nhiên 1000 phần tử, kiểm định giả thuyết H0 có phân phối chuẩn
với kì vọng 0,1 và độ lệch chuẩn bằng 1, mức ý nghĩa α= 0,01:
x = normrnd(0.1,1,1,1000);
ztest(x,0,1,0.01)
( ans = ? )
p: xác suất
h=1 chứng tỏ bác bỏ giả thuyết H0 với mức ý nghĩa 0,01

Trang 16



VD3:
Cho 1 mẫu 100 phần tử, kiểm định giả thuyết H0 có phân phối chuẩn với kì
vọng là 0,1, chưa biết phương sai:
x = normrnd(0.1,1,1,100);
ttest(x,0)

Ans=0 chứng tỏ chấp nhận giả thuyết H0 với mức ý nghĩa 0,05
VD4: Kiểm định giả thuyết với 2 mẫu x,y có cùng kì vọng

Trang 17


Ans=1 chứng tỏ bác bỏ giả thuyết với mức ý nghĩa 0,05
VD5:
Kiểm định Kolmogorov-Smirnov:
Kiểm định liệu là các giá trị có được lấy từ phân phối chuẩn hay ko?
x = -2:1:4 (x nhận giá trị từ -2 đến 4, mỗi số tăng lên 1 đơn vị)
kstest(x,[],0.05,0)

Ans=0 chứng tỏ chấp nhận giả thuyết: giá trị đươc lấy từ phân phối chuẩn
VD6:
Kiểm định Chi-square ( goodness-of-fit): x có được từ phân phối chuẩn hay
không ?
x = randn(100,1);
Trang 18


[h,p] = chi2gof(x,'cdf',@normcdf)

( h=0 chứng tỏ giả thuyết được chấp nhận.)


Trang 19


Trang 20



×