Tải bản đầy đủ (.docx) (18 trang)

Tìm hiểu tổng quan về phương pháp thống kê và kiểm định giả thiết

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (212.25 KB, 18 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
──────── * ───────

BÁO CÁO BÀI TẬP LỚN
QUÁ TRÌNH NGẪU NHIÊN
ỨNG DỤNG
ĐỀ TÀI: Tìm hiểu tổng quan về phương pháp
thống kê và kiểm định giả thiết
Giáo viên hướng dẫn:
PGS.TS Nguyễn Thị Hoàng Lan
Sinh viên thực hiện :
Nguyễn Đức Hậu
Trần Quang Đạt
Hà Văn Cầu
Hoàng Tùng Anh
An Mạnh Công
Đoàn Khắc Hùng

Trang 1

20124977
20124974
20124970
20124969
20121330
20121821


MỤC LỤC


Trang 2


PHÂN CÔNG NHIỆM VỤ:
-

Hoàng Tùng Anh: Tìm hiểu về các khái niệm cơ bản + báo cáo
Nguyễn Đức Hậu: Kiểm định kỳ vọng + bài tập
Đoàn Khắc Hùng : Phương Sai và Kiểm định độc lập
Hà Văn Cầu : Phân phối và Kiểm định phân phối
An Mạnh Công : Likelihood ratio test
Trần Quang Đạt : Ứng dụng Matlab để làm

Trang 3


Phần I. Giới thiệu chung
Khái niệm cơ bản
Quan sát các hiện tượng tự nhiên ta thấy có những hiện tượng thường xảy ra, có
những hiện tượng ít xảy ra. Xác suất là một đại lượng thể hiện mức độ xảy ra
(thường xuyên hay ít khi) của một biến cố. Trong lịch sử Toán học đã có nhiều
định nghĩa cho khái niệm xác suất
Xác suất là một môn toán học phát triển trí óc và theo kiểu trừu tượng. Nó là
những dự đoán và suy luận cơ bản về thực tế. Thống kê dựa trên các áp dụng lý
thuyết để giải quyết các vấn đề thưc tế và nó là những dự đoán và diễn giải cơ
bản dựa trên sự theo dõi và quan sát thực tế.
Để hiểu rõ hơn về thống kê, ta nêu các ví dụ :
Giả sử một hộp chứa 3 bi trắng và 1 bi đen. Trò chơi đặtra : Người tham gia
chơi sẽ bốc ngẫu nhiên một viên bi. Sẽ nhận được 5 đô nếu bốc được bi trắng,
sẽ trả 6 đô nếu bốc phải bi đen. Biết xác suất bốc mỗi viên bi là như nhau. Có

nên tham gia????
Nhận xét: Trong nhiều tình huống , để đưa ra quyết định, đánh giá hay giải
quyết một vấn đề nào đó… => ta dựa các tham số p, δ…. Lưu ý là với BNN nào
đó thì các tham số là duy nhất. => Thống kê để ta có các thông tin về tham số.
Chúng ta bắt đầu quan sát sự kết nối giữa khái niệm xác suất và thực tế :
p ≅ n_a/n
Xác suất p =P(a) xảy ra của một sự kiện a với một số n_a là xác suất thành
công trong n lần thử. Chúng ta sử dụng các cách thức thử nghiệm để làm sáng tỏ
sự liên kết của tất cả các khái niệm xác suất
Thống kê: là số các giá trị , Giá trị của hàm không lớn hơn 1 . Mối quan
hệ đó là theo lối lặp lại các công việc ước lượng đoạn η và và một vấn đề
chính của người thống kê là mang tới cho mọi người một kết quả chính xác
nhất.
Quá trình nghiên cứu thống kê sẽ có các giai đoạn :
1. Điều tra thống kê : xây dựng các khái niệm, chỉ tiêu thống kê, xác định
vấn đề, mục đích, nội dung, đối tượng nghiên cứu.
2. Tổng hợp thống kê : xử lý số liệu
3. Phân tích thống kê: Phân tích và giải thích kết quả, dự đoán xu hướng
phát triển. Báo cáo và truyền đạt kết quả nghiên cứu
Mục đích của nghiên cứu thống kê là sẽ giải quyết các vấn đề sau:
• Vấn đề thứ nhất, chúng ta giả sử rằng giả thuyết thống kê là
đúng và chúng ta muốn rằng làm được việc dự đoán một điều gì
đó trong tương lai. Ví dụ: Chúng ta biết được xác suất của một
RV x và chúng ta muốn nó dự báo được giá trị trung bình của
Trang 4


sau n thử nghiệm trong tương lai hoặc là chúng ta biết xác suất
p của một sự kiện A và chúng ta muốn dự đoán được số lần
thành công của xác suất thành công A trong n lần thử.

• Trong trường hợp thứ hai, một hay nhiều tham số , không biết gì về đối
tượng mà chúng ta ước lượng, hoặc là những giá trị đó (tham số ước lượng
khác) phải chọn là , là một giá trị hằng (lấy từ giả thuyết). Ví dụ, chúng ta
theo dõi giá trị của một RV x và chúng ta muốn có hoặc là sự đánh giá về
ý nghĩa của hoặc là thừa nhận giả thuyết rằng = 5.3. Chúng ta tung đồng
xu 1000 lần và nó hiện lên mặt ngửa 465 lần. Sử dụng thông tin đó, chúng
ra sẽ có được ước lượng xác suất p xuất hiện mặt ngửa xuất hiện ít hơn
hoặc là quyết định là xác suất xảy ra hai sự hiện là bằng nhau (theo giả
thuyết).
Về phân tích thống kê hay ở đây là tổng hợp thu thập để có những dự báo.
Trước hết ta xét khái niệm:
Định nghĩa : [Martingale] Một quá trình ngẫu nhiên
là một Martingale đối với bộ lọc
và với xác suất nếu:

được gọi

Với -hầu như chắc chắn và
Khái niệm -hầu như chắc chắn (P-almost surely) được hiểu như sau:
Cho
là một không gian xác suất. Biến cố trong xảy ra gần như
chắc chắn nếu
, điều này tương đương với biến cố xảy ra gần như
chắc chắn nếu xác suất biến cố không xảy ra bằng . Từ đó ta có thể hiểu
rằng với một bộ lọc ta có thể suy ra được với một độ đo xác suất hay là
một -đo được.
Vậy rốt cuộc ý nghĩa về mặt định tính của Martingale là gì? Ở đây chúng ta làm
rõ bằng một ví dụ như sau: khi quan sát một biến ngẫu nhiên ví dụ như là
quan sát giá cổ phiếu ACB, nếu thoả tính chất của Martingale điều đó có
nghĩa là muốn dự báo sự thay đổi của trong tương lai ta hoàn toàn không thể

dự đoán được với những thông tin hiện có. Nói ngắn gọn, hướng di chuyển
trong tương lai của Martingale là hoàn toàn không thể dự đoán được, mặc dù
Martingale cũng có thể có những khuynh hướng tồn tại trong một khoảng thời
gian rất ngắn tuy nhiên khuynh hướng này tăng hay giảm hoàn toàn ngẫu nhiên
và không có tính hệ thống
Ví dụ trong thực tế của Martingale có thể kể đến như việc đặt cược một cách
công bằng trong các trò chơi bài bạc hoặc quan sát sự biến động của giá cổ
Trang 5


phiếu, giá vàng, các bước đi dạo ngẫu nhiên ko có xu hướng (unbiased random
walk)…
Chúng ta đưa ra một RV x cùng sự thống kê của nó và chúng ta muốn ước
lượng giá trị của x ở một lần thử trong tương lai. Một cách ước lượng x là quyết
định chọn một hằng số c sao cho tổng các giá trị -c là nhỏ nhất. Trong một số
lần thử đặc biệt, RV x có thể mang một trong nhiều giá trị. Có thể các giá trị đó
ko thể nào dự đoán trước, nó chỉ có thể ước lượng được. Vì vậy ước lượng của
một RV x là dự đoán một giá trị tiếp theo của x dựa vào giá trị của c. Nếu chúng
ta sử dụng tiêu chuẩn cho sự lựa chọn c ở mức độ nhỏ nhất có thể của độ lệch
sai số MS E{(x - c)2}, suy ra c = E{x}. Vấn đề là phải cân nhắc kĩ lưỡng.
• Một quá trình lấy rời rạc của x là một sự quyết định hai tham số
c1 và c2:
P{ c1 < x < c2 } = γ = 1- δ
Trên đây thì được gọi là hằng số riêng. Phương trình trạng thái trên,
nếu chúng ta dự đoán giá trị x của x ở lần thử tiếp theo thì nó sẽ nằm trong
khoảng cách (c1,c2), dự đoán của chúng ta sẽ chính xác 100. % trong
trường hợp này. Vấn đề là làm sao tìm được c1 và c2 sao cho sự sai khác c2
– c1 là nhỏ nhất (9-4). Sự lựa chọn có hai vấn đề xung đột với nhau. Nếu
gần tới 1 thì dự đoán rằng x sẽ nằm trong khoảng (c1,c2) là đáng tin cậy
nhưng mà khoảng c2 – c1 quá lớn; nếu nhỏ bớt đi, c2 – c1 được giảm đi

nhưng mà ước lượng là thiếu tin cậy. Giá trị đặc trưng của là 0.9, 0.95,
0.99. Để có được sự dự đoán tối ưu, chúng ta cần phải thêm vào một giá trị
vào để chúng ta xác định rõ c1 và c2 để cho khoảng cách c2 – c1 là nhỏ nhất
để thực hiện được (9-4). Chúng ta cần đưa ra rằng nếu như mật độ của x
một giá trị lớn nhất, c2 – c1 là nhỏ nhất nếu như . Tạo ra c 1 và c2 bằng cách
thử và xác định độ lệch. Một điểm cực dễ dàng để tìm thấy nếu như chúng
ta các định rõ c1 và c2 giống như:

Mang lại c1 = và c2 = với xu là u % xuất hiện của x trong
khoảng (c1,c2) .Cách giải quyết vấn đề này là tối ưu nếu như là
đối xứng. Điều đó có nghĩa là η là giá trị trung bình bởi vì thì
sẽ đối xứng. Nếu x là chuẩn, thì xu = η + zu là tỉ lệ % chuẩn .
Ví dụ : Chúng ta tung đồng xu 100 lần và muốn dự đoán được số lần na là mặt
ngửa với γ = 0.997. Trong vấn đề này thì n = 100 và p = 0.5.
Chúng ta dự đoán, vì vậy, cùng với hệ số 0.997 là số mặt ngửa nằm trong
khoảng từ 35 tới 65.
Các ví dụ trên đã làm rõ vai trò của thống kê trong các ứng dụng xác suất để
giải quyết các vấn đề thực tế: Sự kiện được định nghĩa trong thực nghiệm của
trò chơi tung đồng xu. Nó mang lại những thông tin rằng xác suất xảy ra không
Trang 6


thể được sử dụng để xác thực dự đoán về sự kiện A thi hành ở thực nghiệm . Sự
kiện:
được khai báo ở thực nghiệm trong vòng lặp thử nghiệm và nó là xác suất . Nếu
như chúng ta có thể gần chắc chắn rằng sẽ xảy ra ở một quá trình thực tế.
Chúng ta có sự thay đổi suy nghĩ “chủ quan” về A dựa trên thông tin cơ bản để
có thể khách quan hơn để kết luận rằng sẽ chắc chắn chính xác, dựa trên xác
suất .


Phần II. Kiểm định
I.

Kiểm định kì vọng.
1. Bài toán đặt ra:
Đại lượng ngẫu nhiên X có trung bình E(X) = µ chưa biết. Người
ta đưa ra giả thiết:
1.1. Trường hợp 1:

Phương sai Var(X) = đã biết và
hoặc ( và có phân phối chuẩn)
Chọn thống kê . Nếu đúng thì
Lấy mẫu cụ thể và tính giá trị quan sát
Miền bác bỏ được xác định trong 3 trường hợp sau:

Miền bác bỏ :

1.2.

Trường hợp 2:
Phương sai chưa biết. Và
Do nên ta thay thế bằng s
Trang 7


Chọn thống kê Nếu đúng thì Ut(n-1)
Lấy mẫu cụ thể và tính giá trị quan sát

Miền bác bỏ được xác định trong 3 trường hợp sau:


Miền bác bỏ :
(;-t(n-1;1-)) ( t(n-1;1-);
( t(n-1;1-);
(;-t(n-1;1-))
1.3
Trường hợp 3.
Không biết phương sai và n<30.
- chưa biết.
- và có phân phối chuẩn.
Chọn thống kê:
Nếu H đúng thì
Với mức ý nghĩa cho trước, ta xác định phân vị Student (n1) bậc tự do mức là .
Khi đó miền bác bỏ là:

Phần III. Phương sai và kiểm định độc lập
I.

Kiểm định phương sai:
1. Bài toán đặt ra:
Đại lượng ngẫu nhiên X có phân phối N(ɳ, σ ) . Người ta đưa ra
giả thiết:

Trang 8


1.1. Trường hợp 1:

Kỳ vọng ɳ đã biết. Ta sử dụng kiểm dịnh giả thiết với thống kê:
(9.69)
Nếu đúng thì q ).

Với mức ý nghĩa cho trước, xác định phân vị chuẩn . Ta tìm được
miền bác bỏ:
Vì:

-

Lấy mẫu cụ thể và tính giá trị quan sát
So sánh q và .
Nếu
thì bác bỏ giả thuyết và chấp nhận .
Nếu
thì chấp nhận .
1.2. Trường hợp 2:
Kỳ vọng ɳ chưa biết.
Trong trường hợp này ta vẫn chọn thống kê như trên trong đó kì
vọng như trên trường hợp 1 trong đó kì vọng được thay bởi giá trị
trung bình của mẫu ngẫu nhiên .
Nếu đúng thì q ). Tương tự trên, ta có miền bác bỏ là

II.

Kiểm định tính độc lập:
1. Bài toán đặt ra:
Chúng ta kiểm định giả thiết với hai sự kiện B và C là độc lập.
Giả thiết:
H0 : P(A∩B) = P(A) P(B) ngược lại (H1: P(A∩B) ≠ P(A) P(B)).
Giả sử xác suất của hai sự kiện b = P(B) và c = P(C) đã biết. Ta áp
dụng kiểm định chi bình phương để phân vùng các sự kiện :
A1 = B∩C


A2 = B∩

A3 = ∩C A4 = ∩
Ký hiệu p01 . p02, p03, p04 lần lượt là xác suất của các sự kiện
A1 ,A2 ,A3 ,A4.
Nếu H0 đúng, tức là các sự kiện Ai (i=1,4) là độc lập. Do đó:
p01 = bc
p02 = b(1-c) p03 = (1-b)c p04 = (1-b) (1-c)
Kết quả của kiểm định là
Chấp nhận H0 nếu <
Với ki là số xuất hiện của sự kiện Ai; ví dụ k2 là số lần B xuất hiện
nhưng C thì không.
2. Ví dụ:
Trang 9


Trong một trường đại học , tỷ lệ sinh viên năm thứ nhất là nam giới là
60 % còn tỷ lệ đó với toàn bộ sinh viên tốt nghiệp đại học là 75%.
Chọn ngẫu nhiên các hồ sơ của 299 nam và 101 nữ cùng với 168 nam
và 68 nữ tốt nghiệp.
Kiểm tra giả thuyết H0 rằng các sự kiện B={male} and C={graduate}
là độc lập.
Với α=0.05 với m= 400, p(B) = 0.6, p(C) = 0.75, pi = 0,45 0.15 0.3
0.1, ki = 168 68 131 33:
Áp dụng kiểm tra chi bình phương ta có:
q = = 4.1
2
Vì X 0.95(3) = 7.81 >4.1, chúng ta chấp nhận giả thiết H0.

Phần IV. Phân Phối

Trong ứng dụng này của lý thuyết kiểm định giả thuyết, giả thuyết Ho
không liên quan đến tham số, hàm phân bố F(x) của một biến ngẫu nhiên x
được giả thiết bằng một hàm F0(x).
ở đây H0 :F(x)=F0(x) <> H1 :F(x)≠ F0(x)
Để kiểm định giả thuyết này, có 2 phương pháp
• Phương pháp Kolmogoroff-Smirnov
• Phương pháp Chi-Square
I.

Phương pháp Kolmogorov-Mirnov

Phương pháp này được thực hiện bằng việc hình thành 1 quá trình
ngẫu nhiên có phân phối F*(x) để dự đoán vấn đề và sử dụng để kiểm tra
số liệu thống kê cho biến ngẫu nhiên
q= maxx| F*(x)-F0(x)|
sự lựa chọn này được giả thích như sau: với mỗi tham số cụ thể , F*( x) có
ước lượng phụ thuộc vào F(x), và nó có xu hướng tiến tới F(x) khi n tiến
tới vô cùng
Kì vọng E(F*(x)) =F(x)
F*(x)→F(x) khi n tiến tới vô cùng
Xét với n lớn.Biến ngẫu nhiên q có thể tiến về 0 nếu H0 đúng và tới 1 giá trị
F(x)-F0(x) nếu H1 đúng. Để phủ nhận giả thuyết H0 hay chấp nhận H0 ta đi so
sánh q với một hằng số c.Hằng số này phụ thuộc vào mức ý nghĩa α và phân
phối của biến ngẫu nhiên q. theo giả thuyết H0 chúng ta kiểm tra biến ngẫu
nhiên q= maxx|F*(x)-F(x)| với mức ý nghĩa α =P (q>c|H0)=1Từ đây có thể kết luận: Hình thành các sự toán thực nghiệmF*(x) của
F(x)và quyết định q từ công thức q=maxx|F*(x)-F(x)|
Ho được chấp nhận nếu q>
II.
Phương pháp Chi- Squared
Trang 10



Phương pháp này sử dụng kiểm tra thống kê Pearson. Và thực hiện
như sau
Đưa ra các phần vùng U=[ A1,……..,Am] của không gian P và muốn
kiểm tra giả thuyết các xác suất pi=P(Ai)của sự kiện Ai bằng m cho hằng
số poi:
H0: pi=p0i với mọi i
ngược lại H1: pi≠p0i với 1 vài giá trị của i
dữ liệu đầu vào là số lần thử thành công ki trong n lần thử của mỗi sự kiện
Ai.
Xét biến ngẫu nhiên q=
(9.75)
Biến ngẫu nhiên ki có phân nhị thức với kì vọng npi và phương sai
npiqi vì thế tỉ lệ ki/n có xu hướng tiến tới pi khi n .Kiểm tra giả thuyết bằng
việc so sánh q với 1 hàng số c.
Để tìm c, chúng ta phải xác định được phân phối của q. chúng ta sẽ đi
tìm theo hướng giả định n lớn. Với giả định như vậy , biến ngẫu nhiên k là
gần với phân phối chuẩn với kì vọng là kpi. theo giả thuyết H0, biến ngẫu
nhiên q có phân phối X2(m-1),trên thực tế, với hằng số p0i thỏa mãn
Quan sát số lượng ki và tính toán tổng q trong (9.75) , tìm χ21-α(m-1 )
Chấp nhận Ho nếu q< χ21-α(m-1 )
(9.76)
Phương pháp Chi-Square được sử dụng trong việc kiểm định những
kiểm tra liên quan đến thỏa thuận các mô hình lí thuyết với thực nghiệm.
Bài tập ứng dụng:
Chúng ta có 506 bệnh nhân.nếu không có sự khác biệt mỗi tháng thì chúng ta
có kì vọng mỗi tháng là: npoi = 506/12 = 42 ca, m= 12.
Tháng
1

2
3
4
5
6
7
8
9
10
11
12
40
34
30
44
39
58
51
55
36
48
33
38
kiểm tra giả thiết với độ chính xác α=0.05. Thay nó vào công thức q= =21.3. do
χ20.95 (11)= 19.68 < 21.3 nên chúng ta không chấp nhận giả thiết

Phần V: Likelihood radio test
Vídụ 9-21: Chúng ta cóN(�, 1) RV x và chúng ta muốn kiểm tra
đơn giản các giả thuyết �= đối lập với � . Trong bài toán và
Đạt giá trị max nếu tổng :

Là min, có nghĩa là ,nếu = . Từ = và
�=
Trang 11


Từ phía trên nó sau �> c nếu<. Điều này cho thấy rằng các kiểm tra tỷ
số hợp lệ trung bình của một RV bình thương tương đương một để kiểm tra.
Lưu ý trong bài toán này rằng, m = 1 vàmo = 0.Hơn nữa,
w= -ln� = n=
Nhưng ở bên phải là RV với hàm phân phối(1). Từ đó, RV w có hàm phân
phối(m - ) không chỉ có tiệm cận, nhưng đối với bất kỳ n.
Giả lập tính toán trong kiểm định giả thuyết.
Như chúng ta thấy, kiểm định 1 một giả thuyếtgồm các bước sau :Chúng ta xác
định giá trị X của vector ngẫu nhiên X =[] trong điều kiện quan sátcủa m RVs
và tính toán giá trị tương ứng q = q(X) của bài toán phân tích
q = g(X).Chúng ta đồng ý nếu q không phải là một giá trị quan trọng trong bài
ví dụ như , nếu q là giá trị trong khoảng () với và là các giá trị được lựa chọn
thích hợp của u phần trăm củaq.
Điều này liên quan đến việc xác định hàm phân phối F(q)của q và giá trị nghịch
đảo = (u) củaF(q). Vấn đề đảo ngược có thể tránh được nếu chúng ta sử dụng
biện pháp sauđây.
HàmF(q) là hàm đơn điệu tăng . Từ đó,
nếu a = F()< F(q)< F() =b.
Điều này cho thấy rằng tương đương với kiểm tra
Đồng ý nếua Liên quan đến việc xác định hàm phân phối F(q) của q.Như chúng ta đã thể
hiện trong phần 8.3 , hàm F(q) có thể được xác định bằng giả lập tính toán :
Đề ước tính số lượng F(q)chúng ta xây dựng chuỗi vector RV
=[] i=1,…,n
vớilà các mẫu tính toán tạo ra của m RVs Sử dụng theo trình tựchúng ta hình

thành được chuỗi và chúng ta đếm số của nhỏ hơn so với tính toán q.Thêm vào
(8-163), chúng ta có được F(q)=.Với F(q)được xác định, công thức 9-84 được
kiểm tra:
đồng ý nếu
Như trên, q=g(X) là một số được xác định trong điều kiện của dữ liệu
kiểm định. Theo trình tự , tuy nhiên, các tính toán được tạo ra.
Các phương pháp trên được sử dụng nếu gặp khó khăn để xác định và
phân tích hàm F(q). Đây là trường hợp xác định số liệu thống kê kiểm tra
Pearson.

Phần VI: Bài tập
Bài 8.2
Cho 3 sự kiện A,B,C thỏa mãn:P(A)=P(B)=P(C)=0,5 và
P(AB)=P(BC)=P(CA)=P(ABC)=0,25.Các biến ngẫu nhiên ,, tương ứng chỉ sự
xuất hiện các sự kiện A,B,C(bằng 0 hoặc 1).Chứng minh , không độc lập nhưng
độc lập từng đôi một
Trang 12


Giải:
+Theo giả thiết:P(=P(ABC)=0,25
P()=P()=P(A)=0,5(do chỉ nhận một trong hai giá trị 0 và 1)
+Tương tự P(=P()=P(B)=0,5
+Tương tự P()=P()=P(C)=0,5
Do đó:P().P().P()=0,5.0,5.0,5=0,125 P()=0,25
Suy ra các biến ngẫu nhiên ,, là không độc lập
+P(
P(=P(A).P(B)=0.25
Suy ra P(
P(

P().P()=0,5.0,5=0,25
Suy ra P()=P().P()
Chứng minh tương tự với các trường hợp còn lại ,ta có các kết quả tương tự.Từ
đó rút ra:với mọi , thì P(.Vậy , độc lập.
Tương tự độc lập
Tương tự , độc lập
Vậy độc lập từng đôi một
Bài 8.3
Cho x,y,z là các biến ngẫu nhiên tuân theo luật phân phối chuẩn,đôi một độc lập
với nhau.Chứng minh rằng chúng độc lập
Giải:
x,y,z tuân theo luật phân phối chuẩn
Hàm mật độ biên:

Công thức tổng quát:

f(x) =
Với x =
Ma trận hiệp phương sai của f(x,y,z):
⅀=
=
Trang 13


|⅀|=

Ta có: (x-�) ==


=



f(x,y,z) =
=
= f(x)f(y)f(z)

 x,y,z độc lập(ĐPCM)

Phần VII. Ứng dụng matlab
1.Các hàm thường sử dụng:
• Ztest:[h, p, ci, zval] = ztest(x, m, sigma, alpha)
kiểm định 1 mẫu, mẫu đó có phân phối chuẩn đã biết trước kì vọng và
phương sai, đối thuyết là nó không có kì vọng như vậy.
• Ttest:[h, p, ci, stats] = ttest(x, m)
kiểm định 1 mẫu, mẫu đó có phân phối chuẩn đã biết trước kì vọng nhưng
chưa biết phương sai. Đối thuyết là nó không có phương sai như vậy.
• Ttest2:[h, p, ci, stats] = ttest2(x, y)
Trang 14


kiểm định 2 mẫu, 2 mẫu độc lập có phân phối chuẩn đã biết kì vọng
nhưng chưa biết phương sai. Đối thuyết là các kì vọng không bằng nhau.
• Kstest: [h, p, ksstat, cv] = kstest(x)
kiểm định Kolmogorov-Smirnov trên 1 mẫu có phân phối liên tục với
các tham số được chỉ rõ. Đối thuyết của nó là không có phân phối như
vậy.
• Kstest2: [h, p, ks2stat] = kstest2(x, y)
kiểm định Kolmogorov-Smirnov trên 2 mẫu có phân phối liên tục giống
nhau. Đối thuyết là chúng không có phân phối giống nhau.
• Chi2gof: [h, p] = chi2gof(x)

kiểm định Chi-square ( goodness-of-fit) với 1 mẫu có phân phối được chỉ
rõ. Đối thuyết là nó không có phân phối như vậy.
2. Ví dụ:
Ví dụ 1: cho mẫu ngẫu nhiên 150 phần tử , kiểm định giả thuyết có phân phối
chuẩn với kì vọng 0,1 và độ lệch chuẩn bằng 1, mức ý nghĩa 5%
Sử dụng hàm ztest:
Tạo mẫu ngẫu nhiên có phân phối chuẩn: x=norm(0.1,1,150,1);

-

h=0 hoặc 1(h=0 :chấp nhận ; h=1: bác bỏ )
p: P-value
ci: khoảng tin cậy
zval: giá trị thống kê Z
x: giá trị mẫu
m: giá trị trung bình cần kiểm định
Trang 15


-

sigma: độ lệch chuẩn
alpha: mức ý nghĩa

Ví dụ 2: Cho 1 mẫu 200 phần tử, kiểm định giả thuyết H0 có phân phối chuẩn
với kì vọng là 0.1 ,chưa biết phương sai:
Sử dụng hàm ttest:
Tạo mẫu ngẫu nhiên có phân phối chuẩn : x=normrnd(0.1,1,200,1);

-


h,p,ci,x,m: tương tự như hàm ztest
stats: xuất ra các giá trị:
 tstat: giá trị thống kê t
 df: bậc tự do
 sd: độ lệch chuẩn ước lượng

Ví dụ 3: Kiểm định giả thuyết với 2 mẫu x,y có cùng kì vọng
sử dụng hàm ttest2:

Trang 16


Ví dụ 4: Kiểm định Kolmogorov-Smirnov:
Kiểm định liệu là các giá trị có được lấy từ phân phối chuẩn hay ko?
x = -2:1:4 (x nhận giá trị từ -2 đến 4, mỗi số tăng lên 1 đơn vị)

Trang 17







h=0:chấp nhận
p: giá trị P
ksstat: số liệu thống kê
cv: giá trị quan trọng


Trang 18



×