Tải bản đầy đủ (.pdf) (17 trang)

Chương 6: Kiểm định giả thiết ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (149.03 KB, 17 trang )

G.V Cao Haò Thi

Chương 6
KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
(Tests of Hypotheses)
Thông thường đối với tham số • chưa biết của tập hợp chính ta có thể đưa ra nhiều giả
thuyết về •.
Vấn đề đặt ra là làm thế nào kiểm đònh được giả thuyết nào thích hợp với các số liệu
của mẫu quan sát được (x
1
, x
2,
…, x
n
).
6.1 NHỮNG KHÁI NIỆM VỀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Giả thuyết thống kê ( Statistical Hypothesis)
Là một giả sử hay một phát biểu có thể đúng, có thể sai liên quan đến tham số của một
hay nhiều tập hợp chính.
Giả thuyết không (giả thuyết đơn) và giả thuyết ngược lại (đối thuyết)
(Null Hypothesis & Alternative Hypothesis)
Giả thuyết không: là sự giả sử mà chúng ta muốn kiếm đònh thường được ký hiệu là
H
o.
Giả thuyết ngược lại: Việc bác bỏ giả thuyết không sẽ dẫn đến việc chấp nhận giả
thuyết ngược lại. Giả thuyết ngược lại thường được ký hiệu là H
1.
Ví dụ
Kiếm đònh giả thuyết H
o
: • ≥ •


o
có thể •=•
o
Với H
1
: • < •
o

Kiếm đònh giả thuyết H
o
: • ≤ •
o


Với H
1
: • > •
o
Kiểm đònh giả thuyết H
o :
• = •
o
Với H
1
: • ≠ •
o

6.1.3 Các loại sai lầm trong việc kiểm đònh giả thuyết thống kê
Việc kiểm đònh giả thuyết thống kê có thể phạm phải 2 loại sai lầm
1.3.1 Sai lầm loại I

(type I error)
Là loại sai lầm mà chúng ta phạm phải trong việc bác bỏ giả thuyết H
o
khi
H
o
đúng.
Xác suất của việc bác bỏ H
o
khi H
o
đúng lkà xác suất của sai lầm loại I và
được ký hiệu là α
G.V Cao Haò Thi

α = P ( bác bỏ H
o
/ H
o
đúng) = P(type I error)
α : còn được gọi là mức ý nghóa ( level of sigui ficance)
α = 0.05, 0,01 ,0,001 …
1.3.2 Sai lầm II
(type II error)
Là loai sai lầm mà chúng ta phạm phải khi không bác bỏ giả thuyết H
o
khi
H
o
sai.

Xác suất của việc không bác bỏ H
o
khi H
o
sai là xác suất của sai lầm loải II và đưkợc
ký hiệu làβ.
β = P (không bác bỏ H
o
/H
o
sai) = P(type II error)

Quyết đònh về
giả thuyết không Ho
Bản chất của Ho
Ho đúng

Ho sai

Không bác bỏ ( chấp nhận )

Quyết đònh đúng
Prob = 1- α
P (không bác bỏ Ho / Ho) = 1-α
Sai lầm loại II
Prob = β

Bác bỏ

Sai lầm loại I

Prob = α
(α = significance level of the test)
Quyết đònh đúng
Prob = 1 - β
(1 - β: power of the test)
năng lực cuả kiểm đònh
1.4 Miền bác bỏ và miền chấp nhận
( rejection region & acceptance region )
Tất cả các giá trò có thể có của các đại lượng thống kê trong kiểm đònh có thể
chia làm 2 miền: miền bác bỏ và miền chấp nhận.
- Miền bác bỏ
là miền chứ các giá trò làm cho giả thuyết Ho bò bác bỏ.
-Miền chấp nhận
là miền chứa các giá trò giúp cho giả thuyết Ho không bò bác bỏ.
Trong thực tế khi Ho không bò bác bỏ cùng nghóa là nó được chấp nhận.
Giá trò chia đôi hai miền được gọi là giá trò giới hạn ( Gitical value)
- Kiểm đònh một đầu và kiểm đònh 2 đầu

(one – tailed test & two – tailed test)
Kiểm đònh một đầu

Khi giả thuyết ngược lại H
1
có tính chất 1 phía (one – sided) thì việc kiểm đònh được
gọi là kiểm đònh 1 đầu.
Ví dụ:

H
o
: • = •

o
hay H
o
: • = •
o


G.V Cao Haò Thi

H
1
: • > •
o
H
1
: • < •
o

Kiểm đònh hai đầu
:
Khi giả thuyết ngược lại H
1
có tính chất 2 phía( two – sided_ thì việc kiểm được gọi là
kiểm đònh 2 đầu.
Ví dụ

H
o
: • = •
o



H
1
: • ≠ •
o


2.
Các bước của việc kiểm đònh giả thuyết thống kê
Gồm 6 bước:
Bước 1
: Thành lập giả thuyết Ho
Ví dụ
:
H
o
: • = •
o
H
o
: • ≤ •
o
H
o
: • ≥ •
o

Bước 2
: Thành lập giả thuyết H

1
Ví dụ:
H
1
: • < •
o
H
1
: • > •
o
H
1
: • ≠ •
o
Bước 3: Xác đònh mức ý nghóa α
Bước 4
: Chọn các tham số thống kê thích hợp chko việc kiếm đònh và xác đònh các
miền bác bỏ, miền chấp nhận và giá trò giới hạn.
Bước 5
: Tính toán các giá trò của các tham số thống kê trong việc kiểm đònh dựa trên
số hiệu của mẫu ngẫu nhiên.
Bước 6:
Ra quyết đònh: Nếu các giá trò tính toán rồi vào miền bác bỏ Ho thì ra quyết
đònh bác bỏ Ho. Ngược lại sẽ chấp nhận Ho.
3. Kiểm đònh giá trò trung bình µ của phân phối chuẩn N (µ,δ
2
) khi đã biết δ
2

Cho ( x1, x2 , …, xn) là mẫu ngẫu nhiên cỡ n được lấy từ tập họp chính tuân theo phân

phối chuẩn N (µ,δ
2
) trong đó δ
2
đã biết.
Vấn đề
: Kiểm đònh giả thuyết Ho : µ ≤ µ
ο
hay µ ≥ µ
ο
hay
µ = µ
ο
với giả thuyết ngược lại H
1:
µ > µ
ο
hay µ < µ
ο
hay
µ ≠ µ
ο .
Sự kiểm đònh có mức ý nghóa là α.
Ta có 3 trường hợp:
G.V Cao Haò Thi

3.1 Trường hợp 1
Ho : µ = µ
ο
hay µ

ο
: µ ≥ µ
ο

H
1
: µ < µ
ο

Miền bác bỏ R: Bác bỏ Ho nếu Σ =
n/
X
0
δ
µ−
< −
α















3.2 Trường hợp 2:


Ho :
0
µ=µ hay Ho
0
µ

µ
H
1
:µ >
0
µ
Miền bác bỏ R
: Bác bỏ Ho nếu
α
∑>
δ
µ−
=∑
n/
X
0

















3.3 Trường hợp 3:


α
α


α

F
z

Miền bác bỏ Ho Miền khôn
g
bác bỏ Ho
G.V Cao Haò Thi

Ho :

0
µ=µ
H
1
:
0
µ≠µ

Miền bác bỏ R: Bác bỏ Ho nếu
2
α

>

hay
2
α


<


Với
n/
X
0
δ
µ−
=∑



Thí dụ

Trong một nhà máy bánh kẹo, một máy tự động sản xuất ra các thanh sô cô la với
trọng lượng qui đònh 250g. Biết rằng trọng lượng các thanh sô cô la được sản xuất ra có
phân bố chuẩn N(µ,5
2
). Trong một ngày bộ phân kiểm tra kỹ thuật chọn một mẫu ngẫu
nhiên gồm 16 thanh sô cô la và tính trọng lượng trung bình của chúng được 244g. Có
thể khẳng đònh máy tự động sản xuất ra các thanh sô cô la có trọng lượng nhớ hơn qui
đònh không? Với mức ý nghóa
α=0.05 kiểm đònh giả thuyết thống kê tương ứng.
Giải

1/ Ho :
µ = 250g
2/ H
1
: µ < 250g
3/
α = 0.05
4/
=∑=∑
α 05.0
16.45
-
=∑
α
-1.645
5/

8.4
16/5
250246
n/
X
0
−=

=
δ
µ−
=∑



2
5
2
⇒ δ = 5
n = 16

X = 244g ,
0
µ = 250g
6/
Σ = -4.8 < -
05.0

= -1,645


Ra quyết đònh : Bác bỏ giả thuyết Ho
⇒ Chấp nhận H
1
nghóa là máy tự động sản xuất sô cô la có trọng lượng nhỏ hơn qui
đònh.
⇒ Phải điều chỉnh lại máy
Thí dụ

Một máy khoan trong dây chuyền sản xuất dùng để khkoan lỗ trên các bản thép. Khi
máy khoan hoạt động đúng chứ năng thiết kế đường kính các lỗ khoan sẽ tuân theo
phân phối chuần với số trung bình là 2 inches và độ lệch chuẩn là 0,06 inches. Trong
quá trình kiểm tra đònh kỳ xem máy khoan có hoạt động đúng hay không, người ta lấy
đo ngẫu nhiên các lỗ đã khoan. Giả sử độ lệch chuẩn không thay đổi. Mẫu ngẫu nhiên
G.V Cao Haò Thi

gồm 9 lỗ khoan cho ta đường kính trung bình của mẫu là 1.95 inches. Kiểm đònh giả
thuyết Ho : số trung bình của tập hợp chính là 2 inches.
Với H
1
: số trung bình của tập hợp chính khác 2 inches.
Trong quá trình kiểm đònh dùn
α = 5%
Giải:

1/ Ho :
µ = µ
0
= 2
2/ H
1

: µ ≠ 2
3/
α = 0.05
4/
96.1
025,0
2
=∑=∑
α

-
196
025.0
2

=∑−=∑
α

5/
X = 1,95 , µ
0
=2 , δ = 0.06 ,n = 9

50,2
9/06.0
295.1
n/
X
0
−=


=
δ
µ−
=∑
6/ Ta có
2
α
∑−
<


Ra quyết đònh : Bác bỏ giả thuyết Ho ở mức ý nghóa 5%
⇒ Máy hoạt động không đúng chức năng thiết kế.
4. Kiểm đònh giá trò trung bình m của phân phối chuẩn N (
µ, δ
2
) khi chưa biết δ
2

Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy từ tập hợp chính tuân theo phân
phối chuẩn có số trung bình là
µ. Gọi • và S
x
là số trung bình và độ lệch chuẩn của
mẫu, ta sẽ có 3 trường hợp kiểm đònh
µ với mức ý nghóaα.
4.1 Trường hợp 1:

Ho :

µ = µ
0
hay µ ≥ µ
0

H
1
: µ > µ
0

Miền bác bỏ R : Bác bỏ Ho nếu t
n-1
> t
n-1
, α
Với t
n-1
=
n/
X
x
0
δ
µ−
, t
n-1
tuân theo phân phối.
Student t với độ tự do n-1
4.2 Trường hợp 2:


Ho :
µ = µ
0
hay Ho : µ ≤ µ
0

H
1
: µ > µ
0

Miền bác bỏ R: Bác bỏ Ho nếu t
n-1
> t
n-1
, α
4.3 Trường hợp 3:

G.V Cao Haò Thi

Ho : µ = µ
0
H
1
: µ ≠ µ
0

Miền bác bỏ R: Bác bỏ Ho nếu t
n-1
> t

n-1
, α/2
Hay t
n-1
< - t
n-1
, α/2





Thí dụ

Nhà quản lý các cửa hàng bán lẻ nhận thấy rằng số lượng hàng bán ra trung bình trong
tháng 12 cao hơn 20% so với tháng 11. Theo dõi sổ sách của sáu cửa hàng ( được chọn
một cách ngẫu nhiên ) nhà quản lý nhận thấy Phần trăm độ tăn trung bình của lượng
hàn bán ra tại 6 cửa hàng trong tháng 12 như sau:
19.2%, 18.4, 19.8, 20.2, 20.4, 19,0
Giả sử phần trăm độ tăng trung bình của lượng hàng bán ra tại tất cả các cửa hàng
trong hệ thống bán lẻ tuân theo phân phối chuẩn
Kiểm đònh giả thuyết rằng phần trăm độ tăng trung bình của lượng hàng bán ra trong
tháng 12 là 20% so với tháng 11 với
α = 10%
Giải:

1/ Ho :
µ = µ
0
= 20

2/ H
1
: µ ≠ 20
3/
α = 10% = 0.1
t
n-1
, α/2 = t
5
, 0.05 = 2,015
-t
n-1
, α/2 = -t
5
, 0.05 = -2,015
4/ Xác đònh
X và δ
x


x
I
x
i
2

19.2 368,64
18.4 338,56
19.8 392,04
20.2 408,04

20.4 416,16
19.0 361,00
Tổng 117,0 2.284,44


5,19
6
117
n
X
i
x
==

=

22
i
2
x
xnx(
)1n(
1
−∑


) = )5,19*644,2284(
5
1
2


G.V Cao Haò Thi



δ
x
2
= 0.588

⇒ δ
x = 588.0
= 0.767
5/ t
n-1
=
n/
x
x
0
δ
µ−
= 597.1
6/767.0
205,19
−=



6/ Ra quyết đònh :


Ta có t
n-1,
α/2 < t
n-1
< t
n-1
, α/2
-2,015 < -1,597 < 2,015

⇒ Chấp nhận giả thuyết Ho (Những dữ kiện từ mẫu không đủ mạnh để bác bỏ Ho)
5. Kiểm đònh phương sai của phân phối chuẩn

Giả sử ta có mẫu ngẫu nhiên cỡ mẫu là n được lấy ra từ tập hợp chính tuân theo phân
phối chuẩn có phương sai la
δ
2
ø . Gọi S
2
x
là phương sai của mẫu, ta sẽ có 3 trường hợp
kiểm đònh
δ
2
với mức ý nhóa là α
5.1 Trường hợp 1:

Ho :
δ
2

= δ
0
2
hay Ho : δ
2
= δ
0
2

H
1
: δ
2
< δ
0
2

R : Bác bỏ Ho nếu X
2
n-1
< X
2
n-1
, 1-α

Với X
2
n-1
=
2

0
2
x
)1n(
δ
δ−


X
2
n-1
tuân theo phân phối X
2
với độ tự do n-1.
5.2 Trường hợp 2:

Ho :
δ
2
= δ
0
2
hay Ho : δ
2
≤ δ
0
2

H
1

: δ
2
> δ
0
2

R : Bác bỏ Ho nếu X
2
n-1
> X
2
n-1
, α
5.3 Trường hợp 3:

Ho :
δ
2
= δ
0
2

H
1
: δ
2
≠ δ
0
2


R : Bác bỏ Ho nếu X
2
n-1
> X
2
n-1
,
2
α

Hay X
2
n-1
< X
2
n-1
, 1-
2
α


G.V Cao Haò Thi

Thí dụ
Để thỏa mãn tiêu chuẩn đã được ấn đònh trong họp đồng là phương sai của hàm lượng
chất bẩn trong các lò hàng hoá chất không được vượt quá 4%.
Lấy ngẫu nhiên 20 lô hàng ta có phương sai của hàm lượng chất bẩn trong các lô hàng
mẫu là 5,62%. Kiểm đònh giả thuyết phương sai của hàm lượng chất bẩn trong tất cả
các lô hàng không quá 4% với
α =10%. Giả sử rằng tập hợp chính tuân theo phân phối

chuẩn.
Giải
:
1/ Ho :
δ
2
≤ δ
0
2
= 4
2/ H
1
: δ
2
> 4
3/
α = 0.1 , n = 20
X
2
n-1
, α = X
2
19,0.1
= 27,20
4/
δ
2
x
=5.62 ,n = 20 , δ
2

0
=4
5/ X
2
n-1
= 695,26
4
62.5*19
)1n(
2
0
2
x
==
δ
δ−

6/ Ra quyết đònh:

Vì X
2
n-1
=26,695 < X
2
n-1
, α =27,20

⇒ Không bác bỏ Ho tại mức α =10%
6. Kiểm đònh giá trò tỉ số P của tập họp chính trong điều kiện cỡ mẫu lớn


- Gọi P là tỉ số của số lần thành công trong tập hợp chính
f là tỉ số của số lần thành công trong n phép thực
- Khi cỡ mẫu n lớn, thì biến ngẫu nhiên chuẩn hóa
n/)p1(p
pf


=∑
sẽ gần đúng cơ phân phối chuẩn hóa
- Ta có 3 trường hợp p với mức ý nghóa α.
6.1 Trường hợp 1:
Ho : P = P
0
hay Ho : P ≥ P
0

H
1
: P < P
0
R : Bác bỏ Ho nếu Σ <- Σ
α

Với
n/)p1(p
pf


=∑
, Σ ∼ N (0,1)


G.V Cao Haò Thi

6.2 Trường hợp 2:
Ho : P = P
0
hay Ho : P ≤ P
0

H
1
: P > P
0
R : Bác bỏ Ho nếu Σ > Σ
α

6.3 Trường hợp 3:

Ho : P = P
0

H
1
: P ≠ P
0
R : Bác bỏ Ho nếu Σ > Σ
α/2

Hay
Σ < -Σ

α/2

Thí dụ

Lấy ý kiến 199 giảng viên về việc day học theo lối tín chỉ thì có 104 giảng viên đồng
ý . Kiếm đònh với mức về giả thuyết cho rằng có một nửa số giảng viên trong trường
Bách khoa đồng ý dạy theo lối tín chỉ.
Giải
Gọi P là tỉ lệ số giảng viên trường Đại học Bách Khoa đồng ý dạy theo lối tín chỉ
1/ Ho : P = P
o
=0.05
2/ H
1
: P ≠ 0.05
3/
Σ
α/2
= Σ
0.05
= 1,645 vì α = 10%
-
Σ
α/2
= -Σ
0.05
= -1,645
4/ n =199 , P
o
= 0.05

f =
523.0
199
104
=

5/
65.0
199/50.0*50.0
50.0523.0
n/)p1(p
pf
00
0
=

=


=∑

6/ Ra quyết đònh: -Σ
α/2
< Σ < Σ
α/2

-1,645 < 0.65 < 1,645
⇒ Không bác bỏ Ho
Thí dụ


Cũng ví dụ trên, kiếm đònh giả thuyết số giảng viên đồng ý hơn hoặc bằng một nửa số
giảng viên trong trường.
Giải:

1/ Ho : P
≥ P
o
= 0.05
2/ H
1
: P < 0.05
3/
Σ
α
= Σ
0.1
= 1,28
-
Σ
α
= -1,28
6/ Ra qui đònh:
Σ

= 0.65 > -Σ
α
= 1,28 ⇒ Không bác bỏ Ho.
7. Kiểm đònh giả thuyết về qui luanä phân phối lý thuyết

G.V Cao Haò Thi


7.1 Kiểm đònh tính phù hợp ( A goddness-of-fit test)
Giả sử ta có mẫu ngẫu nhiên với cỡ mẫu là n. Mỗi giá trò quan sát của mẫu ngẫu nhiên
có thể xếp vào 1 trong K lớp. Gọi số phần tư của lớp thứ i là Oi với i= 1,2, …,K.
Trong việc kiểm đònh tính phù hợp ta có:
Ho : Xác suất để cho các giá trò quan sát rơi vào lớp thứ i = Pi (i =1,2, … k)
H
1
: Xác suất để cho các giá trò quan sát rơi vào lớp thứ i ≠ Pi
R : Bác bỏ Ho nếu X
2
k-1
> X
2
k-1
, α
Với : X
2
k-1
=
i
2
ii
k
1i
E
)EO( −

=




Ei
:
Kỳ vọng của số phần tử trong lớp thư ùi. Với giả thuyết Ho ta có

Ei = n .Pi


• X
2
k-1
tuân theo phân phối X
2
với độ tự do là k-1.
Ví dụ

Một công ty chất đốt dựa vào kinh nghiệm trong quá khứ cho rằng đến cuối mùa đông
sẽ có 80% lượng khách hàng trả đầy đủ tiền ngay 10% trả chậm 1 tháng, 6% trả chậm
2 tháng và 4% trả châm hơn 2 tháng. Đến cuối mùa đông để kiểm đònh lại điều này,
Cty lấy ngẫu nhiên mẫu gồm 400 khách hàng và nhận thấy có 287 khách hàng trả
ngay, 49 trả chậm 1 tháng, 30 trả chậm 2 tháng và 34 trả chậm hơn 2 tháng. Hỏi những
kinh nhiệm trong quá khứ có thể áp dựng cho mùa đông năm nay không? Kiểm đònh
với mức ý nghóa 5%.
Giải

1/ Ho : Xác suất lượng khách hàng trả tiền ở mùa đông hiện tại phù họp với các số
liệu trong quá khứ. Nghóa là xác suất tương ứng với 4 loại khách hàng là:
P
1

= 0.8, P
2
= 0.1, P
3
= 0.06, P
4
= 0.04
2/ H
1
: P
1
≠ 0.8, P
2
≠ 0.1, P
3
≠ 0.06, P
4
≠ 0.04
3/
α = 0.05 , k = 4 ⇒ X
2
k-1
, α = X
2
3,0.05
= 7.81
4/ Dưới giả thuyết Ho, kỳ vọng của số khách hàng trong mỗi loại từ tổng số 400 khách
hàng sẽ là
E
1

= 400 * 0.8 = 320
E
2
= 400 * 0.1 = 40
E
3
= 400 * 0.06 = 24
E
4
= 400 * 0.04 = 16
G.V Cao Haò Thi

Ta có:
Số tháng trả chậm 0 1 2 > 2 Tổng
Số khách hàng dựa vào
mẫu quan sát Oi
287 49 30 34 400
Xác suất P
i
0.8 0.1 0.06 0.04 1
Kỳ vọng của số khách
hàng trong mỗi loại E
i

320 40 24 16 400
5/ X
2
k-1
=
i

2
ii
4
1i
E
)EO( −

=

=
16
)1634(
24
)2430(
40
)4049(
320
)320287(
2222

+

+

+


X
2
k-1

=227,187
6/ Ra quyết đònh:
Vì X
2
k-1
> X
2
k-1
, α
⇒ Bác bỏ Ho. Nghóa là không thể áp dụng kinh nghiêm trong quá khứ vào năm
nay. Số lượng khách hàng trả chậm trong năm nay nhiều hơn các năm trước.
7.2 Kiểm đònh thuyết về qui luật phân phối lý thuyết

Trong việc kiểm đònh giả thuyết tính phù họp của số liệu quan sát với qui lkuật phân
phối lý thuyết ta có:
Ho : Số liệu quan sát tuân theo qui luật phân phối lý thuyết
H
1
: Số liệu quan sát không tuân theo qui luật phân phối lý thuyết
Cách tìm miền bác bỏ R bằng kiểm đònh X
2

1) Chia n số liệu quan sát ra làm K kkhoảng
2) Gọi Oi là số phần tử của mẫu quan sát nằm trong khoảng i(i=1,2, …, K)
3) Gọi Ei là kỳ vọng của số phần tư nằm trong khoảng i(Ei được tính dựa vào qui luật
phân phối lý thuyết)
E
i
= n . P
i

P
i
= xác suất để cho các phần tử năm trong khoảng i
4) Tính X
2

X
2
=
i
2
ii
k
1i
E
)EO( −

=

X
2
gần đúng tuân theo phân phối chi Squared với độ tự do là
γ


γ
= k -r -1
G.V Cao Haò Thi

r : số tham số cần phải ước lượng .

• Với phân phối chuẩn r = 2
• Với phân phối Poisson r = 1
5) Tìm miền bác bỏ R
Nếu X
2
> X
2
γ,α
ta bác bỏ giả thuyết Ho. Nghóa là số liệu quan sát không tuân theo
qui luật phân phối lý thuyết đã đònh
→ Đi tìm qui luật phân phối lý thuyết khác.
Ví dụ
: Kiểm đònh phân phối chuẩn
Để đo lường chất lượng của 1 lô sản phẩm, người ta lấy ra đo 200 chi tiết và cho kết
quả như sau:

Các lớp Số chi tiết quan sát được O
I
54,795 54,800 54,805
54,805 54,810 54,815
54,815 54,82 54,825
54,825 54,83 54,835
54,835 54,84 54,845
54,845 54,85 54,855
54,855 54,86 54,865
54,865 54,87 54,875
6
14
33
47

45
33
15
7
n = 200
Vấn đề đặt ra là các số liệu quan sát được có tuân theo phân phối chuẩn không?
Giải:

1/ Ho : Các số liệu quan sát tuân theo phân phối chuẩn
2/ H
1
: Các số liệu quan sát không tuân theo phân phối chuẩn
3/ Tính E
i

E
i =
n * p
I
Với
P
I
= P(x
I
< x < x
I+1
) = P (
δ
µ−
<∑<

δ
µ−
+1ii
xx
)
Ở đây lấy
7835,54X ==µ (số trung bình của mẫu)

δ = δ
x
= 0,016 (độ lệch của mẫu)
Ví dụ:
Tính P
1
, E
1
P
1
= P (54,795 < X < 54,805 = P (
016,0
835,54805,54
016,0
835,54795,54 −
<∑<

)

= P (-2,5 < ∑ <-1,88)
= 0.4938 – 0,4699
G.V Cao Haò Thi


P
1
= 0.0239 ⇒ E
1
= n P
1
= 200 * 0.0239 =4.78
Tính tương tự cho các lớp khác ta có

Các lớp Kỳ vọng của số phần tử nằm trong lớp i
E
i
(-


54.795
54.805
54.815
54.825
54.835
54.845
54.855
54.865
(54.865
-
-
-
-
-

-
-
-
-
-
54.805)
54.805
54.815
54.825
54.835
54.845
54.855
54.865
54.875
+
∞ )
4.78
6.02
14.74
31.46
46.18
46.74
32.52
15.76
6.58
5.20
Tổng n

200 n = 200
(n = 197.38)



4. Tính X
2
:
O
i
E
i
(O
i
– E
i
) (O
i
–E
i
)
2
i
2
iii
E
)EO( −

6
14
33
47
45

33
15
7
6.02
14.74
31.46
46.18
46.74
32.52
15.76
6.58

-0.02
-0.74
1.54
0.82
-1.74
0.48
-0.76
0.42

0.0004
0.5476
2.3716
0.6724
3.0276
0.2304
0.5776
0.1764
≈ 0

0.037
0.075
0.014
0.069
0.007
0.036
0.027
n = 20 n = 200 X
2
= 0.265
5/ Tính X
2
γ,α
:

γ = K – r –1 = 8 –2 – 1
Số lớp K = 8
r = 2 (phân phối chuẩn)

α = 0.05
Tra bảng X
2
5,0.05
= 11.0706
6/ Ra quyết đònh :
Vì X
2
= 0.265 < X
2
5,0.05

= 11.0706

⇒ Không bác bỏ Ho
G.V Cao Haò Thi

⇒ Số liệu quan sát tuân theo phân phối chuẩn .
8. Bảng Dữ Kiện Ngẫu Nhiên
( Contingency tables)
8.1 Bảng dữ kiện ngẫu nhiên 2 chiều
( two way contingency tables)
Nếu các dữ kiện của biến ngẫu nhiên được xếp loại theo 2 tiêu chuẩn thì các dữ kiên
sẽ được trình bày trong bảng gồm hàng và cột gọi là bảng dữ kiện ngẫu nhiên 2 chiều.
Tổng quát, bảng ngẫu nhiên 2 chiều gồm r hàng và c cột được trình bày như sau:
Ký hiệu:

: Số dữ kiện quan sát ở hàng i , cột j
R : Tổng các dữ kiện quan sát ở hàng i
C
j
: Tổng các dữ kiện quan sát ở cột j
n : Cỡ mẫu
n =
∑ R
i
= ∑ C
j

8.2 Kiểm đònh giả thuyết về tính độc lập giữa 2 thuộc tính của tập hợp chính

Trong việc kiểm đònh giả thuyết về tính độc lập giữa 2 thuộc tính của tập họp chính ta

có:
Ho : Các tiêu chuẩn được phân loại theo hàng và theo cột độc lập với nhau.
H1 : Các tiêu chuẩn đực phân loại theo hàng và theo cột phụ thuộc nhau
R : Bác bỏ giả thuyết Ho nếu X
2
≥ X
2
α,γ
X
2
=
ij
2
ijj,i
j,i
E
)EO( −


E
ij
: là kỳ vọng của phần tử ở hàng i, cột j
E
ij
=
n
CR
ji



E
ij
= P
ij
* n = P
I
* P
j
* n
= n*
n
C
*
n
R
j
i

=
n
CR
ji

X
2
: tuân theo phân phối Chi – squared với độ tự do là γ

γ = (r -1)(C –1)

G.V Cao Haò Thi


Ví dụ
Để đánh giá hiệu quả làm tăng chất lượng của một biện pháp công nghệ mới trên một
dây chuyền sản xuất người ta thu thập được các số liệu sau:

Công
nghệ
Chất
lượng
Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái)
Sau khi thay đổi
công nghệ
8 192 200
Trước khi thay đổi
công nghệ
92 708 800
Tổng số 100 900 1000
Vấn đề đặt ra là việc áp dụng công nghệ mới và chất lượng có liên quan hay không ? (
với
α =0.05)
Giải:

1/ Ho : Công nghệ mới độc lập với chất lượng
2/ H
1
: Chất lượng phụ thuộc công nghệ mới
3/ Tính E
ij
:
• Tỉ lệ phế phẩm 10

1000
100
=
%
• Tỉ lệ chính phẩm
90
100
900
=
%
Chất lượng
Công nghệ
Phế phẩm (cái) Chính phẩm (cái) Tổng số (cái)

Sau khi thay đổi
công nghệ
200 *
100
10
= 20 200 *
100
90
= 180
200
Trước khi thay đổi
công nghệ
800 *
100
10
= 80 800 *

100
90
= 720
800
Tổng số 100 900 1000
4/ Tính X
2
:
G.V Cao Haoø Thi

X
2
=
ij
2
ijj,i
j,i
E
)EO(



=
()()
(
)
(
)
720
720708

180
180192
80
8092
20
208
2222

+

+

+


2
χ
= 10
5/ Tính
2
,αυ
χ

α = 0.05
ν = (r-1)(c-1) =

×