9/8/2010
Phần 09
Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD
©2010, Nguyễn Duy Long, Tiến Sỹ
1
Các suy luận về các trị trung bình
So sánh các trị trung bình
Mẫu đơi
©2010, Nguyễn Duy Long, Tiến Sỹ
2
1
9/8/2010
Inferences about means
©2010, Nguyễn Duy Long, Tiến Sỹ
3
Ta làm việc với trị trung bình (means): khoảng tin
chắc và kiểm nghiệm giả thiết dựa trên mơ hình
phân phối
ố mẫu.
ẫ
Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng
mơ hình phân phối mẫu cho trị trung bình là mơ
hình chuẩn với trị trung bình μ và độ lệch chuẩn là:
SD y
n
©2010, Nguyễn Duy Long, Tiến Sỹ
4
2
9/8/2010
Với các phần, có sự liên hệ giữa giá trị của phần
(proportion value) và độ lệch chuẩn của phần của
mẫu
ẫ (sample
(
l proportion).
i )
Với trị trung bình thì khơng! Biết trị trung bình của
mẫu khơng cho ta biết điều gì về SD( y)
Ta làm tất cả những gì có thể: ước lượng thông số
quần thể σ với trị thống kê của mẫu s.
Sai số chuẩn của trị trung bình của mẫu:
SE y
s
n
©2010, Nguyễn Duy Long, Tiến Sỹ
5
Ta có thêm sự biến đổi trong sai số chuẩn từ s, độ
lệch
ệ chuẩn của mẫu.
◦ Ta cần xét sự biến đổi thêm này để khơng lẫn (mess up)
với các tính tốn về biên sai.
Và hình dạng (shape) của mơ hình mẫu thay đổi –
mơ hình khơng cịn là mơ hình chuẩn nữa.
◦ Vậy mơ hình mẫu ra sao?
©2010, Nguyễn Duy Long, Tiến Sỹ
6
3
9/8/2010
William S. Gosset, nhân viên công ty bia Guinness
ở Ireland, tìm ra mơ hình mẫu.
Mơ hình mẫu do Gosset tìm ra được gọi là t của
Student (Student’s t).
◦ Các mô hình t của Student hình thành một tập các phân
phối liên quan phụ thuộc vào thông số bậc tự do (degrees
of freedom), gọi tắc là df.
◦ Viết tắc mơ hình này dưới dạng tdf.
©2010, Nguyễn Duy Long, Tiến Sỹ
7
Mơ hình phân phối mẫu thực tiễn cho các trị trung bình
Khi các điều kiện thỏa, trị trung bình mẫu được chuẩn hóa:
t
y
SE y
Theo mơ hình phân phối t của Student với n – 1 bậc tự do.
s
Ta ước lượng sai số chuẩn theo: SE y
n
với n là kích thước của mẫu
©2010, Nguyễn Duy Long, Tiến Sỹ
8
4
9/8/2010
Khi Gosset sửa mơ hình cho sự khơng chắc chắn thêm (extra
uncertainty), biên sai ME lớn hơn.
◦ Khoảng tin chắc sẽ rộng hơn một chút
Các mơ hình t (t-models) là một mốt, đối xứng, và có hình
chng tựa như mơ hình chuẩn.
◦ Các mơ hình t với vài bậc tự do có đi dày hơn mơ hình chuẩn.
◦ Khi df tăng, các mơ hình t càng giống mơ hình chuẩn.
◦ Mơ hình t với df vơ tận thì chính là mơ hình chuẩn.
Mơ hình chuẩn
Mơ hình t với 2 bậc tự do
©2010, Nguyễn Duy Long, Tiến Sỹ
9
Mơ hình t khác nhau bởi
bậc tự do (n-1)
Bảng tra cho giá trị tới hạn
của mơ hình t (t-model
critical values)
Với n = 16 và C = 95%, t*= +/2.131
◦ Nếu n = 8 và kiểm nghiệm
một phương đuôi trên với
=5%, t*=1.895
Một phần của Bảng T (tr.A-58)
©2010, Nguyễn Duy Long, Tiến Sỹ
10
5
9/8/2010
1) Giả định tính độc lập:
◦ Điều kiện ngẫu nhiên hóa: Dữ liệu từ mẫu ngẫu
nhiên hay thí nghiệm được ngẫu nhiên hóa thích
hợp.
◦ Điều kiện 10%
©2010, Nguyễn Duy Long, Tiến Sỹ
11
2) Giả định quần thể chuẩn:
◦ Điều kiện gần chuẩn “Nearly Normal”: Dữ liệu từ
phân phối một mốt và đối xứng.
Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất.
suất
Kích thước mẫu càng nhỏ (n < 15), dữ liệu càng nên theo
mơ hình chuẩn.
Với các kích thước mẫu trung bình (n giữa15 và 40), t sẽ
hữu hiệu khi dữ liệu là một mốt và gần đối xứng.
Với kích thước mẫu lớn hơn, t sẽ an tồn để dùng thậm chí
dữ liệu là bị lệch.
©2010, Nguyễn Duy Long, Tiến Sỹ
12
6
9/8/2010
Khi các điều kiện thỏa, có thể tìm khoảng tin chắc
cho trị trung bình của mẫu, μ.
Khoảng tin chắc:
CI y tn1 SE y
Với sai số chuẩn của
trị trung bình của mẫu:
SE y
s
n
Giá trịị tới
ới h
hạn tn*1 phụ
h thuộc
h ộ vào
à mức
ứ tin
i chắc,
hắ C, và
à
số bậc tự do, n – 1.
13
©2010, Nguyễn Duy Long, Tiến Sỹ
Các điều kiện cho kiểm nghiệm một mẫu (one-sample t-test)
cho trị trung bình giống với khoảng t cho một mẫu (one-sample
t-interval).
Kiểm nghiệm giả thiết H0: = 0 dùng trị thống kê kiểm
nghiệm:
tn 1
y 0
SE y
với sai số chuẩn của trị trung bình của mẫu:
SE y
s
n
Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theo
mơ hình t của Student với n – 1 bậc tự do.
©2010, Nguyễn Duy Long, Tiến Sỹ
14
7
9/8/2010
Nhà sản xuất rượu kiểm tra dây chuyền đóng chai
750ml để đảm bảo việc rót đủ rược, nếu khống phải
dùng dây chuyền và kiểm tra mọi thứ, một qui trình
mất thời gian và tốn kém. Trong khi một số biến đổi
là tự nhiên và chấp nhận được, mẫu 15 chai có
dung tích trung bình 740ml và độ lệch chuẩn 20ml
◦ Tìm 95% CI cho dung tích trung bình của các chai rượu
◦ Nếu ta quan tâm việc đóng chai lớn hơn hay nhỏ hơn dung
tích trên nhãn và sẽ chấp nhận mức = 5%, dùng loại kiểm
nghiệm nào?
Ta có dừng dây chuyền khơng?
◦ Nếu
ế ta chỉ quan tâm đóng chai ít rượu hơn, loại kiểm
ể
nghiệm gì cần thực hiện? Nếu = 5%, ta vẫn dùng cùng
mức tin chắc ở trên?
©2010, Nguyễn Duy Long, Tiến Sỹ
15
Comparing Means
©2010, Nguyễn Duy Long, Tiến Sỹ
16
8
9/8/2010
Các thí nghiệm để so sánh hai nhóm thường
y ra cả trong
g khoa học
ọ và công
g nghiệp.
g ệp
xảy
So sánh hai trị trung bình khơng khác mấy so
với so sánh hai phần
©2010, Nguyễn Duy Long, Tiến Sỹ
Khi các điều kiện thỏa, sự khác nhau được
giữa các trịị trung
g bình
chuẩn hóa của mẫu g
của hai nhóm độc lập,
t
17
( y1 y 2 ) ( 1 2 )
SE ( y1 y 2 )
có thể mơ hình bởi mơ hình t của Student với
bậc tự do theo công thức đặc biệt. Sai số
chuẩn
ẩ được ước tính:
SE ( y1 y2 )
s12
n1
2
ns22
©2010, Nguyễn Duy Long, Tiến Sỹ
18
9
9/8/2010
Xác định bậc tự do theo:
df
s2
s2
( n1 n2 ) 2
1
2
2
2
1 ( s1 ) 2 1 ( s2 ) 2
n11 n1
n2 1 n 2
Qui tắc dễ hơn:
◦ df = min(n
( 1, n2) nhưng
g không
g lớn hơn ((n1 + n2 – 2))
©2010, Nguyễn Duy Long, Tiến Sỹ
19
Giả định tính độc lập
Giả định quần thể chuẩn
Giả định các nhóm độc lập
©2010, Nguyễn Duy Long, Tiến Sỹ
20
10
9/8/2010
Khi các điều kiện thỏa, khoảng tin chắc cho
ự khác nhau g
giữa các trịị trung
g bình của hai
sự
nhóm độc lập, µ1 - µ2, là:
( y1 y2 ) t df* SE ( y1 y2 )
21
©2010, Nguyễn Duy Long, Tiến Sỹ
Kiểm nghiệm t cho hai mẫu (two-sample ttest)
H0: µ1 - µ2 = Δ0
( y y )
Trị thống kê kiểm nghiệm: t SE1 ( y 2 y )0
1
©2010, Nguyễn Duy Long, Tiến Sỹ
2
22
11
9/8/2010
Paired Samples
©2010, Nguyễn Duy Long, Tiến Sỹ
23
Dữ liệu đơi (paired data) xuất hiện dưới nhiều
cách.
◦ Ví dụ: So sánh các đối tượng với chính nó trước và
sau một liệu pháp.
Khơng thể dùng các phương pháp hai mẫu ở
phần trên cho dữ liệu đơi.
©2010, Nguyễn Duy Long, Tiến Sỹ
24
12
9/8/2010
Tên
Dặm lái xe với tuần
làm việc 5 ngày
Dặm lái xe với tuần
làm việc 4 ngày
Khác nhau
Jeff
2798
2914
-116
116
Betty
7724
6112
1612
Roger
7505
6177
1328
838
1102
-264
4592
3281
1311
Tom
Aimee
Greg
8107
4997
3110
y G.
Larry
1228
1695
-467
Tad
8718
6606
2112
Larry M.
1097
1063
34
Leslie
8089
6392
1697
Lee
3807
3362
445
Nguồn: De Veaux, 2006, tr.574
©2010, Nguyễn Duy Long, Tiến Sỹ
25
Vì ta quan tâm đến các sự khác nhau, ta coi
tất cả chúng (cột ngoài cùng bên phải) như
thể
hể chúng
hú
là dữ
d liệu,
l
bỏ qua hai
h cột đầu.
đầ
Ta chỉ có một cột các giá trị để xem xét, ta có
thể dùng kiểm nghiệm t một mẫu (onesample t-test).
Về tính tốn, kiểm nghiệm t đơi (paired ttest) chỉ là kiểm nghiệm t một mẫu cho các trị
trung bình của sự khác nhau từng đơi
(pairwise differences), kích thước mẫu là số
cặp
©2010, Nguyễn Duy Long, Tiến Sỹ
26
13
9/8/2010
Giả định dữ liệu đơi
Giả định tính độc lập
Giả định quần thể chuẩn
©2010, Nguyễn Duy Long, Tiến Sỹ
27
Khi các điều kiện thỏa, ta có thể kiểm nghiệm
g bình của sự
ự khác nhau từng
g đơi có
trịị trung
khác nhau đáng kể so với khơng.
Giả thiết rỗng H0: µ0 = Δ0
Trị số thống kê:
Sai số chuẩn:
t n 1
SE (d )
d 0
SE ( d )
sd
n
©2010, Nguyễn Duy Long, Tiến Sỹ
28
14
9/8/2010
Khi các điều kiện thỏa, ta có thể tìm khoảng
g bình của sự
ự khác nhau
tin chắc cho trịị trung
từng đơi:
d t n*1 SE (d )
Với
SE (d )
sd
n
©2010, Nguyễn Duy Long, Tiến Sỹ
29
©2010, Nguyễn Duy Long, Tiến Sỹ
30
15