Tải bản đầy đủ (.pdf) (15 trang)

Bài giảng Thống kê học ứng dụng trong quản lý xây dựng: Phần 9 - TS. Nguyễn Duy Long

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 15 trang )

9/8/2010

Phần 09
Nguyễn Duy Long, Tiến Sỹ
Bộ môn Thi Công và QLXD

©2010, Nguyễn Duy Long, Tiến Sỹ





1

Các suy luận về các trị trung bình
So sánh các trị trung bình
Mẫu đơi

©2010, Nguyễn Duy Long, Tiến Sỹ

2

1


9/8/2010

Inferences about means

©2010, Nguyễn Duy Long, Tiến Sỹ






3

Ta làm việc với trị trung bình (means): khoảng tin
chắc và kiểm nghiệm giả thiết dựa trên mơ hình
phân phối
ố mẫu.

Định Lý Giới Hạn Trung Tâm (CLT) cho ta biết rằng
mơ hình phân phối mẫu cho trị trung bình là mơ
hình chuẩn với trị trung bình μ và độ lệch chuẩn là:

SD  y  


n

©2010, Nguyễn Duy Long, Tiến Sỹ

4

2


9/8/2010










Với các phần, có sự liên hệ giữa giá trị của phần
(proportion value) và độ lệch chuẩn của phần của
mẫu
ẫ (sample
(
l proportion).
i )
Với trị trung bình thì khơng! Biết trị trung bình của
mẫu khơng cho ta biết điều gì về SD( y)
Ta làm tất cả những gì có thể: ước lượng thông số
quần thể σ với trị thống kê của mẫu s.
Sai số chuẩn của trị trung bình của mẫu:

SE  y  

s
n

©2010, Nguyễn Duy Long, Tiến Sỹ



5


Ta có thêm sự biến đổi trong sai số chuẩn từ s, độ
lệch
ệ chuẩn của mẫu.
◦ Ta cần xét sự biến đổi thêm này để khơng lẫn (mess up)
với các tính tốn về biên sai.



Và hình dạng (shape) của mơ hình mẫu thay đổi –
mơ hình khơng cịn là mơ hình chuẩn nữa.
◦ Vậy mơ hình mẫu ra sao?

©2010, Nguyễn Duy Long, Tiến Sỹ

6

3


9/8/2010




William S. Gosset, nhân viên công ty bia Guinness
ở Ireland, tìm ra mơ hình mẫu.
Mơ hình mẫu do Gosset tìm ra được gọi là t của
Student (Student’s t).


◦ Các mô hình t của Student hình thành một tập các phân
phối liên quan phụ thuộc vào thông số bậc tự do (degrees
of freedom), gọi tắc là df.
◦ Viết tắc mơ hình này dưới dạng tdf.

©2010, Nguyễn Duy Long, Tiến Sỹ

7

Mơ hình phân phối mẫu thực tiễn cho các trị trung bình
Khi các điều kiện thỏa, trị trung bình mẫu được chuẩn hóa:

t

y 
SE  y 

Theo mơ hình phân phối t của Student với n – 1 bậc tự do.
s
Ta ước lượng sai số chuẩn theo: SE  y  

n

với n là kích thước của mẫu

©2010, Nguyễn Duy Long, Tiến Sỹ

8

4



9/8/2010



Khi Gosset sửa mơ hình cho sự khơng chắc chắn thêm (extra
uncertainty), biên sai ME lớn hơn.
◦ Khoảng tin chắc sẽ rộng hơn một chút



Các mơ hình t (t-models) là một mốt, đối xứng, và có hình
chng tựa như mơ hình chuẩn.

◦ Các mơ hình t với vài bậc tự do có đi dày hơn mơ hình chuẩn.
◦ Khi df tăng, các mơ hình t càng giống mơ hình chuẩn.
◦ Mơ hình t với df vơ tận thì chính là mơ hình chuẩn.
Mơ hình chuẩn

Mơ hình t với 2 bậc tự do

©2010, Nguyễn Duy Long, Tiến Sỹ






9


Mơ hình t khác nhau bởi
bậc tự do (n-1)
Bảng tra cho giá trị tới hạn
của mơ hình t (t-model
critical values)
Với n = 16 và C = 95%, t*= +/2.131
◦ Nếu n = 8 và kiểm nghiệm
một phương đuôi trên với
=5%, t*=1.895

Một phần của Bảng T (tr.A-58)

©2010, Nguyễn Duy Long, Tiến Sỹ

10

5


9/8/2010

1) Giả định tính độc lập:
◦ Điều kiện ngẫu nhiên hóa: Dữ liệu từ mẫu ngẫu
nhiên hay thí nghiệm được ngẫu nhiên hóa thích
hợp.
◦ Điều kiện 10%

©2010, Nguyễn Duy Long, Tiến Sỹ


11

2) Giả định quần thể chuẩn:
◦ Điều kiện gần chuẩn “Nearly Normal”: Dữ liệu từ
phân phối một mốt và đối xứng.

 Kiểm tra điều kiện này bằng cách vẽ biểu đồ tần suất.
suất
 Kích thước mẫu càng nhỏ (n < 15), dữ liệu càng nên theo
mơ hình chuẩn.
 Với các kích thước mẫu trung bình (n giữa15 và 40), t sẽ
hữu hiệu khi dữ liệu là một mốt và gần đối xứng.
 Với kích thước mẫu lớn hơn, t sẽ an tồn để dùng thậm chí
dữ liệu là bị lệch.

©2010, Nguyễn Duy Long, Tiến Sỹ

12

6


9/8/2010










Khi các điều kiện thỏa, có thể tìm khoảng tin chắc
cho trị trung bình của mẫu, μ.
Khoảng tin chắc:

CI  y  tn1  SE  y 

Với sai số chuẩn của
trị trung bình của mẫu:

SE  y  

s
n

Giá trịị tới
ới h
hạn tn*1 phụ
h thuộc
h ộ vào
à mức
ứ tin
i chắc,
hắ C, và
à
số bậc tự do, n – 1.

13


©2010, Nguyễn Duy Long, Tiến Sỹ





Các điều kiện cho kiểm nghiệm một mẫu (one-sample t-test)
cho trị trung bình giống với khoảng t cho một mẫu (one-sample
t-interval).
Kiểm nghiệm giả thiết H0:  = 0 dùng trị thống kê kiểm
nghiệm:

tn 1 

y  0
SE  y 

với sai số chuẩn của trị trung bình của mẫu:


SE  y  

s
n

Khi các điều kiện thỏa và giả thiết rỗng đúng, trị thống kê theo
mơ hình t của Student với n – 1 bậc tự do.

©2010, Nguyễn Duy Long, Tiến Sỹ


14

7


9/8/2010



Nhà sản xuất rượu kiểm tra dây chuyền đóng chai
750ml để đảm bảo việc rót đủ rược, nếu khống phải
dùng dây chuyền và kiểm tra mọi thứ, một qui trình
mất thời gian và tốn kém. Trong khi một số biến đổi
là tự nhiên và chấp nhận được, mẫu 15 chai có
dung tích trung bình 740ml và độ lệch chuẩn 20ml
◦ Tìm 95% CI cho dung tích trung bình của các chai rượu
◦ Nếu ta quan tâm việc đóng chai lớn hơn hay nhỏ hơn dung
tích trên nhãn và sẽ chấp nhận mức  = 5%, dùng loại kiểm
nghiệm nào?
 Ta có dừng dây chuyền khơng?

◦ Nếu
ế ta chỉ quan tâm đóng chai ít rượu hơn, loại kiểm

nghiệm gì cần thực hiện? Nếu  = 5%, ta vẫn dùng cùng
mức tin chắc ở trên?

©2010, Nguyễn Duy Long, Tiến Sỹ

15


Comparing Means

©2010, Nguyễn Duy Long, Tiến Sỹ

16

8


9/8/2010





Các thí nghiệm để so sánh hai nhóm thường
y ra cả trong
g khoa học
ọ và công
g nghiệp.
g ệp
xảy
So sánh hai trị trung bình khơng khác mấy so
với so sánh hai phần

©2010, Nguyễn Duy Long, Tiến Sỹ




Khi các điều kiện thỏa, sự khác nhau được
giữa các trịị trung
g bình
chuẩn hóa của mẫu g
của hai nhóm độc lập,

t


17

( y1  y 2 )  ( 1   2 )
SE ( y1  y 2 )

có thể mơ hình bởi mơ hình t của Student với
bậc tự do theo công thức đặc biệt. Sai số
chuẩn
ẩ được ước tính:

SE ( y1  y2 ) 

s12
n1

2

 ns22

©2010, Nguyễn Duy Long, Tiến Sỹ


18

9


9/8/2010



Xác định bậc tự do theo:

df 


s2

s2

( n1  n2 ) 2

1
2
2
2
1 ( s1 ) 2  1 ( s2 ) 2
n11 n1
n2 1 n 2

Qui tắc dễ hơn:


◦ df = min(n
( 1, n2) nhưng
g không
g lớn hơn ((n1 + n2 – 2))

©2010, Nguyễn Duy Long, Tiến Sỹ





19

Giả định tính độc lập
Giả định quần thể chuẩn
Giả định các nhóm độc lập

©2010, Nguyễn Duy Long, Tiến Sỹ

20

10


9/8/2010



Khi các điều kiện thỏa, khoảng tin chắc cho
ự khác nhau g

giữa các trịị trung
g bình của hai
sự
nhóm độc lập, µ1 - µ2, là:

( y1  y2 )  t df*  SE ( y1  y2 )

21

©2010, Nguyễn Duy Long, Tiến Sỹ






Kiểm nghiệm t cho hai mẫu (two-sample ttest)
H0: µ1 - µ2 = Δ0
( y  y )
Trị thống kê kiểm nghiệm: t  SE1 ( y 2 y )0
1

©2010, Nguyễn Duy Long, Tiến Sỹ

2

22

11



9/8/2010

Paired Samples

©2010, Nguyễn Duy Long, Tiến Sỹ



23

Dữ liệu đơi (paired data) xuất hiện dưới nhiều
cách.
◦ Ví dụ: So sánh các đối tượng với chính nó trước và
sau một liệu pháp.



Khơng thể dùng các phương pháp hai mẫu ở
phần trên cho dữ liệu đơi.

©2010, Nguyễn Duy Long, Tiến Sỹ

24

12


9/8/2010


Tên

Dặm lái xe với tuần
làm việc 5 ngày

Dặm lái xe với tuần
làm việc 4 ngày

Khác nhau

Jeff

2798

2914

-116
116

Betty

7724

6112

1612

Roger

7505


6177

1328

838

1102

-264

4592

3281

1311

Tom
Aimee
Greg

8107

4997

3110

y G.
Larry


1228

1695

-467

Tad

8718

6606

2112

Larry M.

1097

1063

34

Leslie

8089

6392

1697


Lee

3807

3362

445

Nguồn: De Veaux, 2006, tr.574







©2010, Nguyễn Duy Long, Tiến Sỹ

25

Vì ta quan tâm đến các sự khác nhau, ta coi
tất cả chúng (cột ngoài cùng bên phải) như
thể
hể chúng

là dữ
d liệu,
l
bỏ qua hai
h cột đầu.

đầ
Ta chỉ có một cột các giá trị để xem xét, ta có
thể dùng kiểm nghiệm t một mẫu (onesample t-test).
Về tính tốn, kiểm nghiệm t đơi (paired ttest) chỉ là kiểm nghiệm t một mẫu cho các trị
trung bình của sự khác nhau từng đơi
(pairwise differences), kích thước mẫu là số
cặp
©2010, Nguyễn Duy Long, Tiến Sỹ

26

13


9/8/2010





Giả định dữ liệu đơi
Giả định tính độc lập
Giả định quần thể chuẩn

©2010, Nguyễn Duy Long, Tiến Sỹ






27

Khi các điều kiện thỏa, ta có thể kiểm nghiệm
g bình của sự
ự khác nhau từng
g đơi có
trịị trung
khác nhau đáng kể so với khơng.
Giả thiết rỗng H0: µ0 = Δ0



Trị số thống kê:



Sai số chuẩn:

t n 1 

SE (d ) 

d 0
SE ( d )
sd
n

©2010, Nguyễn Duy Long, Tiến Sỹ

28


14


9/8/2010



Khi các điều kiện thỏa, ta có thể tìm khoảng
g bình của sự
ự khác nhau
tin chắc cho trịị trung
từng đơi:

d  t n*1  SE (d )


Với

SE (d ) 

sd
n

©2010, Nguyễn Duy Long, Tiến Sỹ

29

©2010, Nguyễn Duy Long, Tiến Sỹ


30

15



×