Tải bản đầy đủ (.pdf) (16 trang)

Bài giảng - phương pháp thí nghiệm đồng ruộng - chương 4 pps

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (455.09 KB, 16 trang )


36

CHƯƠNG IV
ƯỚC LƯỢNG VÀ KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Chương này sẽ giới thiệu các dạng ước lượng cụ thể đối với số trung bình
của một đặc trưng định lượng và xác suất của một đặc trưng định tính nào đó (tỷ lệ)
trong một quần thể (hay công thức); đề cập đến việc kiểm định (so sánh) hai số
trung bình của một đặc tính định lượng hay hai xác suất (hai tỷ lệ) của một đặc tính
định tính của quần thể.
A. ƯỚC LƯỢNG
1. ĐẶT VẤN ĐỀ
Như chúng ta đã biết, đối tượng nghiên cứu trong nông nghiệp khá phức tạp,
trong quá trình nghiên cứu không thể quan sát và đo đếm tất cả các cá thể có của
quần thể (công thức) với những lý do sau:
- Không có điều kiện về nhân lực và thời gian để theo dõi
- Phải bảo vệ đối tượng nghiên cứu.
Do đó phải tiến hành lấy mẫu ngẫu nhiên n cá thể mang tính đại diện để tiến
hành nghiên cứu (quan sát hay đo đếm). Từ kết quả quan sát của mẫu đưa ra kết
luận (đánh giá) cho toàn quần thể (công thức). Kết luận đưa ra được gọi là kết luận
thống kê. Nên từ quần thể quan sát đưa ra một kết luận (đánh giá) đối với độ lớn của
trung bình (hay xác suất) thì ta có một ước lượng.
Từ kết quả của mẫu suy ra kết quả của cả đám đông thì không tránh khỏi sai
số, chỉ có điều là khả năng và mức độ sai số là như thế nào? Nội dung của chương
này sẽ nghiên cứu sai số và khả năng hạn chế sai số đó khi tiến hành ước lượng để
đạt tới mong muốn cho phép mà thôi.
2. CÁC PHƯƠNG PHÁP ƯỚC LƯỢNG
2.1. Ước lượng điểm
Ước lượng điểm của một tham số thống kê nào đó là dạng ước lượng mà từ
kết quả quan sát của một mẫu lấy ngẫu nhiên mang tính đại diện của tổng thể, đưa
ra một con số và cho rằng con số đó là giá trị gần đúng tốt nhất cho tham số muốn


biết.
Thí dụ: Biến ngẫu nhiên X (định lượng hoặc định tính) có phân phối xác suất phụ
thuộc vào một tham số

chưa biết. Từ biến ngẫu nhiên này lấy một ngẫu nhiên n
quan sát.
Gọi x
i
là quan sát thứ i, còn x
i
là giá trị cụ thể của X
i
. Trong mẫu quan sát
hàm f(X
1,
X
2
, X
n
) được dùng để ước lượng

. Vấn đề đặt ra là chọn hàm nào?
Ký hiệu Q
n
= f (x
1
, x
2
, x
n

) là hàm ước lượng của

. Q
n
là một biến ngẫu
nhiên có giá trị cụ thể q = f (x
1
, x
2
, x
n
). Vậy q là ước lượng điểm của

.

37


q


(4.1)
Có thể tính được độ lệch chuẩn của Q
n
và ước lượng điểm lúc này sẽ là:



n
QDq 


(4.2)
Trong đó


n
QD là độ lệch chuẩn của Q
n
.
Thí dụ: Tổng thể có phân phối chuẩn


2
,



là trung bình (kỳ vọng) chưa
biết cần ước lượng. Lấy n quan sát x
1
, x
2
, x
i
, x
n.
. Tính
n
x
x

i

 và
n
s
s
x
 như
vậy có thể đưa ra được ước điểm của kỳ vọng

.
x


hoặc
n
s
x 

(4.3)
2.2. Ước lượng khoảng
Ước lượng khoảng của một tham số thống kê nào đó là từ kết quả quan sát
của mẫu đưa ra được giá trị tương ứng với một độ tin cậy nhất định. Mọi giá trị nằm
trong khoảng đó đều được coi là giá trị gần đúng tốt nhất của tham số.
Giả sử

là tham số cần ước lượng. Nếu có q
1
là giới hạn dưới và q
2

là giới
hạn trên,

là xác suất để mắc sai lầm thì ước lượng khoảng của

được viết như
sau:


PqqP 

1
21
(4.4)
Trong đó:
[q
1
; q
2
] là khoảng tin cậy của tham số


P : Gọi là độ tin cậy (thường lấy với xác suất lớn 0,95; 0,99 và 0,999).
1


- P (thường lấy xác suất nhỏ 0,05; 0,01 và 0,001).
3. ƯỚC LƯỢNG GIÁ TRỊ TRUNG BÌNH CỦA TỔNG THỂ (KHI CÁC ĐẶC
TRƯNG NGHIÊN CỨU CÓ PHÂN PHỐI CHUẨN)
Do chỉ quan sát được n cá thể trong mẫu mà lại mong muốn đánh giá được

của toàn công thức (cần biết trung bình của công thức hay còn gọi là kỳ vọng). Cho
nên có thể xem xét cụ thể như sau:
3.1. Ước lượng trị số trung bình của tổng thể khi dung lượng mẫu n


30n
Giả sử X có phân phối chuẩn N


2
,

, trong thực tế thì hầu như chúng ta
không biết phương sai
2

mà chỉ tính được phương sai thống kê của mẫu s
2
. Vì
vậy, khi dung lượng mẫu đủ lớn thì có thể coi
22
s

. Theo tính chất của phân phối
chuẩn chúng ta có:

38


n

s
s
x
 hay
n
s
2

Vì vậy, khi phân phối của
x
là tiệm cận với phân phối chuẩn thì kỳ vọng hay
trung bình tổng thể

sẽ được xác định qua ước lượng điểm hoặc ước khoảng như
sau:
Ước lượng điểm
x
sx 


x



Ước lượng khoảng




 1

xx
suxsuxP (4.5)


u là giá trị tra ở bảng 2 (phụ lục)
Nếu lấy độ tin cậy P là 0,95 thì 96,1

u ; P = 0,99 thì 58,2

u và P = 0,999
thì 29,3

u .
Tương tự sẽ suy ra khoảng tin cậy cụ thể như sau:



95,005,0196,196,1 
xx
sxsxP





99,001,0158,258,2 
xx
sxsxP






999,0001,0129,3,29,3 
xx
sxsxP


Thí dụ: Điều tra năng suất cá thể của một số giống cà chua xuân hè (kg/cây)với
mẫu n = 50. Từ đó có năng suất cá thể trung bình
48
,
1

x
kg; độ lệch chuẩn của
năng suất là 0,35 kg/cây. Hãy đưa ra ước lượng cho năng suất cá thể của cà chua
điều tra nêu trên.
Trước hết ta đưa ra ước lượng điểm có năng suất như sau

 
05,048,1
50
35,0
48,1 

kg/cây.
Ước lượng khoảng ở độ tin cậy P = 0,95 gọi tắt là khoảng tin cậy sẽ là
95,005,01
50

35,0
96,148,1
50
35,0
96,148,1 







P



95,005,0110,048,110,048,1 

P
Điều này có nghĩa với độ tin cậy 95%, năng suất cá thể của cà chua từ 1,38
đến 1,58 kg/cây.
Nếu như
01
,
0


thì khoảng tin cậy được xác định là:
01,01
50

35,0
58,248,1
50
35,0
58,248,1 










P
P


01,0113,048,113,048,1 



39




01,0161,135,1 


P
Năng suất từ 1,35 đến 1,61 kg/cây với độ tin cậy 99%
3.2. Ước lượng số trung bình quần thể khi dung lượng mẫu n < 30
Lúc này không thể coi phương sai chưa biết
2

là s
2
được do đó phải dùng
đến phân phối t (Student). Khoảng tin cậy của trị số trung bình có dạng như sau
P




 1
),(),( xdfxdf
stxstx (4.6)
Ở đây giá trị
),( df
t

với df = n - 1 tra ở bảng phân phối t (bảng 4 phụ lục)
Thí dụ: Theo dõi năng suất của bắp cải trong thí nghiệm vụ đông xuân tại Đông
Anh Hà Nội, dung lượng mẫu điều tra n = 25, năng suất bình quân
5
,
175

x

tạ/ha
với độ lệch chuẩn s = 20,5 tạ/ha. Hãy đưa ra khoảng tin cậy 95% cho năng suất bắp
cải vụ đông tại điểm nghiên cứu ở Đông Anh Hà Nội.
Trước hết ta tra bảng t ở mức
05
,
0


với số bậc tự do
df = n - 1 và df = 25 - 1 = 24. Như vậy, giá trị
)24,05,0( df
t = 2,06
Khoảng sẽ được xác định như sau
P 95,005,01
25
5,20
06,25,175
25
5,20
06,25,175 








P



05,019,1831,167 


Hay viết gọn lại P (
4
,
8
5
,
175



) tạ/ha với mức ý nghĩa
05
,
0



4. XÁC ĐỊNH DUNG LƯỢNG MẪU KHI ƯỚC LƯỢNG
Như đã biết khoảng tin cậy với trung bình của quần thể phụ thuộc vào độ tin
cậy và dung lượng mẫu. Khi dung lượng mẫu lớn khoảng tin cậy trung bình có dạng
 X

(4.7)
Như vậy


là sai số ước lượng và chúng ta muốn



với

càng nhỏ càng
tốt để khoảng tin cậy hẹp.

n
su


)(

hoặc
n
st
df


,


Như vậy
2
22
)(



su
n

hoặc
2
22
),(



st
n
df

(khi dung lượng mẫu nhỏ)
Khi
05
,
0


thì 96,1
)05,0(
u và có thể lấy
2


Còn giá trị 96,1
),05,0(


df
t phụ thuộc vào độ tự do có thể tra trong bảng 4 phần
phụ lục.

40

Vậy
2
2
4



s
n
ct
(4.8)
Ở đây

có giá trị chứa đơn vị đo như các quan sát x
i
hoặc
x
. Ta còn có thể
tính được độ lớn n cần thiết khi cho trước một sai số ước lượng %

qua công thức
sau
22
2

22
2
%)()(
000.40
10000
%)()(
4






x
s
x
s
n
ct
(4.9)
Thí dụ: Quan sát 10 cành cà phê chè Catimor trồng 2 năm. Đếm số quả trên cành có
trung bình 121

x quả/cành. Độ lệch chuẩn s = 25 quả/cành. Để số quả bình quân
của vườn cà phê mong muốn
)
10
121
(




quả/cành ( 10


quả/cành) thì dung
lượng n = 10 như đã lấy thử đủ đảm bảo sai số đưa ra hay chưa với độ tin cậy 95%.
n cần thiết cho 10


tính như sau
Do

là giá trị số lượng nên cành 25
10
4625
10
254
2
2





ct
n cành
Vậy để cho sai số của số quả/cành là 10 quả/cành thì dung lượng n = 10 như
đã lấy thử là chưa đủ lớn mà phải lấy thêm ít nhất 15 cành nữa để tổng số cành quan
sát 25


n .
Nếu lại đưa ra %

mong muốn là 5% thì
3,68
5)121(
)25(000.40
2
2




ct
n hay 68

cành hoặc 69 cành
Như vậy, n = 10 còn quá nhỏ so với mong muốn để sai số ước lượng %5


.
Phải lấy thêm 59 cành nữa mới đủ chấp nhận sai số ước lượng nêu trên.
5. ƯỚC LƯỢNG XÁC SUẤT CỦA TỔNG THỂ ( ƯỚC LƯỢNG TỶ LỆ)
Trong thực nghiệm sinh học, rất nhiều trường hợp phải nghiên cứu các xác
suất hay tỷ lệ, như tỷ lệ sống của cây con sau khi đem từ vườn ươm trồng ra lô sản
xuất, tỷ lệ bệnh, hoặc tỷ lệ mọc mầm của hạt
Thí dụ: Trong một quần thể có N cá thể (N rất lớn) và giả sử có M cá thể có
đặc tính A. Như vậy, xác suất của A là p = M/N (đây là theo lý thuyết). Song ta
không thể có điều kiện để tính p trực tiếp. Vì vậy, phải lấy một mẫu ngẫu nhiên từ

quần thể ấy. Trong n phần tử của mẫu đếm được m phần tử có đặc tính A. Vậy tần
suất của đặc tính A trong mẫu sẽ là f = m/n.
Để ước lượng xác suất p của các cá thể có đặc tính A cần phải xem xét các
điều kiện cụ thể sau:
5.1. Khi sự kiện A có xác suất không gần 0 và 1
5.1.1. Khi dung lượng n đủ lớn (n > 100)

41

Lúc này luật phân phối nhị thức, xác suất của A sẽ tiệm cận với luật phân
phối chuẩn, như vậy
n
ff
s
p
)1( 
 và biểu thức ước lượng điểm có thể viết như
sau:
p
sfp  (4.10)
Hoặc
f
p

(4.11)
Khoảng tin cậy của sự kiện A có xác suất p trong quần thể sẽ có dạng sau:
P


 1)(

pp
sufpsuf (4.12)
Hoặc viết gọn như sau:
P(


 1)
p
sufp (4.13)
Cụ thể:

p
sfp 96,1 là khoảng tin cậy 95%

p
sfp 58,2 là khoảng tin cậy 99%

p
sfp 29,3 là khoảng tin cậy 99,9%
Thí dụ: Để dự đoán sâu đục quả cà chua vụ xuân hè 2002 tại Gia Lâm, Hà Nội, tiến
hành lấy ngẫu nhiên một mẫu n = 630 quả, trong đó 82 quả bị sâu đục. Hãy đưa ra
các ước lượng cho tỷ lệ sâu đục quả cà chua trong nghiên cứu trên.
Do độ lớn n = 630 là lớn nên:
* Ước lượng điểm:
Gọi p là xác suất bị sâu đục quả của quần thể, f là tần suất của mẫu có quả bị sâu
f = 130,0
630
82

p = 0,130 hay 13,0%.

Hoặc p = 0,130
630
)130,01(130,0 
 = 0,130
0134
,
0


hay p = (13,0
34
,
1

) %.
* Ước lượng khoảng:
Nếu chọn mức ý nghĩa
05
,
0


thì tỷ lệ sâu đục quả cà chua nghiên cứu sẽ
được xác định như sau:
p = f
p
s96,1 = 0,130
)
0134
,

0
96
,
1
(



= 0,0134
0262
,
0

hay p = (13,0
)
62
,
2

%.

42

Với độ tin cậy 95% thì tỷ lệ cà chua bị sâu đục quả vụ xuân hè 2002 tại Gia
Lâm, Hà Nội nằm trong khoảng từ 10,38% đến 15,62%.
- Nếu chọn
01
,
0



thì khoảng tin cậy lúc này là:
P = 0,130

2,58 0346,0130,0 
p
S hay từ 9,54% đến 16,46%.
- Nếu
001
,
0


thì khoảng sẽ thay đổi từ 8,59% đến 17,4%.
5.1.2. Khi dung lượng n < 100 (không đủ lớn)
Do mẫu nhỏ nên không thể áp dụng hàm tiệm cận để ước lượng được mà
phải dùng phân phối nhị thức. Nhưng việc tính toán sẽ phức tạp nên các nhà toán
học thống kê xác suất đã lập bảng tính sẵn cho độ lớn n từ 4 đến 100 (chỉ áp dụng
cho khoảng 95% độ tin cậy). Khoảng này sẽ được tìm ở các bảng 6 (a, b, c) phần
phụ lục.
Bảng 6a áp dụng cho khoảng 95% của tỷ lệ mẫu bé (x = m)
Với 4

n

10
Bảng 6b với tỷ lệ của mẫu khi 10

n


100 và 0

m

25
Bảng 6c với tỷ lệ khi 60

n

100 và 26

m

50
Thí dụ: Áp dụng một biện pháp điều trị bằng thuốc hoá cho bệnh chảy gôm bưởi
thanh trà ta có kết quả sau:.
Tiến hành xử lý ở n = 20 cây ; sau xử lý quan sát thấy có 5 cây khỏi bệnh và
15 cây khác không khỏi bệnh. Vậy khoảng tin cậy 95% của khỏi bệnh là bao nhiêu?
* Nếu lấy ước lượng điểm thì ở đây xác suất (tỷ lệ) khỏi bệnh chảy gôm cây
bưởi sẽ là:
p = f = 250,0
20
5

n
m
hay 25,0%
* Nếu tìm khoảng tin cậy 95% cho tỷ lệ khỏi bệnh sẽ dùng trong bảng 6 (b)
tra tại cột 5 hàng 20
Hàng trên là p

1
% = 8,7%
Hàng dưới là p
2
% = 49,1%
Như vậy khoảng tin cậy 95% của tỷ lệ f =
20
5
sẽ là từ 8,7% đến 49,1% (khỏi
bệnh chảy gôm cây bưởi).
5.2. Khi sự kiện A có xác suất gần 0 hoặc gần 1
Trong trường hợp này xác suất của A tuân theo luật Poisson (hay còn gọi là
hàm phân phối xác suất của sự kiện hiếm). Dựa theo luật Poisson người ta đã lập
một bảng tính sẵn để có ước lượng khoảng cho sự kiện A này. Tuy nhiên, chỉ ứng
với độ tin cậy 95% (bảng 7 phụ lục).

43

Còn với ước lượng điểm thì cũng chỉ lấy gần đúng tốt nhất cho xác suất của
tổng thể là xác suất của A trong mẫu quan sát.
Thí dụ: Nghiên cứu ảnh hưởng của chiếu xạ lên hạt giống đến hiện tượng dị hình
của cây sau xử lý. Mẫu xử lý có độ lớn n = 12500 hạt táo, sau đó đem gieo và theo
dõi cây con. Gọi A là hiện tượng dị hình, quan sát thấy có A = 105 cây. Hãy đưa ra
các dạng ước lượng cho kết quả xử lý trên về hiện tượng đột biến kiểu hình.
Gọi p là xác suất hay tỷ lệ đột biến kiểu hình của liều lượng xử lý trên, kết
quả thống kê mẫu có tần suất:
f 0084,0
12500
105
 hay 0,84%

* Vậy ước lượng điểm của hiện tượng đột biến kiểu hình của liều lượng xử
lý trên p

f % là 0,84%
* Ước lượng khoảng được xác định sẵn qua bảng 7 phụ lục. Song, bảng chỉ
cho hai giá trị np
1
và np
2
ứng với 95% độ tin cậy.
P (p
1
.p
2
) = 1 – 0,05 với p
1
. p
2
tính từ
p
1
=
n
np
1
và p
2
=
n
np

2

Trong trường hợp ở đây np
1
và np
2
phải được tra từ giá trị gần đúng sau:
Trong bảng 7 chỉ có x = m nhiều nhất là 100. Từ giá trị m = 105 không có
trong bảng. Nên phải giảm (lùi 10 lần); m = 10,5 lấy gần đúng m = 11.
Tra ở m = 11 (hàng 10 cột 1) có np
1
= 0,025; np
2
= 5,572
Muốn có p
1
và p
2
thì p
i
=
n
np
i
. Nhưng vì các giá trị np
1
và np
2
đều được tính
lùi 10 lần nên lúc này n chỉ còn n = 1250. Từ đó

np
1
= 5,5 và np
2
= 19,7
p
1
= 0044,0
1250
5,5
 hay 0,44%
p
2
= 01576,0
1250
7,19
 hay 1,576% lấy gần đúng 1,58%
Vậy tỷ lệ đột biến kiểu hình của liều lượng xử lý này sẽ dao động từ 0,44%
đến 1,58% với độ tin cậy 95%.
Bài tập:
1. Điều tra năng suất ngô của 44 hộ nông dân ta có kết quả sau(tạ/ha) :
14; 38; 35; 42; 42; 36; 40; 36; 34; 36; 35; 36; 34; 42; 39; 39; 44; 37; 44; 36; 41; 43;
42; 42; 42; 43; 39; 43; 39; 44; 40; 43; 43; 35; 38; 39; 39; 42; 43; 37; 44; 40; 39; 43

44

Hãy đưa ra các dạng ước lượng cho năng suất ngô của vùng điều tra nói trên
(ước lượng điểm và ước lượng khoảng) với độ tin cậy 95% và 99%).
2. Đếm số hạt trên bông lúa của một giống ta có số liệu sau(hạt/bông):
120; 119; 116; 110; 121; 118; 106; 133; 123; 115; 112; 126; 109; 128; 123; 107;

132; 125; 106; 124.
Hãy đưa ra các dạng ước lượng cho số hạt trên bông của giống lúa nói trên
(ước lượng điểm và ước lượng khoảng) với độ tin cậy 95% và 99%.
3. Người ta đã tiến hành theo dõitỷ lệ bật mầm các mắt ghép ở 200 cây ghép
đã cho thấy kết quả có 148 cây đã bật mầm. Hãy đưa ra ước lượng điểm và ước
lượng khoảng của hiện tượng bật mầm của mắt ghép nêu trên với độ tin cậy là 95%
và 99%.
B. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
1. NHỮNG KHÁI NIỆM CHUNG VÀ Ý NGHĨA
Trong nghiên cứu thường phải so sánh các tham số thống kê như số trung
bình, phương sai, xác suất của một mẫu với một tiêu chuẩn cho trước nào đó, hoặc 2
mẫu với nhau hay nhiều mẫu với nhau. Thông thường các tham số có sự khác nhau
(khác nhau về số học), nhưng ta lại cần xem xét sự sai khác này có rõ ràng hay
không? ở mức độ nào?
Nếu chúng khác nhau trong phạm vi ngẫu nhiên thì sự khác nhau này được
coi như không đáng kể (không có ý nghĩa). Nếu chúng khác nhau ngoài phạm vi
ngẫu nhiên thì kết luận sự khác nhau ấy là do tác động của nhân tố thí nghiệm .
Để kiểm định người ta dùng các kết quả thực nghiệm quan sát ở mẫu với
việc vận dụng công cụ toán học là lý thuyết xác suất để kiểm tra những giả thuyết
đã cho. Nếu tài liệu thực nghiệm phù hợp với giả thuyết thì giả thuyết được chấp
nhận. Ngược lại thì giả thuyết bị bác bỏ. Sự phù hợp mà ta nói ở đây không phải là
tuyệt đối mà chỉ là nói phù hợp theo một tiêu chuẩn nào đó xác định trước đủ thỏa
mãn những yêu cầu của thực tiễn.
Trong nông học người ta thường so sánh (hay kiểm định) sự sinh trưởng,
phát triển, diễn biến sâu bệnh hại cây trồng cũng như các chỉ tiêu năng suất được
gieo trồng bằng những biện pháp kỹ thuật khác nhau để xem chúng có ảnh hưởng
thực sự đến các chỉ tiêu nghiên cứu hay không?
2. TRƯỜNG HỢP HAI MẪU ĐỘC LẬP
Mẫu độc lập hay thí nghiệm độc lập là những khái niệm tương đối. Theo
nghĩa rộng người ta gọi mẫu độc lập hay thí nghiệm độc lập nếu một quá trình thực

nghiệm nào đó được thiết kế một cách độc lập với những thí nghiệm khác.
2.1. Tiêu chuẩn u của phân phối tiêu chuẩn
Nếu trong trường hợp kiểu phân phối lý thuyết đặc trưng cho 2 kết quả (2mẫu)

45

nghiên cứu chưa biết thì yêu cầu dung lượng mẫu lấy phải được coi là đủ lớn (n
1
>
30 và n
2
> 30). Theo luật số lớn thì trong trường hợp mẫu lớn, phân phối xác suất
của số trung bình mẫu
X
xấp xỉ luật chuẩn với kỳ vọng

XM và phương sai
n
s
XD
2

Như vậy










1
2
1
11
,
n
Nx













2
2
2
22
,
n
Nx




Giả thiết H
o
:
21

 hay 0
21



Đối thiết H
1
:
21

 hay 0
21


(4.14)










2
2
2
1
2
1
2121
,
nn
Nxx


(4.15)
Được kiểm định bằng tiêu chuẩn u của phân phối tiêu chuẩn với mức ý nghĩa

tính giá trị thực nghiệm như sau:
2
2
2
1
2
1
21
nn
xx
u
tn




 (4.16)
Nếu phương sai của 2 tổng thể không được biết trước và dung lượng mẫu đủ
lớn thì có thể thay một cách gần đúng phương sai tổng thể bằng phương sai mẫu, có
nghĩa là
2
1
2
1
s


2
2
2
2
s


Lúc này tiêu chuẩn phù hợp như sau:
2
2
2
1
2
1
21
n
s
n

s
xx
u
tn


 (4.17)
Nếu như

uu
tn
 tra ở bảng 2 phụ lục với mức ý nghĩa

thì giả thiết H
o

được chấp nhận nghĩa là hai trung bình của hai mẫu bằng nhau. Ngược lại nếu

uu
tn
 thì giả thiết bị bác bỏ nghĩa là hai trung bình của hai mẫu là khác nhau.
Thí dụ: Đo chiều cao cây cuối cùng của hai giống lúa mới có kết quả như sau:
Giống I: Đo n = 42 khóm có chiều cao trung bình 2,95
1
x cm
Độ lệch chuẩn về chiều cao là s
1
= 3,2 cm.
Giống II: Đo n = 40 khóm có chiều cao trung bình 5,98
2

x cm
Độ lệch chuẩn tương ứng s
2
= 3,4 cm.

46

Hỏi chiều cao của hai giống có khác nhau hay không với mức ý nghĩa
05
,
0



Vì hai dung lượng mẫu n
1
và n
2
lấy từ hai giống nghiên cứu và không biết
trước được hai phương sai tổng thể. Nên ta có thể dùng tiêu chuẩn u của phân phối
chuẩn để kiểm định.
Giả thiết H
o
:
21

 hay 0
21




Đối thiết H
1
;
21

 hay 0
21



Để kiểm định giả định giả thiết H
o
ta áp dụng biểu thức (4.17)
52,4
40
4,3
42
2,3
5,982,95
22
2
2
2
1
2
1
21








n
s
n
s
xx
u
tn

Với
05
,
0


, 96,1

u
Ở đây
05,0
uu
tn



96,152,4 

Nên ta bác bỏ giả thiết H
o
và chấp nhận đối thiết H
1
là giống khác nhau thì
chiều cao khác nhau rõ rệt.
2.2.Tiêu chuẩn t của phân phối Student
Tiêu chuẩn này được áp dụng trong trường hợp luật phân phối của hai tổng
thể mà đại diện là 2 mẫu có phân phối chuẩn và phương sai của hai tổng thể được
coi là bằng nhau. Nếu thỏa mãn hai điều kiện này thì có thể kiểm tra.
Giả thiết H
o
:
21

 hay 0
21



Đối thiết H
1
;
21

 hay 0
21


bằng tiêu chuẩn t của Student như sau:














2121
2
22
2
11
21
11
2
)1()1(
nnnn
snsn
xx
t
tn
(4.18)
Trong đó:
1

x và
2
x là trung bình của 2 mẫu.

2
1
s và
2
2
s là phương sai của mẫu 1 và mẫu 2.
n
1
và n
2
là dung lượng quan sát của 2 mẫu.
Thường trường hợp này được áp dụng khi n
1
và n
2
là không đủ lớn
n
1
< 30 và n
2
< 30 hoặc n
1
> 30 và n
2
< 30 hoặc n
2

> 30 và n
1
< 30
Nếu
)2,(
21


nntn
tt

tra bảng t với n
1
+ n
2
– 2 bậc tự do (phụ lục bảng 4) thì giả
thiết H
o
được chấp nhận, nghĩa là trung bình của hai mẫu bằng nhau (khác nhau
không ý nghĩa). Ngược lại nếu như
)2,(
21


nntn
tt

tra bảng với bậc tự do = n
1
+ n

2
- 2

47

thì giả thiết H
o
bị bác bỏ. Nghĩa là chấp nhận đối thuyết H
1
trung bình hai mẫu là
khác nhau tại mức ý nghĩa

.
Thí dụ:So sánh năng suất của hai giống cà chua vụ xuân hè
Giống số 6: theo dõi 16 điểm trên ruộng năng suất trung bình đạt 30,6 tấn/ha.
Độ lệch chuẩn về năng suất 4,5 tấn/ha.
Giống số 204 A theo dõi ở 19 địa điểm, năng suất bình quân đạt 27,0 tấn /ha.
Độ lệch chuẩn năng suất là 4,0 tấn/ha.
Biết rằng phân phối về năng suất của cà chua là phân phối chuẩn và phương
sai lý thuyết được coi là bằng nhau.
Hãy cho biết năng suất trung bình của hai giống trên có khác nhau hay không
ở mức ý nghĩa
05
,
0


và 0,01.
Vì hai tổng thể đã đáp ứng các điều kiện nêu ra nên có thể áp dụng tiêu
chuẩn t của phân phối Student để kiểm định giả thiết

Giả thiết H
o
:
21

 hay 0
21



Đối thiết H
1
:
21

 hay 0
21



Theo (4.18)















2121
2
22
2
11
21
11
2
)1()1(
nnnn
snsn
xx
t
tn

Thay vào được
064,2
19
1
16
1
21916
0,4).119(5,4).116(
0,276,30
22













tn
t
04,2
)33;05,0(
t , như vậy


33;05,0
tt
tn
 nên giả thiết H
o
bị bác bỏ và chấp nhận
H
1
với câu trả lời “hai giống cà chua nói trên có năng suất trung bình khác nhau”.
Với
01

,
0


thì 75,2
)33;01,0(
t
Vì 2,064 < 2,75 nên chấp nhận giả thiết H
o
có nghĩa là “hai giống cà chua nói
trên có năng suất trung bình bằng nhau” (khác nhau không có ý nghĩa).
Trong một số trường hợp thì áp dụng tiêu chuẩn t của Student để so sánh 2
mẫu độc lập, điều kiện về luật phân phối chuẩn của tổng thể được thỏa mãn, nhưng
2 phương sai của tổng thể không được biết trước.
Khi đó phải kiểm định bằng tiêu chuẩn F của Fisher về sự bằng nhau của hai
phương sai (sẽ nêu ở mục 5).

48

Nếu hai phương sai bằng nhau thì áp dụng kiểm định như biểu thức (4.18).
Nếu hai phương sai được coi là khác nhau thì biểu thức áp dụng cho tiêu
chuẩn t của Student như sau:
2
2
2
1
2
1
21
n

s
n
s
xx
t
tn


 (4.19)
Nhưng
tn
t sẽ được so sánh với giá trị t lý thuyết ở mức ý nghĩa

tính như sau:
2
2
2
1
2
1
2
2
2
)1,(
1
2
1
)1,(
*
2211

n
s
n
s
n
s
t
n
s
t
t
ndfndf



















(4.20)
Nếu như
*
tt
tn
 thì chấp nhận H
o
(hai trung bình là khác nhau không có ý nghĩa)
Nếu như
*
tt
tn
 bác bỏ giả thiết H
o
thì chấp nhận H
1
(hai trung bình là khác nhau)
Thí dụ:Phân tích hàm lượng đường tổng số (%) của hai giống cà chua vụ xuân hè.
- Giống MV1 phân tích ở 6 mẫu có hàm lượng đường tổng số đạt 3,09% và
phương sai về đường tổng số là 0,75%.
- Giống mới phân tích ở n
2
= 8 mẫu có giá trị trung bình của đường tổng số
đạt 2,79%. Phương sai có giá trị 0,10%.
Hãy cho biết hàm lượng đường tổng số của hai giống nêu trên có khác nhau
hay không? Cho hai phương sai là không bằng nhau với mức ý nghĩa
05
,
0



.
Do hai phương sai là không bằng nhau nên áp dụng biểu thức (4.19)

2
2
2
1
2
1
21
n
s
n
s
xx
t
tn


 thay số vào ta có 798,0
8
16,0
6
73,0
79,209,3





tn
t
Áp dụng biểu thức (4.20) tính
*
05,0
t như sau:

2
2
2
1
2
1
2
2
2
)1,(
1
2
1
)1,(
*
2211
n
s
n
s
n
s
t

n
s
t
t
ndfndf



















Thay số vào

49

54,2
8

10,0
6
75,0
8
10,0
36,2
6
75,0
75,2
*
05,0
















t
Như vậy,
*

tt
tn
 (0,798<2,54) nên chấp nhận giả thiết H
o
“hai giống cà chua
nói trên có hàm lượng đường tổng số bằng nhau”.
3. TRƯỜNG HỢP HAI MẪU THEO CẶP
3.1. Khái niệm về mẫu theo cặp
Thực tiễn nghiên cứu khoa học trong nông nghiệp cũng như sinh học nói
chung, ngoài những mẫu độc lập như đã nêu ở trên, nhà khoa học khi nghiên cứu
còn gặp một loạt các mẫu quan sát không độc lập mà lại có xếp theo cặp (đôi).
Thí dụ: khi đo chiều cao cây ta dùng hai loại thước đo để đo cùng một mẫu.
Hoặc xác định khối lượng 1000 hạt của mẫu bằng hai chiếc cân khác nhau. Hay hai
kỹ thuật viên A và B đếm khuẩn lạc của n hộp petri. Như vậy, các mẫu trên đều
được thực hiện 2 lần quan sát, kết quả được xác định theo cặp.
Những kết quả như vậy sẽ được kiểm định theo phương pháp cặp. Do vây,
người làm công tác thống kê sẽ vận dụng các tiêu chuẩn khác cho phù hợp.
3.2. Tiêu chuẩn t của Student (để kiểm định cho trường hợp hai mẫu theo cặp)
Giả thiết H
o
:
21

 hay 0
21



Đối thiết H
1

:
21

 hay 0
21



Tính các hiệu sai d
i
= y
i
– x
i
(hiệu của hai mẫu) sau đó tính độ lệch chuẩn của
hiệu sai theo biểu thức sau:
)1(
)(
2
2





nn
n
d
d
d

s
d
t
i
i
d
tn
(4.21)
với
n
d
d
i

 (4.22)
)1(
)(
2
2
2





n
n
d
d
s

i
i
d
(4.23)
Sai số chuẩn
n
s
s
d
d
 (Độ lệch chuẩn hiệu sai bình quân)

)1,( 

ntn
tt

chấp nhận H
o


50


)1,( 

ntn
tt

chấp nhận H

1

Thí dụ: Đo đường vanh của 18 cây cao su bằng hai loại thước khác nhau kết quả
được ghi lại trong bảng 1.4 .Vậy giữa hai loại thước đo có sự khác nhau rõ rệt hay
không ở độ tin cậy 95%.
Bảng 1.4. So sánh hai mẫu theo cặp bằng tiêu chuẩn t
TT x
i
của thước 1 y
i
của thước 2 d
i
= x
i
- y
i
d
i
2
1 29,7 29,0 0,7 0,49
2 34,9 34,5 0,4 0,16
3 37,0 37,5 - 0,5 0,25
4 28,5 28,0 0,5 0,25
5 26,9 26,5 0,4 0,16
6 27,0 27,1 - 0,1 0,01
7 28,7 28,5 0,2 0,04
8 31,2 31,0 0,2 0,04
9 31,5 31,0 0,5 0,25
10 33,7 33,5 0,2 0,04
11 34,0 33,7 0,3 0,09

12 35,9 36,0 - 0,1 0,01
13 41,2 41,5 - 0,3 0,09
14 29,5 29,0 0,5 0,25
15 30,7 30,5 0,2 0,04
16 33,5 33,7 - 0,2 0,04
17 36,2 36,0 0,2 0,04
18 37,5 37,5 0 0
Tổng

 1,3
i
d

 25,2
2
i
d
0749,0
)118(18
18
)1,3(
25,2
)1(
)(
2
2
2










nn
n
d
d
i
i
d
S


51

Thay số vào biểu thức (4.21)
30,2
0749,0
01722,0

tn
t
Tra bảng t của Student với
05
,
0



bậc tự do df = 17 ta được giá trị 11,2
)17;05,0(
t

)17;05,0(
tt
tn
 nên hai thước đo khác nhau thì kết quả trung bình khác nhau rõ rệt.

×