Tải bản đầy đủ (.pdf) (141 trang)

Phương pháp kiểm tra thống kê sinh học phần 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (21.99 MB, 141 trang )

CHƯƠNG IV

KIỂM TRA Sự PHÙ HỢP GIỮA
THỰC T Ế VÀ LÝ THUYẾT
Trong những phần trên của cuốn sách; một sô' phương pháp kiểm tra
thông kê sinh học cđ bản như xác định mức độ tin cậy cùa sò triing bình và
sự sai khác giữa các số trung bình mẫu với nhau, các phưđng pháp kiểm tra
t và bội số so sánh đã được giới thiệu một cách chi tiết. Song, những thí
nghiệm trong nghiên cứu sinh học rất đa dạng, đặc biệt trong di truyền và
chọn giông, những phướng pháp kiểm tra dó không thê ứng dụng được
trong lĩnh vực này. Thí dụ, nghiên cứu tỷ lệ sinh con trai hay COII gái, tỷ lộ
đực cái trong gia súc, nghiên cứu tỷ lệ đóng góp nguồn vật châ’t di truyền
của từng thành phần vào các tố hỢp lai, nghiên cứu tỷ lệ của những cặp
tính trạng trên các thế hệ lai đời 1, 2 hay 3, v.v, các phương pháp trên đây
không thế giải quyết được,
Những thí nghiệm mang tính châ"t nghiên cứu so sánh tý lộ X í i y ra
trong thực tê so vói tỷ lệ lý thuyết của một số quy luật sinh học rất phố biên
trong nghiên cứu công nghệ sinh học vừa nêu trên đòi hỏi phải có một
phương pháp thích hdp đế kiểm tra. Với những loại mô hình nghiên cứu
chuyên sâu vể những lĩnh vực ấy, bộ sô”liệu thu được từ các mô hình thí
nghiệm ấy có những đặc điểm khác nhau so với các bộ số liệu chúng ta đã
nghiên cứu trước. Đặc biệt sự khác biệt về tính chất và sự phân bố chuẩn,
nên các phương pháp kiếm tra đã trình bày trên như phương pháp kiểin tra
độ tin cậy và so sánh các số trung bình mẫu không đáp ứng cho việc kiểm
tra trong những mô hình thí nghiệm này. Do đặc điểm, tính chất khác
nhau nên sự phân bô”của bộ số liệu này không tuân thủ theo sự phân bô’
chuẩn, dòi hỏi phải có một phưđng pháp kiểm tra thích hỢp.
Phưđng pháp kiểm tra các thí nghiệm nhằm so sánh sự phù hợp giữa
tần suất thí nghiệm thực tế và lý thuyết của một quy luật sinh học là một
phương pháp hết sức cần thiết và quan trọng phục vụ đắc lực cho lĩnh vực
nghiên cứu sinh học cũng như di truyền và chọn giống. Vì vậy, chương IV


128


sẽ trình bày những phương pháp kiếrn tra thông ké sinh học riêng biệt đó.

Có rất nhiều phương pháp kiếm tra so sánh sự phù hỢp giữa tần suất
thi nghiệm thực tê và lý thuyết của một quy luật sinh học. Chương này giói
thiệu hai trong sô các phương pháp kiểm tra thống kê sinh học cơ bản và
thòng ciụng nhát áp dụng cho các tlií nghiệm nghiôn cứu sinh học vể sự phù
hợp giữa tần suất thực tế và lý thuyôL. Hai phương pháp đó là:
- phướng pháp kiểm tra “khi binh phương”, được ký hiệu bằng (x*);
- phương pháp kiểm tra G.

Những phương pháp kiểm tra thống kê sinh học và G đưỢc áp dụng
rộng rãi nhằm phục vụ cho phân tích, kiểm tra, xác định sự phù hợp giữa
tầu suất thực tiễn và lý thuyết. Trong lĩnh vực di truyền học và tạo giông
vật nuôi hay cây trồng, nhiêu thí nghiệm cần thiết phải được khảo sát sự
phù hợp giữa tần suất lý thuyết và thực tế thì những phương pháp kiểm tra
X"và G này thỏa mân đưỢc các yêu cầu đó.
Mục đích của những phương pháp kiểm tra và G này là làm căn cứ
khoa học để kiểm tra những kết quả thực tê của các thí nghiệm chúng ta
dang nghiên cứu liệu có tuán thủ theo các nguyên lý của các quy luật hay
những định luật trong sinh học không? Nếu kết quả kiểm tra cho thấy sự
phù hợp của tần suâ”t thực tiễn trong những thí nghiệm và lý thuyết thì sự
phù hợp đó ở mức độ nào?
Đê kiếm tra được sự phù hợp đó, phương pháp kiểm tra và G là hai
phương pháp kiếm tra thích hợp, thuận tiện, dễ làm và thông dụng nhất.
Vì vậy, trong phần này hai phương pháp kiểm tra x‘^và G sẽ được trình bày
một cách chi tiết về đặc điểm, nội dung và phương pháp phân tích tính toán
kiểm tra để bạn đọc có thể áp dụng nó một cách dễ dàng trong nghiên cứu

của nùnh.

A. PHƯƠNG PH Á P KIỂM TRA x'
I. Đ Ặ C Đ lỂ M , M ỤC Đ ÍC H VÀ NỘ I D U N G

Một trong những phương pháp phân tích kiểm tra thốhg kê sinh học
về sự phù hợp giữa tần suất thực tiễn thu được trong các thí nghiệiĩi và tần
suất lý thuyết thu được của các quy luật sinh học, di truyền học và hệ thống
lai tạo được áp dụng nhiều trong sinh học đặc biệt trong công tác di truyền
129


giống là phương pháp kiểm tra “khi bình phương” và dược ký liiệu bằng
ix^). Giả thuyết để thực hiện phương pháp kiểin tra "khi bình |jluíciiig" là
mẫu thí nghiệm phải được lấy một cách hoàn toàn ngầu nhiên từ quần thê
hoặc số liệu quan sát của thí nghiệm là sô liệu thu được thực tế iroiig các
thí nghiệm chứ không phải bắt nguồn từ bất cứ dẫn suất nào của các phép
tính toán. Đồng thòi, số liệu đó mang tính chất dộc lập. Liíii ý, sụ phán bò
của phương pháp kiểm tra X"là không đôi xứng.
Mục đích áp dụng phương pháp kiêm tra y- nhằm kiêm tra mức dộ
đồng nhâ"t, ngẫu nhiên, độc lập và quan trọiig nhâ"t ỉà sự phù hỢị) giữa tầỉi

suất thực tiễn thu được từ thí nghiệm so với tần suất lý thuyết tínli được từ
các quy luật sinh học. Thí dụ, kiểm tra tỷ lệ giữa con trai và COII gái lại niộl
cơ sở nào đó có đúng là 50% không? Hoặc kiểm tra sự phân tính kiêu hình
có phù hỢp với một tỷ lệ lý thuyết nhât định của một tính trạng Iiào đó ơ
thê hệ lai thứ hai (F2 ) có tuân theo tỷ lệ 3:1 hoặc hai tính trạng độc lập
nhau ỏ thê hệ lai thứ hai (P^) liệu có đúng với tỷ lệ 9:3:3:1 khôiig vì đó là
định luật phân tính, một trong những quy luật cơ bản nhất của di truyền
thường gặp trong công tác tạo giông vật nuôi hay cây trồng.

Tóm lại, phương pháp kiểm tra X" là một trong những phưcỉng pháp
kiểm tra thống kê sinh học quan trọng, đóng góp rất nhiều cho lĩnh vực
nghiên cứu di truyền học, về phân tích kiểm tra mức độ đồng nhất, ngẫu
nhiên, độc lập và quan trọng trong việc kiểm tra sự phù hợp giữa tần suất
thực tiễn của bộ sô* liệu thu được so với tần suâ”t lý thuyết clược xác định
theo các quy luật sinh học. Muốn thực hiện phương pháp kiếm tra thống kê
sinh học
tnang lại kết quả chuẩn xác, cần phải tiến hành nghiên cứu
khảo sát một cách kỷ lưỡng những khái niệm, nội dung cơ bản sau;
1. Tần suất lý thuyết
Tồn su ất ỉý th u yết là giá trị tính toán được dựa theo một (Ịuy lUíật lý

thuyết nào đó mà quy luật đó đă được khẳng định thành một quy luật sinh
học, một định luật như tỷ lệ đực và cái là 50:50% hay sự phâii ly độc lập
của hai cặp tính trạng ở thế hệ lai thứ hai (Ka) là 9:3:3:1. Tần suất lý thuyết
đưỢc xác định bằng khả năng trong lý thuyết xảy ra nhân với dung lượng
mẫu lý thuyết.
2. Tần suất thực tiễn
Tần suất thực tiễn là sô' liệu thực thu được trong thực tế, có thể rút ra
từ một quần thể hay thu được từ một thí nghiệm. Tần suất thực tiễn được
xác định bằng kết quả thu được trong thực tê của thí nghiệm; thí dụ, tần
130


suất thực; tiễn sô bé nam trong tổng 1000 bé sinh ra tại quận Ba Đình,
thành phô Hà Nội trong tháng õ năm 2001 là õí)l bé. Từ tần suâ't thực tiễn
dó, suy ra tý lệ thực tiễn giữa con trai và con gái của bộ số liệu trên ià

3. T ín h g iá tr ị


Giá trị y-dược tính theo công thức sau:

trong đó:
- £ là tông cộng tâ*t cả các giá trị, tỷ lệ;
- t là tầii suất thực tiễn thu được từ niột quần thế hay của một thí
nghiệm;
- 1 là tần suất lý thuyết được tính theo một quy luật sinh học hay một
định luật nào đó.
4. Tra cứu xác định giá trị

tại bảng

Giá trị được xác định tại bảng phân bố X' với các độ tự do tương ứng
của các mức độ xác suất tương ứng. Trong các thí nghiệm sinh học, ba mức
độ xác suất thưòng được sử dụng là: p=0,05; P=0,01 và p=0,001.
5. So sánh giá trị

tính đưỢc của thi nghiệm

v ớ i X* tr a c ứ u c ủ a b ả n g

Khi so sánh giá trị tính được từ thí nghiệm và giá trị
bảiig cho sẫn, có thể rút ra kết luận, nếu:


tính được từ thí nghiệm (x'tn)

tra cứu từ

cứu đưỢc của bảng ỏ một


niửc dộ tin cậy nhát định, thí dụ ở mức p=0,05 tức là p (x\n) ^ 0.05 thì kết
luận lằng tần suất lý thuyết và thực tế phù hỢp nhau với độ tin cậy 95%.
• X' tính đưỢc từ th í nghiệm (x \n ) > X" tra cứu tại bảng ồ mức tin cậy

p=0,0õ tức là p (x^tn) 0*05 thì kết luận tầìì suất lý thuyết và thực tế không
phù hỢp nhau vối độ tin cậy 95%.
Tóm lại, thực hiện phưđng pháp kiểm tra thống kê sinh học là kiểm
tra giá thuyết không (H,j) “có sự phù hợp giữa tần suất thực tế và lý thuyết”
liệu giá thuyết không có được chấp nhận hay không. Nếu:

131


1. Giả thuyết không (Ho) được châ'p thuận thì có sự phù hỢp giQa tần
suất thực tiễn với lý thuyết.
2. Giả thuyết không (H(,) không được chấp thuận thì có sự khác nhau
giữa hai giá trị lý thuyết và thực tê và rút ra kết luận tần suíVt thực tê
không phù hđp với lý thuyết.
Tương tự, cũng tính và biện luận cho các mức độ tin cậy khác nhau
như p= 0,01 và p= 0,001.
II. S Ử D Ụ N G P H Ư Ơ N G P H Á P K IỂ M t r a

f KHI NÀO?

Nhiều thí nghiệm đòi hỏi phải khảo sát, kiểm tra so sánh giữa các tần
suất lý thuyết vối các tần suâ*t thu được trong thực tế. Mục đích sử dụng
phưđng pháp này là để khẳng định những giông vật nuôi hay cây trồng tại
một địa điểm nhất định nào đó của một thí nghiệm vê một số cặp tính
trạng nào đó có tuân thủ theo những nguyên lý lý thuyết hay những định

luật sinh học nào đó không và nếu có thì ở inức dộ tin cậy nào. Vì vậy,
phưđng pháp kiềm tra "khi binh phương" được áp dụng khi:
1. Khảo sát một thí nghiệm dựa theo quy luật sinh học
Một trong những quy luật sinh học mà mọi ngưòi thường gặp trong
cuộc sông của con người là tỷ lệ sinh con trai và con gái cũng như tỷ lệ giữa
đực và cái của gia súc là 50:50%. Vì vậy, có thề’ dùng phưdng pháp kiểm tra
này để kiểm tra tỷ lệ giữa đực và cái của một quần thề hay một thí
nghiệm của một giốhg gia súc, gia cầm nào đó liệu chúng có tuân thủ theo
quy luật sinh học tỷ lệ giữa đực và cái 50:50% hay không? Kiểm tra loại thí
nghiệm này thì duy nhâ't là sử dụng phương'pháp kiểm tra X‘2. Khảo sát một thí nghiêm dựa theo định luật di truyền học
ứng dụng các định luật đồng tính và phân tính của di truyền học
Mendel rút ra từ nghiên cứu trên cây đậu Hà Lan vào những thí nghiệm
sinh học là những thí dụ điển hình để minh họa việc sử dụng phương pháp
kiểm tra thốhg kê sinh học nhằm kiểm tra sự phù hợp giữa tỷ lệ thực
tiễn của những thí nghiệm so vói tỷ lệ lý thuyết của các định luật di truyền
đó. Thí dụ, kiểm tra khảo sát sự đồng nhất ỏ thế hệ lai thứ nhât (F|) hoặc
tỷ lệ phân ly độc lập ỏ thế hệ lai thứ hai (Pa) đối vỏi một sô' cặp tính trạng

nào đó dựa theo các định luật di truyền đã nêu trên. Hay là khảo sát kiểm
tra tỷ lệ phân ly độc lập ỏ thế hệ lai F, đôì với hai cặp tính trạng nào đó của
132


một giông gia súc hay cây trồng có tuân th<‘0 lý lệ 9:3:3; 1 không?
3. Kicm tra một thí nghiêm dựa theo khả năng
hoặc bản chất sinh học
"rrong lĩnh lực sinh học, khá nàng ho.ậc bán chất sinh học của một sinh
vật nào dỏ thưòng là cô" định. Troiig thực tế, eó thô sử dụng phương pháp
kiểm tra thông kô sinh học y - đê kiếm tra Iiiột khá năng hoặc một đặc điểm
bán chất sinh học của một cđ thô sinh vật nào dó là tốt nhâ”t. Thí dụ, kiểm

tra sự đồng đều về thòi gian mà một giông gia súc hay cây trồng bị nhiễm
một Ccăn bệnh, hay là sự đồng đêu trẻ om sinh la trong một khoảng thòi

gian nhỉít dịnh của một ngày.

III.

C Á C P H Ư Ơ N G P H Á P K IỂ M T R A f

Đê kiểm tra được những kết quá các thí nghiệm sinh học đang được
nghiêỉi cứu trong thực tê có tuân theo các quy luật hoặc định luật sinh học
như các quy luật di truyền học, khả nàng mẫn cảin bệnh hay một đặc điểm
sinh học, thì phương pháp kiểm tra thống kê sinh học
là một trong
những phương pháp hđp lý và hiệu quả nhất. Phưđng pháp kiểm tra x’
đưỢc áp dụng râ't rộng rãi và linh hoạt đổì vổi các thí nghiệm nghiên cứu về
lĩiih vực di truyền học và nó phụ thuộc nhiều vào sô'yếu tố thí nghiệm.
Đề giúp cho bạn đọc áp dụng, thực hiện được phưđng pháp kiểm tra
thông kê sinh học X“' niột cách hợp lý và thuận tiện, chúng tôi sẽ trình bày
cụ thề phưđng pháp kiểm tra X' l iêng biệt theo từng kiểu câ'u trúc và yêu

cầu của mỗi loại thí nghiệm. Phướng pháp kiổin tra
theo sô yếu tô thí nghiệm;

được phân loại ra

- thí nghiệm chỉ có một yếu tô’;
- thí nghiệm có hai yếu tô’ dược phân ra hai hưóng khác nhau.
1. Thi nghiệm chỉ có một yếu tố
Phương pháp kiểm tra thống kè sinh học x’ tlược áp dụng một cách

rộng rãi trong các thí nghiệm, đặc biệt trong, các dạng sau:
- kiểm tra các thí nghiệm dựa vào định luật di ti’uyển học;
- kiểm tra các thí nghiệm dựa vào phân bố tần suất theo thời gian.

1 33


1.1. Dạng 1. Kiểm tra thi nghiệm dựa theo định luật
di truyền học
a.

Kiểm tra th í nghiệm dựa theo định luật đồng tính của F ị

Định luật đồng tính của thê hệ lai thứ nhâ”t (F|) là một trong những
định luật di truyền cđ bản nhất, là nền móng của lĩnh vực di truyền học
được Mendel phát hiện ra từ thế kỷ thứ XIX do quá trình thực hiện phép
lai các cặp bô" mẹ thuần chủng có một cặp tính trạng đổi nhau dã thu được
tất cả các cá thể lai ở đời thứ nhâ't đểu đồng tính (tính đồng loạt giông Iihau
hoàn toàn) hoặc của bô”hoặc của mẹ. Thí dụ sau dây sẽ minh hoạ phương
pháp kiểm tra thống kê sinh học X' về định luật đó.
Thí dụ 4.1. Tại một thí nghiệm “lai giữa lợn Pietrain (niàu đen) với
lợn Đại Bạch (màu trắng) tổ chức tại Đông Anh, Hà Nội, thu được ỏ đòi con
100 000 con, trong sô" đó có 20 con màu trắng và 99980 con niàu đen”. Hãy
kiểm tra xem liệu tính trạng màu sắc của hai giôVig lợn dó có tuân theo
định luật đồng tính ở con lai F, không?
Cách giải bài toán

Như ta đã biết, màu đen của lợn biểu thị tính trội, màu trắng là lặn,
hai giông Pi và ĐB đều là thuần chủng và gen biểu thị màu sắc là đơn gen.
Giả thuyết không (Ho); tỷ lệ lợn màu đen ở đời thứ nhất là 100%

Giả thuyết kháng không (Hj): tỷ lệ Iđn màu đen ỏ đòi thứ nhất không
là 100%.
Để tính được x^. trưổc hết hãy xác định tần suất lý thuyết về màu sắc
của mỗi nhóm lợn. Theo tỷ lệ lý thuyết, tính tần suất lý thuyết như sau:
- sô lợn màu đen là 100/100 X 100 000 = 100 000;

- sô lợn màu trắng là 0/100 X 100 000 = p
Vậy, giá trị

thí nghiệm được tính theo công thức sau:
2 _ (99980 -100000) 2
Xt
100000

(20 - 0)
0,0

= 20Vl00000
= 0,004
Tra cứu tìm giá trị tại bảng phân bô' vối DF = 1, đó chính là giá trị
Xi^lý thuyết và giá trị đó là:

134


Kết luận
S o s á n h s ự s a i k h á c g i ữ a liai giá trị
liơii ti a o ử u t ạ i b ả n g XbaiiK"

giá Irị tiiự c t i ễ n Xt" là 0 , 0 0 4 n h ỏ


sự .sai kh;'ic tíiữa c h ú n g k h ô n g có ý

Ii g h ì a rõ r ệ t . V ậ y , với bộ sô liệ u vỏ n ià u sắc c ú a lợn ỏ t h ế h ệ lai t h ứ n h â ”t

giũa thực tế và lý thuyết không chênh lệch .nên giá thuyết không (H,)) trên
đây đưỢc châ"p nhận. Điều đó có nghĩa là tv lộ thực tiền rất phù hdp vối tỷ
lộ lý tlìuyêt, gần như 100% lợn con Fj có màu don.
Lưu ý, trong sô 100 000 lợn F| có 20 con l)icu thị màu trắng là nằm
ìigoài quy ỉuật đồng tính của di tiuvêii học. Hiện tượng này có thế giải
thích do có sự không thật thuần nhất, lấn át gen, uội không hoàn toàn hay
dột biên gen gây ra.

b.Kiểm tra th í nghiệm dựa vào định luật phản tinh một cặp tính trạng
ỞF,

t)ịnh luật phân tính của một cặp lính nạng ó ihế hệ lai thứ hai (F.)) là
3:1 cĩuig là một trong những định luật di tiuyen cơ bán nh ất đưỢc M endel

phát liiệii ra từ thế kỷ thứ XIX. Kết quá do thực hiện các cặp lai của bố mẹ
thuáii chủng thu đưỢc ỏ đòi thứ hai của một cã|) tính trạng đổi nhau là tỷ lệ

kiou hình trội so với lặn của tất cả các cá thế lai đòi thứ hai biểu hiện 3:1.
Thí dụ sau dây sẽ minh họa phưđng pháp và kêt quả kiêm tra về sự phù
hợp giữa tý lộ thực tiễn với lý thuyêt.
Thí dụ 4.2. Tại một thí nghiệm "nghiên cứu vê khả năng kháng căn
bệnh A do bản châ't di truyền gáy ra: tổng dàii lợii thí nghiệm có 40 con,
liong dó 26 lợn có khả nâng kháng được bệnh và 14 lợn bị nhiễm”. Hãy
kióni tra bộ số liệu thu được trong thực tê thí Iiglúệni đó có phù .hợp vói tỷ
lệ lý thuyết 3:1 không?

Cách giãi đê kiêm tra định luật phán tính của F.J đốì với một cặp tính
tr ạ n ịĩ

Dô tính cỉược giá trị X". trước hết liãy xác định tần suất lý thuyết của
Iiiỗi Iihóin lỢn. Theo tỷ lệ lý thuyết ;ỉ:l thì tầii suiVt lý thuyết sẽ được tính
Iihư sau;
- sô lợn kháng bệnh là 3/4 X 40 = 3(>;

- sô’lợn bị nhiễm bệnh là 1/4 X 10 = 10
Vậy, giá trị Xt" đưỢc tính theo côiìg thức sau;
_

(26-30)'“ (14-10)"^3(
2,13
135


Tra cứu xác định giá trị Xi^ tại b ản g với DF = 1, thu được kết q u ả Xbanị,"
= 3 ,8 4

Nhận xét
So sán h giá trị x^giữa thực tiễn và lý th u yết cho thấy: Xi' (2,13) <

(3,84) cho phép kết luận sự sai khác giữa chúng không có ý nghĩa rỡ rệt.
Vậy, với sô' liệu giữa thực tế và lý thuyết không chênh lệch đáng kê nêai giả
thuyết trên được chấp nhận có nghĩa là tỷ lệ thực tiễn phù hỢp với -.ỷ lệ lý

thuyết, đó là tỷ lệ 3:1.
Cần lưu ý rằng, với số liệu trên có thể áp dụng phép thử nhị th '£c như
đã trình bày ở phần trên. Theo giả thuyết không (Ho) thì p = 3/4 = 0,75. Giả

sử, ngưòi có khả năng kháng bệnh là thuộc nhân tố may mắn thàr.h công
thì Pmaymản = 26/40 = 0,65. Như vậy, giá trị Z‘được tính theo công thử( S;au:

2 _

^may mán "Plý thuyết

pq/n
0,65-0,75
(0,75x0,25)/40
= -1,46

Rõ ràng, kết quả của hai phương pháp kiểm tra trên đây hoàn toàn
giốhg nhau. Cụ thể:
Z2 = (-1,46)'^
= 2 ,1 3

Kết luận
Giá trị kiểm tra tính toán theo nhị thức này hoàn toàn phù hcp hoặc
bằng giá trị tính theo phương pháp kiểm tra = 2,13.
c. Kiểm tra th í nghiệm theo định lu ật phân ly độc lập của hai cáp
trạng ở F.2

tính

Định luật phần ly độc lập của hai cặp tính trạng ở thế hệ thứ hai (Pa)
là 9:3:3:1 cũng là một trong những định luật di truyền cơ bản được Mendel
xây dựng từ thế kỷ thứ XIX. Kết qủả thu được do thực hiện phép lai của bố
mẹ thuần chủng thu được ỏ đòi lai thứ hai của hai cặp tính trạng đcì nhau
lặ tỷ lệ kiểu hình của tất cả các cá thể lai đòi thứ hai biểu hiện tỷ lệ ):3:3;1.

L}Ịu ý, hai cặp tính trạng này phải độc lập với nhau, trội hoàn toàn, không
xảy ra đột biến và không có liên kết gen vôi nhau. Nếu tách riêng tùng cặp
136


tínli trạng thì cả hai tính trạng



dồu biổu thị tv lệ 3:1 ỏ đời lai thứ hai

này. Thí dụ sau đây sẽ minh họa phưđng pháp kiôni tra thông kê sinh học
X' vồ

Hự

phù hđp giữa tỷ lệ thực tiễn !ighiôn cứu so với lý th u yết của định

luật.

Thí dụ 4.3. Một trong sỏ n h ữ n g

thí

nghiệm nghiên cứu về quy luật di

truyền thực hiện trên cây đậu Hà l.an với kết quá sô’ hạt đậu đã thu được ỏ
thê hệ lai thứ hai khi nghiên cứu hai 0<ậỊ) tính Irạng, gồm bô"n loại hình vè

độ nhẫn và màu sắc hạt khác nhau đưỢc trình bày tại bảng 4.1. Dựa theo

dịnh luật di truyền học “phân ly dộc lập của hai tính trạng ỏ thê hệ lai thứ
hai oủa Mendel”, hãy phân tích kiêin tra bộ số liệu trên liệu thu được liệu
tỷ lệ thực tiễn thí nghiệm đó có tuân theo lý thuyết phân ly độc lập ở thê hệ
lai thứ hai theo tỷ lệ 9:3:3:1 không?
Bảng 4.1. Hình dạng và màu sắc của hạt đậu Hà Lan
Loai hình

S ố hat thu đươc

Trơn và Vàng(T và V)

315

Nhăn và Vàng (N và V)

101

Trơn và Xanh(T và X)

108

Nhãn và Xanh (N và X)

32

Các bước tính toán cụ th ế

Giả thuyết không (Ho); Sô liệu hạt đậu thu được trong thực tê của bôVi
loại hình trên tuân theo quy luật 9:3:3:1, có nghla là chúng biểu hiện theo
đúng tỷ lệ 9/16, 3/16, 3/16 và 1/16 tương ứng vổi các loại hình trên.

Giả thuyết kháng không (H,): Số liệu thực tế thu được không tuân thủ
theo tỷ lệ lý thuyết trên. Các bước phân tích, tính toán được tiến hành cụ
thể như sau:
Xác định tần suât mong dời
Giá trị tần suâ't m ong đợi (K) clnỢc xác định tlieo cônh thức sau đây:
E = np

trong dó:
- 11 là tống sô hạt thu được;
- p là tỷ lệ của từng loại hạt phân theo, hình dạng vể độ nhẵn và màu
sắc hạt đã thu được.

Tần suâ"t mong đợi vê tỷ lộ thuộc hai cặp tính trạng màu và dạng hạt
đưỢc trình bày ỏ bảng 4.2.
137


B á n g 4.2. T ầ n s u ấ t m o n g đ ợ i v é tỷ lệ m à u v à d ạ n g h ạ t
Loại

hinh

Số hạt E

T vả V

N và V

T và X


N và X

9/16(556)

9/16(556)

9/16(556)

9/16(556)

= 312.8

= 104,2

= 104,2

= 34,8

ghi chú:
♦ S ố h ạ t E là s ố h ạ t m o n g đ ợ i đ ư ợ c tín h t h e o lý t h u y ế t

nên còn gọi số hạt lý thuyết:
- T là biểu thị dạng hạt trơn;
- N là biểu thị dạng hạt nhàn:
- V ià b iể u th ị m à u v à n g c ủ a h ạ t;
- X là b iể u th ị m à u x a n h c ủ a h ạ t.

Lập bảng tần suất lỷ thuyết (l) và thực tế(t)y độ lệch giữa chúng
Báng 4.3.


T ầ n s u ấ t lý t h u y ế t , th ự c t ế v à đ ộ lệ c h g iữ a c h ú n g

Loại hinh

T và V

N và V

TvàX

N v àX

V

Số hạt t

315

101

108

32

556

S ố hạt 1

312,8


104.2

104,2

34.8

556

Hiệu (t-ỉ)

2,2

*3,2

3.8

■2.8

0

ghi chủ:
- 1là tần suất iỷ thuyết;
- 1 lả tần suất thực tiễn;
-

t-l là độ lệch giữa tấn suất thực tiền và lý thuyết

Tính giá trị
, ^


2.2^

-3.2^

33^

-2 ,8 -

312,8 ^ 104,2^ 104,2 ^ ' 3 4 /
= 0,477
Tính độ tự do (DF)

DF = n - 1
= 4 -1
=3
Tra cứu tại bảng ^ và so sánh với ^ thực tiễn

Vối DF = 3, mức tin cậy p = 0,05 thì Xb,inti' =
Như vậy, giá trị thực tiễn
138

(0,477) nhỏ hơn giá trị tra cứu tại bảng


Ximii-"

v ậ y t ầ n s u â t c ủ a bộ sỏ liộ u tliu
khác so với sô' liệu tính toán lý thuyết nôii f?ia thuyết không (H,|) đưỢc chấp
thuận, có nghĩa là không có sự Sfú khác giữa lầỉi suất lý thuyết và thực

liỗn.
Xác định giá trị p

p=
Kết luận

Vổi bộ sô’ liệu về hình dạng dộ nhăn và niàu sắc của hạt đậu Hà Lan
thu dược troiìg thí nghiệm đó của Mendel, p = Pr(xi)ị.=:Ị^>0,477), nên giả
thuyêt không ỏ trên được chấp nhận. Có thể nói inột cách khác, số liệu thu

dưực từ thí nghiệm của bôn loại hạt đậu về ỉììiìh dạng và màu sắc ỏ trên
hoàn toàn tuân theo định luật phán ly độc lập di truyền là 9:3:3:1.
1.2. Dane 2. Kiểm tra sự phán bố tần suất theo thời gian
a. Đặc điểm chung
Dạng thí nghiệm nghiên cứu về sự đồng nhất trong phân bô' tần suất
tlìoo đơn vị thòi gian của một yếu tô nào đó cũng phố biến trong lĩnh vực
sinh học và trong cuộc sống. Vì vậy, phương pháp phân tích kiếm tra thôVig
kê sinh học về mức độ đồng nhâ*t của các thí nghiệm được trình bày nhằm
giúp bạn đọc áp dụng đê kiểm tra các thí nghiệm loại hình đó của mình.
Thí dụ sau đây sẽ minh họa phương pháp kiểni tra dó.
b. Thi dụ và phân tích tính toán cụ thê
Thí dụ 4.4. Sô" liệu 32 224 trẻ em sinh ra ở ihành phô" Hà Nội trong
ngày 1/6/2001 và được trình bày trên báng 4.4 với khoảng cách thời gian ba
giò. Hãy xác định tần suất trẻ em sinh ra có phân bô* đểu theo các khoảng
thòi gian trong ngày không?
Bảng 4.4. S ố trẻ sinh ngày 1/6/2001 tại thành phố Hà Nội
Sinh ra trong thòi gian (giờ)

rắn suât quan sát


T ỳlệ(% )

4064

1 2 ,6

0 3 ,0 1 • 0 6 , 0 0

4267

1 4 ,4

0 6 01 - 0 9 0 0

4488

139

0 9 ,0 1 - 1 2 ,0 0

43 5 1

136

1 2 0 1 - 1 6 00

3262

1 0 .1


1 5 .0 1 - 1 8 ,0 0

3630

1 1 .3

1 8 ,0 1 -2 1 ,0 0

•3577

11.1

2 1 ,0 1 -2 4 ,0 0

4225

1 3 .1

32224

10 0 ,0

T ừ 0 ,0 0

Tổng

đ ế n 3 ,0 0

139



Giả thuyết không (Ho): sô' lượng trẻ em sinh ra bàng nhan trong tám
khoảng cách thòi gian tương ứng trong ngày (mỗi khoảng thời giani là 3
giờ).
Giả thuyết kháng không (H|): chúng không sinh ra đều nhau trong
táin khoảng cách thòi gian tương ứng trên. Các bước phân tích và tíinh cụ
thể như sau:
Xác định tần suất mong đợi

Tần suất mong đới (E) được xác định theo công thức sau:
E = np
trong đó:
- n là tổng số trẻ em sinh ra trong ngày;
- p là tỷ lệ trẻ em sinh ra trong mỗi khoảng cách thời gian thu được.
Vậy, tần suất mong đợi sẽ được xác định theo công thức sau:
E = 32224 X 1/8
= 4028,0
Lập bảng tần suất lý thuyết và thực tiễn
Bảng 4.5. Tần suất thực tiễn và độ lệch glCtì thực tiễn và lý thuyết
Sinh trong thời gian (gid)

Tẩn suất t

(t-l)'/l

TỪO.OO đến 3,00

4064

1296


0,32

03.01 - 06.00

4267

57121

14.18

06.01 - 09 00

4488

211600

5253

09 01 - 1 2 00

4351

104329

25.90

12.01 -1 5 ,0 0

3262


586756

145,67

15.01 -1 8 ,0 0

3630

158404

39,33

1 8 ,0 1 -2 1 ,0 0

3577

203401

50,50

21 01 - 2 4 00

4225

38809

9,63

32224


Tổng

Tính giá trị ^ th í nghiệm:

xi^ ~ 338,06

Tính độ tự do (DF)

DF = 8 -1
=7
Tra bảng và so sánh giữa hai giá trị
140

(t-lf

338,06


M.O"
' {.'i^H.oe) lớn hơnXbiinK" ( H . o ? ) liên sự sai k h á c g i ữ a c h ú n g có ý n g h ĩ a

I'ât rù rệt .
Kết luận

vỏi sô’ lượiig tre em sinh ra giữa thực lố so với tỷ lệ lý thuyết quá
chứnli lệch nên giá thuyết không ở trên khóng được châ"p nhận. Nói một
cách khác, sô liệu thu được từ thực tế không tuân theo lý thuyết có nghĩa là
trẻ em sinh ra không đồng đều trong tám khoáng thòi gian trong ngày.
2. Thí nghiệm có hai yếu tố

Thí nghiệm có hai vếu tô’ nghiên cứu vê sự phù hợp giữa các tỷ lệ thực
tiễn và lý thuyết khá phổ biến trong lĩtih vực sinh học, Có râ"t nhiều phương
plìáp kiểm tra thôVig kê sinh học c h o các trường hỢp khác nhau, ở đây trình
bày phương pháp kiếm tra cho tiưòng hợp chung ỉihât của mô hình thí
nghiệm này.
2.1. T rư ờn g hỢp ch u n g
Thi dụ 4.5. Kết quả của mộl thí nghiệm dùng ba loại huyết thanh
kháng vi trùng uô"n ván của bò, ngựa và cừu. Với 498 người được đưa vào
thí nghiệm hoàn toàn ngẫu nhiên và thu được kết quả như ở bảng 4.6. Hây
sử dụng phương pháp kiểm tra thống kê sinh học X" để xét xem liệu các
ph;in ứng giữa các loại huyết thanh trên có khác nhau không?.
B ả n g 4.6. Kết quả phản ứ n g của ba loại huyết thanh

Huyết thanh

S ố ngưài

Số nguời có phản ứng

Tỷ lệ phản ứng (%)



205

25

1 2 ,2

Ngưa


148

42

2 8 ,4

CỪU

145

17

1 1 .7

Giá thuyết không (Ho); khả năng phản ứng của ba loại huyêt thanh
như nhau.
Ciiá thuyết kháng không (H|): kh;i Iiăng Ị)hản ứng của ba loại huyêt
thanh khác nhau.
Đầu tiên, lập bảng phân chia theo hai chiều: một chiều mô tả phản
ứng có hoặc không và chiều kia niô tả các loại huyết thanh sử dụng: bò,
ngựa và cừu (bảng 4.7).
141


Bầng 4.7. Tổng họp giCfâ phản ứng với loại huyết thanh
Phàn ứng

Huyết thanh


I

C6

Không

180

X



25

205

Ngira

42

106

148

CiAi

17

128


145

84

414

498

Giả thuyết nêu lên rằng khả náng một ngưòi ỏ trong cột dọc sô 1 của
bảng không bị ảnh hưỏng bỏi bâ't cứ hàng nào. Như vậy có nghĩa là giữa cột
và hàng là hoàn toàn độc lập với nhau. Do chúng độc lập với nhau nê!i có
thề áp dụng với quy tắc tích để tính các khả năng của chúng như sau:
- khả năng (Pr) của người trong hàng 1 sẽ được tính = 205/498;
- khả năng của người trong hàng 2 sẽ được tính = 148/498;
- khả năng của người trong hàng 3 sẽ được tính = 145/498;
- khả năng của ngưòi trong cột 1 sẽ được tính = 84/498;
- khả năng của ngưòi trong cột 2 sẽ được tính = 414/498.
Nếu Ho là thực, có nghĩa Ho được chấp thuận thì:
- Pr của ngưòi trong cột sô' 1 và hàng thứ nhất sẽ được tính bằng công
thức sau:
Pr = 205/498 X84/498
T ần su ấ t m ong đợi của ngưòi trong cột số 1 và hàn g thứ nhất sẽ được

tính bằng công thức sau:
^ _ 205 , 84
E --------------- X
X 498
498 498
_ 205x84
498

= 34,6
Tần suầ"t mong đợi tổng thể sẽ được tính bằng công thức:
„ _ Tổng của hàng X Tổng của cột
“ ~ ------- ;------------- :— 7--------Tông của các tông
Tương tự, tính kết quả của các giá trị lý thuyết của các hàng và các cột
được trình bày ồ bảng 4.8.
142


Bảng 4.8. Kết quà vế các giá tri lý thuyết hnng vá cột
Phàn ứng
H u y ế t th a n h





Không



3 4 .6

1 7 0 ,4

2 0 5 ,0

N gưa

2 5 ,0


1 2 3 ,0

1 4 8 ,0

Cừu

2 4 .5

1 2 0 ,5

1 4 5 ,0

1

84 ,1

4 1 3 .9

4 9 8 ,0

Nếu làm tròn số (không lấy số thập phân vì cơ thề sinh vật không thể
là sô’ t h ậ p Ị)h â n ) t h ì k ế t q u ả ớ b ả n g giá trị nioiig dỢi ỏ đ â y giôVig n h ư g iá t r ị

thu đưỢc trong thực tế.
Giá trị X" chính là một trong những sô do mức phán tán giữa tần suất
thực tiễn và tần suất lý thuyết (hay oòn gọi là laii suất mong đợi) khi giả
thiêt không đưỢc công nhận là thực.
. ỵ - y (2 5 -3 4, 6) ^


(42^25.0)^

34,6

2 d ,(ỉ

(17-24.5)-

(1 80- 170 ,4) ^

+

( 1 0 6 - 1 2 3 , 0 ) ( 1 2 8 -120,0) 123.0

120,5

= 19,92

Xác định DF bằng cách lấy sô hàng (r) -1 nhân với số cột (c) - 1. Vậy,
gicá trị được xác định theo cônh thức: DF = (r • l)(c - 1). Tại thí nghiệm này
dộ tự do df=(3-l)(2-l) = 2
Tra cứu xác định giá trị X'
Í‘= 0 , 1 % thì

X h :m g '

bầng với DF = 2. Vói mức độ tin cậy

=13,82. Vậy, X,' > Xì,..iik' nên giá thuyết trên không được


chấp nhận (P<0,001), có nghla giữa số liệu lý ihuyốt và sô'liệu thực tế hoàn
toàn khác nhau hay sô liệu thực tê không tuân theo quy luật của lý thuyết.
H uyết thanh ngựe'\ có thể dùng dể sáìi xuất (tưực mức dộ kháng thể có lợi.
2.2. T rư ờng hơp bô sô liêu quá nhỏ
a.

Khái niệm

Điều kiện đế những bộ sô’ liệu dược coi là quá nhỏ nếu chúng có đầy đủ
hai đặc điểm cơ bản sau:
- chỉ có một giá trị mong đợi nhỏ hơn 5;
- không có giá trị mong đợi nào nhổ hơn 1.
Nguyên nhân của phương pháp kiêm tra X" không được phép dùng cho
các bộ số liệu quá nhỏ là vì giá trị 7 ,- chỉ tuân theo sự phân bô" một cách
143


tương đôi do quá trình thực hiện bình phương giá trị X" nếu giả thuyết của
phưdng pháp kiểm tra là thực. Do sự tương đôì đó dẫn đến có thê làm oho
không thoả mãn vối những giá trị mong đợi là quá nhỏ bé. Hãy xét thí dụ
sau để làm rõ vâVi để đó.
Thí dụ 4.6. Hãy kiếm tra mức độ đồng đểu về ảnh hưởng của h ai 3êu
tố: tắm nắng và không tắm nắng đôì vói tổng sô' 30 rắn hổ chúa có chửa
hoặc không có chửa của một thí nghiệm đưỢc tồ chức tại Trung tâm y tế
q u ố c t ê ( r ắ n được c h ọ n v à o t h í n g h i ệ m h o à n t o à n n g ẫ u n h i ê n ) . K ô t q u ả đ ó
được trình bày ở bảng phân tích tồng hợp phức cách hai chiều: một chiều là
ảnh hưởng của tắm nắng: có và không tắm nắng và chiều kia là những con
rắn có chửa và không có chửa (bảng 4.9).
Bảng 4.9. Tổng hớp giữa rẳn tắm nắng và chửa
Tắm nắng




Không

1

Rắn có chửa

11

5

16

Rắn không có chửa

4

10

14

15

15

30

I


Tại thí nghiệm này, hai yếu tô" rắn có chửa hoặc không chửa và rắn có
tắm nắng hoặc không tắm nắng hoàn toàn độc lập nhau.
Giả thuyết không (Ho): khả năng ảnh hưởng của tắm nắng và không
tắm nắng đôi vối rắn hố chúa có chửa và không chửa đểu bằng nhau.
Giả t h u y ế t

k h á n g k h ô n g (H ị): g i ữ a c h ú n g

có s ự

khác nhau.

Các bước tính toán tường tự giống như đã trình bày ỏ thí dụ 4.5 trên
đây. Kết quả thu được sau khi tính toán là Xt" = 4,82.
Tra bảng X* vói DF = 1 và mức độ tin cậy 0,1% là 13,82. Vậy, X,- > XhnniT
nên giả thuyết trên không đươc châ"p nhận (0,02con rắn có chửa thưòng tắm nắng nhiều hđn những con rắn không chửa.
Nhưng do số liệu quá nhỏ nên các kết quả ỏ đây cùng chỉ có thể rút ra
kết luận tạm thời chứ không chắc chắn vì chi’ cần một con rắn chuyển từ
nhóm tắm nắng sang nhóm không tắm nắng thì kết quả Xt^ sẽ bị thay đổi
ngay và giá trị mới sẽ là
= 3,45. Như vậy, với giá trị vừa mối tìm đưỢc Xi"
= 3,45 này thì các nhân tô”trên không biểu thị sự sai khác rõ rệt, có nghĩa
là giả thuyết giữa chúng không có sự khác nhau được chấp nhận.
b. Kết luận

Như vậy, trong những trưòng hợp mà bộ sô' liệu quá nhỏ, bắt buộc phải
144



sử dụng hệ sô điều chỉnh thì kết quả mỏi dưỢc tin cậy. Hệ sô" điểu chỉnh
thírh hỢp nhất cho bộ sô"liệu quá nhỏ thưòng dược dũng là hệ sô điều chỉnh
Yate.

2.3. H ệ sô 'đ iều c h ỉn h Yate
a. Hệ RÔ điều chỉnh Yate là gì?
Khi có hai nhân tô’ thí nghiệm trong một sự phân bô mà độ tự do chỉ
b ằ n g 1 t h ì g iá t r ị t h u đ ư ợ c c ủ a p h é p k iê m t r a sẽ rã't lớ n n ê n t a c ầ n á p d ụ n g

hệ sô điều chỉnh Yate. Hệ sô điều chỉnh Yáte là inột hệ sô" điểu chỉnh làm
c h o s ự b iế n đ ổ i c ủ a bộ sô' li ệ u t r ỏ t h à n h liê n t ụ c c h ứ k h ô n g b ị n g ắ t q u ã n g đ ể

áp dụng cho tính toán
đôì vối một thí nghiệm có dạng 2 x 2 (biểu diễn
theo hai chiều nià mỗi chiều chỉ có một nhân tố riêng biệt). Hệ số điều
chỉnh Yate được tiến hành thực hiện theo từng bưóc cụ thể như sau: ở tử sô",
lâV giá trị tuyệt đốì của độ lệch giữa tần suất thực tiễn và lý thuyết (t - 1)
trừ đi 0,5 trưốc khi thực hiện phép bình phương. Như vậy, công thức tính
hệ sò •/- có áp dụng hệ sô"điều chỉnh Yate có sự thay đổi.
Công thức tính X‘ ■có áp dụng hệ số điều chỉnh Yate:

trong đó:
- 1 là tần suâ't quan sát thực tiễn;
- I là tần suâ't lý thuyết;
- I I là giá trị tu yệt đối;

• 1/2 là hằng số.
Thí dụ 4.7. Kiểm tra tỷ lệ tròng : mái của 16 chim cút được lấy ra một
cách ngẫu nhiên từ một quần thể chim cút nuôi tại Trung tâm nghiên cứu

gia cầm Thuỵ Phương. Trong số đó, có 12 chim trống và 4 chim mái. Hỏi
quản thể chim cút đó có tuân theo quy luật sinh học lý thuyết trống ; mái tỷ
lệ 1:1 không?
b. Cách g iả i bài toán
Từ bộ sô liệu trên ta có:
Giả thuyết không (Hjj) là tỷ lệ giữa trống và mái bằng nhau.

145


Giả thuyêt kháng không (Hi) là tỷ lệ giữa trông và mái không hằng
nhau.

Để kiểm tra sự đồng nhâ’t của tính biệt trông và mái dàn clniii CÚI thí
nghiệm được rút ra từ một quần thế chim cút, ta có thể tiên hành BO sánh

theo hai cách tính: có và không sử dụng hệ sô diều chỉnh Yatc dê chứng
minh nên dùng hay không nên dùng hệ số điểu chỉnh Yate.
c. Không dùng hệ s ố điều chinh Yate

J

X

, _= ------------------(12-8)'“^ + (4-8)-

y-

8


8

= 4,0

Vói DF = 1 và p = 0,05 thì có sự sai khác vì Xi" (4,0)> X|- (3.84), có nghĩa
là t ỷ lệ t r ô n g m á i c ủ a m ẫ u t h í n g h i ệ m đư ợ c r ú t r a t ừ d à n c h im c ú t k h ô n g
p h ù hỢp q u y l u ậ t s i n h h ọ c lý t h u y ế t .

d. Có dùng hệ s ố điều chỉnh Yate
r

L

11-0,5)^
J
-

^ (112-81-0,5)- (14-81 •0.5)8
^
'8
= 3,062
Với DF = 1 và p = 0,05 thì kết quả ở thí nghiệm có dùng hệ sô điều
chỉnh Yate không biểu thị sự sai khác rõ rệt vì Xt' (3,062) < 7j- (3,84), có
nghĩa là tỷ lệ chim cút trôVig và mái phù hợp với quy luật lý thuvót sinh học
theo tỷ lệ 1:1.
Như giả thuyết đã nêu trên đây là chim cút trông và niái dểu phân tán
ngẫu nhiên trong quần thể. Song, cần lưu ý rằng ở một sô' trường hỢp tỷ lệ
trống mái không tuân thủ theo 1:1 nên đã gây nên sai lệch. Lưu ý, hệ số
điều chỉnh Yate có thể dùng để tính toán trong các trường hợp bộ sô liệu
quá nhỏ cho các báo cáo để kết quả thu được chính xác. Song, ỏ nước ta do

phương pháp sử dụng hệ sô"điều chỉnh Yate không được phổ biến rộng rãi,
và nó không thuận tiện trong khi tính toán củng như lúc trình bày nên
trong thực tiễn nưóc ta ít dùng đến nó.
146


B . P H Ư Ơ N G P H Á P K IỂ M T R A G

I. Đ Ặ C Đ IỂ M C H U N G

Phương pháp kiểm tra thôVig kê sinh học G cũng là một trong những
phiíơng pháp kiếm tra mức độ phù hỢỊ) giữa tan su.it thực tiễn và tần suất
lý thuyết tô’t nhât. Phương pháp kiêm tra G có đặc tính, nội dung và
phương pháp phân tích, tính toán tương tự giông như phương pháp kiểm
tra x~. Song, phương pháp kiểm tra G có một sô ưu điểm tốt hơn so với
phương pháp kiểm tra
đó là: dễ làm và đơn giản hơn, đặc biệt dễ sử
dụng cho máy tính cầm tay.
Theo các nhà toán học phân tích thì vê' mặt lý thuyết tnà nói phương
pháp kiểm tra G có nhiều thuận tiện và hiện đại hơn trong việc áp dụng.
Công thức tính của phương pháp kiểm tra G như sau:
G = 2 X I t In
ti o iig dỏ:

- t là tần suâ*t thực tiễn;
- 1 là tần su ấ t lý thuyết;

- In là hàm sô'logarit tự nhiên.

II. CÁC P H Ư Ơ N G P H Á P K IỂM TRA G


Phương pháp kiểm tra thống kê sinh học G là một trong hai phương
pháp dưỢc dùng phổ biến nhất tì‘OMg việ(í plìâiì tíòlì kiểm tra sự phù hỢp
g iữ a lỷ lệ t h ự c t i ễ n t h í n g h i ệ m với lý th u y ế t được t í n h t ừ c á c q u y l u ậ t s i n h

học. Có nhiều phương pháp khác nhau, tuỳ thuộc vào sô' yếu tô”thí nghiệm,
loại niô hình thí nghiệm, vv để phân tích kiểm tra sự phù hỢp đó. Song, có

thê nêu lên đây mâV phương pháp cơ bản và thông dụng nhất:
- phương pháp áp dụng cho tần suât thí nghiệm có một yếu tô;
- phương pháp áp dụng cho tần suâ't thí nghiệm dạng 2x2;
- phương pháp áp dụng cho tần suất thí nghiệm dạng hàng Xcột.

147


1. Áp dụng cho tần suâ't thí nghiệm có một yếu tô'
1.1. Vài n ét 8tí hộ v ề p h ư ơ n g p h á p k iêm tr a G
Trong lĩnh vực sinh học nói chung, thí nghiệm chỉ có một yèu tố dể so
sánh sự sai khác nhau giữa tỷ lệ thực tiễn so với lý thuyết của một quy lu<ậ(
s i n h h ọ c t h ư ò n g được s ử d ụ n g n h i ề u , n h á t là t r o n g l ĩ n h vực d i t r u y ề n h ọ c
và chọn giốhg. Ngoài ra, một số thí nghiệm muôn kiếm t r a Iiiứcđộ(lồng
nhất của một quần thể, sự phân ly một số tính trạng trong c<ác lô hỢỉ) lai, sự
phân bô" đồng đều trên một đdn vị thòi gian, v.v cũng cần dùng phương
pháp kiểm tra thốhg kê sinh học G. Mục đích, đặc điểm, nội dunfĩ và
phương pháp phần tích kiểm tra sẽ đưỢc minh họa trong thí dụ sau dây.
Thí dụ 4.8. Trong một hỗn hỢp bốn giống gà mới IIƠ và số lượiig các
giôVig gà đó đểu bằng nhau, người ta nhặt ra một cách hoàii loàn ngẫu
nhiên 75 con thì thấy trong sô* đó có 24RR, 32LP, lOTH và 9Ỉ)T. Hỏi sự
phân tán của đàn gà con có đồng đều không? Tại bảng 4.lơ, trình bày sô

liệu về tần suất thực tiễn của thí nghiệm và giá trị lý thuyết.
Bảng 4.10. Tấn suất thực tiễn và lý thuyết của cảc giống gà
Giống gà

RR

LP

TH

Tần suất thực tiễn (t):

24

32

10

Tần suất lý thuyết (I):

18,75

18,75

18,75

ĐT
9
18.75


ghi chú:
- RR là giống gà Rốt RI;
- LP là giống gà Lirang Phưạig;
- TH là giống gà Tam Hoàng:
- ĐT là giống gà Đông Tào.

1.2.

Các bước tiến hành

a. Tim tổng của các tích t với logarit (t/l)
I t In (ưl) = 24ln(24/18,75) + 321n(32/18,75)
+101n(10/18,75) + 91n(9/18,75)
= 5,925 + 17,105 + (-6,286) + (-6,606)
= 10.138

b. Tính G theo công thức sau:
G = 2 x lt In (ưi)
= 2 X 10,138
= 20,276
148


c. Tính hệ sỗ điều chỉnh Williarn (CFịị):
Hộ sô'điểu chỉnh William được xác (lịnh theo cònfí tliức sau;
('iv = 1 +

^
BnDỈ-'


trong dó:
- C h \ là h ệ sô^ diề u c h ỉ n h c ủ a VVilliani;

* a là sô nhóm mẫu hay tần xuâl lớp:
' n là tống dung lượng mẫu;
- DF là độ tự do và được tính = a - 1.
Hộ số hiệu chỉnh CF^ là:
cF vv

=

1 +

6x75x3

= 1 + (15/1350)
= 1,0111

d. Tinh giá trị G đã được hiệu chính theo hệ sô'William (G

J

G |uéu chinh w ~ G / C I * „

= 20,276/1,0111
= 20,053
e. Kết luận
S o s á n h g iá trị G,„ệu chinh w với X" sử d ụ n g D F = 3. G iá trị Gh.ệu chính w

(20,053) tưổng đương vổi giá trị %- (19,98). Như vậy, với thí nghiệm chỉ có

niột độ tự do thì phướng pháp kiểm Ira G không khác so vói phương pháp
kiồin tia X'2. Áp dụng cho tần suất thi nghiệm dạng 2x2
2 .1 .

Khái niệm

Trong trường hỢp thí nghiệm có dạng 2x2 thì không cần thiết phân
biệt giữa giá trị thực tiễn và lý thuyết. Có thề ký hiệu tần suât quan sát
h a y t h ự c t i ễ n là f. I^ấy t ầ n s u ấ t q u a n s á t n h â n vói (x) l o g a r i t t ự n h i ê n c ủ a

chính nó rồi cộng các các tích CÌQ lại vâi Iihau. Cách tính này râ*t dễ trong

việc sử dụng máy tính cầm tay. Thí dụ 4.9 sau đây sẽ minh họa cụ thể.

149


2 .2 .

Thi du và các bước tinh chinh
é

Thí dụ 4.9. Mức độ nhiễm bệnh của đàn ỈỢn nhập nội tại hai cd sỏ
chăn nuôi Iđn ỏ Việt Nam thu được như sau: Trại A không bị nhiỗin 86 con,
bị nhiễm 15 con và trại B tưdng ứng 32 và 12 con. Hỏi sự khác nhau vê mức
độ nhiễm bệnh giữa hai trại có ý nghĩa không?
Để xác định được sự nhiễm bệnh của lớn trên hai cơ sở chãii nuôi ỏ
n ư ố c t a có k h á c n h a u h a y k h ô n g , c ầ n x á c đ ị n h đưỢc t ầ n s u â ”t q u a n s á t v à

tổng của các yếu tố. Kết quả cụ thể được trình bày ở bảng 4.11.

Báng 4.11. Tẩn suất và tổng thực tế các
Không bị nhiễm
Trại A
Trại B
Tổng

yểu

tố

BỊ nhiễm

Tổng

a

b

a+b

86

15

101

c

d


c+d

32

12

44

a+c

.b^-d

a+b+c+d

118

27

145

ghi chủ:

- a, b. c và d là các tần suất quan sát tưong ứng của mỗi yếu tố của mô hình;
- 86,15. 32.12 là tẳn suất cụ thể của thi nghiêm đối với các yếu tố tương ứng:
- a+b và c+d tổng đàn lợn của các trại A và B tưong ứttg;
- a+c và b+d là tổng sỏ’ lợn bị nhiễm và không bị nhiễm bệnh của cà hai trại.

a. Tính Z fln fch o tất cả từng tần suất thực tiễn
I(f InO = 861n86 + 151nl5 + 321n32 + 12lnl2
= 564,417

b. Tính

ln ỉjc h o tổng tấ t cả các tần suất thực tiễn

= 145 lnl45
= 721,626
c. Tính ỵ fln fc h o tấ t cả tổng hàng và cột: f là tần suất của hàng và cột
I (f Iní) =1011nl01 + 44ln44 + lis in l 18 + 271n27

= 1284,560
d. Cộng các kết quả Z(f InO tổng của từng tần suất thực tiễn và
lnLf tổng tầ”t cả tần xuất rồi trừ đ i kết quả của S(flnO của tống tần suất
hàng và cột.
564,417 + 721,626 - 1284,560 = 1,483
150


e. Tính giá trị G theo công thức aciu:
G = 2 X [I(f

..... . + (innXO,,„,. - ^(nnOh.„,H..>t]

= 2x1,483
= 2,966
g. Tính CF„ theo công thức sau:
1 —
t h w-- 1+




llKii/íí + í') +---- ------+ d) • _i
1]
. 6n

= 1 + ((145/101) + ( 1 4 5 / 4 4) -1ỊÍ145 / 1 18
" 6 xT 4 õ
= 1 + (20,891/870)

= 1,024
h. Tính

, 7,,,,/,

^*hiẹu i-hinh w ”

bằng cách chia G cho CF(V
G /C P ^ .

= 2,966/1,024
= 2,896
So sánh

với / sử dụng giá trị DF = (r-ỉ)(c-l)=I

i. Kết luận
Giá trị G tính đưỢc (2,896) < X" (3,84) ớ mức tin cậy p=0,05 nên sự
khác nhau về mức dộ nhiễm bệnh giữa hai trại lợn không có ý nghĩa rõ rệt.


So sánh giá trị Ghiệudtinh wvới 7,“ sử dụng hộ sô’hiệu chỉnh Yate thì giá

Í^hiíii .hinh w này (2,896) lớn hdn giá trị X' sử dụng hệ sô' hiệu chỉnh Yate
(2,;ỉ55).

3. Áp d ụ n g c h o tầ n s u ấ t th í n g h iệ m d ạ n g h à n g X c ộ t

3.1. K h á i n iệm và cá ch tinh
Trong trường hỢp th í nghiệm có dạng hàng X cột (r x c ), các bước tính
của phướng pháp phân tích kiểm tra thống kê sinh học giôứĩg như dạn g 2 X

2 đã nêu trên đây, có nghĩa cũng không cần thiết phân biệt giữa tần suất
thực tiễn và lý thuyết. Có thế ký hiệu, tần suất quan sát hay thực tiễn là f
rồ i l ấ y t ầ n s u â ”t q u a n s á t n h â n với l o g a r it t ự n h iê n c ủ a c h í n h n ó v à s a u đ ó

cộng các các tích đó lại vối nhau.
3.2. So s á n h vớỉ d ạ n g th i nghiệm kiểu 2 x 2
Thí nghiệm có dạng hàng X cột hầu hết giôVig thí nghiệm có dạng 2x2,

151


song cũng có những điểm cd bản khác nhau sau đây;
a. Độ tự do khác nhau
Phưdng pháp tính độ tự do giốhg như nhau, song ỏ đây hàng vá cột có
thể khác vôi trị sô" 2 ở mô hình thí nghiệm dạng 2 X 2. Vì vậy, độ tự do d mô
hình thí nghiệm hàng X cột được tính theo công thức sau:

DF = (r-l)(c-l)
trong đó:
- r là tổng sô”hàng được bô”trí trong các thí nghiệm;
- c là tổng số cột được bố trí trong thí nghiệm.

Vì vậy, độ tự do trong mô hình thí nghiệm hàng Xcột có thô > 1. Thực
chất, mô hình thí nghiệm dạng 2x2 là một dạng đặc biệt trong các dạng của
t h í n g h i ệ m h à n g X cọt.

b. Không cần thiết áp dụng hệ sô'điều chỉnh cho một s ố trường hợp
Cũng có thể do r > 2 và c > 2 nên DF > 1. Vì vậy, giá trị G, có thề lỏn
hđn G| rất rõ ràng mà không cần áp dụng hệ số điều chỉnh.
Do chỉ có một số điểm khác nhau vừa nêu trên so với thí nghiệm dạng
2x2, còn phương pháp và các bưốc tính toán hoàn toàn giống nhau nên
không trình bày cụ thể phướng pháp phân tích kiểm tra mô hình thí
nghiệm dạng hàng Xcột.

c. MỘT SỐ ĐẶC ĐIỂM CỦA PHƯƠNG PH Á P KIỂM t r a
Để kiềm tra mức độ đồng nhất, mức độ ngẫu nhiên, sự phù hỢp giữa
t ầ n s u ấ t t h ự c t i ễ n v à lý t h u y ế t , s ự p h ù h ợ p c ủ a m ộ t q u y l u ậ t s i n h h ọ c ,

V .V .,

cần phải áp dụng phưdng pháp kiểm tra sự phù hỢp và G này. Đê thề
hiện rõ ràng hơn về các đặc trưng của phưđng pháp kiểm tra này và ứng
dụng-cụ thể của mỗi phướng pháp áp dụng vào các mô hình thí nghiệm khi:
1.
Kiểm tra so sánh mức độ đồng nhâ”t giữa tần suâ*t thực tế và lý
thuyết nếu giả thuyết không (Ho) đã được chấp nhận. Chú ý rằng, khi tính
tầ n su ấ t lý th u yết là phải dựa trên mô hìn h toán học thích hỢp vối quy lu ậ t
sin h học đang đừđc n gh iên cứu. c ả h ai phương pháp X' và G đều áp dụng

được nhưng ỏ phưdng pháp G không cần thực hiện phép tính ở giai đoạn
trung gian khi xác định tần suất lý thuyết. Các phương pháp này (lùng
152



×