Tải bản đầy đủ (.doc) (132 trang)

Bài giảng bộ môn hệ thống nông nghiệp

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (753.97 KB, 132 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI
BÀI GIẢNG CAO HỌC THÚ Ý
MÔN: PPTN & THỐNG KÊ SINH HỌC
PGS.TS. NGUYỄN THỊ LAN
Bộ môn: HỆ THỐNG NÔNG NGHIỆP
Hà Nội - 2010
2
MỤC LỤC
MỤC LỤC i
BÀI 1: NHỮNG KHÁI NIỆM CƠ BẢN TRONG NGHIÊN CỨU 1
1.1. Các bước trong nghiên cứu khoa học nông nghiệp 1
1.2. Các phương pháp nghiên cứu trong khoa học nông nghiệp 3
1.2.1. Phương pháp nghiên cứu trong phòng 3
1.2.2. Phương pháp nghiên cứu trong nhà có mái che 3
1.2.3. Phương pháp nghiên cứu trong chuồng trại 3
1.2.4. Phương pháp nghiên cứu trong điều kiện sản xuất của hộ nông dân
(trang trại) 4
1.3. Các nguyên tắc khi thiết kế thí nghiệm 4
1.3.1. Nhắc lại 4
1.3.2. Ngẫu nhiên 4
1.3.3. Khối 5
1.3.4. Một số nguyên tắc đồng đều 6
1.4. Một số khái niệm cơ bản trong thống kê sinh học 7
1.4.1. Thí nghiệm 7
1.4.3. Một số tham số thống kê đại diện 8
1.4.4. Tham số thống kê đại diện 9
1.5. Phân tích sự sai khác 11
1.6. Thu thập số liệu 12
1.6.1. Cách lấy mẫu 12
1.6.2. Nguyên tắc lấy mẫu 12


1.6.3. Các loại số liệu trong nghiên cứu khoa học 14
1.6.4. Một số quy tắc cần biết trong tính toán 14
BÀI 2: PHÂN TÍCH MỐI LIÊN HỆ GIỮA CÁC ĐẠI LƯỢNG 15
2.1. Nghiên cứu mối liên hệ 15
i
2.2. Xác định mức độ liên hệ giữa các đại lượng 16
2.2.1. Tỷ tương quan 18
2.2.2. Hệ số tương quan 20
2.2.3. Chỉ số tương quan 24
2.2.4. Hệ số tương quan kép (hệ số tương quan tuyến tính 2 lớp) 24
2.3. Phương pháp bình phương bé nhất 24
2.4. Nghiên cứu mối quan hệ tuyến tính bậc nhất 25
2.5. Tương quan và hồi quy tuyến tính nhiều biến 31
2.5.1. Ý nghĩa của phân tích mối quan hệ nhiều biến 31
2.5.2. Hệ số hồi quy riêng và hệ số tương quan riêng 32
2.5.3. Hệ số tương quan bội (hệ số tương quan phức) 34
2.5.4. Xây dựng phương trình tuyến tính nhiều lớp 35
2.6. Nghiên cứu mối liên hệ phi tuyến 39
2.7. Hệ số tương quan thứ tự (tưong quan Spearman) 49
2.8. Kiểm định giả thuyết về các hệ số khi nghiên cứu mối liên hệ 50
2.8.1. So sánh hai hệ số tương quan 51
2.8.2. So sánh nhiều hệ số tương quan 51
2.8.3. So sánh hệ số hồi quy 53
2.8.4. Một số sai lầm trong nghiên cứu mối quan hệ 53
BÀI 3: BỐ TRÍ THÍ NGHIỆM VÀ PHÂN TÍCH KẾT QUẢ 54
3.1. Bố trí thí nghiệm 1 nhân tố 55
3.1.1. Sắp xếp tuần tự 55
3.1.2. Sắp xếp hoàn toàn ngẫu nhiên (CRD: Completely randomized
design) 56
3.1.3. Bố trí kiểu khối ngẫu nhiên đầy đủ (RCB hay RCBD: Randommized

Complete Block Design) 56
3.1.4. Bố trí ô vuông la tinh (LS: Latin Square) 56
3.2. Bố trí thí nghiệm 2 nhân tố 57
ii
3.2.1. Kiểu tổ hợp hoàn toàn ngẫu nhiên (CRD) 57
3.2.2. Kiểu tổ hợp khối ngẫu nhiên đầy đủ (RCB) 57
3.2.3. Kiểu chia ô lớn ô nhỏ (Split-Plot) 57
3.2.4. Bố trí thí nghiệm kiểu chia băng (Strip – Plot hay Criss Cross) 58
3.3. Bố trí thí nghiệm 3 nhân tố 59
3.4. Mô hình phân tích kết quả thí nghiệm 1 nhân tố 59
3.4.1. Kiểu thiết kế hoàn toàn ngẫu nhiên (CRD) 59
3.4.2. Kiểu thiết kế khối ngẫu nhiên đầy đủ (RCB) 62
3.4.3. Phân tích kết quả của thí nghiệm thiết kế theo kiểu ô vuông la tinh
(LS) 66
3.5. Phân tích kết quả thí nghiệm 2 nhân tố 71
3.5.1. Thí nghiệm 2 nhân tố thiết kế tổ hợp khối ngẫu nhiên đầy đủ (RCB)
71
3.5.2. Phân tích kết quả thí nghiệm thiết kế chia ô lớn ô nhỏ (Split – Plot)76
3.6. Đổi biến (chuyển đổi) số liệu trước khi phân tích kết quả thí nghiệm 91
3.7. Phân tích kết quả thí nghiệm 3 nhân tố 94
3.7.1. Kiểu khối ngẫu nhiên đầy đủ (RCB) 94
3.7.2. Kiểu chia ô lớn, ô nhỏ, ô nhỏ (Split – Split – Plot) 99
3.8. Phân tích phương sai qua một loạt thí nghiệm 100
3.8.1. Phân tích qua các vụ 100
3.8.2. Phân tích qua các năm 100
3.9 Phân tích hiệp phương sai 100
3.10. Một số phương pháp phân tích sự sai khác trong so sánh các trung bình
100
TÀI LIỆU THAM KHẢO 102
PHỤ LỤC 103

iii
BÀI 1: NHỮNG KHÁI NIỆM CƠ BẢN TRONG NGHIÊN CỨU
1.1. Các bước trong nghiên cứu khoa học nông nghiệp
Nghiên cứu khoa học nông nghiệp là quá trình tìm hiểu sự thật hay phát hiện các quy luật
tự nhiên. Nó được tiến hành theo một phương pháp khoa học mang tính hệ thống. Trước hết
là quan sát sự vật (từ thực tế hoặc từ các nguồn tài liệu thứ cấp), trên cơ sở đó xác định vấn
đề thực tiễn cần đòi hỏi phải giải quyết. Từ đó, xác định mục tiêu nghiên cứu và hình thành
giả thiết khoa học để giải quyết vấn đề đặt ra Giả thiết sẽ có giá trị nếu như nó được chứng
minh qua thí nghiệm và dựa trên các kết quả của thí nghiệm phát hiện bản chất của sự vật. Để
đánh giá đúng và hiểu rõ ý nghĩa của các kết quả thí nghiệm cần thiết phải sử dụng toán thống
kê để phân tích và đánh giá mức độ tin cậy của kết quả thí nghiệm ấy
Song, muốn có được kết quả đúng và đáng tin cậy, thí nghiệm phải được thực hiện và tuân
thủ các phương pháp đúng. Các phương pháp này quy định cách bố trí thí nghiệm và cách xử
lý (phân tích thống kê) kết quả thu được từ việc theo dõi thí nghiệm thông qua các chỉ tiêu
nghiên cứu đặt ra. Tuy nhiên, lựa chọn phương pháp tính toán và xử lý nào lại phụ thuộc vào
mực đích (số lượng nhân tố trong yếu tố thí nghiệm) và cách bố trí thí nghiệm. Kết quả thí
nghiệm hay kết quả nghiên cứu nếu được xử lý bằng các tiêu chuẩn (Test) thống kê phù hợp
sẽ cho kết luận tin cậy.
Các kết quả thí nghiệm thu được chỉ mới dựa vào một mẫu (dựa vào tham số thống kê đại
diện của mẫu), nhà khoa học nếu chỉ dựa vào kết quả này để đánh giá sẽ dễ dàng mắc sai lầm
trong kết luận. Do vậy, mục đích chính của thống kê toán là đưa ra các cơ sở khách quan cho
việc phân tích vấn đề nghiên cứu thông qua các số liệu quan sát được. Có thể coi đây là cơ sở
của môn học này. Phần lớn các nghiên cứu trong khoa học nông nghiệp sử dụng phương pháp
quy nạp. Có nghĩa là phân tích qua các giai đoạn phát dục của đối tượng nghiên cứu ở các chỉ
tiêu gián tiếp và cuối cùng đến chỉ tiêu có vị trí quan trọng là năng suất của cây trồng cũng
như vật nuôi trong nghiên cứu đặt ra. Từ đó, rút ra các kết luận khái quát.
Thí nghiệm được xây dựng dựa trên việc theo dõi các chỉ tiêu nghiên cứu. Qua theo dõi
các chỉ tiêu đó, dưới ảnh hưởng của yếu tố thí nghiệm trong cùng điều kiện của yếu tố không
thí nghiệm được kiểm soát (yếu tố thí nghiệm được quyền và bắt buộc thay đổi, trong khi các
nhân tố của yếu tố không thí nghiệm được đồng nhất có nghĩa là sự khác nhau là tối thiểu).

Thí dụ: Nghiên cứu ảnh hưởng của các mức kali bón khác nhau đến năng suất lúa, thì chỉ có
các mức kali bón là thay đổi, còn các mức của phân chuồng, phân đạm và phân lân là được
giữ nguyên. Các biện pháp kỹ thuật như: giống lúa, tuổi mạ, mật độ, …cũng giống nhau. Như
vậy, sau này năng suất lúa khác nhau là do nguyên nhân chủ yếu của lượng kali bón khác
nhau. Còn ảnh hưởng của các loại phân khác và các biện pháp kỹ thuật thực hiện thí nghiệm
là tối thiểu
Ta có thể mô tả các bước trong nghiên cứu khoa học nông nghiệp qua hình sau:
1
THU THẬP THÔNG TIN ĐỂ XÁC
ĐỊNH VẤN ĐỀ CẦN GIẢI QUYẾT
MỤC TIÊU CẦN ĐẠT ĐƯỢC
PHÂN TÍCH CƠ SỞ KHOA HỌC VÀ
THỰC TIẾN ĐỂ NẮM ĐƯỢC VẤN ĐỀ
XÂY DỰNG GIẢ THIẾT KHOA HỌC
CHỨNG MINH GIẢ THIẾT KHOA HỌC
PHÂN TÍCH THỐNG KÊ
KẾT QUẢ NGHIÊN CỨU
TỔNG KẾT VÀ VIẾT BÁO CÁO
KHOA HỌC
NGHIÊN CỨU TIẾP HAY MỞ HỘI THẢO HOẶC
KHUYẾN CÁO ÁP DỤNG VÀO SẢN XUẤT


2
Hình 1.1. Các bước trong tiến trình nghiên cứu
1.2. Các phương pháp nghiên cứu trong khoa học nông nghiệp
Hiện nay, trong nghiên cứu nông nghiệp nói chung và đặc biệt trong chăn nuôi thú y người
ta đang sử dụng các phương pháp nghiên cứu sau đây:
1.2.1. Phương pháp nghiên cứu trong phòng
Phương pháp này các thí nghiệm được thực hiện trong các phòng thí nghiệm hay các

phòng nghiên cứu Điều kiện thực hiện thí nghiệm có tính nhân tạo và độc lập với môi trường
tự nhiên bên ngoài. Do đó, kết quả thí nghiệm có độ chính xác cao. Các kết luận được rút ra
từ những thí nghiệm này không áp dụng vào thực tế sản xuất được, mà chỉ có tác dụng lý
luận. Có thể mô tả kết quả nghiên cứu này bằng phương trình :

( )
VXfY ,
=
(1.1)
Ở đây:
Y
là kết quả thí nghiệm;
X
là yếu tố thí nghiệm; còn
V
là các biện pháp kỹ thuật
thực hiện trong thí nghiêm (yếu tố không thí nghiệm)
Sai số thí nghiệm cho phép

%CV
1%
1.2.2. Phương pháp nghiên cứu trong nhà có mái che
Phương pháp này các đối tượng nghiên cứu được nuôi trong các ô chuồng nhỏ (có ít đối
tượng nghiên cứu), hoặc trong các bể (nếu là thủy hải sản)…Điều kiện là đối tượng nghiên
cứu được sống một phần trong môi trường tự nhiên, còn một phần là môi trường nhân tạo
(đây là phương pháp chuyển tiếp giữa phương pháp trong phòng và phương pháp trong
chuồng trại). Hiện nay, phương pháp này đang phát triển và nông dân nếu có điều kiện cũng
có thể làm được.Tuy nhiên, phương pháp thí nghiệm dạng này chủ yếu được thực hiện ở các
cơ sở nghiên cứu khoa học và các trường. Biểu thức mô tả kết quả có dạng:


( )
eVXfY ;;
=
(1.2)
Ở đây
e
: là một bộ phận của môi trường tự nhiên trong nhà có mái che, là nơi đặt thí
nghiệm mà ở đó người nghiên cứu chưa kiểm soát được.
Các thí nghiệm của phương pháp này có sai số cho phép

%CV
5%
1.2.3. Phương pháp nghiên cứu trong chuồng trại
Đây là loại hình thí nghiệm nghiên cứu phổ biến trong các cơ sở khoa học chăn nuôi và thú
y. Phương pháp này, đối tượng trong thí nghiệm được nuôi trong môi trường tự nhiên và đồng
thời chịu ảnh hưởng của nhiều nhân tố như: điều kiện chuồng trại và khí hậu. Những nhân tố
này thuộc yếu tố không thí nghiệm (nền cho thí nghiệm và không tham gia so sánh). Song, ta
khó có thể kiểm soát chặt chẽ.
Những thí nghiệm này có ưu điểm là sát với thực tế sản xuất, nên có thể sử dụng kết quả
để xây dựng các biện pháp kỹ thuật trong sản xuất. Kết quả được biểu thị bằng biểu thức sau:

( )
EVXfY ;;
=
(1.3)
3
Trong công thức này
E
: là môi trường tự nhiên tại nơi làm thí nghiệm. Thí nghiệm này tuỳ
thuộc vào đối tượng nghiên cứu cũng như sự khác biệt của yếu tố thí nghiệm cho phép sai số

khác nhau vật nuôi có kích thước nhỏ, trong mỗi lần nhắc lại có nhiều đầu gia súc sai số bé
còn vật nuôi có kích thước lớn mỗi lần nhắc lại có ít con vật nuôi tham gia phải cho phép sai
số lớn hơn.
1.2.4. Phương pháp nghiên cứu trong điều kiện sản xuất của hộ nông dân (trang trại)
Đây có thể coi là trường hợp đặc biệt của phương pháp nghiên cứu trong chuồng trại nêu
trên. Điều này có nghĩa là: thí nghiệm (nghiên cứu) được thực hiện trong điều kiện thực tế của
hộ nông dân, do hộ quản lý, theo dõi và đánh giá kết quả (có thể nuôi trong chuồng trại và
chăn thả tự nhiên ngoài đồng cỏ hay dưới tán rừng ). Vì điều kiện thực tế sản xuất tại hộ nông
dân nên khó có thể khống chế các điều kiện thí nghiệm chặt chẽ. Vì vậy, thí nghiệm nên đơn
giản, ít công thức và chỉ nên theo dõi ít chỉ tiêu (những chỉ tiêu thông thường). Thí nghiệm
này yêu cầu độ chính xác thấp hơn
Ưu điểm của loại hình nghiên cứu này là tiết kiệm, khả năng phổ biến để áp dụng kết quả
vào sản xuất cao, phù hợp với điều kiện thực tế của nông dân và điều quan trọng là tự hộ nông
dân đánh giá. Mô tả kết quả nghiên cứu bằng biểu thức toán học :

( )
SEVXfY ;;;
=
(1.4)
Trong đó:
S
là kỹ năng quản lý của chủ trang trại.
1.3. Các nguyên tắc khi thiết kế thí nghiệm
Như ta đã biết, để có được kết quả thí nghiệm đúng và tin cậy phải thực hiện thí nghiệm
tuân thủ các phương pháp đúng. thiết kế thí nghiệm đúng phù hợp với mục đích và điều kiện
nghiên cứu sẽ làm giảm sai số, tăng độ tin cậy để khẳng định vai trò của yếu tố thí nghiệm
đặt ra. Để có thể kiểm soát được sai số thí nghiệm, trong khi thiết kế cũmg như sắp xếp thí
nghiệm cần phải nắm vững tuân thủ các nguyên tắc của thí nghiệm
1.3.1. Nhắc lại
Nhắc lại nghĩa là trong cùng một thời gian, trên cùng khu vực thí nghiệm, mỗi công thức

được lặp lại một số lần nhất định và như nhau.
Thí dụ: Có 5 công thức so sánh 5 liều lượng vaxin khác nhau, thí nghiệm được nhắc lại 3 lần.
Điều này có nghĩa là: mỗi công thức (mỗi liều lượng) được phép có mặt ở 3 lô (nhóm) và như
vậy sẽ có 15 lô thí nghiệm. Phải thực hiện nhắc lại mới có thể xác định sai số (ước lượng) của
thí nghiệm. Sai số này là cơ sở cho việc xác định sự khác nhau trong kết quả thí nghiệm có
thực sự khác nhau về mặt tiêu chuẩn thống kê hay không.
1.3.2. Ngẫu nhiên
Ngẫu nhiên là sự sắp xếp các công thức thí nghiệm vào các lô thí nghiệm hoặc gán mỗi gia
súc à 1 lần nhắc lại (vị trí các ô chuồng) hoàn toàn ngẫu nhiên mà không hề có định hướng.
Những ảnh hưởng của các nhân tố khác trong yếu tố không thí nghiêm (ảnh hưởng tương tác)
cũng được coi là tác nhân ngẫu nhiên. Do có những sai khác luôn luôn xảy ra khách quan và
4
ngẫu nhiên, mà người làm thí nghiệm khó và thậm chí không thể kiểm soát nổi,. Vì vậy, mọi
cơ sở của phân tích thống kê đều dựa trên luật phân phối của các đại lượng ngẫu nhiên phù
hợp (phân phối ngẫu nhiên). Sắp xếp ngẫu nhiên các trong thí nghiệm sẽ tránh được ý muốn
chủ quan của con người, tạo điều kiện cho các giả thiết có giá trị khách quan.
1.3.3. Khối
Để thí nghịêm đạt độ chính xác cao, các công thức cần phải được sắp xếp ở điều kiện càng
giống nhau càng tốt. Điều này có nghĩa là: nếu xảy ra sự khác nhau thì chỉ là tổi thiểu. Trong
thực tế các dãy chuồng nuôi thí nghiệm hay gia súc không cùng lứa với cùng mẹ nên không
thể hoàn toàn đồng nhất. Do đó, người thiết kế nên chia các dãy chuồng trong thí nghiệm (các
gia súc ) thành các khối (Block) khác nhau, trên mỗi khối các công thức thí nghiệm đều được
xuất hiện
Thí dụ: Có một thí nghiệm so sánh các mức đạm urê bổ sung trong khẩu phần ăn cho lơn con
khác nhau, để có thể kiểm soát sai số do chuồng nuôi (thuộc yếu tố không thí nghiệm), ta chia
khu vực thí nghiệm làm nhiều khối. Trong đó, mỗi khối lại chia làm các ô chuồng để bố trí số
lơn con thí nghiệm được bổ sung các mức đạm urê trong khẩu phần ăn. Như vậy, khối có thể
được coi là một phần hoàn chỉnh của thí nghiệm. Sự khác nhau do điều kiện thí nghiệm (vị trí
chuòng trại) giữa các ô chuồng nuôi của thí nghiệm trong cùng khối là nhỏ hơn so với sự khác
nhau giữa các chuồng trong các khối khác nhau.

Kỹ thuật tạo khối làm tăng sự chính xác cho thí nghiệm, do tách được sai số của thí
nghiệm ra khỏi sự sai khác do nhân tố thí nghiệm. Bên cạnh đó khối còn cho phép đánh giá sự
khác nhau của nhân tố thí nghiệm ở trong cùng một khối.
Khi thiết kế thí nghiệm để đảm bảo “ sai khác duy nhất” cần có các điều kiện sau:
(1) Các ô chuồng thí nghiệm khác nhau về nhân tố (hay mức độ của cùng nhân tố) theo
đúng nội dung nghiên cứu xây dựng.
(2) Sai số ngẫu nhiên (sai số thí nghiệm) phải nhỏ .
(3) Thiết kế (sắp xếp các ô thí nghiệm) phải phù hợp với điều kiện của nơi đặt thí
nghiệm, số lượng nhân tố nghiên cứu để đạt độ chính xác cao và tin cậy.
(4) Phân tích thống kê theo đúng mô hình thiết kế phù hợp.
(5) Kết luận phải có giá trị rộng.
Có thể thấy độ chính xác của thí nghiệm phụ thuộc vào nhiều nhân tố. Song độ chính xác
tăng khi sai số chuẩn trung bình giảm. Có thể có một số giải pháp làm tăng độ chính xác của
thí nghiệm như sau:
(1) Tăng số đầu gia súc cho 1 công thức trong 1 lần nhắc lại của thí nghiệm, tuy nhiên khi
thực hiện được như trên sẽ cần phải có chuồng rộng và đồng thời khó tạo ra các
nguyên tắc đồng đều trong nghiên cứu. Điều này lại làm cho sai số thí nghiệm lớn
(2) Tăng số lần nhắc lại (3 - 4 lần hoặc có thể nhiều hơn) .
(3) Xác định công thức nghiên cứu thích hợp
5
(4) Kỹ thuật thực hiện thí nghiệm có tính đồng nhất cao
1.3.4. Một số nguyên tắc đồng đều
1.3.4.1. Đồng đều về tuổi
Trong thực tế đây là vấn đề rất khó có thể thực hiện đúng như lý thuyết đặt ra. Song, để có
thể làm được thí nghiệm cần chấp nhận đồng đều như sau::
(1) Đối với gia cầm cho phép chênh lệch một số ngày (sinh trong cùng tuần chênh 7 – 10
ngày) được coi là cùng tuổi
(2) Đối với lợn cho phép chênh lệch một số tuần (sinh trong cùng tháng chênh nhau 15 – 20
ngày được coi là cùng tuổi.
(3) Đối với đại gia súc (trâu, bò, dê, cừu,…)chênh một số tháng

1.3.4.2. Đồng đều về thể trọng (khối lượng)
Gia súc đưa vào thí nghiệm có khối ượng càng gần nhau càng tốt. Nhưng cũng có khi cùng
tuổi nhưng khối lượng lại khác nhau, trong cùng một đàn (lứa) cũng khó có khả năng có thể
trọng như nhau. Vì vậy, khi thực hiện thí nghiệm phải chấp nhận một sự khác nhau về khối
lượng là:
(1) Đối với gia cầm khối lượng chênh nhau???
(2) Với lợn chia ra: Lợn con chênh 1- 2 kg/con; lợn nhỡ lệch nhau 4 – 5 kg/con và lợn lớn
chênh lệch nhau từ 10 – 15 kg/con
(3) Với đại gia súc như: Trâu, bò,bao gồm:
+ Với bê nghé chênh nhau 20 – 25 kg
+ Trâu, bò chênh nhau 30 – 40 kg
1.3.4.3. Đồng đều về số lượng
Trong thí nghiệm số lượng gia súc trong mỗi công thức cho mỗi lần nhắc lại phải bằng
nhau. Song, với mỗi loại gia súc thí nghiệm khác nhau số lượng cho mỗi công thức cũng khác
nhau. Có thể chấp nhận số lượng như sau:
+ Với gia cầm mỗi công thức 50 con/lần nhắc lại
+ Với lợn cho phép 10 – 15 con cho mỗi công thức/lần nhắc lại
+ Với trâu bò 5 con/lần nhắc/công thức
Có thể trong thời gian thí nghiệm với những lý do khách quan (ngẫu nhiên mà con người
không kiểm soát được) làm thất thoát (mất hay chết) khi đó phải chấp nhận số gia súc còn lại
là không giống nhau.
1.3.4.4. Đồng đều về tính biệt và giống
Thực tế trong thí nghiệm tính biệt (đực, cái) phải có số lượng hay tỷ lệ như nhau, trừ
những nghiên cứu chuyên sâu về tính biệt còn ại các nghiên cứu khác đều có cả con đực và
con cái trong mỗi công thức/mỗi lần nhắc. Tuyệt đối không để riêng 1 loại tính biệt cho một
lần nhắc nào đó, mặc dù trong các công thức đều có số lượng cho mỗi tính biệt là như nhau.
Cũng tương tự, loại trừ thí nghiệm về giống còn trong các thí nghiệm khác nếu đồng nhất chỉ
6
1 giống là tốt nhất. Tuy nhiên nếu không thể chọn đủ chỉ 1 giống có thể có thêm cácgiống
khác, nhưng tỷ lệ các giống phải như nhau trong các công thức.

1.3.4.5. Đồng đều về dinh dưỡng
Loại trừ thí nghiệm về dinh dưỡng, còn lại các thí nghiệm khác dinh dưỡng đều là nhân tố
thuộc yếu tố không thí nghiệm. Vì vây, phải như nhau (số lượng đơn vị thức ăn hay khẩu
phần ăn cho mỗi con trong ngày theo tuổi và thời kỳ phát dục của gia súc. Cụ thể tỷ lệ thức ăn
tinh, thô hay dinh dưỡng bổ sung, số bữa và thời gian cho ăn/ngày)
1.3.4.6. Đồng đều về các mặt khác
Việc chăm sóc (tắm và cho ra sân chơi hoặcchăn thả trên đồng cỏ)và tiêm phòng trừ các
loại dịch bệnh cho gia súc thí nghiệm cũng phải đồng nhất
Bên cạnh đó đối tượng nghiên cứu với vật nuôi cần xác định rõ:
- Loài vật nuôi: lợn vật nuô ăn cỏ (trâu, bò,dê, ngựa, ), gia cầm (gà, vịt, ngan, ngỗng,…)
- Hướng sản xuất: Thịt, trứng, sữa, cày kéo.
- Tuổi còn non hay trưởng thành.
- Điều kiện nuôi dưỡng: Thời gian, địa điểm và kỹ thuật nuôi dưỡng
1.4. Một số khái niệm cơ bản trong thống kê sinh học
1.4.1. Thí nghiệm
Trong thống kê thực hiện thí nghiệm (hay phép thử) để tạo ra số liệu. Những thí dụ cổ điển
trong toán xác suất hay nêu như: tung đồng xu và kết quả xảy ra là sự xuất hiện mặt xấp hoặc
mặt ngửa (chỉ có 2 trường hợp). Đổ con xúc sắc sẽ có 6 trường hợp có thể xảy ra. Trong
nghiên cứu về hệ thống nông nghiệp việc phỏng vấn hộ nông dân ở một vùng nào đó để biết
được mức thu nhập, trình độ sản xuất (nhỏ lẻ, trang trại,…). Hay ta tiến hành so sánh khối
lượng ợn con cai sữa của 5 đàn lợn lai kinh tế …Các thí dụ nêu trên đều gọi là thí nghiệm.
Mục đích của thí nghiệm là nhằm kiểm tra giả thiết về nguyên nhân thực của sự vật hay hiện
tượng xảy ra
Có thể hiểu thí nghiệm là thực hiện một công việc không có sẵn trong tự nhiên để tạo ra số
liệu. Cũng có thể hiểu cụ thể hơn: Thí nghiệm là quá trình theo dõi một hay nhiều chỉ tiêu
dưới tác động của một hay nhiều nhân tố nhằm phát hiện hoặc kiểm định một vấn đề nào đó.
1.4.2. Biến và tham số
Một đại lượng (hay một biến) nhận các giá trị của nó với xác suất tương ứng nào đấy gọi là
đại lượng ngẫu nhiên hay biến ngẫu nhiên.
Ta thường ký hiệu các biến ngẫu nhiên bởi các chữ:

;;; ZYX
…Các giá trị mà biến ngẫu
nhiên nhận được thường viết bằng chữ nhỏ (chữ thường)
;;; zyx

Trong nghiên cứu thực nghiệm của các nhà khoa học thường gọi: biến là một đặc trưng
hay tính trạng có thể đo đếm được của thí nghiêm. Có hai loại biến là: biến độc lập và biến
phụ thuộc. Thí dụ trong nghiên cứu về xác định lượng phân đạm (urê)sử dụng để ủ chua rơm
rạ làm thức ăn cho trâu, bò, biến đạm (N các mức cho vào ủ cùng khối lượng rơm rạ) là biến
7
độc lập, còn chất lượng rơm rạ sau khi ủ theo quy trình (hoặc sau đó cho trâu bò ăn rồi theo
dõi sự tăng trọng ,…) là biến phụ thuộc.
Tham số là một đặc trưng thông kê của một biến hay tính trạng của tổng thể. Thí dụ: Số
trung bình của quần thể (hay gọi là kỳ vọng toán; số trung bình lý thuyết). Số trung bình đại
diện cho độ lớn trung bình của chỉ tiêu nghiên cứu trong tổng thể. Hoặc tham số phương sai
của quần thể (б
2
); phương sai đại diện cho độ biến động hay phân tán của các giá trị của chỉ
tiêu nghiên cứu.
Tuy nhiên, hai tham số này không biết trực tiếp mà chỉ xác định thông qua phép ước
lượng.
1.4.3. Một số tham số thống kê đại diện
1.4.3.1. Tổng thể
Tất cả các cá thể (phần tử) của đối tượng mà ta nghiên cứu được gọi là tổng thể, còn trong
1 công thức các con vật nuôi gọi là quần thể. Thí dụ ta nghiên cứu về hiện trạng sử dụng đất
sản xuất nông nghiệp để trồng cỏ chăn nuôi tại một vùng nào đó, thì tất cả các hộ nông dân
nhận đất sản xuất nông nghiệp để trồng cỏ trong vùng đó là một tổng thể. Hay trong một vùng
có 4400 con trâu, bò, muốn biết số con bị bênh lở mồm, long móng có tỷ lệ là bao nhiêu?
tổng thể của trường hợp này là 4400 con có trong vùng nêu trên.
* Vậy tham số trung bình của tổng thể


( )
N
x
MX
n
i
i

=
==
1
µ
(1.5)
Trong đó:
i
x
là giá trị quan sát của cá thể thứ i
N
là toàn số cá thể trong tổng thể.
* Phương sai của tổng thể : là tổng bình phương độ lệch trung bình của các giá trị quan sát
so với kỳ vọng của tổng.

( )
( )
N
x
DX
n
i

i
2
1
2

=

==
µ
σ
(1.6)
1.4.3.2. Mẫu ngẫu nhiên
Mục đích của các nhà khoa học luôn mong muốn biết các thông tin về tổng thể nghiên cứu.
Song, họ không thể quan sát được toàn bộ các cá thể có trong tổng thể, bởi những hạn chế sau:
(1). Không có đủ thời gian, nhân lực và tài chính.
(2). Cần phải bảo vệ đối tượng nghiên cứu (có một số trường hợp sau khi đo đếm mẫu bị phá
huỷ. Nếu có bao nhiêu đem nghiên cứu hết sẽ không có mẫu cho lần tiếp sau.
8
Vì những lý do trên, nên các nhà khoa học phải làm thế nào để chỉ cần lấy một số cá thể
(một nhóm hay bộ phận) có độ lớn
n
từ trong tổng thể để quan sát mà vẫn có thể biết được
các thông tin (đặc trưng) của tổng thể. Việc đó gọi là “ lấy mẫu” .
Thí dụ: Tiến hành quan sát độc lập một chỉ tiêu (ký hiệu biến ngâu nhiên
X
) nào đó. Ta
gọi
i
x
là giá trị quan sát thứ

i
của chỉ tiêu
X
. Khi đó các giá trị
( )
ni
xxxx ; ;; ;;
21
được gọi
là mẫu ngẫu nhiên;
n
được gọi là cỡ mẫu (dung lượng hay độ lớn mẫu). Như vậy, mẫu ngẫu
nhiên cỡ
( )
n
thực chất là
( )
n
biến ngẫu nhiên độc lập, có cùng phân phối như biến ngẫu nhiên
X
Mẫu phải có tính đại diện. Để đảm bảo điều kiện này phải tạo điều kiện cho tất cả các cá
thể trong tổng thể có tính đồng khả năng như nhau trong chọn mẫu. Sự chọn mẫu còn cần
phải độc lập giữa các cá thể trong cùng tổng thể với nhau.
Như vậy, theo nguyên lý của xác suất, ta phải chọn ngẫu nhiên các cá thể trong tổng thể
đó. Mỗi cá thể được chọn là một biến ngẫu nhiên có cùng hàm phân phối xác suất. Nếu thoả
mãn được các điều kiện trên được gọi là “mẫu ngẫu nhiên”
1.4.4. Tham số thống kê đại diện
1.4.4.1. Trung bình
* Trung bình tổng thể
µ

(Biểu thức 1.5)
.* Trung bình mẫu
( )
x
Từ mẫu ngãu nhiên có độ lớn là
( )
n
, ta tính được trung bình theo công thức sau:

n
x
x
n
i
i

=
=
1
(1.7)
trong đó:
n
là dung lượng mẫu

i
x



giá trị quan sát thứ i

1.4.4.2. Phương sai
* Phương sai tổng thể
( )
2
σ
Phương sai của tổng thể : là tổng bình phương độ lệch trung bình của các giá trị quan sát
so với kỳ vọng của tổng thể.Công thức tính số (1.6)
* Phương sai mẫu
( )
2
S
Từ mẫu ngẫu nhiên có dung lượng
( )
n
, phương sai mẫu là tổng bình phương độ lệch trung
bình bớt đi một độ tự do của các giá trị quan sát trong mẫu so với trung bình mẫu; Phương sai
mẫu tính bằng công thức
9

( )
1
2
1
2


=

=
n

xx
S
n
i
i
(1.8)

Phương sai mẫu biểu thị sự biến động hay phân tán của mẫu nghiên cứu Có thể xảy ra
trường hợp hai mẫu có trung bình như nhau, nhưng phương sai khác nhau, nên hai mẫu cũng
khác nhau. Nếu mẫu nào có giá trị phương sai nhỏ hơn, mẫu đó ổn định hơn (các cá thể trong
mẫu đồng đều hơn).
1.4.4.3. Độ lệch chuẩn
Độ lệch chuẩn là sự sai khác của của các giá trị quan sát với tham số trung bình. Độ lệch
chuẩn càng nhỏ các giá trị càng tập trung gần với trung bình. Ngược lại độ lệch chuẩn càng
lớn các giá trị phân bố xa số trung bình .
* Độ lệch chuẩn tổng thể
( )
σ
Độ lệch chuẩn tổng thể tính .bằng công thức sau:


2
σσ
±=
(1.9)
* Độ lệch chuẩn mẫu
( )
S
Độ lệch chuẩn mẫu được tính bằng công thức :


2
SS
±=
(1.10)
1.4.4.4. Độ lệch chuẩn của sổ trung bình
Thông thường, trong các tiêu chuẩn (Test) trong thống kê hay sử dụng tham số trung bình
để tính toán. Vì vậy, độ lệch chuẩn của trung bình hay được sử dụng.
* Độ lệch chuẩn của trung bình tổng thể (
x
σ
)
Độ lệch chuẩn của trung bình của tổng thể tính như sau:

N
x
2
σ
σ
=
hay
N
x
σ
σ
=
(1.11)
* Độ lệch chuẩn của trung bình mẫu
( )
x
S

10

n
S
n
S
S
x
2
==
(1.12)
1.4.4.5. Hệ số biến động ( CV%)
Hệ số biến động là giá trị so sánh tương đối giữa độ lệch chuẩn với trung bình
Hệ số biến động của mẫu tính bằng công thức sau:

100*%
x
S
CV
=
(1.13)
1.5. Phân tích sự sai khác
Các số liệu sau khi tính toán các than số thống kê cần thiết phù hợp với nội dung nghiên
cứu cần phải được phân tích để rút ra kết luận cụ thể cho biện pháp kỹ thuật (yếu tố thí
nghiệm).
Thí dụ: Giả sử muốn biết khả năng tăng trọng của một giống bò thịt A nào đó được nuôi ở hai
điều kiện là: có ủ chua thức ăn và không ủ chua thức ăn xanh, xem có khác nhau hay không ?
Ta có thể chia số bò thí nghiệm thành 2 nhóm, mỗi nhóm tuân thủ các nguyên tắc đồng đều.
Một nhóm bò cho ăn thức ăn xanh được ủ chua theo quy trình và nhóm thứ 2 cho ăn thức ăn
xanh không ủ chua Nhóm bò ăn thứ ăn xanh ủ chua cho khả năng tăng trọng cao hơn nhóm

bò chỉ ăn thức ăn thông thường. Như vậy cho kết luận là thức ăn được ủ chua đã làm cho khả
năng tăng trọng cao hơn so với thức ăn không được ủ chua. Nhưng kết luận như vậy liệu đã
chính xác chưa? Để trả lời câu hỏi đó cần xem xét một số nội dung sau:
Sự sai khác về khả năng tăng trọng thu được của hai nhóm bò do hai nguyên nhân:
(1) Do có sự khác nhau về chất lượng thức ăn xanh (đây là nhân tố hay yếu tố thí nghiệm)
(2) Do nhóm trâu bò ăn thức ăn không ủ chua được nuôi trong chuồng có điều kiện tốt hơn
(đây là yếu tố không thí nghiệm). Có thể hai nhóm bò cùng ăn thức ăn xanh được ủ chua,
nhưng khối lượng thịt thu được từ hai nhóm trâu bò cũng khác nhau. Nhưng sự khác nhau
này là do ảnh hưởng của điều kiện môi trường như:(chất lượng chuồng nuôi; khí hậu; dịch ;
bệnh;…) ta không kiểm soát được. Sự khác nhau này được gọi là “ sai số thí nghiệm”.
Như vậy, sự khác nhau khối lượng giữa hai nhóm trâu bò thí nghiệm là do có sự khác nhau
về yếu tố thí nghiệm và cả sự khác nhau giữa các yếu tố không thí nghiệm (sai số thí nghiệm)
tạo ra. Do đó, chỉ căn cứ vào sự khác nhau để kết luận là không chính xác. Nên cần phải sử
dụng phương pháp phân tích thống kê để phân tích sự sai khác. Phân tích thống kê sẽ tách
được sự sai khác (thông qua các nguồn biến động) do các nguyên nhân (gọi là nguồn biến
động) khác nhau gây ra.
Sự khác nhau cơ bản trong các kiểu bố trí thí nghiệm là khác nhau. Sự khác nhau này cần
được tính khi phân tích kết quả thí nghiệm. Công cụ phân tích này là dựa vào sự kiểm định
bằng phân tích phương sai (ANOVA) là công cụ phân tích chính
11
Phân tích sai khác tổng hợp (biến động toàn phần) thành các thành phần hay các nguyên
nhân do các nguồn biến động khác nhau. Trong đó, nguyên nhân chính dẫn tới sự khác nhau
là yếu tó thí nghiệm (do 1 nhân tố hoặc do nhiều nhân tố).
Sự sai khác trung bình (hay còn có tên là phương sai) do các nguyên nhân khác nhau (do
công thức hay yếu tố thí nghiệm; khối; …) được so sánh với phương sai ngẫu nhiên, thông
qua việc thiết lập tỷ số giữa hai phương sai. Trong đó: phương sai ngẫu nhiên nluên đứng làm
mẫu số để có được tiêu chuẩn
F
(Fisher- Snedercor). Giá trị
F

được dùng để đánh giá mức
độ khác nhau giữa các giá trị trung bình của một nguồn biến động cụ thể.
Bên cạnh đó, phân tích phương sai còn cho biết mức độ sai số chuẩn của các số trung bình.
Qua đó để ước lượng tìm khoảng tin cậy chắc chắn của sự sai khác do yếu tố thí nghiệm gây
nên.
Có một số các tiêu chuẩn (Test) dùng trong so sánh số trung bình như:
(1) Dùng hiệu quả chênh lệch nhỏ nhất có ý nghĩa
( )
α
LSD
(2) Dùng tiêu chuẩn đa biên độ của Duncan
( )
α
DMRT
Trong đó cần phải tính được sự
khác nhau nhỏ nhất
α
D
của tất cả các khoảng giữa các số trung bình trong dãy xếp
hạng
1.6. Thu thập số liệu
1.6.1. Cách lấy mẫu
Mẫu là một bộ phận (nhóm) của tổng thể. Thông qua mẫu ta có thể ước lượng và biết được
tổng thể. Lý do ta phải lấy mẫu là:
(1) Tổng thể có số lượng cá thể lớn hoặc rất lớn. Trong khi đó nhân lực và tài chính chỉ
có hạn nên không thể nghiên cứu tất cả tổng thể.
(2) Tổng thể có biến đổi theo thời gian (đối tượng nghiên cứu là sinh vật) nếu quan sát
tất cả sẽ mắc sai số.
(3) Phải bảo vệ đối tượng nghiên cứu .
Lý thuyết thống kê cũng đã chứng minh được: Luật phân bố của tổng thể phù hợp với luật

phân bố của mẫu, nếu như mẫu đủ lớn và đại diện. Do đó, có thể dùng phân tích thống kê để
kiểm tra độ chính xác (độ tin cậy) của mẫu có đại diện cho tổng thể hay không?
Có hai nguyên nhân gây nên sai số của mẫu là: (i) do ngẫu nhiên (ii) và do lấy mẫu gây ra.
Ta có khả năng khắc phục sai số này bằng cách phải lấy mẫu đại diện và tăng dung lượng
mẫu.
1.6.2. Nguyên tắc lấy mẫu
Theo nguyên lý thì mẫu phản ánh (đại diện) cho tổng thể. Nên các cá thể có trong tổng thể
đều có khả năng như nhau trong việc chọn mẫu. Do đó, mẫu phải được lấy ngẫu nhiên và đây
cũng chính là cơ sở toán học để tính xác suất nhằm kiểm định kết quả thí nghiệm sau này.
12
1.6.2.1. Dung lượng mẫu (n)
Dung lượng mẫu hay còn gọi là độ lớn của mẫu
( )
n
, tuỳ theo từng đặc trưng (chỉ tiêu)
nghiên cứu có biến động khác nhau mà xác định dung lượng cho phù hợp. Có thể thấy, dung
lượng mẫu phụ thuộc vào các điều kiện sau:
- Loại chỉ tiêu nghiên cứu.
- Độ chính xác của thí nghiệm cần đạt được.
- Điều kiện (nhân lực; tài chính) và số lượng cá thể có trong tổng thể hay trong công
thức
1.6.2.2. Phương pháp lấy mẫu
Để mẫu đảm bảo tính đại diên, khách quan và chính xác, bên cạnh độ lớn của mẫu thì cách
lấy mẫu cũng cần được quan tâm.
(1). Phương pháp chọn ngẫu nhiên
Phương pháp này cho biết : Mỗi cá thể trong tổng thể có cơ hội được chọn như nhau (lưu ý
cần loại trừ các cá thể ở hàng biên). Phương pháp này chỉ chính xác khi dung lượng mấu lớn,
trong điều kiện tổng thể nhỏ và đồng nhất
(2). Phương pháp chọn theo lớp ( theo nhóm)
Phải phân các cá thể trong tổng thể thành các nhóm (k nhóm khác nhau). Trên cơ sở của

các nhóm sẽ xác định tiêu chuẩn cụ thể của mấu và các dung lượng (m
i
) cụ thể của từng
nhóm cho phù hợp. Dung lượng mẫu sẽ là tổng của các dung lượng mẫu của các nhóm:


=
=+++++=
k
i
iki
mmmmmn
1
21

(1.14)
Phương pháp này đảm bảo khách quan và chính xác. Nhưng tốn thời gian .
(3). Phương pháp chọn mẫu phân phối đều
Đây là phương pháp hay được áp dụng với thí nghiệm đồng ruộng. Chon mẫu bằng
phương pháp này được thực hiện theo hai dạng sau:
(1) Phân phối đều theo đường chéo (5 điểm;4 điểm; 3 điểm hay 2 điểm tuỳ thuộc từng
trường hợp cụ thể). Dạng này hay áp dụng cho lấy mẫu trên ô thí nghiệm. (hay có thể
hiểu quần thể có tính đồng nhất cao)
(2) Phân phối đều theo tuyến. Kiểu này thường sử dụng trong lấy mẫu điều tra trên đồng
ruộng (tổng thể không đồng nhất).
Cho dù lấy mẫu theo phương pháp nào thì cũng không lấy các cá thể ở hàng biên ( hay
ngoài rìa )
13
1.6.3. Các loại số liệu trong nghiên cứu khoa học
1.6.3.1. Số liệu thô

Các số liệu thu được trực tiếp sau mỗi lần đo, đếm hoặc quan sát (đánh giá) gọi là số liệu
thô. Thí dụ: Xác định sản lượng sữa của 1 bò cái trong một chu kỳ cho sữa (kg/con) với 2
giống có các số liệu như sau:
Giống A: 26,0 ; 21,0 ; 23,7 ; 26,2 ; 19,9 ; 27,0 ; 21,0 ; 23,5 ; 21,7 ; 25,9
Giống B 19,0 ; 23,5 ; 25,0 ; 24,6 ; 20,6 ; 22,4 ; 25,3 ; 23,0 ; 23,7 ; 20,6
Nhìn vào các số liệu thô, ta rất khó nhận định kết quả xem sản lượng sữa của giống bò nào
là cao hơn? Giống nào có sản lượng sữa ổn định hơn?
1.6.3.2. Số liệu tinh
Các số (tham số) được tính toán từ số liệu thô, theo những tham số thống kê cần thiết
được gọi là số liệu tinh. Số liệu tinh dùng để công bố trong báo cáo khoa học. Thí dụ từ số
liệu thô về sản lượng sữa của hai giông trên ta tính được sản lượng sữa trung bình của giống
A và của giống B. Từ đó sẽ có nhận định giống bò nào có sản lượng sữa lớn hơn và ổn định
hơn.
1.6.4. Một số quy tắc cần biết trong tính toán
Trong quá trình tính toán (chuyển từ số liệu thô sang số liệu tinh) kết quả có thể là các số
ngẫu nhiên. Song, tuỳ thuộc vào ý nghĩa của các chỉ tiêu nghiên cứu mà ta có thể quy định để
khi công bố kết qủa nghiên cứu, các số đó vừa đảm bảo tính chính xác cần thiết và vừa đảm
bảo ý nghĩa của chỉ tiêu.
1.6.4.1. Con số có nghĩa
Thí dụ: Có số liệu vòng ngực của
n
con trâu (đơn vị đo: cm). Thông thường số liệu thô có
thể lấy chính xác đến 1/10 ( lấy 1 số thập phân hay 1 số lẻ tương ứng mm).
Vì vậy, con số có nghĩa là 4 (vòng ngực đạt trung bình 121,0 cm)
Như vậy, con số có nghĩa là số con số diễn tả (biểu thị) giá trị của biến ngẫu nhiên x
i
.
1.6.4.2. Phép tính gần đúng ( quy tắc xấp xỉ hay cách làm tròn số)
Sau khi quy định con số có nghĩa, khi tính các tham số thống kê (cộng; trừ; nhân; chia; bình
phương; căn;…), kết quả của các phép tính là một số ngẫu nhiên. Vì vậy, cần phải làm tròn số

theo đúng quy định về số chữ số có nghĩa. Có như vậy mới đảm bảo sự thống nhất cũng như ý
nghĩa của chỉ tiêu nghiên cứu
Thí dụ: Vòng ngực của đại gia súc quy định lấy chính xác đến 1/10 cm, nên khi tính vòng
ngực trung bình của (
n
) con trâu giả sử được giá trị 120,642 cm, nên khi công bố kết quả ta
chỉ lấy trung bình là xấp xỉ 120,6 cm
Hay chiều cao trung bình của một giống bò là 115,572 cm, ta quy định chỉ lấy 1 số thập
phân thì trung bình là 115,6 cm.

14
BÀI 2: PHÂN TÍCH MỐI LIÊN HỆ GIỮA CÁC ĐẠI LƯỢNG
Mục đích: Giúp người học hiểu được ý nghĩa và sự cần thiết của việc nghiên cứu mói quan hệ
giữa các đại lượng (các chỉ tiêu) trong nghiên cứu về lý thuyết cũng như trong thực tiễn. Sau
khi học, người học phải biết tính các tham số cũng như xây dựng phương trình hồi quy biểu
diễn mối quan hệ giữa chúng, biết các thuật toán khác có liên quan như: Ước lượng, kiểm tra
sự tồn tại của các tham số, từ đó, áp dụng trong công tác nghiên cứu khoa học
Nội dung:
1. Khái niệm về tương quan và hồi quy
2. Cách xác định dạng quan hệ
3. Cách tính cường độ quan hệ
4. Xây dựng phương trinh hồi quy biểu diễn mối quan hệ và ứng dụng trong sản xuất
nông nghiệp
2.1. Nghiên cứu mối liên hệ
Trong tự nhiên cũng như xã hội, mọi hiện tượng và sự vật đều có liên hệ với nhau. Đặc
biệt, trong sinh học giữa các cá thể sinh vật, giữa các quần thể, các quần xã, các hệ sinh thái
và cả sinh quyển trong quá trình phát triển luôn luôn tồn tại các mối liên hệ qua lại lẫn nhau
và với môi trường. Nhiệm vụ của con người là phát hiện và phân biệt được các mối liên hệ
khách quan đó. Trên cơ sở những nhận biết, thông qua các mối liên hệ tìm cách điều khiển
các liên hệ theo hướng có lợi cho con người.

Các mối liên hệ này có thể phân thành 2 dạng sau:
(1) Quan hệ hàm số (hay sự phụ thuộc hàm)
Nếu ta có hai đại lượng (hai chỉ tiêu)
X

Y
, nếu ứng với mỗi giá trị của
X
hoàn toàn
xác định được giá trị của
Y
thì ta nói rằng
Y
là hàm số của
X
. Thí dụ quan hệ giữa diện
tích hình tròn
( )
S
là hàm số của bán kính
R
. Hàm số này được biểu diễn bởi công thức
sau:
2
* RS
π
=
. Hay trong quá trình đẳng nhiệt, khi thể tích
V
giảm thì áp suất

P
tăng,
có nghĩa là giữa
P

V
có sự phụ thuộc hàm số và được biểu diễn bằng công thức:
V
C
P =
với
C
là một hằng số.
(2) Quan hệ tương quan (sự phụ thuộc tương quan)
Trong sinh học, thường gặp một kiểu phụ thuộc khác đó là: ứng với mỗi giá trị của đại
lượng này không hoàn toàn xác định được giá trị của đại lượng kia.
Thí dụ: Quan hệ giữa khối lượng gia súc với vòng ngực của chúng, ta không thể biết chính
xác rằng khi có vòng ngực là
X
xác định nào đó, sẽ cho phép định lượng khối lượng cơ
thể
Y
đạt ở mức bao nhiêu? Mà thường khối lượng này giao động trong một khoảng xác
định nào đó. Vì vậy,
X
là đại lượng không ngẫu nhiên, còn khối lượng
Y
là hàm số của
X
. Sự phụ thuộc này có thể biểu diễn bằng công thức:

15

)(XfY
=
(2.1)
Ở đây:
Y
là biến phụ thuộc, còn
X
là biến độc lập
Người ta xem xét mối liên hệ giữa các đại lượng qua sơ đồ sau:
Nhiệm vụ của người làm công tác thống kê khi phân tích các mối quan hệ giữa các đại
lượng là phải xác định đựoc rõ mức độ quan hệ giữa chúng và sau đó xây dựng được
phương trình hồi quy biểu thị mối quan hệ đó. Thông qua phương trình hồi quy xây dựng,
có thể dự báo kết quả của tác động của biện pháp kỹ thuật nào đó.
2.2. Xác định mức độ liên hệ giữa các đại lượng
Có thể xem xét mối liên hệ giữa các đại lượng (các biến) qua các hàm (phương trình)
hồi quy sau:
16
y
x
b>0
y=a+blgx
b<0
y
b>0
y=a+bx
b<0
x
x

y
c>0 c<0
y=a+bx+cx
2
y
x
b>0
b<0
lgy=a+bx
y=a+bx+cx
2
+dx
3
d>0
d<0
y
x
y
x
lgy=a+blgx
17
Trong thống kê toán để xác định mức độ liên hệ giữa các đại lượng ta có thể sử dụng các
tham số sau:
2.2.1. Tỷ tương quan
2.2.1.1. Khái niêm
Tỷ tương quan là chỉ tiêu mô tả mức độ liên hệ giữa các đại lượng trong trường hợp chung
nhất mà ta không cần (hoặc chưa biết trước) dạng liên hệ. Vì vây, tỷ tương quan mới chỉ mô
tả cường độ của sự liên hệ, mà không nêu lên chiều hướng của sự liên hệ đó
Trong thực tế, để biết xem ta có thể lợi dụng được sự liên hệ giữa các đại lượng hay
không, thường trước tiên phải xác định tỷ tương quan để biết giữa chúng có thực sự tồn tại

mối liên hệ hay không và liên hệ ở mức độ nào? trước khi đi xác định dạng liên hệ giữa các
đại lượng đó.
Tỷ tương quan được ký hiệu là
η
và công thức tính cụ thể như sau:
y
xyy
Q
QQ

=
η
(2.2)
Với
( )
2
1 1
∑∑
= =
−=
m
i
f
j
ijy
i
yyQ
(2.3)
( )
2

1 1
/
∑∑
= =
−=
m
i
f
j
iijxy
i
xyyQ
(2.4)
Trong đó,
ij
y
là các trị số quan sát của biến phụ thuộc
Y

y
là trị số trung bình của n trị số quan sát của biến phụ thuộc
Y

i
xy
là số trung bình có điều kiện của biến phụ thuộc
Y
ứng với 1 trị số xác
định của biến đọc lập
X

.
Tỷ tương quan là một số nhận các giá trị từ 0 đến 1
)10(
≤≤
η
)
Nếu
0=
η
thì 2 đại lượng độc lập tuyến tính
Nếu
1=
η
thì 2 đại lượng có quan hệ hàm số
Nếu
)3,00(
≤≤
η
thì 2 đại lượng có quan hệ yếu
Nếu (
5,03,0
≤≤
η
) thì 2 đại lượng có quan hệ vừa
Nếu (
7,05,0
≤≤
η
) thì 2 đại lượng có quan hệ tương đối chặt
Nếu (

9,07,0
≤≤
η
) thì 2 đại lượng có quan hệ chặt
18
Nếu (
19,0
<≤
η
) thì 2 đại lượng có quan hệ rất chặt
2.2.1.2. Cách tính
Để tính tỷ tương quan trong mối liên hệ giữa 2 đại lượng
Y

X
, trước tiên các số
liệu quan sát được chia tổ ghép nhóm theo biến
X
. Từ biểu thức (2.2) ta rút ra
∑∑
∑∑

∑∑∑
= =
= =
=
= ==



























=
m
i
f
j
m
i

f
j
ij
ij
m
i
m
i
f
j
ij
i
f
j
ij
i
i
ii
n
y
y
n
y
f
y
1 1
2
1 1
2
1

2
1 1
2
1
2
η
(2.5)
Trong đó,

=
i
f
j
ij
y
1
là tổng các trị số quan sát của biến
Y
ở mỗi tổ của biến
X

∑∑
= =
m
i
f
j
ij
i
y

1 1
là tổng các trị số quan sát của biến
Y
ở tất cả các tổ của biến
X
Khi dung lượng mẫu nghiên cứu mối liên hệ nhỏ, ta có thể sử dụng ngay công thức
(2.2) hoặc công thức biến đổi sau:
y
xy
Q
Q
/
1
−=
η
(2.6)
2.2.1.3. Kiểm tra độ tin cậy của tỷ tương quan
Tỷ tương quan mà ta vừa tính được ở biểu thức (2.5) và (2.6) mới chỉ là của mẫu có độ lớn
là n, đặc biệt là khi mẫu có những dao động ngẫu nhiên nhất là khi dung lượng mẫu n nhỏ,
nên tỷ tương quan này chưa hẳn đã tồn tại trong quần thể. Vì vậy, cần phải kiểm tra sự tồn tại
(độ tin cậy) của nó để khẳng định hai đại lượng
Y

X
là có liên hệ với nhau thực sự trong
quần thể.
Người ta đã chứng minh được rằng: Nếu phân bố tần suất của biến
Y
tại mỗi tổ của biến
X

là chuẩn với các phương sai bằng nhau và giả thuyết

0:
=
η
o
H
là đúng thì đại lượng
19
( )
11
2
2



=
m
mn
F
TN
η
η
η
(2.7)
Có phân phối
F
với độ tự do
1
1

−= mdf
và độ tự do
mndf −=
2
(trong đó: m là số tổ
của đại lượng
X
.
Nếu giá trị của
TN
F
tính theo biểu thức (2.7) <
LT
F
với hai độ tự do
1
df

2
df
thì giả
thuyết
0: =
η
o
H
là đúng (có nghĩa là tỷ tương quan không tồn tại hay không đáng tin cậy).
Ngược lại

TN

F

LT
F
khẳng định tỷ tương quan tính được là tồn tại (nghĩa là trong quần thể
thực sự tồn tại mối liên hệ giữa hai đại lượng
X

Y
.
2.2.2. Hệ số tương quan
2.2.2.1. Khái niệm
Hệ số tương quan là tham số đánh giá mức độ liên hệ (phụ thuộc hay chi phối) giữa
hai đại lượng (hai chỉ tiêu)
YX &
trong mối quan hệ tuyến tính bậc nhất (hay đường thẳng 1
lớp).
Công thức định nghĩa hệ số tương quan như sau:
( )
yx
SS
XYCOV
r
*
=
(2.8)
Người ta cũng chứng minh được rằng
rrr
xyyx
==

Nếu trước khi nghiên cứu hệ số tương quan ta đã nghiên cứu hồi quy đã xây dựng phương
trình hồi quy biểu diễn sự phụ thuộc của hai đại lượng với nhau thì các hệ số có mối quan hệ
thông qua biểu thức sau:
x
y
yxyx
S
S
brr ==
(2.9)
Ở đây hệ số hồi quy
yx
b
là hệ số hồi quy của
Y
phụ thuộc vào
X
. Tưong tự ta thấy:
y
x
xyxy
S
S
brr ==
(2.10)
Từ biểu thức (2.9) ta có
x
y
yx
S

S
rb
=

và từ công thức (2.10) có
y
x
xy
S
S
rb
=
20

×