Tải bản đầy đủ (.pdf) (66 trang)

Phương pháp thí nghiệm và phân tích số liệu trong nghiên cứu khoa học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.32 MB, 66 trang )

Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

CHƢƠNG 1. VỊ TRÍ PHƢƠNG PHÁP THÍ NGHIỆM VÀ PHÂN TÍCH SỐ LIỆU
TRONG NGHIÊN CỨU KHOA HỌC
1.1. Các bƣớc trong tiến trình nghiên cứu khoa học
Có thể tóm tắt tiến trình của một nghiên cứu khoa học và khoa học ứng dụng
trong nuôi trồng thủy sản nói riêng thông qua các bƣớc chung nhƣ sau:
(1) Xác định đề tài nghiên cứu
(2) Xây dựng đề cƣơng – Lựa chọn phƣơng pháp nghiên cứu
(3) Triển khai nghiên cứu – Thu thập và xử lý số liệu
(4) Công bố kết quả nghiên cứu
1.2. Vị trí của học phần phƣơng pháp thí nghiệm và phân tích số liệu
Vị trí của học phần phƣơng pháp thí nghiệm và phân tích số liệu trong tiến trình
nghiên cứu khoa học tập trung vào bƣớc (2) và (3) của tiến trình nghiên cứu. Học phần
chủ yếu tập trung vào việc bố trí, hoạch định cho các thí nghiệm, định hƣớng xử lý số
liệu (ở bƣớc 2) và sau đó tập trung vào các bƣớc triển khai, thu tập và xử lý số liệu (ở
bƣớc 3)
1.3. Thống kê sinh học với công tác thiết kế thí nghiệm và xử lý số liệu
1.3.1. Mục đích của công tác thống kê
Hoạt động nghiên cứu khoa học bao gồm việc “quan sát” các hiện tƣợng, sự kiện
tự xãy ra trong tự nhiên hoặc do chúng ta chủ động bố trí và “suy luận” để giải thích
hoặc giải quyết vấn đề. Qua việc theo giỏi, quan sát các hiện tƣợng, sự kiện ta tìm ra
qui luật của các hiện tƣợng, sự kiện đó. Từ việc nắm bắt qui luật của các hiện tƣợng,
sự kiện để quay trở lại phục vụ cho lợi ích của con ngƣời. Mục đích của công tác thống
kê chính là tìm ra qui luật của các hiện tƣợng, sự kiện mà ta quan tâm nghiên cứu.
1.3.2. Thống kê sinh học (Bio-Statistics)
Thống kê sinh học là môn khoa học thực nghiệm ứng dụng các phƣơng pháp và
kết quả của lý thuyết thống kê trong lĩnh vực sinh học nhằm tìm hiểu các qui luật và
bản chất của các qui trình sinh học.


1.3.3. Sự cần thiết phải sử dụng thống kê sinh học trong thiết kế thí nghiệm và xử lý số liệu
Trong thiết kế thí nghiệm và xử lý số liệu ở các lĩnh vực sinh học, sinh thái học,
nông - lâm nghiệp và nuôi trồng thuỷ sản, việc sử dụng thống kê sinh học là việc làm
cần thiết và là yêu cầu bắt buộc đối với các đề tài nghiên cứu khoa học.

1

Để mô tả các thuộc tính của đối tƣợng nghiên cứu, ví dụ nhƣ sức sinh sản trung
bình ± độ lệch chuẩn của cá Hồng Bạc Lutjanus argentimacus ngƣời làm nghiên cứu
cần dùng đến thống kê mô tả (descriptive statistics). Để so sánh các nhóm đối tƣợng
hay tìm mối quan hệ giữa các biến nghiên cứu (ví dụ nhƣ so sánh sức sinh sản của cá
Hồng Bạc nuôi theo ba chế độ dinh dƣỡng khác nhau hay xác định tƣơng quan giữa
khối lƣợng thân và sức sinh sản của chúng) hoặc để phân tích các kết quả thu đƣợc
ngƣời làm nghiên cứu cần dùng đến thống kê suy luận (inferential statistics). Trong
luận văn tốt nghiệp đại học, luận văn cao học, luận án nghiên cứu sinh và các đề tài
nghiên cứu khác, ngƣời làm nghiên cứu nhất thiết phải sử dụng thống kê (statistical
analysis) để phân tích các kết quả mình thu đƣợc. Các tạp chí khoa học khi xét đăng
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

bài báo khoa học của các nhà nghiên cứu đều nhấn mạnh đến tính hợp lý của phƣơng
pháp nghiên cứu và xử lý số liệu bằng thống kê. [Hoàng Tùng, 2006].
Trong quá trình làm nghiên cứu, chúng ta phải tiếp xúc và xem xét tính hợp lệ
của một lƣợng thông tin rất lớn do đó ngƣời làm nghiên cứu cần sử dụng đến công cụ

thống kê để tổng hợp số liệu, phân tích và rút ra các nhận định. Đồng thời, ngƣời phản
biện cũng cần có kiến thức về thống kê để đánh giá độ tin cậy của thông tin nghiên cứu
bởi lẽ không phải tất cả những cách thức mà tác giả phân tích và rút ra các nhận định
đều hợp lý. Ngƣời đọc, nếu không có kiến thức về thống kê sẽ không đánh giá đƣợc
tính hợp lý của các kết luận, ví dụ nhƣ trƣờng hợp sau: “Xác xuất bắt gặp cá hồng tuổi
1 + trong vịnh Nha Trang cao hơn so với cá tuổi 2 + trở lên,  2 =4,2; df=1, P<0,05”.
Nghiên cứu khoa học do con ngƣời thực hiện. Vì thế, các kết luận rút ra từ
nghiên cứu có thể bị ảnh hƣởng bởi cảm tính của ngƣời thực hiện. Sử dụng thống kê
sinh học trong thiết kế thí nghiệm và xử lý số liệu sẽ giúp đảm bảo tính khách quan
của nghiên cứu, loại bỏ các kết luận hoặc nhận định chủ quan, cảm tính của ngƣời làm
nghiên cứu. [Hoàng Tùng, 2006].
Quan trọng nhất là khả năng của thống kê trong việc xử lý các biến động của sinh
vật, môi trƣờng, sai số khi thu mẫu. Ta thƣờng phải xác định các thuộc tính, đặc điểm
của tổng thể nghiên cứu để mô tả hoặc kiểm chứng giả thuyết đặt ra. Trong lĩnh vực
Nuôi trồng Thuỷ sản đó có thể là kích thƣớc thành thục của cá niên, nhu cầu protein
của mực nang vân hổ, độ béo của sò huyết hay tốc độ tăng trƣởng của cá bớp. Tuy
nhiên, các nghiên cứu phải dựa trên mẫu bởi khó có đủ thời gian, kinh phí và khả năng
để xem xét từng đơn vị một của tổng thể (chẳng hạn nhƣ tất cả các con cá niên đang
sống ở vùng núi Việt Nam). Từ các thông số thống kê thu đƣợc đƣợc qua mẫu, ngƣời
nghiên cứu sẽ ƣớc lƣợng các thuộc tính của tổng thể. Các thông tin này lại phụ thuộc
vào mức độ biến động giữa các đơn vị trong tổng thể nghiên cứu và phƣơng pháp thu
mẫu. Đặc điểm của sinh vật và môi trƣờng sống của chúng là đa dạng và thƣờng xuyên
biến động. Chính vì thế mà các kết luận rút ra đƣợc từ nghiên cứu không phải là hoàn
toàn chắc chắn và đƣợc trình bày dƣới dạng xác xuất. Nhờ vậy, ngƣời đọc biết nếu
mình lặp lại nghiên cứu này, xác xuất để có đƣợc kết quả tƣơng tự là bao nhiêu %
(thông qua việc tính toán hiệu lực thống kê chứ không phải là xác suất p tính đƣợc qua
kiểm định thống kê). Nên nhớ thống kê không chứng mình điều gì cả. Thống kê chỉ
giúp ngƣời nghiên cứu xác định xác suất của hiện tƣợng quan sát đƣợc để ủng hộ hay
phản bác một giả thuyết cụ thể. [Hoàng Tùng, 2006].
1.3.4. Chức năng của thống kê

Trong nghiên cứu thực nghiệm thống kê đƣợc coi là một công cụ của nghiên cứu
khoa học. Dù là ở trong lĩnh vực khoa học nào thì thống kê đều thể hiện chức năng của
mình là thu thập số liệu nếu chỉ hiểu theo nghĩa hẹp. Còn nếu ta hiểu theo nghĩa rộng
thì chức năng của thống kê bao gồm:
- Bố trí, hoạch định các quan sát và thí nghiệm
- Thu thập, tổng hợp và trình bày số liệu
2

- Tính toán các đặc trƣng của đối tƣợng nghiên cứu
- Phân tích, suy diễn, dự đoán để đƣa ra các qui luật của sự kiện
1.4. Một số phần mềm thống kê ứng dụng
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Thống kê đã ra đời từ rất lâu. Sau đó là sự xuất hiện của máy tính năm 1946, cho
đến nay với sự hổ trợ của nhiều phần mềm chuyên dụng khác nhau nhƣ SPSS,
GenStat, Minitab, SAS hay Statistica thì việc xử lý thống kê các kiểm định phức tạp đã
trở nên dễ dàng hơn. Trong khuôn khổ tài liệu này xin đƣợc đề cập một vài ứng dụng
của phần mềm MS-Excel trong việc xử lý số liệu thống kê trong lĩnh vực sinh học,
nông - lâm - thuỷ sản. Hai công cụ trong phần mềm này đƣợc đề cập đến đó là hàm
thống kê (Statistics) và bộ chƣơng trình xữ lý số liệu (Data Analysis).

3


Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

CHƢƠNG 2. PHƢƠNG PHÁP THU MẪU VÀ THIẾT KẾ THÍ NGHIỆM
2.1. Phƣơng pháp thu mẫu
2.1.1. Một số khái niệm
Tổng thể nghiên cứu (Target population)
Là tập hợp chứa mọi phần tử thuần nhất theo một tiêu chuẩn nào đó mà ta cần
nghiên cứu. Hay tổng thể nghiên cứu là tập hợp các đơn vị cấu thành với các biến quan
tâm nghiên cứu. Ví dụ sức sinh sản của cá hồng bạc ở Nha Trang hay kích thƣớc thành
thục lần đầu của gà lai F1 giữa gà kiến mái với trống tam hoàng.
Tổng thể thu mẫu (Sample population)
Là một phần của tổng thể nghiên cứu, phần mà ta có thể tiếp cận. Ví dụ cá hồng
bạc do ngƣời dân câu đƣợc hay số trại giống gà lai F1 nghiên cứu trong tổng số trại gà
lai của vùng ta nghiên cứu.
Mẫu (Sample)
Là một phần của tổng thể nghiên cứu có đƣợc nhờ hoạt động thu mẫu. Kết quả
thu đƣợc từ mẫu đƣợc dùng để suy diễn cho toàn bộ tổng thể. Do vậy hoạt động thu
mẫu cần đảm bảo đƣợc các nguyên tắc của nó.
Đơn vị thu mẫu (Sampling unit)
Là một phần của tổng thể thu mẫu. Đơn vị thu mẫu có thể là một cá thể hay một
nhóm cá thể. Trong nghiên cứu các tiêu chuẩn của đơn vị thu mẫu cần phải đƣợc xác
định cụ thể và mô tả một cách rõ ràng. Ví dụ cá hồng bạc có kích thƣớc từ 0,5 – 8 kg
hay có tuổi từ 1 + – 8 +.

Phƣơng thức đo đạc (Measurement protocol)
Đó là phƣơng thức cụ thể nhằm quan sát, đo đạc hoặc phân tích để xác định các
đặc điểm cần nghiên cứu của đơn vị thu mẫu. Dung lƣợng mẫu sẽ thu tính theo diện
tích, thể tích hay khối lƣợng đều phải có đơn vị cụ thể. Phƣơng thức đo đạc phải bao
gồm mọi công đoạn từ khi thu mẫu, bảo quản (nếu cần) đến phân tích trong phòng thí
nghiệm, ghi nhận kết quả phân tích. Phƣơng thức đo đạc cần phải chỉ rõ số lƣợng đơn
vị thu mẫu, chủng loại, địa điểm, thời gian thu mẫu.
2.1.2. Thiết kế thu mẫu
Ta có thể thiết kế thu mẫu dựa trên xác suất (probability – based design) hay thiết
kế thu mẫu có chủ ý.
Đối với thiết kế thu mẫu theo xác suất thì địa điểm thu mẫu và đơn vị thu mẫu
đƣợc chọn một cách ngẫu nhiên. Thiết kế theo kiểu này cho ta xác suất để thu đƣợc
từng đơn vị cấu thành nên tổng thể thu mẫu là nhƣ nhau.

4

Ngƣời làm nghiên cứu có thể dùng các công cụ thống kê để đƣa ra các kết luận
về tổng thể thu mẫu. Thống kê sẽ giúp ta đƣa ra kết luận về tổng thể nghiên cứu từ các
số liệu thu đƣợc thông qua các đơn vị thu mẫu. Dựa trên kết quả phân tích thống kê
ngƣời nghiên cứu sẽ đƣa ra các nhận định chuyên môn.
Ngƣợc lại, thiết kế thu mẫu dựa vào phán đoán lại đƣợc xây dựng trên cơ sở hiểu
biết về đối tƣợng nghiên cứu. Trong trƣờng hợp này ngƣời nghiên cứu không thể kiểm
nghiệm thống kê để đƣa ra kết luận. Tính hữu ích của thiết kế dạng này phụ thuộc vào
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu


August 19, 2015

mục tiêu, qui mô của nghiên cứu và lƣợng thông tin mà ngƣời nghiên cứu có về tổng
thể nghiên cứu để đƣa ra các phán đoán. Thiết kế dạng này không cho phép lƣợng hóa
mức tin cậy.
Cho dù là thiết kế thu mẫu dạng nào việc ngƣời nghiên cứu cần xây dựng cho
mình một mô hình giả thuyết, giải thích mối tƣơng tác giữa các yếu tố mình nghiên
cứu với các yếu tố khác trong môi trƣờng và sự thay đổi của tƣơng tác này theo không
gian và thời gian là việc làm rất cần thiết khi thiết kế thu mẫu.
Để thiết kế thu mẫu ngƣời nghiên cứu cần xây dựng đƣợc các yêu cầu cụ thể và
chỉ ra đƣợc trình tự tiến hành thu mẫu hay nói một cách ngắn gọn là quy trình thiết kế
thu mẫu:
- Xác định mục tiêu:
Mục tiêu của thu mẫu có thể là tìm hiểu về tổng thể nghiên cứu, xác định thông
số của các yếu tố quan tâm, so sánh hai tổng thể, thực hiện quan trắc định kỳ hoặc xác
định các điểm bất lợi cho hoạt động Nuôi trồng thủy sản, hoạt động chăn nuôi, …
Ngoài các mục tiêu kỹ thuật ngƣời làm nghiên cứu cần cân nắc đến các mục tiêu về
thời gian, kinh phí và nhân lực. Thiết kế thu mẫu làm sao để giúp đem lại số liệu với
tính đại diện cao giúp ngƣời nghiên cứu trả lời đƣợc câu hỏi nghiên cứu đặt ra.
- Xác định thành phần nhóm nghiên cứu:
Thành phần nhóm nghiên cứu nếu có chuyên gia trong lĩnh vực nghiên cứu tham
gia thì thiết kế thu mẫu sẽ hạn chế đƣợc các sai lầm trong thu mẫu. Phƣơng án thu mẫu
sẽ hay hơn nếu trong thành phần nhóm thiết kế thu mẫu gồm các thành viên có chuyên
môn khác nhau trong lĩnh vực nghiên cứu.
- Xác định các yêu cầu thu mẫu:
Phạm vi của nghiên cứu về không gian và thời gian.
Ƣớc tính ban đầu về kích thƣớc mẫu thu.
Các thông số thống kê ta quan tâm nghiên cứu: Giá trị trung bình, phần trăm, xu
thế, độ phân tán, …
Các tiêu chuẩn qui định chất lƣợng của thông số đo đạc nhƣ: Mức tin cậy α=0,05;

hiệu lực thống kê P>80%; 95% khoảng tin cậy chỉ bằng 10% của giá trị trung bình.
- Xác định các yếu tố có thể ảnh hƣởng đến việc thu mẫu:
Thu mẫu/ phân tích: Độ chính xác của thiết bị sử dụng, yêu cầu sử dụng thiết bị
chuyên dụng, điều kiện thời tiết.
Thời gian/ kế hoạch: Có những thời điểm không thu mẫu đƣợc (mùa sinh sản).
Địa mạo: Rào cản của điều kiện tự nhiên không cho phép thu mẫu ví dụ nhƣ độ
sâu, tốc độ của dòng chảy vào mùa mƣa lũ, khoảng cách giữa các điểm thu mẫu quá
xa.
Kinh phí: Khả năng đáp ứng về kinh phí cho các phƣơng án lựa chọn.
5

- Các bƣớc triển khai:
Cụ thể hóa mục tiêu thu mẫu, yêu cầu về chất lƣợng của số liệu, liệt kê các hạn
chế về kinh phí, thời gian biểu, thiết bị chuyên dụng, cơ sở vật chất và nhân lực.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Xây dựng các phƣơng án thu mẫu khác nhau và quyết định sử dụng phƣơng án
thu mẫu theo kế hoạch hoặc theo kiểu tùy cơ ứng biến. Thu mẫu theo hoạch định là
tuân thủ nghiêm ngặt thiết kế thu mẫu. Thu mẫu theo kiểu tùy cơ ứng biến là xây dựng
quy trình thu mẫu trƣớc, đơn vị thu mẫu sẽ đƣợc xác định khi triển khai trong thực tế
và có thể đƣợc điều chỉnh căn cứ vào kết quả của lần thu năm trƣớc. Bất cứ thiết kế
nào đƣợc xây dựng củng phải đảm bảo đƣợc mục tiêu nghiên cứu đã đƣợc đề ra. Đánh
giá đƣợc ƣu nhƣợc điểm của từng kiểu thiết kế và dự tính trƣớc những trƣờng hợp cụ

thể nào gặp phải trong thực tế thì sẽ thay đổi thiết kế thu mẫu.
Xác lập công thức tính toán hiệu quả và chi phí cho từng giãi pháp thiết kế thu
mẫu. Với mỗi giãi pháp thiết kế xây dựng mô hình thống kê hoặc công thức toán học
để xác định hiệu quả của nó khi xét đến hiệu lực thống kê hoặc độ rộng của khoảng tin
cậy. Thƣờng để làm việc này cần xây dựng mô hình bao gồm các hợp phần của
phƣơng sai và ƣớc lƣợng phƣơng sai của tổng thể. Tƣơng tự, cho mỗi giãi pháp tính
thử chi phí cố định (chuẩn bị cho nghiên cứu) và chi phí vận hành (công thu mẫu/ mẫu
hoặc chi phí phân tích mẫu). Nếu ta thiết kế thu mẫu theo chủ ý sẽ không có bƣớc này.
Xác định kích thƣớc mẫu đáp ứng yêu cầu về chất lƣợng và các hạn chế khi thu
mẫu với kích thƣớc này. Tính toán kích thƣớc mẫu tối ƣu (và phân bổ mẫu nếu thu
mẫu nếu thu mẫu theo kiểu phân tầng hoặc phức tạp hơn). Thông thƣờng nếu biện
pháp sử dụng có độ chính xác không cao lắm, ít tốn kém thì ta thu đƣợc nhiều mẫu.
Ngƣợc lại phƣơng pháp có độ chính xác cao thƣờng tốn kém và vì thế hạn chế số
lƣợng mẫu thu. Ngƣời làm nghiên cứu phải lựa chọn và đƣa ra quyết định. Kiểm tra
xem các hạn chế (về hiệu quả, thời gian biểu, chi phí, thiết bị, cơ sở vật chất và nhân
lực) đã đƣợc khắc phục chƣa? Nếu không có phƣơng án thiết kế nào đạt yêu cầu thì ta
có thể chọn một trong những cách sau: Xây dựng lại phƣơng án thu mẫu, giảm bớt yêu
cầu về chất lƣợng thông tin sẽ thu thập, tăng độ rộng của khoảng tin cậy, khắc phục
các hạn chế, thay đổi hoặc điều chỉnh lại mục tiêu nghiên cứu (giảm bớt tham vọng
hơn).
Lựa chọn phƣơng án thu mẫu tiết kiệm nhất. Xem xét những ƣu điểm và sự chọn
lựa giữa hiệu quả và chi phí của các phƣơng án thu mẫu tốt nhất (đáp ứng đƣợc yêu
cầu của số liệu và khắc phục đƣợc những hạn chế về thời gian, kinh phí, thiết bị, nhân
lực, …). Tiếp tục xem xét các vấn đề mang tính thực tế hơn ví dụ nhƣ an toàn của
ngƣời nghiên cứu, ảnh hƣởng có thể của việc thu mẫu đến xã hội, môi trƣờng, nguy cơ
phát sinh chi phí, … Sau đó thống nhất để lựa chọn một phƣơng án tối ƣu nhất.
Mô tả chi tiết phƣơng án thu mẫu với kế hoạch dự phòng (contingency plans) khi
có tình huống không lƣờng trƣớc xảy ra khi thu mẫu ngoài thực địa, các biện pháp đảm
bảo chất lƣợng, liệt kê giả định làm cơ sở cho phƣơng án thu mẫu (đặc biệt là các giả
định sẽ đƣợc kiểm chứng trong quá trình thu mẫu và đánh giá sau này).

2.1.3. Các kiểu thu mẫu
Thu mẫu theo chủ ý (Judmental sampling)
6

Nhƣ đã trình bày ở trên thì đây là kiểu thu mẫu dựa vào các hiểu biết về đối
tƣợng hoặc điều kiện thu mẫu kết hợp với kinh nghiệm, phán đoán chuyên môn của
ngƣời nghiên cứu để xác định vị trí thu mẫu, kích thƣớc mẫu sẽ thu tại mỗi điểm. Kết
luận có thể rút ra đƣợc từ số liệu về tổng thể nghiên cứu bị hạn chế bởi tầm hiểu biết
của ngƣời làm nghiên cứu, không cho phép khái quát dựa trên các nguyên lý thống kê.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Nếu biết kết hợp thu mẫu theo kiểu này với những kiểu thu mẫu khác sẽ cho kết quả
rất tốt.
Thu mẫu theo chủ ý không nên đƣợc hiểu lầm với việc hiểu biết chuyên môn để
xây dựng phƣơng án thu mẫu tối ƣu (ví dụ nhƣ khi phải phân tầng tổng thể nghiên thu
mẫu). Kiểu thu mẫu này nên đƣợc áp dụng trong những trƣờng hợp sau:
- Số lƣợng mẫu có thể thu đƣợc không nhiều và mẫu chỉ để xác định một vài
thông số.
- Thời gian và kinh phí dành cho thu mẫu rất hạn chế.
- Ngƣời thiết kế thu mẫu có đầy đủ thông tin về đối tƣợng hoặc vùng nghiên cứu.
- Mục tiêu thu mẫu là nhằm cung cấp các số liệu ban đầu hoặc để phát hiện một
số thông số quan tâm (để xây dụng một chƣơng trình thu mẫu chi tiết hơn).
Các thông tin phải biết tùy thuộc vào lĩnh vực nghiên cứu. Ví dụ muốn thu mẫu

để xác định dƣ lƣợng thuốc trừ sâu phải biết loại thuốc trừ sâu đang sử dụng trong
vùng nghiên cứu, điểm xuất phát của chúng, chế độ thủy triều, dòng chảy của sông,
chu trình chuyển hóa và tích tụ thuốc trừ sâu qua chuổi thức ăn, vào bùn đáy, thời gian
phân hủy, ƣớc tính lƣợng thuốc trừ sâu sử dụng trong lƣu vực, …
Thu mẫu ngẫu nhiên (Random sampling)
Đây là kiểu thu mẫu đơn giản nhất. Các đơn vị thu mẫu thuộc tổng thể nghiên
cứu đều có xác suất đƣợc lựa chọn nhƣ nhau. Thƣờng sử dụng cách đánh số để chọn
ngẫu nhiên. Kiểu thu mẫu này phù hợp với những tổng thể nghiên cứu nhỏ hoặc độ
tƣơng đồng giữa các đơn vị của tổng thể nghiên cứu cao.
Ƣu điểm của phƣơng pháp thu mẫu này là khả năng xác định các thông số
thống kê một cách khách quan, dễ hiểu, dễ thực hiện và việc tính toán kích thƣớc
thƣớc mẫu cũng nhƣ kích thƣớc thống kê đơn giản.
Nhƣợc điểm của phƣơng pháp này là có thể do ngẫu nhiên mà các điểm thu
mẫu gần nhau quá, nhƣ vậy sẽ không đảm bảo đƣợc tính đại diện của mẫu. Thu mẫu
theo kiểu này sẽ không tận dụng đƣợc những hiểu biết đã có về đối tƣợng hoặc vùng
nghiên cứu.
Theo phƣơng pháp này trƣớc hết phải xác định kích thƣớc của mẫu. Muốn làm
đƣợc việc này trƣớc hết hết ta phải ƣớc tính phƣơng sai của tổng thể nghiên cứu. Các
thông tin sử dụng để ƣớc tính tổng thể nghiên cứu có thể lấy từ kết quả nghiên cứu thí
điểm hoặc nghiên cứu đƣợc thực hiện trên tổng thể gần giống với tổng thể nghiên cứu
hoặc dựa vào mô hình toán. Nếu không có thông tin gì về tổng thể thì sử dụng phép
ƣớc đơn giản sau: Độ lệch chuẩn = (Max - Min)/6. Giá trị Max và Min do ngƣời
nghiên cứu ƣớc đoán.

7

Tiếp theo ta lựa chọn địa điểm và đơn vị thu mẫu. Với một số nghiên cứu, đơn
vị nghiên cứu rất cụ thể nhƣ là trại nuôi, ao nuôi, hoặc con cá. Tuy nhiên khi nghiên
cứu trong môi trƣờng đất và nƣớc thì khó hơn nhiều. Ngƣời nghiên cứu phải xác định
đƣợc đơn vị nghiên cứu là gì. Kích thƣớc của từng đơn vị thu mẫu càng nhỏ thì sự biến

động giữa các đơn vị thu mẫu càng lớn. Sau khi đã liệt kê hết các thành phần của tổng
thể nghiên cứu theo thứ tự từ 1 đến n, dùng bảng số ngẫu nhiên để chọn ngẫu nhiên
các đơn vị thu mẫu cho đủ kích thƣớc mẫu đã xác định.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Hƣớng thu mẫu có thể là một, hai hoặc ba chiều. Khi thu mẫu theo không gian
ba chiều, việc chọn điểm thu mẫu trên bản đồ không khó. Nhƣng việc xác định điểm
thu mẫu, thu đƣợc đúng kích thƣớc mẫu cần thiết lại không phải dễ trong thực tế.
Cũng có thể dụng một kỹ thuật khác là quasi – random sampling. Dãy số ngẫu
nhiên quasi – random sampling tạo ra theo một trình tự ngẫu nhiên và vì thế không có
điểm nào trùng. Điều này giúp hạn chế tối đa việc các mẫu thu có thể “dính chùm” với
nhau khi chọn hoàn toàn ngẫu nhiên. Sử dụng thu mẫu ngẫu nhiên kết hợp với các kiểu
thu mẫu khác nhƣ phân tầng, phân bậc hay gộp có điều chỉnh.
Thu mẫu phân nhóm (Stratified sampling)
Kiểu thu mẫu này thích hợp với các tổng thể nghiên cứu mà ở đó có sự khác biệt
đáng kể giữa các đơn vị cấu thành. Ta có thể chia tổng thể ra làm nhiều nhóm không
có khoảng trùng lặp dựa trên những đặc điểm đã biết về tổng thể hoặc những suy luận
mang tính logic, có cơ sở (kết hợp với kiểu thu theo chủ ý). Việc phân chia này có thể
dựa vào đặc điểm cả đối tƣợng nghiên cứu theo thời gian hoặc không gian. Tính đồng
nhất trong từng nhóm sẽ cao hơn nhiều so với tính đồng nhất của cả tổng thể và nhƣ
thế cho phép ngƣời nghiên cứu ƣớc lƣợng chính xác hơn về các thuộc tính của tổng thể
vì tính đại diện của mẫu thu đƣợc đảm bảo. Thêm vào đó cho phép ngƣời nghiên cứu
tìm hiểu sâu hơn và có thể so sánh các nhóm này với nhau.

Thu mẫu hệ thống và phân ô (Systematic and grid sampling)
Với kiểu thu mẫu này, hoạt động thu mẫu đƣợc thực hiện một cách máy móc theo
trình tự thời gian hoặc khoảng cách không gian đã đƣợc định trƣớc. Thời điểm bắt đầu
hoặc điểm thu đầu tiên đƣợc lựa chọn một cách ngẫu nhiên. Các thời điểm hoặc điểm
thu còn lại sẽ đƣợc xác định dựa trên khoảng cách đã thiết kế (nếu theo không gian thì
phải chia ô). Ô có thể là hình vuông, hình chử nhật, hình tam giác hoặc rẻ quạt). Kiểu
thu mẫu này sẽ cho ta phát hiện xu hƣớng biến động theo thời gian hoặc không gian.
Nếu kích thƣớc mẫu lớn, tần suất thu mẫu ngắn, khả năng khái quát các diễn biến của
tổng thể nghiên cứu sẽ rất cao. Kiểu thu mẫu này đơn giản và dễ thực hiện cho phép
thực hiện dễ dàng các điểm thu mẫu theo nguyên tắc “ngẫu nhiên có hệ thống”.
Thu mẫu gộp thích ứng (adaptive cluster sampling)

8

Với kiểu thu mẫu này, n mẫu đƣợc thu một cách ngẫu nhiên từ tổng thể nghiên
cứu. Sau đó tiến hành thu thêm tại những điểm mà kết quả phân tích cho thấy cần đƣợc
quan tâm hơn (ví dụ những điểm phát hiện ra ô nhiễm hoặc có hiện tƣợng lạ). Vì thế
phải phân tích làm nhiều vòng. Kiểu thu này nhằm đảm bảo số liệu thu đƣợc là khách
quan mặc dù ngƣời nghiên cứu có khi phải thu quá nhiều mẫu tại một địa điểm. Kiểu
thu mẫu này rất hiệu quả nếu mục tiêu thu mẫu là phác thảo vùng phân bố của sinh vật
hay một yếu tố nào đó (ví dụ chất gây độc hại đến môi trƣờng). Điều kiện để thực hiện
là phƣơng pháp phân tích biến nghiên cứu để thu kết quả phải nhanh và lý tƣởng nhất
là không tốn kém. Khả năng phân tán của đối tƣợng nghiên cứu phải hạn chế. Ví dụ để
xác định các bãi giống sò huyết, đầu tiên vùng nghiên cứu đƣợc chia ô, sau đó chọn
ngẫu nhiên 10 ô. Dựa vào kết quả phân tích ban đầu này, nếu ô nào cho kết quả phân
tích mật độ sò cao thì tiếp tục thu mẫu các ô lân cạnh quanh nó.
Thu mẫu kết hợp (Composit sampling)
Kiểu thu mẫu này đƣợc áp dụng khi chi phí phân tích mẫu cao rong khi đó chi
phí thu mẫu lại thấp và phƣơng pháp thu đơn giản. Ngƣời nghiên cứu sẽ tiến hành thu
Trƣờng Đại học Quảng Bình


| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

nhiều đơn vị thu mẫu, trộn lẫn chúng với nhau để chỉ tạo ra một mẫu. Có thể tiến hành
nhƣ vậy với điều kiện việc trộn mẫu không ảnh hƣởng đến kết quả (ví dụ nhƣ hàm
lƣợng khí hòa tan) và sức khỏe của ngƣời nghiên cứu. Kiểu thu mẫu này chỉ có giá trị
khi ngƣời nghiên cứu chỉ quan tâm đến giá trị trung bình mà không quan tâm đến sự
biến động của biến nghiên cứu theo không gian hoặc thời gian hoặc mức độ biến động
của biến nghiên cứu trong tự nhiên là quá lớn (khó khăn cho việc phân tích số liệu).
2.1.4. Nguyên tắc thu mẫu
Nguyên tắc ngẫu nhiên
Đây là nguyên tắc đầu tiên của thu mẫu. Bởi vì thu mẫu một cách ngẫu nhiên sẽ
hạn chế đến mức tối đa các yếu tố làm sai lệch kết quả có thể do cố ý hoặc vô tình. Giả
sử bạn hƣớng dẫn một lớp sinh viên đi khảo sát vùng triều vào một ngày mƣa lạnh.
Mỗi sinh viên đƣợc giao nhiệm vụ thu toàn bộ các sinh vật (có thể gồm rất nhiều loài
động, thực vật khác nhau) tìm đƣợc trong một khung quadrat có diện tích 1 m2 (1,0 x
1,0 m) phân loại chúng. Cách thu là quăng khung quadrat đi một cách ngẫu nhiên, di
chuyển lại chỗ khung rơi xuống và tiến hành thu mẫu. Các sinh viên ngại mƣa gió
muốn xong việc cho nhanh sẽ chủ ý quăng khung vào các khu vực ít sinh vật phân bố,
có thể nhìn thấy bằng mắt (ví dụ nhƣ rong biển, rạn san hô trên đó có nhiều sinh vật
sống) hoặc đoán qua kiến thức đã đƣợc học (ví dụ nền cát sẽ ít sinh vật hơn trên rạn).
Nhƣ thế thông tin thu đƣợc sẽ không phản ánh chính xác các thuộc tính của quần xã
sinh vật đƣợc nghiên cứu. Cũng có khi vô tình mà thu mẫu tƣởng là ngẫu nhiên lại trở
thành chọn lọc. Trong một bể nuôi tôm 6 m 3 có 100 con, bạn dùng vợt nhỏ để bắt 10
con (10% của tổng thể) nhằm kiểm tra mức độ cảm nhiễm virus MBV (biết chắc chắn

là có). Kết quả là phần lớn những con bạn sẽ bắt đƣợc những cá thể yếu ớt, lờ đờ có
khả năng bơi lội, búng nhảy kém. Những cá thể này đa phần bị nhiễm mầm bệnh. Vì
thế tỉ lệ cảm nhiễm mà bạn xác định sẽ cao hơn mức thực của nó. Trong trƣờng hợp
này cần thiết phải đánh số từng con một rồi chọn lựa ngẫu nhiên 10 con số hoặc rút
mực nƣớc bể, bắt toàn bộ ra cho vào một cái xô nhỏ chứa lấp xấp nƣớc rồi bắt ngẫu
nhiên 10 con (trên cạn, chúng đều nằm một chỗ hết cả, nếu có búng nhảy thì cũng chỉ
trong xô - trong tầm kiểm soát của bạn).
Khi số lƣợng các cá thể của tổng thể không lớn lắm, ta có thể đánh số rồi dùng
bảng số ngẫu nhiên để chọn. Ví dụ nhƣ 63 con cá Chẽm bố mẹ trong lồng nuôi có thể
đƣợc đánh số bằng thẻ từ. Hay khu vực cửa sông nơi tiến hành khảo sát khu hệ thuỷ
sinh có thể chia thành nhiều ô nhỏ trên bản đồ rồi chọn ngẫu nhiên. Nhƣng nếu số
lƣợng các cá thể của tổng thể quá lớn, ví dụ nhƣ ở cảng cá có đến hàng nghìn con cá
Chẽm đƣợc ngƣ dân bày bán, ta phải dùng một thủ thuật gọi là “thu mẫu 2 giai đoạn”.
Chia số cá này ra làm n nhóm kích thƣớc (tuỳ ý ngƣời thu mẫu, ví dụ 100 con một
nhóm. Từ những nhóm này ta chọn ngẫu nhiên 1 hoặc một vài con để đƣợc số lƣợng
mẫu cần thiết.

9

Chỉ thu mẫu theo kiểu ngẫu nhiên nếu ta không có đủ thông tin về tổng thể
nghiên cứu (ví dụ nhƣ vùng nƣớc nào trong vịnh bị ảnh hƣởng bởi nƣớc ngọt từ sông
đổ vào hay ốc mƣợn hồn phân bố tập trung trên các rạn san hô chết ở vùng trung triều)
hoặc biết chắc chắn đối tƣợng nghiên cứu phân bố đều. Nói cách khác, phải sử dụng
tối đa mọi thông tin đã biết về tổng thể nghiên cứu để đảm bảo mẫu thu sẽ mang tính
đại diện cao nhất.
Nguyên tắc đại diện cao cho tổng thể nghiên cứu
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ



Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Mỗi cá thể là một phần tử của tổng thể nghiên cứu. Ta thƣờng ký hiệu số cá thể
của tổng thể nghiên cứu là N và thƣờng không xác định đƣợc chính xác các thuộc tính
của N. Ta ƣớc lƣợng các thuộc tính của N thông qua mẫu đại diện cho tổng thể nghiên
cứu. Tính đại diện thể hiện mức độ tƣơng đồng giữa kết quả đo đạc phân tích đƣợc
trên mẫu với giá trị thực của các thông số hay biến cần đo đạc trong tự nhiên. Không
phải trong trƣờng hợp nào thu mẫu một cách ngẫu nhiên cũng đảm bảo tính đại diện
cho tổng thể từ đó mẫu đƣợc thu. Tuy nhiên, việc thu mẫu một cách ngẫu nhiên sẽ
giúp cho số liệu thu đƣợc khách quan và đảm bảo tính độc lập, rất cần thiết cho các
kiểm nghiệm thống kê (Underwood 2005). Về nguyên tắc, nếu số lƣợng mẫu thu đủ
lớn thì các thông số thống kê của mẫu sẽ gần với các thuộc tính của tổng thể. Trong
thực tế thu nhiều mẫu sẽ tốn kém và trong nhiều trƣờng hợp không có khả năng thực
hiện đƣợc. Vì thế cần phải có phƣơng pháp thu mẫu hợp lý. Chẳng hạn trong tự nhiên,
ốc mƣợn hồn phân bố tập trung trên các rạn san hô chết gần bờ. Mật độ ốc ở các
khoảng trống giữa các rạn rất thấp. Ngƣời nghiên cứu, mặc dù lựa chọn các điểm thu
một cách ngẫu nhiên, có thể không xác định đƣợc chính xác mật độ trung bình của
quần thể ốc trên một khu vực cụ thể. Nếu phƣơng pháp thu mẫu không đảm bảo đƣợc
tính đại diện thì số liệu thu đƣợc sẽ không phản ánh chính xác (cao hơn hoặc thấp hơn)
các thuộc tính của tổng thể nghiên cứu. Chính vì thế cần phải làm mọi cách có thể để
đảm bảo tính đại diện.
Nguyên tắc lựa chọn kích thƣớc mẫu
Kích thƣớc mẫu (n) phụ thuộc vào kích thƣớc của tổng thể nghiên cứu, yêu cầu
về số liệu (hiệu lực thống kê, mức ý nghĩa, mức độ sai khác cần phát hiện khi cần so
sánh) và khả năng của ngƣời nghiên cứu (kinh phí, thời gian, trang thiết bị và nhân
lực). Với yếu tố thứ 3, nguyên tắc là tối đa kích thƣớc mẫu trong khả năng của mình.
Nhƣ đã đề cập, thu mẫu tức là nhằm thu thập số liệu cần thiết từ mẫu để qua các

thông số thống kê tính toán đƣợc ƣớc lƣợng tổng thể nghiên cứu. Kết quả sẽ chính xác
nếu tất cả các đơn vị cấu thành tổng thể đều đƣợc thu. Tuy nhiên, điều này hiếm khi
khả thi trong thực tế. Chính vì thế, kích thƣớc của mẫu phải đƣợc xem xét trong mối
tƣơng quan với kích thƣớc của tổng thể. Giả sử ta có một đàn Cua Scylla
paramamosain mẹ gồm 262 con sẽ sử dụng để thực hiện một chƣơng trình chọn giống.
Nếu muốn ƣớc tính sức sinh sản trung bình của mỗi cá thể trong đàn này để chuẩn bị
cơ sở vật chất nhƣ bể ấp, bể đẻ, bể ƣơng và ao nuôi khi tiến hành chọn giống ta có thể
tiến hành thu mẫu từ đàn này và cho đẻ thử theo một qui trình đã lựa chọn. Giả sử ta
chọn ngẫu nhiên 35 con. Nhƣ vậy ta đã sử dụng 13,4% số đơn vị của tổng thể nghiên
cứu. Nhƣng một ngƣời làm nghiên cứu khác, muốn ƣớc tính sức sinh sản trung bình
của loài cua này ở rừng ngập mặn Cần Giờ nếu chỉ sử dụng cùng một kích thƣớc mẫu
(n = 35) cho nghiên cứu của mình thì chƣa chắc số liệu đã đủ độ tin cậy, đặc biệt khi
tính ngẫu nhiên khi thu mẫu không đƣợc bảo đảm. Ví dụ nhƣ ngay tại điểm thu mẫu
đầu tiên ở Long Thạnh (một trong nhiều xã ở Cần Giờ) đã bắt đƣợc hơn 35 con rồi.
Trong thực tế, rất khó có thể biết đƣợc kích thƣớc của tổng thể mặc dù cũng có các
phƣơng pháp ƣớc đoán, ví dụ nhƣ chỉ số Lincoln.
10

Chỉ số Lincoln (Lincoln Index - LI) dùng để ƣớc đoán số lƣợng các cá thể có
trong một quần thể nhất định. Mẫu đƣợc thu 2 lần, đều hoàn toàn ngẫu nhiên. Lần thứ
1, đánh dấu toàn bộ các cá thể thu đƣợc, sau đó đem thả lại vào môi trƣờng. Lần thứ 2,
sau một khoảng một thời gian nhất định, thu lại và căn cứ trên số lƣợng các cá thể bị
đánh dấu có trong đợt này mà qui ra tổng số cá thể của quần thể.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu


N .n
LI 
r

August 19, 2015

Trong đó:
n: tổng số cá thể thu lần 1
N: tổng số cá thể thu lần 2
r: số cá thể đã được đánh dấu có trong lần thu 2

Ta cũng có thể ứng dụng nguyên tắc này để tiến hành nghiên cứu hoạt động khai
thác các đối tƣợng trên một khu vực xác định với điều kiện đối tƣợng nghiên cứu
không phải là loại có khả năng di chuyển rộng hoặc có vùng phân bố tƣơng đối tập
trung.
Nếu ta có thể thu đƣợc ngẫu nhiên khoảng 10% tổng thể, kết quả nghiên cứu sẽ
có độ tin cậy cao. Khi không thể ƣớc đoán đƣợc kích thƣớc của tổng thể, phải dựa vào
phƣơng sai và yêu cầu về số liệu để tính kích thƣớc mẫu cần thiết để đảm bảo ƣớc
lƣợng ta sẽ thực hiện là chính xác (95% độ tin cậy). Phƣơng sai thể hiện mức độ khác
biệt giữa các đơn vị cấu thành tổng thể và có thể lấy đƣợc từ các nghiên cứu trƣớc trên
cùng đối tƣợng hoặc qua một nghiên cứu sơ bộ mang tính thí điểm. Công thức tính
kích thƣớc mẫu nhƣ sau:
N

z 2 . 2
d2

Trong đó z chính là giá trị lấy từ phân phối chuẩn. Với độ tin cậy là 95%, z =
1,96. Nhƣ vậy z2 sẽ xấp xỉ bằng 4. Phƣơng sai của tổng thể (  2 ) có thể ƣớc lƣợng
bằng cách lấy phƣơng sai của mẫu (s 2) trong các nghiên cứu trƣớc hoặc nghiên cứu sơ

bộ. Còn d chính là sai số cho phép giữa trung bình của mẫu sẽ thu và trung bình của
tổng thể. Sai số này không tính bằng % mà tính bằng đơn vị đo đạc cụ thể.
2.2. Thiết kế thí nghiệm
Thiết kế thí nghiệm chính là xây dựng cách thức triển khai thí nghiệm một cách
hợp lý. Có nghĩa là số liệu thu đƣợc sẽ giúp ngƣời nghiên cứu lời đƣợc câu hỏi nghiên
cứu hoặc kiểm chứng đƣợc giả thuyết đặt ra về một hiện tƣợng quan sát đƣợc. Thiết kế
thí nghiệm bao gồm cả việc xác định cách xử lý số liệu (kiểm nghiệm thống kê sẽ sử
dụng) cho từng khả năng của kết quả sẽ thu đƣợc. Việc này phải thực hiện trƣớc khi
triển khai thí nghiệm. Ngƣời làm nghiên cứu vì thế phải dự báo đƣợc đến mức tối đa
các tình huống có thể xảy ra khi thực hiện nghiên cứu.
2.2.1. Tầm quan trọng của thiết kế thí nghiệm

11

Chất lƣợng của một thí nghiệm phụ thuộc vào chất lƣợng thông tin thu đƣợc từ
thí nghiệm. Chất lƣợng của thông tin phụ thuộc vào cách thức mà nó đƣợc thu thập.
Thí nghiệm, nếu không đƣợc thiết kế, chuẩn bị một cách kỹ lƣỡng thƣờng đem lại rất ít
thông tin hữu ích. Với nhiều ngƣời, thiết kế thí nghiệm thƣờng đi kèm với các yêu cầu
hiểu biết về thống kê và những thuật ngữ toán học rắc rối, tốn thời gian. Thực tế không
phải nhƣ vậy. Ngƣời làm nghiên cứu về NTTS hay sinh học chính là những nhà sinh
học chứ không phải nhà thống kê hay toán học. Thiết kế thí nghiệm đòi hỏi phải có sự
hiểu biết nhất định về đối tƣợng hoặc hệ thống nghiên cứu, tƣ duy logic và sự cẩn
trọng. Tiết kiệm thời gian cho thiết kế thí nghiệm sẽ không dành đƣợc nhiều thời gian
hơn cho công việc thu thập số liệu. Ngƣợc lại, dành thêm thời gian cho thiết kế thí
nghiệm sẽ giúp tiết kiệm thời gian và đảm bảo hiệu quả nghiên cứu của mình. Dƣới
đây là hai suy nghĩ nên tuyệt đối tránh:
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ



Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

- Cách thức thu thập số liệu không quan trọng bởi thế nào ta cũng sẽ tìm đƣợc
cách xử lý chúng. Nhận định này sai. Mặc dù có rất nhiều kiểm định thống kê nhƣng
mỗi một kiểm định lại có yêu cầu cụ thể về số liệu. Nếu số liệu không đáp ứng đƣợc
các giả định của thống kê, kết quả của kiểm định không có giá trị. Đôi khi ta có thể tìm
đƣợc một kiểm định khác mà số liệu thu đƣợc đáp ứng các giả định của nó. Nhƣng kết
quả của kiểm định lại không trả lời đƣợc câu hỏi nghiên cứu đặt ra. Ví dụ: kiểm định
phi tham số so sánh trung vị chứ không so sánh giá trị trung bình. Đa số các kiểm định
thống kê đều có yêu cầu chung về tính ngẫu nhiên và độc lập của số liệu. Nếu không
đáp ứng đƣợc yêu cầu này thì số liệu không có giá trị.
- Cố gắng thu thật nhiều số liệu. Thế nào ta cũng sẽ tìm đƣợc trong số đó những
số liệu tốt, giúp ta phát hiện ra những điều lý thú?! Nhận định này cũng sai. Số lƣợng
không đồng nghĩa với chất lƣợng. Nhiều số liệu chỉ giúp ngƣời làm nghiên cứu chứng
tỏ mình vất vả (đôi khi không cần thiết) mà thôi. Nếu số liệu thu đƣợc không giúp
ngƣời nghiên cứu trả lời một cách rõ ràng câu hỏi nghiên cứu, không đem lại sự tự tin
khi đƣa ra những kết luận thì việc thu thập những số liệu này là hoàn toàn vô ích. Chƣa
nói đến sự lãng phí thời gian, công sức và tiền bạc.
Trong thực tế, có khá nhiều nghiên cứu trong lĩnh vực NTTS thu thập số liệu
nhiều hơn mức cần thiết - điển hình là các đề tài điều tra. Trong các báo cáo này, phần
phụ lục rất dài với các số liệu thu đƣợc. Nhƣng kết quả đƣợc trình bày ở phần kết quả
nghiên cứu và thảo luận lại không nhiều. Một số tác giả đề cập trong phần phƣơng
pháp nghiên cứu các thông số cần phải đo đạc mà không hề đƣợc sử dụng khi phân
tích chỉ vì “các tác giả khác cũng làm nhƣ thế”. Nên nhớ quan tâm của các tác giả khác
không nhất thiết phải giống của bạn. Cần xem xét đề tài họ thực hiện khác gì so với đề
tài của bạn? Cơ sở nào khiến ngƣời ta chọn thông số A để đo đạc mà không phải thông
số B? Liệu có thông số nào tốt hơn thông số A để ta chọn không? Liệu tác giả mà ta

tham khảo có sai lầm không khi chọn thông số A? Ở một khía cạnh khác, trong một số
nghiên cứu, ngƣời nghiên cứu viện lý do thời gian và chi phí để giảm bớt số lƣợng
mẫu cần thu, giảm bớt số lần lặp lại của các nghiệm thức hay thu hẹp qui mô thí
nghiệm. Nếu bạn cũng có ý định tƣơng tự với nghiên cứu của mình hãy tự hỏi liệu các
số liệu thu đƣợc có đủ để đƣa ra các nhận định, kết luận không? Bạn nên đặt câu hỏi
này khi lập kế hoạch nghiên cứu chứ không phải sau khi đã thu thập hoặc thậm chí xử
lý xong số liệu.

12

Ngày nay, xã hội quan tâm nhiều đến tác động của NTTS lên môi trƣờng và
nguồn lợi. Không phải chỉ có các hoạt động ngành nghề thực tế mới có thể gây ra các
tác động này. Thí nghiệm, nghiên cứu cũng có thể có ảnh hƣởng tƣơng tự. Thí nghiệm
trong NTTS sử dụng sinh vật hoặc tài nguyên (đất, nƣớc, năng lƣợng,…) hoặc cả hai.
Thiết kế một thí nghiệm không hợp lý bạn sẽ phải làm lại thí nghiệm đó. Nhƣ thế bạn
đã tác động vào nguồn lợi và môi trƣờng hơn mức cần thiết. Muốn hiểu rõ hơn điều
này, hãy thử tƣởng tƣợng bạn đang nghiên cứu một đối tƣợng quí hiếm đang có nguy
cơ tuyệt chủng hoặc nghiên cứu ảnh hƣởng của một loại hoá chất độc hại nào đó đến
môi trƣờng thủy sinh. Mỗi lần bạn phải làm lại thí nghiệm là một lần bạn đẩy đối
tƣợng nghiên cứu này đến gần bờ vực của sự diệt vong hoặc tiếp tục hủy hoại môi
trƣờng trong trƣờng hợp thứ 2.
Có 2 lý do nữa khiến thiết kế thí nghiệm quan trọng đó là sự biến động thƣờng
thấy trong sinh học và “yếu tố gây nhiễu” (confounding factor). Trong tự nhiên luôn
hiện hữu sự khác biệt giữa các cá thể trong cùng một quần thể, giữa các quần thể với
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu


August 19, 2015

nhau. Tƣơng tự nhƣ vậy, điều kiện môi trƣờng của một vùng có thể biến đổi trong
ngày, theo tháng hoặc năm. Ngƣời nghiên cứu không thể cân một con cá trong đàn cá
để xác định khối lƣợng trung bình của các cá thể trong đàn hoặc đo độ trong của một
điểm tại vùng cửa sông mà qui ra độ trong của cả vùng. Số lƣợng quan sát phải nhiều
để hạn chế tối đa sai lệch của kết quả đo đạc so với thực chất. Thêm nữa, các hệ thống
sinh học thƣờng phức tạp và luôn thay đổi. Giả sử ta muốn so sánh hiệu quả của 4 loại
thức ăn khác nhau trong nuôi cá rô phi. Tốc độ tăng trƣởng của cá đƣợc chọn làm
thông số dùng để so sánh. Muốn tính đƣợc tốc độ tăng trƣởng, ta phải xác định khối
lƣợng đầu (khi mới bắt đầu thí nghiệm) và khối lƣợng cuối (khi kết thúc thí nghiệm).
Vào ngày kết thúc thí nghiệm, do số lƣợng cá nhiều nên phải mất cả buổi sáng ta mới
cân xong khối lƣợng thân của từng con cá trong 4 nghiệm thức thức ăn. Việc cân cá
vào các thời điểm khác nhau nhƣ vậy có ảnh hƣởng đến kết quả không? Câu trả lời là
có. Khối lƣợng thân của cá còn bị ảnh hƣởng bởi lƣợng thức ăn có trong ruột, tốc độ
tiêu hoá và hoạt động bài tiết. Nhƣ vậy thời điểm cân cá phải đồng nhất giữa các
nghiệm thức. Nếu không con còn nhiều thức ăn trong ruột sẽ đƣợc hiểu là con mau
lớn. Ngƣời nghiên cứu phải hạn chế tối đa không để các “yếu tố gây nhiễu” làm ảnh
hƣởng đến kết quả.
2.2.2. Các khái niệm trong thiết kế thí nghiệm
- Yếu tố (factor): là biến độc lập, do ngƣời làm nghiên cứu kiểm soát. Số lƣợng
các yếu tố trong một thí nghiệm có thể nhiều hơn 1. Thí nghiệm nghiên cứu ảnh hƣởng
của nhiều yếu tố gọi là Factorial. Càng nhiều yếu tố, thí nghiệm càng phức tạp, cả
trong việc thực hiện lẫn xử lý số liệu. Yếu tố nghiên cứu có thể là biến định lƣợng (ví
dụ: liều lƣợng hóc môn, hàm lƣợng protein) hoặc định tính (ví dụ: giới tính, màu sắc,
hình dạng); có thể là biến liên tục (ví dụ: chiều dài thân, khối lƣợng) hoặc gián đoạn
(số lần đẻ của tôm Sú, số ao nuôi của mỗi trại nuôi tôm).
- Mức (level): là một loại hình hoặc một trị số của yếu tố nghiên cứu. Chẳng hạn
yếu tố nghiên cứu là giới tính có 2 mức: đực và cái; yếu tố nghiên cứu là hàm lƣợng

protein trong thức ăn có thể gồm 4 mức: 20, 24, 27 và 30%. Trong các thí nghiệm
nghiên cứu ảnh hƣởng của một yếu tố thì mỗi mức sẽ là một nghiệm thức.
- Nghiệm thức (treatment): là tổ hợp giữa các mức của các yếu tố nghiên cứu.
Nếu thí nghiệm nghiên cứu ảnh hƣởng của nhiệt độ và độ mặn đến cƣờng độ hô hấp
của cá Trắm cỏ với 3 mức nhiệt độ (25, 28 và 31 oC) và 4 mức độ mặn (0, 2, 4 và 8 ppt)
thì tổng cộng có 12 nghiệm thức. Tức là 12 cách tổ hợp các mức nhiệt độ và độ mặn
vừa nêu. Nếu thiếu bất cứ một nghiệm thức nào thì thiết kế thí nghiệm đƣợc coi là
không đầy đủ (incomplete design). Việc xử lý số liệu của các thí nghiệm dạng này sẽ
khó khăn hơn và độ chính xác của kiểm định giảm.

13

- Đơn vị thí nghiệm (experimental unit): là một lần lặp lại của nghiệm thức theo
không gian (ao, bể, ruộng lúa) hoặc thời gian (các lần đo đạc cách nhau). Tổng số đơn
vị thí nghiệm sẽ bằng số nghiệm thức. Số lần lặp lại trong thí nghiệm đƣợc thiết kế cân
đối (balanced design). Nếu số lƣợng các đơn vị thí nghiệm không bằng nhau giữa các
nghiệm thức, kiểm định thống kê vẫn thực hiện đƣợc nhƣng hiệu lực thống kê sẽ giảm
và giả định về đồng nhất phƣơng sai có thể bị vi phạm nếu sự chênh lệch là quá lớn.
- Số liệu bị thiếu/mất (missing value): đôi khi trong quá trình làm thí nghiệm do
những trục trặc không lƣờng trƣớc đƣợc mà một vài đơn vị thí nghiệm có thể sẽ không
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

còn nữa khi kết thúc thí nghiệm. Vì thế mà ngƣời nghiên cứu không thu thập đủ số

liệu. Tất nhiên phải hết sức hạn chế trƣờng hợp này.
2.2.3. Các bƣớc cần thiết để thiết kế thí nghiệm
Trƣớc hết phải xác định rõ giả thuyết nghiên cứu. Không có giả thuyết rõ ràng,
không thể thiết kế thí nghiệm đƣợc. Sau đó, tiến hành thiết kế thí nghiệm giúp ta có thể
kiểm chứng đƣợc giả thuyết đã xác định một cách thuyết phục và dễ dàng nhất. Thí
nghiệm phải đƣợc thiết kế sao cho ngay cả ngƣời hoài nghi nhất cũng đồng ý với
những kết luận của bạn. Các kết luận dạng nhƣ “Nhiệt độ là yếu tố ảnh hƣởng chính
đến cƣờng độ trao đổi chất của cá (P<0.05). Tuy nhiên còn có một số yếu tố ảnh
hƣởng khác nhƣ độ mặn hoặc độ pH mặc dù ảnh hƣởng của chúng không đƣợc thể
hiện rõ trong thí nghiệm này (P<0.05)”. Kết luận dạng “nƣớc đôi” nhƣ thế này sẽ bị
bác bỏ bởi phản biện, là những ngƣời có trình độ và rất cẩn trọng trong việc đƣa ra kết
luận.
Với các đề tài lớn, cần phải triển khai thí nghiệm sơ bộ (hay gọi là thí điểm)
trƣớc khi tiến hành thí nghiệm lớn. Triển khai một thí nghiệm thí điểm sẽ giúp ngƣời
nghiên cứu hoàn thiện kỹ thuật thu mẫu, thu thập thêm các thông tin cần thiết về đối
tƣợng và phát hiện các điểm bất hợp lý hoặc sai sót trong thiết kế ban đầu. Không nên
vội vã làm ngay thí nghiệm lớn và dùng sức ép về thời gian để biện hộ cho mình. Thí
nghiệm sơ bộ còn giúp ngƣời nghiên cứu kiểm chứng tính hợp lý của giả thuyết nghiên
cứu, đặc biệt khi ý tƣởng nghiên cứu là do ngƣời khác gợi ý. Quan sát kỹ đối tƣợng
nghiên cứu còn giúp ta nảy sinh ra các ý tƣởng nghiên cứu mới. Cuối cùng, đề tài
nghiên cứu là của bạn, do bạn làm. Nếu không có kết quả, bạn không thể đổ lỗi cho
ngƣời khác. Làm thí nghiệm sơ bộ còn giúp ta kiểm tra các kỹ thuật thu mẫu hay điều
chỉnh cách thức, thời gian, qui mô của thí nghiệm.
Một ngƣời làm nghiên cứu thiết kế thí nghiệm của mình có 6 nghiệm thức, mỗi
nghiệm thức lặp lại 3 lần, tổng cộng có 18 đơn vị thí nghiệm. Tuy nhiên, chỉ để dọn vệ
sinh cho 18 bể nuôi thôi, đã hết buổi sáng không đủ thời gian để thực hiện các công
việc khác. Một ngƣời khác nghiên cứu chu kỳ lột xác của tôm Mũ ni ở cỡ thƣơng
phẩm trong thời gian 2 tháng. Trong suốt 2 tháng chẳng có con nào lột xác cả vì
khoảng thời gian giữa hai lần lột xác của tôm Mũ Ni rất dài. Tƣơng tự, tôm Bạc thẻ
nuôi trong bể không chết vì yếu tố gây ảnh hƣởng mà do tranh thức ăn rồi nhảy ra

ngoài, rơi xuống đất mà chết. Hoặc lƣới sử dụng để chặn trứng trong bể đẻ của tôm bị
bịt kín khi tôm đẻ, nƣớc tràn hết ra ngoài khiến cho việc ƣớc lƣợng sức sinh sản thiếu
chính xác. Nếu chƣa có kinh nghiệm nghiên cứu và không làm thí nghiệm sơ bộ, rất
khó lƣờng trƣớc các chi tiết này. Làm thí nghiệm sơ bộ còn có lợi ở chỗ ta kiểm tra
kích thƣớc mẫu, thiết kế thí nghiệm của mình có phù hợp chƣa khi thử phân tích kết
quả theo hƣớng đã chọn và có các điều chỉnh thích hợp.
2.2.4. Các loại thí nghiệm
Có hai loại thí nghiệm: mô tả (measurative) và điều khiển (manipulative) hoặc
kết hợp cả hai.
14

Thí nghiệm xác định tƣơng quan (correlational) thuộc loại thứ nhất. Quan sát, mô
tả trong tự nhiên thƣờng dễ thực hiện và ít tốn kém hơn về kinh phí lẫn công sức.
Ngoài ra, nó giúp hạn chế các thí nghiệm “phi thực tế” ví dụ nhƣ nghiên cứu về khả
năng thích ứng với nhiệt độ mà tốc độ tăng hay giảm nhiệt độ lại cao đến 1 oC/3 phút
hay 3 oC/9 phút. Trong thực tế, nhiệt độ nƣớc ở các thủy vực hay trong ao nuôi không
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

tăng giảm với tốc độ nhƣ thế đƣợc. Tuy nhiên, thí nghiệm dạng mô tả khi thực hiện
ngoài tự nhiên lại gặp rắc rối với các yếu tố gây nhiễu (confounding factor) hoặc “tác
dụng ngƣợc”. Ngƣời làm nghiên cứu cho rằng biến A tác động lên biến B nhƣng thực
ra chính thay đổi của B kéo theo thay đổi của A. Tƣơng tự, ta khó biết A tác động trực
tiếp lên B hay thông qua một biến khác là C. Có thể lấy ví dụ về lập luận rất nổi tiếng

của Ronald Fisher rằng không phải thuốc là gây ra bệnh mà chính là stress gây bệnh và
ngƣời bị stress thƣờng hay hút thuốc. Có tƣơng quan không có nghĩa là tồn tại quan hệ
nhân quả. Các nghiên cứu về bệnh ký sinh trùng trên cá Tuyết ở Na Uy cho thấy một
sự trùng hợp ngẫu nhiên. Mức độ cảm nhiễm của cá tăng trong các
tháng có chữ “r”. Vào các tháng 5, 6, 7 và 8 bệnh không xuất hiện. Yếu tố qui định tất
nhiên không phải là chữ “r”.
Trong một số trƣờng hợp, ngƣời ta không thể làm thí nghiệm điều khiển đƣợc. Ví
dụ ta không thể thay đổi đƣợc màu sắc của con cá theo ý muốn. Cũng không thể làm
thí nghiệm xem ảnh hƣởng của hoá chất gây ung thƣ Treflan lên công nhân kỹ thuật ở
trại sản xuất tôm giống. Thông thƣờng thì kết hợp hai dạng nghiên cứu trên sẽ đem lại
hiệu quả cao hơn. Đặc biệt khi ta muốn đi sâu vào nghiên cứu bản chất của hiện tƣợng
mà còn có quá nhiều phân vân khi suy đoán yếu tố nào là quan trọng hơn và yếu tố nào
ảnh hƣởng đến yếu tố nào. Nhƣ thế, tốt nhất là làm một nghiên cứu mô tả - tìm tƣơng
quan, sau đó hãy nghiên cứu sâu vào bản chất dựa trên những kết quả đã thu thập
đƣợc.
Ngƣời làm nghiên cứu sẽ phải quyết định sẽ tiến hành thí nghiệm trong phòng
(hoặc ao, bể với khả năng kiểm soát tốt) hay là ngoài thực tế. Mỗi lựa chọn đều có
những ƣu và nhƣợc điểm nhất định. Nơi đều có cái lợi và bất lợi riêng. Làm thí
nghiệm trong phòng ta có thể khống chế những điều kiện quan trọng, tách riêng các
yếu tố để quan sát ảnh hƣởng của chúng và thuận tiện trong việc thu số liệu. Tuy nhiên
cần phải xem xét sinh vật ta định làm thí nghiệm có thích ứng đƣợc với điều kiện nuôi
giữ không. Ví dụ nếu muốn làm thí nghiệm về chế độ dinh dƣỡng cho mực Nang vân
hổ ta phải chắc chắn mực có thể đẻ trứng trong điều kiện nuôi nhốt nếu sử dụng khả
năng sinh sản làm tiêu chuẩn đánh giá. Điều này rất khó xảy ra đối với cá Chẽm bố mẹ
bắt từ tự nhiên về.
Làm thí nghiệm trong điều kiện nhân tạo có thể không phản ảnh hết các mối
quan hệ phức tạp trong thực tế. Chẳng hạn một nghiên cứu trong phòng thí nghiệm kết
luận rằng tôm Sú đực có thể tạo tinh nang mới (có khả năng thụ tinh cho trứng) trong
vòng 20 ngày chỉ đúng với điều kiện thí nghiệm mà tác giả đã tiến hành thôi. Nếu điều
kiện thí nghiệm giống nhƣ qui trình nuôi tôm bố mẹ phổ biến trong sản xuất thì tính

ứng dụng sẽ cao. Trong tự nhiên, khi điều kiện dinh dƣỡng không đủ, môi trƣờng
không thuận lợi, bị địch hại rƣợt đuổi có thể tôm đực sẽ phải mất nhiều thời gian hơn
để phục hồi lại tinh nang của mình sau khi giao vĩ. Tuy nhiên, phải khẳng định một
điều là kết quả thí nghiệm là các thông tin quan trọng giúp ta tìm hiểu và phỏng đoán
các hiện tƣợng trong tự nhiên. Làm thí nghiệm trong thực tế thƣờng tốn kém và khó
khống chế đƣợc điều kiện thí nghiệm. Vì vậy, nếu có thể đƣợc nên làm cả 2 bƣớc,
trƣớc hết trong phòng thí nghiệm, sau đó ra thực tế.
15

2.2.5. Nguyên tắc thiết kế thí nghiệm
Mục tiêu của thiết kế thí nghiệm là tối ƣu hoá hiệu lực thống kê (statistical power
hoặc power of test), tức là khả năng phát hiện khác biệt giữa các nghiệm thức. Hiệu lực
thống kê phụ thuộc vào:
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

- Mức độ ảnh hƣởng (effective size) của yếu tố nghiên cứu.
- Mức độ sai khác tự nhiên giữa các đơn vị thí nghiệm (random variation).
- Số lần lặp lại.
Nếu ta thử nghiệm đƣa Mazzal vào bể ƣơng và kiểm tra sự khác biệt về chất
lƣợng nƣớc (ví dụ qua hàm lƣợng NH3-N) thì sự khác biệt về hàm lƣợng NH3-N giữa
nghiệm thức có sử dụng và không sử dụng Mazzal chính là mức độ ảnh hƣởng. Yếu tố
ảnh hƣởng càng mạnh thì khác biệt này càng lớn, vì thế càng dễ phát hiện và ngƣợc lại.
Nếu khác biệt tự nhiên giữa các đơn vị thí nghiệm lớn thì khả năng phát hiện khác biệt

giữa các nghiệm thức càng nhỏ. Số lần lặp lớn sẽ hạn chế đƣợc khác biệt tự nhiên và
nhờ đó gia tăng xác suất phát hiện đƣợc ảnh hƣởng của yếu tố nghiên cứu. Nhƣ vậy
hiệu lực thống kê phụ thuộc một phần vào bản chất của đối tƣợng nghiên cứu và yếu tố
ảnh hƣởng, và một phần vào cách thức làm thí nghiệm (số lần lặp, thiết kế thí nghiệm).
Ngƣời làm nghiên cứu không thể thay đổi đƣợc tự nhiên nhƣng có thể thay đổi đƣợc
thiết kế thí nghiệm. Vì thế cần phải có phỏng đoán tốt về 2 yếu tố ban đầu để có thể
thiết kế thí nghiệm phù hợp.
Thiết kế thí nghiệm cần tuân thủ nghiêm ngặt 5 nguyên tắc, đó là: lặp lại, có đối
chứng, ngẫu nhiên, độc lập và hạn chế các sai khác không giải thích đƣợc giữa các
nghiệm thức. Để áp dụng các nguyên tắc này một cách có hiệu quả, ngƣời nghiên cứu
cần có hiểu biết nhất định về đối tƣợng nghiên cứu. Đối tƣợng nghiên cứu và câu hỏi
nghiên cứu không giống nhau giữa các thí nghiệm. Vì thế thiết kế thí nghiệm này có
thể khác hoàn toàn so với thiết kế thí nghiệm kia nhƣng 5 nguyên tắc trên phải đƣợc
bảo đảm.
- Lặp lại (replication): khi nghiên cứu về một tổng thể, phép đo đạc nếu chỉ thực
hiện một lần sẽ không đại diện đƣợc cho giá trị trung bình của tổng thể vì các đơn vị
cấu thành lên tổng thể không giống nhau. Ngƣời làm nghiên cứu hạn chế sai số này
bằng cách thực hiện phép đo đạc nhiều lần, mỗi lần trên một hoặc một nhóm đơn vị
cấu thành lên tổng thể. Nếu là thí nghiệm dạng mô tả thì tiến hành mô tả đối tƣợng
nghiên cứu dựa trên nhiều quan sát. Nếu là thí nghiệm dạng điều khiển thì điều kiện thí
nghiệm đƣợc lặp lại nhiều lần để đo lƣờng phản ứng của đối tƣợng nghiên cứu.
Về nguyên tắc, số lần lặp lại càng nhiều, kết quả càng chính xác. Tuy nhiên, lặp
lại nhiều lần sẽ tốn thời gian, kinh phí và vật liệu dùng làm thí nghiệm. Câu hỏi mà
mọi ngƣời nghiên cứu đều quan tâm là “bao nhiều lần lặp là đủ để có thể đƣa ra đƣợc
kết luận chính xác?”. Việc quyết định số lần lặp lại phụ thuộc vào kinh nghiệm nghiên
cứu trên đối tƣợng và nếu có đủ thông tin về đối tƣợng ta có thể ƣớc tính đƣợc. Thông
thƣờng khi làm thí nghiệm, mỗi nghiệm thức phải đƣợc lặp lại tối thiểu là 3 lần.

16


- Có đối chứng (concurent controls): so sánh nếu không có đối chứng thì sẽ khập
khiễng. Ví dụ: nếu so sánh kết quả học tập môn Kỹ thuật Nuôi Hải sản của sinh viên
khoá K35 đƣợc dạy bằng phƣơng pháp mới với kết quả học tập của sinh viên K34 là
không hợp lý. Khả năng tiếp thu của hai nhóm sinh viên khác nhau, điều kiện học tập
không giống nhau khiến cho phép so sánh không thuyết phục. Đối chứng tốt nhất là
một nửa sinh viên K35 học theo phƣơng pháp cũ. Giữa đối chứng và nghiệm thức chỉ
khác biệt về yếu tố nghiên cứu. Ví dụ nếu ta tiêm cá với hóc môn, thì đối chứng dù
không tiêm hóc môn cũng sẽ phải tiêm nƣớc cất. Nếu tỉ lệ sống không phải là yếu tố
quan tâm nghiên cứu (ví dụ sức sinh sản) thì tôm cắt mắt và không cắt mắt cũng sẽ
phải chịu tác động của ngƣời làm nghiên cứu nhƣ nhau.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Có 2 kiểu đối chứng: âm và dƣơng. Đối chứng âm so sánh việc can thiệp với
không can thiệp để biết can thiệp vào hệ thống có đem lại hiệu quả gì không. Đối
chứng dƣơng so sánh các biện pháp mới với biện pháp đang sử dụng. Tức là đều tác
động để biết cái nào tốt hơn. Xét về thời gian có 2 kiểu đối chứng: lịch sử (historical )
và đồng thời (concurrent). Đối chứng theo kiểu lịch sử là so sánh với số liệu đã công
bố. Đối chứng đồng thời là so với số liệu thu đƣợc cùng một lúc. Chọn đối chứng theo
kiểu lịch sử sẽ khiến thí nghiệm đơn giản hơn. Tuy nhiên kết luận lại thiếu tính thuyết
phục vì sự khác biệt về điều kiện thí nghiệm và các yếu tố ảnh hƣởng khác mà ta
không biết đƣợc. Đối chứng kiểu đồng thời tốt hơn nhiều vì nó đảm bảo điều kiện thí
nghiệm tƣơng đồng ngoại trừ yếu tố nghiên cứu.
- Ngẫu nhiên hóa (randomization): có nghĩa là thu mẫu một cách ngẫu nhiên,

phân bổ nghiệm thức vào các đơn vị thí nghiệm một cách ngẫu nhiên. Tại sao phải
vậy? Giả sử ta so sánh tốc độ tăng trƣởng của cá chọn giống và cá tự nhiên. Mỗi nhóm
400 con nuôi trong 8 bể, mật độ là 50 con/bể. Cho 8 bể vào trong nhà. Nếu sắp xếp
không khéo thì có thể có bể sẽ chịu tác động của một yếu tố khác (cƣờng độ chiếu
sáng) và nhƣ thế sẽ ảnh hƣởng đến kết quả nghiên cứu. Cá thả vào từng bể nếu ta thả
theo thứ thự của nghiệm thức thì có thể sẽ gặp trƣờng hợp con khoẻ vào hết một
nghiệm thức. Nhắm mắt bắt cá không phải là ngẫu nhiên, con khoẻ chạy mất, con to dễ
bắt hơn. Lựa chọn vô tình cũng là một vấn đề nữa, đặc biệt cho các đề tài điều tra. Ví
dụ xem trình độ học vấn của ngƣời NTTS, phát ra 300 phiếu, thu về 180. Trong số 180
phiếu này có 150 phiếu của ngƣời tốt nghiệp trung học trở lên. Kết luận 83,3% ngƣời
nuôi tôm có trình độ học vấn trên trung học? Chƣa chắc, 120 ngƣời không trả lời có thể
họ không biết chữ, có thể họ không có đủ trình độ để trả lời các câu hỏ i khác trong
phiếu điều tra. Hay điều tra trên mạng internet tự nó đã sàng lọc đối tƣợng tham dự
điều tra rồi.

17

- Các đơn vị thí nghiệm phải độc lập (independence): có nghĩa là giá trị đo đƣợc
trên đơn vị thí nghiệm này không ảnh hƣởng hoặc bị ảnh hƣởng bởi giá trị đo đƣợc
trên các đơn vị thí nghiệm khác. Ví dụ để xác định tỉ lệ đực cái của tôm Sú nói chung,
nghiên cứu viên A bắt 5.000 con tôm từ một ao nuôi, kiểm tra giới tính để biết số
lƣợng con đực và con cái. Thiết kế này sẽ sai nếu 5.000 con tôm này đ ều từ một con
tôm mẹ vì các đơn vị thí nghiệm (cá thể tôm) có quan hệ huyết thống với nhau. Tỉ lệ
đực cái thƣờng là 1:1 cho toàn bộ tổng thể nhƣng cho một gia đình tôm duy nhất thì
không nhất thiết phải là nhƣ vậy. Lấy một ví dụ khác: nghiên cứu viên B có 12 con cá
Bớp mẹ và muốn nghiên cứu ảnh hƣởng của các yếu tố môi trƣờng đến khả năng thành
thục của chúng trong bể nuôi. Ngƣời này tiến hành 3 thí nghiệm. Lần 1 xem xét ảnh
hƣởng của nhiệt độ, lần 2 xem xét ảnh hƣởng của độ mặn và lần 3 xem ảnh hƣởng của
chu kỳ quang. Mỗi lần thí nghiệm đều lặp lại 12 lần, sử dụng 12 con cá, mỗi con nuôi
trong một bể. Số liệu thu đƣợc không độc lập bởi vì cá sử dụng cho thí nghiệm sau đã

chịu ảnh hƣởng khác nhau của thí nghiệm trƣớc. Khi thí nghiệm tác dụng của kháng
sinh ta không thể lấy khuẩn lạp (trên cùng một đĩa cấy) làm đơn vị thí nghiệm lặp lại
đƣợc (đĩa này ngoài kháng sinh ra còn có thể có những yếu tố khác ảnh hƣởng đến sự
phát triển của vi khuẩn mà chúng ta không biết). Đơn vị thí nghiệm phải là đĩa petri có
cấy vi khuẩn theo cùng một phƣơng pháp, sử dụng cùng môi trƣờng và điều kiện cấy ủ.
Để đảm bảo nguyên tắc này, ngƣời làm nghiên cứu nên chọn đơn vị thí nghiệm là
đơn vị chịu tác động trực tiếp của yếu tố nghiên cứu. Ví dụ nếu ta thay đổi nhiệt độ
nƣớc trong bể ƣơng thì đơn vị thí nghiệm phải là bể (trong đó có nhiều ấu trùng).
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Nhƣng nếu ta tiêm hóc môn cho cá đã thành thục để dục đẻ thì có thể dùng cá thể làm
đơn vị thí nghiệm. Tuy nhiên, phải đảm bảo rằng hoạt động đẻ trứng của con này
không ảnh hƣởng đến những con khác và ngƣợc lại. Trong NTTS, chọn đơn vị thí
nghiệm là bể hoặc một nhóm sinh vật bao giờ cũng an toàn hơn và giúp hạn chế các rủi
ro nhƣ vật thí nghiệm chết (nếu đơn vị thí nghiệm là cá thể thì sẽ mất số liệu này) hoặc
khác biệt tự nhiên giữa các cá thể quá lớn.
- Hạn chế tối đa các sai khác không giải thích đƣợc (unexplained variance): khi
thiết kế thí nghiệm, ngƣời làm nghiên cứu phải đảm bảo loại trừ khả năng các yếu tố
không thuộc quan tâm của nghiên cứu có thể làm sai lệch kết quả. Chẳng hạn nếu thí
nghiệm nghiên cứu ảnh hƣởng của nhiệt độ thì các yếu tố khác phải đƣợc chuẩn hoá
giữa các nghiệm thức. Nếu nghiên cứu là để đánh giá hiệu quả của một số loại thức ăn
công nghiệp thì thức ăn tự nhiên hoặc phải đƣợc loại bỏ ra khỏi hệ thống nuôi hoặc
bằng cách nào đó đồng nhất giữa các nghiệm thức. Trong nghiên cứu về NTTS, cần

chú ý nhiều đến nguồn gốc của sinh vật sử dụng làm thí nghiệm. Không dùng một
nhóm sinh vật cho một nghiệm thức và một nhóm khác biệt về nguồn gốc cho các
nghiệm thức còn lại. Nhƣ thế ảnh hƣởng của yếu tố nghiên cứu sẽ bị pha trộn với ảnh
hƣởng của yếu tố gây nhiễu là di truyền hoặc điều kiện sống của sinh vật trƣớc khi đƣa
vào thí nghiệm.
Không có thiết kế thí nghiệm nào là hoàn hảo một cách tuyệt đối. Nếu không thể
tránh đƣợc một số hạn chế, ta cứ làm thí nghiệm. Vấn đề quan trọng là ở chỗ phải hết
sức cẩn thận khi đƣa ra kết luận. Khi so sánh 2 loài thì chỉ kết luận cho 2 loài, đừng
mở rộng kết luận ra cho tất cả các loài. Tránh các kết luận phiến diện, ví dụ nhƣ “hầu
sống ở vùng ven biển chậm lớn hơn ở vùng của sông do ảnh hƣởng của độ mặn”. Nên
nhớ ngoài độ mặn ra còn có nhiều yếu tố ảnh hƣởng khác nhƣ nhiệt độ, dòng chảy,
lƣợng và chủng loại thức ăn. Kết luận đúng phải là “độ mặn ảnh hƣởng đến tốc độ tăng
trƣởng của hầu”.
2.2.6. Một số kiểu thiết kế thí nghiệm
Ngẫu nhiên Hoàn toàn (Complete Randomized Design)
Là kiểu thiết kế thí nghiệm đơn giản nhất. Các đơn vị thí nghiệm đƣợc phân bổ
một cách hoàn toàn ngẫu nhiên vào các nghiệm thức. Nếu ta chỉ nghiên cứu ảnh hƣởng
của một yếu tố (ví dụ nhƣ nhiệt độ) thì kiểm nghiệm thống kê sẽ sử dụng là t-test nếu
chỉ có 2 nghiệm thức hoặc phân tích phƣơng sai 1 yếu tố (one-way ANOVA) nếu có từ
3 nghiệm thức trở nên. Đây gọi là thí nghiệm 1 yếu tố. Nếu ta nghiên cứu ảnh hƣởng
của 2 yếu tố (ví dụ thêm số lần cho ăn hoặc độ mặn) thì là sẽ sử dụng phân tích
phƣơng sai 2 yếu tố. Tuy nhiên nên giới hạn số yếu tố nghiên cứu.

18

Điều kiện để chọn kiểu thiết kế ngẫu nhiên hoàn toàn là khác biệt giữa các đơn vị
thí nghiệm không có hoặc không đáng kể. Điều này thƣờng chỉ khả dĩ trong phòng thí
nghiệm, chứ ít khi đạt đƣợc ngoài thực tế. Chẳng hạn, ta làm một thí nghiệm nghiên
cứu ảnh hƣởng của việc xử lý nƣớc bằng ozone và sử dụng thức ăn nhân tạo của
Biomar thay thế Artemia nauplii khi ƣơng nuôi ấu trùng cua biển Scylla paramamosain

ở giai đoạn Z4 - Z5 với mật độ ƣơng là 40 con/L. Đây là thí nghiệm nghiên cứu ảnh
hƣởng của 2 yếu tố: chất lƣợng nƣớc và điều kiện dinh dƣỡng. Theo ngƣời thiết kế thí
nghiệm, yếu tố thứ nhất có 2 mức: nƣớc có xử lý và không xử lý ozone sau khi đã lọc
qua bộ lọc cát. Yếu tố thứ 2 có 3 mức: cho ăn hoàn toàn bằng Artemia nauplii (đối
chứng) với mật độ 5 nauplii/mL, cho ăn kết hợp 5 g thức ăn Biomar/ngày/m 3 với duy
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

trì mật độ 2 nauppli/mL và cho ăn hoàn toàn bằng thức ăn Biomar với liều lƣợng là 7
g/ngày/m3. Nhƣ vậy, thí nghiệm có tất cả là 6 nghiệm thức. Nếu ngƣời làm nghiên cứu
quyết định chọn số lần lặp lại của các nghiệm thức là 3 thì tổng cộng cần có 18 đơn vị
thí nghiệm. Mỗi đơn vị thí nghiệm là một bể ƣơng có dung tích 100 L. Các bể ƣơng
này phải tƣơng đồng nhau về mọi mặt. Ngƣời làm nghiên cứu có thể phân bổ ngẫu
nhiên 6 nghiệm thức vào 18 đơn vị thí nghiệm bằng cách làm 18 lá thăm. Mỗi lá đại
diện cho 1 đơn vị thí nghiệm (bể ƣơng) rồi bắt ngẫu nhiên 3 lá cho 1 nghiệm thức.
Thiết kế dạng khối (Block Design)
Khi có một yếu tố nào đó có thể làm ảnh hƣởng đến kết quả nghiên cứu (i.e. làm
tăng mức độ biến động của biến nghiên cứu giữa các đơn vị thí nghiệm, hoặc giữa
những cá thể của tổng thể nghiên cứu), ta có thể hạn chế ảnh hƣởng của yếu tố này
bằng cách phân khối. Ngƣời nghiên cứu sẽ chia các đơn vị thí nghiệm thành nhiều
khối. Các đơn vị trong cùng một khối có chung giá trị của yếu tố bị phân khối. Sau đó
từ mỗi khối này, ta sẽ chọn ngẫu nhiên các đơn vị thí nghiệm để phân bổ vào các
nghiệm thức. Ví dụ: so sánh tỉ lệ thành thục của cá với 2 phƣơng pháp khác nhau:
dùng hóc môn và kích thích sinh thái (bằng dòng chảy, nhiệt độ). Cá đƣa vào làm thí

nghiệm có con già con non, con lớn con bé. Nếu ta so sánh một cách đơn thuần, thì
giữa 2 nhóm lúc này ngoài sự khác biệt về cách thức chúng đƣợc kích dục còn có ít
nhất là một điểm khác biệt khác chƣa đƣợc kiểm soát. Tỉ lệ thành thục của cá khi đó
không chỉ phụ thuộc vào yếu tố nghiên cứu (phƣơng pháp kích dục) mà có thể phụ
thuộc vào tuổi của cá (thông tin đã đƣợc công bố hoặc kinh nghiệm cho biết điều này).
Nhƣ vậy tuổi của cá phải đƣợc phân khối. Ta sẽ xếp cá thành nhiều nhóm tuổi. Khi đó
ta sẽ so sánh tỉ lệ thành thục của cá trong từng nhóm tuổi hơn là so sánh chung (đây là
kiểu bố trí thí nghiệm gần giống nhƣ thí nghiệm 2 yếu tố) và sẽ khai báo dùng “block”
khi dùng kiểm định ANOVA một yếu tố. Nếu trong mỗi block đều có đại diện của mỗi
nghiệm thức và số nghiệm thức trong từng block là nhƣ nhau thì gọi là thiết kế theo
kiểu khối ngẫu nhiên hoàn toàn (completely randomized block design). Có thể bố trí
thí nghiệm theo kiểu khối ngẫu nhiên không hoàn toàn nhƣng xử lý số liệu sẽ khó
khăn. Nếu bạn định bố trí thí nghiệm theo dạng này, nên tham khảo chuyên gia thống
kê để đƣợc tƣ vấn về phƣơng pháp xử lý số liệu trƣớc khi tiến hành nghiên cứu.

19

Nguyên tắc của việc phân khối là để so sánh ảnh hƣởng của yếu tố nghiên cứu
trong từng khối nơi mà sự khác biệt giữa các đơn vị thí nghiệm là nhỏ nhất, chứ không
so sánh chung giữa các nghiệm thức vì sự khác biệt sẽ lớn hơn rất nhiều. Có 3 kiểu
phân khối: đơn vị thí nghiệm, không gian (giữa các ao, giữa các trại, giữa các vùng)
hoặc thời gian (lặp lại thí nghiệm giữa các tháng, hay khi không đủ bể làm thí
nghiệm). Lƣu ý là phân khối chỉ có hiệu quả nếu yếu tố bị phân khối (blocked) thực sự
có ảnh hƣởng đến kết quả của yếu tố ta nghiên cứu lên biến nghiên cứu, ví dụ nhƣ tuổi
của cá khi nghiên cứu khả năng dục đẻ bằng các loại hóc môn khác nhau. Nếu yếu tố
này không có ảnh hƣởng gì đến biến nghiên cứu thì phân khối sẽ làm cho hiệu lực
thống kê của thí nghiệm yếu đi. Hơn nữa, hiệu quả của phân khối sẽ thấp khi số đơn vị
thí nghiệm không lớn. Trong trƣờng hợp hao hụt khi tiến hành làm thí nghiệm quá lớn
(có thể dẫn đến sự xoá sổ của một vài đơn vị thí nghiệm trong một nghiệm thức) thì
phân khối cũng không có hiệu quả. Lúc này từ kiểu phân khối ngẫu nhiên hoàn toàn

(khi bắt đầu thí nghiệm) đã bị chuyển sang kiểu khối ngẫu nhiên không hoàn toàn (khi
kết thúc thí nghiệm) và sẽ gặp khó khăn khi xử lý số liệu.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Vì thế ta không áp dụng phân khối cho các yếu tố mà khả năng ảnh hƣởng của nó
đƣợc xác định theo nhận định chủ quan của ngƣời nghiên cứu. Ví dụ nhƣ phân chia cá
làm thí nghiệm theo tình trạng sức khoẻ bằng cách đánh giá qua cảm quan. Nếu yếu tố
bị phân khối có khả năng tƣơng tác với yếu tố nghiên cứu, ta nên giới hạn số lƣợng
khối trong thí nghiệm. Thay vì phân khối, trong một số trƣờng hợp ta có thể phân tích
đồng biến (ANCOVA) để thấy đƣợc ảnh hƣởng của yếu tố định dùng để phân khối.
Thiết kế phân cặp (paired design) là một dạng đặc biệt của phân khối. Ví dụ nhƣ
trong thí nghiệm chỉ có 2 nghiệm thức ta sử dụng các cá thể sinh đôi để chia ra mỗi cá
thể chịu một tác động. Lúc này có thể dùng kiểm định t-test hoặc z-test một cách dễ
dàng. Tuy nhiên cách này có hạn chế là kết quả chỉ ứng dụng đƣợc cho những cặp sinh
đôi thôi, chƣa chắc đã đúng cho những cá thể sinh đơn.
Thiết kế thí nghiệm chéo (Cross-over Design hoặc Repeated Measurement)
Theo kiểu thiết kế này các đơn vị thí nghiệm đƣợc dùng cho các nghiệm thức
khác nhau theo trình tự thời gian. Ví dụ nghiên cứu cƣờng độ hô hấp của cá ở nhiệt độ
30 oC trong 2 ngày, sau đó chuyển sang nhiệt độ 28 oC 2 ngày tiếp theo, hoặc ngƣợc lại.
Ngƣời làm nghiên cứu phải hết sức cẩn thận khi sử dụng kiểu thiết kế này vì rất dễ vi
phạm giả định quan trọng của thống kê là “mẫu thu phải độc lập”.
Khi thiết kế, cần chú 4 điểm sau:
(i) Sử dụng nhiều nhóm mẫu để tránh ảnh hƣởng của thời gian.

(ii) Dƣ động của yếu tố trƣớc khi nghiên cứu ảnh hƣởng của yếu tố sau.
(iii) Sinh vật làm thí nghiệm không đƣợc chết hoặc vật thí nghiệm không bị hủy
hoại khi chịu tác động của yếu tố nghiên cứu. Nếu không thì không sử dụng đƣợc nữa
cho nghiệm thức tiếp theo.
(iv) Phải có thời gian “làm sạch” (washout time) giữa 2 nghiệm thức để đảm bảo
không bị ảnh hƣởng của dƣ động.
Thí nghiệm dạng này tiết kiệm đƣợc kinh phí, tốt khi số lƣợng đơn vị thí nghiệm
quá ít. Nhƣng phải cẩn thận, nếu không thì “tiết kiệm sẽ thành không tiết kiệm” nếu số
liệu thu đƣợc ít có giá trị về mặt sinh học. Hơn nữa, thí nghiệm theo kiểu này rất mất
thời gian.
Thiết kế thí nghiệm dạng Split-plot

20

Kiểu thiết kế này áp dụng cho thí nghiệm nghiên cứu ảnh hƣởng của 2 yếu tố.
Với yếu tố thứ nhất, ta phân bổ một cách ngẫu nhiên các đơn vị thí nghiệm theo các
mức (nghiệm thức) của yếu tố này. Sau đó, trong mỗi một nghiệm thức của yếu tố 1, ta
phân bổ một cách ngẫu nhiên các đơn vị thí nghiệm theo các mức của yếu tố thứ 2.
Hoàng Tùng (2002) nghiên cứu ảnh hƣởng của cƣờng độ chiếu sáng đến sự phát triển
buồng trứng của tôm Bạc thẻ (Penaeus merguiensis) trong mối liên quan với giai đoạn
thành thục buồng trứng của tôm. Thí nghiệm gồm có 6 bể nuôi vỗ tôm mẹ: 3 bể có
cƣờng độ chiếu sáng yếu (2 lux) và 3 bể có cƣờng độ chiếu sáng mạnh (1.100 lux).
Trong mỗi bể có 4 con tôm mẹ có buồng trứng phát triển ở 4 giai đoạn khác nhau là II,
III, IV và V. Ở nghiên cứu này ảnh hƣởng của cƣờng độ chiếu sáng đã đƣợc tìm hiểu ở
nghiên cứu trƣớc. Ngƣời làm nghiên cứu quan tâm nhiều đến tƣơng tác giữa cƣờng độ
chiếu sáng và giai đoạn phát triển của buồng trứng tôm khi bắt đầu đƣa vào thí
nghiệm.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ



Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Ngƣời làm nghiên cứu nên sử dụng kiểu thiết kế này nếu yếu tố thứ nhất có ảnh
hƣởng mạnh, dễ phát hiện hoặc ta đã biết ảnh hƣởng của nó rồi, không cần thiết lắm
phải thu thêm số liệu. Điều này cũng có nghĩa là ảnh hƣởng của yếu tố thứ 2 (ở từng
mức của yếu tố thứ 1) và tƣơng tác của nó với yếu tố thứ 1 đối với ngƣời nghiên cứu
quan trọng hơn nhiều. Khi thiết kế thí nghiệm phải có lặp lại.
Kết luận cho các kiểu thiết kế thí nghiệm
- Rất nhiều thí nghiệm (so sánh) cần đối chứng. Cần phải chọn đối chứng sao cho
có hiệu quả nhất.
- Thiết kế thí nghiệm đa yếu tố cho phép phát hiện tƣơng tác giữa các yếu tố. Tuy
nhiên việc diễn giải các tƣơng tác này không phải đơn giản.
- Thiết kế theo kiểu ngẫu nhiên hoàn toàn là đơn giản nhất nhƣng nếu biến động
của biến quan sát giữa các đơn vị lớn thì lại không phù hợp. Khi đó có thể sử dụng
phƣơng pháp phân khối. Thiết kế theo dạng cặp là một dạng đặc biệt của phân khối,
nhƣng chỉ cho 2 nghiệm thức mà thôi.
- Thiết kế dạng chéo tức là lặp lại phép đo nhiều lần trên một đơn vị thí nghiệm
tại các thời điểm khác nhau, chứ không tiến hành đo đạc trên nhiều đơn vị thí nghiệm
tại cùng một thời điểm.
2.2.7. Một số lƣu ý
Ngƣời làm nghiên cứu cần phải dự đoán mình sẽ diễn giải kết quả thu đƣợc nhƣ
thế nào trong mối tƣơng quan với giả thuyết đã thiết lập cho mỗi khả năng có thể xảy
ra khi tiến hành nghiên cứu.
Tránh làm những thí nghiệm mà ta không có khả năng diễn giải kết quả thu đƣợc.
Ngay cả khi kết quả thí nghiệm bác bỏ giả thuyết của mình đƣa ra, kết quả đó cũng
phải hữu ích cho khoa học. Ví dụ nhƣ kiểm chứng giả thuyết “hàm lƣợng probiotic A

sử dụng có liên quan đến năng suất tôm nuôi”. Nếu kết quả phản bác lại giả thuyết,
ngƣời nghiên cứu có thể khuyến cáo cho ngƣời nuôi tôm không nên sử dụng probiotic
A. Nếu kết quả ủng hộ giả thuyết, thì các thông tin về khả năng cải thiện năng suất
nuôi của probiotic A sẽ đƣợc ứng dụng trong sản xuất khi xây dựng chế độ sử dụng,
liều lƣợng cần thiết. Trong ví dụ sau, giả thuyết nghiên cứu là “thả cá bằng tay trái sẽ
đem lại một mùa vụ thành công”. Nếu giả thuyết này bị phản bác bởi kết quả, điều đó
không có nghĩa là thả cá bằng tay phải sẽ đem lại thành công. Trong trƣờng hợp này,
thông tin ta tìm đƣợc không có giá trị, kể cả nếu số liệu ủng hộ giả thuyết vì ta không
giải thích đƣợc vì sao thả bằng tay trái lại thành công.
Thiết kế thí nghiệm là nghệ thuật sử dụng nguồn nhân vật lực nhất định để tối đa
hoá lƣợng và chất lƣợng thông tin cần thiết phải thu thập. Nếu điều kiện thí nghiệm
không cho phép chúng ta thu đƣợc tất cả những gì theo mong muốn thì đành phải chấp
nhận bởi vì “có còn hơn không”. Nhƣng nếu thực sự ta có thể làm tốt hơn đƣợc thì cần
phải suy tính lại.
21

(Tham khảo thêm nội dung Chƣơng 2 ở tài liệu: Hoàng Tùng (2006), Phương
pháp nghiên cứu khoa học trong nuôi trồng thủy sản, Tài liệu dự án nâng cao năng lực
nghiên cứu và đào tạo SRV2701 – NORAD, Trƣờng Đại học thủy sản, Nha Trang.)

Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

CHƢƠNG 3. THU THẬP VÀ TRÌNH BÀY SỐ LIỆU

3.1. Thu thập số liệu
Thu thập số liệu là thao tác cân, đo, đếm, quan sát vật mẫu hay kết quả thí
nghiệm để ghi lại các số liệu cần thiết phục vụ cho việc xử lý thống kê. Các số liệu này
sẽ tham gia vào các tính toán để tìm ra các đặc trƣng cần thiết của đối tƣợng nghiên
cứu.
Quá trình thu thập số liệu trên vật mẫu hầu nhƣ không thể cho ta một kết quả
chính xác tuyệt đối mà nó có một khoảng sai khác nhất định gọi là “sai số”. Sai số đó
chính là độ lệch của giá trị ta quan sát, đo đạc trên mẫu với giá trị thực của tổng thể
nghiên cứu. Có nhiều nguyên nhân khác nhau dẫn đến các loại sai số khác nhau. Vấn
đề là ta cần phải xác định nguyên nhân dẫn đến sai số để có để có quyết định đối với
số liệu thu đƣợc.
- Sai số thô: Là sai số phát sinh do sự bất cẩn của ngƣời thu thập số liệu hoặc
dùng sai dụng cụ lấy số liệu. Loại sai số này cần phải loại bỏ trong nghiên cứu thu thập
số liệu.
- Sai số hệ thống: Là sai số phát sinh do sự sai lệch của dụng cụ đo hoặc phƣơng
pháp đo đạc. Phƣơng pháp đo đạc chính là phƣơng pháp cụ thể để tiến hành quan sát
đo đạc hoặc phân tích để xác định các đặc điểm của đơn vị nghiên cứu. Phƣơng pháp
đo đạc ở đây phải bao gồm cả công đoạn từ khi thu mẫu hay thiết kế thí nghiệm đến
bảo quản, phân tích và ghi nhận kết quả phân tích trên. Các số liệu thuộc sai số hệ
thống cần phải đƣợc tính toán lại.
- Sai số ngẫu nhiên là sai số không thể tiên đoán đƣợc cụ thể với trình độ khoa
học dƣơng thời do nhiều nhân tố có tác dụng nhỏ không thể tách riêng hoặc tính riêng
(loại trừ sai số hệ thống và sai số thô). Đây là sai số mà ngƣời làm thí nghiệm không
thể loại bỏ đƣợc và loại sai số này đƣợc chấp nhận trong nghiên cứu.
Do đó, khi thu thập số liệu cần phải chú ý hiệu chỉnh thiết bị, loại trừ các nguy cơ
thực hiện phép đo thiếu chính xác, hạn chế tối đa sai số do ngƣời đo đạc và tác động
của ngƣời nghiên cứu.
Hiệu chỉnh thiết bị (nhƣ máy đo pH, đo hàm lƣợng oxy hòa tan, máy đo quang
phổ, cân điện tử …) là rất cần thiết để đảm bảo độ chính xác và phải kiểm tra trong
quá trình nghiên cứu thƣờng xuyên vì có thể có những sự cố xãy ra mà ngƣời làm

nghiên cứu không biết ví dụ nhƣ ngƣời khác làm rơi, hỏng thiết bị.
Khi thực hiện một phép đo có thể thực hiện nhiều lần để xem xét kết quả có
giống nhau hay không. Đặc biệt nên kiểm tra với những biến cần có sự đánh giá của
ngƣời đo hoặc ngƣời đo đang tập sự ta không tin tƣởng lắm.
3.2. Sắp xếp và trình bày số liệu
3.2.1. Phân nhóm số liệu
22

Trong các nghiên cứu chúng ta thƣờng thu thập và làm việc với một số lƣợng lớn
số liệu đủ lớn để đảm bảo độ tin cậy cho kết quả nghiên cứu. Sẽ đơn giản hơn trong
việc thu thập và xử lý số liệu sau này nếu nhƣ ngay từ bƣớc đầu ta có phƣơng pháp sắp
xếp và trình bày số liệu hợp lý. Nếu không thì nó sẽ làm cho số liệu ta thu thập đƣợc là
một mớ lộn xộn và rất khó hiểu.
Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

Việc phân nhóm số liệu là việc làm cần thiết để thể hiện số liệu một cách có hệ
thống và đơn giản.
Việc phân nhóm cần phải căn cứ vào những tiêu chuẩn để đáp ứng đƣợc vấn đề
ngiên cứu đặt ra. Đồng thời việc phân chia nhóm phải thể hiện đƣợc mục đích nghiên
cứu. Tức là các nhóm nghiên cứu khác nhau phải có những đặc tính khác nhau về tiêu
chuẩn nghiên cứu.
Trình tự các bƣớc tiến hành phân nhóm nhƣ sau:
- Xác định số nhóm (k).

- Xác định các giá trị biên nhóm (Xbi), với i = 1 … k với qui ƣớc giá trị biên
thuộc vào nhóm đứng trƣớc.
- Xếp các số liệu (Xi) vào các nhóm sao cho Xi  Xbi.
- Tính tần số nhóm (fi).
Trƣờng hợp ta không đặt ra tiêu chuẩn phân nhóm (phân nhóm không chủ định)
thì ta tiến hành các bƣớc nhƣ sau:
3
- Xác định số nhóm theo công thức: k  2n .

- Xác định độ dài từng nhóm theo công thức: h 

X max  X min
.
k

- Giá trị biên: Xbi = Xbi-1 +h
3.2.2. Bảng phân bố tần số
Bảng phân bố tần số thể hiện sự sắp xếp kết quả phân nhóm số liệu khác nhau
một cách ngắn gọn, rõ ràng.
Ví dụ với dãy số liệu 2; 2; 4; 5; 5; 6; 7; 7; 8; 9 ta lập thành bảng sau:
Nhóm

Giá trị biên

Tần số

Tần suất

Tần số tích lũy


Tần suất tích lũy

1

4

3

30%

3

30.00%

2

7

5

50%

8

80.00%

3

>7


2

20%

10

100.00%

Tần số là số mẫu có giá trị thuộc phạm vi nhóm của biến số. Hay tần số là số lần
quan sát đƣợc tƣơng ứng với trị số (cụm).
Tần suất là tỷ lệ phần trăm số mẫu có giá trị thuộc phạm vi nhóm so với tổng số mẫu.
Tần số tích lũy là tần số cộng dồn từ nhóm 1 đến nhóm đang tính.
Tần suất tích lũy là tần suất cộng dồn từ nhóm 1 đến nhóm đang tính.

23

Để có đƣợc các giá trị điền vào bảng phân bố tần số ta phải trải qua các bƣớc tính
toán. Đối với số lƣợng số liệu nhỏ ta có thể tính nhanh bằng phƣơng pháp thủ công
nhƣng đối với một lƣợng số liệu lớn thì ta phải nhờ đến công cụ xử lý trong MS-Excel
để cho việc tính toán đƣợc thuận lợi, nhanh chóng hơn và chính xác.

Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015


Ta có thể dùng hàm tính phân bố tần số Frequency bằng cách gõ hàm hoặc gọi
hàm trong Insert Function bằng cách nhấn nút fx trên thanh Standar, sau đó chọn hàm
thống kê (Statistical) trong danh sách các nhóm hàm.
Cấu trúc của hàm là: =Frequency(Data Array, Bin Array). Tức là tính giá trị tần
số của các nhóm số liệu trong vùng Data Array dựa vào giá trị biên khai báo trong
vùng Bin Array. Dãy kết quả đƣợc kết xuất theo chiều đứng (cột).
Để dùng hàm bằng cách gõ hàm ta gõ tại cell đầu tiên của vùng kết xuất. Bƣớc
tiếp theo là bôi đen vùng kết xuất. Sau đó nhấn phím chức năng F2. Cuối cùng ta nhấn
tổ hợp phím Shift + Control + Enter để đọc kết quả.
Một công cụ khác trong MS-Excel sử dụng để tính phân bố tần số là chƣơng trình
tính phân bố tần số (Histogram). Bằng cách vào thực đơn Tool chọn Data Analysis rồi
chọn chƣơng trình ứng dụng nhƣ đã nói ở trên. Khi thấy cửa sổ chƣơng trình xuất hiện
ta nhập địa chỉ vùng cell chứa số liệu (Input Range) và vùng cell chứa biên nhóm (Bin
Range) đã đƣợc nhập vào bảng tính trƣớc đó. Cuối cùng ta chọn địa chỉ kết xuất kết
quả ngay trong bảng tính (Output Range) rồi nhấn OK để hiển thị kết quả (nếu nhƣ
muốn kết xuất tần suất tích lũy thì ta chọn Cumulative Percentage).
Cửa sổ chƣơng trình tính phân bố tần số Kết xuất của chƣơng trình có dạng

Bin

Frequency

Cumulative %

30

4

40.00%


40

4

80.00%

50

1

90.00%

More

1

100.00%

3.2.3. Biểu đồ
Có nhiều dạng biểu đồ khác nhau nhƣ biểu đồ hình cột, biểu đồ dạng đƣờng nối
điểm, biểu đồ dạng hình quạt, biểu đồ dạng hình tròn. Tuy nhiên, ta thƣờng dùng biểu
đồ dạng cột để biểu diễn tần số, biểu đồ dạng hình tròn để biểu diễn tần suất.

24

Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ



Phương pháp thí nghiệm và phân tích số liệu

August 19, 2015

CHƢƠNG 4. MÔ TẢ THỐNG KÊ MẪU
4.1. Các đặc trƣng về giá trị trung bình
4.1.1. Số trung bình (Mean)
Số trung bình là trung bình cộng của các số liệu thu đƣợc. Nếu ta lấy ra từ tổng
thể nghiên cứu n giá trị mẫu: X1, X2, X3, …, Xn. Thì giá trị trung bình của mẫu đƣợc
tính theo công thức:
X

Trong đó:

1
n

n

X
i 1

i

X là trung bình của mẫu

X i là các số liệu thu đƣợc từ mẫu

n là số mẫu.
Ví dụ: Tính trung bình của các số liệu sau: 1, 1, 2, 2, 2, 3, 3, 3, 3, 4. Đây là dãy

số liệu với số lƣợng số liệu ít, đơn giản nên ta có thể tính nhẫm hoặc bằng cách tính áp
dụng công thức thì ta có ngay kết quả: n = 10,  = 24, X = 2,4 .
Khi số lƣợng số liệu lớn, thƣờng thì quá trình thu thập số liệu ta sắp xếp theo các
nhóm khác nhau. Gọi trị số nhóm là Xi với tần số nhóm tƣơng ứng là f i. Khi đó dãy số
liệu của ta đƣợc trình bày dƣới dạng bảng nhƣ sau:
Trị số (Xi)

X1

X2

Xk

Xn

Tần số (fi)

f1

f2

fk

fn

Xi.fi

X1.f1

X2.f2


Xk.fk

Xn.fn

Lúc này công thức tính giá trị trung bình chuyển thành dạng:
X

1
n

k

X f
i 1

i i

Với ví dụ trên ta có bảng kết quả nhƣ sau:
Trị số (Xi)

1

2

3

4

Tần số (fi)


2

3

4

1

Xi.fi

2

6

12

4

Trƣờng hợp số liệu phân nhóm có khoảng cách hay nói cách khác là trị số của
các nhóm giao động trong một khoảng giá trị theo một tiêu chuẩn định sẳn thì X i là
trọng số của nhóm, tức là trị số chính giữa khoảng giá trị của nhóm (xem bảng ví dụ):

25

Trị số nhóm

0 - 10

10 - 20


20 - 30

30 - 40

Tần số nhóm (fi)

2

3

4

1

Trọng số (Xi)

5

15

25

35

Xi.fi

10

45


100

35

Trƣờng Đại học Quảng Bình

| Lƣu hành nội bộ


×