Tải bản đầy đủ (.docx) (113 trang)

Bài giảng thống kê và tin học trong lâm nghiệp, bảo huy 2009

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (8.95 MB, 113 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC TÂY NGUYÊN

PGS.TS. BẢO HUY

THỐNG KÊ TIN HỌC
TRONG LÂM NGHIỆP
Áp dụng phần mềm Statgraphics Centurion và MS. Excel
(Dùng cho Cao học Lâm nghiệp)


Tháng 5 năm 2009

2


Mục lục
1
1.1
1.2
2
3
3.1
3.2
4
5
5.1
5.2

6.
6.1.


6.2.
6.2.1.
6.2.2.
6.3.
6.4.
6.4.1.
6.4.2.
7.
8.
9.

10.
10.1.
10.2.
10.3.
11.

TỔNG QUÁT VỀ CHỨC NĂNG XỬ LÝ THỐNG KÊ CỦA EXCEL VÀ
STATGRAPHICS ......................................................................................................... 7
Tổng quát về phần xử lý thống kê trong Excel ............................................... 7
Tổng quát về phần mềm xử lý thống kê Statgraphics Centuiron ................... 8
THỐNG KÊ MÔ TẢ ............................................................................................. 10
SO SÁNH 1 – 2 MẪU QUAN SÁT BẰNG TIÊU CHUẨN T ................................ 13
So sánh một mẫu với một giá trị cho trước – Kiểm tra T một mẫu ............... 13
So sánh sự sai khác giữa trung bình 2 mẫu – Kiểm tra T 2 mẫu ................. 14
NGHIÊN CỨU MỐI QUAN HỆ SINH THÁI LOÀI TRONG RỪNG MƯA NHIỆT
ĐỚI DỰA VÀO TIÊU CHUẨN χ2 (Bảo Huy, 1997) .................................................... 17
PHÂN TÍCH PHƯƠNG SAI ................................................................................ 23
Phân tích phương sai 1 nhân tố với các thí nghiệm ngẫu nhiên hoàn toàn . 23
Phân tích phương sai 2 nhân tố ................................................................... 27 5.2.1. Phân

tích phương sai 2 nhân tố với 1 lần lặp lại: (Bố trí thí nghiệm theo khối ngẫu nhiên đầy đủ
(Randomized Complete Blocks) (RCB): ............................................. 27
5.2.2.
Phân tích phương sai 2 nhân tố m lần lặp ........................................................... 32
PHÂN TÍCH TƯƠNG QUAN - HỒI QUY ............................................................ 36
Hồi quy tuyến tính 1 lớp ............................................................................... 36
Dạng phi tuyến đưa về tuyến tính 1 lớp ....................................................... 38
Lập mô hình hàm mũ trong Excel: ..................................................................... 38
Lập mô hình hàm mũ và Schumacher trong Statgraphics: ................................. 40
Hồi quy tuyến tính nhiều lớp ........................................................................ 46
Hồi quy phi tuyến tính nhiều lớp, tổ hợp biến .............................................. 49
Lập mô hình phi tuyến nhiều lớp chuyển về tuyến tính nhiều lớp trong Excel.. 49
Lập mô hình phi tuyến nhiều lớp chuyển về tuyến tính trong Statgraphics ....... 51
ƯỚC LƯỢNG CÁC DẠNG HỒI QUY MỘT BIẾN TRÊN ĐỒ THỊ ...................... 55
SẮP XẾP VÀ VẼ BIỂU ĐỒ PHÂN BỐ TẦN SỐ XUẤT HIỆN THEO CẤP, CỠ,
HẠNG ......................................................................................................................... 59
KIỂM TRA THUẦN NHẤT K MẪU QUAN SÁT ĐỨT QUẢNG - ỨNG DỤNG: KIỂM TRA
SỰ THUẦN NHẤT CỦA CÁC DÃY PHÂN BỐ N/D, N/H Ở CÁC Ô TIÊU
CHUẨN ...................................................................................................................... 61
MÔ HÌNH HOÁ QUY LUẬT PHÂN BỐ ........................................................... 62
Mô hình hoá phân bố giảm theo hàm Mayer ............................................ 63
Mô phỏng phân bố thực nghiệm theo phân bố khoảng cách-hình học: .... 67
Mô phỏng phân bố thực nghiệm theo phân bố Weibull: ........................... 69
PHƯƠNG PHÁP NGHIÊN CỨU CẤU TRÚC MẶT BẰNG RỪNG (Bảo Huy,
1993) ........................................................................................................................ 71
12. PHÂN TÍCH, PHÁT HIỆN CÁC NGUYÊN NHÂN, NHÂN TỐ ĐỊNH TÍNH, ĐỊNH
LƯỢNG ẢNH HƯỞNG ĐẾN BIẾN PHỤ THUỘC (HẬU QUẢ, VẤN ĐỀ) (Bảo Huy,
2006) ........................................................................................................................ 73

3



LỜI NÓI ĐẦU
Tài liệu này được biên soạn phục vụ cho việc giảng dạy môn học “Thống kê và Tin học trong lâm
nghiệp” cho lớp Cao học Lâm nghiệp ở trường Đại học Tây Nguyên. Môn học này giúp cho người
học phân tích, xử lý số liệu thống kê trên máy vi tính trong quá trình học tập, làm đề tài nghiên cứu
cũng như ứng dụng vào thực tiễn.
Có rất nhiều phần mềm ứng dụng để xử lý thống kê như SPSS, Statgraphics Plus, Excel....
Microsoft Excel được mọi người biết đến khi nói đến công cụ bảng tính, tính tóan..., nhưng những
chức năng chuyên sâu về ứng dụng thống kê trong sinh học, nông lâm nghiệp, quản lý tài nguyên
thiên nhiên, môi trường lại ít được đề cập đến. Mục đích của môn học này là khai thác chức năng
xử lý thống kê hết sức phong phú và mạnh của phần mềm Excel để ứng dụng trong phân tích các
kết quả thí nghiệm, đánh giá các kết quả điều tra khảo sát trong lâm nghiệp, nghiên cứu về quản lý
tài nguyên thiên nhiên. Trong đó bao gồm các xử lý thống kế phổ biến như: Phân tích các đặc trưng
mẫu, so sánh các mẫu thí nghiệm, phân tích phương sai, tương quan hồi quy, dự báo….. do đó phần
mềm Excel được chọn lựa để giới thiệu.
Các phần mềm thống kê chuyên dụng và phổ biến trên thế giới là Statgrahics, SPSS, …. Đây là các
phần mềm thống kê được ứng dụng rộng trong hầu hết các lĩnh vực nghiên cứu, phân tích dữ liệu
của nhiều ngành khác nhau về xã hội, tự nhiên. Ứng dụng mạnh của các phần mềm này là phân tích
các mô hình hồi quy đa biến dạng tuyến tính hay phi tuyến tính với các cách phân tích đa dạng như
hồi quy lọc, hồi quy từng bước, tổ hợp biến, mã hóa tự động các biến định tính, ….. Do đó phần
mềm Statgraphics cũng được giới thiệu để người học có thể tiếp cận với công cụ phân tích thống kê
này.
Tài liệu này sẽ không đi sâu vào lý thuyết xác suất thống kê, mà thiên về hướng ứng dụng đơn giản,
dễ hiểu, kèm theo các ví dụ để người đọc có thể thực hành các chức năng xử lý, phân tích dữ liệu
bằng Excel, Statgraphics Plus một cách nhanh chóng, thuận tiện trong hoạt động quản lý và nghiên
cứu lâm nghiệp, quản lý tài nguyên thiên nhiên, môi trường.

4



1 TỔNG QUÁT VỀ CHỨC NĂNG XỬ LÝ THỐNG KÊ CỦA
EXCEL VÀ STATGRAPHICS
1.1 Tổng quát về phần xử lý thống kê trong Excel
Excel thiết kế sẵn một số chương trình để xử lý số liệu và phân tích thống kê cơ bản ứng dụng trong
nhiều lĩnh vực:
- Chức năng xử lý số liệu, tạo bảng tổng hợp dữ liệu: Sắp xếp, tính toán nhanh các bảng tổng hợp từ
số liệu thô,...
- Chức năng của các hàm: Cung cấp hàng loạt các hàm về kỹ thuật, thống kê, kinh tế tài chính, hàm
tra các chỉ tiêu thống kê như t, F, χ2
- Chức năng Data Analysis: Dùng để phân tích thống kê như phân tích các đặc trưng mẫu, tiêu chuNn
t để so sánh sự sai khác, phân tích phương sai, ước lượng các tương quan hồi quy

5


Phân tích mô hình tưong quan hoặc hồi quy để dự báo các thay đổi theo thời gian ngay

trên
đề
th

.

L
ư
u
ý:
V


6


vi

c
cài
đặ
t
ch
ươ
ng
trinh phân tích d

li

u
Data Analysis
)
(
trong Excel:
Khi
cài
đặ
t
ph

n
m


m
Excel
ph

i
th

c hi

n trong ch
ế
độ
ch

nl
7



a cài
đặ
t, sau
đ
ó ph

i ch

nm

c: Add-Ins

và Analysis Toolpak.
Khi ch

y Excel l

n
đầ
uc

nm

ch
ế
độ
phân tích d

li

ub

ng cách: Menu
Tools/Add-Ins
ch


n
Analysis
(
Toolpak-OK.
Đố

i
8


v

i
MS.
Office
2003)

Đố
iv

i MS. Office 2007, ti
ế
n hành m

ch
ế
độ
phân tích th

ng kê nh
ư
sau: Kích vào
Microsoft Office Button sau
đ
ó ch


n excel
options,
kích
vào
Add-ins,

ch

n
Analysis ToolPak trong h

p tho

i - OK.

N
h
9


ư
v

y trong th

ct
ế
qu

n lý d


li

u nông
lâm nghi

p nói riêng, vi

c khai thác h
ế
t ti

mn
ă
ng

ng d

ng c

a Excel c
ũ
ng mang l

i hi

u qu

tốt mà không nhất thiết phải tìm kiếm thêm một phần mềm chuyên dụng nào khác. Vấn đề đặt ra là
xác định chiến lược ứng dụng và khai thác đúng và sâu các công cụ chức năng sẵn có ở một phần

mềm phổ biến ở bất kỳ một vi tính cá nhân nào.

10


Một số hàm thông dụng trong thống kê: o Tính tổng: =Sum(dãy đs).
o Tổng bình phương: =Sumq(dãy đs). o Trung bình:
=Average(dãy đs). o Lấy giá trị tuyệt đối: =Abs(đs). o Trị
lớn nhất, nhỏ nhất: =Max(dãy đs), Min(dãy đs). o Các hàm
lượng giác: =Cos(đs), =Sin(đs), =tan(đs). o Hàm mũ, log:
=Exp(đs), =Ln(đs), =Log(đs). o Căn bậc 2: =Sqrt(đs)..
o Sai tiêu chuNn mẫu chưa hiệu đính: =Stdevp(dãy đs); đã hiệu đính =Stdev(dãy đs).
o Phương sai mẫu chưa hiệu đính: =Varp(dãy đs); đã hiệu đính =Var(dãy đs). o Giai thừa: =Fact(n).
o Số Pi: =Pi().
Tra các giá trị T, F, χ2:
Chọn 1 ô lấy giá trị tra.
Kích nút fx trên thanh công cụ chuNn. Trong hộp thoại Function Category, chọn
Statistical.
Trong mục Function name, chọn 1 trong các hàm:
Hàm Tinv: để tra T.
Hàm Chiinv: để tra χ2.
Hàm Finv: để tra F.
Bấm N ext.
Trong hộp thoại tiếp theo: Function Wizard chọn:
o Probability (fx): Gõ vào mức ý nghĩa α=0.05 ; 0.01 hay 0.001.
o Degrees Freedom (fx): Gõ vào bậc tự do. Đối với tiêu chuNn F cần đua vào 2 độ tự do.
o Finish.

1.2 Tổng quát về phần mềm xử lý thống kê Statgraphics Centuiron
-


Đây là một phần mềm chuyên dụng trong xử lý thống kê, bao gồm các chức năng:
Tạo lập cơ sở dữ liệu dưới dạng bảng tính
Tính toán các đặc trưng mẫu, vẽ sơ đồ, đồ thị quan hệ
So sánh hai hay nhiều mẫu bằng các tiêu chuNn thống kê t, U, F và nhiều tiêu chuNn phi tham số
khác.
Phân tích phương sai AN OVA.
Kiểm tra tính chuNn của dữ liệu và đổi biến số.
Thiết lập các mô hình hồi quy tuyến tính hay phi tuyến tính từ một cho đến nhiều lớp, tổ hợp biến.
Với cách xử lý đa dạng để chọn lựa được các biến ảnh hưởng đến một hậu qủa (biến phụ thuộc).

11


Giao tiếp trong Statgraphics Centurion, số liệu đầu vào có thể được nhập trực tiếp trong file bảng
tính và cơ sở dữ liệu; song với các làm này đôi khi không thuận tiện trong các bước xử lý số liệu
thô như đổi biến số, tính các biến trung gian, mã hóa biến số. Do đó thông thường nên tạo lập cơ sở
dữ liệu trong bảng tính Excel để có thể sử dụng những chức năng bảng tính mạnh của nó trong xử
lý dữ liệu thô, tạo lập cơ sở dữ liệu; sau đó sẽ nhập vào Statgraphics Centurion để tính toán, thiết
lập mô hình, .... Cơ sở dữ liệu lập trong Excel cần lưu dưới dạng phiên bản của Excel 97 – 2003, vì
nó chưa nhận được file Excel ở version 2007.
Sau khi nhập dữ liệu trong Excel 97-2003, đóng file của Excel và mở nó trong Statgrahics
Centurion như sau: File/Open/Open Data Source; chọn External Data File – OK. Trong hộp

12


tho

im


file, ch

n ki

u file Excel và ch

n file c

nm

đ
ãt

o tr
13


ướ
c
đ
ó.

2 THỐNG KÊ MÔ TẢ
Để có những thông số đặc trưng về một đối tượng quan sát như sinh trưởng của một lô rừng, sự đa
dạng loài của lô rừng, sự ảnh hưởng của cháy rừng đến mật độ, chất lượng tái sinh, biến động trữ
lượng, mật độ của một lô rừng trồng, trạng thái rừng ..... cần tiến thành thu thập dữ liệu theo một
nhân tố chủ đạo và sau đó ước lượng, tính toán các đặc trưng cơ bản. Đây là các thông tin cơ bản về
một đối tượng quan sát, theo một chỉ tiêu, nhân tố quan tâm.
Các đặc trưng mẫu bao gồm tính các chỉ tiêu: Số trung bình, số trung vị, phương sai, sai tiêu chuNn,

độ lệch, độ nhọn của dãy số liệu quan sát, phạm vi biến động của nó với một mức sai số cho phép
đặt trước.
Ví dụ: Khảo sát các đặc trưng cơ bản về sinh trưởng đường kính của rừng trồng tếch.
Số liệu đo D1,3 rừng trồng Tếch 14 tuổi trong ô tiêu chuNn 500m2.
Các đặc trưng mẫu có thể tính đồng thời trong Excel theo các bước:
N hập số liệu theo cột hoặc hàng.
Menu Tools/Data Analyisis/Descriptive Statistics/OK. Có hộp thoại, trong đó cần xác
định:
o Input range: Khai báo khối dữ liệu. o Grouped by: Chọn dữ liệu nhập theo cột (Columns) hoặc
hàng (Rows). o Label in first row: N ếu đưa vào cả hàng tiêu đề thì đánh dấu. o Output range:
Đánh vào địa chỉ ô trên trái nơi đưa ra kết quả. o Summary Statistics: Thông tin tóm lược các đặc
trưng thống kê (đánh dấu).
o Kích nút OK
Bảng nhập dữ liệu đường kính D1.3 của Tếch

14


Sử dụng chức năng phân tích đặc trưng mẫu của Excel

15


Kết quả tính đặc trưng mẫu
D1,3 (cm)

Mean

18,98


Standard Error

0,442

Median

19 ,1

Mode
Standard Deviation

3 ,16

Sample Variance

9 ,986

Kurtosis

0 ,852

Skewness

-0,227

Range

17 ,19

Minimum


9 ,868

Maximum

27 ,06

Sum
Count
Confidence Level (95,0%)

16

19 ,42

968
51
0 ,889


Giải thích: o Mean: Số trung bình.
o Standard Error: Sai số của số trung bình mẫu. o Median: Trung vị mẫu. o Mode: Trị số ứng với
tần số phân bố tập trung nhất. o Standard deviation: Sai tiêu chuNn mẫu. o Sample variance:
Phương sai mẫu.
o Kurtosis: Độ nhọn của phân bố
Ku = 0 phân bố thực nghiệm tiệm cận chuNn.
Ku > 0 đường cong có dạng bẹt hơn so với phân bố chuNn.
Ku < 0 đường cong có đỉnh nhọn hơn so với phân bố chuNn.
Ku = Kurt(A2:A52) = 0.852. Đỉnh đường cong thấp hơn so với phân bố chuNn. o
Skewness: Độ lệch của phân bố.

Sk = 0 phân bố đối xứng.
Sk > 0 đỉnh đường cong lệch trái so với số trung bình.
Sk < 0 đỉnh đường cong lệch phải so với số trung bình.
Sk = Skew(A2:A52) = -0.227. Đường cong hơi lệch phải. o
Minimum: Trị số quan sát bé nhất. o Maximum: Trị số quan sát
lớn nhất. o Sum: Tổng các trị số quan sát. o Count: Dung lượng
mẫu.
o Cofidence level (95%): Sai số tuyệt đối của ước lượng với độ tin cậy 95%.
Trong kết quả phân tích đặc trưng mẫu nói trên, ngoài các chỉ số phổ biến cần quan tâm như số
trung bình, phương sai; thì hai giá trị quan trọng thuyết minh kiểu dạng phân bố của dữ liệu quan
sát là Ku và Sk.
Khi Ku > 0 thì giá trị quan sát có xu hướng phân tán xa số trung bình, ngược lại Ku < 0 thì giá trị
quan sát tập trung quanh số trung bình nhiều hơn. Khi Ku = 0 thì độ nhọn của số liệu quan sát tiệm
cận chuNn
Khi Sk > 0 thì số liệu quan sát có xu hướng nghiêng về các giá trị nhỏ hơn trung bình, nếu là số liệu
sinh trưởng rừng, thì cây rừng đang ở giai đoạn non; ngược lại Sk < 0, giá trị quan sát thiên về các
giá trị lớn hơn trung bình, nếu quan sát sinh truởng rừng, thì đây là các khu rừng đã đi vào thành
thục. N ếu Sk = 0 thì độ lệch tiệm cận chuNn.
Khi một mẫu có Ku = 0 và Sk = 0 thì nó có phân bố chuNn.
N ếu mẫu phân bố chưa chuNn thì cần bổ sung mẫu theo công thức mẫu cần thiết nct:
𝑛𝑛𝑛 ≥ 𝑛 . 𝑛% /∆%
Trong đó V% là hệ số biến động: 𝑛% = 100 và Δ% là sai số tương đối cho trước.

Giá trị Confidence Level (95%) cho phép ước lượng phạm vi biến động của số trung bình với độ tin
cậy 95%:
P(mean – t.S/ n ≤ µ ≤ mean + t.S/ n ) = 0.95 trong đó
t.S/ n = Confidence Level (95%)
Vì vậy giá trị biến động trung bình của tổng thể được ước lượng:
µ = mean ± Confidence Level (95%)


17


Tùy theo yêu cầu của cuộc điều tra đánh giá, thí nghiệm mà chọn mức độ tin cậy khác nhau: 90%,
95%, 99%.

3 SO SÁNH 1 – 2 MẪU QUAN SÁT BẰNG TIÊU CHUẨN T
Kiểm tra mẫu bằng tiêu chuNn t dựa vào giả thiết phân phối chuNn của mẫu quan sát. Có hai loại
kiểm tra t: kiểm tra t một mẫu (one-sample t-test), và t cho hai mẫu (two-sample t-test). Kiểm tra t
một mẫu để đánh giá số trung bình của một mẫu có phải thật sự bằng một gía trị nào đó hay không?.
Kiểm tra t hai mẫu thì để so sánh hai mẫu có cùng một luật phân phối, hay cụ thể hơn là hai mẫu có
thật sự có cùng trị số trung bình hay không? Hay nói khác đi có sự sai khác giữa hai mẫu quan sát
hay không?

3.1 So sánh một mẫu với một giá trị cho trước – Kiểm tra T một mẫu
Trong mô tả quan sát một mẫu, người ta có thể có yêu cầu đánh giá giá trị trung bình của mẫu với
một giá trị cho trước, ví dụ từ đo đếm chiều cao của cây tái sinh trong rừng khộp, so sánh với một
giá trị cho trước về chiều cao mong đợi để cây rừng vượt qua được lửa rừng, xem thật sự chiều cao
tái sinh của lô rừng đó đã đạt yêu cầu hay chưa?
Để giải quyết vấn đề này, sử dụng kiểm định t một mẫu. Theo lí thuyết thống kê công thức t kiểm
tra một mẫu với một giá trị cho trước:
𝑛𝑛𝑛 − µ
𝑛=𝑛
√𝑛
Trong đó, Xbq là giá trị trung bình của mẫu, μ là trung bình theo giả thuyết, S là sai tiêu chuNn và n
là số lượng mẫu quan sát.
- N ếu giá trị tuyệt |t| tính cao hơn giá trị t lí thuyết ở mức sai có ý nghĩa, thường là 5% thì có thể kết
luận có sự khác biệt có ý nghĩa thống kê giữa trung bình mẫu với giá trị cho trước đó. Và trong
trường hợp này nếu t tính <0 thì có nghĩa trung bình của mẫu nhỏ thua có ý nghĩa so với trung bình
lý thuyết, ngược lại nếu t tính > 0 thì trung bình của mẫu lớn hơn có ý nghĩa so với trung bình lý

thuyết
- N ếu |t| tính ≤ t(0.05, df) thì có thể kết luận ở mức sai 5% trung bình mẫu quan sát xấp xỉ với trung
bình lý thuyết.
Trong đó t lý thuyết được tính theo hàm =tinv(0.05, df), với độ tự do df = n-1.
Số liệu đo cao cây tái sinh rừng khộp trong Excel
Chiểu
cao cây
tái sinh
(m)

Stt

18

1

1.5

2

1.3

3

0.8

4

1.9


5

1.7

6

2.2

7

2.5


8

1.0

9

0.7

10

1.9

11

1.8
……


58

1.6

59

2.0

60

1.9

61

1.7

Để tính được giá trị t, cần tính toán đặc trưng mẫu để có các giá trị thông kê về Xbq, S.

Kết quả tính đặc trưng mẫu tái sinh rừng khộp Chiểu
cao cây tái sinh (m)

Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range

Minimum
Maximum
Sum
Count

1.64
0.06318
1.7
1.9
0.49347
0.24351
-0.4499
-0.4627
1.8
0.7
2.5
100.3
61

Confidence Level(95.0%)

0.12638

Từ đó tính giá trị thống kê t: So sánh trung bình chiều cao tái sinh với giá trị lý thuyết µ =2m
1.64 − 2
𝑛 = = −5.63
0.493
√61
Và t lý thuyết: t (0.05, df = n-1) = tinv(0.05, 60) = 2.00
Kết quả cho thấy |t| = 5.63 > t(0.05, 60). Kết luận: Có sự sai khác có ý nghĩa giữa trung bình chiều

cao cây tái sinh rừng khộp với giá trị trung bình lý thuyết mong đợi là 2m. Và t < 0 do đó có nghĩa
là chiều cao trung bình cây tái sinh nhỏ thua có ý nghĩa khi so với chiều cao mong đợi là 2m; hay
nói khác nếu với yêu cầu cao trên 2m thì mới thoát được ảnh hưởng của lửa rừng, thì lô rừng này
cây tái sinh chưa đạt được.
19


3.2 So sánh sự sai khác giữa trung bình 2 mẫu – Kiểm tra T 2 mẫu
Trong các thí nghiệm thường người ta cần so sánh kết quả của 2 công thức, ví dụ: Bón phân hay
không bón, che bóng hay không che, sinh trưởng, tái sinh của cây rừng nơi được chăm sóc và nơi
không, sinh trưởng cây rừng nơi cháy và không cháy.....Việc kiểm tra tiến hành theo 2 mẫu trên cơ
sở so sánh 2 số trung bình bằng các tiêu chuNn t.

Công thức tính giá trị kiểm tra t:
X1− X2
t=
(n1− 1)S12 + (n2 − 1)S22 ( 1 + 1 ) n1+n2 − 2
n1 n2
Với:

X1, X2: Trung bình của mẫu 1 và 2.
S12, S22: Phương sai mẫu 1 và 2.
n1, n2: dung lượng 2 mẫu 1 và 2.

N ếu t tính lớn hơn t bảng với α=0.05 và độ tự do K=n1+n2-2 thì bác bỏ giả thuyết Ho, có nghĩa
trung bình 2 mẫu sai khác có ý nghĩa, và người ta sẽ chọn mẫu có trung bình cao.
Trước khi sử dụng tiêu chuẩn t, cần kiểm tra 2 điều kiện: o Hai
mẫu có phân bố chuNn.
o Phương sai của hai mẫu có bằng nhau hay không
Hai mẫu có phân bố chuẩn: Có thể vẽ biểu đồ phân bố tần số từng mẫu, hoặc dựa vào

độ lệch và độ nhọn để xem xét có tiệm cận chuNn hay không. Trong nhiều trừong hợp
thống kê về xã hội lẫn tự nhiên, người ta phải rút mẫu đủ lớn để bảo đảm tiêu chí này.
Khi dung lượng mỗi mẫu >30 thì có thể xem là tiệm cận chuNn.
Kiểm tra bằng nhau của 2 phương sai của 2 mẫu bằng tiêu chuẩn F.
Trước khi chọn lựa tiêu chuNn t để so sánh trung bình 2 mẫu, cần kiểm tra sự sai khác phương sai
của chúng bằng tiêu chuNn F.
Ví dụ: Kiểm tra sinh trưởng chiều cao H của 2 phương pháp trồng thông 3 lá Pinus kesiya bằng cây
con và rễ trần tại trạm thực nghiệm Lang Hanh-Lâm Đồng: Mỗi công thức được rút mẫu theo ô tiêu
chuNn 1000m2, đo đếm chiều cao:
- Dung lượng quan sát mỗi mẫu >90cây, nên chấp nhận giả thuyết phân bố N H của từng mẫu tiệm
cận chuNn.
- Kiểm tra bằng nhau của 2 phương sai bằng tiêu chuNn F:
Bảng tóm tắt số liệu sinh trưởng H của hai mẫu
A

20

B


1

H (cây con)

H (rễ trần)

2

13,6


13

3

14

13 , 5

13,8

12

13

13 , 5

11

15

12

14

12,5

10

93
94


9

Tính F: Một trong 2 cách:
C1: Kích nút fx, có hộp thoại: Chọn: Statistical (trong Function Category) và Ftest-N ext (trong
Function name): Xuất hiện hội thoại tiếp theo:
Array 1: Đưa vào dãy 1: A2:A93
Array 2: Đưa vào dãy 2: B2:B94
Finish.
C2: Đưa đến ô kết quả: =Ftest(A2:A93,B2:b94) Enter.
Nếu giá trị xác suất P > 0.05, kết luận hai phương sai bằng nhau, nếu ngược lại thì bác bỏ.
Kết quả ví dụ trên có P=0.40>0.05, kết luận phương sai hai mẫu bằng nhau (chưa có sai dị
rõ).
• Dùng tiêu chuẩn t để kiểm tra giả thuyết Ho theo trình tự:
Trong menu Tools/Data Analysis: Chọn trong hộp thoại một trong hai trưòng hợp tuỳ theo phương
sai hai mẫu có bằng nhau hay không qua kiểm tra bằng F ở bước trước o t-Test: Two sample
assuming equal variance (Trường hợp phương sai bằng nhau).
o t-Test: Two sample assuming unequal variance (Trường hợp phương sai không bằng nhau).

21


Trong Hộp thoại: Xác định: o Variable 1 range: Khối
dữ liệu mẫu 1 (A1:A93) o Variable 2 range: Khối dữ
liệu mẫu 2 (B1:B94) N ên đưa cả tiêu đề.
o Hypothesized mean diference: Đưa vào 0 (Có nghĩa giả thuyết Ho=0). Có thể thay đổi giả thuyết
này theo yêu cầu đánh giá thí nghiệm. Ví dụ nếu muốn kiểm tra xem hai trung bình của hai mẫu có
thực sự sai khác nhau không, giả thuyết Ho sẽ là: Ho: Mean1 = Mean2 hay nói khác Mean1 – Mean
2 = 0, lúc này giải thuyết Ho được đặt giá trị là 0.
o Label: N ếu có đưa hàng tiêu đề vào thì cần đánh dấu vào label o Output range: Đưa địa chỉ ô trên

trái nơi xuất kết quả. o OK.
N ếu: P(T<=t) two tail (hai chiều) <0.05, bác bỏ Ho, có nghĩa 2 mẫu sai dị rõ, ngược lại thì trung
bình hai mẫu chưa có sai khác.
Hoặc |t Stat| > t Critical two tail (t hai chiều), bác bỏ Ho, hai mẫu sai dị rõ, ngược lại thì sai khác là
ngẫu nhiên.

t-Test: Two-Sample Assuming Equal Variances
H (cây con)
Mean

11,60434783

13,40322581

Variance

2,559761108

2,148141655

Observations
Pooled Variance
Hypothesized Mean Difference
df

22

H (rễ trần)

92

2,352826738
0
183

93


t Stat

-7,975469453

P(T<=t) one-tail

7,98781E-14

t Critical one-tail

1,653222625

P(T<=t) two-tail

1,59756E-13

t Critical two-tail

1,973012331

Từ kết quả trên cho thấy sinh trưởng của P.kesiya trồng bằng 2 phương pháp khác nhau sai dị rõ.
Chiều cao bình quân cây trồng bằng rễ trần hơn hẵn trồng bằng cây con, do vậy phương pháp trồng
thông 3 lá bằng rễ trần cần được ứng dụng trong thực tiễn.


4 NGHIÊN CỨU MỐI QUAN HỆ SINH THÁI LOÀI TRONG
RỪNG MƯA NHIỆT ĐỚI DỰA VÀO TIÊU CHUẨN χ2 (Bảo
Huy, 1997)













Rừng hỗn loài nhiệt đới bao gồm nhiều loài cây cùng tồn tại, thời gian cùng tồn tại của một số loài
trong đó phụ thuộc vào mức độ phù hợp hay đối kháng giữa chúng với nhau trong quá trình lợi
dụng những yếu tố môi trường. Có thể phân ra làm 3 trường hợp:
Liên kết dương: Là trường hợp những loài cây có thể cùng tồn tại suốt quá trình sinh trưởng, giũa
chúng không có sự cạnh tranh về ánh sáng, về các chất dinh dưỡng trong đất và không làm hại nhau
thông qua các chất hoặc sinh vật trung gian khác.
Liên kết âm: Là trường hợp những loài cây không thể tồn tại lâu dài bên cạnh nhau được do có
những đối kháng quyết liệt trong quá trình lợi dụng các yếu tố môi trường (ánh sáng, chất dinh
dưỡng trong đất, nước..), có khi loại trừ lẫn nhau thông qua nhiều yếu tố như: độc tố lá cây, các tinh
dầu hoặc sinh vật trung gian..
Quan hệ ngẫu nhiên: Là trường hợp những loài cây tồn tại tương đối độc lập với nhau.
Việc nghiên cứu mối quan hệ giữa các loài là nhằm mục đích:
Phục vụ việc “đơn giản hóa tổ thành”, xác định việc nên giữ lại và đào thải loài cây nào trong thiết

kế nuôi dưỡng, khai thác rừng tự nhiên.
Định hướng trong việc lựa chọn nhóm loài cây hỗn giao trong trồng rừng, làm giàu rừng.
Tuy nhiên, nghiên cứu đầy đủ mối quan hệ giữa các loài cây trong rừng tự nhiên là một vấn đề phức
tạp, đòi hỏi căn cứ trên nhiều yếu tố. Trong thống kê sinh học, phương pháp dự báo được sử dụng
để xác định mối quan hệ giữa các loài, làm cơ sở cho việc định hướng lựa chọn mô hình trồng rừng
hỗn giao, điều chỉnh tổ thành trong công tác lâm sinh.
Phương pháp nghiên cứu gồm có các bước chính:
Xác định diện tích biểu hiện loài
Dự báo mối quan hệ giữa các loài
i) Xác định diện tích biểu hiện loài
Để nghiên cứu mối quan hệ sinh thái giữa các loài, cần phải rút mẫu theo ô tiêu chuNn để tính toán
xác suất xuất hiện các loài, vấn đề đặt ra là kích thước ô tiêu chuNn bao nhiêu để bảo đảm đại diện,
đó chính là xác định diện tích biểu hiện loài.
23


N guyên tắc nghiên cứu trong trường hợp này là xác định một diện tích ô mẫu nhỏ nhát nhưng bảo
đảm xuất hiện các loài ưu thế sinh thái.
Thu thập số loài theo ô tiêu chuNn diện tích thay đổi (Theo từng loại: Cây gỗ, cây tái sinh), diện
tích ô bắt đầu là 100m2 và tăng dần đến khoảng 1 – 2ha.
Số loài theo kích thước ô mẫu tăng dần
Stt

Số loài

Tên loài

1
2
3

4
5
6
7
8
9
10
11

Diện tích ô tiêu chuẩn
(m2)
100
100
100
,,,,
200
200
,,,
400
400
,,,
600

5
4
6
,,,,
6
8
,,,,

10
11
,,,

a, d, hg

n

2500

18

,,,,
,,,

Có thể biểu thị việc xác định diện tích biểu hiện loài bằng đồ thị sau:
Di

n tích ôtc
(
S)
S

loài

n
đị
nh loài
Di


n tích
biểu hiện loài
Xác định diện tích biểu hiện loài

Mô phỏng quan hệ: N (số loài) = f(S=diện tích ô tiêu chuNn), dạng quan hệ sau có thể được sử
dụng:

N =a.e−b.S −m
24


−b.S − m

=

Lim Na.e

=a

Khi S → + ∞
Ví dụ: Tiến hành điều tra thử nghiệm 53 ô có diên tích từ 100m 2 đến 10.000m2 ở rừng khộp vùn Ea
Soup, trên mỗi ô xác định số loài thuộc tầng cây gỗ (có đường kính ngang ngực lớn 10cm) xuất
hiện. Tiến hành mô phỏng quy luật biến đổi số loài (N ) theo diện tích ô (S) bằng một dạng hàm mũ
cơ số e. Kết quả đã ước lượng các tham số:

N =16.810.e−6.900.S− 0.246
Với n=53

R=0.907


Fr=722.58

α<0.01

Phương trình đạt hệ số tương quan cao chứng tỏ có mối liên hệ chặt chẽ giữa N và S, và dạng hàm
này mô tả tốt chiều hướng biến thiên.
Khảo sát hàm này cho thấy khi tăng diện tích lên vô hạn thì số loài xuất hiện tiệm cận với giá trị của
tham số a = 16.810. N hư vậy có nghĩa là đối với rừng khộp tại Ea Soup, số lượng loài thuộc tầng
cây gỗ không nhiều, chỉ đạt đến 17 loài.
Đặc biệt một số loài có hệ số tổ thành gần như tuyệt đối. Các loài phổ biến của rừng khộp: Cà chắc
(Shorea obtusa); CNm liên (Pentacme siamensis), Dầu đồng (Dipteocarpus tuberculatus), Dầu trà
beng (Dipterocarpus obtusifolius), Chiêu liêu (Terminalia mycrocarpa) và một số loài thuộc loài
khác có tỷ lệ thấp hơn trong tổ thành. N hư vậy số loài phổ biến trên một đơn vị diện tích rừng khộp
chỉ khoảng 5-6 loài.
Từ phương trình, thế giá trị N =6 vào suy được diện tích biểu hiện, đây cũng chính là diện tích cần
có của một ô tiêu chuNn trong rút mẫu điều tra nghiên cứu quan hệ sinh thái loài. Diện tích biểu
hiện trong trường hợp này là S = 2.500m2. Vậỵ có thể chọn ô hình vuông với kích thước 50x50m.
ii) Dự báo mối quan hệ sinh thái giữa các loài
Trên cơ sở đã xác định dược diện tích ô biểu hiện sinh thái loài; tiếp tục xác định dung lượng mẫu
(số ô tiêu chuNn) cho từng sinh cảnh theo công thức:
t2.V%2
Nct



2

Δ%

(

)
1
2
2





25

Trong đó: t = 1,96 khi độ tin cậy là 95%


×