Tải bản đầy đủ (.doc) (47 trang)

ĐỀ CƯƠNG BÀI GIẢNG THỐNG KÊ TOÁN HỌC TRONG LÂM NGHIỆP

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.7 MB, 47 trang )

ĐỀ CƯƠNG BÀI GIẢNG
THỐNG KÊ TOÁN HỌC TRONG LÂM NGHIỆP
1
Chương 1
PHÂN BỐ THỰC NGHIỆM VÀ PHƯƠNG PHÁP ƯỚC LƯỢNG
CÁC THAM SỐ ĐẶC TRƯNG CỦA TỔNG THỂ
Số tiết: 7 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành: 0 tiết)
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ Các phương pháp chọn mẫu
+ Phân bố thực nghiệm
+ Ước lượng điểm, ước lượng khoảng
- Kỹ năng: Vận dụng được để tính toán các đặc trưng mẫu, lập các phân bố thực nghiệm
- Thái độ: Chủ động, tích cực trong việc tìm hiểu các đặc trưng mẫu và phân bố thực nghiệm
1.1. Một số khái niệm
1.1.1. Tổng thể và mẫu
1.1.1.1. Tổng thể
- Khái niệm: Tổng thể là toàn bộ đối tượng cần nghiên cứu, số lượng các phần tử của
tổng thể được gọi là dung lượng tổng thể.
- Ký hiệu: N là dung lượng của tổng thể. Dung lượng của tổng thể có thể là một số hữu
hạn hoặc vô hạn.
- Ví dụ: Tổng số dân trong tỉnh Phú Thọ. Hoặc tổng số cây rừng trong một lâm phần.
1.1.1.2. Mẫu
- Khái niệm: Mẫu là một bộ phận của tổng thể, mà trên đó người ta tiến hành điều tra, đo
đếm và thu thập tài liệu. Số lượng các phần tử của mẫu được gọi là dung lượng mẫu.
- Ký hiệu: n là dung lượng mẫu, dung lượng mẫu luôn là một số hữu hạn.
- Ví dụ: Số cây trong OTC đo đếm. Số người trong xã được phỏng vấn.
1.1.2. Các phương pháp chọn mẫu
1.1.2.1. Chọn mẫu ngẫu nhiên
Chúng ta đem đánh số các phần tử và sau đó bốc thăm tạo thành mẫu. Có thể dựa vào
Bảng số ngẫu nhiên, rút thăm hay trình lệnh T-D-S trong Excel.


1.1.2.2. Chọn mẫu hệ thống
Các phần tử quan sát rải đều trong tổng thể.
- Chọn mẫu theo tuyến song song cách đều:
0
S
S
N
r
=
(1.1)
Sr: diện tích rừng; So: diện tích 1 ô; N: dung lượng tổng thể
- Chọn mẫu theo mắt lưới.
1.1.2.3. Chọn mẫu điển hình
Dựa vào một số thông tin đã biết trước về tổng thể sau đó sẽ lấy mẫu là những phần tử
điển hình, đại diện nhất cho tổng thể. Những phần tử này cho phép kết luận cho toàn bộ tổng thể.
1.1.3. Dấu hiệu quan sát (tiêu thức thống kê)
1.1.3.1. Dấu hiệu quan sát về lượng (đại lượng quan sát)
- Khái niệm: Dấu hiệu quan sát về lượng là đại lượng có thể cân, đong đo, đếm một cách
chính xác bằng các dụng cụ điều tra.
2
- Ký hiệu: Đại lượng quan sát là các chữ cái in: X, Y, Z…
- Ví dụ: Chiều cao vút ngọn (H
vn
), đường kính ngang ngực (D
1.3
),
- Đại lượng quan sát liên tục: Là đại lượng có thể nhận bất kỳ giá trị nào trong một
khoảng xác định nào đó.
- Ví dụ: Chiều cao cây rừng, bề dày sản phẩm, độ dài sợi nấm…
- Đại lượng đứt quãng: Là những đại lượng chỉ có thể nhận các giá trị là những số tròn

đếm được.
- Ví dụ: Số quả có trên một cành, số sâu có trên một cây, số sản phẩm được sản xuất/1 ca
của một cỗ máy…
1.1.3.2. Dấu hiệu quan sát về chất
- Khái niệm: Đại lượng có các phần tử phân biệt nhau bởi 1 đặc điểm hay tính chất.
- Ví dụ: Hạt nảy mầm, không nảy mầm; cây bị bệnh, không bị bệnh; cây tốt, xấu,…
- Bằng cách gán cho các phần tử mang đặc điểm A giá trị 0 và các phần tử mang đặc
điểm khác A giá trị là 1, khi đó nhận được dấu hiệu quan sát về lượng 2 giá trị 0,1 – là đại lượng
đứt quãng.
1.2. Phân bố thực nghiệm
1.2.1. Khái niệm
Quy luật phân bố của những giá trị quan sát được ở mẫu có thể khái quát hoá thành phân
bố lý thuyết gọi là phân bố thực nghiệm.
Phân bố thực nghiệm được lập khi dung lượng mẫu đủ lớn (n≥30).
1.2.1.1. Lập phân bố thực nghiệm cho đại lượng đứt quãng
- Bước 1: Tìm giá trị lớn nhất, giá trị nhỏ nhất (X
max
, X
min
) trong dãy quan sát.
- Bước 2: Lập bảng phân bố tần số thực nghiệm.
- Bước 3: Thống kê các phần tử cùng giá trị theo kiểu kiểm phiếu bầu cử.
- Bước 4: Tính tần số, tần suất thực nghiệm.
- Bước 5: Vẽ biểu đồ phân bố thực nghiệm.
- Ví dụ 1.1: Lập phân bố thực nghiệm số ô theo số cây thông nhựa tái sinh tự nhiên có
trong 60 ô quan sát ở khu vực Uông Bí – Quảng Ninh
1.2.1.2. Lập phân bố thực nghiệm cho đại lượng liên tục
- Bước 1: Chia tổ ghép nhóm.
)lg(.5 nm =
(1.2)

m
XX
k
minmax

=
(1.3)
Trong đó:
+ m là số tổ được chia.
+ k là cự ly tổ.
+ X
max
, X
min
là trị số quan sát lớn nhất và bé nhất.
- Bước 2: Lập bảng phân bố tần số và tần suất thực nghiệm.
- Bước 3: Thống kê các phần tử có cùng giá trị theo kiểu kiểm phiếu bầu cử.
- Bước 4: Tính tần số thực nghiệm.
- Bước 5: Vẽ biểu đồ.
- Ví dụ 1.2: Lập phân bố thực nghiệm cho bề dày của 50 sản phẩm gỗ
3
1.2.2. Các đặc trưng của phân bố thực nghiệm (đặc trưng mẫu)
1.2.2.1. Số trung bình mẫu
a. Trung bình mẫu giản đơn
- Khái niệm: Giả sử có một dãy trị số quan sát: x
1
, x
2
,…. x
n

, thì trị số:
=+++= ) (
1
21 n
xxx
n
x
n
1

=
n
i
i
x
1
(1.4)
được gọi là số trung bình mẫu giản đơn
- Chú ý: Số trung bình mẫu giản đơn thường tính với mẫu nhỏ (n<30), tài liệu chưa qua
chỉnh lý.
- Ví dụ 1.3: Tính trung bình về chiều cao cây rừng từ số liệu đo cao 10 cây
b. Trung bình gia quyền
Trong trường hợp mẫu lớn (n≥30), tài liệu đã qua chỉnh lý, số trung bình mẫu được tính
theo công thức sau:
=x
n
1

=
m

i
ii
xf
1
(1.5)
Với x
i
là trị số giữa tổ, f
i
là tần số tương ứng với mỗi tổ.
- Ví dụ 1.4: Tính trung bình về chiều cao cây rừng từ số liệu đo cao 30 cây
1.2.2.2. Số trung bình toàn phương
- Khái niệm: Giả sử có 1 dãy các trị số quan sát: z
1
, z
2
,… z
n
thì số bình quân:

=
=
n
i
i
z
n
z
1
2

1
(1.6)
được gọi là số trung bình toàn phương.
Trong lâm nghiệp, đã vận dụng số trung bình toàn phương để tính đường kính bình quân
cây rừng theo công thức:

=
=
n
i
i
d
n
d
1
2
1
(1.7)
- Ví dụ 1.5: Tính đường kính bình quân toàn phương của 6 cây rừng sau: d
1
=8.2 cm;
d
2
=7.5 cm; d
3
=6.4 cm; d
4
=9.0 cm; d
5
=8.0 cm; d

6
=7.3 cm.
1.2.2.3. Phương sai và sai tiêu chuẩn
a. Sai tiêu chuẩn mẫu
- Khái niệm: Là số bình quân toàn phương về độ lệch giữa các giá trị quan sát với số
trung bình mẫu của nó.
- Công thức hiệu đính sai tiêu chuẩn mẫu được viết như sau:

=


=
n
i
i
xx
n
S
1
)(
1
1
(1.8)
- Để tính sai tiêu chuẩn mẫu, cần lưu ý 2 trường hợp sau:
+ Trường hợp mẫu nhỏ (n<30):
1−
=
n
Q
S

x
với


=
=
−=
n
i
n
i
i
ix
n
x
xQ
1
1
2
2
)(
(1.9)
4
+ Ví dụ 1.6: Tính sai tiêu chuẩn về chiều cao từ số liệu đo chiều cao 10 cây rừng
+ Trong trường hợp mẫu lớn (n>30), tài liệu đã qua chỉnh lý:
1−
=
n
Q
S

x
với


=
=
−=
n
i
n
i
ii
iix
n
xf
xfQ
1
1
2
2
)(
(1.10)
+ Ví dụ 1.7: Từ tài liệu chỉnh lý số sản phẩm theo bề dày của 50 sản phẩm được sản xuất
ở 1 cỗ máy chế biến, tính sai tiêu chuẩn về bề dầy sản phẩm
b. Phương sai mẫu
- Bình phương sai tiêu chuẩn mẫu được gọi là phương sai mẫu.
- Phương sai mẫu ký hiệu là: S
2
.
1.2.2.4. Hệ số biến động

- Khái niệm: Biểu thị mức độ biến động bình quân tương đối của dãy trị số quan sát.
100.%
x
S
S =
(1.11)
Nhờ chỉ tiêu này mà có thể so sánh mức độ biến động giữa các dãy trị số quan sát với
nhau trên cùng 1 dấu hiệu điều tra nào đó.
- Ví dụ 1.8: Khu rừng A có chiều cao bình quân là 8,5m và sai tiêu chuẩn về chiều cao là
1.2m, khu rừng B có chiều cao bình quân là 10,5m và sai tiêu chuẩn về chiều cao là 1,2m. Hỏi
khu rừng nào có mức độ phân hoá về chiều cao mạnh hơn?
1.2.2.5. Phạm vi biến động
- Khái niệm: Phạm vi biến động là khoảng chênh lệch giữa trị số quan sát lớn nhất và bé
nhất của dãy trị số quan sát.
R=X
max
-X
min
Trong đó: X
max
và X
min
là trị số quan sát lớn nhất và bé nhất của dãy quan sát.
1.2.2.6. Sai số của số trung bình mẫu
Là đại lượng xác định bởi công thức:
n
S
S
x
=

(1.12)
1.2.2.7. Hệ số chính xác
Là sai số tương đối trung bình của số trung bình mẫu:
n
S
x
S
P
x
%
100.% ==
1.2.2.8. Độ lệch (S
K
)
- Khái niệm: Độ lệch là đại lượng đặc trưng cho mức độ chênh lệch của đỉnh đường cong
so với số trung bình.
3
1
3
.
)(
Sn
xx
S
n
i
i
K

=


=
(1.13)
Nếu S
K
=0 thì phân bố là đối xứng.
S
K
>0 thì đỉnh đường cong lệch trái so với số trung bình.
S
K
<0 thì đỉnh đường cong lệch phải so với số trung bình.
1.2.2.9. Độ nhọn phân bố
- Khái niệm: Là đại lượng đặc trưng cho mức độ tập trung hay phân tán của các trị số
quan sát xung quanh trị số trung bình.
- Ký hiệu độ nhọn là E
X
:
5
3
.
)(
4
1
4


=

=

Sn
xx
E
n
i
i
X
(1.14)
E
X
=0 thì đường cong thực nghiệm tiệm cận chuẩn.
E
X
>0 thì đỉnh đường cong nhọn so với phân bố chuẩn.
E
X
<0 thì đỉnh đường cong bẹt hơn so với phân bố chuẩn.
1.3. Phương pháp ước lượng các tham số đặc trưng của tổng thể
Giả sử X là một biến ngẫu nhiên có phân bố xác suất phụ thuộc vào một số hữu hạn các
tham số: θ
1
, θ
2
,…, θ
n
. Từ biến ngẫu nhiên này thực hiện n quan sát và tạo thành một mẫu.
1.3.1. Phương pháp ước lượng điểm
- Khái niệm: Là phương pháp ước lượng thống kê, trong đó người ta dùng trị số của hàm
ước lượng được tính toán ở mẫu thay thế một cách gần đúng cho tham số của tổng thể cần ước lượng.
- Công thức tổng quát của phương pháp ước lượng điểm tham số θ của tổng thể như sau:

)(nT
Dt ±=
θ
(1.15)
+ θ là tham số của tổng thể cần ước lượng.
+ T
n
là hàm ước lượng của tham số θ.
+ t là trị số thực của hàm ước lượng T
n
.
+ D
T(n)
là phương sai của hàm ước lượng T
n
.
- Ví dụ 1.9: Để ước lượng số trung bình tổng thể µ, người ta đã chứng minh được rằng:
số trung bình mẫu (
x
) là hàm ước lượng tốt nhất thoả mãn cả 3 tính chất của 1 hàm ước lượng:
không chệch, hội tụ và hiệu nghiệm. Công thức ước lượng điểm như sau:
n
S
xSx
x
±=±=
µ
(1.16)
Trong đó
n

S
S
x
=
được gọi là sai số của số trung bình mẫu.
1.3.2. Phương pháp ước lượng khoảng
- Khái niệm: Là phương pháp ước lượng thống kê trong đó tham số cần ước lượng của
tổng thể chứa trong một khoảng xác định được cấu tạo từ những kết quả quan sát ở mẫu với một
xác suất (hay độ tin cậy) cho trước.
- Công thức tổng quát của phương pháp ước lượng khoảng tham số θ của tổng thể:
αθ
−=≤≤ 1)(
trd
GGP

+ P = 1-α = β là độ tin cậy của ước lượng.
+ α là mức ý nghĩa, trong lâm nghiệp thường chọn α bằng 0,05; 0,01 hay 0,001
+ G
d
, G
tr
là giới hạn dưới và giới hạn trên của khoảng ước lượng.
+
2
L
=∆
là sai số tuyệt đối của ước lượng số trung bình và thành số tổng thể.
+
100% x
x


=∆
là sai số tương đối của ước lượng.
1.3.2.1. Ước lượng khoảng số trung bình tổng thể
6
a. Ước lượng khoảng số trung bình tổng thể trong trường hợp mẫu nhỏ (n<30), tài liệu chưa qua
chỉnh lý và tổng thể có phân bố chuẩn
- Người ta đã chứng minh được rằng, nếu tổng thể có phân bố chuẩn X∈N(µ,σ
2
) thì đại lượng:
n
S
x
T .
µ

=
có phân bố t với k=n-1 bậc tự do. Vì vậy, căn cứ vào luật phân bố t có thể viết:
αµ
αα
−=+≤≤− 1) (
)(2/)(2/
n
S
tx
n
S
txP
kk
(1.17)

Trong đó:
+
x
là số trung bình mẫu.
+ S là sai tiêu chuẩn mẫu.
+ t
α
/2(k)
là giá trị tra bảng của phân bố t.
- Sai số cực hạn của ước lượng là:
n
S
t
k
.
)(2/
α
±=∆
- Sai số tương đối của ước lượng là:
nx
St
x
k
).(
100
100%
)(2/
α



=∆
- Nếu cho trước sai số tương đối thì dung lượng quan sát cần thiết được tính:
22
42
2/
2
%).()(
10
c
ct
x
St
n


α
(1.18)
- Ví dụ 1.11: Ước lượng chiều cao bình quân của 9 cây quế con trong vườn ươm dưới
công thức dàn che 50%, với α=0,05. Nếu muốn sai số không vượt quá 3% thì dung lượng quan
sát cần thiết bằng bao nhiêu? Biết rằng phân bố số cây theo chiều cao là tuân theo luật chuẩn.
b. Ước lượng khoảng số trung bình tổng thể trong trường hợp mẫu lớn (n≥30)
Để ước lượng số trung bình tổng thể µ, cần rút ngẫu nhiên một mẫu với dung lượng đủ
lớn (n≥30). Theo định luật số lớn thì phân bố xác suất của số trung bình mẫu tiệm cận luật
chuẩn, vì vậy công thức ước lượng khoảng số trung bình tổng thể sẽ là:
αµ
αα
−=+≤≤− 1) (
2/2/
n
S

Ux
n
S
UxP
(1.19)
Trị số U
α
/2
được tra trong phụ biểu 1 ứng với xác suất 1-α.
Nếu α=0,05 > 1- α=0,95 > U
α
/2
=1,96
Nếu α=0,01 > 1- α=0,99 > U
α
/2
=2,58
Nếu α=0,001 > 1- α=0,999 > U
α
/2
=3,29
Trong công thức (1.19):
n
S
UxG
d
.
2/
α
−=

n
S
UxG
tr
.
2/
α
+=
n
S
UGGL
dtr
2
2/
α
=−=
7
n
S
U
L
.
2
2/
α
±==∆
100
.
100%
2/

×=×

=∆
nx
SU
x
α
Trường hợp nếu cho trước sai số tương đối (∆%) thì dung lượng quan sát cần thiết được
xác định theo công thức sau:
22
42
2/
2
%).()(
10
c
ct
x
SU
n


α
(1.20)

100% x
x
S
S =
nên công thức (1.20) còn có thể viết:

2
2
2/
2
%)(
%).(
c
ct
SU
n


α
(1.21)
Nếu dung lượng quan sát cần thiết được tính theo (1.20) hay (1.21) lớn hơn dung lượng
mẫu đã điều tra thì cần thiết phải điều tra bổ sung, dung lượng quan sát bổ sung là: n
bs
=n
ct
-n.
- Ví dụ 1.10: Từ kết quả điều tra bề dày 50 sản phẩm được sản xuất từ một cỗ máy chế
biến (ví dụ 1.2 – bảng 1.4), hãy ước lượng bề dày bình quân của lô phẩm với α=0,05. Nếu muốn
sai số tương đối của ước lượng không vượt quá 4% thì dung lượng quan sát cần thiết bằng bao
nhiêu?
1.3.2.2. Ước lượng khoảng phương sai tổng thể (
σ
2
)
Giả sử một tổng thể có phân bố chuẩn X∈N(µ,σ
2

), trong đó phương sai tổng thể σ
2
là 1
tham số chưa biết cần ước lượng.
Người ta đã chứng minh được rằng, nếu X∈N(µ,σ
2
) thì biến ngẫu nhiên:
2
2
2
).1(
σ
χ
Sn −
=
(1.22)
có phân bố χ
2
với k=n-1 bậc tự do. Vì vậy, có thể cấu tạo khoảng ước lượng phương sai tổng thể
dựa vào phân bố χ
2
như sau:
α
χ
σ
χ
αα
−=

≤≤



1
).1().1(
(
2
)(2/1
2
2
2
)(2/
2
kk
SnSn
P
(1.23)
Trong đó χ
2
α
/2(k)
và χ
2
1-
α
/2(k)
được tra ở phụ biểu số 5 ứng với xác suất
2
α
và 1-
2

α
và bậc tự
do k=n-1.
- Ví dụ 1.12: Để khảo sát độ chính xác của một dụng cụ đo cao, người ta đo trên cùng
một mục tiêu 10 lân bằng cùng một dụng cụ với phương sai S
2
=0,25 m
2
. Hãy ước lượng độ
chính xác của dụng cụ đo cao với độ tin cậy β=0,95.
1.3.3.3. Ước lượng khoảnh thành số tổng thể (P
t
)
Giả sử một tổng thể có N phần tử phân biệt nhau bởi một dấu hiệu nào đã trong đó có M
phần tử mang đặc điểm A và N-M phần tử mang đặc điểm khác A thì tỷ số:
N
M
P
t
=
được gọi là thành số tổng thể của những phần tử mang đặc điểm A.
8
N
MN
PQ
tt

=−=1
được gọi là thành số tổng thể của những phần tử mang đặc điểm
khác A.

Từ tổng thể rút ngẫu nhiên 1 mẫu với dung lượng đủ lớn (n>30), trong đó có m phần tử
mang đặc điểm A và n-m phần tử mang đặc điểm khác A, thì tỷ số:
n
m
P
t
=
được gọi là thành số mẫu của những phần tử mang đặc điểm A.
n
mn
pq
mm

=−= 1
là thành số mẫu của những phần tử mang đặc điểm khác A.
Người ta đã chứng minh được rằng, khi n đủ lớn mà P
t
không gần 0 và 1 hoặc n. P
r
≥ 5 thì
phân bố xác suất của P
m
là tiệm cận chuẩn, vì vậy công thức ước lượng khoảng sẽ là:
( ) ( )
)26.1(1
1
.
1
.
22

α
αα
−=









+≤≤


n
pP
UPP
n
pP
UPP
mm
mt
mm
mm
với sai số tuyệt đối của ước lượng là:
( )
n
pP
U

mm

±=∆
1
.
2
α
Nếu cho trước sai số tuyệt đối của ước lượng (∆
c
) thì dung lượng quan sát cần thiết sẽ là:
( )
2
2
2
1.
c
mm
ct
ppU
n



α
(1.25)
- Ví dụ 1.13: Một khu rừng có diện tích rất lớn, người ta điều tra ngẫu nhiên một mẫu với
dung lượng n = 450 cây, trong đó có 120 cây bị bệnh sâu róm thông. Hãy ước lượng tỷ lệ cây bị
bệnh của cả khu rừng với α = 0,05. Nếu muốn sai số không vượt quá 0,04 thì dung lượng quan
sát cần thiết bằng bao nhiêu?
*) Bài tập

1. Kết quả điều tra sinh trưởng đường kính ngang ngực (D
1.3
) của rừng trồng Keo lai, mật độ
2500 cây/ha cho trong tài liệu sau:
D
1.3
(cm) 7 9 11 13 15 17 19
f
t
3 5 10 13 11 3 2
Hãy ước lượng đường kính ngang ngực (D
1.3
) trung bình của lâm phần với độ tin cậy α =
0,05. Nếu muốn sai số của ước lượng không vượt quá 5% thì dung lượng quan sát cần thiết bằng
bao nhiêu?
2. Kết quả điều tra sinh trưởng chiều cao vút ngọn (H
vn
) của rừng trồng Keo lai, mật độ 1666
cây/ha cho trong tài liệu sau:
H
vn
(m) 6 8 10 12 14 16 18
f
t
2 6 5 9 8 5 3
Hãy ước lượng chiều cao vút ngọn (H
vn
) trung bình của lâm phần với độ tin cậy α = 0,05.
Nếu muốn sai số của ước lượng không vượt quá 5% thì dung lượng quan sát cần thiết bằng bao
nhiêu?

*) Tài liệu học tập
9
1. Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2. Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
*) Câu hỏi ôn tập
1. Thế nào là tổng thể, mẫu? Cho biết một số cách chọn mẫu trong lâm nghiệp?
2. Các phương pháp mô tả một phân bố thực nghiệm? Ý nghĩa và nội dung từng phương pháp?
3. Cho biết ý nghĩa và cách tính 5 đặc trưng mẫu: Trung bình, sai tiêu chuẩn, hệ số biến động, sai
số của số trung bình và hệ số chính xác?
10
Chương 2
MÔ HÌNH HÓA QUY LUẬT CẤU TRÚC TẦN SỐ
Số tiết: 8 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành: 1 tiết )
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ Kiểm định giả thuyết bằng tiêu chuẩn χ
2
+ Mô phỏng được phân bố theo các hàm phân bố Weibull, khoảng cách, Meyer
- Kỹ năng: Vận dụng được để mô phỏng các phân bố thực nghiệm bằng các hàm phân bố
- Thái độ: Chủ động, tích cực trong việc tính toán mô phỏng các phân bố thực nghiệm
2.1. Ý nghĩa của việc mô hình hoá quy luật cấu trúc tần số
- Tạo tiền đề để đề xuất các giải pháp kỹ thuật lâm sinh hợp lý, chẳng hạn: cần thiết phải
điều chỉnh mật độ lâm phần ứng với từng giai đoạn tuổi lâm phần để điều tiết không gian dinh
dưỡng thông qua biện pháp tỉa thưa (đối với rừng sản xuất) trên cơ sở nghiên cứu quy luật phân
bố số cây theo mặt phẳng nằm ngang (n/D
1.3
), hay điều tiết cấu trúc theo mặt phẳng đứng tạo
những lâm phần nhiều tầng tán, đa tác dụng (đối với rừng phòng hộ) trên cơ sở nghiên cứu quy
luật phân bố số cây theo mặt phẳng đứng (n/H
vn

).
- Ví dụ: Quy luật phân bố số cây theo đường kính (n/D
1.3
) quy luật phân bố số cây theo
chiều cao vút ngọn (n/H
vn
)
2.2. Kiểm tra giả thuyết về luật phân bố
- Bước 1: Đặt giả thuyết: H
0
: F
x
(x)= F
0
(x)
F
x
(x) là phân bố thực nghiệm của đại lượng quan sát.
F
0
(x) là hàm phân bố lý thuyết đã xác định (phân bố chuẩn, phân bố giảm…)
- Bước 2: Nếu giả thuyết H
0
đúng và dung lượng mẫu đủ lớn để sao cho tần số lý thuyết ở
các tổ lớn hơn hoặc bằng 5 thì đại lượng ngẫu nhiên:

=

=
l

i
l
lt
n
f
ff
1
2
2
)(
χ
(2.1)
có phân bố χ
2
với k=l-r-1 bậc tự do.
Trong đó:
+ f
l
=n.p
i
là tần số lý luận tương ứng với từng tổ của đại lượng điều tra, với p
i
là xác suất
tương ứng mỗi tổ tính theo phân bố lý thuyết đã lựa chọn.
+ f
t
là tần số thực nghiệm.
+ l là số tổ sau khi gộp (đó là số tổ có tần số lý luận ≥ 5).
+ r là số tham số của phân bố lý thuyết.
- Bước 3: Kết luận về giả thuyết.

So sánh χ
n
2
với χ
2
0.5(k)

2.3. Một số phân bố lý thuyết thường gặp trong lâm nghiệp
2.3.1. Phân bố chuẩn
2.3.1.1. Khái niệm
Là phân bố xác suất của biến ngẫu nhiên liên tục. Nếu X là biến ngẫu nhiên liên tục có
phân bố chuẩn thì hàm mật độ xác suất có dạng:
11
( )
( )
)2.2(
2.
1
2
2
2b
ax
x
e
b
xP
−−
×=
π
Trong đó: + a: là kỳ vọng toán, đường cong đồ thị đối xứng qua đường x=a, khi a thay

đổi thì đỉnh đường cong sẽ di chuyển trên đường thẳng song song với trục hoành có tung độ:
π
2
1
b
y =
.
+ b: là sai tiêu chuẩn, khi b thay đổi đỉnh đường cong di chuyển trên đường thẳng song
song với trục tung có hoành độ: x = a
Trường hợp đặc biệt, khi a = 0 và b = 1 thì ta có phân bố chuẩn tiêu chuẩn hay phân bố
chuẩn 0, 1, ký hiệu là X ∈ N(0,1).
( )
)3.2(
2
1
2
2
u
x
eu

×=
π
ϕ
2.3.1.2. Cách tính xác suất theo phân bố chuẩn tiêu chuẩn
( )
( )
)4.2(
2.
1


2
1
2
2
2



=+≤≤−
x
x
b
ax
dxe
b
btaXbtaP
π
Đặt
b
ax
u

=
ta có:
t
b
abta
b
ax

u
t
b
abta
b
ax
u
+=
−+
=

=
−=
−−
=

=
.
.
2
2
1
1
( )
)5.2(
2
1

2
2


+


=+≤≤−
t
t
u
duebtaxbtaP
π
Do tính chất đối xứng của hàm ϕ
x(u)
nên
∫∫

=
t
t 0
0
vì thế (2.5) có thể viết:
P(a-t.b

X

a+t.b) = 2
Φ
(t) (2.6)
Trong đó:
( )
( )



t
ux
dut
0
.
ϕ
(2.7)
Hàm Φ(t) gọi là hàm số tích phân luôn luôn dương và bằng 0,5 khi t=+∞. Người ta đã lập
sẵn phụ biểu để tính hàm Φ(t) và 2Φ(t) khi t có những giá trị khác nhau (Phụ biểu số 2).
Các giá trị U
1
và U
2
tính được có thể âm hoặc dương, nhưng do tính chất đối xứng nên ta
đặt |U| = t. Có thể xảy ra 3 trường hợp sau:
- Trường hợp I: Cả U
1
và U
2
đều âm, nhưng U
1
có giá trị tuyệt đối lớn hơn U
2
. Khi đó xác
suất sao cho X lấy giá trị trong khoảng x
1
và x
2

sẽ là:
P(x
1


X

x
2
) =
Φ
(t
1
) –
Φ
(t
2
) (2.8)
với t
1
= |U
1
| và t
2
= |U
2
|
- Trường hợp II: U
1
âm và U

2
dương:
P(x
1


X

x
2
) =
Φ
(t
1
) +
Φ
(t
2
) (2.9)
- Trường hợp III: U
1
và U
2
đều dương và U
2
> U
1
:
P(x
1



X

x
2
) =
Φ
(t
2
) –
Φ
(t
1
) (2.10)
12
2.3.1.3. Nắn phân bố thực nghiệm theo dạng chuẩn
- Chỉnh lý tài liệu quan sát, tính các đặc trưng mẫu
x
, S.
- Thay thế một cách gần đúng
x
≈ µ và S ≈ σ
- Tính xác suất để X lấy giá trị trong các tổ của đại lượng điều tra
- Tính tần số lý thuyết: f
l
=n.p
i
.
- Kiểm tra giả thuyết H

0
về luật phân bố theo tiêu chuẩn phù hợp χ
2
.
H
0
: F
x
(x)= F
0
(x)
- Tính đại lượng:

=

=
l
i
l
lt
n
f
ff
1
2
2
)(
χ
(2.11)
có phân bố χ

2
với k=l-r-1 bậc tự do.
So sánh χ
n
2
tính theo (2.1) với χ
2
0.5(k)

- Vẽ biểu đồ phân bố tần số thực nghiệm và lý thuyết.
Ví dụ 2.1: Nắn phân bố thực nghiệm số sản phẩm theo bề dày (ví dụ 1.2) theo phân bố chuẩn.
2.3.2. Phân bố giảm (phân bố mũ)
2.3.2.1. Khái niệm
Phân bố giảm là phân bố xác suất của biến ngẫu nhiên liên tục với hàm mật độ:
P
x
(x)=
β
.e
-
β
x
(x>0)
Trong đó β là tham số của phân bố giảm.
Đường cong phân bố giảm, giảm khi x tăng, β càng lớn thì đường cong càng lõm và
ngược lại, β càng bé thì đường cong càng bẹt
2.3.2.2. Nắn phân bố thực nghiệm theo dạng hàm Meyer
Hàm Meyer có dạng: y=
α
.e

-
β
x
(2.12)
Trong đó α và β là hai tham số của hàm Meyer. Để xác định α và β phải logarit hoá 2 vế
phương trình (2.12):
lny=lnα-β.x
Đặt:
b
a
yy
=−
=
=
β
α
ln
ˆ
ln
Nhận được phương trình hồi quy tuyến tính 1 lớp:
bxay +=
ˆ
(2.13)
Để xác định các tham số a và b của phương trình hồi quy tuyến tính 1 lớp (2.13) có thể
dùng các công thức sau:
x
xy
Q
Q
b =


)14.2(xbya
−=
Trong đó:
)15.2(
.
.
m
yx
yxQ
xy
∑∑

−=
13




−=
−=
m
y
yQ
m
x
xQ
y
x
2

2
2
2
)(
)16.2(
)(

= y
m
y
1


= x
m
x
1
(2.17)
Với m là số tổ được chia theo biến số x.
Sau khi xác định được a và b theo công thức (2.14), dễ dàng tìm được các tham số α và β
của hàm Meyer:
Vì:
a=
α
lg
nên α=10
a
(2.18)
be =− lg
β

nên
e
b
lg
−=
β
(2.19)
- Ví dụ 2.2: Nắn phân bố số cây theo đường kính (N/D
1.3
) của ô tiêu chuẩn 2000m
2
trạng
thái rừng IIIA
1

2.3.3. Phân bố khoảng cách
2.3.3.1. Khái niệm
Phân bố khoảng cách là phân bố xác suất của biến ngẫu nhiên đứt quãng, hàm toán học
có dạng:

F(x)= (2.20)
Trong đó:
n
f
0
=
γ
với f
0
là tần số quan sát tổ thứ nhất.

Khi 1-γ=α thì phân bố khoảng cách trở về dạng phân bố hình học:
F(x)=(1-
α
)
α
x
với x≥0 (2.21)
2.3.3.2. Ước lượng các tham số của phân bố khoảng cách
)23.2(
)(
1
)22.2(
0
0


−=
=
ii
Xf
fn
n
f
α
γ
- Ví dụ 2.3: Nắn phân bố số cây theo đường kính (n/D
1.3
) trạng thái rừng IIIA
1
tại Tùng

Di-Cát Bà, theo tài liệu điều tra sau:
2.3.4. Phân bố Weibull
2.3.4.1. Khái niệm
Phân bố Weibull là phân bố xác suất của biến ngẫu nhiên liên tục với miên giá trị (0,+∞).
Hàm mật độ có dạng:
)24.2( )(
.1
α
λα
πα
x
x
exxf
−−
=
Trong đó α và λ là 2 tham số của phân bố Weibull. Khi các tham số α và λ thay đổi thì
dạng đường cong phân bố cũng thay đổi theo. Tham số α đặc trưng cho độ lệch của phân bố.
Tham số λ đặc trưng cho độ nhọn của đường cong phân bố.
14
γ với x=0
(1-α)(1-γ)α
X-1
với x≥1
)25.2(
).(


=
α
λ

axf
n
il
Trong đó a là trị số quan sát bé nhất, x
i
là trị giữa tổ.
2.3.4.2. Nắn phân bố thực nghiệm theo hàm Weibull
Tham số α được chọn sao cho kết quả tính trị số χ
n
2
theo công thức (2.1) là bé nhất và
nhỏ hơn χ
05
2
tra bảng với bậc tự do k=l-r-1.
Nếu giả thuyết không được chấp nhận thì tiến hành chọn tham số α khác phù hợp hơn.
- Ví dụ 2.4: Nắn phân bố thực nghiệm n/D
1.3
lâm phần mỡ trồng thuần loài đều tuổi theo
hàm Weibull theo kết quả điều tra sau đây (với α=3).
*) Bài tập
1. Nắn phân bố số cây theo đường kính (n/D
1.3
) của ô tiêu chuẩn 2000m
2
trạng thái rừng IIIA
1
theo tài liệu:
D
1.3

(x) 8 12 16 20 24 28 32
F
t
13 17 14 10 11 7 2
2. Nắn phân bố số cây theo đường kính (n/D
1.3
) trạng thái rừng IIIA
1
tại Tùng Di-Cát Bà, theo tài
liệu điều tra sau:
D
1.3
(x) 7 9 11 13 15 17 19 21 23 25 27
f
t
19 32 17 16 11 9 9 3 1 3 1
3. Nắn phân bố thực nghiệm n/D
1.3
lâm phần mỡ trồng thuần loài đều tuổi theo hàm Weibull theo
kết quả điều tra sau đây (với α=3).
D
1.3
(x) 7 9 11 13 15 17 19 21
f
t
2 7 14 19 11 6 4 1
*) Thực hành
1. Kiểm định luật chuẩn theo phương pháp Q-Q plot
Quy trình:
1.Graphs\P-P_ (hoặc Q-Q)

2.Đưa các biến kiểm định vào Variables trong Test distribution
3.Tiếp theo chọn phân bố lý thuyết cần mô phỏng như phân bố chuẩn (Normal) Weibull.…
Trong Distribution parameters chọn Estimation from data trong proportion Estimation
formula chọn Blom's
4.OK
2. Kiểm định theo dạng chuẩn chiều cao của 70 cây rừng
Quy trình:
1. Analyze\ Nonparametric Tests\ 1-Sample K- S
2. Trong hộp thoại Test variable lists, đưa biến kiểm tra (chẳng hạn h
vn
) vào và đánh dấu
dạng phân bố cần kiểm định: Normal, Poisson
3. Trong Options của hộp thoại One Sample Kolmogorov Smirnov Test, nếu muốn biết chi
tiết các đặc trưng mẫu, cần lựa chọn thêm Descriptive và nhấn Continue để trở về thực đơn
của hộp thoại One Sample Kolmogorov Smirnov Test
15
4. OK
*). Tài liệu học tập
1. Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2. Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
*) Câu hỏi ôn tập
1. Ý nghĩa của việc mô hình hóa cấu trúc tần số?
2. Trình tự các bước kiểm định giả thuyết bằng tiêu chuẩn χ
2
?
3. Vai trò, ý nghĩa của các hàm phân bố Weibull, khoảng cách, Meyer trong nghiên cứu lâm nghiệp?
16
Chương 3
PHƯƠNG PHÁP SO SÁNH CÁC MẪU QUAN SÁT
VÀ THÍ NGHIỆM TRONG LÂM NGHIỆP

Số tiết: 10 tiết (Lý thuyết: 6 tiết; bài tập, thảo luận: 1 tiết; thực hành 3 tiết)
*) Mục tiêu
- Kiến thức: Sinh viên hiểu được kiến thức về:
+ So sánh các mẫu trong trường hợp: 2 mẫu độc lập, k mẫu độc lập
+ So sánh các mẫu trong trường hợp mẫu liên hệ
+ Kiểm tra thuần nhất các mẫu về chất
- Kỹ năng: Vận dụng được để tính toán, đưa ra kết luận cho các mẫu trong trường hợp
độc lập và liên hệ
- Thái độ: Chủ động, tích cực trong quá trình tính toán và đưa ra nhận xét
3.1. Các bước cơ bản khi giải bài toán so sánh
- Bước 1: Đặt giả thuyết:
- Bước 2: Tính toán các tiêu chuẩn thống kê phù hợp.
- Bước 3: So sánh giá trị tính toán với giá trị tra bảng có 2 khả năng xảy ra:
+ Nếu giá trị tính toán ≤ giá trị tra bảng thì H
0
+
(chấp nhận giả thuyết H
0
).
+ Nếu giá trị tính toán > giá trị tra bảng thì H
0
-
(bác bỏ giả thuyết H
0
).
3.2. Trường hợp hai mẫu độc lập
Mẫu độc lập hay thí nghiệm độc lập là những thí nghiệm được bố trí xa nhau, để có thể
loại bỏ những tác động tác động giống nhau về hoàn cảnh (đất đai, khí hậu…)
3.2.1. Tiêu chuẩn t của Student
- Điều kiện áp dụng: Tiêu chuẩn t của Student được dùng trong trường hợp:

+ So sánh 2 mẫu về lượng độc lập.
+ Hai tổng thể phải có phân bố chuẩn, phương sai của hai tổng thể bằng nhau (σ
1
2

2
2
).
+ Dung lượng mẫu: n
1
, n
2
< 30
- Các bước tiến hành:
+ Đặt giả thuyết: H
0
: µ
1

2

H
1
: µ
1
≠µ
2

+ Kiểm tra giả thuyết H
0

bằng tiêu chuẩn t:
( )
1.3
11
.
2
)1()1(
2121
2
22
2
11
21








+
−+
−+−

=
nnnn
SnSn
xx
t

+ Kết luận: So sánh /t/ với t
05 (k)
tra bảng với bậc tự do k=n
1
+n
2
-2
- Ví dụ 3.1: Hãy so sánh sinh trưởng đường kính ngang ngực (D
1.3
) của hai lô rừng thông
trồng thuần loài đều tuổi dưới hai công thức mật độ trồng rừng khác nhau (1500 cây/ha và 2000
cây/ha)
Trường hợp: Nếu bài toán chưa cho trước về sự bằng nhau của 2 phương sai tổng thể thì
trước khi so sánh bằng tiêu chuẩn t phải kiểm tra sự bằng nhau của 2 phương sai (kiểm tra điều
kiện), bằng tiêu chuẩn F (Fisher).
- Đặt giả thuyết: H
0
: σ
1
2

2
2
17
H
1
: σ
1
2


2
2
(nếu S
1
2
> S
2
2
)
- Giả thuyết được kiểm tra bằng công thức:
2
2
2
1
S
S
F =
(nếu S
1
2
> S
2
2
) (3.2)
Trong đó: S
1
, S
2
là sai tiêu chuẩn của mẫu 1 và mẫu 2.
- So sánh F với F

05 (k1,k2)
với bậc tự do k
1
=n
1
-1, k
2
=n
2
-1
- Ví dụ 3.2: So sánh khối lượng thể tích của ván dăm (g/cm
3
) được sản xuất ra từ hai nhà
máy chế biến gỗ. Biết rằng khối lượng thể tích của ván dăm là tuân theo luật chuẩn, cho trước
α=0.05
3.2.2. Tiêu chuẩn U của phân bố chuẩn tiêu chuẩn
Điều kiện áp dụng: n
1
,n
2
≥30, hai mẫu độc lập về lượng, không cần biết trước về luật phân
bố của hai tổng thể thì ta sử dụng tiêu chuẩn U của phân bố chuẩn tiêu chuẩn.
- Đặt giả thuyết: H
0
: µ
1

2
H
1

: µ
1
≠µ
2

- Kiểm tra giả thuyết H
0
bằng công tiêu chuẩn U của phân bố chuẩn tiêu chuẩn được viết
như sau:
( )
4.3
2
2
2
1
2
1
21
n
S
n
S
xx
U
+

=
- So sánh /U/ với 1.96
- Ví dụ 3.3: Hãy so sánh sinh trưởng đường kính của cây trồng trên hai vị trí địa hình với
α=0.05.

3.2.3. Các tiêu chuẩn phi tham số
Cách xếp hạng các trị số quan sát:
- Sắp xếp các trị số quan sát của từng mẫu theo thứ tự từ bé đến lớn.
- Xếp hạng các trị số quan sát chung cho cả hai mẫu.
* Tiêu chuẩn U của Mann và Whiney
- Điều kiện áp dụng:
+ Không biết trước luật phân bố của đại lượng quan sát.
+ n
1
, n
2
≥4 và n
1
+n
2
≥20 (hoặc n
1
,n
2
≥10).
+ F(X) và F(Y) liên tục, hay X, Y liên tục. Trong đó F(X) và F(Y) là hàm phân bố của
đại lượng quan sát thuộc mẫu 1 và mẫu 2.
- Bước 1: Đặt giả thuyết: H
0
: F(X)=F(Y)
H
1
: F(X)≠F(Y)
- Bước 2: Sắp xếp các trị số quan sát theo thứ tự từ bé đến lớn chung cho cả hai mẫu.
- Bước 3: Xếp hạng các trị số quan sát.

- Bước 4: Tính tổng hạng cho mỗi mẫu và kiểm tra việc xếp hạng. Nếu R
x
, R
y
là tổng
hạng của hãi mẫu thì công thức kiểm tra là:
2
)1( +
=+
nn
RR
yx
với n=n
1
+n
2
.
- Bước 5: Tính U
x
và U
y
theo công thức:
18
y
yy
yxy
x
xx
yxx
R

nn
nnU
R
nn
nnU

+
+=

+
+=
2
)1(
.
2
)1(
.
Với:
xyxy
UnnU −=
- Bước 6: Dùng U
x
và U
y
để kiểm tra giả thuyết H
0
theo tiêu chuẩn U của Mann và
Whiney sau:
)1(
12

2
++

=
yx
yx
yx
x
nn
nn
nn
U
U
- So sánh /U/ với 1.96
Chú ý:
+ Nếu đã tính U
x
theo (3.6) thì U
y
có thể tính theo công thức thứ 2 sau:
( )
10.3
xyxy
UnnU −=
+ Nếu ở 2 mẫu có nhiều trị số qua sát lặp lại, thì hạng của chúng sẽ là hạng trung bình
của những trị số đó, và công thức tính U sẽ là:
σ
2
yx
x

nn
U
U

=
hoặc
( )
11.3
2
σ
yx
y
nn
U
U

=
Trong đó:
( )
( )
12.3
121
3












=

T
nn
nn
nn
yx
σ
Với:
∑∑

=
12
3
tt
T
trong đó t là số lần lặp lại 1 trị số quan sát nào đó.
+ Khi dùng tiêu chuẩn U của Mann và Whiney để so sánh 2 mẫu độc lập, dung lượng
quan sát của 2 mẫu không cần đủ lớn, song theo Wander Walden thì n
x
≥4, n
y
≥4 và n
x
+ n
y

>20.
- Ví dụ 3.4: Hãy so sánh sinh trưởng chiều cao cây rừng trồng thuần loài đề tuổi dưới 2
công thức mật độ trồng rừng khác nhau (1500c/ha và 2000c/ha).
3.2.4. Tiêu chuẩn Kruskal and Wallis
Tiêu chuẩn dùng so sánh k (nhiều) mẫu độc lập.
- Điều kiện áp dụng là:
+ Phân bố đại lượng quan sát phải liên tục.
+ Phải có từ 3 mẫu trở lên.
- Bước 1: Đặt giả thuyết: H
0
: F(X
1
)= F(X
2
)= = F(X
k
)
H
1
: F(X
1
)≠ F(X
2
)= = F(X
k
) (Chỉ cần có một sự sai khác.)
- Bước 2: Sắp xếp các trị số quan sát chung của các mẫu (k mẫu) theo thứ tự từ bé đến lớn.
- Bước 3: Xếp hạng các trị số quan sát chung cho K mẫu.
- Bước 4: Tính tổng hạng cho mỗi mẫu và kiểm tra việc xếp hạng
( )

( )
13.3
2
1
1
+
=

=
nn
iR
K
i
Trong đó:
19
R
i
là tổng hạng của mẫu thứ i.
n là tổng dung lượng quan sát của toàn thí nghiệm:
k
nnnn +++=
21
- Bước 5: Kiểm tra giả thuyết H
0
về sự thuần nhất của các mẫu bằng tiêu chuẩn χ
2
sau đây:
( )
( ) ( )
14.313

1
12
1
2
+−
+
=

=
n
n
R
nn
H
K
i
i
i
- So sánh χ
2
với χ
05
2
tra bảng với k=n-1 bậc tự do
3.3 Trường hợp các mẫu liên hệ
Là các mẫu quan sát không độc lập với nhau mà có liên hệ với nhau ở một mức độ nào
đó, các mẫu như thế gọi là mẫu liên hệ. Các mẫu liên hệ luôn đi theo từng cặp.
Ví dụ: Trong đo cao cây rừng, người ta có thể dùng một trong hai loại thước đo cao:
Thước kẹp sào và thước Blumeleise.
3.3.1. Tiêu chuẩn t của Student để so sánh hai mẫu liên hệ

Điều kiện áp dụng: n
1
, n
2
phải được rút ra từ tổng thể có phân bố chuẩn
+ Đặt giả thuyết: H
0
: µ
x

y
H
1
: µ
x
≠µ
y
+ Kiểm tra giả thuyết H
0
bằng công thức sau:
( )
21.3n
S
d
t
d
=
Trong đó: d
i
là hiệu sai (d

i
=x
i
-y
i
).
d là trung bình của hiệu sai d
i
.
( )


−=

=
n
d
dQ
n
Q
S
i
id
d
d
2
2
1
(n là số cặp mẫu liên hệ)
+ So sánh /t/ với t

05
(k=n-1)
- Ví dụ 3.8: Người ta đo đường kính ngang ngực cây rừng (D
1.3
) bằng hai loại thước:
Thước kẹp kính và thước đo vanh. Kết quả đo đường kính được cho ở bảng 3.9. Hỏi hai kết quả
đo đường kính bằng hai loại thước khác nhau có sai khác nhau rõ rệt không?
3.3.2. Tiêu chuẩn tổng hạng theo dấu của Wilcoxon
Đây là tiêu chuẩn phi tham số dùng để kiểm tra sai dị giữa hai mẫu liên hệ.
Điều kiện áp dụng là: + F(X), F(Y) phải liên tục.
+ r≥25 (r là số cặp hiệu sai d
i
≠0).
- Bước 1: Đặt giả thuyết: H
0
: F(X)=F(Y)
H
1
: F(X)≠F(Y).
- Bước 2: Tính các hiệu sai (hay sai dị) d
i
=x
i
-y
i
, trong đó x
i
và y
i
là các giá trị thực nghiệm

tương ứng của đại lượng X và Y của hai mẫu.
- Bước 3: Xếp hạng các hiệu sai theo thứ tự từ bé đến lớn, khi xếp hạng bỏ qua những sai
dị bằng 0 (d
i
= x
i
-y
i
=0) và không để ý đến dấu của các sai dị là âm hay dương.
- Bước 4: Tính tổng hạng theo dấu âm (R
-
) và tổng hạng theo dấu dương (R
+
), kiểm tra
việc xếp hạng và tính tổng hạng theo công thức sau:
( )
( )
19.3
2
1
+
=+
−+
rr
RR
Trong đó r là số cặp có sai dị khác 0.
- Bước 5: Kiểm tra giả thuyết H
0
theo tiêu chuẩn U của Wilcoxon:
20

( )
( )( )
24
121
4
1
++
+

=
+
rrr
rr
R
U
hay
( )
( )( )
( )
20.3
24
121
4
1
++
+

=

rrr

rr
R
U
- Bước 6: So sánh /U/ với 1.96
- Ví dụ 3.7: Người ta đo chiều cao của 26 cây trồng thuần loài đề tuổi được kết quả ở
bảng 3.8 bằng hai loại thước đo cao là thước Blumeleise và thước kẹp sào. Hỏi kết quả đo chiều
cao cây bằng hai loại thước khác nhau có thuần nhất với nhau không?
3.4. Kiểm tra thuần nhất các mẫu về chất
3.4.1. So sánh hai mẫu về chất bằng tiêu chuẩn U
- Đặt giả thuyết: H
0
: P
t1
=P
t2


H
1
: P
t1
≠P
t2
Trong đó: H
1
: P
t1
, P
t2
là thành số mẫu 1 và thành số mẫu 2.

- Để kiểm tra giả thuyết H
0
ta dùng công thức sau:
( )
22.3
21
m
p
mm
pp
U
σ

=
Trong đó σ
Pm
là sai số của thành số mẫu, được tính theo công thức sau:
( )
23.3
11
.
21









+=
nn
qp
m
P
σ
Với
21
21
21

nn
PnPn
p
mm
+
+
=

( )
24.31 pq −=
Hoặc ta có thể sử dụng công thức sau để kiểm tra giả thuyết H
0
:
m
p
mm
pp
U
σ

21

=
Với:
( ) ( )
( )
25.3
11
21
2211
n
pp
n
pp
mmmm
p
m

+

=
σ
- Kết luận: So sánh /U/ với 1.96
- Ví dụ 3.9: So sánh tỷ lệ cây bị bệnh ở hai khu rừng thông trồng thuần loài đều tuổi
- Ví dụ 3.10: So sánh tỷ lệ sản phẩn được sản xuất ra từ 2 cỗ máy chế biến của 1 xí
nghiệp chế biến lâm sản
3.4.2. Kiểm tra thuần nhất các mẫu về chất (kiểm tra tính độc lập)
- Giả sử cần so sánh a mẫu về chất, mỗi mẫu về chất chia ra b cấp chất lượng, đặt giả
thuyết H
0

: Các mẫu về chất là thuần nhất.
H
1
: Các mẫu về chất là không thuần nhất.
Kết quả được sắp xếp vào bảng gồm các hàng và cột như sau:
Bảng 3.10: Sắp xếp kết quả nghiên cứu
21
B
A
1 2 j b

1
2

i

a
f
11
f
21

f
i1

f
a1
f
12
f

22

f
i2

f
a2






f
1j
f
2j

f
ij

f
aj






f

1b
f
2b

f
ib

f
ab
Ta
1
Ta
2

Ta
i

Ta
a

Tb
1
Tb
2
Tb
j
Tb
b
TS
f

ij
là tần số quan sát của mẫu i cấp chất lượng j.
Ta
i
là tổng tần số quan sát của mẫu thứ i.
Tb
j
là tổng tần số quan sát của cấp chất lượng j.
TS là tổng tần số quan sát của toàn thí nghiệm.
∑∑∑∑
= ===
===
a
i
b
j
ij
b
j
j
a
i
i
fTbTaTS
1 111
- Giả thuyết H
0
được kiểm tra bằng tiêu chuẩn phù hợp χ
n
2

sau đây:
( )
26.31
2
2









×
=

ji
ij
n
TbTa
f
TS
χ
- Kết luận: So sánh χ
n
2
với χ
05
2

tra bảng, k=(a-1)(b-1) bậc tự do
- Ví dụ 3.11: So sánh chất lượng rừng trồng trên 3 khu vực trồng rừng khác nhau
*) Bài tập
1. Hãy so sánh sinh trưởng đường kính ngang ngực (D
1.3
) của hai lô rừng thông trồng thuần loài
đều tuổi dưới hai công thức mật độ trồng rừng khác nhau (1500 cây/ha và 2000 cây/ha) theo tài
liệu sau: + Công thức mật độ 1500 cây/ha: x
1
=10.5 cm, S
1
2
=1.2 cm
2
, n
1
=16 cây.
+ Công thức mật độ 2000 cây/ha: x
2
=8.6 cm, S
2
2
=1.1 cm
2
, n
2
=19 cây.
Biết rằng phân bố số cây theo đường kính của hai lâm phần tuân theo luật chuẩn và
phương sai của hai tổng thể bằng nhau.
2. Người ta đo khối lượng thể tích của ván dăm (g/cm

3
) được sản xuất ra từ hai nhà máy chế biến
gỗ, kết quả được cho ở bảng sau:
Stt 1 2 3 4 5 6 7 8 9
X
i1
0.4 0.43 0.51 0.48 0.64 0.72 0.58 0.60 0.71
X
i2
0.43 0.44 0.50 0.46 0.70 0.58 0.71 0.67 0.69
Hỏi khối lượng thể tích của ván dăm được sản xuất ra từ hai nhà máy chế biến gỗ có như
nhau hay không? Biết rằng khối lượng thể tích của ván dăm là tuân theo luật chuẩn, cho trước
α=0.05.
3. Kết qủa đo đường kính ngang ngực cây rừng (D
1.3
) trồng thuần loài đều tuổi trên hai vị trí địa
hình (chân đồi và đỉnh đồi) và chỉnh lý tài liệu quan sát được kết quả như sau:
x
i
7 9 11 13 15 17 19

f
t
(1) 2 5 9 14 7 4 1 42
f
t
(2) 3 8 12 10 6 3 1 43
22
Hãy so sánh sinh trưởng đường kính của cây trồng trên hai vị trí địa hình với α=0.05.
Trong đó f

t
(1) là tần số quan sát ứng với vị trí trồng rừng chân đồi, f
t
(2) là tần số quan sát ứng
với vị trí trồng rừng đỉnh đồi.
4. Hãy so sánh sinh trưởng chiều cao cây rừng trồng thuần loài đề tuổi dưới 2 công thức mật độ
trồng rừng khác nhau (1500c/ha và 2000c/ha) theo tài liệu điều tra sau:
X 2.7 2.9 3.0 3.3 3.6 3.7 4.0 4.1 4.2 4.5 4.7 5.0
Y 2.8 3.2 3.5 3.9 4.2 4.3 4.9 5.0 5.1 5.4 5.5
5. Người ta đo chiều cao của 26 cây trồng thuần loài đề tuổi được kết quả ở bảng sau, bằng hai
loại thước đo cao là thước Blumeleise và thước kẹp sào. Hỏi kết quả đo chiều cao cây bằng hai
loại thước khác nhau có thuần nhất với nhau không?
Số TT x
i
(m) y
i
(m)
1
2
3
4
5
6
7
8
9
10
11
12
13

14
15
16
17
18
19
20
21
22
23
24
25
26
2.4
3.1
2.8
2.5
3.3
3.5
3.6
4.1
3.4
2.6
2.0
2.5
2.9
3.7
4.1
3.8
2.5

3.4
3.2
3.7
3.0
2.9
2.2
2.7
3.0
3.2
2.6
3.0
2.5
2.7
2.8
3.4
3.6
4.5
3.7
2.3
2.4
2.3
2.6
3.8
4.0
3.3
2.8
3.0
3.1
3.2
3.1

2.4
2.2
2.5
3.3
2.8
6. Hai khu rừng thông trồng thuần loài đều tuổi có diện tích rất lớn bị nhiễm bệnh rơm lá trông.
Từ mỗi khu rừng lập 1 ô tiêu chuẩn điển hình 2000 m
2
và thống kê số cây bị nhiễm bệnh. Kết
quả điều tra như sau:
- Khu rừng I: n
1
=70 cây, m
1
=24 cây bị bệnh
- Khu rừng II: n
2
=75 cây, m
2
=36 cây bị bệnh
23
Hỏi tỷ lệ cây bị bệnh của hai khu rừng có thuần nhất với nhau không?
7. Kết quả kiểm kê rừng trồng trên 3 khu vực trồng rừng khác nhau (I, II và III) được cho ở bảng
B
A
Tốt
Trung
bình
Xấu


I
II
III
100
80
120
120
130
100
40
50
70
260
260
290

300 350 160 810
Hỏi chất lượng rừng trồng trên 3 khu vực trồng rừng khác nhau có thuần nhất không?
*) Thực hành
1. So sánh hai mẫu độc lập theo tiêu chuẩn t
Quy trình
1. Tools\ Data Analysis\ T- Test two sample assuming equal (ho uniqual) Variances
2. Input range: Variable 1 range: khai báo biến thứ nhất. Variable 2 range: khai báo
biến thứ 2
3. Hypothesied Mean Diffrence: ghi 0, Alfa =0.05.
4. Output range: Chọn một cell bất kỳ và Ok
2. So sánh hai mẫu độc lập theo tiêu chuẩn U
Quy trình
1. Analyze\ Nonparametric tests\ 2 Independent samples
2. Trong hộp thoại: 2 Independent samples đưa H

vn
vào Test variable và Dhinh vào
Grouping variable
3. Nháy chuột trái vào Define groups và ghi: Group 1: 3 (địa hình 3), Group 2: 4 (địa hình 4)
4. Chọn Mann -Whitney
5. OK
3. So sánh nhiều mẫu độc lập bằng tiêu chuẩn Kruskal – Wallis
Quy trình
1. Analyze\ Nonparametric Tests\ K - Independent samples
2. Trong hộp thoại Tests for several Independent samples Test đưa H
vn
vào variable List
và Dhinh vào Grouping variable
3. Nháy chuột trái vào Define Range và ghi: minimum = 2, maximum = 4
4. Chọn Kruskal - Wallis - H
5. OK
4. So sánh 2 mẫu liên hệ bằng tiêu chuẩn t
Quy trình
1. Tools\ Data analysis\ T- Test Paired two sample for Mean
2. Input range:Variable 1 range: khai báo biến thứ nhất. Variable 2 range: khai báo biến 2
3. Hypothesied Mean Diffrence: ghi 0, Alfa =0.05.
4. Output range: Chọn một cell bất kỳ và Ok
5. So sánh 2 mẫu liên hệ bằng tiêu chuẩn Wilcoxon
Quy trình
1. Analyze\ Nonparametric Tests\ 2 Related samples
2. Trong hộp thoại Two Related samples chuyển cả 2 biến X và Y vào khung Test pair(s)
24
list
3. Chọn Wilcoxon
4. OK

6. So sánh nhiều mẫu liên hệ - tiêu chuẩn Friedman
Quy trình
1. Analyze\ Nonparametric Tests\ K related samples
2. Chọn cả k biến (chú ý sau khi đã xếp hạng) và nhấp mũi tên bên cạnh để chuyển vào
Test Varieables
3. Chọn Friedman trong Test type
4. OK
7. Kiểm định tính độc lập theo tiêu chuẩn χ
2
Quy trình
1. Data\ Weight cases\ Weight cases by và đưa biến Fi vào (trong trường hợp không có
bảng tần số thì không cần bước này)
2. Analyze\ Descriptive Statistics\ Crosstabs
3. Trong hộp thoại Crosstabs: Rows ghi Ô tiêu chuẩn,
4. Columns ghi loài cây
5. Nháy chuột trái vào Statistics và chọn Chi square. Nếu muốn có tần số quan sát thực tế
và lý luận thì nháy vào Cells và chọn Observed, Expected.
6. OK
8. Trường hợp so sánh mẫu liên hệ về chất - Tiêu chuẩn Q của Cochran
Quy trình
1. Analyze\ Nonparametric Tests\ K related samples
2. Chọn cả k biến vỡ nhấp mũi tên bên cạnh để chuyển vỡo ô Test Varieables
3. Chọn Cochran
,
Q trong Test type, nếu muốn biết các đặc trưng mẫu thi chọn Descriptive
trong Statistics
4. OK
*) Tài liệu học tập
1. Ngô Kim Khôi (1998), Thống kê toán học trong lâm nghiệp, Nxb Nông nghiệp Hà Nội
2. Nguyễn Hải Tuất (2006), Xử lý thống kê trong lâm nghiệp, Nxb Nông nghiệp Hà Nội

*) Câu hỏi ôn tập
1. Khi so sánh 2 mẫu độc lập, chúng ta thường sử dụng tiêu chuẩn nào? Cho biết sự khác nhau
giữa các tiêu chuẩn đó?
2. Cho biết trình tự thực hiện so sánh 2 mẫu độc lập bằng tiêu chuẩn U của Mann Whitney và
mẫu liên hệ theo tiêu chuẩn tổng hạng theo dấu của Wincoxon?
3. Khi so sánh 2 mẫu độc lập về chất, chúng ta dùng tiêu chuẩn nào?
25

×