Bài giảng chương 5
Chương 5
Phân tích mối quan hệ giữa các đại lượng
trong lâm nghiệp
5.1. ý nghĩa và một số khái niệm
5.1.1. Một số khái niệm
Trong tự nhiên và xà hội nói chung, trong lâm nghiệp nói riêng các đại
lượng thêng cã mèi quan hƯ víi nhau, c¸c mèi quan hệ này có thể phân ra 2
dạng:
Quan hệ hàm số (sự phụ thuộc hàm):
- Giả sử có hai đại lượng X và Y, nếu ứng với mỗi giá trị của X, hoàn toàn
xác định được giá trị của đại lượng Y thì ta nói rằng Y là hàm số của X.
- Ví dụ: Diện tích hình tròn S là hàm số của bán kính R. Hàm số đó được
biểu diƠn b»ng c«ng thøc: S=.R2.
- VÝ dơ: Trong vËt lý dao động cơ điều hoà sơ cấp, tại cùng một vị trí thì
tần số góc (W) là hàm số của chiều dài sợi dây (l). Hàm số được biểu diễn bằng
công thức: W
g
l
Quan hệ tương quan (sự phụ thuộc tương quan):
- Giả sử có hai đại lượng X, Y có phụ thuộc vào nhau nhưng ứng với mỗi
giá trị của đại lượng X, không hoàn toàn xác định được giá trị của đại lượng Y,
quan hệ như vậy người ta gọi là quan hệ tương quan.
- Ví dụ: Quan hệ giữa năng suất cây trồng và lượng phân bón.
Một điều chắc chắn là, phân bón có ảnh hưởng đến năng suất cây trồng
(có thể là tích cực, cũng có thể là tiêu cực nếu bón quá liều lượng cần thiết),
nhưng không thể khẳng định được rằng, khi bón một lượng phân X xác định nào
đó thì năng suất cây trồng Y sẽ đạt một số xác định là bao nhiêu, mà thường dao
động trong một khoảng xác định nào đó. Vì vậy, X là một đại lượng không ngẫu
nhiên còn Y là một đại lượng ngẫu nhiên. Y lµ hµm sè cđa X. Sù phơ thc nµy
cã thĨ biĨu diƠn b»ng biĨu thøc: Y=f(X)
Víi Y lµ biÕn phơ thuộc, còn X là biến độc lập.
- Một trong những nhiệm vụ trọng tâm của người làm công tác thống kê
khi phân tích mối liên hệ giữa các đại lượng là xác định mức độ liên hệ giữa
chúng và lập phương trình hồi quy biểu thị cho mối quan hệ ®ã.
5.1.2. ý nghÜa
Bùi Mạnh Hưng
Bài giảng chương 5
- Việc nghiên cứu mối liên hệ giữa các đại lượng còn có ý nghĩa rất lớn
trong khí tượng thuỷ văn, trong y học, trong quản lý bảo vệ rừng... bởi lẽ chúng
ta có thể dựa vào những đại lượng dễ đo đếm, trực quan để có thể dự báo cho các
đại lượng trong tương lai, cho các đại lượng khó đo đếm.
-Ví dụ: Trong quản lý bảo vệ tài nguyên rừng để dự tính dự báo sâu hại,
dịch bệnh, trong điều tra rừng bằng ảnh máy bay để xác định trữ lượng lâm phần,
trong chế biến lâm sản để xác định đồ bền uốn tĩnh của ván ghép thanh trong
mối quan hệ giữa nó với kích thước của thanh ghép thành phần...
5.2. Xác định mức độ liên hệ giữa các đại lượng
5.2.1. Tỷ tương quan
- Khái niệm: Tỷ tương quan là chỉ tiêu thuyết minh mức độ liên hệ giữa
các đại lượng trong trường hợp chung nhất mà không cần biết trước dạng liên hệ.
- Tỷ tương quan chỉ thuyết minh cường độ của sự liên hệ mà không nói lên
chiều hướng của sự liên hệ đó là nghịch biến hay đồng biến.
- Ký hiệu và công thức lý thuyết:
Tỷ tương quan ký hiệu là: .
Công thức định nghĩa tỷ tương quan được viết như sau:
Qy Qy / x
fi
m
Q y y ij y
Víi:
(5.4)
Qy
2
(5.5)
i 1 j 1
m
fi
Q y / x yij y / xi
2
(5.6)
i 1 j 1
Trong đó:
yij là các trị số quan sát của biến phụ thuộc Y.
y là trị số trung bình của n trị số quan sát của biến phụ thuộc Y.
y / xi
là số trung bình cã ®iỊu kiƯn cđa biÕn phơ thc Y øng víi 1
trị số xác định của biến độc lập X.
Tỷ tương quan là 1 số, nhận các giá trị từ 0 đến 1, 01.
Nếu =0 thì 2 đại lượng độc lập tuyến tính.
Nếu =1 thì 2 đại lượng có quan hệ hàm số.
Nếu 00.3 thì 2 đại lượng có tương quan yếu.
Nếu 0.30.5 thì 2 đại lượng có tương quan vừa.
Nếu 0.50.7 thì 2 đại lượng có tương quan tương đối chặt.
Nếu 0.70.9 thì 2 đại lượng có tương quan chặt.
Nếu 0.9<1 thì 2 đại lượng có tương quan rất chỈt.
Bùi Mạnh Hưng
Bài giảng chương 5
5.2.2. Hệ số tương quan
- Khái niệm: Hệ số tương quan là chỉ tiêu thuyết minh mức độ liên hệ
giữa hai đại lượng X và Y trong liên hệ đường thẳng (tuyến tính 1 lớp)
(Y=A+B.X).
- Ký hiệu và công thức lý thuyết:
Công thức định nghĩa hệ số t¬ng quan nh sau:
r
Q y Qy
ˆ
5.9
Qy
n
Qy yi y
2
i 1
Víi:
n
2
ˆ
Qy yi y
ˆ
i 1
Trong đó:
y là trị số trung bình của n trị số quan sát của biến phụ thuộc Y.
y là trị số lý luận của phương trình hồi quy tuyến tính 1 líp.
ˆ
y a bx
- r tÝnh theo (5.9) gọi là hệ số tương quan của Y theo X. r nhận các giá trị
từ 0 đến 1 (0/r/1).
Nếu:
r=0 thì 2 đại lượng X và Y độc lập tuyến tính.
r=1 thì 2 đại lượng X và Y có quan hệ hàm số.
00.30.50.70.9- r ngoài cho biết sự liên hệ, cường độ liên hệ còn cho biết chiều hướng
của liên hệ. Vì hệ số tương quan r có thể âm hoặc dương:
- Nếu r > 0 thì quan hệ giữa X và Y là đồng biến.
- Nếu r < 0 thì quan hệ giữa X và Y là nghịch biến.
Y
Y
y a bx
ˆ
y a bx
Bùi Mạnh Hưng
X
X
Bài giảng chương 5
Hình 5.1. Quan hệ giữa X và Y dạng tuyến tính đồng biến và nghịch biến.
5.2.3. Chỉ số tương quan
- Khái niệm: Chỉ số tương quan (i) là chỉ tiêu đánh giá mức độ liên hệ
giữa hai biến X và Y trong liên hệ phi tuyến tính, thực chất là thuyết minh mức
độ biến động giữa các trị số quna sát của biến Y với trị số lý luận của phương
trình phi tuyến.
- Ký hiệu và công thøc lý thuyÕt:
i
Qy Q y
ˆ
5.18
Qy
2
ˆ
ˆ
Víi Qy yi y trong đó y là trị số lý ln cđa hµm håi quy phi tun.
ˆ
5.2.4. HƯ sè t¬ng quan kÐp (HƯ sè t¬ng quan tun tÝnh hai lớp)
- Khái niệm: Là chỉ tiêu thuyết minh mức độ liên hệ giữa Y với X1 và X2
trong liên hệ tuyến tính hai lớp.
- Ký hiệu và công thức lý thuyÕt:
R
Q y Qy
ˆ
Qy
5.19
ˆ
Víi Qyˆ yi y 2
Trong đó y là trị số lý luận của hµm håi quy tun tÝnh 2 líp:
ˆ
y a0 a1x1 a2 x2 .
5.3. Chọn giả thuyết về dạng liên hệ (dạng hồi quy)
Sau khi xác định mức độ liên hệ giữa các đại lượng, nếu hai đại lượng X
và Y thực sự tồn tại mối liên hệ ở mức độ nào đó thì bước tiếp theo là chọn giả
thuyết về dạng liên hệ (dạng hàm hồi quy), nghĩa là mô phỏng dạng liên hệ bằng
một biểu thức toán học (phương trình hồi quy) với một số hữu hạn các tham số,
sao cho thoả mÃn 3 điều kiện cơ bản sau:
1. Phản ánh đúng bản chất của các quy luật sinh học, các quy luật của tự
nhiên và xà hội.
2. Có mức độ liên hệ giữa các đại lượng cao, sai số của phương trình nhỏ.
3. Dễ thực hiện, tính toán.
Để dễ dạng cho việc chọn giả thuyết về dạng liên hệ giữa 2 đại lượng trên
cơ sở đà khẳng định sự tồn tại của tỷ tương quan, bước tiếp theo là chấm các cặp
giá trị của 2 đại lượng X và Y lên biểu đồ, căn cứ vào chiều hướng của đám mấy
Bựi Mnh Hng
Bài giảng chương 5
điểm thực nghiệm mà đặt giả thuyết về dạng hàm hồi quy. Sau đây là 1 số dạng
cơ bản:
y a bx cx 2
y a bx cx2 dx3
b
ˆ
y a
x
b c
ˆ
y a 2
x x
ˆ
y
x2
a bx cx 2
ˆ
y
ˆ
y a
b
x
ˆ
y a
b c
x x2
x2
a bx 2
ˆ
y a b log( x)
ˆ
y
x
a bx
ˆ
y a bx c log( x )
ˆ
y
x
a bx cx 2
ˆ
y aekx
y ax k
k>1
k<1
a
k<0
k>0
a
Hình 5.2. Các dạng liên hệ phi tuyến cơ bản giữa X và Y
5.4. Kiểm tra giả thuyết về dạng liên hệ
Trong nhiều trường hợp, khi phân tích mối liên hệ giữa các đại lượng,
nhiều khi không biết trước dạng liên hệ giữa chúng, mà phải dựa vào biểu đồ
thực nghiệm để chọn giả thuyết về dạng liên hệ. Vì vậy sau khi đà xác định được
tỷ tương quan (), hệ số tương quan (r),... cần căn cứ vào trị số tuyệt đối của
Bựi Mnh Hng
Bài giảng chương 5
,r... thông qua các tiêu chuẩn thống kê để kiểm tra sự tồn tại của các dạng liên
hệ.
5.5. Liên hệ tuyến tính một lớp.
Phương trình hồi quy tun tÝnh 1 líp trong tỉng thĨ cã d¹ng:
Y = A + BX
( 5.32)
Và ở mẫu có dạng:
y = a + bx
(5.33)
Trong đó: a được gọi là hệ số tự do.
b được gọi là hệ số hồi quy (hệ số góc).
5.5.1. Xác định các tham số của liên hệ tuyến tÝnh 1 líp trêng hỵp mÉu nhá.
- Bíc 1: LËp bảng tính, tính các biến động.
Bảng 5.1: Bảng tính hệ số tương quan (r)
và các tham số của phương trình hồi quy a và b
x
y
x2
y2
xy
(1)
(2)
(3)
(4)
(5)
...
...
...
...
...
x
y
x2
y2
xy
Trong bảng 5.1:
Cột (1) và (2) là các cặp giá trị của 2 đại lượng X vµ Y, tỉng cét (10 vµ (2)
lµ x vµ y dùng để tính x và y theo (5.38)
Cột (3) và (4) là bình phương các trị số quan sát của hai đại lượng X và Y,
tổng cộng (3) và (4) là x2 và y2 để tính Qx và Qy theo (5.37) và (5.13)
Cith (5) là tính các trị số quan sát của X và Y, tổng cộng (5) là x.y dïng
®Ĩ tÝnh Qxy theo (5.36).
Tõ Qx, Qy, Qxy, x y sẽ xác định được hệ số tương quan (r) theo (5.10) các
tham số a theo (5.35) và b theo (5.34).
Tính các biến động:
Qx x 2
2
( x ) 2
Qy y
n
( y ) 2
Qxy x. y
n
x. y
n
Trong đó: n là số cặp x, y.
Bùi Mạnh Hưng
Bài giảng chương 5
- Bước 2: Xác định mức độ liên hệ.
r
Qxy
Qx .Qy
- Bước 3: Kiểm tra sự tồn tại cđa hƯ sè t¬ng quan.
Trong thùc tiƠn, ngêi ta chØ tiến hành kiểm tra sự tồn tại của hệ số tương
quan, nếu trị số tuyệt đối của nó nhỏ thua 0.3 và mẫu nhỏ.
- Đặt giả thuyết: H0: =0
H1: 0
- Người ta chứng minh được rằng, nếu biến ngẫu nhiên (X,Y) có phân bố
chuẩn 2 chiều và độc lập thì biến ngẫu nhiên:
t
r
1 r2
n2
- Nếu /t/ tính theo công thức trên t05 tra bảng với K=n-2 bậc tự do thì
H0+, nghĩa là trong tổng thể thực sự tồn tại mối quan hệ đường thẳng giữa X và
Y.
Nếu /t/ tính theo công thức trên > t05 tra bảng với K=n-2 bậc tự do thì H0-,
nghĩa là trong tổng thể không tồn tại mối quan hệ đường thẳng giữa X và Y.
- Bước 4: Tính các tham số và kiểm tra sự tồng tại của các tham số trong tổng
thể.
b
Q xy
Qx
a y bx
Trong đó:
y
1
1
yi và x n xi
n
Kiểm tra sự tồn tại của các tham số:
Sau khi xác định được các tham số a và b của phương trình hồi quy tuyến
tính một lớp, cần phải tiến hành kiểm tra sự tồn tại của nó, cũng tức là kiểm tra
xem các tham số A và B trong tổng thể có thực sự khác không hay không. Có 2
trường hợp kiểm tra như sau:
- Kiểm tra giả thuyết:
H0: A = 0 và B = 0
H1: A 0 và B 0
- Giả thuyết H0 được kiểm tra theo tiêu chuẩn t của Student sau đây:
Với tham số a:
ta
a
Sa
Với tham số b:
tb
b
Sb
Trong đó:
Bựi Mnh Hng
Sa là sai tiªu chn cđa hƯ sè tù do a.
Bài giảng chương 5
Sa S
x
2
n.Qx
Sb là sai tiêu chuẩn của hệ số hồi quy b.
Slb S
S
1
Qx
là phương sai thõa hay ph¬ng sai håi quy
Qxy b 2 .Qx
ˆ
S2
n2
- Nếu /ta/ và /tb/ tính được < t05 tra b¶ng víi K = n - 2 bËc tù do thì giả
thuyết H0 +, nghĩa là 2 tham số A và B trong tổng số không tồn tại.
Nếu /ta/ và /tb/ tính được > t05 tra bảng với K = n - 2 bậc tự do thì giả
thuyết H0-, nghĩa lµ tham sè A vµ B trong tỉng thĨ thùc sự tồn tại ở mức =0,05.
- Bước 5: Ước lượng khoảng các tham số A và B trong tổng thể.
Nếu tham số a và b thực sự tồn tại qua việc kiểm tra ở trên, thì cần tiến
hành ước lượng các tham số A và B trong tổng thể.
* Với tham số A, công thức ước lượng khoảng như sau:
P a t a / 2( K ) .S a A a t / 2( K ) .S a 1
Hay:
ˆ
P a t / 2( K ) .S
x
2
n.Q x
ˆ
A a t / 2( K ) .S
1
n.Q x
x
2
* Víi tham số B công thức ước lượng khoảng như sau:
P (b - t/2(K).Sb < B < b + t/2(K).Sb) = 1 -
Hay:
ˆ 1 B bt
ˆ 1 1
P b t / 2( K ) .S
/ 2 ( K ) .S
Qx
Qx
VÝ dô 5.3. BiÕt rằng quan hệ giữa đường kính tán (Dt) và đường kính
ngang ngực (D1.3) cây rừng có dạng: Dt = a + b D1.3. HÃy xác định mức độ liên hệ
(r), các tham số của phương trình hồi quy (a, b) và vẽ biểu đồ tương quan theo tài
liệu điều tra sau:
Bảng 5.2. Bảng tính tương quan Dt/D1.3
D1.3(x)
Dt(y)
x2
y2
x.y
7.6
2.5
57.76
6.25
19.000
Bựi Mnh Hng
Bài giảng chương 5
8.8
2.8
77.44
7.84
24.64
8.9
3.0
79.21
9.00
26.70
9.3
3.4
86.49
11.56
31.62
9.7
3.7
94.09
13.69
35.89
10.6
4.0
112.36
16.00
42.40
11.0
4.5
121.0
20.25
49.50
11.8
4.9
139.24
24.01
57.82
11.9
5.2
141.61
27.04
61.88
12.3
5.7
151.29
32.49
70.11
101.9
39.7
1060.49
168.13
419.56
Tính các biến động:
Qxy x. y
x. y 419,56 101,9 x39,7
n
10
Qxy 15,017
x
2
2
Qxy x
1060,49
n
y
y
n
2
Qxy
2
168,13
(101,9) 2
22,129
10
(39,7 ) 2
10,521
10
* Xác định hệ số tương quan.
Hệ số tương quan được tính theo công thức:
r
Q xy
Q x .Q y
15,017
22,129 x10,521
0,98
Vì r = 0,98 nên quan hệ giữa Dt và D1.3 là rất chặt chẽ, hơn nữa vì hệ số
tương quan rất cao nên không cần phải kiểm tra sự tồn tại của nó.
* Xác định các tham số a và b của phương trình hồi quy.
áp dụng các công thức (5.34) và (5.35).
b
Q xy
Qx
15,017
0,6786
22,129
a y bx
Bùi Mạnh Hưng
y b x
n
n
Bài giảng chương 5
=
39,7 101,9
.0,6786 2,945
10
10
Phương trình hồi quy cã d¹ng:
Dt 2,945 0,6786.D1.3
* KiĨm tra sù tån tại của các tham số a và b:
Đặt giả thuyết:
H0: A = 0 vµ B = 0
H1: A 0 và B 0
Với tham số a:
ta
a
Sa
ta
a
S
S
Trong đó:
n.Q x
x2
ˆ
Sa = S .
ˆ
S.
x
2
nQ x
Q y b 2 Qx
n2
10,521 0,6786 2.22,129
0,2033
10 2
S a 0,2033
1060,49
0,4462
10 x22,129
VËy:
ta
a
2,945
6,6
Sa
0,4462
Víi tham sè b:
tb
b
Sb
S b 0,2033
Trong ®ã S b S
1
Qx
1
0,043
22,129
VËy:
tb
b
0,6786
15,781
S b 0,043
Vì /ta/ = 6,6 và /tb/ = 15,781 đều lớn hơn t05 tra bảng vớiK = n - 2 = 8 bậc
tự do bằng 2,31 nên giả thuyết H0 bị bác bỏ, nghĩa là các tham số A và B trong
tổng thể thực sự tồn tại.
* Ước lượng các tham sè A vµ B trong tỉng thĨ.
Víi tham sè A:
P a t / 2( K ) .S a a t / 2( K ) .S a 1
Bùi Mạnh Hưng
Bài giảng chương 5
Thay số:
P (-2,945 - 2,31 x 0,4462 < A < 2,945 + 2,31 x 0,4462) = 0,95
P (-3,9758 < A < -1,9142) = 0,95
Chóng ta tin tíi møc 95% r»ng tham sè A trong tỉng thĨ n»m trong
khoảng từ -3,9758 đến -1,9142.
Với tham số B: P (b - ta/2/(K).Sb < B < b + t/2(K).Sb) = 1 -
Thay sè:
P (0,6786 - 2,31 x 0,043 < B < 0,6786 + 2,31 x 0,043) = 0,95
P (0,5793 < B 0,7779) = 0,95
Chóng ta tin tíi møc 95% r»ng tham số B tổng thể nằm trong khoảng
0,5793 đến 0,7779.
* Tính trị số lý luận của phương trình và vẽ biểu đồ tương quan:
Từ phương trình hồi quy Dt = -2,945 + 0,6786 D1.3 đà thiết lập, thay các trị
D1.3 thực nghiệm vào phương trình sẽ nhận được các trị số Dt tương ứng, các trị
số này gọi là trị số lý luận.
Kết quả Dt lý luận được cho ở bảng 5.3.
Bảng 5.3. Bảng tính trị số lý luận Dt
D1.3
7.6
8.8
8.9
9.3
9.7
10.6
11.0
11.8
11.9
12.3
Dt
2.5
2.8
3.0
3.4
3.7
4.0
4.5
4.9
5.2
5.7
Dtl
2.21
3.02
3.09
3.37
3.64
4.25
4.52
5.06
5.13
5.4
Chấm các điểm thực nghiệm và lý luận Dt lên biểu đồ tương ứng với các
trị số D1.3 sẽ nhận được biểu đồ tương quan sau:
6.5
Dt
Dtl
5.5
4.5
3.5
2.5
1.5
7.6
8.6
9.6
10.6 11.6 12.6
Biểu đồ tương quan Dt/D1.3
5.5.2. Xác định các tham số của liên hệ tuyến tính 1 lớp trường hợp mẫu lớn.
Trình tự bài toán phân tích mối liên hệ giữa 2 đại lượng gồm các bước sau:
- Bước 1: Chỉnh lý tài liệu quan sát, lập bảng tính 2 chiều.
Bựi Mnh Hng
Bài giảng chương 5
- Bước 2: Tính các biến động Qx, Qy, Qxy.
Ví dụ 5.5.
Trong công nghệ chế biến lâm sản, người ta nghiên cứu mối quan hệ giữa
thời gian xẻ (tính bằng giây) và diện tích gỗ xẻ (tính bằng m2) trên máy cưa
vòng cố định (cưa vòng nằm) của một phân xưởng xẻ gỗ.
Kết quả được cho ở bảng 5.6.
Bảng 5.6. Bảng tương quan thời gian xẻ và diện tích gỗ xẻ
x(m2)
y (s)
0.5-0.7
0.7-0.9
0.9-1.1
1.1-1,3
1.3-1.5
1.5-1.7
fy
3
2
8
42 - 48
3
36 - 42
6
9
8
8
11
11
6
5
30.36
24 - 30
5
8
18 - 24
8
13
21
2
5
fx
23
18
13
25
20
17
4
Trong b¶ng 5.6:
BiÕn x ký hiƯu cho diƯn tích gỗ xẻ (m2), được chia ra 6 tổ.
Biến y ký hiệu cho diện tích gỗ xẻ (giây), được chia ra 5 tỉ.
Kx lµ cù ly tỉ theo biÕn x, Kx = 0,2m2.
Ky lµ cù ly tỉ theo biÕn y, Ky = 6 giây.
fx là tổng tần số quan sát ứng với mỗi tổ của biến x.
fy là tổng tần số quan sát ứng với mỗi tổ của biến y.
n là tổng tần số quan sát toàn thí nghiệm (n = 100).
Tõ b¶ng 5.6. lËp b¶ng tÝnh (5.7)
Bùi Mạnh Hưng
38
n = 100
Bài giảng chương 5
Bựi Mnh Hng
Bài giảng chương 5
Bảng 5.7. Bảng tính tương quan đường thẳng y = a + bx giữa diện tích gỗ xẻ và thời gian xẻ
x
0.6
y
0.8
1.6
fy
fy.y
fy.y2
fxy.x
fxy.x.y
3
2
8
360
16200
10.4
468
23
897
34983
28
1092
38
1254
41382
42.2
1392.6
18
1.2
1.4
486
13122
14.4
388.8
13
1.0
273
5733
8.8
184.8
3470
111420
45
3
39
6
9
8
8
11
11
6
5
33
2
27
5
8
21
8
5
fx
13
21
25
20
17
4
n=100
fx.x
7.8
16.8
25
24
23.8
6.4
103.8
fx.x2
4.68
13.77
25
28.8
33.32
10.24
115.48
fxy.y
303
585
867
714
645
156
fxy.y.x
181.8
468
867
856.8
903
249.6
3526.2
(fxy.y)2
91809
342225
751689
509796
416025
24336
109472.1
f
7062.2
16296.4
30067.6
25489.8
24472.1
6084
.y
2
xy
fx
Bựi Mnh Hưng
3526.2
Bài giảng chương 5
Từ bảng 5.7 tính được.
ã Tính các tỉng biÕn ®éng.
f .x
2
Qx f x x
2
x
115,48
n
f . y
103,82
7,736
100
2
x
Qx f x y 2
111420
n
Qx f xy .x. y
32702
4491,0
100
f .x. f . y 3526,2 103,8 x3270 131,94
x
y
n
100
TÝnh tû t¬ng quan.
f . y f . y
2
2
xy
fx
2
y
n
f .y
y
2
f . y
2
2
y
n
32702
100
32702
111420
100
109472,1
2543,1
0,57 2 0,75
4491,0
V× 0,7 < < 0,9 nên quan hệ giữa thời gian xẻ và diện tích xẻ là chặt chẽ.
Kiểm tra sự tồn tại của tỷ tương quan với H0: 0 = 0 và H1 : 0 0 theo
tiªu chn F cđa Fisher:
F
2 n mx
0,57 100 6 53,58
.
x
2
1 mx 1 1 0,57 6 1
2,15
F = 24,92
V× F = 24,92 > F
K 5
05 1
K 94
2
=4,40 nên giả thuyết H0 bị bác, trong tổng thể
thực sự tồn tại liên hệ giữa 2 đại lượng thời gian xẻ và diện tích xẻ.
Tính hệ số tương quan.
r
Qxy
Qx .Qy
131,94
131,94
0,71
7,736x 4491,0 186,393
Sự tồn tại của hệ số tương quan được kiểm tra theo tiêu chuẩn t cđa
Student víi gi¶ thut
H0: = 0
H1: 0
t
r
1 r2
n2
0,71
1 0,712
x 100 2 9,98
V× t = 9,98 > t05 (K=98) = 1,98 nên giả thuyết H0 bị bác bỏ, thực sự tồn tại
mối liên hệ đường thẳng giữa 2 đại lượng thời gian xẻ và diện tích xẻ.
Kiểm tra sự tồn tại của dạng liên hệ tuyến tính 1 lớp.
Với giả thuyết H0: Y = A + BX, theo tiªu chn F cđa Fisher:
Bùi Mạnh Hưng
Bài giảng chương 5
F , r
2 r2 n m
.
1 2 m 2
F , r
0,57 0,504 100 6 6,204
.
3,61
1 0,57
62
1,72
V× F, r = 3,61 < F
K 5
05 1
K 94
2
= 5,66 nên giả thuyết H0 được chấp nhận, nghĩa là
thực sự tồn tại mối liên hệ đường thẳng giữa 2 đại lượng thời gian xẻ và diện tích
xẻ.
Xác định các tham số của phương trình hồi quy và ph¬ng sai thõa.
HƯ sè håi quy b:
b
Qcy
Qx
131,94
17,06
7,736
HƯ sè tù do a:
a y bx
a
f . y b. f .x
y
x
n
n
3270
103,8
17,06.
32,70 17,708
100
100
a = 14,992
Vậy phương trình hồi quy lập được là:
y = 14,992 + 17,06.x
Phương sai thừa đối với đường hồi quy tính ®ỵc nh sau:
^2
S
^
Qy b2 .Qx
n2
4491 17,06 x7,736
44,48
100 2
^2
S S 44,48 6,67
KiÓm tra sự tồn tại của các tham số a và b.
Đặt giả thuyết:
H0: A = 0 và B = 0
H1: A 0 vµ B 0
Víi tham sè a:
a
trong ®ã
ta
Sa
Sa = 2,577
VËy
ta
14,992
5,82
2,577
Víi tham sè b:
Bùi Mạnh Hưng
^
Sa S
x
2
n.Qx
6,67.
115,48
100 x7,736
Bài giảng chương 5
tb
tb
b
Sb
trong đó
^
Sb S .
1
2,398
Qx
17,06
7,11
2,398
Vì /ta/ và /tb/ đều lớn hơn t05(K=98) = 1,98 nên tham số A và B thực sự tồn tại
trong tổng thể.
Ước lượng tham số A và B trong tỉng thĨ.
Víi tham sè A:
P(a-t/2(K) . Sa < A < a + t/2(K) . Sa) = 1 -
P(14,992 - 1,98 x 2,577 < A < 14,992 + 1,98 x 2,577) = 0,95
P(9,89 < A < 20,09) = 0,95
Víi tham sè B:
P(b-t/2(K). Sb < B < b + t/2(K) . Sb) = 1 -
P(17,06 - 1,98 x 2,398 < B < 17,06 + 1,98 x 2,398) = 0,95
P(12,312 < B < 21,808) = 0,95
Chóng ta tin tíi møc 95% r»ng tham sè A trong tỉng thĨ n»m trong
kho¶ng tõ 9,89 đến 20,09 và tham số B trong tổng thể nằm trong khoảng từ
12,312 đến 21,808.
Tính trị số lý luận thời gian xẻ trong sự phục thuộc vào diện tích gỗ xẻ.
Từ phương trình hồi quy đà thiết lậ:
^
y = 14,992 + 17,06x
thay các giá trị của x (diện tích gỗ xẻ) vào phương trình hồi quy sẽ xác
^
định được giá trị tương ứng của biến y (thời gian xẻ), chẳng hạn:
Bảng 5.7. Bảng tính trị số lý luận thời gian xẻ gỗ.
x
y/x
^
y
0.6
23.3
0.8
27.8
1.0
34.7
1.2
35.7
1.4
37.9
1.6
39.0
25.228
28.64
32.052
35.464
38.876
42.288
Trong bảng 5.7, các trị số y / x là trị số trung bình có điều kiện của biến y
ứng với các giá trị xác định của biến x. Các trị số này được tính như sau:
Nếu x1 = 0,6m2 thì có 2 giá trị của y là 27 (5 lần lặp) và 21 (8 lần lặp),
vậy:
y / x1 0,6
Bùi Mạnh Hưng
1
5 x 27 8 x 21) 23,3 gi©y.
3
Bài giảng chương 5
Nếu x2 = 0,8m2 thì có 3 giá trị của y là 22 (8 lần lặp), 27 (8 lần lặp) và 21
(5 lần lặp), vậy:
y / x 2 0 .8
1
8 33 8 27 5 21) 27,8 giây.
21
Tương tự như vậy, sẽ xác định được các số trung bình có điều kiện của
biến y ứng với các trị số xác định của biến x.
Từ bảng 5.7, chấm lên biểu đồ với trục hoành là diện tích gỗ xẻ (m2) và
trục tung là thời gian xẻ (giây), sẽ cso biểu đồ tương quan trên hình 5.5.
ytt
45
yll
40
35
30
25
20
15
0.4 0.6 0.8
1
1.2 1.4 1.6 1.8
Hình 5.5. Biểu đồ tương quan giữa thời gian xẻ và diện tích gỗ xẻ
5.6.4. Kiểm tra sự thuần nhất nhiều hệ số hồi quy
Giả sử có m phương trình hồi quy tuyến tính đơn:
y1 a1 b1.x
y2 a2 b2 .x
.......
ym am bm .x
Vấn đề đặt ra là, cần so sánh m hệ số hồi quy bi xem chúng có thuần nhất
với nhau không? Nếu chúng thùân nhất thì có thể gộp m phương trình hồi quy
tuyến tính đơn thành một phương trình chung.
Giả thuyết H0 đặt ra là: B1= B2=... Bm và đối thuyết H1 là ít nhất 1 hệ số hồi
quy Bi khác với các hệ số hồi quy còn lại.
Để kiểm tra giả thut H0, cã thĨ vËn dơng tiªu chn n2 cđa Pearson:
b2
m
Wbi .bi
m
2
Wbi .bi i 1m
i 1
Wbi
2
(5.49)
i 1
Víi
Wbi lµ träng sè cđa hƯ sè håi quy bi.
Wbi
Bùi Mạnh Hưng
1
trong ®ã Sbi 2 là phương sai của hệ số hồi quy b.
2
Sbi
Bài giảng chương 5
2
2
S bi
Si
trong đó Si 2 là phương sai thừa đối với đường hồi quy.
Qx i
Nếu n2 tÝnh theo (5.49) 052 tra b¶ng víi k=m-1 bËc tù do thì các hệ s
hồi quy bi là thuần nhất với nhau. Ngược lại nếu n2 tính theo (5.49)> 052 tra
bảng với k=m-1 bậc tự do thì giả thuyết H0 bị bác, các hệ số hồi quy bi là không
thuần nhất với nhau.
Trường hợp nếu giả thuyết H0 được chấp nhận, các hệ số hồi quy bi là
thuần nhất với nhau, khi đó các phương trình hồi quy tuyến tính đơn ở các mẫu
được gộp chung với hệ số hồi quy mới là:
m
W
.bi
bi
b
(5.50)
i 1
m
Wbi
i 1
Còn hệ số tự do ai của mỗi phương trình được điều chỉnh theo công thức:
(5.51)
ai yi bi .xi
Vµ hƯ sè tù do a của phương trình bình quân chung sẽ là số bình qu©n gia
qun theo Wb (träng sè cđa hƯ sè tù do ai), nghĩa là:
i
m
W
.a i
ai
a
i 1
m
(5.52)
W
ai
i 1
Trong đó:
Wai
1
S ai
2
và S a S i
2
2
x
.
2
i
n.Qxi
i
Phương trình gộp có dạng:
(5.53)
y a b.x
Ví dụ 5.5: GS.TS. Đồng Sỹ Hiền đà nghiên cứu mối quan hệ giữa hình cao
bình quân ( H f ) với chiều cao loài dẻ ở 5 địa phương khác nhau dạng:
H f =a+bh. Ông đà xác lập phương trình hồi quy cho loài dẻ ở từng địa phương
và tiến hành kiểm tra thuần nhất các hệ số hồi quy bi, kết quả kiểm tra được cho
ở bảng 5.8.
Bảng 5.8: Kiểm tra thuần nhất các hệ số hồi quy bi loài dẻ
ở 5 địa phương khác nhau
Địa
bi
Sbi
2
Wbi
Wbi .bi
Wbi .bi
2
y
x
ai
Sai
2
Wai
Wai .ai
phương
Cầu hai 0.3714 0.0010 1000.0 371.4 137.9 10.031 20.634 1.986 0.0180 55.56 110.33
Đại Từ 0.3987 0.0002 5000.0 1993.5 794.8 9.276 20.182 1.407 0.0134 74.63 105.0
Bùi Mạnh Hưng
Bài giảng chương 5
Hà Cối 0.4046 0.0010 1000.0
H.Sơn 0.3487 0.0029 344.80
Tiªn Yªn 0.3716 0.0007 1428.6
8773.4
404.6 164.5 9.431 20.056 1.611 0.0173 57.80 93.12
120.2 41.9 11.092 20.368 3.151 0.0531 18.83 59.34
530.9 197.3 7.017 13.644 1.697 0.0069 144.93 245.94
3420.6 1336.4
351.75 613.74
Tõ b¶ng 5.8 tính được:
2
b
2
m
Wbi .bi
2
m
2
1336.4 3420.6 2.77
Wbi .bi i 1m
8773.4
i 1
Wbi
i 1
V× b2=2.77<052(k=4) =9.49 nên giả thuyết về sự thuần nhất của các hệ số
hồi quy bi được chấp nhận. Hệ số hồi quy trung bình được tính theo (5.50):
m
W
.bi
bi
b
i 1
m
W
3420.6
0.3899
8773.4
bi
i 1
Hệ số tự do ai của mỗi phương trình hồi quy được điều chỉnh theo công
thức (5.51): ai y i b i .x i
Từ bảng 5.8 tính được:
m
W
.ai
ai
a
i 1
m
613.74
1.745
351.75
W
ai
i 1
Vậy phương trình gộp chung biểu thị cho quan hệ giữa hình cao và chiều
cao cây dẻ của 5 địa phương sẽ là:
H f a b.h Hay H f 1.745 0.3899.h
5.7. Liªn hƯ tun tính hai lớp
Phương trình hồi quy tuyến tính hai lớp trong tỉng thĨ cã d¹ng:
Y A0 A1 X 1 A2 X 2
(5.54)
Còn hàm ước lượng của nó ë mÉu cã d¹ng:
ˆ
y a0 a1x1 a2 x2
(5.55)
Trình tự phân tích tương quan và hồi quy của liên hệ tuyến tính 2 lớp như
sau:
5.7.1. Ước lượng phương sai thừa
Đối với liên hệ tuyến tính 2 lớp, phương sai thừa được định nghĩa theo
công thức:
m
S2
y
y
2
i
i 1
Bựi Mnh Hng
n3
với y là trị số lý luận
(5.56)
Bài giảng chương 5
của phương trình hồi quy tuyến tính 2 lớp.
Phương sai thừa thường được tính theo công thức sau:
ˆ
S2
Víi
Q x a1 .Q x1 y a2 .Q x2 y
n3
x y
1
Qx1 y x1 y
(5.58)
n
Qx2 y x2 y
(5.57)
x y
2
(5.59)
n
a1, a2 lµ hệ số hồi quy tuyến tính 2 lớp được xác định bằng phương pháp
bình phương bé nhất.
5.7.2. Xác định các hệ số hồi quy tuyến tính 2 lớp
Bằng phương pháp bình phương bé nhất, lập được hệ phương trình:
y na0 a1 x1 a2 x2
2
yx1 a0 x1 a1 x1 a2 x1x2
2
yx2 a0 x2 a1 x1x2 a2 x2
(5.60)
Giải hệ phương trình sẽ xác định được các tham số của liên hệ tuyến tính
hai lớp bằng phương pháp thừa số Gauss. Gọi Cij (i,j=1,2...) là những thừa số
Gauss, được xác định từ hệ các phương trình bậc nhất.
C11.Qx1 C12 .Qx1 x2 1
C11.Qx1 x2 C12 .Qx2 0
C21.Qx 2 C22 .Qx1 x2 0
C .Q C .Q 1
22
x2
21 x1 x2
(5.61)
Từ hệ (5.61) dễ dạng nhận được:
C11
C22
Qx 2
(5.62)
D1
Qx1
(5.63)
D1
C12 C21
Qx1 x2
(5.64)
D1
Trong ®ã:
x
x
n
2
Qx1
2
1
(5.65)
1
x
2
Qx2 x2
2
Qx1x2 x1 x2
Bùi Mạnh Hưng
2
(5.66)
n
x x
1
n
2
(5.67)
Bài giảng chương 5
Qx1 y x1 y
Qx2 y x2 y
x y
1
n
x y
2
n
(5.68)
(5.69)
C¸c tham sè a0, a1, a2 được xác định bằng phương pháp thừa sè Gauss sÏ lµ:
a1 C11 .Qx y C12 .Qx y
(5.70)
1
2
a1 C12 .Qx1 y C22 .Qx2 y
(5.71)
a0 y a1 x1 a2 x 2
(5.72)
Hc: a1
D4
D1
(5.73)
a2
D5
D1
(5.74)
D1 Qx1 Qx2 Q 2 x1x2
(5.75)
D2 Qx2 Q y Q 2 x2 y
(5.76)
D3 Qx1 Qy Q 2 x1y
(5.77)
D4 Qx2 Qx1 y Qx1x2 Qx2 y
(5.78)
D5 Qx1 Qx2 y Qx1x2 Qx1y
Trong đó:
(5.79)
5.7.3. Kiểm tra sự tồn tại của các tham số của liên hệ tuyến tính 2 lớp
Trong tự nhiên và xà hội, chúng ta thường gặp những liên hệ tuyến tÝnh 2
líp mµ sù tham gia cđa X1 vµ X2 là khác nhau về cường độ và chiều hướng. Nếu
một tham số ai nào đó quá bé thì thực tế ảnh hưởng của Xi đối với hàm y là
không đáng kể và khi đó có thể bỏ đi được. và liên hệ tuyến tính hai lớp trở về
dạng tuyến tính mét líp. Nhng tham sè ai nh thÕ nµo lµ quá bé và loại khỏi
phương trình để trả lời câu hỏi này, người làm công tác thống kê cần phải kiểm
tra sự tồn tại của chúng bằng tiêu chuẩn thống kê.
Người ta đà chứng minh được rằng, nếu giả thuyết H0: Ai=0 (H1: có ít nhất
1 Ai0) thì đại lượng:
t
ai
S . Cn
i 1,2
(5.80)
cã ph©n bè t víi k=n-3 bËc tù do. V× vËy, nÕu /t/ tÝnh theo (5.80)>t05 tra bảng với
k=n-3 bậc tự do thì giả thuyết H0 bị bác, các tham số ai được xem là tồn tại thực
sự. Ngược lại, nếu /t/t05 tra bảng với k=n-3 bậc tự do thì giả thuyết H0 được
chấp nhận các tham số là không tồn tại.
5.7.4. Ước lượng khoảng hệ số håi quy 2 líp
Bùi Mạnh Hưng
Bài giảng chương 5
Trường hợp nếu các tham số ai thực sự tồn tại thông qua việc kiểm tra
bằng tiêu chuẩn t của Student, thì bước tiếp theo là ước lượng khoảng các tham
số Ai trong tổng thể theo công thøc:
(5.81)
P ai t a / 2k .S. C n Ai ai t a / 2k .S . Cn 1
Trong đó:
Cij là các thừa số Gauss.
S
là sai tiêu chuẩn thừa của liên hệ tuyến tính 2 lớp.
Để phân tích mối liên hệ tuyến tÝnh hai líp, lËp b¶ng tÝnh sau:
B¶ng 5.9: B¶ng tÝnh các tham số a0, a1 và a2 của liên hệ tun tÝnh 2 líp
C«ng thøc kiĨm tra
x1
x2
y
x 12
x22
y2
x 1.x 2
x1y
x 2y
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
x 1 x2
y
x12
x 22
y2 x1.x2 x1y x2y
z=x1+x2+y
z2
(10)
(11)
z
z2
C«ng thøc kiĨm tra:
x12+ x22+ y2+2 x1.x2+2 x1y+2 x2y=z2
(5.82)
Ví dụ 5.6: Để thăm dò phương hướng lập biểu thể tích cho Thông nhựa và
Thông đuôi ngựa ở vùng Đông Bắc, Bộ môn Điều tra quy hoạch, trường ĐHLN
đà nghiên cứu mối quan hệ giữa thể tích với các nhân tố điều tra cấu thành thể
tích là chiều cao vút ngọn và đường kính ngang ngực cây rừng, dạng:
V a0 a1H a2 HD13
2
(5.82)
Số liệu đo đếm thể tích (V), chiều cao (H) và đường kính ngang ngực
(D1.3) của 15 cây thông mà vĩ tuổi 30 được cho ở bảng 5.10.
Nếu đặt y V , x1=H và x2=H.D1.32 thì phương trình (5.82) trở về dạng liên
hệ tuyến tính 2 lớp:
y a0 a1x1 a2 x2
Bùi Mạnh Hưng
Bài giảng chương 5
Bảng 5.10 Bảng tính tương quan tuyến tÝnh 2 líp V=a0+a1.H+a2.H.D1.32
Cét kiĨm tra
TT
x1(m)
x2(m3)
y(m3)
x12
x22
y2
x1.y
x 2.y
x 1.x 2
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
(9)
(10)
1
2
15.50
15.80
1.063982 0.307615 240.250000 1.132058 0.094627 4.768033 0.327297 16.491721 16.871597 284.650785
1.741539 0.014712 249.640000 3.032958 0.000216 0.232450 0.025622 27.516316 17.556251 308.221949
3
13.30
0.575411 0.197229 176.890000 0.331098 0.038899 2.623146 0.113488 7.652966 14.072640 198.039197
4
15.50
0.670592 0.271170 240.250000 0.449694 0.073533 4.203135 0.181844 10.394176 16.441762 270.331538
5
13.45
0.563236 0.249691 180.902500 0.317235 0.062346 3.358344 0.140635 7.575524 14.262927 203.431087
6
11.60
0.426220 0.178234 134.560000 0.181663 0.031767 2.067514 0.075967 4.944152 12.204454 148.948697
7
15.00
1.029660 0.341156 225.000000 1.060200 0.116387 5.117340 0.351275 15.444900 16.370816 268.003617
8
14.90
0.601974 0.163095 222.010000 0.362373 0.026600 2.430116 0.098179 8.969413 15.665069 245.394387
9
12.65
0.331986 0.147716 160.022500 0.110215 0.021820 1.868607 0.049040 4.199623 13.129702 172.389075
10
13.36
0.513238 0.186912 178.489600 0.263413 0.034936 2.497144 0.095930 6.856860 14.060150 197.687818
11
13.10
0.503250 0.187641 171.610000 0.253261 0.035209 2.458097 0.094430 6.592575 13.790891 190.188675
12
14.75
0.807651 0.333528 217.562500 0.652300 0.111241 4.919538 0.269374 11.912852 15.891179 252.529570
13
14.40
1.081094 0.424224 207.360000 1.168764 0.179966 6.108826 0.458626 15.567754 15.905318 252.979141
14
15.70
0.685792 0.286445 246.490000 0.470311 0.082051 4.497187 0.196442 10.766934 16.672237 277.963487
15
13.20
0.650545 0.256416 174.240000 0.423209 0.065749 3.384691 0.166810 8.587194 14.106961 199.006349
212.21
11.246170 3.545784 3025.277100 10.208750 0.975348 50.534167 2.644958 163.472960
Bùi Mạnh Hưng
z=x1+x2+y
z2
(11)
(12)
3469.765369