108
Phụ lục 3: Phương pháp bình phương nhỏ nhất
trong phân tích hồi quy
1. Mô hình tuyến tính
Mô hình hồi quy tuyến tính có dạng:
baxxfy
+
== )(
.
Theo phương pháp bình phương nhỏ nhất, các hệ số hồi quy
a và b
trong phương trình trên được tìm sao cho tổng bình phương sai số bằng
∑
=
−−=
n
k
kk
baxyE
1
2
)(
cực tiểu. Lần lượt lấy đạo hàm biểu thức này theo
a , b và cho bằng
không, ta được hệ phương trình sau đây để xác định
a và b :
∑∑∑
===
=+
n
k
kk
n
k
k
n
k
k
yxxbxa
111
2
,
∑∑
==
=+
n
k
k
n
k
k
ynbxa
11
.
Vậy các hệ số hồi quy được tính theo các công thức sau:
∑∑
∑∑∑
==
===
−
−
=
n
k
k
n
k
k
n
k
kk
n
k
k
n
k
k
xnx
yxnyx
a
1
22
1
111
)(
(20)
∑∑
∑∑∑∑
==
====
−
−
=
n
k
k
n
k
k
n
k
k
n
k
k
n
k
kk
n
k
k
xnx
yxyxx
b
1
22
1
11
2
11
)(
, (21)
hay hệ số
b còn có thể tính theo công thức:
n
xay
b
n
k
k
n
k
k
∑∑
==
−
=
11
. (22)
2. Mô hình đa thức
Phương pháp bình phương nhỏ nhất cũng có thể áp dụng để tính các
hệ số hồi quy đa thức dạng
m
n
xaxaxaaxf ++++= )(
2
210
.
thí dụ đối với mô hình bậc hai
2
210
)( xaxaaxf ++= .
Lấy đạo hàm tổng sai số theo các hệ số và cho bằng không ta có hệ
sau đây để xác định các hệ số hồi quy bậc hai:
109
⎪
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎪
⎨
⎧
=++
=++
=++
∑∑∑∑
∑∑∑∑
∑∑∑
====
====
===
n
k
kk
n
k
n
k
kk
n
k
k
n
k
kk
n
k
n
k
kk
n
k
k
n
k
k
n
k
k
n
k
k
yxxaxaxa
yxxaxaxa
ynaxaxa
1
2
11
2
0
3
1
1
4
2
111
0
2
1
1
3
2
11
01
1
2
2
(23)
Về nguyên tắc ta có thể sử dụng phương pháp này để tìm phương
trình đa thức bậc bất kỳ. Tuy nhiên trong thực tế phương pháp trở thành
không ổn định khi bậc đa thức lớn hơn vì các sai số làm tròn số trong máy
tính.
3. Mô hình phi tuyến
Phương pháp bình phương nhỏ nhất có thể áp dụng cho hàm bất kỳ,
nhưng hệ các phương trình để tìm các hệ số có thể phi tuyến, và do đó
không thể giải được bằng cách sử dụng các phương trình tuyến tính. Tuy
nhiên, trong một số trường hợp, một hàm phi tuyến có thể chuyển thành
một hàm tuyến tính. Thí dụ về một hàm có thể tuyến tính hoá là
a
xbxf )( = (24)
Nếu lấy loga hai vế của phương trình này, ta có
bxaxf lnln)(ln
+
= . (25)
Nếu ký hiệu
)(ln)( xfxg =
(26)
bb ln
~
=
(27)
xx ln
~
=
(28)
yy ln
~
=
(29)
ta có
bxaxg
~
~
)( +=
(30)
Với phương trình (30) các hệ số hồi quy
a và b
~
tính theo các công
thức
∑∑
∑∑∑
==
===
−
−
=
n
k
k
n
k
k
n
k
kk
n
k
k
n
k
k
xnx
yxnyx
a
1
22
1
111
~
)
~
(
~~
~
~
(31)
∑∑
∑∑∑∑
==
====
−
−
=
n
k
k
n
k
k
n
k
k
n
k
k
n
k
kk
n
k
k
xnx
yxyxx
b
1
22
1
11
2
11
~
)
~
(
~
~
~~
~
~
(32)
Vậy công việc tính toán gồm: chuyển đổi các giá trị số liệu
k
x và
k
y
theo các công thức (28), (29), tính các tổng, kết quả thế vào các phương
trình (31), (32) để tìm
a và b
~
. Giải phương trình (27) đối với b và đặt vào
phương trình (24).
110
Phụ lục 4: Sơ đồ ứng dụng phương pháp hồi
quy nhiều biến
Giả sử có
n
quan trắc đối với biến phụ thuộc y và các biến độc lập
m
xxx , , ,
21
. Phương trình hồi quy được thiết lập như sau:
mm
xaxaxaay
+
+++
=
22110
.
Các hệ số hồi quy
), ,1( mia
i
= được chọn sao cho thoả mãn
()
∑
=
=−−−−−=
n
i
mm
xaxaxaay
1
2
22110
min
δ
Lần lượt lấy đạo hàm biểu thức trên theo
m
aaaa , , , ,
210
và cho các
đạo hàm bằng không, ta có hệ
1+m phương trình để xác định các hệ số
a
[
][]
[
]
[
]
[] [ ] [ ] [ ] [ ]
[] [ ] [ ] [ ] [ ]
[] [ ] [ ] [ ] [ ]
mmmmmmm
mm
mm
mm
yxaxxaxxaxxax
yxaxxaxxaxxax
yxaxxaxxaxxax
yaxaxaxna
=++++
=++++
=++++
=++++
2
21
10
2
22
221
210
2
1
12
121
110
1
2
21
10
(33)
Hệ phương trình này gọi là hệ phương trình chính tắc để xác định các
hệ số hồi quy. Dưới dạng ma trận ta viết hệ này như sau:
[
]
[
]
[
]
[] [ ] [ ] [ ]
[] [ ] [ ] [ ]
[] [ ][ ] [ ]
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
mmmmmmm
m
m
m
b
b
b
b
a
a
a
a
xxxxxxx
xxxxxxx
xxxxxxx
xxxn
.
2
1
0
2
1
0
21
222212
112111
21
(34)
với dấu
[]
ký hiệu phép lấy tổng
∑
n
1
.
Để tìm các hệ số hồi quy
m
aaaa , ,,,
210
ta phải giải hệ phương
trình chính tắc theo phương pháp loại biến Gauss hoặc phương pháp căn
bậc hai đã mô tả trong phụ lục 2 vì ma trận hệ số của các phương trình
chính tắc là ma trận đối xứng. Dưới đây dẫn hai thủ tục hỗ trợ cho việc lập
hệ phương trình đại số tuyến tính chuẩn tắc (34) − SUBROUTINE
LHPTCT và giải hệ phương trình đó bằng phươ
ng pháp loại biến Gauss −
SUBROUTINE GAUSS.
SUBROUTINE LHPTCT (Y, X, A, N, M)
INTEGER N, M, I, J, K
REAL Y (10000), X (10000, 50), A (0 : 50, 0 : 51)
A (0, 0) = N
DO J = 1, M
A (0, J) = 0.0
DO K = 1, N
A (0, J) = A (0, J) + X (K, J)
END DO
END DO
A (0, M + 1) = 0.0
DO K = 1, N
A (0, M + 1) = A (0, M + 1) + Y (K)
END DO
111
DO I = 1, M
A (I, M + 1) = 0.0
DO K = 1, N
A (I, M + 1) = A (I, M + 1) + Y (K) * X(K, I)
END DO
END DO
DO I = 1, M
DO J = I, M
A (I, J) = 0.0
DO K = 1, N
A (I, J) = A (I, J) + X (K, I) * X (K, J)
END DO
ENDDO
ENDDO
DO I = 1, M
DO J = 0, I - 1
A (I, J) = A (J, I)
END DO
END DO
RETURN
END
SUBROUTINE GAUSS (M, A, X)
INTEGER M
REAL A (0 : 50, 0 : 51), X (0 : 50)
DO I = 0, M - 1
K = I
AMAX = ABS (A (K, K))
DO J = I + 1, M
R = ABS (A (J, I))
IF (AMAX .LT. R) THEN
AMAX = R
K = J
END IF
END DO
IF (K .NE. I) THEN
DO J = I, M + 1
AMAX = A (I, J)
A (I, J) =A (K, J)
A (K, J) = AMAX
END DO
END IF
DO J = I + 1, M + 1
A (I, J) = A (I, J) / A (I, I)
END DO
DO J = I + 1, M
DO K = I + 1, M + 1
A (J, K) = A (J, K) - A (J, I) * A (I, K)
END DO
END DO
END DO
X (M) = A (M, M + 1) / A (M, M)
DO I = M - 1, 0, -1
X (I) = A (I, M + 1)
DO J = I + 1, M
X (I) = X (I) - A (I, J) * X (J)
END DO
END DO
RETURN
END