Tải bản đầy đủ (.doc) (29 trang)

Phương pháp hồi quy và tương quan - Phân tích dãy số thời gian và dự báo Hồi qui tuyến tính một chiều ( tuyến tính đơn)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (257.9 KB, 29 trang )

CHƯƠNG 1
CƠ SỞ LÝ LUẬN

1.1. Phương pháp hồi quy và tương quan
1.1.1. Hồi qui tuyến tính một chiều ( tuyến tính đơn)
Phân tích hồi qui là nghiên cứu sự phụ thuộc của một biến (biến phụ thuộc hay còn gọi
là biến được giải thích) vào một biến hay nhiều biến khác (biến độc lập hay cịn gọi là
biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự đốn) giá trị trung bình của
biến phụ thuộc trên cơ sở các giá trị đã biết của biến độc lập.
1.1.1.1. Phương trình hồi qui tuyến tính một chiều
Đặt (x1, y1), (x2, y2),…, (xn, yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:
y = α + β x1 + ε1
Theo phương pháp bình phương bé nhất thì ước lượng các hệ số α và β là các giá trị a
và b sao cho tổng bình phương sai số của phương trình sau đây là bé nhất:
n

SS =

∑ ei2 =
i =1

n

∑ ( y − a − bx )
i

i =1

2

i



Các hệ số a và b được tính như sau:
n

b=

∑ xi yi − nx y
i =1
n

∑ x − nx
i =1

2
i

−2

n

=

∑ ( x − x)( y
i

i =1

1

n


∑ ( x − x)
i =1

− y)
2

i

Suy ra : a = y - b x
Và phương trình hồi qui tuyến tính mẫu của y trên x là: y = a + b x
1.1.1.2. Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều
Giả sử đường hồi qui tuyến tính có dạng: yi = α + β x1 + ε1
2
Và đặt σ ε là phương sai của sai số và được ước lượng từ công thức sau:

-1-


n

2
e

s =

∑e
i =1

2

i

=

n−2

SEE
n−2

Đặt b là ước lượng mẫu của β thì phương sai của b là
σ e2
σ =
=
∑ ( xi − x)2
2
b

σ e2

∑x

2
i

− nx

2

→ Ước lượng không chênh lệch của σ ε2 được xác định bởi:
Se2

σ = S =
=
∑ ( xi − x)2
2
b

2
b

σ e2

∑x

2
i

− nx

2

Giả sử, sai số hồi qui ( ε1 ) có phân phối chuẩn thì ngẫu nhiên (t) dùng để kiểm định giả
thuyết về β và ước lượng khoảng tin cậy của β được tính như sau:
t=

b−β
Sb

Và khoảng tin cậy 100 (1 - α )% cho β là:
b −t


n − 2,

α
2

Sb < β < b + t

n − 2,

α
2

Sb

α
Trong đó, tn − 2,α là một số sao cho P( tn − 2 > tn − 2,α ) =
2

2

2

1.1.1.3. Kiểm định tham số hồi qui tổng thể ( β )
Ở mức ý nghĩa α , giả thuyết H0 có thể được kiểm định dưới các trường hợp:
 H 0 : β = β0
(1)
 H1 : β > β 0

Đặt giả thuyết: 


Giá trị kiểm định: t =

 H 0 : β = β0
(2)

 H1 : β < β 0

 H 0 : β = β0
(3)

 H1 : β # β 0

b − β0
Sb

Quyết định bác bỏ giả thuyết H0 khi: t < tn − 2,α t < tn − 2,α
Giả thuyết H0: β = 0
-2-

t > t α
n − 2,

2

t < −tn − 2, α

2


1.1.1.4. Phân tích phương sai hồi qui

* Hệ số xác định: R2 là hệ số nhằm xác định mức độ quan hệ giữa X và Y có quan hệ
hay khơng hoặc bao nhiêu phần trăm sự biến thiên của Y có thể giải thích bởi sự phụ
thuộc tuyến tính của Y vào X.
Giá trị thực tế yi = a + bx1 +e1
Giá trị dự đốn theo phương trình hồi qui: y = a + bx1
⇒ y1 = µ 1 + e1
y

Vậy e1 là sự khác biệt giữa giá trị thực tế với giá trị dự đốn của phương trình hồi qui
tuyến tính. Như vậy e1 thể hiện phần biến thiên của Y khơng thể giải thích bởi mối quan
hệ tuyến tính giữ Y và X.
Ta có:

∑ ( y − y)
i

2

=

y
∑ ( µ − y)
i

2

+

∑e


2
i

Hay SST = SSR+ SSE
SSR càng lớn thì mơ hình hồi qui tuyến tính càng có độ tin cậy cao trong việc giải thích
sự biến động của Y
Hệ số xác định R2 =

SSR
SSE
=1là phần trăm biến động của Y được giải thích bởi
SST
SST

mối quan hệ tuyến tính của Y vào X.
* Phân tích phương sai
Trong ước lượng các tham số của mơ hình hồi qui tuyến tính đơn theo phương pháp
bình qn nhỏ nhất, có thể chứng minh được rằng:
∑ ( yi – ytb)2 = ∑ ( yi -

i

)2 + ∑ (

i

– ytb)2

Trong đó:
∑ ( yi – ytb)2 = SST là tổng biến động của y

∑(

i

– ytb)2 = SSR là tổng bình phương hồi qui, là đại lượng biến động

của y được giải thích bởi đường hồi qui.

-3-


∑ ( yi -

i

)2 = SSE là phần biến động còn lại hay còn gọi là dư số, là đại

lượng biến động tổng gộp của nguồn biến động do các nhân tố khác gây ra mà không
hiện diện trong mô hình hồi qui và phần biến động ngẩu nhiên.


SSR càng lón thì mơ hình hồi qui càng có độ tin cậy cao trong việc giải thích biến

động của y.
● Hệ số xác định: r2 = SSR/ SST = 1 – ( SSE/ SST) là phần trăm biến động của y được
giải thích bởi mối quan hệ tuyến tính của y đối với x.


Số thống kê F = SSR/ [ SSE/ ( n-2)] = MSR/MSE có phân phối F và thường được


dùng để kiểm định mức ý nghĩa của mơ hình hồi qui. F càng lớn mơ hình càng có ý
nghĩa.
Các nguồn biến động của hồi qui tuyến tính đơn được tóm tắt trong bảng phân tích
phương sai hồi qui như sau:
Độ tự do

Tổng bình phương

Trung bình bình phương

Nguồn biến

(d.f)

(SS)

(MS)

động
Do hồi qui

1

Dư số

(n-2)

SSE=∑ ( yi -

)2


SSE/(n-2)

Tổng cộng

(n-1)

SST= ∑ ( yi – ytb)2

SST/(n-1)

SSR=∑ (

i

– ytb)2
i

1.1.1.5. Dự báo trong phương pháp hồi qui tuyến tính đơn giản
Ước lượng khoảng giá trị thực của yn +1 với độ tin cậy (1 - α )
$ ±t
y

n − 2,

α
2

Se


1+

1 ( xn +1 − x) 2
+
2
n n 2
∑ xi − nx
i =1

Ước lượng khoảng giá trị trung bình của yn +1 với độ tin cậy (1 - α )
$ ±t
y

n − 2,

α
2

Se

1 ( xn +1 − x ) 2
+
2
n n 2
∑ xi − nx
i =1

1.1.2. Hồi qui tuyến tính nhiều chiều
-4-



1.1.2.1. Mơ hình hồi qui
Giả sử Y phụ thuộc vào k biến độc lập X1…Xk. Nếu giá trị của k biến độc lập X1...Xk
mơ hình hồi qui tuyến tính nhiều chiều có dạng :
Y = α + β1 X1 + β 2 X2 + … + β k Xk + U
Giải thích biến:
- Y (biến phụ thuộc): chỉ tiêu phân tích: Năng suất lúa dình qn cả năm.
- α ( biến độc lập): hệ số chặn phản ánh mức độ ảnh hưởng của các nhân tố khác đến
chỉ tiêu phân tích.
- β : hệ số ước lượng, các hệ số hồi quy này phản ánh mức độ ảnh hưởng của từng
nhân tố đến biến giải thích.
Nếu β >0 thì ảnh hưởng thuận và ngược lại là ảnh hưởng nghịch. β càng lớn thì sự ảnh
hưởng đến chỉ tiêu phân tích càng mạnh.
- Xi các yếu tố ảnh hưỏng đến năng suất.Với i chạy từ 1 đến k.
- U là sai số
1.1.2.2. Phương trình hồi qui
Gọi các hệ số a, b1…bk ước lượng cho α , β1 … β k được xác định bởi phương pháp bình
phương bé nhất. Phương trình hồi qui có dạng:
Y = a + b1x1 + b2x2 +…+bkxk.
Các tham số a, b1,b2,…,bn có thể được ước lượng dễ dàng nhờ các phần mềm có sẵn các
biến độc lập X1, X2,…, Xk.
1.1.2.3. Phân tích phương sai hồi qui
 Hệ số xác định:
Hệ số xác định R2 là nói lên tính chặt chẽ giữa biến phụ thuộc Y và các biến độc lập X i,
tức là nó thể hiện phần trăm biến thiên của Y có thể được giải thích bởi sự biến thiên
của tất cả các biến Xi.
R2 =

SSR
SSE

=1SST
SST
-5-

0 ≤ R2 ≤ 1


Trong đó:
n

SSE =

∑e

SSR =

y
∑ (°

i =1

2
i

: là phần biến động còn lại hay còn gọi là số dư

n

− y ) 2 : là tổng bình phương hồi qui, là đại lượng biến động của y được


i

i =1

i

giải thích bằng đường hồi qui
n

SST =

∑ ( y − y)
i =1

i

2

: là tổng biến động của y.

SSR càng lớn thì mơ hình hồi quy càng có độ tin cậy cao trong việc giải thích biến
động y
 Hệ số tương quan bội R
R nối lên tính chặt chẽ của mối quan hệ giữa biến phụ thuộc (y) và các biến độc lập (xi).
R=

R2

(-1 ≤ R ≤ 1)


 Phân tích ANOVA hồi quy:
Kiểm định sự phù hợp của mơ hình (ANOVA):
Giá trị được dùng để kiểm định là giá trị F. Việc kiểm định này nhằm đảm bảo
cho việc phù hợp của mơ hình hồi quy tuyến tính mẫu với các hệ số tìm được vẫn có giá
trị khi suy diễn ra mơ hình thực cho tổng thể.
Để kiểm định sự phù hợp của mô hình hồi quy tổng thể, ta sử dụng Sig.F để làm
căn cứ cho việc chấp nhận hay bác bỏ giả thiết
Sig.F < α : mơ hình có ý nghĩa.
Sig.F > α : mơ hình khơng có ý nghĩa.
1.1.2.4. Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi quy nhiều
chiều
Mơ hình hồi qui nhiều chiều cho tổng thể có dạng:
y = α + β1 x1 + β 2 x2 +… + β k xk + U

-6-


Đặt a, b1, b2, … ,bk là những tham số được ước lượng cho tổng thể ; Sa , Sb , Sb , …, Sb
1

2

k

là những độ lệch chuẩn đã ước lượng, và U coi phân phối chuẩn thì biến ngẫu nhiên t
được tính như sau:
tα =

b1 − β1
a −α

; tb1 = S
có độ tự do ( n –k -1)
Sa
b1

Vì vậy, khoảng tin cậy 100(1- α )% cho các hệ số hồi qui β1 được tính như sau:
b1 - tn − k −1,α Sb < β < b1 + tn − k −1,α Sb
2

t

n − k −1,

α
2

i

2



i



là một số sao cho (P  tn − k −1 > tn − k −1,α  .


2




1.2.Dãy số thời gian
1.2.1. Khái niệm
Các hiện tượng kinh tế - xã hội luôn luôn biến động qua thời gian. Để nghiên cứu sự
biến động này người ta dung phương pháp dãy số thời gian. Dãy số thời gian là dãy các
giá trị của chỉ tiêu kinh tế - xã hội biến động theo thời gian.
1.2.2. Phân loại
Căn cứ vào đặc điểm về mặt thời gian, người ta thường chia dãy số thời gian thành 2
loại:
-

Dãy số thời kỳ: là dãy số biểu hiện sự thay đổi của hiện tượng qua từng thời kỳ
nhất định.

-

Dãy số thời điểm: là dãy số biểu hiện mặt lượng của hiện tượng vào một thời
điểm nhất định

Một cách chi tiết hơn, dãy số thời điểm cịn có thể được chia thành dãy số thời điểm có
khoảng cách thời gian bằng nhau và dãy số thời điểm có khoảng cách thời gian không
bằng nhau.

1.2.3. Ý nghĩa của việc nghiên cứư dãy số thời gian
-7-


Phương pháp phân tích một dãy số thời gian dựa trên một giả định căn bản là: sự biến

động trong tương lai của hiện tượng nói chung sẽ giống với sự biến động của hiện
tượng trong quá khứ và hiện tại xét về mặt đặc điểm và cường độ biến động. Nói một
cách khác các yếu tố đã ảnh hưởng đến biến động của hiện tượng trong quá khứ và hiện
tại được giả định trong tương lai sẽ tiếp tục tác động đến hiện tượng theo xu hướng và
cường độ giống hoặc gần giống như trước.
Do vậy, mục tiêu chính của phân tích dãy số thời gian là chỉ ra và tách biệt các yếu tố đã
ảnh hưởng đến dãy số thời gian. Điều đó có ý nghĩa trong việc dự đoán cũng như
nghiên cứu quy luật biến động của hiện tượng. Tất nhiên, giả định nói trên có nhược
điểm, nó thường bị phê bình là q ngây thơ và máy móc vì đã khơng xem xét đến sự
thay đổi về kỹ thuật, thói quen, nhu cầu hoặc sự tích lũy kinh nghiệm trong kinh
doanh... Vì vậy phương pháp phân tích dãy số thời gian cung cấp những thơng tin hữu
ích các nhà quản lý trong việc dự đốn và xem xét chu kỳ biến động của hiện tượng.
Đây là công cụ đắc lực cho họ trong việc ra quyết định.
1.2.4. Các yếu tố ảnh hưởng đến dãy số thời gian
Biến động của một dãy số thời gian: X1, X2,…, Xn thường được xem như là kết quả
hợp thành của các yếu tố sau đây:
- Tính xu hướng: Quan sát số liệu thực tế của hiện tượng trong một thời gian
dài (thường là nhiều năm), ta thấy biến động của hiện tượng theo một chiều hướng
( tăng hoặc ) giảm rõ rệt. Nguyên nhân của 2 loại biến động này là sự thay đổi trong
công nghệ sản xuất, gia tăng dân số, biến động về tài sản…
- Tính chu kỳ: biến động của hiện tượng được lặp lại với một chu kỳ nhất định,
thường kéo dài 2-10 năm, trải qua 4 giai đoạn: phục hồi, phát triển, thịnh vượng, suy
thoái và đình trệ. Biến động theo chu kỳ là do biến động tổng hợp của nhiều yếu tố khác
nhau. Chẳng hạn như trong kỳ kinh doanh thì chu kỳ đời sống sản phẩm ảnh hưởng rất
lớn đến doanh thu của cơng ty qua 4 giai đoạn của nó.
- Tính thời vụ: biến động của một số hiện tượng kinh tế - xã hội mang tính thời
vụ nghĩa là hàng năm, vào thời điểm nhất định (tháng hoặc quý) biến động của hiện
tượng được lặp đi lặp lại. Nguyên nhân của biến động hiện tượng là do các điều kiện
thời tiết khí hậu tập quán xã hội, tín ngưỡng của dân cư…
-8-



- Tính ngẫu nhiên hay bất thường: là những biến động khơng có quy luật và hầu
như khơng thể dự đoán được. Loại biến động này thường xảy ra trong một thời gian
ngắn và không lặp lại. Nguyên nhân là do ảnh hưởng của các biến cố chính trị, thiên tai,
chiến tranh…
Giá trị X trong dãy số thời gian X1, X2,…, Xn, có thể được diễn tả bằng cơng thức sau:
Xi = Ti . Ci . Si . Ii
Xi : Giá trị thứ i của dãy số thời gian
Ti : Giá trị của yếu tố xu hướng
Ci : Giá trị của yếu tố chu kỳ
Si : Giá trị của yếu tố thời vụ
Ii : Giá trị của yếu tố ngẫu nhiên (bất thường)
1.2.5. Các chỉ tiêu cơ bản dùng để phân tích biến động dãy số thời gian
1.2.5.1. Mức độ trung bình theo thời gian
Là số trung bình của các mức độ trong dãy số. Chỉ tiêu này biểu hiện mức độ
chung nhất của hiện tượng trong thời kỳ nghiên cứu.
Ký hiệu: x1, x2, …, xn: Dãy số thời gian
x : Mức độ trung bình

 Mức độ trung bình của dãy số thời kỳ
x1 + x2 + ... + xn
=
x =
n

n

∑x
i =1


1

n

 Mức độ trung bình của dãy số thời điểm
Khoảng cách thời gian giữa các thời điểm bằng nhau
1
x = 2

x1 + x2 + ... + xn −1 +
n −1

1
2

Nếu khoảng cách giữa các điểm thời gian không bằng nhau
-9-


x =

∑ x .t
∑t
i

i

xi: mức độ thứ i
ti: độ dài thời gian có mức độ thứ i

x : Giá trị trung bình thứ i

1.2.5.2.Lượng tăng (giảm) tuyệt đối
Là chỉ tiêu biểu hiện sự thay đổi về giá trị tuyệt đối của hiện tượng giữa hai thời kỳ
hoặc thời điểm nghiên cứu.
Tuỳ theo mục đích nghiên cứu, ta có:
-

Lượng tăng giảm tuyệt đối từng kỳ (liên hoàn): Biểu hiện lượng tăng giảm

tuyệt đối giữa 2 thời kỳ kế tiếp nhau.
∆ i = xi - xi −1 ( I =2, …,n)

-

Lượng tăng (giảm) tuyệt đối định gốc: Biểu hiện lượng tăng giảm tuyệt đối

giữa kỳ nghiên cứu và kỳ được chọn làm gốc.
∆ 'n = xi – x1

x1: kỳ được chọn làm gốc
Giữa lượng tăng (giảm) tuyệt đối từng kỳ và định gốc có mối liên hệ sau. Tổng
đại số các lượng tăng (giảm) tuyệt đối từng kỳ bằng lượng tăng (giảm) tuyệt đối định
gốc, nghĩa là:
n

∑∆

i


'
= ∆n

i=1

- Lượng tăng (giảm) tuyệt đối trung bình: chỉ tiêu này biểu hiện một cách
chung nhất lượng tăng (giảm) tuyệt đối, tính trung bình cho cả thời kỳ nghiên cứu.
n

∆ =

∑∆
i =2

i

n −1

Chỉ tiêu này có ý nghĩa khi các lượng tăng (giảm) tuyệt đối từng kỳ xấp xỉ nhau.
-10-


1.2.5.3. Tốc độ phát triển (lần, %)
Là chỉ tiêu biểu hiện sự biến động của hiện tượng xét về mặt tỷ lệ. Tuỳ theo
mục đích nghiên cứu, ta có các loại tốc độ phát triển sau:
- Tốc độ phát triển từng kỳ (liên hoàn) : Biểu hiện sự biến động về mặt tỷ lệ của
hiện tựơng giữa hai kỳ liền nhau.

ti =


xi
xi −1

( i= 2,3,…,n)

- Tốc độ phát triển định gốc: Biểu hiện sự biến động về mặt tỷ lệ của hiện
tượng giữa kỳ nghiên cứu với kỳ được chọn làm gốc.
ti' =

xi
(I = 2,3,…,n)
x1

* Mối quan hệ giữa tốc độ phát triển từng kỳ và định gốc
- Tích các tốc độ phát triển từng kỳ bằng tốc độ phát triển định gốc.
n

Công thức:

∏t

i

'
= tn

i −2

- Thương của hai tốc độ phát triển định gốc liền nhau bằng tốc độ phát từng kỳ.
Công thức:


t i'
t i'−1

= ti

1.2.5.4. Tốc độ tăng (giảm)
Thực chất tốc độ tăng (giảm) bằng tốc độ tăng trừ đi 1 ( hoặc trừ 100 nếu tính bằng %).
Nó phản ánh mức độ của hiện tượng nghiên cứu giữa hai thời kỳ tăng lên hay giảm đi
bao nhiêu lần (hoặc %), nói lên nhịp điệu của sự tăng theo thời gian.
- Tốc độ tăng (giảm) từng kỳ (hay liên hồn)
ai =

Vì:

xi − xi −1
(i=2,3,…,n)
xi −1

xi − xi −1 = ∆ i

- Tốc độ tăng (giảm) định gốc
-11-


Suy ra: a i =

∆i
xi −1


hay ai = t i − 1
ai' =

xi − x1
x1

(i=2,3,…,n)

xi − x1 = ∆'i

Vì:
Suy ra:

ai' =

∆'i
xi

hay ai' = t i' − 1

- Tốc độ tăng (giảm) trunng bình
a = t −1

1.2.5.5. Giá trị tuyệt đối của 1% tăng (giảm)
Là chỉ tiêu này biểu hiện mối quan hệ giữa chỉ tiêu lượng tăng (giảm) tuyệt đối
trong công thức với chỉ tiêu tốc độ tăng (giảm), nghĩa là tính xem 1 % tăng (giảm) của
chúng tương ứng với một lượng giá trị tuyệt đối tăng giảm là bao nhiêu.
gi =

∆i

ai

Từ cơng thức trên ta có: ai =

Suy ra:

gi =

∆i
x.100
xi −1

∆i
x
= i −1
∆ i x.100 100
xi −1

Chỉ tiêu này khơng tính cho tốc độ tăng (giảm) định gốc vì kết quả ln ln bằng

x1
100

1.2.6. Dự đốn biến động của dãy số thời gian
Dự báo là xác định mức độ có thể xảy ra trong tương lai của hiện tượng. Biết được
tương lai của hiện tượng sẽ giúp các nhà quản trị chủ động cũng như có những quyết
định đúng trong kinh doanh.

-12-



Có nhiều phương thức dự đốn khác nhau . Tuy vậy nội dung cơ bản của dự đoán thống
kê là dựa trên các giá trị đã biết (x1, x2, …, xn). Dự đoán dựa vào dãy số thời gian để phân
tích các yếu tố ảnh hưởng đến sự biến động của hiện tượng.
1.2.6.1. Dự đoán bằng hàm xu hướng
Tùy theo tính chất của hiện tượng nghiên cứu hoặc kết hợp với kinh nghiêm ta có
thể xây dựng hoặc chọn một hàm số phù hợp biểu hiện sự biến động của hiện tượng
qua thời gian.

 Hàm xu hướng dạng đa thức (bậc n ≤ 4)
Giả sử đường dữ liệu được biểu diễn dưới dạng:
yi = α 0 + α1ti + α 2ti2 + α 3ti3 + α 4ti4 + ε i
2
3
4
Mô hình hàm xu hướng: yt = b0 + b1t + b2t + b3t + b4t

Tính tổng bình phương các sai số:
n

SS =

∑ ei2 =
i =1

n

∑ ( yi − yti )2 =
i =1


n

∑  yi − (b0 + b1ti + b2ti2 + b3ti3 + b4ti4 ) 



2

i =1

Xác định các biến bk với (k = 0,1,2,3,4) sao cho hàm SS đạt cực tiểu:
Lấy đạo hàm của hàm SS theo các biến bk với (k = 0,1,2,3,4), ta được
n
∂SS
= −2∑ ( yi − b0 − b1ti − b2ti2 − b3ti3 − b4ti4 ) tik ;
∂bk
i =1

Hàm xu hướng dạng bậc 4:

(k = 0,1,2,3,4)

yt = b0 + b1t + b2t 2 + b3t 3 + b4t 4

Trong đó:
b0 =

a0 − c1b2 − c2b4
;
n


b1 =

a1 − c2b3
;
c1

b2 =

(na2 − a0c1 ) − (nc3 − c1c2 )b4
;
nc2 − c12

-13-


b3 =

a3c1 − a1c2
2 ;
c1c3 − c2

b4 =

(na4 − a0c2 )(nc2 − c12 ) − (nc3 − c1c2 )(na2 − a0 c1 )
2
(nc4 − c2 )(nc2 − c12 ) − (nc3 − c1c2 ) 2

n


ck = ∑ ti2 k


i =1
Với 
n
a =
∑ yitik
 k i =1


(k = 0,1,2,3,4)

yt = b0 + b1t + b2t 2 + b3t 3

Hàm xu hướng dạng bậc 3:
b0 =

a0 − c1b2
;
n

b1 =

a1 − c2b3
;
c1

b2 =


na2 − a0c1
;
nc2 − c12

b3 =

Trong đó:

a3c1 − a1c2
2
c1c3 − c2
yt = b0 + b1t + b2t 2

Hàm xu hướng dạng bậc 2:
b0 =

a0 − c1b2
;
n

b1 =

a1
;
c1

b2 =

Trong đó:


na2 − a0c1
nc2 − c12
yt = b0 + b1t

Hàm xu hướng dạng bậc 1:
n

Trong đó:

a
b0 = 0 =
n

∑y
i =1

i

;

n

-14-


n

a
b1 = 1 =
c1


∑yt

i i

i =1
n

∑t
i =1

2
i

 Hàm xu hướng dạng hàm mũ
Giả sử đường dữ liệu được biểu diễn dưới dạng:
yi = α 0 eα1ti + ε i
bt
Mơ hình hàm xu hướng: yt = b0 e
1

Lấy log hai vế hàm mữ ta được: lnyt = lnb0 +b1t
Áp dụng hàm xu hướng dạng đường thẳng ta được:
n

Trong đó:

∑ ln y

lnb0 =


n

i

i =1

hay

n

∑ ln yi
b0 = e

i =1

n

n

b1 =

∑ t ln y
i =1

i

n

i


∑t
i =1

2
i

 Hàm xu hướng dạng hàm Logarithmic
Giả xử đường dữ liệu được biểu diễn dưới dạng:
yi = α 0 + α1 ln ti + ε i

Mơ hình hàm xu hướng: yt = b0 + b1 ln t
Áp dụng hàm xu hướng dạng đường thẳng ta được:
yt = b0 + b1 ln t
n

Trong đó:

b0 = y − b1

∑ ln t
i =1

i

n

-15-

yt = b0 eb1t



n

b1 =

n

n

i =1

i =1

n∑ yi ln ti − ∑ yi ∑ ln ti
n

n∑ ( ln ti )
i =1

2

i =1



−  ∑ ln ti 
 i =1

n


2

 Hàm xu hướng dạng hàm luỹ thừa
Giả xử đường dữ liệu được biểu diênc dưới dạng:
yi = α 0tiα1 + ε1
1

Mơ hình hàm xu hướng: yt = b0t b

Áp dụng hàm xu hướng dạng đường thẳng ta được:
1

yt = b0t b
n

Trong đó:

lnb0 =

∑ ln y

i

i =1

n

n


− b1

n

b1 =

∑ ln t
i =1

i

hay
b0 = e

n

n









n

∑ ln yi
i =1


n



n

−b1

∑ ln ti 

i =1

n






n

n∑ ln yi ln ti − ∑ ln yi ∑ ln ti
i =1

i =1

n

n∑ ( ln ti )

i =1

2

i =1



−  ∑ ln ti 
 i =1

n

2

1.2.6.2. Mơ hình dự đốn lượng tăng (giảm) tuyệt đối trung bình
Phương pháp này thường được sử dụng khi hiện tượng biến động với một lượng tuyệt
đối hay tương đối đều nghĩa là các lượng tăng (giảm) tuyệt đối từng kì xấp xỉ nhau.
Cơng thức dự đơán:
ˆ
y n + L = y n + ∆ .L
ˆ
y n + L : Giá trị dự đoán ở thời điểm n + L
y n : Giá trị thực tế tại thời điểm n
n

∆ : Lượng tăng (giảm) tuyệt đối trung bình;

∆=


-16-

∑∆
i =2

i

n −1


L: Tầm xa dự đoán
1.2.6.3. Dự đoán dựa vào tốc độ phát triển trung bình.
Phương pháp này thường được sử dụng khi hiện tượng bất động với một nhịp độ tương
đối ổn định, nghĩa là tốc độ phát triển từng kỳ xấp xỉ nhau.
Cơng thức dự đốn:
L
ˆ
y n + L = y n. .( t )

ˆ
y n + L : Giá trị dự đoán ở thời điểm n + L
y n: : Giá trị thực tế tại thời điểm n
t : Tốc độ phát triển trung bình; t = n −1

xn
x1

L: Tầm xa dự đoán

-17-



CHƯƠNG 2
PHÂN TÍCH TÌNH HÌNH BIẾN ĐỘNG NĂNG SUẤT
LÚA VIỆT NAM GIAI ĐOẠN 1991 – 2005

2.1. Một số yếu tố ảnh hưởng đến sự biến động năng suất việt Nam giai đoạn
1991 – 2005.
Bảng 2.1. Sự biến động năng suất lúa bình quân cả năm giai đoạn 1991-2005
Năm

Sản lượng Phân

Sản lượng lúa

Năng suất lúa bình

Bón (kg/ha)

(nghìn tấn)

qn (tạ/ha)

1991

65.3

19621.9

3.113204


1992

70.5

21590.4

3.33427

1993

78.2

22836.5

3.481492

1994

89.9

23528.2

3.565635

1995

97.3

24963.7


3.689798

1996

102.2

26396.7

3.768911

1997

110.6

27523.9

3.876769

1998

118.9

29145.5

3.958534

1999

125.5


31393.8

4.101834

2000

127.8

32529.5

4.243181

2001

135.1

32108.4

4.285291

2002

140.8

34447.2

4.590328

2003


146.2

34568.8

4.638738

2004

153.3

36148.9

4.855264

2005

162.7
1724.3

35832.9
432636.3

4.88906
60.392309

Tổng

-18-



(Bảng số liệu được thu thập từ trang wed tổng cục thống kê www.gso.gov.vn)
Theo kết quả từ SPSS, ta có:
Descriptive Statistics
Nangsuat
Luongphanbon
Sanluong

Mean
4.0262
114.953
28842.420

Std. Deviation
.55244
30.4791
5490.2858

N
15
15
15

Correlations

Pearson Correlation

Sig. (1-tailed)

N


Luongph
anbon
.987
1.000
.990
.000
.
.000
15
15
15

Nangsuat
1.000
.987
.986
.
.000
.000
15
15
15

Nangsuat
Luongphanbon
Sanluong
Nangsuat
Luongphanbon
Sanluong

Nangsuat
Luongphanbon
Sanluong

Sanluong
.986
.990
1.000
.000
.000
.
15
15
15

Hệ số tương quan giữa Y (năng suất) và chính nó là 1. Như vậy Năng suất lúa với chính
nó có mối quan hệ rất chặt chẽ.
Hệ số tương quan giữa X1 (lượng phân bón) và Y là 0.987. Giá trị này cho thấy rằng
giữa năng suất và sản lượng phân bón có mối quan hệ chặt chẽ với nhau.
Hệ số tương quan giữa X2 (sản lượng lúa) và Y là 0.986. Giá trị này cũng cho ta thấy
rằng sản lượng lúa cả năm có mối quan hệ chặt chẽ với năng suất lúa trung bình cả năm.
b
Variables Entered/Removed

Model
1

Variables
Entered
Sanluong,

Luongpha
a
nbon

Variables
Removed

Method
.

a. All requested variables entered.
b. Dependent Variable: Nangsuat

-19-

Enter


b
Model Summary

Model
1

R
.989a

Adjusted
R Square
.975


R Square
.979

Std. Error of
the Estimate
.08711

a. Predictors: (Constant), Sanluong, Luongphanbon
b. Dependent Variable: Nangsuat

Ta thấy hệ số tương quan r = 0.989: tương quan giữa hai biến là trên mức trung bình (r =
98.9%), nghĩa là năng suất lúa bình quân sẽ tăng khi tăng lượng phân bón và sản lượng
lúa thu hoạch được.
Hệ số xác định R2: Chỉ riêng tăng lượng phân bón và sản lượng lúa thu hoạch sẽ làm
thay đổi 97.9% năng suất lúa (R2 = 0.979).

ANOVAb
Model
1

Regression
Residual
Total

Sum of
Squares
4.182
.091
4.273


df

Mean Square
2.091
.008

2
12
14

F
275.556

Sig.
.000a

a. Predictors: (Constant), Sanluong, Luongphanbon
b. Dependent Variable: Nangsuat

Kiểm định ở mức ý nghĩa 5% thì mơ hình hồi qui rất có ý nghĩa vì Sig.F= 0.00001 rất
nhỏ so với 5%, tức là sản lượng lúa thu hoạch và lượng phân bón ảnh hưởng đến năng
suất lúa trung bình.
Coefficientsa
Unstandardized
Coefficients
Model
1

(Constant)

Luongphan
bon
Sanluong

B
1.615

Std. Error
.263

.010

.005

4.236

Standardized
Coefficients
Beta

.000

95% Confidence
Interval for B
Lower
Upper
Bound
Bound
1.042
2.188


t
6.144

Sig.
.000

.571

1.943

.076

-.001

.022

.421

1.433

.177

.000

.000

a. Dependent Variable: Nangsuat

Phương trình hồi qui: y = 4.236X1 +0.1X2 +1.615

-20-


Y: Năng suất lúa bình quân cả năm (tấn/ha)
X1: Sản lượng phân bón (kg/ha)
X2: Sản lượng lúa cả năm (nghìn tấn)
Ý nghĩa của phương trình:
- Khi cố định X1 ( sản lượng phân bón) sản lượng lúa thu hoạch tăng 0.1 nghìn tấn. Ta
thấy sản lượng ảnh hưởng đến năng suất lúa bình quân cả năm
- Khi cố định X2 (sản lượng lúa) lượng phân bón tăng 4.236 kg/ha. Ta thấy lượng phân
bón ảnh hưởng tới năng suất lúa bình quân cả năm.
- Ngoài 2 nhân tố trên các nhân tố khác làm tăng năng suất lúa bình quân cả năm là
1.615 tấn/ha.
- Sai số chuẩn của lượng phân bón là 0.005
- Sai số chuẩn của sản lượng lúa là 0.0001
2.2. Phân tích dãy số thời gian và dự báo
2.2.1. Phân tích dãy số thời gian và bự báo năng suất lúa bình quân cả năm
Để xác định hàm số mô tả một cách gần đúng nhất biến động của hiện tượng được thể
hiện bằng đồ thị về hàm số xu hướng. Quan sát đồ thị ở dưới đồ thị có dạng hàm xu
hướng bậc 2, ta thấy năng suất lúa có hiện tượng tăng dần.
Hàm xu hướng bậc 2 có dạng:
yt = b2t2 + b1t + b0

yt: Giá trị dự đoán của hiện tượng ở thời điểm t
b0 , b1 , b2 : tham số
t : thời gian

Năm
1991
1992

1993
1994
1995
1996

Năng suất lúa (tấn/ha)
3.113204
3.33427
3.481492
3.565635
3.689798
3.768911
-21-


1997
1998
1999
2000
2001
2002
2003
2004
2005

Năm
1991
1992
1993
1994

1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
Tổng

y
3.1132
3.3343
3.4815
3.5656
3.6898
3.7689
3.8768
3.9585
4.1018
4.2432
4.2853
4.5903
4.6387
4.8553
4.8891
60.392


3.876769
3.958534
4.101834
4.243181
4.285291
4.590328
4.638738
4.855264
4.88906

t
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
0

yt

-21.79
-20.01
-17.41
-14.26
-11.07
-7.538
-3.877
0
4.1018
8.4864
12.856
18.361
23.194
29.132
34.223
34.402

t2
49
36
25
16
9
4
1
0
1
4
9
16

25
36
49
280

t3
-343
-216
-125
-64
-27
-8
-1
0
1
8
27
64
125
216
343
0

t4
2401
1296
625
256
81
16

1
0
1
16
81
256
625
1296
2401
9352

yt2
152.55
120.03
87.037
57.05
33.208
15.076
3.8768
0
4.1018
16.973
38.568
73.445
115.97
174.79
239.56
1132.2

Từ số liệu bảng trên ta có n = 15 và các tham số b0, b1, b2 được tính như sau:

b0 = 4.0039
b1 = 0.1229
b2 = 0.0012

Vậy hàm mô tả biến động năng suất lúa bình quân cả năm là:
y= 4.0039 + 0.1229t + 0.0012t2

-22-


NĂNG SUẤT LÚA
y = 0.0012t + 0.1229t + 4.0039
6
2

y(năng suất tấn/ha)

5
4

Năng suất lúa (tấn/ha)

3
Poly. (Năng suất lúa
(tấn/ha))

2
1
0
-7 -6


-5 -4 -3 -2

-1

0

1

2

3

4

5

6

7

t

Hàm số này có thể dự đốn được năng suất của những năm sắp tới. Ta có thể dự đốn
được năng suất bình quân vào những năm 2011, 2012, 2013, 2014, 2015 như sau:
Năm

Xu hướng phát triển Dựa vào tốc độ phát
triển trung bình


y= b0 + b1t + b2t2

()

yn + L = yn . t

Dựa vào lượng tăng
giảm tuyệt đối trung

L

bình yn + L = yn + ∆.L

2011

5.8044

5.9407

5.6501

2012

5.9597

6.1367

5.7770

2013


6.1174

6.3392

5.9038

2014

6.2775

6.5484

6.0307

2015

6.7645

6.7645

6.1575

2.2.2. Phân tích dãy số thời gian và dự báo cho lượng phân bón
Để xác định hàm số mơ tả một cách gần đúng nhất biến động của hiện tượng được thể hiện
bằng đồ thị về hàm số xu hướng. Quan sát đồ thị ở dưới ta thấy đồ thị có dạng hàm xu hướng
bậc 4 .
Hàm xu hướng bậc 3 có dạng:
yt = b3t3 + b2t2 + b1t + b0


Với yt: giá trị dự đốn của lượng phân bón
b0, b1, b2, b3, b4: hàm số
-23-


t: thời gian
Năm
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005

Lượng phân bón (kg/ha)
65.3
70.5
78.2
89.9
97.3
102.2

110.6
118.9
125.5
127.8
135.1
140.8
146.2
153.3
162.7

-24-


Năm
1991
1992
1993
1994
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
Tổng


t
-7
-6
-5
-4
-3
-2
-1
0
1
2
3
4
5
6
7
0

y
65.3
67.5
78.2
93.4
131.2
128.5
122.6
145.2
131.7
133.6

135.1
140.8
146.2
153.3
162.7
1835.3

yt
-457.1
-405
-391
-373.6
-393.6
-257
-122.6
0
131.7
267.2
405.3
563.2
731
919.8
1138.9
1757.2

t2
49
36
25
16

9
4
1
0
1
4
9
16
25
36
49
280

yt2
t3
3199.7 -343
2430 -216
1955 -125
1494.4 -64
1180.8 -27
514
-8
122.6
-1
0
0
131.7
1
534.4
8

1215.9 27
2252.8 64
3655 125
5518.8 216
7972.3 343
32177
0

t4
t5
t6
t7
t8
yt3
yt4
2401 -16807 117649 -823543 5764801 -22398 156785
1296 -7776 46656 -279936 1679616 -14580 87480
625 -3125 15625 -78125 390625 -9775 48875
256 -1024 4096 -16384 65536 -5978 23910.4
81
-243
729 -2187
6561
-3542 10627.2
16
-32
64
-128
256
-1028 2056

1
-1
1
-1
1
-122.6 122.6
0
0
0
0
0
0
0
1
1
1
1
1
131.7 131.7
16
32
64
128
256
1068.8 2137.6
81
243
729
2187
6561 3647.7 10943.1

256 1024 4096 16384 65536 9011.2 36044.8
625 3125 15625 78125 390625 18275 91375
1296 7776 46656 279936 1679616 33113 198677
2401 16807 117649 823543 5764801 55806 390643
9352
0 369640
0
15814792 63630 1059808

Từ số liệu trên ta có n = 15 và các tham số b0, b1, b2, b3, b4 được tính như sau:
b0 = 118.11
b1 = 6.3404
b2 = −0.3374
b3 = 0.0135
b4 = 0.005

Vậy ta được phương trình: yt = 118.11 + 6.3404t – 0.3374t2 + 0.0135t3+ 0.005t4

-25-


×