Tải bản đầy đủ (.doc) (23 trang)

các phương pháp và mô hình dự báo kinh tế - xã hội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.11 MB, 23 trang )

CÁC PHƯƠNG PHÁP VÀ MÔ HÌNH DỰ BÁO KINH TẾ-XÃ HỘI
Đề tài: Lấy ví dụ xây dựng mô hình dự báo bằng phương pháp xu thế.
I. Cơ sở lý thuyết.
1. Định nghĩa:
Xu thế là sự vận động tăng hoặc giảm của dữ liệu trong một thời gian dài.
Sự vận động này có thể được mô tả bằng một đường thằng hay đường cong
toán học.
Có thể mô hình hóa hàm xu thế bằng cách thực hiện một hàm hồi quy thích
hơpk với biến cần dự báo Y và thời gian T.
2. Các dạng hàm xu thế điển hình:
Y
t
= β
1
+ β
2
.T + U
t

Y
t
= β
1
+ β
2
.T + β
3
.T
2
+ U
t


Y
t
= β
1
+ β
2
.T + β
3
.T
2
+ β
4
.T
3
+ U
t
Y
t
= β
1
+ β
2
.ln(T) + U
t
Y
t
= e
β1 + β2.T + Ut

Y

t
= β
1
+ β
2
.(
1
T
) + U
t
ln(Y
t
) = β
1
+ β
2
.T + U
t
Dự báo điểm với hàn xu thế

1 2
ˆ ˆ
ˆ
t
Y T
β β
= +
2
1 2 3
ˆ ˆ ˆ

ˆ
t
Y T T
β β β
= + +
2 3
1 2 3 4
ˆ ˆ ˆ ˆ
ˆ
t
Y T T T
β β β β
= + + +
( )
1 2
ˆ ˆ
ˆ
ln
t
Y T
β β
= +

1 2
1
ˆ ˆ
ˆ
ln
t
Y

T
β β
 
= +
 ÷
 
( )
2 2
2
1
ˆ ˆ
ˆ ˆ
ˆ
ln
2 2
ˆ
t
T Y
t
Y e e
σ σ
β β
+ + +
= =

( )
1 2
ˆ ˆ
ˆ
ln

t
Y T
β β
= +
Để biết được xu thế trong dữ liệu sẽ tuân theo dạng hàm nào cách đơn giản
nhất là vẽ đồ thị của biến phụ thuộc Y sau đó nhận dạng đồ thị của hàm số
tương ứng với dạng hàm toán học nào. Có khi bằng đồ thị ta chưa phân biệt
được dữ liệu có xu thế với dạng hàm nào, khi đó ra phải ước lượng một số
mô hình mà mình cho răng có thể phù hợp. Sau đó kiểm định so sánh các chỉ
tiêu thống kê để chọn ra mô hình phù hợp nhất.
II. Các ví dụ cho mô hình dự báo xu thế và các bước thực hiện với
phần mềm Eview.
Ví dụ 1: Dự báo tổng sản phẩm quốc nội (GDP) từ những số liệu thu thập
được từ năm 1990 đến năm 2010.
Năm Tổng sản phẩm quốc nội
Tỷ Đồng
1990 131968
1991 139634
1992 151782
1993 164043
1994 178534
1995 195567
1996 213833
1997 231264
1998 244596
1999 256272
2000 273666
2001 292535
2002 313247
2003 336242

2004 362435
2005 393031
2006 425373
2007 461344
2008 490458
2009 516568
Số liệu lấy từ Tổng Cực Thống Kê Việt Nam 2010
Ví Dụ 2: Xây dựng mô hình dự báo số lượng người lao động Mỹ năm 2010
theo phương pháp xu thế.
Năm Đội ngũ lao động là công dân Mỹ
(nghìn người)
1990 125840
1991 126343
1992 128105
1993 129200
1994 131056
1995 132304
1996 133943
1997 136297
1998 137673
1999 139368
2000 142583
2001 143734
2002 144863
2003 146510
2004 147401
2005 149320
2006 151428
2007 153124
2008 154287

2009 154142
Số liệu lấy từ Cục Tống Kê Nhân Lực Mỹ.
Ví dụ 3: Xây dựng mô hình dự báo Tổng vốn đầu tư nước ngoài vào Việt
Nam theo phương pháp xu thế.
Năm Tổng Vốn Đầu Tư Nước Ngoài Được
Thực Hiện
(Triệu USD)
1990 187
1991 328
1992 574
1993 1017
1994 2040
1995 2556
1996 2714
1997 3115
1998 2367
1999 2334
2000 2413
2001 2450
2002 2591
2003 2650
2004 2852
2005 3308
2006 4100
2007 8030
2008 11500
2009 10000
Lời nói đầu:
- Trong bài chuận bị của nhóm 5 sẽ giới thiệu 1 phương pháp khác nhập dữ
liệu cho eview thay vì cách nhập dữ liệu sử dụng Empty Group (Edit Series).

Phương pháp đó là Mở Dữ Liệu Ngoại Lai (Files\Open\Open a Foreign as
Workfile) - ở đây là Microsoft Exel 2003.
Quá trình chuẩn bị phần mềm cùng thiết bị.
- Phiên bản Eview được sử dụng là 5.1 đã được mua bản quyền.
- File dữ liệu exel chứa nội dung của 3 bảng.
Bước 1: Nhập và tinh chỉnh số liệu.
- Vì sử dụng phương pháp Open a Foreign as Workfile nên việc nhập dữ liệu
trở lên rất nhanh chóng và đơn giản, nhóm chúng tôi quyết định cùng 1 lúc
nhập toàn bộ số liệu cho 3 bảng.
- Trong giao diện ban đầu của Eview 5.1 Chọn Files\Open\Open a Foreign
as Workfile…
Hộp thoại Open hiện ra, tìm đến file số liệu dạng exel đã chuẩn bị sẵn chọn
Open.
Lúc này Eview sẽ tự động tìm kiếm tên biến, dạng số liệu của biến, tần suất.
Cửa sổ SpreadSheet Read Step 1 hiện ra
- Lựa chọn đầu tiên được mặc định là tự động duyệt toàn bộ trang Exel.
- Custom Range: Tùy biến khoảng duyệt - đưa ra các tùy chọn điểm bắt đầu
và kết thúc duyệt, số lượng ô dữ liệu được đưa vào.
Vì bảng dữ liệu trong exel đã được nhập đúng cách nên không cần phải chọn
chế độ custom range nữa mà chúng ta chọn Next luôn.
Trong bước 2:
- Mục Column headers dùng để tinh chỉnh độ dài của tên cột. Trong ví dụ
này trước các số liệu có 2 đầu đề là Tên biến và Đơn vị. Chính vì vậy số trog
Header Lines là 2.
- Chính vì khả năng rất cao tên biến quá dài không phù hợp cho sử dụng
trong eview lên chúng ta nhấp chuột để chọn các biến như Nam, GDP …
Tương ứng với đó ta có thể thay đổi tên biến, cũng như thêm các đoạn miêu
tả trong Column Info và Description.
Sau khi tinh chỉnh tên biến xong nhấn Finish.
+ Ta được Workfile mới như sau.

Chú Ý: Eview tự động lấy 1 biến có tần số giống với tần số trong bộ nhớ để
làm biến quan sát – OBS. Trong trường hợp này là biến Nam, tần số là
Annual – Năm.
+ Tinh Chỉnh số liệu: Thêm xóa thay đổi cấu trục dữ liệu sao cho phù hợp
với yêu cầu.
Như trong hình trên chúng ta thấy thiếu 1 quan sát năm 2010 để dự báo. Vậy
để thêm 1 quan sát là năm 2010 thì phải làm thế nào?
Có 2 cách nhưng nhanh nhất vẫn là nháy đúp chuột vào chữ Range trong cửa
sổ Workfile.
Cửa sổ Workfile structure hiện ra chúng ta giờ có thể điều chỉnh Loại, dạng
tần số của dữ liệu. Khởi Đầu và kết thúc các quan sát. Như ở trên chúng ta
thay đổi End Date từ 2009 thành 2010.
Bước 2: Vẽ biểu đồ cho từng biến.
Cách làm tương tự như nhau nên nhóm chúng tôi làm 1 lần.
Trên thanh công cụ chọn Quick\Graph\ Sau đó nhận vào dạng biểu đồ mà
bạn muốn, để dễ cho việc nhận diện dạng đồ thị nhóm chúng tôi chọn biểu
đồ đường – Line Graph.
Cửa sổ Series List hiện ra chúng ta muốn vẽ biến nào và số lượng ra sao tùy
theo yêu cầu. Trong các ví dụ này FDI, GDP, LF không liên quan đến nhau
và đơn vị khác nhau nên chúng ta lập đồ thị riêng.
Sau khi nhập tên biến xong nhấn OK và chúng ta được đồ thị.
Bước3: Xác định dạng đồ thị và tiến hành dự báo thông qua phương
pháp xu thế.
- Để biết xu thế của dữ liệu sẽ tuân theo dạng hàm nào,cách đơn giản nhất là
vẽ đồ thị của biến phụ thuộc sau đó nhận dạng đồ thị. Nhưng có một số
trường hợp như với biến FDI, đồ thị như trên ta khó có thể phân biệt được
dữ liệu có xu thế tương ứng với dạng hàm nào. Do đó, ta cần phải ước lượng
một số mô hình mà mình cho rằng có thể phù hợp. Sau đó, cần kiểm định, so
sánh các chỉ tiêu thống kê để tìm ra mô hình phù hợp nhất.

1. Tạo biến xu thế.
Cách 1:
Chọn Quick/Generate Series để tạo biến mới.
Ta gõ t=@trend(1989) với
T là tên biến.
= là thao tác gán.
@trend() là hàm xu thế
1989 là thời điểm bắt đầu chuỗi xu thế.
Nhấn Ok ta được bảng giá trị của t như sau.
Cách 2:
Gõ vào cửa sổ chính là Eview.
Genr t = @trend(1989)
Trên cửa sổ Workfile hiện hành sẽ xuất hiện thêm biến xu thế t.
2. Dự báo biến phụ thuộc FDI.
2 hàm tương ứng là:
Hàm bậc 3
Hàm Ln
Ta vào Quick\Equation Estimation…
a. Hàm bậc 3.
Phương pháp dự báo là LS – Bình Phương Nhỏ Nhất.
Xét các quan sát: 1990 – 2010.
Ta được kết quả.
Dependent Variable: FDI
Method: Least Squares
Date: 11/14/10 Time: 17:24
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C -2176.476 1067.477 -2.038898 0.0583
T 1699.831 429.5131 3.957577 0.0011

T^2 -201.5634 46.92326 -4.295596 0.0006
T^3 7.532379 1.471111 5.120198 0.0001
R-squared 0.911779 Mean dependent var 3356.300
Adjusted R-squared 0.895238 S.D. dependent var 3019.270
S.E. of regression 977.2457 Akaike info criterion 16.78421
Sum squared resid 15280148 Schwarz criterion 16.98336
Log likelihood -163.8421 F-statistic 55.12118
Durbin-Watson stat 1.735690 Prob(F-statistic) 0.000000

b. Hàm bậc 2.
Làm tương tự trong ô Equation Spectification: fdi c t t^2
Dependent Variable: FDI
Method: Least Squares
Date: 11/14/10 Time: 17:14
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 1825.477 1145.730 1.593287 0.1295
T -342.1967 251.2764 -1.361834 0.1910
T^2 35.70654 11.62271 3.072136 0.0069
R-squared 0.767228 Mean dependent var 3356.300
Adjusted R-squared 0.739843 S.D. dependent var 3019.270
S.E. of regression 1539.998 Akaike info criterion 17.65443
Sum squared resid 40317078 Schwarz criterion 17.80379
Log likelihood -173.5443 F-statistic 28.01635
Durbin-Watson stat 0.646872 Prob(F-statistic) 0.000004
c. Hàm Ln
Làm tương tự trong ô Equation Spectification: log(fdi) c t
Dependent Variable: LOG(FDI)
Method: Least Squares

Date: 11/14/10 Time: 17:19
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 6.153335 0.239510 25.69137 0.0000
T 0.149719 0.019994 7.488246 0.0000
R-squared 0.756999 Mean dependent var 7.725387
Adjusted R-squared 0.743499 S.D. dependent var 1.018037
S.E. of regression 0.515594 Akaike info criterion 1.607647
Sum squared resid 4.785075 Schwarz criterion 1.707220
Log likelihood -14.07647 F-statistic 56.07382
Durbin-Watson stat 0.314070 Prob(F-statistic) 0.000001
d. So sánh các hàm số xác định hàm phù hợp nhất.
Xét giá trị R-squared: chọn mô hình nào có R-squared lớn nhất
Hàm bậc ba có R-squared là 0.911779
Hàm bậc hai có R-squared là 0.767228
Hàm loganêpe có R-squared là 0.756999
Vậy hàm bậc 3 phù hợp nhất, từ bảng kết quả của hàm bậc 3 ta chọn
Forecast
Cửa sổ Forecast hiện ra, tat hay đổi tên chuỗi giá trị dự báo là fdif.
Trong đó
Root Mean Squared Error: Sai số bình phương trung bình
Mean Absolute Error: Sai số tuyệt đối trung bình
Mean Abs.Percent Error: Phần trăm sai số tuyệt đối trung bình
Các sai số này khá nhỏ.
Tương tự với hàm bậc hai và Loganêpe
Theo so sánh các sai số ta thấy Hàm bậc 3 là phù hợp nhất. Ta tìm đến chuỗi
số dự báo FDIF để tham chiếu giá trị năm 2010.
FDI năm 2010 được dự báo sẽ là: 14387.56 (Triệu USD)
3. Dự báo biến phụ thuộc GDP.

Làm tương tự như với FDI.
Xét 2 hàm
Hàm bậc nhất.
Hàm bậc 2.
Tương ứng với.
Dependent Variable: GDP
Method: Least Squares
Date: 11/14/10 Time: 17:58
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 78608.58 9972.327 7.882672 0.0000
T 20001.05 832.4738 24.02604 0.0000
R-squared 0.969761 Mean dependent var 288619.6
Adjusted R-squared 0.968081 S.D. dependent var 120158.5
S.E. of regression 21467.50 Akaike info criterion 22.88111
Sum squared resid 8.30E+09 Schwarz criterion 22.98068
Log likelihood -226.8111 F-statistic 577.2507
Durbin-Watson stat 0.136479 Prob(F-statistic) 0.000000
Hàm bậc 2
Dependent Variable: GDP
Method: Least Squares
Date: 11/14/10 Time: 18:00
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 129422.9 4599.200 28.14032 0.0000
T 6142.588 1008.676 6.089755 0.0000
T^2 659.9267 46.65597 14.14453 0.0000
R-squared 0.997632 Mean dependent var 288619.6

Adjusted R-squared 0.997353 S.D. dependent var 120158.5
S.E. of regression 6181.872 Akaike info criterion 20.43411
Sum squared resid 6.50E+08 Schwarz criterion 20.58347
Log likelihood -201.3411 F-statistic 3580.659
Durbin-Watson stat 0.374140 Prob(F-statistic) 0.000000
Qua so sánh các sai số ta thấy hàm bậc 2 phù hợp hơn.
Kết quả dự báo GDP cho năm 2010 là: 549444.98 (Tỷ Đồng)
4. Dự Báo Biến Phụ Thuộc LF
Làm tương tự FDI với các hàm
Hàm Bậc Nhất.
Hàm bậc hai.
Hàm loganêpe
Hàm Bậc nhất.
Dependent Variable: LF
Method: Least Squares
Date: 11/14/10 Time: 18:04
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 123276.0 332.7460 370.4808 0.0000
T 1628.578 27.77710 58.63025 0.0000
R-squared 0.994791 Mean dependent var 140376.1
Adjusted R-squared 0.994502 S.D. dependent var 9659.991
S.E. of regression 716.3045 Akaike info criterion 16.08073
Sum squared resid 9235659. Schwarz criterion 16.18030
Log likelihood -158.8073 F-statistic 3437.506
Durbin-Watson stat 1.037325 Prob(F-statistic) 0.000000
Hàm bậc 2
Dependent Variable: LF
Method: Least Squares

Date: 11/14/10 Time: 18:05
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 122887.1 534.9091 229.7346 0.0000
T 1734.634 117.3138 14.78627 0.0000
T^2 -5.050296 5.426314 -0.930705 0.3650
R-squared 0.995043 Mean dependent var 140376.1
Adjusted R-squared 0.994460 S.D. dependent var 9659.991
S.E. of regression 718.9815 Akaike info criterion 16.13103
Sum squared resid 8787884. Schwarz criterion 16.28039
Log likelihood -158.3103 F-statistic 1706.411
Durbin-Watson stat 1.079095 Prob(F-statistic) 0.000000
Hàm Loganepe
Dependent Variable: LOG(LF)
Method: Least Squares
Date: 11/14/10 Time: 18:06
Sample (adjusted): 1990 2009
Included observations: 20 after adjustments
Variable Coefficiet Std. Error t-Statistic Prob.
C 11.72758 0.002670 4391.652 0.0000
T 0.011641 0.000223 52.22189 0.0000
R-squared 0.993443 Mean dependent var 11.84982
Adjusted R-squared 0.993079 S.D. dependent var 0.069099
S.E. of regression 0.005749 Akaike info criterion -7.385066
Sum squared resid 0.000595 Schwarz criterion -7.285492
Log likelihood 75.85066 F-statistic 2727.126
Durbin-Watson stat 0.819484 Prob(F-statistic) 0.000000
Như vậy hàm bậc 2 là phù hợp nhất.
Lực lượng lao động mỹ năm 2010 được dự báo sẽ là: 158269.39 (Nghìn

người)

×