TỔNG CỤC THỐNG KÊ
VIỆN KHOA HỌC THỐNG KÊ
BÁO CÁO CHUYÊN ĐỀ:
PHƢƠNG PHÁP DỰ BÁO THU NHẬP HỘ GIA
ĐÌNH VÀ CHỈ SỐ GIÁ TIÊU DÙNG
Thuộc đề tài: Nghiên cứu ứng dụng các phƣơng
pháp dự báo để dự báo một số chỉ tiêu thống kê xã
hội chủ yếu ở Việt nam
Người biên sọan:
Lê Văn Dụy
Nguyễn Thị Thu Huyền
HÀ NỘI, 11/ 2009
2
MỞ ĐỀ
Nâng cao mức sống của dân cƣ là một mục tiêu rất cơ bản của mọi quốc
gia. Dân có giàu, nƣớc mới mạnh, mặt khác, đời sống vật chất lên cao kéo theo
đời sống tinh thần cũng đi lên. Ở nhiều nƣớc trên thế giới, do mức thu nhập cao
nên ngƣời dân ấm no và hạnh phúc, nhà cửa khang trang, ăn mặc chỉnh tề, vui
chơi giải trí trở thành một nhu cầu thiết yếu của đời sống bên cạnh việc tham gia
tích cực trong sản xuất kinh doanh của toàn xã hội. Ở các nƣớc có mức thu nhập
cao, ngƣời lao động không còn lo đến việc ăn ở mà chi lo tích lũy chút tiền để
đến kỳ nghỉ đi du lịch sang các nƣớc khác. Ở nƣớc ta, mức thu nhập của ngƣời
dân còn thấp, vì vậy nâng cao mức thu nhập của các hộ gia đình trở thành một
nhiệm vụ lớn của Đảng và Nhà nƣớc. Với lý do này chỉ tiêu thống kê “mức thu
nhập bình quân một hộ” trở thành một chỉ tiêu thống kê quan trọng cần đƣợc
theo dõi thƣờng xuyên. Vì vậy, cứ hai năm một lần chúng ta tổ chức một cuộc
điều tra khảo sát mức sống hộ gia đình. Tuy nhiên, bên cạnh nhu cầu thông tin
phản ánh tình hình thu nhập thực tế của các hộ gia đình, cần có các thông tin dự
báo, bởi có nhƣ vậy mới biết khả năng sắp tới thu nhập của các hộ gia đình nhƣ
thế nào để từ đó có những biện pháp thúc đẩy mức thu nhập của ngƣời dân lên
cao. Hơn thế nữa, dù thu nhập bình quân đầu ngƣời tăng, song chỉ số giá tiêu
dung cũng tăng thì chƣa chắc đời sống của ngƣời dân đƣợc nâng lên. Ngƣợc lại,
nếu tốc độ tăng của chỉ số giá tiêu dung cao hơn so với tốc độ tăng của thu nhập
bình quân một đầu ngƣời thì mức sống của ngƣời dân còn có thể bị giảm. Vì
vậy, trong Chuyên đề này trình bày các phƣơng pháp dự báo mức thu nhập bình
quân của các hộ gia đình và chỉ số giá tiêu dùng.
3
I. KHÁI NIỆM VÀ ĐỊNH NGHĨA
1.1. Định nghĩa tổng thu nhập quốc gia (Gross National Income-GNI)
Chỉ tiêu kinh tế tổng hợp phản ánh tổng thu nhập lần đầu đƣợc tạo ra từ
các yếu tố thuộc sở hữu của quốc gia tham gia vào hoạt động sản xuất trên lãnh
thổ quốc gia hay ở nƣớc ngoài trong một thời kỳ nhất định, thƣờng là một năm.
Tổng thu nhập quốc gia phản ánh thu nhập đƣợc tạo ra từ các yếu tố tham
gia vào quá trình sản xuất thuộc sở hữu của quốc gia, tổng thu nhập quốc gia
bằng tổng sản phẩm trong nước (GDP) cộng với chênh lệch giữa thu nhập của
người lao động Việt Nam ở nước ngoài gửi về và thu nhập của người nước
ngoài ở Việt Nam gửi ra nước ngoài cộng với chênh lệch giữa thu nhập sở hữu
nhận được từ nước ngoài với thu nhập sở hữu trả nước ngoài.
1.2. Thu nhập quốc gia thuần (Net national income - NNI)
Chỉ tiêu kinh tế tổng hợp phản ánh phần còn lại của tổng thu nhập quốc
gia sau khi trừ đi khấu hao tài sản cố định dùng trong sản xuất của toàn bộ nền
kinh tế trong một thời kỳ nhất định. Dƣới dạng công thức, thu nhập quốc gia
thuần đƣợc tính nhƣ sau:
NNI = GNI - Khấu hao tài sản cố định dùng trong sản xuất.
1.3. Định nghĩa thu nhập của hộ gia đình
Thu nhập của hộ là toàn bộ số tiền và giá trị hiện vật sau khi trừ chi phí
sản xuất mà hộ và các thành viên của hộ nhận đƣơc trong một thời gian nhất
định, thƣờng là 1 năm. Thu nhập của hộ gia đình bao gồm:
- Thu từ tiền công, tiền lƣơng;
- Thu nhập từ sản xuất nông, lâm nghiệp, thuỷ sản(sau khi đã trừ chi phí
sản xuất);
- Thu nhập từ sản xuất các ngành nghề phi nông, lâm nghiệp, thuỷ sản (
sau khi đã trừ chi phí sản xuất);
4
- Thu khác đƣợc tính vào thu nhập, nhƣ quà biếu, mừmg giúp, lãi tiết
kiệm…
Lƣu ý: cần phân biệt các khoản thu khác đƣợc tính vào thu nhập và không
đƣợc tính vào thu nhập của hộ gia đình trong năm. Các khoản thu khác không
tính vào thu nhập gồm rút tiền tiết kiệm, thu nợ, bán tài sản, vay nợ, tạm ứng và
các khoản chuyển nhƣợng vốn nhận đƣợc do liên doanh, liên kết trong sản xuất
kinh doanh …
1.4. Định nghĩa thu nhập của hộ gia đình bình quân 1 tháng
Đƣợc tính bằng cách lấy tổng thu nhâp của hộ trong năm chia cho 12
tháng.
Công thức tính
Thu nhập của hộ gia
đình bình quân 1 tháng
=
Tổng thu nhập trong năm của hộ
12 tháng
Thu nhập của hộ gia đình bình quân một tháng còn có thể đƣợc tính một
cách gián tiếp bằng cách lấy thu nhập quốc gia thuần trong năm chia cho tổng số
hộ bình quân của năm sau đó chia cho 12 tháng. Giữa phƣơng pháp tính trực tiếp
và gián tiếp này có thể cho các kết quả khác nhau do vậy số liệu ở các năm cần
đƣợc tính theo một phƣơng pháp thống nhất. Trong thực tế khi thiếu cơ sở số
liệu để tính theo công thức trên có thể sử dụng chỉ tiêu tổng sản phẩm trong
nƣớc (GDP) để thay thế cho thu nhập quốc gia thuần.
II. CÁC PHƢƠNG PHÁP DỰ BÁO THU NHẬP HỘ GIA ĐÌNH
Để dự báo thu nhập hộ gia đình thƣờng ngƣời ta sử dụng một trong hai
phƣơng pháp, đó là dự báo theo dãy số thời gian hoặc dự báo theo phƣơng pháp
tƣơng quan hồi quy đa nhân tố. Mỗi một phƣơng pháp có một ƣu điểm riêng.
Phƣơng pháp dãy số thời gian đơn giản, dễ làm đặc biệt là trong bối cảnh ngày
5
nay đã có nhiều chƣơng trình phân tích thống kê mạnh nhƣ SPSS, STATA,
SAS,… Phƣơng pháp tƣơng quan hồi quy đa nhân tố đòi hỏi phải tiến hành
nhiều bƣớc và nhiều thông tin khác nhau, song lại có ƣu điểm lớn là dễ cho kết
quả sát thực, đồng thời lại cho phép biết đƣợc các nhân tố cũng nhƣ mức độ tác
động của chúng tới thu nhập của các hộ gia đình.
2.1. Dự báo số thu nhập của các hộ gia đình theo phƣơng pháp dãy số
thời gian
Để dự báo thu nhập của các hộ gia đình bằng phƣơng pháp dãy số thời
gian cần thực hiện các bƣớc sau:
+ Thu thập thông tin về chỉ tiêu này theo thời gian với thời kỳ thống nhất
(thƣờng là theo năm). Các số liệu này cũng phải đồng nhất về mặt phạm vi và
đơn vị tính, có nhƣ vậy chúng mới phản ánh đúng xu thế phát triển của chỉ tiêu.
+ Xác định một phƣơng trình toán học (mô hình) có thể mô tả tốt nhất
quy luật phát triển của thu nhập của các hộ gia đình theo thời gian để sử dụng nó
cho công tác dự đoán.
+ Ƣớc lƣợng các tham số của mô hình để tiến hành dự đoán. Thông
thƣờng các tham số của mô hình đƣợc ƣớc lƣợng dựa vào phƣơng pháp bình
phƣơng nhỏ nhất.
Nhƣ đã trình bày, dự báo thu nhập của các hộ gia đình theo dãy số thời
gian có các ƣu điểm sau:
Thứ nhất, nó đơn giản, dễ làm;
Thứ hai, nhanh chóng cho ra các kết quả dự báo cần thiết.
Tuy nhiên, nó có các nhƣợc điểm sau đây:
6
Thứ nhất, khó thu thập đƣợc thông tin cho một dãy số liệu dài. Mặt khác,
các thông tin có đƣợc thƣờng mức độ sát thực thấp và số liệu giữa các thời kỳ
thƣờng có phạm vi không đồng nhất do vậy kết quả dự báo thu đƣợc cũng có
mức độ sát thực thấp. Để khắc phục tình trạng này trƣớc khi tiến hành xây dựng
mô hình dự báo cần đánh giá và hiệu chỉnh số liệu nếu thấy cần thiết.
Thứ hai, thông tin dự báo thu đƣợc thƣờng chỉ là một con số tổng hợp mà
không cho biết các thông tin chi tiết nên tác dụng của dự báo cũng bị hạn chế
theo.
Thí dụ, dựa vào dãy số liệu thống kê về thu nhập bình quân một ngƣời
(CI) trong giai đọan 1990-2006. Ta tiến hành dự báo bằng phƣơng pháp dãy số
thời gian cho các năm 2007, 2008 và 2009.
Bảng 1: Thu nhập bình quân một người giai đọan 1990-2006 (triệu đồng)
Năm
CI
CI'
1990
2.00
2.00
1991
2.08
2.12
1992
2.22
2.25
1993
2.36
2.38
1994
2.52
2.52
1995
2.72
2.68
1996
2.92
2.84
1997
3.11
3.01
1998
3.24
3.19
1999
3.35
3.38
2000
3.53
3.58
2001
3.72
3.78
2002
3.93
4.00
2003
4.16
4.22
2004
4.42
4.46
2005
4.73
4.70
2006
5.05
4.95
2007
.
5.21
2008
.
5.48
2009
.
5.76
Thu nhập 1 ngƣời bq giai đoạn
3.30
CI’ là số ước lượng được từ mô hình
7
2
0045.01034.08944.1' ttCI
t
996.0R
;
993.0
2
R
Sai số tuyệt đối bình quân bằng 0,055 đơn vị; sai số tương
đối bằng 1,67%.
Hình 1:
Thu nhap bq dau nguoi
Sequence
20100
5.5
5.0
4.5
4.0
3.5
3.0
2.5
2.0
1.5
Observed
Quadratic
Sử dụng chƣơng trình SPSS đã xác định đƣợc hàm số bậc hai mô tả tốt
nhất quy luật phát triển theo thời gian của chỉ tiêu thu nhập bình quân một
ngƣời. Điều này thể hiện rất rõ thông qua hệ số tƣơng quan R và hệ số mô tả R
2
ƣớc lƣợng đƣợc. Hệ số tƣơng quan thu đƣợc bằng
996.0R
. Kết qủa này cho
thấy giữa chỉ tiêu thu nhập bình quân một ngƣời và biến thời gian có mối quan
hệ rất chặt. Hệ số mô tả thu đƣơc:
993.0
2
R
. Điều này cho thấy biến thời gian
mô tả đƣợc tới 99,3% sự biến động của chỉ tiêu thu nhập bình quân một ngƣời.
Hơn thế nữa, sai số dự báo tuyệt đối và tƣơng đối đều ở mức độ thấp (các con số
tƣơng ứng là 0,055 đơn vị tính và 1,67%). Nhƣ vậy, ta có thể kết luận là hàm số
8
bậc hai phù hợp với việc mô tả sự biến động theo thời gian của chỉ tiêu thu nhập
bình quân một ngƣời và có thể yên tâm sử dụng nó để dự báo.
Theo kết quả tính toán, thu nhập bình quân một ngƣời của các năm 2007,
2008 và 2009 tƣơng ứng sẽ là 5,21 triệu , 5,48 triệu và 5,76 triệu đồng. Với mức
độ tin cậy là 95%, thu nhập bình quân một ngƣời của các năm này sẽ nằm trong
các khoảng sau: năm 2007- (5,11;5,32); năm 2008- (5,38;5,59); và năm 2009-
(5,66;5,87).
2.2. Dự báo thu nhập bình quân của hộ gia đình theo phƣơng pháp
kết hợp
Đây là phƣơng pháp kết hợp giữa dự báo cho hai nhóm chỉ tiêu khác nhau
để dự báo cho một chỉ tiêu. Phƣơng pháp này có ƣu điểm là cho phép tận dụng
hai nguồn số liệu khác nhau để dự báo. Mặt khác, về mặt phƣơng pháp luận nó
cho phép tận dụng riêng rẽ quy luật phát triển của hai chỉ tiêu từ đó tránh đƣợc
sự nhần lẫn trong việc phát hiện quy luật của một hiện tƣợng bị hai hiện tƣợng
chi phối. Hơn thế nữa, phƣơng pháp này còn cho phép áp dụng các phƣơng pháp
dự báo khác nhau cho từng chỉ tiêu.
Bên cạnh ƣu điểm trên, dự báo theo phƣơng pháp kết hợp cũng có một
hạn chế là nó chịu sai số của hai chỉ tiêu nên sai số dự báo có thể lớn hơn so với
của phƣơng pháp không kết hợp. Tuy nhiên, kết quả dự báo cho chỉ tiêu thu
nhập bình quân đầu ngƣời sử dụng phƣơng pháp kết hợp đƣợc trình bày dƣới
đây sẽ cho thấy trong chừng mực nhất định vẫn có thể sử dụng phƣơng pháp kết
hợp để dự báo.
Bảng 2 trình bày kết quả dự báo chỉ tiêu thu nhập bình quân một ngƣời
dựa vào phƣơng pháp kết hợp: tiến hành dự báo riêng rẽ cho chỉ tiêu GDP và
tổng số dân (POP) sau đó kết hợp với nhau để dự báo cho chỉ tiêu thu nhập bình
quân một ngƣời.
9
Bảng 2: Dự báo thu nhập bình quân đầu ngƣời thông qua dự báo hai
chỉ tiêu GDP và dân số
GDP (ng tỷ đ)
POP (000)
GDP'
POP'
Thu nhap bq 1 ng
A
(1)
(2)
(3)
(4)
(5)
1990
131968
66017
133206
66046
2.02
1991
139634
67242
142805
67253
2.12
1992
151782
68450
153484
68450
2.24
1993
164043
69645
165242
69637
2.37
1994
178534
70825
178079
70814
2.51
1995
195567
71996
191994
71979
2.67
1996
213833
73157
206989
73135
2.83
1997
231264
74307
223063
74280
3.00
1998
244596
75456
240216
75415
3.19
1999
256272
76597
258447
76539
3.38
2000
273666
77635
277758
77653
3.58
2001
292535
78686
298148
78757
3.79
2002
313247
79727
319617
79850
4.00
2003
336242
80902
342165
80933
4.23
2004
362435
82032
365792
82005
4.46
2005
393031
83106
390497
83068
4.70
2006
425135
84156
416282
84119
4.95
2007
.
.
443146
85160
5.20
2008
.
.
471089
86191
5.47
2009
.
.
500111
87212
5.73
Nguồn số liệu: Tổng cục Thống kê, Niên giám thống kê các năm
Cột (1) và (2) của bảng 2 trình bày số liệu thực tế của hai chỉ tiêu GDP và
dân số trung bình trong giai đoạn 1990-2006. Cột (3) và (4) trình bày giá trị của
hai chỉ tiêu này đƣợc ƣớc lƣợng dựa vào mô hình dự báo. Kết quả của các năm
2007, 2008 và 2009 là kết quả dự báo cho hai chỉ tiêu đó. Cột (5) là giá trị của
chỉ tiêu thu nhập bình quân một đầu ngƣời đƣợc tính dựa vào giá trị đƣợc tính từ
mô hình dự báo của hai chỉ tiêu GDP và dân số. Giá trị của chỉ tiêu này ở các
năm 2007, 2008 và 2009 cũng là các giá trị dự báo.
So sánh giá trị dự báo của chỉ tiêu thu nhập bình quân đầu ngƣời bằng
phƣơng pháp trực tiếp và phƣơng pháp kết hợp thấy không khác nhau là mấy.
10
Bảng 3: Kết quả dự báo chỉ tiêu thu nhập bình quân đầu ngƣời bằng hai phƣơng
pháp
Dự báo bằng phƣơng
pháp trực tiếp
Dự báo bằng phƣơng
pháp kết hợp
Độ lệch giữa hai phƣơng
pháp
2007
5.21
5.20
0.010
2008
5.48
5.47
0.010
2009
5.76
5.73
0.030
Hình2: Đồ thị GDP và dân số (POP)
GDP
Sequence
3020100
600000
500000
400000
300000
200000
100000
Observed
Quadratic
population
Sequence
3020100
90000
80000
70000
60000
Observed
Quadratic
11
2.3. Phƣơng pháp tƣơng quan hồi quy đa nhân tố
Ở phƣơng pháp này trƣớc tiên xác định mối quan hệ giữa thu nhập của
các hộ (đƣợc coi là biến phụ thuộc) với các yếu tố kinh tế xã hội khác nhau
(đƣợc coi là các biến độc lập) có liên quan đến thu nhập của các hộ ví dụ nhƣ
tuổi tác của chủ hộ, số ngƣời trong hộ, giới tính, dân tộc,…Sau khi xác định
đƣợc các yếu tố có ảnh hƣởng tới số năm đi học, tiến hành thu thập thông tin của
các yếu tố này tính tóan ma trận hệ số tƣơng quan để tiến hành lựa chọn các yếu
tố đƣa vào mô hình dự báo. Thông thƣờng, do tầm dự báo ngắn và do lôga của
các biến có hình dạng là đƣờng cong sẽ trở thành đƣờng thẳng hoặc xấp xỉ
thẳng, nên hàm tuyến tính đa biến đƣợc chọn làm mô hình dự báo. Tức là mô
hình dạng sau đây đƣợc sử dụng để dự báo:
kk
XaXaXaaY
22110
Trong đó, Y là thu nhập bình quân hoặc loga của thu nhập bình quân,
i
a
, i=1,2, , k là
tham số của mô mình,
i
X
, i=1,2, , k là các biến có quan hệ với thu nhập bình quân (Y).
Trong thực tế dự báo, mô hình trên có thể ứng dụng theo không gian và
cũng có thể đƣợc dụng theo thời gian. Theo không gian có nghĩa là thông tin về
các biến đƣợc thu thập cho các cá nhân hoặc tỉnh, thành phố trên phạm vi toàn
quốc để từ đó ƣớc lƣợng các thông số của mô hình. Khi các thông số của mô
hình đã đƣợc ƣớc lƣợng có thể tiến hành dự báo. Để dự báo, trƣớc tiên phải dự
báo các biến của mô hình sau đó lắp vào mô hình để tính thu nhập bình quân.
Theo thời gian có nghĩa là số liệu của các biến phải thu thập theo thời gian để
ƣớc lƣợng các tham số của mô hình, sau đó để tiến hành dự báo phải tiến hành
một bƣớc tiếp theo là dự báo từng yếu tố của mô hình và lắp vào phƣơng trình
dự báo.
12
Thí dụ, dựa vào số liệu thu đƣợc từ cuộc điều tra khảo sát mức sống hộ gia đình
2004, chung tôi xây dựng mô hình dự báo cho thu nhập bình quân thực tế của
các hộ gia đình. Các b ƣớc đƣợc tiến hành nhƣ sau:
1) Phân tích định tính để lựa chọn các yếu tố có quan hệ với thu nhập của các hộ
gia đình;
2) Tính ma trận tƣơng quan giữa các yếu tố này (bao gồm cả chỉ tiêu thu nhập
bình quân của hộ gia đình);
3) Lựa chọn các yếu tố để đƣa vào mô hình;
4) Ƣớc lƣợng các thông số của mô hình.
Qua phân tích định tính và dựa vào ma trận hệ số tƣơng quan chúng tôi đã chọn
các biến sau đây để xây dựng mô hình: Chi bình quân thực tế (CHIBQTTE), số
năm học bình quân của những ngƣời từ 15 tuổi trở lên (NAMHBQ15), tỷ lệ trẻ
em trong hộ (TLETREEM) và số giờ làm việc trong tuần (GIOBQTUA).
Qua khảo nghiệm thấy biến thu nhập bình quân của các hộ gia đình
(THUBQTTE) cần đƣợc log hóa để quan hệ của nó có dạng tuyến tính, vì vậy
mô hình có dạng:
GIOBQTUAaTLETREEMaNAMHOCBQaCHIBQTTEaaTHUBQTTELn
43210
15)(
Sử dụng bộ số liệu của cuộc điều tra mức sống hộ gia đình năm 2004, chúng tôi
đã ƣớc lƣợng đƣợc các hệ số của mô hình nhƣ sau:
Bảng hệ số của mô hình và mức ý nghĩa
Unstandardized Coefficients
Standardized
Coefficients
t
Sig.
B
Std. Error
Beta
(Constant)
5.061
.016
322.917
.000
CHIBQTTE
.001
.000
.593
77.617
.000
NAMHBQ15
.038
.002
.187
23.267
.000
TLETREEM
288
.024
090
-12.052
.000
GIOBQTUA
.006
.000
.122
16.986
.000
a Dependent Variable: LNTHUBQT
13
Các thông số của mô hình đƣợc ƣớc lƣợng ở cấp vi mô và hệ số mô tả của mô
hình ở mức 75,6%. Ở cấp vi mô mà hệ số mô tả nhƣ vậy là cao. Mô hình có thể
sử dụng để dự báo cho chỉ tiêu thu nhập bình quân của các hộ. Mô hình có dạng
cụ thể là:
GIOBQTUATLETREEMNAMHOCBQCHIBQTTETHUBQTTELn 006,0288,015038,0001,0061,5)(
Từ mô hình trên, nếu biết đƣợc mức chi tiêu bình quân của một hộ, số năm đi
học bình quân của những ngƣời từ 15 tuổi trở lên, tỷ lệ trẻ em trong hộ và số
giời làm việc trong 1 tuần của chủ hộ ta sẽ dự báo đƣợc mức thu nhập của hộ
này là bao nhiêu.
III. CÁC PHƢƠNG PHÁP DỰ BÁO CHỈ SỐ GIÁ TIÊU DÙNG
Cũng giống nhƣ các chỉ tiêu thống kê khác, chỉ số giá tiêu dùng có thể
đƣợc dự báo bằng hai phƣơng pháp: dãy số thời gian và mô hình hồi quy đa
nhân tố.
3.1. Dự báo chỉ số giá tiêu dùng bằng phƣơng pháp gia quyền điều
hòa
Mô hình dự báo này có dạng
Dãy số liệu này đƣợc coi là sự thể hiện của một qúa trình ngẫu nhiên, ví
dụ X
t
, nào đó. Quá trình này một mặt phụ thuộc vào yếu tố (biến) thời gian t,
một mặt nó chịu sự chi phối của ba thành phần là: thành phần khuynh hƣớng
f(t), thành phần biến động thời vụ
)(t
và thành phần ngẫu nhiên z(t). Giữa ba
thành phần này có mối quan hệ cộng tính hoặc quan hệ nhân tính sau:
+ Quan hệ cộng tính:
(2) X
t
= f(t) +
)(t
+ z(t)
+ Quan hệ nhân tính:
14
(3) X
t
= f(t)
)(t
z(t)
Do mô hình (3) có thể chuyển về dạng của mô hình (2) thông qua phép
biến đổi lôga nên từ đây chúng tôi chỉ nghiên cứu ứng dụng mô hình (2).
Thành phần khuynh hướng f(t) về mặt bản chất nó do nội lực của hiện
tƣợng đƣợc nghiên cứu tác thành. Nó phát triển một cách có hệ thống và theo
một quy luật nhất định tuỳ theo điều kiện nội và ngoại cảnh quyết định.
Thành phần biến động thời vụ
)(t
phát triển cũng hệ thống và theo một
chu kỳ k nhất định. Điều đấy có nghĩa là cứ sau khoảng k thời gian hiện tƣợng
lại đƣợc lặp lại:
)(t
=
)( mkt
, trong đó k đƣợc gọi là chu kỳ dao động mùa vụ.
Thành phần ngẫu nhiên z(t) là thành phần phản ánh sự tác động của các
yếu tố ngẫu nhiên lên sự phát triển của hiện tƣợng đƣợc nghiên cứu. Ví dụ, sự cố
đột nhiên mất điện hoặc đột nhiên có bão làm ảnh hƣởng tới sản xuất,
Thành phần ngẫu nhiên có đặc trƣng sau:
+ Có kỳ vọng toán bằng 0: E(z(t))=0.
+ Không phụ thuộc vào biến thời gian t
Với các điều kiện trên ta có:
(4) E(X
t
)= f(t) +
)(t
Nhƣ vậy về mặt lý thuyết ta có cơ sở để coi dự đoán là dự đoán không
chệch.
Vấn đề đƣợc đặt ra bây giờ là để tiến hành dự báo ta phải dự báo đƣợc xu
thế phát triển của hai thành phần là thành phần khuynh hƣớng và thành phần
biến động thời vụ. Để làm đƣợc điều đó cần thực hiện hai bƣớc: bƣớc thứ nhất là
tách hai thành phần này ra khói dãy số động thái; bƣớc thứ hai là dự báo sự phát
triển của chúng trong tƣơng lai.
15
Tách thành phần khuynh hƣớng
Có nhiều phƣơng pháp để tách thành phần khuynh hƣớng ra khỏi dãy số
động thái. Ở đây chúng tôi sẽ giới thiệu phƣơng pháp tách thành phần khuynh
hướng bằng phương pháp xấp xỉ đoạn. Nội dung của phƣơng pháp nhƣ sau:
Ở phƣơng pháp này ngƣòi ta coi mỗi giá trị của thành phần khuynh hƣớng
là một đại lƣợng ngẫu nhiên. Nó đƣợc xác định bằng một phƣơng trình đƣờng
thẳng mà mỗi thông số của phƣơng trình đƣờng thẳng này lại là một đại lƣợng
phụ thuộc vào thời gian t. Phƣơng trình mô tả giá trị của từng điểm của khuynh
hƣớng có dạng:
P
t
= a
t
+ b
t
t, với t= 1,2, ,n
Để tách thành phần khuynh hƣớng bằng phƣơng pháp xấp xỉ đoạn, tiến
hành các bƣớc sau:
Đầu tiên chọn một số K nào đó (thƣờng đƣợc chọn bằng chu kỳ của mùa
vụ) làm cơ sở để phân đoạn đƣờng cong (K cũng chính là số điểm nằm trên đoạn
thẳng), sau đó tính các thông số của các phƣơng trình đoạn thẳng:
(5)
iiit
btaP
,
với i= 1,2,…,n-K+1, t=1,2,…,n
Công thức (5) biểu thị các đoạn gấp khúc của đƣờng khuynh hƣớng. Có
nhiều phƣơng pháp để ƣớc lƣợng các thông số a
i
và b
i
của các
phƣơng trình này.
Ở đây giới thiệu cách ƣớc lƣợng các thông số a và b bằng phƣơng pháp qua 2
điểm. Cụ thể:
(6)
i
i
i
i
i
tt
XX
a
2
2
16
(7)
iiii
taXb
,
trong đó :
1
1
Ki
it
i
t
K
t
1
1
Ki
it
ti
x
K
X
,
với t=1,2,…,n; i=1,2,…,n-K+1 và
1
2
1
Ki
it
i
t
m
t
1
2
1
Ki
it
ti
x
m
X
,
với
(t>
i
t
) và m là số lượng t
Khi đã có các thông số của các đoạn thẳng ta ƣớc lƣợng thông số của từng
thời điểm t. Do số liệu ở từng thời kỳ (điểm) của dãy số thời gian tham gia vào
mô tả các đoạn thẳng khác nhau nên việc tính các thông số của phƣơng trình mô
tả các sự biến động của dãy số thời gian ở từng thời kỳ (điểm) sẽ đƣợc tính dựa
vào số lần tham gia vào mô tả các đoạn thẳng khác nhau. Công thức tính nhƣ
sau:
(8a)
1
1
1
1
, ,2;
1
1
1, ,1;
1
, ,2,1;
1
Kn
Kti
i
t
Kti
i
t
i
i
t
nKnta
tn
KnKta
K
Kta
t
a
17
(8b)
1
1
1
1
, ,2;
1
1
1, ,1;
1
, ,2,1;
1
Kn
Kti
i
t
Kti
i
t
i
i
t
nKntb
tn
KnKtb
K
Ktb
t
b
2) Ước lượng gía trị khuynh hướng từng thời điểm t
Các giá trị khuynh hƣớng ở từng thời điểm t đƣợc ƣớc lƣợng dựa vào
công thức:
(9)
tt
t
btaP
, với t= 1,2,…,n
B. Tách thành phần mùa vụ
Sau khi đã ƣớc lƣợng đƣợc giá trị khuynh hƣớng ta tiến hành tách thành
phần mùa vụ. Để việc tính toán sau này đƣợc thuận tiện, chúng tôi tách thành
phần mùa vụ theo dạng chỉ số. Cách làm đó nhƣ sau:
Đầu tiên tính tỷ số (M) giữa giá thực tế và giá trị khuynh hƣớng đã tách
đƣợc:
(10)
t
j
t
j
t
P
x
M
, với t= 1,2,…,n; j=1, 2, ,k và k là số
thời vụ
Về mặt bản chất, các tỷ số M
t
chịu ảnh hƣởng của hai thành phần: thành
phần biến động thời vụ và thành phần ngẫu nhiên. Vì vậy, bƣớc tiếp theo là phải
loại bỏ ảnh hƣởng của thành phần ngẫu nhiên ra khỏi chúng. Cách làm nhƣ sau:
+ Trƣớc tiên tính tỷ số bình quân của từng mùa vụ:
(11)
j
t
j
M
s
M
1
, với s là số lượng số hạng trong tổng các
j
t
M
có cùng chỉ số j
18
+ Tiếp theo, hiệu chỉnh các tỷ số cho phù hợp với lý thuyết (tổng của các
tỷ số mùa vụ bằng 1 hoặc bằng 100 nếu tính theo phần trăm). Cách làm nhƣ sau:
a) Tính tổng M:
j
K
j
M
K
M
1
1
b) Tính chỉ số mùa cho từng mùa vụ:
M
M
M
j
j
, j=1,2, , K
Ƣớc lƣợng các gía trị lý thuyết của dãy số và đánh giá mô hình
Sau khi đã tách đƣợc thành phần khuynh hƣớng và thành phần mùa vụ,
tiến hành ƣớc lƣợng các giá trị lý thuyết (giá trị tính đƣợc dựa vào mô hình) mô
tả sự biến động của dãy số thời gian và đánh giá mức độ sát thực của mô hình.
Các giá trị lý thuyết đƣợc ƣớc lƣợng dựa vào các công thức sau:
j
t
t
MPx
, với t= 1,2, , n, trong đó
t
P
thuộc mùa vụ nào thì nhân M
j
tƣơng ứng của mùa vụ ấy.
Sau khi ƣớc lƣợng đƣợc giá trị lý thuyết cần tiến hành đánh giá mức độ
sát thực của mô hình. Các bƣớc tiến hành nhƣ sau:
1) Tính độ lệch (d) giữa giá trị thực tế và giá trị lý thuyết:
ttt
xxd
, với t=1,2, , n
Có giá trị d rồi cần kiểm định xem d có phải là một đại lƣợng ngẫu nhiên
không. Nếu độ lệch d là một đại lƣợng ngẫu nhiên thì coi nhƣ giá trị khuynh
hƣớng lý thuyết mô tả tốt giá trị thực tế và có thể sử dụng nó để dự báo, nếu
19
không thì không thể sử dụng đƣợc. Muốn biết d có phải là biến ngẫu nhiên hay
không cần kiểm định xem:
+ d có đan dấu hay không;
+ Phân bố của d có phải là phân bố chuẩn hay không;
+ d có tƣơng quan với thời gian (t) hay không; và
+ Kỳ vọng toán của d có bằng 0 hay không.
III. DỰ BÁO BẰNG PHƢƠNG PHÁP ĐIỀU HÒA GIA QUYỀN
Giả thuyết cơ bản của phƣơng pháp này là mức độ gia tăng khuynh hƣớng
(có thể dƣơng, có thể âm) ở các thời kỳ càng sát với thời điểm dự báo càng có sự
tác động lớn đến sự phát triển trong tƣơng lai của chỉ tiêu cần dự báo. Với giả
thuyết này mức độ gia tăng càng về sau càng có quyền số lớn trong việc tính
mức độ gia tăng bình quân của chỉ tiêu đƣợc dự báo.
Mức độ gia tăng khuynh hƣớng đƣợc tính bằng công thức:
1ttt
PPIC
, với t=2,3,…,n
Quyền số (W) của gia tăng có dạng:
t
i
n
t
inn
W
2
1
1
1
1
, với t=2,3,…,n
Dễ thấy rằng
1
2
n
t
n
t
W
và
n
t
W
<
n
t
W
1
, nhƣ vậy
n
t
W
có thể giữ vai trò là
quyền số và đảm bảo điều kiện của giả thuyết đặt ra.
Mức độ gia tăng bình quân (IC) đƣợc tính bằng công thức:
t
ICIC
n
2t
n
t
W
Giá trị dự báo Y* đƣợc tính theo công thức:
20
ICPY
nn
*
, với =1,2,…,h và h là tầm dự báo
t
M
CPI
Pt
CPI'
Mj
2004
1
12'
100.6
101.1
101.05
0.999735
2
1
101.1
101.0
101.25
1.002422
3
2
102.5
100.9
102.11
1.01205
4
3
100.1
100.7
100.18
0.995099
5
4
100.6
100.6
100.33
0.997118
2005
6
5
100.5
100.6
100.75
1.001753
7
6
100.4
100.5
100.50
0.999527
8
7
100.4
100.5
100.39
0.998461
9
8
100.4
100.6
100.49
0.999186
10
9
100.8
100.6
100.58
0.999322
11
10
100.4
100.7
100.36
0.996933
12
11
100.4
100.7
100.51
0.998395
13
12
100.8
100.7
101.05
14
1
101.2
100.7
101.25
15
2
102.1
100.7
102.11
16
3
99.5
100.6
100.18
17
4
100.2
100.5
100.33
2006
18
5
100.6
100.5
100.66
19
6
100.4
100.4
100.37
20
7
100.4
100.4
100.22
21
8
100.4
100.4
100.28
22
9
100.3
100.5
100.40
23
10
100.2
100.5
100.22
24
11
100.6
100.6
100.43
25
12
100.5
100.7
100.64
26
1
101.1
100.7
100.99
27
2
102.2
100.8
102.00
28
3
99.8
100.7
100.24
29
4
100.5
100.7
100.42
2007
30
5
100.8
100.7
100.87
31
6
100.9
100.7
100.64
32
7
100.9
100.7
100.58
33
8
100.6
100.9
100.77
34
9
100.5
101.1
101.03
35
10
100.7
101.4
101.09
36
11
101.2
101.7
101.58
37
12
102.9
102.1
102.11
38
1
102.4
102.5
102.72
39
2
103.6
102.7
103.93
40
3
103.0
102.8
102.26
41
4
102.2
102.7
102.39
2008
42
5
103.9
102.5
102.65
43
6
102.1
102.1
102.01
21
t
M
CPI
Pt
CPI'
Mj
44
7
101.1
101.6
101.42
45
8
101.6
101.1
101.02
46
9
100.2
100.7
100.62
47
10
99.8
100.3
100.02
48
11
99.2
100.1
99.91
49
12
99.3
100.0
99.95
50
1
100.3
100.0
100.23
51
2
101.2
100.1
101.26
52
3
99.8
100.1
99.63
53
4
100.4
100.2
99.94
2009
54
5
100.4
100.3
100.52
55
6
100.6
100.4
100.37
56
7
100.5
100.5
100.33
57
8
100.2
100.6
100.48
58
9
100.6
100.7
100.63
59
10
100.4
100.8
100.48
60
11
100.6
100.9
100.70
61
12
101.4
100.9
100.89
62
1
101.4
100.9
101.19
63
2
102.0
101.0
102.17
64
3
100.8
100.9
100.41
65
4
100.1
100.8
100.54
2010
66
5
100.3
100.7
100.90
67
6
100.2
100.6
100.54
68
7
100.1
100.5
100.30
69
8
100.2
100.4
100.28
70
9
101.3
100.4
100.35
71
10
101.1
100.5
100.22
72
11
101.9
100.7
100.55
73
1
100.7
100.69
74
2
100.7
100.96
75
3
100.7
101.932
76
4
100.7
100.228
77
5
100.7
100.434
2011
78
6
100.7
100.904
79
7
100.25
100.139
80
8
100.23
100.184
81
9
100.21
99.96
82
10
100.19
99.72
83
11
100.17
99.77
84
12
100.15
100.26
Đồ thị
22
96.0
97.0
98.0
99.0
100.0
101.0
102.0
103.0
104.0
105.0
1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61 64 67 70 73 76 79 82
CPI Pt CPI'
IV. KẾT LUẬN
Chỉ tiêu thu nhập bình quân thực tế của một hộ gia đình có ý nghĩa lớn
trong việc đánh giá mức sống của dân cƣ. Biết trƣớc đƣợc trong tƣơng lai thu
nhập của các hộ sẽ thay đổi nhƣ thế nào khi các điều kiện gia đình thay đổi sẽ
giúp cho Nhà nƣớc nắm bắt tình hình trên cơ sở đó có nhãng chính sách điều
chỉnh phù hợp. Các phƣơng pháp dự báo đƣa ra khả dĩ có thể áp dụng để dự báo
chỉ tiêu này cho các địa phƣơng và cho toàn quốc. Hơn thế nữa, chúng có thể sử
dụng để ƣớc lƣợng số liệu cho những nơi bị thiếu.
PHỤ LỤC
Bảng hệ số tƣơng quan
TUOI
SNLVIEC
SNLD15
SNAMHOC
NAMHBQ15
QUIMO
THUBQTTE
TLETREEM
TLLAMVIE
GIOBQTUA
TUOI
1
016
.024(*)
291(**)
044(**)
092(**)
.043(**)
509(**)
.067(**)
222(**)
SNLVIEC
016
1
.951(**)
104(**)
028(**)
.671(**)
126(**)
045(**)
.518(**)
049(**)
SNLD15
.024(*)
.951(**)
1
080(**)
.032(**)
.659(**)
098(**)
134(**)
.491(**)
.002
SNAMHOC
291(**)
104(**)
080(**)
1
.745(**)
068(**)
.260(**)
.016
057(**)
.236(**)
NAMHBQ15
044(**)
028(**)
.032(**)
.745(**)
1
110(**)
.337(**)
328(**)
.082(**)
.231(**)
QUIMO
092(**)
.671(**)
.659(**)
068(**)
110(**)
1
163(**)
.328(**)
184(**)
.114(**)
THUBQTTE
.043(**)
126(**)
098(**)
.260(**)
.337(**)
163(**)
1
174(**)
001
.174(**)
TLETREEM
509(**)
045(**)
134(**)
.016
328(**)
.328(**)
174(**)
1
407(**)
.111(**)
TLLAMVIE
.067(**)
.518(**)
.491(**)
057(**)
.082(**)
184(**)
001
407(**)
1
101(**)
GIOBQTUA
222(**)
049(**)
.002
.236(**)
.231(**)
.114(**)
.174(**)
.111(**)
101(**)
1
** Correlation is significant at the 0.01 level (2-tailed).
* Correlation is significant at the 0.05 level (2-tailed).
Kết quả tính toán
1) Hệ số tƣơng quan của mô hình
Model Summary
Model
R
R Square
Adjusted R
Square
Std. Error of
the Estimate
1
.758(a)
.574
.574
.44974
a Predictors: (Constant), GIOBQTUA, TLETREEM, CHIBQTTE, NAMHBQ15
24
2) Bảng hệ số của mô hình và mức ý nghĩa
Unstandardized Coefficients
Standardized
Coefficients
t
Sig.
B
Std. Error
Beta
(Constant)
5.061
.016
322.917
.000
CHIBQTTE
.001
.000
.593
77.617
.000
NAMHBQ15
.038
.002
.187
23.267
.000
TLETREEM
288
.024
090
-12.052
.000
GIOBQTUA
.006
.000
.122
16.986
.000
TÀI LIỆU THAM KHẢO
1. Oskar Lange, Wstep do Ekonometrii;
2. Tổng cục Thống kê, Tổng điều tra dân số Việt Nam 1989, Phân tích kết quả
điều tra mẫu, Hà Nội 1991;
3. Tổng cục Thống kê, kết quả điều tra mức sống hộ gia đình năm 2004