Tải bản đầy đủ (.docx) (37 trang)

CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN THU NHẬP CỦA NGƯỜI DÂN TP.HỒ CHÍ MINH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (782.13 KB, 37 trang )

TRƯỜNG ĐẠI HỌC NGOẠI THƯƠNG CƠ SỞ II – TPHCM.
NGÀNH TÀI CHÍNH NGÂN HÀNG - CHUYÊN NGÀNH TÀI CHÍNH QUỐC TẾ.
  
KINH TẾ LƯỢNG
ĐỀ TÀI:
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN
THU NHẬP CỦA NGƯỜI DÂN
TP.HỒ CHÍ MINH.
GVHD: Cô Trần Thị Tuấn Anh.
Nhóm thực hiện: Nhóm 3 - K49B,C – Ca 2.
1. Phan Lê Chí
2. Lê Tấn Đạt
3. Nguyễn Thị Thanh Hà
4. Trần Thị Hồng Lam
5. Huỳnh Diệp Mỹ Ngọc
6. Huỳnh Thanh Sang
7. Nguyễn Thị Tâm
8. Hồ Thị Như Thủy
9. Hàn Thị Hạ Thư
10. Nguyễn Thị Cẩm Vân
030
042
048
101
133
175
183
211
527
260
TP.HCM, Ngày 05/12/2011.


MỤC LỤC
CÁC YẾU TỐ ẢNH HƯỞNG ĐẾN THU NHẬP CỦA
NGƯỜI DÂN TP.HỒ CHÍ MINH.
I.GIỚI THIỆU ĐỀ TÀI NGHIÊN CỨU:
1.Giới thiệu:
Thu nhập của người dân ở mọi nơi đều là vấn đề thu hút sự quan tâm của đông đảo
những người nghiên cứu, cho dù đó là quốc gia giàu mạnh hay nghèo đói cho đến những
địa phương nhỏ bé. Bởi vì, nó chính là chỉ tiêu quan trọng có ý nghĩa kinh tế để đánh giá
mức sống, sự phát triển của mỗi khu vực địa lý cũng như khía cạnh nào đó là nguyên
nhân của nhiều vấn đề xã hội khác.
Thành phố Hồ Chí Minh – hòn ngọc Viễn Đông giữ vai trò đầu tàu kinh tế của cả
Việt Nam, do đó vấn đề thu nhập của người dân tại thành phố Hồ Chí Minh có ý nghĩa rất
quan trọng và cần thiết. Nó ảnh hưởng đến bộ mặt của toàn bộ nền kinh tế cả nước. Đó là
lý do tại sao nhóm 3 chọn đề tài nghiên cứu “ Các yếu tố ảnh hưởng đến thu nhập của
người dân thành phố Hồ Chí Minh”.
2.Đối tượng, phạm vi khảo sát:
Đối tượng được thực hiện khảo sát là người dân đang sống và làm việc tại 19 quận và
5 huyện thuộc thành phố Hồ Chí Minh. Tuy nhiên, do tính chất phức tạp và phạm vi quá
rộng lớn, nhóm 3 (gồm 5 bạn lớp K49B và 5 bạn lớp K49C) không thể khảo sát trên toàn
bộ địa bàn thành phố Hồ Chí Minh. Đây là lúc phát huy tinh thần đoàn kết và tương thân
tương trợ giữa các nhóm. Mỗi nhóm đã khảo sát 1 quận hoặc 1 huyện thuộc thành phố
Hồ Chí Minh. Dưới sự hướng dẫn của cô Tuấn Anh, nhóm 3 đã tiến hành khảo sát về thu
nhập của người dân tại huyện Cần Giờ. Sau khi các nhóm hoàn thành phần khảo sát của
nhóm mình, cô Tuấn Anh đã tổng hợp và chọn lọc để có được một bảng số liệu tổng hợp
về thu nhập của người dân thành phố Hồ Chí Minh tương đối hoàn hảo và chính xác.
Do giới hạn về mặt thời gian và những khó khăn về phương tiện đi lại và di chuyển,
nhóm 3 không thể khảo sát tường tận đến từng hang cùng ngõ hẹp của huyện Cần Giờ mà
nhóm đã tập trung lực lượng để tiến hành khảo sát những khu dân cư điển hình của huyện
2
Cần Giờ. Mặc dù gặp không ít khó khăn nhưng nhóm đã có tinh thần và thái độ làm việc

hết sức nghiêm túc trong quá trình khảo sát.
3.Ý nghĩa đề tài:
Là những sinh viên đang sống và học tập tại thành phố Hồ Chí Minh, vấn đề thu nhập
của người dân thành phố không những là mối quan tâm của nhiều người mà còn là mối
3
Chọn đề tài
Xác định các tham số
Thu thập số liệu
Xây dựng mô hình
Kiểm định, sửa chữa
Nhận xét, kết luận
quan tâm của đại bộ phận sinh viên chúng tôi. Cũng có thể nói đó là một trong những mối
quan tâm hàng đầu của các cấp chính quyền địa phương. Thu nhập của người dân thành
phố Hồ Chí Minh như thế nào? Nó có những điểm gì khác biệt và nổi bật hơn so với các
thành phố và địa phương khác trong cả nước và nó bị chi phối, chịu ảnh hưởng bởi những
yếu tố nào? Nhóm 3 hy vọng qua bài báo cáo này, mọi người sẽ có một cái nhìn tổng
quan nhất về thu nhập của người dân thành phố Hồ Chí Minh. Qua bài báo cáo này, mọi
người cũng sẽ biết được những yếu tố nào thực sự ảnh hưởng đến thu nhập của người dân
thành phố Hồ Chí Minh và nó đã ảnh hưởng và tác động như thế nào?
Từ bài nghiên cứu, nhóm chúng tôi cũng đưa ra một số hướng khắc phục và một số
giải pháp mà nhóm chúng tôi cho là có thể góp phần nâng cao thu nhập của người dân
thành phố Hồ Chí Minh để có thể rút ngắn khoảng cách giàu nghèo và tạo điều kiện cho
mọi người dân đều có một cuộc sống đầy đủ, ấm no và hạnh phúc.
4.Quy trình thực hiện, công cụ hỗ trợ:
• Các bước thực hiện
• Công cụ hỗ trợ:
Để tiến hành xây dựng mô hình, nhóm đã đi điều tra bằng phiếu khảo sát. Sau quá
trình khảo sát của nhóm và các nhóm bạn đã thu được 727 mẫu quan sát hợp lệ
4
 Phiếu hợp lệ là phiếu điền đầy đủ thông

tin và trả lời đầy đủ tất cả câu hỏi trong
phiếu khảo sát.
 Phiếu không hợp lệ là phiếu bỏ trống, điền
thiếu thông tin hay thêm thông tin không
cần thiết và không liên quan vào, không trả
lời hết các câu hỏi.
Căn cứ vào số liệu thu thập từ các phiếu hợp lệ,
nhóm đã tiến hành hồi quy, kiểm định (đa cộng
tuyến, tự tương quan, phương sai thay đổi) và
khắc phục.
Để hoàn thành bài nghiên cứu, nhóm đã sử
dụng các kiến thức được học trên lớp và các phần
mềm hỗ trợ như: chủ yếu là phần mềm eview 5.0,
các phần mềm của Microsoft như: word,
excel, paint,…
5.Các yếu tố khảo sát:
Để thực hiện mô hình “Các yếu tố ảnh hưởng
tới thu nhập của người dân thành phố Hồ Chí
Minh”, nhóm 3 tiến hành khảo sát các yếu tố sau:
5
• Số tuổi:bao nhiêu tuổi
• Sử dụng ngoại ngữ: thành thạo hay không thành thạo
• Bằng cấp: thạc sỹ, tiến sỹ, đại học, cao đẳng, trung cấp, THPT,THCS, tiểu học,…
• Giới tính: nam hay nữ
• Vị trí công việc: lãnh đạo, nhân viên,….
• Chuyên môn: y tế, giáo dục, khoa học, nông nghiệp,…
• Sức khỏe: tốt hay không tốt
II.XÂY DỰNG MÔ HÌNH HỒI QUY
1.Mô hình hồi quy tổng quát.
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D2 + C(5)*D3 + C(6)*D4 + C(7)*D5 +

C(8)*D6 + C(9)*D7 + C(10)*D8 + C(11)*D9 + C(12)*D10 + C(13)*D11 +
C(14)*D12 + C(15)*D13 + C(16)*D14 + C(17)*D15
2.Ý nghĩa các biến trong mô hình.
Biến phụ thuộc
Tên
biến
Diễn giải Giá trị Đơn vị tính
Y Thu nhập
410 1000
000
Nghìn đồng/tháng
Biến độc lập – định lượng
Tên
biến
Diễn giải
Đơn vị
tính
Giá trị
Dấu kì
vọng
Ghi chú
X1 Tuổi Năm
19 70
+
Tuổi càng cao thì
thu nhập càng tăng.
Biến độc lập – định tính
Tên
biến
Diễn giải

Giá trị
Dấu kỳ
vọng
Ghi chú
1 0
D1
Lĩnh vực chuyên
môn
Y học
Lĩnh vực
khác
Thu nhập sẽ khác
nhau cho những
lĩnh vực chuyên
môn khác nhau
D2 Giáo gục
đào tạo
Lĩnh vực
khác
6
D3
Công
nghệ
thông tin
Lĩnh vực
khác
D4
Kiến
trúc/Xây
dựng

Lĩnh vực
khác
D5 Luật
Lĩnh vực
khác
D6
Nghệ
thuật
Lĩnh vực
khác
D7
Nông/lâm
/Ngư
nghiệp
Lĩnh vực
khác
D8
Kinh
doanh
Lĩnh vực
khác
D9 Quân đội
Lĩnh vực
khác
D10
Mức độ thông
thạo ngoại ngữ
Thành
thạo
Không

thành
thạo
+
Mức độ thông thạo
ngoại ngữ càng lớn
thì thu nhập càng
cao
D11 Vị trí công việc Lãnh đạo Khác +
Chức vụ càng cao
thì thu nhập càng
lớn
D12
Bằng cấp
Thạc sĩ,
tiến sĩ,
đại học,
cao đẳng
Khác
+
Bằng cấp là một
yếu tố quan trọng
phản ánh mức thu
nhập của một người
D13
THPT vs
THCS
Khác
D14 Giới tính Nam Nữ +
Thu nhập ở người
nam và nữ luôn có

sự chênh lệch
D15 Sức khỏe Tốt Không tốt + Sức khỏe tốt góp
7
phần cải thiện thu
nhập
III.MÔ HÌNH HỒI QUY – KIỂM ĐỊNH VÀ SỬA CHỮA MÔ HÌNH.
A.MÔ HÌNH HỒI QUY
1.Mô hình hồi quy gốc:
1.1. Phương trình hồi quy gốc:
Estimation Command:
=====================
LS Y C X1 D1 D2 D3 D4 D5 D6 D7 D8 D9 D10 D11 D12 D13 D14 D15
Estimation Equation:
=====================
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D2 + C(5)*D3 + C(6)*D4 + C(7)*D5 + C(8)*D6
+ C(9)*D7 + C(10)*D8 + C(11)*D9 + C(12)*D10 + C(13)*D11 + C(14)*D12 +
C(15)*D13 + C(16)*D14 + C(17)*D15
Substituted Coefficients:
=====================
Y = -4271.544 + 123.5550*X1 + 4024.775*D1 + 279.8236*D2 + 1265.943*D3 +
2196.124*D4 + 6599.651*D5 + 3621.184*D6 – 697.8300*D7 + 1522.957*D8 –
2733.346*D9 + 4845.598*D10 + 5682.831*D11 + 4219.735*D12 + 3280.677*D13 +
17.26477*D14 + 708.1200*D15
1.2. Mô hình 1:
Dependent Variable: Y
Method: Least Squares
Date: 12/01/11 Time: 20:15
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.

C -4271.544 2215.019 -1.928445 0.0542
X1 123.5550 33.42733 3.696226 0.0002
8
D1 4024.775 1404.453 2.865725 0.0043
D2 279.8236 1319.545 0.212061 0.8321
D3 1265.943 1550.551 0.816447 0.4145
D4 2196.124 1390.187 1.579732 0.1146
D5 6599.651 3222.904 2.047734 0.0410
D6 3621.184 3446.540 1.050672 0.2938
D7 -697.8300 1811.023 -0.385324 0.7001
D8 1522.957 792.3376 1.922106 0.0550
D9 -2733.346 2318.408 -1.178976 0.2388
D10 4845.598 768.2656 6.307191 0.0000
D11 5682.831 752.2490 7.554454 0.0000
D12 4219.735 1442.374 2.925548 0.0035
D13 3280.677 1408.847 2.328625 0.0202
D14 17.26477 662.8633 0.026046 0.9792
D15 708.1200 1115.706 0.634684 0.5258
R-squared 0.228171 Mean dependent var 8192.597
Adjusted R-
squared 0.210778 S.D. dependent var 9335.781
S.E. of regression 8293.738 Akaike info criterion 20.90750
Sum squared resid 4.88E+10 Schwarz criterion 21.01480
Log likelihood -7582.874 Hannan-Quinn criter. 20.94890
F-statistic 13.11832 Durbin-Watson stat 1.609121
Prob(F-statistic) 0.000000
1.3. Nhận xét:
+ Kiểm định các biến bị bỏ sót – Kiểm định Ramsey
Ramsey RESET Test:
F-statistic 14.48788 Prob. F(2,708) 0.0000

Log likelihood
ratio 29.16063 Prob. Chi-Square(2) 0.0000
9
Test Equation:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:35
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C -2347.900 4825.795 -0.486531 0.6267
X1 108.4009 89.68444 1.208693 0.2272
D1 2257.047 3198.833 0.705584 0.4807
D2 657.7420 1302.216 0.505094 0.6136
D3 1518.140 1709.561 0.888030 0.3748
D4 2079.335 1998.006 1.040705 0.2984
D5 1884.890 5579.307 0.337836 0.7356
D6 4113.287 4282.827 0.960414 0.3372
D7 -557.5245 1834.530 -0.303906 0.7613
D8 1658.333 1278.079 1.297520 0.1949
D9 -2067.366 2849.377 -0.725550 0.4684
D10 3289.324 3760.638 0.874672 0.3820
D11 3758.016 4477.976 0.839222 0.4016
D12 3878.503 3031.585 1.279365 0.2012
D13 2951.121 2476.466 1.191667 0.2338
D14 -199.9990 659.8742 -0.303087 0.7619
D15 1017.755 1170.139 0.869772 0.3847
FITTED^2 -5.42E-05 7.82E-05 -0.692650 0.4888
FITTED^3 4.03E-09 2.43E-09 1.661979 0.0970
R-squared 0.258517 Mean dependent var 8192.597

Adjusted R- 0.239666 S.D. dependent var 9335.781
10
squared
S.E. of regression 8140.533 Akaike info criterion 20.87289
Sum squared resid 4.69E+10 Schwarz criterion 20.99282
Log likelihood -7568.294 Hannan-Quinn criter. 20.91917
F-statistic 13.71353 Durbin-Watson stat 1.583935
Prob(F-statistic) 0.000000
Dễ thấy P_value <0,05 nên có biến bị bỏ sót
Nhận thấy các biến X1, D1, D5, D10, D11, D12, D13 có P_value < 0.05 nên có ý
nghĩa thống kê. Các biến còn lại có P_value > 0.05 nên không có ý nghĩa thống kê.
+Kiểm định các biến bị loại bỏ (biến thừa) ta sử dụng kiểm định Wald
C(4)=C(5)=C(6)=C(8)=C(9)=C(10)=C(11)=C(16)=C(17)= 0
Wald Test:
Equation: HQUY1
Test Statistic Value df Probability
F-statistic 1.091471 (9, 710) 0.3666
Chi-square 9.823238 9 0.3650
Null Hypothesis Summary:
Normalized Restriction (= 0) Value Std. Err.
C(4) 279.8236 1319.545
C(5) 1265.943 1550.551
C(6) 2196.124 1390.187
C(8) 3621.184 3446.540
C(9) -697.8300 1811.023
C(10) 1522.957 792.3376
C(11) -2733.346 2318.408
C(16) 17.26477 662.8633
11
C(17) 708.1200 1115.706

Restrictions are linear in coefficients.
P-value > 0.05 do đó chấp nhận Ho, các biến trên đều là biến thừa.
Vậy loại bỏ các biến D2, D3, D4, D6, D7, D8, D9, D14, D15 ra khỏi mô hình.
Như vậy, các yếu tố lĩnh vực chuyên môn (Giáo dục đào tạo, Công nghệ thông tin,
Kiến trúc/Xây dựng, Luật, Nghệ thuật, Nông/Lâm/Ngư nghiệp, Kinh doanh, Quân đội),
giới tính và sức khỏe đều không ảnh hưởng đến thu nhập của người dân Thành phố Hồ
Chí Minh.
2. Mô hình sau khi loại bỏ các biến không cần thiết:
2.1. Phương trình hồi quy:
Estimation Command:
=====================
LS Y C X1 D1 D5 D10 D11 D12 D13
Estimation Equation:
=====================
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D5 + C(5)*D10 + C(6)*D11 + C(7)*D12 +
C(8)*D13
Substituted Coefficients:
=====================
Y = -2673.387 + 112.4161*X1 + 3171.415*D1 + 5602.597*D5 + 4963.202*D10 +
5972.162*D11 + 4459.695*D12 + 3334.765*D13
2.2. Mô hình 2:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:24
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
12
C -2673.387 1896.861 -1.409374 0.1592
X1 112.4161 32.41639 3.467878 0.0006

D1 3171.415 1283.188 2.471512 0.0137
D5 5602.597 3167.038 1.769034 0.0773
D10 4963.202 761.0756 6.521299 0.0000
D11 5972.162 727.9322 8.204284 0.0000
D12 4459.695 1396.666 3.193101 0.0015
D13 3334.765 1392.414 2.394952 0.0169
R-squared 0.217493 Mean dependent var 8192.597
Adjusted R-
squared 0.209874 S.D. dependent var 9335.781
S.E. of regression 8298.484 Akaike info criterion 20.89648
Sum squared resid 4.95E+10 Schwarz criterion 20.94697
Log likelihood -7587.869 Hannan-Quinn criter. 20.91596
F-statistic 28.54872 Durbin-Watson stat 1.594778
Prob(F-statistic) 0.000000
Ta thấy R
2
=21.749% nhỏ hơn R
2
lúc đầu . Tuy nhiên các biến vẫn có ý nghĩa với mô
hình do P_value < 0.05, ngoại trừ P_value của D5 = 0.0773>0.05 nên ta sẽ kiểm định thử
D5 có phải là biến thừa không?
*Kiểm định biến D5 bằng Wald:
Wald Test:
Equation: HQUY2
Test Statistic Value df Probability
F-statistic 3.129481 (1, 719) 0.0773
Chi-square 3.129481 1 0.0769
Null Hypothesis Summary:
13
Normalized Restriction (= 0) Value Std. Err.

C(4) 5602.597 3167.038
Restrictions are linear in coefficients.
Dễ thấy P_value > 0.05 vậy D5 là biến thừa trong mô hình.
3.Mô hình sau khi loại bỏ biến thừa:
3.1. Phương trình hồi quy:
Estimation Command:
=====================
LS Y C X1 D1 D10 D11 D12 D13
Estimation Equation:
=====================
Y = C(1) + C(2)*X1 + C(3)*D1 + C(4)*D10 + C(5)*D11 + C(6)*D12 + C(7)*D13
Substituted Coefficients:
=====================
Y = -2703.616 + 113.1395*X1 + 3078.102*D1 + 5021.531*D10 + 5962.938*D11 +
4542.664*D12 + 3337.625*D13
3.2. Mô hình 3:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:29
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C -2703.616 1899.587 -1.423266 0.1551
X1 113.1395 32.46171 3.485321 0.0005
D1 3078.102 1283.998 2.397279 0.0168
D10 5021.531 761.4847 6.594395 0.0000
14
D11 5962.938 728.9891 8.179735 0.0000
D12 4542.664 1397.941 3.249540 0.0012
D13 3337.625 1394.471 2.393470 0.0169

R-squared 0.214087 Mean dependent var 8192.597
Adjusted R-squared 0.207537 S.D. dependent var 9335.781
S.E. of regression 8310.747 Akaike info criterion 20.89807
Sum squared resid 4.97E+10 Schwarz criterion 20.94225
Log likelihood -7589.448 Hannan-Quinn criter. 20.91512
F-statistic 32.68858 Durbin-Watson stat 1.599475
Prob(F-statistic) 0.000000
Tất cả các biến đều có P_value < 0.05 vậy tất cả các biến đều có ý nghĩa với mô
hình.
3.3. Nhận xét:
• C1= -2703.616: Một người dân có số tuổi là 0, không làm ngành Y, ngoại ngữ không
thành thạo, không làm lãnh đạo, bằng cấp dưới THCS thì có thu nhập trung bình là
-2703.616 nghìn đồng/tháng. Số liệu này không có ý nghĩa kinh tế.
• Tác động của số tuổi (X1) tới thu nhập: C2=113.1395>0, số tuổi có tác động cùng
chiều với thu nhập. Khi số tuổi của người dân tăng lên 1 tuổi, các yếu tố khác không đổi
thì thu nhập trung bình tăng 113.1395 nghìn đồng/tháng.
• Tác động của lĩnh vực chuyên môn là ngành Y (D1) tới thu nhập: C3=3078.102>0,
tác động cùng chiều với thu nhập. Khi lĩnh vực chuyên môn là ngành Y, các yếu tố khác
không đổi thì thu nhập trung bình tăng 3078.102 nghìn đồng/tháng.
• Tác động của ngoại ngữ (D10) tới thu nhập: C4=5021.531>0, tác động cùng chiều với
thu nhập. Trung bình một người có ngoại ngữ thành thạo có thu nhập nhiều hơn một
người ngoại ngữ không thành thạo, các yếu tố khác không đổi, là 5021.531 nghìn
đồng/tháng.
• Tác động của vị trí trong công việc (D11) tới thu nhập: C5=5962.938>0, tác động
cùng chiều với thu nhập. Trong điều kiện các yếu tố khác không đổi, một người làm lãnh
đạo có thu nhập nhiều hơn một người không làm lãnh đạo trung bình là 5962.938 nghìn
đồng/tháng.
• Tác động của bằng cấp tới thu nhập:
- Thạc sĩ, tiến sĩ, đại học, cao đẳng (D12): C6=4542.664>0, tác động cùng chiều với thu
nhập. Trong điều kiện các yếu tố khác không đổi, trung bình một người tốt nghiệp tiến sĩ,

15
thạc sĩ, đại học, cao đẳng có thu nhập nhiều hơn một người chưa tốt nghiệp THCS là
4542.664 nghìn đồng/tháng.
- THPT và THCS : C7=3337.625 >0, tác động cùng chiều với thu nhập. Trong điều kiện
các yếu tố khác không đổi, trung bình một người tốt nghiệp THPT hoặc THCS có thu
nhập nhiều hơn một người chưa tốt nghiệp THCS là 3337.625 nghìn đồng/tháng.
B.KIỂM ĐỊNH VÀ KHẮC PHỤC
1.Kiểm định đa cộng tuyến
1.1. Kiểm định đa cộng tuyến
Lập ma trận hệ số tương quan:
X1 D1 D10 D12 D13
X1 1.000000 0.068272 -0.131910 -0.227085 0.103652
D1 0.068272 1.000000 0.044623 0.183848 -0.169152
D10 -0.131910 0.044623 1.000000 0.364085 -0.314173
D12 -0.227085 0.183848 0.364085 1.000000 -0.875559
D13 0.103652 -0.169152 -0.314173 -0.875559 1.000000
Vì |r
D12D13
| = 0.875559 > 0.8 nên cặp biến độc lập D12 và D13 bị đa cộng tuyến.
1.2.Khắc phục đa cộng tuyến.
Kiểm định sự cần thiết của các biến bị đa cộng tuyến với mô hình:
a. Hồi quy mô hình với D12:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:48
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C 676.6432 1274.546 0.530890 0.5957
X1 97.93633 31.93841 3.066412 0.0022

D1 3097.041 1288.177 2.404205 0.0165
16
D10 5020.628 763.9776 6.571696 0.0000
D11 5961.429 731.3755 8.150982 0.0000
D12 1658.582 711.0249 2.332664 0.0199
R-squared 0.207833 Mean dependent var 8192.597
Adjusted R-
squared
0.202340 S.D. dependent var 9335.781
S.E. of regression 8337.956 Akaike info criterion 20.90324
Sum squared resid 5.01E+10 Schwarz criterion 20.94112
Log likelihood -7592.329 Hannan-Quinn criter. 20.91786
F-statistic 37.83243 Durbin-Watson stat 1.572545
Prob(F-statistic) 0.000000
Ta thấy: R
2
=20.783%
b. Hồi quy mô hình với D13:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:50
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C 2211.037 1156.955 1.911082 0.0564
X1 84.17938 31.42063 2.679112 0.0076
D1 3521.653 1285.158 2.740249 0.0063
D10 5437.368 755.6151 7.195949 0.0000
D11 5999.861 733.7168 8.177353 0.0000
17

D13 -568.2864 711.6168 -0.798585 0.4248
R-squared 0.202560 Mean dependent var 8192.597
Adjusted R-squared 0.197030 S.D. dependent var 9335.781
S.E. of regression 8365.661 Akaike info criterion 20.90988
Sum squared resid 5.05E+10 Schwarz criterion 20.94775
Log likelihood -7594.740 Hannan-Quinn criter. 20.92449
F-statistic 36.62875 Durbin-Watson stat 1.570505
Prob(F-statistic) 0.000000
R
2
=20.256%
Nhận xét: R
2
của D12 > R
2
của D13(0.20783>0.20256), do đó D12 ảnh hưởng đến Y
nhiều hơn D13 nên ta sẽ bỏ biến D13 để khắc phục hiện tượng đa cộng tuyến.
Ta có phương trình hồi quy sau khi bỏ biến D13 :
Y= 676.6432 + 97.93633*X1+ 3097.041*D1+ 5020.628*D10 + 5961.429*D11+
1658.582*D12.
2.Kiểm định tự tương quan.
2.1. Phát hiện tự tương quan.
a. Kiểm định Durbin-watson:
Dependent Variable: Y
Method: Least Squares
Date: 12/02/11 Time: 05:48
Sample: 1 727
Included observations: 727
Variable Coefficient Std. Error t-Statistic Prob.
C 676.6432 1274.546 0.530890 0.5957

X1 97.93633 31.93841 3.066412 0.0022
D1 3097.041 1288.177 2.404205 0.0165
18
D10 5020.628 763.9776 6.571696 0.0000
D11 5961.429 731.3755 8.150982 0.0000
D12 1658.582 711.0249 2.332664 0.0199
R-squared 0.207833 Mean dependent var 8192.597
Adjusted R-squared 0.202340 S.D. dependent var 9335.781
S.E. of regression 8337.956 Akaike info criterion 20.90324
Sum squared resid 5.01E+10 Schwarz criterion 20.94112
Log likelihood -7592.329 Hannan-Quinn criter. 20.91786
F-statistic 37.83243 Durbin-Watson stat 1.572545
Prob(F-statistic) 0.000000
Vì số quan sát quá lớn nên ta không thể tra bảng. Ta có:
Hệ số tự tương quan = 1-d/2 = 1- 1.572545/2 = 0.2137 > 0. Vậy có sự tương quan
dương.
b. Kiểm định Breusch Godfrey:
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 34.58900 Prob. F(1,720) 0.0000
Obs*R-squared 33.32437 Prob. Chi-Square(1) 0.0000
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/02/11 Time: 06:05
Sample: 1 727
Included observations: 727
Presample missing value lagged residuals set to zero.
Variable Coefficient Std. Error t-Statistic Prob.
C -9.210992 1245.857 -0.007393 0.9941
19

X1 -1.535167 31.22057 -0.049172 0.9608
D1 191.8293 1259.603 0.152293 0.8790
D10 -192.9495 747.5009 -0.258126 0.7964
D11 12.28604 714.9154 0.017185 0.9863
D12 157.6574 695.5366 0.226670 0.8207
RESID(-1) 0.214504 0.036472 5.881242 0.0000
R-squared 0.045838 Mean dependent var -1.84E-13
Adjusted R-squared 0.037887 S.D. dependent var 8309.194
S.E. of regression 8150.270 Akaike info criterion 20.85907
Sum squared resid 4.78E+10 Schwarz criterion 20.90326
Log likelihood -7575.273 Hannan-Quinn criter. 20.87612
F-statistic 5.764834 Durbin-Watson stat 2.009860
Prob(F-statistic) 0.000007
Vì p_value < 0.05 nên có sự tự tương quan trong mô hình.
2.2. Khắc phục tự tương quan.
Bước 1: Sử dụng phần dư e
i
để hồi quy dạng hàm:
Đặt e=resid, nhập hàm e c e(-1) ta được:
Dependent Variable: E
Method: Least Squares
Date: 12/02/11 Time: 10:16
Sample (adjusted): 2 727
Included observations: 726 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C -1.739389 301.6724 -0.005766 0.9954
E(-1) 0.213705 0.036307 5.886096 0.0000
R-squared 0.045668 Mean dependent var -1.276226
Adjusted R-squared 0.044350 S.D. dependent var 8314.851
S.E. of regression 8128.378 Akaike info criterion 20.84686

20
Sum squared resid 4.78E+10 Schwarz criterion 20.85950
Log likelihood -7565.411 Hannan-Quinn criter. 20.85174
F-statistic 34.64612 Durbin-Watson stat 2.009098
Prob(F-statistic) 0.000000
r
0
=0.214
Bước 2:Viết phương trình hồi quy mới dạng sai phân.
Dependent Variable: Y-R0*Y(-1)
Method: Least Squares
Date: 12/02/11 Time: 10:21
Sample (adjusted): 2 727
Included observations: 726 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 384.9373 986.3577 0.390261 0.6965
X1-R0*X1(-1) 104.4478 31.08531 3.360036 0.0008
D1-R0*D1(-1) 3119.659 1246.617 2.502499 0.0126
D10-R0*D10(-1) 4662.383 755.7497 6.169217 0.0000
D11-R0*D11(-1) 6084.928 716.1482 8.496744 0.0000
D12-R0*D12(-1) 1692.438 689.5437 2.454431 0.0143
R-squared 0.212743 Mean dependent var 6440.477
Adjusted R-squared 0.207276 S.D. dependent var 9152.643
S.E. of regression 8149.058 Akaike info criterion 20.85742
Sum squared resid 4.78E+10 Schwarz criterion 20.89534
Log likelihood -7565.244 Hannan-Quinn criter. 20.87205
F-statistic 38.91368 Durbin-Watson stat 2.006000
Prob(F-statistic) 0.000000
21
Ta thấy Durbin-Watson stat = 2.006000 xấp xỉ 2 nên khắc phục được sự tự tương

quan.
Bước 3: Kiểm định lại sự tự tương quan bằng BG test.
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.006760 Prob. F(1,719) 0.9345
Obs*R-squared 0.006826 Prob. Chi-Square(1) 0.9342
Test Equation:
Dependent Variable: RESID
Method: Least Squares
Date: 12/02/11 Time: 10:24
Sample: 2 727
Included observations: 726
Presample missing value lagged residuals set to zero.
Variable Coefficient Std. Error t-Statistic Prob.
C 0.474314 987.0556 0.000481 0.9996
X1-R0*X1(-1) 0.011743 31.10710 0.000377 0.9997
D1-R0*D1(-1) -2.015504 1247.719 -0.001615 0.9987
D10-R0*D10(-1) 2.204263 756.7465 0.002913 0.9977
D11-R0*D11(-1) -0.244130 716.6488 -0.000341 0.9997
D12-R0*D12(-1) -2.244417 690.5596 -0.003250 0.9974
RESID(-1) -0.003071 0.037350 -0.082219 0.9345
R-squared 0.000009 Mean dependent var 2.07E-12
Adjusted R-squared -0.008335 S.D. dependent var 8120.909
S.E. of regression 8154.685 Akaike info criterion 20.86017
Sum squared resid 4.78E+10 Schwarz criterion 20.90440
Log likelihood -7565.241 Hannan-Quinn criter. 20.87724
22
F-statistic 0.001127 Durbin-Watson stat 1.999711
Prob(F-statistic) 1.000000
Ta thấy p_value > 0.05 => Mô hình hết bị tự tương quan.
3.Kiểm định phương sai thay đổi.

Dùng lại mô hình mới khắc phục ở trên:
Dependent Variable: Y-R0*Y(-1)
Method: Least Squares
Date: 12/02/11 Time: 10:39
Sample (adjusted): 2 727
Included observations: 726 after adjustments
Variable Coefficient Std. Error t-Statistic Prob.
C 384.9373 986.3577 0.390261 0.6965
X1-R0*X1(-1) 104.4478 31.08531 3.360036 0.0008
D1-R0*D1(-1) 3119.659 1246.617 2.502499 0.0126
D10-R0*D10(-1) 4662.383 755.7497 6.169217 0.0000
D11-R0*D11(-1) 6084.928 716.1482 8.496744 0.0000
D12-R0*D12(-1) 1692.438 689.5437 2.454431 0.0143
R-squared 0.212743 Mean dependent var 6440.477
Adjusted R-
squared 0.207276 S.D. dependent var 9152.643
S.E. of regression 8149.058 Akaike info criterion 20.85742
Sum squared resid 4.78E+10 Schwarz criterion 20.89534
Log likelihood -7565.244 Hannan-Quinn criter. 20.87205
F-statistic 38.91368 Durbin-Watson stat 2.006000
Prob(F-statistic) 0.000000
3.1.Vẽ đồ thị
23
-40,000
-20,000
0
20,0 00
40,0 00
60,0 00
80,0 00

100, 000
100 200 300 400 500 600 700
RESID
3.2.Kiểm định White:
Heteroskedasticity Test: White
F-statistic 2.069368 Prob. F(20,705) 0.0040
Obs*R-squared 40.25687 Prob. Chi-Square(20) 0.0046
Scaled explained SS 695.1153 Prob. Chi-Square(20) 0.0000
Test Equation:
Dependent Variable: RESID^2
Method: Least Squares
Date: 12/03/11 Time: 14:18
Sample: 2 727
Included observations: 726
Variable Coefficient Std. Error t-Statistic Prob.
C -1.79E+08 1.21E+08 -1.479583 0.1394
X1-R0*X1(-1) 14556753 7822489. 1.860885 0.0632
(X1-R0*X1(-1))^2 -198375.4 119429.8 -1.661022 0.0972
(X1-R0*X1(-1))*(D1-
R0*D1(-1)) 319700.7 5949829. 0.053733 0.9572
24
(X1-R0*X1(-1))*(D10-
R0*D10(-1)) 4472725. 3984204. 1.122615 0.2620
(X1-R0*X1(-1))*(D11-
R0*D11(-1)) 5490283. 3627532. 1.513504 0.1306
(X1-R0*X1(-1))*(D12-
R0*D12(-1)) -3989271. 3407303. -1.170800 0.2421
D1-R0*D1(-1) 2.08E+08 2.98E+08 0.698160 0.4853
(D1-R0*D1(-1))^2 52968950 2.57E+08 0.206341 0.8366
(D1-R0*D1(-1))*(D10-

R0*D10(-1)) 57201048 1.35E+08 0.423456 0.6721
(D1-R0*D1(-1))*(D11-
R0*D11(-1)) 1.79E+08 1.46E+08 1.224149 0.2213
(D1-R0*D1(-1))*(D12-
R0*D12(-1)) -3.01E+08 2.25E+08 -1.338946 0.1810
D10-R0*D10(-1) -88679990 1.78E+08 -0.498755 0.6181
(D10-R0*D10(-1))^2 -46760003 1.56E+08 -0.298792 0.7652
(D10-R0*D10(-1))*(D11-
R0*D11(-1)) 92959536 83780572 1.109560 0.2676
(D10-R0*D10(-1))*(D12-
R0*D12(-1)) 62798175 1.03E+08 0.611658 0.5410
D11-R0*D11(-1) 10152782 1.74E+08 0.058499 0.9534
(D11-R0*D11(-1))^2 -32810463 1.49E+08 -0.219675 0.8262
(D11-R0*D11(-1))*(D12-
R0*D12(-1)) -1.60E+08 80688053 -1.987994 0.0472
D12-R0*D12(-1) 52459472 1.42E+08 0.369536 0.7118
(D12-R0*D12(-1))^2 23616345 1.42E+08 0.165893 0.8683
R-squared 0.055450 Mean dependent var 65858330
Adjusted R-squared 0.028654 S.D. dependent var 3.91E+08
S.E. of regression 3.85E+08 Akaike info criterion 42.40326
Sum squared resid 1.04E+20 Schwarz criterion 42.53595
Log likelihood -15371.38 Hannan-Quinn criter. 42.45447
F-statistic 2.069368 Durbin-Watson stat 1.271698
25

×