Bộ mơn Kinh tế lượng – Học viện Tài chính
Nội dung
1.1. Phân tích hồi quy
1.2. Số liệu trong phân tích hồi quy
1.3. Hồi quy tổng thể
1.4. Sai số ngẫu nhiên
1.5. Hồi quy mẫu
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
2
1.1. Phân tích hồi quy
1.1.1. Bản chất của phân tích hồi quy
Thuật ngữ “regression” - hồi quy do Francis Galton đề cập lần đầu vào năm 1886
trong bài báo nghiên cứu chiều cao của những đứa trẻ có cha mẹ cao và thấp
khơng bình thường. Khi đó ơng sử dụng thuật ngữ “regression to mediocrity” -
quy về trung bình.
▪ Khái niệm: Phân tích hồi quy nghiên cứu mối liên hệ phụ thuộc của một biến,
gọi là biến phụ thuộc (dependent variable) vào một hay nhiều biến khác, gọi là
biến độc lập (independent variable), trong đó ước lượng giá trị trung bình (kỳ
vọng) của biến phụ thuộc theo các giá trị xác định của biến độc lập.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
3
1.1. Phân tích hồi quy
▪ Có nhiều cách gọi tên biến
Biến phụ thuộc: Biến được giải thích, biến được dự báo, biến được hồi quy,
biến phản ứng, biến nội sinh.
Biến độc lập: Biến giải thích, biến dự báo, biến hồi quy, biến tác nhân, biến
kiểm soát, biến ngoại sinh.
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
4
1.1. Phân tích hồi quy
▪ Ví dụ: Giả sử dự đốn mức tiêu dùng trung bình hàng tuần của hộ gia đình
trong một khu dân cư khi biết thu nhập khả dụng (Nguồn: Gujarati, trang 38)
▪ Các biến nghiên cứu:
Biến phụ thuộc Y: Chi tiêu hàng tuần của hộ gia đình (đơn vị: USD).
Biến độc lập X: Thu nhập khả dụng hàng tuần của hộ gia đình (đơn vị:
USD).
Mẫu nghiên cứu: Số liệu chi tiêu và thu nhập của 60 hộ gia đình. Kết quả
được phân nhóm tương đối và sắp xếp theo thu nhập tăng dần.
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
5
1.1. Phân tích hồi quy
Bảng 1.1: Số liệu thu thập theo tuần được sắp tăng dần theo thu nhập
Thu nhập
X
80
100
120
140
160
180
200
220
240
260
Tiêu dùng
55
65
79
80
102
110
120
135
137
150
của các hộ
60
70
84
93
107
115
136
137
145
152
65
74
90
95
110
120
140
140
155
175
70
80
94
103
116
130
144
152
165
178
75
85
98
108
118
135
145
157
175
180
113
125
140
160
189
185
gia đình Y
($)
88
115
162
191
Tổng
325
462
445
707
678
750
685
1043
966
1211
E(Y/Xi)
65
77
89
101
113
125
137
149
161
173
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
6
1.1. Phân tích hồi quy
Bảng 1.2: Xác suất có điều kiện của tiêu dùng theo các mức thu nhập
X
P(Y/Xi)
80
100
120
140
160
180
200
220
240
260
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/5
1/6
1/5
1/7
1/6
1/6
1/5
1/7
1/6
1/7
1/7
1/6
1/6
1/7
1/6
1/7
1/6
1/7
E(Y/Xi)
1/3/2021
65
77
89
101
1/7
113
125
137
149
Bộ môn Kinh tế lượng – Học viện Tài chính
1/7
161
173
7
1.1. Phân tích hồi quy
Tiêu dùng theo tuần ($)
Điểm trung bình có điều kiện
Mật độ phân phối xác suất của tiêu
dùng ứng với mức thu nhập 220 $
Thu nhập theo tuần ($)
Hình 1.1: Hàm mật độ xác suất của Y với từng giá trị thu nhập X
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
8
1.1. Phân tích hồi quy
▪ Kết quả nghiên cứu:
Như vậy ứng với mức thu nhập hàng tuần xác định tiêu dùng của hộ gia
đình sẽ là một khoảng, dao động quanh giá trị trung bình.
Khi thu nhập hàng tuần tăng thì tiêu dùng của gia đình cũng tăng nhưng
mức tăng của tiêu dùng luôn nhỏ hơn thu nhập (hệ số góc lớn hơn 0, nhỏ
hơn 1). Điều này phù hợp với lý thuyết kinh tế.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
9
1.1. Phân tích hồi quy
▪ Một số mối quan hệ kinh tế khác
Lượng cầu của người tiêu dùng về một hàng hóa (ký hiệu Y) phụ thuộc vào
giá của hàng hóa đó (X).
Tỷ lệ thay đổi của tiền lương (Y) phụ thuộc vào tỷ lệ thất nghiệp (X).
Tỷ lệ tiền mặt nắm giữ trong tổng thu nhập (Y) phụ thuộc vào tỷ lệ lạm phát
(X).
Mức cầu về một mặt hàng (Y) phụ thuộc mức chi cho quảng cáo (X).
Sản lượng của một loại nông sản (Y) phụ thuộc lượng phân bón, lượng mưa,
nhiệt độ, v.v…
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
10
1.1. Phân tích hồi quy
1.1.2. Mục đích của phân tích hồi quy
Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị xác định của
biến độc lập.
Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc
và biến độc lập mà lý thuyết kinh tế đưa ra.
Dự báo giá trị trung bình và giá trị cá biệt của biến phụ thuộc ứng với giá trị
dự đoán của các biến độc lập phù hợp với mẫu.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
11
1.1. Phân tích hồi quy
1.1.3. Phân tích hồi quy và các mối quan hệ khác
Phân tích hồi quy và quan hệ hàm số (functional relationship)
Phân tích hồi quy và phân tích tương quan (correlation analysis)
Phân tích hồi quy và quan hệ nhân quả (causation relationship)
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
12
1.2. Số liệu trong phân tích hồi quy
▪ Các loại số liệu:
Số liệu chuỗi thời gian (Time series data): Là số liệu thu thập về một đối
tượng tại nhiều thời điểm.
Số liệu chéo (Undate - Cross section data): Là số liệu thu thập về nhiều đối
tượng tại một thời điểm.
Số liệu kết hợp: Kết hợp hai loại số liệu trên, là số liệu thu thập về nhiều đối
tượng tại nhiều thời điểm. Số liệu bảng (Panel data) là dạng đặc biệt của số
liệu kết hợp.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
13
1.2. Số liệu trong phân tích hồi quy
Bảng 1.2. Tốc độ tăng trưởng GDP của Việt Nam qua các năm
Năm
1995
1996
1997
1998
1999
2000
2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015
2016
2017
GDP (%)
9.5
9.3
8.2
5.8
4.8
6.8
6.9
7.1
7.3
7.8
8.4
8.2
8.48
6.18
5.32
6.78
5.89
5.25
5.42
5.98
6.68
6.21
6.81
Nguồn Tổng cục Thống kê
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
14
1.2. Số liệu trong phân tích hồi quy
Bảng 1.3. Chỉ số giá tiêu dùng của các mặt hàng của Việt Nam
Chỉ tiêu
Chỉ số giá tiêu dùng
Hàng ăn và dịch vụ ăn uống
Lương thực
Thực phẩm
Ăn uống ngồi gia đình
Đồ uống và thuốc lá
May mặc, giày dép mũ nón
Nhà ở và vật liệu xây dựng
Thiết bị và đồ dùng gia đình
Thuốc và dịch vụ y tế
Giao thơng
Bưu chính viễn thơng
Giáo dục
Văn hóa, giải trí và du lịch
Đồ dùng và dịch vụ khác
Tháng 1/2019
0.1
0.66
0.52
0.85
0.28
0.69
0.39
0.35
0.16
0.01
-3.04
-0.09
0.15
0.33
0.34
Đơn vị tính: %- Nguồn Tổng cục Thống kê
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
15
1.2. Số liệu trong phân tích hồi quy
Bảng 1.4. Dữ liệu về 29 doanh nghiệp xây dựng niêm yết trên sàn chứng khoán VN
Đơn vị tính: % - Nguồn: Tổng hợp từ BC của các doanh nghiệp
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
16
1.2. Số liệu trong phân tích hồi quy
▪ Nguồn gốc của số liệu
Số liệu từ các nguồn được phát hành như: Niên giám thống kê, tạp
chí,…hoặc có thể do các cơ quan Nhà nước, các tổ chức quốc tế, các công ty
tư nhân thu thập.
Số liệu từ các cuộc điều tra thực tế hoặc đi mua.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
17
1.2. Số liệu trong phân tích hồi quy
▪ Bản chất chung của số liệu kinh tế - xã hội
Phần lớn là các số liệu phi thực nghiệm nên mức độ tin cậy không cao.
Đối với kinh tế học nói riêng và khoa học xã hội nói chung rất khó bố trí thí
nghiệm có kiểm sốt.
✓ Kết quả các nghiên cứu khơng chỉ phụ thuộc vào mơ hình được lựa chọn mà
còn phụ thuộc rất nhiều vào chất lượng của số liệu.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
18
1.2. Số liệu trong phân tích hồi quy
▪ Hạn chế của số liệu
Hầu hết số liệu trong kinh tế là số liệu phi thực nghiệm nên độ tin cậy
không cao.
Các cuộc điều tra bằng bảng hỏi khó nhận được câu trả lời chính xác hoặc
các câu hỏi khơng được trả lời hết.
Các mẫu thu thập trong các cuộc điều tra khác nhau thường khác nhau về
kích thước nên khó khăn trong việc so sánh hoặc kết hợp kết quả giữa các
đợt điều tra.
Các số liệu kinh tế thường đã được tổng hợp, không cho phép đi sâu vào
phân tích các đơn vị nhỏ.
Có những số liệu thuộc bí mật quốc gia nên khơng tiếp cận và thu thập
được.
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
19
1.3. Hồi quy tổng thể
1.1.3. Hàm hồi quy tổng thể
Tổng thể (Population) là toàn bộ tập hợp các phần tử đồng nhất theo một
dấu hiệu nghiên cứu định tính hoặc định lượng nào đó.
Giả sử một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu
X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y), có bảng phân phối xác
suất đồng thời như sau:
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
20
1.3. Hồi quy tổng thể
Bảng 1.5. Phân phối xác suất đồng thời của X và Y.
X1
X2
…
Xk
Y1
P(Y1,X1)
P(Y1,X2)
…
P(Y1,Xk)
Y2
P(Y2,X1)
P(Y2,X2)
…
P(Y2,Xk)
…
…
…
P(Yh,Xk)
…
Yh
h
P(Yh,X1)
k
P(Yh,X2)
P(Y , X ) = 1;
j =1 i =1
1/3/2021
j
i
P(Y j , X i ) 0 j = 1, h; i = 1, k ;
Bộ mơn Kinh tế lượng – Học viện Tài chính
21
1.3. Hồi quy tổng thể
▪ Bảng phân phối xác suất có điều kiện của Y theo Xi
(Y / X i )
Y1
P(Y / X i )
P(Y1 / X i )
Y2
P(Y2 / X i )
( i = 1, k )
…
Yh
…
P(Yh / X i )
▪ Kỳ vọng toán của Y với điều kiện của Xi:
h
E (Y / X i ) = Y j . P(Y j / X i )
j =1
X = X i ! E (Y /X i ) E (Y / X i ) = f ( X i ) (i = 1, k )
E(Y/X) là hàm số biểu diễn sự phụ thuộc của giá trị trung bình của Y theo X,
gọi là hàm hồi quy tổng thể (Population Regression Function - PRF).
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
22
1.3. Hồi quy tổng thể
▪ Ví dụ 1:
X
Y
Y│X1
P
2
3
P(Y)
1
0.1
0.4
0.6
2
0.3
0.1
0.4
P(X)
0.5
0.5
1.0
Y1
Y2
P(Y1│X1) = 2/5 P(Y2│X1) = 3/5
Y│X2
Y1
Y2
P
P(Y1│X2) = 4/5
P(Y2│X2) = 1/5
2
3 8
E (Y | X 1 ) = Y1.P(Y1 | X 1 ) + Y2 .P(Y2 | X 1 ) = 1. + 2. =
5
5 5
4
1 6
E (Y | X 2 ) = Y1.P(Y1 | X 2 ) + Y2 .P(Y2 | X 2 ) = 1. + 2. =
5
5 5
1/3/2021
Bộ môn Kinh tế lượng – Học viện Tài chính
23
1.3. Hồi quy tổng thể
Nếu hàm hồi quy tổng thể có một biến độc lập thì gọi là hàm hồi quy đơn -
Simple regression: E(Y/Xi) = f(Xi)
Nếu hàm hồi quy tổng thể có nhiều hơn một biến độc lập thì gọi là hàm hồi
quy bội - Multiple regression: E(Y/X1i, X2i,…) = f(X1i, X2i, …)
Giả sử hàm hồi quy có dạng tuyến tính: E (Y / X ) = + X
i
1
2 i
trong đó:
1 = E (Y / X i = 0) là hệ số chặn (intercept coefficient)
dE (Y / X )
2 =
là hệ số góc (slope coefficient)
dX
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
24
1.3. Hồi quy tổng thể
1.3.2. Mơ hình hồi quy tổng thể
Nếu hàm hồi quy tổng thể là tuyến tính thì mơ hình hồi quy tổng thể tương
ứng có dạng tuyến tính (Population Regression Model - PRM).
Yi = 1 + 2 X i + U i
PRM:
(i = 1 N )
Mơ hình hồi quy tuyến tính được hiểu là mơ hình có dạng tuyến tính đối
với các tham số, nên mơ hình có thể là tuyến tính hoặc phi tuyến đối với các
biến số. Ví dụ một số dạng mơ hình hồi quy tuyến tính:
Yi = 1 + 2 X i2 + U i ; Yi = 1 + 2 X i−1 + U i ; Ln(Yi ) = 1 + 2 X i + U i ;
Yi = 1 + 2 Ln( X i ) + U i ; Ln(Yi ) = 1 + 2 Ln( X i ) + U i ;...
1/3/2021
Bộ mơn Kinh tế lượng – Học viện Tài chính
25