HỒI QUY HÀM HAI BIẾN (HỒI QUY ĐƠN)
Chương 1:
1. PHÂN TÍCH HỒI QUY
2. MÔ HÌNH HỒI QUY
2.1 HÀM HỒI QUY TỔNG THỂ
2.2 HÀM HỒI QUY MẪU
2.3 PHƯƠNG PHÁP BÌNH PHƯƠNG BÉ NHẤT (OLS)
4. CÁC GIẢ THIẾT CỦA MÔ HÌNH
3. TÍNH CHẤT HÀM HỒI QUY
PHÂN TÍCH HỒI QUY
- Biến quan hệ thống kê về quan hệ hàm số
- Phân tích hồi quy là nghiên cứu sự phụ thuộc của một
biến (biến phụ thuộc) vào một hay nhiều biến khác
(biến độc lập)
- Dùng để ước lượng và dự đoán giá trị trung bình của
biến phụ thuộc khi biết giá trị các biến độc lập
Chú ý
- Biến độc lập là biến không ngẫu nhiên, nó có giá trị xác
định trước.
- Biến phụ thuộc là biến ngẫu nhiên có phân phối xác
suất, nghĩa là ứng với mỗi giá trị của biến độc lập, biến
phụ thuộc có thể nhận nhiều giá trị khác, nhưng các giá
trị này tuân theo 1 quy luật phân phối nhất định, thường
là phân phối chuẩn
Bảng 1 : Thu nhập và tiêu dùng của một địa phương
Thu
nhập
80 100 120 140 160 180 200
Tiêu
dùng
55 65 79 80 102 110 120
60 70 84 93 107 115 136
65 74 90 95 110 120 140
70 80 94 103 116 130 144
75 85 98 108 118 135 145
88 113 125 140
115
PHÂN TÍCH HỒI QUY
MÔ HÌNH HỒI QUY TỔNG THỂ
- Với mỗi quy luật tương ứng, ta có một mô hình
- Hàm hồi quy tổng thể luôn chứa các tham số mà ta
phải ước lượng (ta chỉ biết dạng hàm)
Trước hết, ta xét PRF có dạng tuyến tính sau
( )
1 2
|
β β
= + +
E Y X X U
1 2
,
β β
là các tham số cần ước lượng
2
β
1
β
gọi là hệ số tự do hay hệ số chặn
gọi là hệ số góc (nó cho biết tỷ lệ thay đổi của Y
đối với X)
U
MÔ HÌNH HỒI QUY TỔNG THỂ
Đại lượng nhiễu,
xuất hiện với
các lý do sau
Chú ý: tuyến tính theo tham số
Sai số dụng cụ đo
Do chọn mô hình sau
Bỏ xót các biến cần thiết
Do các yếu tố không
kiểm soát được
( )
1 2
|
β β
= + +
E Y X X U
1 2
ˆ ˆ
,
β β
e
µ
1 2
ˆ ˆ
β β
= + +
Y X e
1 2
,
β β
U
ˆ
= −
i i i
e Y Y
MÔ HÌNH HỒI QUY MẪU
- Ứng với mỗi PRF ta có một SRF tương ứng với dạng
hàm của PRF
- SRF dùng để ước lượng cho PRF chưa biết
Với PRF có dạng
SRF có dạng
Trong đó
là các ước lượng điểm của
là ước lượng điểm của
và e
i
(phần dư):
µ
Y
là ước lượng điểm của
( )
|E Y X
1 2
( | )E Y X X
β β
= +
1
β
1 2 3 4
X X X X
1
Q
2
Q
3
Q
4
Q
Nếu Q nằm trên đường thẳng thì ta có thể xác định
được PRF
PRF VÀ SRF
1 2
( | )E Y X X
β β
= +
1
β
1 2 3 4
X X X X
1
P
2
P
3
P
4
P
U
1
U
Trong thực tế ta chỉ quan sát được giá trị, các điểm P
Giữa PRF và dữ liệu thực tế bao giờ cũng có sai số
PRF VÀ SRF
1 2
ˆ ˆ ˆ
Y X
β β
= +
1
ˆ
β
1 2 3 4
X X X X
1
P
1 2
( | )E Y X X
β β
= +
1
β
1
Q
( )
1 1 1 1 1 1 1 2 1
ˆ ˆ
ˆ
β β
= = − = − +
e Q P Y Y Y X
1 2
ˆ ˆ
ˆ
( )
β β
= = − = − +
i i i i i i i
e Q P Y Y Y X
i
Q
i
P
1
e
U
e
Tìm 1 đường thẳng xấp xỉ cho dữ liệu thực tế
Khoảng cách P và Q là phần dư e, ước lượng cho sai số U
PRF VÀ SRF
Theo phương pháp OLS, để
i
Y
ˆ
càng gần với Y
i
thì
21
ˆ
,
ˆ
ββ
cần thỏa mãn :
µ µ
2 2
1 2
1 1
ˆ ˆ
( ) min
n n
i i i
i i
RSS e Y X
β β
= =
= = − − →
∑ ∑
Suy ra
µ µ
1 2
ˆ ˆ
,
β β
cần thỏa mãn :
=−−−=
∂
∂
=−−−=
∂
∂
∑
∑
∑
∑
=
=
=
=
n
1i
ii21i
2
n
1i
2
i
n
1i
i21i
1
n
1i
2
i
0)X)(X
ˆˆ
Y(2
ˆ
e
0)1)(X
ˆˆ
Y(2
ˆ
e
ββ
β
ββ
β
PHƯƠNG PHÁP OLS
µ µ µ
1
2 1 2
2 2
1
ˆ ˆ ˆ
( )
n
i i
i
n
i
i
X Y nX Y
Y X
X n X
β β β
=
=
−
= = −
−
∑
∑
Giải hệ, ta có :
1
2 2 2
1 1
( )
n
i i i i
i
n n
i i
i i
x y X Y nX Y
x X n X
= =
= =
= −
= −
∑ ∑
∑ ∑
n
i 1
i i
i i
x X X
y Y Y
= −
= −
Có thể chứng minh được :
với
PHƯƠNG PHÁP OLS
Nên có thể biểu diễn :
µ
2
2
β
=
∑
∑
i i
i
x y
x
Ví dụ 1: Giả sử cần nghiên cứu chi tiêu
tiêu dùng của hộ gia đình phụ thuộc thế
nào vào thu nhập của họ, người ta tiến
hành điều tra, thu được một mẫu gồm
10 hộ gia đình với số liệu như sau :
PHƯƠNG PHÁP OLS
Y 70 65 90 95 110 115 120 140 155 150
X 80 100 120 140 160 180 200 220 240 260
Trong đó : Y – chi tiêu hộ gia đình
(USD/tuần)
X – thu nhập hộ gia đình
(USD/tuần)
Giả sử Y và X có quan hệ tuyến tính. Hãy
ước lượng mô hình hồi qui của Y theo X.
PHƯƠNG PHÁP OLS
1 2
ˆ ˆ
Y X
β β
= +
( , )X Y
ˆ
=
Y Y
CÁC TÍNH CHẤT CỦA MÔ HÌNH
- SRF luôn đi qua điểm nghĩa là
-
Các tính chất trên có thể kiểm tra trực tiếp hoặc
bằng các số liệu cụ thể
1
1
0
=
= =
∑
n
i
i
e e
n
1
0,
=
=
∑
n
i i
i
e X
1
ˆ
0
=
=
∑
n
i i
i
eY
•
Giả thiết 1 : Biến độc lập X
i
là phi
ngẫu nhiên, các giá trị của chúng phải
được xác định trước.
•
Giả thiết 2 : Kỳ vọng có điều kiện của
sai số ngẫu nhiên bằng 0 :
E (U
i
/ X
i
) = 0 ∀i
CÁC GỈA THIẾT CỔ ĐIỂN CỦA
MÔ HÌNH HỒI QUI TUYẾN TÍNH
•
Giả thiết 3 : (Phương sai thuần nhất ) Các sai số
ngẫu nhiên có phương sai bằng nhau :
Var (U
i
/ X
i
) = σ
2
∀i
•
Giả thiết 4 : Không có hiện tượng tương quan giữa
các sai số ngẫu nhiên : Cov (U
i
, U
j
) = 0 ∀ i ≠ j
•
Giả thiết 5 : Không có hiện tượng tương quan giữa
biến độc lập X
i
và sai số ngẫu nhiên U
i
:
Cov (X
i
, U
i
) = 0 ∀ i
•
Giả thiết 6:
•
Giả thiết 7:
CÁC GỈA THIẾT CỔ ĐIỂN CỦA
MÔ HÌNH HỒI QUI TUYẾN TÍNH
Y
i
~ N (β
1
+ β
2
X
i
, σ
2
)
2
(0, )
σ
:
i
U N
GIẢ THUYẾT MÔ HÌNH
B
B
L
L
U
U
E
E
: The Best
: The Best
: Linear
: Linear
: Unbias
: Unbias
: Estimate
: Estimate
Định lý Gauss – Markov : Với các giả thiết từ 1
đến 5 của mô hình hồi qui tuyến tính cổ điển, các
ước lượng OLS là các ước lượng tuyến tính,
không chệch và có phương sai bé nhất trong lớp
các ước lượng tuyến tính, không chệch.
Nếu mô hình thoả mãn G1 – G5 thì mô hình được gọi
là có tính chất BLUE
TÍNH CHẤT CỦA CÁC HỆ SỐ HỒI QUY
ˆ
( ) , 1,2.
i i
E i
β β
= =
ˆ ˆ
( ,var( )), 1 ( )2 1, .
i i i
N i
β β β
=
:
µ
2
2
2
( 2)
( 2)
n
n
σ
χ
σ
−
−
:
1. Được xác định duy nhất ứng với mỗi mẫu
gồm n cặp quan sát (X
i
, Y
i
)
2. Là các ước lượng điểm cho các tham số mô
hình, tức là
3. Có phân phối xác suất
Trong đó : σ
2
= var (U
i
). Do σ
2
chưa biết nên
dùng ước lượng của nó là
Phương sai Sai số chuẩn
1
2
1
2
1
2
2
2 2
ˆ
2
2 2
2
2
2
ˆ ˆ
1 1
2
2
2
ˆ ˆ
2
ˆ
22
2
(2)
(3)
ˆ ˆ
( ) 1 ( )
ˆ ˆ
( ) (
1
)
i
i
Xi
X
X
n
X
Var se
n S
Var se
nS
x
x
ββ
ββ
β
β
σ σ
σ σ
σ
β β σ σ
σ
β β σ σ
÷
+ = =
÷
= = =
= = =
= =
∑
∑
∑
2
2 2 2
,
ˆ
(1 )
2 2
(4)
i
X Y Y
e
n
r S
n n
σ
= = −
− −
∑
TÍNH CHẤT CỦA CÁC HỆ SỐ HỒI QUY
TÍNH CHẤT CỦA CÁC HỆ SỐ HỒI QUY
ˆ
ˆ ˆ
( ,var( )) (0,1 )
)
(5)
ˆ
(
i i
i i i
i
N Z N
se
β β
β β β
β
−
⇒ =
: :
ˆ
( 2)
(
(
ˆ
)
6)
i i
i
T St n
se
β β
β
−
= −
:
Số tham số có trong mô hình
Phương sai tổng thể ước lượng bởi phương sai
mẫu, khi đó (5) trở thành
Từ (1) theo định lý trong xác suất, ta có
1. ĐÁNH GIÁ ĐỘ PHÙ HỢP CỦA MÔ HÌNH
2. TÌM KHOẢNG TIN CẬY CHO CÁC HỆ SỐ HỒI
QUY
3. KIỂM ĐỊNH GIẢ THUYẾT
4. BÀI TOÁN DỰ BÁO
5. VÍ DỤ TỔNG HỢP
CÁC BÀI TOÁN
6. ỨNG DỤNG PHẦN MỀM EVIEWS
1 2
ˆ ˆ ˆ
Y X
β β
= +
( , )
i i
X Y
ˆ
i
Y
Y
µ
= −
i
i i
e Y Y
−
i
Y Y
ˆ
i
Y Y
−
Với n bộ số liệu ta xây dựng các hệ số xác đònh sau
Với n bộ số liệu ta xây dựng các hệ số xác đònh sau
i
Y
1. Các hệ số :
ĐÁNH GIÁ ĐỘ PHÙ HỢP CỦA MƠ HÌNH
2 2
1
( )
i
i
Y
n
TSS nSY Y
=
= − =
∑
2 2 2
2
1
ˆ
( )
ˆ
n
i
i
X
ESS nY SY
β
=
= − =
∑
( )
2 22 2
1 1
,
ˆ
( ) 1
n
X Yi Y
n
i i
i i
Y Y eRSS n r S
= =
= − = = −
∑ ∑
X
2 2
,
1
= = − =
X Y
ESS RSS
R r
TSS TSS
Miền xác định của R
2
:
0 ≤ R
2
≤ 1
R
2
1 : hàm hồi qui càng phù hợp.
R
2
0 : hàm hồi qui càng ít phù hợp
ĐÁNH GIÁ ĐỘ PHÙ HỢP CỦA MÔ HÌNH
2. Hệ số xác định mô hình
Ý nghĩa của R
2
- Cho biết mô hình xấp xỉ bao nhiêu % bộ số liệu
(độ phù hợp của mô hình)
- So sánh hai mô hình có cùng số biến độc lập (có
thể khác dạng hàm)
Ví dụ: Bảng sau cho biết số liệu về
doanh thu (X: tỷ USD) và lợi nhuận
(Y: triệu USD)
X 37 17 21 30 28 13 26 10 18 12 14 15
Y 629 180 349 453 757 191 490 90 243 168 90 100
ĐÁNH GIÁ ĐỘ PHÙ HỢP CỦA MÔ HÌNH
R
2
= 0.806749
µ
169.38545 23.95280= − +Y X
3. Hệ số tương quan : Là số đo mức độ
chặt chẽ của quan hệ tuyến tính giữa
X và Y.
2 2 2 2
( )( )
( ) ( )
− −
= =
− −
∑ ∑
∑ ∑ ∑ ∑
i i i i
i i i i
X X Y Y x y
r
X X Y Y x y
2
r R
=
µ
2
ˆ
β
Và dấu của r trùng với dấu của hệ số của
X trong hàm hồi qui
Chứng minh được :
ĐÁNH GIÁ ĐỘ PHÙ HỢP CỦA MÔ HÌNH