Tải bản đầy đủ (.doc) (39 trang)

Bài giảng kinh tế lượng cơ bản

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (311.5 KB, 39 trang )

Phần I Kinh tế lượng cơ bản
Mở đầu
1.Khái niệm về Kinh tế lượng
Kinh tế lượng là môn khoa học bao gồm toán kinh tế, thống kê, lý thuyết kinh tế, với
mục đích là tìm ra kết quả định lượng, thực nghiệm cho các lý thuyết kinh tế và kiểm
chứng lại các kết quả mà lý thuyết kinh tế đã đưa ra.
Về ý nghĩa: Econometrics = Econo + metrics = Kinh tế + Đo lường
Mục tiêu nghiên cứu : Là các mối quan hệ giữa các biến số kinh tế, các quá trình kinh tế
xã hội, các mối quan hệ xảy ra giữa các đối tượng, các chủ thể, các yếu tố kinh tế xã
hội.
Công cụ sử dụng chủ yếu : Là các mô hình gọi là các mô hình kinh tế lượng.
Kết quả : Là kết quả định lượng, sử dụng kết quả là những con số để trả lời các câu hỏi,
đưa ra khuyến nghị, dự báo, đánh giá chính sách, phân tích tác động,… trong kinh tế.
Kiến thức nền tảng cần phải trang bị trước khi học kinh tế lượng, đó là: Kinh tế học
(Kinh tế vi mô + vĩ mô), Mô hình toán kinh tế, Xác suất thống kê toán, tin học.
2.Phương pháp luận
+) Đặt giả thiết về vấn đề nghiên cứu
+) Xây dựng mô hình (dựa trên các luận thuyết kinh tế hay các mô hình lý thuyết kinh
tế đã đưa ra)
+) Thu thập số liệu và ước lượng các hệ số của mô hình
+) Kiểm định, đánh giá và phân tích mô hình
+) Sử dụng kết quả để phân tích và dự báo về kinh tế hay khuyến nghị chính sách.
3.Số liệu để phân tích
Số liệu được dùng để phân tích trong môn Kinh tế lượng là số liệu thống kê về kinh tế
và bao gồm các loại số liệu sau
-) Số liệu theo thời gian (chuỗi thời gian)
-) Số liệu không gian (hay số liệu chéo)
-) Số liệu hỗn hợp (theo cả thời gian và không gian).
Yêu cầu về số liệu: Đó là số liệu được điều tra ngẫu nhiên,phi thực nghiệm, phù hợp
với mục đích và đối tượng nghiên cứu.
Nguồn số liệu: Số liệu được thu thập qua các cuộc điều tra (khảo sát) hay được cung


cấp bởi các cơ quan chuyên môn (như tổng cục thống kê…).

Chương 1
Mô hình kinh tế lượng
1. Phân tích hồi quy
Phân tích hồi quy là phân tích mối liên hệ phụ thuộc giữa một biến (gọi là biến phụ
thuộc,biến được giải thích, biến nội sinh,…) phụ thuộc vào một (hay một số) biến gọi là
biến độc lập, biến giải thích hay biến ngoại sinh, biến hồi quy,…
+) Biến phụ thuộc ký hiệu là Y
+) Biến độc lập ký hiệu là X, hay X
1
, X
2
,…,X
k
(k nguyên dương)
- Các biến độc lập là các biến không ngẫu nhiên, giá trị của chúng được cho trước.
Trong điều kiện đó biến phụ thuộc là một biến ngẫu nhiên có quy luật phân phối xác
suất xác định.
+ Hàm
( / ) ( )E Y X f X=
gọi là hàm hồi quy đơn - Simple regression (hàm hồi quy
có một biến độc lập).
+ Hàm
1 2 1 2
( / , , , ) ( , , , )
k k
E Y X X X f X X X=
gọi là hàm hồi quy bội-
Multiple regression (hàm hồi quy có hơn một biến độc lập).

- Mục đích của phân tích hồi quy:
+ Ước lượng giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập, tức
là phải ước lượng các tham số của mô hình.
+ Kiểm định các giả thuyết về bản chất của mối quan hệ giữa biến phụ thuộc và biến
độc lập mà lý thuyết kinh tế đưa ra. Trong trường hợp này phải trả lời hai câu hỏi:

) Có tồn tại quan hệ giữa biến phụ thuộc và biến độc lập hay không?

) Nếu tồn tại quan hệ thì mức độ chặt chẽ như thế nào?
+ Dự báo giá trị trung bình của biến phụ thuộc khi biết giá trị của biến độc lập.
2. Mô hình hồi quy đơn (hay mô hình hồi quy 2 biến)
2.1. Mô hình hồi quy tổng thể
- Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu định tính hoặc
định lượng nào đó được gọi là tổng thể nghiên cứu hay tổng thể.
- Giả sử có một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu nghiên cứu: X, Y
tạo thành một biến ngẫu nhiên hai chiều (X, Y).
- Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất:
+ Bảng phân phối xác suất đồng thời của X và Y:
X
Y
x
1
x
2
x
k
y
1
p(x
1

,

y
1
) p(x
2
,

y
1
) p(x
k
,

y
1
)
y
2
p(x
1
, y
2
) p(x
2
, y
2
) p(x
k
,


y
2
)
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
y
h
p(x
1
,

y
h
) p(x
2
,


y
h
) p(x
k
,

y
h
)
1 1
( , ) 1
k h
i j
i j
p x y
= =
=
∑∑
Các bảng phân phối xác suất có điều kiện của Y theo X
i
( 1 )i k= ÷
Y/(X = X
i
) y
1
y
2
y
h

( / )
i
Y X
P
P[(Y= y
1
)/X
i
] P[(Y= y
2
)/X
i
] P[(Y = y
h
)

/X
i
]
Kỳ vọng toán của Y với điều kiện của X = X
i
1
( / ) [( ) / ]
h
i j j i
j
E Y X y P Y y X
=
= =


hay
1 2
( / ) ( 1 )
i i
E Y X X i k
β β
= + = ÷

( / ) ( )
i i
E Y X f X=
hoặc
( / ) ( )E Y X f X=
là một hàm số và gọi là hàm hồi quy
tổng thể của Y đối với X (Population Regression Function – PRF). Nó cho biết giá trị
trung bình của Y thay đổi như thế nào theo X.
Giả sử PRF có dạng tuyến tính

1 2
( / ) ;( 1 )
i i
E Y X X i k
β β
= + = ÷
hoặc
1 2
( / )E Y X X
β β
= +
Trong đó

1 2
,
β β
gọi là các hệ số hồi quy (Regression Coefficient):
+) Hệ số
1
( / 0)
i
E Y X
β
= =
gọi là hệ số chặn (Intercept - INPT) hệ số này cho biết
giá trị trung bình của biến phụ thuộc Y khi biến X = 0.
+) Hệ số
2
( / )E Y X
X
β

=

gọi là hệ số góc (Slope) hệ số này cho biết khi X tăng lên
1 đơn vị thì giá trị trung bình của Y thay đổi như thế nào.
- Ứng với mỗi giá trị cá biệt Y
i
của Y ta có:

1 2
( 1 )
i i i

Y X u i N
β β
= + + = ÷

gọi là mô hình hồi quy tổng thể (Population Regression Model – PRM).
Với
( / )
i i i
u Y E Y X= −
gọi là sai số ngẫu nhiên (Random error), phản ánh chênh lệch
giữa giá trị cá biệt của Y với giá trị trung bình của Y.
- Sai số ngẫu nhiên u
i
đại diện cho tất cả những yếu tố không phải biến độc lập có trong
mô hình nhưng cũng tác động đến biến phụ thuộc, đó là:
+ Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
- Sự tồn tại của sai số ngẫu nhiên là tất yếu khách quan và nó có vai trò đặc biệt quan
trọng trong phân tích hồi quy, nó phải thoả mãn những điều kiện nhất định thì việc
phân tích trên mô hình mới có ý nghĩa.
2.2. Mô hình hồi quy mẫu
- Trong thực tế chúng ta không có được tổng thể hoặc có nhưng không thể (hoặc không
cần thiết) nghiên cứu toàn bộ tổng thể vì vậy không thể tìm được PRF mặc dù dạng của
PRF có thể biết.
- Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra từ tổng thể
theo những nguyên tắc nhất định.
- Giả sử từ tổng thể lập mẫu ngẫu nhiên kích thước n:
W = {(X
i

, Y
i
);
1i n= ÷
}
- Trong mẫu W = {(X
i
, Y
i
):
1i n= ÷
)} tồn tại một hàm số có dạng giống như PRF mô
tả xu thế biến động của trung bình biến phụ thuộc theo biến độc lập, thực chất nó là
một ước lượng điểm của PRF, ký hiệu:

1 2
ˆ ˆ
ˆ
;( 1 )
i i
Y X i n
β β
= + = ÷
gọi là hàm hồi quy mẫu (Sample Regression Function - SRF).
- Trong đó:
1 2
ˆ ˆ
,
β β
gọi là các hệ số hồi quy ước lượng được (Estimated regression

coeffcient), thực chất chúng lần lượt là các ước lượng điểm của
1 2
,
β β

ˆ
i
Y
là các giá
trị ước lượng được (Fitted value), thực chất nó là các ước lượng điểm của E(Y/X
i
).
- Ứng với mỗi giá trị cá biệt của Y ta có:

1 2
ˆ ˆ
;( 1 )
i i i
Y X e i n
β β
= + + = ÷

gọi là mô hình hồi quy mẫu (Sample Regression Model – SRM)
với
ˆ
;( 1 )
i i i
e Y Y i n= − = ÷
gọi là phần dư (Residual), thực chất chúng là các ước
lượng điểm của các sai số ngẫu nhiên u

i
. Các phần dư e
i
phản ánh chênh lệch giữa giá
trị cá biệt Y
i
trong mẫu W với giá trị ước lượng được
ˆ
i
Y
. Bản chất của các phần dư e
i
giống như các sai số ngẫu nhiên u
i
.
Tương ứng với mỗi mẫu rút ra từ tổng thể ta sẽ tìm được một hàm hồi quy mẫu SRF,
tức là có rất nhiều SRF khác nhau mà chúng đều là các ước lượng điểm của PRF, ta cần
tìm SRF nào đại diện tốt nhất cho PRF.
3. Mô hình hồi quy bội (hay mô hình hồi quy k biến)
3.1. Mô hình hồi quy tổng thể
Mô hình hồi quy tổng thể (PRM) và hàm hồi quy tổng thể (PRF) có dạng:
PRM:
1 2 2
1
i i k ki i
Y X X u i N
β β β
= + + + + = ÷L
PRF:
2 1 2 2

( ) ( / , , )
i i ki i k ki
E Y E Y X X X X
β β β
= = + + +L
Trong đó:
Y là biến phụ thuộc

X
1
, X
2
,…,X
k
là các biến độc lập
1
β
gọi là hệ số chặn
2 3
, , ,
k
β β β
gọi là các hệ số góc riêng phần (các hệ số hồi quy tương ứng với
các biến X
1
, X
2
,…,X
k
)

- Giá trị của k cho biết số tham số cần ước lượng của mô hình.
- Hệ số chặn
1 2 3
( / 0)
i i ki
E Y X X X
β
= = = = =
là giá trị trung bình của Y khi
0;( 2 )
mi
X m k= ∀ = ÷
.
- Hệ số
2 3
( / , , , )
;( 2 )
k
m
m
E Y X X X
m k
X
β

= = ÷

cho biết khi X
m
tăng một đơn

vị thì trung bình của Y thay đổi như thế nào trong điều kiện các biến X
j
;

(
j m∀ ≠
)
không thay đổi.
Dạng ma trận của mô hình
Y
X
Y
i
E(Y/X
i
)
X
i
1 2
ˆ ˆ
ˆ
:
i i
SRF Y X
β β
= +
1 2
: ( / )
i i
PRF E Y X X

β β
= +
u
i
ˆ
i
Y
e
i
Đặt: X
i
= (1 X
2i
X
3i
… X
ki
) β =
1
2
k
β
β
β
 
 ÷
 ÷
 ÷
 ÷
 

M
Ta có E(Y
i
) = X
i
β và Y
i
= X
i
β + u
i
Ngắn gọn hơn nếu đặt
Y =
1
2
N
Y
Y
Y
 
 ÷
 ÷
 ÷
 ÷
 
M
; X =
21 1
22 2
2

1
1
1
k
k
N kN
X X
X X
X X
 
 ÷
 ÷
 ÷
 ÷
 ÷
 
L
L
M M O M
L
; β =
1
2
k
β
β
β
 
 ÷
 ÷

 ÷
 ÷
 
M
; u =
1
2
N
u
u
u
 
 ÷
 ÷
 ÷
 ÷
 
M
Thì E(Y) = Xβ và Y = Xβ + u
3.2. Mô hình hồi quy mẫu
Với một mẫu kích thước n:
{ }
2
( , , , ): 1
i i ki
W Y X X i n= = ÷
thì hàm hồi quy mẫu
(SRF) và mô hình hồi quy mẫu (SRM) có dạng:
SRF:
1 2 2

ˆ ˆ ˆ
ˆ
i i k ki
Y X X
β β β
= + + +L
SRM:
1 2 2
ˆ ˆ ˆ
( 1; )
i i k ki i
Y X X e i n
β β β
= + + + + =L

Trong đó:
1 2
ˆ ˆ ˆ
, , ,
k
β β β
là các hệ số hồi quy ước lượng được, thực chất chúng lần lượt là các
ước lượng điểm của
1 2
, , ,
k
β β β
.
ˆ
i

Y
là các giá trị ước lượng được của biến phụ thuộc, thực chất là các ước lượng điểm
của của
2 3
( / , , , )
i i ki
E Y X X X
.
e
i
là các phần dư, thực chất là các ước lượng điểm của các sai số ngẫu nhiên u
i
.
Dạng ma trận
Đặt Y =
1
2
n
Y
Y
Y
 
 ÷
 ÷
 ÷
 ÷
 
M
X =
21 1

22 2
2
1
1
1
k
k
n kn
X X
X X
X X
 
 ÷
 ÷
 ÷
 ÷
 ÷
 
L
L
M M O M
L

ˆ
β
1
2
ˆ
ˆ
ˆ

k
β
β
β
 
 ÷
 ÷
=
 ÷
 ÷
 ÷
 
M
e =
1
2
n
e
e
e
 
 ÷
 ÷
 ÷
 ÷
 
M
Thì SRF và SRM có thể viết dưới dạng
SRF: Ŷ = X
ˆ

β
và SRM: Y = X
ˆ
β
+ e
Chương 2
Ước lượng mô hình
1. Phương pháp bình phương nhỏ nhất
1.1. Ước lượng mô hình hồi quy đơn(hay mô hình hồi quy 2 biến)
Xét mô hình hồi quy đơn dạng tuyến tính
PRF:
1 2
( / )
i i
E Y X X
β β
= +

PRM:
1 2
( 1 )
i i i
Y X u i N
β β
= + + = ÷
Từ tổng thể ta lấy ra một mẫu ngẫu nhiên kích thước n

{ }
( , ); 1
i i

W X Y i n= = ÷
Dựa vào mẫu này ta tìm được một ước lượng điểm của PRF
SRF:
1 2
ˆ ˆ
ˆ
i i
Y X
β β
= +

SRM:
1 2
ˆ ˆ
( 1 )
i i i
Y X e i n
β β
= + + = ÷
Nội dung phương pháp bình phương nhỏ nhất (Least Squares - LS) là
tìm

1 2
ˆ ˆ
,
β β
sao cho
2 2 2
1 2
1 1 1

ˆ ˆ
ˆ
( ) ( ) min
n n n
i i i i i
i i i
e Y Y Y X
β β
= = =
= − = − − →
∑ ∑ ∑
Đặt
2
1 2 1 2
1
ˆ ˆ ˆ ˆ
( , ) ( )
n
i i
i
f Y X
β β β β
=
= − −

khi đó tìm
1 2
ˆ ˆ
,
β β

là nghiệm của hệ phương
trình
1 2
1 2
1
1
1 2
1 2
1
2
1 2 1 2
1 1 1 1
2
1 2 1
1 1 1 1
ˆ ˆ
( , )
ˆ ˆ
0
2 ( ) 0
ˆ
ˆ ˆ
( , )
ˆ ˆ
2 ( ) 0
0
ˆ
1 1
ˆ ˆ ˆ ˆ
1

ˆ ˆ ˆ
n
i i
i
n
i i i
i
n n n n
i i i i
i i i i
n n n n
i i i i i
i i i i
f
Y X
f
X Y X
n X Y X Y
n n
X X X Y X
n
β β
β β
β
β β
β β
β
β β β β
β β β
=

=
= = = =
= = = =



=
− − − =



 

 

 
− − − =
=
 




+ = + =


⇔ ⇔


+ = +





∑ ∑ ∑ ∑
∑ ∑ ∑ ∑
2
2
1 1
1 1
ˆ
n n
i i i
i i
X X Y
n n
β
= =





=


∑ ∑
Đặt
1 1
2 2

1 1
1 1
,
1 1
, ;
n n
i i
i i
n n
i i i
i i
X X Y Y
n n
X X XY X Y
n n
= =
= =
= =
= =
∑ ∑
∑ ∑
ta có
1 2
2
2 2
ˆ ˆ
ˆ
( )
Y X
XY X Y

X X
β β
β

= −



=



Nếu đặt
,
i i i i
x X X y Y Y= − = −
thì
1 2
1
2
2
1
ˆ ˆ
ˆ
n
i i
i
n
i
i

Y X
x y
x
β β
β
=
=

= −




=






1.2. Ước lượng mô hình hồi quy bội
a) Ước lượng mô hình hồi quy 3 biến
Xét mô hình hồi quy 3 biến dạng tuyến tính
PRF:
2 3 1 2 2 3 3
( / , )
i i i i
E Y X X X X
β β β
= + +


PRM:
1 2 2 3 3
( 1 )
i i i i
Y X X u i N
β β β
= + + + = ÷
Từ tổng thể ta lấy ra một mẫu ngẫu nhiên kích thước n

{ }
2 3
( , , ); 1
i i i
W Y X X i n= = ÷
Dựa vào mẫu này ta tìm được một ước lượng điểm của PRF
SRF:
1 2 2 3 3
ˆ ˆ ˆ
ˆ
i i i
Y X X
β β β
= + +

SRM:
1 2 2 3 3
ˆ ˆ ˆ
( 1 )
i i i i

Y X X e i n
β β β
= + + + = ÷
Tương tự mô hình hồi quy đơn ta tìm
1 2 3
ˆ ˆ ˆ
, ,
β β β
sao cho
2 2 2
1 2 2 3 3
1 1 1
ˆ ˆ ˆ
ˆ
( ) ( ) min
n n n
i i i i i i
i i i
e Y Y Y X X
β β β
= = =
= − = − − − →
∑ ∑ ∑
Đặt
2
1 2 3 1 2 2 3 3
1
ˆ ˆ ˆ ˆ ˆ ˆ
( , , ) ( )
n

i i i
i
f Y X X
β β β β β β
=
= − − −


khi đó
1 2 3
ˆ ˆ ˆ
, ,
β β β
là nghiệm của hệ phương trình

1 2 3
1 2 2 3 3
1
1
1 2 3
2 1 2 2 3 3
1
2
1 2 3
3 1 2 2 3 3
1
3
ˆ ˆ ˆ
( , , )
ˆ ˆ ˆ

2 ( ) 0
ˆ
ˆ ˆ ˆ
( , , )
ˆ ˆ ˆ
2 ( ) 0
ˆ
ˆ ˆ ˆ
( , , )
ˆ ˆ ˆ
2 ( ) 0
ˆ
n
i i i
i
n
i i i i
i
n
i i i i
i
f
Y X X
f
X Y X X
f
X Y X X
β β β
β β β
β

β β β
β β β
β
β β β
β β β
β
=
=
=


= − − − − =






= − − − − = ⇔






= − − − − =









1 2 2 3 3
1 1 1
2
1 2 2 2 3 2 3 2
1 1 1 1
2
1 3 2 2 3 3 3 3
1 1 1 1
ˆ ˆ ˆ
ˆ ˆ ˆ
ˆ ˆ ˆ
n n n
i i i
i i i
n n n n
i i i i i i
i i i i
n n n n
i i i i i i
i i i i
n X X Y
X X X X X Y
X X X X X Y
β β β
β β β
β β β

= = =
= = = =
= = = =

+ + =



+ + =



+ + =


∑ ∑ ∑
∑ ∑ ∑ ∑
∑ ∑ ∑ ∑

Đặt
1
1
n
i
i
Y Y
n
=
=


2 2
1
1
n
i
i
X X
n
=
=

3 3
1
1
n
i
i
X X
n
=
=

i i
y Y Y= −
2 2 2i i
x X X= −
3 3 3i i
x X X= −
Giải hệ phương trình chuẩn ta có


1 2 2 3 3
ˆ ˆ ˆ
Y X X
β β β
= − −

2
2 3 3 3 2
1 1 1 1
2
2 2 2
2 3 3 2
1 1 1
( )( ) ( )( )
ˆ
( )( ) ( )
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
x y x x y x x
x x x x
β
= = = =
= = =

=


∑ ∑ ∑ ∑
∑ ∑ ∑

2
3 2 2 3 2
1 1 1 1
3
2 2 2
2 3 3 2
1 1 1
( )( ) ( )( )
ˆ
( )( ) ( )
n n n n
i i i i i i i
i i i i
n n n
i i i i
i i i
x y x x y x x
x x x x
β
= = = =
= = =

=

∑ ∑ ∑ ∑
∑ ∑ ∑
b) Ước lượng mô hình hồi quy k biến

Xét mô hình hồi quy bội (hay mô hình hồi quy k biến) dạng tuyến tính
PRF:
2 3 1 2 2 3 3
( / , , , )
i i ki i i k ki
E Y X X X X X X
β β β β
= + + + +L

PRM:
1 2 2 3 3
( 1 )
i i i k ki i
Y X X X u i N
β β β β
= + + + + + = ÷L
Từ tổng thể ta lấy ra một mẫu ngẫu nhiên kích thước n

{ }
2 3
( , , , , ); 1
i i i ki
W Y X X X i n= = ÷
Dựa vào mẫu này ta tìm được một ước lượng điểm của PRF
SRF:
1 2 2 3 3
ˆ ˆ ˆ ˆ
ˆ
i i i k ki
Y X X X

β β β β
= + + + +L

SRM:
1 2 2 3 3
ˆ ˆ ˆ ˆ
( 1 )
i i i k ki i
Y X X X e i n
β β β β
= + + + + + = ÷L
Tương tự mô hình hồi quy đơn ta tìm
1 2
ˆ ˆ ˆ
, , ,
k
β β β
sao cho
2 2 2
1 2 2
1 1 1
ˆ ˆ ˆ
ˆ
( ) ( ) min
n n n
i i i i i k ki
i i i
e Y Y Y X X
β β β
= = =

= − = − − − − →
∑ ∑ ∑
L
Đặt
2
1 2 1 2 2
1
ˆ ˆ ˆ ˆ ˆ ˆ
( , , , ) ( )
n
k i i k ki
i
f Y X X
β β β β β β
=
= − − − −

L

khi đó
1 2
ˆ ˆ ˆ
, , ,
k
β β β
là nghiệm của hệ phương trình
1 2
1 2 2
1
1

1 2
2 1 2 2
1
2
1 2
ˆ ˆ ˆ
( , , , )
0
ˆ ˆ ˆ
2 ( ) 0
ˆ
ˆ ˆ ˆ
( , , , )
ˆ ˆ ˆ
0 2 ( ) 0
ˆ


ˆ ˆ ˆ
( , , , )
0
ˆ
n
k
i i ki
i
n
k
i i i ki
i

k
k
f
Y X
f
X Y X
f
β β β
β β β
β
β β β
β β β
β
β β β
β
=
=


=

− − − − − =





= − − − − − =









=






L
L
1 2 2
1
1 2 2 2 2
1 1 1
2
1 2 2 2 2 2
1 1 1 1

ˆ ˆ ˆ
2 ( ) 0
ˆ ˆ ˆ
ˆ ˆ ˆ

n
k i i i ki

i
n n n
i i i
i i i
n n n n
i i k i ki i i
i i i i
X Y X
n X X Y
X X X X X Y
β β β
β β β
β β β
=
= = =
= = = =









− − − − − =


+ + + =
+ + + =



∑ ∑ ∑
∑ ∑ ∑ ∑
L
L
L
2
1 2 2
1 1 1 1

ˆ ˆ ˆ
n n n n
k i k i i k k i ki i
i i i i
X X X X X Y
β β β
= = = =









+ + + =



∑ ∑ ∑ ∑
L

Dạng ma trận, tìm véc tơ
ˆ
β
sao cho e

e
min→
với
e

e = (Y

-
ˆ
β

X

)( Y -
ˆ
β
X) = Y

Y - Y

X
ˆ

β
-
ˆ
β

X

Y +
ˆ
β

X

X
ˆ
β

,
e e
ˆ
β

=

-2 X

Y + 2

X


X
ˆ
β
= [0]

(X

X)
ˆ
β
= X

Y

giải hệ phương trình sau
2
1 1
1
1
2
21 22 2
22 2 2
2
1 1 1
1 2
2
2
1 1 1
ˆ
1 1 1

ˆ
. .
ˆ
n n
i ki
i i
n n n
n
i i i ki
i i i
k k kn
n
n n n
k
ki ki i ki
i i i
n X X
Y
X X X
YX X X X
X X X
Y
X X X X
β
β
β
= =
= = =
= = =
 

 ÷
 
 ÷
 
 
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
=
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 ÷
 
 
 
 ÷
 ÷
 

∑ ∑
∑ ∑ ∑
∑ ∑ ∑
L
L
L
L
M M L M
M
M
M M O M
L
L
Để giải được hệ trên điều kiện cần là ma trận X

X không suy biến, hay các biến độc lập
không có quan hệ cộng tuyến với nhau.
2. Các giả thiết của phương pháp bình phương nhỏ nhất
Để giải được nghiệm
ˆ
( 1 )
j
j k
β
= ÷
và nghiệm có thể sử dụng trong phân tích,
các giả thiết của phương pháp bình phương nhỏ nhất được đặt ra.
Giả thiết 1: Hàm hồi quy tuyến tính theo tham số
Giả thiết 2: Các biến độc lập không ngẫu nhiên
Giả thiết 3: Trung bình sai số ngẫu nhiên bằng không,

( ) 0
i
E u i= ∀
Giả thiết 4: Phương sai sai số ngẫu nhiên là không đổi,

2
Var( )
i
u i
σ
= ∀
Giả thiết 5: Các sai số ngẫu nhiên không tương quan với nhau

( , ) 0
i j
Cov u u i j= ∀ ≠
Giả thiết 6: Các sai số ngẫu nhiên không tương quan với các biến độc lập
Cov(u
i
, X
i
) = 0
i∀
Giả thiết 7: Số quan sát nhiều hơn số tham số cần ước lượng
Giả thiết 8: Các biến độc lập không có quan hệ cộng tuyến với nhau
Giả thiết 9: Dạng hàm của mô hình được chỉ định đúng
Dưới dạng ma trận, các giả thiết được mô tả như sau
Giả thiết 1: PRF có dạng E(Y) = Xβ hay Y = Xβ + u
Giả thiết 2: Ma trận X không ngẫu nhiên
Giả thiết 3: E(u) = [0]

Giả thiết 4 + 5: Cov(u) =
2
σ
I (với I là ma trận đơn vị)
Giả thiết 6: Cov(u, X) = [0]
Giả thiết 7: n > k
Giả thiết 8: r(X) = k (hạng của ma trận X bằng k)
Định lý Gauss – Markov: Nếu các giả thiết của phương pháp bình phương nhỏ nhất
được thỏa mãn thì
ˆ
β
= (X

X)
-1
X

Y là ước lượng tuyến tính, không chệch, tốt nhất của
β.
3. Tham số của ước lượng và các tính chất
Bằng phương pháp ước lượng bình phương nhỏ nhất, tìm được các
ˆ
( 1 )
j
j k
β
= ÷
chính là các thành phần của véc tơ
ˆ
β

.
Nếu mẫu là ngẫu nhiên thì
ˆ
( 1 )
j
j k
β
= ÷
là các đại lượng ngẫu nhiên, đồng thời
theo đinh lý Gauss – Markov ta có
E(
ˆ
β
) = β hay
ˆ
( ) ( 1 )
j j
E j k
β β
= = ÷
Phương sai và hiệp phương sai của các hệ số ước lượng được tính như sau

Cov(
ˆ
β
)
1 1 2 1
2
2 1 2 2
1 2 k

ˆ ˆ ˆ ˆ ˆ
Var( ) ( , ) ( , )
ˆ ˆ ˆ ˆ ˆ
( , ) Var( ) ( , )
ˆ ˆ ˆ ˆ ˆ
( , ) ( , ) Var( )
k
k
k k
Cov Cov
Cov Cov
Cov Cov
β β β β β
β β β β β
σ
β β β β β
 
 ÷
 ÷
= =
 ÷
 ÷
 ÷
 
L
L
M M O M
L
(X


X)
-1
Độ lệch chuẩn của các hệ số ước lượng là
j
ˆ ˆ
( ) Var( )
j
σ β β
=
, ta chú ý rằng
2
σ
trong công thức trên là phương sai của sai số ngẫu nhiên, tức là
2
σ
= Var(u
i
),
nhưng do tổng thể chưa biết nên
2
σ
chưa biết.
Khi đó ước lượng cho
2
σ
được tính theo công thức

2
2 2
1

ˆ ˆ ˆ
=
n
i
i
e
n k
σ σ σ
=
= ⇒



ˆ
σ
được gọi là độ lệch chuẩn của đường hồi quy (S.E of Regression). Khi thay
2
ˆ
σ
cho
2
σ
thì độ lệch chuẩn của
ˆ
j
β
khi đó được gọi là sai số tiêu chuẩn của
ˆ
j
β

, ký hiệu Se(
ˆ
j
β
) (Standard error).
Trường hợp mô hình hồi quy đơn ta có

2
2
1
1 1 1 1 1
2
1
2
2 2 2 2 2
2
1
ˆ ˆ ˆ ˆ
( ) , Var( ) = ( ) Var( )
ˆ ˆ ˆ ˆ
( ) , Var( ) = ( ) Var( )
n
i
i
n
i
i
n
i
i

X
E
n x
E
x
β β β σ σ β β
σ
β β β σ β β
=
=
=
= ⇒ =
= ⇒ =



Với
2
σ
được ước lượng bởi
2 2
2
1 1
ˆ ˆ
2 2
n n
i i
i i
e e
n n

σ σ
= =
= ⇒ =
− −
∑ ∑
Khi đó các sai số chuẩn của
1 2
ˆ ˆ
,
β β


2
1
1 2
2
2
1
1
ˆ
ˆ ˆ
ˆ
Se( ) = , Se( ) =
n
i
i
n
n
i
i

i
i
X
n x
x
σ
β σ β
=
=
=



Các ước lượng bằng phương pháp bình phương nhỏ nhất còn có một số tính chất sau
Tính chất 1:
1
1
0
n
i
i
e e
n
=
= =

Tính chất 2:
ˆ
Y Y=
Tính chất 3:

1
0 ( )
n
i ji
i
e X j
=
= ∀


Tính chất 4:
1
ˆ
0
n
i i
i
eY
=
=

Tính chất 5: Đồ thị hàm hồi quy mẫu đi qua điểm trung bình mẫu
Chú ý: Nếu với mẫu ngẫu nhiên
{ }
2 3
( , , , , ); 1
i i i ki
W Y X X X i n= = ÷
thì các
ước lượng nhận được bằng phương pháp LS là các đại lượng ngẫu nhiên, tuy nhiên với

một phép thử trên mẫu ngẫu nhiên ta được một mẫu với những giá trị cụ thể, hay mẫu
cụ thể

{ }
2 3
w , , , , ); 1
i i i ki
y x x x i n= = ÷

thì các ước lượng nhận được bằng phương pháp LS sẽ nhận một giá trị cụ thể.
Chương 3
Phân tích mô hình
Ước lượng và kiểm định giả thuyết
Như trên đã trình bày các ước lượng nhận được bằng phương pháp LS là dựa vào thông
tin mẫu. Xuất phát từ các ước lượng nhận được ta muốn suy đoán thống kê về các tham
số của tổng thể thì ta cần phải biết quy luật phân phối xác suất của các ước lượng. Do
quy luật phân phối xác suất của các ước lượng đều có liên quan trực tiếp với quy luật
phân phối xác suất của sai số ngẫu nhiên, do vậy ta giả thiết sai số ngẫu nhiên có phân
phối chuẩn (xem giả thiết 3 + 4 ở trên)
Giả thiết 10:
2
~ (0, ) ( )
i
u N i
σ

Do
ˆ
j
β

là ước lượng tuyến tính, tức là
ˆ
j
β
là hàm tuyến tính của các sai số ngẫu nhiên
u
i
nên

ˆ ˆ
~ ( , Var( )) ( 1 )
j j j
N j k
β β β
= ÷

ˆ ˆ
~ (0,1) ( 1 )
ˆ
ˆ
( )
Var( )
j j j j
j
j
U N j k
β β β β
σ β
β
− −

⇒ = = = ÷
Khi thay
ˆ
( )
j
σ β
bởi
ˆ
( )
j
Se
β
ta có

ˆ
~ ( )
ˆ
( )
j j
j
T T n k
Se
β β
β

= −

2
2 2
2

ˆ
( )
~ ( )
n k
n k
σ
χ χ
σ

= −
1. Ước lượng khoảng cho các hệ số hồi quy
Với độ tin cậy
1
α

cho trước,
1 2
α α α
+ =
1.1. Khoảng tin cậy cho từng hệ số
Với mẫu ngẫu nhiên ta có

2 1
( ) ( )
ˆ ˆ ˆ ˆ
[ ( ) ( ) ] 1
n k n k
j j j j j
P Se t Se t
α α

β β β β β α
− −
− < < + = −
Với mẫu cụ thể và với độ tin cậy
1
α

cho trước, ta có các khoảng tin cậy cho
j
β
như sau
Khoảng tin cậy hai phía (đối xứng)

( ) ( )
2 2
ˆ ˆ ˆ ˆ
( ) ( )
n k n k
j j j j j
Se t Se t
α α
β β β β β
− −
− < < +

Khoảng tin cậy phía trái (tối đa)

( )
ˆ ˆ
( )

n k
j j j
Se t
α
β β β

< +

Khoảng tin cậy phía phải (tối thiểu)

( )
ˆ ˆ
( )
n k
j j j
Se t
α
β β β

> −
1.2. Khoảng tin cậy cho hai hệ số
Với mẫu ngẫu nhiên ta có
2 1
( ) ( )
ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
[( ) ( ) ( ) ( ) ( ) ]
1
n k n k
i j i j i j i j i j
P Se t Se t

α α
β β β β β β β β β β
α
− −
± − ± < ± < ± + ±
= −
với

ˆ ˆ ˆ ˆ ˆ ˆ ˆ ˆ
( ) Var( ) Var( ) Var( ) 2 ( , )
i j i j i j i j
Se Cov
β β β β β β β β
± = ± = + ±

Nếu xây dựng khoảng tin cậy cho
i j
a b
β β
±
(a, b là hằng số) thì ta xây dựng tương tự
như trên và lưu ý

2 2
ˆ ˆ ˆ ˆ ˆ ˆ
( ) a Var( ) Var( ) 2 ( , )
i j i j i j
Se a b b abCov
β β β β β β
± = + ±


Và có thể mở rộng cho ước lượng tổng 3 hệ số
i j m
β β β
+ +
với công thức tính
phương sai

ˆ ˆ ˆ ˆ ˆ ˆ
Var( ) Var( )+Var( )+Var( )
ˆ ˆ ˆ ˆ ˆ ˆ
2 ( , ) 2 ( , ) 2 ( , )
i j m i j m
i j j m m i
Cov Cov Cov
β β β β β β
β β β β β β
+ + =
+ + +
2. Ước lượng khoảng cho phương sai sai số ngẫu nhiên
Với mẫu ngẫu nhiên ta có

2 1
2 2
2
2 2
1
ˆ ˆ
( ) ( )
[ ] 1

( ) ( )
n k n k
P
n k n k
α α
σ σ
σ α
χ χ

− −
< < = −
− −
Với mẫu cụ thể và với độ tin cậy
1
α

cho trước ta có các khoảng tin cậy cho
2
σ
như
sau
Khoảng tin cậy hai phía
2 2
2
2 2
1
2 2
ˆ ˆ
( ) ( )
( ) ( )

n k n k
n k n k
α α
σ σ
σ
χ χ

− −
< <
− −
Khoảng tin cậy tối đa
2
2
2
1
ˆ
( )
( )
n k
n k
α
σ
σ
χ


<

Khoảng tin cậy tối thiểu
2

2
2
ˆ
( )
( )
n k
n k
α
σ
σ
χ

>

3. Kiểm định giả thuyết về các hệ số hồi quy
3.1 Kiểm định về từng hệ số hồi quy
Do chưa có tổng thể nên ta chưa biết được các
j
β
, nhưng có thể cho rằng nó bằng
*
j
β
(với
*
j
β
cho trước ) hay không ? khi ấy ta đưa ra giả thuyết
*
0

:
j j
H
β β
=
. Để
kiểm định giả thuyết này ta chọn tiêu chuẩn kiểm định
*
ˆ
ˆ
( )
j j
j
T
Se
β β
β

=
. Nếu giả thuyết
*
0
:
j j
H
β β
=
là đúng thì
*
ˆ

~ ( )
ˆ
( )
j j
j
T T n k
Se
β β
β

= −
, do vậy với mức ý nghĩa
α
cho trước tùy thuộc vào giả thuyết đối H
1
mà ta xây dựng được các miền bác bỏ giả
thuyết H
0
tương ứng với các trường hợp sau
-) Nếu ta kiểm định cặp giả thuyết

*
0
*
1
:
:
j j
j j
H

H
β β
β β

=





thì
*
( )
2
ˆ
W {T ; }
ˆ
( )
j j
n k
j
T t
Se
α α
β β
β


= = >


Với mẫu cụ thể và với
α
cho trước mà
( )
qs
2
T
n k
t
α

>
thì ta bác bỏ H
0
-) Nếu ta kiểm định cặp giả thuyết

*
0
*
1
:
:
j j
j j
H
H
β β
β β

=



>


thì
*
( )
ˆ
W {T ; }
ˆ
( )
j j
n k
j
T t
Se
α α
β β
β


= = >

Với mẫu cụ thể và với
α
cho trước mà
( )n k
qs
T t

α

>
thì ta bác bỏ H
0
-) Nếu ta kiểm định cặp giả thuyết

*
0
*
1
:
:
j j
j j
H
H
β β
β β

=


<


thì
*
( )
ˆ

W {T ; }
ˆ
( )
j j
n k
j
T t
Se
α α
β β
β


= = < −
Với mẫu cụ thể và với
α
cho trước mà
( )n k
qs
T t
α

< −
thì ta bác bỏ H
0
Trường hợp riêng :
0
1
: 0
: 0

j
j
H
H
β
β
=







với mẫu cụ thể ta tính được
ˆ
ˆ
( )
j
qs
j
T
Se
β
β
=

Với trường hợp riêng ta có các chú ý sau :

) Nếu ta bác bỏ H

0
thì ta nói hệ số
j
β
khác 0 một cách có ý nghĩa, hay hệ số
j
β
có ý
nghĩa thống kê. Nếu hệ số
j
β
không có ý nghĩa thống kê thì có nghĩa là biến độc lập X
j
không giải thích cho biến phụ thuộc Y, ngược lại nếu hệ số
j
β
có ý nghĩa thống kê thì
có nghĩa là biến độc lập X
j
có giải thích cho biến phụ thuộc Y.

) Có thể kiểm định bằng phương pháp P – value, theo đó với
α
cho trước mà
α
> P
– value thì bác bỏ giả thuyết H
0
.
3.2. Kiểm định về nhiều hệ số hồi quy

Do chưa có tổng thể nên ta chưa biết được các
j
β
, nhưng có thể cho rằng
i j
β β
±
bằng
*
β
(với
*
β
cho trước ) khi ấy ta đưa ra giả thuyết
*
0
:
i j
H
β β β
± =
. Để kiểm
định giả thuyết này ta chọn tiêu chuẩn kiểm định
*
ˆ ˆ
( )
ˆ ˆ
( )
i j
i j

T
Se
β β β
β β
± −
=
±
(với mẫu cụ
thể, thay số tính được T
qs
). Nếu giả thuyết
*
0
:
i j
H
β β β
± =
là đúng thì

*
ˆ ˆ
( )
~ ( )
ˆ ˆ
( )
i j
i j
T T n k
Se

β β β
β β
± −
= −
±
do vậy với mức ý nghĩa
α
cho trước tùy thuộc
vào giả thuyết đối H
1
mà ta xây dựng được các miền bác bỏ giả thuyết H
0
tương ứng
với các trường hợp sau
-) Nếu ta kiểm định cặp giả thuyết

*
0
*
1
:
:
i j
i j
H
H
β β β
β β β

± =



± ≠


thì
*
( )
2
ˆ ˆ
( )
W {T ; }
ˆ ˆ
( )
i j
n k
i j
T t
Se
α α
β β β
β β

± −
= = >
±

Với mẫu cụ thể và với
α
cho trước mà

( )
qs
2
T
n k
t
α

>
thì ta bác bỏ H
0
-) Nếu ta kiểm định cặp giả thuyết

*
0
*
1
:
:
i j
i j
H
H
β β β
β β β

± =


± >



thì
*
( )
ˆ ˆ
( )
W {T ; }
ˆ ˆ
( )
i j
n k
i j
T t
Se
α α
β β β
β β

± −
= = >
±

Với mẫu cụ thể và với
α
cho trước mà
( )n k
qs
T t
α


>
thì ta bác bỏ H
0
-) Nếu ta kiểm định cặp giả thuyết

*
0
*
1
:
:
i j
i j
H
H
β β β
β β β

± =


± <


thì
*
( )
ˆ ˆ
( )

W {T ; }
ˆ ˆ
( )
i j
n k
i j
T t
Se
α α
β β β
β β

± −
= = < −
±
Với mẫu cụ thể và với
α
cho trước mà
( )n k
qs
T t
α

< −
thì ta bác bỏ H
0
.
Có thể mở rộng cho kiểm định giả thuyết về hơn hai hệ số, chẳng hạn
i j m
β β β

+ +
hay tổ hợp của các hệ số
i j
a b
β β
+
(với a, b là các hằng số cho trước).
4. Hệ số xác định
4.1. Phân tích độ biến động của biến phụ thuộc
Xuất phát từ mô hình hồi quy mẫu đó là

ˆ ˆ
i i i i i i
Y Y e Y Y Y Y e= + ⇔ − = − +
,
bình phương hai vế đẳng thức này và áp dụng các tính chất của phương pháp LS ta có
2 2 2
1 1 1
ˆ
( ) ( )
n n n
i i i
i i i
Y Y Y Y e
= = =
− = − +
∑ ∑ ∑
hay



2 2 2
1 1 1
ˆ ˆ
( ) ( ) ( )
n n n
i i i i
i i i
Y Y Y Y Y Y
= = =
− = − + −
∑ ∑ ∑

Ta đặt :
2
1
( )
n
i
i
Y Y TSS
=
− =

( Total Sum of Squares) là tổng bình phương chênh lệch của các
giá trị cá biệt (biến phụ thuộc) so với trung bình mẫu, hay còn gọi là đại lượng đo tổng
biến động của biến phụ thuộc (trong mẫu).
2
1
ˆ
( )

n
i
i
Y Y ESS
=
− =

( Explained Sum of Squares) là tổng bình phương chênh lệch
giữa giá trị của biến phụ thuộc được tính bởi hàm hồi quy mẫu so với trung bình mẫu
(biến phụ thuộc), hay còn gọi là đại lượng đo tổng biến động của biến phụ thuộc được
giải thích bởi các biến độc lập.
2 2
1 1
ˆ
( )
n n
i i i
i i
e Y Y RSS
= =
= − =
∑ ∑
(Residual Sum of Squares) là tổng bình phương phần
dư, hay còn gọi là đại lượng đo tổng biến động của biến phụ thuộc được giải thích bởi
các yếu tố ngẫu nhiên.
Khi đó ta có TSS = ESS + RSS
4.2. Hệ số xác định của mô hình
Nếu đặt
2
ESS

R 1
TSS
RSS
TSS
= = −

Thì R
2
gọi là hệ số xác định của mô hình
+) Dễ thấy
2
0 R 1≤ ≤
+) Ý nghĩa của hệ số xác định R
2
: Cho biết các biến độc lập có trong mô hình giải thích
được 100*R
2
(%) sự biến động của biến phụ thuộc.
Chú ý : R
2
được xác định theo công thức trên là đại lượng ngẫu nhiên nếu mẫu là ngẫu
nhiên, tuy nhiên với mẫu cụ thể thì R
2
là con số cụ thể.
4.3. Hệ số xác định điều chỉnh
Nếu đặt
2
2
1
R 1 (1 )

n
R
n k

= − −

Thì
2
R
gọi là hệ số xác định điều chỉnh của mô hình
+) Ta có tính chất:
2
2
R R<
+) Ý nghĩa của hệ số xác định
2
R
: Khi thêm biến giải thích vào mô hình thì hệ số xác
định tăng lên cho dù biến mới thêm vào có thực sự giải thích cho biến phụ thuộc hay
không. Như vậy hai mô hình có số biến độc lập không giống nhau, khi đó đánh giá mô
hình nào giải thích được tốt hơn cho biến phụ thuộc dựa trên tiêu chí hệ số xác định
không còn chính xác, do đó người ta dùng hệ số xác định điều chỉnh.
Khi thêm biến giải thích vào mô hình, nếu hệ số xác định điều chỉnh tăng lên thì đó là
một trong các tiêu chí cho thấy nên thêm biến giải thích này vào mô hình (tất nhiên cần
chú ý đến ý nghĩa kinh tế của mô hình khi thêm biến mới).
5. Kiểm định sự phù hợp của hàm hồi quy
Xét mô hình hồi quy k biến, hệ số xác định của mô hình trong tổng thể cho biết độ biến
động của biến phụ thuộc được giải thích bởi các biến độc laapjtrong mô hình. Nếu R
2
tổng thể bằng 0 thì các biến độc lập trong mô hình không giải thích được cho sự biến

động của biến phụ thuộc, khi ấy ta nói hàm hồi quy không phù hợp. Ngược lại nếu R
2
tổng thể lớn hơn 0 thì có nghĩa là trong mô hình có ít nhất một biến độc lập có giải
thích cho sự biến động của biến phụ thuộc, khi ấy ta nói hàm hồi quy phù hợp. Để kiểm
định sự phù hợp của hàm hồi quy, ta kiểm định cặp giả thuyết sau (với R
2
trong tổng
thể )

2
0 0 2 3
2
1
1
: 0 : 0
: 0 ( 2 )
: 0
k
j
H R H
H j k
H R
β β β
β

= = = = =



 

∃ ≠ ∀ = ÷
>



L
Ta chọn tiêu chuẩn kiểm định

2
2
2
2
ESS
1
k-1
RSS
1
1 1
n-k
R
R n k
k
F
R
R k
n k


= = = ×


− −

Theo phân tích sự biến động của biến phụ thuộc trong mẫu ta có thể chứng minh được
2
ESS ~ ( 1)k
χ


2
RSS ~ ( )n k
χ


nên
ESS
k-1
~ ( 1; )
RSS
n -k
F F k n k= − −
Chú ý: R
2
trong tiêu chuẩn kiểm định F là R
2
ước lượng.
Khi ấy với mức ý nghĩa
α
cho trước miền bác bỏ giả thuyết H
0



2
(k-1; n-k)
2
R n-k
W {F = ; F > f }
1- R k-1
α α
= ×

Với mẫu cụ thể và với mức ý nghĩa
α
cho trước mà
( 1; )k n k
qs
F f
α
− −
>
thì ta bác bỏ H
0
tức là ta kết luận hàm hồi quy phù hợp. Trường hợp ngược lại thì ta chưa có cơ sở bác
bỏ H
0
ta kết luận hàm hồi quy không phù hợp.
6. Kiểm định hồi quy có điều kiện ràng buộc (hay kiểm định thu hẹp hàm hồi quy)
Xét mô hình hồi quy k biến (hay k tham số)

1 2 2 3 3 k k
Y X X X u

β β β β
= + + + + +L
Nghi ngờ m biến độc lập X
k-m+1
, X
k-m+2
, …, X
k
không giải thích cho biến phụ thuộc Y,
hay nói khác đi m biến này không có ý nghĩa trong mô hình. Khi đó ta kiểm định cặp
giả thuyết sau

0 1 2
1
: 0
: 0 [ ( 1) ]
k m k m k
j
H
H j k m k
β β β
β
− + − +
= = = =


∃ ≠ ∀ = − + ÷

L
Nếu giả thuyết H

0
là đúng thì từ mô hình có k tham số (gọi là mô hình Lớn – ký hiệu L)
có thể thu hẹp về mô hình còn (k - m) tham số (gọi là mô hình Nhỏ - ký hiệu N)

1 2 2 1 1k m k m k m k m k k
Y X X X X u
β β β β β
− − − + − +
= + + + + + + +L L
(L)

1 2 2 k m k m
Y X X v
β β β
− −
= + + + +L
(N)
Lần lượt ước lượng các mô hình trên bằng phương pháp LS ta thu được
2 2
, , ,
L L N N
RSS R RSS R
.
Do thống kê
2 2
2
~ ( ; )
1
N L L N
L

L
RSS RSS R R
m m
F F m n k
RSS
R
n k
n k
− −
= = −



Nên ta chọn tiêu chuẩn kiểm định


2 2
2
1
N L
N L L N
L
L L
RSS RSS
RSS RSS R R
n k n k
m
F
RSS
RSS m R m

n k

− −
− −
= = × = ×


Với mức ý nghĩa
α
cho trước miền bác bỏ giả thuyết H
0


2 2
(m; n -k)
L N
2
L
R R
n - k
W {F= ; F > f }
1 - R m
α α

= ×

Nếu với mẫu cụ thể và với mức ý nghĩa
α
cho trước mà
( ; )m n k

qs
F f
α

>
thì ta bác bỏ
H
0
, điều này có nghĩa trong các biến X
k-m+1
, X
k-m+2
, … , X
k
có ít nhất một biến có giải
thích cho biến phụ thuộc Y.
Một số trường hợp đặc biệt
-) Trường hợp m = 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm định về từng hệ
số hồi quy, F
qs
trong trường hợp này bằng bình phương T
qs
ứng với hệ số đó.
-) Trường hợp m = k – 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm định về sự
phù hợp của hàm hồi quy.
-) Kiểm định mở rộng hàm hồi quy tương đương với kiểm định thu hẹp hàm hồi quy,
chú ý rằng k luôn là số tham số của mô hình lớn, dù là kiểm định về thu hẹp hay mở
rộng hàm hồi quy.
7. Dự báo
Khi véc tơ

0 0 0 0
2 3 k
X (1 X X X )
=
L
cho trước ta cần dự báo giá trị trung
bình và cá biệt của biến phụ thuộc.
+) Dự báo giá trị trung bình E(Y/ X
0
)
Với độ tin cậy
1-
α
ta có khoảng tin cậy đối xứng của E(Y/ X
0
) như sau

( ) 0 ( )
0 0 0 0
2 2
ˆ ˆ ˆ ˆ
Y (Y ) E(Y/ X ) < Y (Y )
n k n k
Se t Se t
α α
− −
− < +
Với
0 0 0
0 1 2 2 k

0' ' -1 0
0
ˆ ˆ ˆ ˆ
ˆ
Y X X X
ˆ
ˆ
(Y ) X (X X) X
k
Se
β β β β
σ
= = + + +
=
L
+) Dự báo giá trị cá biệt (Y/ X
0
)
Với độ tin cậy
1-
α
ta có khoảng tin cậy đối xứng của (Y/ X
0
) như sau

( ) 0 ( )
0 0 0 0
2 2
ˆ ˆ
Y (Y ) (Y/ X ) < Y (Y )

n k n k
Se t Se t
α α
− −
− < +
Với
0' ' -1 0
0
ˆ
(Y ) 1+X (X X) XSe
σ
=
Trường hợp mô hình hồi quy đơn ta có

( 2) ( 2)
0 0 0 0 0
2 2
ˆ ˆ ˆ ˆ
Y (Y ) E(Y/ X ) < Y (Y )
n n
Se t Se t
α α
− −
− < +

( 2) ( 2)
0 0 0 0 0
2 2
ˆ ˆ
Y (Y ) (Y/ X ) < Y (Y )

n n
Se t Se t
α α
− −
− < +

Với
2
0
0
2
1
( )
1
ˆ
ˆ
(Y )
n
( )
n
i
i
X X
Se
X X
σ
=

= +




2
0
0
2
1
( )
1
ˆ
(Y ) 1
n
( )
n
i
i
X X
Se
X X
σ
=

= + +


8. Một số mô hình phi tuyến có thể đưa về dạng tuyến tính
+) Mô hình hàm tổng chi phí
Với TC là tổng chi phí, Q là sản lượng
Ta có mô hình hàm tổng chi phí như sau
TC = β

1
+ β
2
Q + β
3
Q
2
+ β
4
Q
3
+ u với β
1
> 0, β
2
> 0, β
3
< 0, β
4
> 0
Nếu ta đặt Q
2
= Q
2
, Q
3
= Q
3
thì ta có mô hình tuyến tính sau
TC = β

1
+ β
2
Q + β
3
Q
2
+ β
4
Q
3
+ u
+) Hàm tăng trưởng
- Dạng hàm:
0
(1 )
t
t
Y Y r= +
với r là nhịp tăng trưởng.
- Biến đổi:
0
ln ln ln(1 )
t
Y Y t r= + +
- Đặt:
1 0 2 1 2
ln , ln(1 ) ln
t
Y r Y t

β β β β
= = + ⇒ = +
+) Hàm sản xuất Coob – Douglas
- Dạng hàm
31 2 i
u
i i i
Q e K L e
ββ β
=
với
2 3
,
β β
là hệ số co giãn của Q theo K, L.
- Biến đổi ta có
i 1 2 i 3 i i
lnQ + lnK + lnL + u
β β β
=
- Đặt:
i i i i i i
lnQ LQ , lnK LK , lnL LL= = =

i 1 2 i 3 i i
LQ LK LL u
β β β
⇒ = + + +
Hàm Cobb – Douglas có thể mở rộng cho trường hợp nhiều biến giải thích


31 2 k
2 3 k 1 2 2 3 3 k k
Y e X X X lnY lnX lnX lnX
ββ β β
β β β β
= ⇒ = + + + +L L

Trong đó
j
β
là hệ số co dãn của Y đối với X
j
(
j = 1 k÷
)
+) Hàm tuyến tính – loga
- Dạng hàm
i 1 2 i i
Y + lnX + u
β β
=

- Đặt:
* *
i i i 1 2 i i
X lnX Y + X + u
β β
= ⇒ =
+) Hàm loga – tuyến tính
- Dạng hàm

i 1 2 i i
lnY + X + u
β β
=

- Đặt:
* *
i i i 1 2 i i
Y lnY Y + X + u
β β
= ⇒ =
+) Hàm dạng Hypecbol
- Mô hình chi phí trung bình phụ thuộc vào sản lượng

i 1 2 i
i
1
Y + + u
X
β β
=
với
1 2
0, 0
β β
> >
- Mô hình chi tiêu phụ thuộc vào thu nhập (đường cong Engel)

i 1 2 i
i

1
Y + + u
X
β β
=
với
1 2
0, 0
β β
> <
- Mô hình lạm phát phụ thuộc vào tỷ lệ thất nghiệp (đường cong Philips)

i 1 2 i
i
1
Y + + u
X
β β
=
với
1 2
0, 0
β β
< >
Với mô hình dạng Hypecbol như đã nêu trên ta đặt

* *
i i 1 2 i i
i
1

X Y + X + u
X
β β
= ⇒ =
+) Hàm xu thế và hàm có biến trễ
- Mô hình hàm xu thế:
t 1 2 t 3 t
Y X T u
β β β
= + + +
(T là biến xu thế thời gian)
- Mô hình có biến độc lập trễ:
t 1 2 t 3 t -1 t
Y X X u
β β β
= + + +
- Mô hình có biến phụ thuộc trễ một thời kỳ là biến độc lập (hay mô hình tự hồi quy)

t 1 2 t 3 t -1 t
Y X Y u
β β β
= + + +

Lấy ví dụ hoặc làm bài tập

Chương 4
Mô hình hồi quy với biến giả
1. Biến định tính
Các biến trong mô hình hồi quy mà ta đã xét ở phần trước thì tất cả các biến đó là các
biến định lượng. Nhưng nếu chúng ta cần nghiên cứu một mô hình mà trong số các

biến, không những có cả biến định lượng mà còn có cả biến định tính nữa, khi ấy chúng
ta muốn ước lượng các tham số của mô hình thì ta phải làm thế nào ?
Trước hết ta hiểu một biến định tính là biến như thế nào ?
+) Biến định tính là biến cho biết có hay không có một thuộc tính nào đó.
+) Biến định tính có 2 phạm trù ( hay trạng thái) : Giả sử ta có biến định tính với hai
phạm trù, chẳng hạn
A

A
, điều đó có nghĩa là một cá thể chỉ có thể thuộc vào một
trong 2 phạm trù
A
hoặc
A
mà thôi
Ví dụ : Biến giới tính (có 2 phạm trù là Nam và Nữ), biến chất lượng sản phẩm (có 2
phạm trù là Chính phẩm và Phế phẩm), biến tình trạng kinh tế của hộ gia đình miền núi
(có 2 phạm trù Hộ nghèo và Hộ không nghèo).v.v
+) Biến định tính có h phạm trù (h > 2, h

N): Giả sử ta có biến định tính với h phạm
trù, chẳng hạn A
1
, A
2
, . . ., A
h
điều đó có nghĩa là một cá thể chỉ có thể thuộc vào một
trong h phạm trù A
1

, A
2
, . . ., A
h
mà thôi
Ví dụ : Biến vùng – miền có các phạm trù (Bắc, Trung, Nam) hay (Thành thị, Nông
thôn, Miền núi), biến trình độ học vấn có các phạm trù (Thất học, Tốt nghiệp cấp 1, Tốt
nghiệp cấp 2, Tốt nghiệp cấp 3).v.v.Như vậy biến vùng – miền có h = 3, biến trình độ
học vấn có h = 4.
Như vậy biến định tính có những đặc điểm sau
-) Có số phạm trù hữu hạn
-) Một cá thể chỉ thuộc một phạm trù xác định
-) Không có đơn vị
Mục này ta xét biến phụ thuộc là biến định lượng và có biến độc lập là biến định tính.
Xét một ví dụ sau với mô hình hồi quy mà biến phụ thuộc là biến định lượng và một
biến độc lập là biến định tính có 2 phạm trù
Ví dụ : Ta muốn xem xét thu nhập của người lao động Hà nội phụ thuộc vào giới tính
như thế nào ? hay nói khác đi, ta cần trả lời câu hỏi là: liệu có sự khác nhau về thu nhập
trung bình giữa lao động Nam và lao động Nữ ?
Đặt Y = (Thu nhập của người lao động Hà nội), u là yếu tố ngẫu nhiên

1
0
D

=


Nếu là lao động Nữ
Nếu là lao động Nam


Ta có mô hình
1 2i i i
Y D u
β β
= + +
Khi đó, với lao động Nam ta có :
1
( / 0)
i
E Y D
β
= =
Với lao động Nữ ta có :
1 2
( / 1)
i
E Y D
β β
= = +
Nếu
2
0
β

thì thu nhập trung bình giữa lao động Nam và lao động Nữ có sự khác
nhau.
Biến D được đặt như trên được gọi là biến giả (Dummy variable)
2. Quy tắc đặt biến giả
Nhận xét

+) Biến giả chỉ nhận giá trị 0 hoặc 1
+) Bất kỳ cá thể nào của tổng thể, đều phải có giá trị của biến giả
+) Các biến giả phân chia tổng thể thành những phần riêng biệt ứng với các phạm trù
(trạng thái) của biến định tính
Do đó nếu biến định tính có h phạm trù A
1
, A
2
, . . ., A
h
thì ta đặt h – 1 biến giả. Phạm
trù mà có tất cả các biến giả nhận giá trị 0 được gọi là phạm trù cơ sở, giá trị trung bình
của biến phụ thuộc ứng với phạm trù cơ sở chính là hệ số chặn
1
β
. Các hệ số ứng với
các biến giả cho biết mức chênh lệch của trung bình biến phụ thuộc ứng với phạm trù
đang xét so với giá trị trung bình của biến phụ thuộc ứng với phạm trù cơ sở.
3. Mô hình có nhiều biến định tính
Để hiểu mô hình có nhiều biến định tính là biến độc lập, ta nghiên cứu tiếp ví dụ trên.
Ta xét mô hình
1 2 1 3 2 4 1 2
( * )
i i i i i i
Y D D D D u
β β β β
= + + + +
Với Y = (Thu nhập của người lao động Hà nội)
1
1

0
D

=


Nếu là lao động Nữ
Nếu là lao động Nam

2
1
0
D

=


Nếu là lao động làm việc ở khu vực tư nhân
Nếu là lao động làm việc ở khu vực nhà nước
Còn u là yếu tố ngẫu nhiên
Khi đó ta có
-)
1 2 1
( / 0)
i i
E Y D D
β
= = =
cho biết thu nhập trung bình của lao động Nam làm việc ở
khu vực nhà nước

-)
1 2 1 2
( / 1, 0)
i i
E Y D D
β β
= = = +
cho biết thu nhập trung bình của lao động Nữ làm
việc ở khu vực nhà nước
-)
1 2 1 3
( / 0, 1)
i i
E Y D D
β β
= = = +
cho biết thu nhập trung bình của lao động Nam làm
việc ở khu vực tư nhân
-)
1 2 1 2 3 4
( / 1, 1)
i i
E Y D D
β β β β
= = = + + +
cho biết thu nhập trung bình của lao động
Nữ làm việc ở khu vực tư nhân.
4. Mô hình có một biến độc lập là định lượng và một biến độc lập là định tính
Xét ví dụ
Gọi X = (Thu nhập của người lao động Hà nội)

Y = (Tiêu dùng của người lao động Hà nội)
1
0
D

=


Nếu là lao động làm việc ở khu vực tư nhân
Nếu là lao động làm việc ở khu vực nhà nước

-) Nếu ta xét mô hình
1 2 3i i i i
Y D X u
β β β
= + + +
thì mô hình này gọi là mô hình có biến
định tính (biến giả) tác động đến hệ số chặn.
-) Nếu ta xét mô hình
1 3 4
( * )
i i i i i
Y X D X u
β β β
= + + +
thì mô hình này gọi là mô hình
có biến định tính (biến giả) tác động đến hệ số góc
-) Nếu ta xét mô hình
1 2 3 4
( * )

i i i i i i
Y D X D X u
β β β β
= + + + +
thì mô hình này gọi là mô
hình có biến định tính (biến giả) tác động đến cả hệ số chặn và hệ số góc.
Để xem xét mối quan hệ giữa tiêu dùng và thu nhập của người lao động Hà nội làm
việc ở khu vực tư nhân và nhà nước có sự khác nhau hay không, ta kiểm định cặp giả
thuyết sau

0 2 4
2 2
1 2 4
: 0
: 0
H
H
β β
β β
= =


+ >

Cấu trúc mô hình ở hai khu vực là đồng nhất
Cấu trúc mô hình ở hai khu vực không đồng nhất
(Sử dụng kiểm định thu hẹp hàm hồi quy để kiểm định cặp giả thuyết trên)
5. So sánh hai hồi quy
5.1. Kiểm định Chow
Giả sử ta có tổng thể với số liệu thời gian và số liệu được chia thành hai giai đoạn

Với toàn bộ tổng thể ta xét mô hình
1 2t t t
Y X u
β β
= + +
Với giai đoạn 1 giả sử mô hình có dạng
1 2 1t t t
Y X u
λ λ
= + +
Với giai đoạn 2 giả sử mô hình có dạng
1 2 2t t t
Y X u
γ γ
= + +
(Xét tương tự với mô hình k biến)
Để xem xét cấu trúc mô hình ở hai giai đoạn có đồng nhất hay không ? ta kiểm định cặp
giả thuyết sau

0
1
:
:
H
H



Cấu trúc mô hình ở hai giai đoạn là đồng nhất
Cấu trúc mô hình ở hai giai đoạn không đồng nhất

Để kiểm định cặp giả thuyết trên ta lấy mẫu W
1
kích thước n
1
ở giai đoạn 1 và ước
lượng mô hình thu được RSS
1
, tương tự lấy mẫu W
2
kích thước n
2
ở giai đoạn 2 và ước
lượng mô hình thu được RSS
2
, ghép chung các quan sát của hai giai đoạn được mẫu W
có kích thước n
1
+ n
2
và ước lượng mô hình thu được RSS
Đặt
1 2
RSS RSS RSS= +
và chọn tiêu chuẩn kiểm định

1 2
1 2
1 2
2
~ ( ; 2 )

2
RSS RSS
n n kRSS RSS
k
F F k n n k
k
RSS RSS
n n k

+ −−
= = × + −
+ −
Với mẫu cụ thể và với mức ý nghĩa
α
cho trước mà
1 2
( ; 2 )k n n k
qs
F f
α
+ −
>
thì bác bỏ
giả thuyết H
0
, kết luận cấu trúc mô hình ở hai giai đoạn không đồng nhất.
5.2. Sử dụng biến giả
Để kiểm định mô hình ở hai giai đoạn có đồng nhất hay không ta thực hiện các bước
sau
+) Bước 1: Ghép chung các quan sát của cả hai giai đoạn và ước lượng mô hình


1 2 3 4
( * )
t t t t t t
Y D X D X u
β β β β
= + + + +
Với
1
0
D

=


Nếu quan sát thuộc giai đoạn 1
Nếu quan sát thuộc giai đoạn 2
+) Bước 2: Kiểm định cặp giả thuyết
0 2 4
2 2
1 2 4
: 0
: 0
H
H
β β
β β
= =



+ >

Cấu trúc mô hình ở hai giai đoạn là đồng nhất
Cấu trúc mô hình ở hai giai đoạn không đồng nhất
(Sử dụng kiểm định thu hẹp hàm hồi quy để kiểm định cặp giả thuyết trên)
Khi so sánh cấu trúc của hai hàm hồi quy ta chú ý
-) Nếu cấu trúc của mô hình giữa hai giai đoạn là đồng nhất thì có thể ghép chung số
liệu để phân tích.
-) Nếu cấu trúc của mô hình giữa hai giai đoạn là không đồng nhất thì phải tách riêng
từng tệp số liệu để phân tích.
Đánh giá về mô hình
Nếu các giả thiết của phương pháp bình phương nhỏ nhất (LS) được thỏa mãn thì các
ước lượng nhận được là các ước lượng tuyến tính không chệch tốt nhất, các kết quả
nhận được là đáng tin cậy. Tuy nhiên khi các giả thiết không được thỏa mãn thì các ước
lượng nhận được không còn đáng tin cậy.
Để biết kết quả hồi quy có đáng tin cậy và tốt nhất cho phân tích hay không ? ta cần
đánh giá về mô hình, xem mô hình có vi phạm các giả thiết của phương pháp LS hay
không. Với mỗi trường hợp mà mô hình vi phạm giả thiết của phương pháp LS thì ta
nói mô hình có khuyết tật.
Chương 5
Đa cộng tuyến
1. Hiện tượng
Xét mô hình hồi quy k biến (
3,k k
≥ ∈
Z)

1 2 2 3 3i i i k ki i
Y X X X u
β β β β

= + + + + +L
(5.1)
Một trong các giả thiết của phương pháp LS là không có hiện tượng đa cộng tuyến
trong mô hình hồi quy bội. Khi giả thiết này bị vi phạm thì ta nói mô hình có hiện
tượng đa cộng tuyến. Đa cộng tuyến chia làm hai loại : Đa cộng tuyến hoàn hảo và đa
cộng tuyến không hoàn hảo.
+) Đa cộng tuyến hòa hảo là hiện tượng các biến độc lập trong mô hình thỏa mãn điều
kiện

2 2 3 3
0
k k
X X X
λ λ λ
+ + + =L

×