Tải bản đầy đủ (.doc) (48 trang)

BÀI GIẢNG KINH TẾ LƯỢNG CƠ BẢN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (261.64 KB, 48 trang )

Phần I
Kinh tế lượng cơ bản
Mở đầu
1. Khái niệm về Kinh tế lượng
Kinh tế lượng là môn khoa học bao gồm toán kinh tế, thống kê, lý thuyết
kinh tế, với mục đích là tìm ra kết quả định lượng, thực nghiệm cho các lý
thuyết kinh tế và kiểm chứng lại các kết quả mà lý thuyết kinh tế đã đưa ra.
Về ý nghĩa: Econometrics = Econo + metrics = Kinh tế + Đo lường
Mục tiêu nghiên cứu : Là các mối quan hệ giữa các biến số kinh tế, các quá
trình kinh tế xã hội, các mối quan hệ xảy ra giữa các đối tượng, các chủ
thể, các yếu tố kinh tế xã hội.
Công cụ sử dụng chủ yếu : Là các mô hình gọi là các mô hình kinh tế
lượng.
Kết quả : Là kết quả định lượng, sử dụng kết quả là những con số để trả lời
các câu hỏi, đưa ra khuyến nghị, dự báo, đánh giá chính sách, phân tích tác
động,… trong kinh tế.
Kiến thức nền tảng cần phải trang bị trước khi học kinh tế lượng, đó là:
Kinh tế học (Kinh tế vi mô + vĩ mô), Mô hình toán kinh tế, Xác suất thống
kê toán, tin học.
2. Phương pháp luận
+) Đặt giả thiết về vấn đề nghiên cứu
+) Xây dựng mô hình (dựa trên các luận thuyết kinh tế hay các mô hình lý
thuyết kinh tế đã đưa ra)
+) Thu thập số liệu và ước lượng các hệ số của mô hình
+) Kiểm định, đánh giá và phân tích mô hình
+) Sử dụng kết quả để phân tích và dự báo về kinh tế hay khuyến nghị
chính sách.
3. Số liệu để phân tích
Số liệu được dùng để phân tích trong môn Kinh tế lượng là số liệu thống
kê về kinh tế và bao gồm các loại số liệu sau
-) Số liệu chéo (5 chương đầu)


Là số liệu được quan sát (điều tra) về các đối tượng khác nhau tại cùng
một thời kỳ (hay cùng một thời điểm)
Ví dụ: Điều tra về thu nhập và chi tiêu của người lao động Hà Nội năm
2010
-) Số liệu thời gian (chương 6 và chương 7)


Là số liệu được quan sát (điều tra) về một đối tượng tại các mốc thời
gian cách đều nhau.
Ta hay gặp số liệu chuỗi thời gian theo năm, theo quý, theo tháng
Ví dụ: Số liệu về GDP của Việt Nam từ năm 2000 đến năm 2011, khi đó
ta có số liệu năm về GDP của Việt Nam đó là
GDP2000, GDP2001, . . . , GDP2011
-) Số liệu hỗn hợp (kết hợp hai loại số liệu trên)
Là số liệu được điều tra về các đối tượng khác nhau tại các mốc thời
gian cách đều nhau
Ví dụ: Điều tra về Doanh thu, Vốn, Lao động của tất cả các doanh
nghiệp sản xuất ở Hà Nội từ năm 2000 đến năm 2011
Yêu cầu về số liệu: Đó là số liệu được điều tra ngẫu nhiên, phù hợp với
mục đích và đối tượng nghiên cứu.
Nguồn số liệu: Số liệu được thu thập qua các cuộc điều tra (khảo sát) hay
được cung cấp bởi các cơ quan chuyên môn (như Tổng cục thống kê, Bộ
Lao động thương binh và xã hội,…)
Chương I
Mô hình hồi quy đơn
(Hay mô hình hồi quy hai biến)
1. Mô hình hồi quy
Mô hình hồi quy đơn phân tích mối liên hệ phụ thuộc giữa một biến gọi là
biến phụ thuộc (hay biến được giải thích, biến nội sinh,…) phụ thuộc vào
một biến khác được gọi là biến độc lập (hay biến giải thích, biến ngoại

sinh, biến hồi quy,…)
+) Biến phụ thuộc ký hiệu là Y
+) Biến độc lập ký hiệu là X
+) Hàm E (Y / X ) = f ( X ) gọi là hàm hồi quy đơn - Simple Regression
Function (hàm hồi quy có một biến độc lập).
2. Mô hình hồi quy tổng thể
- Toàn bộ tập hợp các phần tử đồng nhất theo một dấu hiệu nghiên cứu
định tính hoặc định lượng nào đó được gọi là tổng thể nghiên cứu hay tổng
thể.
- Giả sử có một tổng thể nghiên cứu gồm N phần tử với hai dấu hiệu
nghiên cứu: X, Y tạo thành một biến ngẫu nhiên hai chiều (X, Y).
- Để nghiên cứu BNN (X, Y) ta lập các bảng phân phối xác suất:
+ Bảng phân phối xác suất đồng thời của X và Y:


X
Y
y1
y2
.
.
.
yh

x1

x2

...


p(x1 , y1)
p(x1, y2)
.
.
.
p(x1, yh)

p(x2 , y1)
p(x2, y2)
.
.
.
p(x2, yh)

...
...
...
...
...
...

k

xk
p(xk , y1)
p(xk , y2)
.
.
.
p(xk , yh)


h

∑∑ p( x , y ) = 1
i =1 j =1

i

j

Các bảng phân phối xác suất có điều kiện của Y theo Xi (i = 1 ÷ k )
Y/(X = Xi)
P(Y / X i )

y1
P[(Y= y1)/Xi]

y2
P[(Y= y2)/Xi]

...
...

yh
P[(Y = yh) /Xi]

Kỳ vọng toán của Y với điều kiện của X = Xi
h

E (Y / X i ) = ∑ y j P[(Y = y j ) / X i ]

j =1

Nhận thấy E (Y / X i ) = f ( X i ) hay E (Y / X ) = f ( X ) là một hàm số theo
X và gọi là hàm hồi quy tổng thể của Y đối với X (Population Regression
Function – PRF). Nó cho biết giá trị trung bình của Y thay đổi như thế nào
theo X.
Giả sử PRF có dạng tuyến tính
E (Y / X i ) = β1 + β 2 X i (i = 1 ÷ k ) hay E (Y / X ) = β1 + β 2 X
Trong đó β1 , β 2 gọi là các hệ số hồi quy (Regression Coefficient):
+) Hệ số β1 = E (Y / X = 0) gọi là hệ số chặn (Intercept - INPT) hệ số này
cho biết giá trị trung bình của biến phụ thuộc Y khi biến X = 0.
+) Hệ số β 2 =

dE (Y / X )
gọi là hệ số góc (Slope coeffcient) hệ số này cho
dX

biết khi X tăng lên 1 đơn vị thì giá trị trung bình của Y thay đổi như thế
nào.
- Ứng với mỗi giá trị cá biệt Yi của Y ta có:

Yi = β1 + β 2 X i + ui

(i = 1 ÷ N)

hay Y = β1 + β 2 X + u
gọi là mô hình hồi quy tổng thể (Population Regression Model – PRM).


Với ui = Yi − E (Y / X i ) gọi là sai số ngẫu nhiên (Random error), phản ánh

chênh lệch giữa giá trị cá biệt của Y với giá trị trung bình của Y.
- Sai số ngẫu nhiên ui đại diện cho tất cả những yếu tố không phải biến độc
lập có trong mô hình nhưng cũng tác động đến biến phụ thuộc, đó là:
+ Những yếu tố không biết
+ Những yếu tố không có số liệu
+ Những yếu tố mà tác động của nó quá nhỏ không mang tính hệ thống
- Sự tồn tại của sai số ngẫu nhiên là tất yếu khách quan và nó có vai trò
đặc biệt quan trọng trong phân tích hồi quy, nó phải thoả mãn những điều
kiện nhất định thì việc phân tích trên mô hình mới có ý nghĩa.
3. Mô hình hồi quy mẫu
- Trong thực tế chúng ta không có được tổng thể hoặc có nhưng không thể
(hoặc không cần thiết) nghiên cứu toàn bộ tổng thể vì vậy không thể tìm
được PRF mặc dù dạng của PRF có thể biết.
- Mẫu ngẫu nhiên là một bộ phận mang thông tin của tổng thể được lấy ra
từ tổng thể theo những nguyên tắc nhất định.
- Giả sử từ tổng thể lập mẫu ngẫu nhiên kích thước n:
Wn = {(Xi, Yi); i = 1 ÷ n }
- Trong mẫu Wn = {(Xi, Yi): i = 1 ÷ n )} tồn tại một hàm số có dạng giống
như PRF mô tả xu thế biến động của trung bình biến phụ thuộc theo biến
độc lập, thực chất nó là một ước lượng điểm của PRF, ký hiệu:

hay

Yˆi = βˆ1 + βˆ2 X i , (i = 1 ÷ n)
Yˆ = βˆ1 + βˆ2 X

gọi là hàm hồi quy mẫu (Sample Regression Function - SRF).
- Trong đó: βˆ1 , βˆ2 gọi là các hệ số hồi quy ước lượng được (Estimated
regression coeffcient), thực chất chúng lần lượt là các ước lượng điểm của
β1, β2 và Ŷi là các giá trị ước lượng được (Fitted value), thực chất nó là các

ước lượng điểm của E(Y/Xi).
- Ứng với mỗi giá trị cá biệt của Y ta có:

Yi = βˆ1 + βˆ2 X i + ei , (i = 1 ÷ n)
hay Y = βˆ1 + βˆ2 X + e

gọi là mô hình hồi quy mẫu (Sample Regression Model – SRM)
với ei = Yi − Yˆi , (i = 1 ÷ n) gọi là các phần dư (Residuals), thực chất
chúng là các ước lượng điểm của các sai số ngẫu nhiên ui. Các phần dư ei
phản ánh chênh lệch giữa giá trị cá biệt Yi trong mẫu W với giá trị ước


lượng được Ŷi . Bản chất của các phần dư ei giống như các sai số ngẫu
nhiên ui.
Y

ui

Yˆi = βˆ1 + βˆ2 X i

Yi

ei

Yˆi

(SRF )

E (Y / X i ) = β1 + β 2 X i ( PRF )


E(Y/Xi)

Xi

X

Tương ứng với mỗi mẫu rút ra từ tổng thể ta sẽ tìm được một hàm hồi quy
mẫu SRF, tức là có rất nhiều SRF khác nhau mà chúng đều là các ước
lượng điểm của PRF, ta cần tìm SRF nào đại diện tốt nhất cho PRF
4. Tính tuyến tính trong mô hình hồi quy
+) Tuyến tính theo tham số và biến số
+) Tuyến tính theo tham số, phi tuyến theo biến số
+) Phi tuyến theo cả tham số và biến số
Kết luận: Mô hình hồi quy tuyến tính theo nghĩa nó tuyến tính theo tham
số
5. Phương pháp ước lượng – Phương pháp bình phương nhỏ nhất
(Ordinary Least Squares Method – OLS)
Xét mô hình hồi quy đơn dạng tuyến tính
E (Y / X i ) = β1 + β 2 X i
PRF:
Yi = β1 + β 2 X i + ui
(i = 1 ÷ N)
PRM:
Từ tổng thể ta lấy ra một mẫu ngẫu nhiên kích thước n

W = { ( X i , Yi ); i = 1 ÷ n}

Dựa vào mẫu này ta tìm được một ước lượng điểm của PRF
SRF: Yˆi = βˆ1 + βˆ2 X i
SRM: Yi = βˆ1 + βˆ2 X i + ei


(i = 1 ÷ n)


Nội dung phương pháp bình phương nhỏ nhất (OLS) là ta tìm βˆ1 , βˆ2 sao
cho
n

n

n

i =1

i =1

∑ e = ∑ (Yi − Yˆi )2 = ∑ (Yi − βˆ1 − βˆ2 X i )2 → min
i =1

2
i

Đặt
n

f ( βˆ1 , βˆ2 ) = ∑ (Yi − βˆ1 − βˆ2 X i ) 2 khi đó tìm βˆ1 , βˆ2 là nghiệm của hệ
i =1

phương trình


 ∂f ( βˆ1 , βˆ2 )
 n
=
0
−2∑ (Yi − βˆ1 − βˆ2 X i ) = 0


ˆ
 ∂β1
 i =1
⇔ n

 ∂f ( βˆ1 , βˆ2 ) = 0
−2 X (Y − βˆ − βˆ X ) = 0
i
i
1
2 i
 ∂βˆ
 ∑
i =1
2

n
1 n
 ˆ ˆ n
ˆ ˆ 1 n
n
β
+

β
X
=
Y
β
+
β
X
=
Yi



2∑
i
i
2
i
 1
 1
n
n


i =1
i =1
i =1
i =1
⇔ n



n
n
n
n
n
2
 βˆ
 βˆ 1 X + βˆ 1 X 2 = 1 X Y
ˆ
X
+
β
X
=
X
Y

∑ i n∑
i
2∑
i
i i
i
2
i i
 1 ∑
 1 n ∑
n i=1
i =1

i =1
i =1
i =1
i =1
1 n
1 n
 βˆ1 = Y − βˆ2 X
X = ∑ X i , Y = ∑ Yi
n i =1
n i =1

Đặt
ta

ˆ
XY − X Y
1 n 2
1 n
β
=
2
 2
2
2
X = ∑ X i , XY = ∑ X iYi ;
X

(
X
)


n i =1
n i =1

Nếu đặt xi = X i − X ,

yi = Yi − Y thì

 βˆ1 = Y − βˆ2 X

n

xi yi
ˆ ∑
i =1
β2 = n

xi2


i =1

Thí dụ:
Bảng sau đây cho số liệu về lãi suất (Y) và tỷ lệ lạm phát (X) trong năm
1988 của 9 nước trong một khu vực.
X
7.2
4.0
3.1
1.6

4.8
51.0
2.0
6.6 4.4


Y

11.9

9.4

7.5

4.0

11.3

66.3

2.2

10.3

7.6

Giả sử sự phụ thuộc của E(Y/X) vào X có dạng E(Y/X) = β1 + β2X.
Hãy tìm hàm hồi quy mẫu là ước lượng của hàm hồi quy tổng thể.
3. Tính không chệch và độ chính xác của ước lượng
3.1. Các giả thiết của phương pháp OLS

Giả thiết 1:
Mô hình được ước lượng dựa trên mẫu ngẫu nhiên kích thước n
Giả thiết 2:
E(u / X) = 0 hay E(ui) = 0 với mọi i
Giả thiết 3:
Var(u / X) = σ2 hay Var(ui) = σ2 với mọi i
3.2. Tính không chệch của các ước lượng
Nếu giả thiết 2 được thỏa mãn thì ta có

E ( βˆ1 ) = β1 , E ( βˆ2 ) = β 2

3.3. Độ chính xác của các ước lượng
n

Var(βˆ1 ) = σ 2

∑X
i =1
n

2
i

⇒ σ βˆ = Var(βˆ1 )

n∑ xi2

1

i =1


Var(βˆ2 ) =

σ
n

2

⇒ σ βˆ = Var(βˆ2 )

∑x
i =1

2

2
i
n

Với σ được ước lượng bởi
2

σˆ 2 =

∑e
i =1

2
i


n−2

n

⇒ σˆ =

∑e
i =1

2
i

n−2

σˆ được gọi là độ lệch chuẩn của đường hồi quy (S.E of Regression). Khi
thay σˆ 2 cho σ 2 thì độ lệch chuẩn của βˆ1 , βˆ2 khi đó trở thành sai số tiêu
chuẩn (Standard error) của βˆ1 , βˆ2


n

∑X

Se(βˆ1 ) = σˆ

i =1
n

2
i


n∑ xi2

, Se(βˆ2 ) =

i =1

σˆ
n

∑x
i =1

2
i

Các ước lượng bằng phương pháp bình phương nhỏ nhất còn có một số
tính chất sau

1 n
e = ∑ ei = 0
n i =1

Tính chất 1:

n

∑e X

Tính chất 2:


i =1

Tính chất 3:
Tính chất 4:

i

i

=0

Đồ thị hàm hồi quy mẫu đi qua điểm trung bình mẫu

Yˆ = Y

4. Độ phù hợp của hàm hồi quy mẫu – Hệ số xác định của mô hình
4.1. Phân tích độ biến động của biến phụ thuộc
Xuất phát từ mô hình hồi quy mẫu đó là
Yi = Yˆi + ei ⇔ Yi − Y = Yˆi − Y + ei ,
bình phương hai vế đẳng thức này và áp dụng các tính chất của phương
n

n

n

i =1

i =1


n

n

i =1

i =1

2
2
pháp OLS ta có ∑ (Yi − Y ) = ∑ (Yˆi − Y ) + ∑ ei
2

i =1

n

hay

∑ (Yi − Y ) = ∑ (Yˆi − Y )2 + ∑ (Yi − Yˆi )2
i =1

2

Ta đặt :
n

∑ (Y − Y )
i =1


2

i

= TSS ( Total Sum of Squares) là tổng bình phương chênh

lệch của các giá trị cá biệt (biến phụ thuộc) so với trung bình mẫu, hay còn
gọi là đại lượng đo tổng biến động của biến phụ thuộc (trong mẫu).
n

∑ (Yˆ − Y )
i =1

i

2

= ESS ( Explained Sum of Squares) là tổng bình phương

chênh lệch giữa giá trị của biến phụ thuộc được tính bởi hàm hồi quy mẫu


so với trung bình mẫu (biến phụ thuộc), hay còn gọi là đại lượng đo tổng
biến động của biến phụ thuộc được giải thích bởi các biến độc lập.
n

n

∑ e = ∑ (Y − Yˆ )

i =1

2
i

i =1

i

i

2

= RSS (Residual Sum of Squares) là tổng bình

phương phần dư, hay còn gọi là đại lượng đo tổng biến động của biến phụ
thuộc được giải thích bởi các yếu tố ngẫu nhiên.
Khi đó ta có TSS = ESS + RSS
4.2. Hệ số xác định của mô hình

R2 =

Nếu đặt

ESS
RSS
= 1−
TSS
TSS


Thì R2 gọi là hệ số xác định của mô hình
+) Dễ thấy 0 ≤ R 2 ≤ 1
+) Ý nghĩa của hệ số xác định R 2 : Cho biết biến độc lập X trong mô hình
giải thích được 100*R2 (%) sự biến động của biến phụ thuộc Y.
Chú ý : R2 được xác định theo công thức trên là đại lượng ngẫu nhiên nếu
mẫu là ngẫu nhiên, tuy nhiên với mẫu cụ thể thì R2 là con số cụ thể.
Chương II
Mô hình hồi quy bội
(Hay mô hình hồi quy k biến)
1 . Sự cần thiết của mô hình hồi quy bội
(Người học tham khảo trong giáo tình Kinh tế lượng của các tác giả
Nguyễn Quang Dong và Nguyễn Thị Minh)
2. Mô hình hồi quy bội và phương pháp ước lượng OLS
2.1. Mô hình hồi quy tổng thể và các giả thiết
• Mô hình hồi quy tổng thể (PRM) và hàm hồi quy tổng thể (PRF)

PRM
PRF
Hay

PRM
PRF

Yi = β1 + β 2 X 2i + L + β k X ki + ui

(i = 1 ÷ N)

E (Yi ) = E (Y / X 2i ,..., X ki ) = β1 + β 2 X 2 i + L + β k X ki
Y = β1 + β 2 X 2 + L + β k X k + u
E (Y ) = E (Y / X 2 ,..., X k ) = β1 + β 2 X 2 + L + β k X k


Trong đó:
Y là biến phụ thuộc


X1 ≡ C (tất cả giá trị của biến C đều bằng 1)
X2, …, Xk là các biến độc lập
β1 gọi là hệ số chặn
β2, ...., βk gọi là các hệ số góc riêng phần (các hệ số hồi quy tương
ứng với các biến X2, …, Xk)
- Giá trị của k cho biết số tham số cần ước lượng của mô hình.
- Hệ số chặn β = E (Y / X = L = X = 0)
1

2

k

là giá trị trung bình của Y khi X m = 0, ∀m = 2 ÷ k
- Hệ số
∂E (Y / X ,K , X )

βm =

2

∀m = 2 ÷ k

k


∂X m

cho biết khi Xm tăng một đơn vị thì trung bình của Y thay đổi như thế nào
trong điều kiện các biến Xj; ( ∀j ≠ m ) không thay đổi.
Dạng ma trận của mô hình

Đặt:

Xi = (1 X2i … Xki)

 β1 
 ÷
β2
β=  ÷
 M÷
 ÷
 βk 

Ta có E(Yi) = Xiβ và Yi = Xiβ + ui
Ngắn gọn hơn nếu đặt

 Y1 
 ÷
Y2
Y =  ÷; X =
 M÷
 ÷
 YN 









1 X 21 L
1 X 22 L
M M O
1 X 2N L

X k1 
÷
Xk2 ÷
; β=
M ÷
÷
X kN 

 β1 
 ÷
 β 2 ÷; u =
 M÷
 ÷
 βk 

 u1 
 ÷
 u2 ÷
M÷

 ÷
 uN 

Thì E(Y) = Xβ và Y = Xβ + u
• Các giả thiết
Giả thiết 1:
Mô hình được ước lượng dựa trên mẫu ngẫu nhiên kích thước n
Giả thiết 2:
E(u / X) = 0
Giả thiết 3:


Var(u / X) = σ2
Giả thiết 4:
Giữa các biến độc lập không có hiện tượng đa cộng tuyến hoàn hảo
2.2. Mô hình hồi quy mẫu và phương pháp OLS
• Hàm hồi quy mẫu và mô hình hồi quy mẫu
Với một mẫu kích thước n:

Wn = { (Yi , X 2i ,K , X ki ), i = 1 ÷ n}

thì hàm hồi quy mẫu (SRF) và mô hình hồi quy mẫu (SRM) có dạng:
SRF:
Yˆi = βˆ1 + βˆ2 X 2 i + L + βˆk X ki
SRM:
Trong đó:

Yi = βˆ1 + βˆ2 X 2 i + L + βˆk X ki + ei

(i = 1 ÷ n)


βˆ1 , βˆ2 ,..., βˆk là các hệ số hồi quy ước lượng được, thực chất chúng lần
lượt là các ước lượng điểm của β1 , β 2 ,..., β k .
Ŷi là các giá trị ước lượng được của biến phụ thuộc, thực chất là các ước
lượng điểm của của E(Y/ X2i,…,Xki) .
ei là các phần dư, thực chất là các ước lượng điểm của các sai số ngẫu
nhiên ui.
Dạng ma trận

 Y1 
 ÷
Y2 ÷

Y=
 M÷
 ÷
 Yn 

Đặt



X= 




1 X 21 L
1 X 22 L
M M O

1 X 2n L

X k1 
÷
Xk2 ÷
M ÷
÷
X kn 

 βˆ1 
 ÷
 βˆ2 ÷
ˆ
=
β  ÷
 M÷
 βˆ ÷
 k

Thì SRF và SRM có thể viết dưới dạng
SRF: Ŷ = X βˆ và SRM: Y = X βˆ + e
• Phương pháp ước lượng bằng OLS
Tương tự mô hình hồi quy đơn ta tìm βˆ1 , βˆ2 ,..., βˆk sao cho
n

n

n

i =1


i =1

∑ e = ∑ (Yi − Yˆi )2 = ∑ (Yi − βˆ1 − βˆ2 X 2i − L − βˆk X ki )2 → min
i =1

2
i

n

Đặt

f ( βˆ1 , βˆ2 ,..., βˆk ) = ∑ (Yi − βˆ1 − βˆ2 X 2i − L − βˆk X ki ) 2
i =1

 e1 
 ÷
e2 ÷

e=
 M÷
 ÷
 en 


khi đó βˆ1 , βˆ2 ,..., βˆk là nghiệm của hệ phương trình

 ∂f ( βˆ1 , βˆ2 ,..., βˆk )
 n

=0

−2∑ (Yi − βˆ1 − βˆ2 X 2 i − L − βˆk i ) = 0
ˆ

∂β1

 i =1
 ∂f ( βˆ , βˆ ,..., βˆ )
 n
1
2
k

=0
−2∑ X 2i (Yi − βˆ1 − βˆ2 X 2 i − L − βˆk i ) = 0

⇔  i =1
∂βˆ2

...............................
..............................................................


 ∂f ( βˆ , βˆ ,..., βˆ )
 n
ˆ ˆ
ˆ
1
2

k
=0

 −2∑ X k i (Yi − β1 − β 2 X 2 i − L − β k i ) = 0
 i =1
∂βˆk

n
n
n

ˆ
ˆ
ˆ
 nβ1 + β 2 ∑ X 2i + L + β 2 ∑ X 2i = ∑ Yi
i =1
i =1
i =1

n
n
n
ˆ n
2
ˆ
ˆ
β
X
+
β

X
+
L
+
β
X
X
=
X 2iYi
 ∑

2∑
2i
k∑
2i
ki
⇔  1 i =1 2i
i =1
i =1
i =1
................................................................................

n
n
n
ˆ n
2
ˆ
ˆ
 β1 ∑ X k i + β 2 ∑ X k i X 2 i + L + β k ∑ X k i = ∑ X k iYi

i =1
i =1
i =1
 i =1

Dạng ma trận, tìm véc tơ βˆ sao cho e’e → min với
e’e = (Y’ - βˆ ’X’)( Y - βˆ X) = Y’Y - Y’X βˆ - βˆ ’X’Y + βˆ ’X’X βˆ

∂e, e
= -2 X’Y + 2’X’X βˆ = [0] ⇔ (X’X) βˆ = X’Y ⇔ giải hệ phương
ˆ
∂β
trình sau

 n

 n
 ∑ X 2i
 i =1
 M
 n
 ∑ X ki
 i =1

n

∑ X 2i

L


i =1

n

∑X
i =1

L

2
2i

M

O

n

∑X X
i =1

ki

2i

L


÷ βˆ  
i =1

÷ 1 ÷ 
n
X 2 i X ki ÷ βˆ2 ÷ 

i =1
÷ ÷ = 
÷ M ÷ 
M
÷ βˆ ÷ 
n
2
÷ k 
X

ki

i =1
n

∑X

ki

1
X 21

1
L
X 22 L


M
X k1

M O
Xk2 L

1   Y1 
 ÷
X 2n ÷
÷ Y2 ÷
M ÷ M÷
÷ ÷
X kn  Yn 

Để giải được hệ trên điều kiện cần là ma trận X’X không suy biến, hay các
biến độc lập không có quan hệ cộng tuyến với nhau.


2.3. Độ phù hợp của hàm hồi quy
• Hệ số xác định bội
Tương tự mô hình hồi quy đơn ta có

R2 =

ESS
RSS
= 1−
TSS
TSS


Tuy nhiên R2 trường hợp này gọi là hệ số xác định bội của mô hình
+) Dễ thấy 0 ≤ R 2 ≤ 1
+) Ý nghĩa của hệ số xác định R2 : Cho biết các biến độc lập có trong mô
hình giải thích được 100*R2 (%) sự biến động của biến phụ thuộc.
Chú ý : R2 được xác định theo công thức trên là đại lượng ngẫu nhiên nếu
mẫu là ngẫu nhiên, tuy nhiên với mẫu cụ thể thì R2 là con số cụ thể.
• Hệ số xác định hiệu chỉnh
Nếu đặt

2

R = 1 − (1 − R 2 )

n −1
n−k

Thì R 2 gọi là hệ số xác định hiệu chỉnh của mô hình
2
+) Ta có tính chất: R < R 2
+) Ý nghĩa của hệ số xác định R 2 : Khi thêm biến giải thích vào mô hình
thì hệ số xác định tăng lên cho dù biến mới thêm vào có thực sự giải thích
cho biến phụ thuộc hay không. Như vậy hai mô hình có số biến độc lập
không giống nhau, khi đó đánh giá mô hình nào giải thích được tốt hơn cho
biến phụ thuộc dựa trên tiêu chí hệ số xác định không còn chính xác, do đó
người ta dùng hệ số xác định điều chỉnh.
Khi thêm biến giải thích vào mô hình, nếu hệ số xác định điều chỉnh tăng
lên thì đó là một trong các tiêu chí cho thấy nên thêm biến giải thích này
vào mô hình (tất nhiên cần chú ý đến ý nghĩa kinh tế của mô hình khi thêm
biến mới).
2.4. Tính tốt nhất của các ước lượng bằng phương pháp OLS

• Định lý Gauss – Markov: Nếu các giả thiết của phương pháp bình
phương nhỏ nhất được thỏa mãn thì βˆ = (X’X)-1X’Y là ước lượng
tuyến tính, không chệch, tốt nhất của β.
• Ước lượng không chệch
E( βˆ ) = β hay

E ( βˆ j ) = β j

j = 2÷k

• Độ chính xác của ước lượng
Phương sai và hiệp phương sai của các hệ số ước lượng


 Var(βˆ1 )

 Cov( βˆ2 , βˆ1 )
ˆ
Cov( β ) = 
 M
 Cov( βˆ , βˆ )

k
1
Var(βˆ j ) =

Cov( βˆ1 , βˆ2 ) L
Var(βˆ2 )
L


Cov( βˆ1 , βˆk ) 
÷
Cov( βˆ2 , βˆk ) ÷
= σ 2 (X’X)-1
÷
M
O
M
÷
ˆ
ˆ
ˆ
Cov ( β k , β 2 ) L
Var(β k ) ÷


σ2
n

(1 − R )∑ x 2ji
2
j

⇒ σ βˆ = Var(βˆ j ) =
j

i =1

σ
n


(1 − R 2j )∑ x 2ji
i =1

Với σ được ước lượng bởi
2

n

∑e

2
i

n

∑e

RSS
n−k
n−k
n−k
Khi thay σˆ 2 cho σ 2 thì sai số tiêu chuẩn của βˆ j
σˆ
Se(βˆ j ) =

σˆ 2 =

i =1


=

RSS
⇒ σˆ =
n−k

2
i

i =1

=

n

(1 − R 2j )∑ x 2ji
i =1

Trong đó Rj2 là hệ số xác định của mô hình khi hồi quy X j với các biến độc
lập còn lại.
3. Một số mô hình phi tuyến có thể đưa về dạng tuyến tính
+) Mô hình hàm tổng chi phí
Với TC là tổng chi phí, Q là sản lượng
Ta có mô hình hàm tổng chi phí như sau
TC = β1 + β2Q + β3Q2 + β4Q3 + u với β1 > 0, β2 > 0, β3 < 0, β4 > 0
Nếu ta đặt Q2 = Q2, Q3 = Q3 thì ta có mô hình tuyến tính sau
TC = β1 + β2Q + β3Q2 + β4Q3 + u
+) Hàm tăng trưởng
- Dạng hàm: Yt = Y0 (1 + r )t với r là nhịp tăng trưởng.
- Biến đổi: ln Yt = ln Y0 + t ln(1 + r )

- Đặt: β1 = ln Y0 , β 2 = ln(1 + r ) ⇒ ln Yt = β1 + β 2 t
+) Hàm sản xuất Coob – Douglas
Dạng hàm
Q = e β1 K β 2 Lβ3


Mô hình

Qi = e β1 K iβ2 Lβi 3 e ui

với β 2 , β 3 là hệ số co giãn của Q theo K, L.
lnQi = β1 + β 2 lnK i + β 3lnLi + u i
- Biến đổi ta có
- Đặt: lnQi = LQi , lnK i = LK i , lnL i = LLi

⇒ LQi = β1 + β 2 LK i + β 3 LLi + u i

Hàm Cobb – Douglas có thể mở rộng cho trường hợp nhiều biến giải thích

Y = e β1 X 2β2 X 3β3 L X kβk ⇒ lnY = β1 + β 2lnX 2 + β3lnX 3 + L + β k lnX k
Trong đó β j là hệ số co dãn của Y đối với Xj ( j = 1 ÷ k )
+) Hàm tuyến tính – loga
- Dạng hàm Yi = β1 + β 2 lnX i + u i
- Đặt: X*i = lnX i ⇒ Yi = β1 + β 2 X*i + u i
Lưu ý đơn vị khi phân tích tác động của X tới Y
+) Hàm loga – tuyến tính
lnYi = β1 + β 2 X i + u i
- Dạng hàm
- Đặt: Yi* = lnYi ⇒ Yi* = β1 + β 2 X i + u i
+) Hàm dạng Hypecbol

- Mô hình chi phí trung bình phụ thuộc vào sản lượng

Yi = β1 + β 2

1
+ u i với β1 > 0, β 2 > 0
Xi

- Mô hình chi tiêu phụ thuộc vào thu nhập (đường cong Engel)

Yi = β1 + β 2

1
+ u i với β1 > 0, β 2 < 0
Xi

- Mô hình lạm phát phụ thuộc vào tỷ lệ thất nghiệp (đường cong Philips)

Yi = β1 + β 2

1
+ ui
Xi

với β1 < 0, β 2 > 0

Với mô hình dạng Hypecbol như đã nêu trên ta đặt

X*i =


1
⇒ Yi = β1 + β 2 X*i + u i
Xi

Chương III
Suy diễn thống kê và dự báo từ mô hình hồi quy


1. Quy luật phân phối xác suất của một số thống kê mẫu
Chương I và chương II đã trình bày thì các ước lượng nhận được bằng
phương pháp OLS là dựa vào thông tin mẫu. Xuất phát từ các ước lượng
nhận được ta muốn suy đoán thống kê về các tham số của tổng thể thì ta
cần phải biết quy luật phân phối xác suất của các ước lượng. Do quy luật
phân phối xác suất của các ước lượng đều có liên quan trực tiếp với quy
luật phân phối xác suất của sai số ngẫu nhiên, do vậy ta giả thiết sai số
ngẫu nhiên có phân phối chuẩn (xem giả thiết 2 + 3 ở trên)
Giả thiết 5: ui ~ N (0, σ 2 ) (∀i )
Do βˆ j là ước lượng tuyến tính, tức là βˆ j là hàm tuyến tính của các sai số
ngẫu nhiên ui nên

(

βˆ j ~ N β j , Var(βˆ j )

)

(

hay βˆ j ~ N β j , σ β2ˆ


βˆ j − β j

j

)

( j = 1÷ k)

βˆ j − β j
⇒U =
=
~ N (0, 1) ( j = 1 ÷ k )
σ
ˆ
Var(β j )
βˆ j
Khi thay

σ βˆ bởi Se( βˆ j ) ta có
j
βˆ j − β j
T=
~ T (n − k )
Se( βˆ )
j

2. Bài toán xây dựng khoảng tin cậy cho các hệ số hồi quy
Với độ tin cậy 1 − α cho trước, α1 + α 2 = α
2.1. Khoảng tin cậy cho từng hệ số hôi quy
Với mẫu ngẫu nhiên ta có


P[βˆ j − Se( βˆ j )tα( n2 − k ) < β j < βˆ j + Se( βˆ j )tα( n1 − k ) ] = 1 − α

Với độ tin cậy 1 - α cho trước, các khoảng tin cậy thường dùng cho β j như
sau:
Khoảng tin cậy hai phía (đối xứng)

βˆ j − Se( βˆ j ) t α( n − k ) < β j < βˆ j + Se( βˆ j ) t α( n − k )
2

2


Khoảng tin cậy phía trái (dùng để ước lượng tối đa cho βj)

β j < βˆ j + Se( βˆ j ) tα( n − k )

Khoảng tin cậy phía phải (dùng để ước lượng tối thiểu cho βj)

β j > βˆ j − Se( βˆ j ) tα( n − k )

2.2. Khoảng tin cậy cho tổ hợp hai hệ số
Ta có

(a βˆ j + bβˆs ) - (a β j + bβ s )
T=
~ T (n − k )
Se(a βˆ j + bβˆs )

Với mẫu ngẫu nhiên ta có


P[(a βˆ j + bβˆs ) − Se(a βˆ j + bβˆs )tα( n2 −k ) < (a β j + bβ s ) < (a βˆ j + bβˆs ) + Se(a βˆ j + bβˆs )tα( n1 −k ) ]
= 1−α

với
Se(a βˆ j + bβˆs ) = a 2 Var( βˆ j ) + b 2 Var( βˆs ) + 2abCov( βˆ j , βˆs )

Với độ tin cậy 1 - α cho trước, các khoảng tin cậy thường dùng cho
aβj + bβs như sau:
Khoảng tin cậy hai phía (đối xứng)

(a βˆ j + bβˆs ) − Se( a βˆ j + bβˆs )t α( n− k ) < ( a β j + bβ s ) < ( a βˆ j + bβˆs ) + Se( a βˆ j + bβˆs )t α( n− k )
2

Khoảng tin cậy phía trái (dùng để ước lượng tối đa cho aβj + bβs)

(aβ j + bβ s ) < (aβˆ j + bβˆs ) + Se(a βˆ j + bβˆs )tα( n− k )

Khoảng tin cậy phía phải (dùng để ước lượng tối thiểu cho aβj + bβs)

(aβ j + bβ s ) > (aβˆ j + bβˆs ) − Se(aβˆ j + bβˆs )tα( n− k )

2.3. Ý nghĩa của khoảng tin cậy
(Người học tham khảo trong giáo tình Kinh tế lượng của các tác giả
Nguyễn Quang Dong và Nguyễn Thị Minh)
2.4. Các yếu tố ảnh hưởng đến độ dài khoảng tin cậy
( n−k )
• Số bậc tự do (n – k): số bậc tự do (n – k) càng nhỏ thì t α2
càng lớn
kéo theo khoảng tin cậy càng rộng.


2


• Mối tương quan tuyến tính giữa các biến độc lập : Mối tương quan

tuyến tính giữa các biến độc lập càng chặt chẽ thì Se( βˆ j ) càng lớn
kéo theo khoảng tin cậy càng rộng

3. Bài toán kiểm định giả thuyết thống kê về các hệ số hồi quy
3.1 Kiểm định về từng hệ số hồi quy
Do chưa có tổng thể nên ta chưa biết được các β j , nhưng có thể cho rằng
nó bằng β * (với β * cho trước ) hay không ? khi ấy ta đưa ra giả thuyết

H 0 : β j = β * . Để kiểm định giả thuyết này ta chọn tiêu chuẩn kiểm định
βˆ j − β *
T=
Se( βˆ j )
βˆ j − β *
*
~ T (n − k ) , do vậy
Nếu giả thuyết H 0 : β j = β là đúng thì T =
Se( βˆ j )
với mức ý nghĩa α cho trước tùy thuộc vào giả thuyết đối H 1 mà ta xây
dựng được các miền bác bỏ giả thuyết H0 tương ứng với các trường hợp
sau
-) Nếu ta kiểm định cặp giả thuyết

 H 0 : β j = β *


*
 H1 : β j ≠ β



βˆ j − β *
; T > t α( n−k ) 
thì Wα = T =
2
Se( βˆ j )


( n−k )
Với mẫu cụ thể và với α cho trước mà Tqs > t α
thì ta bác bỏ H0
2

-) Nếu ta kiểm định cặp giả thuyết

 H 0 : β j = β *

*
 H1 : β j > β



βˆ j − β *
; T > tα( n−k ) 
thì Wα = T =
Se( βˆ j )



( n−k )
Với mẫu cụ thể và với α cho trước mà Tqs > tα
thì ta bác bỏ H0
-) Nếu ta kiểm định cặp giả thuyết

 H 0 : β j = β *

*
 H1 : β j < β



βˆ j − β *
( n−k ) 
W
=
T
=
;
T
<

t
thì


α
α

ˆ )
Se
(
β
j


( n−k )
Với mẫu cụ thể và với α cho trước mà Tqs < −tα
thì ta bác bỏ H0


 H 0 : β j = 0

 H1 : β j ≠ 0

Trường hợp riêng :

βˆ j
với mẫu cụ thể ta tính được Tqs =
Se( βˆ j )
Với trường hợp riêng ta có các chú ý sau :
• ) Nếu ta bác bỏ H0 thì ta nói hệ số βˆ j khác 0 một cách có ý nghĩa, hay hệ
số βˆ j có ý nghĩa thống kê. Nếu hệ số βˆ j không có ý nghĩa thống kê thì có
nghĩa là biến độc lập Xj không giải thích cho biến phụ thuộc Y, ngược lại
nếu hệ số βˆ j có ý nghĩa thống kê thì có nghĩa là biến độc lập X j có giải
thích cho biến phụ thuộc Y.
• ) Có thể kiểm định bằng phương pháp P – value, theo đó với α cho trước
mà α > P – value thì bác bỏ giả thuyết H0
3.2. Kiểm định giả thuyết về tổ hợp các hệ số hồi quy

Do chưa có tổng thể nên ta chưa biết được các β j , nhưng có thể cho rằng

a β j + bβ s bằng β * (với β * cho trước ) khi ấy ta đưa ra giả thuyết
H 0 : a β j + bβ s = β * . Để kiểm định giả thuyết này ta chọn tiêu chuẩn kiểm
(a βˆ j + bβˆs ) − β *
định T =
(với mẫu cụ thể, thay số tính được Tqs). Nếu
Se(a βˆ j + bβˆs )
*
giả thuyết H : a βˆ + b βˆ = β là đúng thì
0

j

s

(a βˆ j + bβˆs ) − β *
T=
~ T (n − k ) do vậy với mức ý nghĩa α cho trước tùy
Se(a βˆ + bβˆ )
j

s

thuộc vào giả thuyết đối H1 mà ta xây dựng được các miền bác bỏ giả
thuyết H0 tương ứng với các trường hợp sau
-) Nếu ta kiểm định cặp giả thuyết

thì


 H 0 : a β j + bβ s = β *

*
 H1 : a β j + bβ s ≠ β


(a βˆ j + bβˆs ) − β *
Wα = T =
; T > t α( n−k ) 
2
Se(a βˆ j + bβˆs )




( n−k )
Với mẫu cụ thể và với α cho trước mà Tqs > t α2
thì ta bác bỏ H0

-) Nếu ta kiểm định cặp giả thuyết

 H 0 : a β j + bβ s = β *

*
 H1 : a β j + bβ s > β


(a βˆ j + bβˆs ) − β *
( n−k ) 
W

=
T
=
;
T
>
t
thì


α
α
Se(a βˆ j + bβˆs )


( n−k )
Với mẫu cụ thể và với α cho trước mà Tqs > tα
thì ta bác bỏ H0
-) Nếu ta kiểm định cặp giả thuyết

 H 0 : a β j + bβ s = β *

*
 H1 : a β j + bβ s < β


(a βˆ j + bβˆs ) − β *
( n−k ) 
; T < −tα 
thì Wα = T =

ˆ + bβˆ )
Se
(
a
β
j
s


( n−k )
Với mẫu cụ thể và với α cho trước mà Tqs < −tα
thì ta bác bỏ H0
Có thể mở rộng cho kiểm định giả thuyết về tổ hợp hơn hai hệ số
3.3. Giá trị xác suất ( P_value) của các thống kê kiểm định
(Người học tham khảo trong giáo trình Kinh tế lượng của các tác giả
Nguyễn Quang Dong và Nguyễn Thị Minh)
3.4. Kiểm định sự phù hợp của hàm hồi quy
Xét mô hình hồi quy k biến, nếu tất cả các biến độc lập trong mô hình
không giải thích được cho sự biến động của biến phụ thuộc, khi ấy ta nói
hàm hồi quy không phù hợp. Ngược lại nếu có ít nhất một biến độc lập có
giải thích cho sự biến động của biến phụ thuộc, khi ấy ta nói hàm hồi quy
phù hợp.
Để kiểm định sự phù hợp của hàm hồi quy, ta kiểm định cặp giả thuyết
sau

 H 0 : β 2 = β3 = L = β k = 0

 H1 : ∃ β j ≠ 0 (∀j = 2 ÷ k )

Ta chọn tiêu chuẩn kiểm định



R2
ESS
R2
n−k
k

1
k-1
F=
=
=
×
2
2
RSS 1 − R
1− R
k −1
n-k
n−k

Theo phân tích sự biến động của biến phụ thuộc trong mẫu ta có thể chứng
minh được ESS ~ χ 2 ( k − 1) và RSS ~ χ 2 ( n − k )

ESS
k-1
nên F = RSS ~ F (k − 1; n − k )
n -k
Chú ý: R2 trong tiêu chuẩn kiểm định F là R2 ước lượng.

Khi ấy với mức ý nghĩa α cho trước miền bác bỏ giả thuyết H0 là


R2
n-k
(k-1; n-k) 
Wα =  F =
×
;
F
>
f

α
1- R 2 k-1


( k −1; n − k )
Với mẫu cụ thể và với mức ý nghĩa α cho trước mà Fqs > fα
thì ta
bác bỏ H0 tức là ta kết luận hàm hồi quy phù hợp. Trường hợp ngược lại thì
ta chưa có cơ sở bác bỏ H0 ta kết luận hàm hồi quy không phù hợp.
3.5. Kiểm định hồi quy có điều kiện ràng buộc
(Trình bày kiểm định thu hẹp hàm hồi quy)
Xét mô hình hồi quy k biến (hay k tham số)

Y = β1 + β 2 X 2 + L + β k X k + u

Nghi ngờ m biến độc lập Xk-m+1, Xk-m+2, …, Xk không giải thích cho biến
phụ thuộc Y, hay nói khác đi m biến này không có ý nghĩa trong mô hình.

Khi đó ta kiểm định cặp giả thuyết sau

 H 0 : β k −m+1 = β k −m+2 = L = β k = 0

 H1 : ∃ β j ≠ 0 [∀j = (k − m + 1) ÷ k ]

Nếu giả thuyết H0 là đúng thì từ mô hình có k tham số, gọi là mô hình
không có điều kiện ràng buộc (Unrestricted – ký hiệu U) có thể thu hẹp về
mô hình còn (k - m) tham số, gọi là mô hình có điều kiện ràng buộc
(Restricted – ký hiệu R)

Y = β1 + β 2 X 2 + L + β k −m X k −m + β k −m+1 X k −m+1 + L + β k X k + u

(U )

Y = β1 + β 2 X 2 + L + β k −m X k −m + v

( R)


Lần lượt ước lượng các mô hình trên bằng phương pháp OLS thu được
RSSU , RU2 , RSS R , RR2 .
Ta chọn tiêu chuẩn kiểm định

RSS R − RSSU
RU2 − RR2
m
m ~ F (m; n − k )
F=
=

RSSU
1 − RU2
n−k
n−k
Với mức ý nghĩa α cho trước miền bác bỏ giả thuyết H0 là

 R 2U − R 2R n - k
(m; n -k) 
Wα = F =
×
;
F
>
f

α
2
1
R
m
U



( m; n−k )

Nếu với mẫu cụ thể và với mức ý nghĩa α cho trước mà Fqs > fα
thì
ta bác bỏ H0 , điều này có nghĩa trong các biến Xk-m+1, Xk-m+2, … , Xk có ít
nhất một biến có giải thích cho biến phụ thuộc Y.

Một số trường hợp đặc biệt
-) Trường hợp m = 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm định
về từng hệ số hồi quy, Fqs trong trường hợp này bằng bình phương Tqs ứng
với hệ số đó.
-) Trường hợp m = k – 1 thì kiểm định thu hẹp hàm hồi quy chính là kiểm
định về sự phù hợp của hàm hồi quy.
-) Kiểm định mở rộng hàm hồi quy tương đương với kiểm định thu hẹp
hàm hồi quy, chú ý rằng k luôn là số tham số của mô hình lớn, dù là kiểm
định về thu hẹp hay mở rộng hàm hồi quy.
4. Một số kiểm định khác
(Người học tham khảo trong giáo tình Kinh tế lượng của các tác giả
Nguyễn Quang Dong và Nguyễn Thị Minh)
5. Dự báo giá trị của biến phụ thuộc
Khi véc tơ X 0 = (1 X 02 L X 0k ) cho trước ta cần dự báo giá trị trung
bình và cá biệt của biến phụ thuộc.
+) Dự báo giá trị trung bình E(Y/ X0)
Với độ tin cậy 1 - α ta có khoảng tin cậy đối xứng của E(Y/ X0) như sau

ˆ − Se(Y
ˆ ) t α( n−k ) < E(Y/ X 0 ) < Y
ˆ + Se(Y
ˆ ) t α( n−k )
Y
0
0
0
0
2

2



Với

ˆ = X 0 βˆ = βˆ + βˆ X 0 + L + βˆ X 0
Y
0
1
2 2
k
k
ˆ ) = σˆ X 0' (X ' X) -1X 0
Se(Y
0

+) Dự báo giá trị cá biệt (Y/ X0)
Với độ tin cậy 1 - α ta có khoảng tin cậy đối xứng của (Y/ X0) như sau

ˆ − Se(Y
ˆ -Y ) t α( n−k ) < (Y/ X 0 ) < Y
ˆ + Se(Y
ˆ -Y ) t α( n−k )
Y
0
0
0
0
0
0
2


Với

2

ˆ -Y ) = σˆ 1+X 0' (X ' X)-1X 0
Se(Y
0
0

Trường hợp mô hình hồi quy đơn ta có

ˆ − Se(Y
ˆ ) t α( n−2) < E(Y/ X ) < Y
ˆ + Se(Y
ˆ ) t α( n−2)
Y
0
0
0
0
0
2



2

ˆ − Se(Y
ˆ -Y ) t α

Y
0
0
0

( n − 2)
2

ˆ + Se(Y
ˆ -Y ) t α( n−2)
< (Y/ X 0 ) < Y
0
0
0
2

Với

( X 0 − X )2
1
ˆ
Se(Y0 ) = σˆ
+
n n
∑ ( X i − X )2
i =1



( X 0 − X )2

1
ˆ
Se(Y0 -Y0 ) = σˆ 1 + + n
n
∑ ( X i − X )2
i =1

Lấy ví dụ hoặc làm bài tập
Chương IV
Mô hình hồi quy với biến giả
1. Biến định tính
Các biến trong mô hình hồi quy mà ta đã xét ở phần trước thì tất cả các
biến đó là các biến định lượng. Nhưng nếu chúng ta cần nghiên cứu một
mô hình mà trong số các biến, không những có cả biến định lượng mà còn
có cả biến định tính nữa, khi ấy chúng ta muốn ước lượng các tham số của
mô hình thì ta phải làm thế nào ?
Trước hết ta hiểu một biến định tính là biến như thế nào ?
+) Biến định tính là biến cho biết có hay không có một thuộc tính nào đó.
+) Biến định tính có 2 phạm trù ( hay trạng thái) : Giả sử ta có biến định
tính với hai phạm trù, chẳng hạn A và A , điều đó có nghĩa là một cá thể
chỉ có thể thuộc vào một trong 2 phạm trù A hoặc A mà thôi


Ví dụ : Biến giới tính (có 2 phạm trù là Nam và Nữ), biến chất lượng sản
phẩm (có 2 phạm trù là Chính phẩm và Phế phẩm), biến tình trạng kinh tế
của hộ gia đình miền núi (có 2 phạm trù Hộ nghèo và Hộ không nghèo).v.v
+) Biến định tính có h phạm trù (h > 2, h∈ N): Giả sử ta có biến định tính
với h phạm trù, chẳng hạn A1, A2, . . ., Ah điều đó có nghĩa là một cá thể chỉ
có thể thuộc vào một trong h phạm trù A1, A2, . . ., Ah mà thôi
Ví dụ : Biến vùng – miền có các phạm trù (Bắc, Trung, Nam) hay (Thành

thị, Nông thôn, Miền núi), biến trình độ học vấn có các phạm trù (Thất
học, Tốt nghiệp cấp 1, Tốt nghiệp cấp 2, Tốt nghiệp cấp 3).v.v.Như vậy
biến vùng – miền có h = 3, biến trình độ học vấn có h = 4.
Như vậy biến định tính có những đặc điểm sau
-) Có số phạm trù hữu hạn
-) Một cá thể chỉ thuộc một phạm trù xác định
-) Không có đơn vị
Mục này ta xét biến phụ thuộc là biến định lượng và có biến độc lập là biến
định tính.
Xét một ví dụ sau với mô hình hồi quy mà biến phụ thuộc là biến định
lượng và một biến độc lập là biến định tính có 2 phạm trù
Ví dụ : Ta muốn xem xét thu nhập của người lao động Hà nội phụ thuộc
vào giới tính như thế nào ? hay nói khác đi, ta cần trả lời câu hỏi là: liệu có
sự khác nhau về thu nhập trung bình giữa lao động Nam và lao động Nữ ?
Đặt Y = (Thu nhập của người lao động Hà nội), u là yếu tố ngẫu nhiên

1 Nếu là lao động Nữ
D=
0 Nếu là lao động Nam
Yi = β1 + β 2 Di + ui
Ta có mô hình
Khi đó, với lao động Nam ta có : E (Y / Di = 0) = β1
Với lao động Nữ ta có : E (Y / Di = 1) = β1 + β 2
Nếu β 2 ≠ 0 thì thu nhập trung bình giữa lao động Nam và lao động Nữ có
sự khác nhau.
Biến D được đặt như trên được gọi là biến giả (Dummy variable)
2. Quy tắc đặt biến giả
Nhận xét
+) Biến giả chỉ nhận giá trị 0 hoặc 1
+) Bất kỳ cá thể nào của tổng thể, đều phải có giá trị của biến giả



+) Các biến giả phân chia tổng thể thành những phần riêng biệt ứng với các
phạm trù (trạng thái) của biến định tính
Do đó nếu biến định tính có h phạm trù A1, A2, . . . , Ah thì ta đặt h – 1 biến
giả. Phạm trù mà có tất cả các biến giả nhận giá trị 0 được gọi là phạm trù
cơ sở, giá trị trung bình của biến phụ thuộc ứng với phạm trù cơ sở chính
là hệ số chặn β1 . Các hệ số ứng với các biến giả cho biết mức chênh lệch
của trung bình biến phụ thuộc ứng với phạm trù đang xét so với giá trị
trung bình của biến phụ thuộc ứng với phạm trù cơ sở.
3. Mô hình có nhiều biến định tính
Để hiểu mô hình có nhiều biến định tính là biến độc lập, ta nghiên cứu tiếp
ví dụ trên.
Yi = β1 + β 2 D1i + β 3 D2i + β 4 ( D1i * D2 i ) + ui
Ta xét mô hình
Với Y = (Thu nhập của người lao động Hà nội)

1 Nếu là lao động Nữ
D1 = 
0 Nếu là lao động Nam
1 Nếu là lao động làm việc ở khu vực tư nhân
D2 = 
0 Nếu là lao động làm việc ở khu vực nhà nước
Còn u là yếu tố ngẫu nhiên
Khi đó ta có
-) E (Y / D1i = D2 i = 0) = β1 cho biết thu nhập trung bình của lao động
Nam làm việc ở khu vực nhà nước
-) E (Y / D1i = 1, D2 i = 0) = β1 + β 2 cho biết thu nhập trung bình của lao
động Nữ làm việc ở khu vực nhà nước
-) E (Y / D1i = 0, D2 i = 1) = β1 + β 3 cho biết thu nhập trung bình của lao

động Nam làm việc ở khu vực tư nhân
-) E (Y / D1i = 1, D2 i = 1) = β1 + β 2 + β 3 + β 4 cho biết thu nhập trung bình
của lao động Nữ làm việc ở khu vực tư nhân.
4. Mô hình có một biến độc lập là định lượng và một biến độc lập là
định tính
Xét ví dụ
Gọi X = (Thu nhập của người lao động Hà nội)


×