Tải bản đầy đủ (.pdf) (179 trang)

Kinh tế lượng cao thị hồng nga

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.87 MB, 179 trang )

Chương 1

Mô hình hồi quy tuyến tính đơn
Những vấn đề cơ bản

1

Chương 1
Chủ đề chính:
-Bản chất cuả phân tích hồi qui
-Bản chất và nguồn số liệu cho phân tích
hồi qui
-Hàm hồi qui hai biến


I. Bản chất của phân tích hồi qui
1. Khái niệm:
Phân tích hồi qui là nghiên cứu sự phụ thuộc của một
biến(biến phụ thuộc hay còn gọi là biến được giải thích)
vào một hay nhiều biến khác (biến độc lập hay còn gọi là
biến giải thích) với ý tưởng cơ bản là ước lượng (hay dự
đoán) giá trị trung bình của biến phụ thuộc trên cơ sở
các giá trị đã biết của biến độc lập.
2. Một số ví dụ:
Vd1: Công ty địa ốc rất quan tâm đến việc liên hệ giữa
giá bán một ngôi nhà với các đặc trưng của nó như kích
thước, diện tích sử dụng, số phòng ngủ và phòng tắm,
các loại thiết bị gia dụng, có hồ bơi hay không, cảnh
quan có đẹp không,...
3


I. Bản chất của phân tích hồi qui
2.Một số ví dụ:
Vd2: Cho đến nay việc hút thuốc lá là nguyên nhân chính
gây tử vong do ung thư phổi được ghi chép cẩn thận. Một
mô hình hồi qui tuyến tính đơn cho vấn đề này là:
D E A T H S     .S M O K IN G  u

4


I. Bản chất của phân tích hồi qui
2. Một số ví dụ:
Vd3: Ta xem xét đồ thị phân tán sau đây mô tả phân phối về
chiều cao của học sinh nam tính theo những độ tuổi cố
định.
Đồ thị phân tán

Chiều cao(cm)

140
130
120
110
9

10

11

12


13

14

15

16

Tuổi học sinh nam
5

I. Bản chất của phân tích hồi qui
2.Một số ví dụ:
Vd4:

Sau cùng một nhà nông học có thể quan tâm tới việc
nghiên cứu sự phụ thuộc của sản lượng lúa vào nhiệt độ, lượng
mưa, nắng, phân bón,...Một nghiên cứu về sự phụ thuộc như vậy
có thể dự báo sản lượng lúa trung bình khi biết được các thông
tin trên.
Chúng

ta có thể đưa ra vô số ví dụ như trên về sự phụ
thuộc của một biến vào một hay nhiều biến khác. Các kỹ
thuật phân tích hồi qui thảo luận trong chương này nhằm
nghiên cứ sự phụ thuộc như thế giữa các biến số.
6



I. Bản chất của phân tích hồi qui
Ta ký

hiệu:

Y - biến phụ thuộc(hay biến được giải thích)
Xj - biến độc lập(hay biến giải thích) thứ j

Trong đó, biến phụ thuộc Y là đại lượng ngẫu nhiên, có
quy luật phân phối xác suất. Các biến độc lập Xj không phải là
ngẫu nhiên, giá trị của chúng đã được biết trước.

7

I. Bản chất của phân tích hồi qui
3. Phân tích hồi qui giải quyết các vấn đề sau:
- Ước lượng giá trị trung bình của biến
phụ thuộc với giá trị đã cho của biến độc lập.
- Kiểm định giả thiết về bản chất của sự
phụ thuộc.
- Dự đoán giá trị trung bình của biến phụ
thuộc khi biết giá trị của các biến độc lập.
- Kết hợp các vấn đề trên.
8


I. Bản chất của phân tích hồi qui
4. Phân biệt các quan hệ trong phân tích hồi qui:
- Quan hệ thống kê và quan hệ hàm số
- Hồi qui và nhân quả

- Hồi qui và tương quan
9

II.Bản chất và nguồn số liệu cho phân
tích hồi qui
1.Các loại số liệu
Có 3 loại số liệu:
+ Số liệu theo thời gian (chuỗi thời gian).
+ Số liệu chéo (theo không gian).
+ Hỗn hợp của hai loại trên (số liệu dạng
bảng).
10


II.Bản chất và nguồn số liệu cho phân
tích hồi qui
2.Nguồn số liệu:
-Cơ quan nhà nước cung cấp
- Các tổ chức quốc tế
- Các công ty tư nhân
- Cá nhân tự thu thập

II.Bản chất và nguồn số liệu cho phân
tích hồi qui
3. Nhược điểm của số liệu:
Một số nguyên nhân làm cho chất lượng số liệu
kém:
Có sai số khi quan sát hoặc bỏ sót quan sát hoặc cả
hai
Sai số trong đo lường hoặc làm tròn

Thiếu thông tin trả lời
Do tính tổng hợp của số liệu


III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể
Ví dụ : Giả sử ở một địa phương (tổng thể) có cả
thảy 60 gia đình và chúng ta quan tâm đến việc
nghiên cứu mối quan hệ giữa:
Y-Tiêu dùng trong tuần của các gia đình
(USD/tuần)
X-Thu nhập khả dụng trong tuần của các hộ gia
đình (USD/tuần)

13

III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Bảng 1: Thu nhập và chi tiêu trong một tuần của tổng thể
STT

X

80

100 120 140 160 180 200

220 240 260

1


55

65

79

80

102 110 120

135 137 150

2

60

70

84

93

107 115 136

137 145 152

3

65


74

90

95

110 120 140

140 155 175

4

70

80

94

103 116 130 144

152 165 178

5

75

85

98


108 118 135 145

157 175 180

6

-

88

-

113 125 140

-

160 189 185

7

-

-

-

115

-


162

Y

-

-

-

14

191


III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Các số liệu ở bảng trên được giải thích như sau:
Với thu nhập trong một tuần, chẳng hạn X=100 $ thì có 6
gia đình mà chi tiêu trong tuần của các gia đình trong nhóm
này lần lượt là 65; 70; 74; 80; 85 và 88. Tổng chi tiêu trong
tuần của nhóm này là 462 $.... Như vậy, mỗi cột của bảng
cho ta một phân phối của chi tiêu trong tuần Y với mức thu
nhập đã cho X.
Ta có thể tính được chi tiêu trung bình hàng tuần của 1 hộ
gia đình với mức thu nhập cho trước.
15

III.Hàm hồi qui hai biến

1.Hàm hồi qui tổng thể:
Kỳ vọng toán có điều kiện (trung bình có điều kiện) của Y
với điều kiện là X=Xi được tính theo công thức sau:

Từ số liệu cho ở bảng trên ta dễ dàng tính được các xác suất có
điều kiện:

Chẳng hạn: P(Y=85/X=100)=1/6; P(Y=90/X=120)=1/5,...
Từ đó ta có bảng các xác suất có điều kiện và kỳ vọng toán
có điều kiện của Y điều kiện là X=Xi
16


III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Bảng 2: Xác suất có điều kiện P(Y/X) và kz vọng có điều kiện E(Y/Xi)

X

E(Y/
X)

80
1/5

100
1/6

120
1/5


140
1/7

160
1/6

180
1/6

200
1/5

220
1/7

240
1/6

260
1/7

1/5
1/5
1/5
1/5
65

1/6
1/6

1/6
1/6
1/6
77

1/5
1/5
1/5
1/5
89

1/7
1/7
1/7
1/7
1/7
1/7
101

1/6
1/6
1/6
1/6
1/6
113

1/6
1/6
1/6
1/6

1/6
125

1/5
1/5
1/5
1/5
137

1/7
1/7
1/7
1/7
1/7
1/7
149

1/6
1/6
1/6
1/6
1/6
161

1/7
1/7
1/7
1/7
1/7
1/7

173
17

III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Biểu diễn các điểm (Xi;Yj) và
các điểm (Xi; E(Y/Xi)) ta được đồ
thị như hình bên.

200

Theo hình bên ta thấy trung
bình có điều kiện của mức chi
tiêu trong tuần nằm trên đường
thẳng có hệ số góc dương. Khi
thu nhập tăng thì mức chi tiêu
trung bình cũng tăng. Một cách
tổng quát, E(Y/Xi) là một hàm
của Xi.
E(Y/Xi) = f(Xi) (*)

120



180
160

Chi tiêu


140
100
80
60
40
20
0
0

100

200

300

Thu nhập

18


III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Hàm (*) được gọi là hàm hồi qui tổng thể (PRF-Population
Regression Function). Nếu PRF có một biến độc lập thì được gọi là
hồi qui đơn, nếu có từ hai biến độc lập trở lên được gọi là hồi qui bội.
Ý nghĩa

của hàm PRF:

-Hàm hồi qui tổng thể (PRF) cho ta biết giá trị trung bình của

biến Y sẽ thay đổi như thế nào khi biến X nhận các giá trị khác nhau.
-Để xác định dạng hàm của PRF người ta thường dựa vào đồ thị
biểu diễn sự biến thiên của dãy các số liệu quan sát về X và Y kết hợp
với việc phân tích bản chất vấn đề nghiên cứu.
19

III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Ý nghĩa

của hàm PRF:

Chúng ta xét trường hợp đơn giản nhất là PRF có dạng tuyến
tính: E(Y/Xi) = β1 + β2Xi.
Trong đó : β1, β2 là các tham số chưa biết nhưng cố định, và
được gọi là các hệ số hồi qui.
+β1: là hệ số tự do (hệ số tung độ góc). Nó cho biết giá trị trung
bình của biến phụ thuộc Y bằng bao nhiêu khi biến độc lập X nhận
giá trị 0. Điều này chỉ đúng về mặt lý thuyết, trong thực tế nhiều khi
hệ số này không có ý nghĩa.
20


III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Ý nghĩa

của hàm PRF:

+β2: là hệ số góc (hệ số độ dốc) - Cho biết giá trị trung bình


của biến phụ thuộc Y sẽ thay đổi (tăng hoặc giảm) bao nhiêu đơn vị
khi giá trị của biến độc lập X tăng một đơn vị với điều kiện các yếu
tố khác không thay đổi.
- E(Y/Xi) là trung bình có điều kiện của Y với điều kiện X
nhận giá trị Xi.
21

III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
*Thuật ngữ tuyến tính:
-Tuyến tính có 2 loại:
Tuyến tính đối với tham số
Tuyến tính đối với biến


III.Hàm hồi qui hai biến
1.Hàm hồi qui tổng thể:
Thí dụ:

Mô hình nào dưới đây là tuyến tính đối với tham

số, mô hình nào tuyến tính đối với biến số, mô hình
nào tuyến tính cả biến số và tham số.
1/ E(Y/Xi) = β1 + β2Xi2
2/ E(Y/Xi) = β1 + β23 Xi
3/E(Y/Xi) = β1 + β2Xi.
23

III.Hàm hồi qui hai biến

1.Hàm hồi qui tổng thể
- Thuật ngữ tuyến tính

Hàm hồi quy tuyến tính trong kinh tế lượng luôn được
hiểu là tuyến tính với các tham số, nó có thể không
tuyến tính đối với biến.


III.Hàm hồi qui hai biến
2. Sai số ngẫu nhiên và bản chất của nó.
Giả sử chúng ta đã có hàm hồi quy tổng thể E(Y/Xi), vì
E(Y/Xi) là giá trị trung bình của biến Y với giá trị Xi đã biết,
cho nên các giá trị cá biệt Yi không phải bao giờ cũng trùng
với E(Y/Xi) mà chúng xoay quanh E(Y/Xi).
Ta ký hiệu Ui là chênh lệch giữa giá trị cá biệt Yi và E(Y/Xi):
Ui = Yi - E(Y/Xi) hay Yi = E(Y/Xi) +Ui (**)
Ui là đại lượng ngẫu nhiên, người ta gọi Ui là yếu tố ngẫu
nhiên (hoặc nhiễu) và (**) được gọi là PRF ngẫu nhiên.
Nếu như E(Y/Xi) là tuyến tính đối với Xi thì:
Yi = β1 + β2Xi + Ui
25

III.Hàm hồi qui hai biến
2. Sai số ngẫu nhiên và bản chất của nó.

) Sự tồn tại của Ui bởi một số lý do sau đây:
- Chúng ta có thể biết một cách chính xác biến giải thích X và
biến phụ thuộc Y, nhưng chúng ta không biết hoặc biết không rõ về
các biến khác ảnh hưởng đến Y. Vì vậy, Ui được sử dụng như yếu tố
đại diện cho tất cả các biến không có trong mô hình.

- Ngay cả khi biết các biến bị loại khỏi mô hình là các biến nào,
khi đó chúng ta có thể xây dựng mô hình hồi quy bội, nhưng có thể
không có số liệu cho các biến này.
26


III.Hàm hồi qui hai biến
2. Sai số ngẫu nhiên và bản chất của nó.
) Sự tồn tại của Ui bởi một số lý do sau đây:
- Ngoài các biến giải thích đã có trong mô hình còn có một số
biến khác nhưng ảnh hưởng của chúng đến Y rất nhỏ. Trong trường

hợp này, chúng ta cũng sử dụng Ui đại diện cho chúng.
- Về mặt kỹ thuật và kinh tế, chúng ta mong muốn một mô
hình đơn giản nhất có thể được. Nếu như chúng ta có thể giải thích
được hành vi của biến Y bằng một số nhỏ nhất các biến giải thích và
nếu như ta không biết tường minh những biến khác là biến nào có thể
bị loại ra khỏi mô hình thì ta dùng yếu tố Ui để thay cho tất cả các
biến này.
27

III.Hàm hồi qui hai biến
3. Hàm hồi quy mẫu:
Trong thực tế nhiều khi ta không có điều kiện để điều tra toàn
bộ tổng thể. Khi đó ta chỉ có thể ước lượng giá trị trung bình của biến
phụ thuộc Y từ số liệu của một mẫu.
Hàm hồi quy được xây dựng trên cơ sở của một mẫu được gọi
là hàm hồi quy mẫu (SRF – The Sample Regression Function).
Nếu hàm PRF có dạng tuyến tính thì hàm hồi quy mẫu có
dạng:


Trong đó :

: là ước lượng điểm của
: là ước lượng điểm của
Ŷi là ước lượng điểm của E(Y/Xi)
28


III.Hàm hồi qui hai biến
3. Hàm hồi quy mẫu

Dạng ngẫu nhiên của (***) là:
 +β
 X +e
Yi = β
i
i
1
2

 +e
Hay: Yi  Y
i
i

Trong đó: ei là ước lượng điểm của Ui và gọi là phần dư.

29



Chương 2

MÔ HÌNH HỒI QUI HAI BIẾN
VẤN ĐỀ ƯỚC LƯNG

12/1/2011

1

Chủ đề chính:
-Xây dựng hàm mẫu SRF
-Các giả thiết của mô hình hồi qui tuyến
tính cổ điển
-Hệ số xác đònh
-Hệ số tương quan tuyến tính

-Phân phối xác suất của các ước lượng
OLS
12/1/2011

2


I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)
Hàm PRF hai biến ngẫu nhiên:
Tuy nhiên, như đã lưu ý trong Chương 1, hàm PRF
không thể quan sát trực tiếp được. Ta ước lượng nó từ
hàm SRF:


Hay:
12/1/2011

3

I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)
Nhưng ta sẽ xác đònh hàm SRF như thế nào? Để thấy
được điều này, ta hãy tiến hành như sau. Đầu tiên, ta biểu thò
SRF thành :

Giả sử có tập dữ liệu (Xi ,Yi ) gồm n quan sát

12/1/2011

4


I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)
Y

Y





e 1






X
12/1/2011

X11



e3 




e 2



XX
2

2

X3

SRF




e 4




X4

ˆ = bˆ + bˆ X
Y
i
1
2 i

X
X

X4
5

I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)
Theo nguyên lý của phương pháp OLS để tìm
SRF, chúng ta phải cực tiểu hóa tổng bình phương
của các phần dư, có nghóa là:

Chúng ta có thể xem tổng bình phương các phần dư
là một hàm theo và . Nghóa là:
12/1/2011


6


I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)

Đạo hàm riêng theo

được hệ phương trình chuẩn sau:

và cho bằng 0 ta

12/1/2011

7

I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)
Giải hệ phương trình chuẩn này, ta thu được:

Và:

12/1/2011

8


I. PHƯƠNG PHÁP BÌNH PHƯƠNG TỐI
THIỂU THÔNG THƯỜNG (OLS)

Chú ý:
1/ Hàm ước lượng thu được trên được gọi là các ước
lượng bình phương bé nhất thông thường.
2/ 3 công thức khác để tính

3/ SRF 2 biến ngẫu nhiên có dạng độ lệch
12/1/2011

9

I. PHƯƠNG PHÁP BÌNH PHƯƠNG
TỐI THIỂU THÔNG THƯỜNG
(OLS)
Ví dụ: Bài tập 7

12/1/2011

10


II. CÁC TÍNH CHẤT CỦA PHƯƠNG
PHÁP OLS
1. SRF đi qua các giá trò trung bình mẫu của Y và X.
2. Giá trò trung bình Y ước lượng bằng giá trò trung
bình của Y thực. Nghóa là:
3. Giá trò trung bình của các phần dư

bằng 0.

4. Các phần dư e i là không tương quan với Yi ước

lượng. Nghóa là:  e i Y i = 0
12/1/2011

11

II. CÁC TÍNH CHẤT CỦA PHƯƠNG
PHÁP OLS
5.Các phần dư
là:

eX
i

elài không tương quan với Xi, nghóa
i

=0

6. β 1 ,β 2 lần lượt là các ước lượng điểm của b1 , b2

và là các đại lượng ngẫu nhiên.

 ,β
 là cặp nghiệm duy nhất ứng với n cặp quan
7. β
1
2
sát cho trước.
12/1/2011


12


III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 1: Mô hình hồi quy tuyến tính. Mô hình hồi quy là
tuyến tính theo các thông số.
Giả thiết 2: Các giá trò X được cố đònh trong việc lấy mẫu
lập lại. Các giá trò rút ra bởi biến hồi qui độc lập X được coi là
cố đònh trong các mẫu lập lại. Nói rõ hơn, X được giả thiết là
không ngẫu nhiên.
Giả thiết 3: Giá trò trung bình bằng không của các nhiễu
Ui. Cho trước giá trò của X, giá trò trung bình hay kỳ vọng của
các số hạng nhiễu Ui bằng 0. Nói rõ hơn, giá trò trung bình có
điều kiện của Ui là 0. Về mặt ký hiệu, ta có:
=0
12/1/2011

13

III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Bằng hình học, giả thiết này có thể được vẽ trên hình sau,
nó chỉ ra một vài giá trò của biến X và tổng thể Y liên kết với
chúng. Như đã thấy, mỗi một tổng thể Y tương ứng với một X
cho trước được phân phối xung quanh giá trò trung bình của nó
(có thể thấy được nhờ những chấm được khoanh tròn trên
PRF) cùng với một vài giá trò Y ở phía trên và dưới nó.
Khoảng cách phía trên và dưới đối với giá trò trung bình không
là gì nhưng Ui và cái mà giả thiết 3 đòi hỏi là giá trò trung bình

của các độ lệch này tương ứng với bất kỳ X đã cho phải bằng
0.
12/1/2011

14


ọc, giả thiết này có thể được vẽ trên hình sau, nó chỉ ra một vài giá tr
III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Y
Mean (Trung bình)
Hàm Hồi qui tổng thể
PRF = b1 + b 2 X i



+ ui 




- ui 



12/1/2011

X1


X2

X3

X4

X

15

III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 4: Phương sai có điều kiện không đổi hay
phương sai bằng nhau của Ui. Cho các giá trò của X, phương
sai của Ui sẽ như nhau đối với tất cả mọi quan sát. Nghóa là,
các phương sai có điều kiện của Ui đều đồng nhất. Về mặt
ký hiệu, ta có:

12/1/2011

16


III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS

Hình 2.3: Phương sai có điều kiện không đổi
12/1/2011

17


III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS

Hình 2.4: Phương sai có điều kiện thay đổi
12/1/2011

18


III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 5: Không có tự tương quan giữa các
nhiễu. Cho trước hai giá trò X bất kỳ, Xi và Xj (i  j),
tương quan giữa Ui và Uj bất kỳ (i  j) bằng 0. Về
mặt ký hiệu ta có:

12/1/2011

19

III. CÁC GIẢ THIẾT CỦA PHƯƠNG
PHÁP OLS
Giả thiết 6: Đồng phương sai zero giữa Ui và Xi ,
hay là E(UiXi) = 0.
Về mặt ký hiệu ta có:

12/1/2011

20



×