Tải bản đầy đủ (.pdf) (25 trang)

ĐÁNH GIÁ CÁC KHUYẾT TẬT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (530.7 KB, 25 trang )

Bài 6: Đánh giá các khuyết tật

BÀI 6

ĐÁNH GIÁ CÁC KHUYẾT TẬT

Hướng dẫn học:
Trong nội dung các bài học trước, sinh viên đã làm quen với cơng việc phân tích hồi quy
cho các dạng hồi quy khác nhau: hồi quy đơn, hồi quy bội, hồi quy với biến giả,… Trên
thực tế, các cơng việc phân tích hồi quy như: ước lượng, kiểm định, dự báo cho mơ hình
hồi quy để đạt được độ chính xác và kết quả đáng tin cậy cần dựa trên giả định các giả
thiết cơ bản của phương pháp bình phương nhỏ nhất (gọi tắt là các giả thiết OLS) phải
thỏa mãn.
Trong bài học này, sinh viên sẽ tiếp xúc với các tình huống số liệu thực tế có xuất hiện
sự vi phạm của các giả thiết OLS, khi đó mơ hình hồi quy sẽ có khuyết tật. Các hiện
tượng này sẽ được giới thiệu dưới các góc độ: bản chất – nguyên nhân, hậu quả, cách
phát hiện và cách khắc phục đối với từng hiện tượng.
Bên cạnh đó, bài học cũng giới thiệu một số tiêu chí đánh giá một mơ hình thích hợp cho
các phân tích thực nghiệm.
Để học tốt bài này sinh viên cần thực hiện:
 Học đúng lịch trình của mơn học theo tuần, đọc kĩ các khái niệm.
 Theo dõi ví dụ để hiểu ý nghĩa.
 Đọc tài liệu: Nguyễn Quang Dong, Nguyễn Thị Minh, 2012, Giáo trình kinh tế lượng,
NXB Đại học Kinh tế quốc dân.
 Sinh viên tự học, làm việc theo nhóm, trao đổi với giảng viên.
 Tham khảo các thông tin từ trang Web của môn học.
Nội dung:
 Một số tiêu chí đánh giá mơ hình
 Hiện tượng dạng hàm hồi quy xác định sai: bản chất, hậu quả, cách phát hiện và một
số cách khắc phục.
 Hiện tượng phương sai sai số thay đổi: bản chất – nguyên nhân, hậu quả, cách phát


hiện, và khắc phục.
 Hiện tượng sai số ngẫu nhiên không phân phối chuẩn: hậu quả và cách phát hiện.
Mục tiêu:
Sau khi học xong bài này, sinh viên cần đảm bảo được các yêu cầu sau:
 Nắm được các tiêu chí cơ bản đánh giá một mơ hình thích hợp cho phân tích thực nghiệm;
 Hiểu rõ bản chất của các khuyết tật có thể gặp phải khi sử dụng một mơ hình để phân tích;
 Nắm được hậu quả và cách phát hiện một số khuyết tật cơ bản của mơ hình hồi quy;
 Nắm được một số phương pháp khắc phục đơn giản cho các khuyết tật của mơ hình.

118

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

Tình huống dẫn nhập
Tiếp tục sử dụng bộ số liệu thống nhất từ bài số 1: Chi tiêu (CT) phụ thuộc Thu nhập (TN) rút ra
từ bộ số liệu VHLSS 2012. Tuy nhiên chúng ta sử dụng các quan sát của các hộ gia đình có mức
chi tiêu/năm trên 200 triệu.
Chi tiêu

Thu nhập

Chi tiêu

Thu nhập

Chi tiêu


Thu nhập

Chi tiêu

Thu nhập

201

159

230

227

266

375

296

349

205

294

232

228


273

285

297

396

205

294

233

347

274

298

298

351

207

252

233


265

275

334

302

372

207

254

235

267

276

290

303

374

208

224


236

263

277

325

304

361

210

239

241

333

278

396

308

358

210


258

242

362

280

385

318

378

211

195

243

203

281

364

333

385


211

202

245

225

281

312

334

362

212

274

246

276

282

325

336


392

213

229

246

240

288

271

337

392

213

154

248

284

289

344


337

380

218

309

249

239

292

394

345

394

226

220

252

346

293


370

360

398

228

306

261

259

294

340

229

227

264

272

294

360


Nghiên cứu mối quan hệ phụ thuộc của chi tiêu vào thu nhập, xây dựng mô hình:
Mơ hình (1): CT   1   2 TN  u






Mơ hình 1 có bị thiếu biến số quan trọng hay không? (với bộ số liệu đang sử dụng)
Nếu có thêm số liệu về biến số người của hộ (SN) thì có nên đưa biến này vào mơ hình 1
hay khơng?
Sai số ngẫu nhiên trong mơ hình 1 có phương sai đồng đều hay khơng?
Sai số ngẫu nhiên của mơ hình 1 có phân phối chuẩn hay khơng? Nếu khơng, điều này có ảnh
hưởng đến các phân tích hồi quy hay khơng?
Có thể dùng các kết quả ước lượng từ mơ hình 1 có đáng tin cậy để thực hiện phân tích hồi
quy hay khơng?

TXT0KT04_Bài6_v1.0015108207

119


Bài 6: Đánh giá các khuyết tật

6.1.

Tiêu chí đánh giá lựa chọn mơ hình thích hợp

Sự xuất hiện các khuyết tật trong mơ hình hồi quy có ngun nhân các giả thiết OLS bị
vi phạm. Sự vi phạm của giả thiết 2 sẽ dẫn đến hiện tượng kỳ vọng sai số ngẫu nhiên

khác không, giả thiết 3 vi phạm gây ra khuyết tật phương sai sai số thay đổi và sự vi
phạm của giả thiết 5 dẫn tới hiện tượng sai số ngẫu nhiên không phân phối chuẩn. Trong
các bài học trước, ta ngầm định các giả thiết từ 1 đến 4 đã được thỏa mãn.
Trước khi bắt đầu nghiên cứu từng khuyết tật của mơ hình hồi quy, ta đến với một số
tiêu chí đánh giá một mơ hình thích hợp trong phân tích thực nghiệm.
6.1.1.

Tiêu chí lựa chọn mơ hình

Theo D.F.Hendry và J.F.Richard (1983), một mơ hình được chọn cho nghiên cứu thực
nghiệm nên thỏa mãn các tiêu chuẩn sau:
 Độ chính xác của số liệu chấp nhận được: khi đó, các kết quả dự báo nhận được từ
mơ hình là hợp lý.
 Độ vững của lý thuyết: Ước lượng cho các hệ số của mơ hình thu được cần có ý
nghĩa kinh tế phù hợp. Ví dụ, khi mơ hình hồi quy chi tiêu theo thu nhập thì hệ số
góc được kì vọng là nằm trong khoảng 0 đến 1.
 Mơ hình có dạng hàm được định dạng đúng: Kỳ vọng của sai số ngẫu nhiên trong
mô hình bằng khơng, phương sai của sai số ngẫu nhiên là đồng đều và các sai số
ngẫu nhiên khơng có tương quan với nhau. Khi đó, các ước lượng nhận được từ
mơ hình sẽ là các ước lượng tốt nhất.
 Tính bao qt: Một mơ hình cần chứa đầy đủ thơng tin của các mơ hình khác có
cùng đối tượng cần giải thích. Nói cách khác, khơng có mơ hình nào có thể thích
hợp hơn mơ hình được chọn cho vấn đề nghiên cứu.
6.1.2.

Một số kiểu định dạng hàm sai trong nghiên cứu thực nghiệm

 Mơ hình bỏ sót biến giải thích quan trọng
Trong mơ hình (1), chi tiêu của hộ gia đình trên thực tế có thể cịn chịu tác động
của nhiều yếu tố khác, việc xác định dạng hàm bỏ sót một hoặc một số biến độc

lập sẽ dẫn đến sự vi phạm của giả thiết 2. Các ước lượng nhận được sẽ là các ước
lượng chệch và kém ý nghĩa trong phân tích hồi quy.
Ví dụ:
Mơ hình (1): CT  1   2 TN  u1
Mô hình (2): CT  1   2 TN   3SN  u 2
Nếu dạng hàm của mơ hình (2) là đúng thì:

u1   3 SN  u 2
Như vậy trong trường hợp người nghiên cứu nhất định lựa chọn dạng hàm của mơ
hình 1 thì ta có:

E (u1 TN , SN )  E[(  3 SN  u 2 ) TN , SN ]  E (  3 SN TN , SN )  E (u 2 TN , SN )  0

120

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

Mơ hình 1 đã vi phạm giả thiết 2, do đó các ước lượng từ mơ hình 1 khơng phải là
ước lượng tốt nhất vì nó là ước lượng chệch.

 Mơ hình chứa các biến không cần thiết
Tương tự trường hợp trên, tuy nhiên khi mơ hình được lựa chọn lại chứa các biến
khơng cần thiết dẫn đến việc vi phạm giả thiết 4. Như đã đề cập ở trên, ta không
nghiên cứu sự vi phạm của giả thiết này trong chương trình học. Trên thực tế, tình
huống mơ hình chứa những biến khơng cần thiết hoặc có thơng tin trùng lặp cũng
dẫn đến những hậu quả nhất định trong phân tích hồi quy, nhưng kỹ thuật khắc
phục hiện tượng này tương đối đơn giản nên các học viên có thể tham khảo thêm

trong giáo trình KINH TẾ LƯỢNG của Đại học Kinh tế Quốc dân.
Ví dụ:
Mơ hình: TN  1   2 KN  3TUOI  u
Với các biến: TN  thu nhập của người lao động.
KN – số năm kinh nghiệm làm việc trong công việc hiện tại.
TUOI – tuổi đời của người lao động.
Trong mơ hình dễ thấy khi tuổi đời tăng lên thì số năm kinh nghiệm của người lao
động cũng tăng lên  điều này dẫn tới có thơng tin trùng lặp trong mơ hình, người
nghiên cứu có thể bỏ bớt 1 trong 2 biến giải thích của mơ hình.

 Xác định dạng hàm sai
Ví dụ:
Mơ hình xác định dạng hàm sai:
Mơ hình (1): Q  1   2 P  u1
Mơ hình (2): Q   1P 2 e u 2

Giả sử dạng hàm đúng là mơ hình (2), như vậy ta cũng gặp tình huống tương tự
như trường hợp mơ hình bị bỏ sót biến giải thích quan trọng và dẫn tới các ước
lượng bị chệch.
 Sai số trong đo lường các biến số
Khi điều tra số liệu nếu ta khơng thể có thơng tin về các biến dự kiến xuất hiện
trong mơ hình, thì ta có thể sử dụng các biến đại diện (proxy variable(s)). Chất
lượng của biến đại diện cũng ảnh hưởng tương đối lớn đến kết quả ước lượng nhận
được. Nếu biến đại diện khơng tốt, ta sẽ gặp tình trạng sai số trong đo lường các
biến số.
Ví dụ:
Khi điều tra số liệu nếu ta khơng thể có thơng tin về các biến dự kiến xuất hiện
trong mơ hình, thì ta có thể sử dụng các biến đại diện (proxy variable(s)). Chất
lượng của biến đại diện cũng ảnh hưởng tương đối lớn đến kết quả ước lượng nhận
được. Nếu biến đại diện khơng tốt, ta sẽ gặp tình trạng sai số trong đo lường các

biến số.

TXT0KT04_Bài6_v1.0015108207

121


Bài 6: Đánh giá các khuyết tật

Ví dụ:
Nghiên cứu sự phụ thuộc của Lượng cầu hàng hóa vào giá bán hàng hóa. Trên
thực tế ta cần sử dụng biến đại diện cho biến lượng cầu hàng hóa là “lượng bán
của hàng hóa”. Thơng thường trong trường hợp này biến đại diện là tốt.
Trong một nghiên cứu khác, xây dựng mô hình đánh giá tác động của năng lực
bẩm sinh của cá nhân tới mức độ thành cơng của người đó. Ở đây, ta phải sử dụng
biến đại diện cho cả biến giải thích và biến được giải thích trong mơ hình. Mức độ
thành cơng của một người có thể được đại diện bằng thu nhập hoặc địa vị của
người đó và năng lực bẩm sinh được đại diện bằng chỉ số IQ của người đó. Dễ
nhận thấy các biến đại diện trong trường hợp này không thực sự đảm bảo độ chính
xác của thơng tin.
Các ví dụ trên có thể được mơ tả chi tiết hơn dưới dạng tốn học như sau:
Giả sử ta cần nghiên cứu mơ hình:
Y  1   2 X  u

Tuy nhiên, biến Y và biến X trong mơ hình trên phải đại diện bởi biến Y* = Y + w
và biến X* = X + v. Khi đó mơ hình nhận được thực tế trở thành:
Y   1   2 X  (u   2 v  w)

Thông thường, mức sai lệch v và w càng lớn dẫn tới sự tương quan cao giữa sai số
trong mơ hình thực tế và biến giải thích  giả thiết 2 bị vi phạm.

6.2.

Kỳ vọng của sai số ngẫu nhiên khác không

Hiện tượng kỳ vọng sai số ngẫu nhiên của mơ hình hồi quy khác không là hiện tượng sai
số ngẫu nhiên u, tại một giá trị nào đó của biến giải thích X, có kỳ vọng khác khơng.
6.2.1.

Ngun nhân

Như đã đề cập ở mục 6.1.2, giả thiết 2 bị vi phạm với các nguyên nhân chủ yếu đã nêu
trên. Bên cạnh đó ngun nhân giả thiết 2 bị vi phạm cịn có thể do tính tác động đồng
thời của số liệu, được hiểu là 1 dạng khác của trường hợp mơ hình thiếu biến giải
thích quan trọng. Để tìm hiểu kỹ hơn về nguyên nhân này, học viên có thể tham khảo
giáo trình Kinh tế Lượng của trường Đại học Kinh tế Quốc dân.
Trên thực tế thì nguyên nhân chủ yếu của hiện tượng kỳ vọng sai số ngẫu nhiên khác
không vẫn là mơ hình bị bỏ sót biến giải thích quan trọng.
6.2.2.

Hậu quả của kỳ vọng sai số ngẫu nhiên khác không

 Ước lượng OLS bị chệch
Khi giả thiết 2 bị vi phạm thì ta có các ước lượng OLS sẽ là ước lượng chệch:
E ( ˆ )  
( j  1, k )
j

j

Hệ quả của điều này là các cơng việc phân tích hồi quy khơng đáng tin cậy nữa.

 Các suy diễn thống kê không đáng tin cậy
Như đã học trong bài 4, các bài toán suy diễn thống kê đối với mơ hình hồi quy
như bài tốn ước lượng hoặc bài toán kiểm định đều cần ước lượng của các βj là
122

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

ước lượng tốt nhất. Tuy nhiên khi các j là ước lượng chệch thì đương nhiên
chúng cũng không phải là ước lượng tốt nhất. Các kết quả suy diễn thống kê nhận
được đều không đáng tin cậy cho người nghiên cứu.
 Phát sinh lượng chệch của ước lượng khi mơ hình thiếu biến giải thích quan trọng
Giả sử ta nghiên cứu một mơ hình 3 biến và muốn đánh giá tác động của X2 tới Y:
Y  1   2 X 2   3 X 3  u1

Thay vì sử dụng mơ hình trên, ta quyết định chỉ sử dụng mơ hình chỉ có tác động
của một mình biến giải thích X2:
Y   1   2 X 2  u2

Khi đó, ước lượng ˆ 2 sẽ có mối liên hệ với hệ số  2 trong mơ hình ban đầu dưới dạng:
E (ˆ 2 )   2   3 bˆ2

Với bˆ2 là ước lượng hệ số góc của mơ hình:
X 3  b1  b2 X 2  v

Lượng chệch của ước lượng ˆ 2 chính là  3bˆ2 . Khi hệ số  3 và bˆ2 càng lớn thì
lượng chệch này cũng tăng lên.
6.2.3.


Phát hiện sự khác không của kỳ vọng của sai số ngẫu nhiên

 Trường hợp thông tin, số liệu của biến bị thiếu đã biết
Xét mơ hình:
Y  1   2 . X 2     k . X k  u

Để kiểm tra mơ hình trên có thiếu biến Z (đã có thơng tin, số liệu), ta có thể thực
hiện kiểm định t với cặp giả thiết:
H 0 :  k 1  0

 H 1 :  k 1  0

Ý kiến ở H0 thể hiện thông tin biến Z là khơng cần thiết và mơ hình xuất phát
khơng bị thiếu biến. Còn ý kiến ở H1 thể hiện thơng tin là mơ hình ban đầu bị thiếu
biến quan trọng.
Chọn tiêu chuẩn kiểm định:
ˆ k 1
t
Se( ˆ k 1 )



Miền bác bỏ H0: W  T : T  t( n  k 1)
2



Kết luận: Nếu t qs  W thì bác bỏ H0 và ngược lại thì chưa có cơ sở bác bỏ H0.


Với sự hỗ trợ của phần mềm, học viên cũng có thể sử dụng giá trị Prob. của thống
kê t mà phần mềm máy tính tính tốn sẵn để đưa ra kết luận về cặp giả thuyết trên.
Cách sử dụng giá trị xác suất này đã được trình bày trong bài 4.

TXT0KT04_Bài6_v1.0015108207

123


Bài 6: Đánh giá các khuyết tật

Ví dụ: Xét tình huống dẫn nhập, ta có bộ số liệu của 66 hộ gia đình có chi tiêu năm
2012 trên 200 triệu. Bộ số liệu rút ra từ cuộc điều tra VHLSS 2012. Mơ hình ban
đầu được quan sát là:
CT   1   2 TN  u1
Dependent Variable: CT
Method: Least Squares
Sample(adjusted): 9 100 IF CT>200
Included observations: 66 after adjusting endpoints
Variable

Coefficient

Std. Error

t – Statistic

Prob.

C


108.2196

15.04457

7.193271

0.0000

TN

0.506978

0.048209

10.51618

0.0000

R – squared

0.633427

F – statistic

110.5900

Adjusted R –
squared


0.627699

Prob(F – statistic)

0.000000

Người nghiên cứu cần kiểm tra mơ hình này có thiếu biến số người của hộ (SN –
thông tin của biến này cũng được cung cấp trong bộ số liệu VHLSS 2012) hay
khơng? Mơ hình đã thêm biến để kiểm tra:
CT   1   2TN   3 SN  u 2
Dependent Variable: CT
Method: Least Squares
Sample(adjusted): 9 100 IF CT>200
Included observations: 66 after adjusting endpoints
Variable

Coefficient

Std. Error

t – Statistic

Prob.

C

5.263773

9.943290


0.529379

0.5984

TN

0.582662

0.023434

24.86352

0.0000

SN

18.62580

1.252190

14.87458

0.0000

R – squared

0.918755

F – statistic


356.2169

Adjusted R – squared

0.916176

Prob(F – statistic)

0.000000

Theo kết quả ước lượng, ta có Prob. của hệ số ứng với biến SN =0,0000 < α = 0,05
 bác bỏ H0 trong cặp giả thuyết nêu trên. Kết luận biến SN là cần thiết có mặt
trong mơ hình. Nói cách khác, mơ hình xuất phát là thiếu biến.
Ví dụ: Xét bộ số liệu về QA – lượng bán một hàng hóa, PA –giá bán của hàng hóa
đó, PB – giá của hàng hóa B thay thế cho hàng hóa A đang được nghiên cứu.
Mơ hình xuất phát:
QA   1   2 PA  u1

Ta có kết quả ước lượng của mơ hình:
Dependent Variable: QA
Method: Least Squares
Included observations: 52

124

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật


Variable

Coefficient

Std. Error

t – Statistic

Prob.

C

316.3988

10.56304

29.95339

0.0000

PA

– 1.287562

0.304836

– 4.223789

0.0001


R – squared

0.262976

F – statistic

17.84040

Adjusted R – squared

0.248236

Prob(F – statistic)

0.000101

Kiểm tra mơ hình có bị thiếu các biến PA và PB hay khơng, ta thực hiện ước
lượng mơ hình mới:
QA   1   2 PA   3 PB  u 2

Kết quả ước lượng của mô hình mới:
Dependent Variable: QA
Method: Least Squares
Included observations: 52
Variable

Coefficient

Std. Error


t – Statistic

Prob.

C

302.9997

2.913554

103.9966

0.0000

PA

– 2.959413

0.106124

– 27.88630

0.0000

PB

1.891012

0.075280


25.11967

0.0000

R – squared

0.946891

F – statistic

436.8134

Adjusted R – squared

0.944723

Prob(F – statistic)

0.000000

Theo kết quả ước lượng, ta có Prob. của hệ số ứng với biến PB = 0,0000 < α =
0,05  bác bỏ H0 trong cặp giả thuyết nêu trên. Kết luận biến PB là cần thiết có
mặt trong mơ hình. Nói cách khác, mơ hình xuất phát là thiếu biến.

 Trường hợp thông tin, số liệu của biến bị thiếu chưa biết
Trong trường hợp này cần sử dụng thông tin của các biến đại diện cho biến bị
thiếu, đưa vào mơ hình xuất phát và thực hiện kiểm định theo kỹ thuật nêu trên.
 Mơ hình xác định dạng hàm sai
Kiểm định RAMSEY: đây là kiểm định tương đối phổ biến được sử dụng để kiểm
tra tình trạng mơ hình xác định dạng hàm sai. Ý tưởng của kiểm định này là biến

giải thích quan trọng bị thiếu là các biến bậc cao của các biến giải thích trong mơ
hình. Khi làm việc với mơ hình hồi quy bội, có thể lượng biến giải thích sẽ tương
đối nhiều, ta sẽ sử dụng biến đại diện cho các biến này được lấy từ các dạng biểu
diễn của Y. Biến được chọn là Yˆ , cần chú ý thêm là khơng thể đưa trực tiếp biến
Yˆ vào mơ hình rồi kiểm tra như trên, vì điều này dẫn đến giả thiết 4 bị vi phạm.

Các bước tiến hành của kiểm định RAMSEY:
Bước 1: Hồi quy mơ hình ban đầu thu được Yˆ

Y  1   2 . X 2  ...   k . X k  u

 Yˆ

Bước 2: Hồi quy phụ
(2) Y = 1 + 2X2+…+ kXk + k + 1 Yˆ 2 + u

Bước 3: Kiểm định cặp giả thuyết
H0: Mơ hình ban đầu xác định đúng (không cần dạng bậc cao của các biến giải thích).
TXT0KT04_Bài6_v1.0015108207

125


Bài 6: Đánh giá các khuyết tật

H1: Mơ hình ban đầu xác định sai (cần đưa các dạng bậc cao của các biến giải thích).

R 2  R12 n  k  1

1

1  R22

Kiểm định F: Fqs = 2

= F  statistic (Ramsey Reset test)

Nếu Fqs > F (1, n – k – 1) thì bác bỏ H0 và ngược lại thì chưa có cơ sở bác bỏ H0
Có thể sử dụng giá trị xác suất p – value do phần mềm tính tốn để thực hiện kiểm
định cặp giả thuyết trên:
Prob.(RAMSEY) ≤   Bác bỏ H0
Prob. (RAMSEY) >   Chưa có cơ sở bác bỏ H0
Ví dụ:
Tiếp tục với tình huống dẫn nhập, thực hiện kiểm định RAMSEY để kiểm tra
khuyết tật mơ hình: CT   1   2 TN  u1 có bị thiếu biến hay không. Kết quả

kiểm định cho thấy:
Ramsey RESET Test:
F – statistic

6.646491

Probability

0.012285

Theo kết quả kiểm định, ta có Prob. của thống kê F trong kiểm định RAMSEY =
0,012285 < α = 0,05  bác bỏ H0 trong cặp giả thuyết nêu trên. Kết luận: mơ hình
xuất phát là xác định dạng hàm sai.
6.2.4.


Một số biện pháp khắc phục

Do nguyên nhân gây ra hiện tượng kỳ vọng sai số khác khơng trong mơ hình hồi quy
là khác nhau nên phương pháp khắc phục cũng khác nhau cho từng tình huống.
Nếu mơ hình bị thiếu biến và thơng tin của biến bị thiếu đã có, ta chỉ cần đưa biến bị
thiếu vào mơ hình và ước lượng mơ hình mới.
Nếu ngun nhân là dạng hàm bị xác định sai, phát hiện thơng qua kiểm định
RAMSEY thì ta cần thay đổi dạng hàm của mơ hình, chẳng hạn chuyển dạng hàm của
mơ hình về dạng bậc cao, dạng tuyến tính với các biến logarith,…
Nếu ngun nhân là mơ hình bị thiếu biến mà chưa có thơng tin của biến bị thiếu thì
có thể sử dụng các biến đại diện và đưa vào mơ hình xuất phát để kiểm tra.
6.3.

Kiểm định phương sai sai số thay đổi

Định lý Gauss- Markov trong Bài 4 khẳng định rằng để ước lượng OLS là tốt nhất thì
phương sai sai số trong mơ hình hồi quy phải bằng nhau tại mọi quan sát. Mục này sẽ
xem xét nguyên nhân và hậu quả khi giả thiết này không được thỏa mãn, cách phát
hiện và một số phương pháp khắc phục hậu quả khi mơ hình có hiện tượng phương sai
sai số thay đổi.
6.3.1.

Nguyên nhân của phương sai sai số thay đổi

Xét mơ hình: Y  1   2 X 2     k X k  u (1)
Mơ hình trên có chỉ số i xác định cho các trường hợp của biến độc lập.

126

TXT0KT04_Bài6_v1.0015108207



Bài 6: Đánh giá các khuyết tật

Giả sử trong mô hình (1), sai số ngẫu nhiên u có phương sai thay đổi, nghĩa là có thể
viết như sau: var(u i / X 2i , , X ki )   2i
(2)
Nghĩa là tại các bộ giá trị (X2i,…, Xki) khác nhau thì phương sai của sai số ngẫu nhiên
nhận các giá trị khác nhau, ký hiệu bởi  i2 .
Một số nguyên nhân thường dẫn đến hiện tượng này bao gồm:
Do bản chất của số liệu
Ta đã biết rằng phương sai của sai số ngẫu nhiên tại quan sát thứ i, cũng chính bằng
phương sai của biến phụ thuộc tại quan sát này, Yi. Vì thế nên nếu độ dao động của Yi
tại các giá trị khác nhau của biến Xj là khác nhau thì phương sai sai số sẽ thay đổi. Ví
dụ ta xét mơ hình sau về mối quan hệ giữa chi tiêu và thu nhập:
CT  1   2TN  u

Ta biết rằng với những người có mức thu nhập TN = 3 triệu/tháng thì nói chung chỉ
vừa đủ cho chi tiêu sinh hoạt, nên chi tiêu của những người này là rất giống nhau, do
đó phương sai của biến CT tại mức TN = 3 là rất bé. Cịn với những người có mức thu
nhập cao hơn, chẳng hạn 10 triệu, thì họ có thể có mức chi tiêu rất khác nhau, tùy
thuộc vào sở thích và kế hoạch của từng cá nhân, và như vậy phương sai của biến CT
tại mức TN = 10 là khá lớn.
Do mơ hình thiếu biến quan trọng hoặc dạng hàm sai
Chẳng hạn giả sử mơ hình phù hợp cho mối quan hệ giữa năng suất tính theo giờ làm
việc của người lao động (NS) và số giờ người lao động làm việc trong một ca sản xuất
(H) là:

NSi  1   2 H i  3 H i 2  ui
Trong đó thành phần H2 nhằm tính đến quy luật năng suất biên giảm dần.

Tuy nhiên nếu ta sử dụng mơ hình thiếu biến: NSi  a1  a2 H i  vi . Khi đó sai số ngẫu
nhiên vì sẽ chứa thành phần H i2 và do đó phương sai của nó tại các quan sát khác
nhau sẽ khác nhau.
Dạng hàm sai cũng có thể là nguyên nhân gây nên hiện tượng phương sai sai số thay
đổi. Chẳng hạn mơ hình đúng có dạng: log( NSi )  1   2 log( H i )  ui . Nhưng ta lại
sử dụng mơ hình: NSi  a1  a2 H i  vi . Khi đó phương sai của sai số ngẫu nhiên trong
mơ hình này sẽ thay đổi.
6.3.2.

Hậu quả của phương sai sai số thay đổi

Chúng ta sẽ xem xét các hậu quả của phương sai sai số thay đổi khi sử dụng ước
lượng OLS với điều kiện là các giả thiết khác của mơ hình là thỏa mãn.
Giả sử mơ hình (1) có phương sai sai số thay đổi: var(u / X 2i ,..., X ki )   2 . Khi đó:
Các ước lượng OLS vẫn là ước lượng không chệch
Nghĩa là khi phương sai sai số thay đổi mà các giả thiết khác của mơ hình thỏa mãn
thì ta vẫn có: E ( ˆ j )   j (j=1,2,, k)

TXT0KT04_Bài6_v1.0015108207

127


Bài 6: Đánh giá các khuyết tật

Do đó nếu mục đích của phân tích hồi quy là xác định các ước lượng điểm cho các hệ
số hồi quy thì việc vi phạm giả thiết 3 là không gây hậu quả.
Tuy nhiên chúng ta thường muốn đưa ra các suy diễn thống kê về các hệ số trong mơ
hình hồi quy tổng thể, do đó cần xem xét đến phương sai của các hệ số ước lượng.
Các ước lượng hệ số khơng cịn là ước lượng tốt nhất

Điều này có nghĩa là trong các ước lượng khơng chệch thì phương sai của các hệ số
ước lượng OLS khơng cịn là bé nhất nữa.
Phương sai của hệ số ước lượng là chệch
Việc tính tốn phương sai của các hệ số ước lượng như trình bày trong Bài 3 cho thấy
nếu phương sai sai số trong mơ hình là thay đổi thì phương sai của các hệ số ước lượng
tính bởi phương pháp OLS sẽ bị chệch. Khi đó sai số chuẩn sẽ khơng cịn đáng tin cậy
nữa, và do đó:
Khoảng tin cậy và kiểm định giả thuyết về các hệ số không còn giá trị sử dụng
Khi phương sai của các hệ số ước lượng là chệch, các thống kê T và F trình bày trong
Bài 4 sẽ khơng tn theo các quy luật Student và quy luật Fisher tương ứng nữa. Do
đó kết luận của kết luận từ bài tốn xây dựng khoảng tin cậy và kiểm định giả thuyết
về các hệ số hồi quy có thể dẫn đến những kết luận sai lệch.
6.3.3.

Phát hiện phương sai sai số thay đổi

Ta xét mơ hình hồi quy tuyến tính (1), giả thiết 3 về phương sai sai số khơng đổi cho
mơ hình này là: var(u / X 2i ,..., X ki )   2 i (3)
Ta sẽ giả sử rằng mô hình (1) thỏa mãn các giả thiết của mơ hình hồi quy tuyến tính
cổ điển, ngoại trừ giả thiết 3 mà ta đang xem xét. Do mơ hình thỏa mãn giả thiết 2 nên
kỳ vọng của sai số ngẫu nhiên bằng 0, hay E(u|X) = 0, từ đó ta có:
var(u / X 2i ,..., X ki )  E (u 2 / X 2i ,..., X ki )

Do đó (3) được viết lại thành: E (u 2 / X 2i ,..., X ki )  E (u i2 )   2 i (4)
Chúng ta sẽ xem xét một số phương pháp thông dụng phục vụ cho việc phát hiện hiện
tượng phương sai sai số thay đổi trong mơ hình hồi quy.
a. Sử dụng đồ thị phần dư
Đồ thị có thể cung cấp một cái nhìn ban đầu về việc liệu phương sai sai số trong mơ
hình có thay đổi hay không. Do trong công thức (4), giá trị ui2 là chưa biết nên phải
thay thế bằng ước lượng của nó là ei2 . Nhìn vào sự biến động của ei hoặc ei2 trên đồ thị

có thể giúp ta thấy được sự hiện diện hay không của phương sai sai số thay đổi.
Chẳng hạn khi vẽ đồ thị của ei theo một biến Xj nào đó trong mơ hình và được đồ thị
như sau:

128

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

Hình 6.1. Quan hệ giữa e và X2

Đồ thị này cho thấy với các giá trị khác nhau của Xj thì ei khác nhau khá lớn, điều
này gợi ý rằng  i2 là thay đổi và là một hàm số nào đó của Xj.
Ví dụ 1: Xét mơ hình CT1   1   2TN 1  u gọi là mơ hình (VD1) trong đó CT1 là chi

tiêu cho ăn uống và TN1 là thu nhập. Với bộ số liệu gồm 40 quan sát thu thập từ 40 cá
nhân, ta thu được kết quả:
SRM: CT1 = 7,383 + 0,232 × TN1 + e
(Se) (4,008) (0,055)
Nghi ngờ mơ hình (VD1) có hiện tượng phương sai sai số thay đổi, nên ta ghi lại phần
dư của mơ hình này với tên là E và vẽ đồ thị E theo TN ta có hình sau:

10

200

5


160

0

120

E2

240

E

15

-5

80

-10

40

-15

0

20

40


60

80
TN

100

120

20

40

60

80

100

120

TN

Hình 6.2: Đồ thị phần dư E và và bình phương phần dư theo TN

Quan sát đồ thị bên trái ta thấy: ở các mức thu nhập thấp, phần dư E dao động quanh
trục hoành (E = 0) với biên độ dao động nhỏ từ -5 đến 5, trong khi đó ở các mức thu
nhập cao hơn, phần dư E có giá trị tuyệt đối lớn hơn, dao động từ -15 đến 15. Đồ thị
bên phải của hình 6.2 thể hiện mối quan hệ giữa bình phương phần dư (ký hiệu là E2)
với thu nhập. Ta thấy ở các mức thu nhập cao hơn 60 đơn vị giá trị E2 cao hơn rất

nhiều so với E2 ở các mức thu nhập thấp hơn. Hình ảnh này cho thấy phương sai của

TXT0KT04_Bài6_v1.0015108207

129


Bài 6: Đánh giá các khuyết tật

sai số ngẫu nhiên trong mơ hình (VD1) tăng khi thu nhập tăng, tức là mơ hình này có
hiện tượng phương sai sai số thay đổi.
Đồ thị phần dư cho ta một cái nhìn ban đầu về hiện tượng phương sai sai số thay đổi,
nó có thể giúp cho thấy rằng phương sai sai số thay đổi là do sự thay đổi của một biến
số nào đó trong mơ hình. Tuy nhiên với mơ hình hồi quy bội, nhiều khi sự thay đổi
trong phương sai sai số là do đóng góp của nhiều biến số, hoặc dạng thức của phương
sai sai số thay đổi là phức tạp mà ta khó có thể phát hiện bằng mắt thường. Sau đây ta
sẽ xem xét một số kiểm định chi tiết.
b. Kiểm định Breusch – Pagan (BP)
Breusch – Pagan đề xuất ý tưởng xem xét nếu u2 có tương quan với ít nhất một trong
các biến độc lập trong mơ hình thì mơ hình có hiện tượng phương sai sai số thay đổi.
Để xét mơ hình (1) Y  1   2 X 2  ..   k X k  u có hiện tượng phương sai sai số thay
đổi hay không ta thực hiện như sau:
Bước 1: Ước lượng mơ hình (1) bằng phương pháp OLS và thu được phần dư e.
Bước 2: Ước lượng mơ hình hồi qui phụ:
ei2  b1  b2 X 2i  ..  bk X ki  w i (*) (với wi là sai số ngẫu nhiên)

thu được hệ số xác định R*2  
Bước 3: Kiểm định cặp giả thuyết:

tương đương:


H 0 : b2  b3  ..  bk  0
H1 : b22  b32  ..  bk2  0

H0: Mơ hình (1) có phương sai sai số đồng đều
H1: Mơ hình (1) có phương sai sai số thay đổi

Tính giá trị quan sát của các thống kê kiểm định:

Fqs 

R*2 / (k*  1)
với k*2 là số hệ số trong mơ hình (*)
(1  R*2 ) / (n  k* )

LM qs  nR*2
Nếu Fqs  f ( k*  1, n  k* ) hoặc LM qs  2 (k*  1) thì bác bỏ giả thuyết H0, chấp nhận
giả thuyết H1 và ta kết luận rằng mơ hình có hiện tượng phương sai sai số thay đổi.
Ngược lại, nếu Fqs  f ( k*  1, n  k* ) hoặc LM qs  2 (k*  1) thì chưa có cơ sở bác bỏ
giả thuyết H0, và ta kết luận rằng mô hình có hiện tượng phương sai sai số đồng đều.
Một cách tương đương, có thể sử dụng giá trị xác suất P tương ứng với thống kê quan
sát để đưa ra kết luận tương ứng.
Ví dụ 2: Ta xét mơ hình (VD1) đã được trình bày trong ví dụ 1 ở trên. Để kiểm định
giả thuyết về phương sai sai số khơng đổi trong mơ hình này bằng kiểm định BP, ta sử
dụng phần dư E và ước lượng mô hình hồi quy phụ sau: E 2  1   2TN  v thu được
kết quả:
SRM: E2 = 74,709 + 1,708 × TN1 + v
(Se) (30,605) (0,422) và R*2 = 0,301

130


TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

Với mức ý nghĩa 5%, hãy kết luận về hiện tượng phương sai sai số thay đổi trong mơ
hình (VD1)?
Lời giải:
Cách 1:
Ta cần kiểm định cặp giả thuyết:
H0: Mơ hình (VD1) có phương sai sai sai số đồng đều.
H1: Mơ hình (VD1) có phương sai sai sai số thay đổi.
Giá trị quan sát của thống kê F là:
Fqs 

0,301/1
 16,363
(1  0,301) / (40  2)

Tra bảng ta có: f0,05(1,38) ≈ f0,05(1,20) = 4,35
Suy ra Fqs > f0,05(1,38) nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1.
Kết luận: Mơ hình (VD1) có hiện tượng phương sai sai số thay đổi.
Cách 2:
Ta cần kiểm định cặp giả thuyết:
H0: Mơ hình (VD1) có phương sai sai sai số đồng đều.
H1: Mơ hình (VD1) có phương sai sai sai số thay đổi.
Giá trị quan sát của thống kê LM là:
LMqs = 40*0,301 = 12,04
2

(1)  3,84
Tra bảng ta có:  0,05
2
(1) nên bác bỏ giả thuyết H0, chấp nhận giả thuyết H1.
Suy ra LMqs >  0,05

Kết luận: Mơ hình (VD1) có hiện tượng phương sai sai số thay đổi.
Ví dụ 3: Ta xét mơ hình: Q = β1 + β2P + β3PC+ u (gọi là mơ hình VD2) đã được trình
bày trong bài 4. Để kiểm định giả thuyết về phương sai sai số khơng đổi trong mơ
hình này bằng kiểm định BP, ta ước lượng mơ hình và thu được phần dư E. Tiếp theo
ta ước lượng mơ hình hồi quy phụ sau: E 2  1   2 P   3 PC  v thu được R*2 =

0,0567. Với mức ý nghĩa 5% hãy kết luận về hiện tượng phương sai sai số thay đổi
trong mơ hình (VD2) ?
Lời giải:
Cách 1:
Ta cần kiểm định cặp giả thuyết:
H0: Mơ hình (VD2) có phương sai sai số đồng đều.
H1: Mơ hình (VD2) có phương sai sai số thay đổi.
Giá trị quan sát của thống kê F là:

Fqs 

0, 0567 / 2
 1, 472
(1  0, 0567) / (52  3)

Tra bảng ta có: f0,05(2,49) ≈ f0,05(2,20) = 3,49
Suy ra Fqs < f0,05(2,49) nên chưa có cơ sở bác bỏ giả thuyết H0.
Kết luận: Mơ hình (VD2) có phương sai sai số đồng đều.

TXT0KT04_Bài6_v1.0015108207

131


Bài 6: Đánh giá các khuyết tật

Cách 2:
Ta cần kiểm định cặp giả thuyết:
H0: Mơ hình (VD2) có phương sai sai số đồng đều.
H1: Mơ hình (VD2) có phương sai sai số thay đổi.
Giá trị quan sát của thống kê LM là:
LMqs = 52 × 0,0567 = 2,948
2
(2)  5,11
Tra bảng ta có:  0,05
2
(2) nên chưa có cơ sở bác bỏ giả thuyết H0.
Suy ra LMqs <  0,05

Kết luận: Mơ hình (VD2) có phương sai sai số đồng đều.
c. Kiểm định White
Để minh họa kiểm định White, ta xét mơ hình hồi quy ba biến như sau:

Y  1   2 X 2   3 X 3  u (5)
Kiểm định White cho mơ hình hồi quy này được thực hiện như sau:
Bước 1: Ước lượng mơ hình (5) và thu được các phần dư ei.
Bước 2: Ước lượng mơ hình hồi quy phụ:
ei2  1   2 X 2i   3 X 3i   4 X 22i   5 X 32i   6 X 2i  X 3i  vi (*)


thu được hệ số xác định, ký hiệu là R*2
Chú ý: Biến tích X 2i  X 3i được gọi là số hạng chéo (Cross term) có thể xuất hiện

trong mơ hình hồi quy phụ hoặc khơng.
Bước 3: Xét cặp giả thuyết:
H0:  2     6  0 (Mơ hình (5) có phương sai sai số đồng đều)
H1:  22     62  0 (Mơ hình (5) có phương sai sai số thay đổi)
Sử dụng kiểm định F hoặc kiểm định Khi bình phương như nêu trong kiểm định BP
để kiểm định cặp giả thuyết này.
Ví dụ 4: Thực hiện kiểm định White cho mơ hình (VD2): Q = β1 + β2P + β3PC+ u.
Bước 1: ước lượng mơ hình và thu được phần dư E.
Bước 2: Ước lượng mơ hình hồi quy phụ sau:
E 2  1   2 P   3 PC   4 P 2   5 PC 2   6 P  PC  v thu được R*2 = 0,110141.

Với mức ý nghĩa 5% hãy cho biết mơ hình (VD2) có hiện tượng phương sai sai số
thay đổi hay không?
Lời giải:
Cách 1:
Ta cần kiểm định cặp giả thuyết:
H0: Mơ hình (VD2) có phương sai sai số đồng đều.
H1: Mơ hình (VD2) có phương sai sai số thay đổi.
Giá trị quan sát của thống kê F là:

132

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật


Fqs 

0,110141 / 5
 1,1387
(1  0,110141) / (52  6)

Tra bảng ta có: f0,05(5,46) ≈ f0,05(5,20) = 2,71
Suy ra Fqs < f0,05(5,46) nên chưa có cơ sở bác bỏ giả thuyết H0.
Kết luận: Mơ hình (VD2) có phương sai sai số đồng đều.
Cách 2:
Ta cần kiểm định cặp giả thuyết:
H0: Mơ hình (VD2) có phương sai sai số đồng đều.
H1: Mơ hình (VD2) có phương sai sai số thay đổi.
Giá trị quan sát của thống kê LM tương ứng là:
LMqs = 52 × 0,110141= 5,727328
2
(5)  11, 0705
Tra bảng ta có:  0,05
2
(5) nên chưa có cơ sở bác bỏ giả thuyết H0.
Suy ra: LMqs <  0,05

Kết luận: Mơ hình (VD2) có phương sai sai số đồng đều.
Lưu ý: Kiểm định White được lập trình trong phần mềm Eviews, trong đó các thống
kê F, LM và các giá trị xác suất của nó đã được tính sẵn. Sau đây là kết quả kiểm định
White cho mơ hình (VD2) thu được từ phần mềm Eviews:

White Heteroskedasticity Test:
F – statistic


1.138716

Probability

0.353686

Obs*R – squared

5.727328

Probability

0.333662

Với thông tin từ phần mềm Eviews, ta dễ dàng nhận thấy: Fqs = F-statistic = 1,138716;
LMqs = Obs*R-squared = 5,727328. Ta có thể sử dụng các giá trị này và thực hiện
kiểm định như trên, hoặc đơn giản hơn ta dùng các giá trị xác suất (Probability) ở cột
bên phải so sánh với mức ý nghĩa    và kết luận (đây là cách 3 và là cách được sử
dụng phổ biến nhất).
Cách 3:
Ta kiểm định cặp giả thuyết:
H0: Mơ hình (VD2) có phương sai sai số đồng đều.
H1: Mơ hình (VD2) có phương sai sai số thay đổi.
Theo kết quả kiểm định White:
Prob (F) = 0,353686; Prob (LM) = 0,333662
  = 0,05
Ta có Prob >     nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mơ hình (VD2) có phương sai sai số đồng đều.
Ví dụ 5: Xét tình huống dẫn nhập, ta có bộ số liệu của 66 hộ gia đình có chi tiêu năm

2012 trên 200 triệu. Bộ số liệu rút ra từ cuộc điều tra VHLSS 2012. Mơ hình ban đầu
được quan sát là: CT   1   2TN  u1

Thực hiện kiểm định White cho mơ hình này ta thu được kết quả sau:

TXT0KT04_Bài6_v1.0015108207

133


Bài 6: Đánh giá các khuyết tật

White Heteroskedasticity Test:
F – statistic

1.625689

Probability

0.204922

Obs*R – squared

3.239041

Probability

0.197994

Với mức ý nghĩa 5% hãy cho biết mơ hình này có hiện tượng phương sai sai số thay

đổi hay không?
Lời giải:
Ta kiểm định cặp giả thuyết:
H0: Mô hình có phương sai sai số đồng đều.
H1: Mơ hình có phương sai sai số thay đổi.
Theo kết quả kiểm định White:
Prob (F) = 0,204922; Prob (LM) = 0,197994
  = 0,05
Ta có Prob >  nên chưa có cơ sở bác bỏ giả thuyết H0.

Kết luận: Mơ hình có phương sai sai số đồng đều.
6.3.4.

Khắc phục vấn đề phương sai sai số thay đổi

Ta biết rằng phương sai sai số thay đổi có thể do mơ hình thiếu biến hoặc dạng hàm
sai. Do đó trước khi khắc phục hậu quả do phương sai sai số thay đổi, ta cần xem xét
vấn đề thiếu biến hoặc dạng hàm sai bởi các cơng cụ trình bày trong mục 6.2. Chỉ đến
khi mơ hình khơng có vấn đề về thiếu biến quan trọng hoặc dạng hàm sai thì ta mới
bắt đầu xem xét các giải pháp về vấn đề phương sai sai số thay đổi.
Ta sẽ nghiên cứu lần lượt hai giải pháp sau đây: một là sử dụng phương pháp bình
phương bé nhất tổng quát, hai là phương pháp ước lượng sai số chuẩn vững.
a. Phương pháp bình phương bé nhất tổng quát (GLS – generalized least squares)
Ý tưởng của phương pháp là như sau: giả sử đã biết dạng thay đổi của phương sai sai
số, khi đó dùng các phép biến đổi tương đương để đưa về một mơ hình mới mà sai số
ngẫu nhiên trong mơ hình này có phương sai sai số khơng đổi, sau đó sử dụng phương
pháp OLS để ước lượng mơ hình mới này.
Để minh họa phương pháp GLS khi mơ hình có hiện tượng phương sai sai số thay đổi,
chúng ta xét mơ hình: Y  1   2 X 2  ..   k X k  u (1)
Giả sử mơ hình (1) thỏa mãn các giả thiết 1 – 5, ngoại trừ giả thiết phương sai sai số

không đổi. Và giả sử rằng phương sai sai số là thay đổi theo dạng:

 i2   2 X 22i

(6)

Khi đó ta thực hiện như sau:
Chia hai vế của (1) cho X2i và thu được:
Yi
X
X
u

 i   2   3 3i     k kt  i
X 2i X 2i
X 2i
X 2i X 2i
Hay:

134

Yi *  1   2 X 2*i  ..   k X ki*  ui*

(7)

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật


trong đó: Yi * 

Yi
X
u
1
, X 2*i 
, X ki*  ki , ui*  i
X 2i
X 2i
X 2i
X 2i

Với mơ hình (7) ta dễ dàng chứng tỏ được rằng sai số ngẫu nhiên mới trong mơ hình,
u*, có phương sai là khơng đổi và bằng  2 . Do đó có thể áp dụng OLS để thu được
các ước lượng tốt nhất cho các hệ số  j (j=1,k), và từ đó suy ra ước lượng cho các hệ
số  j .
Việc biến đổi một mơ hình có khuyết tật thành mơ hình khơng có khuyết tật và sử
dụng OLS cho mơ hình đã biến đổi như trên được gọi là phương pháp bình phương bé
nhất tổng qt.
Việc chuyển từ mơ hình (1) sang (7) về thực chất là gán trọng số X2i cho quan sát thứ
i. Vì vậy phương pháp ước lượng (1) thơng qua mơ hình (7) cũng cịn được gọi là
phương pháp ước lượng bình phương bé nhất có trọng số (WLS - weighted
least squares).
Ví dụ 6: Kết quả kiểm định ở các ví dụ trên cho thấy mơ hình CT 1  β1  β2TN1  u

có hiện tượng phương sai sai số thay đổi và có dạng hàm đúng nên ta có thể khắc phục
hậu quả bằng cách áp dụng phương pháp GLS. Chia cả hai vế phương trình (VD2) cho
TN và ước lượng phương trình thu được kết quả sau:
SRM: CT1/TN1 = 3,855 × (1/TN1) + 0,285 + v

(Se) (2,542) (0,042)
Trong đó ước lượng của hệ số góc của mơ hình ban đầu   0, 285 (là hệ số chặn của
2

mơ hình đã biến đổi) và 3,855 là ước lượng của hệ số chặn trong mô hình (VD2) ban
đầu. Kết quả kiểm định White dưới đây cho thấy mơ hình đã biến đổi có phương sai
sai số đồng đều, tức là đã khắc phục được khuyết tật của mơ hình.
White Heteroskedasticity Test:
F – statistic

0.813054

Probability

0.451268

Obs*R – squared

1.683946

Probability

0.430860

Việc xác định dạng thức của phương sai sai số nhiều khi là rất khó, đặc biệt là khi mơ
hình có nhiều biến, và do đó phương pháp bình phương bé nhất có trọng số là khơng
khả thi. Khi đó nếu n lớn thì chúng ta có thể áp dụng kỹ thuật ước lượng sai số chuẩn
vững (robust standard error) là một pháp được sử dụng rộng rãi trong thời gian gần
đây, sẽ được trình bày trong mục tiếp theo dưới đây.
b. Ước lượng sai số chuẩn vững

Nhắc lại rằng khi mơ hình có hiện tượng phương sai sai số thay đổi, các ước lượng
OLS cho các hệ số vẫn là ước lượng khơng chệch, chỉ có phương sai của các hệ số
ước lượng và hiệp phương sai giữa các hệ số ước lượng thu được bằng phương pháp
OLS là chệch. Từ đó White (1980) đề xuất phương pháp sai số chuẩn vững (robust
standard error) với tư tưởng như sau: vẫn sử dụng các hệ số ước lượng từ phương
pháp OLS, tuy nhiên phương sai các hệ số ước lượng thì được tính tốn lại mà khơng
sử dụng đến giả thiết phương sai sai số không đổi.

TXT0KT04_Bài6_v1.0015108207

135


Bài 6: Đánh giá các khuyết tật

Để minh họa phương pháp của White, chúng ta sẽ trở về trường hợp mơ hình hồi quy
hai biến. Ta có khi các giả thiết khác được thỏa mãn thì phương sai của các hệ
số bằng:
n

var( ˆ2 ) 

x 
i 1

2
2i

2
i


 n 2
  x2i 
 i 1 

(8)

2

Khi phương sai sai số đồng đều, tức là  i2   2 thì (8) sẽ trở thành cơng thức tính
phương sai theo phương pháp OLS (được nêu trong định lý 1.2 trong Bài 2). Khi
phương sai sai số thay đổi, tức là  i2   2 , White đã đề xuất thay công thức dùng
trong phương pháp OLS bởi công thức sau:
n

var( ˆ2 ) 

x
i 1

2 2
2i i

e

 n 2
  x2i 
 i 1 

2


(9)

và sai số chuẩn vững được tính là căn bậc hai của biểu thức trong (9).
White đã chứng minh được rằng khi n là đủ lớn thì (9) tiệm cận về giá trị đúng (8).
Việc chứng minh điều này là khá phức tạp, người đọc quan tâm có thể tìm hiểu thêm
bài viết của White (1980).
Ví dụ 7: Kết quả kiểm định ở các ví dụ trên cho thấy mơ hình:
CT1   1   2 TN 1  u

có hiện tượng phương sai sai số thay đổi và có dạng hàm đúng nên ta có thể khắc phục
hậu quả bằng cách áp dụng phương pháp ước lượng sai số chuẩn vững và thu được kết
quả sau:
SRM: CT1  7,383  0,232TN 1  e
(Se) (4,403) (0,071)
So với kết quả trình bày trong ví dụ 1, ta thấy các ước lượng OLS không thay đổi nhưng
các sai số chuẩn (Se) của nó đã thay đổi và đây là ước lượng vững, đáng tin cậy.
6.4.

Sai số ngẫu nhiên khơng tn theo tuy luật chuẩn

Bài tốn xây dựng khoảng tin cậy, bài toán kiểm định giả thuyết thống kê về các hệ số
hồi quy cũng như bài toán dự báo giá trị của biến phụ thuộc trình bày trong Bài 4
được dựa trên giả thiết về phân phối chuẩn của sai số ngẫu nhiên. Tuy nhiên giả thiết
này trong nhiều trường hợp là không thỏa mãn.
Chúng ta biết rằng để biến ngẫu nhiên Y nào đó tuân theo quy luật chuẩn hoặc xấp xỉ
chuẩn thì hàm mật độ của nó phải đối xứng. Tuy nhiên các biến số như mức lương của
người lao động thường là không đối xứng do hàm mật độ của nó bị cắt cụt ở phía trái
bởi mức lương tối thiểu và có đi dài về phía phải, như trong hình 6.3 dưới đây:


136

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

20
16
12
8
4
0
10

20

30

40

50

60

70

Hình 6.3: Phân phối mẫu của mức lương

Hình 6.3 cho thấy khó có thể cho rằng phân phối của biến mức lương là chuẩn hoặc

xấp xỉ chuẩn.
Tương tự, điểm thi môn học của sinh viên bị chặn trên bởi 10 và chặn dưới bởi 0,
nhưng khó có thể nói phân phối của biến này là đối xứng qua điểm 5, vì như vậy có
nghĩa là 50% sinh viên sẽ trượt môn học. Dưới đây là phân phối mẫu của điểm thi
môn Kinh tế lượng của sinh viên ngành Ngân hàng trường Kinh tế quốc dân với kích
thước mẫu bằng 80.
20

%

16
12
8
4
0
0

2

4

6

8

10

Hình 6.4: Phân phối mẫu của điểm thi mơn Kinh tế lượng

Hình 6.3 và 6.4 thể hiện hai phân phối với độ bất đối xứng khá cao, không phân

phối chuẩn.
6.4.1.

Hậu quả khi sai số ngẫu nhiên không tuân theo quy luật chuẩn

Định lý Gauss- Markov trong Bài 3 khẳng định rằng để ước lượng OLS là ước lượng
tốt nhất trong lớp các ước lượng tuyến tính khơng chệch thì khơng cần đến giả thiết về
phân phối chuẩn của sai số ngẫu nhiên. Tuy nhiên để thực hiện các suy diễn thống kê
như trong Bài 4 ta cần đến giả thiết này.
TXT0KT04_Bài6_v1.0015108207

137


Bài 6: Đánh giá các khuyết tật

Khi sai số ngẫu nhiên khơng tn theo quy luật chuẩn thì các ước lượng ˆ j sẽ không
tuân theo quy luật chuẩn và do đó các thống kê t sẽ khơng tn theo quy luật Student,
thống kê F sẽ không tuân theo quy luật Fisher. Vậy khi đó các suy diễn thống kê về
các hệ số cịn có đáng tin cậy hay khơng?
 Khi đó nếu kích thước mẫu là nhỏ thì các suy diễn thống kê là không đáng tin cậy.
 Tuy nhiên với mẫu kích thước lớn thì các suy diễn thống kê vẫn có giá trị.
6.4.2.

Phát hiện khi sai số ngẫu nhiên không tuân theo quy luật chuẩn

Để phát hiện xem có dấu hiệu cho rằng sai số ngẫu nhiên khơng tn theo quy luật
chuẩn, chúng ta có thể sử dụng thông tin từ phần dư, thông qua một số phương pháp
sau đây:
Xem xét đồ thị phần dư

Xem xét đồ thị tần suất (historgram plot) của phần dư có thể giúp chúng ta có ý tưởng
về hình dạng của phân phối xác suất. Nếu phân phối quá lệch về bên phải hoặc bên
trái, quá nhọn hoặc quá dẹt, thì đấy là các dấu hiệu cho rằng sai số ngẫu nhiên của mơ
hình là khơng tn theo quy luật chuẩn
Kiểm định Jacque – Bera (JB)
Kiểm định JB được đề xuất bởi Jacque và Bera (1987). Ý tưởng của kiểm định Jacque
– Bera là như sau:
Ta biết rằng biến ngẫu nhiên phân phối chuẩn sẽ có độ bất đối xứng bằng 0 và độ
nhọn bằng 3. Do đó nếu một biến ngẫu nhiên nào đó có độ bất đối xứng quá khác 0
hoặc độ nhọn quá khác 3 thì đấy là dấu hiệu cho rằng biến đó khơng tn theo quy
luật chuẩn.
Do đó kiểm định Jacque – Bera được thực hiện như sau:
Cho cặp giả thuyết:
H0: u tuân theo phân phối chuẩn.
H1: u không tuân theo phân phối chuẩn.
Bước 1: Ước lượng mơ hình hồi quy gốc, thu được các phần dư ei.
Bước 2: Tính giá trị quan sát của thống kê kiểm định:
S 2 ( K  3) 2

)
6
24
Trong đó S là độ bất đối xứng (Skewness), K là độ nhọn (Kurtosis) của phần dư, n là
kích thước mẫu, k là số hệ số có trong mơ hình.
JB  (n  k )(

Bước 3: Kết luận: Nếu JB  2 (2) thì bác bỏ giả thuyết H0 và thừa nhận giả thuyết

H1. Ngược lại, nếu JB  2 (2) thì chưa có cơ sở bác bỏ giả thuyết H0. Đồng thời, ta
cũng có thể sử dụng giá trị xác suất để kết luận.

Ví dụ 1: Xét mơ hình (VD2): Q = β1 + β2P + β3PC+ u. Ta có kết quả ước lượng:

138

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

8

Series: Residuals
Sample 1 52
Observations 52

7
6
5
4
3
2
1
0
-6

-4

-2

0


2

Mean
Median
Maximum
Minimum
Std. Dev.
Skewness
Kurtosis

-1.86E-14
0.163952
5.201459
-5.840955
2.344561
-0.269058
3.032343

Jarque-Bera
Probability

0.629666
0.729911

4

Với mức ý nghĩa 5% hãy cho biết sai số ngẫu nhiên trong mơ hình này có phân phối
chuẩn hay không?
Lời giải:

Cách 1:
Để trả lời câu hỏi này ta cần kiểm định cặp giả thuyết sau:
H0: u tuân theo phân phối chuẩn.
H1: u không tuân theo phân phối chuẩn.
2
(2)  5,11 , tức
Theo kết quả ước lượng ta có: JBqs = Jarque – Bera = 0,629666 mà  0,05
2
(2) nên chưa có cơ sở bác bỏ H0.
là JBqs <  0,05

Kết luận: Mơ hình (VD2) có sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn.
Cách 2:
Để trả lời câu hỏi này ta cần kiểm định cặp giả thuyết sau:
H0: u tuân theo phân phối chuẩn.
H1: u không tuân theo phân phối chuẩn.
Kết quả ước lượng ta có: Prob (JB) = 0,729911 (giá trị Probability ở dòng cuối cùng
trong kết quả ước lượng).
Mà     = 5% nên Prob >  suy ra chưa có cơ sở bác bỏ H0.

Kết luận: Mơ hình (VD2) có sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn.
Ví dụ 2: Xét tình huống dẫn nhập, ta có bộ số liệu của 66 hộ gia đình có chi tiêu năm
2012 trên 200 triệu. Bộ số liệu rút ra từ cuộc điều tra VHLSS 2012. Mơ hình ban đầu
được quan sát là: CT   1   2TN  u1

Thực hiện kiểm định Jarque – Bera cho mơ hình này ta thu được kết quả sau:

TXT0KT04_Bài6_v1.0015108207

139



Bài 6: Đánh giá các khuyết tật

9

Series: Residuals
Sample 1 66
Observations 66

8
7
6
5
4
3
2
1
0
-40

-20

0

20

Mean
Median
Maximum

Minimum
Std. Dev.
Skewness
Kurtosis

-2.56E-14
5.177662
50.00322
-52.27110
25.50103
-0.368375
2.402245

Jarque-Bera
Probability

2.475304
0.290065

40

Với mức ý nghĩa 5% hãy cho biết sai số ngẫu nhiên trong mơ hình này có phân phối
chuẩn hay không?
Lời giải:
Để trả lời câu hỏi này ta cần kiểm định cặp giả thuyết sau:
H0: u tuân theo phân phối chuẩn.
H1: u không tuân theo phân phối chuẩn.
Kết quả ước lượng ta có: Prob (JB) = 0,290065
Mà  = 5% nên Prob >  suy ra chưa có cơ sở bác bỏ H0.
Kết luận: Mơ hình có sai số ngẫu nhiên tuân theo quy luật phân phối chuẩn.


140

TXT0KT04_Bài6_v1.0015108207


Bài 6: Đánh giá các khuyết tật

Tóm lược cuối bài
Tiêu chí đánh giá mơ hình thích hợp cho phân tích thực nghiệm:

 Độ chính xác của số liệu;
 Độ vững về lý thuyết;
 Dạng hàm định dạng đúng;
 Tính bao quát.
Kỳ vọng sai số ngẫu nhiên khác không
 Hiện tượng kỳ vọng sai số ngẫu nhiên khác không là sai số ngâu nhiên, tại một giá trị nào đó
của biến giải thích, có kỳ vọng khác khơng.
 Ngun nhân chính dẫn tới hiện tượng kỳ vọng sai số ngẫu nhiên khác khơng là mơ hình bị
bỏ sót biến hoặc có dạng hàm xác định sai.
 Phát hiện: kiểm định ý nghĩa thống kê của hệ số tương ứng với biến bị thiếu, kiểm định
RAMSEY.
 Phương pháp khắc phục: thêm thông tin của các biến số mới hoặc đổi dạng hàm của mơ hình
hồi quy.
Phương sai sai số thay đổi
 Phương sai sai số thay đổi là hiện tượng phương sai của sai số ngẫu nhiên nhận các giá trị
khác nhau tại các bộ giá trị (X2i ,, Xki) khác nhau.
 Nguyên nhân chủ yếu dẫn đến hiện tượng phương sai sai số thay đổi là do bản chất của số
liệu và do mơ hình thiếu biến quan trọng hoặc dạng hàm sai.
 Hậu quả của hiện tượng phương sai sai số thay đổi là các ước lượng OLS vẫn là ước lượng

khơng chệch nhưng khơng cịn là ước lượng tốt nhất, phương sai của hệ số ước lượng là
chệch dẫn đến khoảng tin cậy và kiểm định giả thuyết về các hệ số khơng cịn giá trị sử dụng.
 Phát hiện: sử dụng đồ thị phần dư, kiểm định Breusch – Pagan, kiểm định White.
 Khắc phục: phương pháp GLS hoặc phương pháp ước lượng sai số chuẩn vững.
Sai số chuẩn không tuân theo quy luật chuẩn
 Các biến số trong kinh tế có thể có phân phối lệch đi, quá nhọn hoặc quá bẹt nên không
phân phối chuẩn. Khi biến phụ thuộc không phân phối chuẩn sẽ dẫn đến sai số ngẫu nhiên
không phân phối chuẩn.
 Khi xảy ra hiện tượng này, các ước lượng OLS vẫn là các ước lượng tuyến tính khơng chệch
và tốt nhất. Tuy nhiên các suy diễn thống kê về các hệ số không cịn đáng tin cậy khi có ít
quan sát trong mẫu.
 Để kiểm định sai số chuẩn có tuân theo quy luật chuẩn hay khơng ta có thể vẽ đồ thị tần suất
của phần dư hoặc thực hiện kiểm định Jarque – Bera.

TXT0KT04_Bài6_v1.0015108207

141


Bài 6: Đánh giá các khuyết tật

Câu hỏi ôn tập
Nêu rõ các tiêu chí đánh giá một mơ hình thích hợp cho phân tích thực nghiệm.
Thế nào là hiện tượng kỳ vọng sai số ngẫu nhiên khác không?
Nêu 2 nguyên nhân chính gây ra hiện tượng kỳ vọng sai số ngẫu nhiên khác khơng.
Trình bày các bước kiểm định RAMSEY phát hiện hiện tượng kỳ vọng sai số ngẫu nhiên
khác không.
5. Thế nào là hiện tượng phương sai sai số thay đổi? Nguyên nhân nào dẫn đến hiện tượng này?
6. Hậu quả của phương sai sai số thay đổi? Một mơ hình có phương sai sai số thay đổi có nên
sử dụng trong phân tích khơng? Tại sao?

7. Nêu các bước thực hiện kiểm định Breusch – Pagan? Áp dụng cho một mơ hình cụ thể bất kỳ?
8. Nêu các bước thực hiện kiểm định White? Áp dụng cho một mơ hình cụ thể bất kỳ?
9. Nêu cách khắc phục hiện tượng phương sai sai số thay đổi trong mô hình?
10. Sai số ngẫu nhiên khơng phân phối chuẩn là gì? Hậu quả và cách phát hiện?
1.
2.
3.
4.

142

TXT0KT04_Bài6_v1.0015108207


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×