Tải bản đầy đủ (.pdf) (55 trang)

Suy diễn thống kê và dự báo từ mô hình hồi quy tuyến tính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (529.19 KB, 55 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

KHOA TOÁN

Mai Thị Tuyết

SUY DIỄN THỐNG KÊ VÀ DỰ BÁO
TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

Hà Nội – Năm 2016


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

KHOA TOÁN

Mai Thị Tuyết

SUY DIỄN THỐNG KÊ VÀ DỰ BÁO
TỪ MÔ HÌNH HỒI QUY TUYẾN TÍNH

Chuyên ngành: Toán ứng dụng

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS Trần Trọng Nguyên



Hà Nội – Năm 2016


Mục lục

Danh sách bảng

vi

Danh sách hình vẽ

vii

Lời mở đầu

1

1 MÔ HÌNH HỒI QUY TUYẾN TÍNH BỘI

3

1.1

1.2

1.3

Khái niệm và các giả thiết cơ bản . . . . . . . . . . . .


3

1.1.1

Khái niệm . . . . . . . . . . . . . . . . . . . . .

3

1.1.2

Các giả thiết cơ bản . . . . . . . . . . . . . . .

4

Ước lượng các tham số bằng OLS cho mô hình
hồi quy bội . . . . . . . . . . . . . . . . . . . . . . .

6

1.2.1

Phương pháp OLS . . . . . . . . . . . . . . . .

6

1.2.2

Định lý Gauss- Markov . . . . . . . . . . . . . .

7


1.2.3

Các tính chất của ước lượng OLS . . . . . . . .

10

1.2.4

Tính vững của ước lượng OLS . . . . . . . . . .

11

¯2
Hệ số xác định bội R2 và hệ số xác định hiệu chỉnh R

13

2 SUY DIỄN THỐNG KÊ VÀ DỰ BÁO TỪ MÔ HÌNH
HỒI QUY

18

i


Khóa luận tốt nghiệp Đại học

2.1


Mai Thị Tuyết

QUY LUẬT PHÂN PHỐI XÁC SUẤT CỦA MỘT SỐ
THỐNG KÊ MẪU . . . . . . . . . . . . . . . . . . . .

2.2

18

BÀI TOÁN XÂY DỰNG KHOẢNG TIN CẬY CHO
CÁC HỆ SỐ HỒI QUY . . . . . . . . . . . . . . . . .
2.2.1

Khoảng tin cậy cho một hệ số hồi quy: đánh giá
tác động khi một biến độc lập thay đổi . . . . .

2.2.2

20

20

Khoảng tin cậy cho biểu thức của hai hệ số hồi
quy; đánh giá tác động khi hai biến độc lập cùng

2.3

2.4

thay đổi . . . . . . . . . . . . . . . . . . . . . .


22

2.2.3

Ý nghĩa của khoảng tin cậy . . . . . . . . . . .

24

2.2.4

Các yếu tố ảnh hưởng đến độ đài khoảng tin cậy 25

BÀI TOÁN KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
VỀ HỆ SỐ HỒI QUY . . . . . . . . . . . . . . . . . .

26

2.3.1

Kiểm định giả thuyết về một hệ số hồi quy . . .

26

2.3.2

Kiểm định giả thuyết về một ràng buộc giữa các
hệ số hồi quy - kiểm định T . . . . . . . . . . .

30


2.3.3

Giá trị xác suất P của các thống kê kiểm định .

31

2.3.4

Kiểm định giả thuyết về nhiều ràng buộc của
các hệ số hồi quy-kiểm định F . . . . . . . . . .

33

2.3.5

Kiểm định về sự phù hợp của hàm hồi quy . . .

37

2.3.6

So sánh kiểm định T và kiểm định F . . . . . .

39

DỰ BÁO GIÁ TRỊ CỦA BIẾN PHỤ THUỘC VÀ SAI
SỐ DỰ BÁO . . . . . . . . . . . . . . . . . . . . . . .

41


2.4.1

Dự báo giá trị của biến phụ thuộc . . . . . . . .

41

2.4.2

Đánh giá sai số dự báo . . . . . . . . . . . . . .

42

ii


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

Kết luận chung

45

iii


LỜI CẢM ƠN

Trong quá trình nghiên cứu khóa luận “Suy diễn thống kê và dự báo

từ mô hình hồi quy tuyến tính” với sự cố gắng của bản thân và sự giúp
đỡ nhiệt tình của các thầy cô trong tổ Toán ứng dụng, các bạn sinh viên
khoa Toán em đã hoàn thành khóa luận này.
Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong
tổ Toán ứng dụng, trường đại học sư phạm Hà Nội 2 và các bạn sinh
viên đã tạo điều kiện cho em trong suốt thời gian làm khóa luận.
Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hướng dẫn
PGS.TS Trần Trọng Nguyên, người đã tận tình và đóng góp ý kiến quý
báu cho em trong quá trình thực hiện và hoàn thành khóa luận này.
Hà Nội, tháng 05 năm 2016
Sinh viên

Mai Thị Tuyết


LỜI CAM ĐOAN

Em xin cam đoan đề tài này là do em thực hiện. Trong quá trình
nghiên cứu em đã kế thừa những thành quả nghiên cứu của các nhà
khoa học, nhà nghiên cứu với sự trân trọng biết ơn. Đề tài này không
trùng với các kết quả của tác giả khác.
Hà Nội, tháng 05 năm 2016
Sinh viên

Mai Thị Tuyết


Danh sách bảng
1.1


Bảng số liệu . . . . . . . . . . . . . . . . . . . . . . . .

14

2.1

Các cặp giả thuyết và điều kiện để bác bỏ H0 tương ứng

28

2.2

Các cặp giả thuyết và điều kiện để bác bỏ H0 tương ứng

30

vi


Danh sách hình vẽ
1.1

Kết quả EVIEWS cho ví dụ 1.3.1

. . . . . . . . . . . .

15

1.2


Kết quả hồi quy cho ví dụ 1.3.1 . . . . . . . . . . . . .

16

2.1

Khoảng tin cậy với độ tin cậy 95% từ các mẫu khác nhau 25

2.2

Giá trị tqs và xác suất P tương ứng . . . . . . . . . . .

32

2.3

Kết quả ước lượng . . . . . . . . . . . . . . . . . . . . .

43

2.4

Kết quả sai số dự báo . . . . . . . . . . . . . . . . . . .

44

vii


Khóa luận tốt nghiệp Đại học


Mai Thị Tuyết

Lời mở đầu
1. Lý do chọn đề tài
Suy diễn thống kê là việc nghiên cứu mối quan hệ giữa một tổng thể
và một mẫu được lấy ra từ tổng thể đó. Suy diễn thống kê và dự báo từ
mô hình hồi quy tuyến tính là một phần quan trọng trong phân tích hồi
quy. Nó giúp cho người nghiên cứu kiểm chứng nhiều giả thuyết quan
trọng và đưa ra các dự báo trên cở sở phân tích khoa học về các dữ liệu
đã thu thập được để có thêm thông tin chắc chắn cho việc ra quyết định
về chính sách hay giải pháp nào đó.
Với mong muốn tìm hiểu sâu vấn đề này, cùng sự giúp đỡ tận tình của
PGS.TS Trần Trọng Nguyên, tôi đã chọn nghiên cứu đề tài khóa
luận tốt nghiệp: “Suy diễn thống kê và dự báo từ mô hình hồi
quy tuyến tính”.
2. Mục đích nghiên cứu
Nghiên cứu mô hình hồi quy tuyến tính (bội), phương pháp ước lượng
OLS, bài toán suy diễn thống kê về giá trị của các hệ số hồi quy tổng
thể và bài toán dự báo cho giá trị của biến phụ thuộc tại các giá trị cụ
thể của biến độc lập với sự hỗ trợ của phần mềm Eviews.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: suy diễn thống kê và dự báo từ mô hình hồi
quy tuyến tính.
- Phạm vi nghiên cứu: mô hình hồi quy tuyến tính (bội), các phương
pháp ước lượng và kiểm định giả thuyết về các hệ số của mô hình hồi
quy ứng dụng trong việc trình bày bài toán suy diễn thống kê và bài
toán dự báo trong phân tích hồi quy.
4. Phương pháp và công cụ nghiên cứu
- Phương pháp nghiên cứu tổng hợp tài liệu.

1


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

- Phương pháp nghiên cứu thực nghiệm với dữ liệu thực tế.
- Sử dụng phần mềm Eviews 4.0
5. Cấu trúc khóa luận
Nội dung khóa luận gồm hai chương:
Chương 1. Mô hình hồi quy tuyến tính bội: chương này trình bày một
số khái niệm và kiến thức cơ bản sẽ được sử dụng trong chương sau.
Chương 2. Suy diễn thống kê và dự báo từ mô hình hồi quy tuyến
tính: chương này trình bày bài toán suy diễn thống kê và trình bày bài
toán dự báo sử dụng mô hình hồi quy.

2


Chương 1
MÔ HÌNH HỒI QUY TUYẾN
TÍNH BỘI
Mục đích của chương này là trình bày mô hình hồi quy tuyến tính dưới
dạng tổng quát- còn được gọi là mô hình hồi quy bội. Trong mô hình hồi
quy bội, biến phụ thuộc có thể được giải thích bởi nhiều biến độc lập,
điều này cho phép đánh giá tác động riêng phần của một biến độc lập
lên biến phụ thuộc- là một vấn đề cốt lõi khi đánh giá tác động trong
kinh tế- xã hội, khi mà các biến số thường có tác động chồng chéo nhau.


1.1
1.1.1

Khái niệm và các giả thiết cơ bản
Khái niệm

Mô hình hồi quy tuyến tính k biến có thể viết dưới dạng sau:

Y = β1 + β2 X2 + ... + βk Xk + u.

(1.1)

Trong đó Y là biến phụ thuộc và các Xj (j = 2, 3, ..., k) là các biến
độc lập.Ta biết rằng dù có đưa bao nhiêu biến độc lập vào mô hình thì
vẫn tồn tại những yếu tố có tác động đến biến phụ thuộc mà chúng
3


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

ta hoặc không có quan sát của chúng, hoặc không thể và cũng không
muốn đưa vào mô hình như là các biến s, do đó với mô hình k biến
vẫn tồn tại sai số ngẫu nhiên u, đại diện cho các yếu tố ngoài các biến

Xj (j = 2 − k),có tác động đến Y nhưng không đưa vào mô hình như là
biến số.
Sai số ngẫu nhiên u trong mô hình hồi quy bội là yếu tố đại diện cho
các yếu tố có tác động đến Y nhưng không đưa vào mô hình như các

biến số.

1.1.2

Các giả thiết cơ bản

Với mô hình (1.1), xét ra các giả thiết sau:
Giả thiết 1 : Việc ước lượng được dựa trên cơ sở mẫu ngẫu nhiên.

Giả thiết này tương tự như trong mô hình hồi quy hai biến: các cá
thể được chọn một cách ngẫu nhiên, rồi từ đó thu thập các chỉ tiêu của
các cá thể này. Chẳng hạn khi xem xét vấn đề năng suất lao động thì
người lao động được lựa chọn một cách ngẫu nhiên từ tổng thể, sau đó
thu thập các số liệu từ những người được chọn trong mẫu về năng suất,
trình độ học vấn, tuổi ...
Giả thiết 2 : Kỳ vọng của sai số ngẫu nhiên tại mỗi giá trị (X2i , ..., Xki )
bằng 0:

E(ui |X2i ,...,Xki ) = 0 .
Giả thiết 3 : Phương sai của sai số ngẫu nhiên tại các giá trị (X2i , ..., Xki )
đều bằng nhau:

V ar(u

X2i ,...,Xki )

4

= σ2 .



Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

Giả thiết 4 : Giữa các biến độc lập Xj (j = 2, ..., k) không có mối
quan hệ đa cộng tuyến hoàn hảo, nghĩa là không tồn tại các hằng số

λ2 , ..., λk không đồng thời bằng 0 sao cho: λ2 X2 + ... + λk Xk = 0.
Ý nghĩa của các hệ số hồi quy
Các hệ số hồi quy trong mô hình hồi quy bội còn được gọi là hệ số
hồi quy bội.
Với giả thiết 2 ta có:

E(Y |X2 ,...,Xk ) = β1 + β2 X2 + ... + βk Xk .
Để tìm hiểu ý nghĩa các hệ số góc βj (j ≥ 2), ta lấy đạo hàm riêng
hai vế biểu thức trên theo Xj (giả định Xj là biến liên tục):

∂E(Y

X2 ,..., Xk )

∂Xj

= βj , (j = 2, ..., k).

Hệ số góc βj (j = 2 − k) thể hiện tác động riêng phần của biến Xj
lên giá trị trung bình của biến phụ thuộc, là tác động của biến Xj lên
giá trị trung bình của biến phụ thuộc khi các yếu tố Xs (s = j) là không
đổi. Do đó trong mô hình hồi quy bội, các hệ số góc còn được gọi là hệ

số hồi quy riêng (partial coefficient).
Mô hình hồi quy bội cho phép đánh giá tác động của một biến độc
lập lên biến phụ thuộc khi các biến số khác trong mô hình hồi là không
đổi. Điều này cho thấy sự ưu việt quan trọng của mô hình hồi quy bội
trong phân tích kinh tế xã hội: mặc dù trong thực tế, chúng ta không
cần (và không thể) “giữ nguyên các yếu tố khác không đổi”, nhưng vẫn
có thể ước lượng được tác động riêng phần của một biến số như trong
điều kiện “giữ nguyên một số các yếu tố khác không đổi”.

5


Khóa luận tốt nghiệp Đại học

1.2

Mai Thị Tuyết

Ước lượng các tham số bằng OLS cho mô hình
hồi quy bội

1.2.1

Phương pháp OLS

Xét mô hình k biến:

Y = β1 + β2 X2 + ... + βk Xk + u.
Giả sử có một mẫu quan sát với các giá trị thực tế là (Yi , X2i , ..., Xki


(i = 1, 2, ..., n) và ta sẽ sử dụng thông tin từ mẫu này để xây dựng các
ước lượng cho các hệ số βj (j = 1, 2, ..., k) ký hiệu bởi βˆj (j = 1, 2, ..., k)
tương ứng. Từ các giá trị ước lượng này có thể viết hàm hồi quy mẫu
như sau: Yˆ = βˆ1 + βˆ2 X2 + ... + βˆk Xk .
Tại mỗi quan sát i, hàm hồi quy mẫu này được viết thành:

Yˆi = βˆ1 + βˆ2 X2i + ... + βˆk Xki .
Trong đó Yˆi là giá trị ước lượng cho Yi và sai lệch giữa hai giá trị này
được gọi là phần dư: ei = Yi − Yˆi .
Phương pháp OLS nhằm xác định các giá trị βˆj (j = 1, 2, ..., k) sao
cho tổng bình phương các phần dư là bé nhất:
n

e2i =

(Yi − β1 − β2 X2 − ... − βk Xk )2

i=1

= M inβ˜1 ,...,β˜k

2
(Yi − β˜1 − β˜2 X2 − ... − β˜k Xk ) .

6

(1.2)


Khóa luận tốt nghiệp Đại học


Mai Thị Tuyết

Khi đó dễ thấy rằng các giá trị là nghiệm của hệ k phương trình sau:











n

(Yi − βˆ1 − βˆ2 X2i − ... − βˆk Xki ) = 0

i=1
n

X2i (Yi − βˆ1 − βˆ2 X2i − ... − βˆk Xki ) = 0

i=1












1.2.2

......
n

Xki (Yi − βˆ1 − βˆ2 X2i − ... − βˆk Xki ) = 0

i=1

Định lý Gauss- Markov

Định lý 1.1. Khi các giả thiết 1- giả thiết 4 thỏa mãn thì các ước lượng
thu được từ phương pháp OLS là các ước lượng tuyến tính, không chệch
và có phương sai nhỏ nhất trong lớp các ước lượng tuyến tính không
chệch.
Khi các giả thiết 1- giả thiết 4 được thỏa mãn thì ước lượng OLS là
ước lượng tốt nhất trong lớp các ước lượng tuyến tính không chệch và
thường viết tắt là BLUE (best linear unbiased estimator).
Ước lượng tuyến tính: β˜j được gọi là ước lượng tuyến tính cho hệ số
hồi quy nếu nó được biểu diễn dưới dạng là tổ hợp tuyến tính của các
giá trị của biến phụ thuộc: β˜j = w1 Y1 + ... + wn Yn .
Trong đó wi là các hằng số nào đó và Yi là các giá trị trong mẫu của
biến phụ thuộc. Như vậy định lý Gauss- Markov khẳng định rằng các
ước lượng OLS là ước lượng tuyến tính.

Ước lượng không chệch: Ước lượng β˜j được gọi là ước lượng không
chệch của nếu βj E(β˜j ) = βj . Như vậy định lý Gauss- Markov khẳng
định rằng: E(βˆj ) = βj , j = 2, 3, ..., k.
Phương sai nhỏ nhất: Như đã chỉ ra phần trên, khi βˆj là ước lượng
không chệch của βj , thì var(βˆj ) thể hiện độ chính xác của ước lượng,
7


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

var(βˆj ) càng nhỏ có nghĩa là độ chính xác càng lớn. Vì vậy trong các
ước lượng không chệch, ước lượng có phương sai nhỏ hơn sẽ được ưa
thích hơn.
Định lý Gauss- Markov khẳng định rằng khi các giả thiết 1 − 4 thỏa
mãn thì ước lượng thu được từ phương pháp OLS là có phương sai bé
nhất trong số các ước lượng tuyến tính không chệch:

var(βˆj OLS ≤ var(β˜j )
với β˜j là ước lượng tuyến tính không chệch bất kỳ.
Như vậy nếu các giả thiết 1 − 4 được thỏa mãn thì ước lượng OLS
là ước lượng tốt nhất trong số các ước lượng có dạng tuyến tính và ta
không cần tìm đến bất kỳ ước lượng tuyến tính nào khác. Điều này cũng
có nghĩa là khi một trong các giả thiết này không được thỏa mãn thì
các ước lượng OLS sẽ không còn là ước lượng tôt nhất nữa.
Độ chính xác của các ước lượng
Khi các giả thiết 1 − 4 thỏa mãn thì βˆj là các ước lượng không chệch
của βj và var(βˆj ) chính là thước đo độ chính xác của các ước lượng này.
Bây giờ xem xét công thức để ước lượng var(βˆj ). Phương sai của các hệ

số ước lượng được tính theo công thức:

var(βˆj ) =

σ2
(1 − Rj2 )

x2ji

.

(1.3)

Trong đó Rj2 là hệ số xác định của mô hình hồi quy Xj theo hệ số
¯j .
chặn và các biến độc lập còn lại trong mô hình và xji = Xji − X
Chẳng hạn Rj2 là hệ số xác định của mô hình hồi quy sau đây: X2 =

α1 + α2 X3 + ... + αk Xk + v.
Trong đó v là sai số ngẫu nhiên trong mô hình hồi quy phụ này.
8


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

Trong công thức R2 = r2 (Y, Yˆ ), do σ 2 là tham số chưa biết nên khi
tính toán được thay bởi ước lượng (không chệch) của nó là σ
ˆ 2 , trong đó:

n

σ
ˆ2 =

j=1

e2i

n−k

.

(1.4)

Với các giả thiết 1 − 4 thì được tính theo công thức (1.4) chính là
ước lượng không chệch của tham số tổng thể σ 2 .
Sai số chuẩn của se(βˆj ) được ký hiệu bởi se(βˆj ) và được tính bởi
công thức:

se(βˆj ) =

σ
ˆ2
(1 − Rj2 )

x2ji

=


RSS/(n − k)
, j = (2, 3, ..., k). (1.5)
(1 − Rj2 ) x2ji

Các yếu tố xác định độ chính xác của ước lượng
Từ công thức (1.3) ta thấy độ chính xác của các βˆj phụ thuộc vào
ba thành phần sau đây:
Thứ nhất, nó phụ thuộc vào phương sai của yếu tố ngẫu nhiên σ 2 ,
phương sai này càng bé thì độ chính xác của các ước ượng càng lớn. Ta
biết rằng u thể hiện cho các yếu tố có tác động đến biến phụ thuộc Y
nhưng không được đưa vào mô hình như là các biến số, vậy ta kỳ vọng
rằng việc giảm bớt các thành phần trong u sẽ giúp giảm phương sai của
nó. Điều này có nghĩa là việc đưa thêm các biến số thích hợp vào mô
hình sẽ có khả năng giúp làm giảm σ 2 và do đó giúp làm tăng độ chính
xác của các βˆj .
Thành phần thứ hai trong (1.3) là

1
:
(1−Rj2 )

khi Rj2 càng lớn thì giá trị

này càng lớn và khi xấp Rj2 xỉ 1 thì giá trị này sẽ lớn rất nhanh, làm cho
phương sai rất lớn và tiến dần đến +∞ một cách nhanh chóng, do đó
thành phần này còn được gọi là nhân tử phóng đại phương sai ( VIF:
9


Khóa luận tốt nghiệp Đại học


Mai Thị Tuyết

variance inflation factor) .

V IFj =

1
.
(1 − Rj2 )

(1.6)

Nhớ lại rằng Rj2 là hệ số xác định trong mô hình hồi quy phụ của
biến độc lập Xj theo hệ số chặn và theo các biến độc lập còn lại trong
mô hình, nó thể hiện mối quan hệ tuyến tính giữa biến Xj và các biến
độc lập còn lại. Do đó nếu quan hệ tuyến tính này càng chặt thì Rj2 càng
lớn và độ chính xác của các ước lượng càng giảm.
n

Thành phần còn lại trong công thức (1.3) là
i=1

x2ji , giá trị này càng

lớn thì độ chính xác của ước lượng càng lớn. Do đó nếu giá trị của biến

Xj trong mẫu càng khác biệt thì phương sai của hệ số ước lượng càng
nhỏ.
Như vậy việc đưa thêm một biến độc lập bất kỳ vào mô hình thì

thông thường sẽ làm thay đổi không chỉ vào giá trị ước lượng của các hệ
số hồi quy mà còn vào phương sai của các ước lượng, thông qua cả ba
thành phần trong công thức (1.3). Tuy nhiên cũng sẽ có một số trường
hợp khi mà việc đưa thêm biến số vào không làm thay đổi kết quả ước
lượng.

1.2.3

Các tính chất của ước lượng OLS

Xét mô hình hồi quy bội: Y = β1 + β2 X2i + β3 X3i + ... + βk Xki + ui .
Mô hình hồi quy bội có các tính chất sau:

¯2, X
¯ 3 , ..., X
¯ k ).
• Đường hồi quy bội đi qua điểm (Y¯ , X
• ¯ˆY = Y¯ .
n



ui = 0.
i=1

10


Khóa luận tốt nghiệp Đại học


Mai Thị Tuyết
n

• ui không tương quan với Xpi , (p = 2, 3, ..., k),

ui Xpi = 0.
i=1

n

• Các ui không tương quan với Yˆi :

ui Yˆi = 0.

i=1

• Các βˆj là các ước lượng tuyến tính không chệch và có phương sai
nhỏ nhất cho các βi (i = 1, k).

1.2.4

Tính vững của ước lượng OLS

Định lý 1.2. Định lý Gauss – Markov cho ta biết rằng khi các giả thiết

1 − 4 thỏa mãn thì ước lượng OLS là các ước lượng tốt nhất trong lớp các
ước lượng tuyến tính không chệch. Tính chất vững của ước lượng phản
ánh chất lượng của ước lượng khi mẫu lớn, vì vậy tính chất này còn gọi
là tính chất với mẫu lớn của ước lượng.
Để làm rõ ý nghĩa ứng dụng của khái niệm này, hãy xem xét trường

hợp khi mà θˆ không phải là ước lượng vững của θ. Khi đó dù kích thước
mẫu có lớn đến đâu thì chúng ta cũng không kỳ vọng rằng ước lượng θˆ
thu được từ mẫu đó là xấp xỉ với giá trị chưa biết θ.
Về mặt lý thuyết, trong trường hợp ước lượng là không chệch thì vẫn
có thể thu được giá trị gần đúng cho θ kể cả khi ước lượng là không vững,
bằng cách lấy ngẫu nhiên nhiều mẫu cùng kích thước và lấy giá trị trung
θˆ +θˆ +...+θˆ(m)
.
bình của các ước lượng θ thu được từ mẫu này: θˆ∗ = (1) (2)
m

Trong đó θˆ(j) là ước lượng không chệch cho thu được từ mẫu thứ j
(j = 1, 2, ..., m). Khi m khá lớn thì theo định lý giới hạn trung tâm, θˆ∗
sẽ là một ước lượng tốt của θ. Tuy nhiên trong thực hành, các nhà kinh
tế lượng thường chỉ có một mẫu, do đó tính vững của ước lượng vẫn là
một yêu cầu cơ bản.
Trong trường hợp ước lượng là chệch mà lại không vững thì θˆ∗ nói
trên sẽ cũng không phải là ước lượng tốt, do đó yêu cầu về tính vững lại
11


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

càng quan trọng đối với các ước lượng chệch. (Granger, một nhà kinh
tế lượng nổi tiếng, cho rằng nếu một ước lượng là không vững thì ước
lượng này là không nên sử dụng).Ta có kết quả sau đây:
Định lý 1.3. Khi các giả thiết 1-4 thỏa mãn thì các ước lượng OLS
không chỉ là các ước lượng BLUE, mà còn là ước lượng vững, nghĩa là:

Với mọi ε > 0 tùy ý thì:
(n)
lim P ( βˆj − βj | > ε) = 0.

(1.7)

n→∞

(n)
Trong đó βˆj là ước lượng βˆj với kích thước mẫu n.

Chứng minh: Để đơn giản cho việc trình bày, chúng ta chỉ chứng
minh cho trường hợp mô hình hồi quy hai biến, với trường hợp mô hình
hồi quy nhiều biến, việc chứng minh là hoàn toàn tương tự nhưng phải
dựa trên ngôn ngữ ma trận.
Với hàm hồi quy hai biến ta có: βˆ2 = β2 +
Do đó:

βˆ2 − β2 =

1
n

1
n

n

xi ui
i=1

n
1
x2i
n
i=1

.

n

xi ui
i=1
.
n
1
2
xi
n
i=1

(1.8)

Khi n lớn, tử số của vế phải trong (1.8) hội tụ về cov(X, u) và mẫu
số hội tụ về var(X). Với giả thiết var(X) hữu hạn, vế phải của (1.8)
sẽ hội tụ về 0 khi n lớn ra vô cùng, là điều cần chứng minh. Việc chứng
minh cho tính vững của βˆ1 được thực hiện hoàn toàn tương tự.
Định lý 1.4. nếu trong định lý 1.3, giả thiết 2 được thay bởi giả thiết
sau:
12



Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

• cov(Xj , u) = 0 với j = 2, 3, ..., k.
• E(u) = 0
Thì ước ước lượng OLS vẫn là ước lượng vững. Như đã chỉ ra ở các
phần trên, khi giả thiết 2 thỏa mãn thì hai giả thiết kia cũng thỏa mãn
nhưng không có điều ngược lại: khi X tuy không tương quan với u nhưng
không độc lập với u thì giả thiết 2 là không thỏa mãn. Định lý ngụ ý
rằng với kích thước mẫu lớn thì giả thiết về sự bằng 0 của kỳ vọng của
sai số ngẫu nhiên có thể được thay thế bởi điều kiện yếu hơn mà vẫn
đảm bảo được tính vững của ước lượng OLS.

Hệ số xác định bội R2 và hệ số xác định hiệu

1.3

¯2
chỉnh R
Trong mô hình hồi quy bội hệ số xác định kí hiệu là R2 được xác định
bởi công thức: R2 =

ESS
T SS

=1−

RSS

T SS .

Hệ số xác định R2 có tính chất sau:

• 0 ≤ R2 ≤ 1.
• Nếu R2 = 1 khi đó đường hồi quy giải thích sự thay đổi của Y bởi
n

uˆi = 0.

vì khi đó:
i=1

• Nếu R2 = 0 khi đó mô hình không giải thích được sự thay đổi của
Y.
• Nếu số biên độc lập càng tăng thì hệ số R2 càng lớn, hay R2 là một
hàm tăng theo các biến giải thích.
Như vậy, tính phù hợp của mô hình hồi quy tăng lên khi có nhiều
biến giải thích trong mô hình hơn. Tuy nhiên, người ta muốn dùng một
13


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

lượng biến giải thích vừa đủ sao cho vẫn có được mô hình phù hợp mà
không quá tốn kém thì phải thu thập thông tin của quá nhiều biến giải
thích. Hơn nữa, nhiều khi đưa thêm một số biến độc lập vào mô hình
thì tác động riêng phần của các biến độc lập đó tới biến phụ thuộc lại

không thực sự có ý nghĩa thống kê. Vậy cần có tiêu chuẩn đánh giá sự
phù hợp của mô hình, trong đó có cân nhắc đến số lượng biến giải thích
của mô hình. Một trong số các tiêu chuẩn như vậy là hệ số xác định
n

¯2

¯2

2

hiệu chỉnh R của R cho bằng biểu thức: R = 1 −

i=1
n

u
ˆ2i /(n−k)

.
y 2 /(n−1)

i=1

Trong đó n là số quan sát, k − 1 là số biến độc lập trong mô hình.
¯ 2 và R2 là: R
¯ 2 = 1 − (1 − R2 ) (n−1) .
Dễ thấy mối quan hệ giữa R
(n−K)


¯ 2 có các tính chất sau:
Hệ số điều chỉnh R
¯ 2 ≤ R2 ≤ 1.
• Nếu k > 1 thì R
¯ 2 cũng tăng lên nhưng tăng
• Khi số biến độc lập k − 1 tăng lên thì R
chậm hơn so với.

¯ 2 có thể âm. Khi R
¯ 2 nhận giá trị âm thì để
• Nếu R2 ≥ 0, nhưng R
cho tiện, thường thì người ta gán lại cho nó giá trị bằng 0.
Ví dụ 1.3.1. Cho bảng số liệu sau:
X2

9 10

X3

8 13 11 10 12 16 10 10 12 14 12 16 14 10 12

Y

6

8

8
8


7
7

10
7

4
12

5

5

9

8

6
9

8

7

4

10 10 11

9
9


5

8

10 11

Bảng 1.1: Bảng số liệu

Trong đó X2 là tỉ lệ lao động của nông nghiệp (%), X3 số năm trung
bình đào tạo những người lớn hơn 25 tuổi (năm), Y là thu nhập bình
quân đầu người/năm (U SD).
Chọn File → New: [workfile Range].
14


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

Frequency: Undate or irregular → start date: 1 → End date: 15
mở cửa sổ [workfile].
Chọn Quick → Empty Group (Edit Series) mở cửa sổ [Group]

→ chọn ô đầu tiên bên phải ô obs, nhập tên biến X2 , các ô bên dưới
tự động chuyển thành NA, nhập các giá trị của biến X2 ứng với các số
liệu đã có. Tiếp tục với cột biến X3 và biến và biến Y.
[Cửa sổ lệnh] LS Y C X2 X3 được kết quả ở cửa sổ [Equation].

Hình 1.1: Kết quả EVIEWS cho ví dụ 1.3.1


Dựa vào kết quả báo cáo trong EVIEWS ta có:
Coeffiuent (ước lượng hệ số):

βˆ1 = 6, 202980
βˆ2 = −0, 376164
βˆ3 = 0, 452514
15


Khóa luận tốt nghiệp Đại học

Mai Thị Tuyết

Std. Error (sai số chuẩn):

se(βˆ1 ) = 1, 862253
se(βˆ2 ) = 0, 132724
se(βˆ3 ) = 0, 119511
R-squared (hệ số xác định bội): R2 = 0, 693203.

¯ 2 = 0, 642070.
Adjusted R-squared (hệ số xác định điều chỉnh): R
Từ [Equation] View → Representations: Khi đó ta có kết quả ước
lượng phương trình hồi quy.

Hình 1.2: Kết quả hồi quy cho ví dụ 1.3.1

Yˆ = 6, 202980 − 0, 376264.X2 + 0, 452514.X3 .
Trong đó:


16


×