Tải bản đầy đủ (.pdf) (15 trang)

Hồi quy hai biến docx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (416.55 KB, 15 trang )

HỒI QUY 2 BIẾN
Chương 2
1) Hồi qui
a- Khái niệm
Phân tích hồi qui là nghiên cứusự phụ thuộccủa1
biến(biếnphụ thuộc) vào 1 hay nhiềubiến khác (biến
độclập), nhằmmục đích ướclượng (hay dựđoán) giá
trị trung bình củabiếnphụ thuộctrêncơ sở các giá trị
biếttrướccủacácbiến độclập.
2.1. Giớithiệu
2.1.1. Khái niệmvề hồiquyvàtương quan
ĐỒ THỊ PHÂN TÁN
i. Quan hệ thống kê và quan hệ hàm số:
Y = aX + b
Năng suấtlúa= f(giống, kỹ thuậtcanhtác, đất đai thổ
nhưỡng, vậttư nôngnghiệp,…)
ii. Hồi quy và quan hệ nhân quả:
Phân tích hồi quy không đòi hỏigiữabiếnphụ thuộcvà
các biến độclậpphảicómốiquanhệ nhân quả.
Vì hồi qui là để quyết định phương án tốtnhấtnhằmdự
báo biếnY từ biếnX
b) Sự khác nhau giữacácd
ạng quan hệ trong hồiqui
 Ví dụ 1 : Về nhân quả : khi thu nhậpcánhântăng (biến
X) thì số thuế thu nhậpcánhânphảinộptăng (biếnY), vậy
khi ta thấymộtngườinộpthuế thu nhậpcánhântăng, ta có
thể cho rằng người đócómức thu nhậptăng.
Tuy nhiên trong thựctế ta không thể xác định rõ biếnnào
qui định biếnnào.
 Ví dụ 2 : không phải nhân quả
Lý thuyếtkinhtế cho rằng : tỷ lệ thấp nghiệptăng do giá


lương thấp, nhưng cầnhiểurằng giá lương thấp không là
nguyên khiếnthất nghiệptăng
b) Sự khác nhau giữacácdạng quan hệ trong hồiqui
a- Khái niệm
–Phân tích tương quan :
• Là đolường mức độ liên kếtcủahaibiếnnhằm cho biếtmột
biếncóxuhướng thay đổinhư thế nào khi thay đổibiến còn lại.
• Không có sự phân biệtgiữa các biến; các biếncótínhchất đối
xứng.
r
xy
= r
yx
Ví dụ : mốitương quan cao giữaviệc hút thuốcvàbệnh ung thư
phổi
–Phân tích hồi qui :
Nhằm ướclượng hoặcdựđóan giá trị trung bình củabiếnphụ
thuộcdựa trên giá trị xác định củabiến độclập.
iii. tương quan:
2.2.1. Mô hình hồiquytổng thể (PRF-Public
Regression Function)
Ví dụ 2.1.
Xét mốiquanhệ giữa chi tiêu dùng hàng tuần
(Y) theo mức thu nhập(X) của 60 hộ dân tạimột
địaphương.Ta đượcsố liệuchoở bảng sau:
2.2.Mô hình hồiquytổng thể và hồiquymẫu
Bảng 2.1. Chi tiêu và thu nhậpcủahộ gia đình:
MỨC THU
NHẬP
( X )

80 100 120 140 160 180 200 220 240 260
MỨC CHI
TIÊU
( Y )
55 65 79 80 102 110 120 135 137 150
60 70 84 93 107 115 136 137 145 152
65 74 90 95 110 120 140 140 155 175
70 80 94 103 116 130 144 152 165 178
75 85 98 108 118 135 145 157 175 180
88 113 125 140 160 189 185
115 162 191

Yi
325 462 445 707 678 750 685 1043 966 1211
E(Y/Xi) 65 77 89 101 113 125 137 149 161 173
)/()(
XXYYPYX
/
YE
ij
1
ji
===

=
k
j
Vd : tính E(Y/X=100) =
6
1

88
6
1
85
6
1
80
6
1
74
6
1
70
6
1
65 +++++
E(Y/X
i
) = f(X
i
) = β
1
+ β
2
X
i
β
1
: là hệ số chặn–tungđộ gốc
β

2
: hệ số góc - hệ sốđo độ dốc đường hồi quy
Ví dụ: ở hộ gia đình có mức chi tiêu trung bình
149 ta có được thu nhập ở mức:
149 = 17 +0.6X ⇒X = 220
Mô hình hồi quy tổng thể ngẫu nhiên:
Y
i
= β
1
+ β
2
X
i
+ u
i
u
i
:sai số ngẫu nhiên củatổng thểứng vớiquansátthứ i
u
i
: đạidiệnnhững nhân tố còn lại ảnh hưởng đếnchi tiêu
Mô hình hồi quy tổng thể
 Về mặthìnhhọc, một đường hồiquytổng thể là
quỹ tích các giá trị trung bình có điềukiệncủa
biếnphụ thuộc ứng vớimỗigiátrị cốđịnh của
biếngiải thích.
 Ứng vớimỗi giá trị củaX, cómộttổng thể các giá
trị của Y, dao động xung quanh giá trị kỳ vọng có
điềukiệncủaY

Dependent Variable: CHITIEU
Method: Least Squares
Date: 09/19/10 Time: 09:08
Sample: 1 60
Included observations: 60
Variable Coefficient Std. Error t-Statistic Prob.
C 17 4.66196662984 3.64652974802 0.000570143766419
THUNHAP 0.6 0.0254913443421 23.5374012428 2.30488954789e-31
R-squared 0.9052301916
82
Mean dependent var 121.2
Adjusted R-
squared
0.9035962294
7
S.D. dependent var 36.4579163011
S.E. of regression 11.319802605
8
Akaike info criterion 7.72374945135
Sum squared resid 7432 Schwarz criterion 7.79356093675
Log likelihood -229.71248354 F-statistic 554.009257266
Durbin-Watson
stat
1.5104951560
8
Prob(F-statistic) 0
-Bỏ sót biếngiải thích.
-Saisố khi đolường biếnphụ thuộc.
-Dạng mô hình hồi quy không phù hợp.
-Cáctácđộng không tiên đoán được.

Sai số ngẫu nhiên hình thành từ nhiềunguyên
nhân:
40
60
80
100
120
140
160
50 100 150 200 250 X
Y
Y = E(Y/X
i
)
Y
i
u
i
E(Y/X
i
)=β
1

2
X
i
Y
i

1


2
Xi+u
i
Y
i
= β
1

2
X
i
Thu nhậpkhả dụng (X)
Tiêu
dùng
(Y)
β
1
β
2
Mô hình hồi quy mẫu:
Trong đó
: ướclượng cho β
1
.
: Ướclượng cho β
2
.
: Ướclượng cho E(Y/Xi)
Mô hình hồi quy mẫungẫu nhiên

ii
XY
21
ˆˆ
ˆ
ββ
+=
1
ˆ
β
2
ˆ
β
i
Y
ˆ
iii
eXY ++=
21
ˆˆ
ββ
2.2.2. Mô hình hồiquymẫu(SRF)
0
100
200
300
400
500
600
0 100 200 300 400 500 600 700 800 900

Thu nhập
Tiêu dùng
(PRF)
(SRF)
Xi
Yi
E(Y/Xi)
Yi
e
i
ε
i
β
1
β
1
β
2
β
2
β
2
Giả thiết1:
Các biếngiải thích (biến độclập) là phi ngẫu
nhiên tức là X nhận các giá trị xác định x
i
(giá trị
của chúng đượcchotrướchoặc đượcxácđịnh)
, khi đó
mớitồntạibiếnngẫu nhiên có điềukiện (Y/Xi)

và mớitồntại trung bình E(Y/Xi).
¾Từđómới xây dựng hàm hồi qui tổng thế và
biếnngẫu nhiên
.
2.3.1.Các giảđịnh củamôhìnhhồiquytuyến
tính cổđiển
Giả thiết2:
Kỳ vọng củayếutố ngẫu nhiên u
i
bằng 0, tứclà:
E[ u
i
/ X
i
] = 0 ∀i # j
•Nghĩa là E(ui/Xi) = f(Xi), hay hàm hồi qui tổng thể
đượcxácđịnh là điqua đúng các điểm trung bình có
điềukiện.
•Sự dao động ngẫunhiêntriệttiêunhauvìvậy không
tác động đếnxuthế biến động trung bình, mà xu thế
này do biến độclậpX giảithích
2.3.1.Các giảđịnh củamôhìnhhồiquytuyến
tính cổđiển
U
i
+
U
i
-
Y

X
Ảnh hưởng cân bằng củanhiễuUi
Vd : sự chênh lệch giữa
những nhóm ngườilàm
việc trong ngành ngân
hàng và ngành y có cùng
mức thu nhậpnhưng
mức tiêu dùng khác
nhau
Giả thiết2:(tt)
Giả thiết2:(tt)
Phương sai sai số ngẫunhiên(u
i
) bằng nhau (phương sai
thuầnnhất)
Var(u
i
/X
i
) = var(u
j
/X
i
) = σ
2

i,σ
2
> 0
Độ giao động phương sai là đồng nhấtgiữacácgiátrị Xi

Giả thiết3
:
Giả thiết 3 (tt):
Phương sai thuầnnhất
Trường hợpphương sai thay đổi
Các sai số ngẫunhiên(u
i
) không tương quan lẫn nhau:
Cov [u
i
,u
j
]= E(u
i
,u
j
) = 0

i # j
Khi X = X
i
, sự dao động của Y không liên quan đến
sự giao động của Y khi X = X
j
¾Nhằm đảmbảosự biến động củaY tạicácvị trí độc
lậpvới nhau và sai số ngẫu nhiên là thậtsự ngẫu
nhiên chứ không mang tính xu thế
Giả thiết4:
Giả thiết 4 (tt):
Tự tương quan củaphầndư ( nhiễu–Ui)

c) Không tương quan
b) Tương quan âm
a) Tương quan dương
Sai số ngẫu nhiên (u
i
) và các biến độclập( X
i
) không
tương quan với nhau:
Cov (u
i
,X
i
) = 0
Biến độclập X và u cùng tác dụng đếnbiếnY, làtác
động riêng lẽ không liên quan với nhau, chúng hoàn
toàn độclậpvớinhau
Giả thiết5
:
 Định lý Gauss-Markov
Vớicácgiảđịnh củamôhìnhhồiquytuyến tính
cổđiển, mô hình hồiquytuyếntínhtheophương
phápbìnhphương tốithiểu(OLS) là ướclượng
tuyến tính không thiên lệch tốtnhất
2.3.1.Các giảđịnh củamôhìnhhồi
quy tuyếntínhcổđiển
2.3.2. Phương pháp bình phương nhỏ nhất
(OLS)
iiiii
iiiii

XYY
ˆ
Ye
eY
ˆ
eXY
∧∧
∧∧
−−=−=⇔
+=++=
21
21
ββ
ββ
1
β
ˆ
Ta có hàm SRF:
•Ta muốn tìm và sao cho gầnbằng với Y
nhất, có nghĩalàΣe
i
nhỏ nhất. Tuy nhiên, Σei thường
rấtnhỏ và thậm chí bằng 0 vì chúng triệttiêulẫn
nhau.
• Để tránh tình trạng này, ta dùng phương pháp “Bình
phương nhỏ nhất”
2
ˆ
β
Y

ˆ
Cho n quan sát của2 đạilượng (Y
i
, X
i
)
Mô hình hồi quy mẫungẫu nhiên có dạng
ni ,1=
iii
eXY ++=
21
ˆˆ
ˆ
ββ
iii
YYe
ˆ
−=
0min).
ˆˆ
(
ˆ
1211111
⇔⇒+−=−= XYYYe
ββ
0).
ˆˆ
(
ˆ
2212222

⇒+−=−= XYYYe
ββ
0).
ˆˆ
(
ˆ
3213333
⇒+−=−= XYYYe
ββ
Nội dung củaphương pháp
Phương pháp OLS (tt)
()
2
21
2
∑∑
−−=
iii
X
ˆˆ
Ye
ββ
1
β
ˆ
•Bâygiờ, ta muốntìm và saochoΣe
i
2
nhỏ nhất.
•Lưuý rằng biểuthứctrêncóthểđượcxemnhư là một

hàm số theo và và chúng ta cần tìm các β sao
biểuthức đạtcựctiểu
2
β
ˆ
1
β
ˆ
2
β
ˆ
)
ˆ
,
ˆ
(fe
i 21
2
ββ

=
()
0e2X
ˆˆ
Y2
ˆ
e
n
1i
i

n
1i
i21i
1
n
1i
2
i
=−=β−β−−=
β∂







∑∑

==
=
()
0Xe2XX
ˆˆ
Y2
ˆ
e
n
1i
iii

n
1i
i21i
2
n
1i
2
i
=−=β−β−−=
β∂







∑∑

==
=
• Để tìm ∑ei2 => 0: sử dụng Phương pháp bình phương bé
nhất(OSL)
•Vậy để tìm giá trị cựctiểucủabiểuthứctrên, tacần tính
đạohàmcủahàmsố trên theo các β và cho các đạohàm=0.
Giảihệ phương trình trên, chúng ta thu được:
XY
21
ˆˆ
ββ

−=


=
=


=
n
i
i
n
i
ii
XnX
YXnXY
1
22
1
2
).(

ˆ
β
XXx
ii
−=
YYy
ii
−=



=
=

n
1i
2
i
n
1i
ii
2
x
xy
ˆ
n
Y
Y
n
X
X
i
i


=
=
Với
đặt


Phương pháp OLS (tt)
1
β
ˆ

2
β
ˆ
Đượcgọilàcácướclượng bình phương
nhỏ nhất của
β
1

β
2
Các thuộctínhcủa
1
β
ˆ

2
β
ˆ
 Các ướclượng OLS là các ướclượng điểm, có nghĩa
là, vớimẫuchotrước, mỗi ướclượng chỉ cho biếtduy
nhấtmột giá trị củathamsố củatổng thể nghiên cứu.
 Mộtkhithuđược các ướclượng từ mẫu, ta có thể vẽ
được đường hồiquymẫuvàđường này có những đặc
tính sau:

Đặc điểmcủa đường hồi quy mẫu
Đi qua giá trị trung bình
mẫucủa X và Y, do
XY
ββ
ˆˆ
21
+=
Đặc điểmcủa đường hồiquymẫu
2. Giá trịướclượng trung bình củaY bằng vớigiátrị
trung bình của Y quan sát.
3. Giá trị trung bình củasaisố e
i
bằng 0: ⎯e
i
= 0.
4. Sai số e
i
không có tương quan vớigiátrị dự báo
Y
i
.
5. Sai số e
i
không có tương quan vớiX
i
.
YY
=
ˆ

Trong đó: σ
2
= var (u
i
). Do σ
2
chưabiếtnên
dùng ướclượng củanólà(ướclượng điểm
phương sai sai số ngẫu nhiên)
Phương sai Sai số chuẩn
2
ˆˆ
2
2
2
2
ˆ
2
2
ˆˆ
1
2
2
2
2
ˆ
1
222
111
ˆˆ

)
ˆ
(
1
)
ˆ
(
ˆˆ
)
ˆ
()
ˆ
(
βββ
βββ
σσβσσβ
σσβσσβ
====
====



se
x
Var
se
xn
X
Var
i

i
i
22
ˆ
2
2

=

=

n
RSS
n
e
i
σ
2.4.1. Phương sai và sai số chuẩncủacácướclượng
2.4. Phương sai, sai số chuẩncủacácước
lượng, hệ số xác định R
2
, hệ số tương quan
 Ví dụ : chúngtacómộtTổng thể chỉ 10 người, và chiều
cao tính bằng cm của10 ngườinàylà:
 Tổng thể: 130, 189, 200, 156, 154, 160, 162, 170, 145, 140
 Như vậychiều cao trung bình củaTổng thể (chúng ta biết)
là 160.6 cm. Gọichỉ số này là μ = 160.6 cm.
 Bây giờ, giả sử chúng ta không có điềukiệnvàtàilực để
đochiềucaocủatoànbộ Tổng thể, mà chỉ có khả năng lấy
mẫu5 ngườitừ Tổng thể này để ước tính chiềucao.

 Chúngtacóthể lấy nhiềumẫungẫunhiên, mỗilần5
người:
2.4. Phương sai, sai số chuẩn
b
) Sai số chuẩn(SE)
 Lầnthứ 1: 140, 160, 200, 140, 145 x1 = 157.0
 Lầnthứ 2: 154, 170, 162, 160, 162 x2 = 161.6
 Lầnthứ 3: 145, 140, 156, 140, 156 x3 = 147.4
 Lầnthứ 4: 140, 170, 162, 170, 145 x4 = 157.4
 Lầnthứ 5: 156, 156, 170, 189, 170 x5 = 168.2
 Lầnthứ 6: 130, 170, 170, 170, 170 x6 = 162.0
 Lầnthứ 7: 156, 154, 145, 154, 189 x7 = 159.6
 Lầnthứ 8: 200, 154, 140, 170, 170 x8 = 166.8
 Lầnthứ 9: 140, 170, 145, 162, 160 x9 = 155.4
 Lầnthứ 10: 200, 200, 162, 170, 162 x10 = 178.8
n
S
SE =
Cứ mỗilầnchọnmẫu, số trung bình chiều cao ước tính khác
nhau,
và biến thiên từ 147.4 cm đến 178.8 cm (x
i
ởđây là các giá trị
trung bình). Các số trung bình này dao động chung quanh số trung
bình củatổng thể (tức là 160.6 cm).
Nếu chúng ta chọnmẫu N lần(mỗilầnvới n đốitượng), thì chúng
ta sẽ có N số trung bình khác nhau.
Sai số chuẩn SE được tính bằng công thứcsau:
2.4.2. Hệ số xác định R
2

và hệ số tương quan r
Thước đo độ phù hợpcủamôhìnhđốivới
dữ liệulàR
2
Y
Yi
Yi
Xi X
Y
SRF
ii
yYY
ˆ
ˆ
=−
iii
eYY =−
ˆ
ii
yYY =−
TSS = = ESS
=RSS
•TSS (Total Sum of Squares): Tổng bình phương
tấtcả các sai lệch giữa giá trị thựctế củaY với
giá trị trung bình củanó.
RSSESSnTSS
Y
Y
Y
Y

i
n
i
i
+=−=−=
∑∑
=
2
2
2
1
)()(
• ESS (Explained Sum of Squares-Tổng bình phương
phầngiảithích): Tổng bình phương tấtcả các sai
lệch giữagiátrị củaY đượctínhtheomôhìnhvới
giá trị trung bình của nó.
∑∑
==
=−=
n
i
n
i
i
x
Y
Y
i
ESS
1

2
2
2
1
2
)()(
ˆ
ˆ
β


=
=
−=−=−==
n
i
i
n
i
i
y
e
SST
SSE
TSS
RSS
TSS
ESS
R
1

2
1
2
2
111
• RSS (Residual Sum of Squares- Tổng bình
phương phầndư): Tổng bình phương tấtcả các
sai lệch giữagiátrị thựctế với giá trị lý thuyết
theo mô hình củaY.



==
=
2
)
ˆ
(
1
2
Y
Y
e
i
i
RSS
n
i
i
Hệ số xác định R

2
thể hiệnphầntỷ lệ biến thiên của
Y đượcgiải thích bởimối liên hệ tuyến tính củaY
theo X và đượcviết thành:
* Tính chấtcủaR
2
•0≤ R
2
≤1. VớiR
2
=0 thể hiện X và Y độclậpthống
kê. R
2
=1 thể hiện X và Y phụ thuộctuyến tính hoàn
hảo.
•R
2
không xét đếnquanhệ nhân quả.


=
=
=
n
i
i
n
i
i
y

x
R
1
2
1
22
2
2
ˆ
β
Hệ số tương quan r
2
1
2
1
2
1
)
2
))((
()
(


Σ
∑∑


−−
==

==
=
Y
Y
X
X
Y
Y
X
X
ii
i
ii
n
i
i
n
i
i
n
i
ii
i
xy
xy
r
Hệ số tương quan r đolường mức độ phụ thuộc
tuyến tính giữa2 đạilượng X và Y.
- r > 0: giữa X và Y có quan hệđồng biến
r→ ± 1: X và Y có quan hệ tuyến tính chặtchẽ

r → 0: X và Y có quan hệ tuyến tính không chặt
chẽ
r < 0: X và Y có quan hệ nghịch biến
-Hệ số tươngquancótínhchất đốixứng: r
XY
= r
YX
-r độclậpvớigốctoạđộvà các tỷ lệ. Nghĩalà: với
a, c > 0, b, d là hằng số, và:
Thì : r
XY
= r
X*Y*
dcYY
baXX
ii
ii
+=
+=
*
*
Tính chấtcủar:
- NếuX, Y độclập theo quan điểmthống kê thì hệ
số tương quan giữa chúng bằng 0.
-r chỉ là đạilượng đosự kếthợptuyến tính hay
phụ thuộctuyến tính. r không có ý nghĩa để mô
tả quan hệ phi tuyến.
2
Y,X
n

1i
2
i
n
1i
2
i
2
n
1i
ii
2
r
yx
yx
R =






=
∑∑

==
=
r
XY
= ± R

2.5. Phân bố xác suấtcủacácướclượng
)1,0(~
ˆ
),(~
ˆ
)1,0(~
ˆ
),(~
ˆ
2
2
1
1
ˆ
22
2
ˆ
22
ˆ
11
2
ˆ
11
NZN
NZN
β
β
β
β
σ

ββ
σββ
σ
ββ
σββ

=⇒

=⇒
N (0, σ
2
),
Giả thiết6
: u
i
có phân phốichuẩn
Vớicácgiả thiết nêu trên, các ướclượng có
các tính chấtsau:
- Chúng là các ướclượng không chệch
-Cóphương sai cựctiểu
-Khisố quan sát đủ lớnthìcácướclượng này xấpxỉ
với giá trị thựccủa phân phối
σ
ββ
ˆ
,
ˆ
,
ˆ
2

21
Ướclượng khoảng cho hệ số hồiquyvớimứcý
nghĩa α (độ tin cậy1-α) như sau. Để xác suấtmà
giá trịđúng củathamsố cần ướclượng nằmtrong
khoảng (1-α)
)
ˆ
(
)2/,2( ini
SEt
βε
α

=
)
ˆ
;
ˆ
(
iiiii
εβεββ
+−∈
2.6. Khoảng tin cậycủa các tham số
Với
αεβεβ
β
−=+≤≤− 1)
ˆˆ
(
ii

i
ii
P
ii
εβ

ˆ
: giớihạntin cậydưới
ii
εβ
+
ˆ
: giớihạntin cậytrên
ε : độ chính xác của ướclượng (ε > 0)
Có 3 cách để kiểm định giả thiết:
Cách 1:
Kiểm định t:
Quy tắcquyết định
Nếu thì bác bỏ H
0
.
Nếu thì ta không thể bác bỏ H
0
.
*
21
*
20
2
2

:
:
ββ
ββ

=
H
H
)
ˆ
(
ˆ
2
*
22
β
ββ
SE
t

=
)2/,2(
α

>
n
tt
)2/,2(
α



n
tt
2.7. Kiểm định giả thiếtvề hệ số hồiquy
* Để tìm giá trị t
α/2, n-2
, sử dụng hàm TINV(α/2, n-2)
Vớilà1 giátr
ị nào đó
β
2
-4 -3 -2 -1 0 1 2 3 4
t
f(t)
α/2
α/2
-t
α/2
t
α/2
Giả sử ta tìm được khoảng tin cậycủa βi là:
vớimứcý nghĩa α trùng vớimức ý nghĩacủagtH
0
Quy tắcquyết định
-NếuchấpnhậnH
0
-Nếubácbỏ H
0
)
ˆ

;
ˆ
(
iiiii
εβεββ
+−∈ )
ˆ
( *
)2/,2( ini
set
βε
α

=
)
ˆ
;
ˆ
(
*
iiiii
εβεββ
+−∈
)
ˆ
;
ˆ
(
*
iiiii

εβεββ
+−∉
Cách 2: Phương pháp khoảng tin cậy
Với
Tính
Quy tắcquyết định
- Nếup ≤ α : Bác bỏ H
0
-Nếup > α: ChấpnhậnH
0
(Phương pháp này thường dùng khi tiến hành trên máy vi
tính)
)
ˆ
(
ˆ
*
i
ii
i
se
t
β
ββ

=
ptTP
i
=> )(
Cách 3: Phương pháp P-value

Vd nếu α = 0,05 = 5%, ta đọc“xácsuất để khoảng
tin cậychứagiátrị thựccủa
β
i
là 95%.
1)Kiểm định sự phù hợpcủamôhình
Kiểm định giả thiếtH
0
: R
2
= 0 vớimức ý nghĩa α
hay độ tin cậy1 -α
Xét thống kê
Quy tắcquyết định
-NếuF > F
α
(k-1,n-k): Bác bỏ H
0
-NếuF ≤ F
α
(k-1,n-k): ChấpnhậnH
0
2
2
1
)2(
R
nR
F



=
2.8. Kiểm định sự phù hợpcủamôhình–Dự
báo
Tra bảng Fα(n
1
, n
2
) để tìm giá trị F. trong đón
1
= k-1,
n
2
= n-k, vớik làtổng số biến trong mô hình
Miềnbácbỏ
Miềnchấpnhận
F
α=0,05
F
α
(k-1,n-k)
Thống kê F
* Sử dụng hàm FINV(p,n
1
,n
2
)
trong Exel để tính giá trị F
2)Dự báo
Cho trước giá trị Xi = X

0
, hãy dự báo giá trị trung
bình và giá trị cá biệtcủaY vớimức ý nghĩa α
hay độ tin cậy1 -α.
* Dự báo điểm
ii
XY
21
ˆˆ
ˆ
ββ
+=
0210
ˆˆ
ˆ
XY
ββ
+=
2.8. Kiểm định sự phù hợpcủamôhình–Dự
báo (tt)
* Dự báo giá trị trung bình củaY
)
ˆ
;
ˆ
()/(
00000
εε
+−∈ YYXYE
)2/,2(00

)
ˆ
(
α
ε

=
n
tYse
)
ˆ
()
ˆ
(
00
YVarYse =
Với:
)
)(
1
(
ˆ
)
ˆ
(
2
2
0
2
0



+=
ì
x
XX
n
YVar
σ
* Dự báo giá trị cá biệtcủaY
Với:
)
ˆ
;
ˆ
(
'
00
'
000
εε
+−∈ YYY
)2/,2(00
'
0
)
ˆ
(
α
ε


−=
n
tYYse
)
ˆ
()
ˆ
(
0000
YYVarYYse −=−
)
)(
1
1(
ˆ
)
ˆ
(
2
2
0
2
00


++=−
ì
x
XX

n
YYVar
σ
Ví dụ :
THU NHẬP (Xi) 31 31 30 35 35 40 38 37 39 36
CHI TIÊU (Yi) 25 26 25 29 29 33 31 30 32 29
ββ
ˆˆ
21
,
Quan sát về thu nhập(X –USD/tuần) và chi tiêu (Y – USD/tuần
của 10 hộ gia đình ở một khu vựccósố liệunhư sau :
Dựavàobảng số liệutrên, anh(chị) hãy tính :
•Cáchệ số hồi qui
•Viếtphương trình hồi qui chi tiêu theo thu nhậpcủa 10 hộ dân
trên
• Hãy tính các hệ số : RSS, ESS, TSS, R
2
,
•Kiểm định β
2
, kiểm định F
σ
ˆ
2
Giải
Dependent Variable: Y
Method: Least Squares
Date: 03/28/11 Time: 20:11
Sample: 1 10

Included observations: 10
Variable Coefficient Std. Error t-Statistic Prob.
X 0.790323 0.036563 21.61531 0.0000
C 1.080645 1.292804 0.835893 0.4275
R-squared 0.983166 Mean dependent var 28.90000
Adjusted R-squared 0.981061 S.D. dependent var 2.806738
S.E. of regression 0.386256 Akaike info criterion 1.112223
Sum squared resid 1.193548 Schwarz criterion 1.172740
Log likelihood -3.561113 F-statistic 467.2216
Durbin-Watson stat 1.541630 Prob(F-statistic) 0.000000

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×