29/05/2017
PHÂN TÍCH TƯƠNG QUAN
CHƯƠNG 5c
HỒI QUI VÀ TƯƠNG
QUAN
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
• Correlation Analysis
• Dùng để đo độ mạnh của mối quan hệ tuyến
tính giữa hai biến ngẫu nhiên
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Hiệp phương sai (Covariance)
Hệ số tương quan
• Cho hai biến ngẫu nhiên X và Y. Hiệp phương sai
của X và Y, ký hiệu cov(X,Y), là kỳ vọng toán của
tích các sai lệch của các bnn đó và kỳ vọng toán
của chúng.
• Hệ số tương quan của hai biến ngẫu nhiên X, Y
ký hiệu và định nghĩa bởi công thức:
X ,Y
cov X , Y E X - X Y - Y
cov X , Y
XY
• Với hai biến ngẫu nhiên bất kỳ:
cov X , Y E XY - X Y
3
Nguyễn
Văn Tiến
Bài giảng Toán Cao cấp 1
-1 X ,Y 1
4
Nguyễn
Văn Tiến
Bài giảng Toán Cao cấp 1
Hệ số tương quan mẫu
Ví dụ
• Với mẫu ngẫu nhiên cỡ n: (Xi, Yi) i=1,2,…,n. Hệ
số tương quan mẫu ký hiệu là rX,Y được xác định
n
như sau:
• Số liệu về thời gian quảng cáo trên truyền hình
và lượng sản phẩm tiêu thụ ở một công ty sản
xuất đồ chơi trẻ em như sau:
x - x y - y
i
rX ,Y
i
i 1
n
n
2
x - x . y - y
i
2
i
i 1
i 1
n
x y - n.x. y
i
rX ,Y
Bài giảng Toán Cao cấp 1
Thời gian
28 37 44 36 47 35 26 29 33 32 31 28
Lượng tiêu thụ 41 32 49 42 38 33 27 24 35 30 34 25
i
i 1
n
2
2
n 2
2
xi - nx . yi - n y
i 1
i 1
Nguyễn Văn Tiến
• Thời gian: phút/tuần
• Lượng tiêu thụ: 1000sp/tuần
• Hãy tính hệ số tương quan mẫu và cho kết luận
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
1
29/05/2017
Ví dụ
Đánh giá hiệp phương sai
• Đáp số: r=0,63882
• Kết luận: mối liên hệ tương quan giữa thời gian
quảng cáo và số sản phẩm tiêu thụ được là
tương quan thuận, ở mức trung bình.
• Cov(X,Y)>0: X và Y có xu hướng thay đổi cùng
chiều
• Cov(X,Y)<0: X và Y có xu hướng thay đổi ngược
chiều
• Cov(X,Y)=0: X và Y độc lập (tuyến tính)
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Đánh giá hệ số tương quan
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Đánh giá hệ số tương quan
• Miền giá trị: -1 rX ,Y 1
• Nếu -1 rX ,Y 0 thì tương quan âm. rXY càng
gần -1 thì mối liên hệ tuyến tính nghịch giữa X,
Y càng mạnh
• Nếu 0 rX ,Y 1 thì tương quan dương. rXY càng
gần -1 thì mối liên hệ tuyến tính thuận giữa X, Y
càng mạnh
• rXY càng gần 0 thì quan hệ tuyến tính càng yếu.
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Kiểm định giả thuyết cho hệ số tương quan
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Kiểm định hệ số tương quan
• Ta cần kiểm định giả thuyết H0: không có mối
quan hệ tuyến tính giữa X và Y
H0 : 0
• Ta có:
• Ta có các bài toán:
• Tiêu chuẩn kiểm định:
• Với mức ý nghĩa
H 0 : 0
H1 : 0
a
H 0 : 0
H1 : 0
H0 : 0
H1 : 0
b
c
cho trước.
n-2
T r
~ t n - 2
1- r2
• T có phân phối Student (n-2) bậc tự do
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
2
29/05/2017
Miền bác bỏ
Các bước kiểm định
• Phát biểu giả thuyết H0 và đối thuyết H1
• Xác định mức ý nghĩa
• Tính giá trị kiểm định
Tqs r
n-2
1- r2
• So sánh với miền bác bỏ
• Kết luận bác bỏ/không bác bỏ H0
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Đối thuyết
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
p 2 P T Tqs
≠0
1:
>0
T ta n -1
p P T Tqs
1:
<0
T -ta n -1
p P T Tqs
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Ví dụ
• Công ty dầu ăn Tường An đang xem xét việc giảm
giá bán sản phẩm (bình 5 lít) để tăng lượng hàng
bán ra đồng thời quảng bá sản phẩm của mình đến
khách hàng. Người quản lý của công ty muốn tính
toán xem nếu sản phẩm này được giảm giá 1000
đ/l thì lượng hàng bán ra trung bình sẽ thay đổi
như thế nào.
• Nếu như giảm giá 1000 đ mà lượng hàng bán thêm
được nhiều hơn 50.000 sản phẩm thì công ty sẽ
tiến hành một chiến dịch khuyến mại trong một
tháng với mức giảm giá 10.000 đ/l
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Câu hỏi
Ví dụ
• Để tiến hành nghiên cứu này, phòng marketing của
công ty đã dựa vào số liệu bán hàng trong 15 tháng
qua (n=15 quan sát) để thu thập số liệu về giá bán P và
lượng bán Q.
• Sau khi tiến hành thống kê mô tả, nghiên cứu viên đã
quyết định dùng hàm cầu dạng tuyến tính để xem xét
ảnh hưởng của giá đến lượng bán.
Q i 0 1Pi i
• Dùng số liệu của mẫu ta được hàm hồi qui mẫu dạng:
Q i 6227 30, 43Pi
Bài giảng Toán Cao cấp 1
T ta n/ -21
P_value
1:
Phân tích hồi quy
• Phân tích hồi quy là tìm quan hệ phụ thuộc của một
biến, được gọi là biến phụ thuộc vào một hoặc nhiều
biến khác, được gọi là biến độc lập nhằm mục đích
ước lượng hoặc tiên đoán giá trị kỳ vọng của biến phụ
thuộc khi biết trước giá trị của biến độc lập.
• Một số tên gọi khác của biến phụ thuộc và biến độc
lập như sau:
• Biến phụ thuộc: biến được giải thích, biến được dự
báo, biến được hồi quy, biến phản ứng, biến nội sinh.
• Biến độc lập: biến giải thích, biến dự báo, biến hồi
quy, biến tác nhân hay biến kiểm soát, biến ngoại sinh.
Miền bác bỏ
Nguyễn Văn Tiến
• Khi giá giảm 1 đơn vị thì lượng bán hàng thay
đổi như thế nào?
• Khi giá giảm 1000 đ/l thì lượng bán ra có lớn
hơn được 50.000 sản phẩm như công ty mong
muốn không
• Giá bán quyết định bao nhiêu % trong thay đổi
lượng bán
• Nếu giá bán là 150.000 đồng/bình thì lượng
bán dự báo là bao nhiêu
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
3
29/05/2017
Phân tích hồi quy
Hàm hồi quy tổng thể
• Phân tích hồi quy được sử dụng để xác định
mối liên hệ giữa:
• Hàm hồi quy tổng thể
– Một biến phụ thuộc Y (biến được giải thích)
– Một hay nhiều biến độc lập X1, X2, …,Xn (còn được
gọi là biến giải thích)
Y
• Biến phụ thuộc Y phải là biến liên tục
• Các biến độc lập X1, X2, …, Xn có thể là biến liên
tục, rời rạc hay phân loại.
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
E Y | X X i 1 2 X
• Đối với một quan sát cụ thể ta có:
Yi 1 2 X i i
• Mô hình chỉ có một biến phụ thuộc Y và một biến giải
thích X.
•
và
gọi là hệ số chặn (intercept) và hệ số góc
(slope) của đường thẳng hồi quy.
Bài giảng Toán Cao cấp 1
Đường hồi quy tổng thể
Tiêu dùng, Y (XD)
Hàm hồi quy tổng thể
Y= b1b2Xi
Yi= b1 + b2Xi + i
500
i
E(Y/Xi)= b1 + b2Xi
400
300
b2
200
100
• Ta ít khi có số liệu của cả tổng thể mà chỉ có số
liệu của mẫu (số liệu quan sát được)
• Ta dùng số liệu mẫu để ước lượng tổng thể
• Hàm hồi quy mẫu:
Yi 1 2 X i
Yi
Y = E(Y/Xi)
• Đối với quan sát thứ i:
b1
0
0
Nguyễn Văn Tiến
Hàm hồi quy mẫu SRF
700
600
1 2 X
100
200
300
400
500
Xi
600
700
800
Y i 1 2 X i e i
900
Thu nhập khả dụng, X (XD)
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
PRF và SRF
PRF và SRF
Trong đó
SRF
Y
bˆ 2
PRF
b2
b1
Nguyễn Văn Tiến
•
là ước lượng cho b1.
•
là ước lượng cho b2.
•
là ước lượng cho Y hay E(Y|Xi)
•
bˆ1
X
Ta sử dụng phương pháp bình phương nhỏ
nhất thông thường (OLS) để tìm ;
Hệ số hồi quy trong hàm hồi quy PRF và SRF
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
23
Bài giảng Toán Cao cấp 1
24
Nguyễn Văn Tiến
4
29/05/2017
Phương pháp OLS
Phương pháp OLS
• Từ hàm hồi quy mẫu ta có:
ei y i
y i y i 1 2x i
n
e
i 1
2
i
y
n
i 1
i
1 2x i
2
SSE
2 y i 1 2x i 0
i 1
1
n
SSE
2 y i 1 2x i x i 0
i 1
2
n
• Tổng bình phương sai số (Sum of squares for Errors
– SSE) hay tổng bình phương thặng dư cho n điểm
dữ liệu :
SSE
; ta có:
• Ta lấy đạo hàm theo biến
• Nội dung của phương pháp bình phương bé nhất là
tìm các ước lượng sao cho SSE đạt giá trị bé nhất.
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Phương pháp OLS
Phương pháp OLS
• Ta được hệ phương trình sau:
• Để thuận tiện ta ký hiệu như sau:
n
n
n
y i 1 2x i 0
y i n 1 2 x i 0
i 1
i 1
i n 1
n
n
n
2
y i 1 2x i x i 0
x iy i 1 x i 2 x i 0
i 1
i 1
i 1
i 1
x 2 .y x .xy
1
2
ny n n x 0
x y
x2 x
1
2
2
1
n .xy n 1 x n 2 x 2 0
x 2 x 2 xy
xy x .y
1
2
2
x2 x
2
S xx
S xy
n
Nguyễn Văn Tiến
n
x i
i 1
2
xi x xi
n
i 1
i 1
x
i 1
i
x
y
4
6
2
9
i 1
S
2 xy
S xx
i
i
n
1 y 2x
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
5
5
5
4
7
2
• Ta lập bảng sau:
Stt
1
2
3
4
5
6
sum
• Ta có:
Bài giảng Toán Cao cấp 1
xy
y
n
n
x i y i
i 1
i 1
Ví dụ
• Quan sát sự biến động của nhu cầu gạo Y
(tấn/tháng) vào đơn giá X (ngàn đồng/kg) ta
được các số liệu cho ở bảng. Hãy lập mô hình
hôi quy mẫu biễu diễn mối phụ thuộc về nhu
cầu vào đơn giá gạo
1
10
i
n
• Ta có:
Ví dụ
Xi
Yi
n
n
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Xi
1
4
2
5
5
7
24
Yi
10
6
9
5
4
2
36
X
XiYi
10
24
18
25
20
14
111
X^2
1
16
4
25
25
49
120
24
36
4 Y 6
6
6
Nguyễn Văn Tiến
5
29/05/2017
Ví dụ
Ví dụ
• Nhận xét: Yˆi 11,5 - 1,375 . X i
• X và Y có quan hệ nghịch biến
• Ta có:
n
bˆ2
Y X
i
i
- n. X .Y
i 1
n
X
2
i
- n.( X )
2
111 - 6.4.6
-1,375
120 - 6.(4)2
i 1
bˆ1 Y - bˆ2 X 6 - (-1,375).4 11,5
= 11,5 nên nhu cầu tối đa là 11,5 tấn/tháng
•
= −1,375 nên khi giá tăng 1000 đồng/kg thì
nhu cầu trung bình sẽ giảm 1,375 tấn/tháng với
các yếu tố khác trên thị trường không đổi.
Yˆi 11,5 - 1,375 . X i
Bài giảng Toán Cao cấp 1
•
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Giải hồi quy bằng máy tính
Bài tập 1
1. Bật tần số: Shift+Mode+↓ +4+1 (Freq On
2. Chọn Mode Regression: Mode+3+2(chọn
A+Bx)
3. Nhập dữ liệu theo cột
4. Kiểm tra và nhấn AC thoát
5. Xem kết quả: Shift +1+ 3,4,5 (tùy theo Sum,
Var hay Reg)
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Thu thập số liệu về điểm học tập của học sinh và
mức thu nhập hàng năm của bố mẹ ta có bảng số
liệu sau:
Xi 45 60 30
90 75 45 105 60
Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5
Hãy tìm hàm hồi quy mẫu và tính các đặc trưng
của nó
Xi: thu nhập (triệu/năm)
Yi: điểm trung bình
33
Bài giảng Toán Cao cấp 1
• Các ước lượng ; tìm được gọi là các ước
lượng bình phương tối thiểu
• Đường thẳng
= +
gọi là các ước
lượng bình phương tối thiểu.
• Gọi giá trị quan sát trung bình của y và trung
bình của x là:
y, x
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Nguyễn Văn Tiến
34
Ước lượng OLS
Ước lượng OLS
• Ứng với xi ta gọi yi là giá trị quan sát thực tế và
•
là giá trị ước lượng theo đường hồi quy mẫu
Nguyễn Văn Tiến
• Từ hàm hồi quy mẫu: Y i 1 2 X i e i
• Đặt:
Y i 1 2 X i
Ta có:
ei y i
y i y i 1 2x i
ei là sự khác biệt giữa giá trị thực tế yi
và giá trị dự đoán theo phương trình hồi quy
tuyến tính SRF
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
6
29/05/2017
Ước lượng OLS
Tính chất đường hồi quy mẫu SRF
• Một số tính chất:
• A) Tổng bình phương sai số đạt giá trị nhỏ nhất
• Ứng với một mẫu cho trước thì các hệ số
; được xác định duy nhất
• Đường hồi quy mẫu SRF đi qua điểm có tọa độ
giá trị trung bình x ; y
• Giá trị trung bình của các ước lượng bằng giá
trị trung bình các quan sát
y
n
SSE
i 1
i
2
yi
• B) Tổng các giá trị thặng dư triệt tiêu.
SE
y
n
i 1
i
yi
n
e
i 1
i
0
• SE: Sum of Errors
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
n
e
i 1
• Các phần dư ei và
i
0
e i .Yi 0
i 1
i 1
i
Nguyễn Văn Tiến
Các tổng bình phương độ lệch
y y y y y
y
i
y y i y yi yi
n
2
i 1
n
2
i
i
i 1
i 1
y
n
• Mà
n
i
• Ta có:
n
không tương quan
n
1
Y n Y
Bài giảng Toán Cao cấp 1
Tính chất đường hồi quy mẫu SRF
• Giá trị trung bình của các phần dư ei bằng 0
n
1
n
i
y
i 1
yi
i
2 y y y
n
2
i
i 1
i
yi
y y 0
i
i
i 1
• Các phần dư ei và Xi không tương quan
e .X
i
i 1
y
0
i
Bài giảng Toán Cao cấp 1
i 1
Nguyễn Văn Tiến
Đo sự biến thiên của dữ liệu a
• Tổng bình phương toàn phần (Total Sum of Squares)
TSS
n
y
i 1
i
yi
i 1
n
i 1
Bài giảng Toán Cao cấp 1
2
y
n
i
i
yi
2
y
n
i 1
i
yi
2
Nguyễn Văn Tiến
• Tổng bình phương toàn phần (Total Sum of Squares)
SST
n
y
i 1
i
yi
2
• Explained Sum of Squares - Bình phương sai số được
giải thích
n
2
SSE y i y i
• Tổng bình phương sai số (Residual Sum of Squares)
2
Nguyễn Văn Tiến
y
i 1
i 1
• Tổng bình phương sai số (Error Sum of Squares)
y
y
Đo sự biến thiên của dữ liệu b
i
Bài giảng Toán Cao cấp 1
2
• Tổng bình phương hồi quy (Regression Sum of
Squares)
n
2
RSS y i y i
ESS
• Nên ta có:
n
n
SSR
y
n
i 1
Bài giảng Toán Cao cấp 1
i
yi
2
Nguyễn Văn Tiến
7
29/05/2017
Ý nghĩa các độ đo
Tính các độ đo
• SST: đo sự biến thiên của các giá trị
xung
quanh giá trị trung tâm của dữ liệu
• SSR: giải thích sự biến thiên liên quan đến mối
quan hệ tuyến tính của X và Y
• SSE: giải thích sự biến thiên của các nhân tố
khác (không liên quan đến mối quan hệ tuyến
tính của X và Y)
• Ta có:
SST
n
y
i 1
SSR
i
2
yi
y
n
2
2 xi x
yi
i
i 1
SSE
y
n
i 1
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
y y
i
2
i
2
2 x i x
yi
2
n
e
SSE
Y
2 S2
2 X2
SY
S
2
Y
y
i 1
i
y
n 1
n
2
;S
2
X
x
i 1
2
2
i
i 1
y
n
i 1
i
yi
2
SRF
Yˆi
Tổng chênh lệch
SSE
SST
i
x
2
n
y
i 1
SSR
n
2
i
Nguyễn Văn Tiến
2
x
2
Các tổng bình phương độ lệch
• Ta có:
x
2
Bài giảng Toán Cao cấp 1
Tính các độ đo
2
SSR
R2
2
SST
i
e
Yi
SSR
Xi
yi
y
n
i
i 1
n 1
i
2
yi
2
X
Ý nghĩa hình học của SST, SSR và SSE
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
46
Hệ số xác định
Hệ số xác định
• Coefficient of determination
• Là tỷ lệ của tổng sự biến thiên trong biến phụ
thuộc gây ra bởi sự biến thiên của các biến độc
lập (biến giải thích) so với tổng sự biến thiên
toàn phần.
• Tên gọi: R_bình phương (R squared)
• Ký hiệu:
SSR
2
• Hệ số xác định của một mô hình hồi quy cho
phép ta đánh giá mô hình tìm được có giải thích
tốt cho mối liên hệ giữa biến phụ thuộc Y và
biến độc lập X hay không
R
• Dễ thấy:
Bài giảng Toán Cao cấp 1
SST
0 R2 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
8
29/05/2017
Hệ số xác định điều chỉnhR2
Tính chất của hệ số xác định R2
•
0≤ R2≤1
•
Cho biết % sự biến động của Y được giải thích bởi
các biến số X trong mô hình.
•
R2 =1: đường hồi quy phù hợp hoàn hảo
•
R2
2
R 1- (1 - R2 )
• Khi k > 1, R2 < R2.
=0: X và Y không có quan hệ
• Do vậy, khi số biến X tăng,R2 sẽ tăng ít hơn R2.
• Nhược điểm: R2 tăng khi số biến X đưa vào mô hình
tăng, dù biến đưa vào không có ý nghĩa.
• Khi đưa thêm biến vào mô hình mà làm choR2
tăng thì nên đưa biến vào và ngược lại.
• => Sử dụng R2 điều chỉnh (adjusted R2 -R2) để quyết
định đưa thêm biến vào mô hình.
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
49
Bài giảng Toán Cao cấp 1
Hệ số xác định
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Hệ số xác định
n -1
n-k
Nguyễn Văn Tiến
50
Hệ số xác định
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Các giả thiết của phương pháp OLS
• Giả thiết 1: Các giá trị Xi được xác định trước và không
phải là đại lượng ngẫu nhiên.
• VD: Mẫu 1
Mẫu 2
Chi tiêu Y
70
65
90
95
110
115
120
140
155
150
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Thu nhập X
80
100
120
140
160
180
200
220
240
260
Chi tiêu Y
55
88
90
80
118
120
145
135
145
175
Thu nhập X
80
100
120
140
160
180
200
220
240
260
Nguyễn Văn Tiến
54
9
29/05/2017
Các giả thiết của phương pháp OLS
Các giả thiết của phương pháp OLS
• Giả thiết 2: Kỳ vọng hoặc trung bình số học của
các sai số là bằng 0 (zero conditional mean),
nghĩa là E
=0
• Giả thiết 3: Các sai số có phương sai bằng nhau
(homoscedasticity).
V
Bài giảng Toán Cao cấp 1
= σ2
Nguyễn Văn Tiến
55
Phương
sai sai số
đồng
nhất
Bài giảng Toán Cao cấp 1
Các giả thiết của phương pháp OLS
Nguyễn Văn Tiến
56
Các giả thiết của phương pháp OLS
•
Giả thiết 4: Các sai số
không có sự tương
quan, nghĩa là
Cov( , ) = E(
) = 0, nếu i j
Phương sai sai số không đồng nhất:
var(Ui|Xi) = i2
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
57
Các giả thiết của phương pháp OLS
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Sai số chuẩn của các ước lượng OLS
• Giả thiết 5: Các sai số độc lập với biến giải
thích.
Cov( , Xi) = 0
• Giả thiết 6: Đại lượng sai số ngẫu nhiên có phân
phối chuẩn ~ N(0, σ2 )
• Các nhiễu (sai số)
sai:
2
Nguyễn Văn Tiến
59
của tổng thể có phương
V i
• Trong thực tế ta không biết được giá trị này nên
ta ước lượng bằng ước lượng không chệch của
mẫu:
ˆ
Bài giảng Toán Cao cấp 1
58
Bài giảng Toán Cao cấp 1
2
2
i
e
n-2
SSE
n-2
Nguyễn Văn Tiến
10
29/05/2017
Tính chất của các ước lượng OLS
Sai số chuẩn của các ước lượng OLS
;
ˆ
Sai số chuẩn của hồi quy: là
độ lệch tiêu chuẩn các giá trị
Y quanh đường hồi quy mẫu
2
i
e
n-2
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
; được xác định một cách duy nhất với n
cặp giá trị quan sát (Xi , Yi)
•
; là các đại lượng ngẫu nhiên, với các mẫu
khác nhau, giá trị của chúng sẽ khác nhau
• Ta đo lường độ chính xác các ước lượng bằng sai
số chuẩn (standard error – se).
•
61
Bài giảng Toán Cao cấp 1
Tính chất của các ước lượng OLS
;
có phân phối chuẩn.
• B) Kỳ vọng và phương sai của
E 1 1
E 2 2
Bài giảng Toán Cao cấp 1
bˆ1
;
lần lượt là:
2
x
1
2
V 1
n
S xx
2
V 2
S xx
Nguyễn Văn Tiến
62
Sai số chuẩn của các ước lượng OLS
• Ta có:
• A)
là ước lượng điểm của ; tìm được
bằng phương pháp OLS có tính chất:
bˆ2
2
x 2
1
V b
1
n S xx
2
V b
2
Sxx
SSE / n - 2
SE(bˆ2 )
Sxx
V: phương sai
Nguyễn Văn Tiến
SE: UL sai số chuẩn
Bài giảng Toán Cao cấp 1
Định lý Gauss-Markov
2
SSE 1 x
.
n - 2 n Sxx
SE(bˆ1)
Nguyễn Văn Tiến
64
Định lý Gauss-Markov
• Một ước lượng được gọi là “ước lượng không chệch
tuyến tính tốt nhất” (BLUE) nếu thỏa các điều kiện:
– Nó là tuyến tính, có nghĩa là một hàm tuyến tính
của một biến ngẫu nhiên,
• Định lý: Với những giả thiết (từ 1 đến 5) của mô
hình hồi quy tuyến tính cổ điển, mô hình hồi quy
tuyến tính theo phương pháp bình phương tối
thiểu là ước lượng tuyến tính không chệch tốt
nhất, tức là, chúng là BLUE.
n
bˆ j kiYi
– Nó không chệch,
i 1
– Nó có phương sai nhỏ nhất, hay còn gọi là ước
lượng hiệu quả (efficient estimator).
E ( bˆ ) b
var( bˆ ) min
j
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
65
Bài giảng Toán Cao cấp 1
j
j
Nguyễn Văn Tiến
66
11
29/05/2017
Phân phối của các ước lượng OLS
Phân phối của các ước lượng OLS
• Ta có:
• Tương tự ta có:
2
2
Z 2 2
2 ~ N 2 ;
N 0;1
S xx
2
S xx
SSE
2
n 2
2
t
2
2 2
Z2
SSE
/ n 2
2
~ t n 2
t
1
~ t n 2
SSE / n 2
1 1
2
x
SSE 1
.
n 2 n S xx
~ t n 2
S xx
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Khoảng tin cậy của hệ số hồi quy b1 , b2
Bài toán: Tìm khoảng ( − ;
Khoảng tin cậy của hệ số hồi quy b1
Khoảng tin cậy của hệ số b1
+ ) sao cho
xác suất của khoảng ( − ;
trị thực của bi là 1 - a hay:
+ ) chứa giá
1
1 ; 1 1
1 t /2 n 2 .
i ta /2 n - 2 .SE b i
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
69
Bài giảng Toán Cao cấp 1
Khoảng tin cậy của hệ số b2
2
2 ; 2 2
Bài giảng Toán Cao cấp 1
SSE
Nguyễn Văn Tiến
70
( − ; + ): là khoảng tin cậy
i : độ chính xác của ước lượng
1 - a: hệ số tin cậy,
a với (0 < a < 1): là mức ý nghĩa.
ta/2(n-2): giá trị tới hạn (tìm bằng cách tra bảng số
t-student)
• n: số quan sát
• Ví dụ: nếu a = 0,05 = 5%, ta đọc “xác suất để khoảng
tin cậy chứa giá trị thực của b1 , b2 là 95%.
n 2
•
•
•
•
•
Trong đó:
2 t /2 n 2 .
2
x
SSE 1
.
n 2 n S xx
Khoảng tin cậy của hệ số hồi quy b1 , b2
Khoảng tin cậy của hệ số hồi quy b2
Trong đó:
- b b
1-a
Pb
i
i
i
i
i
Với:
Nguyễn Văn Tiến
.
1
S xx
Nguyễn Văn Tiến
71
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
72
12
29/05/2017
Khoảng tin cậy của hệ số hồi quy σ2
Khoảng tin cậy của hệ số hồi quy σ2
• Phân phối xác suất của SSE:
• Khoảng tin cậy của phương sai sai số tổng thể:
SSE
2
~ 2 n - 2
SSE
SSE
; 2
2
n
2
n
2
1-a /2
a /2
SSE
P 12-a /2 n - 2 2 a2/2 n - 2 1 - a
SSE
SSE
P 2
2 2
1-a
n
2
n
2
1-a /2
a /2
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Ví dụ
Ví dụ
Thu thập số liệu về điểm học tập của học sinh và
mức thu nhập hàng năm của bố mẹ ta có bảng số
liệu sau:
• Tìm khoảng ước lượng cho các hệ số hồi quy
với độ tin cậy 95%
• Với mức ý nghĩa 5% có thể kết luận thu nhập
của bố mẹ có ảnh hưởng đến kết quả học tập
của con cái không
• Tính SSE, SST
Xi 45 60 30
90 75 45 105 60
Yi 8,75 7,5 6,25 8,75 7,5 5,0 9,5 6,5
Hãy tìm hàm hồi quy mẫu và tính các đặc trưng
của nó
Xi: thu nhập (triệu/năm)
Yi: điểm trung bình
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
75
KIỂM ĐỊNH GIẢ THUYẾT
•
•
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
KIỂM ĐỊNH GIẢ THUYẾT
1. Kiểm định giả thuyết về hệ số hồi quy
Do ei theo phân phối chuẩn, các ước lượng
OLS của b1 và b2 cũng theo phân phối chuẩn vì
chúng là các hàm số tuyến tính của ei.
Chúng ta có thể áp dụng các kiểm định t, F, và
2 để kiểm định các giả thuyết về các ước
lượng OLS.
Hai phía:
H 0 : b i b i*
H1 : b i b i*
Phía phải:
H 0 : bi bi*
H1 : b i b i*
Phía trái:
H 0 : bi b i*
H1 : b i bi*
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
77
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
78
13
29/05/2017
Kiểm định giả thuyết về hệ số hồi quy
Kiểm định giả thuyết về hệ số hồi quy
H 0 : b i b i* ; H 1 : b i b i*
f(t)
Cách 1: Phương pháp giá trị tới hạn
Bước 1: Tính t
bˆ i - b i*
t
SE ( bˆ i )
Bước 2: Tra bảng t-student để có
Bước 3: Quy tắc quyết định
ta / 2 n - 2
Nếu
t ta /2 n - 2
bác bỏ H0.
Nếu
t ta /2 n - 2
chấp nhận H0.
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
1-a
a/2
Miền bác bỏ Ho
a/2
1
2
Nguyễn Văn Tiến
Bước 2: Tính
3
4
80
bi - bi
SE ( bˆ i )
P (T t i ) p
Bước 3: Quy tắc quyết định
- Nếu p ≤ a: Bác bỏ H0
- Nếu p > a: Chấp nhận H0
Bài giảng Toán Cao cấp 1
81
Kiểm định giả thuyết về hệ số hồi quy
Nguyễn Văn Tiến
82
Kiểm định giả thuyết về hệ số hồi quy
Thực tế
H0 đúng
H0 sai
Quyết định
Không bác Quyết định đúng, Quyết định sai, xác
bỏ
xác suất 1-α suất β (Sai lầm loại 2)
Loại GT
Hai phía
Phía phải
Phía trái
Quyết định sai, Quyết định đúng, xác
xác suất α
suất 1-β
(Sai lầm loại 1)
Nguyễn Văn Tiến
0
t
ti
Quy tắc quyết định
- Nếu bi* (bˆi - i ; bˆi i ) chấp nhận H0
*
- Nếu bi (bˆi - i ; bˆi i ) bác bỏ H0
Bài giảng Toán Cao cấp 1
t
-1
Cách 3: Phương pháp p-value
Bước 1: Tính
*
ˆ
với mức ý nghĩa a trùng với mức ý nghĩa
của H0
Bác bỏ
-2
Kiểm định giả thuyết về hệ số hồi quy
i ta /2 n - 2 .SE(bˆi )
Nguyễn Văn Tiến
-3
Bài giảng Toán Cao cấp 1
79
Cách 2: Phương pháp khoảng tin cậy
Khoảng tin cậy của bi:
Bài giảng Toán Cao cấp 1
a/2
Miền bác bỏ Ho
-t
a/2
-4
Kiểm định giả thuyết về hệ số hồi quy
bi (bˆi - i ; bˆi i )
Miền chấp nhận Ho
83
Bài giảng Toán Cao cấp 1
H0
βi = βi*
βi ≤ βi*
βi ≥ βi*
H1
βi ≠ βi*
βi > βi*
βi < βi*
Miền bác bỏ
|t|>ta/2 (n-2)
t > ta (n-2)
t < -ta (n-2)
Nguyễn Văn Tiến
84
14
29/05/2017
Kiểm định phía trái
Kiểm định phía phải
f(t)
f(t)
H0 : βi ≤ βi*
H1 : βi > βi*
H0 : βi ≥ βi*
H1 : βi < βi*
1-a
1-a
a
a
Miền bác bỏ Ho
t
Miền bác bỏ Ho
-t
a
a
t
0
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
85
Kiểm định sự phù hợp của mô hình
Kiểm định giả thiết H0: R2 = 0
(tương đương H0: β2= 0)
với mức ý nghĩa a hay độ tin cậy 1 - a
Bước 1:
R 2 (n - 2)
Tính
F
2
1- R
Bài giảng Toán Cao cấp 1
0
t
Nguyễn Văn Tiến
86
Kiểm định sự phù hợp của mô hình
b. Phương pháp p-value
Bước 2: Tính p-value= p (Fa(1,n-2)>F)
Bước 3: Quy tắc quyết định
- Nếu p ≤ a : Bác bỏ H0
- Nếu p > a: Chấp nhận H0
a. Phương pháp giá trị tới hạn
Bước 2: Tra bảng F với mức ý nghĩa a và hai bậc
tự do (1, n-2)
Bước 3: Quy tắc quyết định
- Nếu F > Fa(1,n-2): Bác bỏ H0
- Nếu F ≤ Fa(1,n-2): Chấp nhận H0
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
87
Bài giảng Toán Cao cấp 1
88
DỰ BÁO
Kiểm định sự phù hợp của mô hình
F
Nguyễn Văn Tiến
• Ta cần dự đoán giá trị của biến phụ thuộc Y ứng với
một giá trị cho trước của biến độc lập X, chẳng hạn là
X0.
• Có hai câu hỏi:
• Giá trị thực của Y0 là bao nhiêu
• Giá trị trung bình của Y0 là bao nhiêu
Thống kê F
Miền bác bỏ Ho
Miền chấp nhận Ho
a=0,05
Fa(1,n-2)
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
90
89
15
29/05/2017
DỰ BÁO
DỰ BÁO
• Dựa vào mối quan hệ tuyến tính giữa Y và X thì:
Y0 b 1 b 2 X 0 0
Ước lượng khoảng cho giá trị thực của Y0 với độ
tin cậy 1 −
là:
• Trong đó: Y0 là giá trị thực của Y; X0 là giá trị của X và
0 là sai số ngẫu nhiên.
• Các hệ số 1; 2 được ước lượng từ mẫu. 0 được
ước lượng bằng 0
• Như vậy ước lượng điểm của Y0 là:
Y0 Yˆ0 - 1 ; Yˆ0 1
1 ta / 2 n - 2 .SE (Yˆ0 - Y0 )
Yˆ0 bˆ1 bˆ 2 X 0
Bài giảng Toán Cao cấp 1
x0 - x
1
SE (Yˆ0 - Y0 ) 1
n
S xx
Nguyễn Văn Tiến
91
Bài giảng Toán Cao cấp 1
DỰ BÁO
2
Nguyễn Văn Tiến
92
Ví dụ 1
Ước lượng khoảng cho giá trị trung bình của Y0 là
E (Y / X 0 ) (Yˆ0 - 2 ; Yˆ 0 2 )
Với:
2 ta / 2 n - 2 .SE (Yˆ0 )
SE (Yˆ0 )
1
n
x - x0
a)
b)
c)
d)
2
Tìm đường thẳng hồi quy
Tìm ước lượng 2
Tìm khoảng tin cậy 95% của các hệ số
Tìm khoảng dự đoán 95% tại x=5.
Nguyễn Văn Tiến
93
Bài giảng Toán Cao cấp 1
VÍ DỤ 2
Xi
1
4
2
5
5
7
Nguyễn Văn Tiến
94
VÍ DỤ 2
Theo số liệu quan sát sự biến động của nhu cầu
gạo Y (tấn/tháng) vào đơn giá X (ngàn đồng/kg)
Bài giảng Toán Cao cấp 1
2
S xx
Bài giảng Toán Cao cấp 1
STT
1
2
3
4
5
6
1;
Yi
10
6
9
5
4
2
Nguyễn Văn Tiến
95
a.Hãy lập mô hình hồi quy mẫu biễu diễn mối phụ
thuộc về nhu cầu vào đơn giá gạo
b.Tìm khoảng tin cậy của b1, b2 với a=0,05
c. Hãy xét xem nhu cầu của loại hàng trên có phụ
thuộc vào đơn giá của nó không với a=0,05.
d. Có thể nói rằng nếu giá gạo tăng 1.000đ/kg thì
nhu cầu gạo trung bình giảm 2 tấn/tháng không?
Cho với a=0,05
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
96
16
29/05/2017
VÍ DỤ 2
VÍ DỤ 2
a. Mô hình hồi quy mẫu biễu diễn mối phụ thuộc về nhu
cầu vào đơn giá gạo
e. Hãy kiểm định sự phù hợp của mô hình. Cho
a=0,05.
f. Hãy dự báo nhu cầu trung bình và nhu cầu thực
của loại hàng trên khi đơn giá ở mức 6.000
đồng/kg với độ tin cậy 95%.
g. Hãy viết lại hàm hồi quy nếu nhu cầu gạo được
tính theo đơn vị là tạ và giá có đơn vị là đồng.
h. Tính SST, SSE, SSR, R2
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Stt
1
2
3
4
5
6
sum
97
Xi
1
4
2
5
5
7
24
Yi
10
6
9
5
4
2
36
Bài giảng Toán Cao cấp 1
24
4;
n
6
X
Y
i i 111
XY
n
6
• Ta có: X
2
36
6
n
6
2
X
120 20
X2
n
6
Y
Syy
2
2
i
i
2
2
2
i
X
2
bˆ 2
XY
X
1
2
1 1 1 / 6 - 4 .6
- 1, 3 7 5
4
- n X .Y
2
- nX
1 1 1 - 6 .4 .6
- 1, 3 7 5
1 2 0 - 6 .4 2
Nguyễn Văn Tiến
VÍ DỤ 2
Như vậy, mô hình hồi quy mẫu
ta tính như sau:
x 2 .y x .xy
1
2
x2 x
Yˆi 11,5 - 1,375 . X i
=> X và Y có quan hệ nghịch biến
*bˆ = 11,5: nhu cầu tối đa là 11,5 tấn/tháng
1
*
• Hoặc đơn giản hơn:
bˆ1 Y - bˆ2 X 6 - (-1,375).4 11.5
Bài giảng Toán Cao cấp 1
- X
Bài giảng Toán Cao cấp 1
Ví dụ 2
• Hệ số
2
• Chú ý sinh viên có thể tính bằng CT sau:
2
Nguyễn Văn Tiến
X Y - X .Y
bˆ 2
i
Bài giảng Toán Cao cấp 1
Yˆi bˆ1 bˆ 2 X i
• Ta có:
X - X 20 - 4 4
Sxx
98
• Giả sử mô hình hồi quy mẫu dạng:
2
2
Yi^2
100
36
81
25
16
4
262
Ví dụ 2
Yi
X - X X - n X 120 - 6.4 24
Y -Y Y - nY 262 - 6.6 46
2
Xi^2
1
16
4
25
25
49
120
Nguyễn Văn Tiến
Ví dụ 2
Xi
XiYi
10
24
18
25
20
14
111
Nguyễn Văn Tiến
bˆ
2
= -1,375: khi giá tăng 1000 đồng/kg thì nhu cầu
trung bình sẽ giảm 1,375 tấn/tháng với điều kiện
các yếu tố khác trên thị trường không đổi.
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
102
17
29/05/2017
Ví dụ 2b
Chú ý 1
• Để thuận tiện sinh viên có thể sử dụng công thức sau:
• Tìm khoảng tin cậy của b1, b2 với a=0,05
• Ta có:
2
2
SSE 1 x
ˆ
ˆ
b1 - 1 b1 b1 1; 1 ta /2 n - 2 .
.
n - 2 n Sxx
SSE 1
bˆ2 - 2 b2 bˆ2 2 ; 2 ta /2 n - 2 .
.
n - 2 Sxx
Bài giảng Toán Cao cấp 1
2
Y -Y Y - nY
X - X Y -Y XY - nX.Y
Sxx Xi - X Xi2 - n X ;
Nguyễn Văn Tiến
Syy
Sxy
b2
2
i
i
i
Sxy
SST Syy
Sxx
.S
SSR b
2
xx
2
SSE SST - SSR
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Chú ý 2
Ví dụ 2b
• Để thuận tiện sinh viên có thể sử dụng công thức sau:
R2
SSR 2 Sxx
b2 .
SST
Syy
.
SE b
1
2
i
X
nSxx
SSE SST - SSR 2
n-2
n-2
1 ta/2 n - 2 .SE b
1
1
SE b2 .
2 ta/2 n - 2 .SE b2
Sxx
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
• Ta có:
SST Yi - Y
SSR b2
i
2
i
X
nSxx
X
S yy 46
-X
2
b2 S xx -1,375 .24 45,375
2
2
SSE
0,625
0,395285
n-2
4
SSR 45,375
R2
0,986413
SST
46
t0,025 4 2,776
ˆ
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Ví dụ 2b – cách cũ
0,625 120
0,360844
4 6.24
• Do đó:
1 2,776.
2,776*0,360844 1,001703
1 ta/2 n - 2 .SE b
1
. 1 0,625 1 0,080687
SE b
2
Sxx
4 24
2 ta /2 n - 2 .SE b2 2,776*0,080687 0,223988
Bài giảng Toán Cao cấp 1
2
2
SSE SST - SSR 0,625
Chú ý 2
• Vậy:
.
SE b
1
2
2
i
Nguyễn Văn Tiến
2 2,776.
• Vậy:
0,625 1 42
. 1,001702717
4 6 24
0,625 1
. 0,2239875369
4 24
11,5 -1,0017 b1 11,5 1,0017
-1,375 - 0,22399 b2 -1,375 0,22399
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
18
29/05/2017
Ví dụ 2c
Ví dụ 2c
• Hãy xét xem nhu cầu của loại hàng trên có phụ
thuộc vào đơn giá của nó không với a=0,05.
• Bài toán kiểm định:
H 0 : b2 0
H 1: b 2 0
• Giá trị quan sát::
t qs
• Miền bác bỏ:
Wa t : t t0,025 4 2, 776
• Tiêu chuẩn kiểm định:
t
bˆ2 - b 2*
~ t n - 2
SE ( bˆ2 )
Bài giảng Toán Cao cấp 1
-1,375 - 0
-17, 0379
0, 0806
Nguyễn Văn Tiến
• Do t qs Wa nên bác bỏ H0, chấp nhận H1.
• Nhu cầu trung bình có phụ thuộc vào đơn giá
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Ví dụ 2c, e
• Sử dụng kiểm định F để kiểm định hệ số R2
• Bài toán kiểm định:
Ví dụ 2c
• Giá trị quan sát::
Fqs
2
H 0 : R 0
2
H 1: R 0
(6 - 2)0,986413
290,3991
(1 - 0,986413)
• Miền bác bỏ:
• Tiêu chuẩn kiểm định:
Wa F : F F0,05 1; 4 7, 71
2
F
Bài giảng Toán Cao cấp 1
( n - 2) R
~ F 1; n - 2
(1 - R 2 )
Nguyễn Văn Tiến
• Do Fqs Wa nên bác bỏ H0, chấp nhận H1.
• Nhu cầu trung bình có phụ thuộc vào đơn giá
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Ví dụ 2d,f,g
Ví dụ 2f
• d. Có thể nói rằng nếu giá gạo tăng 1.000đ/kg
thì nhu cầu gạo trung bình giảm 2 tấn/tháng
không? Cho với a=0,05
• f. Hãy dự báo nhu cầu trung bình và nhu cầu
thực của loại hàng trên khi đơn giá ở mức 6.000
đồng/kg với độ tin cậy 95%.
• g. Hãy viết lại hàm hồi quy nếu nhu cầu gạo
được tính theo đơn vị là tạ và giá có đơn vị là
đồng.
• Ước lượng điểm của nhu cầu khi giá gạo là
X0=6000
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
Yˆ0 11, 5 - 1, 375.6 3, 25
• Dự báo giá trị trung bình của Y0:
E (Y / X 6) Yˆ0 ta /2 n - 2 .SE (Yˆ0 )
• Với:
SE (Yˆ0 )
x - x0
1
n
S xx
Bài giảng Toán Cao cấp 1
2
2
0, 625 1 4 - 6
.
0, 228218
4
6
24
Nguyễn Văn Tiến
19
29/05/2017
Ví dụ 2f
Ví dụ 2f
• Dự báo giá trị thực của Y0:
• Vậy ta có:
Y0 Yˆ0 ta /2 n - 2 .SE (Y0 - Yˆ0 )
ta / 2 n - 2 .SE (Yˆ0 ) 2, 776 * 0, 228218 0, 633532
• Với:
• Do đó:
E Y X 0 3, 25 - 0, 6335; 3, 25 0, 6335
E Y X 0 2, 6165; 3,8835
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
x - x0
1
SE (Y0 - Yˆ0 ) 1
n
S xx
ta / 2 n - 2 .SE (Y0 - Yˆ0 ) 2, 776 * 0, 456435 1, 267065
• Do đó: Y0 3, 25 - 1, 2671; 3, 25 1, 2671
Y0 1, 9829; 4, 5171
• Vậy, khi đơn giá là 6.000 đồng/kg ở một tháng
nào đó thì nhu cầu sẽ dao động từ 2-4,5 tấn.
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
• Cho số liệu chi tiêu
tiêu
dùng
Y
(USD/tuần) và thu
nhập hàng tuần X
(USD/tuần) của 10 hộ
gia đình. Giả sử X và Y
có quan hệ tuyến tính
trong đó Y là biến phụ
thuộc
Bài giảng Toán Cao cấp 1
Ví dụ 3
Yi
70
65
90
95
110
115
120
140
155
150
Xi
80
100
120
140
160
180
200
220
240
260
Nguyễn Văn Tiến
VÍ DỤ 2
1. Viết hàm hồi quy Y theo X. Ý nghĩa các hệ số hồi
quy
2. Tính khoảng tin cậy của 2. Ý nghĩa của khoảng tin
cậy này là gì? Cho độ tin cậy 95%.
3. Nếu thu nhập của hộ gia đình tăng 1 USD/tuần thì
chi tiêu trung bình của hộ gia đình có tăng 0.7
USD/tuần không? Cho mức ý nghĩa 5%.
4. Mô hình có phù hợp không? Cho mức ý nghĩa 1%.
5. Dự báo chi tiêu và chi tiêu trung bình của hộ gia
đình khi thu nhập là 300 USD/tuần. Cho mức ý
nghĩa 5% và X trung bình là 170 USD/tuần.
Bài giảng Toán Cao cấp 1
0, 625
1 4 - 6
. 1
0, 456435
4
6
24
Ví dụ 3
• Vậy ta có:
t 0 ,025 8 2, 306
2
2
SE (Y0 - Yˆ0 )
Ví dụ 2f
Bài giảng Toán Cao cấp 1
Chạy số liệu trên Eviews, ta có kết quả sau
F0 ,01 (1, 8) 11, 26
Nguyễn Văn Tiến
Bài giảng Toán Cao cấp 1
Nguyễn Văn Tiến
120
20
29/05/2017
Ví dụ 3
• Tính toán các giá trị có thể và kiểm tra với kết
quả chạy phần mềm ở trên.
Yˆi 24 , 4545 0 ,5091 X i R 2 0,9621
df 8
se ( 6 , 4138 )( 0 , 0357 )
F (1,8) 202,87
p (0,0000)
t ( 3,813 )(14 , 243 )
p ( 0 , 005 )( 0 , 000 )
tj
Bài giảng Toán Cao cấp 1
bˆ j
se ( bˆ j )
Nguyễn Văn Tiến
21