Câu 2: Bảng sau đây cho ta một mẫu gồm 11 quan sát (x i, yi) từ tập hợp chính các
giá trị của cặp ĐLNN (X, Y):
X
0,9
1,22
1,32
0,77
1,3
1,2
Y
-0,3
0,1
0,7
-0,28
-0,25
0,02
X
1,32
0,95
1,45
1,3
1,2
Y
0,37
-0,70
0,55
0,35
0,32
a) Tìm đường hồi quy của Y đối với X.
b) Tính sai số tiêu chuẩn của đường hồi quy.
c) Tính tỷ số F để kiểm định sự đúng đắn của giả thiết: Có hồi quy tuyến tính
của Y theo X.
Bài làm
Nhận xét: Đây là bài tốn phân tích hồi quy tuyến tính
Cơ sở lý thuyết
Ŷ x = B0 + BX
B0 = Ȳ - BẊ
XiYi
∑ XiYi – ∑ N
B=
∑ Xi 2−N ( Ẋ ) 2
X - biến số phụ thuộc (dependent / reponse variable)
Y – biến số độc lập (independent / predictor variable)
B0 và B – các hệ sớ hời quy (regression coefficients)
Bảng ANOVA
Trung bình
bình
phương
(MS)
Nguồn
Bậc tự do
(DF)
Tổng bình
phương
(SS)
Hồi quy
1
SSR
MSR
Sai số
n–2
SSE
MSE
Tổng cộng
n–1
SST
Tỷ số F
Giá trị thống kê
Giá trị R-bình phương (R-square):
R=
SSR
(100R2: %của biến đổi trên Y được giải thích bởi X)
SST
Độ lệch chuẩn (Standard Error):
S=
√
1
' 2
(Y i−Y i)
∑
N −2
(Sự phân tán của dữ liệu càng ít thì giá trị của S càng gần zero)
Trắc nghiệm thống kê:
Đối với một phương trình hồi quy, Ŷ x = B0 + BX , ý nghĩa thống kê của các hệ số
Bi (B0 hay B) được đánh giá bằng trắc nghiệm t (phân phối Student) trong khi tính
chất thích hợp của phương trình Ŷ x = f(X) được đánh giá bằng trắc nghiệm
F(phôi bố Fischer)
Trắc nghiệm t
- Giả thiết:
Áp dụng excel
Bước 1: Nhập bảng số liệu
Bước 2: vào Data /Data analysis, chọn Regression.
Bước 3: Nhập các số liệu vào bảng sau:
Nhấn OK, ta được kết quả:
a) Đường hồi quy của Y đối với X là: Y=1.5479X – 1.7395
b) Sai số tiêu chuẩn của đường hồi quy: 0.2896
c) Ta thấy F = 12.6367 > c = 5.12
(Tra bảng phân bố Fisher với bậc tự do n1 = 1, n2 = 9 ở mức 0.05)
=> Có hồi quy tuyến tính của Y theo X