Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.13 MB, 75 trang )
<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1></div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>
Hai biến (đại lượng) được nói là có tương quan nếu chúng có
quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có
ảnh hưởng đến thay đổi của biến còn lại.
Ký hiệu (x,y) là cặp giá trị quan sát được của hai biến X, Y.
<b>Chi phí quảng </b>
<b>cáo</b> <b>1,3</b> <b>0,9</b> <b>1,8</b> <b>2,1</b> <b>1,5</b>
Tổng doanh số
Ký hiệu: r hay r<sub>X,Y</sub>
Cơng thức:
Trong đó n là số lượng quan sát
1
2 2
, ; cov ,
cov ,
. 1
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>n</i> <i>n</i>
<i>i</i> <i>i</i>
<i>X Y</i>
<i>X</i> <i>Y</i>
<i>x</i> <i>x y</i> <i>y</i>
<i>x y</i>
<i>n</i>
<i>x y</i>
<i>r</i>
<i>x</i> <i>x</i> <i>y</i> <i>y</i>
<i>X Y</i> <i><sub>n</sub></i> <i><sub>n</sub></i>
<i>i</i> <i>i</i>
<i>i</i> <i>i</i>
<i>x</i> <i>x y</i> <i>y</i>
<i>x</i> <i>x</i> <i>y</i> <i>y</i>
Ký hiệu: r hay r<sub>X,Y</sub>
Công thức:
Trong đó n là số lượng quan sát
,
2 2 2 2
2 2 2 2
. <sub>.</sub>
. .
<i>X Y</i>
<i>n</i> <i>xy</i> <i>x</i> <i>y</i> <i><sub>xy x y</sub></i>
<i>r</i>
<i>n</i> <i>x</i> <i>x</i> <i>n</i> <i>y</i> <i>y</i> <i>x</i> <i>x</i> <i>y</i> <i>y</i>
<sub></sub>
<i>X Y</i> <i><sub>n</sub></i> <i><sub>n</sub></i>
<i>i</i> <i>i</i>
<i>i</i> <i>i</i>
<i>x</i> <i>x y</i> <i>y</i>
<i>r</i>
<i>x</i> <i>x</i> <i>y</i> <i>y</i>
Đối với quan sát mẫu
Ta có:
1 2 1 1 2 1
2 2
2 2 2 2 2 2
2 1 2 1 2 1 2 1
... ...
;
... ...
;
...
<i>n</i> <i>n</i>
<i>i</i> <i>i</i>
<i>n</i> <i>i</i> <i>n</i> <i>i</i>
<i>n</i> <i>n</i>
<i>i</i> <i>i</i>
<i>n</i> <i>i</i> <i>n</i> <i>i</i>
<i>n</i>
<i>i i</i>
<i>x</i> <i>y</i>
<i>x</i> <i>x</i> <i>x</i> <i>y</i> <i>y</i> <i>y</i>
<i>x</i> <i>y</i>
<i>n</i> <i>n</i> <i>n</i> <i>n</i>
<i>x</i> <i>y</i>
<i>x</i> <i>x</i> <i>x</i> <i>y</i> <i>y</i> <i>y</i>
<i>x</i> <i>y</i>
<i>n</i> <i>n</i> <i>n</i> <i>n</i>
<i>x y</i>
<i>x y</i> <i>x y</i>
<sub> Miền giá trị: 1 </sub>
<sub> Nếu thì tương quan âm. r</sub><sub>XY</sub><sub> càng gần -1 thì mối liên hệ </sub>
tuyến tính nghịch giữa X, Y càng mạnh
<sub> Nếu thì tương quan dương. r</sub><sub>XY</sub><sub> càng gần 1 thì mối liên </sub>
hệ tuyến tính thuận giữa X, Y càng mạnh
Hãy tính hệ số tương quan Pearson giữa chi phí quảng
cáo và doanh số trong ví dụ sau.
<b>Chi phí quảng </b>
<b>cáo</b> <b>1,3</b> <b>0,9</b> <b>1,8</b> <b>2,1</b> <b>1,5</b>
Tổng doanh số
<b>X</b> <b>Y</b> <b>X2</b> <b>Y2</b> <b>XY</b>
1,3 151,6 1,69 22.982,56 197,08
0,9 100,1 0,81 10.020,01 90,09
1,8 199,3 3,24 39.720,49 358,74
2,1 221,2 4,41 48.929,44 464,52
1,5 170,0 2,25 28.900,00 255,00
7,6 842,2 12,40 150.552,5
0 1.365,43
<b>X</b> <b>Y</b> <b>X2</b> <b>Y2</b> <b>XY</b>
1,3 151,6 1,69 22.982,56 197,08
0,9 100,1 0,81 10.020,01 90,09
1,8 199,3 3,24 39.720,49 358,74
0 1.365,43
5 5
1 1
5 <i><sub>i</sub></i> 7,6 <i><sub>i</sub></i> 842, 2
<i>i</i> <i>i</i>
<i>n</i> <i>x</i> <i>y</i>
Ta có:
Hệ số tương quan:
Hoặc:
2
2
1,52 2, 48 168, 44
30110,5 273,086
<i>x</i> <i>x</i> <i>y</i>
<i>y</i> <i>xy</i>
273,086 1,52.168, 44
2, 48 1,52 30110,5 168, 44 0,993371434
<i>XY</i>
<i>r</i>
1 1 1
2 2
1 1 1 1
2 2 2 2
5.1365, 43 7,6*842, 2
0,993371434
5.12, 4 7,6 5.150552,5 842, 2
.
.
<i>n</i> <i>n</i> <i>n</i>
<i>i i</i> <i>i</i> <i>i</i>
<i>i</i> <i>i</i> <i>i</i>
<i>XY</i>
<i>n</i> <i>n</i> <i>n</i> <i>n</i>
<i>i</i> <i>i</i> <i>i</i> <i>i</i>
<i>i</i> <i>i</i> <i>i</i> <i>i</i>
<i>n</i> <i>x y</i> <i>x</i> <i>y</i>
<i>r</i>
<i>x</i> <i>x</i> <i>y</i> <i>y</i>
2 12, 4 <sub>2, 48;</sub> 2 150552,5 <sub>30110,5;</sub> 1365, 43 <sub>273,086</sub>
5 5 5
<i>x</i> <i>y</i> <i>xy</i>
2 12, 4 <sub>2, 48;</sub> 2 150552,5 <sub>30110,5;</sub> 1365, 43 <sub>273, 086</sub>
5 5 5
0, 460435 46,61634
<i>X</i> <i>Y</i>
<i>x</i> <i>y</i> <i>xy</i>
0,993371
Số liệu về thời gian quảng cáo trên truyền hình và lượng
sản phẩm tiêu thụ ở một công ty sản xuất đồ chơi trẻ em
như sau:
Thời gian: phút/tuần
Lượng tiêu thụ: 1000sp/tuần
Hãy tính hệ số tương quan mẫu và cho kết luận
<b>Thời gian</b> <b>28 37 44 36 47 35 26 29 33 32 3</b>
<b>1</b> <b>28</b>
Hệ số tương quan hạng
Ký hiệu R
Cơng thức:
Trong đó n là cỡ mẫu và d là hiệu số của các hạng.
2
2
Khi tuyển dụng, một công ty đánh giá các ứng viên thông qua
phỏng vấn và bài kiểm tra. Khi phỏng vấn, các ứng viên được
đánh giá từ A (xuất sắc) đến E (khơng phù hợp) và bài kiểm tra
được tính theo thang điểm 100. Kết quả của 5 ứng viên như
sau:
Tính hệ số tương quan hạng Spearman và cho nhận xét
<b>Ứng viên</b> <b>1</b> <b>2</b> <b>3</b> <b>4</b> <b>5</b>
Điểm phỏng
vấn A B A C D
Ta lập bảng sau:
<b>Ứng </b>
<b>viên</b>
<b>Hạng </b>
<b>phỏng </b>
<b>vấn</b>
<b>Hạng </b>
<b>kiểm </b>
<b>tra</b>
<b>Hiệ</b>
<b>u số</b>
<b>Hiệu số </b>
<b>bình </b>
<b>phương</b>
1 1,5 4 -2,5 6,25
2 3 3 0 0
3 1,5 5 -3,5 12,25
4 4 1 3 9
5 5 2 3 9
<b>0</b> <b>36,50</b>
2
6 <sub>6* 36,50</sub>
1 <i>d</i> 1 0,825
<b>-VÍ DỤ</b>
<b>Loại </b>
<b>rượu</b> <b>Hương vị Giá tiền</b>
A 1 2,49
B 2 2,99
C 3 3,49
D 4 2,99
E 5 3,59
F 6 3,99
G 7 3,99
H 8 2,99
<b>Loại </b>
<b>rượu</b> <b>hương vịHạng</b> <b>giá tiềnHạng</b> <b>Hiệu số</b> <b>Hiệu số bình phương</b>
Phân tích hồi quy được sử dụng để xác định mối liên hệ
giữa:
<sub>Một biến phụ thuộc Y (biến được giải thích)</sub>
<sub>Một hay nhiều biến độc lập X1, X2, …,Xn (cịn được gọi là biến giải </sub>
thích)
Biến phụ thuộc Y phải là biến liên tục
Liên hệ hàm số: Y=aX+b
Với một giá trị của X, có 1 giá trị duy nhất của Y
Liên hệ thống kê: Y=aX+b
Ví dụ: X: thời gian tự học; Y: điểm cuối kỳ
Một giá trị của X có thể có nhiều giá trị của Y
Dữ liệu X: dữ liệu mẫu
• Ta cần xác định các hệ số a, b sao cho đường
thẳng trên xấp xỉ tốt nhất cho hàm chi phí.
Số liệu về doanh số và số lượng nhân viên kinh doanh trong các
khu vực của công ty X như sau:
<b>Khu vực Doanh số</b> <b>Số nhân viên kinh <sub>doanh</sub></b>
A 236 11
B 234 12
C 298 18
D 250 15
E 246 13
Giả sử có n quan sát (x1,y1), (x2,y2),…,(xn,yn)
Ta cần xác định đường thẳng y=a.x+b sao cho tổng bình
phương của các thặng dư là nhỏ nhất.
Hay cần cực tiểu hóa hàm số sau:
Chú ý:
a, b: là hai ẩn cần tìm
xk; yk là các giá trị đã biết.
1
, <i>n</i> <i><sub>k</sub></i> . <i><sub>k</sub></i>
<i>i</i>
<i>F a b</i> <i>y</i> <i>a x</i> <i>b</i>
=
<i>a</i> <i>y bx</i>
<i>x</i> <i>x y</i> <i>y</i>
Số liệu về doanh số và số lượng nhân viên kinh doanh trong các
khu vực của công ty X như sau:
Hãy tìm mơ hình tuyến tính dự đoán doanh số theo số nhân viên
<b>Khu vực Doanh số</b> <b>Số nhân viên kinh <sub>doanh</sub></b>
A 236 11
B 234 12
C 298 18
D 250 15
E 246 13
Vấn đề: có hai biến quan sát X và Y
Ta cần tìm phương trình thể hiện mối liên hệ giá trị giữa
Y và X
Y: biến phụ thuộc; X: biến độc lập
X và Y có tương quan tuyến tính mạnh
Ta giả sử X và Y có mối quan hệ tuyến tính với nhau.
Mơ hình như sau:
: hệ số góc (slope)
u: sai số ngẫu nhiên (nhiễu ngẫu nhiên, nhiễu trắng)
1 2
Với giá trị quan sát được ta có:
yi : giá trị quan sát được của Y khi X nhận giá trị là xi.
xi: giá trị quan sát thứ i của X.
ui: sai số ngẫu nhiên khi X nhận giá trị xi.
1 2
<i>i</i> <i>i</i> <i>i</i>
1 2
1 2
<i>i</i> <i>i</i> <i>i</i>
Ta ít khi có số liệu của cả tổng thể mà chỉ có số liệu của mẫu
(số liệu quan sát được)
Ta dùng số liệu mẫu để ước lượng tổng thể
Hàm hồi quy mẫu:
Đối với quan sát thứ i:
1 2
<i>i</i> <i>i</i>
1 2
<i>i</i> <i>i</i> <i>i</i>
1
2
ˆ
1
ˆ
<i>PRF</i>
2
Trong đó
là ước lượng cho 1.
là ước lượng cho 2.
là ước lượng cho Y hay E(Y|Xi)
Tình trạng Biện
pháp
Hệ số Tham số
Khơng xác định được
chính xác giá trị
Ước lượng
Kiểm định
Hệ số
Phương sai sai số 2
Hệ số Biến ngẫu nhiên
Có thể tính được giá trị trên mẫu đã
chọn
Dùng để ước lượng cho các tham số
tổng thể
Hệ số
Phương sai thặng dư
mẫu
Tình trạng Biện
pháp
Tham số
Khơng xác định được
chính xác giá trị
Ước lượng
Kiểm định
Biến ngẫu nhiên
Có thể tính được giá trị trên mẫu đã
chọn
2
1 2
1 1
<i>n</i> <i>n</i>
<i>i</i> <i>i</i> <i>i</i>
<i>i</i> <i>i</i>
<i>u</i> <i>y</i> <i>b</i> <i>b</i> <i>x</i>
= =
= -
1 2 2 2
2 2
1 2
2
. . .
;
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>n</i>
<i>x y x xy</i> <i>xy x y</i>
<i>x</i> <i>x</i> <i>x</i> <i>x</i>
<i>x</i> <i>x y</i> <i>y</i>
Là các ước lượng của ;
Dạng biểu diễn khác:
µ
2 <sub>2</sub> <sub>2</sub>
1
1 1
1 2
;
<i>n</i>
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>i</i>
<i>i i</i> <i>i</i>
<i>n</i> <i>n</i>
<i>i</i>
<i>i</i> <i>i</i>
<i>i</i> <i>i</i>
<i>x</i> <i>x y</i> <i><sub>x</sub></i> <i><sub>x</sub></i>
<i>cy c</i>
<i>x</i> <i>x</i> <i>x</i> <i>x</i>
Giá trị trung bình các hệ số hồi quy mẫu:
Phương sai các hệ số hồi quy mẫu:
Ta dùng các kết quả trên để ước lượng giá trị của các hệ số hồi quy
tổng thể ;
µ
1 <sub>1</sub>; 2 <sub>2</sub>
<i>E</i> <i>b</i> = <i>b</i> <i>E</i> <i>b</i> = <i>b</i>
µ
1 <sub>2</sub> 2 <sub>2</sub>
1 1
<i>x</i> <i>x</i> <i>x</i> <i>x</i>
<i>s</i>
<i>b</i> <i>s</i> <i>b</i>
Ta có:
1 1 1 1
<i>n</i> <i>n</i> <i>n</i> <i>n</i>
<i>i</i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i>
<i>i</i> <i>i</i> <i>i</i> <i>i</i>
TSS = tổng của các mức độ khác biệt bình phương giữa
<i>từng giá trị y</i>i<i> và trị số trung bình của y. </i>
ESS = tổng của các mức độ khác biệt bình phương giữa
<i>các giá trị quan sát và giá trị dự đoán của y. </i>
1
<i>n</i>
<i>i</i>
<i>i</i>
=
1
<i>n</i>
<i>i</i>
<i>i</i>
=
1
<i>n</i>
<i>i</i>
<i>i</i>
<i>i</i>
=
RSS Tổng chênh lệch
ESS
SRF
Y
X
y<sub>i</sub>
X<sub>i</sub>
<i>i</i>
<i>n</i>
<i>i</i>
<i>i</i>
<i>RSS</i> <i>y</i> <i>y</i>
=
=
1
<i>n</i>
<i>i</i>
<i>i</i>
<i>T SS</i> <i>y</i> <i>y</i>
=
=
1
<i>n</i>
<i>i</i>
<i>i</i>
<i>i</i>
<i>ESS</i> <i>y</i> <i>y</i>
=
=
Khi điểm quan sát càng gần đường thẳng ước lượng thì “độ
thích hợp” càng cao, có nghĩa là ESS càng nhỏ và RSS càng
lớn.
Tham số đo độ thích hợp:
R2 càng lớn càng tốt
ESS: biến thiên khơng giải thích được
RSS: biến thiên giải thích được
R2 nhỏ nghĩa là nhiều biến thiên của Y khơng giải thích được
bằng X. Cần phải thêm nhiều biến khác vào mô hình.
2
Coefficient of determination
Là tỷ lệ của tổng sự biến thiên trong biến phụ thuộc gây ra
bởi sự biến thiên của các biến độc lập (biến giải thích) so với
tổng sự biến thiên tồn phần.
Tên gọi: R_bình phương (R squared)
Ký hiệu:
Dễ thấy:
Đánh giá mơ hình tìm được có giải thích tốt cho mối liên
hệ giữa biến phụ thuộc Y và biến độc lập X hay khơng.
Là bình phương của hệ số tương quan mẫu
2 <sub>2</sub> 2 <sub>2</sub>
2
2
2
<i>i</i>
<i>i</i>
<i>XY</i>
Nhớ
Với độ tin cậy 95% thì:
µ
µ
1
~<i>t n</i> 2
<i>Se</i>
<i>b</i> <i>b</i>
<i>b</i>
-2,5%
2,5% 95%
<i>t</i> <i>n </i>
<i>t</i> <i>n</i> <i>t</i> <i>n</i>
<i>Se</i>
<i>b</i> <i>b</i>
<i>b</i>
-- - £ £
-µ
1 <i>t</i><sub>0,025</sub> <i>n</i> 2 <i>Se</i> <sub>1</sub> <sub>1</sub> 1 <i>t</i><sub>0,025</sub> <i>n</i> 2 <i>Se</i> <sub>1</sub>
Tổng quát với độ tin cậy
2
2
2
2
<i>t</i><sub></sub> <i>n</i>
2
2
<i>t</i><sub></sub> <i>n</i>
µ
<i>b</i> <i>b</i> <i>s</i>
ổ ử<sub>ữ</sub>
ỗ <sub>ữ</sub>
ỗ <sub>ữ</sub>
ỗ <sub>ữ</sub>
ỗ
= = <sub>ỗ</sub> + ữ<sub>ữ</sub>
ỗ ữ
ỗ ữ<sub>ữ</sub>
ỗ
ố ứ
2 <sub>1</sub> 2
2 2
<i>t n</i> <i>t n</i>
<i>Se</i>
<i>a</i> <i>a</i>
<i>b</i> <i>b</i>
<i>b</i>
-- - £ £
-µ
1 <i>t n<sub>a</sub></i> 2 <i>Se</i> <sub>1</sub> <sub>1</sub> 1 <i>t n<sub>a</sub></i> 2 <i>Se</i> <sub>1</sub>
<i>b</i> - - <i>b</i> £ <i>b</i> £ <i>b</i> + - <i>b</i>
µ µ
Nhớ
Với độ tin cậy (1- ) thì:
µ
µ
2
~<i>t n</i> 2
<i>Se</i>
<i>b</i> <i>b</i>
<i>b</i>
-/ 2
/ 2
/2 2
<i>t</i><sub></sub> <i>n</i>
/2 2
<i>t</i><sub></sub> <i>n</i>
2 <sub>2</sub>
/ 2 / 2
2
2 2
<i>t</i> <i>n</i> <i>t</i> <i>n</i>
<i>Se</i>
<i>a</i> <i>a</i>
<i>b</i> <i>b</i>
2 <i>t</i> <i>n</i> 2 <i>Se</i> 2 <i>t</i> <i>n</i> 2 <i>Se</i>
<i>b</i> - - <i>b</i> £ <i>b</i> £ <i>b</i> + - <i>b</i>
µ
2 2
<i>xx</i>
<i>Se</i> <i>V</i>
<i>S</i>
<i>s</i>
2
2 2
/2 1 /2
Cho X nhận giá trị là x0. Ta tiến hành dự báo:
Trung bình của Y khi X = x0. Ký hiệu: E(Y0|X0)
Giá trị cụ thể của Y khi X = x0. Ký hiệu:
Công thức chung:
Phân phối chuẩn
Giá trị tới hạn mức α ( là số thực ký hiệu 2<sub>(n;)</sub><sub>sao cho với </sub>
Z~ 2<sub>(n) thì:</sub>
2 <i><sub>n</sub></i><sub>;</sub>
Giá trị tới hạn mức α ( là số thực ký hiệu sao cho với Z~
(n) thì:
;0 ;1
;0,5 ;1 ;
;
<i>n</i> <i>n</i>
<i>n</i> <i>n</i> <i>n</i>
<i>n</i>
<i>n</i>
<b>Quan sát sự biến động của nhu cầu gạo Y (tấn/tháng) vào </b>
đơn giá X (ngàn đồng/kg) ta được các số liệu cho ở bảng.
Hãy lập mơ hình hơi quy mẫu biễu diễn mối phụ thuộc về
nhu cầu vào đơn giá gạo
<b>VÍ DỤ</b>
Ta lập bảng sau:
Ta có: 24 <sub>4</sub> 36 <sub>6</sub>
6 6
<i>i</i>
<i>i</i>
Lãi suất Y (%) 7 11 20 10 16 14
Lạm phát X