Tải bản đầy đủ (.pptx) (75 trang)

Hồi quy tương quan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.13 MB, 75 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1></div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

<b>TƯƠNG QUAN</b>



Hai biến (đại lượng) được nói là có tương quan nếu chúng có
quan hệ với nhau, chính xác hơn, sự thay đổi của biến này có
ảnh hưởng đến thay đổi của biến còn lại.


Ký hiệu (x,y) là cặp giá trị quan sát được của hai biến X, Y.


</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

<b>VÍ DỤ</b>



Một công ty nghiên cứu ảnh hưởng của quảng cáo


tới doanh số bán hàng. Dữ liệu quảng cáo và doanh


thu từng tháng được thu thập như sau:



Hãy vẽ biểu đồ phân tán.



<b>Chi phí quảng </b>


<b>cáo</b> <b>1,3</b> <b>0,9</b> <b>1,8</b> <b>2,1</b> <b>1,5</b>


Tổng doanh số


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

<b>BIỂU ĐỒ PHÂN TÁN</b>


Biến độc lập: chi



</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

<b>HỆ SỐ TƯƠNG QUAN PEARSON</b>



Ký hiệu: r hay r<sub>X,Y</sub>
Cơng thức:


Trong đó n là số lượng quan sát





 





1


2 2


, ; cov ,


cov ,
. 1
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>n</i> <i>n</i>
<i>i</i> <i>i</i>
<i>X Y</i>
<i>X</i> <i>Y</i>


<i>x</i> <i>x y</i> <i>y</i>
<i>x y</i>


<i>n</i>


<i>x y</i>
<i>r</i>



<i>x</i> <i>x</i> <i>y</i> <i>y</i>


 

 


 



 



1
,
2 2
1 1
.
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>


<i>X Y</i> <i><sub>n</sub></i> <i><sub>n</sub></i>


<i>i</i> <i>i</i>


<i>i</i> <i>i</i>


<i>x</i> <i>x y</i> <i>y</i>


<i>r</i>


<i>x</i> <i>x</i> <i>y</i> <i>y</i>


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

<b>HỆ SỐ TƯƠNG QUAN PEARSON</b>



Ký hiệu: r hay r<sub>X,Y</sub>
Công thức:


Trong đó n là số lượng quan sát




 



,


2 2 2 2


2 2 2 2


. <sub>.</sub>


. .


<i>X Y</i>


<i>n</i> <i>xy</i> <i>x</i> <i>y</i> <i><sub>xy x y</sub></i>
<i>r</i>



<i>n</i> <i>x</i> <i>x</i> <i>n</i> <i>y</i> <i>y</i> <i>x</i> <i>x</i> <i>y</i> <i>y</i>


 <sub></sub>
 
   

 



 



1
,
2 2
1 1
.
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>


<i>X Y</i> <i><sub>n</sub></i> <i><sub>n</sub></i>


<i>i</i> <i>i</i>


<i>i</i> <i>i</i>


<i>x</i> <i>x y</i> <i>y</i>
<i>r</i>


<i>x</i> <i>x</i> <i>y</i> <i>y</i>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

<b>TRUNG BÌNH; PHƯƠNG SAI VÀ HIỆP PHƯƠNG SAI</b>




Đối với quan sát mẫu
Ta có:


1 2 1 1 2 1


2 2


2 2 2 2 2 2


2 1 2 1 2 1 2 1


... ...
;
... ...
;
...
<i>n</i> <i>n</i>
<i>i</i> <i>i</i>


<i>n</i> <i>i</i> <i>n</i> <i>i</i>


<i>n</i> <i>n</i>


<i>i</i> <i>i</i>


<i>n</i> <i>i</i> <i>n</i> <i>i</i>


<i>n</i>



<i>i i</i>


<i>x</i> <i>y</i>


<i>x</i> <i>x</i> <i>x</i> <i>y</i> <i>y</i> <i>y</i>


<i>x</i> <i>y</i>


<i>n</i> <i>n</i> <i>n</i> <i>n</i>


<i>x</i> <i>y</i>


<i>x</i> <i>x</i> <i>x</i> <i>y</i> <i>y</i> <i>y</i>


<i>x</i> <i>y</i>


<i>n</i> <i>n</i> <i>n</i> <i>n</i>


<i>x y</i>
<i>x y</i> <i>x y</i>


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

<b>ĐÁNH GIÁ HỆ SỐ TƯƠNG QUAN</b>



<sub> Miền giá trị: 1 </sub>


<sub> Nếu thì tương quan âm. r</sub><sub>XY</sub><sub> càng gần -1 thì mối liên hệ </sub>
tuyến tính nghịch giữa X, Y càng mạnh


<sub> Nếu thì tương quan dương. r</sub><sub>XY</sub><sub> càng gần 1 thì mối liên </sub>
hệ tuyến tính thuận giữa X, Y càng mạnh



</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9></div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

<b>VÍ DỤ</b>



Hãy tính hệ số tương quan Pearson giữa chi phí quảng
cáo và doanh số trong ví dụ sau.


<b>Chi phí quảng </b>


<b>cáo</b> <b>1,3</b> <b>0,9</b> <b>1,8</b> <b>2,1</b> <b>1,5</b>


Tổng doanh số


</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

<b>VÍ DỤ</b>



<b>X</b> <b>Y</b> <b>X2</b> <b>Y2</b> <b>XY</b>


1,3 151,6 1,69 22.982,56 197,08
0,9 100,1 0,81 10.020,01 90,09
1,8 199,3 3,24 39.720,49 358,74
2,1 221,2 4,41 48.929,44 464,52
1,5 170,0 2,25 28.900,00 255,00
7,6 842,2 12,40 150.552,5


0 1.365,43


<b>X</b> <b>Y</b> <b>X2</b> <b>Y2</b> <b>XY</b>


1,3 151,6 1,69 22.982,56 197,08
0,9 100,1 0,81 10.020,01 90,09
1,8 199,3 3,24 39.720,49 358,74


2,1 221,2 4,41 48.929,44 464,52
1,5 170,0 2,25 28.900,00 255,00
7,6 842,2 12,40 150.552,5


0 1.365,43


5 5


1 1


5 <i><sub>i</sub></i> 7,6 <i><sub>i</sub></i> 842, 2


<i>i</i> <i>i</i>


<i>n</i> <i>x</i> <i>y</i>


 


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

<b>VÍ DỤ</b>



Ta có:


Hệ số tương quan:


Hoặc:


2
2


1,52 2, 48 168, 44



30110,5 273,086


<i>x</i> <i>x</i> <i>y</i>


<i>y</i> <i>xy</i>


  


 


2

 

2



273,086 1,52.168, 44


2, 48 1,52 30110,5 168, 44 0,993371434


<i>XY</i>


<i>r</i>   


 


   


1 1 1


2 2


1 1 1 1



2 2 2 2


5.1365, 43 7,6*842, 2


0,993371434
5.12, 4 7,6 5.150552,5 842, 2


.
.


<i>n</i> <i>n</i> <i>n</i>


<i>i i</i> <i>i</i> <i>i</i>


<i>i</i> <i>i</i> <i>i</i>


<i>XY</i>


<i>n</i> <i>n</i> <i>n</i> <i>n</i>


<i>i</i> <i>i</i> <i>i</i> <i>i</i>


<i>i</i> <i>i</i> <i>i</i> <i>i</i>


<i>n</i> <i>x y</i> <i>x</i> <i>y</i>


<i>r</i>


<i>x</i> <i>x</i> <i>y</i> <i>y</i>



</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

<b>VÍ DỤ</b>



Các giá trị trung bình



Độ lệch chuẩn:



Hệ số tương quan



2 12, 4 <sub>2, 48;</sub> 2 150552,5 <sub>30110,5;</sub> 1365, 43 <sub>273,086</sub>


5 5 5


<i>x</i>   <i>y</i>   <i>xy</i>  


2 12, 4 <sub>2, 48;</sub> 2 150552,5 <sub>30110,5;</sub> 1365, 43 <sub>273, 086</sub>


5 5 5


0, 460435 46,61634


<i>X</i> <i>Y</i>


<i>x</i> <i>y</i> <i>xy</i>


 


     


 



0,993371


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

<b>VÍ DỤ</b>



Số liệu về thời gian quảng cáo trên truyền hình và lượng
sản phẩm tiêu thụ ở một công ty sản xuất đồ chơi trẻ em
như sau:


Thời gian: phút/tuần


Lượng tiêu thụ: 1000sp/tuần


Hãy tính hệ số tương quan mẫu và cho kết luận


<b>Thời gian</b> <b>28 37 44 36 47 35 26 29 33 32 3</b>


<b>1</b> <b>28</b>


</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

<b>HỆ SỐ TƯƠNG QUAN SPEARMAN</b>



Hệ số tương quan hạng
Ký hiệu R


Cơng thức:


Trong đó n là cỡ mẫu và d là hiệu số của các hạng.


(

)




2
2


6


1



1



<i>d</i>


<i>R</i>



<i>n n</i>



=





</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

<b>HỆ SỐ TƯƠNG QUAN SPEARMAN</b>



Khi tuyển dụng, một công ty đánh giá các ứng viên thông qua
phỏng vấn và bài kiểm tra. Khi phỏng vấn, các ứng viên được
đánh giá từ A (xuất sắc) đến E (khơng phù hợp) và bài kiểm tra
được tính theo thang điểm 100. Kết quả của 5 ứng viên như
sau:


Tính hệ số tương quan hạng Spearman và cho nhận xét


<b>Ứng viên</b> <b>1</b> <b>2</b> <b>3</b> <b>4</b> <b>5</b>


Điểm phỏng



vấn A B A C D


</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

<b>VÍ DỤ</b>



Ta lập bảng sau:


<b>Ứng </b>
<b>viên</b>
<b>Hạng </b>
<b>phỏng </b>
<b>vấn</b>
<b>Hạng </b>
<b>kiểm </b>
<b>tra</b>
<b>Hiệ</b>
<b>u số</b>
<b>Hiệu số </b>
<b>bình </b>
<b>phương</b>


1 1,5 4 -2,5 6,25


2 3 3 0 0


3 1,5 5 -3,5 12,25


4 4 1 3 9


5 5 2 3 9



<b>0</b> <b>36,50</b>


2


6 <sub>6* 36,50</sub>


1 <i>d</i> 1 0,825


</div>
<span class='text_page_counter'>(18)</span><div class='page_container' data-page=18>

<b>-VÍ DỤ</b>


Một chuyên gia được


yêu cầu nếm thử 8 loại


rượu có giá dưới 4 $.


Hương vị các loại rượu


được xếp hạng từ 1 (dở


nhất) đến 8 (ngon



nhất). Bảng tổng hợp


xếp hạng và giá cả các


loại rượu như sau:



<b>Loại </b>


<b>rượu</b> <b>Hương vị Giá tiền</b>


A 1 2,49


B 2 2,99



C 3 3,49


D 4 2,99


E 5 3,59


F 6 3,99


G 7 3,99


H 8 2,99


</div>
<span class='text_page_counter'>(19)</span><div class='page_container' data-page=19>

<b>VÍ DỤ</b>



Ta lập bảng sau:



<b>Loại </b>


<b>rượu</b> <b>hương vịHạng</b> <b>giá tiềnHạng</b> <b>Hiệu số</b> <b>Hiệu số bình phương</b>


</div>
<span class='text_page_counter'>(20)</span><div class='page_container' data-page=20>

<b>PHÂN TÍCH HỒI QUY</b>



Phân tích hồi quy được sử dụng để xác định mối liên hệ
giữa:


<sub>Một biến phụ thuộc Y (biến được giải thích)</sub>


<sub>Một hay nhiều biến độc lập X1, X2, …,Xn (cịn được gọi là biến giải </sub>


thích)



Biến phụ thuộc Y phải là biến liên tục


</div>
<span class='text_page_counter'>(21)</span><div class='page_container' data-page=21>

<b>LIÊN HỆ HÀM SỐ VÀ LIÊN HỆ THỐNG KÊ</b>



Liên hệ hàm số: Y=aX+b


Với một giá trị của X, có 1 giá trị duy nhất của Y
Liên hệ thống kê: Y=aX+b


Ví dụ: X: thời gian tự học; Y: điểm cuối kỳ


Một giá trị của X có thể có nhiều giá trị của Y
Dữ liệu X: dữ liệu mẫu


</div>
<span class='text_page_counter'>(22)</span><div class='page_container' data-page=22>

<b>VÍ DỤ</b>



</div>
<span class='text_page_counter'>(23)</span><div class='page_container' data-page=23>

<b>VÍ DỤ</b>



Mặc dù những điểm quan sát



không cùng nằm trên một đường


thẳng nhưng tương quan tuyến


tính rất mạnh



Cơng ty muốn xấp xỉ hàm chi phí


bằng một hàm tuyến tính:



• Ta cần xác định các hệ số a, b sao cho đường
thẳng trên xấp xỉ tốt nhất cho hàm chi phí.



.



</div>
<span class='text_page_counter'>(24)</span><div class='page_container' data-page=24>

<b>THẶNG DƯ (RESIDUAL)</b>



</div>
<span class='text_page_counter'>(25)</span><div class='page_container' data-page=25>

<b>VÍ DỤ</b>



Số liệu về doanh số và số lượng nhân viên kinh doanh trong các
khu vực của công ty X như sau:


<b>Khu vực Doanh số</b> <b>Số nhân viên kinh <sub>doanh</sub></b>


A 236 11


B 234 12


C 298 18


D 250 15


E 246 13


</div>
<span class='text_page_counter'>(26)</span><div class='page_container' data-page=26>

<b>TỔNG QUÁT</b>



Giả sử có n quan sát (x1,y1), (x2,y2),…,(xn,yn)


Ta cần xác định đường thẳng y=a.x+b sao cho tổng bình
phương của các thặng dư là nhỏ nhất.


Hay cần cực tiểu hóa hàm số sau:



Chú ý:


a, b: là hai ẩn cần tìm


xk; yk là các giá trị đã biết.


( )

(

)

2


1


, <i>n</i> <i><sub>k</sub></i> . <i><sub>k</sub></i>


<i>i</i>


<i>F a b</i> <i>y</i> <i>a x</i> <i>b</i>


=


</div>
<span class='text_page_counter'>(27)</span><div class='page_container' data-page=27>

<b>-TỔNG QUÁT</b>



Ta có:



<b>Đường hồi quy ln đi qua điểm (</b>



(

)(

)


(

)

( )


1
2
2

2
1
.
.
<i>n</i>
<i>k</i> <i>k</i>
<i>k</i>
<i>n</i>
<i>k</i>
<i>k</i>


<i>a</i> <i>y bx</i>


<i>x</i> <i>x y</i> <i>y</i>


</div>
<span class='text_page_counter'>(28)</span><div class='page_container' data-page=28>

<b>VÍ DỤ</b>



Số liệu về doanh số và số lượng nhân viên kinh doanh trong các
khu vực của công ty X như sau:


Hãy tìm mơ hình tuyến tính dự đoán doanh số theo số nhân viên


<b>Khu vực Doanh số</b> <b>Số nhân viên kinh <sub>doanh</sub></b>


A 236 11


B 234 12


C 298 18



D 250 15


E 246 13


</div>
<span class='text_page_counter'>(29)</span><div class='page_container' data-page=29>

<b>ỨNG DỤNG KINH TẾ</b>



</div>
<span class='text_page_counter'>(30)</span><div class='page_container' data-page=30>

<b>HỒI QUY TUYẾN TÍNH TỔNG QUÁT</b>



Vấn đề: có hai biến quan sát X và Y


Ta cần tìm phương trình thể hiện mối liên hệ giá trị giữa
Y và X


Y: biến phụ thuộc; X: biến độc lập


</div>
<span class='text_page_counter'>(31)</span><div class='page_container' data-page=31>

<b>HỒI QUY TUYẾN TÍNH</b>



X và Y có tương quan tuyến tính mạnh


Ta giả sử X và Y có mối quan hệ tuyến tính với nhau.
Mơ hình như sau:


: hệ số góc (slope)


u: sai số ngẫu nhiên (nhiễu ngẫu nhiên, nhiễu trắng)


1 2


</div>
<span class='text_page_counter'>(32)</span><div class='page_container' data-page=32>

<b>HỒI QUY TUYẾN TÍNH</b>




Với giá trị quan sát được ta có:


yi : giá trị quan sát được của Y khi X nhận giá trị là xi.


xi: giá trị quan sát thứ i của X.


ui: sai số ngẫu nhiên khi X nhận giá trị xi.


1 2


<i>i</i> <i>i</i> <i>i</i>


</div>
<span class='text_page_counter'>(33)</span><div class='page_container' data-page=33>

<b>HÀM HỒI QUY TỔNG THỂ</b>


Hàm hồi quy tổng thể



Đối với một quan sát cụ thể ta có:



Mơ hình chỉ có một biến phụ thuộc Y và một biến giải


thích X.



(

)

1 2


1 2


|

<i><sub>i</sub></i>


<i>E Y X</i>

<i>X</i>

<i>X</i>



<i>Y</i>

<i>X</i>




<i>b</i>

<i>b</i>


<i>b</i>

<i>b</i>



=

=

+



=

+



1 2


<i>i</i> <i>i</i> <i>i</i>


</div>
<span class='text_page_counter'>(34)</span><div class='page_container' data-page=34>

<b>HÀM HỒI QUY MẪU SRF</b>



Ta ít khi có số liệu của cả tổng thể mà chỉ có số liệu của mẫu
(số liệu quan sát được)


Ta dùng số liệu mẫu để ước lượng tổng thể
Hàm hồi quy mẫu:


Đối với quan sát thứ i:


µ

µ

µ



1 2


<i>i</i> <i>i</i>


<i>Y</i>

=

<i>b</i>

+

<i>b</i>

<i>X</i>



µ

µ

µ




1 2


<i>i</i> <i>i</i> <i>i</i>


</div>
<span class='text_page_counter'>(35)</span><div class='page_container' data-page=35>

<b>PRF và SRF</b>



<i>Y</i>



<i>X</i>



1




2


ˆ




1


ˆ




<i>PRF</i>


2





</div>
<span class='text_page_counter'>(36)</span><div class='page_container' data-page=36>

<b>PRF VÀ SRF</b>



Trong đó


là ước lượng cho 1.


là ước lượng cho 2.


là ước lượng cho Y hay E(Y|Xi)


</div>
<span class='text_page_counter'>(37)</span><div class='page_container' data-page=37></div>
<span class='text_page_counter'>(38)</span><div class='page_container' data-page=38>

<b>CHÚ Ý</b>



  Tình trạng Biện


pháp
Hệ số Tham số


Khơng xác định được
chính xác giá trị


Ước lượng
Kiểm định


Hệ số


Phương sai sai số 2



Hệ số Biến ngẫu nhiên


Có thể tính được giá trị trên mẫu đã
chọn


Dùng để ước lượng cho các tham số
tổng thể


Hệ số


Phương sai thặng dư
mẫu


  Tình trạng Biện


pháp


Tham số


Khơng xác định được
chính xác giá trị


Ước lượng
Kiểm định
Biến ngẫu nhiên


Có thể tính được giá trị trên mẫu đã
chọn


</div>
<span class='text_page_counter'>(39)</span><div class='page_container' data-page=39>

<b>ƯỚC LƯỢNG OLS</b>



Tìm giá trị của ; sao cho:



Đạt giá trị nhỏ nhất (pp bình phương tối thiểu)


Dễ thấy:



(

)

2


2


1 2


1 1


<i>n</i> <i>n</i>


<i>i</i> <i>i</i> <i>i</i>


<i>i</i> <i>i</i>


<i>u</i> <i>y</i> <i>b</i> <i>b</i> <i>x</i>


= =
= -

å


( )

( )


µ

(

) (

)


(

)


µ
1
2

2


1 2 2 2


2 2
1 2
2
. . .
;
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>n</i>


<i>x y x xy</i> <i>xy x y</i>


<i>x</i> <i>x</i> <i>x</i> <i>x</i>


<i>x</i> <i>x y</i> <i>y</i>


</div>
<span class='text_page_counter'>(40)</span><div class='page_container' data-page=40>

<b>HỆ SỐ HỒI QUY MẪU</b>



Là các ước lượng của ;
Dạng biểu diễn khác:


µ

(

)


(

)


(

)


(

)


µ µ

1


2 <sub>2</sub> <sub>2</sub>


1
1 1
1 2
;
<i>n</i>
<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>i</i>


<i>i i</i> <i>i</i>


<i>n</i> <i>n</i>


<i>i</i>


<i>i</i> <i>i</i>


<i>i</i> <i>i</i>


<i>x</i> <i>x y</i> <i><sub>x</sub></i> <i><sub>x</sub></i>


<i>cy c</i>


<i>x</i> <i>x</i> <i>x</i> <i>x</i>



</div>
<span class='text_page_counter'>(41)</span><div class='page_container' data-page=41>

<b>MỘT SỐ TÍNH CHẤT</b>



Giá trị trung bình các hệ số hồi quy mẫu:


Phương sai các hệ số hồi quy mẫu:


Ta dùng các kết quả trên để ước lượng giá trị của các hệ số hồi quy
tổng thể ;


µ


( )

( )

µ


1 <sub>1</sub>; 2 <sub>2</sub>


<i>E</i> <i>b</i> = <i>b</i> <i>E</i> <i>b</i> = <i>b</i>


µ

( )

( )


(

)


µ

( )


(

)


2
2
2


1 <sub>2</sub> 2 <sub>2</sub>


1 1


1
<i>n</i> <i>n</i>
<i>i</i> <i>i</i>
<i>i</i> <i>i</i>
<i>x</i>
<i>V</i> <i>V</i>
<i>n</i>


<i>x</i> <i>x</i> <i>x</i> <i>x</i>


<i>s</i>


<i>b</i> <i>s</i> <i>b</i>


</div>
<span class='text_page_counter'>(42)</span><div class='page_container' data-page=42></div>
<span class='text_page_counter'>(43)</span><div class='page_container' data-page=43>

<b>MỘT VÀI TÍNH CHẤT</b>



Ta có:




1 1 1 1


0



<i>n</i> <i>n</i> <i>n</i> <i>n</i>


<i>i</i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i> <i><sub>i</sub></i>


<i>i</i> <i>i</i> <i>i</i> <i>i</i>



<i>u</i>

<i>y</i>

<i>y</i>

<i>y</i>

<i>y</i>

<i>y</i>

<i>y</i>



   


 



</div>
<span class='text_page_counter'>(44)</span><div class='page_container' data-page=44>

<b>KÝ HIỆU</b>



</div>
<span class='text_page_counter'>(45)</span><div class='page_container' data-page=45>

<b>TÁCH NHÓM BIẾN THIÊN: KHÁI NIỆM</b>



TSS = tổng của các mức độ khác biệt bình phương giữa
<i>từng giá trị y</i>i<i> và trị số trung bình của y. </i>


ESS = tổng của các mức độ khác biệt bình phương giữa
<i>các giá trị quan sát và giá trị dự đoán của y. </i>


</div>
<span class='text_page_counter'>(46)</span><div class='page_container' data-page=46>

<b>ĐO SỰ BIẾN THIÊN CỦA DỮ LIỆU</b>



Tổng bình phương tồn phần (Total Sum of Squares)



Tổng bình phương hồi quy (Regression Sum of Squares)



Tổng bình phương sai số (Residual Sum of Squares)



(

)

2


1


<i>n</i>



<i>i</i>
<i>i</i>


<i>RSS</i>

<i>y</i>

<i>y</i>



=


=

å

$



-(

)

2


1


<i>n</i>


<i>i</i>
<i>i</i>


<i>TSS</i>

<i>y</i>

<i>y</i>



=


=

å



-(

)

2


1


<i>n</i>



<i>i</i>
<i>i</i>


<i>i</i>


<i>ESS</i>

<i>y</i>

<i>y</i>



=


</div>
<span class='text_page_counter'>(47)</span><div class='page_container' data-page=47>

RSS Tổng chênh lệch
ESS
SRF
Y
X
y<sub>i</sub>
X<sub>i</sub>


<b>Các tổng bình phương </b>


<b>độ lệch</b>





<i>i</i>


<i>y</i>



(

)

2
1


<i>n</i>



<i>i</i>
<i>i</i>


<i>RSS</i> <i>y</i> <i>y</i>


=


=

å

$


-(

)

2


1


<i>n</i>


<i>i</i>
<i>i</i>


<i>T SS</i> <i>y</i> <i>y</i>


=


=

å



-(

)

2


1


<i>n</i>



<i>i</i>
<i>i</i>


<i>i</i>


<i>ESS</i> <i>y</i> <i>y</i>


=


=

å

- $


</div>
<span class='text_page_counter'>(48)</span><div class='page_container' data-page=48>

<b>CÁC TỔNG BÌNH PHƯƠNG ĐỘ LỆCH</b>



Khi điểm quan sát càng gần đường thẳng ước lượng thì “độ
thích hợp” càng cao, có nghĩa là ESS càng nhỏ và RSS càng
lớn.


Tham số đo độ thích hợp:
R2 càng lớn càng tốt


ESS: biến thiên khơng giải thích được
RSS: biến thiên giải thích được


R2 nhỏ nghĩa là nhiều biến thiên của Y khơng giải thích được
bằng X. Cần phải thêm nhiều biến khác vào mô hình.


<i>�</i>

2

=

<i>���</i>



<i>���</i>




 


2


</div>
<span class='text_page_counter'>(49)</span><div class='page_container' data-page=49>

<b>HỆ SỐ XÁC ĐỊNH</b>



Coefficient of determination


Là tỷ lệ của tổng sự biến thiên trong biến phụ thuộc gây ra
bởi sự biến thiên của các biến độc lập (biến giải thích) so với
tổng sự biến thiên tồn phần.


Tên gọi: R_bình phương (R squared)
Ký hiệu:


Dễ thấy:

<i>R</i>

2

<i>RSS</i>



<i>T SS</i>



</div>
<span class='text_page_counter'>(50)</span><div class='page_container' data-page=50>

<b>HỆ SỐ XÁC ĐỊNH</b>



Đánh giá mơ hình tìm được có giải thích tốt cho mối liên
hệ giữa biến phụ thuộc Y và biến độc lập X hay khơng.


Là bình phương của hệ số tương quan mẫu


µ

(

)


(

)


µ

( )



( )


( )


2 2
2
2 2
2


2 <sub>2</sub> 2 <sub>2</sub>


2
2
2
<i>i</i>
<i>i</i>
<i>XY</i>


<i>x</i>

<i>x</i>

<i>x</i>

<i>x</i>



<i>RSS</i>


<i>R</i>



<i>T SS</i>

<i><sub>y</sub></i>

<i><sub>y</sub></i>

<i><sub>y</sub></i>

<i><sub>y</sub></i>



<i>R</i>

<i>r</i>



<i>b</i>

-

<i>b</i>



-=

=

=



-




-=



</div>
<span class='text_page_counter'>(51)</span><div class='page_container' data-page=51>

Tính chất của hệ số xác định R

2


• 0≤ R

2

<sub>≤1</sub>



• Cho biết % sự biến động của Y được giải thích bởi


các biến số X trong mơ hình.



• R

2

<sub> =1: đường hồi quy phù hợp hồn hảo</sub>



• R

2

<sub> =0: X và Y khơng có quan hệ</sub>



• R

2

<sub>càng lớn càng tốt</sub>



• Đối với dữ liệu chuỗi thời gian thì R

2

<sub>thường lớn hơn </sub>



0,9. Nếu thấp hơn 0,6 hay 0,7 thì xem là thấp



</div>
<span class='text_page_counter'>(52)</span><div class='page_container' data-page=52></div>
<span class='text_page_counter'>(53)</span><div class='page_container' data-page=53>

<b>ƯỚC LƯỢNG VÀ DỰ BÁO</b>



1. Ước lượng hệ số góc


2. Ước lượng hệ số chặn



3. Ước lượng phương sai sai số


4. Dự báo giá trị trung bình



</div>
<span class='text_page_counter'>(54)</span><div class='page_container' data-page=54>

<b>PHÂN PHỐI XÁC SUẤT CỦA </b>




Nhớ


Với độ tin cậy 95% thì:


µ


µ


( )

(

)


1 <sub>1</sub>


1


~<i>t n</i> 2


<i>Se</i>
<i>b</i> <i>b</i>
<i>b</i>


-2,5%
2,5% 95%


0,025 2


<i>t</i> <i>n </i>



0,025 2
<i>t</i> <i>n</i>

 

(

)

µ <sub>µ</sub>

( )

(

)


1 <sub>1</sub>
0,025 0,025
1
2 2


<i>t</i> <i>n</i> <i>t</i> <i>n</i>


<i>Se</i>
<i>b</i> <i>b</i>
<i>b</i>

-- - £ £

<sub>(</sub>

<sub>)</sub>

( )

µ µ

<sub>(</sub>

<sub>)</sub>

( )

µ


1 <i>t</i><sub>0,025</sub> <i>n</i> 2 <i>Se</i> <sub>1</sub> <sub>1</sub> 1 <i>t</i><sub>0,025</sub> <i>n</i> 2 <i>Se</i> <sub>1</sub>


</div>
<span class='text_page_counter'>(55)</span><div class='page_container' data-page=55>

<b>ƯỚC LƯỢNG CHO </b>



Tổng quát với độ tin cậy


2




2


<sub></sub>

<sub>1</sub><sub></sub> <sub></sub>

<sub></sub>






2


2


<i>t</i><sub></sub> <i>n</i> 




2


2


<i>t</i><sub></sub> <i>n</i>


 
µ

( )

( )

à

( )


2
2
1 1
1
<i>xx</i>
<i>x</i>
<i>Se</i> <i>V</i>
<i>n</i> <i>S</i>


<i>b</i> <i>b</i> <i>s</i>



ổ ử<sub>ữ</sub>
ỗ <sub>ữ</sub>
ỗ <sub>ữ</sub>
ỗ <sub>ữ</sub>

= = <sub>ỗ</sub> + ữ<sub>ữ</sub>
ỗ ữ
ỗ ữ<sub>ữ</sub>

ố ứ

(

)

µ <sub>µ</sub>

( )

(

)


1 <sub>1</sub>


2 <sub>1</sub> 2


2 2


<i>t n</i> <i>t n</i>


<i>Se</i>
<i>a</i> <i>a</i>
<i>b</i> <i>b</i>
<i>b</i>

-- - £ £

<sub>(</sub>

<sub>)</sub>

( )

µ µ

<sub>(</sub>

<sub>)</sub>

( )

µ


1 <i>t n<sub>a</sub></i> 2 <i>Se</i> <sub>1</sub> <sub>1</sub> 1 <i>t n<sub>a</sub></i> 2 <i>Se</i> <sub>1</sub>



<i>b</i> - - <i>b</i> £ <i>b</i> £ <i>b</i> + - <i>b</i>


</div>
<span class='text_page_counter'>(56)</span><div class='page_container' data-page=56>

<b>-CÔNG THỨC ƯỚC LƯỢNG </b>



Khoảng tin cậy của hệ số 

1


Trong đó:



 


^



<i>�</i>

2

=

<i>� ��</i>



(

<i>�− 2</i>

)



 


<i>�</i>

<sub>1</sub>

=

<i>�</i>

<i><sub>� /2</sub></i>

(

<i>�−2</i>

)

<i>.</i>

<i>�</i>

^

2

<i>.</i>

(

1



<i>�</i>

+



(

<i>�</i>

´

)

2


<i>�</i>

<i><sub>��</sub></i>

)



 


µ µ



</div>
<span class='text_page_counter'>(57)</span><div class='page_container' data-page=57>

<b>PHÂN PHỐI XÁC SUẤT CỦA</b>



Nhớ


Với độ tin cậy (1- ) thì:


µ


µ


( )

(

)


2 <sub>2</sub>


2


~<i>t n</i> 2


<i>Se</i>
<i>b</i> <i>b</i>
<i>b</i>


-/ 2

/ 2


1 






/2 2


<i>t</i><sub></sub> <i>n</i> 




/2 2


<i>t</i><sub></sub> <i>n</i>


 


(

)

µ <sub>µ</sub>


( )

(

)



2 <sub>2</sub>


/ 2 / 2


2


2 2


<i>t</i> <i>n</i> <i>t</i> <i>n</i>


<i>Se</i>
<i>a</i> <i>a</i>
<i>b</i> <i>b</i>


<i>b</i>

-- - £ £

<sub>(</sub>

<sub>)</sub>

( )

µ µ

<sub>(</sub>

<sub>)</sub>

( )

µ


2 <i>t</i> <i>n</i> 2 <i>Se</i> 2 <i>t</i> <i>n</i> 2 <i>Se</i>


<i>b</i> - - <i>b</i> £ <i>b</i> £ <i>b</i> + - <i>b</i>


µ


( )

( )

µ 2


2 2


<i>xx</i>


<i>Se</i> <i>V</i>


<i>S</i>
<i>s</i>


</div>
<span class='text_page_counter'>(58)</span><div class='page_container' data-page=58>

<b>CƠNG THỨC ƯỚC LƯỢNG </b>



Khoảng tin cậy

của hệ số 

2


Trong đó:



 



<i>�</i>

<sub>2</sub>

=

<i>�</i>

<i><sub>� /2</sub></i>

(

<i>�−2</i>

)

<i>.</i>

<i>�</i>

^

2

<i>.</i>

1



<i>�</i>

<i><sub>��</sub></i>


 


^



<i>�</i>

2

=

<i>� ��</i>



(

<i>�− 2</i>

)



 


µ

à



</div>
<span class='text_page_counter'>(59)</span><div class='page_container' data-page=59>

<b>CễNG THC C LNG </b>

<b>2</b>


ã Khong tin cậy của phương sai sai số


tổng thể:





2


2 2


/2 1 /2


;




2

2



<i>ESS</i>

<i>ESS</i>



<i>n</i>

<i>n</i>



 




<sub></sub>




 

<sub></sub>

<sub></sub>





</div>
<span class='text_page_counter'>(60)</span><div class='page_container' data-page=60>

<b>DỰ BÁO </b>



Cho X nhận giá trị là x0. Ta tiến hành dự báo:
Trung bình của Y khi X = x0. Ký hiệu: E(Y0|X0)
Giá trị cụ thể của Y khi X = x0. Ký hiệu:


Công thức chung:


</div>
<span class='text_page_counter'>(61)</span><div class='page_container' data-page=61></div>
<span class='text_page_counter'>(62)</span><div class='page_container' data-page=62></div>
<span class='text_page_counter'>(63)</span><div class='page_container' data-page=63>

<b>BỔ SUNG KIẾN THỨC VỀ PHÂN PHỐI XÁC SUẤT</b>



Phân phối chuẩn


Phân phối Student


</div>
<span class='text_page_counter'>(64)</span><div class='page_container' data-page=64>

<b>GIÁ TRỊ TỚI HẠN </b>

<b>2</b>

<b><sub>(n;</sub></b>

<b><sub>α)</sub></b>



Giá trị tới hạn mức α ( là số thực ký hiệu 2<sub>(n;)</sub><sub>sao cho với </sub>


Z~ 2<sub>(n) thì:</sub>




2

<i><sub>n</sub></i>

<sub>;</sub>



<i>P Z</i>





2 <i><sub>n</sub></i><sub>;</sub>


</div>
<span class='text_page_counter'>(65)</span><div class='page_container' data-page=65></div>
<span class='text_page_counter'>(66)</span><div class='page_container' data-page=66>

<b>GIÁ TRỊ TỚI HẠN </b>



Giá trị tới hạn mức α ( là số thực ký hiệu sao cho với Z~
(n) thì:




<i>Z t</i>

<i>n</i>;



<i>P</i>

<sub></sub>



   



     


 


;0 ;1


;0,5 ;1 ;


;


0



<i>n</i> <i>n</i>


<i>n</i> <i>n</i> <i>n</i>


<i>n</i>
<i>n</i>


<i>t</i>

<i>t</i>



<i>t</i>

<i>t</i>

<i>t</i>



</div>
<span class='text_page_counter'>(67)</span><div class='page_container' data-page=67></div>
<span class='text_page_counter'>(68)</span><div class='page_container' data-page=68>

<b>VÍ DỤ</b>



<b>Quan sát sự biến động của nhu cầu gạo Y (tấn/tháng) vào </b>
đơn giá X (ngàn đồng/kg) ta được các số liệu cho ở bảng.
Hãy lập mơ hình hơi quy mẫu biễu diễn mối phụ thuộc về
nhu cầu vào đơn giá gạo



<b>Xi</b>

<b>1</b>

<b>4</b>

<b>2</b>

<b>5</b>

<b>5</b>

<b>7</b>



</div>
<span class='text_page_counter'>(69)</span><div class='page_container' data-page=69>

<b>VÍ DỤ</b>


Ta lập bảng sau:


Ta có: 24 <sub>4</sub> 36 <sub>6</sub>


6 6


</div>
<span class='text_page_counter'>(70)</span><div class='page_container' data-page=70>

<b>VÍ DỤ</b>


Ta có:
1
2 <sub>2</sub>
2 2
1

. .


111 6.4.6


ˆ

<sub>1,375</sub>


120 6.(4)


.( )


<i>n</i>
<i>i</i> <i>i</i>
<i>i</i>
<i>n</i>
<i>i</i>
<i>i</i>


<i>Y X</i>

<i>n X Y</i>




<i>X</i>

<i>n X</i>














1 2


ˆ

<i><sub>Y</sub></i>

ˆ

<i><sub>X</sub></i>

<sub>6 ( 1,375).4 11,5</sub>



 

  



<i>i</i>


<i>i</i>

<i>X</i>



</div>
<span class='text_page_counter'>(71)</span><div class='page_container' data-page=71>

Giải hồi quy bằng máy


tính



1. Bật tần số: Shift+Mode+↓ +4+1 (Freq On


2. Chọn Mode Regression: Mode+3+2(chọn



A+Bx)




3. Nhập dữ liệu theo cột



4. Kiểm tra và nhấn AC thoát



</div>
<span class='text_page_counter'>(72)</span><div class='page_container' data-page=72>

Bài tập 1



Thu thập số liệu về điểm học tập của học sinh và


mức thu nhập hàng năm của bố mẹ ta có bảng số


liệu sau:



Hãy tìm hàm hồi quy mẫu và tính các đặc trưng


của nó



Xi: thu nhập (triệu/năm)


Yi: điểm trung bình



<b>Xi 45 60 30 90 75 45 10</b>



<b>5</b>

<b>60</b>



Yi 8,7



</div>
<span class='text_page_counter'>(73)</span><div class='page_container' data-page=73>

Bài tập 1



b) Với độ tin cậy 95% hãy ước lượng hệ số chặn,


hệ số góc và phương sai sai số.



c) Với độ tin cậy 90%, dự đốn điểm và điểm


trung bình khi thu nhập là 80




<b>Xi 45 60 30 90 75 45 10</b>



<b>5</b>

<b>60</b>



Yi 8,7



</div>
<span class='text_page_counter'>(74)</span><div class='page_container' data-page=74>

Bài tập 2



Số liệu về tỷ lệ lạm phát và lãi suất trong năm


2011 của 6 quốc gia như sau:



a) Ước lượng và viết phương trình hồi quy tuyến


tính



b) Tìm hệ số xác định và giải thích ý nghĩa



c) Dự đốn lãi suất trung bình khi lạm phát là


10%.



 


Lãi suất Y (%) 7 11 20 10 16 14


Lạm phát X


</div>
<span class='text_page_counter'>(75)</span><div class='page_container' data-page=75>

Bài tập 3


Cho bảng số liệu sau:



a) Tìm hệ số tương quan mẫu




b) Tìm phương trình hồi quy mẫu


c) Tính Sxx, Sxy, Syy



d) Tính TSS, RSS, ESS.



e) Tính các giá trị hồi quy và từ đó tìm ESS


f) Ước lượng cho với độ tin cậy 90%



 


X

4

7

8 15 8 12 14 20 16 9



</div>

<!--links-->

Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×