Chương
P H Â N T Í C H H Ò I Q U Y T Ư Ơ N G
bốn
Q U A N
V Ả D ự B Ả O K I N H
T É
1. H Ỏ I Q U Y V À T Ư Ơ N G Q U A N
C ă n cứ v à o m ứ c đ ộ chặt c h ẽ của quan h ệ giữa c á c b i ế n n g h i ê n
cứu c ó t h ể p h â n chia quan h ệ của c h ú n g t h à n h quan h ệ h à m v à quan
h ệ thống k ê .
Q u a n h ệ h à m : hai b i ế n n g ẫ u n h i ê n X v à Y đ ư ợ c g ọ i là p h ụ
thuộc h à m sô n ê u t ô n t ạ i f sao cho Y = f ( X ) tức là k h i đ ạ i l ư ợ n g X b i ế n
đ ổ i thì theo m ộ t quy tắc n à o đ ó c ó t h ể x á c đ ị n h được g i á trị t ư ơ n g ứ n g
đại lượng Y .
Q u a n h ệ t h ố n g k ê : hai b i ế n n g ẫ u n h i ê n X v à Y đ ư ợ c g ọ i là p h ụ
thuộc thống k ê n ế u m ỗ i g i á trị của X c ó t h ể x á c định đ ư ợ c quy luật
p h â n p h ố i x á c suất c ó đ i ề u k i ệ n của Y :
F(y/X
= x) = P(Y>y/X
= x)
(4.1)
Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một
h i ệ n t ư ợ n g b i ế n đ ổ i thì l à m cho h i ệ n t ư ợ n g liên quan b i ế n đ ổ i n h ư n g
n ó k h ô n g c ó ảnh h ư ở n g h o à n t o à n q u y ế t đ ị n h đ ế n sự b i ế n đ ổ i n à y .
P h â n t í c h t ư ơ n g q u a n đ o m ứ c đ ộ k ế t hợp t u y ế n t í n h giữa hai
b i ế n . T r o n g đ ó , k h ô n g c ó sự p h â n b i ệ t giữa c á c b i ế n . C á c b i ế n c ó t í n h
chất đ ố i x ứ n g .
149
Số hóa bởi Trung tâm Học liệu – ĐHTN
P h â n t í c h h ồ i q u y n g h i ê n c ứ u m ố i liên h ệ p h ụ t h u ộ c của m ộ t
b i ê n ( g ọ i là b i ế n p h ụ thuộc hay b i ế n đ ư ợ c g i ả i t h í c h ) v ớ i m ộ t hay
n h i ê u b i ê n k h á c (được g ọ i l à b i ế n đ ộ c l ậ p hay b i ế n g i ả i t h í c h ) .
1.1. Phân tích tương quan
M ụ c đ í c h của p h ư ơ n g p h á p p h â n t í c h t ư ơ n g quan là ư ớ c lượng
m ứ c đ ộ ả n h h ư ở n g của c á c b i ế n đ ộ c l ậ p v ớ i nhau ( c á c y ế u t ố n g u y ê n
n h â n ) . P h ư ơ n g p h á p n à y đ ư ợ c ứ n g dụng trong k i n h doanh v à k i n h tế
đ ê p h â n t í c h m ố i liên h ệ giữa hai hay n h i ề u b i ế n n g ẫ u n h i ê n .
H ệ sổ t ư ơ n g q u a n t ổ n g t h ể
H ệ số t ư ơ n g quan đ o l ư ờ n g m ứ c đ ộ quan h ệ t u y ế n t í n h giữa hai
b i ế n ; c h í n h x á c h o n là quan h ệ t u y ế n t í n h giữa hai b i ế n , k h ô n g p h â n
b i ệ t b i ế n n à y p h ụ thuộc v à o b i ế n kia. H ệ số t ư ơ n g quan n à y c ó t ê n gọi
là t ư ơ n g quan Pearson.
G i ả sử X v à Y là hai b i ể n n g ẫ u n h i ê n c ó V ( X ) > 0 v à V ( Y ) > 0,
thì h ệ số t ư ơ n g quan của hai b i ế n X v à Y đ ư ợ c x á c đ ị n h n h ư sau:
E\ự-Eự))(Y-Eự))}
J ĩ ự ỹ ự )
H ệ số t ư ơ n g quan c ó c á c t í n h chất sau: h ệ số t ư ơ n g quan k h ô n g
c ó đ ơ n vị v à c ó t í n h h o á n đ ổ i ( p
= Pyx). H ệ số t ư ơ n g quan l u ô n b i ế n
đ ộ n g trong k h o ả n g t ừ - Ì đ ế n Ì ( I p
| < 1 ) . H ệ số t ư ơ n g quan d ư ơ n g
cho b i ế t X v à Y c ó quan h ệ c ù n g c h i ề u v à h ệ số t ư ơ n g quan â m thì
n g ư ợ c l ạ i ) . H ệ số t ư ơ n g quan p
= ± 1 k h i v à chỉ k h i X v à Y c ó m ố i
quan h ệ p h ụ thuộc t u y ế n t í n h . N h ư v ậ y , c ó t h ể d ù n g p
đ ể đ o lường
sự p h ụ thuộc t u y ế n t í n h của hai b i ế n n g ẫ u n h i ê n , trị số của h ệ số t ư ơ n g
quan c à n g l ớ n thì m ố i quan h ệ t u y ế n t í n h c à n g r õ r à n g . N g ư ợ c l ạ i , k h i
p
= 0 tức là X , Y đ ộ c l ậ p nhau hoặc giữa X v à Y c ó quan h ệ phi
tuyến.
H ệ sổ t ư ơ n g q u a n m ẫ u
G ọ i ( X i , y i ) , ( x , y ) , . - , (x„, y„) là n cặp quan sát của hai b i ế n
2
2
150
Số hóa bởi Trung tâm Học liệu – ĐHTN
ngẫu n h i ê n X v à Y. H ệ số t ư ơ n g quan m ẫ u ( r ) của n cặp g i á trị quan
sát của hai b i ế n X v à Y t h ể h i ệ n bằng c ô n g thức sau:
k
k
ửnn
x
k
2 > , Ị >
v
2
.ry =
r
ự
(
k
2
V
Ị
Ì
2
i- 1
(4.3)
2\
(
Ả
t * .
/=1
n
2> , / » i=1
V
^
2\ í
t y .
=1
n
) ) V
) ì
T r ư ờ n g h ợ p m ô i cặp g i á trị (Xj, yì) x u â t h i ệ n v ớ i t â n suât rtij sao
k
cho
= w thì c ô n g thức t r ê n t r ở t h à n h :
;=1
*y =
2
n
r
k
f k
(4.4)
\ 2\
2\
.2
ĩ
1=1
n
/=1
i=l
A7
V
Bảng 4.1. T r ì n h b à y ý nghĩa của c á c h ệ s ô t ư ơ n g quan.
Bảng 4.1. Y nghĩa của hệ sô tương quan
T r i sô r
Quan h ệ giữa biến X và Y
r = 0
X v à Y đ ộ c l ậ p hoặc c ó quan h ệ p h i t u y ế n
|r|=l
X v à Y c ó quan h ệ t u y ế n t í n h
0,0< |r| < 0,3
X v à Y c ó quan h ệ y ế u
0,3< |r| < 0,5
X v à Y c ó quan h ệ trung b ì n h
151
Số hóa bởi Trung tâm Học liệu – ĐHTN
0,5 < |r| < 0,7
X v à Y c ó quan h ệ t ư ơ n g đ ố i chặt
0,7 < |r| < 0,9
X v à Y c ó quan h ệ chặt
0,9 < |r| < 1,0
X v à Y c ó quan h ệ rất chặt
H ệ số t ư ơ n g q u a n b ộ i v à h ệ số t ư ơ n g q u a n r i ê n g p h ầ n
Hệ số tương
quan
bội
H ệ s ô t ư ơ n g quan b ộ i đ á n h g i á m ứ c đ ộ chặt c h ẽ của m ô i liên hệ
giữa m ộ t t i ê u thức ( t h ư ờ n g là tiêu thức k ế t q u ả ) v ớ i c á c t i ê u thức còn
l ạ i ( t h ư ờ n g là tiêu thức n g u y ê n n h â n ) . C ô n g thức t í n h t ư ơ n g quan b ộ i
giữa b i ế n Y v à c á c b i ế n X i , x , . . , x
2
Hệ số tương
quan
riêng
n
như
sau
phần
(4.5)
yX|jr..jr„
2
ị
'
n y - ỹ )
V à t ư ơ n g quan r i ê n g p h ầ n giữa Y v à X2 ( l o ạ i t r ừ ảnh h ư ở n g của
X i ) t í n h theo c ô n g thức
yx (Jt|)
2
r
yx,
—rr
'yx x,x
2
(4.6)
2
T í n h t o á n h ệ sổ t ư ơ n g q u a n m ẫ u t r o n g E x c e l
T r ư ờ n g h ợ p m ẫ u quan s á t c ó t ầ n suất m t h ì c ó t h ể t í n h t o á n
t h ủ c ô n g theo c ô n g t h ứ c h o ặ c c h u y ể n t h à n h m ỗ i d ò n g ( c ộ t ) chỉ
c h ứ a m ộ t q u a n s á t ( m = 1). D ữ l i ệ u c ó t h ể b ố trí theo h à n g hoặc
theo c ộ t .
N ế u t í n h t o á n t h ủ c ô n g sử d ụ n g c ô n g thức hoặc c ó t h ể k ế t hợp
c á c h à m S Q R T , S U M P R O D U C T đ ể t í n h t o á n h ệ số t ư ơ n g quan r.
C ũ n g c ó t h ể sử d ụ n g c á c h à m thống k ê của Excel đ ể t í n h t o á n . C h ú ý
c á c h à m t h ố n g k ê của Excel k h ô n g t h ể t í n h t o á n v ớ i c á c m ẫ u quan sát
\
r
ì
I
r
t
t
CÓ tân s ô m Ỷ Ì n ê n đ ê sử dụng c ô n g thức c â n p h ả i b i ê n đ ô i d ữ l i ệ u đ ê
m ỗ i quan sát n ằ m t r ê n m ộ t h à n g (cột) trong Excel.
152
Số hóa bởi Trung tâm Học liệu – ĐHTN
H à m RSQ
H à m RSQ tính t o á n p h ư ơ n g sai m ẫ u ( r ) theo c ú p h á p :
2
= RSQ (known_y's;
known_x's)
Trong đó:
K n o w n _ y ' s : c á c g i á trị của m ẫ u quan sát y của b i ế n Y .
K n o w n _ x ' s : c á c g i á trị của m ẫ u quan sát X của b i ế n X .
Hàm CORREL
H à m C O R R E L t í n h t o á n t ư ơ n g quan m ẫ u (r) theo c ú p h á p :
= CORREL
ịarrayl;
array2)
Trong đ ó :
A ư a y l , array2: c á c g i á trị của m ẫ u quan sát X, y của hai b i ế n X
v à Y . T h ứ t ự của c á c t h a m số trong h à m RSQ v à h à m C O R R E L
k h ô n g quan trọng.
Sử
dụng trình
cài thêm
Correlatỉon trong gói Analysis
Toolpak-VBA
T r ì n h cài t h ê m C o r r e l a t i o n trong g ó i A n a l y s i s T o o l p a k - V B A
cho p h é p sử d ụ n g c ô n g c ụ p h â n t í c h t ư ơ n g quan v ớ i giao d i ệ n đ ồ h ọ a
trực quan d ễ thực h i ệ n .
T r u y cập t r ì n h c à i t h ê m t ừ menu
ToolsỊData Analysis chọn
C o r r e l a t i o n n h ư H ì n h 4. Ì
Hi
Anaỉysts Tools
3
Anova: Two-Factor Wíthout Rẹplicatiori
Covariance
belp
Desơiptrve stats&es
Exponentìal Smooh
tmg
F-Test Two-Sample for Variances
Pourier Analysis
Histogram
Moving Average
Random Nunber Generatìon
H ì n h 4 . 1 . Hộp thoại Data Analysỉs
input
ỉnput Ranọe;
Grouped By:
1
<• Colimns
Rpws
F \.abete in Rrst Row
Output optỉons
c Quít** Rartge:
&• Hem Worksheel 0y:
í" NBwWprtho<*
H ì n h 4.2. Hộp thoại
Correlation
153
Số hóa bởi Trung tâm Học liệu – ĐHTN
K h i c h ọ n Correlation v à nhấn O K , h ộ p t h o ạ i C o ư e l a t i o n xuất
h i ệ n đ ể nhập d ữ l i ệ u n h ư h ì n h 4.2. C á c l ự a c h ọ n của h ộ p
thoại
C o r r e l a t i o n n h ư sau:
+ Input Range: khai b á o v ù n g d ữ l i ệ u p h â n t í c h .
+ Grouped by : t ổ chức d ữ l i ệ u theo h ư ớ n g :
+ Columns: theo cột.
+ Rows: theo h à n g .
+ Labels i n First Row: d ò n g đ ầ u tiên của v ù n g d ữ l i ệ u là t ê n biến.
+ Output Range: g ó c trên b ê n trái của v ù n g chứa k ế t q u ả . V ù n g
n à y n ằ m t r ê n c ù n g m ộ t sheet v ớ i v ù n g d ữ l i ệ u .
+ N e w Worksheet Ply: trả k ế t q u ả ra m ộ t trang b ả n g t í n h khác
trong c ù n g m ộ t fíle v ớ i file chứa d ữ l i ệ u .
+ N e w W o r k b o o k : trả k ế t q u ả ra m ộ t f i l e r i ê n g .
V í d ụ 4.1
Đ ể n g h i ê n c ứ u quan h ệ giữa t u ổ i n g h ề ( y ) v à số sản p h ẩ m sai
h ỏ n g ( x ) của c ô n g n h â n trong p h â n x ư ở n g n g ư ờ i ta thống k ê ngẫu
n h i ê n 18 c ô n g n h â n , số l i ệ u thu đ ư ợ c n h ư trong b ả n g . T ì m t ư ơ n g quan
giữa t u ổ i n g h ề v à số sản p h ẩ m sai h ỏ n g .
H ì n h 4.3 t r ì n h b à y c á c h b ố trí d ữ l i ệ u k h i t í n h h ệ số t ư ơ n g quan r
sử d ụ n g c ô n g thức. Đ ộ c g i ả c ó t h ể sử d ụ n g h à m S U M P R O D U C T để
t í n h t o á n c á c g i á trị t r o n g c á c ô v ù n g E9:I9.
N h ư c ó t h ể t h ấ y t ừ H ì n h 4.3, h ệ số t ư ơ n g quan r = - 0,708 cho
thấy k h i t u ổ i n g h ề t ă n g cao thì sai sót trong lao đ ộ n g g i ả m đi v à giữa
t u ổ i n g h ề v à sai sót c ó m ố i quan h ệ k h á chặt v ớ i nhau.
H ì n h 4.4 t r ì n h b à y c á c h sử dụng h à m C O R R E L của Excel để
t í n h t o á n h ệ số t ư ơ n g quan sử d ụ n g số l i ệ u của ví d ụ . T r ì n h b à y hộp
t h o ạ i C o r r e l a t i o n k h i nhập d ữ l i ệ u v à k ế t q u ả t í n h t o á n h ệ số t ư ơ n g
quan sau k h i nhấp O K t r ê n h ộ p thoại C o r r e l a t i o n sử d ụ n g d ừ l i ệ u
trong H ì n h 4. Ì .
154
Số hóa bởi Trung tâm Học liệu – ĐHTN
A
B
c
D
E I f ầ G I H
I I J
1
2 ... . Ky
X
m
m*x m*Y mVy m*x"2
_3_
13
7
3
21 ị 39 273| 147 507
4
8
6
5
30
40 240! 180 320
A
9
10
4
40: 36 3601 40Õ 324
B
25
Ị
2
8
50 2Ò0Ì 32 1250
7
36
2
1
2
36
72
À 1296
_8_
19
2
3
6
57 1141 12 1083
.? tong
18 107 258 1259 775 4780
lõ
tử SỐ -15 26 CT= G9/D9-E9"F9/D92
VỊ.
Mâu BÓ 21 541 CT= SQRT|H9/D9-(E9©9)»2)*SQRT(I9C9-(F9/D9)2)
12
Ị
ì
.ỉ
13
r
-0 708
14
ị
A
A
H ì n h 4.3. Tính hệ số tương quan sử dụng các hàm cua
J_ iS .-Ạ. i .ạ . .. .
13 X
7
2 y
3
13
7
4
13
7
s_
8
6
6
8
6
7
8
6
B
8
6
9
8
6
lũ
9
10
11
9
10
12
9
13
9
10
14
25
4
15
25
4
16
36
2
17
19
2
18
19
2l
_Ị9
19
2
20
H ì n h 4.4. 77«/? /?ệ sớ tương
1 A 1
Hy
X
2
13
m
13
13
13
8
õ
8
á
8
o
'
B
0
ra
9;
11
9
ra
la
yQ
Ì
9
Ì
25
36
2
ó
15
9
ra
19
En
19
1 L m
ị.
rI -0 708
cõng thúc
L
E2=CORREL(A2 A19.B2 B19)
c
quan sử dụng hàm CORREL
B i c
Exceì.
tần
suất.
ũ
E 1 F 1
7
7
7
6
V
X
Bi
i
ì
6
X
-0 70639
1
- "— I^BHB
D 1•ỉhput— —
10 ĩnputRange;
âuupedByỉ
í" Bom
in
IU
17 Ld»lshfìr5tra
10
4
í 0}jtputRange:
2
lí*
4
2
<~ NewWorteh«et
2 ĩ
2
7
GI H
khi dữ liệu có
1
1 <* 1
Carai Ị
1
3
1
:-' •-•ị- 1 t
H ì n h 4.5 Tính toán hệ số tương quan sử dụng trình cài thêm
Correlation.
155
Số hóa bởi Trung tâm Học liệu – ĐHTN
1.2. K i ể m đ ị n h g i ả t h u y ế t v ề s ự t ồ n t ạ i của t ư ơ n g q u a n t ổ n g
thể
É
M Í
*
H ệ s ô t ư ơ n g quan của m ẫ u rát h ữ u ích k h i d ù n g đ ê m ô t ả tính
chặt c h ẽ của m ố i quan h ệ t u y ế n t í n h trong m ộ t m ẫ u . Vì v ậ y , n ó c ó thể
d ù n g l à m c ơ sở cho k i ể m định g i ả thuyết của t ổ hợp k h ô n g t u y ế n tính
( k h ô n g t ư ơ n g quan) trong tổng t h ể .
Đ e k i ể m định v ề sự t ồ n t ạ i của h ệ số t ư ơ n g quan của t ổ n g thể
c â n k i ê m định cặp g i ả thuyết sau:
G i ả thuyết Ho:
p=0
Đ ố i thuyết H i : p ^ O
G i á trị k i ể m định t đ ư ợ c t í n h theo c ô n g thức n h ư sau:
/ = - =
=
(4.7)
Trong đó:
r: h ệ số t ư ơ n g quan m ẫ u .
n : số quan sát trong m ẫ u .
M i ề n b á c b ỏ g i ả t h u y ế t Ho là hay |t| > t(n-2 OI li) • T r o n g đ ó (X là
m ứ c ý nghĩa của k i ê m định; t(n-2 a li) là p h â n p h ô i student v ớ i x á c suât
a/2 v à bậc t ự do n-2.
T r o n g Excel sử d ụ n g h à m t h ô n g k ê T I N V đ ê t í n h t o á n p h â n p h ô i
student v ớ i c ú p h á p sau:
= TlNVịprobability;
deg_freedom)
Trong đó:
Probability: x á c suất của p h â n p h ố i student.
D e g _ f r e e d o m : bậc t ự do của p h â n p h ố i student.
C h ủ ý : H à m T I N V t r o n g Excel đ ư ợ c t h i ế t k ế cho k i ể m đ ị n h hai
p h í a ( T w o - t a i l e d test). N ó i c á c h k h á c h à m T I N V trả v ề g i á trị t sao
cho P ( | X | > t ) = probability. V ì v ậ y k h i sử d ụ n g T I N V đ ể k i ể m đ ị n h hai
156
Số hóa bởi Trung tâm Học liệu – ĐHTN
phía, nhập t h a m số Probability bằng mức ý nghĩa a. K h i sử d ụ n g k i ể m
định m ộ t p h í a (One-tailed test) nhập Probability b ằ n g hai l ầ n m ứ c ý
nghĩa a.
V í d ụ 4.2
Sử d ụ n g d ữ l i ệ u của V í d ụ 4 . 1 . Ở m ứ c ý nghĩa 5% h ã y k i ể m
định g i ả thuyết r ằ n g t ổ n g t h ể c ó m ố i quan h ệ giữa t u ổ i n g h ề v à p h ế
phẩm?
C ó t t í n h t o á n theo c ô n g thức là -4.015. Tra b ả n g p h â n p h ố i
student v ớ i m ứ c ý nghĩa (X = 0.05 v à bậc t ự do n-2 = 16 đ ư ợ c
2.1199.
V ậ y |t| > t tra b ả n g n ê n b á c b ỏ Ho. N ó i c á c h k h á c k ế t l u ậ n v ề d ữ l i ệ u
đ i ề u tra m ẫ u c ó t h ể á p d ụ n g cho tổng t h ể v ớ i x á c suất m ắ c sai l ầ m 5%.
r
V(l-r )/(«-2)
2
-0.70839
= -4.015
yjạ-0J0$39 )/l6
2
H ì n h 4.6 t r ì n h b à y c ô n g thức t í n h t o á n k i ể m đ ị n h g i ả thuyết v ề
Á•
t y
9
m ô i t ư ơ n g quan g i ữ a t u ồ i n g h ê v à sai h ỏ n g k h i gia c ô n g sản p h à m v ớ i
mức ý nghĩa 5%.
1 ỉ
bĩ- y
A
X
13
13
13
8
8
8
8
8
9
9
9
9
25
25
36
19
19
19
l
i
'
7
V
X
7
1
1
7
X
-Ũ.7D839
1
6
6t
-4.01454
côngthức
6 t tra bảng 2.119905
E7=
E4/SQRT((1 -E4»2)/(COUNT(B2: B19)-2))
6
E8=
TINV(ũũ5,COUNT(B2:B19)-2) '
ệ
6
10
HO: r=0
10
HI: r ó c
10
có hi > t tra báng _bác bò HO
10
4
4
2
2
2
2
H ì n h 4.6. Kiểm
định giả thuyết
về sự tồn tại hệ sổ tương
quan.
157
Số hóa bởi Trung tâm Học liệu – ĐHTN
2. H Ồ I Q U Y T U Y Ê N T Í N H Đ Ơ N
2.1. C ơ b ả n về h ồ i quy tuyến tính đ ơ n
D ạ n g đ ơ n g i ả n nhất của m ộ t m ô hình h ồ i quy chứa m ộ t biến
phụ thuộc ( c ò n g ọ i là " b i ế n được giải t h í c h " , " b i ế n n ộ i sinh", hay
" b i ế n - Y " ) và m ộ t b i ế n độc lập đ ơ n (còn g ọ i là " b i ế n g i ả i t h í c h " , "biến
ngoại sinh" hay " b i ế n - X " ) .
P h ư ơ n g trình h ồ i quy t u y ế n tính đ ơ n c ó thể b i ể u d i ễ n theo dạng:
Y=p +Ị$ x
ũ
(4.8)
x
Trong thực tế không chỉ có biến X ảnh hưởng đến Y mà còn có
c á c y ế u t ố n g ẫ u n h i ê n k h á c ảnh h ư ở n g đ ế n Y n ê n p h ư ơ n g trình 4.8
được v i ế t t h à n h :
Y =p
ữ
+ p,x
+
e
(4.9)
Trong đó e là các sai số.
T r o n g thống k ê v à trong k i n h tế lượng, n g ư ờ i ta sử dụng p h ư ơ n g
p h á p b ì n h p h ư ơ n g cực t i ể u đ ể ước lượng c á c h ệ số Po v à p Ì theo công
thức sau:
à =•
i=\
i=\
(
(4.10)
Ý
" I X ĩ * .
1=]
V'=I
)
H ệ số chặn Po đ ư ợ c ước lượng theo c ô n g thức:
p =Ỹ-p,X
(4.11)
ữ
T r o n g đ ó /?
0
v à /?, đ ư ợ c g ọ i là c á c ước lượng đ i ể m của po v à P|.
TSS (Total Sum of Square) là tổng bình phương của tất các sai
lệch giữa giá trị quan sát Y j v à giá trị trung bình của c h ú n g .
TSS=£(Y,-ỹ)
2
158
Số hóa bởi Trung tâm Học liệu – ĐHTN
ESS (Explained Sum o f Square) là tổng bình p h ư ơ n g của tất cả
các sai lệch giữa g i á trị của b i ế n phụ thuộc Y nhận được t ừ h à m h ồ i
quy m â u v ớ i g i á trị trung b ì n h của c h ú n g . Phần n à y đ o đ ộ c h í n h xác
của h à m h ồ i quy.
ESS=£(Ỹ-F)
2
RSS (Residual Sum of Square) là tổng bình phương của tất cả các
sai lệch giữa giá trị quan sát Y v à giá trị nhận được t ừ h à m h ồ i quy.
Rss=ỵe;=ỵự -Ỹ yl
l
l=\
Khi đó:
i=l
T S S = ESS+ RSS
Nên / = -ì ~?l trong đó s và Sy là phương sai mẫu của X và Y.
«?(/?,)
2
2
x
H ệ sô r đ o đ ộ p h ù hợp của m ô h ì n h hôi quy.
i(Ỹ>-ỹ)
2
2_ t t
>
ự
Ỳ ( r , - Ỹ )
1=1
ESS
=
2
T
S
S
RSS
=
~
T
S
S
2
đ o tỉ l ệ của t o à n b ộ sai lệch của Y v ớ i g i á trị trung b ì n h của
c h ú n ^ đ ư ợ c g i ả i t h í c h b ằ n g m ô hình. Do v ậ y r đ ư ợ c sử dụng đ ể đ o đ ộ
thích hợp của h à m h ồ i quy.
2
2.2. Khoảng tin cậy và kiểm định giả thuyết trong hồi quy
tuyến tính đ ơ n
Theo các giả thiết của phương pháp bình phương cực tiểu thì
à ~ (0o> ị);
N
ơ
Ằ ~ (fì> ị)•
N
ước lượng không chệch của ơ
ơ
2
D
o
c
h
ư
a
biết ơị
và ơị
nên sử dụng
là ở . K h i đó các thống kê:
2
, Ã-go. t ằz£±
=
=
có phân bố T (n-2). Do đó khoảng tin cậy của các hệ số hồi quy như
sau:
159
Số hóa bởi Trung tâm Học liệu – ĐHTN
K h o ả n g t i n c ậ y c ủ a Po
V ớ i h ệ số t i n c ậ y ( Ì - oe) t ì m được t a 12 (n-2) t h ỏ a m ã n k h o ả n g
tin cậy ( Ì - a ) của Po là:
[(Ã-t n(n-2)se(ịyj
a
+ /
0
B / 2
(#I-2)«?(Ã))]
K i ể m đ ị n h g i ả t h u y ế t đ ố i v ớ i Po
Loại giả thuyết
Giả thuyết
gốc Ho
Giả thuyết
thay t h ế H i
Hai phía
Po = Po*
PoỶ 3o*
ít 1 > t«12 (n-2)
Phía phải
P o < Po*
Po>í3o*
t>ta(n-2)
P h í a trái
Po>Po*
Po
t<-t«(n-2)
Miền bác bỏ
K h o ả n g t i n c ậ y c ủ a Pi
T ư ơ n g t ự n h ư đ ố i v ớ i Po khoảng t i n c ậ y của (31 l à
[(Ã - t
{n-2)se{ị);ị +/
a n
a / 2
(n-2)«(Ã))]
K i ể m đ ị n h g i ả t h u y ế t đ ố i v ớ i Po
Giả thuyết
Loại giả thuyết
gốc Ho
Giả thuyết
thay t h ế H i
Miền bác bỏ
Hai phía
p. = 3 i *
Phía phải
P i < Pi*
P.>Pi*
t>t (n-2)
P h í a trái
Pi>3i*
3i<3i*
t<-t (n-2)
ít 1 > t „ 12 (n-2)
a
a
3. H Ồ I Q U Y T U Y Ể N T Í N H B Ộ I
3.1. C ơ b ả n v ề h ồ i quy tuyến tính b ộ i
H à m h ồ i quy t u y ế n t í n h tổng t h ể c ó dạng:
Y =/ĩ +/ỉ X +...
l
0
ị
ìl
+ /ỉ X +U
k
kl
i
(4.12)
160
Số hóa bởi Trung tâm Học liệu – ĐHTN
T r o n g đ ó Po là h ệ số t ự do ( h ệ số chặn), pi ( i = Ì ,..,k) là c á c h ệ số
h ồ i quy r i ê n g .
H à m h ồ i quy m ẫ u c ó dạng:
Y =fi +fi X +fi X +... + ĩ X +e, (4.13)
l
Q
Ị
íl
i
ĩt
ki
ki
Mô hình này nói lên mức độ phụ thuộc tuyến tính của biến phụ
thuộc Y ( đ ạ i l ư ợ n g cần n g h i ê n cứu) v ớ i c á c b i ế n độc l ậ p ( X j j ) , ej là sai
sô n g ẫ u n h i ê n g â y ra v ớ i sai l ệ c h của y v ớ i giá trị trung b ì n h của n ó .
Đ ố i v ớ i m ô h ì n h n à y n g ư ờ i ta chấp n h ậ n g i ả định c á c b i ế n đ ộ c l ậ p
k h ô n g c ó m ố i t ư ơ n g quan v ớ i nhau v à p h ư ơ n g sai k h ô n g đ ổ i . M ô h ì n h
h ồ i quy t u y ế n tính b ộ i đi qua g i á trị trung b ì n h của n ó . C á c ư ớ c l ư ợ n g
• p, ước l ư ợ n g được là c á c ư ớ c l ư ợ n g k h ô n g chệch c ó p h ư ơ n g sai n h ỏ
nhất trong c á c l ó p ước l ư ợ n g k h ô n g chệch của Pi. T r o n g c á c t r ư ờ n g
hợp n g h i ê n cứu cụ t h ể n g ư ờ i ta t h ư ờ n g t i ế n h à n h p h â n tích p h ư ơ n g sai
v à p h â n t í c h t ư ơ n g quan trước đ ể t h ă m d ò dạng của quan h ệ p h ụ thuộc
v à k i ể m tra xem c ó x ả y ra h i ệ n t ư ợ n g t ự t ư ơ n g quan, đ a c ộ n g t u y ế n
hay p h ư ơ n g sai thay đ ổ i hay k h ô n g . Đ ể k i ể m tra, t h ư ờ n g sử d ụ n g t h ủ
tục k i ê m định D o l b i n W a t s e m .
V i ệ c t í n h t o á n c á c h ệ số h ồ i quy của h ồ i quy b ộ i k h á phức tạp.
Ví d ụ , v ớ i m ô h ì n h h ồ i quy 2 b i ế n đ ộ c l ậ p ( X i , x ) . C á c h ệ số p , Pi
2
2
Po đ ư ợ c ư ớ c l ư ợ n g theo c á c c ô n g thức sau:
í n
\
í"
Ỵ y, 2,
Ẻ 4
V/=I
ỉ V /=1
) V '=1
; V, '=1
2
í "
í " 2
4
t 4
t * . Xu
( ỉ
Ị
)
V 1=1
/
í »
í »
Ỹ,y, 2,
ỉ
Ì
í 2i u
1
) VV i=l
V /=1
)
V I=\
\ (»
\2
("
ì
x
J
x
x
i*ỉ, ị ± 4
V<=I
J V /=1
k = Y - p , X , - P
2
X
)
\
x
)
/
2
161
Số hóa bởi Trung tâm Học liệu – ĐHTN
Trong đ ó :
y =Y -Ỹ; x, =X
i
i
i
l
i
-X ;x
I
2
j
=X
2
i
-X
2
3.2. K i ể m đ ị n h s ự p h ù h ọ p c ủ a m ô h ì n h h ồ i q u y b ộ i
T r o n g m ô h ì n h h ồ i quy b ộ i , h ệ số x á c đ ị n h b ộ i R đ ư ợ c x á c định
theo c ô n g thức:
2
R =^- (4.15)
2
TSS
'
Do k h ô n g t h ể d ù n g R l à m tiêu chuẩn đ ể xem xét việc đ u a t h ê m hay
k h ô n g đ ư a thêm biến v à o m ô hình, n ê n n g ư ờ i ta đ ư a ra m ộ t h ệ số x á c định
2
bội đ ã điều chinh (Ạịusted R Square) k ý hiệu R v à tính theo công thức:
1
ĩ
1
I
(4 ,6)
'- -( -*Vhĩ -
c ò n t ă n g t h ì c ò n p h ả i đ ư a t h ê m b i ế n m ớ i v à o m ô hình
2
Khi R
h ồ i quy.
K i ể m đ ị n h g i ả t h u y ế t v ề sự p h ù h ợ p của m ô h ì n h b à n g tiêu
chuẩn F đ ư ợ c t í n h theo c ô n g thức:
R {k-2)
2
(l-R )(n-k-l)
2
(
1
7
)
V ớ i g i ả thuyết:
2
H :R
0
= 0.
2
H,:R >0.
M i ề n b á c b ỏ Ho la F > F« ( k , n-k-1) v ớ i k là số b i ể n đ ộ c l ậ p .
3.3. K h o ả n g t i n c ậ y v à k i ể m đ ị n h g i ả t h u y ế t c ủ a m ô h ì n h h ồ i
quy b ộ i
V i ệ c k i ể m đ ị n h g i ả thuyết v à khoảng t i n c ậ y của m ô h ì n h h ồ i
quy b ộ i t i ế n h à n h t ư ơ n g t ự n h ư m ô h ì n h h ồ i quy đ ơ n . T i ê u c h u ẩ n k i ể m
Ổ, - ổ'
.
định là / = — — Ọ - v ớ i m i ê n b á c bỏ sau:
SeiP)
162
Số hóa bởi Trung tâm Học liệu – ĐHTN
Loại giả thuyết
Ho
Hi
M i ề n bác bỏ
Hai p h í a
0i = 3i*
Di * 3i*
| t | > t a | 2 (n-k-1)
B ê n trái
Pi > 3i*
ft
t<-t (n-k-l)
Bên phải
Pi < Pi*
Pi > Pi*
a
t>t (n-k-l)
a
4. H Ồ I Q U Y P H I T U Y Ê N
H ồ i quy phi t u y ế n sử d ụ n g p h ư ơ n g p h á p b ì n h p h ư ơ n g cực t i ể u
phi t u y ế n . T u y n h i ê n v i ệ c ước l ư ợ n g c á c h ệ số n à y k h á phức tạp.
*
r
i
r
t
Trong n h i ê u t r ư ờ n g hợp, n ê u c ó t h ê đ ư ợ c n g ư ờ i ta t ì m c á c h b i ế n đ ổ i
các p h ư ơ n g t r ì n h phi t u y ế n t h à n h p h ư ơ n g t r ì n h t u y ế n t í n h đ ể d ễ d à n g
h ồ i quy.
V ớ i p h ư ơ n g t r ì n h hyperbol dạng y = a/x, đặt 1/x = z đ ể đ ư a v ề
p h ư ơ n g trình y = az v à t i ế n h à n h h ồ i quy t u y ế n t í n h đ ơ n .
V ớ i p h ư ơ n g t r ì n h parabol dạng y = a x
2
+ b x + c đặt Zi = X ,
2
Z2 = X đ ể đ ư a v ề p h ư ơ n g t r ì n h h ồ i quy b ộ i y = azi + ỒZ2 + c.
V ớ i h à m sản x u ấ t C o b b Douglas c ó dạng:
Y=AX, ...Xi
b ,
b 2
...X
b n
n
Trong đó:
Y là k ế t q u ả sản x u ấ t .
Xi,..., Xi,..., x
n
là m ứ c đ ầ u t ư c á c y ế u t ố sản xuất (đất đ a i , lao
động,...).
t r i
I*'
:. "ị
CÓ t h ê b i ê n đ ô i t h à n h h à m t u y ê n t í n h b ă n g c á c h logarit h ó a hai
vế và đưa về dạng:
In Y = In A + b | l n X , +....+ bn In x „ .
K h i đ ó sử d ụ n g c á c c ô n g thức ước l ư ợ n g c á c tham số của h ồ i
quy b ộ i đ ể h ồ i quy.
163
Số hóa bởi Trung tâm Học liệu – ĐHTN
5. Q U Y T R Ì N H P H Â N T Í C H H Ồ I Q U Y T R O N G
EXCEL
5.1. P h â n tích hồi quy đ ơ n trong Excel
Sử dụng h à m SLOPE và I N T E R C E P T để ước lượng
các
t h a m số c ủ a h à m h ồ i q u y đ ơ n
H à m S L O P E d ù n g đ ể ư ớ c l ư ợ n g h ệ số g ó c ( p i ) của p h ư ơ n g
t r ì n h y = Po + p i x . C ú p h á p của h à m S L O P E n h ư sau:
=SLOPE(Known_y's;
known_x's)
Trong đó:
K n o w n _ y ' s : giá trị quan sát của b i ế n p h ụ thuộc y.
K n o w n _ x ' s : giá trị quan sát của b i ế n đ ộ c l ậ p X.
H à m I N T E R C E P T d ù n g đ ể ư ớ c l ư ợ n g h ệ số t ự do Po của
p h ư ơ n g t r ì n h h ồ i quy bậc nhất theo c ú p h á p :
=INTERCEPT(Known_y';
known_x's).
V í d ụ 4.3
T h ố n g k ê g i á trị sản x u ấ t v à t i ê u t h ụ đ i ệ n n ă n g trong 12 t h á n g
n g ư ờ i ta thu đ ư ợ c c á c số l i ệ u sau
Tháng
1
2
3
4
5
6
7
8
9
10
li
12
Giá trị
sản
xuất
(triệu
ÙSD)
4,51
3,58
4,3]
5,06
5,64
4,99
5,29
5,83
4,71
5,61
4,91
4,19
Điện
năng
tiêu
thụ
(triệu
KWh)
4,28
2,26
2,47
2,77
2,99
3,05
3,18
3,46
3,03
3,26
2,67
2,53
B i ế t g i á trị sản xuất ( y ) c ó quan h ệ v ớ i đ i ệ n n ă n g t i ê u t h ụ ( x )
theo d ạ n g y = Po + P i * . H ã y ước l ư ợ n g c á c tham số Po v à P|.
164
Số hóa bởi Trung tâm Học liệu – ĐHTN
H ì n h 4.7 trình b à y c á c h nhập số l i ệ u v à o Excel v à sử dụng h à m
S L O P E , I N T E R C E P T đ ể ước lượng các tham số của h à m h ồ i quy đ ơ n .
_L
2
3
4
5
6
ĩ
B
9
10
11
12
13
14
15
16
A
I
B
I
c
1 D
mm
ịì
F
I
G
H
V
X
Giả trị Điện
Tháng sản xuất nâng
(triệu tiêu thụ
1 451
248
betaũ 0 3037
2
3 58 2.26
beta 1 1,6101
3 4.31
2.47
4
5.06
2.77
Cônq thúC
'
5 5.64
2.99
6 4.99
305
F4=INTERCEPTỊI34:B15,C4:C15)
7 529
3.18
|F5=SLO E(B4:B 15.C4:C15)
8
5.83
3.46
9 471
3.03 Hâm hôi quy mẩu
10
561
3.26
y=0.3037+1.6101<
11 4.91
2 67
12 4.19
253
"'"
Ị
Ị—:_|
D
H ì n h 4.7. Sử dụng hàm của Excel để ước lượng
hồi quy đơn.
các tham số của
hàm
S ử d ụ n g t r ì n h c à i t h ê m Regression đ ề p h â n t í c h h ồ i q u y đ ơ n
T r ì n h cài t h ê m Regression n ằ m trong gói phần m ề m A n a l y s i s
T o o l p a k - V B A v à đ ư ợ c truy cập t ừ menu T o o l s I D a t a A n a l y s ỉ s I
Regression n h ư h ì n h 4.8. Ý nghĩa t ù y c h ọ n v à c á c n ú t l ệ n h của h ộ p
thoại Regression t r ì n h b à y trong b ả n g 4 . 1 .
Regression không chỉ cho các ước lượng điểm của các tham số
h ồ i q u ỵ m à c ò n cho c á c tham số thống k ê đ ể k i ể m định m ô h ì n h h ồ i
quy, đ ê p h â n tích p h ư ơ n g sai ư ớ c l ư ợ n g k h o ả n g của c á c tham số trong
m ô h ì n h h ồ i q u ỵ . Sử d ụ n g t r ì n h Regression cho p h é p h ồ i quy t u y ế n
tính b ộ v ớ i số b i ế n t ố i đ a là 16.
V í d ụ 4.4
Sử d ụ n g c á c số l i ệ u của ví d ụ 4.3
T h ố n g k ê g i á trị sản x u ấ t v à tiêu t h ụ đ i ệ n n ă n g trong 12 t h á n g
n g ư ờ i ta thu đ ư ợ c c á c sô l i ệ u n h ư bảng 4. B i ế t giá trị sản x u ấ t ( y ) co
quan h ệ v ớ i đ i ệ n n ă n g tiêu t h ụ ( x ) theo dạng y = po + p|X. H ã y ước
l ư ợ n g c á c tham s ô của h à m h ồ i quy, k i ể m định sự p h ù hợp cua m ô
h ì n h h ồ i quy v à k i ể m đ ị n h c á c tham số của m ô h ì n h .
165
Số hóa bởi Trung tâm Học liệu – ĐHTN
Tháng
1
2
3
4
5
6
7
8
9
10
li
12
Giá tri
sản
xuất
(triệu
USD)
4,51
3,58
4,31
5,06
5,64
4,99
5,29
5,83
4,71
5,61
4,91
4,19
Điện
năng
tiêu
thụ
(triệu
KWh)
4,28
2,26
2,47
2,77
2,99
3,05
3,18
3,46
3,03
3,26
2,67
2,53
Input
IrputltRange:
r t«òets
r Constart 6 2«o
r* CoítldenceLevel: p %
ouput options
í~ ôutput R**75:
í*" NewWorìuheet0y:
í" NewWortxx*
r standardxed Resduab r R«sduaể Ptots
r l|r«FlPtats
Nạmal ProbaMty
r iloniulProtaMtrMots
H ì n h 4.8. //ộ/? thoại
B ả n g 4.2. Ỷ nghĩa
Input X Range:
Regression.
các tùy chọn của hộp thoại
Tên nút
Input Y Range:
Cancd Ị
Hét J
1
1
lư" Labels
Regressỉon
Ý nghĩa
V
4
V ù n g chứa b i ế n
p h ụ thuộc Y .
V ù n g chứa b i ế n
c á c b i ế n d ó c láp
X.
Chọn tùy
này nếu
đẩu
tiên
chọn
dòng
của
166
Số hóa bởi Trung tâm Học liệu – ĐHTN
Ý nghĩa
Tên nút
vùng d ừ liệu có
chứa t ê n b i ế n .
C h ọ n t ù y chọn
n à y n ế u b ỏ qua
r~ Constant is Zero
Í3O(Í3O = 0 ) .
r~ ConẠdence Level:
ị
%
Chọn mức đ ộ t i n
cậy của h à m h ồ i
quy ( m ặ c định
95%).
ứ OutputRange:
!
Ô đ ầ u tiên b ê n
trái v ù n g k ế t q u ả
k h i k ế t q u ả trên
c ù n g m ộ t sheet
với
vùng
dữ
liệu.
<• New VVorksheet Ply:
ị
K ế t quả hiển thị
t r ê n m ộ t sheet
riêng.
K ế t quả hiển thị
trên
một
fíle
Excel k h á c .
f New Workbook
-Kesiơuals
r~ Residuals
V standardized Residuals
r~ Residual Plots
r* LỊne Fit Plots
ị
C á c t ù y chọn
h i ể n thị sai số.
H ì n h 4.9 t ó m t ắ t c á c tham số thống k ê do Regression trả v ề .
H ì n h 4.10 h i ể n thị k ế t q u ả p h â n - t í c h p h ư ơ n g sai do Regression
trả v ề .
167
Số hóa bởi Trung tâm Học liệu – ĐHTN
SUMMARY OUTPUT
Tóm tắt các kết quả
Regression Statistics
Multiple R
0.89582697
R Square
0.80250596
Ađjusted R Square
0.78275655
Standard Error
0.31053857
Observations
12
Thống kê hồi quy
Hệ số tương quan r
Hệ số xác định r2
Hệ số xác định điều Chĩnh
Sai số chuẩn
Số quan sát
H ì n h 4.9. Tóm tắt cóc tham số thống kê do regressỉon
trả về.
ANOVA
di
Regression
Residual
ì Tót ai
1
lũ
11
ss
3918549641
0.964342025
4882891667
H ì n h 4.10. Phân tích phương
MS
F
Siqniíicance F
3918549641 40.63444
8.09269E-05
0 096434203
sai do Regression
trả về.
Trong Hình 4.10, bậc tự do của hồi quy (dòng Regression cột
d í ) là Ì , bậc t ự do của sai số ( d ò n g Residual c ộ t d í ) l à l o . T ổ n g bình
p h ư ơ n g c á c sai l ệ c h do h ồ i quy ( d ò n g Regression c ộ t s s - ESS) là
3,918. T ổ n g b ì n h p h ư ơ n g c á c sai l ệ c h do n g ẫ u n h i ê n ( d ò n g Residual
cột s s - RSS) là 0.96. P h ư ơ n g sai t ư ơ n g ứ n g của c á c chỉ tiêu đ ó cho
trong c ộ t M S . C ộ t F cho p h â n p h ố i F đ ể k i ể m định sự p h ù h ợ p của m ô
h ì n h h ồ i quy. G i á trị S i g n i í ĩ c a n c e F cho b i ế t x á c suất đ ể F n h ỏ h ơ n
f«(k,n-k-l)..
ế
*
r
r
ì
H ì n h 4.11 t r ì n h b à y k é t q u ả h ô i quy v à c á c tham s ô t h ô n g k ê đê
k i ể m đ ị n h c á c tham số của m ô h ì n h h ồ i quy.
Intercept
ìx Variable 1
Coetíiàents Standard Error tSlat
P-value Lower95ftí Upper 95%
0.303683778
0 724391526
0419226023 0.683914 -1.310361117 ì 917728674
1 610125759
0.252587973
B 374514741 8.09E-05 1 0473246842 172926833
H ì n h 4.11. Kết quả hồi quy do Regression
cung
cấp.
Từ Hình 4.11 thấy ràng hệ số tự do (Intercept) Po = 0. 3036,
Se( po) = 0,724. T h ố n g k ê t (t Stat) là 0,419. G i á trị P-value cho biết
x á c suất đ ể t < t Ji ( n - k - 1 ) . C á c c ộ t L o w e r 9 5 % v à U p p e r 9 5 % cho
b i ế t k h o ả n g t i n cậy của h ệ số h ồ i quy. H ì n h 4.12 h i ể n t h ị k ế t q u ả k h i
c h ọ n R e s i d u a l trong h ộ p t h o ạ i Regression.
168
Số hóa bởi Trung tâm Học liệu – ĐHTN
K i ể m đ ị n h s ự p h ù h ọ p của m ô h ì n h h ồ i q u y
Giả thuyết Ho: R = 0.
2
Giả thuyết Hi: R ^0.
2
RESIDUAL OUTPUT
Observation P
1
2
3
4
5
6
7
8
9
10
11
12
redicted Y
4.29679566
3.942567993
4.280694402
4.76373213
5.117959797
5.214567342
5.423883691
5.874718904
5.182364827
5.552693752
4.602719554
4.377301948
Residuals
Standard
Residuals
Ũ.2132Ũ434
0.720073514
-0.362567993
-1.224532337
0.029305598
0.098976337
0.29626787
1.00061118
0.522040203
1.763131668
-0.224567342
-0.758450768
-0.133883691
-0.452177005
-0.044718904
-0.151033032
-0.472364827
-1.595358711
0.057306248
0.193545364
0.307280446
1.037804908
-0.187301948
-0.632591118
-I
Hình 4.12. Két quả phân tích sai sổ do Regression trả về.
Căn cứ vào kết quả phân tích phương sai trong Hình 4.10 cho
thấy S i g n i í ĩ c a n c e F = 8,09E-05 < oe = 5 % k ế t l u ậ n m ô h ì n h là p h ù h ợ p .
Cũng c ó t h ể sử d ụ n g h à m F I N V đ ể tra p h â n p h ố i f a (k, n-k-1) theo c ú
pháp:
=FINV(probability; deg_freedoml; deg_freedom2)
Trong đ ó :
Probability: xác suất (mức ý nghĩa a.)
Deg_freedoml: bậc tự do Ì (đối với hồi quy đơn là 1.)
Deg_freedom2: bậc tự do 2(đối với hồi quy đơn là n-2.)
Với ví dụ 4.4, FINV(0,05; 1; 10) = 4,96. Lại có F = 40,63 > f =
4,96 n ê n b á c b ỏ Ho.
169
Số hóa bởi Trung tâm Học liệu – ĐHTN
K i ể m đ ị n h c á c t h a m số h ồ i q u y
K i ể m đ ị n h Po
Từ Hình 4.11 có thể thấy ràng P-value của Po là 0,684 > oe =5%
n ê n k ế t luận h ệ số po k h ô n g c ó ý nghĩa k h i m ở r ộ n g m ô h ì n h . C ũ n g có
t h ể thấy đ i ề u n à y k h i xem xét m ô h ì n h h ồ i quy vì k h i k h ô n g sản xuất
(tiêu hao đ i ệ n n ă n g b ằ n g 0) thì g i á trị sản xuat k h ô n g t h ể là số â m . C ó
t h ể d ù n g tiêu chuẩn t đ ể k i ể m định các hệ số h ồ i quy.
G i ả thuyết Ho : Po = 0.
G i ả thuyết H i :
Po^o.
G i á trị t Stat= 0,419; G i á trị t a/2 (n-k-1) đ ư ợ c t í n h t ừ h à m T I N V
theo c ú p h á p
= TINV(0,05; 10) =2,228.
Cót
Stat < t an (n-2)
n ê n k h ô n g đ ủ c ơ sở đ ể b á c b ỏ Ho. Việc
kiếm định Pi t i ế n h à n h t ư ơ n g t ự n h ư k i ể m định po5.2. Phân tích hồi quy bội trong Excel
Ư ớ c l ư ợ n g c á c t h a m sổ của m ô h ì n h h ồ i q u y b ộ i
T r o n g Excel c ó h à m L I N E S T đ ể ước l ư ợ n g c á c tham số của m ô
h ì n h h ồ i quy b ộ i t ư ơ n g t ự n h ư chức n ă n g của h à m S L O P E v à h à m
I N T E R C E P T . C ú p h á p cua h à m L I N E S T n h ư sau:
=LINEST(known_y's;
[known_x's];
ỊconstỊ;
ỊstatỊ)
(CSE)
Trong đó:
Known_y's: vùng địa chỉ chứa biến phụ thuộc y.
K n o w n _ x ' s : v ù n g địa chỉ chứa c á c b i ế n đ ộ c l ậ p X i , . . , XkConst: h à n g số đ ể c h ọ n m ô h ì n h h ồ i quy. N ế u const = Ì ( T R Ư E mặc đ ị n h ) thì Po c ó m ặ t trong m ô h ì n h h ồ i quy. N ế u const = 0
( F A L S E ) thì b ỏ qua Po (Po = 0 ) .
Stat: t ù y c h ọ n đ ể h i ể n thị c á c tham số thống k ê . N ế u stat =1
( T R Ư E , mặc đ ị n h ) thì t í n h t o á n c á c tham số thống k ê . N ế u stat = 0
( F A L S E ) thì k h ô n g t í n h c á c tham số n à y .
170
Số hóa bởi Trung tâm Học liệu – ĐHTN
K é t q u ả trả v ề là m ộ t ma trận c ó số cột tùy thuộc v à o số b i ế n
độc l ậ p của m ô h ì n h h ồ i quy. H ì n h 4.13 m i n h họa ma trận k ế t q u ả của
L i n e s t v ớ i const =1 v à stat = Ì .
Ị
2
3
4
5
A
B
m
. n-1
sen
_n=1
se
2
F
df
ggrẹg ssresid
n
D
E
m
ụ
b
se
r
v
H ì n h 4.13. Kết quả trả về từ hàm
Linest.
Trong đ ó :
m , m . i , . . , m i , b: c á c h ệ số p , p . i , ..,Pi, Po của m ô h ì n h h ồ i
n
n
k
k
quy.
r i
r
se , se -i,.., sei, seb: sai sô c h u â n của c á c h ệ sô t ư ơ n g ứ n g .
n
n
Ĩ2'. h ệ số t ư ơ n g quan b ộ i R .
2
se : sai sổ của h à m h ồ i quy.
y
F: giá trị k i ể m đ ị n h F.
df: bậc t ự do của h ồ i quy; d f = n-k n ế u const = 0; d f = n-k-1 n ế u
const = 1 .
ss : tổng bình phương sai lệch do hồi quy (Sum of Square
reg
Regression).
sSresid: tổng bình phương các sai lệch do ngẫu nhiên (Sum of
Square Residual).
V í d ụ 4.5
C ó thống k ê v ề số l ư ợ n g ô t ô b á n đ ư ợ c ( y ) , giá x ă n g ( X | ) , sự
t ă n g d â n số (X2), v à số l ư ợ n g đ ư ờ n g giao t h ô n g đ ư ợ c x â y d ự n g trong
15 n ă m . G i ả t h i ế t c ó quan h ệ t u y ế n tính giữa y v à Xj. H ã y ước l ư ợ n g
c á c h ệ sổ của h à m h ồ i quy.
171
Số hóa bởi Trung tâm Học liệu – ĐHTN
Năm
Số xe
bán được
(nghìn chiếc)
Giá xăng
(Slgalon)
1
159
1,62
Sự t ă n g d â n
sô ( t r i ệ u
người)
ES í.
55
2
160
1,667
56
13
3
163
1,69
58
14
4
166
1,7
60
15
5
167
1,72
63
17
6
167
1,73
65
18
7
168
1,736
66
18
8
167
1,74
66,7
18
9
167,9
1,75
66,9
19
10
168.9
1,755
67,4
19
li
169
1,756
67,9
19
12
169
1,77
68
20
13
170
1,767
68,5
18
14
171
1,756
68,8
17
15
172
1,77
68,9
18
Số con
đường mới
12
H ì n h 4.14 t r ì n h b à y c á c h n h á p d ữ l i ệ u v à k ế t q u ả ước l ư ợ n g các
tham sô của h à m h ồ i quy m ẫ u .
172
Số hóa bởi Trung tâm Học liệu – ĐHTN
I J I K
1
1
1 n i F 1 F
I 6 I H
1
y
xi
*?
ȓ
Sô xe bán giá xăng sự tăng dân Số con
năm
2
được (nghìn ($/galon) sá (tr
đưònq mới
3
1 nhiárl 159
1 62naưrtil 55
12
beta3 beta2 betal
betaũ
4
2
teo
1.667
56
13
5
3
163
ì 69
58
14
-0.63072 0 53354 57.41194 44.11072
6
4
166
1.7
60
15
0.315223 0.225274 25 4900131.70179
ĩ
5
167
1 72
63
17
0.946848 Ũ.9B6743 #N/A m/A
B
6
167
173
65
18
65.31787
11 #N/A #N/A
9
7
168 1736
66
18
1B3.1368 1028052 #N/A *I/A
10
B
167
1 74
66.7
18
li
9
167.9
1 75
66.9
19 Hàm hòi qly
12
lũ
168.9
1.755
67.4
19
y=44 1107 + 57.4119x1 +0.5335x2 - 0 6307x3
13
11
169 1 756
67 9
19
I
I
u
12
169
1 77
68
20 Côm thức
Ị
15
13
170 1.767
68.5
18
ÍGỈ5:ÍJ$9=UNEST(B3:B17.C3:E17.1.1)
16
14
171 1.756
68.8
17
"
1
15
172
1 77
689
18
18
ì
ì•
A
B
n
H ì n h 4.14. Két quả ước lượng
tham sô của hôi quy bội bằng
hàm
Lỉnest.
S ử d ụ n g t r ì n h Regression đ ể p h â n t í c h h ồ i q u y b ộ i
Quy t r ì n h sử d ụ n g t r ì n h Regressỉon đ ể p h â n t í c h h ồ i quy b ộ i
trong Excel g i ố n g n h ư quy t r ì n h p h â n tích h ồ i quy đ ơ n . H ì n h 4.15 h i ể n
thị k ế t q u ả h ồ i quy v à c á c t h a m số thống k ê đ ể p h â n tích p h ư ơ n g sai,
k i ể m định g i ả thuyết đ ố i v ớ i số l i ệ u trong ví d ụ 4.5.
N h ư c ó t h ể t h ấ y t r o n g k ế t q u ả h ồ i quy p h ả n á n h trong H ì n h 4.15,
S i g n i í i c a n c e F = 2,7E-07 < oe =0,05 n ê n m ô h ì n h h ồ i quy chấp n h ậ n
được. G i á trị P - v a l u e của Po v à p > a n ê n c á c h ệ số n à y k h ô n g c ó ý
3
nghĩa
khi m ở
rộng
y = 57,41 X i + 0 , 5 3 x
hàm
h ồ i quy.
Kết quả
hàm
h ồ i quy
là:
2
5.3. Phân tích hồi quy phỉ tuyến trong Excel
N h ư đ ã n ê u t r o n g m ụ c 4, c á c h à m h ồ i quy p h i t u y ế n n ế u c ó t h ể
tuyến t í n h h ó a đ ư ợ c thì sử d ụ n g c á c k ỹ thuật h ồ i quy t u y ế n t í n h đ ã n ê u
để ước l ư ợ n g c á c t h a m số h ồ i quy v à k i ể m đ ị n h m ô h ì n h h ồ i quy.
Trong Excel cung cấp h à m L O G E S T đ ể ước l ư ợ n g c á c tham số của
h à m h ồ i quy m ũ y = b m , m
X |
X 2
2
...m
X n
n
. Cú pháp và cách diễn giải kết
q u ả của L o g e s t n h ư c ú p h á p v à c á c h d i ễ n g i ả i k ế t q u ả của L i n e s t .
173
Số hóa bởi Trung tâm Học liệu – ĐHTN