Tải bản đầy đủ (.pdf) (143 trang)

Giáo trình Tin học ứng dụng: Phần 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (25.51 MB, 143 trang )

Chương
P H Â N T Í C H H Ò I Q U Y T Ư Ơ N G

bốn

Q U A N

V Ả D ự B Ả O K I N H

T É

1. H Ỏ I Q U Y V À T Ư Ơ N G Q U A N
C ă n cứ v à o m ứ c đ ộ chặt c h ẽ của quan h ệ giữa c á c b i ế n n g h i ê n
cứu c ó t h ể p h â n chia quan h ệ của c h ú n g t h à n h quan h ệ h à m v à quan
h ệ thống k ê .
Q u a n h ệ h à m : hai b i ế n n g ẫ u n h i ê n X v à Y đ ư ợ c g ọ i là p h ụ
thuộc h à m sô n ê u t ô n t ạ i f sao cho Y = f ( X ) tức là k h i đ ạ i l ư ợ n g X b i ế n
đ ổ i thì theo m ộ t quy tắc n à o đ ó c ó t h ể x á c đ ị n h được g i á trị t ư ơ n g ứ n g
đại lượng Y .
Q u a n h ệ t h ố n g k ê : hai b i ế n n g ẫ u n h i ê n X v à Y đ ư ợ c g ọ i là p h ụ
thuộc thống k ê n ế u m ỗ i g i á trị của X c ó t h ể x á c định đ ư ợ c quy luật
p h â n p h ố i x á c suất c ó đ i ề u k i ệ n của Y :
F(y/X

= x) = P(Y>y/X

= x)

(4.1)

Đây là sự phụ thuộc không hoàn toàn chặt chẽ tức là khi một


h i ệ n t ư ợ n g b i ế n đ ổ i thì l à m cho h i ệ n t ư ợ n g liên quan b i ế n đ ổ i n h ư n g
n ó k h ô n g c ó ảnh h ư ở n g h o à n t o à n q u y ế t đ ị n h đ ế n sự b i ế n đ ổ i n à y .
P h â n t í c h t ư ơ n g q u a n đ o m ứ c đ ộ k ế t hợp t u y ế n t í n h giữa hai
b i ế n . T r o n g đ ó , k h ô n g c ó sự p h â n b i ệ t giữa c á c b i ế n . C á c b i ế n c ó t í n h
chất đ ố i x ứ n g .

149
Số hóa bởi Trung tâm Học liệu – ĐHTN




P h â n t í c h h ồ i q u y n g h i ê n c ứ u m ố i liên h ệ p h ụ t h u ộ c của m ộ t
b i ê n ( g ọ i là b i ế n p h ụ thuộc hay b i ế n đ ư ợ c g i ả i t h í c h ) v ớ i m ộ t hay
n h i ê u b i ê n k h á c (được g ọ i l à b i ế n đ ộ c l ậ p hay b i ế n g i ả i t h í c h ) .
1.1. Phân tích tương quan
M ụ c đ í c h của p h ư ơ n g p h á p p h â n t í c h t ư ơ n g quan là ư ớ c lượng
m ứ c đ ộ ả n h h ư ở n g của c á c b i ế n đ ộ c l ậ p v ớ i nhau ( c á c y ế u t ố n g u y ê n
n h â n ) . P h ư ơ n g p h á p n à y đ ư ợ c ứ n g dụng trong k i n h doanh v à k i n h tế
đ ê p h â n t í c h m ố i liên h ệ giữa hai hay n h i ề u b i ế n n g ẫ u n h i ê n .
H ệ sổ t ư ơ n g q u a n t ổ n g t h ể
H ệ số t ư ơ n g quan đ o l ư ờ n g m ứ c đ ộ quan h ệ t u y ế n t í n h giữa hai
b i ế n ; c h í n h x á c h o n là quan h ệ t u y ế n t í n h giữa hai b i ế n , k h ô n g p h â n
b i ệ t b i ế n n à y p h ụ thuộc v à o b i ế n kia. H ệ số t ư ơ n g quan n à y c ó t ê n gọi
là t ư ơ n g quan Pearson.
G i ả sử X v à Y là hai b i ể n n g ẫ u n h i ê n c ó V ( X ) > 0 v à V ( Y ) > 0,
thì h ệ số t ư ơ n g quan của hai b i ế n X v à Y đ ư ợ c x á c đ ị n h n h ư sau:
E\ự-Eự))(Y-Eự))}
J ĩ ự ỹ ự )
H ệ số t ư ơ n g quan c ó c á c t í n h chất sau: h ệ số t ư ơ n g quan k h ô n g

c ó đ ơ n vị v à c ó t í n h h o á n đ ổ i ( p

= Pyx). H ệ số t ư ơ n g quan l u ô n b i ế n

đ ộ n g trong k h o ả n g t ừ - Ì đ ế n Ì ( I p

| < 1 ) . H ệ số t ư ơ n g quan d ư ơ n g

cho b i ế t X v à Y c ó quan h ệ c ù n g c h i ề u v à h ệ số t ư ơ n g quan â m thì
n g ư ợ c l ạ i ) . H ệ số t ư ơ n g quan p

= ± 1 k h i v à chỉ k h i X v à Y c ó m ố i

quan h ệ p h ụ thuộc t u y ế n t í n h . N h ư v ậ y , c ó t h ể d ù n g p

đ ể đ o lường

sự p h ụ thuộc t u y ế n t í n h của hai b i ế n n g ẫ u n h i ê n , trị số của h ệ số t ư ơ n g
quan c à n g l ớ n thì m ố i quan h ệ t u y ế n t í n h c à n g r õ r à n g . N g ư ợ c l ạ i , k h i
p

= 0 tức là X , Y đ ộ c l ậ p nhau hoặc giữa X v à Y c ó quan h ệ phi

tuyến.
H ệ sổ t ư ơ n g q u a n m ẫ u
G ọ i ( X i , y i ) , ( x , y ) , . - , (x„, y„) là n cặp quan sát của hai b i ế n
2

2


150
Số hóa bởi Trung tâm Học liệu – ĐHTN




ngẫu n h i ê n X v à Y. H ệ số t ư ơ n g quan m ẫ u ( r ) của n cặp g i á trị quan
sát của hai b i ế n X v à Y t h ể h i ệ n bằng c ô n g thức sau:
k
k
ửnn

x

k

2 > , Ị >

v

2

.ry =

r



(


k

2

V



Ì
2
i- 1

(4.3)

2\

(


t * .
/=1
n

2> , / » i=1
V

^

2\ í


t y .
=1
n

) ) V

) ì

T r ư ờ n g h ợ p m ô i cặp g i á trị (Xj, yì) x u â t h i ệ n v ớ i t â n suât rtij sao
k
cho

= w thì c ô n g thức t r ê n t r ở t h à n h :
;=1

*y =

2

n

r

k

f k

(4.4)
\ 2\


2\
.2

ĩ
1=1
n

/=1

i=l
A7
V

Bảng 4.1. T r ì n h b à y ý nghĩa của c á c h ệ s ô t ư ơ n g quan.
Bảng 4.1. Y nghĩa của hệ sô tương quan
T r i sô r

Quan h ệ giữa biến X và Y

r = 0

X v à Y đ ộ c l ậ p hoặc c ó quan h ệ p h i t u y ế n

|r|=l

X v à Y c ó quan h ệ t u y ế n t í n h

0,0< |r| < 0,3

X v à Y c ó quan h ệ y ế u


0,3< |r| < 0,5

X v à Y c ó quan h ệ trung b ì n h

151
Số hóa bởi Trung tâm Học liệu – ĐHTN




0,5 < |r| < 0,7

X v à Y c ó quan h ệ t ư ơ n g đ ố i chặt

0,7 < |r| < 0,9

X v à Y c ó quan h ệ chặt

0,9 < |r| < 1,0

X v à Y c ó quan h ệ rất chặt

H ệ số t ư ơ n g q u a n b ộ i v à h ệ số t ư ơ n g q u a n r i ê n g p h ầ n
Hệ số tương

quan

bội


H ệ s ô t ư ơ n g quan b ộ i đ á n h g i á m ứ c đ ộ chặt c h ẽ của m ô i liên hệ
giữa m ộ t t i ê u thức ( t h ư ờ n g là tiêu thức k ế t q u ả ) v ớ i c á c t i ê u thức còn
l ạ i ( t h ư ờ n g là tiêu thức n g u y ê n n h â n ) . C ô n g thức t í n h t ư ơ n g quan b ộ i
giữa b i ế n Y v à c á c b i ế n X i , x , . . , x
2

Hệ số tương

quan

riêng

n

như

sau

phần

(4.5)

yX|jr..jr„
2



'

n y - ỹ )


V à t ư ơ n g quan r i ê n g p h ầ n giữa Y v à X2 ( l o ạ i t r ừ ảnh h ư ở n g của
X i ) t í n h theo c ô n g thức

yx (Jt|)
2

r
yx,

—rr
'yx x,x
2

(4.6)

2

T í n h t o á n h ệ sổ t ư ơ n g q u a n m ẫ u t r o n g E x c e l
T r ư ờ n g h ợ p m ẫ u quan s á t c ó t ầ n suất m t h ì c ó t h ể t í n h t o á n
t h ủ c ô n g theo c ô n g t h ứ c h o ặ c c h u y ể n t h à n h m ỗ i d ò n g ( c ộ t ) chỉ
c h ứ a m ộ t q u a n s á t ( m = 1). D ữ l i ệ u c ó t h ể b ố trí theo h à n g hoặc
theo c ộ t .
N ế u t í n h t o á n t h ủ c ô n g sử d ụ n g c ô n g thức hoặc c ó t h ể k ế t hợp
c á c h à m S Q R T , S U M P R O D U C T đ ể t í n h t o á n h ệ số t ư ơ n g quan r.
C ũ n g c ó t h ể sử d ụ n g c á c h à m thống k ê của Excel đ ể t í n h t o á n . C h ú ý
c á c h à m t h ố n g k ê của Excel k h ô n g t h ể t í n h t o á n v ớ i c á c m ẫ u quan sát
\
r
ì

I
r
t
t
CÓ tân s ô m Ỷ Ì n ê n đ ê sử dụng c ô n g thức c â n p h ả i b i ê n đ ô i d ữ l i ệ u đ ê
m ỗ i quan sát n ằ m t r ê n m ộ t h à n g (cột) trong Excel.
152
Số hóa bởi Trung tâm Học liệu – ĐHTN




H à m RSQ
H à m RSQ tính t o á n p h ư ơ n g sai m ẫ u ( r ) theo c ú p h á p :
2

= RSQ (known_y's;

known_x's)

Trong đó:
K n o w n _ y ' s : c á c g i á trị của m ẫ u quan sát y của b i ế n Y .
K n o w n _ x ' s : c á c g i á trị của m ẫ u quan sát X của b i ế n X .
Hàm CORREL
H à m C O R R E L t í n h t o á n t ư ơ n g quan m ẫ u (r) theo c ú p h á p :
= CORREL

ịarrayl;

array2)


Trong đ ó :
A ư a y l , array2: c á c g i á trị của m ẫ u quan sát X, y của hai b i ế n X
v à Y . T h ứ t ự của c á c t h a m số trong h à m RSQ v à h à m C O R R E L
k h ô n g quan trọng.
Sử

dụng trình

cài thêm

Correlatỉon trong gói Analysis

Toolpak-VBA
T r ì n h cài t h ê m C o r r e l a t i o n trong g ó i A n a l y s i s T o o l p a k - V B A
cho p h é p sử d ụ n g c ô n g c ụ p h â n t í c h t ư ơ n g quan v ớ i giao d i ệ n đ ồ h ọ a
trực quan d ễ thực h i ệ n .
T r u y cập t r ì n h c à i t h ê m t ừ menu

ToolsỊData Analysis chọn

C o r r e l a t i o n n h ư H ì n h 4. Ì
Hi
Anaỉysts Tools
3
Anova: Two-Factor Wíthout Rẹplicatiori
Covariance
belp
Desơiptrve stats&es
Exponentìal Smooh

tmg
F-Test Two-Sample for Variances
Pourier Analysis
Histogram
Moving Average
Random Nunber Generatìon
H ì n h 4 . 1 . Hộp thoại Data Analysỉs

input
ỉnput Ranọe;
Grouped By:

1
<• Colimns
Rpws
F \.abete in Rrst Row
Output optỉons
c Quít** Rartge:
&• Hem Worksheel 0y:
í" NBwWprtho<*
H ì n h 4.2. Hộp thoại

Correlation

153
Số hóa bởi Trung tâm Học liệu – ĐHTN





K h i c h ọ n Correlation v à nhấn O K , h ộ p t h o ạ i C o ư e l a t i o n xuất
h i ệ n đ ể nhập d ữ l i ệ u n h ư h ì n h 4.2. C á c l ự a c h ọ n của h ộ p

thoại

C o r r e l a t i o n n h ư sau:
+ Input Range: khai b á o v ù n g d ữ l i ệ u p h â n t í c h .
+ Grouped by : t ổ chức d ữ l i ệ u theo h ư ớ n g :
+ Columns: theo cột.
+ Rows: theo h à n g .
+ Labels i n First Row: d ò n g đ ầ u tiên của v ù n g d ữ l i ệ u là t ê n biến.
+ Output Range: g ó c trên b ê n trái của v ù n g chứa k ế t q u ả . V ù n g
n à y n ằ m t r ê n c ù n g m ộ t sheet v ớ i v ù n g d ữ l i ệ u .
+ N e w Worksheet Ply: trả k ế t q u ả ra m ộ t trang b ả n g t í n h khác
trong c ù n g m ộ t fíle v ớ i file chứa d ữ l i ệ u .
+ N e w W o r k b o o k : trả k ế t q u ả ra m ộ t f i l e r i ê n g .
V í d ụ 4.1
Đ ể n g h i ê n c ứ u quan h ệ giữa t u ổ i n g h ề ( y ) v à số sản p h ẩ m sai
h ỏ n g ( x ) của c ô n g n h â n trong p h â n x ư ở n g n g ư ờ i ta thống k ê ngẫu
n h i ê n 18 c ô n g n h â n , số l i ệ u thu đ ư ợ c n h ư trong b ả n g . T ì m t ư ơ n g quan
giữa t u ổ i n g h ề v à số sản p h ẩ m sai h ỏ n g .
H ì n h 4.3 t r ì n h b à y c á c h b ố trí d ữ l i ệ u k h i t í n h h ệ số t ư ơ n g quan r
sử d ụ n g c ô n g thức. Đ ộ c g i ả c ó t h ể sử d ụ n g h à m S U M P R O D U C T để
t í n h t o á n c á c g i á trị t r o n g c á c ô v ù n g E9:I9.
N h ư c ó t h ể t h ấ y t ừ H ì n h 4.3, h ệ số t ư ơ n g quan r = - 0,708 cho
thấy k h i t u ổ i n g h ề t ă n g cao thì sai sót trong lao đ ộ n g g i ả m đi v à giữa
t u ổ i n g h ề v à sai sót c ó m ố i quan h ệ k h á chặt v ớ i nhau.
H ì n h 4.4 t r ì n h b à y c á c h sử dụng h à m C O R R E L của Excel để
t í n h t o á n h ệ số t ư ơ n g quan sử d ụ n g số l i ệ u của ví d ụ . T r ì n h b à y hộp
t h o ạ i C o r r e l a t i o n k h i nhập d ữ l i ệ u v à k ế t q u ả t í n h t o á n h ệ số t ư ơ n g

quan sau k h i nhấp O K t r ê n h ộ p thoại C o r r e l a t i o n sử d ụ n g d ừ l i ệ u
trong H ì n h 4. Ì .
154
Số hóa bởi Trung tâm Học liệu – ĐHTN




A
B
c
D
E I f ầ G I H
I I J
1
2 ... . Ky
X
m
m*x m*Y mVy m*x"2
_3_
13
7
3
21 ị 39 273| 147 507
4
8
6
5
30
40 240! 180 320

A
9
10
4
40: 36 3601 40Õ 324
B
25

2
8
50 2Ò0Ì 32 1250
7
36
2
1
2
36
72
À 1296
_8_
19
2
3
6
57 1141 12 1083
.? tong
18 107 258 1259 775 4780

tử SỐ -15 26 CT= G9/D9-E9"F9/D92
VỊ.

Mâu BÓ 21 541 CT= SQRT|H9/D9-(E9©9)»2)*SQRT(I9C9-(F9/D9)2)
12

ì
.ỉ
13
r
-0 708
14

A

A

H ì n h 4.3. Tính hệ số tương quan sử dụng các hàm cua
J_ iS .-Ạ. i .ạ . .. .
13 X
7
2 y
3
13
7
4
13
7
s_
8
6
6
8

6
7
8
6
B
8
6
9
8
6

9
10
11
9
10
12
9
13
9
10
14
25
4
15
25
4
16
36
2

17
19
2
18
19
2l
_Ị9
19
2
20
H ì n h 4.4. 77«/? /?ệ sớ tương

1 A 1
Hy
X
2
13
m
13
13
13
8
õ
8
á
8
o
'
B
0

ra
9;
11
9
ra
la
yQ
Ì
9
Ì
25
36
2
ó
15
9
ra
19
En
19

1 L m
ị.
rI -0 708
cõng thúc
L
E2=CORREL(A2 A19.B2 B19)

c


quan sử dụng hàm CORREL

B i c

Exceì.

tần

suất.

ũ

E 1 F 1

7
7
7
6
V
X
Bi
i
ì
6
X
-0 70639
1
- "— I^BHB
D 1•ỉhput— —
10 ĩnputRange;

âuupedByỉ
í" Bom
in
IU
17 Ld»lshfìr5tra
10
4
í 0}jtputRange:
2
lí*
4
2
<~ NewWorteh«et
2 ĩ
2
7

GI H

khi dữ liệu có

1

1 <* 1
Carai Ị
1
3

1


:-' •-•ị- 1 t

H ì n h 4.5 Tính toán hệ số tương quan sử dụng trình cài thêm

Correlation.
155

Số hóa bởi Trung tâm Học liệu – ĐHTN




1.2. K i ể m đ ị n h g i ả t h u y ế t v ề s ự t ồ n t ạ i của t ư ơ n g q u a n t ổ n g
thể
É
M Í
*
H ệ s ô t ư ơ n g quan của m ẫ u rát h ữ u ích k h i d ù n g đ ê m ô t ả tính
chặt c h ẽ của m ố i quan h ệ t u y ế n t í n h trong m ộ t m ẫ u . Vì v ậ y , n ó c ó thể
d ù n g l à m c ơ sở cho k i ể m định g i ả thuyết của t ổ hợp k h ô n g t u y ế n tính
( k h ô n g t ư ơ n g quan) trong tổng t h ể .
Đ e k i ể m định v ề sự t ồ n t ạ i của h ệ số t ư ơ n g quan của t ổ n g thể
c â n k i ê m định cặp g i ả thuyết sau:
G i ả thuyết Ho:

p=0

Đ ố i thuyết H i : p ^ O
G i á trị k i ể m định t đ ư ợ c t í n h theo c ô n g thức n h ư sau:
/ = - =


=

(4.7)

Trong đó:
r: h ệ số t ư ơ n g quan m ẫ u .
n : số quan sát trong m ẫ u .
M i ề n b á c b ỏ g i ả t h u y ế t Ho là hay |t| > t(n-2 OI li) • T r o n g đ ó (X là
m ứ c ý nghĩa của k i ê m định; t(n-2 a li) là p h â n p h ô i student v ớ i x á c suât
a/2 v à bậc t ự do n-2.
T r o n g Excel sử d ụ n g h à m t h ô n g k ê T I N V đ ê t í n h t o á n p h â n p h ô i
student v ớ i c ú p h á p sau:
= TlNVịprobability;

deg_freedom)

Trong đó:
Probability: x á c suất của p h â n p h ố i student.
D e g _ f r e e d o m : bậc t ự do của p h â n p h ố i student.
C h ủ ý : H à m T I N V t r o n g Excel đ ư ợ c t h i ế t k ế cho k i ể m đ ị n h hai
p h í a ( T w o - t a i l e d test). N ó i c á c h k h á c h à m T I N V trả v ề g i á trị t sao
cho P ( | X | > t ) = probability. V ì v ậ y k h i sử d ụ n g T I N V đ ể k i ể m đ ị n h hai

156
Số hóa bởi Trung tâm Học liệu – ĐHTN





phía, nhập t h a m số Probability bằng mức ý nghĩa a. K h i sử d ụ n g k i ể m
định m ộ t p h í a (One-tailed test) nhập Probability b ằ n g hai l ầ n m ứ c ý
nghĩa a.
V í d ụ 4.2
Sử d ụ n g d ữ l i ệ u của V í d ụ 4 . 1 . Ở m ứ c ý nghĩa 5% h ã y k i ể m
định g i ả thuyết r ằ n g t ổ n g t h ể c ó m ố i quan h ệ giữa t u ổ i n g h ề v à p h ế
phẩm?
C ó t t í n h t o á n theo c ô n g thức là -4.015. Tra b ả n g p h â n p h ố i
student v ớ i m ứ c ý nghĩa (X = 0.05 v à bậc t ự do n-2 = 16 đ ư ợ c

2.1199.

V ậ y |t| > t tra b ả n g n ê n b á c b ỏ Ho. N ó i c á c h k h á c k ế t l u ậ n v ề d ữ l i ệ u
đ i ề u tra m ẫ u c ó t h ể á p d ụ n g cho tổng t h ể v ớ i x á c suất m ắ c sai l ầ m 5%.
r
V(l-r )/(«-2)
2

-0.70839

= -4.015

yjạ-0J0$39 )/l6
2

H ì n h 4.6 t r ì n h b à y c ô n g thức t í n h t o á n k i ể m đ ị n h g i ả thuyết v ề
Á•
t y
9
m ô i t ư ơ n g quan g i ữ a t u ồ i n g h ê v à sai h ỏ n g k h i gia c ô n g sản p h à m v ớ i

mức ý nghĩa 5%.
1 ỉ
bĩ- y

A

X
13
13
13
8
8
8
8
8
9
9
9
9
25
25
36
19
19
19

l
i
'
7

V
X
7
1
1
7
X
-Ũ.7D839
1
6
6t
-4.01454
côngthức
6 t tra bảng 2.119905
E7=
E4/SQRT((1 -E4»2)/(COUNT(B2: B19)-2))
6
E8=
TINV(ũũ5,COUNT(B2:B19)-2) '

6
10
HO: r=0
10
HI: r ó c
10
có hi > t tra báng _bác bò HO
10
4
4

2
2
2
2

H ì n h 4.6. Kiểm

định giả thuyết

về sự tồn tại hệ sổ tương

quan.

157
Số hóa bởi Trung tâm Học liệu – ĐHTN




2. H Ồ I Q U Y T U Y Ê N T Í N H Đ Ơ N
2.1. C ơ b ả n về h ồ i quy tuyến tính đ ơ n
D ạ n g đ ơ n g i ả n nhất của m ộ t m ô hình h ồ i quy chứa m ộ t biến
phụ thuộc ( c ò n g ọ i là " b i ế n được giải t h í c h " , " b i ế n n ộ i sinh", hay
" b i ế n - Y " ) và m ộ t b i ế n độc lập đ ơ n (còn g ọ i là " b i ế n g i ả i t h í c h " , "biến
ngoại sinh" hay " b i ế n - X " ) .
P h ư ơ n g trình h ồ i quy t u y ế n tính đ ơ n c ó thể b i ể u d i ễ n theo dạng:
Y=p +Ị$ x
ũ

(4.8)


x

Trong thực tế không chỉ có biến X ảnh hưởng đến Y mà còn có
c á c y ế u t ố n g ẫ u n h i ê n k h á c ảnh h ư ở n g đ ế n Y n ê n p h ư ơ n g trình 4.8
được v i ế t t h à n h :
Y =p



+ p,x

+

e

(4.9)

Trong đó e là các sai số.
T r o n g thống k ê v à trong k i n h tế lượng, n g ư ờ i ta sử dụng p h ư ơ n g
p h á p b ì n h p h ư ơ n g cực t i ể u đ ể ước lượng c á c h ệ số Po v à p Ì theo công
thức sau:

à =•

i=\

i=\
(


(4.10)

Ý

" I X ĩ * .
1=]
V'=I
)
H ệ số chặn Po đ ư ợ c ước lượng theo c ô n g thức:
p =Ỹ-p,X

(4.11)



T r o n g đ ó /?

0

v à /?, đ ư ợ c g ọ i là c á c ước lượng đ i ể m của po v à P|.

TSS (Total Sum of Square) là tổng bình phương của tất các sai
lệch giữa giá trị quan sát Y j v à giá trị trung bình của c h ú n g .
TSS=£(Y,-ỹ)

2

158
Số hóa bởi Trung tâm Học liệu – ĐHTN





ESS (Explained Sum o f Square) là tổng bình p h ư ơ n g của tất cả
các sai lệch giữa g i á trị của b i ế n phụ thuộc Y nhận được t ừ h à m h ồ i
quy m â u v ớ i g i á trị trung b ì n h của c h ú n g . Phần n à y đ o đ ộ c h í n h xác
của h à m h ồ i quy.
ESS=£(Ỹ-F)

2

RSS (Residual Sum of Square) là tổng bình phương của tất cả các
sai lệch giữa giá trị quan sát Y v à giá trị nhận được t ừ h à m h ồ i quy.
Rss=ỵe;=ỵự -Ỹ yl

l

l=\

Khi đó:

i=l

T S S = ESS+ RSS

Nên / = -ì ~?l trong đó s và Sy là phương sai mẫu của X và Y.
«?(/?,)
2

2


x

H ệ sô r đ o đ ộ p h ù hợp của m ô h ì n h hôi quy.
i(Ỹ>-ỹ)

2

2_ t t

>



Ỳ ( r , - Ỹ )
1=1

ESS

=

2

T

S

S

RSS


=

~

T

S

S

2

đ o tỉ l ệ của t o à n b ộ sai lệch của Y v ớ i g i á trị trung b ì n h của
c h ú n ^ đ ư ợ c g i ả i t h í c h b ằ n g m ô hình. Do v ậ y r đ ư ợ c sử dụng đ ể đ o đ ộ
thích hợp của h à m h ồ i quy.
2

2.2. Khoảng tin cậy và kiểm định giả thuyết trong hồi quy
tuyến tính đ ơ n
Theo các giả thiết của phương pháp bình phương cực tiểu thì
à ~ (0o> ị);
N

ơ

Ằ ~ (fì> ị)•
N

ước lượng không chệch của ơ


ơ

2

D

o

c

h

ư

a

biết ơị

và ơị

nên sử dụng

là ở . K h i đó các thống kê:
2

, Ã-go. t ằz£±
=

=


có phân bố T (n-2). Do đó khoảng tin cậy của các hệ số hồi quy như
sau:
159
Số hóa bởi Trung tâm Học liệu – ĐHTN




K h o ả n g t i n c ậ y c ủ a Po
V ớ i h ệ số t i n c ậ y ( Ì - oe) t ì m được t a 12 (n-2) t h ỏ a m ã n k h o ả n g
tin cậy ( Ì - a ) của Po là:
[(Ã-t n(n-2)se(ịyj
a

+ /

0

B / 2

(#I-2)«?(Ã))]

K i ể m đ ị n h g i ả t h u y ế t đ ố i v ớ i Po

Loại giả thuyết

Giả thuyết
gốc Ho


Giả thuyết
thay t h ế H i

Hai phía

Po = Po*

PoỶ 3o*

ít 1 > t«12 (n-2)

Phía phải

P o < Po*

Po>í3o*

t>ta(n-2)

P h í a trái

Po>Po*

Po
t<-t«(n-2)

Miền bác bỏ

K h o ả n g t i n c ậ y c ủ a Pi

T ư ơ n g t ự n h ư đ ố i v ớ i Po khoảng t i n c ậ y của (31 l à
[(Ã - t

{n-2)se{ị);ị +/

a n

a / 2

(n-2)«(Ã))]

K i ể m đ ị n h g i ả t h u y ế t đ ố i v ớ i Po
Giả thuyết

Loại giả thuyết

gốc Ho

Giả thuyết
thay t h ế H i

Miền bác bỏ

Hai phía

p. = 3 i *

Phía phải

P i < Pi*


P.>Pi*

t>t (n-2)

P h í a trái

Pi>3i*

3i<3i*

t<-t (n-2)

ít 1 > t „ 12 (n-2)
a

a

3. H Ồ I Q U Y T U Y Ể N T Í N H B Ộ I
3.1. C ơ b ả n v ề h ồ i quy tuyến tính b ộ i
H à m h ồ i quy t u y ế n t í n h tổng t h ể c ó dạng:
Y =/ĩ +/ỉ X +...
l

0



ìl


+ /ỉ X +U
k

kl

i

(4.12)

160
Số hóa bởi Trung tâm Học liệu – ĐHTN




T r o n g đ ó Po là h ệ số t ự do ( h ệ số chặn), pi ( i = Ì ,..,k) là c á c h ệ số
h ồ i quy r i ê n g .
H à m h ồ i quy m ẫ u c ó dạng:
Y =fi +fi X +fi X +... + ĩ X +e, (4.13)
l

Q



íl

i

ĩt


ki

ki

Mô hình này nói lên mức độ phụ thuộc tuyến tính của biến phụ
thuộc Y ( đ ạ i l ư ợ n g cần n g h i ê n cứu) v ớ i c á c b i ế n độc l ậ p ( X j j ) , ej là sai
sô n g ẫ u n h i ê n g â y ra v ớ i sai l ệ c h của y v ớ i giá trị trung b ì n h của n ó .
Đ ố i v ớ i m ô h ì n h n à y n g ư ờ i ta chấp n h ậ n g i ả định c á c b i ế n đ ộ c l ậ p
k h ô n g c ó m ố i t ư ơ n g quan v ớ i nhau v à p h ư ơ n g sai k h ô n g đ ổ i . M ô h ì n h
h ồ i quy t u y ế n tính b ộ i đi qua g i á trị trung b ì n h của n ó . C á c ư ớ c l ư ợ n g
• p, ước l ư ợ n g được là c á c ư ớ c l ư ợ n g k h ô n g chệch c ó p h ư ơ n g sai n h ỏ
nhất trong c á c l ó p ước l ư ợ n g k h ô n g chệch của Pi. T r o n g c á c t r ư ờ n g
hợp n g h i ê n cứu cụ t h ể n g ư ờ i ta t h ư ờ n g t i ế n h à n h p h â n tích p h ư ơ n g sai
v à p h â n t í c h t ư ơ n g quan trước đ ể t h ă m d ò dạng của quan h ệ p h ụ thuộc
v à k i ể m tra xem c ó x ả y ra h i ệ n t ư ợ n g t ự t ư ơ n g quan, đ a c ộ n g t u y ế n
hay p h ư ơ n g sai thay đ ổ i hay k h ô n g . Đ ể k i ể m tra, t h ư ờ n g sử d ụ n g t h ủ
tục k i ê m định D o l b i n W a t s e m .
V i ệ c t í n h t o á n c á c h ệ số h ồ i quy của h ồ i quy b ộ i k h á phức tạp.
Ví d ụ , v ớ i m ô h ì n h h ồ i quy 2 b i ế n đ ộ c l ậ p ( X i , x ) . C á c h ệ số p , Pi
2

2

Po đ ư ợ c ư ớ c l ư ợ n g theo c á c c ô n g thức sau:
í n

\

í"

Ỵ y, 2,
Ẻ 4
V/=I
ỉ V /=1
) V '=1
; V, '=1
2
í "
í " 2
4
t 4
t * . Xu
( ỉ

)
V 1=1
/
í »
í »
Ỹ,y, 2,

Ì
í 2i u
1
) VV i=l
V /=1
)
V I=\
\ (»
\2

("

ì

x

J

x

x

i*ỉ, ị ± 4
V<=I
J V /=1
k = Y - p , X , - P

2

X

)

\

x

)

/


2

161
Số hóa bởi Trung tâm Học liệu – ĐHTN




Trong đ ó :
y =Y -Ỹ; x, =X
i

i

i

l

i

-X ;x
I

2

j

=X


2

i

-X

2

3.2. K i ể m đ ị n h s ự p h ù h ọ p c ủ a m ô h ì n h h ồ i q u y b ộ i
T r o n g m ô h ì n h h ồ i quy b ộ i , h ệ số x á c đ ị n h b ộ i R đ ư ợ c x á c định
theo c ô n g thức:
2

R =^- (4.15)
2

TSS

'

Do k h ô n g t h ể d ù n g R l à m tiêu chuẩn đ ể xem xét việc đ u a t h ê m hay
k h ô n g đ ư a thêm biến v à o m ô hình, n ê n n g ư ờ i ta đ ư a ra m ộ t h ệ số x á c định
2

bội đ ã điều chinh (Ạịusted R Square) k ý hiệu R v à tính theo công thức:
1

ĩ

1


I

(4 ,6)

'- -( -*Vhĩ -

c ò n t ă n g t h ì c ò n p h ả i đ ư a t h ê m b i ế n m ớ i v à o m ô hình

2

Khi R
h ồ i quy.

K i ể m đ ị n h g i ả t h u y ế t v ề sự p h ù h ợ p của m ô h ì n h b à n g tiêu
chuẩn F đ ư ợ c t í n h theo c ô n g thức:
R {k-2)
2

(l-R )(n-k-l)
2

(

1

7

)


V ớ i g i ả thuyết:
2

H :R
0

= 0.

2

H,:R >0.
M i ề n b á c b ỏ Ho la F > F« ( k , n-k-1) v ớ i k là số b i ể n đ ộ c l ậ p .
3.3. K h o ả n g t i n c ậ y v à k i ể m đ ị n h g i ả t h u y ế t c ủ a m ô h ì n h h ồ i
quy b ộ i
V i ệ c k i ể m đ ị n h g i ả thuyết v à khoảng t i n c ậ y của m ô h ì n h h ồ i
quy b ộ i t i ế n h à n h t ư ơ n g t ự n h ư m ô h ì n h h ồ i quy đ ơ n . T i ê u c h u ẩ n k i ể m
Ổ, - ổ'
.
định là / = — — Ọ - v ớ i m i ê n b á c bỏ sau:
SeiP)
162
Số hóa bởi Trung tâm Học liệu – ĐHTN




Loại giả thuyết

Ho


Hi

M i ề n bác bỏ

Hai p h í a

0i = 3i*

Di * 3i*

| t | > t a | 2 (n-k-1)

B ê n trái

Pi > 3i*

ft

t<-t (n-k-l)

Bên phải

Pi < Pi*

Pi > Pi*


a


t>t (n-k-l)
a

4. H Ồ I Q U Y P H I T U Y Ê N
H ồ i quy phi t u y ế n sử d ụ n g p h ư ơ n g p h á p b ì n h p h ư ơ n g cực t i ể u
phi t u y ế n . T u y n h i ê n v i ệ c ước l ư ợ n g c á c h ệ số n à y k h á phức tạp.
*
r
i
r
t
Trong n h i ê u t r ư ờ n g hợp, n ê u c ó t h ê đ ư ợ c n g ư ờ i ta t ì m c á c h b i ế n đ ổ i
các p h ư ơ n g t r ì n h phi t u y ế n t h à n h p h ư ơ n g t r ì n h t u y ế n t í n h đ ể d ễ d à n g
h ồ i quy.
V ớ i p h ư ơ n g t r ì n h hyperbol dạng y = a/x, đặt 1/x = z đ ể đ ư a v ề
p h ư ơ n g trình y = az v à t i ế n h à n h h ồ i quy t u y ế n t í n h đ ơ n .
V ớ i p h ư ơ n g t r ì n h parabol dạng y = a x

2

+ b x + c đặt Zi = X ,
2

Z2 = X đ ể đ ư a v ề p h ư ơ n g t r ì n h h ồ i quy b ộ i y = azi + ỒZ2 + c.
V ớ i h à m sản x u ấ t C o b b Douglas c ó dạng:
Y=AX, ...Xi
b ,

b 2


...X

b n
n

Trong đó:
Y là k ế t q u ả sản x u ấ t .
Xi,..., Xi,..., x

n

là m ứ c đ ầ u t ư c á c y ế u t ố sản xuất (đất đ a i , lao

động,...).
t r i
I*'
:. "ị
CÓ t h ê b i ê n đ ô i t h à n h h à m t u y ê n t í n h b ă n g c á c h logarit h ó a hai
vế và đưa về dạng:
In Y = In A + b | l n X , +....+ bn In x „ .
K h i đ ó sử d ụ n g c á c c ô n g thức ước l ư ợ n g c á c tham số của h ồ i
quy b ộ i đ ể h ồ i quy.

163
Số hóa bởi Trung tâm Học liệu – ĐHTN




5. Q U Y T R Ì N H P H Â N T Í C H H Ồ I Q U Y T R O N G


EXCEL

5.1. P h â n tích hồi quy đ ơ n trong Excel
Sử dụng h à m SLOPE và I N T E R C E P T để ước lượng

các

t h a m số c ủ a h à m h ồ i q u y đ ơ n
H à m S L O P E d ù n g đ ể ư ớ c l ư ợ n g h ệ số g ó c ( p i ) của p h ư ơ n g
t r ì n h y = Po + p i x . C ú p h á p của h à m S L O P E n h ư sau:
=SLOPE(Known_y's;

known_x's)

Trong đó:
K n o w n _ y ' s : giá trị quan sát của b i ế n p h ụ thuộc y.
K n o w n _ x ' s : giá trị quan sát của b i ế n đ ộ c l ậ p X.
H à m I N T E R C E P T d ù n g đ ể ư ớ c l ư ợ n g h ệ số t ự do Po của
p h ư ơ n g t r ì n h h ồ i quy bậc nhất theo c ú p h á p :
=INTERCEPT(Known_y';

known_x's).

V í d ụ 4.3
T h ố n g k ê g i á trị sản x u ấ t v à t i ê u t h ụ đ i ệ n n ă n g trong 12 t h á n g
n g ư ờ i ta thu đ ư ợ c c á c số l i ệ u sau
Tháng

1


2

3

4

5

6

7

8

9

10

li

12

Giá trị
sản
xuất
(triệu
ÙSD)

4,51


3,58

4,3]

5,06

5,64

4,99

5,29

5,83

4,71

5,61

4,91

4,19

Điện
năng
tiêu
thụ
(triệu
KWh)


4,28

2,26

2,47

2,77

2,99

3,05

3,18

3,46

3,03

3,26

2,67

2,53

B i ế t g i á trị sản xuất ( y ) c ó quan h ệ v ớ i đ i ệ n n ă n g t i ê u t h ụ ( x )
theo d ạ n g y = Po + P i * . H ã y ước l ư ợ n g c á c tham số Po v à P|.
164
Số hóa bởi Trung tâm Học liệu – ĐHTN





H ì n h 4.7 trình b à y c á c h nhập số l i ệ u v à o Excel v à sử dụng h à m
S L O P E , I N T E R C E P T đ ể ước lượng các tham số của h à m h ồ i quy đ ơ n .
_L
2
3
4
5
6
ĩ
B
9
10
11
12
13
14
15
16

A

I

B

I

c


1 D

mm

ịì

F

I

G

H

V
X
Giả trị Điện
Tháng sản xuất nâng
(triệu tiêu thụ
1 451
248
betaũ 0 3037
2
3 58 2.26
beta 1 1,6101
3 4.31
2.47
4
5.06

2.77
Cônq thúC
'
5 5.64
2.99
6 4.99
305
F4=INTERCEPTỊI34:B15,C4:C15)
7 529
3.18
|F5=SLO E(B4:B 15.C4:C15)
8
5.83
3.46
9 471
3.03 Hâm hôi quy mẩu
10
561
3.26
y=0.3037+1.6101<
11 4.91
2 67
12 4.19
253
"'"

Ị—:_|
D

H ì n h 4.7. Sử dụng hàm của Excel để ước lượng

hồi quy đơn.

các tham số của

hàm

S ử d ụ n g t r ì n h c à i t h ê m Regression đ ề p h â n t í c h h ồ i q u y đ ơ n
T r ì n h cài t h ê m Regression n ằ m trong gói phần m ề m A n a l y s i s
T o o l p a k - V B A v à đ ư ợ c truy cập t ừ menu T o o l s I D a t a A n a l y s ỉ s I
Regression n h ư h ì n h 4.8. Ý nghĩa t ù y c h ọ n v à c á c n ú t l ệ n h của h ộ p
thoại Regression t r ì n h b à y trong b ả n g 4 . 1 .
Regression không chỉ cho các ước lượng điểm của các tham số
h ồ i q u ỵ m à c ò n cho c á c tham số thống k ê đ ể k i ể m định m ô h ì n h h ồ i
quy, đ ê p h â n tích p h ư ơ n g sai ư ớ c l ư ợ n g k h o ả n g của c á c tham số trong
m ô h ì n h h ồ i q u ỵ . Sử d ụ n g t r ì n h Regression cho p h é p h ồ i quy t u y ế n
tính b ộ v ớ i số b i ế n t ố i đ a là 16.
V í d ụ 4.4
Sử d ụ n g c á c số l i ệ u của ví d ụ 4.3
T h ố n g k ê g i á trị sản x u ấ t v à tiêu t h ụ đ i ệ n n ă n g trong 12 t h á n g
n g ư ờ i ta thu đ ư ợ c c á c sô l i ệ u n h ư bảng 4. B i ế t giá trị sản x u ấ t ( y ) co
quan h ệ v ớ i đ i ệ n n ă n g tiêu t h ụ ( x ) theo dạng y = po + p|X. H ã y ước
l ư ợ n g c á c tham s ô của h à m h ồ i quy, k i ể m định sự p h ù hợp cua m ô
h ì n h h ồ i quy v à k i ể m đ ị n h c á c tham số của m ô h ì n h .

165
Số hóa bởi Trung tâm Học liệu – ĐHTN





Tháng

1

2

3

4

5

6

7

8

9

10

li

12

Giá tri
sản
xuất
(triệu

USD)

4,51

3,58

4,31

5,06

5,64

4,99

5,29

5,83

4,71

5,61

4,91

4,19

Điện
năng
tiêu
thụ

(triệu
KWh)

4,28

2,26

2,47

2,77

2,99

3,05

3,18

3,46

3,03

3,26

2,67

2,53

Input
IrputltRange:
r t«òets

r Constart 6 2«o
r* CoítldenceLevel: p %
ouput options
í~ ôutput R**75:
í*" NewWorìuheet0y:
í" NewWortxx*
r standardxed Resduab r R«sduaể Ptots
r l|r«FlPtats
Nạmal ProbaMty
r iloniulProtaMtrMots
H ì n h 4.8. //ộ/? thoại
B ả n g 4.2. Ỷ nghĩa

Input X Range:

Regression.

các tùy chọn của hộp thoại

Tên nút
Input Y Range:

Cancd Ị
Hét J

1

1

lư" Labels


Regressỉon
Ý nghĩa

V

4

V ù n g chứa b i ế n
p h ụ thuộc Y .
V ù n g chứa b i ế n
c á c b i ế n d ó c láp
X.
Chọn tùy
này nếu
đẩu
tiên

chọn
dòng
của

166
Số hóa bởi Trung tâm Học liệu – ĐHTN




Ý nghĩa


Tên nút

vùng d ừ liệu có
chứa t ê n b i ế n .
C h ọ n t ù y chọn
n à y n ế u b ỏ qua

r~ Constant is Zero

Í3O(Í3O = 0 ) .

r~ ConẠdence Level:



%

Chọn mức đ ộ t i n
cậy của h à m h ồ i
quy ( m ặ c định
95%).

ứ OutputRange:

!

Ô đ ầ u tiên b ê n
trái v ù n g k ế t q u ả
k h i k ế t q u ả trên
c ù n g m ộ t sheet

với
vùng
dữ
liệu.

<• New VVorksheet Ply:



K ế t quả hiển thị
t r ê n m ộ t sheet
riêng.
K ế t quả hiển thị
trên
một
fíle
Excel k h á c .

f New Workbook

-Kesiơuals
r~ Residuals
V standardized Residuals

r~ Residual Plots
r* LỊne Fit Plots



C á c t ù y chọn

h i ể n thị sai số.

H ì n h 4.9 t ó m t ắ t c á c tham số thống k ê do Regression trả v ề .
H ì n h 4.10 h i ể n thị k ế t q u ả p h â n - t í c h p h ư ơ n g sai do Regression
trả v ề .

167
Số hóa bởi Trung tâm Học liệu – ĐHTN




SUMMARY OUTPUT

Tóm tắt các kết quả

Regression Statistics
Multiple R
0.89582697
R Square
0.80250596
Ađjusted R Square
0.78275655
Standard Error
0.31053857
Observations
12

Thống kê hồi quy
Hệ số tương quan r

Hệ số xác định r2
Hệ số xác định điều Chĩnh
Sai số chuẩn
Số quan sát

H ì n h 4.9. Tóm tắt cóc tham số thống kê do regressỉon

trả về.

ANOVA
di
Regression
Residual
ì Tót ai

1

11

ss
3918549641
0.964342025
4882891667

H ì n h 4.10. Phân tích phương

MS
F
Siqniíicance F
3918549641 40.63444

8.09269E-05
0 096434203

sai do Regression

trả về.

Trong Hình 4.10, bậc tự do của hồi quy (dòng Regression cột
d í ) là Ì , bậc t ự do của sai số ( d ò n g Residual c ộ t d í ) l à l o . T ổ n g bình
p h ư ơ n g c á c sai l ệ c h do h ồ i quy ( d ò n g Regression c ộ t s s - ESS) là
3,918. T ổ n g b ì n h p h ư ơ n g c á c sai l ệ c h do n g ẫ u n h i ê n ( d ò n g Residual
cột s s - RSS) là 0.96. P h ư ơ n g sai t ư ơ n g ứ n g của c á c chỉ tiêu đ ó cho
trong c ộ t M S . C ộ t F cho p h â n p h ố i F đ ể k i ể m định sự p h ù h ợ p của m ô
h ì n h h ồ i quy. G i á trị S i g n i í ĩ c a n c e F cho b i ế t x á c suất đ ể F n h ỏ h ơ n
f«(k,n-k-l)..
ế
*
r
r
ì
H ì n h 4.11 t r ì n h b à y k é t q u ả h ô i quy v à c á c tham s ô t h ô n g k ê đê
k i ể m đ ị n h c á c tham số của m ô h ì n h h ồ i quy.
Intercept
ìx Variable 1

Coetíiàents Standard Error tSlat
P-value Lower95ftí Upper 95%
0.303683778
0 724391526
0419226023 0.683914 -1.310361117 ì 917728674

1 610125759
0.252587973
B 374514741 8.09E-05 1 0473246842 172926833
H ì n h 4.11. Kết quả hồi quy do Regression

cung

cấp.

Từ Hình 4.11 thấy ràng hệ số tự do (Intercept) Po = 0. 3036,
Se( po) = 0,724. T h ố n g k ê t (t Stat) là 0,419. G i á trị P-value cho biết
x á c suất đ ể t < t Ji ( n - k - 1 ) . C á c c ộ t L o w e r 9 5 % v à U p p e r 9 5 % cho
b i ế t k h o ả n g t i n cậy của h ệ số h ồ i quy. H ì n h 4.12 h i ể n t h ị k ế t q u ả k h i
c h ọ n R e s i d u a l trong h ộ p t h o ạ i Regression.
168
Số hóa bởi Trung tâm Học liệu – ĐHTN




K i ể m đ ị n h s ự p h ù h ọ p của m ô h ì n h h ồ i q u y
Giả thuyết Ho: R = 0.
2

Giả thuyết Hi: R ^0.
2

RESIDUAL OUTPUT
Observation P
1

2
3
4
5
6
7
8
9
10
11
12

redicted Y
4.29679566
3.942567993
4.280694402
4.76373213
5.117959797
5.214567342
5.423883691
5.874718904
5.182364827
5.552693752
4.602719554
4.377301948

Residuals
Standard
Residuals
Ũ.2132Ũ434

0.720073514
-0.362567993
-1.224532337
0.029305598
0.098976337
0.29626787
1.00061118
0.522040203
1.763131668
-0.224567342
-0.758450768
-0.133883691
-0.452177005
-0.044718904
-0.151033032
-0.472364827
-1.595358711
0.057306248
0.193545364
0.307280446
1.037804908
-0.187301948
-0.632591118

-I
Hình 4.12. Két quả phân tích sai sổ do Regression trả về.
Căn cứ vào kết quả phân tích phương sai trong Hình 4.10 cho
thấy S i g n i í ĩ c a n c e F = 8,09E-05 < oe = 5 % k ế t l u ậ n m ô h ì n h là p h ù h ợ p .
Cũng c ó t h ể sử d ụ n g h à m F I N V đ ể tra p h â n p h ố i f a (k, n-k-1) theo c ú
pháp:

=FINV(probability; deg_freedoml; deg_freedom2)
Trong đ ó :
Probability: xác suất (mức ý nghĩa a.)
Deg_freedoml: bậc tự do Ì (đối với hồi quy đơn là 1.)
Deg_freedom2: bậc tự do 2(đối với hồi quy đơn là n-2.)
Với ví dụ 4.4, FINV(0,05; 1; 10) = 4,96. Lại có F = 40,63 > f =
4,96 n ê n b á c b ỏ Ho.

169
Số hóa bởi Trung tâm Học liệu – ĐHTN




K i ể m đ ị n h c á c t h a m số h ồ i q u y
K i ể m đ ị n h Po
Từ Hình 4.11 có thể thấy ràng P-value của Po là 0,684 > oe =5%
n ê n k ế t luận h ệ số po k h ô n g c ó ý nghĩa k h i m ở r ộ n g m ô h ì n h . C ũ n g có
t h ể thấy đ i ề u n à y k h i xem xét m ô h ì n h h ồ i quy vì k h i k h ô n g sản xuất
(tiêu hao đ i ệ n n ă n g b ằ n g 0) thì g i á trị sản xuat k h ô n g t h ể là số â m . C ó
t h ể d ù n g tiêu chuẩn t đ ể k i ể m định các hệ số h ồ i quy.
G i ả thuyết Ho : Po = 0.
G i ả thuyết H i :

Po^o.

G i á trị t Stat= 0,419; G i á trị t a/2 (n-k-1) đ ư ợ c t í n h t ừ h à m T I N V
theo c ú p h á p
= TINV(0,05; 10) =2,228.
Cót


Stat < t an (n-2)

n ê n k h ô n g đ ủ c ơ sở đ ể b á c b ỏ Ho. Việc

kiếm định Pi t i ế n h à n h t ư ơ n g t ự n h ư k i ể m định po5.2. Phân tích hồi quy bội trong Excel
Ư ớ c l ư ợ n g c á c t h a m sổ của m ô h ì n h h ồ i q u y b ộ i
T r o n g Excel c ó h à m L I N E S T đ ể ước l ư ợ n g c á c tham số của m ô
h ì n h h ồ i quy b ộ i t ư ơ n g t ự n h ư chức n ă n g của h à m S L O P E v à h à m
I N T E R C E P T . C ú p h á p cua h à m L I N E S T n h ư sau:
=LINEST(known_y's;

[known_x's];

ỊconstỊ;

ỊstatỊ)

(CSE)

Trong đó:
Known_y's: vùng địa chỉ chứa biến phụ thuộc y.
K n o w n _ x ' s : v ù n g địa chỉ chứa c á c b i ế n đ ộ c l ậ p X i , . . , XkConst: h à n g số đ ể c h ọ n m ô h ì n h h ồ i quy. N ế u const = Ì ( T R Ư E mặc đ ị n h ) thì Po c ó m ặ t trong m ô h ì n h h ồ i quy. N ế u const = 0
( F A L S E ) thì b ỏ qua Po (Po = 0 ) .
Stat: t ù y c h ọ n đ ể h i ể n thị c á c tham số thống k ê . N ế u stat =1
( T R Ư E , mặc đ ị n h ) thì t í n h t o á n c á c tham số thống k ê . N ế u stat = 0
( F A L S E ) thì k h ô n g t í n h c á c tham số n à y .

170
Số hóa bởi Trung tâm Học liệu – ĐHTN





K é t q u ả trả v ề là m ộ t ma trận c ó số cột tùy thuộc v à o số b i ế n
độc l ậ p của m ô h ì n h h ồ i quy. H ì n h 4.13 m i n h họa ma trận k ế t q u ả của
L i n e s t v ớ i const =1 v à stat = Ì .


2
3
4
5

A
B
m
. n-1
sen
_n=1
se
2
F
df
ggrẹg ssresid
n

D

E


m


b

se

r

v

H ì n h 4.13. Kết quả trả về từ hàm

Linest.

Trong đ ó :
m , m . i , . . , m i , b: c á c h ệ số p , p . i , ..,Pi, Po của m ô h ì n h h ồ i
n

n

k

k

quy.
r i
r
se , se -i,.., sei, seb: sai sô c h u â n của c á c h ệ sô t ư ơ n g ứ n g .

n

n

Ĩ2'. h ệ số t ư ơ n g quan b ộ i R .
2

se : sai sổ của h à m h ồ i quy.
y

F: giá trị k i ể m đ ị n h F.
df: bậc t ự do của h ồ i quy; d f = n-k n ế u const = 0; d f = n-k-1 n ế u
const = 1 .
ss : tổng bình phương sai lệch do hồi quy (Sum of Square
reg

Regression).
sSresid: tổng bình phương các sai lệch do ngẫu nhiên (Sum of
Square Residual).
V í d ụ 4.5
C ó thống k ê v ề số l ư ợ n g ô t ô b á n đ ư ợ c ( y ) , giá x ă n g ( X | ) , sự
t ă n g d â n số (X2), v à số l ư ợ n g đ ư ờ n g giao t h ô n g đ ư ợ c x â y d ự n g trong
15 n ă m . G i ả t h i ế t c ó quan h ệ t u y ế n tính giữa y v à Xj. H ã y ước l ư ợ n g
c á c h ệ sổ của h à m h ồ i quy.

171

Số hóa bởi Trung tâm Học liệu – ĐHTN





Năm

Số xe
bán được
(nghìn chiếc)

Giá xăng
(Slgalon)

1

159

1,62

Sự t ă n g d â n
sô ( t r i ệ u
người)
ES í.
55

2

160

1,667

56


13

3

163

1,69

58

14

4

166

1,7

60

15

5

167

1,72

63


17

6

167

1,73

65

18

7

168

1,736

66

18

8

167

1,74

66,7


18

9

167,9

1,75

66,9

19

10

168.9

1,755

67,4

19

li

169

1,756

67,9


19

12

169

1,77

68

20

13

170

1,767

68,5

18

14

171

1,756

68,8


17

15

172

1,77

68,9

18

Số con
đường mới
12

H ì n h 4.14 t r ì n h b à y c á c h n h á p d ữ l i ệ u v à k ế t q u ả ước l ư ợ n g các
tham sô của h à m h ồ i quy m ẫ u .

172
Số hóa bởi Trung tâm Học liệu – ĐHTN




I J I K
1
1
1 n i F 1 F

I 6 I H
1
y
xi
*?
ȓ
Sô xe bán giá xăng sự tăng dân Số con
năm
2
được (nghìn ($/galon) sá (tr
đưònq mới
3
1 nhiárl 159
1 62naưrtil 55
12
beta3 beta2 betal
betaũ
4
2
teo
1.667
56
13
5
3
163
ì 69
58
14
-0.63072 0 53354 57.41194 44.11072

6
4
166
1.7
60
15
0.315223 0.225274 25 4900131.70179
ĩ
5
167
1 72
63
17
0.946848 Ũ.9B6743 #N/A m/A
B
6
167
173
65
18
65.31787
11 #N/A #N/A
9
7
168 1736
66
18
1B3.1368 1028052 #N/A *I/A
10
B

167
1 74
66.7
18
li
9
167.9
1 75
66.9
19 Hàm hòi qly
12

168.9
1.755
67.4
19
y=44 1107 + 57.4119x1 +0.5335x2 - 0 6307x3
13
11
169 1 756
67 9
19
I
I
u
12
169
1 77
68
20 Côm thức


15
13
170 1.767
68.5
18
ÍGỈ5:ÍJ$9=UNEST(B3:B17.C3:E17.1.1)
16
14
171 1.756
68.8
17
"
1
15
172
1 77
689
18
18
ì
ì•

A

B

n

H ì n h 4.14. Két quả ước lượng


tham sô của hôi quy bội bằng

hàm

Lỉnest.
S ử d ụ n g t r ì n h Regression đ ể p h â n t í c h h ồ i q u y b ộ i
Quy t r ì n h sử d ụ n g t r ì n h Regressỉon đ ể p h â n t í c h h ồ i quy b ộ i
trong Excel g i ố n g n h ư quy t r ì n h p h â n tích h ồ i quy đ ơ n . H ì n h 4.15 h i ể n
thị k ế t q u ả h ồ i quy v à c á c t h a m số thống k ê đ ể p h â n tích p h ư ơ n g sai,
k i ể m định g i ả thuyết đ ố i v ớ i số l i ệ u trong ví d ụ 4.5.
N h ư c ó t h ể t h ấ y t r o n g k ế t q u ả h ồ i quy p h ả n á n h trong H ì n h 4.15,
S i g n i í i c a n c e F = 2,7E-07 < oe =0,05 n ê n m ô h ì n h h ồ i quy chấp n h ậ n
được. G i á trị P - v a l u e của Po v à p > a n ê n c á c h ệ số n à y k h ô n g c ó ý
3

nghĩa

khi m ở

rộng

y = 57,41 X i + 0 , 5 3 x

hàm

h ồ i quy.

Kết quả


hàm

h ồ i quy

là:

2

5.3. Phân tích hồi quy phỉ tuyến trong Excel
N h ư đ ã n ê u t r o n g m ụ c 4, c á c h à m h ồ i quy p h i t u y ế n n ế u c ó t h ể
tuyến t í n h h ó a đ ư ợ c thì sử d ụ n g c á c k ỹ thuật h ồ i quy t u y ế n t í n h đ ã n ê u
để ước l ư ợ n g c á c t h a m số h ồ i quy v à k i ể m đ ị n h m ô h ì n h h ồ i quy.
Trong Excel cung cấp h à m L O G E S T đ ể ước l ư ợ n g c á c tham số của
h à m h ồ i quy m ũ y = b m , m
X |

X 2
2

...m

X n
n

. Cú pháp và cách diễn giải kết

q u ả của L o g e s t n h ư c ú p h á p v à c á c h d i ễ n g i ả i k ế t q u ả của L i n e s t .

173
Số hóa bởi Trung tâm Học liệu – ĐHTN





×