Tải bản đầy đủ (.docx) (25 trang)

PHƯƠNG PHÁP HỒI QUY VÀ TƯƠNG QUAN TRONG KIỂM TOÁN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (348.46 KB, 25 trang )

PHƯƠNG PHÁP HỒI QUI VÀ TƯƠNG
QUAN
(Linear Correlation and Regression)

I. HỆ SỐ TƯƠNG QUAN
1. Hệ số tương quan mẫu
2. Đặc tính của hệ số tương quan
II. TƯƠNG QUAN HẠNG
III. MÔ HÌNH HỒI QUI TUYẾN TÍNH
1. Hồi qui tuyến tính một chiều
a. Phương trình hồi qui tuyến tính một chiều
b. Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều
c. Kiểm định tham số hồi qui tổng thể ((): (Test of the
population regression slope)
d. Phân tích phương sai (ANOVA) hồi qui
e. Dự báo trong phương pháp hồi qui tuyến tính đơn
2. Hồi qui nhiều chiều
a. Phương trình hồi qui nhiều chiều
b. Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều
chiều
c. Kiểm định giả thuyết cho các tham số hồi qui
d. Kiểm định trên tất cả các tham số của một mô hình hồi qui
e. Dự báo trong phương pháp hồi qui tương quan nhiều chiều
BÀI TẬP

Mục đích của phương pháp hồi qui tương quan là ước lượng mức độ liên hệ (tương quan)
giữa các biến độc lập (các biến giải thích) đến biến phụ thuộc (biến được giải thích), hoặc ảnh
hưởng của các biến độc lập với nhau (các yếu tố nguyên nhân). Phương pháp này được ứng dụng
trong kinh doanh và kinh tế để phân tích mối liên hệ giữa hai hay nhiều biến ngẫu nhiên.
I. HỆ SỐ TƯƠNG QUAN (Correlation coefficient)
Hệ số tương quan đo lường mức độ quan hệ tuyến tính giữa hai biến; chính xác hơn là


quan hệ tuyến tính giữa hai biến, không phân biệt biến này phụ thuộc vào biến kia.
1. Hệ số tương quan mẫu (r): (Sample correlation coefficient)
Gọi (x1, y1), (x2, y2), , (xn, yn) là n cặp quan sát của một mẫu ngẫu nhiên của hai biến
ngẫu nhiên X & Y. Hệ số tương quan mẫu tính từ mẫu n cặp giá trị quan sát của hai biến X và Y
với trung bình (x và (y và phương sai (x2 và (y2 được thể hiện trong công thức sau:

2. Ðặc tính của hệ số tương quan:
Hệ số tương quan (r) không có đơn vị, có thể tính từ giá trị mã hóa bằng phép biến đổi tuyến
tính của X và Y. (r) luôn luôn biến động trong khoảng ( 1 (-1 ( r ( 1), nếu hệ số tương quan (r)
dương cho biết X và Y biến động cùng chiều và âm thì ngược lại. Ðể biểu hiện mức độ chặt chẽ
của mối liên hệ giữa các biến ta có các nhận xét sau đây:
( r = ( 1 : Mối liên hệ giữa các biến hoàn toàn chặt chẽ.
( r = 0 : Giữa các biến không có mối liên hệ.
Ðể thấy được đặc tính của r, sáu trường hợp sau đây trình bày sự liên hệ tuyến tính giữa X và Y
và giá trị của r. Trong tất cả 6 trường hợp chỉ có (x y là thay đổi, còn các giá trị còn lại như
dưới đây:

Ví dụ: Một quảng cáo giới thiệu du lịch được đăng trong 17 tờ báo hoặc tạp chí. Liên quan đến
chiến dịch quảng cáo này có hai biến liên hệ (bảng 6.1)
X: chi phí quảng cáo (100.000 đồng)
Y: tỉ suất lợi nhuận (chỉ tính trên 100.000đ chi phí quảng cáo)

Từ số liệu bảng trên ta tính trung bình mẫu như sau:


r = -0.441 chỉ ra mối quan hệ giữa chi phí và thu nhập là mối tương quan nghịch, có nghĩa
rằng chi phí cao thì thu nhập thấp và giữa chúng mối liên hệ không chặt chẽ lắm.
Hệ số tương quan của mẫu thì hữu ích khi dùng để mô tả tính chặt chẽ của mối quan hệ
tuyến tính trong một mẫu. Vì vậy, nó có thể dùng làm cơ sở cho kiểm định giả thuyết của tổ hợp
không tuyến tính (không tương quan) trong tổng thể (nghĩa la ìhệ số tương quan tổng thể ( = 0).

Ðặt r là hệ số tương quan mẫu được tính từ một mẫu ngẫu nhiên gồm n cặp quan sát từ
một phân phối chuẩn. Ta có các trường hợp tổng quát để kiểm định ( = 0) nghĩa là không có mối
liên hệ giữa các biến như sau:

Trở lại ví dụ về chi phí và thu nhập trong chiến dịch quảng cáo chúng ta sẽ kiểm định giả
thuyết H0 rằng không có mối quan hệ tương quan trong tổng thể. Trường hợp kiểm định dạng 2
đuôi ta có:

Tra bảng phân phối Student t trong trường hợp n = 17, ta có (n - 2) =15 và kiểm định trong hai
trường hợp ( = 10% và ( = 5%.
t15,5% = 1,753 và t15,2,5% = 2,131.
Như vậy: t = -1, 903 nằm trong khoảng giữa của t15,5% và t15,10%, nghĩa là:

Vậy theo điều kiện quyết định bác bỏ giả thuyết H0 trong trường hợp kiểm định dạng 2 đuôi thì
quan sát trên cho phép bác bỏ giả thuyết H0 ở mức ý nghĩa 10% (có tương quan giữa chi phí
quảng cáo và thu nhập) và chấp nhận giả thuyết H0 ở mức ý nghĩa 5% (không tương quan giữa
chi phí quảng cáo và thu nhập), nghĩa là nếu chọn một xác suất sai lầm (bác bỏ giả thuyết H0 khi
giả thuyết này đúng) nhỏ thì số liệu quan sát trên không đủ điều kịên để bác bỏ H0.
II. TƯƠNG QUAN HẠNG: (RANK CORRELATION)
Tương quan hạng dùng để sử dụng cho kiểm định mối liên hệ giữa các biến khi phân phối
của tổng thể được giả sử không phải là phân phối chuẩn hoặc trong trường hợp hiện diện các giá
trị bất thường của biến quan sát (lớn quá hoặc nhỏ quá).
Ðặt xi và yi là những cặp quan sát được xếp hạng riêng biệt theo thứ tự được bắt đầu từ 1.
Ta có hai trường hợp:
· Nếu các hạng được xếp có trùng nhau (đồng hạng) thì sử dụng công thức (11.1) để tính hệ
số tương quan r.
· Nếu các hạng được xếp không trùng nhau thì sử dụng công thức của Spearman như dưới
đây để tính hệ số tương quan hạng.

Trong đó: di là chênh lệch của 2 hạng được xếp của biến xi và yi

Tương tự các bước kiểm định cho trường hợp tổng quát - không có mối liên hệ giữa các biến (( =
0) ta có:

Trở lại ví dụ của chi phí quảng cáo và thu nhập ta có:
Bảng 6.2. Chi phí quảng cáo (xi) và tỉ suất lợi nhuận (yi) trên 17 tờ báo và tạp chí:
x
i
hạng y
i
hạng x
i
hạng y
i
hạng
4,07
2,15
1,25
14,67
16,02
3,81
9,87
1,27
1,80

14
8
1
16
17
13

15
2
7
17,41
22,25
106,84
14,41
24,18
29,73
35,95
61,81
48,36
2
4
16
1
5
6
8
11
9
1,50
1,68
2,72
1,61
1,52
3,10
3,32
3,07
3

6
9
5
4
11
12
10
78,74
66,42
121,95
21,93
31,29
88,31
92,70
59,06
13
12
17
3
7
14
15
10
Ta thấy rằng hạng được xếp cho các cặp của hai biến X và Y không trùng nhau. Vì vậy ứng
dụng công thức của Spearman ta có hệ số tương quan mẫu:

Tra bảng phân phối Spearman ở mức ý nghĩa ( = 5% và ( = 10% ta có:
rs,5% = 0,412 và rs,2,5% = 0,490
⇒ r
s,2,5%

< r
S
< r
s,5%
Bởi vì giá trị tính được r = - 0,431, và rs,2,5% < r < rs,5% ta có thể kết luận rằng giả thuyết H0
(không có sự liên hệ giữa chi phí quảng cáo và thu nhập) có thể bị bác bỏ trên cơ sở kiểm định
dạng hai đuôi ở mức ý nghĩa 10% nhưng không bị bác bỏ ở ( = 5%.
III. MÔ HÌNH HỒI QUI TUYẾN TÍNH: (LINEAR REGRESSION)
Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến
độc lập Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải
thích).
1. Hồi qui tuyến tính một chiều (tuyến tính đơn): (Simple linear regression)
Mục tiêu phân tích của mô hình này là xét mối liên hệ tuyến tính giữa một hay nhiều biến độc lập
Xi (Xi: còn được gọi là biến giải thích) đến một biến phụ thuộc (Y: biến được giải thích).
a) Phương trình hồi qui tuyến tính một chiều:
Ðặt (x1,y1), (x2,y2) (xn,yn) là mẫu gồm n cặp quan sát trên đường hồi qui tổng thể:.

Theo phương pháp bình phương bé nhất thì ước lượng các hệ số ( và ( là các giá trị a và b
sao cho tổng bình phương sai số của phương trình sau đây là bé nhất:

Các hệ số a và b được tính như sau:
Và đường hồi qui tuyến tính mẫu của y trên x là: y = a + bx
Ví dụ: Chúng ta có thể quan sát số tiền chi tiêu (yi) và thu nhập (xi) của 22 hộ gia đình trong một
tháng có mối quan hệ với nhau như thế nào (1.000đ). Số liệu thu thập được trình bày ở bảng
11.3.
Từ bảng bên ta có:
n = 22

Ðường hồi qui quan sát như sau: y = 1923 + 0,3815x
Phương trình này hàm ý rằng nếu thu nhập của hộ gia đình tăng lên 1.000đ thì trung bình

chi tiêu tăng thêm là 381,5 đ. Còn 1923đ là phần chi tiêu do các nguồn khác.

b) Khoảng tin cậy và kiểm định giả thuyết trong hồi qui một chiều:
Giả sử đường hồi qui tuyến tính có dạng: yi = ( +(xi + (i
và đặtĠ là phương sai của sai số và được ước lượng từ công thức sau:

Vấn đề ở đây là ta xem xét phân phối mẫu và xác định tham số b của đường hồi qui. Ðặt b là ước
lượng mẫu của ( thì phương sai của b sẽ là:

Và vì vậy, ước lượng không chệch củš được xác định bởi:

Giả sử rằng, sai số hồi qui ((i) có phân phối chuẩn thì biến ngẫu nhiên (t) dùng để kiểm định giả
thuyết về ( và ước lượng khoảng tin cậy của ( được tính như sau:
(6.4)
và một khoảng tin cậy 100(1-()% cho ( là:

Trong đó:Ġ là một số sao choĠ
Ví dụ: Trong sự liên hệ giữa chi tiêu và thu nhập mỗi hộ. Chúng ta có những thông tin như sau:
n = 22; b = 0,3815; S
b
= 0,0253
Khoảng tin cậy 99% cho ( được tính như sau:
Tra bảng phân phối t ta có: Ġ
Suy ra: 0,3815 - (2,845)(0,0253) < β < 0,3815 + (2,845)(0,0253)
0,3095 < β < 0,4535
Vì vậy, với khoảng tin cậy 99%, cứ 1000 đồng tăng lên trong thu nhập/hộ thì chi tiêu tăng thêm
nằm trong khoảng 309,5 đồng đến 453,5 đồng.

c) Kiểm định tham số hồi qui tổng thể ((): (Test of the population regression slope)
Ở mức ý nghĩa (, giả thuyết H0 có thể kiểm định dưới các trường hợp sau:

{  
Ðặt giả thuyết: ĉĉĉ
Giá trị kiểm định: ĉ
Quyết định bác bỏ H0 khi: t > tn-2,( t <- tn-2,(; Ġ
Trong ứng dụng, giả thuyết H0: ( = 0 thường được xét đến nhất. Ðặc biệt, trong thực tế có
trường hợp ( = 0, lúc đó ta có: y = ( + (i

hàm ý rằng sự thay đổi của biến phụ thuộc (y) không bị
ảnh hưởng bởi biến độc lập (x). Ngoài ra, kiểm định tham số hồi qui thường ít xét đến tính chất
ảnh hưởng cụ thể thuận biến hay nghịch biến của các biến độc lập mà chỉ xem chúng có ảnh
hưởng đến biến phụ thuộc y hay không nên kiểm định này thường có dạng hai đuôi.
Trở lại ví dụ bảng 11.3 ta có: n = 22 b = 0,3815 Sb = 0,0253
· Ðặt giả thuyết:Ġ
(Giả thuyết H0 có nghĩa là chi tiêu không û phụ thuộc hay không ảnh hưởng bởi thu nhập và giả
thuyết H1 là chi tiêu có ảnh hưởng hay phụ thuộc vào thu nhập).
· Giá trị kiểm định:Ġ
Giá trị tra bảng của t20,0,5% = 2,845. Theo điều kiện bác bỏ giả thuyết H0 ta có giá trị kiểm
định t nằm trong vùng bác bỏ ở mức ý nghĩa 0,5% (vì 15,8 > 2,845). Ðiều này có nghĩa rằng
H1 đúng hay chi tiêu thì phụ thuộc vào thu nhập.

d) Phân tích phương sai (ANOVA) hồi qui:
Trong ước lượng các tham số của mô hình hồi qui tuyến tính đơn theo phương pháp bình
phương nhỏ nhất, có thể chứng minh được rằng:

Trong đó:
ĉ là tổng biến động của y
ĉ là tổng bình phương hồi qui, là đại lượng biến động của y được giải thích bởi đường hồi
qui.
ĉ là phần biến động còn lại hay còn gọi là dư số, là đại lượng biến động tổng gộp của các
nguồn biến động do các nhân tố khác gây ra mà không hiện diện trong mô hình hồi qui và phần

biến động ngẫu nhiên.
• SSR càng lớn thì mô hình hồi qui càng có độ tin cậy cao trong việc giải thích biến động của
y.
• Hệ số xác định: r2 =Ġ là phần trăm biến động của y được giải thích bởi mối quan hệ tuyến
tính của y đối với x.
• Số thống kê F =Ġ có phân phối F và thường được dùng để kiểm định mức ý nghĩa của mô
hình hồi qui. F càng lớn mô hình càng có ý nghĩa (vì Sig.F sẽ nhỏ hơn so với mức ý nghĩa tự
chọn của kiểm định).
Các nguồn biến động của hồi qui tuyến tính đơn được tóm tắt trong bảng phân tích phương sai
hồi qui như sau:

Ví dụ sau đây là bảng kết quả phân tích hồi qui một chiều được xử lý từ Excel hoặc SPSS giữa
hai biến - nhu cầu vốn vay (y) và số nhân khẩu/hộ (x). Kết quả thể hiện
· Giải thích hệ số tương quan r: tương quan giữa hai biến là rất chặt chẽ (r = 0,98), nghĩa là số
nhân khẩu càng cao thì nhu cầu vốn vay càng lớn.
· Giải thích hệ số xác định r2: Chỉ riêng số nhân khẩu/hộ làm thay đổi 97,2% nhu cầu vốn vay
(r2 = 0,972).
· Kiểm định ở mức ý nghĩa 5% thì mô hình hồi qui rất có ý nghĩa vì Sig.F= 0,0001% rất nhỏ
so với 5%.

e) Dự báo trong phương pháp hồi qui tuyến tính đơn
Giả sử ta có mô hình hồi qui của tổng thể y = ( + (xi + (i (i =1, , n) và (i có phân phối chuẩn.
Ðặt a và b là hai tham số được ước lượng theo phương pháp bình phương bé nhất của ( và (, dựa
vào n cặp quan sát (x1,y1); (x2,y2); ; (xn,yn). Ta ước lượng được:
• Khoảng tin cậy 100(1-()% của giá trị thật (yn +1) tại (xn+1):
yn +1 = ( + (xn+1 + (n+1 nằm trong khoảng:

• Và khoảng tin cậy 100(1 - ()% của giá trị mong đợi (yn +1) tại (xn+1) trong điều kiện E
(yn+1/xn+1) là:


Với Ġ vàĠ Ĩ là một giá trị của x mà tại đó chúng ta muốn dự báo về giá trị của y)
Ví dụ: Giả sử rằng chúng ta quan tâm đến dự đoán doanh thu bán lẻ trên hộ trong một năm mà
trong đó thu nhập trên hộ/năm là 12 triệu đồng.
Ta có: xn+1 = 12.000, a = 1.923 và b = 0,3815
Suy ra:

Vì vậy, khi thu nhập/năm là 12 triệu đồng thì doanh thu bán lẻ thu được trên hộ khoảng 6,5 triệu
đồng. Dựa trên các đại lượng:

Thế các đại lượng trên vào công thức (6.6) và (6.7) ta có kết luận sau:
· Dự báo giá trị thật cho doanh thu bán lẻ là 6,501 ( 321. Có nghĩa là với khoảng tin cậy 95%
của doanh thu trong một năm tại mức thu nhập là 12 triệu nằm trong khoảng 6,18 triệu đến
6,82 triệu.
· Và dự báo cho giá trị mong đợi của doanh thu bán lẽ là 6,501 ( 91. Như vậy, rõ ràng rằng
trong cùng khoảng tin cậy nhưng sự không chắc chắn trong việc dự báo cho giá trị thật thì
lớn hơn giá trị mong đợi vì dự báo giá trị thật có khoảng ước lượng rộng hơn.
Chú ý: Nếu tất cả các yếu tố khác không đổi thì:
- Cỡ mẫu n càng lớn, càng hẹp khoảng tin cậy khi ước lượng, dự báo càng chính xác.
-Ġ càng lớn, khoảng tin cậy ước lượng càng lớn, dự báo càng kém chính xác.
- Phương saiĠ càng lớn, thì khoảng tin cậy ước lượng càng hẹp, dự báo càng chính xác.
-Ġcàng lớn, khoảng tin cậy ước lượng càng rộng, và dự báo càng kém chính xác.
2. Hồi qui nhiều chiều: (Multiple Regression)
a) Phương trình hồi qui nhiều chiều:
Mục tiêu của mô hình này giải thích biến phụ thuộc (y) bị ảnh hưởng bởi nhiều biến độc
lập (xi). Ví dụ, trong kinh doanh ngành ngân hàng, lợi tức thu được từ việc chênh lệch giữa lãi
suất tiền gởi và cho vay phụ thuộc ít nhất vào hai yếu tố: Phần trăm tăng lên trong lượng tiền gởi
(x1) và số đơn vị đến gởi (x2). Ðể xét mối quan hệ này ta sử dụng tài liệu thu thập của ngân hàng
qua 25 năm như sau:
Bảng 6.4: Lợi tức, % tăng của tiền gởi và số đơn vị gởi tiền qua 25 năm
Năm x

1
(%) x
2
y (%) Năm x
1
(%) x
2
y
(%)
1 3,92 7.298 0,75 14 3,78 6.672 0,84
2 3,61 6.855 0,71 15 3,82 9.890 0,79
3 3,32 6.636 0,66 16 3,97 7.115 0,70
4 3,07 6.506 0,61 17 4,07 7.327 0,68
5 3,06 6.450 0,70 18 4,25 7.546 0,72
6 3,11 6.402 0,72 19 4,41 7.931 0,55
7 3,21 6.368 0,77 20 4,49 8.097 0,63
8 3,26 6.340 0,74 21 4,70 8.468 0,56
9 3,42 6.349 0,90 22 4,58 8.717 0,41
10 3,42 6.352 0,82 23 4,69 8.991 0,51
11 3,45 6.361 0,75 24 4,71 9.179 0,47
12 3,58 6.369 0,77 25 4,78 9.318 0,32
13 3,66 6.546 0,78
Phương trình hồi qui nhiều chiều cho ví dụ này có dạng:
y = a + b
1
x
1
+ b
2
x

2
Một cách tổng quát, phương trình hồi qui tuyến tính nhiều chiều có dạng:
y = a + b
1
x
1
+ b
2
x
2
+ + b
k
x
k
(6.8)
Các tham số a, b1, b2, ,bn có thể được ước lượng dễ dàng nhờ các phần mềm có sẳn trên
máy tính. Phương trình này sẽ được suy rộng cho tổng thể có biến phụ thuộc Y và các biến độc
lập X1,X2, ,Xk . Trở lại ví dụ trên các tham số có kết quả giải bằng phương pháp ma trận hoặc
từ phần mềm Excel như sau:
a = 1,565 ; b
1
= 0,237 ; b
2
= - 0,000249
Vì vậy: y = 1,565 + 0,237x1 - 0,000249x2
Giải thích:
· Khi cố định số lượng đơn vị tiền gởi (x2), lươûng tiền gởi tăng 1% dẫn đến 0,237% tăng lên
trong lợi tức.
• Khi cố định % tăng lên trong lượng tiền gởi (x1), cứ tăng lên 1000 đơn vị tiền gởi dẫn đến
giảm trong lợi tức 0,249%.

· Ngoài hai nhân tố trên, các nhân tố khác làm tăng lợi tức 1,565% (các nguồn thu từ Nhà nước
chẳng hạn).

• Hệ số xác định R2 : (Multiple coefficient of determination)
R2 được định nghĩa như là tỉ lệ (hay phần trăm) biến động của biến phụ thuộc (y) được
giải thích bởi các biến đôûc lập xi. Chẳng hạn, R2=0,52 có nghĩa là 52% sự thay đổi trong lợi tức
là do ảnh hưởng bởi % tăng trong lượng tiền gởi và số đơn vị tiền gởi. Hệ số xác định được tính
như sau:

• Hệ số tương quan bội R : (Multiple Correlation Corfficient)
R nói lên tính chặt chẽ của mối liên hệ giữa biến phụ thuộc (y) và các biến độc lập (xi).

Từ ví dụ trên, ta cóĠ, nghĩa là sự liên hệ giữa lợi tức (y) và phần trăm tăng lên trong lượng tiền
gởi, số lượng đơn vị tiền gởi là khá chặt chẽ.
• Hệ số xác định đã điều chỉnhĠ: (Adjusted Corfficient of Determination)
ĉ (k: số biến độc lập) (6.11)
hoặc tính từ R2: Ġ (6.12)
Ý nghĩa củaĠ giống như R2, thường thường giá trị củaĠ có sự khác biệt rất ít so với R2.
Tuy nhiên trong trường hợp đặc biệt,Ġ hiệu chỉnh khác biệt lớn so với R2 khi số lượng biến độc
lập chiếm tỉ lệ lớn trong một mẫu nhỏ.Ġlà chỉ số quan trọng để chúng ta nên thêm một biến độc
lập mới vào phương trình hồi qui hay không. Chúng ta có thể quyết định thêm một biến độc lập
nếŵtăng lên khi thêm biến đó vào (điều này thực hiện khá dễ dàng trên phần mềm Excel bằng
cách khi chọn vùng số liệu ta chọn thêm một cột số liệu của chỉ tiêu nào đó mà ta muốn thêm
vào).
• Tỷ số F = MSR/MSE trong bảng kết quả: dùng để so sánh với F trong bảng phân phối F ở
mức ý nghĩa (. Tuy nhiên, cũng trong bảng kết quả ta có giá trị Significance F, giá trị này cho
ta kết luận ngay mô hình hồi qui có ý nghĩa khi nó nhỏ hơn mức ý nghĩa ( nào đó (thay vì
phải tra bảng phân phối F phía sau sách), và giá trị Sig. F cũng là cơ sở để quyết định bác bỏ
hay chấp nhận giả thuyết H0 trong kiểm định bao quát các tham số của mô hình hồi qui. Nói
chung F càng lớn, khả năng bác bỏ giả thuyết H0 càng cao - giả thuyết H0 cho rằng tất cả các

tham số hồi qui đều bằng 0, nghĩa là các biến độc lập (xi) không liên quan tuyến tính tới biến
phụ thuộc y.
Trở lại bảng kết quả trên ta thấy giá trị Sig. F = 0,000282 = 0,023% là rất thấp so với mức ý
nghĩa trong kiểm định 5% nên mô hình hồi qui rất có ý nghĩa, nghĩa là các biến độc lập x1 (%
tăng lên trong lượng tiền gởi) và x2 (lượng đơn vị tiền gởi) có ảnh hưởng đến biến phụ thuộc y
(lợi tức ngân hàng).

b) Ước lượng khoảng tin cậy và kiểm định giả thuyết trong hồi qui nhiều chiều:
Mô hình hồi qui nhiều chiều cho tổng thể có dạng:

Ðặt a, b1, b2, ,bk là những tham số được ước lượng cho tổng thể; là những
độ lệch chuẩn đã ước lượng, và ε coi phân phối chuẩn thì biến ngẫu nhiên t được tính như sau:

Vì vậy, khoảng tin cậy 100(1-()% cho các hệ số hồi qui (i được tính như sau:

ĉ là một số sao choĠ
Ví dụ: Phương trình hồi qui tương quan liên hệ giữa % tiền gởi tiết kiệm, số đơn vị gởi tiền và
lợi tứ ngân hàng trong bảng kết quả trang 209 như sau:

• Khoảng tin cậy 99% cho (1 là:
-0,108 - (2,819)(0,063) < β
1
< -0,108 + (2,819)(0,063)
hay -0,285 < β
1
< 0,069.
Vậy, khi cố định số đơn vị tiền gởi, cứ một 1% tăng lên trong lượng tiền gởi thì dẫn đến lợi tức
giảm từ 0,3% đến tăng 0,069% xét trong khoảng tin cậy 99%.

• Khoảng tin cậy 99% cho (2 là:

-0,00003 - (2,819)(0,00003) < β
2
< - 0,00003 + (2,819)(0,00003)
hay - 0,00011 < β
2
< 0,00005.
Vậy, khi cố định % tăng lên trong lượng tiền gởi, cứ tăng 1000 đơn vị tiền gởi thì làm giảm lợi
tức từ 0,011% đến tăng 0,005%.

c) Kiểm định giả thuyết cho các tham số hồi qui:
Phần kiểm định này giống như trong hồi qui một chiều nhưng thay độ tự do tn-2 bằng tn-k-
1:
  
Ðặt giả thuyết ĉĉĉ
Giá trị kiểm định ĉ
Quyết định bác bỏ H0 khi: t > tn-k-1,( t < - tn-k-1,( Ġ
Trường hợp đặc biệt khi giá trị kiểm định cho những tham số riêng biệt mà bằng 0 thì
giá trị của biến phụ thuộc sẽ không bị ảnh hưởng bởi sự thay đổi của biến độc lập đó, nếu cố định
tất cả các nhân tố khác. Trở lại ví dụ trên nếu ta đặt:
• Giả thuyết H0 cho (1làĠ nếu giả thuyết H0 bị bác bỏ thì có nghĩa là khi các nhân tố khác
không thay đổi thì lượng tiền gởi ảnh hưởng đến lợi tức.
· Giá trị kiểm định:ĉ
Tra bảng phân phối t ta có: tn-k-1,( = t22,0,5% = 2,819
Kết luận: Vì -1,71 lớn hơn -2,819 cho nên giả thuyết H0 bị bác bỏ ngay cả ở mức ý nghĩa 0,5%,
điều này có nghĩa rằng, khi số lượng đơn vị tiền gởi không đổi, % tăng lên trong lượng tiền gởi
có ảnh hưởng đến lợi tức.
• Giả thuyết H0 cho trường hợp (2:


Khi so sánh với t22,0,5% thì giả thuyết H0 bị bác bỏ ở mức ý nghĩa 0,5%, tức là khi các yếu

khác không thay đổi thì số đơn vị tiền gởi có ảnh hưởng đến lợi tức.

d) Kiểm định trên tất cả các tham số của một mô hình hồi qui:
Chúng ta hãy xét mô hình hồi qui nhiều chiều sau:

Giả thuyết :Ġ (các xi không ảnh hưởng đến y)
H1: Có ít nhất một tham số (i ( 0
Giả thuyết H0 có thể được kiểm định dựa trên số thống kê:

Bác bỏ giả thuyết H0 khi: F > Fk,n-k-1,(
Fk,n-k-1,( là một số sao cho P (Fk,n-k-1 > Fk,n-k-1,( ) = (
Phần kiểm định ta cũng có thể tính trực tiếp dựa vào hệ số xác định R2 bởi vì:

Ví dụ: Giả sử ta có một phương trình hồi qui nhiều chiều có 4 biến độc lập (k = 4), n = 31 và
R2 = 0,72.
Ðặt giả thuyết H0: (1 = (2 = (3 = (4 = 0.
Kiểm định Ġ
Tra bảng Fk,n-k-1,( = F4,26,1% = 4,14
Vì vậy, giả thuyết H0 bị bác bỏ ở mức ý nghĩa 1%, điều này có nghĩa là nói chung các biến độc
lập có ảnh hưởng tới sự thay đổi của biến phụ thuộc.

e) Dự báo trong phương pháp hồi qui tương quan nhiều chiều:
Giả sử ta có một mô hình hồi qui tổng thể có dạng tổng quát như sau:

Ðặt a, b1, , bk là những thông số được ước lượng của (, (1, , (k theo phương pháp số bình
phương bé nhất. Dựa vào thông tin mẫu ta có:

Tương ứng với giá trị của các biến x1 n+1, x2. n+1, , xk.n+1 được cho trước thì mô hình
tuyến tính dự đoán tốt nhất cho yn+1 là:


Trở lại ví dụ trong ngành ngân hàng lợi tức (y) bị ảnh hưởng bởi % tăng lên trong lượng
tiền gởi (x1) và số đơn vị tiền gởi (x2). Giả sử rằng chúng ta muốn dự báo lợi tức trong một năm
mà trong đó x1= 4,5% và x2=9.000 đơn vị tiền gởi, phương trình hồi qui ước lượng tìm được ở
phần trước là:
y = 1,565 + 0,237x
1
- 0,000249 x
2
Vì vậy, lợi tức tối ưu sẽ là 0,39 %.

Sự dự đoán này có thể sử dụng để ước tính lợi nhuận mong muốn trong những điều kiện cụ thể.

BÀI TẬP
1. Một mẫu ngẫu nhiên gồm 8 dự án có gía/sản phẩm và doanh thu lần lượt như sau:
Doanh thu (triệu đồng): 12,2 18,6 29,2 15,7 25,4 35,2 14,7 11,1
Giá (ngàn đồng): 29,2 30,5 29,7 31,3 30,8 29,9 27,8 27,0
a. Tìm sự tương quan giữa doanh thu và giá?
b. Kiểm định ở mức ý nghĩa 5% dựa vào kiểm định dạng 2 đuôi với giả thuyết H0 rằng
hệ số tương quan của tổng thể thì bằng 0?
2. Những công ty đa quốc gia thường chuyển từ một sang nhiều liînh vực buôn bán hàng hóa và
dich vụ khác nhau trên trường quốc tế. Họ có một sự linh hoạt rất lớn trong giá chuyển giao của
các mặt hàng. Một nghiên cứu của hai công ty lớn đang hoạt động ở Việt Nam là P & G và
Unilever nhằm xác định tầm quan trọng của 20 biến có liên hệ, những biến này có thể được xem
xét trong việc thành lập chính sách chuyển giao giá quốc tế. Các biến này đã được xếp hạng
trong bảng như sau:

a. Hãy tính hệ số tương quan hạng của Spearman (Tied Rank)?
b. Kiểm định giả thuyết H0 rằng không có sự tương quan giữa các biến ở mức ý nghĩa
5%?
3. Một công ty đặt những giá khác nhau cho hệ thống âm ly đặc biệt cho 8 khu vực khác nhau

trong nước. Bảng sau đây trình bày doanh thu và giá cả như sau: (triệu đồng)
Giá 5,5 6,0 6,5 6,0 5,0 6,5 4,5 5,0
Doanh thu 420 380 350 400 440 380 450 420
Hãy ước lượng phương trình hồi qui của doanh thu trên giá và giải thích?
4. Một mẫu gồm 25 công nhân ở một phân xưởng sản xuất được chọn ra. Mỗi công nhân
được yêu cầu để đánh giá sự thỏa mãn trong nghề nghiệp (x) trong phạm vi từ 1 đến 10. Hơn
nữa, số lượng ngày vắng mặt (y) trong công việc trong năm rồi đã được liệt kê cho số công
nhân này theo đường hồi qui mẫu:
y = 13,6 - 1,2x và Sb = 80,6
a. Giải thích phương trình hồi qui?
b. Kiểm định ở mức ý mghĩa 1% dạng một đuôi giả thuyết H0 rằng không có quan hệ
tuyến tính giữa sự thỏa mãn nghề nghiệp và sự vắng mặt (nghỉ việc trong năm)?
5. Một nhà phân tích tin rằng nhân tố quyết định quan trọng của lợi tức ngân hàng (y:%) là chênh
lệch giữa lãi suất cho vay và lãi suất tiền gởi (x:%). Một mẫu ngẫu nhiên gồm 20 nhà băng được
chọn và đường hồi qui mẫu như sau: y = 0,97 + 0,47x và hệ số xác định R
2
= 0.72.
a. Giải thích phương trình hồi qui?
b. Kiểm định hai đuôi ở mức ý nghĩa 5% giả thuyết H0 rằng không có tổ hợp tuyến tính
giữa x và y?
6. Trong nghiên cứu nhận dạng vấn đề của một công ty muốn thâm nhập thị trường mới, công ty
tiến hành đánh giá sự ảnh hưởng của các nhân tố khác nhau trong việc có nên đặt một chi nhánh
hay đặt một cơ sở sản xuất tại một nơi nào đó hay không. Một mẫu ngẫu nhiên gồm 70 khu vực
được khảo sát với các nhân tố như trong mô hình hồi qui sau đây được ước lượng:
y = -59,31 + 4,983x
1
+ 2,198x
2
+3,816x
3

- 0,31x
4
- 0,886x
5
+ 3,215x
6
+ 0,085x
7

(1,156) (0,21) (2,063) (0,33) (3,055) (1,568) (0,354)
R
2
= 0.766
Chú ý: số trong ngọăc dưới phương trình hồi qui là sai số chuẩn của mỗi biến (Sbi).
Trong đó:
y: Thâm nhập thị trường mới
x1: Dân số (triệu người)
x2: Phạm vi hay mức độ rộng lớn của ngành
x3: Số đo chất lượng đời sống kinh tế
x4: Số đo chất lượng đời sống chính trị
x5: Số đo chất lượng đời sống môi trường
x6: Số đo chất lượng đời sống sức khỏe và y tế
x7: Số đo chất lượng đời sống xã hội
Yêu cầu:
1. Giải thích phương trình hồi qui?
2. Giải thích hệ số xác định?
3. Tìm khoảng tin cậy 95% cho sự tăng lên trong y từ một đơn vị tăng lên trong x3, với
tất cả nhân tố khác không thay đổi?
4. Kiểm định ở mức ý nghĩa 5% giả thuyết H0 rằng x5 không ảnh hưởng đến y, các nhân
tố khác không thay đổi?

5. Yêu cầu giống như câu 4 cho trường hợp x6?
6. Kiểm định giả thuyết H0 rằng tất cả 7 biến độc lập trên không ảnh hưởng đến sự bắt
đầu cuộc kinh doanh mới y ở mức ý nghĩa 5%?

×