Tải bản đầy đủ (.doc) (17 trang)

bài tập kinh tế lượng THỐNG kê và hồi QUY đơn mô hình kinh tế lượng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (771.13 KB, 17 trang )

ĐẠI HỌC HOA SEN

KINH TẾ LƯỢNG
ĐÁP ÁN Bài tập SỐ 1
ÔN TẬP THỐNG KÊ và HỒI QUY ĐƠN (trang 1)
ĐÁP ÁN Bài tập SỐ 2
MÔ HÌNH HỒI QUY ĐƠN

ĐÁP ÁN Bài tập SỐ 1
ÔN TẬP THỐNG KÊ và HỒI QUY ĐƠN(trang 9)
Người soạn: GV. Phạm Văn Minh
Câu 1 (20 điểm):
Hãy nêu định nghĩa của kỳ vọng, phương sai, độ lệch chuẩn của một biến ngẫu nhiên.
Hãy chứng minh những tính chất sau đây của kỳ vọng và phương sai, trong đó X là
một biến ngẫu nhiên và a, b là những hằng số.
(a) E[a] = a

(b) E[bX] = bE[X]

(c) E[a + bX] = a + bE[X]

(d) VAR[a] = 0

(e) VAR[bX] = b2VAR[X]

(f) VAR[a + bX] = b2VAR[X]

(g) VAR[X] = E[X2] - (E[X])2
Giải:
(a) E[a] = a


(b) E[bX] = bE[X]

(c) E[a + bX] = a + bE[X]

(d) VAR[a] = 0


Dựa vào tính chất của toán tử kỳ vọng E[X]: E[a] = a (ở câu a)
(e) VAR[bX] = b2VAR[X]

(f) VAR[a + bX] = b2VAR[X]

(g) VAR[X] = E[X2] - (E[X])2
Để đơn giản hóa ký hiệu, ta đặt  = E[X]

Câu 2 (20 điểm):
Có một giả thuyết cho rằng điểm trung bình của một sinh viên có thể được giải thích
bởi thu nhập trung bình hàng năm của Cha Mẹ. Để kiểm chứng giả thuyết này, một
sinh viên Kinh tế Khóa 34 đã tiến hành thu thập dữ liệu từ một mẫu gồm 8 sinh viên
của Trường Đại Học Hoa Sen và được kết quả như sau:
STT
1
2
3
4
5
6
7
8


Điểm trung bình
(ĐTB)
10.00
7.50
8.75
5.00
7.50
8.75
6.25
6.25

Thu nhập trung bình
hàng năm (TN – tr.đồng)
105
75
45
45
60
90
30
60

Giải:
(a) Hãy tính các trị thống kê tổng hợp cho biến thu nhập trung bình hàng năm và biến
điểm trung bình. Điền các kết quả vào bảng sau:
Trị thống kê Tổng hợp
Số lần Quan sát
Trung bình
Trung vị
Yếu vị (mode)

Giá trị lớn nhất
Giá trị nhỏ nhất

HÀM EXCEL
=COUNT( )
=AVERAGE( )
=MEDIAN( )
=MODE( )
=MAX( )
=MIN( )

Biến ĐTB
8
7.5
7.5
6.25; 7.5; 8.75
10
5

Biến TN
8
63.75
60
45; 60
105
30
2


Phương sai (*)

Độ Lệch chuẩn
Hệ số biến thiên
Đồng Phương sai

626.786
=VAR( )
2.679
25.036
=STDEV( )
1.637
= STDEV( )/
0.218
0.393
AVERAGE( )
=(n/(n-1))*COVAR() = 29.464

Hệ số biến thiên: được định nghĩa là tỷ số σ/μ, trong đó tử số là độ lệch chuẩn và
mẫu số là trị trung bình. Đó là một đại lượng của sự phân tán của phân phối tương
đối so với trị trung bình của phân phối.
Đồng Phương sai: Trong lý thuyết xác suất và thống kê, đồng phương sai (hay hiệp
phương sai) là độ đo sự biến thiên cùng nhau của hai biến ngẫu nhiên (phân biệt với
phương sai - đo mức độ biến thiên của một biến).
Nếu 2 biến có xu hướng thay đổi cùng nhau (nghĩa là, khi một biến có giá trị cao hơn
giá trị kỳ vọng thì biến kia có xu hướng cũng cao hơn giá trị kỳ vọng), thì hiệp
phương sai giữa hai biến này có giá trị dương. Mặt khác, nếu một biến nằm trên giá
trị kì vọng còn biến kia có xu hướng nằm dưới giá trị kì vọng, thì hiệp phương sai của
hai biến này có giá trị âm.
Lưu ý: trong Excel có đến 4 hàm để tính Phương sai. Đó là VAR, VARA, VARP,
VARPA. Nhưng để tính phương sai cho mẫu, ta sử dụng công thức VAR( ), tương tự
như vậy công thức (n/(n-1))*COVAR sẽ tính đồng phương sai của hai biến trên mẫu.

Hoặc sử dụng Data Analysis/ Descriptive Statistics:

Ta có bảng sau:
ĐIỂM TRUNG BÌNH
Mean
Standard Error

THU NHẬP
7.5 Mean
0.578638 Standard Error

63.75
8.851452665

Median

7.5 Median

60

Mode

7.5 Mode

45

Standard Deviation

1.636634 Standard Deviation


25.03568881

Sample Variance

2.678571 Sample Variance

626.7857143

Kurtosis

-0.7 Kurtosis

-0.596449704

3


Skewness
Range
Minimum
Maximum
Sum
Count

-6.3E-17
5
5
10
60
8


Skewness
Range
Minimum
Maximum
Sum
Count

0.46088053
75
30
105
510
8

(b) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến thu nhập
trung bình hàng năm và trục tung cho biến điểm trung bình. Nhận xét một cách ngắn
gọn về đồ thị của dữ liệu.
Tính toán các hệ số hồi quy 1 và 2 trong mô hình hồi quy sau: ĐTB = 1 + 2*TN
bằng Excel.
Đồ thị phân tán:

Nhận xét: Dựa vào đồ thị trên, ta thấy dường như giữa điểm trung bình của một sinh
viên có mối tương quan tuyến tính đồng biến với thu nhập trung bình hàng năm của
Cha Mẹ.

4


Các bạn có thể “click đúp” trực tiếp vào bảng trên để xem cách tính toán mà không

cần phải mở Excel. Cụ thể hơn,  1 và  2 được tính bằng các công thức như sau:
n

 X Y  n. X .Y

ˆ2  i n1

X

i i
2
i

 n.( X ) 2



4031.3  8 * 63.75 * .7.5
0.047.
36900  8 * (63.75) 2

i 1

ˆ1 Y  ˆ2 X 7.5  0.047 * 63.75 4.5032 .
(c) Theo Anh/Chị, giả thuyết cho rằng điểm trung bình của một sinh viên có thể được
giải thích bởi thu nhập trung bình hàng năm của Cha Mẹ là đúng hay không đúng.
Giải thích ngắn gọn câu trả lời của Anh/Chị.
Câu này chưa cần làm.
Câu 3 (20 điểm):
Thu thập dữ liệu về thu nhập (R), chi tiêu cho ăn uống (C1) và các chi tiêu khác (C2),

bình quân 1 tuần của 10 hộ gia đình ở một vùng, nhà nghiên cứu được kết quả sau
(đơn vị ngàn VNĐ/ tuần):
Hộ gia
đình i

1

2

3

4

5

6

7

8

9

10

Ri

800 1000 1200 1400 1600 1800 2000 2200 2400 2600

C1i


320

310

340

310

450

420

480

520

600

520

C2i

380

340

560

640


660

730

740

880

950

980

5


a) Gọi tổng chi tiêu bình quân 1 tuần của hộ gia đình là C (C = C1 + C2). Hãy tính
giá trị kỳ vọng và phương sai của tổng chi tiêu C cho tập dữ liệu trên.

Dùng hàm AVERAGE, VAR trong EXCEL ta được:

Ta thấy E(C) = E(C1) + E(C2); Var(C) = Var(C1) + Var(C2) +2Cov(C1,C2)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của C, chữ đậm màu đỏ ở bảng trên,
“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
b) Gọi số tiền tích lũy bình quân 1 tuần của hộ gia đình là P (P = R – C). Hãy tính giá
trị kỳ vọng và phương sai của số tiền tích lũy bình quân 1 tuần cho tập dữ liệu trên.
Ta có bảng số liệu sau:

Tương tự, ta dùng hàm AVERAGE, VAR trong EXCEL:


Ta thấy E(P) = E(R) + E(C); Var(P) = Var(R) + Var(C) - 2Cov(R,C)
(Các bạn chỉ cần tìm ra Kỳ vọng và phương sai của P, chữ đậm màu đỏ ở bảng trên,
“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
Câu 4 (20 điểm):
Có một giả thuyết cho rằng tổng chi tiêu của một hộ gia đình phụ thuộc vào thu nhập
của hộ gia đình đó. Để kiểm chứng giả thuyết này, nhà nghiên cứu đã dùng dữ liệu về
thu nhập (R), tổng chi tiêu (C) bình quân 1 tuần của hộ gia đình trong Câu 3:
a) Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến R và trục
tung cho biến C. Nhận xét một cách ngắn gọn về đồ thị của dữ liệu.
6


Theo đồ thị ta thấy hình như giữa C và R có mối quan hệ đồng biến, và giữa C &
R có quan hệ tuyến tính khá chặt.
b) Hãy tìm khoảng tin cậy 95% của thu nhập (R) bình quân 1 tuần của hộ gia đình.
Câu này chưa cần làm.

7


Câu 5 (20 điểm):
Tìm hiểu về nhu cầu sử dụng điện thoại, ông Bình đã sử dụng bộ dữ liệu của
Singapore giai đoạn 1960-1981 với 2 biến sau:
TEL: Số lượng máy điện thoại trên 1000 người.
GDP: Tổng sản phẩm quốc nội theo đầu người, tại mức giá cơ cấu tính theo đô
la Singapore năm 1968.
Năm
1960
1961
1962

1963
1964
1965
1966
1967
1968
1969
1970

TEL
36
37
38
41
42
45
48
54
59
67
78

GDP
1299
1365
1409
1549
1416
1473
1589

1757
1974
2204
2462

Năm (tt)
1971
1972
1973
1974
1975
1976
1977
1978
1979
1980
1981

TEL
90
102
114
126
141
163
196
223
262
291
317


GDP
2723
3033
3317
3487
3575
3784
4025
4286
4628
5038
5472

a. Vẽ đồ thị phân tán điểm cho tập dữ liệu trên. Dùng trục hoành cho biến GDP và
trục tung cho biến TEL. Bằng trực quan, Anh/ chị hãy nhận xét ngắn gọn về mối
quan hệ giữa 02 chỉ số trên dựa trên đồ thị này.

Đồ thị cho thấy: khi GDP tăng thì TEL tăng, và ngược lại. Nói cách khác, GDP và
TEL có quan hệ thuận chiều (đồng biến). Đồ thị cũng cho thấy quan hệ GDP và
TEL xấp xỉ tuyến tính.
8


b. Hãy tính các trị thống kê tổng hợp cho biến GDP và TEL (trung bình, phương sai,
độ lệch chuẩn, đồng phương sai).

(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)
c. Sử dụng lệnh CORREL trong EXCEL, hãy xác định hệ số tương quan tuyến tính
giữa TEL và GDP. Giải thích ý nghĩa của hệ số tương quan.


(“click đúp” trực tiếp vào bảng trên để xem cách tính toán cụ thể)

Hệ số tương quan dương cho thấy hai biến TEL và GDP có quan hệ tỷ lệ thuận. |
r| rất gần 1 (≥ 0.8) cho thấy hai biến này có tương quan tuyến tính chặt.
HẾT

ĐÁP ÁN Bài tập SỐ 2
MÔ HÌNH HỒI QUY ĐƠN
Người soạn: GV. Phạm Văn Minh
Câu 1 (25 điểm): Các khẳng định sau đây có chính xác không? Hãy cẩn thận suy xét
và giải thích các câu trả lời của Anh/Chị.
a. Các ước lượng bình phương nhỏ nhất thông thường (OLS) cho hệ số gốc được
ước tính chính xác hơn nếu như các giá trị của X gần với các giá trị trung
bình mẫu hơn.
Trước khi trả lời câu này, nhắc lại sự khác nhau giữa "đúng" và "chính xác" là hữu
ích. Đúng nghĩa là không chệch; chính xác nghĩa là phương sai thấp. Do đó, câu
hỏi này là về phương sai của các hàm ước lượng bình phương thông thường nhỏ
nhất (OLS).
Phương sai của các hàm ước lượng độ dốc OLS trong mô hình hồi qui đơn giản là:

9


Từ biểu thức này chúng ta thấy rằng phương sai là nhỏ hơn (hàm ước lượng này
chính xác hơn) nếu các giá trị của X cách xa giá trị trung bình mẫu hơn. Vậy
khẳng định trên là sai.
b. Nếu Xi và ui tương quan với nhau, thì các hàm ước lượng (OLS) vẫn là không
chệch.
Điều này không đúng. Để thấy tại sao, hãy viết biểu thức sau đối với hàm ước

lượng độ dốc :

Nếu Xi và ui có tương quan với nhau, thì số hạng sau cùng trong biểu thức này
không phải là zero và hàm ước lượng này là chệch.
c. Các hàm ước lượng không thể là ước lượng không chệch tuyến tính tốt nhất
(BLUE) trừ khi các ui đều có phân phối chuẩn.
BLUE nghĩa là "Hàm ước lượng không chệch tuyến tính tốt nhất." Trong bối
cảnh này, "tuyến tính " chỉ một hàm ước lượng là một hàm tuyến tính của số hạng
sai số ngẫu nhiên trong mô hình này, hoặc là một hàm tuyến tính của biến phụ
thuộc của mô hình này. Kiểm tra các hàm ước lượng OLS cho độ dốc và tung độ
gốc là đủ để xác lập rằng chúng là tuyến tính. Không yêu cầu tính chuẩn.
Không chệch được thiết lập bằng cách lấy kỳ vọng của hàm ước lượng OLS, là
điều mà chúng ta đã làm nhiều lần. Không cần tới tính chuẩn khi chứng minh rằng
kỳ vọng này bằng với giá trị thực (nhưng chưa biết) của thông số.
Tốt nhất là dùng Định lý Gauss-Markov. Phép chứng minh định lý này không cần
tới tính chuẩn.
Chúng ta thấy rằng phát biểu này là sai.
d. Nếu phương sai của ui lớn thì các khoảng tin cậy đối với các hệ số sẽ rộng
hơn.

10


Điều này là đúng. Chiều rộng của một khoảng tin cậy liên quan trực tiếp tới độ lớn
của độ lệch chuẩn của hàm ước lượng và độ lệch chuẩn của hàm ước lượng liên
quan trực tiếp tới độ lệch chuẩn của số hạng sai số. Anh/Chị cần viết được các biểu
thức có liên quan này dựa vào trí nhớ.
e. Nếu các giá trị của X có một phương sai lớn thì các khoảng tin cậy sẽ hẹp hơn.
Điều này là đúng. Xem các câu trả lời cho phần 4a và 4d.
f. Một giá trị p cao có nghĩa là hệ số này khác không ở mức độ có ý nghĩa về mặt

thống kê.
Điều này là sai. Câu hỏi này nói tới kiểm định thống kê của giả thuyết cho là hệ số
hồi qui bằng không.
Giá trị p là xác suất của việc trị thống kê kiểm định này có thể vượt quá giá trị
tuyệt đối của trị thống kê kiểm định được tính toán cho một mẫu cụ thể, cho trước
rằng giả thuyết không là đúng. Giá trị tuyệt đối của trị thống kê kiểm định càng lớn
thì giá trị p sẽ càng nhỏ. Trị thống kê kiểm định càng lớn thì hệ số càng có ý nghĩa
thống kê hơn.
g. Nếu Anh/Chị chọn một mức độ ý nghĩa cao hơn thì một hệ số hồi qui có khả
năng có ý nghĩa nhiều hơn.
Điều này đúng. Câu hỏi này nói tới kiểm định thống kê của giả thuyết cho là hệ số
hồi qui bằng không.
Một mức độ ý nghĩa cao thu được một giá trị tới hạn nhỏ hơn nếu xét về giá trị
tuyệt đối. Bác bỏ giả thuyết không khi giá trị tuyệt đối của giá trị tới hạn nhỏ hơn
là điều dễ hơn.
h. Giá trị p là xác suất để giả thuyết không (H0) là đúng.
Đây là một giải thích không chính xác (nhưng thường gặp) đối với giá trị p.
Xem câu trả lời cho phần 4f.
Câu 2 (25 điểm):
Một số liệu thống kê về lãi suất ngân hàng (X, % năm) và tổng vốn đầu tư (Y, tỉ đồng) trên
địa bàn tỉnh Bình Dương qua 10 năm liên tiếp như sau:

Năm

1

2

3


4

5

6

7

8

9

10
11


Xi

7.0

6.5

6.5

6.0

6.0

6.0


5.5

5.5

5.0

4.5

Yi

29

32

31

34

32

35

40

43

48

50


1. Hãy lập mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn đầu tư và lãi
suất ngân hàng (mô hình hồi quy đơn). Nêu ý nghĩa của các hệ số hồi quy ước
lượng được. Đánh giá mức độ phù hợp của mô hình.

Mô hình hồi quy tuyến tính mô tả quan hệ giữa tổng vốn đầu tư và lãi suất
ngân hàng được cho như sau:

Trong đó:
là tung độ gốc của hàm hồi quy trên, được tính bằng lệnh Intercept trong
Excel với cú pháp như sau: Intercept (Tập hợp các dữ liệu của biến phụ thuộc,
Tập hợp các dữ liệu của biến độc lập) = 93.164. Giá trị này nói lên rằng khi
lãi suất ngân hàng bằng 0% (điều này hiếm xảy ra trên thực tế), thì tổng vốn
đầu tư trung bình một năm sẽ là 93.164 tỉ đồng.
là hệ số góc của hàm hồi quy trên, được tính bằng lệnh Slope trong Excel
với cú pháp như sau: Slope (Tập hợp các dữ liệu của biến phụ thuộc, Tập hợp
các dữ liệu của biến độc lập) = -9.532. Giá trị này nói lên rằng: xét các giá trị
của X nằm trong khoảng (4.5, 7)%, khi lãi suất ngân hàng tăng thêm 1% một
năm thì tổng vốn đầu tư một năm sẽ giảm trung bình 9.532 tỉ đồng/năm.
2. Kiểm định giả thiết: Hệ số hồi quy của X trong hàm hồi quy tổng thể bằng 0
với mức ý nghĩa 2% và nêu ý nghĩa của kết quả.
Để kiểm định 2 = 0 với mức ý nghĩa 2%, ta làm các bước sau:
Đặt giả thiết không và giả thiết đối:

H 0 : 2 = 0

với

H 1 : 2  0

Chúng ta biết rằng trong mô hình hồi quy hai biến kiểm định 2 = 0 cũng chính

là kiểm định sự phù hợp của mô hình hồi quy (X thật sự có tác động đến Y?)
Để kiểm định giả thiết trên ta áp dụng quy tắc kiểm định sau:
Tính :

Nếu F > F(1, n-2) thì ta bác bỏ giả thiết H0
12


Dựa vào bảng số liệu trên, ta tính được

= 5.025;

= 4.975. Cụ thể hơn,

Xin tham khảo bảng tính sau (double click vào để xem cách tính):

Từ kết quả trên,

Tra cứu ta có: F(1, n-2) =F0.02(1, 8) = 8.389 (dùng hàm FINV trong Excel)
Ta thấy rằng: F > F (1, n-2) nên ta bác bỏ giả thiết H0, tức là 2  0.
Ý nghĩa của kết quả: Với tập dữ liệu mẫu đã cho, bác bỏ giả thuyết H0 (2=0)

có nghĩa rằng biến lãi suất ngân hàng (X, % năm) thực sự có tác động đến
tổng vốn đầu tư (Y, tỉ đồng).
Cách khác để kiểm định giả thiết H0 ở trên là dùng giá trị p (p-value): ta
dùng hàm FDIST để tìm giá trị P-value trong Excel ứng với giá trị F đã tính
được bằng công thức ở trên, cú pháp:
FDIST(F, bậc tự do tử số, bậc tự do mẫu số)
= FDIST(91.776,1,8) = 0.000011683 = P-value (được gọi là mức ý
nghĩa quan sát hay mức ý nghĩa chính xác hay xác suất phạm sai lầm

loại I, mức ý nghĩa thấp nhất mà H0 có thể bị bác bỏ)
Nguyên tắc kiểm định như sau:
o

P-value < α thì bác bỏ H0, chấp nhận H1
13


P-value ≥ α thì chưa có cơ sở để bác bỏ H0.

o

Vậy từ kết quả P-value tính được ở trên, ta so sánh nó với mức ý nghĩa  của
đề bài, ta có: P-value (0.000011683) <  (0.02). P-value rất thấp, có nghĩa là
xác suất phạm phải sai lầm bác bỏ giả thiết H0 khi nó đúng là rất thấp.
3. Dự báo tổng vốn đầu tư trung bình khi lãi suất là 4,8% năm với độ tin cậy
98%.

Y0 = 93.164 - 9.532 * 4.8 = 47.409
 1
n



2
Ta tính: Var Y0    


 2 = 4.975;


2
i

x

( X 0  X )2 
 (*) trong đó:
 xi2 

= 5.025; X = 5.85; X0=4,8; n=10.



 1 (4.8  5.86) 2 
Var
Y

4
.
975
(*) 
0
 
 1.589  Se Y0 1.261
5.025 
10

 

 


t0,01 (8) = 2,896
Khoảng tin cậy 98% của vốn đầu tư trung bình khi lãi suất là 4,8% năm:
47.409 2,896 *1.261

Hay: 43.757 < E(Y/X=4.8) < 51.061

Câu 3 (25 điểm):
Bảng dưới đây cho biết số liệu về tiền lương trung bình 1 giờ (mean hourly wage, đặt
tên biến là Meanwage) và số năm được đào tạo (years of schooling, đặt tên biến là
Education) như sau:
Quan sát
(n)
1
2
3
4
5
6
7
8
9
10
11
12
13

Số năm được đào tạo
(Education - năm)
6

7
8
9
10
11
12
13
14
15
16
17
18

Lương trung bình một giờ
(Meanwage - $)
4.4567
5.7700
5.9787
7.3317
7.3182
6.5844
7.8182
7.8351
11.0223
10.6738
10.8361
13.6150
13.5310
14



Từ số liệu trên, chúng ta có kết quả hồi quy sau:


Mean wagei  0.014453  0.724097 Educationi
se

=

(0.874624)

(

t

=

(

(10.40648)

B

)

A

)
r2 = 0.9078


n = 13

a. Bạn hãy điền vào chỗ trống ( ) các giá trị thích hợp.
Do t 

ˆi  0
 0.014453
0.724097
B
 0.01652 ; A 
0.06958 ;

0.874624
10.40648
Se( ˆi )

b. Giải thích ý nghĩa của hệ số góc.

1 = - 0.014453 là tung độ gốc của đường hồi quy mẫu, không thể giải thích một

cách máy móc là khi số năm được đào tạo bằng 0 thì tiền lương một giờ trung bình
bằng -0.014453$ (số âm không có ý nghĩa ở đây).

 2 = 0.729097. Giá trị này nói lên rằng: xét các giá trị của Education nằm trong

khoảng (6, 18) năm, khi số năm được đào tạo tăng thêm một năm thì tiền lương
một giờ trung bình sẽ tăng lên 0.729097$.
c. Education có ảnh hưởng đến Meanwage không? Tại sao? (Gợi ý: Kiểm định
giả thiết).
Kiểm định giả thiết: H0: β2=0, H1: β2≠0 với mức ý nghĩa 5%

t = 10.40648 (đề cho)
t/2(n-2) = t0.025 (11) = 2.201
t > t0.025 (11) nên bác bỏ giả thiết H0 (với mức ý nghĩa 5%).

Vậy β2≠0 đáng kể về mặt thống kê, hay Education (số năm được đào tạo) thực
sự có ảnh hưởng đến Meanwage (tiền lương một giờ).
R2 = 0.9078 khá gần 1. Vậy mô hình có mức độ phù hợp cao.
d. Đánh giá mức độ phù hợp của mô hình.
Với kết quả trong câu c (β 2≠0) và R2 = 0.9078 khá gần 1. Ta có thể kết luận rằng
mô hình có mức độ phù hợp cao với tập dữ liệu mẫu đã cho.
Câu 4 (25 điểm):
Xem kết quả của phân tích hồi quy sau:
15


Yˆi 0.2033  0.6560 X i
Se = (0.0976)
r2 = 0.397
Trong đó:

(0.1961)
RSS = 0.0544

ESS = 0.0358

Y là tỷ lệ tham gia lực lượng lao động của nữ năm 1972
X là tỷ lệ tham gia lực lượng lao động của nữ năm 1968

Kết quả phân tích hồi quy này có được từ một mẫu gồm 19 thành phố của Mỹ.
a. Giải thích ý nghĩa của các hệ số hồi quy ước lượng được.


1 = 0.2033 là tung độ gốc của đường hồi quy mẫu, nói lên rằng khi tỷ lệ tham gia

lực lượng lao động của nữ năm 1968 (X) bằng 0, thì tỷ lệ tham gia lực lượng lao
động trung bình của nữ năm 1972 (Y) bằng 0.2033.

 2 = 0.6560 là hệ số góc của đường hồi quy mẫu, nói lên rằng khi tỷ lệ tham gia

lực lượng lao động của nữ năm 1968 (X) tăng (giảm) 1 đơn vị, thì tỷ lệ tham gia
lực lượng lao động trung bình của nữ năm 1972 (Y) sẽ tăng (giảm) 0.6560 đơn vị.
b. Kiểm định giả thiết: H0: β2=1; H1: β2>1 với mức ý nghĩa 5%.
ˆ2  1 0.6560  1

 1.754
0.1961
Se( ˆ2 )
t0,05 (17) = 1.740
t < t0,05 (17) nên không bác bỏ giả thiết H0 (với mức ý nghĩa 5%).
t

c. Từ kết quả phân tích hồi quy trên, chứng minh rằng:

 2 = 0.0032;

x

2
i

= 0.0832;


X = 0.4932

Ta có:
n

n

ESS ( ˆ2 ) 2  xi2
i 1

n

2
i

e



x
i 1

2
i



ESS
0.0358


0.0832 (đpcm)
2
( ˆ2 ) 2 (0.6560)

RSS 0.0544
ˆ 2  i 1 

0.0032
n  2 n  2 19  2

(đpcm)

16


n

Var ( ˆ1 ) 

X
i 1
n

2
i
2
i

n x


n

ˆ ( Se( ˆ1 )) 2 
2

n

X

2
i

n xi2 ( Se( ˆ1 )) 2
i 1



ˆ 2

i 1

i 1

19 * 0.0832 * (0.0976) 2
X 
4.7057

0.0032
i 1

n

2
i

n

Ta còn có:

x
i 1

( X )2 

2
i

n

n

 X  n( X ) 
2
i

2

i 1

X


( X ) 2  i 1

2
i

n



2
i

x
i 1

n

4.7057  0.0832
0.2433  X 0.4932 (đpcm)
19

d. Giả sử rằng tỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0,58 (hay
58%). Trên cơ sở kết quả của phân tích hồi quy ở trên, giá trị trung bình của
tỷ lệ tham gia lực lượng lao động của nữ năm 1972 là bao nhiêu? Thiết lập
khoảng tin cậy 95% cho giá trị dự báo trung bình này.

Y0 = 0.2033 + 0.6560 * 0.58 = 0.58378

 1 (0.58  0.4932) 2 

  1 ( X  X )2 
var Y0  2   0 2  = 0.0032  
 = 0,00046
0.0832
n
 xi 
19


 se(Y0 ) = 0,02141

 

t0,025 (17) = 2.110
Khoảng tin cậy 95% của dự báo trung bình của tỷ lệ tham gia lực lượng lao động của
nữ năm 1972 khi tỷ lệ tham gia lực lượng lao động của nữ năm 1968 là 0.58, là:
0.58378 2.110* 0,002141

Hay: 0.5386 < E(Y/X=0.58) < 0.6289

HẾT

17



×