Câu 1: Lý thuyết:
I.Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1.Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu:
-Trả lời: Đúng (Đ)
-Giải thích: Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu vì: Tiêu thức
thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu tùy theo
mục đích nghiên cứu khác nhau. Tiêu thức thống kê có thể phân theo 3 loại (tùy theo
phản ánh đặc điểm về nội dung của đơn vị tổng thể) gồm: (i) Tiêu thức thuộc tính (tiêu
thức giới tính, nghề nghiệp…); (ii) tiêu thức số lượng (số nhân khẩu trong gia đình, năng
suất lao động…); (iii) tiêu thức thay phiên (nam, nữ). Trong đó, đơn vị tổng thể là các
đơn vị (hoặc phần tử) cấu thành nên tổng thể.
2.Tần suất biểu hiện bằng số tuyệt đối:
-Trả lời: Sai (S)
-Giải thích: Tần suất được biểu hiện bằng số tương đối với đơn vị tính là lần hoặc % và
được ký hiệu bằng di (di= fi / Σfi).
3.Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức
nghiên cứu của hai hiện tượng khác loại:
-Trả lời: Đúng (Đ)
-Giải thích: Hệ số biến thiên được biểu hiện bằng số tương đối có được từ so sánh giữa
độ lệch tiêu chuẩn và trung bình cộng. Hệ số biến thiện có thể dùng để so sánh giữa các
tiêu thức khác nhau như so sánh hệ số biến thiên về năng suất lao động với hệ số biến
thiên về tiền lương…Do đó, hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ
biến thiên về tiêu thức nghiên cứu của hai hiện tượng khác loại.
4.Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của
tổng thể:
-Trả lời: Đúng (Đ).
-Giải thích: Khoảng tin cậy được tính theo công thức:
x −Z α/ 2
σ
σ
≤µ≤x +Z α/ 2
n
n
Theo đó, ứng với một độ tin cậy nhất định (Z không đổi), khi phương sai tăng sẽ làm tăng
khoảng tin cậy. Do đó, khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với
phương sai của tổng thể.
5.Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt:
-Trả lời: Đúng (Đ)
-Giải thích: Liên hệ tương quan là mối liên hệ không hoàn toàn chặt chẽ giữa tiêu thức
nguyên nhân (biến độc lập) và tiêu thức kết quả (biến phụ thuộc): cứ mỗi giá trị của tiêu
thức nguyên nhân sẽ có nhiều giá trị tương ứng của tiêu thức kết quả. Các mối liên hệ này
1
là mối liên hệ không hoàn toàn chặt chẽ, không được biểu hiện một cách rõ ràng trên
từng đơn vị cá biệt.
II.Chọn phương án trả lời đúng nhất:
1.Các phương án biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a.Sắp xếp dãy số theo thứ tự tằng (hoặc giảm) dần
b.Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số
c.Loại bỏ tác động của các yếu tố ngẫu nhiên
d.Không có điều nào ở trên
=> Phương án lựa chọn: c. Loại bỏ tác động của các yếu tố ngẫu nhiên
2.Các biện pháp hạn chế sai số chọn mẫu:
a.Tăng số đơn vị tổng thể mẫu
b.Sử dụng phương pháp chọn mẫu thích hợp
c.Giảm phương sai tổng thể chung
d.Cả a,c
e.Cả a,b
f.Cả a, b, c
=> Phương án lựa chọn: b. Sử dụng phương pháp chọn mẫu thích hợp.
3.Ưu điểm của mode:
a.San bằng mọi chênh lệch giữa các lượng biến
b.Không chịu ảnh hưởng của các biến đột xuất
c.Kém nhạy bén với sự biến động của tiêu thức
d.Cả a,b
e.Cả a, b, c.
=> Phương án lựa chọn: b. Không chịu ảnh hưởng của các biến đột xuất.
4.Tổng thể nào dưới đây là tổng thể bộc lộ
a.Tổng thể những người yêu thích dân ca
b.Tổng thể những người làm ăn phi pháp
c.Tổng thể doanh nghiệp quốc doanh ở một địa phương
d.Cả a,b
e.Cả a, b, c
=> Phương án lựa chọn: c. Tổng thể doanh nghiệp quốc doanh ở một địa phương
5.Biểu đồ hình cột (histograms) có đặc điểm:
a.Giữa các cột không có khoảng cách
b.Độ rộng của cột biểu hiện giá trị giữa của mỗi tổ
c.Chiều cao của mỗi cột biểu thị tần số
d.Cả a, b đều đúng
e.Cả a, c đều đúng
f.Cả a, b, c đều đúng.
=> Phương án lựa chọn: e. Cả a, c đều đúng.
Câu 2:
Ta có công thức chọn cỡ mẫu:
Z2σ2
n=
Error 2
Trong đó:
2
σ =6 (theo kinh nghiệm).
Error = +/-1.
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0.975 (2 phía)), ta có Z=1.96.
Thay vào công thức: n=138.287, làm tròn lên chọn cỡ mẫu: n=139.
Gọi μ là năng suất trung bình một giờ của công nhân tại nhà máy.
Với dữ liệu bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95% trong trường
hợp mẫu lớn (n=139>30) và chưa biết phương sai σ. Theo đó, ta sử dụng công thức :
x − t α / 2;( n −1)
s
s
≤ µ ≤ x + t α / 2;( n −1)
n
n
Trong đó:
X=35; s=6.5; n=139.
Tra bảng t, với số bậc tự do=138, α=5%(2 phía) => t=1.977.
Thay số vào công thức: 36.09 sp≤μ≤39.13sp
Kết luận: Với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong khoảng từ 36.09
sp đến 39.13 sp.
Câu 3:
Gọi p1: Tỷ lệ những người yêu thích mùi hương cũ.
Gọi p2: Tỷ lệ những người ưa thích mùi hương mới.
Đặt giả thiết:
H0: p1≥p2
H1: p1
Bài toán kiểm định hai tỷ lệ- kiểm định Z (với mẫu đủ lớn theo điều kiên n 1*ps1; n2*ps2>5, và
n1*(1-ps1); n2*(1-ps2)>5).
Ta có công thức:
Z=
ps1 − ps2
1
1
ps(1 − ps) +
n1 n2
3
Trong đó: Ps1=200/800=0.25; Ps2=295/1000=0.295.
ps =
n1ps1 + n2 ps2
n1 + n2
=
n1A + n2 A
n1 + n2
;
ps=(200+295)/(800+1000)=0.275.
Thay dữ liệu vào công thức trên:
Z= -2.1246, tra bảng Z được kết quả 1-α=0.9832, α=0.0168=1.68%.
Vì đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z mà Z α>-2.1246, ta
bác bỏ H0, chấp nhận H1( tỷ lệ số người yêu thích mùi hương mới lớn hơn số người yêu thích mùi
hương cũ).
Kết luận : Với độ tin cậy <98.32%, ta có đủ cơ sở để nói rằng tỷ lệ người yêu thích mùi
huơng mới lớn hơn tỷ lệ người yêu thích mùi hương cũ.
Câu 4
1. Phân tích tình hình biến động thời vụ về lượng khách du lịch quốc tế của Công ty qua
chỉ số thờI vụ (giản đơn) để đề xuất những kiến nghị thích hợp:
Với số liệu khách hàng đã cho ta tính được bảng sau:
Tháng
2004
2005
2006
2007
2008
1
2
3
4
5
6
7
8
9
10
11
12
49
51
50
43
47
40
34
31
28
31
46
35
52
52
55
53
50
46
41
38
31
29
36
40
47
52
49
50
47
40
42
39
35
35
22
35
48
57
55
54
50
42
38
37
35
34
30
38
45
55
52
45
54
42
46
42
33
32
25
30
4
Lượng
khách trung
bình tháng
Yi
48.2000
53.4000
52.2000
49.0000
49.6000
42.0000
40.2000
37.4000
32.4000
32.2000
31.8000
35.6000
Chỉ số thời vụ
Ii
1.1476
1.2714
1.2429
1.1667
1.1810
1.0000
0.9571
0.8905
0.7714
0.7667
0.7571
0.8476
Lượng
khách
trung
bình
năm
40.4167 43.5833 41.0833 43.1667 41.75
Tổng
lượng
khách
năm
485
Lượng
khách
trung
bình 6
năm
Yo
523
493
518
501
42.0000
Từ chỉ số thời vụ Ii, ta có nhận xét sau:
Số lượng khách du lịch tập trung vào 6 tháng đầu năm (có chỉ số Ii>1), lượng khách du lịch có xu
hướng suy giảm trong thời gian 6 tháng cuối năm (có chỉ số I i<1). Do đó, công ty cần phải có các
chính sách khuyến mãi định kỳ nhằm cân bằng lượng khách du lịch trong các tháng.
2. Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của số lượng khách du
lịch quốc tế qua các năm tại Công ty:
Sử dụng phương pháp hồi quy tuyến tính với biến phụ thuộc Y: Tổng số khách năm, X: mã năm,
có kết quả sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.26374432
R Square
0.06956107
Adjusted R Square
-0.2405852
Standard Error
18.0286809
Observations
5
ANOVA
df
Regression
SS
1
MS
72.9
5
72.9
F
0.224285
Significance F
0.668125
Residual
3
975.1
Total
4
1048
Coefficients
Intercept
X Variable 1
Standard Error
325.033
t Stat
P-value
Lower 95%
495.9
18.90864
26.2261
0.000122
435.7243
2.7
5.7011695
0.47359
0.668125
-15.44367
Với số liệu thống kê cho thấy có rất ít mối tương quan giữa số lượng khách hàng năm và số năm,
tuy nhiên do đề bài không yêu cầu kiểm định nên ta có hàm sau: Yi= 495.9+2.7*Xi
3. Dự đoán lượng khách của Công ty theo các tháng năm 2009 với độ tin cậy 95%:
Muốn dự đoán lượng khách trung bình hàng tháng của công ty năm 2009, ta phải làm bài toán
ngoại suy hàm xu thế cho lượng khách năm 2009 (Y2009) với độ tin cậy 95%.
Ta có công thức:
ˆ ≤ yˆ n +L + t α / 2,( n −2 ) .Sp
yˆ n +L − t α / 2,( n −2 ) .Sp ≤ Y
Trong đó: Sp =Syt. 1+
1 3( n +2L −1)
+
n
n(n2 −1)
2
Trong đó: Syt=18.028609 (kết quả tra trong bảng kết quả hồi quy).
Y2009=459.5+2.7*6=512.1.
n=5, L=1, tính được Sp=26.126.
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3.182.
Từ đó, ta ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong khoảng từ:
428.9669 khách đến 595.233 khách.
Chia khoảng ước lượng trên cho 12 tháng, sau đó nhân với chỉ số thời vụ I i ta có bảng ước lượng
hàng tháng như sau (làm tròn):
Tháng
Lượng
khách
trung
bình
Chỉ số thời
vụ Ii
Dự đoán điểm
6
Cận dưới
Cận trên
tháng Yi
1
48.2000
1.1476
2
53.4000
1.2714
54.2582
45
63
3
52.2000
1.2429
53.0389
44
62
4
49.0000
1.1667
49.7875
42
58
5
49.6000
1.1810
50.3971
42
59
6
42.0000
1.0000
42.6750
36
50
7
40.2000
0.9571
40.8461
34
47
8
37.4000
0.8905
38.0011
32
44
9
32.4000
0.7714
32.9207
28
38
10
32.2000
0.7667
32.7175
27
38
11
31.8000
0.7571
32.3111
27
38
12
35.6000
0.8476
36.1721
30
42
Câu 5:
Gọi Y: % tăng doanh thu.
Gọi X:% tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X. Từ số liệu đã qua sử dụng hồi quy trong Exel ta có bảng:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9594595
R Square
0.9205625
Adjusted R Square
0.8940833
Standard Error
0.3130063
Observations
5
ANOVA
df
SS
MS
7
F
Significance F
Regression
1
3.406081081
3.406081081
Residual
3
0.293918919
0.097972973
Total
4
3.7
Coefficients
Standard Error
t Stat
34.76551724
P-value
0.00973889
Lower 95%
Intercept
1.8648649
0.295603282
6.308674428
0.008048301
0.92412329
X Variable 1
0.4797297
0.081362126
5.89622907
0.009738889
0.22079913
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ
giữa % tăng doanh thu và % tăng chi phí quảng cáo như sau:
Y=1.86486+0.47973*X
Kết luận: Khi % tăng chi phí quảng cáo là 1% sẽ làm tăng doanh thu 0,47973% (Trong
điều kiện các yếu tố khác không đổI).
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không:
Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6.30867, Mức ý nghĩa=0.00974≈1%, tức là với
độ tin cậy 99% có thể nói rằng % tăng doanh thu có mối liên hệ tuyến tính với % tăng quảng cáo.
3. Đánh giá cường độ của mốI quan hệ và sự phù hợp của mô hình trên (qua hệ số tương
quan và hệ số xác định):
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi trong % tăng
doanh thu được giải thích bởi % tăng chi phí quảng cáo.
4. Hãy ước lượng tỷ lệ % doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% vớI xác suất
tin cậy 95%:
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa % tăng chi phí
quảng cáo và % tăng doanh thu là rất chặt chẽ.
Ta phải ước lượng giá trị Y, khi X=5% với độ tin cậy là 95%, sử dụng công thức khoảng tin cậy
là khoảng:
1
Yˆi ± tα / 2;n − 2 ⋅ S yx ⋅ 1 + +
n
(X − X)
∑( X − X )
2
i
n
i =1
2
i
8
Ta có Y5%= 1.85486+0.47973*5= 4.2635%.
Syx=0.313006 (tra trong bảng kết quả hồi quy=Standard Error).
n=5,X = 3.2.
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3.182.
Thay số vào công thức trên, tính được khoảng tin cậy của Y5% từ: 3.071% đến 5.4499%.
Kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu tăng trong
khoảng từ 3.071% đến 5.4499%.
9