Câu 1: Lý thuyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
..(S) ...1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
Vì: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để
nghiên cứu.
...(S)...2) Tần suất biểu hiện bằng số tuyệt đối.
Vì: Chỉ tần số mới thể hiện bằng số tuyệt đối, tần suất thì thể hiện bằng số
tương đối (số thập phân hoặc %).
...(Đ)...3) Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên
về tiêu thức nghiên cứu của hai hiện tượng khác loại.
Vì: Hệ số biến thiên là thước đo độ biến thiên tương đối, dùng để so sánh hai
hoặc nhiều hơn hai hiện tượng khác loại.
....(Đ)...4) Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với
phương sai của tổng thể.
Vì: Theo công thức:
x −Z α/ 2
σ
σ
≤µ≤x +Z α/ 2
n
n
Do đó ứng với độ tin cậy nhất định (Z không đổi), khi phương sai tăng làm tăng
khoảng tin cậy.
...(S)...5) Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị
cá biệt.
Vì:Liên hệ tương quan biểu hiện rõ trên từng đơn vị cá biệt, thể hiện mối liên
hệ giữa một hoặc nhiều biến độc lập đến 1 biến phụ thuộc.
B. Chọn phương án trả lời đúng nhất:
1. Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng
nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
2. Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu.
b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
3. Ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến.
b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức.
d) Cả a), b).
δ e) Cả a), b), c).
4. Tổng thể nào dưới đây là tổng thể bộc lộ:
a) Tổng thể những người yêu thích dân ca.
b) Tổng thể những người làm ăn phi pháp.
c) Tổng thể các doanh nghiệp quốc doanh ở một địa phương.
d) Cả a) và b).
e) Cả a), b) và c).
5. Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột không có khoảng cách
b) Độ rộng của cột biểu hiện trị số giữa của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả a) và c) đều đúng.
f) Cả a), b) và c) đều đúng
Câu 2
Sử dụng công thức chọn cỡ mẫu:
Z2σ2
n=
Error 2
Với: σ =6 (theo kinh nghiệm); Error = +/-1.
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0.975 (2 phía)), ta có Z=1.96.
Thay vào công thức: n=138.287 (làm tròn n=139)
Gọi μ là năng suất trung bình một giờ của công nhân trong nhà máy.
Theo đề bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95%
trong trường hợp mẫu lớn (n=139>30) và chưa biết phương sai σ. Do đó ta sử
dụng công thức sau:
x − t α / 2;( n −1)
s
s
≤ µ ≤ x + t α / 2; ( n −1)
n
n
Với : X=35; s=6.5; n=139.
Tra bảng t, với số bậc tự do=138, α=5%(2 phía) ta có t=1.977.
Thay số vào công thức ta được: 33.91sp≤μ≤36.09sp
Như vậy với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong
khoảng từ 33.91 sản phẩm đến 36.09 sản phẩm.
Câu 3
Bài làm:
Gọi p1: Tỷ lệ những người yêu thích mùi hương cũ dầu gội đầu của Công ty
B&G.
p2: Tỷ lệ những người ưa thích mùi hương mới dầu gội đầu của Công ty
B&G.
Giả thiết:
H0: p1≥p2
H1: p1
Bài toán kiểm định hai tỷ lệ, kiểm định Z (với mẫu đủ lớn theo điều kiện n 1*ps1;
n2*ps2>5, và n1*(1-ps1); n2*(1-ps2)>5).
Từ công thức:
Z=
ps1 − ps2
1
1
ps(1 − ps) +
n
n
1
2
Với: Ps1=200/800=0.25; Ps2=295/1000=0.295.
ps =
n1ps1 + n2 ps2
n1 + n2
=
n1A + n2 A
;
n1 + n2
ps=(200+295)/(800+1000)=0.275.
Thay số vào công thức trên ta được:
Z= -2.1246, tra bảng Z ta được 1-α=0.9832, α=0.0168=1.68%.
Vì đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z
mà Zα>-2.1246, ta bác bỏ H0, chấp nhận H1( tỷ lệ số người yêu thích mùi hương
mới lớn hơn số người yêu thích mùi hương cũ). Từ đó dẫn đến kết luận với độ
tin cậy <98.32%, có đủ căn cứ để nói rằng tỷ lệ người yêu thích mùi huơng
mới lớn hơn tỷ lệ người yêu thích mùi hương cũ đối với dầu gội đầu của Công
ty B&G.
Câu 4
Bài làm:
1.Theo lượng khách đề bài cho ta tính được bảng sau:
Tháng
1
2004
49
2005
52
2006
47
2007
48
2008
45
2
51
52
52
57
55
3
50
55
49
55
52
4
43
53
50
54
45
5
47
50
47
50
54
6
7
8
9
40
46
34
40
41
31
42
38
28
42
38
39
31
42
46
37
35
42
35
33
10
31
29
35
34
32
11
46
36
22
30
25
12
35
40
35
38
30
Lượng khách
trung bình
năm
Tổng lượng
khách năm
Lượng khách
trung bình 6
năm (Yo)
40.416 43.583 41.083 43.166 41.750
7
3
3
7
0
485
42.000
0
523
493
518
501
Lượng
khách
trung
bình
tháng
Yi
48.200
0
53.400
0
52.200
0
49.000
0
49.600
0
42.000
0
40.200
0
37.400
0
32.400
0
32.200
0
31.800
0
35.600
0
Chỉ số
thời vụ
Ii
1.1476
1.2714
1.2429
1.1667
1.1810
1.0000
0.9571
0.8905
0.7714
0.7667
0.7571
0.8476
Theo chỉ số thời vụ Ii ta thấy: Số lượng khách du lịch tập trung vào 6
tháng đầu năm (có chỉ số I i>1), lượng khách du lịch có xu hướng suy
giảm trong thời gian 6 tháng cuối năm (có chỉ số Ii<1).
Kiến nghị: công ty cần phải có những chính sách khuyến mãi (giảm giá,
quà tặng) nhằm cân bằng lượng khách du lịch trong các tháng.
2. Dùng phương pháp hồi quy tuyến tính với biến phụ thuộc Y: Tổng số khách
năm, X: mã năm. Ta có kết quả sau:
SUMMARY
OUTPUT
Regression Statistics
0.26374
Multiple R
43
0.06956
R Square
11
Adjusted R
0.24058
Square
5
18.0286
Standard Error
81
Observations
5
ANOVA
df
SS
MS
F
Significance
F
Regression
1
72.9
72.9
0.2242
85
0.668125
Residual
3
975.1
325.03
3
Total
4
1048
Coefficients
Standard
Error
P-value
Lower 95%
Intercept
495.9
X Variable 1
2.7
t Stat
26.226
1
0.4735
5.7011695
9
18.90864
0.0001
22
0.6681
25
435.7243
-15.44367
Qua bảng tính trên ta có hàm xu thế tuyến tính biểu diễn xu hướng biến động
của số lượng khách du lịch quốc tế qua các năm tại Công ty như sau:
Yi= 495.9+2.7*Xi
3. Để dự đoán lượng khách trung bình hàng tháng của công ty năm 2009, ta
giải bài toán ngoại suy hàm xu thế cho lượng khách năm 2009 (Y 2009) với độ tin
cậy 95%.
Sử dụng công thức:
ˆ ≤ yˆ n +L + t α / 2,( n −2 ) .Sp
yˆ n +L − t α / 2,( n −2 ) .Sp ≤ Y
Với: Sp
1 3( n +2L −1)
=Syt. 1+ +
n
n(n2 −1)
2
Trong đó Syt=18.028609 (kết quả tra trong bảng kết quả hồi quy).
Y2009=459.5+2.7*6=512.1.
n=5, L=1, tính được Sp=26.126.
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3.182.
Từ đó ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong
khoảng từ: 428.9669 đến 595.233 khách.
Chia khoảng ước lượng trên cho 12 tháng x chỉ số thời vụ I i ta có bảng ước
lượng hàng tháng như sau (làm tròn):
Tháng
1
2
3
4
5
6
7
8
9
10
11
12
Lượng
khách
trung
bình
tháng Yi
48.2000
53.4000
52.2000
49.0000
49.6000
42.0000
40.2000
37.4000
32.4000
32.2000
31.8000
35.6000
Chỉ số
thời vụ
Ii
Dự đoán
điểm
Cận dưới
Cận trên
1.1476
1.2714
1.2429
1.1667
1.1810
1.0000
0.9571
0.8905
0.7714
0.7667
0.7571
0.8476
48.9746
54.2582
53.0389
49.7875
50.3971
42.6750
40.8461
38.0011
32.9207
32.7175
32.3111
36.1721
41
45
44
42
42
36
34
32
28
27
27
30
57
63
62
58
59
50
47
44
38
38
38
42
Câu 5
Từ dữ liệu đề bài đã cho, ta đặt Y: % tăng doanh thu.
X:% tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X. Từ số liệu đã qua sử dụng hồi quy
trong Exel ta có bảng :
SUMMARY OUTPUT
Regression Statistics
0.9594
Multiple R
6
0.9205
R Square
6
Adjusted R
0.8940
Square
8
Standard
0.3130
Syx
Error
1
Observations
5
ANOVA
df
SS
MS
F
Significance
F
3.4060810
81
0.0979729
73
34.765517
24
0.00973889
t Stat
P-value
Lower 95%
6.3086744
28
5.8962290
7
0.0080483
01
0.0097388
89
Regression
1
Residual
3
Total
4
3.40608108
1
0.29391891
9
3.7
Intercept
Coefficie
nts
1.864864
9
0.479729
7
Standard
Error
0.29560328
2
0.08136212
6
X Variable 1
0.92412329
0.22079913
1. Phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng doanh thu
và % tăng chi phí quảng cáo như sau: Y=1.86486+0.47973*X
2. Để kiểm định giả thiết bài ra
đặt cặp giả thiết sau: H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6.30867, Mức ý
nghĩa=0.00974≈1%, tức là với độ tin cậy 99% có thể nói rằng % tăng doanh
thu có mối liên hệ tuyến tính với % tăng quảng cáo.
3. Với hệ số tương quan (R2 =0,921) có nghĩa: với mẫu đã cho thì 92,1% của sự
tăng doanh thu là do tăng % chi phí quảng cáo.
Với hệ số xác định (Multiple R = 95,9%) thấy rõ mối liên hệ tương quan chặt
chẽ giữa % tăng chi phí quảng cáo và % tăng doanh thu.
4. Theo đề bài, để ước lượng giá trị Y, khi X=5% với độ tin cậy là 95%.
Sử dụng công thức khoảng tin cậy là khoảng:
1
Yˆi ± tα / 2;n − 2 ⋅ S yx ⋅ 1 + +
n
(X − X)
∑( X − X )
2
i
n
i =1
2
i
Ta có Y5%= 1.85486+0.47973*5= 4.2635%.
Syx=0.313006 (tra trong bảng kết quả hồi quy=Standard Error).
Với: n=5,X = 3.2.
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3.182.
Thay số vào công thức : khoảng tin cậy của Y5% từ: 3.071% đến 5.4499%.
Kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh
thu tăng trong khoảng từ 3.071% đến 5.4499%.