BÀI TẬP CÁ NHÂN
Câu 1: Lý thuyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
Trả lời: Đúng.
Giải thích: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra
để nghiên cứu.
2) Tần suất biểu hiện bằng số tuyệt đối.
Trả lời: Sai.
Giải thích: Chỉ tần số mới thể hiện bằng số tuyệt đối, tần suất thì thể hiện bàng số
tương đối (số thập phân hoặc %).
3) Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu
thức nghiên cứu của hai hiện tượng khác loại.
Trả lời: Đúng.
Giải thích: Hệ số biến thiên là thước đo độ biến thiên tương đối, dùng để so sánh
hai hoặc nhiều hơn hai hiện tượng khác loại.
4) Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai
của tổng thể.
Trả lời: Đúng.
Giải thích: Theo công thức:
x −Z α/ 2
σ
σ
≤µ≤x +Z α/ 2
n
n
Do đó ứng với độ tin cậy nhất định (Z không đổi), khi phương sai tăng làm tăng
khoảng tin cậy.
5) Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá
biệt.
Trả lời: Sai.
Giải thích: Liên hệ tương quan biểu hiện rõ trên từng đơn vị cá biệt, thể hiện mối
liên hệ giữa một hoặc nhiều biến độc lập đến 1 biến phụ thuộc.
A. Chọn phương án trả lời đúng nhất:
1) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng
nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
2) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu.
b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
3) Ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến.
b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức.
d) Cả a), b).
δ e) Cả a), b), c).
4) Tổng thể nào dưới đây là tổng thể bộc lộ:
a) Tổng thể những người yêu thích dân ca.
b) Tổng thể những người làm ăn phi pháp.
c) Tổng thể các doanh nghiệp quốc doanh ở một địa phương.
d) Cả a) và b).
e) Cả a), b) và c).
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột không có khoảng cách
b) Độ rộng của cột biểu hiện trị số giữa của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả a) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 :
Z2σ2
Từ công thức chọn cỡ mẫu: n =
Error 2
Trong đó:
σ =6 (theo kinh nghiệm).
Error = +/-1.
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0,975 (2 phía)), ta có Z=1,96.
Thay vào công thức: n=138,287, làm tròn lên chọn cỡ mẫu: n=139.
Gọi μ là năng suất trung bình một giờ của công nhân trong nhà máy.
Trường hợp bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95%
trong trường hợp mẫu lớn (n=139>30) và chưa biết phương sai σ. Do đó ta sử dụng
công thức sau:
x − t α / 2;( n −1)
s
s
≤ µ ≤ x + t α / 2;( n −1)
n
n
Trong đó:
X=35; s=6,5; n=139.
Tra bảng t, với số bậc tự do=138, (1-α) =95% => α =5%(2 phía) ta có t=1,977.
Thay số vào công thức ta được: 36,09 sp≤μ≤39,13sp
Như vậy với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong khoảng từ
36,09 sp đến 39,13 sp.
Câu 3 :
Gọi p1: Tỷ lệ những người yêu thích mùi hương cũ.
Gọi p2: Tỷ lệ những người ưa thích mùi hương mới.
Đặt giả thiết:
H0: p1≥p2
H1: p1
Ta có n1 = 800, n2 = 1000, p1 = 200/800, p2 = 295/1000
=> n1 p1; n2p2>5, và n1(1-p1); n2(1-p2)>5
Theo điều kiện trên thì mẫu đủ lớn.
Ta dùng bài toán kiểm định hai tỷ lệ- kiểm định Z (với mẫu đủ lớn theo điều kiện
n1p1; n2p2>5, và n1(1-p1); n2(1-p2)>5).
Tiêu chuẩn kiểm định:
Z=
p s1 − p s2
1
1
p(1 − p ) +
n1 n 2
Trong đó: Ps1=200/800=0,25; Ps2=295/1000=0,295.
p=
n1 p s1 + n 2 p s2
n1 + n 2
=
n1 A + n 2 A
n1 + n 2
=> p=(200+295)/(800+1000)=0,275.
Thay số vào công thức trên ta có:
Z=
0,25 − 0,295
1 = -2,12464
1
0,275(1 − 0,275)
+
800 1000
Z= -2,12464, tra bảng Z ta được 1-α=0,9832, α=0,0168=1,68%.
Vì đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z mà
Zα>-2,1246, ta bác bỏ H0, chấp nhận H1( tỷ lệ số người yêu thích mùi hương mới
lớn hơn số người yêu thích mùi hương cũ). Từ đó dẫn đến kết luận với độ tin cậy
<98,32%, có đủ căn cứ để nói rằng tỷ lệ người yêu thích mùi huơng mới lớn hơn tỷ
lệ người yêu thích mùi hương cũ.
Câu 4 :
1. Từ số liệu khách đã cho ta tính được bảng sau:
Tháng
1
2
3
4
5
6
7
8
9
10
11
12
2004
49
51
50
43
47
40
34
31
28
31
46
35
2005
52
52
55
53
50
46
41
38
31
29
36
40
2006
47
52
49
50
47
40
42
39
35
35
22
35
2007
48
57
55
54
50
42
38
37
35
34
30
38
2008
45
55
52
45
54
42
46
42
33
32
25
30
Lượng
khách
trung
bình
tháng Yi
48,2
53,4
52,2
49,0
49,6
42,0
40,2
37,4
32,4
32,2
31,8
35,6
Chỉ
số
thời vụ Ii
1,1476
1,2714
1,2429
1,1667
1,1810
1,0000
0,9571
0,8905
0,7714
0,7667
0,7571
0,8476
Lượng
khách trung
bình năm
40,4167 43,5833 41,0833 43,1667 41,7500
Tổng lượng
khách năm
485
523
493
518
501
Từ lượng khách trung bình chỉ số thời vụ Ii có nhận xét sau:
Lượng khách trung bình và tổng lượng khách tăng không ổn định trong các năm
Số lượng khách du lịch tập trung vào 6 tháng đầu năm (có chỉ số Ii>1), lượng
khách du lịch có xu hướng suy giảm trong thời gian 6 tháng cuối năm (có chỉ số
Ii<1). Từ đó công ty cấn phải có những chính sách khuyến mãi, tiếp thị và nâng cao
chất lượng dịch vụ để thu hút thêm khách du lịch nhằm cân bằng lượng khách du
lịch trong các tháng.
2. Dùng phương pháp hồi quy tuyến tính với biến phụ thuộc Y: Tổng số khách
năm, X: mã năm. Ta có kết quả sau:
SUMMARY
OUTPUT
Regression Statistics
Multiple R
0.26374432
R Square
0.06956107
Adjusted R Square
-0.2405852
Standard Error
18.0286809
Observations
5
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
SS
1
3
4
72.9
975.1
1048
Coefficient
s
495.9
2.7
Standard
Error
18.90864
5.7011695
MS
F
72.9 0.224285
325.033
t Stat
P-value
26.2261 0.000122
0.47359 0.668125
Significanc
eF
0.668125
Lower 95%
435.7243
-15.44367
Mặc dù số liệu thống kê chỉ ra có rất ít mối tương quan giữa số lượng khách hàng
năm và số năm, tuy nhiên do bài không yêu cầu kiểm định nên ta có hàm sau:
Yi= 495,9+2,7*Xi
3. Để dự đoán lượng khách trung bình hàng tháng của công ty năm 2009, trước hết
ta phải làm bài toán ngoại suy hàm xu thế cho lượng khách năm 2009 (Y 2009) với
độ tin cậy 95%.
Ta có công thức:
ˆ ≤ yˆ n +L + t α / 2,( n −2 ) .Sp
yˆ n +L − t α / 2,( n −2 ) .Sp ≤ Y
Trong đó: Sp
1 3( n +2L −1) 2
=Syt. 1+ +
n
n(n2 −1)
Trong đó Syt=18,028609 (kết quả tra trong bảng kết quả hồi quy).
Y2009=459,5+2,7*6=512,1.
n=5, L=1, tính được Sp=26,126.
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3,182.
Từ đó ta ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong
khoảng từ: 428,9669 khách đến 595,233 khách.
Chia khoảng ước lượng trên cho 12 tháng, sau đó nhân với chỉ số thời vụ I i ta có
bảng ước lượng hàng tháng như sau (làm tròn):
Năm
Tháng
1
2
3
4
5
6
7
8
9
10
11
12
Lượng
khách
trung
bình
tháng Yi
48,2
53,4
52,2
49,0
49,6
42,0
40,2
37,4
32,4
32,2
31,8
35,6
Chỉ
số
thời vụ Ii
1,1476
1,2714
1,2429
1,1667
1,1810
1,0000
0,9571
0,8905
0,7714
0,7667
0,7571
0,8476
Dự đoán điểm
48,9746
54,2582
53,0389
49,7875
50,3971
42,6750
40,8461
38,0011
32,9207
32,7175
32,3111
36,1721
Cận dưới
41
45
44
42
42
36
34
32
28
27
27
30
Cận trên
57
63
62
58
59
50
47
44
38
38
38
42
Câu 5 :
1.
Đặt Y: % tăng doanh thu.
Đặt X:% tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X. Từ số liệu đã qua sử dụng hồi quy trong
Exel ta có bảng :
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9594595
R Square
0.9205625
Adjusted R
Square
0.8940833
Standard Error
0.3130063 Syx
Observations
5
ANOVA
df
Regression
Residual
Total
1
3
4
Coefficient
SS
3.406081081
0.293918919
3.7
Standard
MS
F
3.406081081 34.76551724
0.097972973
t Stat
P-value
Significanc
eF
0.00973889
Lower 95%
Intercept
X Variable 1
s
1.8648649
0.4797297
Error
0.295603282
0.081362126
6.308674428 0.008048301
5.89622907 0.009738889
0.92412329
0.22079913
Từ đó ta có phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng
doanh thu và % tăng chi phí quảng cáo như sau:
Y=1,86486+0,47973*X
2. Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6,30867, Mức ý
nghĩa=0,00974≈1%, tức là với độ tin cậy 99% có thể nói rằng % tăng doanh thu có
mối liên hệ tuyến tính với % tăng quảng cáo.
3. Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay
đổi trong % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo.
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa
% tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ.
4. Ta phải ước lượng giá trị Y, khi X=5% với độ tin cậy là 95%. Ta có công thức
khoảng tin cậy là khoảng:
1
Yˆi ± tα / 2;n − 2 ⋅ S yx ⋅ 1 + +
n
(X − X)
∑(X − X )
2
i
n
i =1
2
i
Ta có Y5%= 1,85486+0,47973*5= 4,2635%.
Syx=0,313006 (tra trong bảng kết quả hồi quy=Standard Error).
n=5,X = 3,2.
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3,182.
Thay số vào công thức ta tính được khoảng tin cậy của Y 5% từ: 3,071% đến
5,4499%.
Có thể kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu
tăng trong khoảng từ 3,071% đến 5,4499%.