BÀI TẬP CÁ NHÂN
Câu 1: Lý thuyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
.....1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
Trả lời: Đúng.
Giải thích: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên cứu.
.....2) Tần suất biểu hiện bằng số tuyệt đối.
Trả lời: Sai.
Giải thích: Chỉ tần số mới thể hiện bằng số tuyệt đối, tần suất thì thể hiện bàng số tương đối (số
thập phân hoặc %).
.....3) Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên
cứu của hai hiện tượng khác loại.
Trả lời: Đúng.
Giải thích: Hệ số biến thiên là thước đo độ biến thiên tương đối, dùng để so sánh hai hoặc nhiều
hơn hai hiện tượng khác loại.
......4) Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể.
Trả lời: Đúng.
Giải thích: Theo công thức:
x −Z α/ 2
σ
σ
≤µ≤x +Z α/ 2
n
n
Do đó ứng với độ tin cậy nhất định (Z không đổi), khi phương sai tăng làm tăng khoảng tin cậy.
…..5) Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt.
Trả lời: Sai.
Liên hệ tương quan biểu hiện rõ trên từng đơn vị cá biệt, thể hiện mối liên hệ giữa một hoặc nhiều
biến độc lập đến 1 biến phụ thuộc.
B. Chọn phương án trả lời đúng nhất:
1) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
*c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
2) Các biện pháp hạn chế sai số chọn mẫu:0
a) Tăng số đơn vị tổng thể mẫu.
*b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
3) Ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến.
*b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức.
d) Cả a), b).
δ e) Cả a), b), c).
4) Tổng thể nào dưới đây là tổng thể bộc lộ:
a) Tổng thể những người yêu thích dân ca.
b) Tổng thể những người làm ăn phi pháp.
*c) Tổng thể các doanh nghiệp quốc doanh ở một địa phương.
d) Cả a) và b).
e) Cả a), b) và c).
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột không có khoảng cách
b) Độ rộng của cột biểu hiện trị số giữa của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
*e) Cả a) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành
được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng
có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn
về năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần được điều tra để đặt định
mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn thành
trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng suất trung bình một giờ của
toàn bộ công nhân với độ tin cậy 95%.
Giải:
Từ công thức chọn cỡ mẫu:
Z2σ2
n=
Error 2
Trong đó:
σ =6 (theo kinh nghiệm).
Error = +/-1.
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0.975 (2 phía)), ta có Z=1.96.
Thay vào công thức: n=138.287, làm tròn lên chọn cỡ mẫu: n=139.
Gọi μ là năng suất trung bình một giờ của công nhân trong nhà máy.
Trường hợp bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95% trong trường
hợp mẫu lớn (n=139>30) và chưa biết phương sai σ. Do đó ta sử dụng công thức sau:
x − t α / 2;( n −1)
s
s
≤ µ ≤ x + t α / 2; ( n −1)
n
n
Trong đó:
X=35; s=6.5; n=139.
Tra bảng t, với số bậc tự do=138, α=5%(2 phía) ta có t=1.977.
Thay số vào công thức ta được: 36.09 sp≤μ≤39.13sp
Như vậy với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong khoảng từ 36.09 sp đến
39.13 sp.
Câu 3
Công ty B&G đang nghiên cứu việc đưa vào một công thức mới để thay đổi mùi hương của dầu
gội đầu. Với công thức cũ khi cho 800 người dùng thử thì có 200 người ưa thích nó. Với công
thức mới, khi cho 1000 người khác dùng thử thì có 295 người tỏ ra ưa thích nó. Liệu có thể kết
luận công thức mới đưa vào làm tăng tỷ lệ những người ưa thích mùi mới không? Với mức ý
nghĩa α là bao nhiêu?
Giải:
Gọi p1: Tỷ lệ những người yêu thích mùi hương cũ.
Gọi p2: Tỷ lệ những người ưa thích mùi hương mới.
Đặt giả thiết:
H0: p1≥p2
H1: p1
Bài toán kiểm định hai tỷ lệ- kiểm định Z (với mẫu đủ lớn theo điều kiên n 1*ps1; n2*ps2>5, và
n1*(1-ps1); n2*(1-ps2)>5).
Theo công thức:
Z=
ps1 − ps2
1
1
ps(1 − ps) +
n1 n2
Trong đó: Ps1=200/800=0.25; Ps2=295/1000=0.295.
ps =
n1ps1 + n2 ps2
n1 + n2
=
n1A + n2 A
;
n1 + n2
ps=(200+295)/(800+1000)=0.275.
Thay số vào công thức trên ta có:
Z= -2.1246, tra bảng Z ta được 1-α=0.9832, α=0.0168=1.68%.
Vì đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z mà Z α>-2.1246, ta
bác bỏ H0, chấp nhận H1( tỷ lệ số người yêu thích mùi hương mới lớn hơn số người yêu thích mùi
hương cũ). Từ đó dẫn đến kết luận với độ tin cậy <98.32%, có đủ căn cứ để nói rằng tỷ lệ người
yêu thích mùi huơng mới lớn hơn tỷ lệ người yêu thích mùi hương cũ.
Câu 4
Có tài liệu về lượng khách du lịch quốc tế của một công ty du lịch như sau:
Đơn vị: ngàn lượt khách
Năm
Tháng
2004
2005
2006
2007
2008
1
2
3
4
5
6
7
8
9
10
11
12
49
51
50
43
47
40
34
31
28
31
46
35
52
52
55
53
50
46
41
38
31
29
36
40
47
52
49
50
47
40
42
39
35
35
22
35
48
57
55
54
50
42
38
37
35
34
30
38
45
55
52
45
54
42
46
42
33
32
25
30
1.
Phân tích tình hình biến động thời vụ về lượng khách du lịch quốc tế của Công ty qua chỉ
số thời vụ (giản đơn) từ đó đề xuất những kiến nghị thích hợp.
2.
Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của số lượng khách du lịch
quốc tế qua các năm tại Công ty nói trên.
3.
Dự đoán lượng khách của Công ty theo các tháng năm 2009 với độ tin cậy 95%.
Giải:
1.
Từ số liệu khách đã cho ta tính được bảng sau:
Tháng
1
2
3
4
5
6
7
8
9
10
11
12
2004
49
51
50
43
47
40
34
31
28
31
46
35
2005
52
52
55
53
50
46
41
38
31
29
36
40
2006
47
52
49
50
47
40
42
39
35
35
22
35
2007
48
57
55
54
50
42
38
37
35
34
30
38
2008
45
55
52
45
54
42
46
42
33
32
25
30
Lượng
khách trung
bình năm
40.4167 43.5833 41.0833 43.1667 41.7500
Tổng lượng
khách năm
485
523
493
518
501
Lượng
khách
trung
bình
tháng Yi
48.2000
53.4000
52.2000
49.0000
49.6000
42.0000
40.2000
37.4000
32.4000
32.2000
31.8000
35.6000
Chỉ
số
thời vụ Ii
1.1476
1.2714
1.2429
1.1667
1.1810
1.0000
0.9571
0.8905
0.7714
0.7667
0.7571
0.8476
Lượng
khách trung
bình 6 năm
(Yo)
42.0000
Từ chỉ số thời vụ Ii có nhận xét sau:
Số lượng khách du lịch tập trung vào 6 tháng đầu năm (có chỉ số I i>1), lượng khách du lịch có xu
hướng suy giảm trong thời gian 6 tháng cuối năm (có chỉ số I i<1). Từ đó công ty cấn phải có
những chính sách khuyến mãi (giảm giá, quà tặng) nhằm cân bằng lượng khách du lịch trong các
tháng.
2.
Dùng phương pháp hồi quy tuyến tính với biến phụ thuộc Y: Tổng số khách năm, X: mã năm. Ta
có kết quả sau:
SUMMARY
OUTPUT
Regression Statistics
Multiple R
0.26374432
R Square
0.06956107
Adjusted R Square
-0.2405852
Standard Error
18.0286809
Observations
5
ANOVA
df
Regression
Residual
Total
SS
1
3
4
72.9
975.1
1048
MS
F
72.9 0.224285
325.033
Significanc
eF
0.668125
Coefficient
Standard
s
Error
t Stat
P-value Lower 95%
Intercept
495.9
18.90864 26.2261 0.000122
435.7243
X Variable 1
2.7
5.7011695 0.47359 0.668125
-15.44367
Mặc dù số liệu thống kê chỉ ra có rất ít mối tương quan giữa số lượng khách hàng năm và số năm,
tuy nhiên do bài không yêu cầu kiểm định nên ta có hàm sau:
Yi= 495.9+2.7*Xi
3.
Để dự đoán lượng khách trung bình hàng tháng của công ty năm 2009, trước hết ta phải làm bài
toán ngoại suy hàm xu thế cho lượng khách năm 2009 (Y2009) với độ tin cậy 95%.
Ta có công thức:
ˆ ≤ yˆ n +L + t α / 2,( n −2 ) .Sp
yˆ n +L − t α / 2,( n −2 ) .Sp ≤ Y
Trong đó: Sp
1 3( n +2L −1) 2
=Syt. 1+ +
n
n(n2 −1)
Trong đó Syt=18.028609 (kết quả tra trong bảng kết quả hồi quy).
Y2009=459.5+2.7*6=512.1.
n=5, L=1, tính được Sp=26.126.
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3.182.
Từ đó ta ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong khoảng từ:
428.9669 khách đến 595.233 khách.
Chia khoảng ước lượng trên cho 12 tháng, sau đó nhân với chỉ số thời vụ I i ta có bảng ước
lượng hàng tháng như sau (làm tròn):
1
2
3
4
5
6
7
8
9
10
11
12
Lượng
khách
trung
bình
tháng Yi
48.2000
53.4000
52.2000
49.0000
49.6000
42.0000
40.2000
37.4000
32.4000
32.2000
31.8000
35.6000
Chỉ
số
thời vụ Ii
1.1476
1.2714
1.2429
1.1667
1.1810
1.0000
0.9571
0.8905
0.7714
0.7667
0.7571
0.8476
Dự đoán điểm
48.9746
54.2582
53.0389
49.7875
50.3971
42.6750
40.8461
38.0011
32.9207
32.7175
32.3111
36.1721
Cận dưới
41
45
44
42
42
36
34
32
28
27
27
30
Cận trên
57
63
62
58
59
50
47
44
38
38
38
42
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh nước ngọt thực hiện một thử nghiệm để đánh giá mức
độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí quảng cáo trên 5
vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của
doanh thu ở các vùng. Thông tin ghi chép được nh sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2.5
2
3
6
5
4
3.5
3
3
1.
Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ
giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số
của mô hình.
2.
Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không?
3.
Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số tương quan
và hệ số xác định).
4.
Hãy ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác
suất tin cậy 95%.
Giải:
1.
Đặt Y: % tăng doanh thu.
Đặt X:% tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X. Từ số liệu đã qua sử dụng hồi quy trong Exel ta có bảng :
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9594595
R Square
0.9205625
Adjusted R
Square
0.8940833
Standard Error
0.3130063 Syx
Observations
5
ANOVA
df
Regression
Residual
Total
Intercept
X Variable 1
1
3
4
SS
3.406081081
0.293918919
3.7
Coefficient
s
1.8648649
0.4797297
Standard
Error
0.295603282
0.081362126
MS
F
3.406081081 34.76551724
0.097972973
t Stat
P-value
6.308674428 0.008048301
5.89622907 0.009738889
Significanc
eF
0.00973889
Lower 95%
0.92412329
0.22079913
Từ đó ta có phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng doanh thu và %
tăng chi phí quảng cáo như sau:
Y=1.86486+0.47973*X
2.
Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6.30867, Mức ý nghĩa=0.00974≈1%, tức là với
độ tin cậy 99% có thể nói rằng % tăng doanh thu có mối liên hệ tuyến tính với % tăng quảng cáo.
3.
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi trong % tăng
doanh thu được giải thích bởi % tăng chi phí quảng cáo.
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa % tăng chi phí
quảng cáo và % tăng doanh thu là rất chặt chẽ.
4.
Ta phải ước lượng giá trị Y, khi X=5% với độ tin cậy là 95%. Ta có công thức khoảng tin cậy là
khoảng:
1
Yˆi ± tα / 2;n − 2 ⋅ S yx ⋅ 1 + +
n
(X − X)
∑( X − X )
2
i
n
i =1
2
i
Ta có Y5%= 1.85486+0.47973*5= 4.2635%.
Syx=0.313006 (tra trong bảng kết quả hồi quy=Standard Error).
n=5,X = 3.2.
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3.182.
Thay số vào công thức ta tính được khoảng tin cậy của Y5% từ: 3.071% đến 5.4499%.
Có thể kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu tăng trong
khoảng từ 3.071% đến 5.4499%.