BÀI TẬP CÁ NHÂN
Môn học: Thống kê trong kinh doanh
Câu 1: Lý thuyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1. Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Đúng, tiêu thức thống kê phản ánh đặc điểm của từng tổng thể nghiên cứu
tùy theo từng mục đích nghiên cứu. Tiêu thức thống kê có thể gồm các
loại: tiêu thức thuộc tính (giới tính, nghề nghiệp, ngành nghề kinh tế), tiêu
thức số lượng (số nhân khẩu, tiền lương,....), tiêu thức thay phiên (nam,
nữ..)
2. Tần suất biểu hiện bằng số tuyệt đối
Sai, tần suất được biểu hiện bằng số tương đối (đơn vị tính là lần hoặc %).
3. Hệ số biến thiên là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức
nghiên cứu của hai hiện tượng khác loại
Đúng, hệ số biến thiên là chỉ tiêu tương đối có được từ so sánh giữa độ
lệch tiêu chuẩn và trung bình cộng. Hệ số biến thiên có thể so sánh giữa
các tiêu thức khác nhau, ví dụ người ta có thể so sánh hệ số biến thiên của
tiêu thức doanh thu và quảng cáo.
4. Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của
tổng thể
Đúng, khoảng tin cậy được tính theo công thức:
X±Z
(Trong đó X là trung bình của tham số trong tổng thể chung)
Khi σ tăng trong khi X và n không đổi, khoảng tin cậy của tham số của
tổng thể chung tăng.
5. Liên hệ tương quan là mối liên hệ không biểu hiện rõ trên từng đơn vị cá biệt.
Sai, liên hệ tương quan tương quan biểu hiện rõ trên từng đơn vị cá biệt,
mỗi biến độc lập đều có biểu hiện rõ thông qua hệ số xác định của mỗi
biến độc lập với biến phụ thuộc
6. Chọn phương án trả lời đúng nhất:
7. 1) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
8.
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
9.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
10. *c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
11. d) Không có điều nào ở trên
12.
13.2) Các biện pháp hạn chế sai số chọn mẫu:0
14.a) Tăng số đơn vị tổng thể mẫu.
15.*b) Sử dụng phương pháp chọn mẫu thích hợp.
16.c) Giảm phương sai của tổng thể chung
17.d) Cả a), c).
18.e) Cả a), b).
19. f) Cả a), b), c).
20.
21.3) Ưu điểm của Mốt là:
22. a) San bằng chênh mọi chênh lệch giữa các lượng biến.
23.*b) Không chịu ảnh hưởng của các lượng biến đột xuất.
24.c) Kém nhậy bén với sự biến động của tiêu thức.
25.d) Cả a), b).
26.e) Cả a), b), c).
27.
28.4) Tổng thể nào dưới đây là tổng thể bộc lộ:
29.a) Tổng thể những người yêu thích dân ca.
30.b) Tổng thể những người làm ăn phi pháp.
31.*c) Tổng thể các doanh nghiệp quốc doanh ở một địa phương.
32.d) Cả a) và b).
33.e) Cả a), b) và c).
34.
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột không có khoảng cách
b) Độ rộng của cột biểu hiện trị số giữa của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
*e) Cả a) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2
Z2σ2
n=
Error 2
Từ công thức chọn cỡ mẫu:
Trong đó:
σ =6 (theo kinh nghiệm).
Error = +/-1.
Với độ tin cậy là 95%, tra bảng Z (với A(Z)=0.975 (2 phía)), ta có Z=1.96.
Thay vào công thức: n=138.287, làm tròn lên chọn cỡ mẫu: n=139.
Gọi μ là năng suất trung bình một giờ của công nhân trong nhà máy.
Trường hợp bài đã cho ta phải ước lượng khoảng trung bình μ với độ tin cậy 95%
trong trường hợp mẫu lớn (n=139>30) và chưa biết phương sai σ. Do đó ta sử dụng
công thức sau:
x − t α / 2;( n −1)
s
s
≤ µ ≤ x + t α / 2; ( n −1)
n
n
Trong đó:
X=35; s=6.5; n=139.
Tra bảng t, với số bậc tự do=138, α=5%(2 phía) ta có t=1.977.
Thay số vào công thức ta được: 36.09 sp≤μ≤39.13sp
Như vậy với độ tin cậy 95%, năng suất lao động trung bình μ nằm trong khoảng từ
36.09 sp đến 39.13 sp.
Giải:
Gọi p1: Tỷ lệ những người yêu thích mùi hương cũ.
Gọi p2: Tỷ lệ những người ưa thích mùi hương mới.
Đặt giả thiết:
H0: p1≥p2
H1: p1
Bài toán kiểm định hai tỷ lệ- kiểm định Z (với mẫu đủ lớn theo điều kiên n1*ps1;
n2*ps2>5, và n1*(1-ps1); n2*(1-ps2)>5).
Z=
Theo công thức:
ps1 − ps2
1
1
ps(1 − ps) +
n
n
1
2
Trong đó: Ps1=200/800=0.25; Ps2=295/1000=0.295.
ps =
n1ps1 + n2 ps2
n1 + n2
=
n1A + n2 A
n1 + n2
;
ps=(200+295)/(800+1000)=0.275.
Thay số vào công thức trên ta có:
Z= -2.1246, tra bảng Z ta được 1-α=0.9832, α=0.0168=1.68%.
Vì đây là kiểm định trái do đó nếu ứng với một mức tin cậy nào đó tra bảng Z mà
Zα>-2.1246, ta bác bỏ H0, chấp nhận H1( tỷ lệ số người yêu thích mùi hương mới
lớn hơn số người yêu thích mùi hương cũ). Từ đó dẫn đến kết luận với độ tin cậy
<98.32%, có đủ căn cứ để nói rằng tỷ lệ người yêu thích mùi huơng mới lớn hơn tỷ
lệ người yêu thích mùi hương cũ.
Câu 4
Giải:
1.
Từ số liệu khách đã cho ta tính được bảng sau:
Lượng
khách
trung
Tháng
1
2
3
4
5
6
7
8
9
10
2004
49
51
50
43
47
40
34
31
28
31
2005
52
52
55
53
50
46
41
38
31
29
2006
47
52
49
50
47
40
42
39
35
35
2007
48
57
55
54
50
42
38
37
35
34
bình
Chỉ
số
tháng
thời vụ
2008
45
Yi
48.200
Ii
1.1476
55
0
53.400
1.2714
52
0
52.200
1.2429
45
0
49.000
1.1667
54
0
49.600
1.1810
42
0
42.000
1.0000
46
0
40.200
0.9571
42
0
37.400
0.8905
33
0
32.400
0.7714
32
0
32.200
0
0.7667
11
46
12
35
36
40
22
35
30
38
25
31.800
0.7571
30
0
35.600
0
0.8476
Lượng
khách
trung bình 40.416
43.583
41.083
43.166
41.750
năm
Tổng
7
3
3
7
0
485
523
493
518
501
lượng
khách
năm
Lượng
khách
trung bình
6
năm 42.000
(Yo)
0
Từ chỉ số thời vụ Ii có nhận xét sau:
Số lượng khách du lịch tập trung vào 6 tháng đầu năm (có chỉ số Ii>1), lượng khách
du lịch có xu hướng suy giảm trong thời gian 6 tháng cuối năm (có chỉ số Ii<1). Từ
đó công ty cấn phải có những chính sách khuyến mãi (giảm giá, quà tặng) nhằm cân
bằng lượng khách du lịch trong các tháng.
2.
Dùng phương pháp hồi quy tuyến tính với biến phụ thuộc Y: Tổng số khách năm,
X: mã năm. Ta có kết quả sau:
SUMMARY
OUTPUT
Regression Statistics
Multiple R
0.26374432
R Square
0.06956107
Adjusted R Square -0.2405852
Standard Error
18.0286809
Observations
5
ANOVA
Significance
df
SS
MS
F
0.22428
Regression
1
72.9
72.9
325.03
Residual
Total
3
4
975.1
1048
3
5
F
0.668125
Standard
Coefficients
Intercept
495.9
Error
18.90864
t Stat
26.226
P-value Lower 95%
0.00012
1
0.4735
2
0.66812
435.7243
X Variable 1
2.7 5.7011695
9
5
-15.44367
Mặc dù số liệu thống kê chỉ ra có rất ít mối tương quan giữa số lượng khách hàng
năm và số năm, tuy nhiên do bài không yêu cầu kiểm định nên ta có hàm sau:
Yi= 495.9+2.7*Xi
3.
Để dự đoán lượng khách trung bình hàng tháng của công ty năm 2009, trước hết ta
phải làm bài toán ngoại suy hàm xu thế cho lượng khách năm 2009 (Y2009) với độ
tin cậy 95%.
Ta có công thức:
ˆ ≤ yˆ n +L + t α / 2,( n −2 ) .Sp
yˆ n +L − t α / 2,( n −2 ) .Sp ≤ Y
Sp
Trong đó:
1 3( n +2L −1)
=Syt. 1+ +
n
n(n2 −1)
2
Trong đó Syt=18.028609 (kết quả tra trong bảng kết quả hồi quy).
Y2009=459.5+2.7*6=512.1.
n=5, L=1, tính được Sp=26.126.
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3.182.
Từ đó ta ước lượng được lượng khách năm 2009 với mức tin cậy 95% nằm trong
khoảng từ: 428.9669 khách đến 595.233 khách.
Chia khoảng ước lượng trên cho 12 tháng, sau đó nhân với chỉ số thời vụ Ii ta có
bảng ước lượng hàng tháng như sau (làm tròn):
Lượng
khách
trung
bình
Chỉ
số
tháng
thời vụ
Ii
Dự đoán điểm
Cận dưới
Cận trên
1
Yi
48.200
1.1476
48.9746
41
57
2
0
53.400
1.2714
54.2582
45
63
3
0
52.200
4
0
49.000
1.2429
1.1667
53.0389
49.7875
44
42
62
58
5
0
49.600
1.1810
50.3971
42
59
6
0
42.000
1.0000
42.6750
36
50
7
0
40.200
0.9571
40.8461
34
47
8
0
37.400
0.8905
38.0011
32
44
9
0
32.400
0.7714
32.9207
28
38
10
0
32.200
0.7667
32.7175
27
38
11
0
31.800
0.7571
32.3111
27
38
12
0
35.600
0
0.8476
36.1721
30
42
Câu 5 (2,5đ)
Đặt Y: % tăng doanh thu.
Đặt X:% tăng quảng cáo
Y là biến phụ thuộc vào biến độc lập X. Từ số liệu đã qua sử dụng hồi quy trong
Exel ta có bảng :
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9594595
R Square
0.9205625
Adjusted R
Square
0.8940833
Standard Error
Observations
0.3130063 Syx
5
ANOVA
Significance
df
SS
MS
3.40608108
F
34.7655172
4
Regression
1 3.406081081
1
0.09797297
Residual
Total
3 0.293918919
4
3.7
3
F
0.00973889
Standard
Coefficients
Error
t Stat
6.30867442
P-value
Lower 95%
0.00804830
Intercept
1.8648649 0.295603282
8
1
0.00973888
0.92412329
X Variable 1
0.4797297 0.081362126
5.89622907
9
0.22079913
Từ đó ta có phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng
doanh thu và % tăng chi phí quảng cáo như sau:
Y=1.86486+0.47973*X
1.
Để kiểm định giả thiết bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (không có mối liên hệ tương quan)
H1: β1≠0 (có mối liên hệ tương quan)
Dựa vào bảng kết quả hồi quy, với biến X ta có t=6.30867, Mức ý
nghĩa=0.00974≈1%, tức là với độ tin cậy 99% có thể nói rằng % tăng doanh thu có
mối liên hệ tuyến tính với % tăng quảng cáo.
3.
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đã cho thì 92,1% sự thay đổi
trong % tăng doanh thu được giải thích bởi % tăng chi phí quảng cáo.
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa
% tăng chi phí quảng cáo và % tăng doanh thu là rất chặt chẽ.
4.
Ta phải ước lượng giá trị Y, khi X=5% với độ tin cậy là 95%. Ta có công thức
khoảng tin cậy là khoảng:
1
Yˆi ± tα / 2;n − 2 ⋅ S yx ⋅ 1 + +
n
(X − X)
∑( X − X )
2
i
n
i =1
2
i
Ta có Y5%= 1.85486+0.47973*5= 4.2635%.
Syx=0.313006 (tra trong bảng kết quả hồi quy=Standard Error).
n=5,X = 3.2.
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3.182.
Thay số vào công thức ta tính được khoảng tin cậy của Y5% từ: 3.071% đến
5.4499%.
Có thể kết luận: Với độ tin cậy 95%, khi chi phí quảng cáo tăng 5% thì doanh thu
tăng trong khoảng từ 3.071% đến 5.4499%.