Bài tập cá nhân môn: Thống Kê trong kinh doanh
BÀI TẬP CÁ NHÂN
Môn học: Thống Kê trong kinh doanh
Học viên: Đỗ Thúy Nga
Lớp: GaMBA01.X01
Câu 1:
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
Trả lời là đúng vì:
Nghiên cứu thống kê phải dựa trên đặc điểm của từng đơn vị tổng thể được chọn ra để
nghiên cứu tuỳ vào từng mục đích mà người nghiên cứu muốn có.
Ví dụ:
Tiêu thức thuộc tính như: giới tính, nghề nghiệp, dân tộc, …
Tiêu thức số lượng như: Số nhân khẩu trong gia đình, tiền lương tháng của mỗi người
lao động,..
2) Tần số biểu hiện bằng số tuyệt đối
Trả lời là đúng vì:
Biểu hiện số đơn vị được phân phối vào trong mỗi tổ, là số lần một lượng biến nhận
một giá trị nhất định trong một tổng thể. Nếu tần số biểu hiện bằng số tương đối thì
gọi là tần suất.
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức
nghiên cứu của hai hiện tượng khác loại.
Trả lời là sai vì:
Độ lệch chuẩn là một đại lượng thống kê mô tả dùng để đo mức độ phân tán của một
tập hợp dữ liệu đã được lập thành bảng tần số. Khi hai tập dữ liệu có cùng giá trị trung
bình cộng và tập nào có độ lệch chuẩn lớn hơn đó là tập có dữ liệu biến thiên nhiều
hơn. Trong trường hợp hai tập dữ liệu có giá trị trung bình cộng không bằng nhau thì
việc so sánh độ lệch chuẩn của chúng không có ý nghĩa.
4) Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ nghịch với phương sai
của tổng thể.
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Trả lời là đúng vì:
Phương sai của tổng thể chung:
Σ(xi – μ)2
σ 2=
N
Khoảng tin cậy: X - Z
5) Phương pháp dãy số bình quân trượt không nên dùng trong dãy số có biến
động thời vụ.
Trả lời là đúng vì:
Số bình quân trượt sử dụng để san bằng dãy số có nhiều biến động ngẫu nhiên. Số
bình quân trượt càng được tính từ nhiều mức độ thì càng có tác dụng san bằng ảnh
hưởng của các yếu tố ngẫu nhiên, nhưng đồng thời làm cho số lượng các mức độ của
dãy số bình quân trượt càng giảm, do đó ảnh hưởng đến việc biểu hiện xu hướng phát
triển của hiện tượng. Phương pháp này làm trơn nhẵn sự biến động thực tế nên không
dùng với dãy số biến động thời vụ.
B. Chọn phương án trả lời đúng nhất:
1) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên.
Phương án trả lời đúng nhất: d) Không có điều nào ở trên.
2) Ưu điểm của Mốt là:
a) San bằng mọi chênh lệch giữa các lượng biến.
b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức.
d) Cả a), b).
e) Cả a), b), c)
Phương án trả lời đúng nhất: b) Không chịu ảnh hưởng của các lượng biến đột xuất
3) Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
Bài tập cá nhân môn: Thống Kê trong kinh doanh
d) Cả a), b).
e) Cả a), c).
f) Cả a), b), c).
Phương án trả lời đúng nhất: e) Cả a), c).
4) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Phương án trả lời đúng nhất: e) Cả b) và c) đều đúng
5) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu.
b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
Phương án trả lời đúng nhất: d) Cả a), c).
Câu 2 . Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn
thành được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng
khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của
ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm. Hãy tính số công
nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ
hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng suất
trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Trả lời:
Z2σ2
Công thức xác định cỡ mẫu :
N=
Error2
Theo giả thiết đầu bài cho ta có sai số Error = 1.
Độ tin cậy 95% hay 1 -ά = 95%
↔
ά = 5%
Độ lệch tiêu chuẩn về năng suất trong 1h là 6 sản phẩm hay σ = 6.
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Tra bảng Z ta có Zά/2 = 1,96
Khi thay số vào công thức ta có: n = 1,962*62/12 = 138,297 = 138 (công nhân).
* Mẫu được chọn là 138 CN . Dựa theo giả thiết đầu bài cho ta được:
Sản phẩm trung bình mà họ hoàn thành trong 1h là 35 hay X = 35;
Độ lệch tiêu chuẩn σ = 6,5.
Gọi -μ năng xuất trung bình 1h của toàn bộ công nhân.
Ta có khoảng ước lượng:
X - tά/2 (n-1) S/√n ≤ μ ≤ X + tά/2 (n-1) S/√n .
∑ (xi - x)2
S2 =
6,52
=
n-1
= 0,308 hay S = 0,555
138 - 1
Với độ tin cậy 95% hay ά = 5% tra bảng
t0,025(137) = 1,978.
Ta được:
35 - 1,978*0,555/11,747 ≤μ≤ 35 + 1,978*0,555/11,747 hay: 34,907 ≤ μ ≤ 35,093
Câu 3 . Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay
không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26
Phương án 2: 20 27 25 29 23 26
30
28
28 24
30 32
28
34
26
38
30
25
30
28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95%
hãy rút ra kết luận về hai phương án trên.
Trả lời:
Hai tổng thể trên phân phối theo quy luật chuẩn; chưa biết phương sai của tổng thể
chung; mẫu nhỏ n1 và n2 <30.
Gọi μ1 là chi phí trung bình sản xuất theo phương án 1
μ2 là chi phí trung bình sản xuất theo phương án 2
Cần kiểm định giả thiết:
Ho:
μ1 = μ2
H1:
μ1 ≠ μ2.
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Chọn tiêu chuẩn kiểm định là thống kê t:
X1 – X2
t=
√ S2 +
S2
n1
n1
S2 là giá trị chung của hai phương sai mẫu S21 và S22.
(n1 – 1)S21 + (n2 -1)S22
S2 =
n 1 + n2 - 2
* Phương án 1:
Số lần
1
2
3
4
5
6
7
8
9
10
11
12
Tổng
Ta có:
(Xi – X)2
Chi phí (xi)
Xi - X
-4,75
2,25
5,25
8,25
5,25
-3,75
0,25
-1,75
-5,75
-1,75
-3,75
0,25
25
32
35
38
35
26
30
28
24
28
26
30
357
X1 = 357/12 = 29,75.
∑ (xi –X1)2
↔
22,5625
5,0625
27,5625
68,0625
27,5625
14,0625
0,0625
3,0625
33,0625
3,0625
14,0625
0,0625
218,25
S21 =
=
n1 - 1
* Phương án 2:
218,25
= 19,841
11
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Số lần
Chi phí (xi)
xi - x
(xi - x)2
1
20
-8,214
67,47
2
27
-1,214
1,47
3
25
-3,214
10,33
4
29
0,786
0,62
5
23
-5,214
27,19
6
26
-2,214
4,90
7
28
-0,214
0,05
8
30
1,786
3,19
9
32
3,786
14,33
10
34
5,786
33,47
11
38
9,786
95,76
12
25
-3,214
10,33
13
30
1,786
3,19
14
28
-0,214
0,05
Tổng:
395
272,36
Tính X2 = 395/14 = 28,214.
∑ (xi –X2)2
↔ S22 =
272,36
=
= 20,951
n–1
13
(12 – 1)*19,84 + ( 14 – 1) * 20,95
↔ S2 =
=
20,442
12 + 14 – 2
29,75 – 28,214
Ta thay S2 được t =
1,54
=
√ 20,442/12 + 20,442/14
=
1,779
Với độ tin cậy 95% ta có 1 – ά = 0,95 hay ά = 0,05 .
Kiểm định hai phía tra bảng tά/2, (n1 + n2 – 2) . Hoặc t0,025 (12 + 14 – 2) = t* = 2,064
0,864
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Chúng ta thấy t < t* chấp nhận giả thiết Ho, bác bỏ giả thiết H1.
Vậy với độ tin cậy 95% chúng ta rút ra kết luận về hai phương án trên là chi phí
trung bình như nhau.
Câu 4 . Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây
của một nhà máy (đơn vị: triệu tấn):
6,1
4,7
6,2
7,5
6,6
6,0
4,9
5,3
7,3
4,8
5,3
7,3
5,7
7,0
3,7
7,2
3,8
12,3
4,5
4,7
7,8
6,4
6,5
5,2
6,4
3,0
5,1
4,5
7,9
6,1
1.
2.
3.
4.
Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và
từ bảng phân bố tần số. So sánh kết quả và giải thích.
Trả lời:
1) Biểu diễn tập hợp số liệu bằng biểu đồ thân lá (Stem and leaf):
Khối lượng than khai thác được trong 30 tháng gần đây của một nhà máy: 3; 3.7; 3.8; 4.5;
4.5;4.7;4.7; 4.8; 4.9; 5.1; 5.2; 5.3; 5.3; 5.7; 6; 6.1; 6.1; 5.2; 6.4; 6.4; 6.5; 6.6; 7; 7.2; 7.3;
7.3; 7.5; 7.8; 7.9; 12.
Thân
Lá
3
4
5
6
7
8
9
10
11
12
0
5
1
0
0
7
5
2
1
2
8
7
3
1
3
7
3
2
3
8
7
4
5
9
4
8
5
9
6
3
2) Xây dựng bảng tần số phân bố phù hợp với dữ liệu:
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Tiêu thức phân tổ này có lượng biến rời rạc và biến thiên trong phạm vi tương đối lớn
nên bảng phân bố tần số cần có khoảng cách tổ. Lựa chọn tiêu thức phân tổ là tiêu thức số
lượng: Khối lượng than khai thác
Dựa vào sơ đồ thân lá trên ta xây dựng bảng phân bố tần số sau:
Bảng phân tổ số tháng khai thác than theo tiêu thức khối lượng than khai thác
Khối lượng
(Triệu tấn)
Trị số giữa
(Triệu tấn)
Tần số
(Số tháng)
Tần xuất
(%)
Từ 3 đến dưới 5
4
9
30,00
Từ 5 đến dưới 7
6
13
43,33
Từ 7 đến duới 9
8
7
23,33
Từ 9 đến dưới 11
10
0
0,00
Từ 11 đến dưới 13
12
1
3,33
Cộng:
40
30
100,00
3) Trong bộ dữ liệu trên có dữ liệu đột xuất, căn cứ vào sơ đồ thân lá và bảng tần số
phân bổ chúng ta thấy 12.3 là dữ liệu đột xuất.
Tại sơ đồ thân lá khối lượng than khai thác phổ biến nhất từ 6 đến dưới 8 triệu tấn là phổ
biến, còn lại là ở dưới mức này và chỉ có 1 tháng là khối lượng than khai thác lên đến
12,3 triệu tấn.
Tại bàng phân bố tần số có khối lượng than khai thác nằm trong khoảng từ 3 - đến dưới 9
triệu tấn, sự phân bố tập trung ở khoảng đầu trong đó phần chiếm tỷ trọng lớn nhất là số
tháng có khối lượng than khai thác từ 5 đến dưới 7 triệu tấn chiếm 43,33%. Chỉ có một
tháng là khối lượng than khai thác12,3 triệu tấn chiếm 3,33%.
Kết luận: Dữ liệu 12,3 triệu tấn là dữ liệu đột xuất.
4) Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra
và từ bảng phân bố tần số. So sánh kết quả và giải thích.
* Theo tài liệu điều tra ta có:
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Tổng khối lượng than khai thác của 30 tháng là:
∑Xi = 179,80 (triệu tấn).
∑Xi
Khối lượng than trung bình khai thác trong 1 tháng là: X =
= 5,993
30
Câu 5 . Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để
đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí
quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại
mức độ thay đổi của doanh thu ở các vùng như sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2
6
4
3
2.5
3
4.5
3.5
3
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối
liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ
này qua các tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có
mối liên hệ tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo
là 5% với xác suất tin cậy 90%.
Trả lời:
1) Với dữ liệu trên, xác định phương trình hồi quy tuyến tính:
* B1: Biểu đồ xem xét mối liên hệ:
Trên biểu đồ ta thấy đồ thị có mối liên hệ tuyến tính, đường thẳng đi lên.
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Phương trình hồi quy có dạng :
Y = b0 + b1 X
* B2: Tính toán các tham số, sử dụng phương pháp bình phương nhỏ nhất.
Tính toán các tham số: - Đặt biến % tăng doanh thu là Y
- % tăng chi phí quảng cáo là X.
STT
X
Y
XY
X2
Y2
1
1
2.5
2.5
1
6.25
2
2
3
6
4
9
3
6
4.5
27
36
20.25
4
4
3.5
14
16
12.25
5
Tổng:
3
16
3
16.5
9
58.5
9
66
9
56.75
∑
y = bo*n + b1∑x
Giải hệ phương trình:
xy = bo*∑x + b1*∑x 2
∑
Thay số ta có:
16,5 = 5bo +16b1
58,5 = 16bo + 66b1
bo = 2,067
↔
Phương trình hồi quy có dạng: Y = 2,068 +0,385X.
Sử dụng excel hồi quy bằng hàm Regression, ta có:
SUMMARY
OUTPUT
Regression
Statistics
Multiple R
R Square
Adjusted R
Square
0.977
0.954
0.939
b1 = 0,385
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Standard
Error
0.187
Observations
5
ANOVA
df
SS
MS
F
Significance F
1
3
4
2.1953
0.1047
2.3
2.1953
0.0349
62.8839
0.0042
Coefficient
s
Standard
Error
t Stat
P-value
Lower 95%
Uppe
r 95%
2.068
0.385
0.176
0.049
11.717
7.930
0.001
0.004
1.506
0.231
2.629
0.540
Regression
Residual
Total
Intercept
X
RESIDUAL
OUTPUT
PROBABILITY
OUTPUT
1
2
3
Predicted
Y
2.452703
2.837838
4.378378
0.047297297
0.162162162
0.121621622
4
3.608108
-0.10810811
5
3.222973
-0.22297297
Observation
Residuals
Standard
Residuals
0.292301692
1.002177229
0.751632922
0.668118153
-1.37799369
Percentile
Y
10
30
50
2.5
3
3
70
3.5
90
4.5
Y = 2.068 + 0,385X.
Giải thích ỹ nghĩa các tham số:
b0 = 2.068 - Nó ảnh hưởng của tất cả các nhân tố khác ngoài nhân tố % tăng chi phí
quảng cáo ảnh hướng tới % tăng doanh thu.
b1 = 0,385 - Nó ảnh hưởng của % tăng chi phí quảng cáo tới % tăng doanh thu. Cụ thể
mỗi khi % chi phí quảng cáo tăng lên 1 đơn vị thì % doanh thu tăng lên 0,385 đơn vị.
2. Kiểm định hệ số hồi quy.
Cặp giả thiết kiểm định:
H0:
β1 ≠ 0 - không có mối liên hệ tuyến tính.
H1:
β1 = 0 Có mối liên hệ tuyến tính.
Bài tập cá nhân môn: Thống Kê trong kinh doanh
Tiêu chuẩn kiểm định:
t = b1 - β1
↔
Từ excel ta thấy
t* = 7.930
Sb1
Khoảng tin cậy 95% hay ά = 5%. Tra bảng tά/2(n-2) = t0,025(3) = 3,182.
Ta thấy t > tά/2(n-2) suy ra bác bỏ Ho chấp nhận H1.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Ta thấy SST = 2,3 mối liên hệ của Y quanh giá trị trung bình Y.
SSR = 2.1953, mối liên hệ giữa X và Y tương đối chặt chẽ.
SSE = 0,1047 nhỏ chứng các nhân tố khác tới Y rất nhỏ.
* Sự phù hợp của mô hình r2 = SSR/SST = 0,954, hay tra bảng excel r2 = 0,954.
95% sự thay đổi về %tăng doanh thu có thể đượcgiải thích bằng sự thay đổi về % tăng
chi phí quảng cáo.
4. Ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là
5% với xác suất tin cậy 90%.
Y^i +- tn-2Syx√1 +1/n +(Xi -X)2/∑(Xi - X )2
Syx = 0,187 với X = 5%.
Y^i = 2,068 + 0,385*5 = 3,993.
X = 3,2 , t tra bảng tά/2(n-2) = 2.353.
↔ Vậy khoảng tin cậy là Y^i +- tn-2Syx√1 +1/n +(Xi -X)2/∑(Xi - X )2 =
= 3.993 ± 2.353*0.187*√ 1+1/5+3.24/2.3 = 3.993 ±0.7107.
Kết thúc.