GaMBA01.M0809
Thống kê và khoa học ra quyết định
BÀI TẬP HẾT MÔN
Môn học: THỐNG KÊ VÀ KHOA HỌC RA QUYẾT ĐỊNH
Học viên: Đào Công Luận - Lớp : GaMBA01.M0809
CÂU 1:
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1. Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
- Trả lời: (Đ)
- Giải thích: Vì tiêu thức thống kê là khái niệm chỉ đặc điểm của đơn vị tổng thể, mỗi đơn vị
tổng thể có nhiều tiêu thức khác nhau, tuỳ theo mục đích nghiên cứu người ta sẽ chọn ra một số
tiêu thức nhất định để làm nội dụng điều tra, tổng hợp và phân tích thống kê.
2. Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
- Trả lời: (Đ)
- Giải thích: Vì tần số trong bảng phân bố tần số thể hiện số lần giá trị đó xuất hiện trong dãy số
liệu. Số lần xuất hiện luôn là một số nguyên dương.
3. Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên cứu
của hai hiện tượng khác loại.
- Trả lời: (S)
- Giải thích: Vì độ lệch tiêu chuẩn là số bình quân toàn phương của bình phương các độ lệch
giữa các lượng biến với số bình quân cộng của các lượng biến đó. Độ lêch tiêu chuẩn có đơn vị
tính là kg, m2, m3, con, ngày, ..... Đối với các hiện tượng khác loại hoặc các hiện tượng cùng loại
không bằng nhau người ta dùng hệ số biến thiên để so sánh chứ không dùng độ lệch chuẩn.
4. Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của
tổng thể chung đó
- Trả lời: (S)
- Giải thích: Từ công thức: x − Zα / 2
σ
σ
≤ µ ≤ x + Zα / 2
n
n
Theo công thức trên, phương sai của tổng thể chung càng nhỏ dẫn đến khoảng tin cậy cho
tham số của tổng thể chung càng nhỏ vì vậy khoảng tin cậy của tổng thể chung tỷ lệ nghịch với
phương sai của tổng thể chung đó là sai.
5. Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân đến
tiêu thức kết quả.
1
GaMBA01.M0809
Thống kê và khoa học ra quyết định
- Trả lời: (Đ)
- Giải thích: Vì hệ số hồi quy b1 phản ánh ảnh hưởng của nhân tố đang nghiên cứu tới biến kết
quả. Cụ thể mỗi khi biến giải thích thay đổi (tăng lên) 1 đơn vị thì biến kết quả thay đổi (tăng
lên) b1 đơn vị. Như vậy hệ số hồi quy (b 1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu
thức nguyên nhân đến tiêu thức kết quả là đúng.
B. Chọn phương án trả lời đúng nhất:
Trả lời: Phương án trả lời đúng nhất là phương án chữ đậm và được đổi màu chữ đỏ.
1. Phân tích dãy số thời gian có tác dụng:
δ
a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε
b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
γ
d) Cả a), b).
η e) Cả b), c).
ι
f) Cả a), b), c).
2. Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
e) Cả a), c).
3. Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả .
4. Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
2
GaMBA01.M0809
Thống kê và khoa học ra quyết định
ϕ e) Cả a), c)
κ
f) Cả a), d)
5. Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
CÂU 2:
Đề bài:
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được
bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng có
sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về
năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ
hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5.
Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Trả lời:
* Xác định cỡ mẫu
Từ dữ liệu đề bài ra, ta có:
- Độ lệch chuẩn đối với tổng thể chung:
σ=6
- Độ lệch chuẩn đối với tổng thể mẫu:
s = 6,5
- Năng suất trung bình:
x = 35 sản phẩm.
- Error = 1
Với độ tin cậy 95% ⇒ 1 - α = 95% ⇒ α = 5% = 0,05
Gọi n là số công nhân cần điều tra để đặt định mức sản phẩm sản xuất.
Từ công thức: n =
Z 2 .σ 2
Error 2
1,645 2.6 2
Với α = 5%, Z = 1,645 (tra bảng); σ = 6; Error = 1 ⇒ n =
= 97,4 ≈ 98.
12
3
GaMBA01.M0809
Thống kê và khoa học ra quyết định
Vậy số công nhân cần được điều tra để đặt định mức là: 98 công nhân
* Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%
Với n = 98 ; x = 35
Tổng thể chung có phân phối chuẩn và phương sai σ = 6,5
⇒ Khoảng tin cậy được xác định như sau: x - Z α / 2 *
σ
σ
≤ µ ≤ x + Zα /2 *
n
n
với Z α / 2 = 1,645
⇒ 35 – 1,645 *
6,5
98
≤ µ ≤ 35 + 1,645 *
6,5
98
⇔ 33,92 ≤ µ ≤ 36,08
Kết luận: Với độ tin cậy 95%, cỡ mẫu là 98 công nhân, năng suất trung bình một giờ của toàn
bộ công nhân nằm trong khoảng 33,92 ≤ µ ≤ 36,08 sản phẩm.
CÂU 3:
Đề bài:
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm. Để
đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến
hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1:
25
32
35
38
35
26
30
28
24
28
26
30
Phương án 2:
20
27
25
29
23
26
28
30
32
34
38
25
30
28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95%
hãy rút ra kết luận về hai phương án trên.
Trả lời:
Với kết quả thu được, ta có dữ liệu về 2 phương án như sau:
* Phương án 1:
xi
24
25
26
28
30
32
35
38
∑ xi = 238
∑f
fi
1
1
2
2
2
1
2
1
i
= 12
xi fi
24
25
52
56
60
32
70
38
∑ xi f i = 357
xi - x
-5,75
-4,75
-3,75
-1,75
0,25
2,25
5,25
8,25
∑
(xi - x ) 2
33,0625
22,5625
14,0625
3,0625
0,0625
5,0625
27,5625
68,0625
( xi − x) 2 = 173,5
4
GaMBA01.M0809
x1=
S12 =
Thống kê và khoa học ra quyết định
357
= 29,75
12
∑ ( x − x)
2
i
=
n −1
173,5
= 15,77 ⇒ S1 = 15,77 = 3,97
11
* Phương án 2:
xi
20
23
25
26
27
28
29
30
32
34
38
x2=
S12 =
∑f
fi
1
1
2
1
1
2
1
2
1
1
1
i
= 14
xi fi
20
23
50
26
27
56
29
60
32
34
38
∑ xi f i = 395
xi - x
-8,21
-5,21
21,79
-2,21
-1,21
27,79
0,79
31,79
3,79
5,79
9,79
∑
(xi - x ) 2
67,404
27,144
474,804
4,884
1,464
772,284
0,624
1010,604
14,364
33,524
95,844
( xi − x) 2 = 2502,944
395
= 28,21
14
∑ ( x − x)
2
i
n −1
=
2502,944
= 192,53 ⇒ S2 = 192,53 = 13,88
13
Ta có bảng phân tích sau:
Phương án 1
Số quan sát (n)
12
Trung bình mẫu ( x )
29,75
Độ lệch chuẩn (S)
3,97
Do số quan sát ít, mẫu nhỏ, ta sử dụng kiểm định t.
Phương án 2
14
28,21
13,88
24
Với độ tin cậy 95% ⇒ α = 0,05 thì t αn1/+n2 2 − 2 = t 0,025 = 2,064
H : µ = µ2
Cặp giả thiết: 0 1
H1 : µ1 ≠ µ 2
Ta có:
2
Phương sai SP =
=> Sp =
(n1 − 1)S12 + (n 2 − 1)S22 11 * 3,97 2 + 13 * 13,88 2
=
= 111,578
n1 + n 2 − 2
12 + 14 − 2
S2P = 10,563
X1 − X 2
29,75 − 28,21
1 1 =
t=
1
1 = 0,37
S
+
10,563
+
n1 n 2
12 14
5
GaMBA01.M0809
Thống kê và khoa học ra quyết định
Vì t < 2,064 nên chưa đủ cơ sở bác bỏ giả thiết H0.
Kết luận: Với độ tin cậy 95% và kết quả thu được từ 2 phương án, chưa đủ cơ sở để bác bỏ rằng
chi phí trung bình theo hai phương án sản xuất có khác nhau.
CÂU 4:
Đề bài:
Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây của một
nhà máy (đơn vị: triệu tấn):
6,1
4,7
6,2
7,5
6,6
6,0
4,9
5,3
7,3
4,8
5,3
7,3
5,7
7,0
3,7
7,2
3,8
12,3
4,5
4,7
7,8
6,4
6,5
5,2
6,4
3,0
5,1
4,5
7,9
6,1
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
3. Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ
bảng phân bố tần số. So sánh kết quả và giải thích.
Trả lời:
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá.
Xếp thứ tự thấp đến cao theo khối lượng than khai thác:
3,0; 3,7; 3,8; 4,5; 4,5; 4,7; 4,7; 4,8; 4,9; 5,1; 5,2; 5,3; 5,3; 5,7; 6,0
6,1; 6,1; 6,2; 6,4; 6,4; 6,5; 6,6; 7,0; 7,2; 7,3; 7,3; 7,5; 7,8; 7,9; 12,3
Tập hợp số liệu theo biểu đồ thân lá:
THÂN
3
4
5
6
7
8
LÁ
0
5
1
0
0
7
5
2
1
2
8
7
3
1
3
7
3
2
3
8
7
4
5
9
4
8
5
9
6
TẦN
SỐ
3
6
5
8
7
0
6
GaMBA01.M0809
9
10
11
12
Thống kê và khoa học ra quyết định
0
0
0
1
3
2. Xây dựng bảng tần số phân bổ:
Khoảng biến thiên = 12,3 – 3,0 = 9,3. Bộ dữ liệu nên chia làm 10 tổ có khoảng cách tổ bằng
nhau hi = 1 Giới hạn tổ: 3, 4, 5, 6, 7, 8, 9, 10, 11, 12.
Tổ
3 tấn đến dưới 4 tấn
4 tấn đến dưới 5 tấn
5 tấn đến dưới 6 tấn
6 tấn đến dưới 7 tấn
7 tấn đến dưới 8 tấn
8 tấn đến dưới 9 tấn
9 tấn đến dưới 10 tấn
10 tấn đến dưới 11 tấn
11 tấn đến dưới 12 tấn
TỔNG
3
6
5
8
7
0
0
0
1
Tần
suất
(%)
10
20
16,67
26,67
23,33
0
0
0
3,33
30
100
Tần số
Tần số
tích luỹ
3
9
11
19
26
26
26
26
27
Tần suất
tích luỹ
%
10
30
46,67
73,33
96,67
96,67
96,67
96,67
100
3. Trong bộ dữ liệu trên có dữ liệu đột xuất không và có là giá trị nào?
Thực hiện bằng phần mềm MS Excel ta có kết quả sau:
Column1
Mean
5.993333333
Standard Error
0.317639763
Median
6.05
Mode
6.1
Standard Deviation 1.739784635
Sample Variance
3.026850575
Kurtosis
4.866233403
Skewness
1.469798392
Range
9.3
Minimum
3
Maximum
12.3
Sum
179.8
Count
30
QUARTILE : Q1=4.83 ; Q2=6.05; Q3= 6.9
IQR = Q3 – Q1 = 6.90 – 4.83 = 2.075
1.5 IQR= 3.11
Giới hạn Giới hạn
ngoài
trong
-1.39
1.71
Nghi
ngờ là
Lượng lượng
biến
biến
(4.83) Q1
đột
đột
xuất
xuất
Giới hạn Giới hạn
ngoài
trong
10.01
13.13
Nghi
ngờ là
lượng Lượng
Q3 (6.9)
biến
biến
đột
đột
xuất
xuất
IQR=2.075
7
GaMBA01.M0809
Thống kê và khoa học ra quyết định
* Các điểm giới hạn bên trái hộp ria mèo được xác định như sau:
+ Giới hạn trong: Q1 – 1,5 IQR = 1.71
+ Giới hạn ngoài: Q1 – 3 IQR = - 1.39
* Các điểm giới hạn bên phải hộp ria mèo được xác định như sau:
+ Giới hạn trong: Q3 + 1,5 IQR = 10.01
+ Giới hạn ngoài: Q3 + 3 IQR = 13.13
Kết luận:
Nhìn trên đồ thị hộp ria mèo ta có thể nhận thấy :
- Lượng biến đột xuất là toàn bộ những giá trị nằm ở khoảng <-1.39 và khoảng > 13.13
- Theo như dữ liệu của bài trong bộ dữ liệu này không có lượng biến đột xuất.
- Giá trị lớn nhất là 12.3 nằm trong khoảng nghi ngờ là lượng biến đột xuất.
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ
bảng phân bố tần số. So sánh kết quả và giải thích.
* Khối lượng than trung bình trong tháng từ tài liệu điều tra:
∑ x i = 179,8 = 5,99 tấn
X=
n
30
* Khối lượng than trung bình trong tháng từ bảng phân bố tần số:
∑ fi x i = 181 = 6,03 tấn
X=
n
30
Kết luận: Kết quả trung bình tính theo phân bổ tần số có kết quả chính xác hơn vì loại được
sai số do kết quả đột biến gây ra.
CÂU 5:
Đề bài:
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá
mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí quảng cáo trên
5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của
doanh thu ở các vùng như sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2
6
4
3
2.5
3
4.5
3.5
3
8
GaMBA01.M0809
Thống kê và khoa học ra quyết định
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ
giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các
tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5%
với độ tin cậy 90%.
Trả lời:
Từ đề bài ta có bảng sau:
STT
% Tăng chi phí
QC (X)
% Tăng
DT (Y)
1
2
3
4
1
2
6
4
2.5
3
4,5
3,5
2,5
6
27
14
1
4
36
16
6,25
9
20,25
12,25
5
3
3
9
9
9
Tổng
16
16,5
58,5
66
56,75
Trung
bình
3,2
3,3
11,7
13,2
11,35
X2
XY
Y2
9
GaMBA01.M0809
Thống kê và khoa học ra quyết định
Thực hiện hồi quy bằng phần mềm MS Excel ta có kết quả sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.976967418
R Square
0.954465335
Adjusted R Square
0.939287113
Standard Error
0.186841938
Observations
5
ANOVA
df
SS
MS
Regression
Residual
1
3
2.19527027
0.10472973
Total
4
2.3
Coefficients
Standard Error
2.19527027
0.03490991
t Stat
Intercept
2.0676
0.176453579
11.71734559
% Tăng chi phí QC
0.3851
0.0486
7.929935117
F
62.8838709
7
Significance F
P-value
0.00133570
7
0.00418159
2
Lower 95%
0.004181592
Upper 95%
1.506013527
2.629121609
0.230572472
0.539697798
1. Phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo
và % tăng doanh thu.
Từ kết quả hồi quy dữ liệu thu thập được ta có:
- Hệ số chặn:
b0 = 2,0676
- Hệ số hồi quy:
b1 = 0,3851
Vậy phương trình hồi quy tuyến tính biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo
và % tăng doanh thu là:
∧
Y = b 0 + b1X = 2,0676 + 0,3851X
Kết luận:
b1 = 0,3851: Với mẫu đã được nghiên cứu, khi các yếu tố khác giữ nguyên, mỗi khi chi
phí quảng cáo tăng thêm 1% thì doanh thu sẽ tăng thêm 0,3851%.
b0 = 2,0676: Là ảnh hưởng của các yếu tố khác, ngoài chi phí quảng cáo, tới doanh thu
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không?
Cặp giả thiết:
H0: β0 = 0 (Không có mối liên hệ tuyến tính giữa quảng cáo và mức doanh thu)
H1: β1 # 0 (Có mối liên hệ tuyến tính giữa quảng cáo và mức doanh thu)
Tiêu chuẩn kiểm định: t =
(b1 − β1 )
Sb1
10
GaMBA01.M0809
Sai số chuẩn của hệ số: Sb1 =
⇒t =
Syx
∑ (x
i
− x) 2
Thống kê và khoa học ra quyết định
= 0,0486
0,3851 - 0
= 7,930
0,0486
Với độ tin cậy 95% nên α = 0,05 ⇒
α
= 0,025 ⇒ tα/2;n-2 = t0,025;3 = 3,182
2
t tương ứng với α = 0,0042 < 0,025 thuộc miền bác bỏ.
Ra quyết định: Bác bỏ H0, chấp nhận H1.
Kết luận: Có mối liên hệ tương quan tuyến tính giữa % tăng chi phí quảng cáo và % tăng doanh
thu.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
- Cường độ của mối liên hệ : Hệ số r = 0,977 rất gần +1 nên mối liên hệ rất chặt chẽ.
SSR
- Sự phù hợp của mô hình : Hệ số xác định r2 =
= 0,954 ⇔ 95,4% sự biến đổi của phần
SST
trăm tăng doanh thu có thể giải thích bằng sự biến đổi về phần trăm tăng chi phí quảng cáo qua
mô hình trên.
4. Ước tính tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với xác suất tin
cậy 90%.
Để dự đoán tỷ lệ % tăng doanh thu khi tăng tỷ lệ % chi phí quảng cáo lên 5% ta sử dụng công
thức:
∧
Yi ± t α/2;n −2 .S yx .
1
(x − X) 2
+ n i
n ∑ (x i − X) 2
i =1
Trong đó:
tα/2;n-2 = t0.05;3 = 3,182
S yx = 0,1868
n=5
X = 3,2
∧
⇒Y = (2,0676+ 0,3851, 5) = 3,993
i
Sai số dự đoán : t α/2; n − 2 .S yx .
1
(x − X) 2
+ n i
= 0,285
n ∑ (x i − X) 2
i =1
Ta có khoảng µyx:
∧
(3,993 – 0,285) ≤ Yi ≤ (3,993 + 0,285)
∧
⇔ 3,709 ≤ Y ≤ 4,278
i
Kết luận: Với độ tin cậy 90%, khi chi phí quảng cáo tăng 5%, các yếu tố khác giữ
nguyên, dự đoán tỷ lệ tăng doanh thu nằm trong khoảng :
11
GaMBA01.M0809
Thống kê và khoa học ra quyết định
∧
3,709 (%) ≤ Yi ≤ 4,278 (%)
TÀI LIỆU THAM KHẢO
- Giáo trình Thống kê & khoa học ra quyết định – Đại học Griggs
- Website : www.ketoan.com
12