BÀI TẬP CÁ NHÂN
Môn: Thống kê và khoa học ra quyết định
Học viên: Mai Thị Phương Thảo - Lớp M0809
Bài làm:
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ) sai (S) các câu hỏi sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu. (Đ)
Giải thích: Tiêu thức thống kê là khái niệm chỉ đặc điểm của đơn vị tổng thể,
mỗi đơn vị tổng thể có nhiều tiêu thức khác nhau, tuỳ theo mục đích nghiên
cứu người ta sẽ chọn ra một số tiêu thức nhất định để làm nội dụng điều tra,
tổng hợp và phân tích thống kê. Mỗi tiêu thức thống kê chỉ phản ánh một đặc
điểm của từng đơn vị tổng thể được chọn ra từ tổng thể nghiên cứu, chứ không
phản ánh toàn bộ đặc điểm của cả tổng thể nghiên cứu.
2) Tần số trong bảng phân bố tần số biểu hiện bằng giá trị tuyệt đối. (Đ)
Giải thích: Tần số được biểu hiện bằng số tuyệt đối còn tần suất mới được biểu
hiện bằng số tương đối với đơn vị tính là (%). Trong phân tích thống kê tần số
cho phép chúng ta xác nhận một trị số nhất định trong một tổng thể nên tần số
biểu hiện bằng số tuyệt đối.
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức
nghiên cứu của hai thiện tượng khác loại. (S)
Giải thích: Độ lệch chuẩn là một trong các chỉ tiêu so sánh độ biến thiên của
hiện tượng cùng loại và số trung bình bằng nhau. Đối với các hiện tượng khác
loại hoặc các hiện tượng cùng loại không bằng nhau người ta dùng hệ số biến
thiên để so sánh.
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với
phương sai của tổng thể chung đó (S).
Giải thích: Ta có công thức:
σ
σ
≤ µ ≤ x + Zα / 2
n
n
Theo công thức trên, phương sai của tổng thể chung càng nhỏ dẫn đến
x − Zα / 2
khoảng tin cậy cho tham số của tổng thể chung càng nhỏ nên nếu nói khoảng
tin cậy của tổng thể chung tỷ lệ nghịch với phương sai của tổng thể chung đó là
sai.
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức
nguyên nhân đến tiêu thức kết quả. (Đ)
Giải thích: Hệ số hồi quy b1 phản ánh ảnh hưởng của nhân tố đang nghiên cứu
tới biến kết quả. Cụ thể mỗi khi biến giải thích thay đổi (tăng lên) 1 đơn vị thì
biến kết quả thay đổi (tăng lên) b 1 đơn vị và ngược lại. Như vậy hệ số hồi quy
(b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên nhân
đến tiêu thức kết quả là đúng.
B. Chọn phương án trả lới đúng nhất (Câu trả lời đúng là câu màu xanh ).
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
f) Cả a), b), c).
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu
thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ι
e) Cả a), c).
ϕ
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả .
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác
loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
κ
λ
e) Cả a), c)
f) Cả a), d)
5) Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2:
Bài giải:
a) Gọi độ lệch chuẩn của tổng thể chung σ = 6, Error =1,
Công thức xác định cỡ mẫu như sau:
Z 2σ2
n =
Error 2
Theo đề bài: độ tin cậy 95% nên α = 0,05 => α/2 = 0,025.
tra bảng ta có Z(α/2) = 1.960
Thay vào ta có cỡ mẫu cần tìm là:
→n=
1,960 2.6 2
= 138 người. (làm tròn số)
12
b) Với n tính được bằng 138, x = 35. Gọi µ là số sản phẩm trung bình
một giờ một công nhân làm được.
Tổng thể chung có phân phối chuẩn, chưa biết phương sai của tổng thể
chung và s là độ lệch chuẩn của tổng thể mẫu thì s = 6,5.
Khoảng tin cậy được xác định theo công thức:
x −tα/ 2; ( n −1)
s
≤µ≤x +tα/ 2; ( n −1)
n
s
n
Với độ tin cậy 1-α = 95%, ta có α/2 = 0,025 và n - 1 =137, ta có t =1.978.
Thay vào công thức, ta có:
35 −
1,978
6,5
≤
µ≤35 +
1,978
138
hay 33,906 < µ < 36,094
6,5
138
Kết luận: Với mẫu 138 đã điều tra trên, với độ tin cậy 95% thì
năng suất lao động trung bình µ nằm trong khoảng từ 33,906 - 36,094
sản phẩm/giờ.
Câu 3:
Bài giải:
Phương án 1(X1): 25 32 35 38 35 26 30 28 24
Phương án 2(X2): 20 27 25 29 23 26 28 30
25 30 28
Ta có:
28
32
26
34
30
38
Phương án 1:
1
x1 =
n
n
357
∑ xi f i = 12 = 29, 75
i =1
xi
fi
xi f i
xi − x
( xi − x ) 2
24
1
24
-5,75
33,0625
25
1
25
-4,75
22,5625
26
2
52
-3,75
14,0625
28
2
56
-1,75
3,0625
30
2
60
0,25
0,0625
32
1
32
2,25
5,0625
35
2
70
5,25
27,5625
38
1
38
8,25
n
∑x f
n = 12
i =1
S12 =
i
68,0625
n
i
= 357
1 n
173,5
( xi − x ) 2 =
= 15,77
∑
n − 1 i =1
12 − 1
∑
i =1
(xi - x ) 2 = 173,5
S1 = 15, 77 = 3,97
Phương án 2:
x2 =
1 n
395
xi fi =
= 28, 21
∑
n i =1
14
xi fi
xi − x
( xi − x ) 2
20
-8,21
67,404
1
23
-5,21
27,144
25
2
50
-3,21
10,304
26
1
26
-2,21
4,884
27
1
27
-1,21
1,464
28
2
56
0,21
0,044
29
1
29
0,79
0,624
30
2
60
1,79
3,204
32
1
32
3,79
14,364
34
38
1
34
38
5,79
9,79
33,524
95,844
xi
fi
20
1
23
1
n
n
∑x f
n=14
i =1
i
i
∑ (x
i =1
= 395
i
1 n
258,804
S =
( xi − x ) 2 =
= 19,908
∑
n − 1 i =1
13
2
2
S 2 = 19,908 = 4,462
Số quan sát (n)
Trung bình mẫu ( x )
Độ lệch chuẩn (S)
Phương án 1
12
29,75
3,97
Do số quan sát ít, mẫu nhỏ nên ta sử dụng kiểm định t.
24
n +n − 2
Với độ tin cậy 95% → α = 0,05 thì t α1 / 2 2 = t 0.025 = 2,064.
Phương án 2
14
28,21
4,462
− x ) 2 = 258,804
H 0 : µ1 = µ 2
Cặp giả thiết:
H 1 : µ1 ≠ µ 2
Ta có:
(n1 − 1) s12 + (n2 − 1) s22
11 * 3,97 2 + 13 * 4,462 2
=
= 18,01
(n1 − 1) + (n2 − 1)
12 + 14 − 2
Phương sai S 2P =
=> Sp =
Sp
2
= 4,244
X1 − X 2
29,75 − 28,21
1
1 =
t=
1 1 = 0,922
S
+
4,244
+
n1 n 2
12 14
Vì t < 2,064 nên chưa đủ cơ sở bác bỏ giả thiết H0.
Kết luận: Với độ tin cậy 95% và kết quả thu được từ 2 phương án, chưa đủ cơ sở để bác
bỏ rằng chi phí trung bình theo hai phương án sản xuất có khác nhau.
Câu 4:
Bài giải:
1 - Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá:
Xếp thứ tự thấp đến cao theo khối lượng than khai thác:
3,0; 3,7; 3,8; 4,5; 4,5; 4,7; 4,7; 4,8; 4,9; 5,1; 5,2; 5,3; 5,3; 5,7; 6,0
6,1; 6,1; 6,2; 6,4; 6,4; 6,5; 6,6; 7,0; 7,2; 7,3; 7,3; 7,5; 7,8; 7,9; 12,3
Tập hợp số liệu theo biểu đồ thân lá
Thân
3
4
5
6
7
8
9
10
11
Lá
0
5
1
0
0
7
5
2
1
2
8
7
3
1
3
7
3
2
3
8
7
4
5
9
4
8
5
9
6
Tần số
<3>
<6>
<5>
<8>
<7>
<0>
<0>
<0>
<0>
12
3
<1>
2 - Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu :
Khoảng biến thiên H =
12,3 − 3.0
= 0,93
10
Khoảng cách tổ bằng nhau hi = 1
Giới hạn tổ: 3, 4, 5, 6, 7, 8, 9, 10, 11, 12
Ta có bảng phân bố như sau:
Tổ
Tần số fi
Tần suất
di (%)
Tần số tích lũy
3 tấn – 4 tấn
3
10
3
10
4 tấn – 5 tấn
6
20
9
30
5 tấn – 6 tấn
5
16,67
14
46,67
6 tấn – 7 tấn
8
26,67
22
73,33
7 tấn – 8 tấn
7
23,33
29
96,67
8 tấn – 9 tấn
0
0
29
96,67
9 tấn – 10 tấn
0
0
29
96,67
10 tấn – 11 tấn
0
0
29
96,67
11 tấn – 12 tấn
0
0
29
96,67
12 tấn – 13 tấn
1
3,33
30
100
Tổng
n = 30
Si
Tần số tích lũy %
100
3 - Giá trị đột xuất:
Căn cứ vào biểu đồ thân lá và tần số phân bổ ta thấy trong bộ dữ liệu về
lượng than khai thác được trong 30 tháng có một giá trị đột xuất là 12,3 triệu tấn.
4 - Khối lượng than trung bình trong 1 tháng:
a - Khối lượng than trung bình trong 1 tháng từ tài liệu điều tra:
X=
1 n
179,8
xi =
= 5,99
∑
n i =1
30
(tấn)
b - Khối lượng than trung bình trong 1 tháng từ bảng phân bổ tần suất là:
X=
∑x f
i i
n
=
181
= 6, 03
30
(tấn)
Căn cứ vào kết quả thu được ta thấy khối lượng than trung bình trong
tháng tính theo bảng phân bổ tần suất có kết quả chính xác hơn vì loại được sai
số do kết quả đột biến gây ra.
Câu 5:
Bài giải:
Căn cứ vào các dữ liệu của đề bài ta có bảng các giá trị sau:
% tăng
doanh thu
(Y)
X2
XY
Y2
N0
% tăng chi phí
QC (X)
1
1
2,5
2,5
1
6,25
2
2
3
6
4
9
3
6
4,5
27
36
20,25
4
4
3,5
14
16
12,25
5
3
3
9
9
9
Tổng
16
16,5
58,5
66
56,75
Trung
bình
3,2
3,3
11,7
13,2
11,35
Ứng dụng phần mềm ta có được những kết quả sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.976967
R Square
0.954465
Adjusted R Square
0.939287
Standard Error
Observations
0.186842
5
ANOVA
df
Regression
Residual
Total
1
3
4
SS
2.195270
0.104730
2.3
Significance
MS
F
F
2.195270 62.883871 0.004182
0.034910
Standard
Lower
Lower
t Stat
P-value
Upper 95%
Upper 95.0%
95%
95.0%
Error
2.0676 0.176454 11.717346 0.001336 1.506014 2.629122 1.506014 2.629122
Coefficients
Intercept
1. Phương trình hồi quy tuyến tính: biểu hiện mối liên hệ giữa % tăng chi phí
quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của
mô hình.
Ŷ = b0 + b1X = (2,0676 + 0,3851X)
(b0 = 2,0678; b1 = 0,3851)
có ý nghĩa: Mỗi khi quảng cáo tăng thêm 1% thì mô hình dự doán cho thấy
rằng doanh thu sẽ tăng thêm 0,3851%.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu
thực sự có mối liên hệ tương quan tuyến tính không.
Giả thiết rằng:
H0 : b1 = 0 (% tăng chi phí quảng cáo không ảnh hưởng đến % tăng doanh
thu)
H1 : b1 ≠ 0 (% tăng chi phí quảng cáo ảnh hưởng đến % tăng doanh thu)
Tiêu chuẩn kiểm định: t =
Sai số chuẩn của hệ số:
Sb1 =
(b1 − β1 )
sb1
S yx
n
∑(X
i =1
suy ra
t=
i
= 0, 0486
− X)
2
(0, 3581 − 0)
= 7,930
0, 0486
Với độ tin cậy là 95% => α = 0,05 => α/2 = 0,0025 => tα/2 ;n-2 = t0,025; 3 = 3,182
t tướng ứng với α = 0,0042 < 0,025 thuộc miền bác bỏ nên bác bỏ H 0, chấp
nhận H1
Kết luận: Có mối liên hệ tương quan tuyến tính giữa % tăng chi phí quảng
cáo và đến % tăng doanh thu.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Để đánh giá cường độ của mối liên hệ, sử dụng hệ số tương quan R
R=
∑ ( x − x )( y − y )
∑ ( x − x) ∑ ( y − y)
i
i
2
i
2
= b1
i
σx
σy
Trong đó:
σx
2
σy
∑( x
=
2
i
− x )2
=
n
∑( y
=
i
− y) 2
n
14,8
= 2,96 ⇒ σ x = 2,96 = 1,7205
5
=
2,3
= 0,46 ⇒ σ y = 0,46 = 0,6782
5
Thay số ta có
1,7205
R = 0,3851
0,6782
= 0,9769
Kết luận: R = 0,9769 nằm trong khoảng giá trị từ -1 đến 1 và rất gần 1 cho
thấy mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là rất chặt
chẽ và đây là mối quan hệ thuận.
4. Ước tính tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5%
với độ tin cậy 90%.
Dự đoán tỷ lệ % tăng doanh thu nếu tỷ lệ % chi phí quảng cáo lên 5% ta sử
dụng công thức:
Ŷ1 ± tα/2 ;n-2
( X − X )2
1
+ n i
. Syx . n
∑ ( X i − X )2
i =1
tα/2 ;n-2 = t0,025; 3 = 3,182
Syx = 0,1868 ; n = 5 ; X = 3, 2
Ŷ1 = (2,0676+0,3851*5) = 3,993
( X i − X )2
1
+
Sai số dự đoán: tα/2 ;n-2 . Syx . n n
= 0,285
∑ ( X i − X )2
i =1
Ta có khoảng μyx : (3,993 – 0,285) ≤ Ŷ1 ≤ (3,993 + 0,285)
3,709% ≤ Ŷ1 ≤ 4,278%
Vậy khi chi phí tăng 5% thì dự doán doanh thu nằm trong khoảng:
3,709% ≤ Ŷ1 ≤ 4,278% với độ tin cậy 90%.
TÀI LIỆU THAM KHẢO
Giáo trình Thống kê và khoa học ra quyết định của ĐH Griggs.