Họ và Tên : Hoàng Duy Lưu
Đề kiểm tra hết môn Thống kê – V0111
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
Sai.
Tiêu thức thống kê không phản ánh đặc điểm của tổng thể nghiên cứu mà
phản ánh đặc điểm của từng cá thể. Chỉ tiêu thống kê mới phản ánh đặc điểm của
tổng thể.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Đúng.
Tần số biểu hiện bằng số tuyệt đối, thể hiện số lần xuất hiện của lượng biến
tiêu thức trong dãy số.
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức
nghiên cứu của hai hiện tượng khác loại.
Sai.
Độ lệch chuẩn chỉ cho phép so sánh độ biến thiên của hai hiện tượng cùng
loại.
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với
phương sai của tổng thể chung đó.
Sai.
Đây là mối quan hệ tỉ lệ thuận, vì theo công thức tính khoảng tin cậy:
δ
µ = X ± Zα/2* n thì phương sai càng lớn khoảng tin cậy càng rộng và ngược lại,
do đó khoảng tin cậy tỷ lệ thuận với phương sai.
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức
nguyên nhân đến tiêu thức kết quả.
Đúng.
Vì hệ số hồi quy (b1) phản ánh sự thay đổi của tiêu thức kết quả khi tiêu thức
nguyên nhân thay đổi một đơn vị.
B. Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để phân tích kết cấu của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
f) Cả a), b), c).
2) Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến
tiêu thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ι
e) Cả a), c).
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Tiêu thức nghiên cứu.
d) Cả a), b).
e) Cả a), b), c).
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ϕ
κ
e) Cả a), c)
f) Cả a), d)
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 (1,5 đ)
Trọng lượng tịnh được ghi trên bao bì sản phẩm một loại snack của công ty A
là 454g. Tuy nhiên, nhiều người tiêu dùng phàn nàn rằng, có vẻ như trọng lượng tịnh
của loại snack đó thấp hơn mức công bố. Để kểm tra, phòng quản lý chất lượng sản
phẩm của công ty đã chọn ra một cách ngẫu nhiên 50 gói snack và kiểm tra trọng
lượng tịnh của chúng. Kết quả thu được như sau:
464
442
448
463
468
1. Ước
450
438
450
449
447
lượng
450 456 452 433
452 447 460 450
439 452 459 459
447 466 446 446
433 464 469 469
trọng lượng tịnh trung bình
446 446 450 447
453 456 446 433
456 454 452 449
450 449 457 464
454 451 453 443
của một gói snack với độ tin cậy
95%.
Sử dụng công cụ Data Analysis của Excel ta có bảng Descriptive như sau:
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Đây là trường hợp chưa biết phương sai
451.2857
1.24335
450
450
8.703448
75.75
0.157966
0.058453
36
433
469
22113
49
tổng thể chung, ta phải dựa trên
phương sai mẫu, với phương sai mẫu s 2 = 75.75, độ lệch chuẩn s = 8.703448. Ở đây
mẫu đủ lớn (n≥30) nên ta sử dụng khoảng tin cậy sau:
x − Zα
2
s
s
≤ µ ≤ x + Zα
n
n
2
Thay x = 451.2857, Z α = 1,96 (α = 0,05 nên α/2 = 0,025), s = 8.703448, n =
2
50 ta có:
451.2857 − 1,96
8.703448
8.703448
≤ µ ≤ 451.2857 + 1,96
50
50
448.8732 ≤ µ ≤ 453.698
Như vậy trọng lượng trung bình của một gói snack với độ tin cậy 95% nằm
trong khoảng từ 448.8732 đến 453.698 (g).
2. Với kết quả ước lượng ở trên có thể kết luận gì về lời phàn nàn của người
tiêu dùng không? Tại sao?
Để trả lời câu hỏi này ta cần kiểm định cặp giả thiết:
H0: µ = 454
H1: µ < 454
Đây là bài toán kiểm định giả thiết về giá trị trung bình của tổng thể chung
khi chưa biết phương sai của tổng thể chung, nhưng mẫu lớn, kiểm định trái, và tiêu
chuẩn kiểm định là:
z=
( x−µ )
0
n
s
Thay vào ta có:
z=
( 451.2857 − 454 )
8.703448
50
= -2.20521
Với tiêu chuẩn kiểm định Z0,5-α = Z 4,5 = 1,64
Như vậy Z < - Z0,5-α nên ta bác bỏ H0, chấp nhận H1, tức là trọng lượng của
snack thấp hơn 454g.
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay
không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
P/A 1 25 32 35 38 35 26 30 28 24 28 26 34 28 27 26
P/A 2 20 27 25 29 23 26 28 30 32 34 38 25 30 24 27 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy
95% hãy rút ra kết luận về hai phương án trên.
Giải:
Ta cần kiểm định cặp giả thiết:
H0: µ1 = µ2 (Chi phí trung bình 2 phương án là như nhau)
H0: µ1 ≠ µ2 (Chi phí trung bình 2 phương án là khác nhau)
Đây là trường hợp 2 mẫu nhỏ, chưa biết phương sai của 2 tổng thể. Do vậy
tiêu chuẩn kiểm định sẽ là:
t=
x1 − x2
1 1
s
+
n1 n2
Trong đó s2 là giá trị chung của 2 phương sai mẫu
s2 =
(n1 − 1) s12 + (n2 − 1) s22
n1 + n2 − 2
Ta tính 2 phương sai mẫu như sau:
- Mẫu 1 (Phương án 1): Sử dụng công cụ Data Analysis của Excel ta có bảng
Descriptive như sau:
Row1
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
- Mẫu 2 (Phương án 2):
Row1
29.46667
1.112127
28
26
4.307247
18.55238
-0.7629
0.688809
14
24
38
442
15
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
27.875
1.098768
27.5
27
4.395073
19.31667
0.839921
0.574975
18
20
38
446
16
Như vậy
s2 =
t=
(15 − 1)*18.55238 + (16 − 1)*19.316667
= 20.25353
15 + 16 − 2
29.46667 − 27,875
= 0.984159
1 1
4.5
+
15 16
n +n −2
29
= t0.025
= 2,045
Tra bảng tìm tα
1
2
2
n1 + n2 − 2
׀t2,045 tα
2
29
= t0.025
= > ׀nên chưa đủ cơ sở bác bỏ H , tức là chi phí trung
0
bình 2 phương án là như nhau.
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 50 tháng gần đây
của một nhà máy (đơn vị: triệu tấn):
6,1
4,7
6,2
7,5
6,6
6,0
5,5
5,3
6,2
5,7
4,9
5,3
7,3
4,8
5,3
7,3
7,5
7,0
7,5
4,5
5,7
7,0
3,7
7,2
3,8 12,3
5,4
4,7
11,5
6,4
4,5
4,7
7,8
6,4
6,5
5,2
7,2
3,0
5,2
6,1
6,4 3,0
5,1 4,5
7,9
6,1
6,4
6,2
6,1
6,1
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Sắp xếp lại dữ liệu:
3
3
3.7
3.8
4.8
4.9
5.1
5.2
5.7
5.7
6
6.1
6.2
6.4
6.4
6.4
7.2
7.3
7.3
7.5
4.5
4.5
4.5
4.7
4.7
4.7
Biểu đồ thân lá:
Thân
3
4
5
6
7
11
12
5.2
5.3
5.3
5.3
5.4
5.5
6.1
6.1
6.1
6.1
6.2
6.2
6.4
6.5
6.6
7
7
7.2
7.5
7.5
7.8
7.9
11.5
12.3
Lá
0
0.5
0.1
0
0
0.5
0.3
0
0.5
0.2
0.1
0
0.7
0.5
0.2
0.1
0.2
0.8
0.7
0.3
0.1
0.2
0.7
0.3
0.1
0.3
0.7
0.3
0.1
0.3
0.8
0.4
0.2
0.5
0.9
0.5 0.7 0.7
0.2 0.2 0.4 0.4 0.4 0.4 0.5 0.6
0.5 0.5 0.8 0.9
2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Tổ
3-4
4-5
5-6
6-7
7-8
≥8
Tổng số
Tần số fi
4
8
10
15
11
2
50
3. Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Đó là 2 dữ liệu 11.5 và 12.3
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều
tra và từ bảng phân bố tần số. So sánh kết quả và giải thích.
n
Từ tài liệu điều tra:
X=
∑X
i =1
i
=6.066
n
n
Từ bảng tần số phân bố: X =
∑ X .f
∑f
i =1
i
i
i
=6.04
Kết quả tính từ tài liệu điều tra phản ánh đúng khối lượng than trung bình. Còn
kết quả từ bảng tần số phân bố không chính xác vì được tính từ trị số đại diện của
mỗi tổ, nó mang tính tượng trưng.
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để
đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng
chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và
ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
% tăng chi phí quảng
1
2
6
4
3,5
5,5
3
2,5
7
cáo
% tăng doanh thu
2
3
4,5
3,5
3
5
2,5
2
6
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện
mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích
mối liên hệ này qua các tham số của mô hình.
Sử dụng công cụ Regression ta có:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.939068
R Square
0.881848
Adjusted R
Square
Standard Error
Observations
0.86497
0.511489
9
ANOVA
Significance
df
Regression
Residual
Total
Intercept
X Variable 1
SS
1
7
8
13.66865
5
1.831349 0.261621
15.5
Coefficient
Standard
s
Error
0.974868
0.65873
MS
F
13.6686 52.2459
t Stat
4
F
0.000173
P-value Lower 95%
0.04052
Upper
Lower
Upper
95%
95.0%
95.0%
0.388732 2.507812
6
7.22813 0.00017
0.055662
1.894074
0.055662
1.894074
0.091134
0.443232
0.874228
0.443232
0.874228
5
3
Phương trình hồi quy tuyến tính có dạng:
yˆ t = 0.974868 + 0.65873* x
Hệ số b1 = 0.65 873 cho biết khi quảng cáo tăng 1% thì doanh thu tăng
0.65873%.
Còn 0.974868 là % doanh thu tăng không phụ thuộc vào quảng cáo.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực
sự có mối liên hệ tương quan tuyến tính không?
Ta phải kiểm định cặp giả thiết:
H0: β1 = 0 (không có mối liên hệ giữa % tăng doanh thu với % tăng quảng cáo)
H1: β1 ≠ 0 (có mối liên hệ giữa % tăng doanh thu với % tăng quảng cáo)
Tiêu chuẩn kiểm định: t =
b1 − β 1
Sb1
Tra bảng Regression có t = 7.228135
Tiêu chuẩn tnα = t70.025= 2.365
Như vậy t thuộc miền bác bỏ, do vậy bác bỏ cặp giả thiết Ho
Kết luận: Với mức ý nghĩa 5% thực sự có mối liên hệ giữa % tăng chi phí quảng cáo
và % tăng doanh thu.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Cường độ của mối liên hệ thể hiện qua hệ số tương quan r = 0.939068, chứng
tỏ mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là mối quan hệ
thuận và rất chặt chẽ.
Sự phù hợp của mô hình thể hiện qua hệ số xác định r 2= 0.8848. Nghĩa là
88.48% sự thay đổi của % tăng doanh thu được giải thích bởi mô hình trên.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng
cáo là 8% với độ tin cậy 90%.
Dự đoán % giá trị doanh thu:
Khi % tăng chi phí quảng cáo là 8%, thay vào mô hình hồi quy ta có Y^ = 6.244709
Tìm khoảng tin cậy cho giá trị dự đoán:
1
(X − X )
i
Y^i ±tα/2;n-2*Syx* 1 + n +
∑ Xi − X
T0.1/2;9-2=1.895
(
)
2
X = 4,1875
Syx=0.511489
(Xi- X )2 = 14.53516
n
∑ ( Xi − X )
i =1
2
=31.5 (Sử sụng hàm DEVSQ để tìm tổng bình phương các độ
lệch cho dãy X: % tăng chi phí quảng cáo)
1 14.53516
9
31.5
Thay vào ta có khoảng tin cậy Y^i ±1.895*0.511489* 1 + +
Y^i ±1.215479
5.02923 < Y^i<7.460188
Kết luận: Nếu chi phí quảng cáo tăng 8% với độ tin cậy là 90% thì % tăng
doanh thu của doanh nghiệp sẽ nằm trong khoảng 5.02923 < Y^i<7.460188 (%)