BÀI TẬP CÁ NHÂN
MÔN THỐNG KÊ VÀ KHOA HỌC QUYẾT ĐỊNH
Họ và tên : Trần Hoài Nam
Lớp : GaMBA01.N06
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tham số tự do (b0) phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả.(S)
vì tham số bo thể hiện giá trị ước lượng của tiêu thức kết quả khi giá trị của tiêu thức nguyên nhân bằng
không, nghĩa là giá trị của tiêu thức kết quả không phụ thuộc vào tiêu thức nguyên nhân.
2) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai của tổng thể
chung đó.(S) vì khoảng tin cậy càng lớn thì mức độ dao động giữa các quan sát càng lớn.Do đó phương
sai càng lớn. Tỷ lệ thuận.
3) Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai
hiện tượng cùng loại và có số trung bình không bằng nhau.(Đ). Vì phương sai cho biết độ biến thiên
xung quanh số trung bình của các lượng biến.
4) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối ( Đ) vì tần số thể hiện qui mô , khối
lượng của hiện tượng kinh tế - xã hội trong điều kiện và thời gian cụ thể.
5) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu (S) vì tiêu thức thống kê là đặc điểm
của từng đơn vị tổng thể được chọn ra để nghiên cứu tuỳ theo mục đích nghiên cứu khác nhau.
B. Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để phân tích kết cấu của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
f) Cả a), b), c).
2) Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ι
e) Cả a), c).
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Tiêu thức nghiên cứu.
d) Cả a), b).
e) Cả a), b), c).
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ϕ e) Cả a), c)
κ
f) Cả a), d)
5) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được bao
nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng
1,5 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về năng suất trong
một giờ là 8 sản phẩm. Hãy tính số công nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn
thành trong 1 giờ là 45 với độ lệch tiêu chuẩn là 7,5. Hãy ước lượng năng suất trung bình một giờ của
toàn bộ công nhân với độ tin cậy 95%.
Bài làm
a) Đã biết δ: độ lệch tiêu chuẩn = 8 sp/h; α = 5%; sai số ∂ = 1.5. Tính số công nhân cần được điều tra
để đặt định mức?
Gọi số công nhân cần được điều tra để đặt định mức là n
Với α = 5% → 1- α = 0.95 → Zα/2 = 1.96( theo bảng phân phối chuẩn A1- Slide )
Ta xác định cỡ mẫu ( Bài toán ước lượng trung bình của tổng thể khi đã biết độ lệch tiêu chuẩn của tổng
thể và tổng thể phân phối chuẩn) theo công thức sau : n = Z2.δ2/∂2
Thay Zα/2 = 1.96; δ = 8 ; ∂ = 1.5 vào ta có kết quả như sau: n = 1,962.82/1.52 ≈ 110 (người)
b) Với n = 110; X( số sản phẩm trung bình mà những người công nhân hoàn thành trong 1 giờ) = 45; δ =
7.5; độ tin cậy = 95%.
Gọi µ là năng suất trung bình một giờ của toàn bộ công nhân.
Đây là bài toán ước lượng khoảng tin cậy trung bình của tổng thể khi đã biết độ lệch chuẩn của tổng thể
và tổng thể phân phối chuẩn.
Công thức ước lượng : X – Zα/2.δ/√n ≤ µ ≤ X + Zα/2.δ/√n
Thay số vào ta có 45 – 1,96.7,5/√110 ≤ µ ≤ 45 + 1,96.7,5/√110
↔ 43,6 ≤ µ ≤ 46,4
Kết luận : với độ tin cậy 95%, năng suất trung bình một giờ của toàn bộ công nhân nằm trong khoảng
từ 44 đến 46 sản phẩm.
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm. Để đánh
giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất
thử và thu được kết quả sau: (ngàn đồng)
P/A 1
25
32
35
38
35
26
30
28
24
28
26
34
28
27
26
P/A 2
20
27
25
29
23
26
28
30
32
34
38
25
30
24
27
28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95% hãy rút ra kết
luận về hai phương án trên.
Bài làm
Sau khi sắp xếp dữ liệu và đưa vào bảng Excel với độ tin cậy 95% ( α = 0.05 ) chạy hàm t – Test :
two sample Assuming Equal Variance , ta có bảng dữ liệu sau :
t-Test: Two-Sample Assuming Equal Variances
P/A1
29.46667
18.55238
15
18.9477
Mean
Variance
Observations
Pooled Variance
Hypothesized Mean
Difference
Df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail
P/A2
27.875
19.31666667
16
0
29
1.017416
0.158684
1.699127
0.317369
2.04523
Kết luận : Giá trị trung bình của phương án 1 là 29,5 và của phương án 2 là 27,9. Do vậy phương
án 2 có mức phí sản xuất trung bình thấp hơn phương án 1.
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 50 tháng gần đây của một nhà máy
(đơn vị: triệu tấn):
6,1
4,9
5,7
4,5
6,4
4,7
5,3
7,0
4,7
3,0
6,2
7,3
3,7
7,8
5,1
7,5
4,8
7,2
6,4
4,5
6,6
5,3
3,8
6,5
7,9
6,0
7,3
12,3
5,2
6,1
5,5
7,5
5,4
7,2
6,4
5,3
7,0
4,7
3,0
6,2
6,2
7,5
11,5
5,2
6,1
5,7
4,5
6,4
6,1
6,1
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
3. Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ bảng phân
bố tần số. So sánh kết quả và giải thích.
Bài làm
1. Biều đồ thân lá (Stem and leaf) :
Thân Lá
3
0 7 8 0
4
9 5 7 7 8 5
5
7 3 1 3 2 5
6
1 4 2 4 6 5
7
0 3 8 5 2 9
8
9
10
11
5
12
3
7
4
0
3
5
3 2 7
1 4 2 2 1 4 1 1
5 2 0 5
2.Xây dựng bảng phân bố tần số phù hợp với bộ dữ liệu trên :
STT
1
2
3
4
5
6
7
8
9
10
Khối lượng than
Xi
fi
f
Xi.fi
khai thác
Từ 3 đến dưới 4
3.5
4
4
14.00
Từ 4 đến dưới 5
4.5
8
12
36.00
Từ 5 đến dưới 6
5.5
10
22
55.00
Từ 6 đến dưới 7
6.5
15
37
97.50
Từ 7 đến dưới 8
7.5
11
48
82.50
Từ 8 đến dưới 9
8.5
0
48
Từ 9 đến dưới 10
9.5
0
48
Từ 10 đến dưới 11
10.5
0
48
Từ 11 đến dưới 12
11.5
1
49
11.50
Từ 12 đến dưới 13
12.5
1
50
12.50
Tổng cộng
50
366
309.00
Trong đó : - Khối lượng than khai thác ( đơn vị triệu tấn )
- Xi : Trị số giữa
- fi : tần suất ( số tháng)
- fi.Xi : số than khai thác
- f : tần số tích luỹ
3.Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
- Theo biểu đồ thân lá trên ta thấy dữ liệu khai thác trong 50 tháng biến động ở mức sản lượng từ
3 đến trên 7 triệu tấn, chủ yếu tập trung ở mức từ 4,5,6,7 triệu tấn.
- Trong bộ dự liệu trên có 02 dự liệu đột xuất là 11,5 và 12,3 triệu tấn.
-
4.Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ
bảng phân bố tần số. So sánh kết quả và giải thích.
Theo bảng số liệu ở trên ta thấy lượng than trung bình khai thác được trong 1 tháng từ tài
liệu điều tra : 303.3/50 =6.07 triệu tấn/ tháng.
Số liệu than trung bình khai thác được trong 1 tháng tính theo bảng tần số 309/50 = 6.18
triệu tấn/ tháng
Kết quả tính số liệu than trung bình khai thác được trong 1 tháng tính theo 2 phương pháp
có khác nhau. Nguyên nhân là do số trung bình thật của từng tổ khác với trị số giữa.
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá mức độ
ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí quảng cáo trên 5 vùng khác
nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các
vùng như sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2
2
3
6
4,5
4
3,5
3,5
3
5,5
5
3
2,5
2,5
2
7
6
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa %
tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số của mô
hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối liên hệ
tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 7% với độ
tin cậy 90%.
Bài làm
1- Gọi X là % tăng chi phí quảng cáo. X là biến độc lập.
Y là % tăng chi phí doanh thu. Y là biến phụ thuộc biến X.
Giữa X và Y được biểu hiện qua mô hình hồi qui tuyến tính , theo công thức sau :
Y^ = b0 + b1 Xi.
Trong đó : b0 : tham số tự do.
b1 : độ dốc của đường % tăng chi phí quảng cáo
Sử dụng bảng excel với độ tin cậy 95% ( confidence level =95% ) và tính ta có :
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.93907
R Square
0.88185
Adjusted R
Square
0.86497
Standard Error
0.51149
Observations
9
ANOVA
Df
SS
Regression
1
13.66865079
Residual
Total
7
8
1.831349206
15.5
Coefficient
s
Standard Error
Intercept
% Tăng chi phí
quảng cáo
MS
13.6686507
9
0.26162131
5
t Stat
F
Significance
F
52.24594
0.000173176
P-value
Lower 95%
Upper
95%
Lower
95.0%
Upper
95.0%
0.9749
0.3887
2.5078
0.0405
0.0557
1.8941
0.0557
1.8941
0.6587
0.0911
7.2281
0.0002
0.4432
0.8742
0.4432
0.8742
Mô hình hồi quy biểu diễn mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu như
sau : Theo bảng tính thì b0 = 0.9749; b1 = 0.6587.
Thay vào công thức hồi qui tuyến tính ở trên ta có Y^ = 0.9749 + 0.6587 Xi.
Ý nghĩa của các tham số.
Theo phương trình trên ta có tham số:
b1 = 0.6587, với độ tin cậy 95%, khi chi phí tăng thêm 1% thì doanh thu tăng tương ứng khoảng
0.6587 %
b0 = 0.9749, là ảnh hưởng của các nhân tố khác tác động lên doanh thu ngoài nhân tố chi phí
quảng cáo.
Trường hợp Xi =0, do tác động của các nhân tố khác, doanh thu tăng thêm khoảng 0.9749%.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không ?
Kiểm định hệ số hồi qui. Ta dùng kiểm định t
Cặp giả thiết không và cặp giả thiết đối là :
Ho: β1 = 0 ( không có mối quan hệ tuyến tính )
H1: β1 # 0 ( có mối quan hệ tuyến tính.
Tiêu chuẩn kiểm định :
Công thức kiểm định : t = b1/Sb1 . Thay số liệu từ bảng tính Exel ở trên với b 1 = 0.6587; Sb1 =
0.0911 thì ta có số liệu sau : t = b1/Sb1 = 0.6587/ 0,0911 = 7,2308 .
Với mức α ( P value) = 0.0002 < 0.05, như vậy t thuộc miền bác bỏ, bác bỏ Ho, nhận H1.
Kết luận : Có mối quan hệ tuyến tính giữa % tăng chi phí quảng cáo và % tăng doanh thu.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Đánh giá cường độ của mối liên hệ : Cường độ của mối liên hệ của mô hình được thể hiện
qua hệ số tương quan R và được tính bằg c/t : R = √R 2 .
Theo bảng tính ở trên, ta có :
R = 0.93907 > 0
Kết luận : Mối quan hệ giữa giữa % tăng chi phí quảng cáo và % tăng doanh thu rất chặt chẽ
và đây là mối liên hệ thuận.
Đánh giá sự phù hợp của mô hình : được thể hiện qua hệ số xác định R2.
Theo bảng tính ở trên , ta có: R2 = 0.88185.
Kết luận : 88% sự thay đổi của % tăng doanh thu được giải thích bởi mô hình trên trong mối
quan hệ với % tăng chi phí quảng cáo.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 7%
với độ tin cậy 90%.
Theo đầu bài, ta phải ước lượng khoảng tin cậy cho từng giá trị riêng biệt của Y ( % tăng
doanh thu ) với mỗi giá trị cá biệt Xi ( % tăng chi phí quảng cáo ).
Sử dụng công thức
µyx =
1
Yˆi ± tα / 2;n −2 ⋅ S yx ⋅ 1 + +
n
(X −X )
∑( X − X )
2
i
n
i =1
Theo đầu bài ta có các số liệu sau :
- ( 1-α) =90% → α = 10% = 0.1 ; α/2 = 0.05,
- n = 9 → n-2=7, tra bảng ta có t α/2; (n-2) = 1.894
i
2
+ Dự đoán điểm khi X (tỷ lệ % tăng chi phí quảng cáo) = 7
Thay vào công thức , ta có Y^i = 0.9749 + 0.6587x7 = 5.5858 ( %).
Sai số chuẩn của mô hình Syx = 0.51149 ( Standard Error).( Xem bảng số liệu )
Ta lập bảng số liệu để tính X của công thức trên ( X là trung bình về % tăng chi phí quảng cáo
của 5 vùng.)
STT
1
2
3
4
5
6
7
8
9
%
%
Tăng
Tăng
chi phí
doanh
quảng
thu
cáo
1
2
2
3
6
4.5
4
3.5
3.5
3
5.5
5
3
2.5
2.5
2
7
6
3.833
∑( Xi -X )^2
8.028
3.361
4.694
0.028
0.111
2.778
0.694
1.778
10.028
31.500
+ Tính sai số dự đoán. Thay các số liệu vào công thức trên ta có :
1.894 x0.51149 x √ (( 1 +1/9 + (7- 3.833)2 / 31.5 ) ) = 1.1583.
Cận dưới = 5.5858 - 1.1583 = 4.4275
Cận trên = 5.5858 + 1.1583 = 5.7441
Kết luận : Với độ tin cậy 90%, khi tỷ lệ % tăng chi phí quảng cáo là 7%, tỷ lệ % tăng doanh thu
sẽ nằm trong khoảng từ 4.426 đến 5.744%.