BÀI TẬP CÁ NHÂN
Học viên: Hoàng Hà
Lớp: Gamba: 01.V03
Câu 1: Lý thuyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
Câu hỏi: 1
Nghiên cứu mối liên hệ tương quan là là phương pháp biểu hiện xu hướng biến động qua thời gian?
Trả lời
Sai
Giải thích Phương pháp biểu hiện xu hướng biến động của hiện tượng qua thời gian dựa vào Dãy số
thời gian. Khác với nghiên cứu mối liên hệ tương quan là phương pháp Hồi quy tương quan,
nghiên cứu mối liên hệ phụ thuộc giữa các hiện tượng.
Câu hỏi: 2
Tần suất biểu hiện bằng số tuyệt đối?
Trả lời
Sai
Giải thích Tần suất là số tương đối vì Tần suất biểu hiện dưới dạng phần trăm của tần số (số tuyệt đối).
Câu hỏi: 3
Phương sai cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện tượng khác loại?
Trả lời
Sai
Giải thích Phương sai chỉ cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của 2 hiện tượng
cùng loại.
Câu hỏi: 4
Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ thuận với phương sai của tổng thể?
Trả lời
Đúng
Giải thích Khi ước lượng khoảng tin cậy sử dụng phương sai tổng thể, ước lượng cho trung bình tổng
thể µ , khoảng tin cậy được xác định như sau:
x − Zα
2
σ
σ
≤ µ ≤ x + Zα
n
n
2
Khi phương sai càng lớn, khoảng tin cậy càng lớn, tức là mối quan hệ giửa khoảng tin cậy
cho tham số của tổng thể chung tỉ lệ thuận với phương sai của tổng thể.
Câu hỏi: 5
Kiểm định không phải là một phương pháp thống kê suy luận?
Trả lời
Sai
Giải thích Trên cơ sở các tham số của mẫu điều tra đem suy rộng cho toàn bộ tổng thể. Ta có thể nói
kiểm định là một phương pháp thống kê suy luận.
B.Chọn phương án trả lời đúng nhất:
Câu hỏi 1:
Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả .
Câu hỏi 2:
Ưu điểm của Mốt không phải là:
a) San bằng mọi chênh lệch giữa các lượng biến.
b) Không chịu ảnh hưởng của các lượng biến đột xuất.
c) Kém nhậy bén với sự biến động của tiêu thức.
d) Cả a), c)
e) Cả a), b), c)
Câu hỏi 3:
Đại lượng nào không phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan.
Câu hỏi 4:
Câu hỏi 5:
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
e) Cả a), c).
f) Cả a), b), c).
Phân tích dãy số thời gian có tác dụng:
a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
b) Biểu hiện xu hướng và tính quy luật của sự biến động
c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
d) Cả a), b).
e) Cả b), c).
f) Cả a), b), c).
Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu.
b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
Câu 2: Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét. Để đánh giá tính hiệu quả của nó xét về mặt thời gian
người ta phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao
hàng như sau:
9
6
8
9
7
6
5
5
7
6
6
7
3
10
6
6
7
4
9
7
5
4
5
7
4
6
8
5
4
3
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo phương pháp mới với độ tin cậy 95%.
Hãy kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ. Biết rằng phương pháp bán hàng cũ có số ngày trung
bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày
Bài giải:
1). Các tham số của mẫu:
Sử dụng công cụ Data Analysis của Excel ta có bảng Descriptive như sau:
Column1
Mean
6.13333333
Standard Error
0.33125791
Median
6
Mode
6
Standard Deviation
1.81437428
Sample Variance
3.29195402
Kurtosis
-0.4497976
Skewness
0.23345977
Range
7
Minimum
3
Maximum
Sum
10
184
Count
30
x = 6.13333333
2). Ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng với độ tin cậy 95% (Ước lượng
µ)
Với phương sai mẫu s2 = 3.29195402, độ lệch chuẩn s = 1.81437428, mẫu đủ lớn (n≥30), ta sử dụng khoảng tin cậy:
x − Zα
2
Thay
x = 6.13333333,
s
s
≤ µ ≤ x + Zα
n
n
2
Z α = 1,96 (α = 0,05 nên α/2 = 0,025), s = 1.81437428, n = 30 ta có:
2
6.13333333 − 1,96
1.81437428
1.81437428
≤ µ ≤ 6.13333333 + 1,96
30
30
5.484067832 ≤ µ ≤ 6.782598828
Vậy, số ngày trung bình từ khi đặt hàng đến khi giao hàng với độ tin cậy 95% nằm trong khoảng từ 5.484067832 đến
6.782598828 ngày.
3). Kết luận về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ:
Theo phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày, ta cần kiểm định cặp giả
thiết:
H0: µ = 7,5 (Phương pháp mới có hiệu quả như phương pháp cũ)
H1: µ < 7,5 ((Phương pháp mới có hiệu quả hơn phương pháp cũ)
Vì đây là bài toán kiểm định giả thiết về giá trị trung bình của tổng thể chung khi chưa biết phương sai của tổng thể chung,
nhưng mẫu lớn, kiểm định trái, và tiêu chuẩn kiểm định là:
x−µ )
(
z=
0
n
s
Thay vào:
z=
( 6.13333333 − 7,5 )
30
1.81437428
= -4.125687693
Với tiêu chuẩn kiểm định Z0,5-α = Z 4,5 = 1,64
Như vậy Z < - Z0,5-α nên bác bỏ H0, chấp nhận H1,
Kết luận: Kết quả cho thấy phương pháp mới hiệu quả hơn phương pháp cũ.
Câu 3: Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm. Để đánh giá xem chi phí trung bình theo
hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25
32
35
38
35
26
30
28
24
28
26
30
Phương án 2: 20
27
25
29
23
26
28
30
32
34
38
25
30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95% hãy rút ra kết luận về hai phư ơng án
trên.
Bài giải:
Cần kiểm định cặp giả thiết:
H0: µ1 = µ2 (Chi phí trung bình 2 phương án như nhau)
H1: µ1 ≠ µ2 (Chi phí trung bình 2 phương án khác nhau)
Tiêu chuẩn kiểm định là (do 2 mẫu nhỏ, chưa biết phương sai của 2 tổng thể):
t=
x1 − x2
1 1
s
+
n1 n2
Trong đó s2 là giá trị chung của 2 phương sai mẫu
s2 =
(n1 − 1) s12 + (n2 − 1) s22
n1 + n2 − 2
Phương sai mẫu được tính như sau:
- Mẫu 1 (PA1): Sử dụng công cụ Data Analysis của Excel ta có bảng Descriptive:
Column1
Mean
29.75
Standard Error
1.28585
Median
29
Mode
35
Standard Deviation
4.454314
Sample Variance
19.84091
Kurtosis
-0.75343
Skewness
0.554079
Range
14
Minimum
24
Maximum
38
Sum
357
Count
12
- Mẫu 2 (PA 2):
Column1
Mean
28.21429
Standard Error
1.223302
Median
28
Mode
25
Standard Deviation
4.577177
Sample Variance
20.95055
Kurtosis
0.633578
Skewness
0.394722
Range
18
Minimum
20
Maximum
38
Sum
395
Count
14
Ta có:
s2 =
(12 − 1) *19.84091 + (14 − 1)* 20.95055
= 20.44196429
12 + 14 − 2
t=
n +n2 −2
1
Tra bảng tìm tα
2
n1 + n2 − 2
׀t2,064 tα
2
29.75 − 28.21429
= 0.863410008
1 1
4.521279054
+
12 14
24
= t0.025
=2,064
24
= t0.025
= > ׀chưa đủ cơ sở bác bỏ H0
Kết luận: Chấp nhận phương án H0, hay chi phí trung bình 2 phương án là như nhau.
Câu 4: Có tài liệu về doanh thu của một doanh nghiệp trong 9 năm như sau:
Năm
2001
Doanh thu (tỷ đồng)
26
2002
28
2003
32
2004
35
2005
40
2006
42
2007
48
2008
51
2009
56
1. Xác định hàm xu thế tuyến tính biểu diễn xu hướng biên động của doanh thu qua thời gian:
Ta có mô hình hồi quy:
yˆ t = a + bt
Bảng tính:
Năm
Doanh thu (tỷ
đồng) - y
T
2001
26
1
2002
28
2
2003
32
3
2004
35
4
2005
40
5
2006
42
6
2007
48
7
2008
51
8
2009
56
9
Sử dụng công cụ Data Analysis/Regression của Excel ta có bảng như sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.995896
R Square
Adjusted R
Square
Standard
Error
0.991809
Observations
0.990639
1.01105
9
ANOVA
df
SS
MS
Significance
F
F
Regression
1
866.4
866.4
Residual
7
7.155556
1.022222
Total
8
873.5556
Coefficients
Standard
Error
t Stat
P-value
20.77778
0.734511
28.28791
1.77E-08
19.04094
3.8
0.130526
29.11297
1.45E-08
3.491355
Intercept
X Variable 1
Ta có phương trình hồi quy:
847.5652
1.45E-08
Upper
95%
Lower 95%
Lower
95.0%
Upper
95.0%
22.51462
19.04094
22.51462
4.108645
3.491355
4.108645
yˆ t = 20.77778 + 3.8* t
2. Xác định sai số của mô hình và dự đoán doanh thu năm 2010 dựa vào mô hình trên với xác suất tin cậy 95%.
n
Sai số của mô hình:
Syt =
∑ ( y − yˆ )
SSE
=
n−2
i =1
i
2
i
n−2
Ta có bảng sau:
ˆt t
yˆyˆty
2001
Doanh thu
(tỷ đồng)
-y
26
2002
28
2003
32
2004
35
2005
40
2006
42
2007
48
2008
51
2009
56
Năm
Tổng
358
t
1
24.5778
1.4222
2.0227
2
28.3778
-0.378
0.1427
3
32.1778
-0.178
0.0316
4
35.9778
-0.978
0.9561
5
39.7778
0.2222
0.0494
6
43.5778
-1.578
2.4895
7
47.3778
0.6222
0.3871
8
51.1778
-0.178
0.0316
9
54.9778
1.0222
1.0449
45
7.1556
n
Syt =
SSE
=
n−2
∑ ( y − yˆ )
i =1
i
n−2
i
2
=
7.1556
= 1.01105006
9-2
Dự đoán doanh thu năm 2010 (t = 10):
Thay t = 10 vào phương trình hồi quy ta có:
yˆ t = 20.77778 + 3.8* 10=58.77778
Tìm khoảng tin cậy:
(y- -- )2
y-
yˆ i ± tαn − 2 .S yt
2
1
(Ti − T ) 2
+
n n
∑ (Ti − T )2
i =1
tαn − 2 = 2,365
2
Syt = 1,0111
n=9
Ta có Sai số dự kiến = 2,9555
Cận trên = 58,7778 + 2,9555 = 61,7333;
Cận dưới = 58,7778 - 2,9555 =55,8223
Kết luận: Với số liệu đã cho, mức ý nghĩa 5%, dự đoán doanh thu năm 2010 của công ty nằm trong khoảng từ:
55,8223 đến 61,7333 tỷ đồng.
Câu 5: Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một nhà máy (đơn vị: triệu tấn)
6,2
7,3
3,0
5,2
6,4
1.
3,3
5,3
7,2
4,5
4,7
5,3
6,1
3,7
7,8
6,1
4,5
4,8
7,0
6,0
7,5
7,9
5,1
3,8
6,5
5,7
7,3
4,9
6,6
4,7
6,4
Biểu diễn dữ liệu trên bằng sơ đồ thân lá và rút ra nhận xét từ kết quả đó
Sắp xếp dữ liệu theo thứ tự từ bé đến lớn như sau:
3,0; 3,3; 3,7; 3,8; 4,5; 4,5; 4,7; 4,7; 4,8; 4,9; 5,1; 5,2; 5,3; 5,3; 5,7; 6,0; 6,1; 6,1; 6,2; 6,4; 6,4; 6,5; 6,6; 7,0; 7,2; 7,3;
7,3; 7,5; 7,8; 7,9.
- Biểu diễn bằng biểu đồ thân lá:
Thân
3
4
5
6
7
Lá
0,3
0,5
0,1
0,0
0,0
0,3
0,5
0,2
0,1
0,2
0,7
0,7
0,3
0,1
0,3
0,8
0,7
0,3
0,2
0,3
0,8
0,7
0,4
0,5
0,9
0,4
0,8
0,5
0,9
0,6
Kết luận: Qua biểu đồ thân lá cho thấy mức sản lượng phổ biến nhất của nhà máy là từ 6 tr tấn đến 7tr tấn, số tháng có sản
lượng 6-7tr tấn chiếm 50% (15 tháng) trong số 30 tháng. Có nghĩa nhà máy đang vận hành công tác sản xuất có hiệu quả.
2.
Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau, vẽ đồ thị hình cột (histogram) và nhận xét thêm.
a. Xây dựng bảng tần số phân bổ với 5 tổ có khoảng cách tổ bằng nhau:
Khoảng cách tổ = (7,9-3,0)/5 = 0,98 ≈ 1
Ta xây dựng bảng tần số phân bổ với 5 tổ với khoảng cách tổ là 1:
Khối lượng thép
Trị số giữa
Tần số
Tần suất di
Tần số tích lũy
(triệu tấn)
(xi)
(fi)
(%)
(Si)
3-4
3,5
4
13,33
4
4-5
4,5
6
20,00
10
5-6
5,5
5
16,67
15
6-7
6,5
8
26,67
23
7 -8
7,5
7
23,33
30
30
100,00
Tổng
b. Vẽ đồ thị dạng cột (histogram):
Đồ thị Tần số
9
8
8
7
7
6
6
Tần số
5
5
4
4
3
2
1
0
0
0
3
3,5
4,5
5,5
6,5
7,5
8
Trị số giửa
c. Nhận xét:
Có 4 tháng khối lượng sản phẩm thép đạt trung bình 3.45 triệu tấn, 6 tháng đạt trung bình 4.68 triệu tấn, 5 tháng đạt trung
bình 5.32 triệu tấn, 8 tháng đạt trung bình 6.29 triệu tấn, 7 tháng đạt trung bình 7.43 triệu tấn.
Khoảng chênh lệch khối lượng sản xuất của nhà máy bán ra giữa những tháng sản xuất nhiều nhất (8 triệu tấn) và thấp nhất là
(4 triệu tấn) là rất lớn, việc lập kế hoạch sản xuất sai có thể ảnh hưởng rất lớn đến nhà máy. Vì vậy, nhà máy cần phải sử dụng nhiều
phương pháp thống kê hơn nữa để đưa ra quyết định mức sản lượng hợp lý.