BÀI TẬP CÁ NHÂN
Môn: Thống kê và khoa học
quyết định
Họ và tên: Trương Văn Thành
Lớp Thạc sỹ Quản trị kinh doanh
Quốc tế GAMBA01.M1009.
§Ò bµi
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên
cứu của hai hiện tượng khác loại.
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương
sai của tổng thể chung đó
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên
nhân đến tiêu thức kết quả
B. Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
f) Cả a), b), c).
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức
kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ι
e) Cả a), c).
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả .
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ϕ e) Cả a), c)
κ
f) Cả a), d)
5) Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành
được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta
độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần
được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình
mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng
suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay
không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 22 32 36 38 35 26 30 28 24 28 26 34
Phương án 2: 21 27 28 29 23 26 28 30 32 34 38 25 36 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95%
hãy rút ra kết luận về hai phương án trên.
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây của
một nhà máy (đơn vị: triệu tấn):
6,1
4,9
5,7
4,5
6,4
1.
2.
3.
4.
4,7
5,3
7,0
4,7
3,0
6,2
7,3
3,7
7,8
5,1
7,5
4,8
7,2
6,4
4,5
6,6
5,3
3,8
6,5
7,9
6,0
7,3
12,3
5,2
6,1
Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra
và từ bảng phân bố tần số. So sánh kết quả và giải thích.
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để
đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi
phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép
lại mức độ thay đổi của doanh thu ở các vùng như sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2.5
2
3
6
4.5
4
3.5
3
3
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối
liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ
này qua các tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự
có mối liên hệ tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo
là 5,5% với độ tin cậy 90%.
Bµi lµm
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu. (Đúng)
Vì: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên
cứu tuỳ theo mục đích nghiên cứu khác nhau. Có thể phân biệt các loại tiêu thức sau:
tiêu thức thực thể, tiêu thức thuộc tính và tiêu thức số lượng.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối. (Đúng)
Vì: Tần số là đơn vị được phân phối trong mỗi tổ. Trong phân tích thống kê tần số cho
phép chúng ta xác nhận một trị số nhất định trong một tổng thể. Do đó tần số biểu hiện
bằng số tuyệt đối.
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên
cứu của hai hiện tượng khác loại. (Sai)
Vì: độ lệch chuẩn là một trong các chỉ tiêu so sánh độ biến thiên của hiện tượng cùng
loại và số trung bình bằng nhau. Đối với các hiện tượng khác loại hoặc các hiện tượng
cùng loại không bằng nhau người ta dùng hệ số biến thiên để so sánh.
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương
sai của tổng thể chung đó. (Sai)
Vì: Với phương sai của tổng thể chung tổng thể chung càng đồng đều khoảng ước
lượng càng nhỏ.
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên
nhân đến tiêu thức kết quả. (Đúng)
Vì: Mỗi khi biến giải thích (tăng lên) 1 đơn vị thì kết quả biến thay đổi (tăng lên) b1 đơn
vị. Do đó hệ số hồi qui (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức
nguyên nhân đến tiêu thức kết quả
B. Chọn phương án trả lời đúng nhất: (Câu trả lời đúng nhất được bôi màu đỏ)
1) Phân tích dãy số thời gian có tác dụng:
λ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
µ b) Biểu hiện xu hướng và tính quy luật của sự biến động
ν c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
ο d) Cả a), b).
π e) Cả b), c).
f) Cả a), b), c).
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức
kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
θ
e) Cả a), c).
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả .
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
ρ e) Cả a), c)
σ
f) Cả a), d)
5) Biểu đồ hình cột (Histograms) không có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành
được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta
độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần
được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ
hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng suất
trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Khoảng ước lượng có sai số bằng 1 ε 0 = 1
1 − α = 0,95
Độ tin cậy 95%: u = u
= 1,96
α /2
0,025
Độ lệch tiêu chuẩn về năng suất trong 1 giờ là 6 sản phẩm σ = 6
Vậy kích cỡ mẫu cần điều tra
4σ 2
σ 2
62
2
n ≥ 2 uα2 / 2 = 2 uα2 / 2 = 2 ( 1,96 ) = 138,3
Io
εo
1
Vậy số công nhân cần được điều tra là 139 người (để đạt được yêu cầu và thỏa mãn
yếu tố chi phí điều tra)
Gọi số sản phẩm hoàn thành trong 1 giờ là X.
Với kích cỡ mẫu trên X = 35 , σ = 6,5
1 − α = 0,95
Độ tin cậy 95%: u = u
= 1,96
α /2
0,025
Khoảng tin cậy đối xứng của giá trị trung bình là:
σ
σ
uα / 2 ; X +
uα / 2 ÷
X −
n
n
6,5
6,5
x1,96;35 +
x1,96 ÷
35 −
139
139
( 33,92;36, 08)
Vậy năng suất trung bình một giờ của toàn bộ công nhân là (33,92; 36,08)
Câu 3 (1,5đ)
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm.
Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 22 32 36 38 35 26 30 28 24 28 26 34
Phương án 2: 21 27 28 29 23 26 28 30 32 34 38 25 36 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95%
hãy rút ra kết luận về hai phương án trên.
Sử dụng Excel ta có các kết quả dưới đây:
Phương án 1
Phương án 2
Mean
Standard Error
Median
Mode
Standard
Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
29.91667
1.46917
29
26
Mean
Standard Error
Median
Mode
28.92857143
1.277292319
28
28
5.089353
25.90152
-1.15503
0.102813
16
22
38
359
12
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
4.779190239
22.84065934
-0.195835101
0.377055651
17
21
38
405
14
Như vậy, với độ tin cậy 95%, Phương án 2 rõ ràng hiệu quả hơn phương án 1 với chi phí
thấp hơn (28,9 so với 29,9) và độ lệch tiêu chuẩn thấp hơn (1,277 so với 1,469).
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng gần đây của
một nhà máy (đơn vị: triệu tấn):
6,1
4,9
5,7
4,5
6,4
4,7
5,3
7,0
4,7
3,0
6,2
7,3
3,7
7,8
5,1
7,5
4,8
7,2
6,4
4,5
6,6
5,3
3,8
6,5
7,9
6,0
7,3
12,3
5,2
6,1
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Sắp xếp số liệu từ nhỏ đến lớn
3,0
3,7
3,8
4,5
4,5
4,7
4,7
4,8
4,9
5,1
5,2
5,3
5,3
5,7
6,0
6,1
6,1
6,2
6,4
6,4
6,5
6,6
7,0
7,2
7,3
7,3
7,5
7,8
7,9
12,3
Qua dữ liệu đã sắp xếp cho thấy khối lượng than thấp nhất là 3,0 triệu tấn, mức cao
nhất là 12,3 triệu tấn. Để có nhận xét đầy đủ hơn về đặc điểm phân phối của các mức
khối lượng khai thác than có thể lập biểu đồ thân lá như sau:
Thân Lá (mỗi lá tương ứng với chữ số sau dấu phẩy)
3
0
7 8
4
5
6
7
12
5
1
0
0
3
5
2
1
2
7
3
1
3
7
3
2
3
8
7
4
5
9
4
8
5
9
6
2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Khối lượng (Tr.T)
Từ 3,0 đến dưới 4,0 tr.T
Từ 4,0 đến dưới 5,0 tr.T
Từ 5,0 đến dưới 6,0 tr.T
Từ 6,0 đến dưới 7,0 tr.T
Từ 7,0 đến dưới 8,0 tr.T
Từ 8,0 đến dưới 9,0 tr.T
Từ 9,0 đến dưới 10,0 tr.T
Từ 10,0 đến dưới 11,0 tr.T
Từ 11,0 đến dưới 12,0 tr.T
Từ 12,0 đến dưới 13,0 tr.T
Tổng
Trị số giữa
(Tr.T)
3,5
4,5
5,5
6,5
7,5
8,5
9,5
10,5
11,5
12,5
Tần số
Tần suất (%)
3
6
5
8
7
0
0
0
0
1
30
10.00%
20.00%
16.67%
26.67%
23.33%
3.33%
100%
3. Trong bộ dữ liệu trên có 01 dữ liệu đột xuất, đó là sản lượng 12,3 triệu tấn; lớn đột
xuất so với sản lượng thông thường hàng tháng.
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra và từ
bảng phân bố tần số. So sánh kết quả và giải thích.
(trước hết, loại lượng biến đột xuất khỏi tập dữ liệu để làm các thống kê)
Khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra:
(3,0 + 3,7 + 3,8 + 2*4,5 + 2*4,7 + 4,8 + 4,9 + 5,1 + 5,2 + 2*5,3 + 5,7 + 6,0 + 2*6,1 + 6,2
+ 2*6,4 + 6,5 +6,6 + 7,0 + 7,2 + 2*7,3 + 7,5 + 7,8 + 7,9) / 29 = 5,8 (triệu tấn)
Theo bảng phân bố tần suất, nhóm tháng đạt khối lượng từ 6,0 đến dưới 7,0 triệu tấn có
tần suất cao nhất 26,67% với trị số giữa là 6,5 triệu tấn.
Kết quả trên có sự chênh lệch do cách tính trực tiếp trên mẫu theo số tuyệt đối và
cách tính trên phương pháp phân bổ tính tần suất theo số tương đối.
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh
giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí
quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại
mức độ thay đổi của doanh thu ở các vùng như sau:
% tăng chi phí quảng cáo
1
2
6
4
3
% tăng doanh thu
2.5
3
4.5
3.5
3
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên
hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các
tham số của mô hình.
Xác định phương trình hồi quy tuyến tính
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.977
R Square
0.954
Adjusted R
Square
0.939
Standard Error
0.187
Observations
5
ANOVA
df
Regression
Residual
Total
Intercept
% tăng chi phí
quảng cáo
SS
2.195
0.105
2.300
1
3
4
Coefficient
s
2.068
MS
F
2.195 62.884
0.035
Standar
d Error
t Stat
0.176 11.717
0.385
0.049
7.930
Pvalue
0.001
0.004
Significanc
eF
0.004
Lower 95%
1.506
Uppe
r
95%
2.629
Lowe
r
95%
1.506
Uppe
r
95%
2.629
0.231
0.540
0.231
0.540
Phương trình hồi quy:
Doanh thu = 2,068 + 0,385X Tăng chi phí quảng cáo
Nếu Chi phí quảng cáo tăng 1% thì doanh thu sẽ tăng 0,385%.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có
mối liên hệ tương quan tuyến tính không?
Dùng tiêu chuẩn kiểm định T-Student để kiểm định hệ số hồi quy β1 với ý nghĩa “liệu
thực sự có mối liên hệ tuyến tính giữa X và Y hay không”?.
Cặp giả thiết không và giả thiết đối là:
H0 : β1 =0 (không có mối liên hệ tuyến tính)
H1 : β1 ≠ 0 (có mối liên hệ tuyến tính)
Miền bác bỏ được xác định:
β¶ j
Wα = t =
; t ≥ tα( n/−2 p )
¶
Se( β j )
Với n – 2 bậc tự do
X=
16
= 3, 2
5
S2 =
1 n
∑ Xi − X
n − 1 i =1
t=
(
)
2
S2 = 3,7
S = 1,92
0,385
= 0, 2 ≤ tα( n/−22)
1,92
Vậy miền bác bỏ là tập rỗng, % tăng phí quảng cáo và % tăng doanh thu có mối quan hệ
tương quan tuyết tính.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
r=
XY − X .Y
σ x .σ y
16
= 3, 2
5
16,5
Y=
= 3,3
5
58,5
XY =
= 11, 7
5
X=
σ X = X 2 − ( X ) 2 = 13, 2 − 10, 24 = 2,96
σ Y = Y 2 − (Y ) 2 = 11,35 − 10,89 = 0, 46
11, 7 − 3,3x3,2
1,14
r=
=
= 0,84
2,96x0,46
1,3616
r = 0,84 cho thấy mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu khá
chặt chẽ và đây là mối liên hệ thuận.
Đánh giá sự phù hợp của mô hình
r 2 = 0, 7 phản ánh tỷ lệ % sự thay đổi của Y được phản ánh bởi mô hình
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là
5,5% với độ tin cậy 90%.
X i = 5,5 theo phương trình hồi quy tuyến tính trên
Yµi = 2, 068 + 0,385x5,5=4,2
Ước tính tỷ lệ tăng doanh thu tương ứng với giá trị cá biệt X i này sẽ nằm trong
khoảng:
2
2
Xi − X
Xi − X
1
1
(
n
−
2)
(
n
−
2)
Yµi − tα / 2 .S yx . + n
; Yµi + tα / 2 .S yx . + n
2
n
n
Xi − X
Xi − X
∑
∑
i =1
i =1
(
(
)
)
(
(
)
)
2
÷
÷
÷
÷
Với độ tin cậy là 90% tương ứng 1 − α = 0,9
3
tα( n/−22) = t0,05
= 2,353
S yx = 0,32
Thay số ta được khoảng ước lượng:
1 (5,5 − 3, 2) 2
1 (5,5 − 3, 2) 2
+
; 4, 2 + 2,353x0,32x
+
4, 2 − 2,353x0,32x
5
14,8
5
14,8
÷
÷
Vậy với tỷ lệ % tăng chi phí quảng cáo, ước tính tỷ lệ % tăng doanh thu nằm trong
khoảng (3,64; 4,76)
TÀI LIỆU THAM KHẢO
Giáo trình môn Thống kê và Khoa học quyết định dành cho nhà quản lý. Trường Đại học
Griggs.