Bài tập cá nhân – Môn học thống kê và khoa học quyết định
Họ và tên: Nguyễn Bích Ngọc
Lớp: GaMBA 01- N04
Môn học: Thống kê và khoa học quyết định.
BÀI KIỂM TRA HẾT MÔN
Câu 1: Lý thuyết (2đ)
A-Trả lời (Đ), sai (S) cho các câu sau và giải thích tại sao?
1- Liên hệ tương quan là mối liên hệ biểu hiện rõ trên từng đơn vị cá biệt.
2- Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
3- Phương sai cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện
tượng khác loại.
4- Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương
sai của tổng thể chung đó.
5- Hệ số hồi quy(b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên
nhân đến tiêu thức kết quả.
B- Chọn phương án trả lời đúng nhất:
1- Phân tích dãy số thời gian có tác dụng:
a) Phân tích đặc điểm biến động của hiện tượng thời gian.
b) Biểu hiện xu hướng và tính quy luật của sự biến động.
c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
d) Cả a), b).
e) Cả b), c).
f) Cả a), b), c).
2- Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức
kết quả.
a) Hệ số tương quan
b) Hệ số chặn (b0).
c) Hệ số hồi quy (b1)
d) Cả a), b).
e, Cả a), c).
3- Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháo chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả.
1
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
4- Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại:
a) Độ lệch tiêu chuẩn.
b) Khoảng biến thiên.
c) Khoảng tứ phân vi
d) Hệ số biến thiên
e) Cả a), c)
f) Cả a), d)
5- Biểu đồ hình cột (Histograms) không phải là đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a), và b) đều đúng
e) Cả b), và c) đều đúng
f) Cả a), b), và c) đều đúng
Bài giải :
A - Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1- Liên hệ tương quan là mối liên hệ biểu hiện rõ trên từng đơn vị cá
biệt ?
Sai: Vì Liên hệ tương quan là mối liên hệ giữa tiêu thức nguyên nhân (biến độc
lập) và tiêu thức kết quả (bến phụ thuộc): mỗi giá trị của tiêu thức nguyên nhân sẽ cho một
giá trị tương ứng của tiêu thức kết quả.
Liên hệ tương quan được mô hình hóa theo lý thuyết thông qua các quan sát, các số
liệu thống kê với cỡ mẫu đủ lớn. nói tóm lại, liên hệ tương quan không biểu hiện một cách
rõ ràng trên từng đơn vị cá biệt.
2- Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối ?
Đúng: Vì Tần số là số đơn vị được phân phối vào trong mỗi tổ, tức là số lần một
lượng biến nhận một trị số nhất định trong một tổng thể. Tần số thường được ký hiệu bằng
fi và ∑fi là tổng tần số hay tổng số đơn vị của tổng thể, biểu hiện bằng số tuyệt đối,
Khi tần số được biểu hiện bằng số tương đối gọi là tần suất, với đơn vị tính là lần hoặc %
và ký hiệu bằng di (di = fi / ∑fi). Tần suất biểu hiện tỷ trọng của từng tổ trong tổng thể.
3- Phương sai cho phép so sánh độ biến thiên của tiêu thức nghiên cứu
của hai hiện tượng khác loại ?
2
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
Sai: Vì phương sai cho biết độ biến thiên xung quanh số trung bình của các lượng
biến.
4- Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ
nghịch với phương sai của tổng thể chung đó?
Sai: Vì Quan hệ đồng biến giữa khoảng tin cậy cho tham số của tổng thể chung với
phương sai thể hiện qua các công thức sau:
Trường hợp đã biết phương sai:
Giả thiết:
- Đã biết phương sai của tổng thể chung,
- Tổng thể chung phân phối chuẩn;
- Nếu không có phân phối chuẩn thì mẫu phải lớn.
x − Zα / 2
σ
σ
≤ µ ≤ x + Zα / 2
n
n
Trường hợp chưa biết phương sai
Giả thiết:
- Chưa biết phương sai của tổng thể chung,
- Tổng thể chung phải phân phối chuẩn;
- Sử dụng phân vị Student với khoảng tin cậy như sau:
x − t α / 2;( n −1)
s
s
≤ µ ≤ x + t α / 2;( n −1)
n
n
5- Hệ số hồi quy ( b1 ) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu
thức nguyên nhân đến tiêu thức kết quả ?
Đúng: Vì Hệ số hồi quy quy b1 phản ánh ảnh hưởng của tiêu thức nguyên nhân
đang nghiên cứu đến tiêu thức kết quả.
B- Chọn phương án trả lời đúng nhất:
1- Phân tích dãy số thời gian có tác dụng : ( Chọn f )
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động.
3
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
f) Cả a), b), c).
2- Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên
nhân đến tiêu thức kết quả: ( Chọn e )
a) Hệ số tương quan.
b) Hệ số chặn (b0 ).
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ι
e) Cả a), c).
3- Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu: (Chọn d )
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả .
4- Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện
tượng khác loại: (Chọn d )
a) Độ lệch tiêu chuẩn.
b) Khoảng biến thiên.
c) Khoảng tứ phân vị.
d) Hệ số biến thiên.
ϕ
κ
e) Cả a), c)
f) Cả a), d)
5- Biểu đồ hình cột (Histograms) không phải là đặc điểm:(Chọn a )
a) Giữa các cột có khoảng cách.
b) Độ rộng của cột biểu hiện khoảng cách tổ.
c) Chiều cao của cột biểu thị tần số.
d) Cả a) và b) đều đúng.
e) Cả b) và c) đều đúng.
4
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
f) Cả a), b) và c) đều đúng.
Câu 2:
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét để đánh giá
tính hiệu quả của nó. Phỏng vấn ngẫu nhiên 30 khách hàng được bán hàng theo phương
pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao hàng như sau:
8
6
6
9
7
6
5
5
7
6
6
7
3
10
6
6
7
4
9
7
4
4
5
7
4
6
8
5
4
3
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng
theo phương pháp mới với xác suất tin cậy 95%. Hãy kết luận về hiệu quả của phương
pháp bán hàng mới so với phương pháp cũ. Biết rằng phương pháp bán hàng cũ có số
ngày trung bình từ khi đặt hàng đến khi giao hàng là 7 ngày.
Bài giải :
Theo giải thiết đề bài cho, ta có dãy số sau:
Số ngày
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Số ngày
(Xi-X)2
(Xi)
8
5
3
9
4
6
5
10
7
6
6
7
6
4
8
4
1
9
9
4
0
1
16
1
0
0
1
0
4
4
STT
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
Tổng cộng
(Xi-X)2
(Xi)
9
6
6
4
5
7
6
7
5
4
6
7
4
7
3
180
9
0
0
4
1
1
0
1
1
4
0
1
4
1
9
90
5
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
Đây là trường hợp Kiểm định trung bình, khi chưa biết б, với mẫu n = 30, ước
lượng khi chưa biết độ lệch chuẩn của tổng thể chung;
Vì vậy ta thực hiện tìm độ lệch chuẩn của tổng thể mẫu, ước lượng t
Độ tin cậy 95%
=> α = 0,05
=> t α/2;(n-1) = 2,045
=>
X = ∑Xi /n = 180/30 = 6
S = SQRT((Xi-X)2/(n-1)) = SQRT (90/29) = 1,76
X − tα / 2;( n −1)
S
n
≤ µ ≤ X + tα / 2;( n −1)
S
n
Áp dụng công thức trên tính toán ta có :
Sai số dự đoán = 2,05 * 1,76/SQRT (30) = 0,66
Như vậy, với độ tin cậy 95%, số ngày từ khi đặt hàng đến khi giao hàng nằm trong
khoảng 5.3423 ≤ μ ≤ 6.66
Kết luận: Theo như tính toán trên thì phương pháp bán hàng mới có hiệu quả cao hơn
phương pháp bán hàng cũ.
Câu 3:
Có hai phương pháp dạy học sử dụng cho 2 lớp thuộc cùng một đối tượng học sinh.
Để xem tác động của phương pháp dạy học đó đến kết quả học tập có khác nhau không,
người ta chọn ngẫu nhiên từ mỗi lớp một số học sinh để kiểm tra kết quả học tập của họ.
Số học sinh được chọn ra ở lớp thứ nhất là nhóm 1 (15 học sinh) với điểm trung bình là 8
điểm và độ lệch tiêu chuẩn là 0,7 điểm. Số học sinh được chọn ra ở lớp thứ hai là nhóm 2
(20 học sinh) với điểm trung bình là 7,8 điểm và độ lệch tiêu chuẩn là 0,6 điểm.
Với mức ý nghĩa 0,05 hãy rút ra kết luận.
Bài giai:
Sử dụng ước lượng t, với α = 0.05; ta có:
X1 = 8
S1 = 0,7
n1 = 15
6
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
X2 = 7,8
S2 = 0,6
n2 = 20
Gọi μ 1 là điểm trung bình của nhóm 1, μ 2 là điểm trung bình của nhóm 2
Để kiểm định xem 2 phương pháp dạy học có kết quả khác nhau hay không, ta thực
hiện kiểm định kết quả trung bình theo 2 phương pháp,
Giả thiết kiểm định:
H0: μ 1 = μ 2
H1: μ 1 # μ 2
Đây là trường hợp: Kiểm định 2 giá trị trung bình của 2 tổng thể chung, hai mẫu độc
lập, chưa biết phương sai tổng, mẫu nhỏ, sử dụng phân bố t, kiểm định 2 phía
Sử dụng công thức, ta tính được :
t=
X1 − X 2
S2 S2
+
n1 n2
S2 =
=
(n1 − 1) S12 + ( n2 − 1) S 22
n1 + n2 − 2
(15 − 1) * 0,7 2 + (20 − 1) * 0,6 2
15 + 20 − 2
= 0,415152
t=
8 − 7,8
= 0,908769
1
1
0,415152 * ( + )
15 20
Với α= 0,05 => tα / 2;( n−2 ) = t 0,05 / 2;33 = ± 2,0345
=>ttính < t 0,05 / 2;33 không thuộc miền bác bỏ
|t| ≤ ta/2;(n1+ n2 - 2) (nằm ngoài miền bác bỏ)
Quyết định: Chưa đủ cơ sở để bác bỏ giả thiết H0
Kết luận: Với mẫu đã điều tra, ở mức ý nghĩa 5% có thể kết luận chưa đủ cơ sở để nói
rằng tác động của phương pháp dạy học đó đến kết quả học tập có khác nhau không.
nghĩa là không đủ cơ sở để bác bỏ điểm trung bình của 2 phương pháp dạy là như nhau.
Câu 4:
7
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
Doanh thu của một doanh nghiệp trong 9 năm:
Năm
2001
Doanh thu (tỷ đồng)
26
2002
28
2003
32
2004
35
2005
40
2006
42
2007
50
2008
51
2009
54
1. Xác định hàm xu thế tuyến tính biểu diễn xu hướng biên động của doanh thu qua
thời gian
2. Xác định sai số của mô hình và dự đoán doanh thu năm 2010 dựa vào mô hình
trên với xác suất tin cậy 95%.
Bài giải:
1. Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của doanh
thu qua thời gian.
Hàm xu thế tuyến tính biểu diễn xu hướng biến động của doanh thu qua thời gian
có dạng: Ŷt = b0 + b1 * t
Trong đó:
Ŷt: là hàm xu thế của doanh thu
t: là thời gian.
Để xác định b0 và b1 ta sử dụng hàm Regression trong Excel với bảng số liệu như sau:
Năm
Doanh thu (tỷ
t
đồng)
2001
26
1
2002
28
2
2003
32
3
2004
35
4
2005
40
5
2006
42
6
2007
50
7
2008
51
8
2009
54
9
Sau khi nhập số liệu và sử dụng hàm Regression, từ bảng tính Excel, cho kết quả
theo phương pháp hồi quy như sau:
SUMMARY
8
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
OUTPUT
Regression Statistics
Multiple R
0,992148091
R Square
0,984357834
AdjustedR
0,982123239
Square
Standard Error
1,37782898
Observations
9
ANOVA
Regression
Residual
Total
df
1
7
8
SS
MS
836,2667 836,2667
13,28889 1,898413
849,5556
Coefficients
Intercept
T
Upper
21,11111
3,733333
Lower
Standar
t Stat
d Error
1,00097 21,09066
0,177877 20,98829
F
Significance F
440,5084 1,4E-07
P-value
Lower 95%
1,36E-07 18,74419
1,4E-07 3,312721
Upper
95%
95,0%
95,0%
23,47803 18,74419 23,47803
4,153945 3,312721 4,153945
Hàm xu thế tuyến tính biểu diễn xu hướng biến động của Doanh thu qua thời gian là :
Ŷt = bo + b1 * t
Ŷt = 21,11111+ 3,733333*t
2. Xác định sai số của mô hình và dự đoán doanh thu năm 2010 dựa vào mô
hình trên với xác suất tin cậy 95%.
Sai số của mô hình: = 1,377829 (Standard Error)
Dự đoán doanh thu năm 2010 dựa vào mô hình trên với xác suất tin cậy 95%:
Để dự đoán doanh thu năm 2010 ta có t = 10; l = 1
Thay t = 10 ta tính được: Ŷ2010 = 58,44444 tỷ đồng
Tính sai số dự đoán:
s = tα / 2;( n−2 ) ∗ S yx ∗ 1 +
1 3(n + 2l − 1) 2
+
2
n
n(n − 1)
với n = 9
Với xác suất tin cậy 95% ta tra bảng t được tα / 2;( n − 2) = t 0, 025;7 = 2,365
9
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
1 3(n + 2l − 1) 2
s = tα / 2;( n−2 ) ∗ S yx ∗ 1 + +
=
2
n
n(n − 1)
1 3(9 + 2 − 1) 2
= 2,365 ∗1,37783 ∗ 1 + +
= 4,02769
9
9(81 − 1)
Dự đoán doanh thu năm 2010 sẽ nằm trong khoảng:
Ŷ2010 – s ≤ Ŷ ≤ Ŷ2010 + s
= 58,44444 - 4,02769 ≤ Ŷ ≤ 58,44444 + 4,02769
ó 54,41675 ≤ Ŷ ≤ 62,47213 (tỷ đồng)
Như vậy dựa vào mô hình hàm xu thế tuyến tính trên với xác suất tin cậy 95%, ta
xác định được kết quả cụ thể như sau:
Dự đoán điểm 2010 (n=9,t=10, L=1)
Sai số:
58,44444444
4,02769480
2
54,4167496
Cận dưới :
4
62,4721392
Cận trên:
5
Kết luận: Với xác suất tin cậy 95%, Dự đoán doanh thu năm 2010 trong khoảng từ
54,416 tỷ đồng đến 62,472 tỷ đồng,
Câu 5:
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một
nhà máy (đơn vị: triệu tấn)
6,2
7,3
3,0
5,2
6,4
3,3
5,3
7,2
4,5
4,7
5,3
6,1
3,7
7,8
6,1
4,5
4,8
7,0
6,0
7,5
7,9
5,1
3,8
6,5
5,7
7,3
4,9
6,6
4,7
6,4
1- Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.
2- Tính trung bình từ dãy số liệu ban đầu và từ bảng phân bố tần số. So sánh kết
quả và cho nhận xét.
Bài giải:
Theo đề bài ta có dãy số sau:
STT
1
2
Khối lượng SP (X)
6,2
7,3
STT
17
18
Khối lượng SP (X)
4,8
7,0
10
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
3
4
5
6
7
8
9
10
11
12
13
14
3,0
5,2
6,4
3,3
5,3
7,2
4,5
4,7
5,3
6,1
3,7
7,8
19
20
21
22
23
24
25
26
27
28
29
30
Tổng
6,0
7,5
7,9
5,1
3,8
6,5
5,7
7,3
4,9
6,6
4,7
6,4
15
16
6,1
4,5
cộng
170,8
- Từ số liệu bảng trên ta có:
Từ số liệu trên ta có: ΣX = 170,8
Do đó:
X = 170,8 /30 = 5,69333 ( triệu tấn )
=> Xây dựng bảng tần số phân bổ với 5 tổ có khoảng cách tổ bằng nhau:
Khoảng cách tổ = (Xmax - Xmin)/5 = 0.98 ( thực hiện phân tổ theo tiêu thức khối
lượng sản phẩm thép)
Tần số (số tháng)
STT
1
2
3
4
5
Khối lượng thép
Từ 3 đến dưới 4
Từ 4 đến dưới 5
Từ 5 đến dưới 6
Từ 6 đến dưới 7
Từ 7 đến dưới 8
Trị số giữa Xi
3,5
4,5
5,5
6,5
7,5
fi
4
6
5
8
7
30
Xi*fi
14,0
27,0
27,5
52,0
52,5
173,0
- Tính trung bình từ bảng phân bổ tần số:
Ta có:
X =
∑ xi * fi
∑ fi
=
173
= 5,76667 (triệu tấn)
30
11
Bài tập cá nhân - Môn học Thống kê và khoa học quyết định
Ta có nhận xét: Sở dĩ có sự chênh lệch giữa các giá trị trung bình về sản lượng thép từ
2 cách tính ( chênh lệch 0,07334) là do chênh lệch của trị số giữa với trung bình thật của
từng tổ.
DANH MỤC TÀI LIỆU THAM KHẢO
- Giáo trình môn học thống kê trong kinh doanh của chương trình đào tạo thạc sĩ Quản trị kinh
doanh Quốc tế được cung cấp trong khóa học.
- Nội dung kiến thức tài liệu được Giảng viên giảng dạy; truyền đạt;cung cấp trong khóa học;
đồng thời có nghiên cứu một số tài liệu khác...
12