Tải bản đầy đủ (.doc) (11 trang)

Bài tập xác suất thống kê khoa học ra quyết định (51)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (171.96 KB, 11 trang )

CHƯƠNG TRÌNH ĐÀO TẠO
THẠC SĨ QUẢN TRỊ KINH DOANH QUỐC TẾ
LỚP GaMBA.X0410
BÀI TẬP CÁ NHÂN
Môn THỐNG KÊ VÀ KHOA HỌC RA QUYẾT ĐỊNH
DÀNH CHO NHÀ QUẢN LÝ
Kính gửi:

Quản lý lớp GaMBA.X0410
Giảng viên bộ môn

Người thực hiện: Phan Thị Ngọc Yến.
BÀI LÀM
Câu 1. Lý thuyết
1. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
i. Liên hệ tương quan là mối liên hệ biểu hiện rõ trên từng
đơn vị cá biệt.
Trả lời: Sai.
Vì liên hệ tương quan giữa hai chỉ tiêu là mối liên hệ ước tính từ một tập
chuỗi các cặp quan sát của hai chỉ tiêu này, chứ không phải trên từng đơn vị
cá biệt.
Mối quan hệ ràng buộc lẫn nhau giữa hai hay nhiều đại lượng hay biến số,
trong đó sự biến động của một hay nhiều đại lượng này sẽ dẫn đến sự chi phối
của đại lượng kia. Trong đó mối liên hệ giữa hai đại lượng là tương quan đơn
và mối liên hệ giữa ba đại lượng trở lên là tương quan bội hay tương quan
nhiều chiều. Liên hệ tương quan giữa các đại lượng được phát hiện và đo
lường bằng các phương pháp đồ thị; lập bảng tương quan; xây dựng các hàm
số tương quan; tính toán các hệ số tương quan.
ii. Tần số trong bảng phân bố tần số biểu hiện bằng số
tuyệt đối.
Trả lời: Đúng.


Tần số là số lần xuất hiện của các lượng biến nên luôn luôn là một số tuyêt
đối, còn tần suất được biểu hiện bằng số tương đối với đơn vị tính là lần hoặc
%. Tổng của các tần số sẽ phải đúng tổng số quan sát.
iii. Phương sai cho phép so sánh độ biến thiên của tiêu thức
nghiên cứu của hai hiện tượng khác loại.
Trả lời: Sai.
Vì muốn so sánh độ biến thiên của hai hiện tượng khác loại, chúng ta phải sử
dụng Hệ số biến thiên được tính bằng tỷ số giữa độ lệch chuẩn với giá trị bình
quân. Bởi nếu so sánh giữa các phương sai của các hiện tượng khác loại, thì
phương sai của những hiện tượng có giá trị quan sát lớn hơn có thể sẽ lớn hơn
về trị tuyệt đối, nhưng về quy mô biến thiên tương đối so với giá trị bình quân
thì có thể lại nhỏ hơn.
1


Các chỉ tiêu khác nhau sẽ có quy luật phân phối và độ biến thiên khác nhau,
tức là có phương sai khác nhau. Và do vậy, mỗi chỉ tiêu tính ra sẽ có một cỡ
mẫu riêng (mặc dù yêu cầu về độ tin cậy (φt) của các chỉ tiêu điều tra như
nhau). Nói cách khác, có bao nhiêu chỉ tiêu điều tra thì phải tính bấy nhiêu cỡ
mẫu, sau đó sẽ chọn ra cỡ mẫu lớn nhất dùng chung cho điều tra tất cả các chỉ
tiêu. Với nhiều cỡ mẫu đòi hỏi phải tính nhiều phương sai nên công việc tính
toán càng trở nên phức tạp, tốn nhiều công sức, khó thực hiện.
Hệ số biến thiên được biểu hiện bằng số tương đối có được từ so sánh giữa độ
lệch tiêu chuẩn và trung bình cộng. Hệ số biến thiên có thể dùng để so sánh
giữa các tiêu thức khác nhau của hai hiện tượng khác nhau nhưng có liên
quan.
iv. Khoảng tin cậy cho tham số nào đó của một tổng thể
chung tỷ lệ nghịch với phương sai của tổng thể chung
đó
Trả lời: Sai.

Vì khoảng tin cậy được tính theo công thức:
σ
σ
x −Zα/ 2
≤µ≤x +Zα/ 2
n

n

Ứng với một độ tin cậy nhất định (Z không đổi), khi phương sai tăng sẽ làm
tăng khoảng tin cậy. Vì vậy, khoảng tin cậy cho tham số của tổng thể chung tỷ
lệ thuận với phương sai của tổng thể.
v. Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh

hưởng của tiêu thức nguyên nhân đến tiêu thức kết quả
Trả lời: Đúng
Do Hệ số hồi quy (b1) là hệ số góc, cho biết giá trị trung bình của biến phụ
thuộc Y sẽ thay đổi (tăng or giảm) bao nhiêu đơn vị khi giá trị của biến độc
lập X tăng 1 đơn vị với điều kiện các yếu tố khác không thay đổi.
b. Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng:
a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
b) Biểu hiện xu hướng và tính quy luật của sự biến động
c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
d) Cả a), b).
e) Cả b), c).
f) Cả a), b), c).
Đáp án F
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân
đến tiêu thức kết quả:

a) Hệ số tương quan.
b) Hệ số chặn (b0)
c) Hệ số hồi quy (b1).
d) Cả a), b).
e) Cả a), c).
2


Đáp án C.
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.
d) Cả a), b), c).
e) Không yếu tố nào cả.
Đáp án D.
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng
khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên.
e) Cả a), c)
f) Cả a), d)
Đáp án F
5) Biểu đồ hình cột (Histograms) không phải là đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng.

e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng.
Đáp án D.
Câu 2.
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét để
đánh giá tính hiệu quả của nó. Phỏng vấn ngẫu nhiên 30 khách hàng được bán
hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi giao
hàng như sau:
8
6
6
9
7
6
5
5
7
6
6
7
3
10
6
6
7
4
9
7
4
4

5
7
4
6
8
5
4
3
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng
khi bán hàng theo phương pháp mới với xác suất tin cậy 95%. Hãy kết luận
về hiệu quả của phương pháp bán hàng mới so với phương pháp cũ. Biết rằng
phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao
hàng là 7 ngày
Bài giải.
Số ngày giao hàng
Mean
6,0000
Standard Error
0,3216
Median
6,0000
3


Mode
6,0000
Standard Deviation
1,7617
Sample Variance
3,1034

Range
7
Minimum
3
Maximum
10
Sum
180
Count
30
1. Ước lượng khoảng tin cậy:
Do số mẫu quan sát là 30, nên ta chọn công thức ước lượng khoảng tin cậy
như sau:


x − zα / 2

s
s
≤ µ ≤ x + zα / 2
n
n

Với:
• Zα/2=1,959964 (xác định bằng hàm NORMSDIST trong Excel)


6 − 1,96 *

1,7617

1,7617
≤ µ ≤ 6 + 1,96 *
30
30

5,3696≤µ ≤ 6,6304
|µ|≤ x ±ε x= x ± 0,630391
εx=0,630391 (tính toán bằng hàm CONFIDENCE trong Excel)
 Do đó, với độ tin cậy 95%, số ngày bình quân từ khi đặt hàng đến giao
hàng là 5,3696 đến 6,6304 ngày.
 µ0 = 7 ngày nằm ngoài khoảng tin cậy.
b. Kiểm định số ngày trung bình từ khi đặt hàng đến khi giao
hàng
Cặp giả thiết kiểm định là:
H0: µ0 = 7 ngày
H1: µ0 < 7 ngày
Với:
• x = 6 ngày.
• S x = 1,7617 ngày.
• µ0 = 7 ngày.
• n = 30
• α=1-95%=5%;




6−7
x − µ0
 Z = σ = 1,7617 = -3,10913
30

n

c. Xác định miền bác bỏ hay chấp nhận H0:
Z = -3,10913< - Zα = - Z2,5%= - 1,959964 (xác định bằng hàm NORMSDIST
trong Excel)
 Bác bỏ với α=5%. Với mẫu đã điều tra đủ cơ sở để bác bỏ H0, không
chấp nhận H0 (có nghĩa là µ < 7 ngày).

4


d. Xác định p-value.
• P-value/2=P(T<-3,10913)=P(T>3,10913)= 0,00209 (bằng cách dùng hàm
TDIST trong Excel).
• P-value= 0,004181=0,42%
 Giả thiết H0 sẽ bị bác bỏ ở bất kỳ giá trị nào của α≥ 0,42%
 Với α=5%>0,42%, giả thiết H0 bị bác bỏ và chấp nhận giải thiết H1 .
e. Kết luận:
• Với mức ý nghĩa 5%, có thể kết luận rằng số ngày trung bình từ khi đặt
hàng đến khi giao hàng nhỏ hơn 7 ngày.
Câu 3.
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác
nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau:
(ngàn đồng)
P/A 1 25 32 35 38 35 26 30 28 24 28 26 34 28 27 26
P/A 2 20 27 25 29 23 26 28 30 32 34 38 25 30 24 27 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin
cậy 95% hãy rút ra kết luận về hai phương án trên.
Lời giải

P/A 1
P/A 2
Mean
29,46667 Mean
27,875
Standard Error
1,112127 Standard Error
1,098768
Median
28 Median
27,5
Mode
26 Mode
27
Standard Deviation 4,307247 Standard Deviation
4,395073
18,5523
2
Sample Variance S1
8 Sample Variance S22 19,31667
Kurtosis
-0,7629 Kurtosis
0,839921
Skewness
0,688809 Skewness
0,574975
Range
14 Range
18
Minimum

24 Minimum
20
Maximum
38 Maximum
38
Sum
442 Sum
446
Count
15 Count
16
1. Giá trị bình quân:
• Phương án 1 là 29,47 còn của Phương án 2 là 27,88
b. Phương sai mẫu hiệu chỉnh:
• Phương án 1 là 18,55 còn Phương án 2 là 19,32
Do cỡ mẫu nhỏ hơn 30 nên chúng ta phải sử dụng kiểm định đối với mẫu nhỏ.
c. Chúng ta tiến hành kiểm định xem chi phí trung bình của hai
phương án có thực sự khác nhau không.
Cặp giả thiết kiểm định là: H0: µ1 = µ2
H1: µ1 ≠ µ2

5


d. Ước lượng kết hợp của phương sai tổng thể được tính:
s 2p =

( n1 − 1) s12 + ( n2 − 1) s22
n1 + n2 − 2


=

(15 - 1) *18,55 + (16 - 1) *19,32
=18,9477
15 + 16 − 2

e. Giá trị thống kê t được xác định như sau:
(X 1 − X 2 )
sp

1
1
+
n1 n2

(X 1 − X 2)

( 29,46667 - 27,875)

1 1
1 1
s 2p *  + 
18,9477 *  + 
 15 16 
 n1 n2  =

t=
=
= 1,017416.
Giá trị ngưỡng của thống kê t với số bậc tự do là n1+n2-2=15+16-2=29 và mức

ý nghĩa α=1-95%=5%; α/2=2,5%; tra hàm TINV trong Excel
tα/2; n1+n2-2= t2,5%; 29= 2,363846
f. Xác định miền bác bỏ hay chấp nhận H0:
• t= 1,017416 < tα/2; n1+n2-2= 2,363846
 Chấp nhận giải thiết H0.
g. Xác định p-value.
• P-value/2=P(T<-2,363846)=P(T>2,363846)= 0,16310829 (bằng cách dùng
hàm TDIST trong Excel).
• P-value= 0,326217=32,62% > 5%
 Giả thiết H0 sẽ bị bác bỏ ở bất kỳ giá trị nào của α≥ 32,62%.
 Với α=5%<32,62%, ta chấp nhận giả thiết H0.
h. Kết luận:
• Với mức ý nghĩa 5%, có thể kết luận rằng chi phí trung bình theo hai
phương án là tương đương nhau.
Câu 4.
Có tài liệu về doanh thu của một doanh nghiệp trong 10 năm như sau:
Năm
Doanh thu (tỷ đồng)
2001
25
2002
26
2003
28
2004
32
2005
35
2006
40

2007
42
2008
50
2009
51
2010
54
1. Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của
doanh thu qua thời gian.
Năm
t
Doanh thu (tỷ đồng)
2001
1
25
2002
2
26
2003
3
28
2004
4
32
6


2005
5

35
2006
6
40
2007
7
42
2008
8
50
2009
9
51
2010
10
54
Đặt Phương trình hồi quy có dạng:
Yi = b0 + b1Xi
Trong đó:
• Yi: Doanh thu (tỷ đồng) - biến phụ thuộc;
• Xi: Số năm t - là biến độc lập;
Sử dụng Excel hồi quy bằng hàm Regression, trong đó hồi quy biến phụ thuộc
Yi, và các biến độc lập là Xi. Ta có bảng hồi quy sau:
SUMMARY OUTPUT
Regression Statistics
0,98885
Multiple R
5
R Square
0,977834

0,97506
Adjusted R Square
3
Standard Error
1,702494
Observations
10
ANOVA
df
Regression
Residual
Total

1
8
9
Coefficient
s

SS
1022,912
23,18788
1046,1

MS
1022,912
2,898485

F
352,9127


Significance F
6,66E-08

Standard
Lower
Upper
Error
t Stat
P-value
95%
95%
1,16302
16,2513 21,6152
Intercept
18,93333
5 16,27939 2,04E-07
9
7
18,7859
3,95344
t
3,521212 0,187438
7 6,66E-08 3,088978
6
Kết quả Phương trình hồi quy có dạng:
Yi = 18,93333+ 3,5212*Xi.
• b1 = 3,5212: Khi thời gian tăng thêm 1 năm thì mô hình dự đoán tăng
khoảng 3,5212 (tỷ đồng).


7


Kiểm định mối liên hệ tuyến tính giữa biến độc lập X i là thời gian với Yi
là Doanh thu:
Cặp giả thiết kiểm định là: H0: β1 = 0 ( Không có mối liên hệ tuyến tính)
H1: β1 ≠ 0 (Có mối liên hệ tuyến tính)
• Tra bảng kết qủa t -Stat cho biến độc lập Xi ta được t- Stat = 18,78597
Sử dụng hàm TINV trong Excel tra t α/2;n-2 = t2,5%;8 = 2,75152
• Xét t - Stat >tα/2;n-2 , thuộc miền bác bỏ, nên bác bỏ giả thiết H0, chấp nhận
giả thiết H1.
• Kết luận: Có mối liên hệ tuyến tính ý nghĩa giữa thời gian và Doanh thu.
Xác định các hệ số hồi quy cho tổng thể chung và giải thích ý nghĩa.
Từ bảng tính Regression Statistics trong Excel (cột Lower 95% và Upper
95%), ta có ước lượng các hệ số hồi qui của tổng thể chung:
• β1: Với mức tin cậy 95%, khoảng tin cậy cho độ dốc β1 là (3,088978;
3,953446), không bao gồm 0.
 Vậy có mối liên hệ tuyến tính ý nghĩa giữa thời gian và Doanh thu.
Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình.
Hệ số xác định:
• R2 = 0,977834, Nghĩa là 97,7834% sự thay đổi trong Doanh thu là do ảnh
hưởng của nhân tố thời gian.
Hệ số tương quan:
• R = 0,975063. Nên giữa Yi, Doanh thu, và biến Xi thời gian có mối quan
hệ tương quan tuyến tính thuận và rất chặt chẽ.
b. Xác định sai số của mô hình và dự đoán doanh thu năm 2011
dựa vào mô hình trên với xác suất tin cậy 95%.
1
Yˆi ± tα ; n − 2 ⋅ S yx ⋅ 1 + +
Theo công thức:

n

(X − X)
∑( X − X )
2

*
i

n

i =1

2

i

Trong đó:
• Yˆi = Yˆ11 = 18,93333+ 3,5212*11= 57,66666667
• Syx=1,702494 (tra trong bảng kết quả hồi quy=Standard Error);
• n=10,
• X*i =11
• X =5,5
• t α;n-2 = t5%;8 = 2,3060.
8




(X




∑( X

*
i

)

2
− X =(11-5,5) =30,25

n

i =1

2

− X ) =82,5
2

i

Thay số vào công thức tính được khoảng tin cậy của Yˆ11 là:
57,66667±4,754571
Tương đương: 57,66667-4,754571< Yˆ11 <57,66667+4,754571
Hay: 52,9121 < Yˆ11 <62,4212
Kết luận: Với độ tin cậy 95%, doanh thu sẽ tăng trong khoảng từ (52,9121;
62,4212)

Câu 5.
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần
đây của một nhà máy (đơn vị: triệu tấn)
6,2
3,3
5,3
4,5
7,9
7,3
7,3
5,3
6,1
4,8
5,1
4,9
3,0
7,2
3,7
7,0
3,8
6,6
5,2
4,5
7,8
6,0
6,5
4,7
6,4
4,7
6,1

7,5
5,7
6,4
1. Xây dựng biểu đồ thân lá và bảng tần số phân bố với 5 tổ có khoảng
cách tổ bằng nhau.
2. Tính trung bình từ dãy số liệu ban đầu và từ bảng phân bố tần số. So
sánh kết quả và giải thích sự khác nhau (nếu có)
Lời giải
1. Xây dựng biểu đồ thân lá và bảng tần số phân bố với 5 tổ có khoảng
cách tổ bằng nhau.
Biểu đồ thân lá
Tổ
Thân

Tổng số lá
1
3
0 0,3 0,7 0,8
4
2
4
0, 0, 0,7 0,7 0,8 0,9
6
5
5
3
5
0,1 0,2 0,3 0,3 0,7
5
4

6
0 0,1 0,1 0,2 0,4 0,4 0, 0,6
8
5
5
7
0 0,2 0,3 0,3 0, 0,8 0,9
7
5

9


Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.
• h = (7,9 – 3,0)/5 = 0,98

Bin

Frequenc
Cumulative %
y
3
1
3,45%
3,98
3
13,79%
4,96
6
34,48%

5,94
5
51,72%
6,92
7
75,86%
More
7
100,00%
b. Tính trung bình từ dãy số liệu ban đầu và từ bảng phân bố tần
số. So sánh kết quả và giải thích sự khác nhau
Bảng tần số phân bố
Khối lượng sản
Trị số giữa Tần số
Tần suất
Tích (xifi)
phẩm
(xi)
(fi)
Từ 3 đến dưới 4
3,5
4
13,33%
14,0
Từ 4 đến dưới 5
4,5
6
20,00%
27,0
Từ 5 đến dưới 6

5,5
5
16,67%
27,5
Từ 6 đến dưới 7
6,5
8
26,67%
52,0
Từ 7 đến dưới 8
7,5
7
23,33%
52,5
Tổng
30
100%
173,0
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
10


5,693333
0,245789
5,85
7,3
1,346242
1,812368
-0,77355
-0,19335
4,9
3
7,9


Giá trị trung bình từ dãy số liệu ban đầu là


x1 =

30

∑ xi

/ n =5,693333

1

Giá trị trung bình tính theo bảng phân bố tần số:
• x 2 = ∑ xifi/∑fi = 173,0/30= 5,7667
c. Nhận xét:

• Một nửa số liệu nhỏ hơn trung bình của khoảng tổ mà nếu ta lấy số trung
bình tính sẽ ra kết quả lớn hơn.
• Trung bình tính theo bảng phân bố tần số Lớn hơn Giá trị trung bình Từ
các số liệu đầu tiên, lý do là trọng số của Từ 6 đến dưới 7 và Từ 7 đến
dưới 8 là 26,67% và 23,33% (tương đương 50%) trong khi phần lá của
chúng đa phần nằm dưới 0,5.
Tài liệu tham khảo.
• Bài giảng môn Thống kê và Khoa học Quyết định - của Chương trình Đào
tạo Thạc sỹ QTKD Quốc tế – Đại học Griggs Hoa Kỳ.
• Tài liệu Thống kê trong Kinh doanh - của Chương trình Đào tạo Thạc sỹ
QTKD Quốc tế – Đại học Griggs Hoa Kỳ.
• Giáo trình Nguyên lý thống kê Kinh tế - của Trưởng Đại học Kinh tế
Thành phố Hồ Chí Minh.

11



×