Thống kê trong kinh doanh
BÀI KIỂM TRA HẾT MÔN
Môn học:
Thống kê trong kinh doanh
Học viên:
Lê Trần Nhật
Lớp:
GaMBA 01.N03
CÂU HỎI
Trả lời các câu hỏi sau đây, giải thích rõ cách làm
1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và
–1.75 là:
2. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi
chỉ số IQ là 1 biến ngẫu nhiên X, tính P (68 < X < 132):
3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết δ = 6.50
và kích thước mẫu n=100. Hãy tính trung bình mẫu :
5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
a. 0.150
b. 0.100
c. 0.051
d. 0.025
Hoàn thành các bài tập sau đây:
Bài 1:
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét. Để đánh
giá tính hiệu quả của nó xét về mặt thời gian người ta phỏng vấn ngẫu nhiên 30 khách
hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi
giao hàng như sau:
9
6
8
9
7
6
5
5
7
6
6
7
3
10
6
6
7
4
9
7
5
4
5
7
4
6
8
5
4
3
Thống kê trong kinh doanh
Hãy ước lượng số ngày trung bình khi đặt hàng đến khi giao hàng khi bán hàng
theo phương pháp mới với độ tin cậy 95%. Hãy kết luận về hiệu quả của phương
pháp bán hàng mới so với phương pháp cũ. Biết rằng phương pháp bán hàng cũ có số
ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày.
Bài 2:
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản
phẩm. Để đánh giá xem chi phí trung bình hai phương án ấy có khác nhau hay không
người ta tiến hành sản xuất thừ và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với mức ý
nghĩa 5% hãy rút ra kết luận về hai phương án trên.
Bài 3:
Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một
loại hoá chất xác định. Nếu mức độ tập trung lớn hơn 247 ppm, loại thuốc này có
thể gây ra một số phản ứng phụ; nếu mức độ tập trung nhỏ hơn 247 ppm, loại
thuốc này có thể sẽ không có hiệu quả. Nhà sản xuất muốn kiểm tra xem liệu
mức độ tập trung bình quân trong một lô hàng lớn có đạt mức 247 ppm yêu cầu
hay không. Một mẫu ngẫu nhiên gồm 60 đơn vị được kiểm nghiệm và người ta thấy
rằng trung bình mẫu là 250 ppm và độ lệch chuẩn của mẫu là 12 ppm.
a. Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247
ppm với mức ý nghĩa α = 0.05. Thực hiện điều đó với α=0.01.
b. Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng này?
Nếu lô hàng đã được bảo đảm rằng nó chứa đựng mức độ tập trung bình quân là
247 ppm, quyết định của bạn sẽ như thế nào căn cứ vào việc kiểm định giả thiết
thống kê?
Bài 4:
Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của
nhà sản xuất bằng cách sử dụng thông tin về chất lượng sản phẩm của họ. Giả sử
rằng các số liệu sau là thị phần đã có tính theo đơn vị phần trăm (%) (Y) và chất
lượng sản phẩm theo thang điểm 0-100 được xác định bởi một quy trình định giá
khách quan (X).
X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68,70, 75, 82.
2
Thống kê trong kinh doanh
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9,
10, 13, 12.
a. Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất
lượng sản phẩm. Kết luận ?
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giưa X và Y.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.
BÀI LÀM
Trả lời các câu hỏi sau đây, giải thích rõ cách làm
1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và
–1.75 :
Nếu X ~ N(µ,σ ) để tính P ( -1.75 < X < 0)
Tính diện tích từ -1.75 → - ∞
P < -1.75 < Z < 0 → P (- ∞ < Z < 1.75)
0.9599 – 0.5 = 0.4599
Như vậy diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa
hai điểm 0 và –1.75 là: 0.4599
2. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi
chỉ số IQ là 1 biến ngẫu nhiên X, tính P (68 < X < 132):
Bài toán đã cho µ = 100; σ = 16 → X ~ N(100,16 )
yêu cầu tìm P (68 < X < 132)
X-µ
Trước tiên ta đổi biến X thành biến Z theo công thức Z =
σ
68 – 100
P (68 < X < 132) = P (
132 - 100
) = P ( -2 < Z < 2)
16
16
Sử dụng phần mềm Megastat ta có:
Normal distribution
→
P(lower)
P(uppe
r)
.0228
.9772
z
X
mean
std.dev
.9772
-2.00
68
100
16
.0228
2.00
132
100
16
P (68 < X < 132 ) = P ( 0.228 < Z < 0.9772 )
3
Thống kê trong kinh doanh
3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
- Độ tinh cậy là xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy.
- Biểu hiện: Độ tin cậy = (1- α )%
α là xác suất để tham số của tổng thể chung không rơi vào trong khoảng tin cậy.
- Khi độ tin cậy giảm tức là (1- α ) giảm khi đó α tăng. Suy ra Z£/2 thu hẹp về phía 0.
Như vậy khoảng tin cậy sẽ hẹp lại.
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết δ = 6.50
và kích thước mẫu n=100. Hãy tính trung bình mẫu :
Khoảng tin cậy cho trung bình tổng thể từ 62.84 đến 69.46. Như vậy ta có:
x - Zα/2 δ/√n = 62.84 (*)
x + Zα/2 δ/√n = 69.46 (*)
→ 2 (Zα/2 δ/√n) = 69.46 - 62.84 = 6.62 (*)
Thay δ = 6.50 và n=100 vào (*) ta có:
2 (Zα/2 6.50/√100) = 6.62 → Zα/2 6.50/√100 = 3.31→ Zα/2 = 0.0509
Thay số vào (*) ta có trung bình mẫu = 66.15
5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
a. 0.150
b. 0.100
c. 0.051
d. 0.025
Nếu p-value ≤ α → sẽ dẫn đến việc bác bỏ giả thiết H0
Nếu p-value > α → sẽ dẫn đến việc không bác bỏ giả thiết H0
Như vậy với giá trị p-value = 0.025 < α= 0.05 sẽ dẫn đến việc bác bỏ giả thiết H0
Hoàn thành các bài tập :
4
Thống kê trong kinh doanh
Bài 1:
Áp dụng phần mềm Megastat ta có kết quả:
Descriptive statistics
#1
count
30
mean
6.13
sample variance
3.29
sample standard deviation
1.81
minimum
3
maximum
10
range
7
Confidence interval - mean
95%
confidence level
6.133333333
mean
1.814374279
std. dev.
30
n
1.960
z
0.6493
half-width
6.7826
upper confidence limit
5.4841
lower confidence limit
Như vậy với kết quả trên cho ta thấy:
- Số ngày trung bình khoảng từ 5.48 → 6.78 ngày, với độ tin cậy 95%
- Phương pháp bán hàng mới hiệu quả hơn so với phương pháp cũ trên giác độ
thời gian từ khi đặt hàng đến khi giao hàng. (µ < 7.5 ngày)
Bài 2:
Đây là trường hợp chưa biết phương sai của tổng thể chung σ12,σ22 mẫu nhỏ (n1, n2
< 30)
Giải thiết: µ1: phương án 1, µ2: phương án 2
H0 :
µ1 = µ2 (Phương án 1 giống phương án 2)
H1 :
µ1 ≠ µ2 (Phương án 1 khác phương án 2)
5
Thống kê trong kinh doanh
Tiêu chuẩn kiểm định được chọn là thống kê t
Sử dụng phần mềm MegaStat ( tính cho cả 2 trường hợp t-test) ta có kết quả:
Hypothesis Test: Independent Groups (t-test, pooled
variance)
PA1
29.75
4.45
12
PA2
28.21
4.58
14
24
1.536
20.442
4.521
1.779
0
0.86
.3965
mean
std. dev.
n
df
difference (PA1 - PA2)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference
t
p-value (two-tailed)
Hypothesis Test: Independent Groups (t-test, unequal
variance)
PA1
29.75
4.45
12
PA2
28.21
4.58
14
mean
std. dev.
n
23
1.536
1.775
0
df
difference (PA1 - PA2)
standard error of difference
hypothesized difference
0.87
.3958
t
p-value (two-tailed)
Từ kết quả trên cho ta thấy với cả 2 trường hợp cho kết quả t và p-value chênh
lệch không đáng kể. Cụ thể t = 0.86 và p-value = 0.3965
Như vậy với p-value = 0.3965 < α = 5%. Suy ra không bác bỏ giải thiết H0 tức
là µ1 = µ2: Có nghĩa chi phí tring bình của Phương pháp 1 giống chi phí trung
bình của phương pháp 2 .
6
Thống kê trong kinh doanh
Bài 3:
Theo đề bài ta có:
δ = 12
H0 = 247
H1 ≠ 247
n = 60
a. Kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247
ppm với mức ý nghĩa α = 0.05.
Giả thiết rằng chi phí trung bình theo hai phương án là chi phí chuẩn.
Giả sử tổng thể có trung bình là µ chưa biết. Ta cần kiểm tra giả thuyết:
H0 :
µ = µ0 (µ0 cho trước) = 247 (ppm)
H1 :
µ ≠ µ0
Căn cứ vào mẫu gồm 60 quan sát độc lập ta đưa ra quy tắc bác bỏ hay không thể bác
bỏ giả thuyết trên với mới ý nghĩa α = 0.05.
- Nếu Z0 < - Zα/2 hoặc Z0 > - Zα/2 ta bác bỏ giả thuyết H0
- Nếu -Zα/2 ≤ Z0 ≤ Zα/2 ta không thể bác bỏ giá thuyết H0
Do ta có mẫu lớn n = 60 > 30 và δ đã biết, tính giá trị kiểm định:
X - µ0
250 - 247
Z0 = ---------- = -------------- = 1.94
δ/√n
12/√60
Dựa vào α ta tìm Zα/2 = Z0.05/2 = Z0.025 =1.96
Như vậy -1.96 < 1.94 < 1.96. Ta không thể bác bỏ giả thuyết H 0, tức là thông tin
từ mẫu đảm bảo được chất lượng đạt 247ppm.
Sử dụng phần mềm Megastat để kiểm định kết quả:
Hypothesis Test: Mean vs. Hypothesized Value
250.00
247.00
12.00
1.55
60
hypothesized value
mean Data
std. dev.
std. error
n
7
Thống kê trong kinh doanh
-1.94
.0528
243.96
250.04
3.04
z
p-value (two-tailed)
confidence interval 95.% lower
confidence interval 95.% upper
margin of error
• Kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247
ppm với mức ý nghĩa α = 0.01.
Dựa vào α ta tìm Zα/2 = Z0.01/2 = Z0.005 = 2.66
Như vậy ta có -2.66 < 1.94 < 2.66. Ta không thể bác bỏ giả thuyết H0, tức là
thông tin từ mẫu đảm bảo được chất lượng đạt 247ppm.
b. Từ những kiểm định giả thuyết và kết luận trên, tức là thông tin từ mẫu
đảm bảo được chất lượng đạt mức 247ppm (mức độ tập trung của lô hàng là
không lớn hoan và cũng không nhỏ hơn 247ppm). Như vậy với m ức độ tập
trung = 247 cho nên đảm bảo yêu cầu trong điều trị bệnh vì thuốc sẽ có hiệu quả điều trị
như mong muốn mà cũng không gây ra phản ứng phụ.
Như vậy lô hàng này đảm bảo yêu cầu chữa bệnh. Và quyết định của cá nhân
tôi là nên sản xuất và cung cấp sản phẩm cho thị trường.
Bài 4:
a.
Ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng
sản phẩm.
Do ở đây có 1 biến phụ thuộc với một biến độc lập, do đó dạng mô hình hồi quy
tuyến tính của mẫu có dạng như sau:
Yi = α + ß Xi (*)
Từ bảng số liệu đã cho ta có:
STT
Chất lượng
SP (điểm) -X
Thị phần
(%)-Y
X²
XY
1
27
2
729
54
2
39
3
1521
117
3
73
10
5329
730
8
Thống kê trong kinh doanh
4
66
9
4356
594
5
33
4
1089
132
6
43
6
1849
258
7
47
5
2209
235
8
55
8
3025
440
9
60
7
3600
420
10
68
9
4624
612
11
70
10
4900
700
12
75
13
5625
975
13
82
12
6724
984
Cộng
738
98
45580
6251
Biến X là biến chất lượng sản phẩm
Biến Y là biến thị phần
∑Xi
Ta có: X =
= 738/13 = 56.77
n
Y = (∑Y)/n = 98/13 = 7.54
n
∑ XiYi – n(X)(Y)
6251 – 13(56.77)(7.54)
i=1
Trong đó ta có ß
=
=
n
= 0.187
45580 – 13 (56.77)²
∑ X²i – n(X)²
i=1
Ta lại có α
=
Y – ß X = 7.54 – (0.187*56.77) = -3.057
9
Thống kê trong kinh doanh
Thay ß, α vào hàm (*) ta có:
Y = - 3.057 + 0.187 X hay Y = 0.187 X - 3.057
Sử dụng chương trình phần mềm Megastat để kiểm định kết quảt:
Regression Analysis
r²
Adjusted r²
r
Std. Error
n
k
Dep. Var.
ANOVA table
Source
Regression
Residual
Total
SS
128,3321
10,8987
139,2308
Regression output
coefficient
variables
s
Intercept
-3,0566
X
0,1866
0,922
0,915
0,960
0,995
13
1
Y
df
MS
F
1
11
12
128,3321
0,9908
129,53
std. error
0,9710
t
(df=11)
-3,148
0,0164
11,381
p-value
,0093
2,00E07
p-value
2,00E07
confidence interval
95%
95%
lower
upper
-5,1938 -0,9194
0,1505
0,2227
b. Kiểm định sự tồn tại của mối liên hệ tương quan tuyến tính giữa X và Y
10
Thống kê trong kinh doanh
Giả thuyết:
H0: ß = 0 ( X và Y không có quan hệ tuyến tính)
H1: ß ≠ 0 ( X và Y có quan hệ tuyến tính)
b
Giá trị kiểm định:
t=
Sb
S²e
Với
Sb =
∑x²i - n x ²
∑e²i
Và S²e =
SSE
=
n-2
= MSE
n-2
Trong đó S²e: phương sai của sai số
Quy tắc quyết định: ở mức ý nghĩa α , bác bỏ H0 nếu:
b
t=
b
< - tn-2, α/2
hay
t=
Sb
> tn-2, α/2
Sb
Từ bảng kết quả hồi quy trên ta có:
b = 0.187
; ∑x²i = 45580, x = 56.77
Như vậy ra có Se² = MSE = 0.9908 (tra từ bảng hồi quy)
0.9908
→ Sb =
0.9908
=
45580 – ((13 * (56.77)²
= 0.016401
3683.172
tn-2 = b/Sb = 0.187/0.016401 = 11.402
11
Thống kê trong kinh doanh
Và tra bảng phân phối t, ta thấy giá trị kiểm định tính được nằm rất x trong vùng bác
bỏ, giá thuyết H0 bị bác bỏ.
Kết luận: do đó có thể kết luận tồn tại mối liên hệ tuyến tính giữa X và Y (giữa chất
lượng sản phẩm và thị phần).
c. Cho biết hệ số R2 và giải thích ý nghĩa:
R2 là hệ số xác định đo lường phần biến thiên của Y (thị phần) có thể được giải
thích bởi biến độc lập X (chất lượng sản phẩm), đây chính là đại lượng thể hiện sự thích
hợp của mô hình hồi quy bội đối với dữ liệu. R 2 càng lớn thì mô hình hối quy bội xây
dựng được xem là càng thích hợp và càng có ý nghĩa trong việc giải thích sự biến thiên
của Y.
Theo kết quả từ phân tích hồi quy tuyến tính ở trên ta có:
R² = 0.922 = 92.2% như thế cho ta thấy 92,2% sự biến đổi của thị phần có thể được giải
thích bằng sự biến đổi của chất lượng sản phẩm.
12