Thống kê trong kinh doanh
BÀI TẬP CÁ NHÂN
THỐNG KÊ TRONG KINH DOANH
Họ và tên học viên: Đỗ Đức Đạt
Lớp: M0909
Hà Nội, ngày 10 tháng 6 năm 2011
M0909
Đỗ Đức Đạt
1
Thống kê trong kinh doanh
I. Lý thuyết
1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0 và
-1,75 là xác suất của biến X, gọi là P(X) = 0,4599.
Để tính xác suất này ta tính xác suất P(X<1,75) = 0.9599 (tra bảng Cumulative
Standerdized Normal Distribution). Mặt khác ta biết P(-1,75P(X<0) = 0,5 P(-1,752. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi chỉ số
IQ là 1 biến ngẫu nhiên X, tính P(68Gọi trung bình của IQ là µ và độ lệch chuẩn là σ
Cần qui đổi sang kiểm định Z qua công thức Z = (X-µ)/σ = (X-100)/16
P[(68-100)/16Tính phần diện tích dưới đường phân phối chuẩn cho phần diện tích -2
đương 2 lần phần diện tích từ 0
Tra bảng ta có P(-∞
3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Nếu độ tin cậy giảm đi thì khoản tin cậy sẽ rộng hơn. Nếu độ tin cậy giảm σ sẽ
giảm (X-µ)/σ sẽ lớn lên Khoảng tin cậy sẽ rộng hơn.
4.
Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62,84 đến 69,46. Biết σ = 6,5 và
kích thước mẫu là n =100. Hãy tính trung bình mẫu.
Gọi X là trung bình mẫu. Theo công thức ta có X − Zα / 2(σ / n ) ) = 62,84 Zα / 2
= (X-62,84)/ (σ / n ). Tương tự X + Zα / 2(σ / n ) = 69,46 Thay Zα/2 vào phương
trình ta có kết quả X = 66,15.
5. Giá trị p-Value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α = 0,05?
Từ lý thuyết ta có kết quả khi p-Value = 0,025.
II. Bài tập
Bài 1
Sử dụng Megastat ta có kết quả như sau:
Descriptive statistics
count
mean
sample variance
M0909
Số
ngày
30
6.13
3.29
Đỗ Đức Đạt
2
Thống kê trong kinh doanh
sample standard deviation
minimum
maximum
range
1.81
3
10
7
standard error of the mean
0.33
confidence interval 95.%
lower
confidence interval 95.%
upper
half-width
1st quartile
median
3rd quartile
interquartile range
mode
low extremes
low outliers
high outliers
high extremes
5.46
6.81
0.68
5.00
6.00
7.00
2.00
6.00
0
0
0
0
Từ bảng trên ta thấy số ngày trung bình từ khi đặt hàng đến lúc giao hàng nằm trong
khoản từ 5,46 đến 6,81 ngày, trong khi với phương pháp bán hàng cũ thì thời gian giao
hàng là 7,5 ngày, nằm ngoài bên phải khoảng trên do đó có thể kết luận phương pháp bán
hàng mới hiệu quả hơn.
Bài 2
Ta giả thiết rằng µ1 và µ2 là chi phí trung bình của phương án 1 và phương án 2.
Ta có hai giả thiết:
H0: µ1 = µ2
H1: µ1# µ2
Ta sử dụng kiểm định t trong Megastat và kết quả là:
Hypothesis Test: Independent Groups (t-test, pooled variance)
PA 1
29.75
4.45
12
PA2
28.21
4.58
14
24
1.536
20.442
4.521
1.779
0
0.86
.3965
M0909
mean
std. dev.
n
df
difference (PA 1 - PA2)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference
t
p-value (two-tailed)
Đỗ Đức Đạt
3
Thống kê trong kinh doanh
-2.135
5.207
3.671
confidence interval 95.% lower
confidence interval 95.% upper
margin of error
Hypothesis Test: Independent Groups (t-test, unequal variance)
PA 1
29.75
4.45
12
PA2
28.21
4.58
14
mean
std. dev.
n
23
1.536
1.775
0
df
difference (PA 1 - PA2)
standard error of difference
hypothesized difference
0.87
.3958
t
p-value (two-tailed)
-2.136
5.207
3.671
confidence interval 95.% lower
confidence interval 95.% upper
margin of error
Cả hai kết quả cho giá trị p-Value là 0,3965 và 0,3958 đếu lớn hơn α = 5%, do đó bác bỏ
giả thiết H1 chấp nhận giả thiết H0 tức là sử dụng cả hai phương án sản xuất đều có chi phí
trung bình là như nhau.
Bài 3
Gọi µ là ppm bình quân ta kiểm định giả thiết:
H0: µ = 247
H1: µ # 247
Z 0 = ( X − 247) /(σ / n ) = 1,94 (1) với σ = 12 và n = 60
Ta sẽ bác bỏ giả thiết H0 nếu Z0 > Zα/2 hoặc Z0 < - Zα/2
Với α = 0,05 Zα/2 = Z0,025 = 1,96 (2)
Từ (1) và (2) Không thể bác bỏ giả thiết H 0. Tức là mức độ tập trung của toàn bộ lô
hàng là đạt tiêu chuẩn qua kiểm định với mẫu là 60 và mức ý nghĩa là 0,05.
Tương tự như vậy khi α = 0,01 thì Zα/2 = Z0,005 = 2,66 (3)
Từ kết quả (1) và (3) cho thấy chấp nhận giả thiết H 0, nghĩa là mới mức ý nghĩa là 0,01 thì
mức độ tập trung của toàn bộ lô hàng vẫn đạt chuẩn qua kiểm định với mẫu là 60.
Từ kết quả trên ta có thể có hai quyết định: Nhà sản xuất có thể yên tâm với chất lượng
của lô hàng và có thể tung ra thị trường.
Bài 4
a) Sử dụng phần mềm Megastat ta có kết quả
Regression Analysis
M0909
Đỗ Đức Đạt
4
Thống kê trong kinh doanh
r²
r
Std. Error
ANOVA
table
Source
Regression
Residual
Total
0.922
0.960
0.995
n
k
Dep. Var.
13
1
Y
MS
128.3321
0.9908
F
129.53
std.
error
0.9710
t
(df=11)
-3.148
0.0164
11.381
pvalue
.0093
2.00E07
SS
128.3321
10.8987
139.2308
Regression output
coefficient
variables
s
Intercept
-3.0566
X
0.1866
df
1
11
12
p-value
2.00E-07
confidence interval
95%
95%
lower
upper
-5.1938
-0.9194
0.1505
0.2227
Từ bảng kết quả ta có hàn tuyến tính quan hệ giữa thị phần (Y) và chất lượng sản phẩm
(X) như sau:
Y = 0,187*X – 3,057
Hai biến có quan hệ cùng chiều, hay nói cách khác là khi chất lượng sản phẩm tăng lên,
thì thị phần của doanh nghiệp cũng tăng và ngược lại.
b) Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giữa X và Y
Giả thuyết:
H0: ß = 0 ( X và Y không có quan hệ tuyến tính)
H1: ß ≠ 0 ( X và Y có quan hệ tuyến tính)
b
Giá trị kiểm định:
t=
Sb
S²e
Với
Sb =
∑x²i - n x ²
∑e²i
Và S²e =
SSE
=
n-2
= MSE
n-2
Trong đó S²e: phương sai của sai số
M0909
Đỗ Đức Đạt
5
Thống kê trong kinh doanh
Quy tắc quyết định: ở mức ý nghĩa α , bác bỏ H0 nếu:
b
t=
b
< - tn-2, α/2
Sb
hay t =
Sb
> tn-2, α/2
Từ bảng kết quả hồi quy trên ta có:
b = 0.187
; ∑x²i = 45580, x = 56.77
Như vậy ra có Se² = MSE = 0.9908 (tra từ bảng hồi quy)
0.9908
→ Sb =
0.9908
=
45580 – ((13 * (56.77)²
= 0.016401
3683.172
tn-2 = b/Sb = 0.187/0.016401 = 11.402
Và tra bảng phân phối t, ta thấy giá trị kiểm định tính được nằm rất x trong vùng bác bỏ, giá
thuyết H0 bị bác bỏ.
Kết luận: do đó có thể kết luận tồn tại mối liên hệ tuyến tính giữa X và Y (giữa chất
lượng sản phẩm và thị phần).
c) Cho biết hệ số R2 và giải thích ý nghĩa của nó
Từ bảng kết quả trên cho thấy R2 = 0,922 điều này có ý nghĩa là 92,2 sự thay đổi của biến thị
phần Y được giải thích hay ảnh hưởng của biến chất lượng sản phẩm X.
M0909
Đỗ Đức Đạt
6