Tải bản đầy đủ (.doc) (9 trang)

Bài tập thống kê ra quyết định số (55)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (214.92 KB, 9 trang )

MÔN THỐNG KÊ TRONG KINH DOANH

BÀI TẬP CÁ NHÂN
Họ và tên

:

Trần Mỹ Hạnh

Lớp

:

GaMBA.M0210

Ngày

:

20/03/2012

BÀI LÀM
I/ Trả lời câu hỏi:
1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm 0
và –1.75 là xác suất P (-1.75 ≤ Z ≤0), với Z là đại lượng ngẫu nhiên phân phối theo quy
luật chuẩn đơn giản có μ = 0 và σ² = 1.
Lý giải: Theo lý thuyết, Phân phối chuẩn là phân phối của đại lượng ngẫu nhiên liên
tục X nhận giá trị từ –∞ đến +∞ với hàm mật độ xác suất có dạng:
F(x) =
Trong đó:


1

σ 2πσ 2

−( x− µ )2

×e

2σ 2

e = 2.71828

Л = 3.14159
μ: Trung bình

σ: Độ lệch chuẩn

1


Đường mật độ của phân phối chuẩn hóa chính là Đồ thị của hàm f(x) có dạng hình
chuông đối xứng qua đường thẳng x = μ.

2. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16. Gọi
chỉ số IQ là 1 biến ngẫu nhiên X, tính P (68 < X < 132):
Áp dụng công thức câu 1. Ta có:
-

μ = 100


-

σ = 16

-

68
Tức là bài đã cho X~ N(100; 16²), tính P (68≤ X ≤132).
Để tính P theo biến X trước hết ta tính P theo biến Z trong công thức:
Z=

x−µ
σ

P (68 ≤ X ≤ 132) = P ( -2 ≤ Z ≤ 2).
Tra bảng tích phân Laplace, ta có:
P ( -2 ≤ Z ≤ 2) = 0.4772 + 0.4772 = 0.9544
Như vậy, P (68 ≤ X ≤ 132) = 0.9544.
3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?

2


Khoảng tin cậy (CONFIDENCE INTERVAL – CI) là khoảng các giá trị bị chặn giữa
hai giới han tin suy từ dữ liệu mẫu mà giá trị thật của một tham số của một quần thể
được cho là nằm trong đó với một xác suất cụ thể nào đó. Khoảng tin cậy luôn tương
ứng với 1 xác suất nhất định, xác suất đó không bao giờ đạt 100%. Ví dụ khoảng tin cậy
95% hàm ý rằng nếu quá trình ước lượng lặp đi lặp lại nhiều lần thì ta kì vọng 95% các

khoảng tin cậy tính được sẽ chứa giá trị thật của tham số.
Khoảng tin cậy đươc tính theo công thức:
μ = x ± Z. σ

x

= x ± Z. σ n

Độ tin cậy là xác suất để tham số của tổng thể chung rơi vào trong khoảng tin cậy.
Độ tin cậy = (1- α)% với α là xác suất để tham số của tổng thể chung không rơi vào
trong khoảng tin cậy.
Điều đó có nghĩa, nếu độ tin cậy giảm đi thì khoảng tin cậy sẽ hẹp lại.
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết σ =
6.50 và kích thước mẫu n=100. Hãy tính trung bình mẫu :
Với kích thước mẫu là n = 100 có nghĩa là mẫu lớn, trong trường hợp đã biết phương
sai của tổng thể chung (σ), trung bình mẫu x được tính theo công thức sau với giả sử độ
tin cậy là 90% tức là α =10% , α/2 = 5% . Ta có:

α

x- Z2 .

σ

α

n ≤ μ ≤ x+ Z2 .

σ


n

(*)

Theo đề bài:
-

62,84 ≤ μ ≤ 69,46

-

σ = 6,5

-

n = 100

Thay các giá trị vào công thức trên ta được :

x = 66,15

Kết luận: Với độ tin cậy 90%, khi khoảng trung bình tổng thể 62,84 ≤ μ ≤ 69,46
thì trung bình mẫu là 66.15.
5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α= 0.05?
3


a. 0.150

b. 0.100


c. 0.051

d. 0.025

Áp dụng nguyên tắc kiểm định:
p-value ≤ α thì bác bỏ H0 thừa nhận H1
p-value > α thì chưa có cơ sở bác bỏ H0
Như vậy với α = 0.05, p-value = 0.025 dẫn đến việc bác bỏ giả thiết H ο .
II. Hoàn thành bài tập
Bài tập số 1
Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem xét. Để đánh giá
tính hiệu quả của nó xét về mặt thời gian người ta phỏng vấn ngẫu nhiên 30 khách
hàng được bán hàng theo phương pháp mới và ghi lại số ngày từ khi đặt hàng đến khi
giao hàng như sau: 9 6 8 9 7 6 5 5 7 6 6 7 3 10 6 6 7 4 9 7 5 4 5 7 4 6 8 5 4 3.
Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo
phương pháp mới với độ tin cậy 95%. Hãy kết luận về hiệu quả của phương pháp bán
hàng mới so với phương pháp cũ. Biết rằng phương pháp bán hàng cũ có số ngày trung
bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày.
Gọi µ là số ngày trung bình từ khi đặt hàng đến khi giao hàng nếu áp dụng bán hàng
mới theo phương pháp mới
Số ngày trung bình: X = ƩXi/n = 6.13 ngày;
Đây là trường hợp có cỡ mẫu lớn ( n = 30 mẫu) và chưa biết mức độ phân bố của mẫu là
chuẩn hay không, ta áp dụng công thức:
S

µ = X ± tα 2 ( n −1) ⋅
Trong đó,

S=


∑(X

i

−X

n −1

)

n
2

= 1.81

với độ tin cậy 95%, tra bảng được tα 2( n −1) = 2.045
Thay số vào ta tính được: µ = 6.13 ± 2.045*0.33 = 6.13 ± 0.68
Tức 5.45 ≤ µ ≤ 6.81

4


Kết luận: Với độ tin cậy là 95% thì số ngày trung bình từ khi đặt hàng đến khi giao
hàng nếu áp dụng bán hàng theo phương pháp mới nằm trong khoảng từ 5.45 đến 6.81
ngày.
Nếu so với phương pháp bán hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao
hàng là 7.5 ngày thì phương pháp mới có số ngày trung bình từ khi đặt hàng đến khi
giao hàng ít hơn, chứng tỏ, phương pháp mới hiệu quả hơn và nên được áp dụng.
Bài tập số 2

Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm.
Để đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không
người ta tiến hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 25 32 35 38 35 26 30 28 24 28 26 30
Phương án 2: 20 27 25 29 23 26 28 30 32 34 38 25 30 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với mức ý nghĩa
5% hãy rút ra kết luận về hai phương án trên.
Giải:
Gọi µ1 và µ2 là chi phí trung bình của phương án 1 và phương án 2.
Ta có cặp giải thiết cần kiểm định:
H0 : µ1 = µ 2

(phương án 1 giống phương án 2)

H1 : µ1 ≠ µ 2

(phương án 1 khác phương án 2)

Theo số liệu của bài ra, với phương án 1 có n1 = 12, trung bình X1 tính được là 29,75
Với phương án 2, n=14, trung bình X2 = 27,92
Đây là trường hợp so sánh 2 trung bình của tổng thể chung với hai mẫu độc lập khi
chưa biết phương sai của tổng thể chung, số lượng đơn vị mẫu nhỏ (dưới 30), tiêu chuẩn
kiểm định được chọn là t, 2 phía.
Tính toán theo bảng Excel ta có:
Sp2 = 18,95 và t = 1,02
Với độ tin cậy là 95% => α = 5% tra bảng ta được tα/2 = 2,0452
Như vậy, kết quả không thuộc miền bác bỏ, tức là chưa đủ cơ để để bác bỏ H 0

5



Kết luận: Với độ tin cậy 95% và số lượng đơn vị mẫu được chọn trong 2 phương án
trên, ta chưa có bằng chứng để chứng tỏ chi phí trung bình của hai phương án là khác
nhau.
Bài tập số 3:
Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm) của một loại
hoá chất xác định. Nếu mức độ tập trung lớn hơn 247 ppm, loại thuốc này có thể gây ra
một số phản ứng phụ; nếu mức độ tập trung nhỏ hơn 247 ppm, loại thuốc này có thể sẽ
không có hiệu quả. Nhà sản xuất muốn kiểm tra xem liệu mức độ tập trung bình quân
trong một lô hàng lớn có đạt mức 247 ppm yêu cầu hay không. Một mẫu ngẫu nhiên
gồm 60 đơn vị được kiểm nghiệm và người ta thấy rằng trung bình mẫu là 250 ppm và
độ lệch chuẩn của mẫu là 12 ppm.
a. Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô hàng là 247 ppm
với mức ý nghĩa α = 0.05. Thực hiện điều đó với α =0.01.
b. Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng này? Nếu lô
hàng đã được bảo đảm rằng nó chứa đựng mức độ tập trung bình quân là 247 ppm,
quyết định của bạn sẽ như thế nào căn cứ vào việc kiểm định giả thiết thống kê?
1. Kiểm định
Cặp giả thiết cần kiểm định là:
-

H0: µ = 247 ppm

-

H1: µ ≠ 247 ppm

Đây là dạng kiểm định giả thiết về giá trị trung bình của tổng thể chung trong trường
hợp mẫu lớn (n=60) và chưa biết phương sai tổng thể chung, kiểm định hai phía, tiêu
chuẩn kiểm định được chọn là Z.

Trường hợp này được áp dụng công thức sau:
Z=

( X − µ) × n
σ

Thay số vào ta có
Z=

(250 − 247) × 60
= 1.936
12

* Với α = 0.05 ; Tra bảng ta có Z 0.5 −α / 2 = Z 0.475 ~ 2.33
Vì /Z/ < Z 0.5 −α / 2 nên có thể kết luận rằng, mẫu đã điều tra chưa đủ cơ sở để bác bỏ H 0
6


Do đó, có thể tạm thời chấp nhận rằng mức độ tập trung bình quân của lô hàng đúng là
247ppm.
2. Kết luận cá nhân:
Kết quả tính toán được cho phép tạm thời chấp nhận mức độ tập trung bình quân của lô
hàng là 247ppm. Tuy nhiên, điều đó không đồng nghĩa với việc tất cả lô hàng đều đúng
là 247ppm mà chỉlà vì số lượng mẫu điều tra chưa đủ bằng chứng thống kê để bác bỏ.
Xét thấy hàng hóa trong trường hợp này là thuốc chữa bệnh, có thể gây ra phản ứng phụ
ảnh hưởng đến tính mạng con người, nên việc chỉ kiểm nghiệm 60 mẫu là chưa đủ lớn.
Tôi nghĩ, cần phải kiểm định toàn bộ lô hàng để đảm bảo chắc chắn rằng tất cả đều chứa
đựng mức độ tập trung bình quân là 247 ppm. Nếu việc kiểm định lô hàng bảo đảm rằng
tất đều chứa đựng mức độ tập trung bình quân là 247 ppm, dẫn đến bác bỏ giả thiết H0,
chấp nhận giả thiết H1 thì lúc đó mới có thể đưa vào sản xuất.

Bài tập số 4:
Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị phần của nhà sản
xuất bằng cách sử dụng thông tin về chất lượng sản phẩm của họ. Giả sử rằng các số
liệu sau là thị phần đã có tính theo đơn vị phần trăm (%) (Y) và chất lượng sản phẩm
theo thang điểm 0-100 được xác định bởi một quy trình định giá khách quan (X).
X: 27, 39, 73, 66, 33, 43, 47, 55, 60, 68, 70, 75, 82.
Y: 2, 3, 10, 9, 4, 6, 5, 8, 7, 9, 10, 13, 12.
a. Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất lượng sản
phẩm. Kết luận ?
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giưa X và Y.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.
1. Xác định hàm hồi quy và ước lượng cho β1 của tổng thể chung
Goi X là Chất lượng sản phẩm, Y là Thị phần, ta cần xét mối quan hệ ảnh hưởng lẫn
nhau giữa hai biến X và Y. Biến X được xem là biến độc lập ảnh hưởng đến biến Y còn
Y được xem là biến phụ thuộc chịu ảnh hưởng bởi biến X.
Dùng EXCEL để tính toán ta có bảng sau:
SUMMARY OUTPUT
Regression Statistics
Multiple R
R Square

0,9601
0,9217
7


Adjusted R
Square
Standard
Error

Observations

0,9146
0,9954
13

ANOVA
df
Regression
Residual
Total

Intercept
Điểm

1
11
12

MS
128,3321
0,990789

F
129,5252

Significanc
eF
2E-07


t Stat

P-value

Lower 95%

3,147805

0,009278

0,0164 11,3809

2E-07

SS
128,3321
10,89868
139,2308

Coefficient
s

Standard
Error

-3,057
0,1866

0,97102


Upper
95%

Lower
95,0%

Upper
95,0%

-5,19378

-0,91938

5,19378

-0,91938

0,15054

0,222727

0,15054

0,222727

Dựa vào cột Coeficients ta có phương trình hồi quy tuyến tính thể hiện mối liên hệ giữa
điểm chất lượng và thị phần có dạng như sau:

Y^ = - 3.057+0.1866 X
Như vậy ta có thể nói rằng với độ tin cậy 95%:

-

Với b1 = 0.1866 nghĩa là khi điểm chất lượng tăng thêm 1 thì thị phần tăng trung
bình 0.1866%.

-

Với b0 = -3.057 khi Y = 0 thì X = 16.38 tức là điểm chất lượng phải > 16.38 thì mới

bắt đầu có thể bán được hàng (thị phần >0).
Tuy nhiên, phương trình hồi quy tuyến tính trên không phải hoàn toàn chính xác mà cho
phép sai số với độ sai số (Standard Error) theo bảng Excel là Sb1 = 0.9954
Áp dụng công thức:
β1 = b1 ± tα / 2;n − 2 ⋅ S b1

Thay số và tra bảng ta tính được:
0.15% ≤ β1 ≤ 0.22%
Kết luận: Với độ tin cậy 95%, khi chất lượng sản phẩm tăng 1 điểm thì thị phần sẽ tăng
từ 0.15% đến 0.22%.
2. Kiểm định
Để kiểm định mối liên hệ tuyến tính giữa X và Y, ta dùng kiểm định t
Gọi β1 là hệ số hồi quy của tổng thể mẫu được dùng để kiểm định.
Giả thiết rằng:
8


-

H0: β1 = 0 (chất lượng sản phẩm không ảnh hưởng tới thị phần).


-

H1: β1 ≠ 0 (chất lượng sản phẩm có ảnh hưởng tới thị phần).

Áp dụng công thức: t =
Thay số:

t=

b1
Sb1

0.1866
= 11.38
0.0164

α = 2E-07 < 0.05 => t thuộc miền bác bỏ
Ta được quyền bác bỏ giả thiết H0 nhận giả thiết H1.
Như vậy với độ tin cậy 95% chất lượng sản phẩm có ảnh hưởng đến thị phần của sản
phẩm trên thị trường
3. Giải thích mô hình
R2 là tỷ lệ phần biến động của Y được giải thích từ X, là sự phụ thuộc của Y vào X. Với R 2 =

0.9217 nghĩa là với 92.27% sự thay đổi của thị phần được giải thích bởi mô hình trên
trong mối quan hệ với điểm chất lượng sản phẩm.
R = 0.96 Nghĩa là đây là mối liên hệ tương quan tuyến tính thuận và rất chặt chẽ.

9




×