Tải bản đầy đủ (.doc) (11 trang)

Bài tập thống kê ra quyết định số (6)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (878.52 KB, 11 trang )

BÀI TẬP CÁ NHÂN
Họ và tên: Nguyễn Tiến Dũng
Lớp:

GaMBA.M0110

Môn học:

Thống kế và Khoa học quyết định

A. PHẦN CÂU HỎI

1. Diện tích nằm dưới đường mật độ của phân phối chuẩn hóa và giữa hai điểm
0 và -1.75 là:
Từ hình vẽ dưới đây chúng ta nhận thấy phần diện tích S = P(lower) tại 0 P(lower) tại (-1.75) = 0.5-0.041 = 0.459

2. Chỉ số IQ có phân phối chuẩn với trung bình là 100 và độ lệch chuẩn là 16.
Gọi chỉ số IQ là 1 biến ngẫu nhiên, tính P (68 < X < 132).
Từ độ lệch chuẩn σ = 16, ta có 2σ = 32 => P (68 Ta cũng có thể tính theo diện tích của đồ thị sau đây với P (thấp hơn) tại X =
132 và P (thấp hơn) X = 68: P (68 1


3. Nếu độ tin cậy giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Theo định nghĩa độ tin cậy (1-α) là xác suất để tham số của tổng thể chung
rơi vào trong khoảng tin cậy, như vậy khi độ tin cậy (1- α) mà giảm đi thì khoảng
tin cậy sẽ hẹp lại.
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. Biết
σ = 6.5 và kích thước mẫu n = 100. Hãy tính trung bình mẫu.
σ


= 69.46
n
σ
= 62.84
n

X + Zα / 2
X − Zα / 2

(1) − ( 2)


(1)
( 2)



2Z α / 2

Z α / 2 = 6.62 :

X = 62.84 + 5.09


n

σ
= 69.46 − 62.84 = 6.62
n


= 6.62

6 .5
100

100
= 5.09
13

= 66.14

5. Giá trị p-value nào sau đây sẽ dẫn đến việc bác bỏ giả thiết H0 nếu α=0.05?
a. 0.150

b. 0.100

c. 0.051

d. 0.025

Đối chiếu với các giá trị p-value trên (0.15, 0.10, 0.51 và 0.025) chúng ta
thấy chỉ có p-value = 0.025 là nhỏ hơn α (α = 0.05) do vậy trong trường hợp
α = 0.05 thì p-value = 0.025 sẽ dẫn tới việc bác bỏ giả thiết Ho (Đáp án d).
2


B. PHẦN BÀI TẬP

Bài số 1. Một phương pháp bán hàng mới theo đơn đặt hàng đang được xem
xét. Để đánh giá tính hiệu quả của nó xét về mặt thời gian, người ta phỏng vấn

ngẫu nhiên 30 khách hàng được bán hàng theo phương pháp mới và ghi lại số
ngày từ khi đặt hàng đến khi giao hàng:
9

6

8

9

7

6

5

5

7

6

6

7

3

10


6

6

7

4

9

7

5

4

5

7

4

6

8

5

4


3

Hãy ước lượng số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán
hàng theo phương pháp mới với độ tin cậy 95%. Hãy kết luận về hiệu quả của
phương pháp bán hàng mới so với phương pháp cũ. Biết rằng phương pháp bán
hàng cũ có số ngày trung bình từ khi đặt hàng đến khi giao hàng là 7,5 ngày.
Từ số đề bài cho chạy phần mềm Megastat ta có:
Descriptive statistics
Count
Mean
sample variance
sample standard deviation
Minimum
Maximum
Range

#1
30
6.13
3.29
1.81
3
10
7

standard error of the mean

0.33

confidence interval 95.% lower

confidence interval 95.% upper
half-width

5.46
6.81
0.68

Số ngày trung bình từ khi đặt hàng đến khi giao hàng khi bán hàng theo
phương pháp mới với độ tin cậy 95% là 6.13 ngày.
3


Theo phương pháp bán hàng mới thì số ngày từ khi đặt hàng đến khi giao
hàng ứng với khoảng tin cậy 95% mức thấp và mức cao lần lượt là 5.46 ngày và
6.81 ngày; trong khi đó số ngày trung bình từ khi đặt hàng đến khi giao hàng theo
phương pháp cũ là 7.5 ngày nhiều ngày hơn so với phương pháp mới ⇒ Phương
pháp bán hàng mới hiệu quả hơn.
Bài số 2. Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một
loại sản phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có
khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau:
(ngàn đồng)
Phương án 1: 25

32 35 38 35

26

30 28 24 28 26 30

Phương án 2: 20


27 25 29 23

26

28 30 32 34 38 25

30

28

Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn, hãy rút ra
kết luận về hai phương án sản xuất một loại sản phẩm.. Với mức ý nghĩa 5%,
hãy rút ra kết luận về hai phương án trên.
Từ số đề bài cho chạy phần mềm Megastat ta có:
Descriptive statistics
p/a A

p/a B

count
mean
sample variance
sample standard deviation
Minimum
Maximum
Range

12
29.75

19.84
4.45
24
38
14

14
28.21
20.95
4.58
20
38
18

1st quartile
Median
3rd quartile
interquartile range
Mode

26.00
29.00
32.75
6.75
35.00

25.25
28.00
30.00
4.75

25.00

0
0
0
0

0
0
1
0

low extremes
low outliers
high outliers
high extremes

4


5


Giả sử: X là chi phí cho p/a 1 (p/a A): X ~ N(µ1,σ12)
Y là chi phí cho p/a 2 (p/a B): Y ~ N(µ2,σ22)

 H 0 : µ1 = µ 2
 H 1 : µ1 ≠ µ 2

Cặp giả thiết: 

X = 29.75;

S1 = 4.45

Y = 28.21;

S 2 = 4.58

Vì S1và S2 không khác nhau nhiều => dùng phương sai hỗn hợp (pooled variance).

6


Hypothesis Test: Independent Groups (t-test, pooled variance)
p/a A
29.75
4.45
12

p/a B
28.21
4.58
14
24
1.536
20.442
4.521
1.779
0
0.86

.3965

mean
std. dev.
n
df
difference (p/a A - p/a B)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference
t
p-value (two-tailed)

Hypothesis Test: Independent Groups (t-test, unequal variance)
p/a A
29.75
4.45
12

p/a B
28.21
4.58
14
23
1.536
1.775
0
0.87
.3958


mean
std. dev.
n
df
difference (p/a A - p/a B)
standard error of difference
hypothesized difference
t
p-value (two-tailed)

Theo các bảng phân tích thống kê mô tả, đồ thị phân tích và số liệu thống kê
phương án kiểm định các phương án sản xuất trên, chúng ta có một số nhận xét, kết
luận như sau:
- Phương án A (12 quan sát) có chi phí trung bình cao hơn phương án B (14
quan sát), p/a A: 29.12 ngàn đồng và p/a B: 28.21 ngàn đồng.
- Độ lệch chuẩn của p/a A và p/a B khác nhau không đáng kể, có thể coi như
bằng nhau (p/a A: 4.45, p/a B: 4.58).
- Khoảng tứ phân vị của p/a A lớn hơn p/a B (6.75 và 4.75). Tứ phân vị thứ
nhất và trung vị của 02 phương án chênh lệch nhau khoảng 1.0 (p/a A cao hơn).
Mod của của p/a A là 35.0 và p/a B là 25.
- Trên biểu đồ BoxPlot & Curve Plot thì cả 2 p/a A và B có phân bố gần với
phân bố chuẩn, tuy nhiên p/a A hơi cong xuống dưới (Curve Plot) tức là lệch sang
phải một chút (BoxPlot), không có giá trị ngoại lai hay đột xuất. Curve Plot của p/a
B thẳng tức là phân phối chuẩn khá hợp lý và có 01 giá trị ngoại lai.
7


- Theo giả thiết là chi phí của 2 phương án sản xuất trên phân phối theo quy
luật chuẩn với mức ý nghĩa 5% và trên cơ sở sử dụng kiểm định giả thuyết cho

trường hợp độ lệch chuẩn của 2 phương án coi như bằng nhau và khác nhau (có thể
dùng phương sai hỗn hợp -pooled và unequal variance) đều cho kết quả là số
p-value ứng với t kiểm định là 0.86/0.87 gần như không có sai khác nhau ~39.6%
>>α ⇒ Chấp nhận giả thiết H 0 tức là chi phí trung bình của 2 phương án sản xuất
trên là như nhau.
Bài số 3. Một loại thuốc chữa bệnh chứa bình quân 247 parts per million (ppm)
của một loại hóa chất xác định. Nếu mức độ tập trung lớn hơn 247 ppm, loại
thuốc này có thể gây ra một số phản ứng phụ, nếu mức độ tập trung nhỏ hơn
247 ppm, loại thuốc này có thể sẽ không có hiệu quả. Nhà sản xuất muốn kiểm
tra xem liệu mức độ tập trung bình quân trong một lô hàng lớn có đạt mức 247
ppm yêu cầu hay không. Một mẫu ngẫu nhiên gồm 60 đơn vị được kiểm
nghiệm và người ta thấy rằng trung bình mẫu là 250 ppm và độ lệch chuẩn của
mẫu là 12 ppm.
a. Hãy kiểm định rằng mức độ tập trung bình quân trong toàn bộ lô
hàng 247 ppm với mức ý nghĩa α=0.05. Thực hiện điều đó với α=0.01.
b. Kết luận của bạn như thế nào? Bạn có quyết định gì đối với lô hàng
này? Nếu lô hàng đã được đảm bảo rằng nó chứa đựng mức độ tập trung bình
quân là 247 ppm, quyết định của bạn sẽ như thế nào căn cứ vào việc kiểm định
giả thiết thống kê?

 H 0 : µ = 247
 H 1 : µ ≠ 247

Kiểm định cặp giả thiết sau: 

Trường hợp này số quan sát là 60, do vậy có thể dùng t hoặc Z đều được.
Hypothesis Test: Mean vs. Hypothesized Value

247.00
250.00

12.00
1.55
60
59
1.94
.0576

hypothesized value
mean ppm
std. dev.
std. error
N
Df
T
p-value (two-tailed)

8


Giá trị p-value của kiểm định là 0.0576, nếu chúng ta kiểm định mức độ tập
trung của lô hàng với mức ý nghĩa α = 0.05 thì p-value> α ⇒ Không bác bỏ giả thiết
H0 tức là không bác bỏ giả thiết mức độ tập trung của lô hàng là 247 ppm. Tương
như vậy, với mức α = 0.01 thì p-value càng lớn hơn α ⇒ Không bác bỏ giả thiết lô
hàng có mức độ tập trung là 247 ppm.
Căn cứ vào kết quả kiểm định trên, nếu lô hàng đảm bảo có mức độ tập trung
là 247 ppm ⇒ Loại thuốc chữa bệnh trên có hiệu quả và không gây ra phản ứng phụ.
Tiếp tục cho nhập hoặc sản xuất loại thuốc chữa bệnh trên.
Bài số 4. Gần đây, một nhóm nghiên cứu đã tập trung vào vấn đề dự đoán thị
phần của nhà sản xuất bằng cách sử dụng thông tin về chất lượng sản phẩm
của họ. Giả sử rằng các số liệu sau là thị phần đã có tính theo đơn vị phần trăm

(%) (Y) và chất lượng sản phẩm theo thang điểm 0-100 được xác định bởi một
quy trình định giá khách quan (X).
X:

27,

39,

73,

66,

33,

43,

47,

55,

60,

68,

70,

75,

82.


Y:

2,

3,

10,

9,

4,

6,

5,

8,

7,

9,

10,

13, 12.

a. Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và
chất lượng sản phẩm. Kết luận?

9



Từ đồ thị rải điểm hay còn gọi là đồ thị phân tán giữa chất lượng sản phẩm
(X) và thị phần trên (Y), chúng ta nhận thấy rằng khi chất lượng sản phẩm tăng cao
thì thị phần cũng tăng lên và ngược lại. Khi chất lượng sản phẩm được đánh giá
mức 80 thì thị phần của sản phẩm có thể lên tới trên 12% và thị phần thấp nhất
xuống tới 2% khi xếp hạng mức thang chất lượng sản phẩm là 27.
Các điểm thống kê từ tệp số liệu đã cho được vẽ (Plot) hình trên phân bố khá
đều dọc theo đường hồi qui tuyến tính có phương trình y = 0.187x – 3.057 ⇒ Có
mối liên hệ tuyến tính giữa chất lượng sản phẩm (X) và thị phần (Y). Hệ số
b1=0.187 cho biết rằng khi chất lượng sản phẩm tăng lên 1 đơn vị thì mô hình dự
đoán thị phần sẽ tăng thêm khoảng 0.187.
b. Kiểm định sự tồn tại mối liên hệ tương quan tuyến tính giữa X và Y.
Để kiểm định mối liên hệ tuyến tính giữa chất lượng sản phẩm (X) và thị
phần (Y) chúng ta sử dụng giả thiết H0, tức là kiểm định giả thiết sau:

 H 0 : β1 = 0

 H 1 : β1 ≠ 0
β1 = 0 ⇒ Không có mối liên hệ tuyến tính
β1 ≠ 0 ⇒ Có mối liên hệ tuyến tính
Sử dụng chương trình MegaStat\Correlation/Regression\Regression Analysis…chúng ta
có kết quả như sau:
Regression Analysis

r
Std. Error
ANOVA table
Source
Regression

Residual
Total

SS
128.3321
10.8987
139.2308

Regression output
coefficient
variables
s
Intercept

-3.0566

0.922
0.960
0.995

df
1
11
12

n
k
Dep. Var.

13

1
Y (Thị phần %)

MS
128.3321
0.9908

F
129.53

std. error

t (df=11)

p-value

0.9710

-3.148

.0093

p-value
2.00E-07

confidence interval
95%
95%
lower
upper

-5.1938

-0.9194

10


X (Chất lượng)

0.1866

0.0164

11.381

2.00E-07

0.1505

0.2227

Theo dữ liệu tính toán trên, ta có thể thấy rằng khi chất lượng sản phẩm tăng
1 đơn vị thì thị phần cũng sẽ tăng từ 0,1505 đến 0,2227. Giá trị p <5% (giá trị giả
định, khi giả thuyết không chứa một giá trị cụ thể); do đó, chúng ta bác bỏ giả
thuyết H 0, có nghĩa rằng H1 là đúng sự thật. Tức là có mối quan hệ tuyến tính giữa
chất lượng sản phẩm và thị phần.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó.
R2 : Hệ số xác định giải thích mức độ ảnh hưởng của những thay đổi của biến
độc lập X trong mô hình hồi quy. Hệ số xác định được xác định theo công thức: R 2 =
SSR / SST = Tổng bình phương được giải thích bằng hồi quy chia cho Tổng bình

phương chung.
Trong trường hợp này R2 = 0.922 ⇒ 92.2% thay đổi của thị phần là do chất
lượng sản phẩm.

Tài liệu tham khảo:

1. Hà Văn Sơn, Trần Hữu Thực, Giáo trình nguyên lý thống kê kinh tế
ứng dụng trong kinh doanh và kinh tế. Nhà xuất bản Thống kê, 2010.
2. Thống kê và khoa học quyết định (2010), Chương trình đào tạo Thạc
sỹ Quản trị kinh doanh quốc tế.
3. Thống kê trong kinh doanh (12/2009), Global Advanced - Tài liệu
tham khảo và lưu hành nội bộ.

11



×