Tải bản đầy đủ (.doc) (10 trang)

Bài tập thống kê ra quyết định số (96)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (908.97 KB, 10 trang )

BÀI TẬP CÁ NHÂN
THỐNG KÊ TRONG KINH DOANH
Học Viên: Phạm Quang Dũng
Lớp : M0211
I. Trả lời các câu hỏi sau đây:
1. Diện tích nằm dưới đường mật độ của phân phân phối chuẩn hóa và giữa hai
điểm 0 và -1.75 có hàm F(X) được biểu diễn: P(-1.75 < X < 0)

Theo phân phối chuẩn có giá trị tương ứng P(-1.75 < X < 0), cho kết quả như
hình trên. Theo đó ta có diện tích nằm dưới đường mật độ của phân phối chuẩn
hóa là: (0.9599 - 0.0401)/2 = 0.4599
2. Gọi chỉ số IQ là một biến ngẫu nhiên X, Tính P (68 < X < 132):


Theo kết quả trên ta có: P (68 < X < 132) = 0.9772 - 0.0228 = 0.9545
3. Nếu độ tin giảm đi, khoảng tin cậy sẽ rộng hơn hay hẹp lại?
Theo công thức ước lượng khoảng tin cậy:
X − tα / 2,n −1

s
n

≤ µ ≤ X + tα / 2,n −1

s
n

Kết luận: Nếu giảm độ tin cậy thì khoảng tin cậy càng rộng ra.
4. Giả sử khoảng tin cậy cho trung bình tổng thể là từ 62.84 đến 69.46. biết σ
=6.5 và kích thước mẫu n=100. Tính trung bình mẫu.
Thay số vào công thức ước lượng khoảng tin cậy khi biết phương sai ta có: 2 x


=62.84+69.46=132.3, suy ra x = 132.3/2=66.15
5. Chọn: Phương án (d: 0.025)
Vì: Nếu p-value≤ α bác bỏ giả thiết H0
Nếu p-value ≥ α không bác bỏ giả thiết H0
Vậy việc bác bỏ giả thiết H0 khi có giá trị p-value=0.025 ≤ α=0.05

II. Hoàn thành các bài tập sau đây
Bài 1
Với số lượng ngẫu nhiên 30 khách hàng ta có bảng sau:
Descriptive statistics
#1

#2

#3

#4

#5

#6


count
mean

5
6.00

5

6.80

5
6.80

5
5
6.00 5.80

5
5.40

population variance
population standard deviation

6.40
2.53

2.96
1.72

1.36
1.17

2.80 1.36
1.67 1.17

2.64
1.62


confidence interval 95.% lower 2.49
confidence interval 95.% upper 9.51
half-width
3.51

4.41
9.19
2.39

5.18
8.42
1.62

3.68 4.18
8.32 7.42
2.32 1.62

3.14
7.66
2.26

Số ngày trung bình theo phương pháp mới với độ tin cậy 95% là:
5.40 < µ < 6.80
Với bài ra theo phương pháp cũ có số ngày trung bình là 7,5 ngày.
 Theo phương pháp mới số ngày trung bình nằm dưới và ngoài khoảng. Do
đó, nếu sử dụng phương pháp mới sẽ có hiệu quả hơn.
Bài số 2. Cho mức ý nghĩa 5% và hai phương án sản xuất phân phối theo quy
luật chuẩn, hãy rút ra kết luận về hai phương án sản xuất một loại sản phẩm.
Descriptive statistics
count

mean
sample variance
sample standard deviation
minimum
maximum
range
1st quartile
median
3rd quartile
interquartile range
mode
low extremes
low outliers
high outliers
high extremes

Phương án A
12
29.75
19.84
4.45
24
38
14

Phương án B
14
28.21
20.95
4.58

20
38
18

26.00
29.00
32.75
6.75
35.00

25.25
28.00
30.00
4.75
25.00

0
0
0
0

0
0
1
0



Ở đây, chúng ta giả sử rằng: X là chi phí cho phương án A: X ~ N(µ1,σ12)
Y là chi phí cho phương án B: Y ~ N(µ2,σ22)


 H 0 : µ1 = µ 2
 H 1 : µ1 ≠ µ 2

Tiến hành kiểm định cặp giả thiết sau: 
X = 29.75;

S1 = 4.45

Y = 28.21;

S 2 = 4.58

Vì S1và S2 không khác nhau nhiều => dùng phương sai hỗn hợp (pooled
variance).
Một số nhận xét, kết luận sau khi phân tích thống kê mô tả và sử dụng các
đồ thị phân tích cũng như số liệu thống kê bằng phương án kiểm định các
phương án sản xuất trên:
-

Phương án A (12 quan sát) có chi phí trung bình cao hơn phương án B (14
quan sát), phương án A: 29.12 ngàn đồng và phương án B: 28.21 ngàn
đồng.

-

Độ lệch chuẩn của phương án A và phương án B khác nhau không đáng kể,
có thể coi như bằng nhau (phương án A: 4.45, phương án B: 4.58).



-

Khoảng tứ phân vị của phương án A là 6.75 lớn hơn phương án B (4.75).
Tứ phân vị thứ nhất và trung vị của 02 phương án chênh lệch nhau khoảng
1.0 (phương án A cao hơn).

-

Trên biểu đồ rải điểm và hộp ria mèo thì cả 2 phương án A và B có phân bố
gần với phân bố chuẩn, tuy nhiên phương án A bị cong xuống dưới tức là
lệch sang phải, không có giá trị ngoại lai hay đột xuất. Rải điểm của
phương án B thẳng hơn do vậy phân phối của phương án B là chuẩn hơn,
có 01 giá trị ngoại lai.

-

Theo giả thiết là chi phí của 2 phương án sản xuất trên phân phối theo quy
luật chuẩn với mức ý nghĩa 5% và trên cơ sở sử dụng kiểm định giả thuyết
cho trường hợp độ lệch chuẩn của 2 phương án coi như bằng nhau và khác
nhau (có thể dùng phương sai hỗn hợp -pooled và unequal variance) đều
cho kết quả là số p-value ứng với kiểm định t là 0.86-0.87 gần như không
có sai khác nhau ~0.396% >α ⇒ Chấp nhận giả thiết H0 (Chi phí trung
bình của 2 phương án sản xuất trên là như nhau).
Hypothesis Test: Independent Groups (t-test, pooled variance)
p/a A
29.75
4.45
12

p/a B

28.21
4.58
14
24
1.536
20.442
4.521
1.779
0
0.86
.3965

mean
std. dev.
n
df
difference (p/a A - p/a B)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference
t
p-value (two-tailed)

Hypothesis Test: Independent Groups (t-test, unequal variance)
p/a A
29.75
4.45
12


p/a B
28.21
4.58
14
23
1.536

mean
std. dev.
n
df
difference (p/a A - p/a B)


1.775 standard error of difference
0 hypothesized difference
0.87 t
.3958 p-value (two-tailed)
Bài 3
Kiểm định mức độ tập trung bình quân trong toàn bộ lô hàng:
Hypothesis Test: Mean vs. Hypothesized Value
247.00
250.00
12.00
1.55
60
59

hypothesized value
mean ppm

std. dev.
std. error
N
Df

1.94
.0576

T
p-value (two-tailed)

246.90
253.10
3.10

confidence interval 95.% lower
confidence interval 95.% upper
margin of error

Hypothesis Test: Mean vs. Hypothesized Value
247.00
250.00
12.00
1.55
60
59

hypothesized value
mean ppm
std. dev.

std. error
N
Df

1.94
.0576

T
p-value (two-tailed)

245.88
254.12
4.12

confidence interval 99.% lower
confidence interval 99.% upper
margin of error

Với hai giá trị α =0.05 và α =0.01 ta có kết quả như trên:
Có p-value = 0.0567.


So sánh giá trị p-value và α trong cả hai trường hợp thì p-value > α -> Không có
cơ sở để bác bỏ H0.
Kết luận: Không có bằng chứng để nhà xản xuất kiểm tra xem liệu mức độ tập
trung bình quân trong một lô hàng lớn đạt mức 247ppm yêu cầu.
Bài 4
a. Hãy ước lượng mối quan hệ hồi quy tuyến tính đơn giữa thị phần và chất
lượng sản phẩm? Kết luận
Regression Analysis


r
Std.

0.922
0.960
0.995

n
13
k
1
Dep. Var. Y

df

MS

Error
ANOVA table
Source

SS

Regression
Residual
Total

128.332 1
1

10.8987 11
139.230 12

F

p-

value
128.3321 129.53 2.00E07
0.9908

8
Regression output
variables
coefficients

std.

Intercept

error
(df=11)
0.9710 -3.148

value
.0093

0.0164

5.1938

2.00E- 0.1505 0.2227

X

-3.0566
0.1866

t p-

11.381

confidence interval
95%
95% upper
lower
-

-0.9194

07
Với kết quả như trên ta so sánh p-value < α -> Bác bỏ giả thiết H 0 . Đi đến kết
luận giữa thị phần và chất lượng sản phẩm có mối quan hệ hồi quy đơn tuyến


tính. Điều đó cho biết nếu chất lượng tăng lên 1 điểm thì thị phần tăng lên
0.1866% tương ứng.
b. Kiểm định mối liên hệ tương quan tuyến tính giữa X và Y

Cặp giả thiết:
H0: β1=0 (không có mối liên hệ tương quan tuyến tính)

H1: β1≠0 (có mối liên hệ tương quan tuyến tính)
Với t(α/2, n-2) = t(2,5%; 11) = 2.201 trong khi đó :t=11.381 -> Bác bỏ giả thiết
H0, chấp nhận giả thiết H1
Kết luận: Thị phần là có mối liên hệ tuyến tính với chất lượng sản phẩm và
ngược lại.
c. Cho biết hệ số R2 và giải thích ý nghĩa của nó:
R2 là hệ số xác định đo lường phần biến thiên của Y (thị phần) có thể được
giải thích bởi biến độc lập X (chất lượng sản phẩm). R2 có giá trị từ 0 đến 100%
(hay 1).
Giá trị R2 càng cao là một dấu hiệu cho thấy mối liên hệ giữa hai biến số
thị phần và chất lượng sản phẩm càng chặt chẽ.
Ta có công thức :
R2 =

SSR
SST

Theo kết quả bảng Excel cho thấy R2 = 0,92, tức là 92% sự thay đổi của
chất lượng sản phẩm được giải thích trong mô hình trên với thị phần.
R = 0,96 chứng tỏ mối quan hệ giữa chất lượng sản phẩm và thị phần là
mối tương quan thuận và rất chặt chẽ..
TÀI LIỆU THAM KHẢO
1. Thống kê và khoa học ra quyết định, Chương trình đạo tạo Thạc sĩ Quản
trị Kinh doanh Quốc tế.
2. Giáo trình nguyên lý Thống kê Kinh tế, Đại học Kinh tế Thành phố Hồ
Chí Minh, 2010.
3. />%E1%BB%91ng%20k%C3%AA.html
4. />




×