Tải bản đầy đủ (.doc) (18 trang)

Bài tập về thống kê trong kinh doanh MBA v

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (227.37 KB, 18 trang )

Bài tập về Thống kê trong kinh doanh MBA
Bài 1
S&P 500 là một nhóm 500 công ty rất lớn niêm yết tại Mỹ. Trong năm 2006, lợi tức
trung bình năm của các cổ phiếu trong S&P 500 là 13.62% với độ lệch chuẩn xấp xỉ
20%. Theo số liệu lịch sử, lợi tức năm của các cổ phiếu này có phân phối chuẩn. Hãy
dùng các thông số trên đây để đánh giá một số khả năng bằng cách trả lời các câu hỏi
sau.
a. Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thu lợi ít nhất
25%, ít nhất 50%?
b. Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thua lỗ ít nhất
25%, ít nhất 50%?
c. Sử dụng nguyên tắc 3 sigma cho biết một cổ phiếu trong S&P 500 sẽ có lỗ lãi
dao động như thế nào?
Ghi chú:
Đối với mỗi câu hỏi, Học viên dùng phần mền Megastat để làm bài tập, Học
viên không nêu rõ cách thức sử dụng và đưa số liệu và phần mền. Sau khi đưa số liệu
vào phần mềm để tính toán, học viên dùng kết quả do phần mền tính toán đưa vào bài
tập để trả lời các câu hỏi của mỗi bài.
Bài làm.

a. Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thu lợi ít nhất
25%, ít nhất 50%?
Ta sử dụng phần mền Megastat để trả lời câu hỏi trên. Từ phần mền ta vào phần
Probability/ Normal Distribution sau đó nhập số liệu vào bảng ta có kết quả sau.
1.1 Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thu lợi ít
nhất 25%.

Page 1


Theo bài ra ta có: µ = 13.62; চ = 20



Normal distribution
P(lowe
r)
.7157

P(uppe
r)
.2843

z
0.57

X
25

mean std.dev
14
20

Như vây ta có khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thu lợi ít nhất 25% là P = 0.2843
1.2 Tính khả năng (xác suất) để một cổ phiế trong nhóm S&P 500 sẽ thu lợi ít nhất 50%.

Page 2


Normal distribution
P(lower
)
.9656


P(upper
)
.0344

z
1.82

X
50

mean
14

std.dev
20

Như vậy, ta có khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thu lợi ít nhất 50% là P = 0.0344

Page 3


b. Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thua lỗ ít nhất 25%, ít nhất 50%?
2.1 Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thua lỗ ít nhất 25%.

Normal distribution
P(lowe
r)
.0268


P(uppe
r)
.9732

z
-1.93

X
-25

mean std.dev
14
20

Page 4


Ta có khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thua lỗ ít nhất 25% là P=0.268
2.2 Tính khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thua lỗ ít nhất 50%.

Normal distribution
P(lower
)
.0007

P(upper
)
.9993

z

-3.18

X
-50

mean
14

std.dev
20

Ta có khả năng (xác suất) để một cổ phiếu trong nhóm S&P 500 sẽ thua lỗ ít nhất 50% là P=0.0007

Page 5


c. Sử dụng nguyên tắc 3 sigma cho biết một cổ phiếu trong S&P 500 sẽ có lỗ lãi dao động như thế nào?
Ta có µ - 3Ϭ = 13.62 – 3*20 = - 46.38
µ + 3Ϭ = 13.62 + 3*20 = 73.62
Gọi X là lợi tức, ta có P(µ - 3Ϭ<X> µ + 3Ϭ), do đó ta có, lợi tức để một cổ phiếu sẽ có lỗ lãi dao động trong khoảng (µ - 3Ϭ<X> µ + 3Ϭ).
f(z)

z

-3

-2

-1


0

1

2

-3.00

3
3.00

Normal distribution
P(lowe

P(uppe

z

X

mean

std.dev

Page 6


r)
r)
.0013

.9987
-3.00 -46.38
13.62
20.00
.9987
.0013
3.00 73.62
13.62
20.00
Ta có xác suất P= 0.9987 số cổ phiếu có lỗ, lãi nằm trong khoảng – 46.38 đến 73.62
Bài 2
Một nhà nghiên cứu thị trường cho một công ty điện tử muốn điều tra về thói quen xem TV của dân cư trong một vùng . Một mẫu ngẫu nhiên gồm 40
người được điều tra và thu được kết quả như sau:

- Thời gian xem TV trung bình 1 tuần của 40 người là 15.3 giờ và độ lệch chuẩn là 3.8 giờ.
- Trong số 40 người thì có 27 người xem chương trình “Ai là triệu phú” trong tuần.
a. Xây dựng khoảng tin cậy 95% cho thời gian xem TV trung bình một tuần của người dân trong vùng.
b. Phải chăng là thời gian xem TV trung bình này đã tăng lên so với trước đây 5 năm (khi đó theo điều tra thời gian xem TV trung bình là 13 gờ 1
tuần (dùng kiểm định giả thiết để kiểm tra).
c. Tìm khoảng tin cậy 95% cho tỷ lệ dân chúng xem chương trinh “Ai là triệu phú”. Giải thích ý nghĩa của kết quả tìm được.
Giả sử nhà nghiên cứu này muốn thực hiện điều tra tại 1 vùng khác. Cho biết:
d. Cho biết cần lấy bao nhiêu người để điều tra sao cho với độ tin cậy 95% sẽ ước lượng được thời gian trung bình xem TV sai lệch không quá 2
giờ quanh trung bình mẫu (giả sử độ lệch chuẩn của tổng thể là 5 giờ).
e. Cần bao nhiêu người để điều tra nếu muốn ước lượng tỷ lệ sốn gười xem chương trình “Ai là triệu phú” với độ tin cậy 95% và sai số biên là
0.035)
Bài làm:
a. Xây dựng khoảng tin cậy 95% cho thời gian xem TV trung bình một tuần của người dân trong vùng.

Page 7



Từ phần mền Megastat / Confidence Interals/Sample Size-nean, đưa số liệu vào ta có kết quả sau.
Confidence interval - mean
95%
15.30
3.80
40.00
1.960
1.178
16.478
14.122

confidence level
mean
std. dev.
n
z
half-width
upper confidence limit
lower confidence limit

Với độ tin cậy 95% thời gian xem tivi trung bình một tuần của người dân trong vùng từ 14.122 giờ đến 16.478 giờ.
b. Phải chăng là thời gian xem TV trung bình này đã tăng lên so với trước đây 5 năm (khi đó theo điều tra thời gian xem TV trung bình
là 13 giờ 1 tuần (dùng kiểm định giả thiết để kiểm tra).
Ta dùng phương pháp kiểm định giả thiết. Từ phần mềm Megastat/hypothesis Tests/Meanve. Hypothesized Value, đưa số liệu vào ta có bảng sau.
Hypothesis Test: Mean vs. Hypothesized Value
13.00
15.30
3.80
0.60

40.00

3.83
0.0001

hypothesized value
mean thoi gian
std. dev.
std. error
n

z
p-value (one-tailed, upper)

Kết luận: Ta có P –value = 0.0001<α = 5%. Như vậy, thời gian xem ti vi trung bình của vùng có tăng lên so với 5 năm trước.

Page 8


c. Tìm khoảng tin cậy 95% cho tỷ lệ dân chúng xem chương trinh “Ai là triệu phú”. Giải thích ý nghĩa của kết quả tìm được.

Từ phần mền Megastat/Confidence Intervals/Sample Size/Confidence interval - proportion, ta nhập số liệu vào, ta có kết quả sau.
Confidence interval - proportion
95% confidence level
0.67 proportion
5
40 n
1.96 z
0
0.14 half-width

5
0.82 upper confidence limit
0
0.53 lower confidence limit
0
Với độ tin cậy là 95%, tỷ lệ dân chúng xem chương trình là là triệu phú ít nhất là 53% và nhiều nhất là 82%.
d. Cho biết cần lấy bao nhiêu người để điều tra sao cho với độ tin cậy 95% sẽ ước lượng được thời gian trung bình xem TV sai lệch
không quá 2 giờ quanh trung bình mẫu (giả sử độ lệch chuẩn của tổng thể là 5 giờ).

Từ phần mền Megastat/Confidence Intervals/Sample Size/Sample Size- mean, ta nhập số liệu vào, ta có kết quả sau.
Sample size - mean

Page 9


2.00
5.00
95%
1.960
24.009
25.00

E, error tolerance
standard deviation
confidence level
z
sample size
rounded up

Với độ tin cậy là 95% và độ lệch chuẩn là 5 giờ thì chúng ta cần chọn mẫu tối thiểu 25 người.

e. Cần bao nhiêu người để điều tra nếu muốn ước lượng tỷ lệ sốn gười xem chương trình “Ai là triệu phú” với độ tin cậy 95% và sai số
biên là 0.035)
Để tìm số người để điều tra, ta dùng phương pháp ước lượng khoảng tin cậy. Tìm kích thước mẫu trong trường hợp ước lượng P.

Từ phần mền Megastat/Confidence Intervals/Sample Size/ Sample Size- P, ta nhập số liệu vào, ta có kết quả sau.
Sample size - proportion
0.035
0.50
95%
1.960
783.971
784.00

E, error tolerance
estimated population proportion
confidence level
z
sample size
rounded up

Từ kế quả trên ta thấy số người cần điều tra từ 784 người.

Page 10


Bài 3
Giá nhà (Asessedvalue) phụ thuộc vào diện tích nhà (Size of house) và tuổi của ngôi nhà (Age). Số liệu sau đây thu thập từ 15 ngôi nhà.

Assessed
Value ($000)

184.4
177.4
175.7
185.9
179.1
170.4
175.8
185.9
178.5
179.2
186.7
179.3
174.5

Area
(1000s feet
square)
2.00
1.71
1.45
1.76
1.93
1.20
1.55
1.93
1.59
1.50
1.90
1.39
1.54


Age
(years)
3.42
11.50
8.33
0.00
7.42
32.00
16.00
2.00
1.75
2.75
0.00
0.00
12.58

Page 11


183.8
176.8

1.89
1.59

2.75
7.17

a. Ước lượng mô hình hồi quy bội

b. Giải thích ý nghĩa các hệ số nhận được
c. Cho biết giá dự báo của ngôi nhà với diện tích 1750 squarefeets và 10 năm tuổi.
d. Dùng kiểm định t kiểm tra ảnh hưởng thực sự của diện tích và tuổi ngôi nhà lên giá của nó.
e. Xác định hệ số R2 và giải thích ý nghĩa của nó.
Bài làm
a. Ước lượng mô hình hồi quy bội
1.1 Ta xác định sự ảnh hưởng của diện tích lên giá của ngôi nhà.
Ta sử dụng phần mền Megastat, chọn mục Regression/Correlation – Scatter plot, nhập số liệu vào hệ thống ta có.

Page 12


Từ biểu đồ trên cho ta thấy, ngôi nhà có diện tích càng lớn, thì giá càng cao. Tức là diện tích ảnh hưởng cùng chiều với giá trị ngôi nhà.
1.2 Ta xác định sự ảnh hưởng của tổi nguôi nhà nên giá trị của chúng.

Page 13


Qua biểu đồ trên ta thấy, ngôi nhà có tuổi càng lớn thì giá bán càng giảm và ngược lại. Như vậy, sự ảnh hưởng cuổi tổi lên giá ngôi là là ngược chiều.
1.3 Mối quan hệ giữa diện tích, tuổi với giá nhà.
Từ phần mềm Megastat/Correlation/Regression/Correlation matrix, ta đưa số liệu vào, ta có kết quả như sau.
Correlation Matrix
Assessed Value ($000)
Area (1000s feet square)
Age (years)

Assessed Value ($000)
1.00
0.81
- 0.80


Area (1000s feet square)
0.81
1.00
- 0.58

Age (years)
- 0.80
- 0.58
1.00

Page 14


15.00

sample size

± .514
± .641

critical value .05 (two-tail)
critical value .01 (two-tail)

Ta có có quan hệ giữa giá nhà và diện tích, tuổi là khá chặt chẽ, sự ảnh hưởng của các yếu tố này là ngang nhau. Diện tích ảnh hưởng cùng chiều
với giá, tuổi ảnh hưởng ngược chiều với giá.
b. Giải thích ý nghĩa các hệ số nhận được.
Ta phân tích mối quan hệ giữa giá nhà với diện tích và tuổi của chúng.
Từ phần mềm Megastat/Correlation/Regression/Correlation Analysis, ta đưa số liệu vào, ta có kết quả như sau.
Regression Analysis


Adjusted R²
R
Std. Error
ANOVA table
Source
Regression
Residual
Total
Regression output
variables
Intercept
Area (1000s feet
square)

SS
268.7247
56.4113
325.1360

0.826
0.798
0.909
2.168

n
k
Dep. Var.
df
2

12
14

MS
134.3623
4.7009

15
2
Assessed Value ($000)
F
28.58

coefficients
163.7751

std. error
5.4072

t (df=12)
30.288

p-value
1.05E-12

10.7252

3.0143

3.558


.0039

p-value
2.73E-05

confidence interval
95% lower
95% upper
151.9939
175.5563
4.1575

Page 15

17.2928


Age (years)

-0.2843

0.0836

-3.400

.0053

-0.4664


-0.1021

Từ bảng trên ta có Y = β0 + β1*X1 + β2 * X2 = 163.7751 + 10.72 * Diện tích – 0.284 * Tuổi
Ý nghĩa: - Nếu tuổi thọ của ngôi nhà không đổi, khi diện tích nhà tăng lên 1 đơn vị (feet vuông) thì giá trung bình của ngôi nhà tăng lên 10,725.00 đô
la.
-

Nếu diện tích của ngôi nhà không đổi, tuổi của ngôi nhà tăng lên 1 đơn vị (1 năm) thì giá trung bình của ngôi nhà giảm đi là 284.00 đô la.

c. Cho biết giá dự báo của ngôi nhà với diện tích 1750 squarefeets và 10 năm tuổi.
Ta sử dụng mô hình ước lượng hồi quy bội tuyến tính để tính toán.
Regression Analysis

Adjusted R²
R
Std. Error

0.83
0.80
0.91
2.17

n
k
Dep. Var.

15.00
2.00
Assessed Value ($000)


ANOVA table
Source
Regression
Residual
Total
Regression output
variables
Intercept
Area (1000s feet square)
Age (years) -

SS
268.72
56.41
325.14
coefficients
163.78
10.73
0.28

df
2.00
12.00
14.00
std. error
5.41
3.01
0.08

MS

134.36
4.70

-

t (df=12)
30.29
3.56
3.40

F
28.58

p-value
0.00
0.00
0.01

p-value
0.00

confidence interval
95% lower
95% upper
151.99
175.56
4.16
17.29
0.47
0.10


Predicted values for: Assessed Value ($000)
95% Confidence Intervals

95% Prediction Intervals

Page 16


Area (1000s feet square)
1,750.00

Age (years)
10.00

Predicted

lower

18,930.00

7,447.23

upper
30,412.78

lower
7,447.23

upper

30,412.78

Leverage
5,908,389.59

Như vậy ta có, ngôi nhà có diện tích 1750 square feets có giá khoảng 18.930 USD.
d. Dùng kiểm định t kiểm tra ảnh hưởng thực sự của diện tích và tuổi ngôi nhà lên giá của nó.

• Kiểm tra giả thiết: H0: β1 = 0 (H1: β 1≠0)
Trong kiểm định này, chúng ta coi α = 5%, Pvalue = 0.39% < α; Do đó bác bỏ giả thiết H0  Kết luận β 1≠0, nghĩa là diện tích có
ảnh hưởng thực sự đến giá nhà.
• Kiểm tra giả thiết: H0: β2 = 0 (H1: β 2≠0)
Trong kiểm định này, chúng ta coi α = 5%, Pvalue = 0.53% < α; Do đó bác bỏ giả thiết H0  Kết luận β2≠0, nghĩa là tuổi của ngôi
nhà có ảnh hưởng đến giá nhà.

e. Xác định hệ số R2 và giải thích ý nghĩa của nó.

Từ câu C ta có R2 = 0.826 là hệ số xác định điều chỉnh chịu ảnh hưởng bởi số biến giải thích và cỡ mẫu. R 2 càng lớn, thì sự ảnh hưởng
của diện tích và tuổi đến ngôi nhà lên giá càng lớn và ngược lại.
Ta có R2 = 0.826 là tương đối lớn. Vì vậy, mô hình lựa chọn là tương đối tốt.

Tài liệu tham khảo.

Page 17


1. Giáo trình Ra quyết định quản lý – Tiến Sỹ Ngyễn Mạnh Thế -PGSM

Page 18




×