Tải bản đầy đủ (.doc) (14 trang)

Bài tập thống kê ra quyết định số (174)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (465.63 KB, 14 trang )

CHƯƠNG TRÌNH ĐÀO TẠO THẠC SĨ QUẢN TRỊ KINH DOANH QUỐC TẾ

Email:
Website: www.griggs.edu.vn

BÀI KIỂM TRA HẾT MÔN

Môn: Thống kê và khoa học ra quyết định

Họ và tên học viên: ĐINH NGUYỄN PHƯƠNG THẢO
Cơ quan: Bộ Văn hóa Thể thao và Du lịch
Lớp: MBA01.M1009

Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao ?
1. Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
Sai, vì: Tiêu thức thống kê là đặc điểm của đơn vị tổng thể được chọn ra để
nghiên cứu tùy theo mục đích nghiên cứu khác. Có thể phân các loại tiêu
thức:
-Tiêu thức thực thể: Là loại tiêu thức phản ánh đặc điểm về nội dung của đơn
vị tổng thể. Tùy theo cách biểu hiện mà có 3 loại:
+Tiêu thức thuộc tính: Là loại tiêu thức phản ánh các thuộc tính của
đơn vị tổng thể và không có biểu hiện trực tiếp bằng con số. Ví dụ: tiêu thức
giới tính, dân tộc,...
+Tiêu thức số lượng: Là loại tiêu thức phản ánh các đặc điểm về lượng
của đơn vị tổng thể và có biểu hiện trực tiếp bằng con số, các biểu hiện con số
của tiêu csw số lượng được gọi là các lượng biến. Ví dụ: số nhân khẩu trong
gia đình, năng suất lao động,...


+Tiêu thức thay phiên: là loại tiêu thức có hai biểu hiện không trùng


nhau trên một đơn vị tổng thể. Ví dụ: nam và nữ, ...
-Tiêu thức thời gian: Nêu lên hiện tượng nghiên cứu theo sự xuất hiện của
hiện tượng ở thời gian nào.
-Tiêu thức không gian: Nêu lên phạm vi lãnh thổ bao trùm và sự xuất hiện
theo địa điểm của hiện tượng nghiên cứu.
Như vậy tùy theo mục đích nghiên cứu, một số đặc điểm của đơn vị
tổng thể được chọn ra để nghiên cứu.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Đúng, vì: Tần số là số đơn vị được phân phối vào trong mỗi tổ, tức là số lần
một lượng biến nhận một trị số nhất định trong một tổng thể.
Ví dụ: Trong phòng tôi có các mức với mỗi người như sau;
Mức lương

Số người có mức lương

Từ 1 triệu đến dưới 2

trong khoảng (tần số)
2

triệu
Từ 2 triệu đến dưới 3

1

triệu
Từ 3 triệu đến dưới 5

3


triệu
Như vậy các tần số trong ví dụ trên là các số cụ thể: là 2, là 1 hay là 3.
3. Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về
tiêu thức nghiên cứu của hai hiện tượng khác loại
Sai, vì: Độ lệch chuẩn là chỉ tiêu hoàn thiện nhất và thường dùng nhất trong
nghiên cứu thống kê để đánh giá độ biến thiên của tiêu thức, cho biết độ biến
thiên xung quanh giá trị trung bình. Độ lệch tiêu chuẩn bằng căn bậc hai của
phương sai tức bằng số bình quân toàn phương của bình phương các độ lệch
giữa các lượng biến với số bình quân cộng của các lượng biến đó.
Phương sai và độ lệch chuẩn là các chỉ tiêu chỉ dùng để so sánh độ biến
thiên của các hiện tượng cùng loại và có số trung bình bằng nhau nhưng


không được dùng để so sánh biến thiên của các hiện tượng khác khác loại
hoặc các hiện tượng cùng loại nhưng số trung bình không bằng nhau. Khi đó
người ta dùng hệ số biến thiên.
4. Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ
nghịch với phương sai của tổng thể chung đó
Sai, vì : phương sai là một trong các nhân tố ảnh hưởng đến độ lớn của
khoảng tin cậy, song tổng thể chung càng đồng đều (phương sai càng nhỏ)
khoảng ước lượng càng nhỏ. Như vậy là tỷ lệ thuận, không phải tỷ lệ nghịch.
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của
tiêu thức nguyên nhân đến tiêu thức kết quả
Đúng, vì dựa vào phương trình mô hình tuyến tính của tổng thể mẫu với dạng
Ŷi = b0 + b1Xi
Trong đó : b0 là hệ số chặn của Y được dùng để ước lượng β0
b1 là độ dốc (hệ số hồi quy) dùng để ước lượng β1.
Ŷi: Biến phụ thuộc (kết quả)
Xi: Biến độc lập (nguyên nhân)
Đây là hàm bậc nhất biểu sự mối quan hệ Xi và Ŷi , tùy theo dấu của b1 mà

ảnh chiều hướng của sự ảnh hưởng (nếu b 1 > 0 thì ảnh hưởng là cùng chiều,
nếu b1 < 0 thì ảnh hưởng là ngược chiều) ; đồng thời giá trị tuyệt đối của b1 ảnh
hưởng đến mức độ ảnh hưởng tiêu thức nguyên nhân và kết quả ( giá trị càng
lớn thì mức độ ảnh hưởng của Xi đến Ŷi càng nhiều và ngược lại)
Như vậy hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng
của tiêu thức nguyên nhân đến tiêu thức kết quả .

B. Chọn phương án trả lời đúng nhất
1) Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động


φ c) Là cơ sở để dự đoán mức độ tương lai của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
f) Cả a), b), c).
Phương án lựa chọn: phương án f
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến
tiêu thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ι

e) Cả a), c).

Phương án lựa chọn: phương án c
ϕ

3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Phương pháp chọn mẫu.( chọn)
d) Cả a), b), c).
e) Không yếu tố nào cả .
Phương án lựa chọn: phương án d
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng
khác loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
κ e) Cả a), c)


λ

f) Cả a), d)

Phương án lựa chọn: phương án d
µ
5) Biểu đồ hình cột (Histograms) không phải là đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Phương án lựa chọn: phương án a

Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân
hoàn thành được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy
muốn xây dựng khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là
95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về năng suất trong một
giờ là 6 sản phẩm. Hãy tính số công nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm
trung bình mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5.
Hãy ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin
cậy 95%.
Bài giải:
Theo bài ra độ tin cậy 95% tức (1 – α)% = 95%
→ α/2 = 0,025 tra bảng → Zα/2 = 1,96
Và có σ = 6
Er = 1
Ta có:


Z2 * σ2

1,962 * 62
=

n=
Er

= 138,3 ≈ 139 (người)

2


2

1

Vậy số công nhân cần được điều tra để đạt định mức là 139 người.
Gọi μ là năng suất trung bình một giờ của công nhân
Độ tin cậy 95% tức (1 – α)% = 95% α/2 = 0,025
Tra bảng → tα/2, n–1 = 1,977
Và có: X = 35; n = 139 ; S = 6,5
Ta có: tα/2, n–1* S / n

= 1,977 * 6,5/ 139 = 1,09

X – tα/2, n–1 * S / n ≤ µ ≤ X + tα/2, n–1 * S / n

35 – 1,09
33,91

≤ µ




35 + 1,09

µ ≤ 36,09

Vậy, với độ tin cậy 95% thì số sản phẩm bình quân công nhân làm ra
trong 1 giờ sản xuất nằm trong khoảng 34 đến 36 sản phẩm.
Câu 3 (1,5đ)


Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một
loại sản phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có
khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau:
(ngàn đồng)
Phương án 1: 22

32

36

38

35

26

30

28

24

28

Phương án 2: 21

27

28


29

23

26

28

30

32

34

26
38

34
25

36 28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin
cậy 95% hãy rút ra kết luận về hai phương án trên.
Bài làm


Gọi μ1 chi phí sản xuất trung bình sản phẩm theo phương án 1
và μ2 là chi phí sản xuất trung bình sản phẩm theo phương án 2.


Cặp giả thiết cần kiểm định là :
H0 : μ1 = μ2
H1 : μ1 ≠ μ2

(→ chi phí sản xuất trung bình của phương án 1 và phương
án 2 khác nhau)

Theo bài ra, đây là trường hợp so sánh 2 trung bình của 2 tổng thể chung
với 2 mẫu độc lập và chưa biết phương sai tổng thể chung, bộ mẫu nhỏ (n 1 =
12 và n2 = 14 < 30), phân phối chuẩn.
Ta có độ tin cậy 95% → α = 0,05.
Vì vậy tiêu chuẩn kiểm định t là :
t=

( Χ1 − Χ 2 ) − ( µ1 − µ 2)
1 1
S p2 ( + )
n1 n2
(trong

(1)

đó: µ1 − µ 2 = 0)

Với:

S

2
p


2

(n − 1) * S1 + (n 2 − 1) * S 2
= 1
( n1 + n 2 − 2)

2

(2)

Với các số liệu đã cho, sử dụng công cụ phân tích dữ liệu “t-Test: TwoSample Assuming Equal Variances” của Chương trình EXCEL, ta có kết quả
sau:

t-Test:
Two-Sample
Assuming Equal Variances

Phương án 1

Phương án 2

Ghi chú


Mean

29.9167

28.9286


trung bình mẫu

Variance

25.9015

22.8407

phương sai mẫu

Observations

12

14

kích thước mẫu

Pooled Variance

24.2436

phương sai chung của 2 tổng thể mẫu

0

sự khác nhau của tổng thể 1 và 2

df


24

bậc tự do

t Stat

0.5101

giá trị của tiêu chuẩn kiểm định

P(T<=t) one-tail

0.3073

t Critical one-tail

1.7109

P(T<=t) two-tail

0.6146

t Critical two-tail

2.0639

Hypothesized
Difference


Mean

giá trị của t một phía

giá trị của t hai phía

Thay vào công thức (1), (2):
X1 − X2

t=

S

1
1
2
Sp *( + )
n1 n2

2
p

=

2

29,917 − 28,929
1 1
24,244 * ( + )
12 14


= 0,510

2

(n1 − 1) * S1 + (n 2 − 1) * S 2
(12 − 1) * 25,90 2 + (14 − 1) * 22,84 2
=
=
= 22,244
( n1 + n 2 − 2)
(12 + 14 − 2)

Với α = 0,05 = >tα / 2;( n1+n 2−2 ) = t 0, 025; 24 = ±2,064

→ t không thuộc miền bác bỏ
Vậy với mẫu đã điều tra nêu trên ở mức ý nghĩa 5% chưa đủ cơ sở để nói
rằng chi phí phương án 1 khác với chi phí phương án 2.

Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng than khai thác được trong 30 tháng
gần đây của một nhà máy (đơn vị: triệu tấn):
6,1
4,9

4,7
5,3

6,2
7,3


7,5
4,8

6,6
5,3

6,0
7,3


5,7
4,5
6,4

7,0
4,7
3,0

3,7
7,8
5,1

7,2
6,4
4,5

3,8
6,5
7,9


12,3
5,2
6,1

1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
3. Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu
điều tra và từ bảng phân bố tần số. So sánh kết quả và giải thích.
Bài làm:
1. Biểu diễn dữ liệu trên bằng bằng biểu đồ thân lá:

Thân
3
4
5
6
7
8
9
10
11
12


0
9
7
1

0

7
5
3
4
3

8
7
1
2
8

7
3
4
5

8
2
6
2

5
5
9

0
3


1

3

2. Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.

Khối lượng than

Trị số giữa ( X * i )

Tần số

Tần suất

(triệu tấn)

(số tháng)

(%)

Từ 3 - dưới 4
Từ 4 - dưới 5
Từ 5 - dưới 6

(triệu tấn)
3,5
4,5
5,5


Từ 6 - dưới 7

6,5

8

3
6
5

10.34
20.69
17.24
27.59


Từ 7 - dưới 8
Tổng

7,5

7
29

24.14
100%

3.Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Trong bộ dữ liệu trên ta có xuất hiện dữ liệu đột xuất. Đó là dữ liệu khối lượng
than 12,3 triệu tấn/tháng

4. Tính khối lượng than khai thác trung bình 1 tháng từ tài liệu điều tra và từ
bảng phân bố tần số. So sánh kết quả và giải thích.

a) Tính khối lượng than trung bình từ tài liệu điều tra:
X=

∑x



i

n

X

1

= 179,8 /30 = 5,99

b) Tính khối lượng than trung bình từ bảng phân bố tần số:
X=

∑x f
∑f
i

i




X

2

= 169,5 /29 = 5,945

i

Nhận xét: So sánh 2 kết quả tính toán ở trên ta thấy khối lượng than khai
thác trung bình tính từ tài liệu điều tra có giá trị cao hơn từ bảng phân bố tần
số. Để giải thích, ta lập bảng sau:
Σxi

Khối lượng than

từ tài liệu
điều tra

Trung bình
cộng giản
đơn từ tài
liệu điều tra

Σxifi
từ bảng
phân bố
tần số

(triệu tấn)


Trung bình
cộng gia
quyền từ
bảng phân bố
tần số

Từ 3 - dưới 4

10,5

3,5

10,5

3,5

Từ 4 - dưới 5

28,1

4,83

27

4,5

Từ 5 - dưới 6

26,6


5,32

27,5

5,5

Từ 6 - dưới 7

50,3

6,28

52

6,5

Từ 7 - dưới 8

52,0

7,43

52,5

7,5

Tổng

167,5 (và 12,3 =

179,8)

169,5


Khối lượng than trung bình tính từ tài liệu điều tra có giá trị cao hơn từ
bảng phân bố tần số vì bảng phân bố tần số không ghi nhận dữ liệu khối
lượng than khai thác trung bình tháng có giá trị 12,3 cho nên:
Σxi > Σxifi và

n > Σfi →

X1 > X2 .

Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm
để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép
tăng chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
% tăng chi phí quảng cáo
1
2
6
4
3
% tăng doanh thu
2.5
3
4.5
3.5
3

1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện
mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích
mối liên hệ này qua các tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực
sự có mối liên hệ tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí
quảng cáo là 5,5% với độ tin cậy 90%.
Bài làm :

1/Phương trình hàm hồi quy tuyến tính:
^

Y = 2,067 + 0,385 X i

Trong đó:
Hệ số chặn ( b0 = 2,067): Ảnh hưởng của tất cả các nguyên nhân khác đến
doanh thu ngoài nguyên nhân chi phí là 2,067%
Hệ số hồi quy ( b1 = 0,385): Ảnh hưởng của chi phí đến doanh thu của hãng.
Cụ thể, khi chi phí quảng cáo tăng lên thêm 1% thì mô hình dự đoán rằng
doanh thu hằng năm mong đợi sẽ tăng lên khoảng 0,385%


2/ Để kiểm định ta xét:

Cặp giả thiết:

H 0 : β1 = 0

H 1 : β1 ≠ 0


Từ số liệu đầu bài, sử dụng bảng kết quả từ excel* (phần cuối bài), ta
có:
t=

b1 − β 1 0,385
=
= 7,9299 và S b1 =
sb1
0,0485

Sx/ y

∑(X i − X )

= 0,0485

Với α = 0,00418 < 0,1 → t thuộc miền bác bỏ → bác bỏ Ho nhận H1
Vậy với mức ý nghĩa α = 0,1 có thể kết luận rằng thực sự có mối liên hệ
giữa chi phí và doanh thu của hãng.

3/ Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên như
sau:
Về hệ số tương quan R = 0,976 cho thấy có mối liên hệ rất chặt chẽ giữa
chi phí và doanh thu của hãng, đây là mối quan hệ thuận.
Về hệ số xác định: R 2 = 0,954 cho biết sự phù hợp của mô hình cụ thể:
95,4% sự thay đổi của doanh thu được giải thích bởi mô hình ( hay là sự thay
đổi của chi phí quảng cáo).
4/ Ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng
cáo là 5,5% với độ tin cậy 90%.

^

1
n

Dự đoán % tăng doanh thu: Yi ± tα / 2 n− 2 * S yx * 1 + +
^

Dự đoán điểm: Y = 2,067 + 0,385 * 5,5 = 4,1845
i

(Xi − X )

∑(X

i

− X )2


Với tα / 2;n −2 = t 0,1 / 2;5−2 = t 0,05;3 = 2,353
S yx = 0,186
X = 3,2

∑(X

i

− X ) 2 = 14,8
1

5

Sai số dự đoán = 0,186*2,353* 1 + +

5,5 − 3,2
= 0,5095
14,8

→khoảng tin cậy cho doanh thu là: 4,1845 ± 0,5095 % (Từ 3,675% đến
4,694%)
Vậy với mức tin cậy 90% khi chi phí quảng cáo tăng 5,5% thì khoảng tin
cậy của doanh thu sẽ nằm trong khoảng từ 3,675% đến 4,694%).
*Bảng kết quả từ Excel
SUMMARY OUTPUT
Regression Statistics
Multiple R

0,976967418

R Square

0,954465335

Adjusted R
Square

0,939287113

Standard Error


0,186841938

Observations

5

ANOVA
df

SS

MS

Regression

1

2,19527027

2,19527027

Residual

3

0,10472973

0,03490991

Total


4

2,3

Coefficients

Standard

t Stat

F
62,88387097

P-value

Significance
F
0,00418159
2

Lower 95%

Upper 95%


Error
Intercept

2,067567568


0,176453579

11,71734559

0,00133570
7

% chi phi
quang cao(X)

0,385135135

0,048567249

7,929935117

0,00418159
2

1,50601352
7

2,629121609

0,23057247
2

0,53969779
8




×