Tải bản đầy đủ (.doc) (12 trang)

Bài tập thống kê ra quyết định số (135)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (115.74 KB, 12 trang )

BÀI TẬP CÁ NHÂN
MÔN HỌC: THỐNG KÊ - KHÓA HỌC: GaMBA01.M1009
Học viên: VŨ TRẦN BÁCH - Lớp GaMBA01.M10

BÀI LÀM:
Câu 1: Lý thuyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu.
Sai vì: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để nghiên
cứu tuỳ theo mục đích nghiên cứu khác nhau. Một tổng thể thống kê có thể nghiên cứu căn cứ
vào nhiều tiêu thức của từng đơn vị tổng thể.
2) Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Sai vì: Tần số trong bảng phân bố tần số có thể được biểu hiện bằng số tương đối, tính
bằng lần khi tần số được biểu hiện bằng số tương đối.
3) Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu thức nghiên
cứu của hai hiện tượng khác loại.
Sai vì: Độ lệch chuẩn là chỉ tiêu cho biết độ biến thiên xung quanh số trung bình của các
lượng biến thuộc tổng thể nghiên cứu. Mặt khác, hai hiện tượng khác loại sẽ có những đặc điểm,
tính chất, mục tiêu nghiên cứu, phương pháp nghiên cứu khác nhau, có các tiêu thức và chỉ tiêu
khác nhau, đơn vị tính khác nhau, không cùng so sánh.
4) Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với phương sai
của tổng thể chung đó.
Sai vì: Phương sai càng nhỏ thì tổng thể chung càng đồng đều, khoảng ước lượng (khoảng
tin cậy) càng nhỏ, thi phương sai, khoảng tin cậy tỷ lệ thuận nhau.
VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên
nhân đến tiêu thức kết quả.



Đúng vì: Mô hình hồi quy tuyến tình của tổng thể mẫu có dạng: Y = b0 + b1 X i
Trong đó:



Y : giá trị dự đoán của Y trong quan sát i (tiêu thức kết quả)

Xi: giá trị của X trong quan sát i (tiêu thức nguyên nhân)
b0: tham số tự do, dùng để ước lượng tổng thể chung β0
b1: độ dốc của mẫu được sử dụng để ước lượng tổng thể chung β1
B. Chọn phương án trả lời đúng nhất:
1) Phân tích dãy số thời gian có tác dụng: Chọn câu f
2) Đại lượng nào phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân đến tiêu thức
kết quả: Chọn câu c
3) Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu: Chọn câu c
4) Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác loại :
Chọn câu a
5) Biểu đồ hình cột (Histograms) không có đặc điểm: Chọn câu c

Câu 2:
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được
bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng có
sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về
năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ
hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng suất trung bình
một giờ của toàn bộ công nhân với độ tin cậy 95%.
Bài làm:
Chúng ta đã biết rằng:


VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


X − Zα / 2

δ
δ
(1)
≤ µ ≤ X + Zα / 2
n
n

hay Z α / 2

Trong đó: Z α / 2

δ
=1
n

α/2 = 2,5%
thay vào công thức: 1,96 ×

δ
là sai số bằng 1
n

Với độ tin cậy 95% nghĩa là α = 5%

Tra bảng AZ ta có: Z = 1,96

δ
=1
n

δ
1
δ
6
=
= 0,5102 ⇒ n =
=
= 11,76
0,5102 0,5102
n 1,96

n= 11,762 = 138,2976 (công nhân)
Như vậy cần chọn mẫu 138 công nhân để điều tra.
Với X = 35 ; δ = 6,5; n = 138; độ tin cậy 95%
thay số liệu vào công thức (1) ta có:
35 − 1,96 ×

6,5
6,5
≤ µ ≤ 35 + 1,96 ×
⇒ 34 ≤ µ ≤ 36
11,76
11,76

Với khoảng tin cậy 95% năng suất lao động trung bình 1 giờ 1 công nhân của doanh nghiệp nằm
trong khoảng 34 ≤ µ ≤ 36 ( sản phẩm.)


Câu 3:
Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một loại sản phẩm. Để
đánh giá xem chi phí trung bình theo hai phương án ấy có khác nhau hay không người ta tiến
hành sản xuất thử và thu được kết quả sau: (ngàn đồng)
Phương án 1: 22 32 36 38 35 26

30 28 24

28

26

34

Phương án 2: 21 27

28 30 32

34

38

25

28 29 23

26

36 28


Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin cậy 95% hãy rút ra
kết luận về hai phương án trên.

VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


Bài làm:
Gọi μ1 là chi phí trung bình của phương án thứ nhất, μ 2 là chi phí trung bình của phương
án thứ hai.
Ta có: H0: μ1 = μ2 (Hai phương án có chi phí trung bình như nhau)
H1: μ1 ≠ μ2 (Hai phương án có chi phí trung bình khác nhau)
P/
A1

P
/A2

2

2

2

1

3

2


2

7

3

2

6

8

3

2

8

9

3

2

5

3

2


2

6

6

3

2

0

8

2

3

8

0

2

3

4

2


2

3

8

4

t-Test: Two-Sample Assuming Equal Variances

P/A1

P/A2

29.92

28.93

25.9

22.8

12

14

Mean

Variance


Observations

Pooled Variance

Hypothesized Mean

22.24

0

Difference
Df

t Stat

24

1.855

VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


2

3

6

8


3

2

4

5

P(T<=t) one-tail

t Critical one-tail

3

P(T<=t) two-tail

6
2

t Critical two-tail

2.064

8

n1

Theo bảng trên:

n1 = 12; X 1 = 29,92 ; S1 = 4,873


s

1

=

∑(x − x )
i =1

i

n1
n2

n2 = 14; X 2 = 28,93 ; S2 = 4,605

s

2

=

2

1

∑(x − x )
i =1


i

2

2

n2

df = (n1 - 1) + (n2 - 1) = (12 – 1) + (14 – 1) = 24
Trường hợp nay kiểm định hai giá trị trung bình của hai tổng thể chung, hai mẫu độc lập
và mẫu nhỏ (n1, n2 < 30), chưa biết phương sai (được coi là bằng nhau).
Kiểm định theo công thức:
t=

X1 − X 2
1
1  Trong đó: Sp2 là phương sai chung.

S ∗  + 
 n1 n 2 
2
p

S p2 =



t=

(n1 − 1) ∗ S12 + (n2 − 1) ∗ S 22 (12 − 1) ∗ 4,873 2 + (14 − 1) ∗ 4,605 2

=
= 22,3708
(n1 − 1) + (n2 − 1)
(12 − 1) + (14 − 1)
29,92 − 28,93

1
1
22,3708 ∗  + 
 12 14 

= 1,35

Với α = 0,05, tra bảng ta được:
VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê



2

,( n1 + n2 − 2 )

= tα
2

, 24

= 2,064

 -2,064<1,35<2,064

Theo kết quả tính toán ta thấy: t không thuộc miền bác bỏ.


Chưa đủ cơ sở bác bỏ với α = 0,05.

Như vậy:: Hai mẫu đã điều tra ở mức ý nghĩa 0,05, chưa đủ bằng chứng để nói rằng chi phí
trung bình hai phương án có khác nhau hay không.

Câu 4:
Dưới đây là dữ liệu về khối lượng sản phẩm than trong 30 tháng gần đây của một nhà
máy (đơn vị: triệu tấn):
6,1
4,9
5,7
4,5
6,4

4,7
5,3
7,0
4,7
3,0

6,2
7,3
3,7
7,8
5,1

7,5

4,8
7,2
6,4
4,5

6,6
5,3
3,8
6,5
7,9

6,0
7,3
3,3
5,2
6,1

Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Giá trị bé nhất trong dãy số liệu là 3,0 và lớn nhất là 7,9, ta xây dựng biểu đồ thân lá với
thân là giá trị phần số nguyên, lá là giá trị phần thập phân. Ta có biểu đồ thân lá sau:

Thân



Tần
số

3


0 7 8 3

4

4

9 5 7 7 8 5

6

VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


5

7 3 1 3 2

5

6

1 4 2 4 6 5 0 1

8

7

0 3 8 5 2 9 3

7

30

Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên
Sắp xếp lại chỗi giá trị theo thứ tự tăng dần như sau (từ trái sang phải, từ trên xuống dưới):
3,0

3,3

3,7

3,8

4,5

4,5

4,7

4,7

4,8

4,9

5,1

5,2

5,3


5,3

5,7

6,0

6,1

6,1

6,2

6,4

6,4

6,6

6,5

7,0

7,2

7,3

7,3

7,5


7,8

7,9

Trong chuỗi giá trị trên:

Max = 7,9
Min = 3,0

Khoảng biến thiên là: 7,9 – 3,0 = 4,9
Với số tổ là 5 và khoảng cách tổ bằng nhau, ta có khoảng cách tổ là: 4,9:5 = 0,98, làm
tròn ta được khoảng cách tổ là 1.
Căn cứ chuỗi số liệu, giới hạn tổ được xác định là 3,0; 4,0; 5,0; 6,0; 7,0; 8,0
Tính trị số giữa của các tổ, ta được: 3,5; 4,5; 5,5; 6,5; 7,5;
Ta lập được bảng tần số phân bố sau:
Sản lượng
(triệu tấn/tháng)

Trị số giữa
(triệu
tấn/tháng)

Tần số

Tần suất

(tháng)

(%)


Từ 3 đến dưới 4

3,5

4

13,33

Từ 4 đến dưới 5

4,5

6

20,00

Từ 5 đến dưới 6

5,5

5

16,67

VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


Từ 6 đến dưới 7

6,5


8

26,67

Từ 7 đến dưới 8

7,5

7

23,33

30

100,00

Cộng

Trong bộ dữ liệu trên có dữ liệu đột xuất. Đó là dữ liệu tổ từ 6 tấn đến dưới 7 tấn đem lại
sản lượng than sản xuất của nhà máy lớn nhất với tần số 8
Tính khối lượng sản phẩm than trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố
tần số. So sánh kết quả và giải thích.
Gọi X 1 là khối lượng sản phẩm than trung bình 1 tháng từ tài liệu điều tra, ta có X 1 được
tính như sau:
n

X1 =

∑X

i =1

Trong đó: X i ,1 là khối lượng sản phẩm than của tháng i

i ,1

n

n: số tháng
Thay số vào ta tính được: X 1 =

170,8
= 5,69 (triệu tấn/tháng).
30

Tính khối lượng sản phẩm than trung bình 1 tháng từ bảng phân bố tần số:
Gọi X 2 là khối lượng sản phẩm than trung bình 1 tháng từ bảng phân bố tần số, ta
có X 2 được tính như sau:
n

X2 =

∑X

i,2

i =1

* fi


Trong đó:

X i , 2 là trị số giữa của tổ thứ i

n
f i là tần số của tổ thứ i

n: số tháng
Thay số vào ta tính được: X 2 =

3,5 * 4 + 4,5 * 6 + 5,5 * 5 + 6,5 * 8 + 7,5 * 7 173
=
= 5,77 (triệu
30
30

tấn/tháng).
VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


Hai giá trị X 1 và X 2 cho thấy hai giá trị trung bình gần bằng nhau do kết quả của dãy số
liệu có khoảng cách khá đều, không có các giá trị đột biến. Tuy nhiên khối lượng sản phẩm than
trung bình từ tài liệu điều tra nhỏ hơn khối lượng sản phẩm than trung bình từ bảng phân bổ tần
số ( X 1 < X 2 ) do có hơn một nửa số tháng (16 tháng) có khối lượng sản phẩm than nhỏ hơn trị số
giữa của tổ, nhưng khi tính theo bảng phân bổ tần số lại được tính giá trị bằng trị số giữa của tổ.
Như vậy, việc tính toán từ số liệu đã xử lý sẽ làm sai lệch kết quả so với ban đầu.

Câu 5:
Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm để đánh giá
mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí quảng cáo trên

5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của
doanh thu ở các vùng. Thông tin ghi chép được nh sau:
% tăng chi phí quảng cáo

1

2

6

4

3

% tăng doanh thu

2.5

3

4.5

3.5

3

* Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ
giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này qua các tham số
của mô hình.
Mô hình hồi quy biểu hiện mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh

thu có dạng như sau:


Y = b0 + b1 X

Trong đó:

b0: tham số tự do.

b1: độ đốc của mẫu (hệ số hồi quy)
Nhập số liệu vào Excel, tính hồi quy, ta có bảng kết quả như sau:
Regression Statistics
Multiple R

0.976967

VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


R Square

0.954465

Adjusted R
Square

0.939287

Standard Error


0.186842

Observations

5

ANOVA
Df

SS

MS

F

Regression

1

62.8838
2.19527 2.19527
7

Residual

3

0.10473 0.03491

Total


4

Coefficien
ts
Intercept
% tăng CPQC

Significance
F
0.004182

2.3

Standard
Error

t Stat P-value Lower 95%

Upper
95%

Lower
95.0%

Upper
95.0%

2.067568


11.7173 0.00133
0.176454
5
6

1.506014 2.629122

1.506014

2.629122

0.385135

7.92993 0.00418
0.048567
5
2

0.230572 0.539698

0.230572

0.539698

b0 = 2.067568, b1 = 0.385135


Vậy mô hình hồi quy tuyến tính có dạng: Y = 2, 067568 + 0,385135* X
Trong đó: Y là % tăng doanh thu
X là % tăng chi phí quảng cáo

Giá trị b1=0,385135 có nghĩa khi chi phí quảng cáo tăng 1% thì doanh thu tăng trung bình
0,385135%.
* Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không?
Ta giả định cặp giả thiết cần kiểm định như sau:
VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


H0: β1 = 0 (không có mối liên hệ giữa % tăng chi phí QC và % tăng DT)
H1: β1 ≠ 0 (thực sự có mối liên hệ giữa % tăng chi phí QC và % tăng DT)
Tiêu chuẩn kiểm định sẽ là:
t=

b1
0,385135
=
= 7,93
S b1 0,048567

t = 7,93 tương ứng với α = 0,004182 < 0,05  giá trị t thuộc miền bác bỏ
Với α = 0,05, bậc tự do n – 2 = 3, tra bảng ta được tα;(n-2) = 3,182
β1 = b1 ± tα ;( n −2 ) ∗ S b1

 0,385135-3,182*0,048567 ≤ β1 ≤ 0,385135+ 3,182*0,048567
 0,230572 ≤ β1 ≤ 0,539698 (%)
Điều này có nghĩa mỗi khi chi phí quảng cáo tăng lên 1% thì doanh thu tăng
khoảng từ 0,230572 đến 0,539698%.
Sai số của mô hình:



S yx =

∑ ( yi − y) 2
n−2

= 0,186842 là độ lệch chuẩn của các giá trị doanh thu xung

quanh giá trị của đường hồi quy lý thuyết.
Vậy bác bỏ giả thiết H0, chấp nhận giả thiết H1. Chi phí quảng cáo và doanh thu có mối
quan hệ tương quan tuyến tính
* Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Đánh giá sự phù hợp của mô hình qua hệ số xác định r2 = 0,954465.
 95,4465% sự thay đổi của doanh thu được giải thích bởi sự thay đổi của chi phí
quảng cáo qua mô hình trên.
Đánh giá cường độ của mối liên hệ qua hệ số tương quan:

VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê


r = r 2 = 0,954465 = 0,977

Vậy: Mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu là mối liên hệ
tương quan tuyến tính thuận (do b1>0  r>0) và rất chặt chẽ (r>0,9).
* Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là
5,5% với xác suất tin cậy 95%.
X =5,5 thay vào công hàm hồi quy trên ta có
Y = 2,068 + 0,385*5,5 = 4,185
Khi % tăng chi phí quảng cáo là 5,5% -> tăng doanh thu là 4,185 % với độ tin
cậy 95%.


VŨ TRẦN BÁCH - GaMBA01.M10 - Bài tập cá nhân – Thống kê



×