Tải bản đầy đủ (.doc) (10 trang)

Bài tập xác suất thống kê số (1)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (132.84 KB, 10 trang )

BÀI TẬP CÁ NHÂN
MÔN HỌC: THỐNG KÊ TRONG KINH DOANH
HỌ VÀ TÊN: HÀ QUỐC TUẤN
LỚP: GaMBA.X01
CÂU 1:
A. Trả Trả lời đúng (Đ), sai (S) cho các câu hỏi sau và giải thích tại sao?
1. Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu. (Đúng)
Vì: Tiêu thức thống kê là đặc điểm của từng đơn vị tổng thể được chọn ra để
nghiên cứu tùy theo mục đích khác nhau, do vậy nó phản ánh đặc điểm của từng
tổng thể nghiên cứu. Tiêu thức thống kê có thể gồm các loại: tiêu thức thuộc tính
(giới tính, nghề nghiệp, ngành nghề kinh tế), tiêu thức số lượng (số nhân khẩu, tiền
lương,....), tiêu thức thay phiên (nam, nữ..)
2. Tần suất biểu hiện bằng số tuyệt đối. (Sai). Vì tần suất biểu hiện tỷ trọng
của từng tổ trong tổng thể và được biểu hiện bằng số tương đối (đơn vị tính là lần
hoặc %).
3. Độ lệch chuẩn là chỉ tiêu tương đối cho phép so sánh độ biến thiên về tiêu
thức nghiên cứu của hai hiện tượng khác loại. (Sai)
Vì Độ lệch chuẩn bằng căn bậc hai của phương sai (tức là số bình quân toàn
phương của bình phương các độ lệch giữa các lượng biến với số bình quân cộng
của các lượng biến đó). Nó dung để so sánh độ biến thiên vè tiêu thức nghiên cứu
của hai hiện tượng cùng loại và có số trung bình bằng nhau.
4. Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ nghịch với phương
sai của tổng thể. (Sai)
Vì khoảng tin cậy cho tham số của tổng thể chung được tính theo công thức:

(Trong đó là
trung bình của tham số trong tổng thể chung)
Khi σ tăng (hoặc giảm) trong khi
và n không đổi, khoảng tin cậy của
tham số của tổng thể chung tăng (hoặc giảm). Như vậy khoảng tin cậy cho tham số
của tổng thể chung tỷ lệ thuận với phương sai của tổng thể.


5. Phương pháp dãy số bình quân trượt không nên dung trong dãy số có biến
động thời vụ. (Đúng)
Vì: Phương pháp dãy số bình quân trượt sử dụng để san bằng dãy số có
nhiều biến động ngẫu nhiên, phương pháp này làm trơn nhẵn biến động thực tế nên
ko dùng với dãy số có biến động thời vụ mà thường dùng với dãy số theo năm.


B. Chọn phương án trả lời đúng nhất:
1. Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên
Đáp án: d
2. ưu điểm của Mốt là:
a) San bằng chênh mọi chênh lệch giữa các lượng biến
b) Không chịu ảnh hưởng của các biến đột xuất
c) Kém nhạy bén với sự biến động của tiêu thức
d) cả a), b)
e) cả a),b),c)
Đáp án: b
3. Đại lượng nào phản ánh chiều hướng của mối liên hệ tương quan:
a) Hệ số tương quan.
b) Hệ số chặn (b0 )
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
e) Cả a), c).
f) Cả a), b), c).
Đáp án e
4. Biểu đồ hình cột (Histograms) có đặc điểm:

a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Đáp án: e
5.Các biện pháp hạn chế sai số chọn mẫu
a, Tăng số đơn vị tổng thể mẫu
b, Sử dụng phương pháp chọn mẫu thích hợp
c, Giảm phương sai tổng thể chung
d, Cả a, c
Đáp án b

CÂU 2:


1. Gọi X là số sản phầm công nhân hoàn thành trong 1 giờ làm việc. Theo
giả thiết X phân phối chuẩn với σ = 6. Vậy số sản phẩm trung bình công nhân hoàn
thành trong 1 giờ là µ đây là bài tóan ước lượng khỏang tin cậy đối xứng của tham
số µ khi đã biết phương sai. Công thức ước lượng là:

Theo giả thiết đầu bài ta có sai số khoảng ước lượng bằng 1 sản phẩm và độ
tin cậy 95% (mức ý nghĩa α = 5%), độ lệch tiêu chuẩn б = 6 sản phẩm, tính số công
nhân cần điều tra (n).
=>

Zα / 2 *

=1


Tra bảng Z ta có

Z 0, 025 =1,96, thay vào công thức ta có:

 1,96*6/√n =1
 n = 138,29
Như vậy, cần điều tra với 139 công nhân để đạt định mức.
2. Ước lượng năng suất trung bình 1 giờ của toàn bộ công nhân với độ tin
cậy 95%, (cỡ mẫu theo kết quả câu 1) là n = 39; sảm phẩm mà họ hoàn thành trong
một giờ ( ) là 35 với độ lệch tiêu chuẩn là (s) 6,5.
Đây là bài toán ước lượng trung bình (µ) đối xứng khi chưa biết độ lệch tiêu
chuẩn của tổng thể chung. Công thức ước lượng là:

X − tα / 2;( n −1)
Tra bảng ta có
=>

s
s
≤ µ ≤ X + tα / 2;( n−1)
n
n

t 0, 025(138 ) = 1,978

35 - 1,978 * 6,5/√139 ≤ µ ≤ 35 + 1,978* 6,5/√139
33,91 ≤ µ ≤ 36,09



Như vậy, với độ tin cậy 95%, năng suất trung bình một giờ của toàn bộ công
nhân nằm trong khoảng từ 33,91 sản phẩm đến 36,09 sản phẩm.
CÂU 3:
Gọi X1 là chi phí của Phương án 1, Gọi X 2 là chi phí của phương án 2 theo
giả thiết đầu bài X1 và X2 phân phối chuẩn với σ21 và σ22 chưa biết. Vậy chi phí
trung bình theo các phương án đó µ 1 và µ2, đây là bài toán kiểm định với cặp giả
thiết cần kiểm định là:
Ho: µ1 = µ2 (chi phí trung bình của 2 phương án là như nhau)
H1: µ1 # µ2 (chi phí trung bình của 2 phương án là khác nhau)
khi chưa biết σ21 và σ22 và n1, n2 <30, ta áp dụng tiêu chuẩn kiểm định:

X1

PHƯƠNG ÁN 1
 X1
(x1i-X1)2
25
22.56
32
5,06
35
27,56
38
68,06
35
27,56
26
14,06
30
0,06

28
3,06
24
33,06
28
3,06
26
14,06
30
0,06

Σ = 357

29,75

Từ công thức kiểm định

Σ = 218,25

PHƯƠNG ÁN 2
X2
X2
(x2i -X2)2
20
67,47
27
1,47
25
10,33
29

0,62
23
27,19
26
4,90
28
0,05
30
3,19
32
14,33
34
33,47
38
95,76
25
10,33
30
3,19
28
0,05
Σ = 395
28,21 Σ = 272,36


Trong đó:

(n1 − 1) S12 + (n2 − 1) S 22
S =
=

n1 + n2 − 2
2

Thay số ta có
S2 =

tqs =

∑ (Xi

1

− X 1 ) 2 + ∑ (Xi2 − X 2 ) 2
n1 + n2 − 2

218,25 + 272,36
= 20,44
10 + 12 − 2

X1 − X 2
S2 S2
+
n1 n 2

=

29,75 − 28,21
20,44 20,44
+
12

14

= 0,863

Tra bảng tìm giá trị: tα / 2;( n1 +n2 −2 )
Ta có kiểm định với độ tin cậy 95% => α = 5%; α / 2 = 2,5%

tα / 2;( n1 +n2 −2 ) = 2,064
ta có biểu đồ khoảng tin cậy

Miền bác bỏ

Miền bác bỏ

-2,064

-0,863

0

0,863 2,064

Nhìn vào đồ thị khoảng tin cậy ta thấy giá trị của t qs không thuộc miền bác bỏ. Do
vậy, chưa có đủ căn cứ để bác bỏ giả thiết Ho và chấp nhận giả thiết H1.
Như vậy với 2 mẫu đã điều tra, ở mức ý nghĩ 5% chưa có đủ cơ sở kết luận chi phí
trung bình của hai phương án là khác nhau.
CÂU 4:
1. Sơ đồ thân lá:
3
4

5
6
7
12

078
957785
73132
14246501
0385293
3


2. Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu:
Khối luợng than khai thác
Từ 3 đến dưới 4 tấn
Từ 4 đến dưới 5 tấn
Từ 5 đến dưới 6 tấn
Từ 6 đến dưới 7 tấn
Từ 7 tấn trở lên
Tổng

Tần số
3
6
5
8
8
30


Tần suất
0.10
0.20
0.17
0.27
0.27
1.00

%
10
20
17
27
27
100

3. Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Để có thể nhận biết biến đột xuất ta vẽ biểu đồ Hộp ria mèo (Box plot) để xác định:
Từ bộ dữ liệu đã cho ta tính được Q1 = 4,83 ; Q2 = 6,05 ; Q3 = 6,90
=> IQR = Q3 - Q1 = 6,9 - 4,83 = 2,07
Sơ đồ Hộp ria mèo:

Như vậy, trong bộ dữ liệu có giá trị 12,3 nằm trong khoảng nghi ngờ là biến
đột suất (10,01 đến 13,13). Do vậy chưa kết luận đươc trong bộ dữ liệu trên có dữ
liệu đọt suất.
4. Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu
điều tra và từ bảng phân bố tần số. So sánh kết quả và giải thích.
a. Khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra:
Áp dụng công thức:



b. Khối lượng than trung bình khai thác được trong 1 tháng từ bảng phân bổ tần số:
Ta c ó:
Khối luợng than khai thác
Từ 3 đến dưới 4 tấn
Từ 4 đến dưới 5 tấn
Từ 5 đến dưới 6 tấn
Từ 6 đến dưới 7 tấn
Từ 7 tấn trở lên
Tổng

Trị số
giữa (Xi)
3.5
4.5
5.5
6.5
7.5

Tần số
(fi)
3
6
5
8
8
30

Xi*fi
10.5

27
27.5
52
60

177

Áp dụng công thức:

= 177/30 = 5,90
Như vậy số bình quân từ tài liệu điều tra (a) lớn hơn số bình quân tính từ
bảng phân bổ tần số (b) vì (b) lấy trị số giữa của tôt là 7,5 nhưng có một biến trong
tổ có trị số 12,3 đã được đưa về trị số thấp hơn rất nhiều (7,5).
CÂU 5:
1.
Gọi X là % tăng lên của chi phí quảng cáo
Gọi Y là %tăng lên của doan thu
Với dữ liệu đã cho với mức độ tin cậy là 90% ta có bảng dữ liệu sau :
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9770
R Square
0.9545
Adjusted R
Square
0.9393
Standard
Error
0.1868

Observations
5
ANOVA


df
Regression
Residual
Total

Intercept
%t?ng CF
QC

1
3
4

SS
2.1953
0.1047
2.3

MS
2.1953
0.0349

F
62.8839


t Stat

P-value
0.0013
4
0.0041
8

Coefficient
s

Standard
Error

2.0676

0.1765

11.7173

0.3851

0.0486

7.9299

Significanc
eF
0.00418


1.5060

2.6291

Lower
95.0%
1.506
0

0.2306

0.5397

0.2306

Lower 95%

Upper 95%

Upper
95.0%

0.5397

2.6291

Như vậy b0 = 2,0676 ; b1 = 0,3851
Ta có phương trình hồi quy tuyến tính như sau:
= 2,0676 + 0,3851 X
Khi chi phí quảng cáo tăng 1% thì doanh thu sẽ tăng khoảng 0,3851%

Khi chi phí quảng cáo là bằng 0 thì doanh thu tối thiểu ở mức 2,0676%
Sai số chuẩn của mô hình là Sxy = 0,1868
Hàm số có mối liên hệ tỷ lệ thuận.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và phần trăm tăng doanh thu
thực sự có mối liên hệ tương quan tuyến tinh hay không?
Dùng tiêu chuẩn kiểm định T – Student để kiểm định hệ số hồi quy β1 với ý nghĩa
liệu thực sự có mối liên hệ tuyến tính giữa X (% tăng chi phí quảng cáo) với Y (%
tăng doanh thu) hay không?
Ta có cặp giả thiết kiểm định: Ho β1= 0 không có mối liên hệ tuyến tính
H1 β1≠ 0 có mối liên hệ tuyến tính
Công thức kiểm định:
B1- β1
tqs = ------------Sb1
Với n-2 bậc tự do
Theo kết quả chạy Exell ở câu 1 với xác suất độ tin cậy là 90%
Ta có
0,3851
tqs = ----------------- = 7,9299
0,0486
tqs = 7,9299 ứng với giá trị α = 0,00418 <0,1


ta có biểu đồ khoảng tin cậy

Miền bác bỏ

Miền bác bỏ

-0,00209


-0,05

0

0,05

0,00209

Có nghĩa là giá trị của tqs thuộc miền bác bỏ do vậy có cở sở để bác bỏ giả
thiết Ho chấp nhận giả thiết H1. Điều này có nghĩa là: giữa % tăng chi phí quảng
cáo và phần trăm tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình
Căn cứ kết quả đã tính toán ở câu 1 ta có
R = 0, 9770 cho thấy hàm số có mối liên hệ giữa giữa % tăng chi phí quảng
cáo và phần trăm tăng doanh thu rất chặt chẽ và đây là mối liên hệ tỷ lệ thuận.
R2= 0,9545 có nghĩa là 95,45% sự thay đổi của Y (% tăng doanh thu) sẽ
được giải thích bới 97,70% sư thay đổi của X (% tăng chi phí quảng cáo).
4. hãy ước đoán tỷ lệ tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5% với
xác suất độ tin cậy là 90%
STT
1
2
3
4
5
Tổng cộng

% tăng chi phí
quảng cáo (X)
1

2
6
4
3
16

% tăng doanh thu (Y)

= (1+2+6+4+3)/5= 3,2
Từ phương trình hồi quy
= 2,0676 + 0,3851 X

2,5
3
4,5
3,5
3

(Xi- X)2
4,84
1,44
7,84
0,64
0,04
14,8


Với % tăng chi phí quảng cáo là 5% ta có :
Y5 = 2,0676 + 0,3851*5= 3,9931
* Ta có dự đoán điểm :

Y5 = 3,9931
* Đây là ước lượng khoảng tin cậy cho 1 giá trị cá biệt của Y ( Y5 ) tại một
giá trị cá biệt của X (X5) , do vậy sai số dự đoán được tính theo công thức :
1
tα / 2;n − 2 ⋅ S yx ⋅ 1 + +
n

(X − X)
∑( X − X )
2

i

n

i =1

2

i

Tra bảng t với số bậc tự do =3, mức ý nghĩa 10% (2 phía) ta có t=2.353.
Syx = 0,1868 ; n = 5 ;

= 3,2
1 ( 5 − 3,2 )
+ 5
5
∑14,8


2

Sai số dự đoán là:: 2.353* 0,1868*

1+

i =1

Sai số dự đóa là : 0,5236
Cận trên là : 3,9931+ 0,5236= 4,5167
Cận dưới là : 3,9931- 0,5236= 3,4695
Kết luận: Với độ tin cậy 90%, khi chi phí quảng cáo tăng 5% thì doanh
thu tăng trong khoảng từ 3,4695% đến 4,5167%.



×