BÀI TẬP CÁ NHÂN MÔN THỐNG KÊ
BÀI LÀM
Câu 1: Lý thuyết (2đ)
A- Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
(Đ) - 1. Chỉ tiêu thống kê phản ánh đặc điểm của tổng thể nghiên cứu. Vì chỉ tiêu
thống kê là đặc tính của từng đơn vị tổng thể được chọn ra để nghiên cứu tùy theo ý
nghĩa của mục đích nghiên cứu khác nhau. Trong đó, đơn vị tổng thể là các đơn vị
(Hoặc phần tử) cấu thành nên tổng thể.
(S) - 2. Tần số biểu hiện bằng số tương đối. Vì tần số được biểu hiện bằng số
tuyệt đối còn đối với tần suất được biểu hiện bằng số tương đối với đơn vị tính là lần
hoặc tỷ lệ %.
(S) - 3. Hệ số biến thiên là chỉ tiêu tuyệt đối cho phép so sánh độ biến thiên về
tiêu thức nghiên cứu của hai hiện tượng khác loại. Vì hệ số biến thiên được biểu hiện
bằng số tương đối có được từ sự so sánh độ lệch tiêu chuẩn và trung bình cộng. Hệ số
biến thiện có thể dùng để so sánh các tiêu thức khác nhau.
(Đ) - 4. Khoảng tin cậy cho tham số của tổng thể chung tỷ lệ nghịch với phương
sai của tổng thể. Vì khoảng tin cậy được tính theo công thức:
x Z / 2
x Z / 2
n
n
Ứng với mỗi độ tin cậy nhất định (Z không đổi), khi phương sai biến thiên tăng
sẽ làm tăng khoảng tin cậy. Chính vì vậy, khoảng tin cậy cho tham số của tổng thể
chung sẽ tỷ lệ thuận với phương sai của tổng thể.
(S) - 5. Liên hệ tương quan là mối liên hệ biểu hiện rõ trên từng đơn vị cá biệt. Vì
mối liên liên hệ tương quan là mối liên hệ không hoàn toàn giàng buộc chặt chẽ giữa
tiêu thức nguyên nhân (Biến độc lập) và tiêu thức kết quả (Biến phụ thuộc): mỗi khi có
sự thay đổi giá trị của tiêu thức nguyên nhân sẽ có những giá trị kết quả tương ứng của
tiêu thức. Các mối liên hệ này thể hiện là mối liên hệ không hoàn toàn chặt chẽ, không
được biểu hiện một cách rõ ràng trên từng đơn vị cá biệt.
B- Chọn phương án trả lời đúng nhất:
1: d) Không có điều nào ở trên
2: e) Cả a), b).
1
3 : c) Không chịu ảnh hưởng của các lượng biến đột xuất .
4: d) Cả a) và b).
5: c) Chiều cao của cột biểu thị tần số
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn
thành được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng
khoảng ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm
của ông ta độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm. Hãy tính số
công nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm bình quân
mà họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 5,5. Hãy ước lượng năng
suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Với đầu bài ta có:
1 – α = 0,95 → α = 0,05 → α/2 = 0,025 → A(Z) = 0,975 → Z = 1,96
σ = 6 sản phẩm → σ2 = 62 = 36
Sai số = 1
* Số công nhân cần được điều tra để đạt định mức nghiên cứu là:
Z22
n
Error 2
=
1,962 * 62
1
= 138,2976
n = 139 công nhân
*Như vậy với cỡ mẫu là 139 công nhân số sản phẩm bình quân hoàn thành trong
1 giờ là 35; tương ứng với độ lệch tiêu chuẩn là 5,5. Vấn đề là hãy ước lượng năng
suất trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Ta có:
1 – α = 0,95 → α = 0,05 → α/2 = 0,025
s = 5,5
n = 139
X = 35
Đây là trường hợp ước lượng số trung bình khi chưa biết σ, công thức ước lượng
là:
2
x t / 2;( n 1)
s
s
x t / 2;( n 1)
n
n
Tra bảng, ta có : t = 1, 977
Từ đó suy ra 34,078 ≤ ≤ 35,922
Kết luận: Từ mẫu điều tra trên, mức độ tin cậy 95%, thì số sản phẩm bình quân
một công nhân hoàn thành trong 1 giờ đạt bằng hoặc biến thiên trong khoảng từ
34,078 đến 35,922.
Câu 3 (1,5đ)
Công ty A&T đang nghiên cứu việc đưa vào một công thức mới để thay đổi mùi
hương của dầu gội đầu. Với công thức cũ khi cho 800 người dùng thử thì có 200 người
ưa thích nó. Với công thức mới, khi cho 1000 người khác dùng thử thì có 285 người tỏ
ra ưa thích nó. Liệu có thể kết luận công thức mới đưa vào làm tăng tỷ lệ những người
ưa thích mùi mới không? Với mức ý nghĩa α là bao nhiêu?
Ta có: n1 = 800
n2 = 1000
Gọi p1 là tỷ lệ người ưa thích mùi hương của dầu gội đầu theo công thức cũ
Gọi p2 là tỷ lệ người ưa thích mùi hương của dầu gội đầu theo công thức mới
Cặp giả thiết cần kiểm định là:
H0: p1 ≥ p2
H1: p1 < p2
Với mẫu n1 & n2 đủ lớn, tiêu chuẩn cần kiểm định là:
PS1 – PS2
Z=
√p(1-p)(1/n1 + 1/n2)
Trong đó:
PS1 = 200/800 = 0,25
PS2 = 285/1000 = 0,285
n1PS1 + n2 PS2
p=
800*0,25 + 1000*0,285
=
n1 + n2
800 + 1000
3
200 + 285
p=
= 0,2694
1800
0,25 – 0,285
Z=
√0,2694(1-0,2694)(1/800 + 1/1000)
- 0,035
Z=
= - 0,035 / 0,021 = - 1,67
√0,000443
Tra bảng A1 với Z = 1,67 ta được 1- α = 0,9525 → α = 0,0475 hay
4,75%
Vì đây là kiểm định trái, do đó nếu ứng với một mức tin cậy nào đó tra bảng A1
mà xác định Zα < - 1,67 ta bác bỏ H0 và chấp nhận H1
Có nghĩa là :
- Với độ tin cậy nhỏ hơn 95,25% ( hay mức ý nghĩa lớn hơn 4,75% ) thì Zα < 1,67 ta bác bỏ H0 và chấp nhận H1 ;
- Với độ tin cậy lớn hơn 95,25% ( hay mức ý nghĩa nhỏ hơn 4,75% ) thì Zα > 1,67 ta chấp nhận H0 bác bỏ H1 ;
Kết luận : Với mẫu đã cho, ở mức ý nghĩa lớn hơn 4,75%, có bằng chứng để
nói rằng với công thức mới đưa vào làm tăng tỷ lệ những người ưa thích mùi hương
của công thức mới.
Câu 4 (2,5đ)
Với đề bài ta có tài liệu về doanh thu của một công ty du lịch như sau:
Đơn vị: nghìn USD
Năm
Tháng
2004
2005
2006
2007
2008
1
49
45
47
48
49
47.6
1.146
47.74
2
51
58
54
57
51
54.2
1.304
54.36
3
50
52
56
55
50
52.6
1.266
52.76
4
43
45
50
52
43
46.6
1.122
46.74
Yi
Ii
2009
4
5
47
54
47
50
47
49.0
1.179
49.15
6
40
42
40
42
40
40.8
0.982
40.92
7
34
46
42
32
34
37.6
0.905
37.71
8
31
42
39
37
31
36.0
0.866
36.11
9
28
33
35
35
28
31.8
0.765
31.90
10
31
32
35
34
31
32.6
0.785
32.70
11
46
26
28
30
46
35.2
0.847
35.31
12
35
30
35
38
35
34.6
0.833
34.70
Cộng
485
505
508
510
485
BQ
500.10
41.55
41.68
1- Phân tích tình hình biến động thời vụ về kết quả kinh doanh (Biểu hiện qua
doanh thu) của Công ty qua chỉ số thời vụ (Giản đơn) từ đó đề xuất những kiến
nghị thích hợp.
Từ số liệu về kết quả kinh doanh của Công ty năm 2004 đến năm 2008 cho thấy:
- Doanh thu trung bình hàng năm của Công ty đạt khoảng 41,55 nghìn USD.
- Doanh thu tăng cơ bản tập trung từ tháng 1 dến tháng 5, biểu hiện qua chỉ số Ii
>1. Từ tháng 6 đến tháng 12 doanh thu có xu hướng giảm, được hiện qua chỉ số Ii < 1.
Điều đó chứng tỏ khách du lịch tăng vào thời điểm từ tháng 1 đến tháng 5.
-Sự biến động thời vụ của doanh thu qua các năm Công ty cần tập trung một số
biện pháp sau:
+ Khai thác tối đa các nguồn lực nhằm làm tăng doanh thu vào thời điểm lượng
khách du lịch tăng cao (Từ tháng 1 đến tháng 5). Điển hình là khai thác hết công suất
phòng, thuê nhân công thời vụ, tăng các dịch vụ phục vụ khách du lịch vv…
+ Thời điểm lượng khách du lịch giảm, Công ty cần sử dụng cơ sở vật chất hiện
có vào phục vụ cho các nhu cầu khác, tổ chức sửa chữa cải tạo nâng cấp chuẩn bị phụ
vụ màu du lịch sau tốt hơn.
2- Xác định hàm xu thế tuyến tính biểu diễn xu hướng biến động của doanh
thu qua các năm tại Công ty:
Thực hiện phép tính trên bảng tính Excel, xác định được hàm xu thế tuyến tính
biểu diễn xu hướng biến động của doanh thu như sau:
Yt = 497,1 + 0,5t
5
3- Dự đoán doanh thu của công ty trong các tháng năm 2009 với độ tin cậy
95%.
- Dự toán điểm: Tính tổng doanh thu năm 2009 ( năm thứ 6) theo hàm tuyến
tính trên, chia trung bình doanh thu 1 tháng trong năm nhân với hệ số Ii để ra doanh
thu hàng tháng.
Y2009= 497,1 + 0,5 * 6 = 500,1
Ŷ/tháng 2009 = 500,1/12 = 41.675.
- Dự đoán khoảng: Ta phải làm bài toán ngoại suy hàm xu thế cho tổng doanh thu
năm 2009 (Y2009) với độ tin cậy 95%.
Ta có công thức:
ˆ yˆ nL t / 2,( n2) .Sp
yˆ nL t / 2,( n2) .Sp Y
Trong đó:
Sp
1 3n 2 L 1
S yt . 1
n
n(n 2 1)
2
Sai số mô hình Syt= 14,45337 (kết quả tra trong bảng kết quả hồi quy).
Y2009= 497,1 + 0,5 * 6 = 500,1
n=5, L=1, tính được Sp= 20,945.
Tra bảng t với số bậc tự do 3, mức ý nghĩa 5% (2 phía), ta có t=3.182.
Từ đó ta ước lượng được doanh thu năm 2009 với mức tin cậy 95% nằm trong
khoảng:
433,45≤ Ŷ ≤ 566,75
Chia khoảng ước lượng trên cho 12 tháng nhân với chỉ số thời vụ Ii ta được
khoảng ước lượng doanh thu từng tháng.
ĐVT: 1000$
Tháng
Yi
Ii
Doanh thu năm 2009
Dự đoán Cận dưới
Cận trên
điểm
1
47.6
1.416
59.012
51.15
66.88
2
54.2
1.304
54.344
47.1
61.59
3
52.6
1.266
52.761
45.73
59.79
4
46.6
1.122
46.759
40.53
52.99
5
49.0
1.179
49.135
42.59
55.68
6
6
40.8
0.982
40.925
35.47
46.38
7
37.6
0.905
37.716
32.69
42.74
8
36.0
0.866
36.091
31.28
40.9
9
31.8
0.765
31.881
27.63
36.13
10
32.6
0.785
32.715
28.35
37.08
11
35.2
0.847
35.299
30.59
40
12
34.6
0.833
34.715
30.09
39.34
500.1
433.45
566.75
41.675
36.12
47.23
Tổng doanh thu năm
Trung bình tháng
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh nước ngọt thực hiện một thử nghiệm để
đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi
phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi
chép lại mức độ thay đổi của doanh thu ở các vùng. Thông tin ghi chép được nh sau:
% tăng chi phí quảng cáo
1.5
2
6
4
3
% tăng doanh thu
2.5
3
5
3.5
3
1- Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện
mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ
này qua các tham số của mô hình.
2- Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực
sự có mối liên hệ tương quan tuyến tính không?
3- Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên (qua hệ số
tương quan và hệ số xác định).
4- Hãy ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là
5% với xác suất tin cậy 95%.
Với đề bài đã cho:
Đặt Y: % tăng doanh thu.
Đặt X:% tăng chi phí quảng cáo
1- Xác định phương trình hồi quy tuyến tính để biểu diễn mối liên hệ giữa %
tăng chi phí quảng cáo và % tăng doanh thu:
7
Y là biến phụ thuộc vào biến độc lập X. Từ số liệu đã qua sử dụng hồi quy trong
Exel ta có bảng:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0.9594595
R Square
0.9205625
Adjusted R
Square
0.8940833
Standard
Error
0.3130063
Observations
5
ANOVA
df
SS
MS
F
34.7655172
Regression
1
3.406081081
3.406081081
Residual
3
0.293918919
0.097972973
Total
4
3.7
4
Standard
Coefficients
Error
t Stat
P-value
0.00804830
Intercept
1.8648649
0.295603282
6.308674428
1
0.00973888
X Variable 1
0.4797297
0.081362126
5.89622907
9
Từ đó, có phương trình hồi quy tuyến tính biểu hiện mối liên hệ tỷ lệ giữa % tăng
doanh thu và % tăng chi phí quảng cáo như sau:
Y = 1.86486+0.47973*X
Ý nghĩa các tham số trong hàm hồi quy tuyến tính trên được hiểu như sau:
* bo = 1.86486 - phản ánh ảnh hưởng của các nhân tố khác ngoài nhân tố %
tăng chi phí quảng cáo tới % tăng doanh thu của công ty.
* b1 = 0.47973 - phản ánh ảnh hưởng của chỉ số % thay đổi chi phí quảng cáo tới
% thay đổi của doanh thu. Cụ thể là: Khi chi phí quảng cáo thay đổi 1% thì doanh thu
của Công ty thay đổi 0.47973%.
8
2- Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu
thực sự có mối liên hệ tương quan tuyến tính không?
Để kiểm định giả thiết đề bài ra, ta đặt cặp giả thiết sau:
H0: β1=0 (Không có mối liên hệ tương quan)
H1: β1≠0 (Có mối liên hệ tương quan)
- Với mức ý nghĩa 5% kiểm định 2 phía → t(α/2, n-2) = t(2,5%,33) = 3,182
- Căn cứ bảng tính từ Excell bên trên, ta có: t Stat = 6,503
t stat > t(α/2, n-2) thuộc miền bác bỏ, bác bỏ giả thiết Ho, nhận H1.
Kết luận: có thể nói rằng tỷ lệ % tăng doanh thu có mối liên hệ tuyến tính với tỷ
lệ % tăng quảng cáo.
3- Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên:
Hệ số tương quan (R2 =0,921) có nghĩa rằng với mẫu đề bài đã cho thì 92,1% sự
thay đổi trong tỷ lệ % tăng doanh thu được giải thích bởi tỷ lệ % tăng chi phí quảng
cáo.
Hệ số xác định (Multiple R = 95,9%) điều này chỉ rõ mối liên hệ tương quan giữa
tỷ lệ % tăng chi phí quảng cáo và tỷ lệ % tăng doanh thu là rất chặt chẽ.
4- Ước lượng tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 5%
với xác suất tin cậy 95%:
Ước lượng giá trị Y, khi X = 5% với độ tin cậy là 95%, ta có công thức khoảng
tin cậy là khoảng:
1
Yˆi t / 2;n 2 S yx 1
n
X X
X X
2
i
n
i 1
2
i
Ta có Y5% = 1.85486 + 0.47973*5 = 4.2635%.
Syx = 0.313006 (Tra trong bảng kết quả hồi quy = Standard Error).
Từ mô hình hàm hồi quy ta có:
Yx = 1,6855 + 0,5195 X → Y5% = 1,6855 + 0,5195*5 = 4,2832%.
Syx=0,285842 (tra trong bảng kết quả hồi quy=Standard Error).
Tra bảng t với số bậc tự do =3, mức ý nghĩa 5% (2 phía) ta có t=3,182.
Thay số vào công thức ta tính được khoảng tin cậy của Y5% :
3,2467 % ≤ Y5% ≤ 5,3197 %.
9
Kết luận: Với mẫu điều tra nghiên cứu ở độ tin cậy 95% ( mức ý nghĩa 5%) có
thể xác định rằng: Khi chi phí quảng cáo tăng 5% thì doanh thu tăng trong khoảng từ
3,2467 % đến 5,3197 %.
10