GaMBA01.N06
TẬP CÁ NHÂN
MÔN: THỐNG KÊ VÀ KHOA HỌC QUYẾT ĐỊNH
Họ và tên: Bùi Đức Nam
Lớp: GaMBA01 - N06
BÀI LÀM
Câu 1: Lý thyết
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1. Tham số tự do (b0) phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân
đến tiêu thức kết quả.
Trả lời: (S) - Sai
Giải thích: Tham số tự do (b 0) dùng để ước lượng tổng thể chung β 0, phản ánh
hệ số mà kết quả không phụ thuộc vào nguyên nhân.
2. Khoảng tin cậy cho tham số nào đó của một tổng thể chung tỷ lệ nghịch với
phương sai của tổng thể chung đó.
Trả lời: (S) - Sai
Giải thích: Phương sai càng nhỏ thì tổng thể chung càng đồng đều từ đó khoảng
ước lượng càng nhỏ hay khoảng tin cậy càng nhỏ.
3. Phương sai là chỉ tiêu tương đối cho phép so sánh độ biến thiên của tiêu thức
nghiên cứu của hai hiện tượng cùng loại và có số trung bình không bằng nhau.
Trả lời: (S) - Sai
Giải thích: Phương sai là thuớc do quan trọng của độ biến thiên, là số trung
bình của bình phương các độ lệch giữa các giá trị của từng quan sát và số trung
bình cộng của các giá trị đó.
4. Tần số trong bảng phân bố tần số biểu hiện bằng số tuyệt đối
Trả lời: (Đ) - Đúng
Giải thích: Vì tần số là đơn vị được phân phối vào trong mỗi tổ, biểu hiện bằng
sô tuyệt đối, tần suất biểu hiện bằng số tương đối.
5. Tiêu thức thống kê phản ánh đặc điểm của tổng thể nghiên cứu
1
GaMBA01.N06
Trả lời: (S) - Sai
Giải thích: Tiêu thức phản ánh đặc điểm của đơn vị tổng thể nghiên cứu chứ
không phải đặc điểm của tổng thể nghiên cứu.
B. Chọn phương án trả lời đúng nhất:
1. Phân tích dãy số thời gian có tác dụng:
δ a) Phân tích đặc điểm biến động của hiện tượng qua thời gian.
ε b) Biểu hiện xu hướng và tính quy luật của sự biến động
φ c) Là cơ sở để phân tích kết cấu của hiện tượng.
γ d) Cả a), b).
η e) Cả b), c).
ι f) Cả a), b), c).
2. Đại lượng nào không phản ánh mức độ ảnh hưởng của tiêu thức nguyên nhân
đến tiêu thức kết quả:
a) Hệ số tương quan.
b) Hệ số chặn (b0)
c) Hệ số hồi quy (b1 ).
d) Cả a), b).
ϕ
e) Cả a), c).
3. Các yếu tố ảnh hưởng đến số lượng đơn vị tổng thể mẫu:
a) Độ tin cậy của ước lượng.
b) Độ đồng đều của tổng thể chung.
c) Tiêu thức nghiên cứu.
d) Cả a), b).
e) Cả a), b), c).
4. Chỉ tiêu nào sau đây cho phép so sánh độ biến thiên của các hiện tượng khác
loại:
a) Độ lệch tiêu chuẩn
b) Khoảng biến thiên
c) Khoảng tứ phân vị
d) Hệ số biến thiên
κ e) Cả a), c)
λ
f) Cả a), d)
5. Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
2
GaMBA01.N06
b) Độ rộng của cột biểu hiện khoảng cách tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
Câu 2: Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành
được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước
lượng có sai số bằng 1,5 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ
lệch tiêu chuẩn về năng suất trong một giờ là 8 sản phẩm. Hãy tính số công nhân cần được
điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ hoàn
thành trong 1 giờ là 45 với độ lệch tiêu chuẩn là 7,5. Hãy ước lượng năng suất trung bình
một giờ của toàn bộ công nhân với độ tin cậy 95%.
Bài làm:
2.1 Tính số công nhân cần được điều tra để đặt định mức.
Ta có:
Er = 1,5 sản phẩm
Năng suất lao động trong một giờ: 8 sản phẩm/h
Với độ tin cậy 95% suy ra khoảng tin cậy 1 - α/2 = 1 - 0.05/2 = 0,975
=> tra bảng ta có Zα/2 = 1,960
Thay vào công thức ta được: n = 109,27; sấp xỉ 110 (làm tròn lên)
Kết luận: Với độ tin cậy 95% và sai số bằng 1,5 sản phẩm thì số công nhân cần
được điều tra để đặt định mức là 110 người.
2.2 Ước lượng năng suất trung bình một giờ của toàn bộ công nhân với độ tin
cậy 95%
Gọi µ là năng suất trung bình một giờ của toàn bộ công nhân
Năng suất trung bình: X = 45 sản phẩm;
Độ lệch chuẩn của tổng thể là: S= 7,5 sản phẩm/h
3
GaMBA01.N06
Đây là trường hợp có cỡ mẫu lớn (trên 30 mẫu) và chưa biết mức độ phân bố
của mẫu là chuẩn hay không, ta tra bảng được tα/2 = 1,982.
Áp dụng công thức:
Ta tính được 43,58 ≤ µ ≤ 46,42
Kết luận: Với độ tin cậy là 95% thì năng suất trung bình một giờ công của công
nhân nằm trong khoảng từ 44,58 đến 46,42 sản phẩm.
Câu 3: Tại một doanh nghiệp người ta xây dựng hai phương án sản xuất một
loại sản phẩm. Để đánh giá xem chi phí trung bình theo hai phương án ấy có
khác nhau hay không người ta tiến hành sản xuất thử và thu được kết quả sau:
(ngàn đồng)
P/A 1 25
32
35
38
35
26
30
28
24
28
26
34
28
27
26
P/A 2 20
27
25
29
23
26
28
30
32
34
38
25
30
24
27
28
Chi phí theo cả hai phương án trên phân phối theo quy luật chuẩn. Với độ tin
cậy 95% hãy rút ra kết luận về hai phương án trên.
Bài làm:
Theo đề bài: Gọi µ1 và µ2 là chi phí trung bình của hai phương án 1 và phương
án 2.
Ta có cặp giải thiết cần kiểm định:
H0: µ1 = µ2 (phương án 1 giống phương án 2)
H1: µ1 ≠ µ2 (phương án 1 khác phương án 2)
n1 = 15, n2 = 16
Trung bình X1 = 29,4667
Trung bình X2 = 27,8750
t-Test: Two-Sample Assuming Equal Variances
4
GaMBA01.N06
Mean
Variance
Observations
Pooled Variance
Hypothesized Mean Difference
Df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail
Phương án 1
29,4667
18,5524
15
18,9477
0,0000
29
1,0174
0,1587
1,6991
0,3174
2,0452
Phương án 2
27,8750
19,3167
16
Đây là trường hợp so sánh 2 trung bình của tổng thể chung với hai mẫu
độc lập khi chưa biết phương sai của tổng thể chung, số lượng đơn vị mẫu nhỏ
(dưới 30), tiêu chuẩn kiểm định được chọn là t, 2 phía.
Kiểm định t với phương sai chung:
Do µ1 = µ2 = 0
Căn cứ từ bảng trên ta có
SP
2
(n1 − 1) S12 + (n2 − 1) S 22
=
n1 + n2 − 2
Phương sai chung
Từ công thức trên hoặc qua tính trên bảng Excel ta có:
Sp2 = 18,9477 và t = 1,0174
Với độ tin cậy là 95% => α = 5% ta tính được tα/2 = 2,0452
Theo đó không thuộc miền bác bỏ => chưa đủ cơ để để bác bỏ H0
5
GaMBA01.N06
Kết luận: Với độ tin cậy 95% và số lượng đơn vị mẫu được chọn chưa có bằng
chứng để chứng tỏ chi phí trung bình của hai phương án có khác nhau hay
không.
Câu 4: Dưới đây là dữ liệu về khối lượng than khai thác được trong 50 tháng gần
đây của một nhà máy (đơn vị: triệu tấn):
6,1
4,9
5,7
4,5
6,4
1.
2.
3.
4.
4,7
5,3
7,0
4,7
3,0
6,2
7,3
3,7
7,8
5,1
7,5
4,8
7,2
6,4
4,5
6,6
5,3
3,8
6,5
7,9
6,0
7,3
12,3
5,2
6,1
5,5
7,5
5,4
7,2
6,4
5,3
7,0
4,7
3,0
6,2
6,2
7,5
11,5
5,2
6,1
5,7
4,5
6,4
6,1
6,1
Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều
tra và từ bảng phân bố tần số. So sánh kết quả và giải thích.
Bài làm:
4.1 Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
Thân
(Triệu tấn)
3
4
5
6
7
11
12
Lá (trăm ngàn tấn)
0
9
7
1
0
5
3
7
5
3
4
3
8
7
1
2
8
0
7
3
4
5
8
2
6
2
5
5
5
9
7
4
0
3
5
3 2 7
1 4 2 2 1 4 1 1
5 2 0 5
4.2 Xây dựng bảng tần số phân bố phù hợp với bộ dữ liệu trên.
Tổ
Từ 3 đến dưới 4 triệu tấn
Tần số
Tần suất
4
8%
Tần số
tích luỹ
4
Tần suất
tích luỹ (%)
8%
6
GaMBA01.N06
Từ 4 đến dưới 5 triệu tấn
Từ 5 đến dưới 6 triệu tấn
Từ 6 đến dưới 7 triệu tấn
Từ 7 đến dưới 8 triệu tấn
Từ 8 đến dưới 9 triệu tấn
Từ 9 đến dưới 10 triệu tấn
Từ 10 đến dưới 11 triệu tấn
Từ 11 đến dưới 12 triệu tấn
Từ 12 đến dưới 13 triệu tấn
8
10
15
11
0
0
0
1
1
16%
20%
30%
22%
0%
0%
0%
2%
2%
Tổng
50
100
12
22
37
48
48
48
48
49
50
24%
44%
74%
96%
96%
96%
96%
98%
100%
Nhận xét:
Sản lượng khai thác than được phân bổ từ 3 đến 12,3 tấn
Khối lượng than khai thác được trong vòng 50 tháng tháng ở khoảng từ 6 triệu
tấn đến dưới 7 tấn chiếm tỷ trọng cao nhất (30%), khối lượng khai thác từ 8
triệu tấn đến dưới 11 triệu tấn là không có.
4.3 Trong bộ dữ liệu trên có dữ liệu đột xuất không, nếu có là dữ liệu nào?
Trước hết ta xác định khoảng tứ phân vị:
+ Vị trí tại điểm Q1 = i*(n+1)/4 = 1*(50+1)/4 = 12,75; căn cứ bảng sắp xếp
dữ liệu suy ra Q1 = 5.
+ Tương tự, vị trí tại điểm Q3 = 3*(50+1)/4 = 38,25; căn cứ bảng sắp xếp
dữ liệu suy ra Q3 = 7.
+ Khoảng tứ phân vị: IQR = Q3 - Q1= 2, ta tính ra 1,5 IQR = 3
Trung vị của bộ dữ liệu (Me): là trị số ở vị trí giữa của bộ dữ liệu (là bình quân
của 2 số đứng giữa) là Me= 6,1 triệu tấn
Ta có Đồ thị hộp ria mèo như sau:
Nghi ngờ là
lượng biến đột
xuất
1.5IQR
1.5IQR
1.5IQR
Nghi ngờ là
lượng biến độtLượng biến
đột xuất
xuất
1.5IQR
7
GaMBA01.N06
2
Q1=5
Me=6,1
Q3=7
10
13
Kết luận: Từ bộ dữ liệu trên ta thấy có hai giá trị: 11,5 và 12,3 là giá trị thuộc
khoảng nghi ngờ là lượng biến đột xuất. Theo đó dữ liệu 11,5 và 12,3 triệu tấn
được nghi ngờ là dữ liệu đột xuất.
4.4 Tính khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu
điều tra và từ bảng phân bố tần số. So sánh kết quả và giải thích.
Dùng hàm Descriptive Statistics trong Excel ta có được
Sản lượng
(bao gồm cả biến đột xuất)
Mean
Standard Error
Median
Mode
Range
Minimum
Maximum
Sum
Count
6,066
0,239
6,1
6,1
9,3
3
12,3
303,3
50
Sản lượng
(Không bao gồm biến đột
xuất)
Mean
Standard Error
Median
Mode
Range
Minimum
Maximum
Sum
Count
5,823
0,175
6,1
6,1
4,9
3
7,9
279,5
48
a. Khối lượng than trung bình khai thác được trong 1 tháng từ tài liệu điều tra
Được tính bằng bình quân cộng 50 tháng của tổng khối lượng than khai thác
trong 50 tháng):
Khi chưa loại bỏ biến đột xuất: 303,3/50 = 6,066 triệu tấn.
Khi đã loại bỏ biến đột xuất: 279,5/48 = 5,823 triệu tấn
b. Khối lượng than trung bình khai thác được trong 1 tháng từ bảng phân bổ tần
số:
Khi chưa loại bỏ biến đột xuất: 312,7/50= 6,254 triệu tấn.
Khi đã loại bỏ biến đột xuất: 288,7/48 = 5,774 triệu tấn.
8
GaMBA01.N06
Nhận xét: Hai kết quả trên khác nhau do việc áp dụng hai cách tính, kết quả từ
tài liệu điều tra là bình quân cộng số liệu thực tế, kết quả từ bảng phân bổ tần
số tính theo tần số và trị số giữa của mỗi tổ.
Câu 5: Một hãng trong lĩnh vực kinh doanh dầu gội đầu thực hiện một thử nghiệm
để đánh giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng
chi phí quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và
ghi chép lại mức độ thay đổi của doanh thu ở các vùng như sau:
% tăng chi phí quảng
cáo
% tăng doanh thu
1
2
6
4
3,5
5,5
3
2,5
7
2
3
4,5
3,5
3
5
2,5
2
6
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện
mối liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối
liên hệ này qua các tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực
sự có mối liên hệ tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là
7% với độ tin cậy 90%.
Bài làm:
5.1 Xác định một phương trình hồi quy tuyến tính để biểu hiện mối liên hệ giữa
% tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ này
qua các tham số của mô hình.
Yêu cầu của bài là xác định ảnh hưởng của doanh thu khi thay đổi chi phí
quảng cáo, gọi Y là biến % tăng doanh thu thì X là biến % tăng chi phí quảng
cáo, ta có Y là biến phụ thuộc theo X, lập lại bảng tổng hợp dữ liệu như sau:
X
Vùng % tăng chi phí
quảng cáo
1
1
2
2
3
6
Y
% tăng
doanh thu
2
3
4,5
9
GaMBA01.N06
4
5
6
7
8
9
4
3,5
5,5
3
2,5
7
3,5
3
5
2,5
2
6
Chạy hàm Regression trong Excel ta có
Regression Statistics
Multiple R
R Square
Adjusted R
Square
Standard Error
Observations
0,939
0,882
0,865
0,511
9
ANOVA
df
Regression
Residual
Total
Intercept
% tăng chi phí
quảng cáo
1
7
8
SS
13,669
1,831
15,500
MS
13,669
0,262
F
52,246
Coefficients
0,975
Standard
Error
0,389
t Stat
2,508
P-value
0,041
0,659
0,091
7,228
0,000173
Significance
F
0,000
Lower 95%
0,056
Upper
95%
1,894
Lower
95,0%
0,056
Upper
95,0%
1,894
0,443
0,874
0,443
0,874
Như vậy, ta có có phương trình hồi quy tuyến tính biểu hiện mối liên hệ % tăng
chi phí quảng cáo và % tăng doanh thu: Y = 0,975 + 0,659X
Qua phương trình trên ta thấy:
+ bo = 0,975: Đây là tổng ảnh hưởng của các nhân tố khác tác động lên
doanh thu ngoài nhân tố chi phí quảng cáo.
+ b1 = 0,659: Khi chi phí quảng cáo tăng 1% thì mô hình dự đoán doanh
thu sẽ tăng khoảng 0,659%, có mối quan hệ tỉ lệ thuận giữa chi phí
quảng cáo và doanh thu.
10
GaMBA01.N06
5.2 Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu
thực sự có mối liên hệ tương quan tuyến tính không?
Kiểm định mối liên hệ % tăng chi phí quảng cáo và % tăng doanh thu
Cặp kiểm định
+ Ho: β1 = 0 (% tăng chi phí quảng cáo không ảnh hưởng đến % tăng doanh
thu)
+ H1: β2 ≠ 0 (% tăng chi phí quảng cáo có ảnh hưởng đến % tăng doanh
thu)
ta có: t = b1/Sb1 = 0,659/0,091 = 7,228 tương ứng với α = 0,0173% (thuộc
miền bác bỏ)
=> Bác bỏ Ho, chấp nhận H1. Có bằng chứng cho mối liên hệ tương quan tuyến
tính giữa % tăng chi phí quảng cáo và % tăng doanh thu.
Ước lượng cho tổng thể chung:
β1= b1 ± tα/2;(n-2).Sb1
Tra bảng t2,5%;7 ta có kết quả là 2,365
=> β1 sẽ nằm trong khoảng từ 0,443 đến 0,874 (0,443 ≤ β1 ≤ 0,874)
Kết luận: Với độ tin cậy 95%, nói chung, mỗi khi chi phí quảng cáo tăng thêm
1% thì doanh thu nói chung tăng trong khoảng từ 0,443% đến 0,874%
5.3 Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Từ kết quả bảng tính tại mục 5.1 ta có:
+ Sai số của mô hình: 0,511
+ Sự phù hợp của mô hình: R 2 = 0,882 (88,2%) => 88,2% sự thay đổi của
doanh thu được giải thích bởi mô hình trên trong mối liên hệ với chi phí
quảng cáo.
+ Cường độ mối liên hệ: R = 0,939 (trên 0,9 và mang dấu “+”) nên đây là
mối liên hệ chặt chẽ thuận.
Tài liệu tham khảo:
1. Giáo trình Thống kê trong kinh doanh;
2. Slide bài giảng;
11
GaMBA01.N06
3. Giáo trình nguyên lý thống kê kinh tế.
12