Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
BÀI TẬP CÁ NHÂN
MÔN HỌC: THỐNG KÊ TRONG
KINH DOANH
HỌ TÊN: NGÔ THỊ THÚY ANH
LỚP: GAMBA01.NO3
Câu 1: Lý thuyết (2điểm)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Chỉ tiêu thống kê phản ánh đặc điểm của đơn vị tổng thể: SAI
Bởi vì: Chỉ tiêu thống kê phản ánh đặc điểm của toàn bộ tổng thể trong điều kiện thời gian và
địa điểm cụ thể. Chỉ tiêu thống kê là tổng hợp biểu hiện mặt lượng của nhiều đơn vị, hiện tượng
cá biệt. Vì thế, chỉ tiêu phản ánh những mối quan hệ chung, đặc điểm của số lớn các đơn vị hoặc
của tất cả các đơn vị tổng thể. Và vì có thể không đại diện cho xu hướng của tổng thể, đặc biệt là
đối với những đơn vị mang lượng biến đột xuất nên chỉ tiêu thông kê không phản ánh đặc điểm
của đơn vị tổng thể
2) Tần số tích lũy trong bảng phân bố tần số biểu hiện bằng số tuyệt đối: ĐÚNG
Bởi vì: Bảng phân bố tần số được lập khi ta phân tổ tổng thể theo một tiêu thức nghiên cứu
cụ thể về số lượng nào đó, tất cả các đơn vị của tổng thể được phân phối vào trong các tổ và ta sẽ
có một phân bố thống kê theo tiêu thức đã chọn và được biểu diễn thành bảng phân bố tần số và
tần số tích lũy.
Bảng này giúp ta thấy được kết cấu của tổng thể, đặc trưng của tổng thể và của từng tổ, biểu
hiện mối quan hệ giữa các bộ phận hoặc tiêu thức, sự biến động của kết cấu.
Một bảng phân bố tần số và tần số tích luỹ gồm thành phần chủ yếu là lượng biến (ký hiệu là
xi) và tần số. Ngoài 2 thành phần trên người ta còn tính tần số tích luỹ. Tần số (hoặc tần suất)
tích lũy tức được tính bằng cách cộng dồn tần số (hoặc tần suất). Tần số tích luỹ (ký hiệu là S i)
cho biết số đơn vị có lượng biến lớn hơn hoặc nhỏ hơn một lượng biến cụ thể nào đó và là cơ sở
để xác định một đơn vị đứng ở vị trí nào đó trong dãy số có lượng biến là bao nhiêu.
3) Hệ số biến thiên cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của hai hiện
tượng khác loại: ĐÚNG
Bởi vì: Hệ số biến thiên là chỉ tiêu tương đối (%) có được từ sự so sánh giữa độ lệch tiêu
chuẩn với số bình quân cộng. Hệ số biến thiên được biểu hiện bằng số tương đối, nên có thể
dùng để so sánh giữa các tiêu thức khác nhau, như so sánh hệ số biến thiên về năng suất lao động
với hệ số biến thiên về tiền lương, hệ số biến thiên của tiền lương với hệ số biến thiên của tỷ lệ
hoàn thành định mức sản xuất,... Vì thế, hệ số biến thiên có thể sử dụng để so sánh giữa các tiêu
thwucs khác nhau.
4) Khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ thuận với phương
sai của tổng thể chung đó: ĐÚNG
Bởi vì, Khi ta sử dụng các tham số của mẫu để ước lượng các tham số của tổng thể chung,
nếu biết phương sai của tổng thể chung thì khoảng tin cậy cho giá trị trung bình của tổng thể là
một miền giá trị cụ ththe theo công thức tính khoảng tin cậy (trong cả ba trường hợp đã biết
phương sai, chưa biết phương sai, tổng thể chung có gới hạn), các nhân tố ảnh hưởng đến độ lớn
1
Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
của khoảng tin cậy là: mức ý nghĩa (hay là xác suất ước lượng), phương sai của tổng thể chung
và độ lớn của mẫu. Vì vậy, khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ
thuận với phương sai của tổng thể chung đó.
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức nguyên
nhân đến tiêu thức kết quả: ĐÚNG
Bởi vì:
-
-
Mô hình hồi quy tuyến tính của tổng thể chung.
Mô hình tuyến tính của tổng thể mẫu.
Trong đó:
b0 : là hệ số tự do của Y được dùng để ước lượng β0.
b1 : là độ dốc (hệ số góc, hay là hệ số hồi quy) dùng để ước lượng β1.
=> Do đó, hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của
tiêu thức nguyên nhân đến tiêu thức kết quả.
B. Chọn phương án trả lời đúng nhất:
1) Sự khác nhau cơ bản giữa thang đo khoảng và thang đo tỷ lệ là:
a) Đơn vị đo
b) Điểm gốc không tuyệt đối
c) Việc áp dụng các phép tính để tính toán
d) Cả a) b) và c)
2) Phát biểu nào dưới đây không đúng về mốt:
a) Mốt san bằng hay bù trừ chênh lệch giữa các lượng biến
b) Mốt chịu ảnh hưởng của lượng biến đột xuất.
c) Mỗi dãy số chỉ có duy nhất một Mốt.
d) Cả a) b) và c)
3) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên.
4) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
2
Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
5) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu.
b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
Câu 2 (1,5 điểm)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành được
bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng ước lượng có
sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta độ lệch tiêu chuẩn về
năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà họ
hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng suất trung bình
một giờ của toàn bộ công nhân với độ tin cậy 95%.
Bài làm:
a/ Từ: 1 – α = 0,95 tra bảng A.2 với độ tin cậy (1 - α) = 95% ta suy ra => α = 0,05 và zα =
1,96 (số bậc tự doN = ∞)
Với Z=1.96, độ lệch chuẩn là б = 6
Ta xác định cỡ mẫu: n = 1,96^2 * 6^2/1 = 138,2
Với kích thước (cỡ) mẫu tính được: n = 138.2976 được làm tròn là 139.
Ta có số công nhân cần thiết cho việc điều tra là 139 người.
b/ Giả sử xác định được năng suất lao động trong một giờ là 35 sản phẩm/giờ, với độ lệch
chuẩn của mẫu là 6.5 sản phẩm. Với cỡ mẫu được tính ở trên là 139, độ tin cậy 95%. Ta có
thể ước lượng được năng suất lao động trung bình của toàn bộ công nhân để làm định mức và
được xác định như sau:
µ = x ± zα * б / √n = 35 ± 1,96 * 6,5 / 11,76
Trong đó:
x = 35, б = 6,5, zα = 1,96
Ta có, với độ tin cậy là 95% thì miền giá trị của năng suất lao động bình quân μ là:
33,917 ≤ μ ≤ 36.83
Câu 3 (1,5điểm)
3
Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
Có hai phương pháp dạy học sử dụng cho 2 lớp thuộc cùng một đối tượng học sinh. Để
xem tác động của phương pháp dạy học đó đến kết quả học tập có khác nhau không, người ta
chọn ngẫu nhiên từ mỗi lớp một số học sinh để kiểm tra kết quả học tập của họ. Số học sinh
được chọn ra ở lớp thứ nhất là nhóm 1 (20 học sinh) với điểm trung bình là 8,1 điểm và độ lệch
tiêu chuẩn là 0,7 điểm. Số học sinh được chọn ra ở lớp thứ hai là nhóm 2 (25 học sinh) với điểm
trung bình là 7,8 điểm và độ lệch tiêu chuẩn là 0,6 điểm.
Với mức ý nghĩa 0,05 hãy rút ra kết luận.
Bài làm
Giả sử:
•
Ta gọi tác động của phương pháp dạy học của lớp thứ nhất (điểm trung bình của
học sinh lớp thứ nhất) là µ1.
•
Ta gọi tác động của phương pháp dạy học của lớp thứ hai (điểm trung bình của
học sinh lớp thứ hai) là µ2
Do kích thước mẫu đều nhỏ hơn 30, vì thế chúng ta sẽ kiểm định đại lượng t về sự khác
nhau giữa hai giá trị trung bình của hai tổng thể để đưa ra kết luận. Cặp giả thiết cần kiểm định ở
đây là:
1/ H0: µ 1 = µ 2:
Hai phương pháp dạy học có hiệu quả như nhau
2/ H1: µ 1 ≠ µ 2:
Thứ nhất: Từ các giá trị: n1 = 20, s1 = 0.7, n2 = 25, s2 = 0.6 => ta tính được s = 0.6461 từ việc xác định phương sai
chung của hai mẫu s bình phương như là ước lượng phương sai chung của tổng thể chung, s1bình phương và s2 bình
phương lần lượt là phương sai của hai mẫu:
s2 =
(n1 – 1).s12 + (n2 – 1).s22
n1 + n2 - 2
Thứ hai: Từ việc kết quả học trung bình của hai lớp chính là giá trung bình mẫu tương ứng của hai tổng thể nghiên
cứu có các giá trị là: X1 = 8.1 và X2 = 7.8, ta tính được t = 1.54775 qua công thức sau:
Với mức ý nghĩa ∝ = 0.05; ∝/2 = 0.025; Số bậc tự do là df = n1 + n2 - 2 = 20 + 25 - 2 = 43
Tra bảng t∝/2, 43 = (2.018 + 2.015)/2 = 2.0165
Do đó, với - 2.0165 < t = 1.548 < 2.0165, chưa có cơ sở bác bỏ H0 và chấp nhận H1
Kết luận:
- Với mức ý nghĩa α = 0,05, chưa có cơ sở để kết luận tác động của phương pháp dạy học
khác nhau có ảnh hưởng đến kết quả học tập.
4
Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
- Với kết quả ở hai mẫu chọn cho thấy lớp thứ nhất có điểm trung bình cao hơn. Tuy
nhiên, vì mẫu nhỏ dưới 30, hệ số biến thiên gần bằng 10% cho ta thấy rằng mức độ đồng bộ còn
thấp. Cần phải xem xét thêm.
Câu 4 (2,5điểm)
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một nhà
máy (đơn vị: triệu tấn)
6,4
7,8
5,3
4,5
6,1
4,8
5,3
7,0
4,7
3,0
6,2
7,3
3,7
4,9
5,1
7,5
4,7
7,2
6,4
4,5
6,5
5,7
3,8
6,6
7,9
6,1
7,3
3,3
5,2
6,0
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
2. Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.
3. Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng nói
trên.
4. Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng phân bố
tần số. So sánh kết quả và giải thích.
Bài làm:
1. Biểu diễn tập hợp số liệu trên biểu đồ thân lá:
Thân
3
4
5
6
7
Lá
0
5
1
0
0
3
5
2
1
2
7
7
3
1
3
8
7
3
2
3
8 9
7
4 4 5 6
5 8 9
2. Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau:
Tổ
Khối lượng sp
(triệu tấn)
3–4
1
Tần số
4
4
4–5
2
10
6
5–6
3
4
5
Tần số tích luỹ
6–7
>7
15
5
8
7
23
30
Tần suất
0.133
3
0.20
00
0.1
667
0.2667
0.2
333
Tỷ lệ
(%)
13.3
3
20.0
0
16.6
7
26.67
23.33
5
Ngô Thị Thúy Anh - GaMBA01.N03
Cộng
Thống kê trong kinh doanh
30
100
3. Vẽ đồ thị tần số
Từ đồ thị trên, ta có nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng như sau:
Khối lượng của sản phẩm thép trong 30 tháng của nhà máy phân bố không đồng đều:
Có 8 tháng có khối lượng sản phẩm đạt trên 6 triệu tấn: chiếm 26.67%.
Mức 7 triệu tấn có 7 tháng: chiếm 23.33%.
15 tháng còn lại: có 4 tháng đạt 3 tấn, 6 tháng đạt 4 tấn và 5 tháng đạt 5 tấn: chiếm
50%
4. Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng
phân bố tần số. So sánh kết quả và giải thích.
- Khối lượng sản phẩm thép trung bình 1 tháng tính từ tài liệu điều tra bằng: 170,8 / 30 =
5,693 (triệu tấn thép/tháng)
- Khối lượng sản phẩm thép trung bình 1 tháng tính từ bảng phân bố tần số:
Tổ
1
2
3
4
5
Trị số giữa (fi)
3.50
4.50
5.50
6.50
7.50
Tổng cộng
Tần số (Xi)
4
6
5
8
7
30
Tần số phân bổ (Xifi)
14.00
27.00
27.50
52.00
52.50
173.00
6
Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
Ta có tổng giá trị sản lượng tính theo trị số giữa và tần xuất của mỗi tổ đạt được 173 triệu
tấn thì sản lượng trung bình sẽ là: 173/30 = 5,7667 (triệu tấn thép/tháng)
Từ đó ta có:
* So sánh: Khối lượng sản phẩm thép trung bình 1 tháng tính từ số liệu điều tra thấp hơn so
với giá trị tính từ bảng phân bố tần số.
* Giải thích: Căn cứ vào số liệu trong bài theo bảng phân bố tần số, chỉ có 14/30 (47%) giá
trị số liệu đạt giá trị bằng hoặc lớn hơn trị số giữa trong khi có tới 16/30 (53%) giá trị nhỏ hơn.
Do đó, có sự chênh lệch này chính là do đã có những hạn chế trong đánh giá.
Câu 5 (2,5điểm)
Đề bài:
Một hãng trong lĩnh vực kinh doanh nước ngọt thực hiện một thử nghiệm để đánh giá
mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí quảng cáo trên
5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại mức độ thay đổi của
doanh thu ở các vùng. Thông tin ghi chép được nh sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2.5
2
3
6
5
4
3.5
7
5.5
Bài làm:
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối
liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ
này qua các tham số của mô hình.
Để biểu diễn mối liên hệ giữa phần trăm tăng chi phí và phần trăm tăng doanh thu, ta xác định
một phương trình hồi quy tuyến tính như sau:
y = b0 + b1 * x
Trong đó:
- y là doanh thu lý thuyết.
- x là chi phí quảng cáo.
Sử dụng công cụ Regression Statistics trong Micrsoft Excel ta có:
SUMMARY OUTPUT
Regression Statistics
Multiple R
0,985
R Square
0,970
Adjusted R
Square
0,960
Standard Error
0,258
Observations
5
ANOVA
7
Ngô Thị Thúy Anh - GaMBA01.N03
df
Regression
Residual
Total
Intercept
X
1
3
4
SS
6,500
0,200
6,7
Coefficient
s
1,9
0,5
Standar
d Error
0,2332
0,0506
Thống kê trong kinh doanh
MS
6,500
0,067
F
97,500
Significanc
eF
0,002
t Stat
8,1493
9,8742
P-value
0,0039
0,0022
Lower 95%
1,1580
0,3389
Upper
95%
2,6420
0,6611
Lower
95,0%
1,1580
0,3389
Upper
95,0%
2,6420
0,6611
Từ bảng bảng trên ta xác định được các giá trị: b0 = 1.9, b1 = 0.5
Ta có phương trình tuyến tính: y = 1.9 + 0.5x
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có mối
liên hệ tương quan tuyến tính không?
Kiểm định
Có cặp giả thiết:
H0: β1 = 0: Phần trăm tăng chi phí Quảng cáo và phần trăm tăng Doanh thu không có
mối liên hệ tuyến tính
H1: β1 ≠ 0: Phần trăm tăng chi phí Quảng cáo và phần trăm tăng Doanh thu có mối
liên hệ tuyến tính.
Do mẫu là n = 5 < 30 ta sẽ dùng kiểm định t cho số liệu mẫu trên.
8
Ngô Thị Thúy Anh - GaMBA01.N03
% tăng chi phí QC
X
1,0
2,0
6,0
4,0
7,0
X =4
% tăng doanh thu
Y
2,5
3,0
5,0
3,5
5,5
Thống kê trong kinh doanh
(Xi- X )^2
9,00
4,00
4,00
0,00
9,00
26,00
Y^
2,40
2,90
4,90
3,90
5,40
(Yi-Y^)^2
0,01
0,01
0,01
0,16
0,01
0,20
Các giá trị tính được như sau: Syx = 0.258; Sb1 = 0.0506, t = 9.874;
Giá trị t tra bảng là t3 = 3,182 với 3 bậc tự do, với mức ý nghĩa α = 0,22% < 5% => thuộc
miền bác bỏ.
Kết luận: Bác bỏ giả thiết Ho, chấp nhận đối thuyết H1. Suy ra có mối liên hệ tương quan tuyến
tính giữa % tăng chi phí quảng cáo và % tăng doanh thu.
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên
Để đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên, sử dụng chức năng tính
toán Regression trong Excel, ta có:
Regression Statistics
Multiple R
R Square
Adjusted R Square
Standard Error
Observations
0.985
0.970
0.960
0.258
5
Ta xác định được: r = 0,985
Kết luận: Hai đại lượng: % tăng chi phí quảng cáo và % tăng doanh thu có mối liên hệ
chặt chẽ và tỷ lệ thuận với nhau.
4. Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 8%
với xác suất tin cậy 95%.
Với giả thiết, tỷ lệ % tăng chi phí quảng cáo bằng 8%, áp dụng vào phương trình tuyến
tính, ta có doanh thu lý thuyết Y^ = 1,9 + 0,5*8 = 5,9
Theo bảng tính: Syx = 0,258; t2.5;3, = 3,182; X =4
9
Ngô Thị Thúy Anh - GaMBA01.N03
Thống kê trong kinh doanh
Ta tính được khoảng tin cậy cho giá trị trung bình của Ŷ là: 5.9 ± 1.10698.
Kết luận: Với giả thiết % chi phí quảng cáo tăng thêm 8%, với mức độ tin cậy 95%, ta có dự
đoán tỷ lệ tăng doanh thu sẽ đạt giá trị trong miền từ 4.78302 đến 7.00698. Từ đó các nhà
Lãnh đạo có thể đưa ra được các quyết định liên quan đến chi phí Quảng cáo và dự báo được
tăng trưởng Doanh thu của hãng kinh doanh nước ngọt.
_______________________________________________________________
DANH MỤC TÀI LIỆU THAM KHẢO
1. Bài giảng, slide và các bài tập thực hành của Cô giáo phụ trách môn Thống kê trong
kinh doanh.
2. Giáo trình “Thống kê trong kinh doanh” của Đại học Griggs.
3. Giáo trình môn Thống kê của trường ĐH Kinh tế Quốc dân.
10