BÀI TẬP CÁ NHÂN
MÔN:
THỐNG KÊ KINH DOANH
Họ và tên: Nguyễn Thái Anh
Lớp: GaMBA01.N03
TRÌNH BÀY BÀI TẬP:
Câu 1: Lý thuyết (2đ)
A. Trả lời đúng (Đ), sai (S) cho các câu sau và giải thích tại sao?
1) Chỉ tiêu thống kê phản ánh đặc điểm của đơn vị tổng thể tổng thể.
Đúng, vì: Chỉ tiêu thống kê là khái niệm dùng biểu hiện một cách tổng hợp đặc điểm về
mặt lượng trong mối quan hệ với mặt chất của hiện tượng nghiên cứu. Mà tổng thể bao
gồm tất cả những đơn vị, phần tử (cá thể - đơn vị tổng thể) của hiện tượng được xét đến.
2) Tần số tích lũy trong bảng phân bố tần số biểu hiện bằng số tuyệt đối.
Đúng, vì: Sau khi phân tổ tổng thể theo một tiêu thức số lượng nào đó, các đơn vị
tổng thể được phân phối vào trong các tổ và ta sẽ có một phân bố thống kê theo tiêu thức
đó và được biểu diễn thành bảng phân bố tần số và tần số tích lũy.
Tần số là số đơn vị được phân phối vào trong mỗi tổ, tức là số lần một lượng biến nhận
một trị số nhất định trong một tổng thể. Tần số thường được ký hiệu bằng fi .Tần số tích
lũy tức là cộng dồn tần số.
Tần số tích luỹ (ký hiệu là S i) cho biết số đơn vị có lượng biến lớn hơn hoặc nhỏ hơn
một lượng biến cụ thể nào đó và là cơ sở để xác định một đơn vị đứng ở vị trí nào đó trong
dãy số có lượng biến là bao nhiêu. Tần số tích lũy của một giá trị xi là tổng số tần số của
giá trị này với tần số của các giá trị nhỏ hơn xi. Thế nên tần số tích lũy biểu hiện bằng số
tuyệt đối.
Khi tần số được biểu hiện bằng số tương đối gọi là tần suất, với đơn vị tính là lần hoặc
% và ký hiệu bằng di (di = fi / fi).
3) Hệ số biến thiên cho phép so sánh độ biến thiên của tiêu thức nghiên cứu của
hai hiện tượng khác loại.
Đúng, vì: Hệ số biến thiên là % độ lệch tiêu chuẩn so với trung bình, để so sánh đặc
trưng phân tán thống kê giữa các tập hợp dữ kiện khác số đo (đơn vị tính):
Trong đó:
V:
S:
x:
hệ số biến thiên
độ lệch tiêu chuẩn
số bình quân cộng
Hệ số biến thiên được biểu hiện bằng số tương đối. Giữa 2 tập hợp dữ liệu, tập nào có
hệ số biến thiên lớn hơn là tập có mức độ biến động lớn hơn. Nhược điểm của hệ số biến
thiên khi dùng để đo mức độ biến động là nếu giá trị bình quân gần 0 thì chỉ một biến
động nhỏ của giá trị bình quân cũng có thể khiến cho hệ số này thay đổi lớn. Ưu điểm của
nó là có thể dùng để so sánh mức độ biến động của 2 tập dữ liệu có giá trị bình quân khác
nhau, so sánh giữa các tiêu thức khác nhau, so sánh độ đồng đều giữa hai hiện tượng khác
nhau nhưng có liên quan. Ví dụ: so sánh độ đồng đều về tiền lương bình quân với độ đồng
đều về năng suất lao động của cùng một xí nghiệp.
4) Khoảng tin cậy cho giá trị trung bình của một tổng thể chung tỷ lệ thuận với
phương sai của tổng thể chung đó
Đúng, vì: Theo công thức tính khoảng tin cậy (trong cả ba trường hợp đã biết phương
sai, chưa biết phương sai, tổng thể chung có gới hạn), mức ý nghĩa (xác suất ước lượng),
độ lớn của mẫu và phương sai là một ba nhân tố ảnh hưởng đến độ lớn của khoảng tin cậy.
Theo đó, phương sai càng nhỏ (tính đồng đều của tổng thể chung càng lớn) thì khoảng tin
cậy càng nhỏ
5) Hệ số hồi quy (b1) phản ánh chiều hướng và mức độ ảnh hưởng của tiêu thức
nguyên nhân đến tiêu thức kết quả
Đúng, vì: Ta có mô hình tuyến tính của tổng thể mẫu:
YY = b + b X
i
0
1 i
Trong đó: b0 là hệ số chặn của Y được dùng để ước lượng β0
b1 là độ dốc (hệ số hồi quy) dùng để ước lượng β1
Hệ số hồi quy nói lên ảnh hưởng của x (trị số của tiêu thức nguyên nhân) đối với y (trị số của
tiêu thức kết quả, cụ thể khi x tăng 1 đơn vị thì y tăng bình quân b1*đơn vị.
B. Chọn phương án trả lời đúng nhất:
1) Sự khác nhau cơ bản giữa thang đo khoảng và thang đo tỷ lệ là:
a) Đơn vị đo
b) Điểm gốc không tuyệt đối
c) Việc áp dụng các phép tính để tính toán
d) Cả a) b) và c)
2) Phát biểu nào dưới đây không đúng về mốt:
a) Mốt san bằng hay bù trừ chênh lệch giữa các lượng biến
b) Mốt chịu ảnh hưởng của lượng biến đột xuất.
c) Mỗi dãy số chỉ có duy nhất một Mốt.
d) Cả a) b) và c)
3) Các phương pháp biểu hiện xu hướng phát triển cơ bản của hiện tượng nhằm:
a) Sắp xếp dãy số theo thứ tự tăng (hoặc giảm) dần.
b) Đảm bảo tính chất so sánh được giữa các mức độ trong dãy số.
c) Loại bỏ tác động của các yếu tố ngẫu nhiên.
d) Không có điều nào ở trên.
4) Biểu đồ hình cột (Histograms) có đặc điểm:
a) Giữa các cột có khoảng cách
b) Độ rộng của cột biểu hiện độ rộng của mỗi tổ
c) Chiều cao của cột biểu thị tần số
d) Cả a) và b) đều đúng
e) Cả b) và c) đều đúng
f) Cả a), b) và c) đều đúng
5) Các biện pháp hạn chế sai số chọn mẫu:
a) Tăng số đơn vị tổng thể mẫu.
b) Sử dụng phương pháp chọn mẫu thích hợp.
c) Giảm phương sai của tổng thể chung
d) Cả a), c).
e) Cả a), b).
f) Cả a), b), c).
Câu 2 (1,5 đ)
Một doanh nghiệp muốn ước lượng trung bình một giờ một công nhân hoàn thành
được bao nhiêu sản phẩm để đặt định mức. Giám đốc nhà máy muốn xây dựng khoảng
ước lượng có sai số bằng 1 sản phẩm và độ tin cậy là 95%, Theo kinh nghiệm của ông ta
độ lệch tiêu chuẩn về năng suất trong một giờ là 6 sản phẩm. Hãy tính số công nhân cần
được điều tra để đặt định mức.
Giả sử sau khi chọn mẫu (với cỡ mẫu được tính ở trên) số sản phẩm trung bình mà
họ hoàn thành trong 1 giờ là 35 với độ lệch tiêu chuẩn là 6,5. Hãy ước lượng năng suất
trung bình một giờ của toàn bộ công nhân với độ tin cậy 95%.
Bài làm:
a/ Ta có: 1 − α = 0,95 => α = 0, 05 => zα = 1,96
σ =6
σ
ξ = zα .
= 1 => n = 11, 76 => n ; 138
n
Kết luận: số công nhân cần được điều tra là 138 người.
b/
x = 35
σ ' = 6,5
zα = 1,96
σ
6,5
= 35 ± 1,96.
11, 76
n
=> 33,917 < µ < 36, 083
=> µ = x ± zα .
Câu 3 (1,5đ)
Có hai phương pháp dạy học sử dụng cho 2 lớp thuộc cùng một đối tượng học sinh.
Để xem tác động của phương pháp dạy học đó đến kết quả học tập có khác nhau không,
người ta chọn ngẫu nhiên từ mỗi lớp một số học sinh để kiểm tra kết quả học tập của họ.
Số học sinh được chọn ra ở lớp thứ nhất là nhóm 1 (20 học sinh) với điểm trung bình là
8,1 điểm và độ lệch tiêu chuẩn là 0,7 điểm. Số học sinh được chọn ra ở lớp thứ hai là
nhóm 2 (25 học sinh) với điểm trung bình là 7,8 điểm và độ lệch tiêu chuẩn là 0,6 điểm.
Với mức ý nghĩa 0,05 hãy rút ra kết luận.
Bài làm
n1 = 20
x = 8,1
σ x = 0.7
n2 = 25
y = 7,8
σ y = 0, 6
Bài toán kiểm định
H0 : µx = µ y
H1 : µ x ≠ µ y
với µ x , µ y là số điểm trung bình của 2 lớp
z=
x−y
2
σx σy
+
n1
n2
2
= 1,52 < zα = 1,96
=> chấp nhận H 0
Kết luận: Với mức ý nghĩa α = 0,05, từ mẫu ngẫu nhiên được chọn ở hai lớp, ta kết luận 2
phương pháp học tập không tác động đến kết quả học tập của mỗi lớp.
Câu 4 (2,5đ)
Dưới đây là dữ liệu về khối lượng sản phẩm thép trong 30 tháng gần đây của một
nhà máy (đơn vị: triệu tấn)
6,4
7,8
5,3
4,5
6,1
4,8
5,3
7,0
4,7
3,0
6,2
7,3
3,7
4,9
5,1
7,5
4,7
7,2
6,4
4,5
6,5
5,7
3,8
6,6
7,9
6,1
7,3
3,3
5,2
6,0
1. Biểu diễn tập hợp số liệu trên bằng biểu đồ thân lá (Stem and leaf).
2. Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau.
3. Vẽ đồ thị tần số và cho nhận xét sơ bộ về khối lượng sản phẩm thép trong 30 tháng
nói trên.
4. Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng
phân bố tần số. So sánh kết quả và giải thích.
Bài làm:
a/ Biểu diễn tập hợp số liệu trên biểu đồ thân lá:
Thân
Lá
3
4
5
6
7
0
5
1
0
0
3
5
2
1
2
7
7
3
1
3
8
7
3
2
3
8 9
7
4 4 5 6
5 8 9
b/ Xây dựng bảng tần số phân bố với 5 tổ có khoảng cách tổ bằng nhau
Tổ
tần số
1
4
2
6
3
5
4
8
5
7
30
tần suất
0.1
3
0.2
0
0.1
7
0.2
7
0.2
3
c/ Vẽ đồ thị tần số
tỷ lệ (%)
13.3
3
20.0
0
16.6
7
26.6
7
23.3
3
Nhận xét sơ bộ:
Khối lượng của sản phẩm thép trong 30 tháng gần đây của nhà máy không ổn định.
Khối lượng thấp nhất đã đạt được là hơn 30 triệu tấn thép/tháng, tuy nhiên thời gian chỉ
đạt khối lượng này không nhiều; khối lượng sản phẩm thép đạt được cao nhất là từ 60-70
triệu tấn/tháng.
d/ Tính khối lượng sản phẩm thép trung bình 1 tháng từ tài liệu điều tra và từ bảng
phân bố tần số. So sánh kết quả và giải thích.
Khối lượng sản phẩm thép trung bình 1 tháng tính từ tài liệu điều tra bằng:
Tổng khối lượng sản phẩm/30 tháng = 170,8 / 30 = 5,693 triệu tấn thép/tháng
Khối lượng sản phẩm thép trung bình 1 tháng tính từ bảng phân bố tần số
Tổ
1
2
3
4
5
Trị số giữa
(fi)
3.50
4.50
5.50
6.50
7.50
Tần số
(Xi)
4
6
5
8
7
30
Tần số phân bổ (Xi x
fi)
14.00
27.00
27.50
52.00
52.50
173.00
173 / 30 = 5,767 triệu tấn theo/tháng
Có thể thấy khối lượng sản phẩm thép trung bình 1 tháng tính từ số liệu điều tra thấp hơn
so với tính từ bảng phân bổ. Sở dĩ có sự khác biệt là bảng phân bố tần số sử dụng tích số
giữa trị số giữa và tần số của mỗi tổ để lấy số binh quân trong khi theo biểu đồ thân lá, ta
thấy, chỉ có 14/30 (47%) giá trị số liệu đạt giá trị bằng hoặc lớn hơn trị số giữa trong khi
có tới 16/30 (53%) giá trị nhỏ hơn.
Câu 5 (2,5đ)
Một hãng trong lĩnh vực kinh doanh nước ngọt thực hiện một thử nghiệm để đánh
giá mức độ ảnh hưởng của quảng cáo đối với doanh thu. Hãng cho phép tăng chi phí
quảng cáo trên 5 vùng khác nhau của đất nước so với mức của năm trước và ghi chép lại
mức độ thay đổi của doanh thu ở các vùng. Thông tin ghi chép được nh sau:
% tăng chi phí quảng cáo
% tăng doanh thu
1
2.5
2
3
6
5
4
3.5
7
5.5
1. Với dữ liệu trên, xác định một phương trình hồi quy tuyến tính để biểu hiện mối
liên hệ giữa % tăng chi phí quảng cáo và % tăng doanh thu, phân tích mối liên hệ
này qua các tham số của mô hình.
2. Kiểm định xem liệu giữa % tăng chi phí quảng cáo và % tăng doanh thu thực sự có
mối liên hệ tương quan tuyến tính không?
3. Đánh giá cường độ của mối liên hệ và sự phù hợp của mô hình trên.
Hãy ước tính (dự đoán) tỷ lệ % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 8%
với xác suất tin cậy 95%.
Bài làm:
a/ Gọi y là doanh thu lý thuyết, x là chi phí quảng cáo; ta có:
y = b0 + b1 * x
Sử dụng chức năng tính toán Regression trong Excel, ta có:
b0 = 1.9
b1 = 0.5
Phương trình tuyến tính: y = 1.9 + 0.5x
b/ Có cặp giả thiết:
H0 : β1=0 (không có mối liên hệ tuyến tính)
H1 : β1<>0 (có mối liên hệ tuyến tính)
Áp dụng công thức vào tính toán, ta có:
=
4
=
5,99
=
0,2
=
0,2582
=
0,051
=
9,874
Kết quả tính toán theo Exel:
Coefficients
Intercept
% tổng chi phí quảng cáo
1.9
0.5
Standard
Error
0.233
0.051
t Stat
8.149
9.874
Tra bảng t với 3 bậc tự do ta được giá trị tới hạn t3 = 2.353 < 9.874 thuộc miền bác bỏ.
Kết luận: Bác bỏ giả thiết H0 => Không có đủ cơ sở để cho rằng “% tăng chi phí quảng cáo
và % tăng doanh thu thực sự có mối liên hệ tương quan tuyến tính”
c/ Sử dụng chức năng tính toán Regression trong Excel, ta có:
Regression Statistics
Multiple R
0.985
R Square
0.970
Adjusted R Square
0.960
Standard Error
0.258
Observations
5
=> r = 0,985
Kết luận: r gần bằng 1, do đó % tăng chi phí quảng cáo và % tăng doanh thu có mối liên
hệ chặt chẽ và tỷ lệ thuận với nhau.
d/ Với tỷ lệ % tăng chi phí quảng cáo bằng 8%, áp dụng vào phương trình tuyến tính, ta
có doanh thu lý thuyết Y^ = 1,9 + 0,5*8 = 5,9
Biết Syx = 0,258; t2.5;3, = 3,182; và
=
4
Ta có % tăng doanh thu nếu tỷ lệ % tăng chi phí quảng cáo là 8% với độ tin cậy 95%
bằng:
= 5, 1,06977697
Bài viết có sử dụng các nguồn tư liệu dưới đây.
Bài giảng và các tài liệu môn học được cung cấp trong khóa học
Giáo trình “Thống kê trong kinh doanh” của Đại học Griggs, bản dịch tiếng Việt phục vụ chương
trình đào tạo Thạc sỹ quản trị kinh doanh hợp tác với Đại học Quốc gia hà Nội.
Excel và Internet....