TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
--- o0o ---
TIỂU LUẬN HỌC PHẦN
THỐNG KÊ ỨNG DỤNG
Giảng viên hướng dẫn
:
Ths. Lê Văn Hòa
Nhóm sinh viên
:
Phạm Hồng Thương
20136566
:
Nguyễn Thị Thùy Linh
20135898
:
Trần Thị Thảo
20136440
:
Dương Văn Thắng
20136451
:
Tống Bá Đạt
20135323
:
Đỗ Ngọc Sơn
20136314
Hà Nội – Tháng 10/2015
1
LỜI CẢM ƠN
Thống kê ứng dụng là môn học rất cần thiết trong học tập và giảng dạy đối với giáo
dục đại học Việt Nam nói chung và sinh viên các ngành kinh tế nói riêng. Đặc biệt là
đối với sinh viên của các chuyên ngành khối kinh tế - xã hội.
Những tình huống thực tế sẽ giúp sinh viên hiểu sâu và hiểu kĩ lý thuyết hơn, có thể
vận dụng những gì đã học vào tình huống cụ thể mà sau này có thể sẽ gặp trong công
việc. Làm quen với những thách thức cần phải đưa ra một quyết định trong dự án kinh
doanh của chính mình hoặc của doanh nghiệp mà mình công tác.
Để hoàn thành được bài tiểu luận này, nhóm chúng em đã nỗ lực rất nhiều và chúng
em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Thạc sĩ Lê Văn Hòa, bộ môn Quản trị
kinh doanh Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành
cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn thầy đã tận tình giảng
dạy và truyền thụ kiến thức, kinh nghiệm cũng như phong cách trình bày, để chúng em
có thêm những bài học quý báu.
Do chưa có cơ hội va chạm và tiếp xúc với môi trường thực tế trong kinh doanh
nên nhóm có thể chưa hiểu rõ hoặc hiểu sai những yêu cầu trong tình huống, bài làm
còn những sai sót, rất mong nhận được sự góp ý và sửa chữa của thầy và các bạn.
Chúng em xin trân trọng cảm ơn!
Hà Nội ngày 5 tháng 10 năm 2015
Nhóm thực hiện
1
MỤC LỤC
Lời cảm ơn .......................................................................................................................1
Tình huống 1:Công ty sô-cô-la Heavenly Chocolates.....................................................4
1. Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả ..................................4
1.1.Đối với thời gian truy cập website công ty .........................................................4
1.2.Đối với số trang đã đọc ......................................................................................5
1.3.Đối với số tiền chi tiêu bình quân một giao dịch ................................................7
2. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo
từng ngày thứ trong tuần ..............................................................................................8
3.Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo
loại trình duyệt web đã sử dụng ...................................................................................9
4.Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu ..............................9
4.1.Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi tiêu .
......................................................................................................................10
5.Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu .....................10
5.1.Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và
số tiền chi mua hàng ...............................................................................................11
6.Sự liên hệ giữa thời gian truy cập website với số trang đã xem .............................11
6.1.Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang đã xem..
......................................................................................................................11
Tình huống 2:.................................................................................................................12
Công ty sản xuất đồ chơi trẻ em Specialty Toys ...........................................................12
1.Đồ thị phân phối ......................................................................................................12
2.Xác suất hết hàng đối với các phương án đặt hàng được đề ra ..............................13
3.Lơi nhuận kì vọng ...................................................................................................14
3.1. Giả định bán được 10000 sản phẩm ................................................................14
3.2. Giả định bán được 20000 sản phẩm ................................................................14
3.3. Giả định bán được 30000 sản phẩm ................................................................14
4.Lợi nhuận dự kiến ...................................................................................................15
2
5.Khuyến nghị ............................................................................................................16
Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto)
.......................................................................................................................................17
1.Phân tích thông kê mô tả .........................................................................................17
2.Ước lượng trung bình khoảng .................................................................................18
3. Thảo luận hàm ý .....................................................................................................18
4.Xác định cỡ mẫu .....................................................................................................19
5)Thông tin thêm ...........................................................................................................19
Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary) ..................20
1.Phân tích thống kê mô tả. ........................................................................................20
2.Ước lượng khoảng trung bình .................................................................................20
3.Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp ........21
4.Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa .................21
5.Kiểm định giả thuyết. ..............................................................................................22
6.Kiểm định giả thuyết. ..............................................................................................23
7.Kiểm định giả thuyết. ..............................................................................................25
Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer) .27
1.Thống kê mô tả........................................................................................................27
2.Xây dựng phương trình hồi qui mẫu. ......................................................................27
3.Xây dựng phương trình hồi quy bội. .......................................................................34
4.Dự báo .....................................................................................................................36
5.Thông tin thêm ........................................................................................................36
TÀI LIỆU THAM KHẢO .............................................................................................37
3
Tình huống 1:
Công ty sô-cô-la Heavenly Chocolates
(Chapter 3, Shopper)
Bài làm
1. Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả
Đối với thời gian truy cập website công ty
Cumulative
Bin
Frequency %
4-10
17
34.00%
10-16
22
78.00%
16-22
6
90.00%
22-28
3
96.00%
28-34
2
100.00%
More
0
100.00%
Histogram
25
Frequency
1.1.
120.00%
100.00%
80.00%
60.00%
40.00%
20.00%
0.00%
20
15
10
5
0
4
Frequency
Cumulative %
Descriptive statistics
Time (min)
Count
50
Mean
12.810
sample standard deviation
6.063
sample variance
36.764
minimum
4.3
maximum
32.9
Range
28.6
Sum
640.500
sum of squares
10,006.230
deviation sum of squares (SSX)
1,801.425
standard error of the mean
0.857
skewness
1.450
kurtosis
2.404
coefficient of variation (CV)
47.33%
1st quartile
8.650
Median
11.400
3rd quartile
14.900
interquartile range
6.250
Mode
11.400
low extremes
0
low outliers
0
high outliers
4
high extremes
0
Nhận xét: Thời gian truy cập website của khách hàng chủ yếu dưới 16 phút, chiếm tới
78%
1.2.
Đối với số trang đã đọc
5
Bin
Frequency Cumulative %
2-4
25
50.00%
4-6
15
80.00%
6-8
7
94.00%
8-10
3
100.00%
More
0
100.00%
Frequency
Histogram
30
150.00%
20
100.00%
10
50.00%
0
0.00%
2-4
4-6
6-8
Frequency
Cumulative %
8-10 More
Bin
Descriptive statistics
Pages Viewed
count
50
mean
4.82
sample standard deviation
2.04
sample variance
4.15
minimum
2
maximum
10
range
8
sum
241.00
sum of squares
1,365.00
deviation sum of squares (SSX)
203.38
standard error of the mean
0.29
skewness
0.65
kurtosis
0.17
6
coefficient of variation (CV)
42.27%
1st quartile
3.25
median
4.50
3rd quartile
6.00
interquartile range
2.75
mode
4.00
low extremes
0
low outliers
0
high outliers
0
high extremes
0
Nhận xét: Số lượng trang mà khách hàng đã xem là khá khiêm tốn, chủ yếu là từ 2 đến
6 trang, chiếm 80%.
Đối với số tiền chi tiêu bình quân một giao dịch
Bin
Frequency Cumulative %
17-46
14
27.45%
46-75
23
72.55%
75-104
7
86.27%
104-133
4
94.12%
133-162
3
100.00%
More
0
100.00%
Histogram
Frequency
1.3.
30
20
10
0
150.00%
100.00%
50.00%
0.00%
Frequency
Cumulative %
Bin
Descriptive statistics
Amount Spent ($)
7
count
50
mean
68.1282
sample standard deviation
32.3438
sample variance
1,046.1187
minimum
17.84
maximum
158.51
range
140.67
sum
3,406.4100
sum of squares
283,332.3967
deviation
sum
of
squares
(SSX)
51,259.8149
standard error of the mean
4.5741
skewness
1.0490
kurtosis
0.8765
coefficient of variation (CV)
47.47%
1st quartile
45.5600
median
62.1500
3rd quartile
82.7350
interquartile range
37.1750
mode
#N/A
low extremes
0
low outliers
0
high outliers
2
high extremes
0
Nhận xét: Khách hàng chi tiêu chủ yếu ở mức dưới 75$, chiếm 72.55% tổng lượng tiền
đã chi tiêu cho mua hàng online.
2. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch
theo từng ngày thứ trong tuần
8
Thứ
Số giao dịch Tổng số tiền($)
Tần số(%)
Số tiền bình quân($)
Mon
9
813.38
25.88
90.38
Tue
7
414.86
13.20
59.27
Wed
6
341.82
10.87
56.97
Thu
5
294.03
9.35
58.81
Fri
11
682.24
21.71
62.02
Sat
7
378.74
12.05
54.11
Sun
5
218.15
6.94
43.63
Tổng
50
3143.22
100.00
Nhận xét:
Qua bảng số liệu trên, ta thấy lượng khách mua hàng vào các ngày thứ 2 và thứ 6 là
khá lớn, kéo theo số tiền đã chi tiêu cũng lớn. Trong khi đó, các ngày chủ nhật và thứ
5, số lần giao dịch ít hơn, vì vậy lượng tiền chi tiêu ít hơn những ngày khác.
3. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao
dịch theo loại trình duyệt web đã sử dụng
Số
giao
Loại trình duyệt
dịch
Tổng số tiền($)
Tần số(%)
Số tiền bình quân($)
Internet Explorer
27
1656.81
48.64
61.36
Firefox
16
1228.21
36.05
76.76
Other
7
521.39
15.31
74.48
Tổng
50
3406.41
100.00
Nhận xét:
Khách hàng chủ yếu sử dụng trình duyệt Internet Explorer để truy cập website, do đó
số tiền khách hàng đã chi tiêu cho mua hàng online ở trình duyệt web này lớn hơn các
trình duyệt còn lại. Tuy nhiên số tiền chi bình quân cho mỗi giao dịch lại thấp hơn
Firefox và các trình duyệt web khác.
4. Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu
9
180.00
y = 3.0942x + 28.492
r² = 0.3365
160.00
Amount Spent($)
140.00
Amount Spent ($)
120.00
Linear (Amount
Spent ($))
100.00
80.00
60.00
40.00
20.00
0.00
0.0
10.0
20.0
30.0
40.0
Times(min)
4.1.
Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền
chi tiêu
Hệ số tương quan mẫu r = 0.580048
Nhận xét: Giữa thời gian truy cập website và số tiền chi tiêu có mối liên hệ tương quan
tuyến tính thuận chiều, thời gian truy cập website càng nhiều thì số tiền chi tiêu càng
cao.
5. Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu
Amount Spent($)
180.00
y = 11.489x + 12.752
160.00
r² = 0.5237
140.00
Amount Spent
($)
Linear (Amount
Spent ($))
120.00
100.00
80.00
60.00
40.00
20.00
0.00
0
5
10
15
Pages Viewed
10
5.1.
Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và số tiền
chi mua hàng
Hệ số tương quan r = 0.7236
Nhận xét: Thông qua đồ thị tán xạ và hệ số tương quan r = 0.7236, ta nhận thấy có một
mối liên hệ tương quan tuyến tính mạnh giữa số trang đã xem trên website và số tiền
chi mua hàng, tức là số lượng trang của website được xem càng nhiều thì số lượng tiền
khách hàng đã chi tiêu để mua hàng của công ty càng lớn.
6. Sự liên hệ giữa thời gian truy cập website với số trang đã xem
35.0
30.0
Times( min)
25.0
20.0
Time (min)
15.0
Linear (Time (min))
10.0
y = 1.7725x + 4.2666
r² = 0.3547
5.0
0.0
0
6.1.
5
10
Pages Viewed
15
Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang
đã xem
Hệ số tương quan mẫu r = 0.5956
Nhận xét:
Qua đồ thị tán xạ và hệ số tương quan tuyến tính mẫu r, ta thấy có 1 mối liên hệ tuyến
tính thuận chiều giữa thời gian truy cập website và số trang đã xem, khách hàng xem
càng nhiều trang thì thời gian truy cập website càng nhiều.
11
Tình huống 2:
Công ty sản xuất đồ chơi trẻ em Specialty Toys
Bài làm
1.Đồ thị phân phối
Với doanh số kỳ vọng là : 𝜇𝑜 = 200000 sản phẩm
Từ giả thiết ta có :
1 – α = 0.95 => α =0.05 =>Zα/2 = 1.96
Mặt khác, nhu cầu 10000 <= 𝜇<= 30000.
Đồ thị phân phối nhu cầu mua hàng
Ta có P(xbar - Zα/2 . 𝜎xbar <= 𝜇<= xbar + Zα/2 . 𝜎xbar ) = 1 – α = 0.95
P(10000 <= 𝜇<= 30000) = 1 – α = 0.95
Xbar - Zα/2 .𝜎xbar = 10000
Xbar + Zα/2 .𝜎xbar =30000
2xbar = 40000
2.Zα/2 . 𝜎xbar =20000
=>
Xbar =20000
𝜎xbar = 5102
12
Vậy giá trị TB và độ lệch chuẩn của phân phối lần lượt là: Xbar=20000; 𝜎xbar =
5102
2. Xác suất hết hàng đối với các phương án đặt hàng được đề ra
Phương án 1 : 15000 sản phẩm
P( X>= 15000) = P (
𝑋− 𝜇 𝑂
𝜎xbar
>=
15000− 𝜇 𝑂
𝜎xbar
) = P( Z >= -0.98) =
= P(Z> 0) + P( -0.98 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.98)
= 0.5 + 0.3365
=0.8365
Vậy xác suất hết hàng đối với trường hợp đặt 15000 sản phẩm là 0.8365.
Phương án 2 : 18000 sản phẩm
P( X>= 18000) = P (
𝑋− 𝜇 𝑂
𝜎xbar
>=
18000− 𝜇 𝑂
𝜎xbar
) = P( Z >= -0.39)
= P(Z> 0) + P( -0.392 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.39)
= 0.5 + 0.1517
= 0.6517
Vậy với phương án đặt mua 18000 sản phẩm, xác xuất bán hết hàng là 0.6517
Phương án 3 : 24000 sản phẩm
P( X>= 24000) = P (
𝑋− 𝜇 𝑂
𝜎xbar
>=
24000− 𝜇 𝑂
𝜎xbar
) = P( Z >= 0.78)
= P(Z> 0) - P( 0
= 0.5 – 0.2823
= 0.2177
Xác suất bán hết 24000 sản phẩm là 0.2177
Phương án 4 : 28000 sản phẩm
P( X>= 28000) = P (
𝑋− 𝜇 𝑂
𝜎xbar
>=
28000− 𝜇 𝑂
𝜎xbar
) = P( Z >= 1.57)
= P(Z> 0) - P( 0
= 0.5 – 0.4418
= 0.0582
Xác suất bán hết 28000 sản phẩm là 0.0582
13
3. Lơi nhuận kì vọng
3.1. Giả định bán được 10000 sản phẩm
Mua
(sảnphẩm)
Tổng tiền
Tổng tiền
bán được giá
bán được
24$ ($)
giá 5$($)
Tổng tiền
đầu tư mua
Lợi nhuận
sản phẩm
($)
giá 16$ ($)
15000
240000
25000
240000
-25000
18000
240000
40000
288000
-8000
24000
240000
70000
384000
-74000
28000
240000
90000
448000
-118000
3.2. Giả định bán được 20000 sản phẩm
Mua
Tổng tiền bán Tổng tiền bán Tổng tiền đầu Lợi nhuận
(sản phẩm)
giá 24$ ($)
15000
360000
18000
tư giá 16$ ($)
($)
0
240000
120000
432000
0
288000
144000
24000
480000
20000
384000
116000
28000
480000
40000
448000
72000
giá 5$ ($)
3.3. Giả định bán được 30000 sản phẩm
Mua
Tổng tiền bán
Tổng tiền bán
Tổng tiền đầu
Lợi nhuận
(sản phẩm)
giá 24$ ($)
giá 5$ ($)
tư giá 16$ ($)
($)
15000
360000
0
240000
120000
18000
432000
0
288000
144000
24000
576000
0
384000
192000
28000
672000
0
448000
224000
Vậy lợi nhuận kì vọng khi đặt mua:
15000 sản phẩm là
(-25000+120000+120000).P(X>15000)=179740($)
18000 sản phẩm là
14
(-8000+144000+144000).P(X>18000)=182476($)
24000 sản phẩm là
(-74000+192000+116000).P(X>240000)=51480($)
30000 sản phẩm là
(-118000+72000+224000).P(X>28000)=10324($)
4. Lợi nhuận dự kiến
Gọi số lượng hàng cần đặt mua là S( sản phẩm ). Vì lượng hàng cần đặt phải đáp ứng
70% nhu cầu người mua và chỉ nên 30% hết hàng.
Tương tự những phần tính xác suất hết hàng ta có:
P( X>=S) = 0.3
P(
𝑋− 𝜇 𝑂
𝜎xbar
>=
𝑆− 𝜇 𝑂
𝜎xbar
) =0.3
P ( Z>= Z’) =0.3
Với S >𝜇𝑜 = 20000 => Z’ > 0.
P ( Z>= Z’) = P( Z>0) – P( 0< Z<= Z’) =0.3
0.5 - P( 0< Z<= Z’) = 0.3
P( 0< Z<= Z’) = 0.2
Z’ = 0.0793
𝑆− 𝜇 𝑂
𝜎xbar
= 0.0793
S = 20404.5886
Hay lượng hàng ta cần đặt mua là 20404 sản phẩm.
Lợi nhuận dự kiến thu được là:
phương
doanh
hàng tồn
doanh thu kì
tiền bán hàng
số tiền mua
lợi nhuận
án (x1)
số (x2)
kho (x3)
giáng sinh (x4)
tồn kho (x5)
hàng (x6)
( x7)
X3= x1-x2
X4 =x2 *24 $
X5= x3 * 5$
X6= x1*16$
X7= x4+x5 –x6
20405
10000
10405
489720
52025
326480
215265
20405
20000
405
489720
2025
326480
165265
20405
30000
-9595
489720
-47975
326480
115265
Vậy lợi nhuận dự kiến theo 3 phương án lần lượt là: 215265;165265; 115265.
15
5. Khuyến nghị
Trước khi đặt hàng ta cần tính toán kỹ xem mức tổn thất hay lợi nhuận nhận dược là
bao nhiêu để có thể đưa ra con số gây ít tổn thất nhất.
Nên đặt mua số lượng là 18000sản phẩm .Dự báo lợi nhuận là 182476($)
Vì P(X>18000)=0,652
Lợi nhuận kì vọng là lớn nhất trong 4 trường hợp đặt mua hàng là 182476($)
16
Tình huống 3:
Công ty nghiên cứu thị trường Metropolitan Research
(Chapter 8, Auto)
1) Phân tích thông kê mô tả
Column1
Column2
Descriptive statistics
Miles
Count
50
Mean
73,340.30
sample variance
619,946,014.05
sample
standard
deviation
24,898.72
Minimum
25066
Maximum
138114
Range
113048
Sum
3,667,015.00
sum of squares
299,317,334,893.00
deviation sum of squares
(SSX)
30,377,354,688.50
Skewness
0.26
Kurtosis
0.17
coefficient of variation
(CV)
33.95%
1st quartile
60,421.00
Median
72,705.00
3rd quartile
86,575.00
interquartile range
26,154.00
Mode
#N/A
17
Trung bình mẫu: mean = 73 340.30
Cỡ mẫu: n = 50
Phương sai: S^2 = 619 946 014.05
Độ lệch chuẩn: s = 24 898.72
Tổng = 3 667 015
Trung vị: Me = 72 705
Biểu đồ hộp và râu:
BoxPlot
0
20000
40000
60000
80000 100000 120000 140000 160000 180000
Miles
2) Ước lượng trung bình khoảng
n=50; s=24898.72;
͞x =73340.30; 1-α=0.95;
Giả sử X là số dặm lái được đến khi bộ truyền động bị lỗi.
1-α = 0.95 => α=0.05 => α/2=0.025 => Zα/2= Z0.025=1.96
N=50>30 nên mẫu có phân phối xấp xỉ phân phối bình thường,
e = Zα/2*s/√n = 1.96*24898.72/√50 = 6901.57
L = ͞x –e = 73340.30 – 6901.57 = 66438.73
U= ͞x +e = 73340.30 + 6901.57 = 80241.87
Khoảng ước lượng cho µ là: L ≤ µ ≤ U
Vậy với độ tin cậy 95%, số dặm trung bình tổng thể lái được đến khi bộ truyền động bị
lỗi được ước lượng trong khoảng từ 66438.73 miles đến 80241.87 miles.Vì giá trị
73340.30 thuộc khoảng ước lượng này nên ta có thể khẳng định bộ truyền động hoạt
động bình thường.
3) Thảo luận hàm ý
Từ bảng thống kê ta thấy:
18
Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phân phối lệch phải.
Độ trải giữa R0 = 86 575 – 60 421 = 26 154 => mức độ phân tán của dữ liệu
khá lớn
Trung vị nằm giữa 2 tứ phân vị cho thấy phân phối khá đều.
Vậy cho nên chưa có đủ căn cứ để tin rằng một số người mua xe hơi đã bị hỏng bộ
truyền động sớm.
4) Xác định cỡ mẫu
Với e=5000; s = 24898.72; Zα/2= 1.96 thì cần lấy cỡ mẫu tối thiểu là:
N = (Zα/2*s)2/e2 = (1.96*24898.72)2/50002 = 95.263
Vậy lấy cỡ mẫu tối thiểu là 96 chiếc xe.
5) Thông tin thêm
Để đánh giá vấn đề lỗi bộ truyền động một cách đầy đủ hơn thì cần có thêm thông tin
về:
Tiêu chuẩn số dặm mà một chiếc xe bình thường lái được đến khi bị lỗi bộ
truyền động mà công ty đặt ra.
Lấy cỡ mẫu lớn hơn để có dữ liệu với độ sai lệch ít hơn.
19
Tình huống 4:
Thu nhập của nhân viên bán hàng
(Chapter 13, SalesSalary)
Bài làm
1. Phân tích thống kê mô tả.
Descriptive statistics
Salary ($)
count
120
Số quan sát
mean
64,925.48
Giá trị trung bình
sample standard deviation
10,838.67
Độ lệch chuẩn s
sample variance
117,476,831.86 Phương sai mẫu
minimum
48621
maximum
88730
range
40109
khoảng biến thiên
1st quartile
56,274.25
Tứ phân vị thứ nhất
Trung vị (Tứ phân vị thứ
median
61,489.50
2)
3rd quartile
76,092.25
Tứ phân vị thứ 3
interquartile range
19,818.00
Độ trải giữa
mode
53,464.00
2. Ước lượng khoảng trung bình
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của tất cả những
người bán hàng.
n=120>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân
phối normal.
confidence interval 95.% lower 62,986.23
confidence interval 95.% upper 66,864.72
margin of error
1,939.25
z
1.96
20
Với độ tin cậy 95%, thu nhập trung bình năm của tất cả những người bán
hàng được ước lượng trong khoảng 62,986.23 đến 66,864.72
3. Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh
nghiệp
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán
hàng tại doanh nghiệp (inside).
n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối
normal.
inside
count
60
confidence interval 95.% lower
55,112.18
confidence interval 95.% upper
56,928.85
margin of error
z
908.33
1.96
Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại
doanh nghiệp (inside) được ước lượng trong khoảng 55,112.18 đến
56,928.85
4. Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán
hàng tại thực địa (outside).
n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối
normal.
outside
count
60
confidence interval 95.% lower
71,825.68
confidence interval 95.% upper
75,835.18
margin of error
2,004.75
z
1.96
21
Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại
thực địa (outside) được ước lượng trong khoảng 71,825.68 đến 75,835.18
5. Kiểm định giả thuyết.
H0: µ1=µ2, thu nhập do vị trí công tác là như nhau.
H1: µ1≠µ2, có sự khác nhau về thu nhập do vị trí công tác.
One factor ANOVA
Mean
n
Std. Dev
56,020.5
60
3,589.83
inside
73,830.4
60
7,922.96
outside
64,925.5
120 10,838.67
Total
SS
df
MS
F
Treatment 9,515,793,950.21
1
9,515,793,950.208 251.54 4.96E-31
Error
4,463,949,041.72
118 37,830,076.625
Total
13,979,742,991.93 119
ANOVA
table
Source
22
p-value
Comparison of Groups
100,000.0
90,000.0
80,000.0
70,000.0
60,000.0
50,000.0
40,000.0
inside
outside
p-value<α=0.05 => bác bỏ H0
Với độ tin cậy 95% có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như
vậy có sự khác nhau giữa thu nhập của nhân viên bán hàng tại doanh nghiệp
(inside) và nhân viên bán hàng tại thực địa (outside).
6. Kiểm định giả thuyết.
n=40>30 => Trung bình mẫu xấp xỉ phân phối normal
H0: µ1=µ2=µ3, Thu nhập do số năm kinh nghiệm là như nhau.
H1: Có sự khác nhau về thu nhập do số năm kinh nghiệm.
One factor ANOVA
Mean
n
Std. Dev
59,819.6
40
6,005.06
low
68,618.1
40
13,621.38
medium
66,338.7
40
9,699.51
high
64,925.5
120
10,838.67
Total
ANOVA
23
table
Source
SS
df
Treatment
1,668,100,099.40
Error
12,311,642,892.53 117
Total
13,979,742,991.93 119
MS
2
F
834,050,049.700 7.93
p-value
.0006
105,227,717.030
p-value=0.0006 < α=0.05 => bác bỏ H0=> Với độ tin cậy 95% có đủ bằng
chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau về thu nhập
do số năm kinh nghiệm.
Phân tích sâu ANOVA:
Post hoc analysis
p-values for pairwise ttests
low
high
medium
59,819.6
66,338.7
68,618.1
low
59,819.6
high
66,338.7
.0053
medium
68,618.1
.0002
.3224
Tukey simultaneous comparison t-values (d.f. = 117)
low
high
medium
59,819.6
66,338.7
68,618.1
low
59,819.6
high
66,338.7
2.84
medium
68,618.1
3.84
0.99
critical values for experimentwise error rate:
0.05
2.38
0.01
2.97
24