Tải bản đầy đủ (.pdf) (38 trang)

Bài tập lớn thống kê ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.39 MB, 38 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
--- o0o ---

TIỂU LUẬN HỌC PHẦN
THỐNG KÊ ỨNG DỤNG
Giảng viên hướng dẫn

:

Ths. Lê Văn Hòa

Nhóm sinh viên

:

Phạm Hồng Thương

20136566

:

Nguyễn Thị Thùy Linh

20135898

:

Trần Thị Thảo

20136440



:

Dương Văn Thắng

20136451

:

Tống Bá Đạt

20135323

:

Đỗ Ngọc Sơn

20136314

Hà Nội – Tháng 10/2015

1


LỜI CẢM ƠN
Thống kê ứng dụng là môn học rất cần thiết trong học tập và giảng dạy đối với giáo
dục đại học Việt Nam nói chung và sinh viên các ngành kinh tế nói riêng. Đặc biệt là
đối với sinh viên của các chuyên ngành khối kinh tế - xã hội.
Những tình huống thực tế sẽ giúp sinh viên hiểu sâu và hiểu kĩ lý thuyết hơn, có thể
vận dụng những gì đã học vào tình huống cụ thể mà sau này có thể sẽ gặp trong công

việc. Làm quen với những thách thức cần phải đưa ra một quyết định trong dự án kinh
doanh của chính mình hoặc của doanh nghiệp mà mình công tác.
Để hoàn thành được bài tiểu luận này, nhóm chúng em đã nỗ lực rất nhiều và chúng
em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Thạc sĩ Lê Văn Hòa, bộ môn Quản trị
kinh doanh Viện Kinh tế và Quản lý, Trường Đại học Bách khoa Hà Nội đã đồng hành
cùng chúng em suốt quá trình nghiên cứu và học tập, cảm ơn thầy đã tận tình giảng
dạy và truyền thụ kiến thức, kinh nghiệm cũng như phong cách trình bày, để chúng em
có thêm những bài học quý báu.
Do chưa có cơ hội va chạm và tiếp xúc với môi trường thực tế trong kinh doanh
nên nhóm có thể chưa hiểu rõ hoặc hiểu sai những yêu cầu trong tình huống, bài làm
còn những sai sót, rất mong nhận được sự góp ý và sửa chữa của thầy và các bạn.
Chúng em xin trân trọng cảm ơn!
Hà Nội ngày 5 tháng 10 năm 2015

Nhóm thực hiện

1


MỤC LỤC
Lời cảm ơn .......................................................................................................................1
Tình huống 1:Công ty sô-cô-la Heavenly Chocolates.....................................................4
1. Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả ..................................4
1.1.Đối với thời gian truy cập website công ty .........................................................4
1.2.Đối với số trang đã đọc ......................................................................................5
1.3.Đối với số tiền chi tiêu bình quân một giao dịch ................................................7
2. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo
từng ngày thứ trong tuần ..............................................................................................8
3.Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch theo
loại trình duyệt web đã sử dụng ...................................................................................9

4.Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu ..............................9
4.1.Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền chi tiêu .
......................................................................................................................10
5.Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu .....................10
5.1.Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và
số tiền chi mua hàng ...............................................................................................11
6.Sự liên hệ giữa thời gian truy cập website với số trang đã xem .............................11
6.1.Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang đã xem..
......................................................................................................................11
Tình huống 2:.................................................................................................................12
Công ty sản xuất đồ chơi trẻ em Specialty Toys ...........................................................12
1.Đồ thị phân phối ......................................................................................................12
2.Xác suất hết hàng đối với các phương án đặt hàng được đề ra ..............................13
3.Lơi nhuận kì vọng ...................................................................................................14
3.1. Giả định bán được 10000 sản phẩm ................................................................14
3.2. Giả định bán được 20000 sản phẩm ................................................................14
3.3. Giả định bán được 30000 sản phẩm ................................................................14
4.Lợi nhuận dự kiến ...................................................................................................15

2


5.Khuyến nghị ............................................................................................................16
Tình huống 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto)
.......................................................................................................................................17
1.Phân tích thông kê mô tả .........................................................................................17
2.Ước lượng trung bình khoảng .................................................................................18
3. Thảo luận hàm ý .....................................................................................................18
4.Xác định cỡ mẫu .....................................................................................................19
5)Thông tin thêm ...........................................................................................................19

Tình huống4:Thu nhập của nhân viên bán hàng(Chapter 13, SalesSalary) ..................20
1.Phân tích thống kê mô tả. ........................................................................................20
2.Ước lượng khoảng trung bình .................................................................................20
3.Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh nghiệp ........21
4.Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa .................21
5.Kiểm định giả thuyết. ..............................................................................................22
6.Kiểm định giả thuyết. ..............................................................................................23
7.Kiểm định giả thuyết. ..............................................................................................25
Tình huống 5:Chi tiêu qua thẻ tín dụng của người tiêu dùng(Chapter 15, Consumer) .27
1.Thống kê mô tả........................................................................................................27
2.Xây dựng phương trình hồi qui mẫu. ......................................................................27
3.Xây dựng phương trình hồi quy bội. .......................................................................34
4.Dự báo .....................................................................................................................36
5.Thông tin thêm ........................................................................................................36
TÀI LIỆU THAM KHẢO .............................................................................................37

3


Tình huống 1:
Công ty sô-cô-la Heavenly Chocolates
(Chapter 3, Shopper)
Bài làm
1. Tóm tắt dữ liệu bằng đồ thị và bằng tham số thống kê mô tả
Đối với thời gian truy cập website công ty

Cumulative
Bin

Frequency %


4-10

17

34.00%

10-16

22

78.00%

16-22

6

90.00%

22-28

3

96.00%

28-34

2

100.00%


More

0

100.00%

Histogram
25

Frequency

1.1.

120.00%
100.00%
80.00%
60.00%
40.00%
20.00%
0.00%

20
15
10
5
0

4


Frequency
Cumulative %


Descriptive statistics
Time (min)
Count

50

Mean

12.810

sample standard deviation

6.063

sample variance

36.764

minimum

4.3

maximum

32.9


Range

28.6

Sum

640.500

sum of squares

10,006.230

deviation sum of squares (SSX)

1,801.425

standard error of the mean

0.857

skewness

1.450

kurtosis

2.404

coefficient of variation (CV)


47.33%

1st quartile

8.650

Median

11.400

3rd quartile

14.900

interquartile range

6.250

Mode

11.400

low extremes

0

low outliers

0


high outliers

4

high extremes

0

Nhận xét: Thời gian truy cập website của khách hàng chủ yếu dưới 16 phút, chiếm tới
78%
1.2.

Đối với số trang đã đọc

5


Bin

Frequency Cumulative %

2-4

25

50.00%

4-6

15


80.00%

6-8

7

94.00%

8-10

3

100.00%

More

0

100.00%

Frequency

Histogram
30

150.00%

20


100.00%

10

50.00%

0

0.00%
2-4

4-6

6-8

Frequency
Cumulative %

8-10 More

Bin

Descriptive statistics
Pages Viewed
count

50

mean


4.82

sample standard deviation

2.04

sample variance

4.15

minimum

2

maximum

10

range

8

sum

241.00

sum of squares

1,365.00


deviation sum of squares (SSX)

203.38

standard error of the mean

0.29

skewness

0.65

kurtosis

0.17

6


coefficient of variation (CV)

42.27%

1st quartile

3.25

median

4.50


3rd quartile

6.00

interquartile range

2.75

mode

4.00

low extremes

0

low outliers

0

high outliers

0

high extremes

0

Nhận xét: Số lượng trang mà khách hàng đã xem là khá khiêm tốn, chủ yếu là từ 2 đến

6 trang, chiếm 80%.
Đối với số tiền chi tiêu bình quân một giao dịch
Bin

Frequency Cumulative %

17-46

14

27.45%

46-75

23

72.55%

75-104

7

86.27%

104-133

4

94.12%


133-162

3

100.00%

More

0

100.00%

Histogram
Frequency

1.3.

30
20
10
0

150.00%
100.00%
50.00%
0.00%

Frequency
Cumulative %


Bin

Descriptive statistics
Amount Spent ($)

7


count

50

mean

68.1282

sample standard deviation

32.3438

sample variance

1,046.1187

minimum

17.84

maximum


158.51

range

140.67

sum

3,406.4100

sum of squares

283,332.3967

deviation

sum

of

squares

(SSX)

51,259.8149

standard error of the mean

4.5741


skewness

1.0490

kurtosis

0.8765

coefficient of variation (CV)

47.47%

1st quartile

45.5600

median

62.1500

3rd quartile

82.7350

interquartile range

37.1750

mode


#N/A

low extremes

0

low outliers

0

high outliers

2

high extremes

0

Nhận xét: Khách hàng chi tiêu chủ yếu ở mức dưới 75$, chiếm 72.55% tổng lượng tiền
đã chi tiêu cho mua hàng online.
2. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao dịch
theo từng ngày thứ trong tuần

8


Thứ

Số giao dịch Tổng số tiền($)


Tần số(%)

Số tiền bình quân($)

Mon

9

813.38

25.88

90.38

Tue

7

414.86

13.20

59.27

Wed

6

341.82


10.87

56.97

Thu

5

294.03

9.35

58.81

Fri

11

682.24

21.71

62.02

Sat

7

378.74


12.05

54.11

Sun

5

218.15

6.94

43.63

Tổng

50

3143.22

100.00

Nhận xét:
Qua bảng số liệu trên, ta thấy lượng khách mua hàng vào các ngày thứ 2 và thứ 6 là
khá lớn, kéo theo số tiền đã chi tiêu cũng lớn. Trong khi đó, các ngày chủ nhật và thứ
5, số lần giao dịch ít hơn, vì vậy lượng tiền chi tiêu ít hơn những ngày khác.
3. Tóm tắt tần số số tiền đã chi tiêu và số tiền chi tiêu bình quân một giao
dịch theo loại trình duyệt web đã sử dụng
Số


giao

Loại trình duyệt

dịch

Tổng số tiền($)

Tần số(%)

Số tiền bình quân($)

Internet Explorer

27

1656.81

48.64

61.36

Firefox

16

1228.21

36.05


76.76

Other

7

521.39

15.31

74.48

Tổng

50

3406.41

100.00

Nhận xét:
Khách hàng chủ yếu sử dụng trình duyệt Internet Explorer để truy cập website, do đó
số tiền khách hàng đã chi tiêu cho mua hàng online ở trình duyệt web này lớn hơn các
trình duyệt còn lại. Tuy nhiên số tiền chi bình quân cho mỗi giao dịch lại thấp hơn
Firefox và các trình duyệt web khác.
4. Sự liên hệ giữa thời gian truy cập website và số tiền đã chi tiêu

9



180.00
y = 3.0942x + 28.492
r² = 0.3365

160.00

Amount Spent($)

140.00

Amount Spent ($)

120.00
Linear (Amount
Spent ($))

100.00
80.00
60.00
40.00
20.00
0.00
0.0

10.0

20.0

30.0


40.0

Times(min)

4.1.

Biểu đồ thể hiện mối liên hệ gian thời gian truy cập website và số tiền
chi tiêu

Hệ số tương quan mẫu r = 0.580048
Nhận xét: Giữa thời gian truy cập website và số tiền chi tiêu có mối liên hệ tương quan
tuyến tính thuận chiều, thời gian truy cập website càng nhiều thì số tiền chi tiêu càng
cao.
5. Mối liên hệ giữa số trang đã xem trên website và số tiền đã chi tiêu

Amount Spent($)

180.00
y = 11.489x + 12.752
160.00
r² = 0.5237
140.00
Amount Spent
($)
Linear (Amount
Spent ($))

120.00
100.00
80.00

60.00
40.00
20.00
0.00
0

5

10

15

Pages Viewed

10


5.1.

Biểu đồ thể hiện mối liên hệ giữa số trang đã xem trên website và số tiền
chi mua hàng

Hệ số tương quan r = 0.7236
Nhận xét: Thông qua đồ thị tán xạ và hệ số tương quan r = 0.7236, ta nhận thấy có một
mối liên hệ tương quan tuyến tính mạnh giữa số trang đã xem trên website và số tiền
chi mua hàng, tức là số lượng trang của website được xem càng nhiều thì số lượng tiền
khách hàng đã chi tiêu để mua hàng của công ty càng lớn.
6. Sự liên hệ giữa thời gian truy cập website với số trang đã xem

35.0

30.0

Times( min)

25.0
20.0

Time (min)

15.0

Linear (Time (min))

10.0
y = 1.7725x + 4.2666
r² = 0.3547

5.0
0.0
0

6.1.

5
10
Pages Viewed

15

Biểu đồ thể hiện sự liên hệ giữa thời gian truy cập website và số trang

đã xem

Hệ số tương quan mẫu r = 0.5956
Nhận xét:
Qua đồ thị tán xạ và hệ số tương quan tuyến tính mẫu r, ta thấy có 1 mối liên hệ tuyến
tính thuận chiều giữa thời gian truy cập website và số trang đã xem, khách hàng xem
càng nhiều trang thì thời gian truy cập website càng nhiều.

11


Tình huống 2:
Công ty sản xuất đồ chơi trẻ em Specialty Toys

Bài làm
1.Đồ thị phân phối
Với doanh số kỳ vọng là : 𝜇𝑜 = 200000 sản phẩm
Từ giả thiết ta có :
1 – α = 0.95 => α =0.05 =>Zα/2 = 1.96
Mặt khác, nhu cầu 10000 <= 𝜇<= 30000.
Đồ thị phân phối nhu cầu mua hàng

Ta có P(xbar - Zα/2 . 𝜎xbar <= 𝜇<= xbar + Zα/2 . 𝜎xbar ) = 1 – α = 0.95
 P(10000 <= 𝜇<= 30000) = 1 – α = 0.95
 Xbar - Zα/2 .𝜎xbar = 10000
Xbar + Zα/2 .𝜎xbar =30000
 2xbar = 40000
2.Zα/2 . 𝜎xbar =20000
=>


Xbar =20000
𝜎xbar = 5102

12


 Vậy giá trị TB và độ lệch chuẩn của phân phối lần lượt là: Xbar=20000; 𝜎xbar =
5102
2. Xác suất hết hàng đối với các phương án đặt hàng được đề ra
Phương án 1 : 15000 sản phẩm
P( X>= 15000) = P (

𝑋− 𝜇 𝑂
𝜎xbar

>=

15000− 𝜇 𝑂
𝜎xbar

) = P( Z >= -0.98) =

= P(Z> 0) + P( -0.98 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.98)
= 0.5 + 0.3365
=0.8365
Vậy xác suất hết hàng đối với trường hợp đặt 15000 sản phẩm là 0.8365.
Phương án 2 : 18000 sản phẩm
P( X>= 18000) = P (


𝑋− 𝜇 𝑂
𝜎xbar

>=

18000− 𝜇 𝑂
𝜎xbar

) = P( Z >= -0.39)

= P(Z> 0) + P( -0.392 <= Z <0)
= P(Z> 0) + P( 0 < Z <= 0.39)
= 0.5 + 0.1517
= 0.6517
Vậy với phương án đặt mua 18000 sản phẩm, xác xuất bán hết hàng là 0.6517
Phương án 3 : 24000 sản phẩm
P( X>= 24000) = P (

𝑋− 𝜇 𝑂
𝜎xbar

>=

24000− 𝜇 𝑂
𝜎xbar

) = P( Z >= 0.78)

= P(Z> 0) - P( 0 = 0.5 – 0.2823

= 0.2177
Xác suất bán hết 24000 sản phẩm là 0.2177
Phương án 4 : 28000 sản phẩm
P( X>= 28000) = P (

𝑋− 𝜇 𝑂
𝜎xbar

>=

28000− 𝜇 𝑂
𝜎xbar

) = P( Z >= 1.57)

= P(Z> 0) - P( 0 = 0.5 – 0.4418
= 0.0582
Xác suất bán hết 28000 sản phẩm là 0.0582

13


3. Lơi nhuận kì vọng
3.1. Giả định bán được 10000 sản phẩm

Mua
(sảnphẩm)

Tổng tiền


Tổng tiền

bán được giá

bán được

24$ ($)

giá 5$($)

Tổng tiền
đầu tư mua

Lợi nhuận

sản phẩm

($)

giá 16$ ($)

15000

240000

25000

240000


-25000

18000

240000

40000

288000

-8000

24000

240000

70000

384000

-74000

28000

240000

90000

448000


-118000

3.2. Giả định bán được 20000 sản phẩm
Mua

Tổng tiền bán Tổng tiền bán Tổng tiền đầu Lợi nhuận

(sản phẩm)

giá 24$ ($)

15000

360000

18000

tư giá 16$ ($)

($)

0

240000

120000

432000

0


288000

144000

24000

480000

20000

384000

116000

28000

480000

40000

448000

72000

giá 5$ ($)

3.3. Giả định bán được 30000 sản phẩm
Mua


Tổng tiền bán

Tổng tiền bán

Tổng tiền đầu

Lợi nhuận

(sản phẩm)

giá 24$ ($)

giá 5$ ($)

tư giá 16$ ($)

($)

15000

360000

0

240000

120000

18000


432000

0

288000

144000

24000

576000

0

384000

192000

28000

672000

0

448000

224000

Vậy lợi nhuận kì vọng khi đặt mua:
 15000 sản phẩm là

(-25000+120000+120000).P(X>15000)=179740($)
 18000 sản phẩm là
14


(-8000+144000+144000).P(X>18000)=182476($)
 24000 sản phẩm là
(-74000+192000+116000).P(X>240000)=51480($)
 30000 sản phẩm là
(-118000+72000+224000).P(X>28000)=10324($)
4. Lợi nhuận dự kiến
Gọi số lượng hàng cần đặt mua là S( sản phẩm ). Vì lượng hàng cần đặt phải đáp ứng
70% nhu cầu người mua và chỉ nên 30% hết hàng.
 Tương tự những phần tính xác suất hết hàng ta có:
P( X>=S) = 0.3
P(

𝑋− 𝜇 𝑂
𝜎xbar

>=

𝑆− 𝜇 𝑂
𝜎xbar

) =0.3

 P ( Z>= Z’) =0.3
Với S >𝜇𝑜 = 20000 => Z’ > 0.
 P ( Z>= Z’) = P( Z>0) – P( 0< Z<= Z’) =0.3

 0.5 - P( 0< Z<= Z’) = 0.3
P( 0< Z<= Z’) = 0.2
 Z’ = 0.0793


𝑆− 𝜇 𝑂
𝜎xbar

= 0.0793

 S = 20404.5886
Hay lượng hàng ta cần đặt mua là 20404 sản phẩm.
 Lợi nhuận dự kiến thu được là:
phương

doanh

hàng tồn

doanh thu kì

tiền bán hàng

số tiền mua

lợi nhuận

án (x1)

số (x2)


kho (x3)

giáng sinh (x4)

tồn kho (x5)

hàng (x6)

( x7)

X3= x1-x2

X4 =x2 *24 $

X5= x3 * 5$

X6= x1*16$

X7= x4+x5 –x6

20405

10000

10405

489720

52025


326480

215265

20405

20000

405

489720

2025

326480

165265

20405

30000

-9595

489720

-47975

326480


115265

 Vậy lợi nhuận dự kiến theo 3 phương án lần lượt là: 215265;165265; 115265.

15


5. Khuyến nghị
Trước khi đặt hàng ta cần tính toán kỹ xem mức tổn thất hay lợi nhuận nhận dược là
bao nhiêu để có thể đưa ra con số gây ít tổn thất nhất.
Nên đặt mua số lượng là 18000sản phẩm .Dự báo lợi nhuận là 182476($)
Vì P(X>18000)=0,652
Lợi nhuận kì vọng là lớn nhất trong 4 trường hợp đặt mua hàng là 182476($)

16


Tình huống 3:
Công ty nghiên cứu thị trường Metropolitan Research
(Chapter 8, Auto)
1) Phân tích thông kê mô tả
Column1

Column2

Descriptive statistics

Miles
Count


50

Mean

73,340.30

sample variance

619,946,014.05

sample

standard

deviation

24,898.72

Minimum

25066

Maximum

138114

Range

113048


Sum

3,667,015.00

sum of squares

299,317,334,893.00

deviation sum of squares
(SSX)

30,377,354,688.50

Skewness

0.26

Kurtosis

0.17

coefficient of variation
(CV)

33.95%

1st quartile

60,421.00


Median

72,705.00

3rd quartile

86,575.00

interquartile range

26,154.00

Mode

#N/A

17


 Trung bình mẫu: mean = 73 340.30
 Cỡ mẫu: n = 50
 Phương sai: S^2 = 619 946 014.05
 Độ lệch chuẩn: s = 24 898.72
 Tổng = 3 667 015
 Trung vị: Me = 72 705
Biểu đồ hộp và râu:
BoxPlot

0


20000

40000

60000

80000 100000 120000 140000 160000 180000
Miles

2) Ước lượng trung bình khoảng
n=50; s=24898.72;

͞x =73340.30; 1-α=0.95;

Giả sử X là số dặm lái được đến khi bộ truyền động bị lỗi.
1-α = 0.95 => α=0.05 => α/2=0.025 => Zα/2= Z0.025=1.96
N=50>30 nên mẫu có phân phối xấp xỉ phân phối bình thường,
e = Zα/2*s/√n = 1.96*24898.72/√50 = 6901.57
L = ͞x –e = 73340.30 – 6901.57 = 66438.73
U= ͞x +e = 73340.30 + 6901.57 = 80241.87
 Khoảng ước lượng cho µ là: L ≤ µ ≤ U
Vậy với độ tin cậy 95%, số dặm trung bình tổng thể lái được đến khi bộ truyền động bị
lỗi được ước lượng trong khoảng từ 66438.73 miles đến 80241.87 miles.Vì giá trị
73340.30 thuộc khoảng ước lượng này nên ta có thể khẳng định bộ truyền động hoạt
động bình thường.
3) Thảo luận hàm ý
Từ bảng thống kê ta thấy:

18



 Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phân phối lệch phải.
 Độ trải giữa R0 = 86 575 – 60 421 = 26 154 => mức độ phân tán của dữ liệu
khá lớn
 Trung vị nằm giữa 2 tứ phân vị cho thấy phân phối khá đều.
Vậy cho nên chưa có đủ căn cứ để tin rằng một số người mua xe hơi đã bị hỏng bộ
truyền động sớm.
4) Xác định cỡ mẫu
Với e=5000; s = 24898.72; Zα/2= 1.96 thì cần lấy cỡ mẫu tối thiểu là:
N = (Zα/2*s)2/e2 = (1.96*24898.72)2/50002 = 95.263
Vậy lấy cỡ mẫu tối thiểu là 96 chiếc xe.
5) Thông tin thêm
Để đánh giá vấn đề lỗi bộ truyền động một cách đầy đủ hơn thì cần có thêm thông tin
về:
 Tiêu chuẩn số dặm mà một chiếc xe bình thường lái được đến khi bị lỗi bộ
truyền động mà công ty đặt ra.
 Lấy cỡ mẫu lớn hơn để có dữ liệu với độ sai lệch ít hơn.

19


Tình huống 4:
Thu nhập của nhân viên bán hàng
(Chapter 13, SalesSalary)
Bài làm
1. Phân tích thống kê mô tả.
Descriptive statistics
Salary ($)
count


120

Số quan sát

mean

64,925.48

Giá trị trung bình

sample standard deviation

10,838.67

Độ lệch chuẩn s

sample variance

117,476,831.86 Phương sai mẫu

minimum

48621

maximum

88730

range


40109

khoảng biến thiên

1st quartile

56,274.25

Tứ phân vị thứ nhất
Trung vị (Tứ phân vị thứ

median

61,489.50

2)

3rd quartile

76,092.25

Tứ phân vị thứ 3

interquartile range

19,818.00

Độ trải giữa


mode

53,464.00

2. Ước lượng khoảng trung bình
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của tất cả những
người bán hàng.
n=120>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân
phối normal.
confidence interval 95.% lower 62,986.23
confidence interval 95.% upper 66,864.72
margin of error

1,939.25

z

1.96

20


 Với độ tin cậy 95%, thu nhập trung bình năm của tất cả những người bán
hàng được ước lượng trong khoảng 62,986.23 đến 66,864.72
3. Ước lượng khoảng trung bình của các nhân viên bán hàng tại doanh
nghiệp
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán
hàng tại doanh nghiệp (inside).
n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối
normal.


inside
count

60

confidence interval 95.% lower

55,112.18

confidence interval 95.% upper

56,928.85

margin of error
z

908.33
1.96

 Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại
doanh nghiệp (inside) được ước lượng trong khoảng 55,112.18 đến
56,928.85
4. Ước lượng khoảng trung bình của các nhân viên bán hàng tại thực địa
Ước lượng khoảng tin cậy 95% của thu nhập trung bình năm của các nhân viên bán
hàng tại thực địa (outside).
n=60>30 =>theo định lý giới hạn trung tâm, trung bình mẫu sẽ xấp xỉ phân phối
normal.
outside
count


60

confidence interval 95.% lower

71,825.68

confidence interval 95.% upper

75,835.18

margin of error

2,004.75

z

1.96

21


 Với độ tin cậy 95%, thu nhập trung bình năm của các nhân viên bán hàng tại
thực địa (outside) được ước lượng trong khoảng 71,825.68 đến 75,835.18
5. Kiểm định giả thuyết.
H0: µ1=µ2, thu nhập do vị trí công tác là như nhau.
H1: µ1≠µ2, có sự khác nhau về thu nhập do vị trí công tác.
One factor ANOVA
Mean


n

Std. Dev

56,020.5

60

3,589.83

inside

73,830.4

60

7,922.96

outside

64,925.5

120 10,838.67

Total

SS

df


MS

F

Treatment 9,515,793,950.21

1

9,515,793,950.208 251.54 4.96E-31

Error

4,463,949,041.72

118 37,830,076.625

Total

13,979,742,991.93 119

ANOVA
table

Source

22

p-value



Comparison of Groups
100,000.0
90,000.0
80,000.0
70,000.0
60,000.0
50,000.0
40,000.0
inside

outside

p-value<α=0.05 => bác bỏ H0
 Với độ tin cậy 95% có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như
vậy có sự khác nhau giữa thu nhập của nhân viên bán hàng tại doanh nghiệp
(inside) và nhân viên bán hàng tại thực địa (outside).
6. Kiểm định giả thuyết.
n=40>30 => Trung bình mẫu xấp xỉ phân phối normal
H0: µ1=µ2=µ3, Thu nhập do số năm kinh nghiệm là như nhau.
H1: Có sự khác nhau về thu nhập do số năm kinh nghiệm.
One factor ANOVA
Mean

n

Std. Dev

59,819.6

40


6,005.06

low

68,618.1

40

13,621.38

medium

66,338.7

40

9,699.51

high

64,925.5

120

10,838.67

Total

ANOVA


23


table
Source

SS

df

Treatment

1,668,100,099.40

Error

12,311,642,892.53 117

Total

13,979,742,991.93 119

MS

2

F

834,050,049.700 7.93


p-value
.0006

105,227,717.030

p-value=0.0006 < α=0.05 => bác bỏ H0=> Với độ tin cậy 95% có đủ bằng
chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau về thu nhập
do số năm kinh nghiệm.
Phân tích sâu ANOVA:
Post hoc analysis
p-values for pairwise ttests
low

high

medium

59,819.6

66,338.7

68,618.1

low

59,819.6

high


66,338.7

.0053

medium

68,618.1

.0002

.3224

Tukey simultaneous comparison t-values (d.f. = 117)
low

high

medium

59,819.6

66,338.7

68,618.1

low

59,819.6

high


66,338.7

2.84

medium

68,618.1

3.84

0.99

critical values for experimentwise error rate:
0.05

2.38

0.01

2.97

24


×