Tải bản đầy đủ (.pdf) (45 trang)

Bài giảng Thống kê ứng dụng trong kinh doanh: Chương 4 - Trường Đại học Bách khoa Hà Nội

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.05 MB, 45 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN KINH TẾ VÀ QUẢN LÝ
EM3230 THỐNG KÊ ỨNG DỤNG TRONG KINH DOANH

CHƯƠNG 4

TÓM TẮT DỮ LIỆU BẰNG CÁC ĐẠI LƯỢNG SỐ


Nội dung chính
4.1 Các đại lượng đo lường xu hướng tập trung
4.2 Các đại lượng đo lường độ phân tán
4.3 Các đại lượng đo lường hình dáng phân phối và phát hiện giá trị bất thường
4.4 Biểu đồ hình hộp
4.5 Thực hành phân tích dữ liệu bang thống kê mơ tả với Excel/ SPSS

EM3230 Thống kê ứng dụng

2


4.1. Các đại lượng đo lường xu hướng tập trung

Xu hướng tập trung

4.1.1 Trung bình

4.1.2 Trung vị

4.1.3 Mode


4.1.5 Trung bình
nhân

4.1.4 Tứ phân vị

EM3230 Thống kê ứng dụng

3


4.1. Các đại lượng đo lường xu hướng tập trung
Phân biệt 3 loại dữ liệu
§

Dữ liệu rời rạc, khơng phân tổ (tần số), khơng
khoảng cách tổ

§

Dữ liệu có phân tổ (tần số), khơng có khoảng cách tổ

§

Dữ liệu có phân tổ (tần số) và có khoảng cách tổ

Thâm niên
xi

Số nhân viên
fi


2
3
4
5

4
6
7
3
Số nhân viên
fi

154

160

162

164

169

155

Thu nhập
tr./tháng

168


160

161

163

173

172

1~3

4

161

162

173

172

168

159

3~5

12


5~7

26

7~10

8

EM3230 Thống kê ứng dụng

4


4.1.1 Trung bình cộng
Khái niệm
Trung bình là đại lượng đo lường xu hướng tập trung mà giá trị của nó được tính bằng
tổng giá trị của các đơn vị trong tập dữ liệu chia cho tổng số đơn vị trong tập đó.
Ví dụ:
§ Năng suất lao động bình qn
§ Điểm học tập trung bình
§ GDP bình qn đầu người

Ý nghĩa
Nêu lên mức độ điển hình nhất, chung nhất của tổng thể nghiên cứu
Cơng thức tính

EM3230 Thống kê ứng dụng

5



4.1.1 Trung bỡnh cng
ã
ã

n

Cụng thc tớnh:
Trung bỡnh tng th

à =

Trung bình mẫu
n

n

x =

å xi
i =1

n

DL khơng có khoảng
cách tổ, khơng có tần số
EM3230 Thống kê ứng dụng

x =


åx

i

i =1

i =1

i =1

n

x =
fi

DL khơng có khoảng
cách tổ, có tần số

i

N

´ fi

n

å

åx


åm

i

i =1

n

å
i =1

´ fi
fi

DL có khoảng cách tổ,
có tần số
6


4.1.1 Trung bình cộng
Ví dụ
VD1: DL khơng có khoảng cách tổ, khơng có tần số
Cho bộ số liệu về số năm cơng tác của 10 nhân viên phịng Kinh doanh công ty TNHH Hồng Minh:
6, 3, 4, 2, 6, 3, 8, 6, 4, 5

n

x =

åx

i =1

n

i

=

6+3+ 4+ 2+ 6+3+8+ 6+ 4+ 5
= 4,7
10

VD2: DL khơng có khoảng cách tổ, có tần số
Thâm niên
xi
2
3
4
5

Số nhân viên
fi
4
6
7
3
20

EM3230 Thống kê ứng dụng


xi x fi
8
18
28
15

n

x=

åx

i

i =1

´ fi

n

åf
i =1

=

69
= 3,45
20

i


69
7


4.1.1 Trung bình cộng
Ví dụ
VD3: DL có khoảng cách tổ, có tần số
Thu nhập
tr./tháng
1~3
3~5
5~7
7~10

EM3230 Thống kê ứng dụng

Trị số giữa
mi
2
4
6
8,5

Số nhân viên
fi
4
12
26
8

50

m i x fi
8
48
156
68
280

n

x=

åm ´ f
i

i =1

n

åf
i =1

i

=

280
= 5,6
50


i

8


4.1.1 Trung bình cộng
Tính chất của Trung bình cộng
§ Có một giá trị trung bình duy nhất trong dãy số
§

n

å (x

i

i =1

- x) = 0

§

Có thể áp dụng đối với DL khoảng và DL tỷ lệ

§

TB bị ảnh hưởng bởi các giá trị đột biến

§


2, 3, 3, 4, 4, 5, 6, 6, 6, 8

x = 4,7
EM3230 Thống kê ứng dụng

9

2, 3, 3, 4, 4, 5, 6, 6, 6, 20

x = 6,6
9


4.1.2 Trung vị (Median)
§

Khái niệm
Là trị số của đơn vị đứng giữa của bộ dữ liệu sau khi sắp xếp theo thứ tự tăng/

giảm dần.
§

Ý nghĩa
§

Trung vị (Me) được sử dụng thay cho Trung bình trong trường hợp dữ liệu có
các giá trị đột biến

§


Trung vị chia bộ dữ liệu thành 2 phần bằng nhau, ½ số đơn vị trong bộ dữ liệu
có giá trị nhỏ hơn Me, ½ số đơn vị trong bộ dữ liệu có giá trị lớn hơn Me

§

Cơng thức tính:

EM3230 Thống kê ứng dụng

10


4.1.2 Trung vị (Median-Me)
Khái niệm
Ý nghĩa

M e = x n +1

Cơng thức tính

2

q DL khơng có khoảng cách tổ

q DL có khoảng
cách tổ, có tần số Bước 1: Xác định tổ chứa trung vị Si>=(Sfi+1)/2
Bước 2 : Xác định trung vị theo công thức

M e = xMe (min) + hMe

EM3230 Thống kê ứng dụng

n
- SMe-1
2
f Me

xMe(min) : Giá trị giới hạn dưới của tổ chứa trung vị
hMe
: Khoảng cách tổ của tổ chứa trung vị
sMe-1
fMe

: Tần số tích lũy của tổ trước tổ chứa trung vị
: Tần số của tổ chứa trung vị

11


4.1.2 Trung vị (Median-Me)
Ví dụ
q VD1: Dữ liệu khơng có khoảng cách tổ:
6, 3, 4, 2, 6, 3, 8, 6, 4, 5

sắp xếp

2, 3, 3, 4, 4, 5, 6, 6, 6, 8

q VD2:
Thâm niên


Số nhân viên

Tần số tích lũy

xi
2

fi
4

Si
4

3

6

10

4

7

17

5

3


20

M e = x n+1 = x10,5
2

x10 + x11 3 + 4
=
=
= 3,5
2
2

20
EM3230 Thống kê ứng dụng

12


4.1.2 Trung vị (Median-Me)
§ Ví dụ
q VD 3 ( DL có khoảng cách tổ)

*

M e = xMe (min) + hMe
EM3230 Thống kê ứng dụng

n
50
- S Me-1

- 16
2
= 5+ 2 2
= 5,69
f Me
26
13


4.1.2 Trung vị (Median-Me)
Tính chất của trung vị
§

Có một trung vị duy nhất trong mỗi dãy số

§

Có thể áp dụng đối với dữ liệu thứ bậc, dữ liệu khoảng, dữ liệu tỷ lệ

§

Khơng bị ảnh hưởng bởi giá trị đột biến
2, 3, 3, 4, 4, 5, 6, 6, 6, 8

EM3230 Thống kê ứng dụng

2, 3, 3, 4, 4, 5, 6, 6, 6, 20

x = 4,7


x = 6,6

Me = 4,5

Me = 4,5

14


4.1.3 Mốt (Mode- Mo)
Khái niệm: giá trị gặp nhiều lần nhất trong tập dữ liệu
Cơng thức tính:
§ Dữ liệu khơng có khoảng cách tổ
o Mốt là giá trị có tần số xuất hiện lớn nhất
§ Dữ liệu có khoảng cách tổ
• Bước 1: Xác định tổ chứa Mốt ( fmax)
• Bước 2: Xác định Mốt theo công thức

M o = xMo (min) + hM 0
EM3230 Thống kê ứng dụng

xMo(min) : Giá trị giới hạn dưới của tổ chứa mốt
hMo
fMo
fMo-1
fMo+1

: Khoảng cách tổ của tổ chứa mốt
: Tần số của tổ chứa mốt
: Tần số của tổ trước tổ chứa mốt

: Tần số của tổ trước sau tổ chứa mốt

f M 0 - f M 0 -1
( f M 0 - f M 0 -1 ) + ( f M 0 - f M 0 +1 )
15


4.1.3 Mốt (Mode- Mo)
Ví dụ
q VD1: 6, 3, 4, 2, 6, 3, 8, 6, 4, 5 sắp xếp 2, 3, 3, 4, 4, 5, 6, 6, 6, 8
à Mo = 6 (fmax=3)
q VD2: Mo = 4
Thâm
niên
Số
Thu nhập
Sốnhân
nhânviên
viên
q VD 3:
tr./tháng
xi

ffi i

2
1~3
3
3~5


44
6
12

4
5~7

7
26

5
7~10

38

26 - 12
Mo = 5 + 2´
= 5,875
(26 - 12) + (26 - 8)

20
50

EM3230 Thống kê ứng dụng

16


4.1.3 Mốt (Mode- Mo)
Tính chất của Mốt

§

Một dãy số có thể có nhiều hoặc khơng có Mode
1, 2, 3, 4, 5, 6, 7, 8 : Khơng có Mốt
2, 3, 3, 4, 4, 5, 6, 6 : Có 3 mốt : 3, 4, 6

§
§

Mốt có thể xác định cho dữ liệu định tính
Mốt khơng chịu ảnh hưởng của các giá trị đột biến

2, 3, 3, 4, 4, 5, 6, 6, 6, 8

2, 3, 3, 4, 4, 5, 6, 6, 6, 20

x = 4,7

x = 6,6

Mo = 6

Mo = 6

§

Nên sử dụng Mốt đối với tổng thể có tương đối nhiều đơn vị

§


Khơng nên sử dụng Mốt đối với tổng thể có đặc điểm phân phối khơng bình
thường (dữ liệu tập trung ở nhiều điểm hoặc không tập trung ở điểm nào)

EM3230 Thống kê ứng dụng

17


So sánh trung bình, trung vị và mode

Trung bình

Trung vị

Mode

DL tỷ lệ, DL khoảng

DL thứ bậc, khoảng,
tỷ lệ

Tất cả các loại dữ liệu

Số đại lượng

duy nhất 1TB

duy nhất 1TV

Có thể khơng có, có 1

hoặc nhiều

Bị ảnh hưởng
bởi các giá trị
đột biến



Khơng

Khơng

Phạm vi AD

EM3230 Thống kê ứng dụng

18


4.1.4 Các tứ phân vị (Quartiles)
Khái niệm: là các giá trị chia bộ dữ liệu ra làm 4 phần bằng nhau.
Cơng thức tính (cần sắp xếp thứ tự từ nhỏ đến lớn trước khi tính)
§ Tứ phân vị thứ 1: Q1= X(n+1)/4 chia dữ liệu thành 2 phần (25% các giá trị đầu< Q1;
75% các giá trị sau > Q1
§ Tứ phân vị thứ 2: Q2= Me
§ Tứ phân vị thứ 3: Q3= X3(n+1)/4 chia dữ liệu thành 2 phần (75% các giá trị đầu< Q3;
25% các giá trị sau > Q3

EM3230 Thống kê ứng dụng


19


4.1.4 Các tứ phân vị (Quartiles)
Nguyên tắc
Nếu kết quả tính vị trí của tứ phân vị [(n+1)/4] và [3n+1)/4] thu được là
§ số ngun thì tứ phân vị là giá trị của đơn vị đứng thứ tự đó
§ là số ½ thì lấy trung bình của 2 giá trị tương ứng
§ khơng phải là số ngun cũng khơng phải số ½ thì làm trịn đến số ngun gần nhất

Ví dụ:
§

Sử dụng VD1: 2, 3, 3, 4, 4, 5, 6, 6, 6, 8
§ n=10:
(n+1)/4 = 2,75 ≈ 3
3(n+1)/4 = 8,25 ≈ 8
§ Q1= X3 = 3
§ Q2= Me = 4,5
§ Q3= X8 = 6

EM3230 Thống kê ứng dụng

SGK:
Q1=X2,75=X2+0,75*(X3-X2)
Q3=X8,25=X8+0,25*(X9-X8)

20



4.1.5 Trung bình nhân (Geometric mean)
Khái niệm : Trung bình nhân của một bộ n số liệu là căn bậc n của tích các số
liệu đó.
Cơng thức tính:

d = n x1.x2 .x3 ...xn
Phạm vi áp dụng trung bình nhân?
Sử dụng trong các trường hợp các lượng biến có quan hệ tích số với nhau
(số tương đối với gốc so sánh khác nhau)

EM3230 Thống kê ứng dụng

22


4.1.5 Trung bình nhân (Geometric mean)
§

Ví dụ

§
§

Gọi x1 và x2 lần lượt là tốc độ phát triển liên hoàn cuối tháng 1 và cuối tháng 2
Trung bình cộng

§

Trung bình nhân


§

x1 và x2 khơng có cùng gốc so sánh do đó việc đem cộng chúng trực tiếp với nhau
trong quá trình tính tốn số trung bình cộng là khơng hợp lý

EM3230 Thống kê ứng dụng

Source: Chu Nguyen Mong Ngoc
23


4.1. Các đại lượng đo lường xu hướng tập trung

Xu hướng tập trung

4.1.1 Trung bình

4.1.2 Trung vị

4.1.3 Mode

4.1.5 Trung bình
nhân

4.1.4 Tứ phân vị

EM3230 Thống kê ứng dụng

24



4.2 Các đại lượng đo lường độ phân tán

4.2.1

Khoảng biến thiên

ĐỘ

4.2.2

Khoảng tứ phân vị

PHÂN
TÁN

4.2.3

4.2.4

Phương sai và độ lệch chuẩn

Variability

Hệ số biến thiên
No Variability

EM3230 Thống kê ứng dụng

26



4.2 Các đại lượng đo lường độ phân tán
No Variability in Cash Flow

Variability in Cash Flow

EM3230 Thống kê ứng dụng

Mean
Mean

Mean
Mean

27


×