1
Basic Business Statistics: Concepts &
Applications
Activity 4 + 5 + 6
Descriptive Statistics
and Graphical Analysis
Thống kê kinh doanh
cơ bản:
Khái niệm & Ứng dụng
Thống kê kinh doanh
cơ bản:
Khái niệm & Ứng dụng
Activity 4 + 5 + 6.
Thống kê mô tả.
Sơ đồ phân tích
Activity 4 + 5 + 6.
Thống kê mô tả.
Sơ đồ phân tích
Người dịch : Châu Lê Duy Thức
()
Nguyễn Phúc Đạt
()
2
Learning Objectives
•
Measures of Center and Location:
Mean (Arithmetic Average,Weighted
Mean, Geometric Mean), Mode, Median
•
Other measures of Location:
Percentiles, Quartiles
•
Measures of Variation: Range,
Interquartile range, Variance and Standard
deviation, Coefficient of variation
Những chỉ tiêu biến thiên: Khoảng biến
thiên, khoảng tứ phân vị, phương sai và độ
lệch tiêu chuẩn, hệ số biến thiên
Những chỉ tiêu biến thiên: Khoảng biến
thiên, khoảng tứ phân vị, phương sai và độ
lệch tiêu chuẩn, hệ số biến thiên
Những chỉ tiêu tập trung và
phân tán : (trung bình cộng,
trung bình gia trọng, trung
bình nhân), Mode, Trung vị.
Những chỉ tiêu tập trung và
phân tán : (trung bình cộng,
trung bình gia trọng, trung
bình nhân), Mode, Trung vị.
Những chỉ tiêu phân tán
khác: những phân vị, những
điểm tứ phân vị
Những chỉ tiêu phân tán
khác: những phân vị, những
điểm tứ phân vị
3
Contents
•
1. Measures of Central Tendency
•
1.1. Mean (Arithmetic Mean)
•
1.2. Mode
•
1.3. Median
•
1.4. Shape of a Distribution
•
2. Other Location Measures: Percentiles and Quartiles
•
2.1. Quartiles
•
2.2. Box-and-Whisker Plot
•
2.3. Distribution Shape and
Box-and-Whisker Plot
1. Các chỉ tiêu phản ánh
khuynh hướng tập trung của
tiêu chí
1.1. số bình quân (TB cộng).
1.2. Mode.
1.3. Trung vị.
1.4. Hình dáng (của) một
Phân phối.
1. Các chỉ tiêu phản ánh
khuynh hướng tập trung của
tiêu chí
1.1. số bình quân (TB cộng).
1.2. Mode.
1.3. Trung vị.
1.4. Hình dáng (của) một
Phân phối.
2. Những chỉ tiêu phân tán khác:
những phân vị và những điểm tứ
phân vị.
2.1. Những điểm tứ phân vị.
2.2. Box and Whisker Plot
2.3. Các biểu đồ hình dạng phân
phối box and Whisker Plot
2. Những chỉ tiêu phân tán khác:
những phân vị và những điểm tứ
phân vị.
2.1. Những điểm tứ phân vị.
2.2. Box and Whisker Plot
2.3. Các biểu đồ hình dạng phân
phối box and Whisker Plot
4
•
3. Measures of Variation
•
3.1. Range
•
3.2. Interquartile Range
•
3.3. Variance
•
3.4. Standard Deviation
•
3.5. Coefficient of Variation
•
3.6. The Empirical Rule and Tchebysheff’s Theorem
•
3.7. Tchebysheff’s Theorem
•
Using Microsoft Excel
•
Exercices
3. Các chỉ tiêu biến thiên
3.1. Khoảng biến thiên
3.2. Khoảng tứ phân vị (độ trãi giữa).
3.3. Phương sai
3.4. Sự lệch tiêu chuẩn.
3.5. Hệ số biến thiên.
3.6. Quy tắc Thực nghiệm và Định lý
Tchebysheff.
3.7. Định lý Tchebysheff.
Sử dụng Microsoft Excel.
Exercices
3. Các chỉ tiêu biến thiên
3.1. Khoảng biến thiên
3.2. Khoảng tứ phân vị (độ trãi giữa).
3.3. Phương sai
3.4. Sự lệch tiêu chuẩn.
3.5. Hệ số biến thiên.
3.6. Quy tắc Thực nghiệm và Định lý
Tchebysheff.
3.7. Định lý Tchebysheff.
Sử dụng Microsoft Excel.
Exercices
5
Summary Measures
Center and Location
Mean
Median
Mode
Other Measures of
Location
Weighted Mean
Describing Data Numerically
Variation
Variance
Standard Deviation
Range
Percentiles
Interquartile Range
Quartiles
Sơ lược về các
chỉ tiêu
Sơ lược về các
chỉ tiêu
Mô tả dữ liệu
số
Mô tả dữ liệu
số
Tập trung và
phân tán
Tập trung và
phân tán
Số bình quân
Số bình quân
Trung vị
Trung vị
Mode
Mode
Trung bình
gia quyền
Trung bình
gia quyền
Chỉ tiêu phân
tán khác
Chỉ tiêu phân
tán khác
phân vị
phân vị
Tứ phân
vị
Tứ phân
vị
Sự biến thiên
Sự biến thiên
Khoảng biến thiên
Khoảng biến thiên
Khoảng tứ
phân vị
Khoảng tứ
phân vị
Phương sai
Phương sai
Sự lệch tiêu
chuẩn
Sự lệch tiêu
chuẩn
6
1. Measures of Central Tendency
Các chỉ tiêu phản ánh khuynh
hướng tập trung của tiêu chí
Các chỉ tiêu phản ánh khuynh
hướng tập trung của tiêu chí
7
1.1. Mean (Arithmetic Mean)
Mean (arithmetic mean) of data values
Sample mean
Population mean
1 1 2
n
i
i n
X
X X X
X
n n
=
+ + +
= =
∑
L
1 1 2
N
i
i N
X
X X X
N N
µ
=
+ + +
= =
∑
L
Sample Size
Population Size
Trung bình cộng
Trung bình cộng
Trung
bình
tổng
thể
mẫu
Trung
bình
tổng
thể
mẫu
Trung
bình
tổng thể
chung
Trung
bình
tổng thể
chung
Kích thước mẫu
Kích thước mẫu
Kích thước chung
Kích thước chung
Cách tính trung bình của giá trị dữ
liệu
Cách tính trung bình của giá trị dữ
liệu
8
1.1 Mean (continued)
(Weighted Mean)
•
Used when values are grouped by frequency
or relative importance
Được sử dụng khi những giá trị
được nhóm lại bởi tần số (thường
xuyên) hoặc tương đối quan trọng
Được sử dụng khi những giá trị
được nhóm lại bởi tần số (thường
xuyên) hoặc tương đối quan trọng
28
87
126
45
Frequency
Days to
Complete
28
87
126
45
Frequency
Days to
Complete
Example: Sample of
26 Repair Projects
Weighted Mean Days
to Complete:
days 6.31
26
164
28124
8)(27)(86)(125)(4
w
xw
X
i
ii
W
==
+++
×+×+×+×
==
∑
∑
9
1.2. Mode
•
A measure of central tendency
•
Value that occurs most often
•
Not affected by extreme values
•
Used for either numerical or categorical data
•
There may be no mode or several modes
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Mode = 9
0 1 2 3 4 5 6
No Mode
- Một chỉ tiêu phản ánh khuynh
hướng tập trung của các tiêu chí
- Giá trị mà xuất hiện thường xuyên
nhất.
- Không bị ảnh hưởng bởi những giá
trị cực trị.
- Được sử dụng cho mọi dữ liệu số
hay tuyệt đối.
- Có thể không có Mode nào hay vài
Mode
- Một chỉ tiêu phản ánh khuynh
hướng tập trung của các tiêu chí
- Giá trị mà xuất hiện thường xuyên
nhất.
- Không bị ảnh hưởng bởi những giá
trị cực trị.
- Được sử dụng cho mọi dữ liệu số
hay tuyệt đối.
- Có thể không có Mode nào hay vài
Mode
10
1.3. Median
•
Robust measure of central tendency
•
Not affected by extreme values
•
In an ordered array, the median is the “middle” number
If n or N is odd, the median is the middle number
If n or N is even, the median is the average of the two
middle numbers
- Chỉ tiêu mạnh phản ánh khuynh hướng tập trung
của các tiêu chí
- Không bị ảnh hưởng bởi giá trị cực đại
- Trong một mảng có trật tự, trung bình là số
“giữa”
+ Nếu n hoặc N là số lẻ, trung bình là số giữa
+ Nếu n hoặc N là chẵn, trung bình là trung
bình của hai số giữa
- Chỉ tiêu mạnh phản ánh khuynh hướng tập trung
của các tiêu chí
- Không bị ảnh hưởng bởi giá trị cực đại
- Trong một mảng có trật tự, trung bình là số
“giữa”
+ Nếu n hoặc N là số lẻ, trung bình là số giữa
+ Nếu n hoặc N là chẵn, trung bình là trung
bình của hai số giữa
0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 12 14
Median = 5
Median = 5
11
1.4. Shape of a Distribution
•
Describes how data is distributed
•
Symmetric or skewed
Hình dáng của
một phân phối
Hình dáng của
một phân phối
- Mô tả dữ liệu được phân phối như thế nào
- Đối xứng hoặc bị lệch
- Mô tả dữ liệu được phân phối như thế nào
- Đối xứng hoặc bị lệch
Phần đuôi dài hơn lệch về trái
12
2. Other Location Measures
Other Measures
of Location
Percentiles Quartiles
1
st
quartile = 25
th
percentile
2
nd
quartile = 50
th
percentile
= median
3
rd
quartile = 75
th
percentile
The p
th
percentile in a data array:
p% are less than or equal to this
value
(100 – p)% are greater than or
equal to this value
(where 0 ? p ? 100)
phân vị
phân vị
tứ phân vị
tứ phân vị
Mảng dữ liệu
Mảng dữ liệu
nhỏ hơn hoặc bằng
nhỏ hơn hoặc bằng
Lớn hơn
Lớn hơn
Các chỉ tiêu phân tán
khác
Các chỉ tiêu phân tán
khác
13
2.1. Quartiles
•
Split Ordered Data into 4 Quarters
•
Position of ith Quartile
25% 25% 25% 25%
( )
1
Q
( )
2
Q
( )
3
Q
( )
( )
1
4
i
i n
Q
+
=
Cắt dữ liệu ra làm
4 phần
Cắt dữ liệu ra làm
4 phần
Vị trí của dữ liệu thứ 4
trong bảng tứ phân vị
được tính như sau
Vị trí của dữ liệu thứ 4
trong bảng tứ phân vị
được tính như sau