25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
1
CHƯƠNG 3.
PHÂN TÍCH THỐNG KÊ ỨNG DỤNG
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
Nội dung
1. Các kiểu biến
2. Biểu đồ
3. Một vài đặc trưng số
4. Hệ số tương quan
5. Đường hồi qui cực tiểu
6. Mô hình và giải bài toán
7. Một số bài toán ứng dụng
2
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
3
Kiểu biến
+ Categorical (qualitative): nominal, ordinal
+ Numerical (quantitative): discrete,
continuous
Ví dụ 1:
+ Categorical: giới tính, màu mắt, quốc
gia,…
+ Numerical: chiều cao, cân nặng,…
Exercise 5A [1]
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
4
Biểu đồ (Bar/Pie chart) - categorical
Ví dụ 2: nominal
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
5
Biểu đồ (Bar/Pie chart) (tt)
Lưu ý: Để vẽ được biểu đồ, ta tính các góc
như sau:
n i × 360
ang =
130
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
Biểu đồ (Bar/Pie chart) (tt)
Ví dụ 3: ordinal
6
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
Biểu đồ (Bar/Pie chart) (tt)
Exercise 5B
7
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
8
Biểu đồ (histogram) (tt) - numerical
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
Biểu đồ (tt) - numerical
Frequency polygon
9
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
10
Relative and Percentage frequency
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
11
Cumulative andcumulative relative
frequency
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
12
Cumulative frequency polygon
Exercise 5C
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
13
Biểu đồ
Hướng dẫn sử dụng Excel để vẽ biểu đồ.
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
14
Một số đặc điểm của biểu đồ
Khi vẽ biểu đồ, ta thường gặp một số dạng
sau:
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
15
Một số đặc điểm của biểu đồ (tt)
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
16
Một số đặc điểm của biểu đồ (tt)
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
17
Một số đặc trưng số
Trung bình: xét một tập dữ liệu với n quan
sát có giá trị: x1 , x 2 ,..., x n
Khi đó, giá trị trung bình của tập dữ liệu là:
x1 + x 2 + ... + x n
x=
.
n
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
18
Một số đặc trưng số (tt)
Trung vị: (median) là giá trị ở giữa của dãy
số đã được sắp thứ tự.
Ví dụ 4:
• 1 3 5 6 7 8 10: median = 6;
6+8
= 7.
• 2 4 5 6 8 9 12 14: median =
2
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
19
Một số đặc trưng số (tt)
Mode: là quan sát xuất hiện nhiều nhất.
Độ lệch chuẩn: xét tập dữ liệu n quan sát
có các giá trị: x1 , x 2 ,..., x n , độ lệch
chuẩn của tập dữ liệu này là:
n
1
2
σn =
( xi − x )
∑
n i=1
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
Một số đặc trưng số (tt)
Độ lệch chuẩn có hiệu chỉnh:
n
1
2
σn −1 =
( xi − x )
∑
n − 1 i=1
Exercise 5G [1]
20
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
21
The boxplots
Để vẽ một boxplots ta cần biết 5 đại lượng
tương ứng của tập dữ liệu:
+ Median
+ Quartile thứ nhất
+ Quartile thứ ba
+ Giá trị nhỏ nhất
+ Giá trị lớn nhất
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
The boxplot
Ví dụ 5: cho tập dữ liệu
Sắp xếp lại dữ liệu:
22
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
The boxplots
Ta có:
+ Median: m = 71.
24 + 27
= 25.5
+ Quartile thứ nhất: Q1 =
2
108 + 111
+ Quartile thứ ba: Q3 =
= 109.5
2
+ Giá trị nhỏ nhất: 2
+ Giá trị lớn nhất: 264
23
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
The boxplots
24
25/12/2015
C01124 - Chương 3. Phân tích thống kê ứng dụng
25
The boxplots
Áp dụng boxplots để so sánh các tập dữ liệu
trên cùng một biến.
• Exercise 5H