THỐNG KÊ ỨNG DỤNG
TRONG KINH TẾ VÀ KINH DOANH
Anderson
Sweeney
Williams
Slides by
John Loucks
St. Edward’s University
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
1
or duplicated, or posted to a publicly accessible website, in whole or in part.
Chương 2, Phần B
Thống kê mô tả:
Trình bày bằng bảng và đồ thị
Phân tích dữ liệu thăm dò: Biểu đồ nhánh và
lá
Bảng chéo và đồ thị phân tán
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
2
or duplicated, or posted to a publicly accessible website, in whole or in part.
Phân tích dữ liệu thăm dò
Các kỹ thuật phân tích dữ liệu thăm dò là các
tính toán đơn giản và các đồ thị đơn giản được
dùng để tóm tắt dữ liệu một cách nhanh chóng.
Một trong số kỹ thuật đó là Biểu đồ nhánh lá.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
3
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ nhánh lá
Biểu đồ nhánh lá thể hiện thứ tự xếp hạng và
hình dáng phân phối của dữ liệu.
Nó giống với phân phối tần số histogram về
hình dáng, nhưng có thêm một ưu điểm là thể
hiện cả giá trị của dữ liệu.
Các chữ số đầu tiên của mỗi giá trị được đặt
bên trái của đường thẳng đứng.
Bên phải đường thẳng, chúng ta ghi các chữ
số cuối của từng giá trị theo thứ tự từ nhỏ đến
lớn.
Mỗi chữ số bên trái đường thẳng là 1 nhánh.
Mỗi chữ số gắn trên nhánh là 1 lá.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
4
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ: Hudson Auto Repair
Người quản lý của Hudson Auto muốn tìm hiểu
sâu hơn về chi phí của các bộ phận được sử
dụng để điều chỉnh động cơ ở cửa hàng. Cho
kiểm tra 50 hóa đơn của khách hàng có nhu
cầu điều chỉnh động cơ. Chi phí của các bộ
phận, được làm tròn đến đồng đô la, được
trình bày ở slide kế tiếp.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
5
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ nhánh lá
Ví dụ: Hudson Auto Repair
Mẫu chi phí các bộ phận (đô la) của 50 nhu
cầu điều chỉnh động cơ
91
71
104
85
62
78
69
74
97
82
93
72
62
88
98
57
89
68
68
101
75
66
97
83
79
52
75
105
68
105
99
79
77
71
79
80
75
65
69
69
97
72
80
67
62
62
76
109
74
73
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
6
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ nhánh lá
Ví dụ: Hudson Auto Repair
5 2 7
6 2 2 2 2 5 6 7 8 8 8 9 9 9
17 1 2 2 3 4 4 5 5 5 6 7 8 9 9 9
8 0 0 2 3 5 8 9
9 1 3 7 7 7 8 9
10 1 4 5 5 9
Nhánh
lá
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
7
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ nhánh lá mở rộng
Nếu thấy biểu đồ nhánh là ban đầu của chúng
ta có quá nhiều dữ liệu, chúng ta có thể kéo dài
cách hiển thị bằng cách sử dụng 2 nhánh cho
mỗi chữ số đầu.
Khi 1 giá trị nhánh được viết 2 lần, thì nhánh
đầu sẽ gồm các giá trị của lá từ 0 – 4, nhánh 2
gồm các giá trị của lá từ 5-9
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
8
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ nhánh là mở rộng
Ví dụ: Hudson Auto Repair
5 2
5 7
6 2 2 2 2
65 6 7 8 8 8 9 9 9
71 1 2 2 3 4 4
75 5 5 6 7 8 9 9 9
8 0 0 2 3
8 5 8 9
9 1 3
9 7 7 7 8 9
10 1 4
10 5 5 9
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
9
or duplicated, or posted to a publicly accessible website, in whole or in part.
Biểu đồ nhánh lá
Đơn vị lá
• Mỗi chữ số được dùng để đại diện một lá.
•
•
•
•
Trong ví dụ trước, đơn vị lá là 1.
Đơn vị của lá có thề là 100, 10, 1, 0,1,...
Trường hợp nếu không khai báo đơn vị lá,
nó quy ước là 1.
Đơn vị của lá dùng để nhân với nhánh và lá
để có được giá trị gần đúng ban đầu của dữ
liệu.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
10
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ: Đơn vị lá = 0,1
Nếu ta có dữ liệu như sau
8,6
8,6
11,7
11,7 9,4
9,4
9,1
9,1
10,2
10,2 11,0
11,0 8,8
8,8
Biểu đồ nhánh lá sẽ là
Đơn vị lá
8 6
9 1
10 2
11 0
= 0,1
8
4
7
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
11
or duplicated, or posted to a publicly accessible website, in whole or in part.
Ví dụ: Đơn vị lá = 10
Nếu ta có dữ liệu như sau:
1806
1806 1717
1717 1974
1974 1791
1791 1682
1682 1910
1910 1838
1838
Biểu đồ nhánh lá sẽ là
Đơn vị lá = 10
16 8
Số 82 trong 1682
17 1 9
được làm tròn
xuống là 80 và
18 0 3
được hiển thị là 8.
19 1 7
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
12
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo và đồ thị phân tán
Như vậy, đến thời điểm này chúng ta tập trung
vào các phương pháp tóm tắt dữ liệu với một
biến tại 1 thời điểm
Thường người quản lý quan tâm đến bảng và
phương pháp đồ họa giúp hiểu được mối quan hệ
giữa hai biến.
Bảng chéo và đồ thị phân tán là hai phương
pháp tóm tắt dữ liệu cho hai biến đồng thời.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
13
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo
Bảng chéo là một bảng tóm tắt dữ liệu cho 2
biến .
•
•
•
Bảng chéo được dùng khi:
Một biến là định tính và một biến là định lượng,
Cả hai biến là định tính, hoặc
Cả hai biến là định lượng.
Các nhãn bên trái và bên trên xác định các
nhóm của hai biến .
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
14
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo
Ví dụ: Finger Lakes Homes
Số lượng căn hộ Finger Lakes được bán theo
giá và theo loại trong 2 năm qua như .
Biến định lượng đã
Biến định
được phân nhóm
tính
Loại căn hộ
Khoảng giá
Colonial
Log
Split A-FrameTổng
< 200.000 USD18
> 200.000 USD12
Tổng
30
6
14
20
19
16
35
12
3
15
55
45
100
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
15
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo
Ví dụ: Finger Lakes Homes
Thông tin từ bảng chéo
•
Phần lớn các căn hộ (19) trong mẫu có
kiểu split-level và giá dưới 200.000 USD.
•
Chỉ có 3 căn hộ kiểu A-Frame và giá cao
hơn hoặc bằng 200.000USD
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
16
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo
Ví dụ: Finger Lakes Homes
Khoảng giá
Colonial
Loại căn hộ
Log
Split A-FrameTổng
<200000USD18
12
> 200.000USD
Tổng
30
Phân phối tần số
cho biến mức giá
đã phân lớp
6
14
20
19
16
35
12
3
15
55
45
100
Phân phối tần số cho
biến loại căn hộ
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
17
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo: Phần trăm hàng và cột
Chuyển đổi các giá trị trong bảng thành tỷ lệ
phần trăm theo cột hoặc tỷ lệ phần trăm theo
hàng có thể cung cấp cái nhìn sâu hơn về mối
quan hệ giữa hai biến.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
18
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo: Phần trăm theo hàng
Ví dụ: Finger Lakes Homes
Khoảng giá
Colonial
< 200.000USD
32,73
26,67
> 200.000USD
Loại căn hộ
Log
Split
10,91 34,55
31,11 35,56
A-FrameTổng
21,82
6,67
100
100
Lưu ý: tổng hàng thật sự là 100,01 do làm tròn số.
(Colonial và > 200.000USD)/(Tổng > 200.000USD) x 100
= (12/45) x 100
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
19
or duplicated, or posted to a publicly accessible website, in whole or in part.
Crosstabulation: Phần trăm theo cột
Ví dụ Finger Lakes Homes
Khoảng giá
Colonial
<200.000USD
60,00
40,00
> 200.000USD
Tổng
100
Loại căn hộ
Log
Split
30,00 54,29
70,00 45,71
100
100
A-Frame
80,00
20,00
100
(Colonial và > $200K)/(Tổng Colonial) x 100 = (12/30) x 100
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
20
or duplicated, or posted to a publicly accessible website, in whole or in part.
Bảng chéo: Nghịch lý Simpson
Dữ liệu trong 2 hoặc 3 bảng chéo là thường
được gom lại để tạo ra một bảng chéo tổng
hợp.
Chúng ta phải cẩn thận khi kết luận về mối
quan hệ giữa hai biến trong bảng chéo tổng hợp.
Trong một số trường hợp, các kết luận dựa
trên một bảng tổng hợp có thể sẽ ngược lại
hoàn toàn so với dữ liệu ban đầu . Các kết luận
nghịch lý dựa trên bảng tổng hợp so với dữ liệu
ban đầu gọi là Nghịch lý Simpson.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
21
or duplicated, or posted to a publicly accessible website, in whole or in part.
Đồ thị phân tán và đường xu hướng
Đồ thị phân tán là trình bày đồ họa về mối
quan hệ giữa hai biến định lượng.
Một biến được biểu diễn ở trục hoành và biến
còn lại trên trục tung
Những điểm giá trị vẽ trên đồ thị thể hiện mới
quan hệ tổng quát giữa 2 biến
Đường xu hướng cung cấp một xấp xỉ về mối quan hệ.
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
22
or duplicated, or posted to a publicly accessible website, in whole or in part.
Đồ thị phân tán
Mối quan hệ thuận
y
x
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
23
or duplicated, or posted to a publicly accessible website, in whole or in part.
Đồ thị phân tán
Mối quan hệ nghịch
y
x
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
24
or duplicated, or posted to a publicly accessible website, in whole or in part.
Đồ thị phân tán
Không có mối quan hệ
y
x
© 2011 Cengage Learning. All Rights Reserved. May not be scanned, copied Slide
25
or duplicated, or posted to a publicly accessible website, in whole or in part.