THỐNG KÊ MÔ TẢ
(phần 2)
THS. LÊ HUỲNH THỊ CẨM HỒNG
Ôn lại
1, Biến số định tính - Biến số định lượng
Biến định tính gồm 3 loại: nhị giá, danh định, thứ tự
Biến định lượng gồm 2 loại: biến liên tục hoặc biến không liên tục
2, Biến số độc lập - Biến số phụ thuộc
3, Biến số gây nhiễu
4, Thống kê mô tả (biến định lượng)
Mô tả khuynh hướng tập trung: trung bình, trung vị, yếu vị
Mô tả tính phân tán: độ lệch chuẩn, khoảng tứ vị, phạm vi số liệu
Thí dụ
Thuốc
hạ áp A được sử dụng trên 5 bệnh nhân và huyết áp tâm thu
sau khi dùng thuôc là 110, 115, 120, 125, 130 (trung bình = 120)
Thuốc
hạ áp B được sử dụng trên 5 bệnh nhân và huyết áp tâm thu
sau khi dùng thuôc là 100, 110, 120, 130, 140 (trung binh = 120)
Hiệu
quả 2 thuốc tương đương nhau (trung bình bằng nhau)
Nhưng
thuốc B phân tán rộng hơn, cho thấy kém hiệu quả hơn
Để đánh giá sự phân tán, người ta sử dụng:
Độ lệch của giá trị so với trung bình
Độ lệch của huyết áp tâm thu của thuốc A là
110
– 120 = -10
115
– 120 = -5
120
– 120 = 0
125
– 120 = 5
130
– 120 = 10
Để mô tả độ lớn của độ lệch ta không thể lấy số trung bình của độ lệch , vì
bao gồm giá trị âm và dương nên trung bình độ lệch là zero.
Do đó sử dụng trung bình của bình phương độ lệch => gọi là PHƯƠNG SAI
PHƯƠNG SAI
Trung bình bình phương độ lệch
Variance. Ký hiệu: s2
110
– 120 = -10 => (-10)2 = 100
115
– 120 = -5 => (-5)2 = 25
120
– 120 = 0 => 02 = 0
125
– 120 = 5 => (5) 2 = 25
130
– 120 = 10 => (10) 2 = 100
PHƯƠNG SAI: s2 = (100 + 25 +0 +25 +100) / (5-1) = 62,5
Độ lệch chuẩn
•
Độ lệch chuẩn: Standard deviation – SD. Ký hiệu: s
•
Phản ánh khoảng cách trung bình của số liệu so với giá trị tiêu biểu
•
Công thức:
Độ lệch chuẩn là căn bậc 2 của phương sai
ĐỘ LỆCH CHUẨN: s = 7,9
Số liêu về huyết áp tâm thu của 5 người là: 135, 150, 120, 125,
130, có trung bình = 132. Tính độ lệch chuẩn?
SD = (135-132)2 + (150-132)2 + (120-132)2 + (125-132)2
+ (130-132)2 / (5-1)
= 11.5
Nên cần mô tả cả khuynh hướng
tập trung và tính phân tán
Trung vị
Min, Max,
Phạm vi số liệu,
Khoảng tứ vị
Trung bình
Độ lệch chuẩn
8
STT Tuổi
1
32
2
35
3
23
4
29
5
31
6
30
7
34
8
27
9
27
10
29
STT Tuổi
11
34
12
32
13
32
14
23
15
29
16
32
17
23
18
35
19
31
20
32
Phạm vi số liệu
(min – max)
Khoảng tứ vị
Trung vị
Trung bình
Độ lệch chuẩn
THỐNG KÊ MÔ TẢ
BIẾN ĐỊNH TÍNH
Thống kê mô tả biến định tính
Mô
tả biến định tính dễ dàng hơn
Trình
bày tần số (số ca/số người) và tỷ lệ phần trăm ở mỗi giá trị của
biến số
Giới tính
Nam
Nữ
Tổng cộng
Số lượng (%)
57 (37.5)
95 (62.5)
152
Nghề nghiệp
Nông dân
Số lượng (%)
14 (9)
Nhân viên văn phòng
98 (64)
Buôn bán, kinh doanh
40 (26)
Khác
1 (1)
Chuyển biến số: biến định lượng => biến định tính
12
20, 21,22,23,………………69 (năm
tuổi)
Biến định
lượng có thể
chuyển thành
biến định tính
20-29, 30-39, 40-49, 5059,60-69
Lứa tuổi 20; 30; 40;
50; 60
Trẻ; Già
Biến định
tính không
thể chuyển
đổi thành
biến định
lượng
Ví dụ:
Biến định lượng có thể được trình bày ở cả 2 dạng
Nhóm
Tuổi
Dưới 30 tuổi
N (%)
38.9 (14.2) (mean, SD)
40 (26)
30-50 tuổi
83 (53)
Trên 50 tuổi
32 (21)
Số năm sống ở Úc
2 (2) (median, IQR)
Ít hơn 2 năm
43 (28)
2-4 năm
94 (60)
Trên $ năm
19 (12)
CÔNG CỤ
TRÌNH BÀY VÀ THỐNG KÊ SỐ LIỆU
Công cụ trình bày số liệu
Trình
o
bày bảng
Bảng phân phối tần suất (Bảng đơn biến - Bảng đa biến)
Biểu
đồ - đồ thị
o
Biểu đồ hình thanh
o
Biểu đồ hình bánh
o
Tổ chức đồ và đa giác tần suất
Bảng phân phối tần suất
Trình
bày số liệu cho biến định tính và biến
định lượng
Nếu
muốn trình bày cho số liệu biến định
lượng cần phải phân nhóm các biến định
lượng thành biến định tính
Bảng đơn biến
Tháng
Số mắc (ca bệnh)
1
1.328
Bảng 1:
2
3.511
3
6.059
Số mắc
bệnh thủy
đậu theo
tháng ở
Miền Bắc,
2007
4
4.368
5
2.599
6
2.030
7
1.460
8
1.102
9
604
10
601
11
706
12
2.372
Tổng cộng
26.740
Bảng đa biến
Số mắc (ca bệnh)
Tháng
Bảng 2:
Số mắc
viêm não
do vi rút
ở Việt
Nam,
2006
Miền Bắc
Miền Trung Miền Nam
Tây
Nguyên
Cả nước
1
2
23
21
5
11
40
59
1
1
69
92
3
18
22
131
1
172
4
34
9
113
4
160
5
125
7
68
1
201
6
211
8
62
4
285
7
80
5
25
9
119
8
91
6
41
3
141
9
88
1
37
0
126
10
28
2
31
1
62
11
22
2
33
0
57
12
23
4
30
0
57
Tổng cộng
764
82
670
25
1.541
Bảng phân phối tần suất
Bảng: Phân phối giới tính của học sinh lớp A, trường mầm non 23/11, Hóc Môn
Giới
Số trẻ
Phần trăm
Nam
45
65%
Nữ
24
35%
Tổng số
69
100%
Hình thức của bảng
•
Có tựa ngắn gọn, rõ ràng
•
Đặt tên và ghi rõ đơn vị cho hàng và cột
•
Trình bày tổng số của hàng và cột
•
Định nghĩa các ký hiệu và chữ viết tắt dưới bảng (nếu có)
•
Ghi nguồn số liệu ở dưới bảng
•
Khi tỉ lệ phần trăm, thông thường chỉ lấy phần nguyên của
số phần trăm. Nếu cỡ mẫu lớn, có thể lấy 1 số lẻ thập
phân.
Biểu đồ hình thanh
Biểu đồ hình thanh
•
Mô tả sự phân bố của biến số rời rạc.
•
Gồm trục hoành, trục tung.
•
Luôn có khoảng trống giữa các thanh.
Biểu đồ hình bánh
Biểu đồ hình bánh
• Là một vòng tròn được chia thành nhiều cung tương ứng
với các giá trị của biến số
•
Mô tả sự phân bố của biến số rời rạc
•
Mô tả cho một biến số của một quần thể duy nhất
Biểu đồ hình bánh
•
Mô tả cho một biến số của một quần thể duy nhất
•
Mô tả cho các biến số của nhiều quần thể, đem lại nhiều
thông tin hơn