THỐNG KÊ MÔ TẢ
(phần 1)
Ths. Bùi Thị Kiều Anh
Ths. Lê Huỳnh Thị Cẩm Hồng
2
Mục tiêu:
Phân
•
•
•
biệt các loại biến số:
Biến số định tính – biến số định lượng
Biến số độc lập – biến số phụ thuộc
Biến số gây nhiễu
Hiểu
Lựa
liệu
được ý nghĩa của thống kê mô tả
chọn các phương pháp mô tả phù hợp với loại dữ
3
Số liệu
là kết quả việc thu thập có hệ thống về các đặc
tính hay đại lượng của đối tượng nghiên cứu.
Vd: Bảng số liệu
4
Thời gian sống ở Ngôn ngữ sử dụng ở
Úc (năm)
nhà
ID
Tuổi
Giới Quốc tịch
BHBR001
BHBR002
BHBR003
31
24
32
Nữ
Nữ
Nam
BHBR004
BHBR005
BHBR006
BHBR007
BHBR008
BHBR009
BHBR010
67
19
17
69
70
31
38
Nữ Myanmar
2 months
Nữ Thailand
3 months
Nữ Thailand
3 years
Nam
Burma
3 years
Nữ
Burma
35 years
Nam Myanmar 4 years 2 months
Nam
Burma
3 years
Burma
Thailand
Thailand
2 months
2 years
3 months
Karenni and Burmese
Kayah
Karenni and Burmese
Karenni and Burmese
Karen
Karen
Sakaw/Karen
Burmese
Sakaw/Karen
Karen/Myanmar
5
Biến số
(thường gọi tắt là biến) là những đại lượng hoặc đặc
tính có thể thay đổi từ người này sang người khác, từ
thời điểm này sang thời điểm khác.
6
Biến số (tt)
Cần phân biệt sự khác biệt giữa biến số và giá
trị của biến số (còn gọi là yếu tố)
Giới tính là biến số nhưng Nữ không phải là biến
số mà là một giá trị của biến số
Thời gian chờ đợi để được sử dụng dịch vụ y tế
là biến số nhưng thời gian chờ đợi lâu là giá trị
của biến số
7
Tiêu chí phân loại biến số
1, Biến số định tính - Biến số định lượng
2, Biến số độc lập - Biến số phụ thuộc
3, Biến số gây nhiễu
8
Biến số định tính
Biến số định lượng
9
Biến định tính
Là biến số mà những giá trị của nó không thể diễn
tả được bằng số, mà chỉ bằng cách phân nhóm
Vd: Giới tính, dân tộc, nơi sinh, nghề nghiệp, thu
nhập, học vấn…
Gồm 3 loại: nhị giá, danh định, thứ tự.
10
Biến định tính
Trên 2 giá trị:
Có 2 giá trị:
Nhị giá:
VD:
Danh định:
Các giá trị không theo thứ tự và được sắp xếp
•
sống/chết;
theo tên
•
đúng/sai;
VD: nơi sinh, giới, dân tộc, hôn nhân,
•
đậu/rớt;
•
có/không;
Các giá trị được sắp xếp theo thứ tự có ý nghĩa;
•
phơi nhiễm/không
không xem xét sự khác biệt giữa các giá trị.
phơi nhiễm;
VD: Trầm cảm (nhẹ, trung bình, nặng); BMI (suy
•
Thứ tự:
can thiệp/không
dinh dưỡng, bình thường, béo phì); Thu
can thiệp
nhập (thấp, trung bình, cao)
11
Biến định lượng
Là biến số có những giá trị diễn tả được bằng số
Gồm 2 loại: biến liên tục hoặc biến không liên tục
12
Biến định lượng
Biến liên tục
Giữa hai giá trị của 1 biến liện tục,
Biến không liên tục
có mọi giá trị đi liền nhau
Khoảng cách giữa các nhóm bằng
nhau;
VD:
Chỉ có giá trị là những số nguyên
VD:
•
Chiều cao (1.1m, 1.2m, …)
•
Số con trong gia đình (1,2,3…)
•
Thu nhập (3 triệu, 3,1 triệu, …)
•
Số lần nhiễm trùng (1,2,3…)
•
Huyết áp (90mmHg, 91mmHg)
•
Số lần sạm da (1,2,3…)
Chuyển biến số
13
20, 21,22,23,………………69
(năm)
20-29, 30-39, 40-49, 5059,60-69
Lứa tuổi 20; 30; 40;
50; 60
Trẻ; Già
14
Biến số độc lập
Biến số phụ thuộc
Biến số độc lập:
15
Là biến số mà một giá trị của nó sẽ quyết định một giá trị
của biến số khác
Biến số phụ thuộc:
Là biến số mà giá trị của nó chịu ảnh hưởng của biến số
độc lập
VD: - Hút thuốc lá làm tăng nguy cơ ung thư phổi
- Tập thể dục đều đặn làm giảm nguy cơ béo phì.
Ví dụ 1
16
Một nghiên cứu đoàn hệ theo dõi trọng lượng sơ sinh của
2 nhóm bà mẹ ở một phường của TP HCM:
Con những bà mẹ không hút thuốc lá có tỉ lệ sinh con
nhẹ cân là 5%
Con những bà mẹ hút thuốc lá có tỉ lệ sinh con nhẹ cân
là 10%
Sự khác biệt có ý nghĩa thống kê (p<0,05)
Các bà mẹ không hút thuốc lá có tỉ lệ sinh con nhẹ cân
thấp hơn các bà mẹ hút thuốc lá
Hút thuốc lá là một trong nhiều yếu tố nguy cơ của sinh
con nhẹ cân
Hút thuốc lá
(có/không)
Hút thuốc lá là biến
số độc lập
Tình trạng sinh con
nhẹ cân
(con nhẹ cân / con
không bệnh)
Tình trạng sinh con nhẹ cân
là biến số phụ thuộc
18
Một nghiên cứu đoàn hệ tiến hành trong 20 năm tại Úc
đã đưa ra kết luận rằng việc tập thể dục đều đặn hàng
ngày và chế độ ăn nhiều rau củ quả giúp làm giảm nguy
cơ bệnh về tim mạch ở người trưởng thành.
Chế độ ăn
nhiều ra củ
quả
Việc tập thể
dục hàng ngày
Biến số độc lập
Bệnh về tim mạch
(có bệnh/không bệnh)
Biến số phụ thuộc
19
Biến số gây nhiễu
20
Biến số gây nhiễu
Là biến số gây nhiễu khi có 3 đặc tính sau:
– Có liên quan đến biến số phụ
thuộc (là yếu tố nguy cơ của vấn đề
nghiên cứu)
– Có liên quan đến biến số độc lập (phân
bố không đều giữa các giá trị của biến độc
lập)
– Không nằm trong cơ chế tác động của
biến độc lập lên biến phụ thuộc
21
Khám thai
(Đủ / Không đủ)
Cân nặng con
(Nhẹ cân / Bình thường)
(Biến độc lập)
(Biến phụ thuộc)
Thu nhập gia đình
(cao / trung bình /
thấp)
(Biến số nhiễu)
22
Hoạt động thể lực
(Đủ / Không đủ)
Nhồi máu cơ tim
(Có / Không)
(Biến độc lập)
(Biến phụ thuộc)
Tuổi
(thanh niên / trung
niên / cao tuổi)
(Biến số nhiễu)
23
Chế độ ăn uống
(Thiếu chất / Vừa
phải / Dư chất)
Cân nặng trẻ
(Nhẹ cân / Bình thường /
Béo phì)
(Biến độc lập)
(Biến phụ thuộc)
Thu nhập gia đình
(cao / trung bình /
thấp)
(Biến số nhiễu)
24
Kiểm soát biến số nhiễu
Phương pháp chia nhóm ngẫu nhiên:
Thực hiện trong nghiên cứu thực nghiệm: toàn
diện nhất.
Phương pháp mô hình hóa:
Dùng hồi quy đa biến để tách riêng tác động của
từng biến số
Phương pháp hạn chế
Khi chọn mẫu: chọn mẫu bắt cặp; phân tầng.
Khi phân tích: phân tích phân tầng: riêng cho
từng nhóm (VD: nhóm người trẻ, nhóm người lớn
tuổi: trong nghiên cứu “nhồi máu cơ tim” và “vận
động thể lực”).
25
THỐNG KÊ MÔ TẢ