Tải bản đầy đủ (.pdf) (45 trang)

Bài giảng Xác suất thống kê y học: Thống kê mô tả - ThS. Bùi Thị Kiều Anh, ThS. Lê Huỳnh Thị Cẩm Hồng (Phần 1)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 45 trang )

THỐNG KÊ MÔ TẢ
(phần 1)

Ths. Bùi Thị Kiều Anh
Ths. Lê Huỳnh Thị Cẩm Hồng


2

Mục tiêu:
 Phân





biệt các loại biến số:

Biến số định tính – biến số định lượng
Biến số độc lập – biến số phụ thuộc
Biến số gây nhiễu

 Hiểu
 Lựa

liệu

được ý nghĩa của thống kê mô tả
chọn các phương pháp mô tả phù hợp với loại dữ



3

Số liệu
là kết quả việc thu thập có hệ thống về các đặc
tính hay đại lượng của đối tượng nghiên cứu.


Vd: Bảng số liệu

4

Thời gian sống ở Ngôn ngữ sử dụng ở
Úc (năm)
nhà

ID

Tuổi

Giới Quốc tịch

BHBR001
BHBR002
BHBR003

31
24
32

Nữ

Nữ
Nam

BHBR004
BHBR005
BHBR006
BHBR007
BHBR008
BHBR009
BHBR010

67
19
17
69
70
31
38

Nữ Myanmar
2 months
Nữ Thailand
3 months
Nữ Thailand
3 years
Nam
Burma
3 years
Nữ
Burma

35 years
Nam Myanmar 4 years 2 months
Nam
Burma
3 years

Burma
Thailand
Thailand

2 months
2 years
3 months

Karenni and Burmese
Kayah
Karenni and Burmese
Karenni and Burmese
Karen
Karen
Sakaw/Karen
Burmese
Sakaw/Karen
Karen/Myanmar


5

Biến số
(thường gọi tắt là biến) là những đại lượng hoặc đặc

tính có thể thay đổi từ người này sang người khác, từ
thời điểm này sang thời điểm khác.


6

Biến số (tt)
Cần phân biệt sự khác biệt giữa biến số và giá
trị của biến số (còn gọi là yếu tố)
Giới tính là biến số nhưng Nữ không phải là biến
số mà là một giá trị của biến số
Thời gian chờ đợi để được sử dụng dịch vụ y tế
là biến số nhưng thời gian chờ đợi lâu là giá trị
của biến số


7

Tiêu chí phân loại biến số
1, Biến số định tính - Biến số định lượng
2, Biến số độc lập - Biến số phụ thuộc
3, Biến số gây nhiễu


8

Biến số định tính
Biến số định lượng



9

Biến định tính
Là biến số mà những giá trị của nó không thể diễn
tả được bằng số, mà chỉ bằng cách phân nhóm

Vd: Giới tính, dân tộc, nơi sinh, nghề nghiệp, thu
nhập, học vấn…

Gồm 3 loại: nhị giá, danh định, thứ tự.


10

Biến định tính
Trên 2 giá trị:

Có 2 giá trị:


Nhị giá:
VD:



Danh định:

Các giá trị không theo thứ tự và được sắp xếp




sống/chết;

theo tên



đúng/sai;

VD: nơi sinh, giới, dân tộc, hôn nhân,



đậu/rớt;



có/không;

Các giá trị được sắp xếp theo thứ tự có ý nghĩa;



phơi nhiễm/không

không xem xét sự khác biệt giữa các giá trị.

phơi nhiễm;

VD: Trầm cảm (nhẹ, trung bình, nặng); BMI (suy






Thứ tự:

can thiệp/không

dinh dưỡng, bình thường, béo phì); Thu

can thiệp

nhập (thấp, trung bình, cao)


11

Biến định lượng
Là biến số có những giá trị diễn tả được bằng số

Gồm 2 loại: biến liên tục hoặc biến không liên tục


12

Biến định lượng
Biến liên tục
Giữa hai giá trị của 1 biến liện tục,


Biến không liên tục


có mọi giá trị đi liền nhau

Khoảng cách giữa các nhóm bằng
nhau;



VD:

Chỉ có giá trị là những số nguyên

VD:



Chiều cao (1.1m, 1.2m, …)



Số con trong gia đình (1,2,3…)



Thu nhập (3 triệu, 3,1 triệu, …)




Số lần nhiễm trùng (1,2,3…)



Huyết áp (90mmHg, 91mmHg)



Số lần sạm da (1,2,3…)


Chuyển biến số

13

20, 21,22,23,………………69
(năm)

20-29, 30-39, 40-49, 5059,60-69

Lứa tuổi 20; 30; 40;
50; 60

Trẻ; Già


14

Biến số độc lập
Biến số phụ thuộc



Biến số độc lập:

15

Là biến số mà một giá trị của nó sẽ quyết định một giá trị
của biến số khác

Biến số phụ thuộc:
Là biến số mà giá trị của nó chịu ảnh hưởng của biến số
độc lập

VD: - Hút thuốc lá làm tăng nguy cơ ung thư phổi
- Tập thể dục đều đặn làm giảm nguy cơ béo phì.


Ví dụ 1

16



Một nghiên cứu đoàn hệ theo dõi trọng lượng sơ sinh của
2 nhóm bà mẹ ở một phường của TP HCM:
 Con những bà mẹ không hút thuốc lá có tỉ lệ sinh con
nhẹ cân là 5%
 Con những bà mẹ hút thuốc lá có tỉ lệ sinh con nhẹ cân
là 10%
 Sự khác biệt có ý nghĩa thống kê (p<0,05)




Các bà mẹ không hút thuốc lá có tỉ lệ sinh con nhẹ cân
thấp hơn các bà mẹ hút thuốc lá



Hút thuốc lá là một trong nhiều yếu tố nguy cơ của sinh
con nhẹ cân


Hút thuốc lá
(có/không)

Hút thuốc lá là biến
số độc lập

Tình trạng sinh con
nhẹ cân
(con nhẹ cân / con
không bệnh)

Tình trạng sinh con nhẹ cân
là biến số phụ thuộc


18

Một nghiên cứu đoàn hệ tiến hành trong 20 năm tại Úc

đã đưa ra kết luận rằng việc tập thể dục đều đặn hàng
ngày và chế độ ăn nhiều rau củ quả giúp làm giảm nguy
cơ bệnh về tim mạch ở người trưởng thành.
Chế độ ăn
nhiều ra củ
quả

Việc tập thể
dục hàng ngày
Biến số độc lập

Bệnh về tim mạch
(có bệnh/không bệnh)

Biến số phụ thuộc


19

Biến số gây nhiễu


20

Biến số gây nhiễu
Là biến số gây nhiễu khi có 3 đặc tính sau:
– Có liên quan đến biến số phụ

thuộc (là yếu tố nguy cơ của vấn đề
nghiên cứu)

– Có liên quan đến biến số độc lập (phân
bố không đều giữa các giá trị của biến độc
lập)
– Không nằm trong cơ chế tác động của
biến độc lập lên biến phụ thuộc


21

Khám thai
(Đủ / Không đủ)

Cân nặng con
(Nhẹ cân / Bình thường)

(Biến độc lập)

(Biến phụ thuộc)

Thu nhập gia đình
(cao / trung bình /
thấp)
(Biến số nhiễu)


22

Hoạt động thể lực
(Đủ / Không đủ)


Nhồi máu cơ tim
(Có / Không)

(Biến độc lập)

(Biến phụ thuộc)

Tuổi
(thanh niên / trung
niên / cao tuổi)
(Biến số nhiễu)


23

Chế độ ăn uống
(Thiếu chất / Vừa
phải / Dư chất)

Cân nặng trẻ
(Nhẹ cân / Bình thường /
Béo phì)

(Biến độc lập)

(Biến phụ thuộc)

Thu nhập gia đình
(cao / trung bình /
thấp)

(Biến số nhiễu)


24

Kiểm soát biến số nhiễu
Phương pháp chia nhóm ngẫu nhiên:
Thực hiện trong nghiên cứu thực nghiệm: toàn
diện nhất.
Phương pháp mô hình hóa:
Dùng hồi quy đa biến để tách riêng tác động của
từng biến số
Phương pháp hạn chế
Khi chọn mẫu: chọn mẫu bắt cặp; phân tầng.
Khi phân tích: phân tích phân tầng: riêng cho
từng nhóm (VD: nhóm người trẻ, nhóm người lớn
tuổi: trong nghiên cứu “nhồi máu cơ tim” và “vận
động thể lực”).


25

THỐNG KÊ MÔ TẢ


×