BÀI 8
XỬ LÝ VÀ PHÂN TÍCH SỐ LIỆU
Khoa Dược - Bộ môn NCKH
Mục tiêu
1.
Trình bày được tầm quan trọng của việc kiểm sốt chất lượng và xử lý số liệu.
2.
Mơ tả được các cách phân tích và phiên giải số liệu dựa trên các mục tiêu và
các biến của nghiên cứu.
3.
Trình bày được các test thống kê thích hợp khi so sánh các biến định tính, các biến
định lượng.
4.
Trình bày được các test thống kê thích hợp mơ tả mối liên quan giữa các biến số.
2
Giới thiệu
Số liệu điều tra thực sự trở nên có ích khi được tập hợp lại và phân tích
hoàn chỉnh.
Việc xử lý và phân tích số liệu nhất thiết phải được tiến hành chuẩn bị
một cách cẩn thận.
3
Giới thiệu
Khi phân tích số liệu:
Loại thiết kết nghiên cứu.
Các phương pháp thu thập số liệu.
Số liệu định lượng: mô tả các số liệu của từng biến trong toàn bộ các đơn vị
nghiên cứu.
Số liệu định tính: thường là các mô tả, tổng hợp, và phiên giải các số liệu thu thập.
4
Kiểm tra chất lượng số liệu
Bộ số liệu cần được kiểm tra tính đầy đủ và thống nhất của số liệu.
Một số biến khơng có thơng tin.
Sự khơng thống nhất về số liệu trong bộ câu hỏi.
•
•
Do người phỏng vấn
Do người trả lời
Nếu không thể nào hiệu chỉnh, cần phải cân nhắc đến việc loại bỏ một phần số liệu.
5
Kiểm tra chất lượng số liệu
Quyết định loại bỏ một phần số liệu:
Ảnh hưởng đến chất lượng của nghiên cứu.
Chứng tỏ tính trung thực về mặt khoa học của người nghiên cứu.
Nên đưa vào bàn luận về điều này trong báo cáo cuối cùng.
6
Phân loại số liệu
Đối với các biến phân loại: định nghĩa ngay từ khi thiết kế bộ câu hỏi.
Câu hỏi có dạng trả lời khác như “loại khác, xin chỉ rõ.” phân loại sau khi đã
điều tra, cần được liệt kê vào một bảng các dạng trả lời khác nhau hoặc
“khác”, (≤ 5% ).
Đối với các biến dạng số: Không cần phân loại trước.
7
Mã hóa số liệu
Mang lại hiệu quả trong việc xử lý, nhập liệu và phân tích.
Có (hoặc dương tính)
mã là 1
Khơng (âm tính)
mã là 2
Khơng biết
mã là 8 hoặc (88)
Khơng trả lời
mã là 9 (hoặc 99)
8
Ví dụ: Bộ câu hỏi 30 người
1. Số thứ tự:………
2. Giới tính:
•
1/ Nam
2/ Nữ
3. Tuổi (ghi cụ thể):………
4. Cân nặng (với 1 số lẽ): ................kg
5. Chiều cao (với 2 số lẻ): ................kg
6. Tình trạng hơn nhân của ơng/ bà:
•
1/ Độc thân
•
2/ Có vợ/chồng
•
3/ Ly thân
•
4/ Ly dị
•
5/ Góa
9
“Bảng mã hóa” dùng cho xử lý dữ kiện bằng máy vi tính.
TT
Biến số
Loại
01
Số thứ tự
Số
02
Giới tính
Số
03
Tuổi
Số
04
Cân nặng
05
Chiều cao
Tên giá trị
Giá trị mất
01 - 30
1- nam
Tên biến
Thu tu
9
Gioi
99
Tuoi
Số
999
Can nang
Số
999
Chieu cao
2 - nữ
20 - 59
1-Độc thân
06
Tình trạng hơn nhân
Số
2-Có vợ/chồng 3-Ly thân
Hon nhan
4-Ly dị 5Góa
10
Bảng số liệu trống (bảng câm)
Có
thể được thiết kế cùng với đề cương.
Định hướng cho việc phân tích số liệu.
11
Nam
Nữ
Địa dư
Tỷ lệ người ít vận động Tần
thể số
lực(%)
phân chia theo địa dưTần
và giới
số (%)
Thành thị
Nông thôn
Tổng số
12
Phân tích số liệu bằng máy tính
Chọn chương trình máy tính: EXCEL, SPSS, STATA, EPI_INFO…
Nhập số liệu: Lập một khn dạng (form) cho việc nhập số liệu trên máy tính.
Kiểm tra chất lượng số liệu sau khi nhập.
Phân tích và đưa ra các kết quả.
13
Định nghĩa phân tích số liệu
Là sự tính tốn những chỉ số được qui định trong những mục tiêu.
Kết quả phân tích dữ kiện trả lời mục tiêu nghiên cứu.
14
Định nghĩa phân tích số liệu
Có 2 loại phân tích số liệu:
Thống kê mô tả: Mô tả bản chất và đặc tính của hiện tượng nghiên cứu.
Thống kê suy luận: Tính tốn và so sánh các chỉ số, kiểm định ý nghĩa, xác định
mức độ liên quan, tương quan, xây dựng mơ hình hồi qui.
15
Nguyên tắc phân tích số liệu
Nguyên tắc:
Mục tiêu và thiết kế nghiên cứu.
Thang đo lường/loại dữ kiện.
Sự tham khảo ý kiến của chuyên gia thống kê.
Những phương pháp phân tích dữ kiện phải được xác định trong giai đoạn thiết kế
đề cương.
16
Các bước phân tích số liệu
Xem lại mục tiêu tổng quát để có khái niệm chung về những kết
quả cuối cùng của nghiên cứu.
Xem những mục tiêu cụ thể: chú ý biến số được khảo sát và tuỳ theo
bản chất của biến số.
Khi cần khảo sát mối liên quan: cần xác định biến số nào là độc
lập, và biến số nào là phụ thuộc, biến số gây nhiễu.
17
Phân tích biến định lượng
Thống kê mơ tả: Các chỉ số cần tính là số đo lường khuynh hướng tập trung và phân
tán.
Trung bình và độ lệch chuẩn (có phân phối chuẩn).
Trung vị và khoảng (khơng có phân phối chẩn)
Thống kê suy luận:
Test thống kê cho kiểm định trung bình
Test phương sai
Tương quan
Hồi qui tuyến tính
18
Phân tích biến định tính
Mơ tả:
Phân bố tần số
Tỷ lệ
Để so sánh:
Test Chi bình phương,
McNemar ...
Nếu biến số là nhị phân: số đo kết hợp:
RR
OR
19
CHỌN TEST THỐNG KÊ TRONG PHÂN TÍCH SỐ LIỆU
20
Cơ sở của các test thống kê
Nghiên cứu phải dùng phép so sánh sự khác biệt của các nhóm (giả thuyết: H0 ,H1).
Test thống kê xem xét là sự khác biệt có phải do:
Yếu tố nghiên cứu
Yếu tố may rủi
Sai số
Cơ sở: Nếu lập lại 100 lần NC (cùng điều kiện) sẽ cho khác biệt độ lớn như vậy bao
nhiêu lần?
Nếu tính tốn: khác biệt chỉ 1 lần; 5 lần – Không là yếu tố may rủi.
21
Giả thuyết H0
Giả thuyết H0: Khơng có sự khác biệt.
Giả thuyết H1: Có sự khác biệt (2 chiều); lớn hơn hoặc nhỏ hơn (một chiều).
Ví dụ: Nghiên cứu Đồn hệ về hút thuốc lá và ung thư phổi:
H0: Tỷ
lệ ung thư phổi của nhóm có hút thuốc và khơng hút thuốc là như
nhau.
H1: Tỷ lệ ung thư phổi của nhóm khơng hút thuốc lá thấp hơn nhóm có hút thuốc
lá.
22
Ngưỡng ý nghĩa
Khi bác bỏ giả thuyết H0 đều mắc sai lầm nhất định.
Đề
xuất một “xác xuất sai lầm” chấp nhận được: mức ý nghĩa.
Tùy theo tính chất của nghiên cứu, mức ý nghĩa: 5%, 1%...
23
Nguyên tắc chọn test thống kê
Mục tiêu của nghiên cứu: Đo lường sự khác biệt hay đo lường mối liên quan giữa
các biến.
Số nhóm nghiên cứu: 1 nhóm, 2 nhóm, hoặc trên hai nhóm.
Bản chất số liệu, loại biến số: Biến định tính, biến định lượng.
Phân bố mẫu: Chuẩn hay không chuẩn.
Loại quan sát: Mẫu độc lập hay ghép cặp.
24
Phân tích sự khác biệt
Biến định tính:
Sự khác biệt so với 1 tỷ lệ giả thuyết
Sự khác biệt 2 tỷ lệ
Nhiều hơn hai tỷ lệ
Sự khác biệt tỷ lệ lặp lại
Biến Biến định lượng:
Sự khác biệt 1 trung bình
Sự khác biệt 2 trung bình
Sự khác biệt nhiều hơn 2 trung bình
Sự khác biệt trung bình lặp lại
25