lËp kÕ ho¹ch cho xö lý
sè liÖu
GS.Ts Ph¹m Duy Têng
Bé m«n Dinh dìng vµ VÖ sinh an
toµn thùc phÈm
Mục tiêu
Xác định được tầm quan trọng của việc phân loại,
kiểm soát chất lượng số liệu và quá trình xử lý số
liệu.
Mô tả được làm thế nào để phân tích diễn giải số
liệu với các biến và mục tiêu của nghiên cứu
Lập kế hoạch cho quá trình xử lý số liệu ( các bản
yêu cầu phân tích, bảng trống dự kiến.
Tại sao phải lập kế hoạch phân tích số
liệu
Hình
thành rõ ràng hơn những yêu cầu xắp
xếp nguồn số liệu
Xem xét đầy đủ hơn các kĩ thuật thu thập số
liệu
Phải lập kế hoạch xử lý trước khi tiến hành
thu thập số liệu để có thể điều chỉnh các biến
và kĩ thuật thu thập số liệu
Kế hoạch phân tích số liệu bao gồm
những nội dung nào?
Lựa
chọn xắp xếp phân loại số liệu ( sorting
data)
Hình thành bản kiểm chất lượng số liệu, kế
hoạch kiểm tra chất lượng
Quá trình làm sạch số liệu
Phân tích số liệu
II. Phân loại số liệu
Xây
dựng bảng phân loại số liệu
Những số liệu, biến số thuộc loại gì?
Có bao nhiêu nhóm nghiên cứu?
Có những loại liên quan nào?
Có thể có biện pháp nào thích hợp để kiểm
tra số liệu và phân tích nó
Biến số là :
Biến danh mục: Các số đo gọi theo tên không xếp thứ
tự được: màu mắt, da, tóc, nhóm máu..
Biến loại mục: các số đo có thể xếp theo thứ tự
được: giai đoạn bệnh..
Biến khoảng chia: Các số đo có thể chia khoảng mà
không gốc Zero thật sự ( Thân nhiệt)
Biến tỷ xuất: các số đo có gốc Zero thật sự ( chiều
cao, cân nặng…)
Biến
định tính
Biến định lượng
Biến độc lâp- phụ thuộc
Chuyển hóa biến
III. Hình thành bản kiểm chất lượng số
liệu
Phần lớn là kiểm tra trên thực địa về quá trình thu
thập thông tin đã đủ chưa và số liệu đã lấy chính xác
chưa.
Các câu hỏi trong bản phỏng vấn đã điền đủ chưa,
có bao nhiêu câu hỏi bị mất.
Có những lỗi kĩ thuật nào dẫn đến số liệu thô bị sai
Số liệu đó có thể lấy lại chính xác được không?
Có phải bỏ toàn bộ số liệu đó không?
Sai số cần loại bỏ
IV. Chuẩn bị số liệu phân tích
Những
tài liệu, vật liệu, các bảng yêu cầu
phân tích, bảng trống
Các chương trình phần mềm
Các bảng yêu cầu phân loại
Các bảng yếu cầu mã hóa
- Mã hóa các câu hỏi mở
- Mã hóa câu hỏi đóng
Xây
dựng chương trình nhập liệu trên
chương trình máy tính (Exel, Epi-Info, SPSS,
Stata..).
Tạo bộ Qes
Tạo chương trình kiểm tra tự động kiểm soát
số liệu.(check).
V. Phân tích số liệu
Từ
bảng yêu cầu xử lý số liệu, bảng trống
chúng ta có thể tiến hành xử lý số liệu
thường :
–
–
–
–
–
Tần số
Tỷ số
Tỷ lệ
Số trung bình
Độ lệch chuẩn
Phương pháp suy luận
Khoảng
tin cậy
Suy luận thống kê :
- Thử nghiệm giả thuyết
- Giải quyết vấn đề đặt giả thuyết
H1
Ho
Ngưỡng
ß
Không vứt bỏ Ho
α
Vứt bỏ Ho
Thực tế giả thuyết Ho
Đúng
Sai
Kết luận
Không vứt bỏ GT
Ho
1-ß
Sai lầm loại 2
Vứt bỏ GT Ho
1-α
Nguy cơ sai lầm
loại 1
Giả
thuyết Ho được chấp nhận khi nó đúng
không có sai lầm
Giả thuyết Ho được vứt bỏ khi nó sai, không
có sai lầm
Giả thuyết Ho bi vứt bỏ khi nó thực có : sai
lầm loại 1
Giả thuyết Ho được chấp nhận trong khi có
sai: sai lầm loại 2
Phân
tích và nhận định kết quả; Đánh giá
mức độ phân tán sử dụng σ
Đánh giá sai số trung bình
So sánh độ phân tán của 2 số liệu
So sánh 2 số trung bình
So sánh tỷ lệ
Tương quan
Một số Test thông thường
Tên Test
Kí
hiệu
Loại biến
Mục đích
T-test 2 mẫu độc
lập
t
Liên tục
So sánh hai số TB của 2
biến độc lập
T-test 2 mẫu
ghép cặp
t
Liên tục
So sánh hai số TB của 2
nhóm ghép cặ
Anova
F
Liên tục
3 biến
Mann Whitney U
test
U
Phi tham số
So sánh điểm phân loại
của 2 nhóm
Wilcoxon signed
rank test
Z
Phi tham số
So sánh điểm của 2 nhóm
ghép cặp
độc lập
Tên
Test
Kí hiệu
Kruskal Wallis
test
Chi square
2
א
Loại biến
Mục đích
Phi tham số
So sánh điểm phân
loại > 2 nhóm
Phi tham số So sánh 2 tỷ lệ
Pearson’ Product- r
moment
Correlation
Tham số
Để kiểm tra mối
tương quan hai biến
liên tục
Spearman’s
correlation
coegicentt
Phi tham số
Để kiêm tra 2 biến
phân loại
r
Phân tích số liệu
Đưa ra ý nghĩa của số liệu đã thu thập
Phân tích / phiên giải dựa vào mục tiêu nghiên cứu
Nhằm giải thích mô hình nguyên nhân
Mô tả thực trạng
Đưa ra khuynh hướng
So sánh với chuẩn
Phân loại theo theo ngưỡng
Sử dụng các thuật toán thích hợp
Những câu hỏi khi phân tích số liệu
Có
vấn đề dinh dưỡng nào đang tồn tại?
Khuynh hướng của vấn đề dinh dưỡng?
Đối tượng nào bi ảnh hưởng?
Tầng lớp nào chịu tác động nhiều nhất
Phân bố vấn đề dinh dưỡng theo địa dư
20