Tải bản đầy đủ (.pdf) (12 trang)

PHÂN TÍCH ĐỊNH LƯỢNG SỐ LIỆU, QUẢN LÝ SỐ LIỆU-ĐẠI HỌC Y TẾ CÔNG CỘNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (310.96 KB, 12 trang )

1
BIOS II BIOS II Chapter 2Chapter 2
11
PPHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNGHÂN TÍCH SỐ LIỆU ĐỊNH LƯỢNG
Quản lý số liệuQuản lý số liệu
Spsswin.exe
BIOS II BIOS II Chapter 2Chapter 2
22
Giới thiệuGiới thiệu
Chuẩn bị số liệuChuẩn bị số liệu
––Mã hoá số liệuMã hoá số liệu
––Nhập liệuNhập liệu
––Làm sạch số liệuLàm sạch số liệu
BIOS II BIOS II Chapter 2Chapter 2
33
Mục tiêuMục tiêu
Hiểu ñược quá trình chuẩn bị bộ số liệu nghiên Hiểu ñược quá trình chuẩn bị bộ số liệu nghiên
cứu ñể nhập liệu. cứu ñể nhập liệu.
Hiểu ñược lý do cơ bản, các nguyên tắc liên Hiểu ñược lý do cơ bản, các nguyên tắc liên
quan, của việc mã số liệu và ñịnh nghĩa của mã quan, của việc mã số liệu và ñịnh nghĩa của mã
một bộ số liệu. một bộ số liệu.
Xác ñịnh một kế hoạch làm sạch số liệu cho bộ Xác ñịnh một kế hoạch làm sạch số liệu cho bộ
số liệu. số liệu.
Nhận biết ñược các chiến lược khác nhau cho Nhận biết ñược các chiến lược khác nhau cho
việc ñảm bảo tính toàn vẹn của bộ số liệu. việc ñảm bảo tính toàn vẹn của bộ số liệu.
BIOS II BIOS II Chapter 2Chapter 2
44
Mã hoá số liệuMã hoá số liệu
Mã hoá số liệu là quá trình chuyển ñổi các Mã hoá số liệu là quá trình chuyển ñổi các
số liệu thu thập ñược (ex. từ các bộ câu hỏi) số liệu thu thập ñược (ex. từ các bộ câu hỏi)
thành các dạng dữ kiện phù hợp với các thành các dạng dữ kiện phù hợp với các


phần mềm phân tích thống kê (ex. SPSS)phần mềm phân tích thống kê (ex. SPSS)
2
BIOS II BIOS II Chapter 2Chapter 2
55
Mã hoá số liệuMã hoá số liệu
Các số liệu dạng ký tự ñược ñổi thành các Các số liệu dạng ký tự ñược ñổi thành các
dữ liệu kiểu sốdữ liệu kiểu số
–– Ví dụ: Nam Ví dụ: Nam  1 Nữ 1 Nữ  22
Bảng mã số liệu cần ñược chuẩn bị trước Bảng mã số liệu cần ñược chuẩn bị trước
cho các biến khác nhaucho các biến khác nhau
BIOS II BIOS II Chapter 2Chapter 2
66
SSố liệu ký tựố liệu ký tự
h_id region age gender education qol_bef
10111001 NE 36 M 3 34
10121003 NW 28 F 8 71
72012051 RR 47 M 1 63
… … … … …
BIOS II BIOS II Chapter 2Chapter 2
77
Số liệu dạng sốSố liệu dạng số
subject
age
Gender
male = 1
female = 2
driving
distance
(wkly-
kms)

no.
accidents
1 42
1
80-90 >2
2 31
1
50-60 1
3 27
1
10-20 0
4 44
2
60-70 0
5 25
2
20-30 >2
BIOS II BIOS II Chapter 2Chapter 2
88
Ví dụVí dụ
Nghiên cứu chấn thương trên toàn quốcNghiên cứu chấn thương trên toàn quốc
Mẫu nghiên cứu ñại diện cho toàn quốcMẫu nghiên cứu ñại diện cho toàn quốc
Nghiên cứu nhiều loại chấn thươngNghiên cứu nhiều loại chấn thương
Chọn các chấn thương liên quan ñến giao Chọn các chấn thương liên quan ñến giao
thông ñể phân tíchthông ñể phân tích
3
BIOS II BIOS II Chapter 2Chapter 2
99
Điều tra chấn thương giao thông quốc gia năm 2003
Mã hộ: _ _ _ _ _ _ _ _

Vùng : __________________________________
Ngày phỏng vấn: _________________________
Thông tin về người trả lời
1. Anh/chị bao nhiêu tuổi (tính tròn năm)?
____________________________
2. Anh/chị là nam hay nữ (khoanh vào lựa chọn phù hợp)?
Nam Nữ
3. Anh/chị sống ở ñâu? (Khoanh vào lựa chọn phù hợp)
Thành phố Nông thôn
4. Anh/chị ñã học ñến lớp mấy (Khoanh vào lựa chọn phù hợp)?
Không ñi học Tiểu học Dưới THCS Trên THCS
Học nghề Đại học Trên ñại học Trẻ nhỏ
5. Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức
Thất nghiệp Trẻ nhỏ Other
BIOS II BIOS II Chapter 2Chapter 2
1010
Bảng mã số liệu
Cột Mô tả Giá trị mã và ý nghĩa
h_id Mã hộ Chạy từ 10111001- 82436071
region Địa ñiểm 1 = Tây Bắc
2 = Đông Bắc
3 = Lưu vực sông Hồng
4 = Bắc Trung bộ
5 = Ven biển miền Trung
6 = Cao Nguyên trung bộ
7 = Đông Nam
8 = Lưu vực sông Mê Kông
ageround Tuổi (năm) 0 – 65

sex Giới tính 1 = Nam
2 = Nữ
u_r Nơi cư trú 0 = Thành phố
1 = Nông thôn
educatio Cấp học cao nhất 1 = Mù chữ
2 = Tiểu học
3 = Cấp II
4 = Cấp III
5 = Học nghề
BIOS II BIOS II Chapter 2Chapter 2
1111
idnumber

Oc …
001 12 …
002 3 …
… … …

5. Anh/chị làm nghề gì (Khoanh vào lựa chọn phù hợp)?
Làm ruộng CBCNVC Buôn bán nhỏ Làm chủ
Học sinh Nghề thủ công Nghỉ hưu Mất sức
Thất nghiệp Trẻ nhỏ Other
Id_num

Oc1

Oc2

001 1 6
002 3 -1

… … …

Các cách mã hoá khác nhau
BIOS II BIOS II Chapter 2Chapter 2
1212
Nhập số liệuNhập số liệu
Nhập số liệu sử dụng các phần mềm phân Nhập số liệu sử dụng các phần mềm phân
tích thống kê ví dụ: SPSS 10.0, EPIINFO tích thống kê ví dụ: SPSS 10.0, EPIINFO
Câu trả lời của ñối tượng ñược nhập vào Câu trả lời của ñối tượng ñược nhập vào
từng ô của tệp số liệutừng ô của tệp số liệu
1 ô = 1 phương án trả lời1 ô = 1 phương án trả lời
4
BIOS II BIOS II Chapter 2Chapter 2
1313
Phần mềm thống kêPhần mềm thống kê
Thông thườngThông thường
–– Là các dạng bảng tínhLà các dạng bảng tính
–– Một dòng là một ñơn vị quan sát/ cá thểMột dòng là một ñơn vị quan sát/ cá thể
–– Một cột là một câu hỏiMột cột là một câu hỏi
–– Quy ñịnh chặt chẽ về ñộ dài và kiểu của tên cộtQuy ñịnh chặt chẽ về ñộ dài và kiểu của tên cột
BIOS II BIOS II Chapter 2Chapter 2
1414
BIOS II BIOS II Chapter 2Chapter 2
1515
Tên cộtTên cột
Không dài quá 8 ký tựKhông dài quá 8 ký tự
Không có dấu cáchKhông có dấu cách
Không bắt ñầu bằng chữ sốKhông bắt ñầu bằng chữ số
BIOS II BIOS II Chapter 2Chapter 2
1616

5
BIOS II BIOS II Chapter 2Chapter 2
1717
Mã xác ñịnh: ____001__
Địa chỉ hòm thư của bạn là bao nhiêu? ___4350___
Bạn bao nhiêu tuổi? __36__years
Bạn là (khoanh tròn)
Nam Nữ
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?
Có Không
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả lời và kết thúc
Câu 1:
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
Mã xác ñịnh: ____001__
Địa chỉ hòm thư của bạn là bao nhiêu? ___4350___
Bạn bao nhiêu tuổi? __36__years
Bạn là (khoanh tròn)
Nam Nữ
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?
Có Không
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả
lời và kết thúc
Câu 1:
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
BIOS II BIOS II Chapter 2Chapter 2
1818
idnumber
postcode

age
gender
refused
quest1
001 4350 36 1 1 3
002 4127 28 2 0 -1
003 4005 47 1 1 2
… … … … … …
•Tt c các s liu ñu là dng s
• Tt c các mã ñc ghi trong bng mã
BIOS II BIOS II Chapter 2Chapter 2
1919
Bộ số liệuBộ số liệu
Có nhiều khả năng sinh lỗi doCó nhiều khả năng sinh lỗi do
––Mã hoá (nhà nghiên cứu)Mã hoá (nhà nghiên cứu)
––Nhập số liệu (nhà nghiên cứu)Nhập số liệu (nhà nghiên cứu)
––Tính thống nhất (người trả lời)Tính thống nhất (người trả lời)
BIOS II BIOS II Chapter 2Chapter 2
2020
Giới thiệuGiới thiệu
Nhập liệuNhập liệu
Gán nhãnGán nhãn
Bài tập thực hànhBài tập thực hành
Spsswin.exe
6
BIOS II BIOS II Chapter 2Chapter 2
2121
SPSS 10.0 for Windows.lnk
Biểu tượng SPSSBiểu tượng SPSS
BIOS II BIOS II Chapter 2Chapter 2

2222
Cửa sổ nhập liệu trên SPSS
BIOS II BIOS II Chapter 2Chapter 2
2323
Xử lý số liệuXử lý số liệu
Kiểm traKiểm tra
–– Sai số do mã hoáSai số do mã hoá
–– Giá trị bất thườngGiá trị bất thường
Kiểm tra nhập số liệuKiểm tra nhập số liệu
Kiểm tra tính ñồng nhấtKiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2Chapter 2
2424
Gend
er

Frequency

Percent

Valid
percent

Cum
percent
Valid

1 2

50.0


50.0

50.0
2

1

25.0

25.0

75.0
5

1

25.0

25.0

100.0
Total

4

100.0

100.0




Sai số mã hoá thể hiện trong bảng phân phối tần số
7
BIOS II BIOS II Chapter 2Chapter 2
2525
idnumber postcode age gender refused bp_sys
001 4350 36 1 1 120
002 4127 28 2 0 -1
003 4005 47 1 1 140
004 4106 52 5 1 200
Bảng mã
Column Description Valid codes & meanings
gender Gender 1 = male
2 = female

BIOS II BIOS II Chapter 2Chapter 2
2626
Xử lý số liệuXử lý số liệu
Kiểm traKiểm tra
–– Sai số do mã hoáSai số do mã hoá
–– Giá trị bất thườngGiá trị bất thường
Kiểm tra nhập số liệuKiểm tra nhập số liệu
Kiểm tra tính ñồng nhấtKiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2Chapter 2
2727
BLOOD PRESSURE (SYSTOLIC)
Frequency Percent Valid
percent
Cum
percent

Valid 120
13
25.0
33.3
33.3
140
1
25.0
33.3
66.7
200
1
25.0
33.3
100.0
Total
3
75.0
100.0
Missing -1
1
25.0
Total
4
100.0
Xác ñịnh giá trị bất thường bằng bảng phân phối tần số
BIOS II BIOS II Chapter 2Chapter 2
2828
idnumber postcode age gender refused bp_sys
001 4350 36 1 1 120

002 4127 28 2 0 -1
003 4005 47 1 1 140
004 4106 52 5 1 200
•So sánh vi b câu hi gc
• Nu ñúng, giá tr này vn phi ñơc dùng
8
BIOS II BIOS II Chapter 2Chapter 2
2929
Xử lý số liệuXử lý số liệu
Kiểm traKiểm tra
–– Sai số do mã hoáSai số do mã hoá
–– Giá trị bất thườngGiá trị bất thường
Kiểm tra nhập số liệuKiểm tra nhập số liệu
Kiểm tra tính ñồng nhấtKiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2Chapter 2
3030
Kiểm tra việc nhập liệuKiểm tra việc nhập liệu
Phương pháp 1Phương pháp 1
–– Kiểm tra số liệu ñã nhập và bộ câu Kiểm tra số liệu ñã nhập và bộ câu
hỏi gốchỏi gốc
–– Chỉ có thể thực hiện ñược với bộ số Chỉ có thể thực hiện ñược với bộ số
liệu nhỏliệu nhỏ
BIOS II BIOS II Chapter 2Chapter 2
3131
Mã xác ñịnh: ____005__
Địa chỉ hòm thư của bạn là bao nhiêu? ___4139___
Bạn bao nhiêu tuổi? __54__years
Bạn là (khoanh tròn)
Nam Nữ
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?

Có Không
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả
lời và kết thúc
Câu 1:
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
BIOS II BIOS II Chapter 2Chapter 2
3232
D A T A S H E E T
i d n u m b e r
p o s t c o d e
a g e
g e n d e r
r e f u s e d
q u e s t 1
… … … … … …
0 0 5
4 1 3 9
5 4
2
1
3
0 0 6 4 2 1 7 4 9 1 1
2
CODING MANUAL
Cột Mô tả Mã và ý nghĩa
quest1 Ra quyết ñịnh -1 = mất số liệu
1 = Rất ñồng ý
2 = Đồng ý
3 = Bình thường

4 = Không ñồng ý
5 = Rất không ñồng ý


Câu 1: ID number: 006
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
9
BIOS II BIOS II Chapter 2Chapter 2
3333
Kiểm tra việc nhập liệuKiểm tra việc nhập liệu
Phương pháp 2Phương pháp 2
–– Nhập tất cả vào tệp số liệu thứ 1 Nhập tất cả vào tệp số liệu thứ 1
–– Nhập toàn bộ lại một lần nữa vào tệp 2 Nhập toàn bộ lại một lần nữa vào tệp 2
–– So sánh số liệu của tệp 1 và 2So sánh số liệu của tệp 1 và 2
–– Nếu phát hiện có sự khác biệt, so sánh với số liệu gốcNếu phát hiện có sự khác biệt, so sánh với số liệu gốc
–– Sửa chữa số liệu trong tệp 1Sửa chữa số liệu trong tệp 1
Phù hp vi b s liu nh/ vaPhù hp vi b s liu nh/ va
BIOS II BIOS II Chapter 2Chapter 2
3434
D A T A S H E E T 2
i d n u m b e r
p o s t c o d e
a g e
g e n d e r
r e f u s e d
q u e s t 1
… … … … … …
0 0 5
4 1 3 9

5 4
2
1
3
0 0 6
4 2 1 7
4 9
1
1
1
D A T A S H E E T 1
i d n u m b e r
p o s t c o d e
a g e
g e n d e r
r e f u s e d
q u e s t 1
… … … … … …
0 0 5
4 1 3 9
5 4
2
1
3
0 0 6
4 2 1 7
4 9
1
1
2

Câu 1: ID number: 006
Tôi luôn chủ ñộng trong quá trình ra quyết ñịnh
Rất ñồng ý Đồng ý Bình thường Không ñồng ý Rất không ñồng ý
BIOS II BIOS II Chapter 2Chapter 2
3535
Kiểm tra việc nhập liệuKiểm tra việc nhập liệu
Phơng pháp 3Phơng pháp 3
–– Nhập tất cả vào tệp số liệu thứ 1 Nhập tất cả vào tệp số liệu thứ 1
–– Nhập Nhập ngu nhiên 10ngu nhiên 10 20%20% số liệu một lần nữa vào tệp 2 số liệu một lần nữa vào tệp 2
–– So sánh số liệu của tệp 1 và 2So sánh số liệu của tệp 1 và 2
–– Nếu phát hiện có sự khác biệt, so sánh với số liệu gốcNếu phát hiện có sự khác biệt, so sánh với số liệu gốc
–– Sửa chữa số liệu trong tệp 1Sửa chữa số liệu trong tệp 1
Phù hp vi b s liu lnPhù hp vi b s liu ln
BIOS II BIOS II Chapter 2Chapter 2
3636
Kiểm tra việc nhập liệuKiểm tra việc nhập liệu
Một công ñoạn quan trọng ñể ñảm bảo Một công ñoạn quan trọng ñể ñảm bảo
tính toàn vẹn của số liệutính toàn vẹn của số liệu
Mục tiêu là giảm sai số do nhập liệu xuống Mục tiêu là giảm sai số do nhập liệu xuống
dưới 1/ 1000 bản ghidưới 1/ 1000 bản ghi
Lý tưởng là có 2 người khác nhau nhập Lý tưởng là có 2 người khác nhau nhập
liệuliệu
10
BIOS II BIOS II Chapter 2Chapter 2
3737
Tt nht là có 2 ngi nhp
cùng mt b s liu!
Tại sao không dùng 1 người nhập
một bộ số liệu 2 lần?
BIOS II BIOS II Chapter 2Chapter 2

3838
Xử lý số liệuXử lý số liệu
Kiểm traKiểm tra
–– Sai số do mã hoáSai số do mã hoá
–– Giá trị bất thườngGiá trị bất thường
Kiểm tra nhập số liệuKiểm tra nhập số liệu
Kiểm tra tính ñồng nhấtKiểm tra tính ñồng nhất
BIOS II BIOS II Chapter 2Chapter 2
3939
Kiểm tra tính ñồng nhấtKiểm tra tính ñồng nhất
Các câu trả lời không ñồng nhất nằm trong tệp số Các câu trả lời không ñồng nhất nằm trong tệp số
liệu.liệu.
So sánh câu trả lời với bộ câu hỏi/ công cụ thu So sánh câu trả lời với bộ câu hỏi/ công cụ thu
thập số liệu.thập số liệu.
Số liệu không ñồng nhất có thể do mã Số liệu không ñồng nhất có thể do mã
hoá sai, lỗi ñánh máy, hoặc trả lời saihoá sai, lỗi ñánh máy, hoặc trả lời sai
BIOS II BIOS II Chapter 2Chapter 2
4040
Mã xác ñịnh: ____009__
Địa chỉ ___4007___
Tuổi __51__years
Giới tính
Nam Nữ
Bạn có sẵn lòng trả lời hết bộ câu hỏi này không?
Có Không
Nếu có, bắt ñầu bằng câu 1, nếu không thì cảm ơn người trả
lời và kết thúc

Câu 10:
Bạn ñã mang bao giờ chưa?

Rồi Chưa
11
BIOS II BIOS II Chapter 2Chapter 2
4141
Số xác ñịnh : ____020__
Ngày sinh : __4/11/1991__
Ngày mất : __14/1/1901__
Số xác ñịnh: ____009__
Trình ñộc học vấn Cấp 1
Cấp 2
Cấp 3
Tuổi __51__years
Bạn ñã từng học ñại học chưa?
Rồi Chưa
Nếu rồi, bạn ñạt văn bằng nào? __Kỹ sư__
BIOS II BIOS II Chapter 2Chapter 2
4242
Chúng ta nên làm gChúng ta nên làm gìì…??…??
Ghi chGhi chép lại toàn bộ các mã ép lại toàn bộ các mã
ñã dùngñã dùng
BIOS II BIOS II Chapter 2Chapter 2
4343
Tại sao lại cần sổ ghi chép mã?Tại sao lại cần sổ ghi chép mã?
SS ghi chép mã cung cp ghi chép mã cung cp
Các mã ñã dùngCác mã ñã dùng
Giúp bạn tra cứu và ñảm bảo các mã ñược dùng Giúp bạn tra cứu và ñảm bảo các mã ñược dùng
thống nhấtthống nhất
Đây là công cụ giúp cho việc giảm thiểu lỗi hoặc Đây là công cụ giúp cho việc giảm thiểu lỗi hoặc
sự không thống nhấtsự không thống nhất
QUẢN LÝ SỐ LIỆUQUẢN LÝ SỐ LIỆU

CácCác câucâu lệnhlệnh thườngthường dùngdùng
–– ComputeCompute
–– RecodeRecode
–– Select Select
BIOS II BIOS II Chapter 2Chapter 2
4444
12
ComputeCompute
SửSử dụngdụng tínhtính toántoán biếnbiến mớimới dựadựa trêntrên cáccác
biếnbiến cócó sẵnsẵn
DùngDùng mộtmột biểubiểu thứcthức toántoán họchọc
CâuCâu lệnhlệnh
–– transform/ compute….transform/ compute….
BIOS II BIOS II Chapter 2Chapter 2
4545
Recode Recode
DùngDùng ñểñể mãmã hóahóa 1 1 biếnbiến dựadựa trêntrên mộtmột hoặchoặc
nhiềunhiều biếnbiến cũcũ
MãMã hóahóa
–– BiếnBiến ñịnhñịnh lượnglượng BiếnBiến ñịnhñịnh tínhtính
–– BiếnBiến ñịnhñịnh tínhtính  BiếnBiến ñịnhñịnh tínhtính
CâuCâu lệnhlệnh
–– Transform/ recode….Transform/ recode….
MãMã hóahóa::
–– MộtMột biếnbiến mớimới ((nênnên dùngdùng))
–– MãMã hóahóa trêntrên chínhchính biếnbiến cũcũ
BIOS II BIOS II Chapter 2Chapter 2
4646
Select cases… Select cases…
ChọnChọn phânphân tíchtích mộtmột phầnphần củacủa bộbộ sốsố liệuliệu

CácCác trườngtrường hợphợp ñượcñược phânphân tíchtích cầncần thỏathỏa
mãnmãn ñiềuñiều kiệnkiện vớivới tùytùy chọnchọn “if”“if”
CâuCâu lệnhlệnh
–– Data/ select cases… Data/ select cases…
BIOS II BIOS II Chapter 2Chapter 2
4747
THỰC HÀNHTHỰC HÀNH
SửSử dụngdụng bộbộ sốsố liệuliệu wh.savwh.sav
–– TìmTìm giágiá trịtrị bấtbất thườngthường
–– XemXem xétxét tínhtính logiclogic
–– SaiSai sốsố mãmã hóahóa
–– ThựcThực hiệnhiện cáccác câucâu lệnhlệnh
ComputeCompute
RecodeRecode
Select cases…Select cases…
BIOS II BIOS II Chapter 2Chapter 2
4848

×