1
2
NỘI DUNG
GIỚI THIỆU EPIDATA VÀ NHẬP
SỐ LIỆU BẰNG EPIDATA
THỐNG KÊ SAU ĐẠI HỌC
TRƯỜNG ĐẠI HỌC Y TẾ CÔNG CỘNG
1.
Mục tiêu bài học
2.
Chức năng, tiện ích của EpiData
3.
Khái niệm cơ bản dùng trong EpiData
4.
Tệp .qes/.check/.rec trong EpiData
5.
Xuất và nhập số liệu trong Epitata
6.
Sử dụng phần mềm EpiData
7.
Tài liệu tham khảo
BIOS_L2
3
MỤC TIÊU BÀI HỌC
1. Trình bày được chức năng, tiện ích của
4
QUI TRÌNH LÀM VIỆC VỚI SỐ LIỆU
1. Thu thập số liệu tại thực địa
EpiData
2. Trình bày được phương pháp tạo bộ nhập
liệu trong EpiData: các tệp qes, check, rec
2. Tạo bộ nhập liệu trên phần mềm
3. Nhập số liệu vào máy tính
3. Trình bày được cách xuất/nhập dữ liệu
4. Làm sạch số liệu
trong EpiData
4. Sử dụng được phần mềm EpiData để nhập
và kiểm sốt số liệu điều tra
BIOS_L2
5. Phân tích số liệu
BIOS_L2
1
5
CHỨC NĂNG, TIỆN ÍCH CỦA EPIDATA
6
KHÁI NIỆM CƠ BẢN DÙNG TRONG EPIDATA
• EpiData là gì? – phần mềm hỗ trợ nhập và
• Bản ghi (Record)
quản lý số liệu do Jens M. Lauritsen viết.
• Trường số liệu = Biến (Field)
• EpiData chuyên dùng cho nhập liệu
• Tên trường = Tên biến (Field name)
• Giao diện thân thiện, tiện lợi, dễ sử dụng
• Tính tương thích cao (HĐH Windows, các phần
mềm thống kê thơng dụng…)
• Nhãn biến (Label)
• Kiểu biến (Type)
• Mã hóa dữ liệu/biến (Code)
• Hồn tồn miễn phí, tại trang web:
(phiên bản 3.1)
BIOS_L2
BIOS_L2
7
MÃ HÓA DỮ LIỆU
8
MÃ HÓA DỮ LIỆU (tt)
• Là q trình chuyển đổi các số liệu thu thập
được (vd. từ các bộ câu hỏi) thành các dạng
dữ kiện phù hợp với các phần mềm phân tích
thống kê (v.d. SPSS)
• Các số liệu dạng ký tự được đổi thành các dữ
liệu kiểu số
• Ví dụ: Nam = 1 , Nữ = 2
• Bảng mã số liệu cần được chuẩn bị trước cho
các mã khác nhau
BIOS_L2
BIOS_L2
2
9
CÁC KIỂU TRƯỜNG DỮ LIỆU (KiỂU BiẾN) CƠ BẢN
CẤU TRÚC MỘT BẢN GHI
Kiểu biến
• Kiểu số tự động: <IDNUM>
Mã hóa
biến
Nhãn
biến
Biến 2
Kiểu biến
Biến n…
Bản ghi
• Kiểu số: #
Nhãn
biến
Biến 1
Nhóm
biến 1
Biến 2
Nhóm
biến n…
Biến n…
• Kiểu chữ: _
• Kiểu thời gian: <dd/mm/yyyy>
Mã hóa
biến
• Kiểu thời gian tự động: <Today-dmy>
• Kiểu logic: <Y> (nhập giá trị Y - Yes hoặc N –
No, có thể thay thế bằng kiểu số)
Biến 1
Nhóm
biến 2
10
• Cấu trúc:
{Tên biến} {Nhãn biến} {Kiểu dữ liệu}
BIOS_L2
BIOS_L2
11
12
PHÂN TÍCH BỘ CÂU HỎI
TẠO BỘ NHẬP LIỆU TRONG EPIDATA
• Xác định: Câu hỏi một hay nhiều lựa chọn?
• Các tệp trong EpiData
• Trả lời cho bảng giả sau:
• Tệp .QES: định nghĩa các biến (1. Define data)
• Tệp .REC: lưu dữ liệu nhập vào (2. Make data file)
ST
Tên biến
T
2
GIOI
Ho va ten cua doi
tuong nghien cuu
Gioi tinh
3
TUOI
Tuoi doi tuong NC
1
HOTEN
Nhãn biến
Dạng biến Độ rộng của biến
BIOS_L2
• Tệp .CHK: lưu các ràng buộc dữ liệu (3. Checks)
20 ký tự (_)
• .qes .rec .chk
numeric
1 ký tự (#)
• Sao lưu: cả 3 file này trong cùng một thư mục,
numeric
2 ký tự (##)
text
phần tên file phải giống nhau.
BIOS_L2
3
13
14
TỆP .QES TRONG EPIDATA
TỆP .REC TRONG EPIDATA
• Chức năng tệp .qes
• Chức năng tệp .rec
• Tạo tệp .qes mới:
• Tạo tệp .rec mới
File/New hoặc Ctrl+N hoặc Define Data/New
.QES file
Make Data File hoặc Data File/Make Data File
• Cấu trúc:
• Chọn đường dẫn cho file đầu vào (.QES) và
{Tên biến} {Nhãn biến} {Kiểu dữ liệu}
• Ví dụ:
sex Gioi tinh #
• Lưu bộ .qes
file đầu ra (.REC)
• Tên file .REC được tự sinh và đặt cùng chỗ
với file .REC (mặc định)
• Đặt tên cho file .REC
BIOS_L2
BIOS_L2
15
16
TỆP .CHECK TRONG EPIDATA
NHẬP SỐ LIỆU TRONG EPIDATA
• Chức năng tệp .check
• Nhập vào file .REC
• Tạo tệp .check
• Enter Data chọn file .REC
• Chọn file .REC
• Range, Legal: Khoảng, giá trị hợp lệ. Ngăn cách bằng
dấu phẩy
• Nhập liệu theo mã đã được mã hóa (code)
• Lưu bản ghi đã nhập
• Jumps: Bước nhẩy
• Các tiện ích trong màn hình nhập liệu
• VD: 1>q3
• Must enter
• Các nút Navigation
• Repeat
• Value label: Nhãn các giá trị mã hóa
BIOS_L2
• Xóa bản ghi đã nhập
BIOS_L2
4
17
XEM CÁC DỮ LIỆU ĐÃ NHẬP
18
CÁC TIỆN ÍCH KHÁC CỦA EPIDATA
• Ba câu lệnh cơ bản: View Data, List Data và Codebook
• Chọn file số liệu muốn xem
• Đối với View Data: Xem tồn bộ số liệu, chỉ cho phép
• Xem cấu trúc file: File Structure
• Đếm bản ghi: Count Record
• Nối các file dữ liệu: Append/Merge Data
xem, khơng cho phép chỉnh sửa dữ liệu
• Đối với List Data: Xem thơng tin chi tiết của bản ghi
files
• Đối với Codebook: Xem thông tin chi tiết của biến
BIOS_L2
BIOS_L2
19
XUẤT SỐ LIỆU TỪ EPIDATA (EXPORT)
20
THỰC HÀNH SỬ DỤNG EPIDATA
• Export Data
• Mở chương trình
• Chọn tệp muốn xuất sang định dạng Stata
• Tạo tệp .qes
• Chọn các biến, bản ghi muốn xuất dữ liệu
• Tạo tệp .rec
• Tạo tệp .check
• Đầu ra: file .dta
• Thực hành nhập số liệu từ phiếu điều tra
• Xuất số liệu
• Nối số liệu (nối ngang, nối dọc)
BIOS_L2
BIOS_L2
5
21
TÀI LIỆU THAM KHẢO
•
•
•
Phạm Việt Cường, Giáo trình EPI Data
(Đại Học Y Tế Cơng Cộng 2006)
Phạm Việt Cường, Giáo trình đào tạo từ
xa EPI Data CD Based, (Đại Học Y Tế
Công Cộng 2007)
Các tài liệu phát tay
BIOS_L2
6
SPSS là gì?
HANOI UNIVERSITY OF PUBLIC HEALTH
• Ban đầu : SPSS (Statistical Package for
the Social Science)
Phần mềm SPSS
• Đổi thành SPSS (Statistical Product and
Service Solutions)
• Hiện nay gọi được thêm tên IBM
SPSS/PAWN.
• Là một phần mềm thống kê rất phổ biến
dùng trong việc quản lý các hệ thống số
liệu phức tạp và phân tích đưa ra kết quả
với cách đơn giản
Cửa sổ số liệu
• Có 4 cửa sổ quan trọng
– Data Editor
– Output Viewer
– Syntax editor
– Script editor
: quản lý số liệu
: hiển thị kết quả
: soạn thảo tập hợp lệnh
: soạn thảo chương trình
1
Cửa sổ số liệu
• Dạng bảng: giúp cho việc định nghĩa, nhập, chỉnh sửa và hiển
thị số liệu
Cửa sổ lệnh (syntax)
• Dùng để soạn thảo các lệnh thực hiện phân tích, quản lý số liệu
của SPSS
Cửa sổ kết quả
• Hiển thị kết quả hoặc thơng báo
Scipt editor
• Soạn thảo các chương trình con/kịch bản để thực hiện các
nhiệm vụ của SPSS/ít khi dùng
2
Thực hành
• SPSS demo
• Thực hành
– Tạo các biến :
•
•
•
•
Age: Tuổi – dạng số
Sex: Giới – gán nhãn: 1-nam, 2- Nữ
Edu: Trình độ học vấn : 1-cấp 1, 2 –cấp 2, 3- cấp 3
Chiều cao: tính =cm
– Nhập ít nhất 20 số liệu
– Ghi lại và sử dụng vào bài sau
3