09/01/2018
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG II:
LÀM SẠCH DỮ LIỆU
FBA
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 LÝ DO
2.2 CÁC BIỆN PHÁP NGĂN NGỪA
2.3 CÁC PHƯƠNG PHÁP LÀM SẠCH DỮ LIỆU
2.3.1 DÙNG BẢNG TẦN SỐ
2.3.2 DÙNG BẢNG PHỐI HỢP HAI BIẾN HAY BA BIẾN
(BASIC OR GERERAL)
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 LÝ DO
Chất lượng của phỏng vấn và đọc soát
Nhập liệu sai, sót, thừa
1
09/01/2018
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.1 CÁC BIỆN PHÁP NGĂN NGỪA
Thiết kế bảng câu hỏi rõ ràng.
Chọn lọc và huấn luyện phỏng vấn viên kỹ lưỡng.
Điều tra thử trước khi tiến hành chính thức.
Bảng câu hỏi sau khi phỏng vấn phải được đọc
kiểm soát lỗi trước khi tiến hành nhập liệu.
Việc mã hóa phải tiến hành tập trung và nhất quán
với chuyên gia nhập liệu.
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.1 Dùng bảng tần số
Để tìm các lỗi dữ liệu bị nhầm, ta có thể lập bảng tần
số để tìm dữ liệu sai sót để sửa.
Thực hiện: từ cửa sổ Data view Analyze
Descriptive Statistics chọn Frequencies Hộp
thoại.
Thí dụ: Minh họa bằng data lamsachdulieu.sav
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.1 Dùng bảng tần số
2
09/01/2018
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.
Thực hiện: từ cửa sổ Data view Analyze Descriptive
Statistics chọn Frequencies Hộp thoại.
IS
- Bước 1: Vào Data Select Cases..., khi màn hình hiện ra hộp thoại
thì ta chọn If Condition is satisfied để nút If hiện ra và ấn vào
- Bước 2: Chọn biến Tuoi và biến NgheNghiep bên trái để đưa vào
khung bên phải với điều kiện logic bao=8 & NgheNghiep="2“tiếp đó
ấn Continue và ấn tiếp OK.
- Bước 3: Khi lệnh này được thực hiện, SPSS sẽ tạo ra một biến mới là
filter_$, biến này nhận giá trị 0 tại tất cả các tình huống không thỏa
mãn và 1 tại tình huống thỏa mãn điều kiện của lệnh If. Những giá trị
là 1 trong biến filter_$ chính là những trường hợp sai mà ta cần tìm để
sửa.
- Thí dụ: Minh họa bằng data lamsachdulieu.sav
TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
KHOA QUẢN TRỊ - KINH DOANH
CHƯƠNG 2: LÀM SẠCH DỮ LIỆU
2.3 Các phương pháp làm sạch dữ liệu
2.3.2 Dùng bảng tần số phối hợp 2 biến hay 3 biến.
Chuyển 1 biến dạng phân loại (Category) thành dạng
biến lưỡng phân (Dichotomy)
Chuyển 1 biến dạng phân loại (Category) thành dạng
biến lưỡng phân (Dichotomy) Được dùng khi gặp câu
hỏi có nhiều trả lới (MA) để tập hợp một thông tin
chứa trong các câu trả lời, muốn vậy cần tạo một biến
với 2 biểu hiện: 1 có thông tin và 0 không có thông tin,
đếm 1 sẽ có được thông tin cần quan tâm; cách tiến
hành:
Vào Transform \ count. Thí dụ minh họa “baosggp”.
3