Tải bản đầy đủ (.pdf) (30 trang)

Bài giảng tin học ứng dụng phân tích dữ liệu nghiên cứu với SPSS bài 4 các phép biến đổi dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.22 MB, 30 trang )

TIN HỌC ỨNG DỤNG
PHÂN TÍCH DỮ LIỆU NGHIÊN
CỨU VỚI SPSS
BÀI 4: CÁC PHÉP BIẾN ĐỔI DỮ LIỆU


Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

MỤC TIÊU
• Hiểu và áp dụng được các phương pháp biến đổi
dữ liệu phù hợp với yêu cầu nghiên cứu.
• Hiểu và áp dụng được các phương pháp xử lý lỗi
phát sinh trong quá trình nhập liệu.
• Tổ chức và làm việc nhóm xây dựng bảng câu hỏi
khảo sát, tiến hành khảo sát, nhập và xử lý dữ liệu.

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

NỘI DUNG
• Xử lý dữ liệu trên biến
– Mã hóa biến với công cụ Recode
– Chuyển định dạng của biến
– Tính toán giá trị của biến với công cụ Compute
– Xử lý câu hỏi có nhiều lựa chọn trả lời

• Làm sạch dữ liệu


– Dữ liệu lỗi và các biện pháp khắc phục
– Các phương pháp làm sạch dữ liệu

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

CÁC PHÉP BIẾN ĐỔI DỮ LIỆU
• Mục đích
– Xử lý sai sót trong quá trình mã hóa, nhập liệu
– Biến đổi dữ liệu để phát hiện mối quan hệ giữa các biến

• Phân loại
– Xử lý dữ liệu trên biến
– Làm sạch dữ liệu

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

XỬ LÝ DỮ LIỆU TRÊN BIẾN
• Mã hóa biến với công cụ Recode
• Chuyển định dạng của biến
• Tính toán giá trị của biến với công cụ Compute

• Xử lý câu hỏi có nhiều lựa chọn trả lời

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

MÃ HÓA BIẾN VỚI RECODE
• Mục đích
– Biến đổi trị số dữ liệu bằng cách mã hóa lại chúng

• Điều kiện áp dụng
– Giảm số biểu hiện của một biến định tính xuống chỉ còn
hai hoặc ba loại biểu hiện cơ bản
– Chuyển biến định lượng thành biến định tính

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

MÃ HÓA BIẾN VỚI RECODE
• Quy trình thực hiện
– Gọi thực hiện chức năng Transform -> Recode -> Into
Different Variables (giữ nguyên biến gốc, tạo biến mới)
– Chọn biến muốn mã hóa lại

– Đặt tên và nhãn cho biến mới, nhấn nút Change để xác
nhận
– Nhấn nút Old and New Values để xác định sự chuyển
đổi giá trị giữa biến cũ và biến mới
– Gán các nhãn giá trị cho biến vừa tạo

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

MÃ HÓA BIẾN VỚI RECODE

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

CHUYỂN ĐỊNH DẠNG CỦA BIẾN
• Mục đích
– Chuyển biến dạng phân loại Category nhiều trị số thành
biến phân loại Dichotomy có hai trị số

• Ví dụ
– BankAccount là biến phân loại, cho biết tên ngân hàng
quản lý tài khoản lương của người được hỏi

– SalaryThrBank là biến phân loại, cho biết người được
hỏi có nhận lương qua ngân hàng VCB hay không

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

CHUYỂN ĐỊNH DẠNG CỦA BIẾN
• Quy trình thực hiện
– Gọi thực hiện chức năng Transform -> Count
– Khai báo tên và nhãn của biến Dichotomy
– Cung cấp (các) biến Category có liên quan tới biến
Dichotomy
– Cung cấp trị số mã hóa của (các) biến Category có liên
quan tới biến Dichotomy
– Gán nhãn các giá trị của biến Dichotomy

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

CHUYỂN ĐỊNH DẠNG CỦA BIẾN

… những bước chập chững vào thế giới số …





Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU
• Dữ liệu lỗi và các biện pháp khắc phục
• Các phương pháp làm sạch dữ liệu

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

DỮ LIỆU LỖI
• Lỗi mã hóa dữ liệu
• Lỗi nhập dữ liệu
• Lỗi về tính nhất quán của dữ liệu

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LỖI MÃ HÓA DỮ LIỆU

• Mô tả
– Dữ liệu nhập không phản ánh đúng ý nghĩa của thông
tin do người được hỏi cung cấp

• Nguyên nhân
– Mã hóa sai thông tin do người được hỏi cung cấp

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LỖI NHẬP DỮ LIỆU
• Mô tả
– Dữ liệu nhập không đúng với bảng mã theo thông tin do
người được hỏi cung cấp

• Nguyên nhân
– Mã đọc sai
– Mã đọc đúng nhưng lỗi do đánh máy

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu


LỖI NHẤT QUÁN DỮ LIỆU
• Mô tả
– Không nhất quán giữa các câu trả lời của cùng một đối
tượng được hỏi

• Nguyên nhân
– Lỗi mã hóa dữ liệu
– Lỗi nhập dữ liệu
– Lỗi do đối tượng được hỏi cung cấp sai thông tin

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

KHẮC PHỤC LỖI MÃ HÓA VÀ NHẬP LIỆU
• Nhập toàn bộ số liệu hai lần bởi hai người độc lập
• Nhập toàn bộ số liệu một lần, nhập lần hai 20% bộ
số liệu (chọn ngẫu nhiên) bởi hai người độc lập

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU

• Sự cần thiết
– Xử lý các lỗi phát sinh trong quá trình mã hóa dữ liệu,
nhập dữ liệu
– Đảm bảo tính nhất quán của dữ liệu

• Các biện pháp ngăn ngừa
– Thiết kế bảng câu hỏi rõ ràng, dễ trả lời
– Chọn lọc và huấn luyện điều tra viên
– Các bảng câu hỏi cần kiểm tra, xử lý lỗi trước khi nhập

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU
• Kết hợp sử dụng MS Excel và SPSS để phát hiện,
xử lý lỗi và làm sạch dữ liệu
– Sử dụng Excel (Max, Min, Auto Filter, Scatter)
– Sử dụng SPSS (Scatter, Frequency, Charts, Box Plots)

• Quy trình thực hiện
– Dùng công cụ để phát hiện giá trị “lạ” của mỗi biến
– Tìm bản ghi chứa giá trị “lạ”
– Chỉnh sửa/loại bỏ bản ghi chứa giá trị lạ

… những bước chập chững vào thế giới số …





Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
• Ví dụ
– Sử dụng hàm MIN, MAX đối với biến Age
– Sử dụng công cụ AutoFilter đối với biến Gender
– Sử dụng đồ thị Scatter đối với biến Childrens

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
• Sử dụng hàm MIN, MAX đối với biến Age
– Đối với dữ liệu người tiêu dùng, độ tuổi khảo sát từ 18
đến 60
– Giá trị nằm ngoài vùng 18 – 60 là dữ liệu lỗi

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu


LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
• Sử dụng công cụ AutoFilter đối với biến Gender
– Biến Gender chỉ có hai giá trị Male và Female, những
giá trị khác (hoặc để trống) là lỗi nhập liệu

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
• Sử dụng đồ thị Scatter đối với biến Age

… những bước chập chững vào thế giới số …




Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU VỚI MS EXCEL
• Sử dụng đồ thị Scatter đối với biến Age

… những bước chập chững vào thế giới số …





Tin học ứng dụng: Biến đổi dữ liệu nghiên cứu

LÀM SẠCH DỮ LIỆU VỚI SPSS
• Ví dụ
– Sử dụng công cụ Frequencies đối với biến Gender
– Sử dụng công cụ Charts đối với biến Literacy
– Sử dụng công cụ Histogram đối với biến Age

… những bước chập chững vào thế giới số …




×