Tải bản đầy đủ (.ppt) (20 trang)

Chương 2 Nhập liệu, mã hóa và làm sạch dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1006.4 KB, 20 trang )

CHƯƠNG 2

Giảng viên: Phạm Minh Tiến

Viện Nghiên Cứu Kinh Tế Phát Triển

1


Màn hình làm việc của SPSS
Mở SPSS:
click chuột vào biểu tượng trên màn hình, hoặc:
Start/Program/ SPSS inc/ SPSS 16.0…
Cửa sổ SPSS

Các thanh menu lệnh
Hai cửa sổ input:
Data view: mô tả từng giá trị của bộ số liệu
Variable view: mô tả các biến trong bộ số liệu

Cửa sổ output: trình bày kết quả xử lý
Viện Nghiên Cứu Kinh Tế Phát Triển

2


Thao tác cơ bản với tệp số liệu
Mở tệp số liệu sẵn có:
File/ Open/ Data..  chọn tệp cần mở; hoặc,
Kích chuột vào biểu tượng open (); hoặc,
Kích chuột vào tên tệp


 Mở file Data thuc hanh.sav để quan sát.

Lưu: (Save, Save as)
File/ Save/
Chọn thư mục lưu tệp
Nhập tên tệp vào, rồi nhấn OK
Viện Nghiên Cứu Kinh Tế Phát Triển

3


Viện Nghiên Cứu Kinh Tế Phát Triển

8


Mã hóa số liệu là gì?
Mã hoá số liệu là chuyển đổi thông tin nghiên cứu đã thu

thập thành dạng thích hợp cho việc phân tích trên máy tính
Thông thường, hay mã hóa số liệu dưới dạng “con số”
Ví dụ:
Giới tính: Nam – 1; Nữ - 2
Nghề nghiệp: Giáo viên – 1; Kỹ sư- 2; CN– 3,….
Tình trạng hôn nhân: Có – 1; Không – 2; Không trả lời

– 99,…
Viện Nghiên Cứu Kinh Tế Phát Triển

9



Nguyên tắc nhập và mã hóa dữ liệu
Mã hóa dữ liệu theo quy ước đối với những dữ liệu định tính

Viện Nghiên Cứu Kinh Tế Phát Triển

10


NHẬP LIỆU SPSS
1.
2.

Tạo danh sách biến
Nhập số liệu từ
bảng hỏi/ phiếu
phỏng vấn, hoặc
chuyển từ các phần
mềm khác như
excel, text, stata,
SAS,… vào SPSS
để xử lý.
Viện Nghiên Cứu Kinh Tế Phát Triển

11


Tạo danh sách các biến
Để nhập số liệu, trước hết cần phải tạo danh sách các biến

Việc định nghĩa biến được thực hiện trong cửa sổ

Variable view
Name: Đặt tên biến
Type: Kiểu giá trị của biến
Width: Độ rộng của trường giá trị
Decimals: số thập phân sau dâu phẩy
Label: Giải thích ý nghĩa của tên biến (nhãn của tên biến)
Viện Nghiên Cứu Kinh Tế Phát Triển

12


Tạo danh sách các biến
Value: Gán nhãn mã hóa cho từng giá trị của biến
Missing: khai báo các giá trị khuyết
Column: khai độ rộng của biến
Align: vị trí dữ liệu trong cột
Measure: chọn loại thang đo

Viện Nghiên Cứu Kinh Tế Phát Triển

13


Đặt tên cho biến (Name)
Luôn phải bắt đầu bằng ký tự chữ, không có khoảng

cách giữa các ký tự.
Bao gồm các ký tự A-Z, các ký tự số và một số ký tự khác


(“_”, “@”,..)
Độ dài biến có thể lên đến 64 ký tự, tuy nhiên nên đặt tên

biến ngắn gọn, dễ hiểu, tiện cho quá trình PTSL sau này
Viện Nghiên Cứu Kinh Tế Phát Triển

14


Kiểu giá trị, độ rộng và số
thập phân của biến
Độ rộng
trường
giá trị

Kiểu
số

Kiểu
ngày
tháng
Số thập
phân

Kiểu
ký tự

Viện Nghiên Cứu Kinh Tế Phát Triển


15


Khai báo nhãn biến (lable)
Thực hiện tại cửa sổ Variable View

Viện Nghiên Cứu Kinh Tế Phát Triển

16


Khai báo mã hóa biến (values)
Thực hiện tại cửa sổ Variable View

Viện Nghiên Cứu Kinh Tế Phát Triển

17


Gán nhãn cho giá trị của biến
B1: Chọn biến muốn gắn
nhãn, chuyển chuột đến
cột Values
B2: Nhấp chuột lên vào dấu
“…” của ô này, một hộp
nhỏ màu xám sẽ xuất
hiện như hình bên: 
B3: nhập giá trị vào hộp Value, sau đó nhập nhãn bạn
muốn gán vào trong hộp Value Label. Nhấp chuột
vào Add

• Làm tương tự đối với các giá trị khác của biến
B4: Nhấn OK sau khi gán cho hết các giá trị của 1 biến
Viện Nghiên Cứu Kinh Tế Phát Triển

18


Chọn loại thang đo

Viện Nghiên Cứu Kinh Tế Phát Triển

19


Chọn loại thang đo
Thang đo

Đối tượng đo

Phép toán thống kê

Định danh
nominal

Các biến thuộc tính, mục tiêu phân loại Đếm, tính tần suất, mode, kiểm
đối tượng.
định

Thứ bậc
ordinal


Các biến thuộc tính và biến số lượng,
giữa các biểu hiện có qua hệ hơn kém

Đếm, tính tần suất, mode, kiểm
định

Khoảng
interval

Các biến số lượng và thuộc tính.
Là thang đo thứ bậc có khoảng cách
đều nhau.

Thêm: khoảng biến thiên,
trung bình, độ lệch chuẩn…,
có thể cộng trừ nhưng không
nhân chia được vì ko có ý
nghĩa.

Tỷ lệ
ratio

Dữ liệu số lượng, có trị số 0 “thật”

Sử dụng hầu hết các công cụ

Ví dụ
Viện Nghiên Cứu Kinh Tế Phát Triển


20


Các loại thang đo
Thang đo
Định danh
nominal

Ví dụ
Tình trạng hôn nhân

Độc thân – 1 ; ở góa - 3
Có gđình - 2 ; ly thân- 4

Quảng cáo sẽ giúp tăng
doanh thu

Đồng ý:
Bình thường:
Không đồng ý:

3
2
1

Khoảng
interval

Tầm quan trọng của môn
thống kê ứng dụng trong

kinh doanh

Không quan trọng :
…………………
Bình thường
…………………..
Rất quan trọng

1
2
3
4
5

Tỷ lệ
ratio

Số nhân viên trong doanh
nghiệp

50 người

Thứ bậc
ordinal

Viện Nghiên Cứu Kinh Tế Phát Triển

21



Nhập số liệu
Việc nhập số liệu trong SPSS được thực hiện ở cửa sổ

Data view:
Mỗi hàng là thông tin của một phiếu trả lời
Tên biến nằm ở dòng đầu tiên của mỗi cột

Nhập thông tin vào từng ô rồi dùng mũi tên ←↑→ để

chuyển sang ô tiếp theo
Viện Nghiên Cứu Kinh Tế Phát Triển

22


Nhập số liệu

Viện Nghiên Cứu Kinh Tế Phát Triển

23


Thực hành
• Sử dụng file sau để:
• Yêu cầu: Khai báo và nhập dữ liệu vào SPSS

Viện Nghiên Cứu Kinh Tế Phát Triển

24




×