Bài 2
NHẬP VÀ MỞ CÁC TỆP DỮ LIỆU
1. Khái niệm về biến và các giá trị trong biến
2. Phương pháp định biến trong SPSS
3. Nhập dữ liệu
4. Mở các tệp dữ liệu
5. Hợp nhất các tập dữ liệu (Merge files)
6. Hiệu đính dữ liệu trong bảng Data View
7. Mã hoá lại dữ liệu
1. Khái niệm về biến và
các giá trị trong biến
• Biến là tập hợp những trả lời cho
một câu hỏi.
Phân loại biến theo số lượng câu trả lời
Biến một trả lời
Biến nhiều trả lời
Biến một trả lời
• Câu hỏi 1: Hãy cho biết bạn ở nhóm tuổi nào
trong số những nhóm tuổi sau:
Nhóm tuổi
code
Dưới 18
1
18 đến 30
31 đến 40
41 đến 50
Trên 50
2
3
4
5
Biến nhiều trả lời
• Câu hỏi 2: Nói đến điện thoại di động, bạn biết được
những nhãn hiệu nào trong danh sách liệt kê dưới đây:
Nhãn hiệu
code
Ericson
1
LG 2
Motorola
3
Nokia
4
Samsung 5
Siemens
6
Panasonic
7
….V.V
Phân loại biến theo kiểu dữ liệu
Biến định tính
• Thang đo định danh (nominal scale)
• Thanh đo thứ bậc (ordinal scale)
Biến định lượng
• Thang đo khoảng cách (internal scale)
• Thang đo tỷ lệ (ratio)
2. Phương pháp định biến trong
SPSS (Define Variable)
• Gán tên (nhãn) cho biến (Name)
• Định dạng kiểu biến (Type)
• Xác định số lượng con số hiễn thị cho giá trị (Width) và số
lượng con số sau dấu phẩy hiển thị (Decimals)
• Gán nhãn cho biến (Variable Label)
• Định tên cho các giá trị trong biến (Value lables)
• Định nghĩa các giá trị khuyết (Missing Values)
• Định kích cở cho cột (Column format)
• Định ra vị trí hiển thị các giá trị (align)
• Định ra dạng thang đo mà biến thể hiện (measurement)
Gán nhãn cho biến (Variable Label
Định dạng kiểu biến (Type)
3. Nhập dữ liệu
Bạn có thể nhập dữ liệu theo đối tượng hoặc theo biến, hoặc
theo khu vực được chọn, hoặc theo từng ô
Một số chú ý
• Ô hoạt động (ô con trỏ) luôn được làm sáng
• Tên biến và số của hàng của ô hoạt động được thể hiện ở góc
cao bên trái của cửa sổ Data Editor.
• Khi chọn một ô và nhập một trị số thì nó sẽ được thể hiện ở
khoang hiệu đính dữ liệu nằm ở trên của Data Editor
• Các trị số không được ghi cho đến khi bạn nhấn Enter hoặc chọn
ô khác
• Để nhập bất kỳ gì khác một dữ liệu dạng số, trước hết phải định
nghĩa loại dữ liệu.
• Nếu nhập một trị số vào một cột rỗng, Data Editor tự động tạo ra
một biến mới và chỉ định một tên biến
• Nếu gõ một ký tự không được chấp nhận bởi loại biến, Data Editor
sẽ phát ra tiếng kêu bíp và không nhập ký tự.
• Với các biến dạng chuỗi, các ký tự nằm ngoài độ rộng được định
nghĩa sẽ không được chấp nhận.
• Với các biến dạng số, các trị số nguyên vượt quá độ rộng vẫn có
thể được nhập vào, nhưng Data Editor thể hiện hoặc là chú giải
khoa học hoặc là các dấu hoa thị trong ô để chỉ ra rằng trị số này
rộng hơn độ rộng được định nghĩa. Để thể hiện trị số trong ô, thay
đổi độ rộng của biến
Để sử dụng nhãn của trị số khi
nhập dữ liệu
• Nếu nhãn trị số không xuất hiện trong bảng Data
View, từ thanh menu chọn: View / Value Labels
• Nhắp lên ô mà trong đó bạn muốn nhập trị số
• Chọn một nhãn trị số từ danh sách mở xuống
• Trị số được nhập vào và nhãn trị số được thể hiện
trong ô.
Chú ý: Điều này chỉ làm việc nếu bạn đã định nghĩa
nhãn trị số của biến.
4. Mở các tệp dữ liệu
Các file dữ liệu có các định dạng khác nhau, có thể
mở được bằng phần mềm này:
• Các bảng tính worksheet được lập trong Excel hoặc
Lotus
• Cơ sở dữ liệu được lập dưới định dạng dBASE và SQL
• Các file dạng text ASCII với kiểu Tabdeliminated
• Các file trong định dạng SPSS được lập trong các hệ
điều hành khác
• Các file dữ liệu SYSTAT
Khởi động SPSS
Run the tutorial: Chạy chương trình
trợ giúp
Type in data: Nhập dữ liệu mới
Run an existing query: Chạy một
truy vấn dữ liệu đã có sẵn
Create new query using Database
Wizard: Lập một truy vấn dữ liệu sử
dụng Database Wizard
Open an existing data source: Mở
file dữ liệu đã có sẵn
(Chú ý: Hộp thoại này chỉ xuất hiện một
lần khi bạn khởi động SPSS)
Để mở một tệp tin {file} Excel
Tại cửa sổ SPSS Data Editor, từ thanh menu chọn: File / Open / Data…
Trong hộp thoại Open File, chọn file mà bạn muốn mở
Nhắp Open
Trong hộp thoại Open File, chọn nnơi lưu giữ file (Look in); chọn loại file
(Files of type) và sau đó chọn tên file (File name)
5. Hợp nhất các tập dữ liệu
(Merge files)
• SPSS cho phép hợp nhất các dữ liệu từ trong
một tập dữ liệu bên ngoài vào tập dữ liệu đang
sử dụng. Hoặc hợp các biến mới trong tập dữ
liệu bên ngoài vào tập dữ liệu đang hoạt động.
Cả hai đều tạo ra một tập dữ liệu mới có thể
chứa tất cả các quan sát được hợp lại hoặc tất
cả các biến đưọc hợp tùy theo ta chọn Add
Cases hay Add Variables
5.1 Thêm vào các quan sát (Add
Cases)
•
Chọn Data/Merge Files/Adds Cases
Hộp thoại Read File cho phép ta
lựa chọn tập dữ liệu sẽ được hợp
với tập dữ liệu đang hoạt động
(working file). Nhấn Open để xác
nhận việc lựa chọn này
Add Cases
Sau khi lựa chọn xong tập dữ sẽ được kết
hợp, ta sẽ có một hộp thoại
Những biến được liệt kê trong hộp thoại
Unpaired Variables là những biến có những
đặc điểm như sau:
Hai biến có tên biến được khai báo khác nhau
Những biến có dạng dữ liệu khác nhau
Cả hai biến biến cùng là dạng chuổi nhưng lai
không bằng nhau về số ký tự trong chuổi.
Unpaired Variables: liệt kê các biến
không giống nhau giữa hai tập dữ
liệu đang được tiến hành hợp nhất
lại, các biến không giống nhau này
sẽ bị loại ra và không có trong tập dữ
liệu mới được tạo ra từ việc hợp nhất
hai tập dữ liệu ban đầu. Các biến này
được ký hiệu khác nhau với ký hiệu
(*) đại diện cho các biến trong tập dữ
liệu đang hoạt động và (+) đại diện
cho các biến trong tập dữ liệu được
truy xuất từ bên ngoài.
Hộp thoại Variables in New Working
Data File liệt kê các biến sẽ có trong
tập tin mới được tạo ra từ việc hợp
nhất hai tập dữ liệu ban đầu. Toàn
bộ các biến trong hai tập tin ban đầu
thỏa mãn các điều kiện giống nhau
về tên và loại dữ liệu (số hoặc
chuổi) sẽ được liệt kê vào hộp thoại
này
•
5.2. Thêm vào các biến (Add
Variables)
Data/Merge Files/Adds Variables từ menu
Excluded Variables liệt kê các biến sẽ bị
loại trừ ra khỏi biến mới hợp thành. Những
biến này là những biến có tên biến giống
nhau. Biến trong tập tin đang hoạt động
được ký hiệu là (*), và những biến trong
tập tin bên ngoài là (+). Nếu muốn các
biến giống tên nhau này có trong tập dữ
liệu mới ta phải tiến hành rename nó lại và
chuyển nó sang hộp thoại chứa các biến
sẽ có trong tập tin mới
Key Variables. Biến khóa dựa vào đó các quan sát giống nhau được xác định. Biến
khóa này phải cùng tên ở các hai tập tin cần hợp nhất. Các trường hợp không thỏa mãn
với biến khóa thì vẫn bao hàm trong tập dữ liệu mới nhưng sẽ không được hợp với các
trường hợp trong tập tin khác. Những trường hợp này chỉ chứa đựng giá trị riêng biệt
của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và các trường
hợp này sẽ có giá trị khuyết trong các biến chứa đựng trong tập tin thứ hai mà ta sẽ
hợp nhất.
6. Hiệu đính dữ liệu trong bảng Data
View
Với Data Editor, có thể hiệu đính trị số của dữ liệu
trong bảng Data View theo nhiều cách. Bạn có thể:
• Thay đổi trị số của dữ liệu
• Cắt, sao chép, và dán các trị số của dữ liệu
• Thêm vào hoặc xoá các đối tượng
• Thêm vào hoặc xoá các biến
• Thay đổi trật tự của các biến
6.1 Để thay thế hoặc hiệu đính một
trị số của dữ liệu
Để xoá trị số cũ và nhập một trị số
mới:
•
• Trong bảng Data View, nhắp đúp vào
ô. Trị số được thể hiện trong khoang
hiệu đính dữ liệu.
•
• Hiệu đính trị số trực tiếp từ ô hoặc
•
trong khoang hiệu đính dữ liệu.
• Nhấn Enter (hoặc chuyển sang ô
khác) để ghi trị số mới.
•
•
•
Cắt, sao chép và dán các trị số
của dữ liệu
Có thể cắt, sao chép và dán các trị số
của từng ô hoặc một nhóm các trị số
trong Data Editor. Có thể:
Chuyển hoặc sao chép trị số của một ô
sang một ô khác.
Chuyển hoặc sao chép trị số của một ô
sang một nhóm các ô.
Chuyển hoặc sao chép trị số của một đối
tượng sang cho một nhóm các đối tượng.
Chuyển hoặc sao chép trị số của một
biến sang cho một nhóm các biến.
Chuyển hoặc sao chép trị số của một
nhóm các ô sang cho một nhóm các ô
khác.
6.2 Chèn thêm các đối tượng mới
Để chèn một đối tượng mới giữa các đối tượng
đã có sẵn
• Trong Data View, chọn bất kỳ ô nào trong đối
tượng (hàng) nằm dưới vị trí nơi mà bạn muốn
chèn đối tượng mới.
• Từ thanh menu chọn: Data/Insert Case
Một hàng mới được chèn vào và mọi biến của đối
tượng mới này đều nhận được trị số khuyết thiếu
hệ thống.
6.3 Chèn một biến mới
Để chèn một biến mới giữa các biến đã có sẵn
• Chọn bất kỳ ô nào trong biến bên phải của
(bảng Data View) hoặc dưới (của bảng Variable
View) vị trí mà bạn muốn chèn biến mới vào.
• Từ thanh menu chọn: Data /
Insert Variable
Một hàng mới được chèn vào với trị số khuyết
thiếu hệ thống cho mọi đối tượng.
6.4 Để chuyển một biến trong Data
Editor
Nếu muốn đặt vị trí biến giữa hai biến đã có sẵn, hãy chèn
một biến vào vị trí nơi bạn muốn di chuyển biến đến đó
• Đối với biến bạn muốn chuyển, nhắp tên biến ở đỉnh
của cột trong bảng Data View hoặc số hàng trong bảng
Variable View. Toàn bộ biến sẽ được làm nổi bật/tô
sáng.
• Từ thanh menu chọn : Edit/Cut
• Nhắp vào tên biến (trong bảng Data View) hoặc số hàng
(trong bảng Variable View) nơi bạn muốn di chuyển biến
đến. Toàn bộ biến này sẽ được mà nổi bật
• Từ thanh menu chọn : Edit/Paste
6.5 Thay đổi loại dữ liệu
Có thể thay đổi loại dữ liệu cho một biến bất kể lúc nào
có sử dụng hộp thoại Variable Type trong bảng Variable
View, và Data Editor sẽ chuyển đổi các trị số hiện có
sang loại mới. Nếu không thể chuyển đổi được thì trị số
khuyết thiếu hệ thống sẽ được chỉ định.
6.6 Tình trạng lọc đối tượng
trong Data Editor
Các đối
tượng bị
lọc (bị
loại trừ)