Tải bản đầy đủ (.ppt) (29 trang)

Bài giảng Thống kê kinh doanh và SPSS - Bài 2: Nhập và mở các tệp dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (533.82 KB, 29 trang )

Bài 2
NHẬP VÀ MỞ CÁC TỆP DỮ LIỆU
1. Khái niệm về biến và các giá trị trong biến
2. Phương pháp định biến trong SPSS
3. Nhập dữ liệu
4. Mở các tệp dữ liệu
5. Hợp nhất các tập dữ liệu (Merge files)
6. Hiệu đính dữ liệu trong bảng Data View
7. Mã hố lại dữ liệu


1. Khái niệm về biến và
các giá trị trong biến
• Biến là tập hợp những trả lời
cho một câu hỏi.
Phân loại biến theo số lượng câu trả lời
 Biến một trả lời
 Biến nhiều trả lời


Biến một trả lời
• Câu hỏi 1: Hãy cho biết bạn ở nhóm
tuổi nào trong số những nhóm tuổi
sau:

Nhóm tuổi code
Dưới 18

1

18 đến 30


31 đến 40
41 đến 50
Trên 50

2
3
4
5


Biến nhiều trả lời
• Câu hỏi 2: Nói đến điện thoại di động, bạn biết được
những nhãn hiệu nào trong danh sách liệt kê dưới
đây:
Nhãn hiệu
Ericson
LG
Motorola
Nokia
4
Samsung
Siemens
6
Panasonic
….V.V

code
1
2
3

5
7


Phân loại biến theo kiểu dữ liệu
 Biến định tính
• Thang đo định danh (nominal scale)
• Thanh đo thứ bậc (ordinal scale)
 Biến định lượng
• Thang đo khoảng cách (internal scale)
• Thang đo tỷ lệ (ratio)


2. Phương pháp định biến trong
SPSS (Define Variable)
• Gán tên (nhãn) cho biến (Name)
• Định dạng kiểu biến (Type)
• Xác định số lượng con số hiễn thị cho giá trị (Width)
và số lượng con số sau dấu phẩy hiển thị (Decimals)
• Gán nhãn cho biến (Variable Label)
• Định tên cho các giá trị trong biến (Value lables)
• Định nghĩa các giá trị khuyết (Missing Values)
• Định kích cở cho cột (Column format)
• Định ra vị trí hiển thị các giá trị (align)
• Định ra dạng thang đo mà biến thể hiện
(measurement)


Gán nhãn cho biến (Variable
Label)



Định dạng kiểu biến (Type)


3. Nhập dữ liệu

Bạn có thể nhập dữ liệu theo đối tượng hoặc theo biến,
hoặc theo khu vực được chọn, hoặc theo từng ô


Một số chú ý

• Ơ hoạt động (ơ con trỏ) ln được làm sáng
• Tên biến và số của hàng của ơ hoạt động được thể hiện ở
góc cao bên trái của cửa sổ Data Editor.
• Khi chọn một ơ và nhập một trị số thì nó sẽ được thể hiện
ở khoang hiệu đính dữ liệu nằm ở trên của Data Editor
• Các trị số khơng được ghi cho đến khi bạn nhấn Enter
hoặc chọn ơ khác
• Để nhập bất kỳ gì khác một dữ liệu dạng số, trước hết
phải định nghĩa loại dữ liệu.
• Nếu nhập một trị số vào một cột rỗng, Data Editor tự
động tạo ra một biến mới và chỉ định một tên biến
• Nếu gõ một ký tự không được chấp nhận bởi loại biến,
Data Editor sẽ phát ra tiếng kêu bíp và khơng nhập ký tự.
• Với các biến dạng chuỗi, các ký tự nằm ngồi độ rộng
được định nghĩa sẽ khơng được chấp nhận.
• Với các biến dạng số, các trị số nguyên vượt quá độ rộng
vẫn có thể được nhập vào, nhưng Data Editor thể hiện

hoặc là chú giải khoa học hoặc là các dấu hoa thị trong ô
để chỉ ra rằng trị số này rộng hơn độ rộng được định
nghĩa. Để thể hiện trị số trong ô, thay đổi độ rộng của
biến


Để sử dụng nhãn của trị số
khi nhập dữ liệu
• Nếu nhãn trị số không xuất hiện trong
bảng Data View, từ thanh menu chọn:
View / Value Labels
• Nhắp lên ơ mà trong đó bạn muốn nhập
trị số
• Chọn một nhãn trị số từ danh sách mở
xuống
• Trị số được nhập vào và nhãn trị số được
thể hiện trong ô.
Chú ý: Điều này chỉ làm việc nếu bạn đã
định nghĩa nhãn trị số của biến.


4. Mở các tệp dữ liệu
Các file dữ liệu có các định dạng khác nhau, có
thể mở được bằng phần mềm này:
• Các bảng tính worksheet được lập trong Excel
hoặc Lotus
• Cơ sở dữ liệu được lập dưới định dạng dBASE
và SQL
• Các file dạng text ASCII với kiểu Tabdeliminated
• Các file trong định dạng SPSS được lập trong

các hệ điều hành khác
• Các file dữ liệu SYSTAT


Khởi động SPSS
 Run the tutorial: Chạy chương
trình trợ giúp
 Type in data: Nhập dữ liệu mới
 Run an existing query: Chạy
một truy vấn dữ liệu đã có sẵn
 Create new query using
Database Wizard: Lập một truy
vấn dữ liệu sử dụng Database
Wizard
 Open an existing data source:
Mở file dữ liệu đã có sẵn
(Chú ý: Hộp thoại này chỉ xuất hiện
một lần khi bạn khởi động SPSS)


Để mở một tệp tin {file} Excel

Tại cửa sổ SPSS Data Editor, từ thanh menu chọn: File / Open /
Data…
Trong hộp thoại Open File, chọn file mà bạn muốn mở
Nhắp Open
Trong hộp thoại Open File, chọn nnơi lưu giữ file (Look in); chọn
loại file (Files of type) và sau đó chọn tên file (File name)



5. Hợp nhất các tập dữ liệu
(Merge files)
• SPSS cho phép hợp nhất các dữ liệu từ
trong một tập dữ liệu bên ngoài vào
tập dữ liệu đang sử dụng. Hoặc hợp các
biến mới trong tập dữ liệu bên ngoài
vào tập dữ liệu đang hoạt động. Cả hai
đều tạo ra một tập dữ liệu mới có thể
chứa tất cả các quan sát được hợp lại
hoặc tất cả các biến đưọc hợp tùy theo
ta chọn Add Cases hay Add Variables


5.1 Thêm vào các quan sát
(Add Cases)
• Chọn Data/Merge Files/Adds Cases
Hộp thoại Read File cho phép
ta lựa chọn tập dữ liệu sẽ được
hợp với tập dữ liệu đang hoạt
động (working file). Nhấn
Open để xác nhận việc lựa
chọn này


Add
Cases
Sau khi lựa chọn xong tập dữ sẽ được kết
hợp, ta sẽ có một hộp thoại

Những biến được liệt kê trong hộp thoại

Unpaired Variables là những biến có
những đặc điểm như sau:
Hai biến có tên biến được khai báo khác
nhau
Những biến có dạng dữ liệu khác nhau
Cả hai biến biến cùng là dạng chuổi
nhưng lai không bằng nhau về số ký tự
trong chuổi.

Unpaired Variables: liệt kê các
biến không giống nhau giữa hai
tập dữ liệu đang được tiến hành
hợp nhất lại, các biến không
giống nhau này sẽ bị loại ra và
không có trong tập dữ liệu mới
được tạo ra từ việc hợp nhất hai
tập dữ liệu ban đầu. Các biến này
được ký hiệu khác nhau với ký
hiệu (*) đại diện cho các biến
trong tập dữ liệu đang hoạt động
và (+) đại diện cho các biến
trong tập dữ liệu được truy xuất
từ bên ngoài.

Hộp thoại Variables in New
Working Data File liệt kê các
biến sẽ có trong tập tin mới
được tạo ra từ việc hợp nhất hai
tập dữ liệu ban đầu. Toàn bộ các
biến trong hai tập tin ban đầu

thỏa mãn các điều kiện giống
nhau về tên và loại dữ liệu (số
hoặc chuổi) sẽ được liệt kê vào
hộp thoại này


5.2. Thêm vào các biến (Add
Variables)

• Data/Merge Files/Adds Variables từ menu

Excluded Variables liệt kê các biến
sẽ bị loại trừ ra khỏi biến mới hợp
thành. Những biến này là những biến
có tên biến giống nhau. Biến trong
tập tin đang hoạt động được ký hiệu
là (*), và những biến trong tập tin
bên ngoài là (+). Nếu muốn các biến
giống tên nhau này có trong tập dữ
liệu mới ta phải tiến hành rename nó
lại và chuyển nó sang hộp thoại chứa
các biến sẽ có trong tập tin mới
Key Variables. Biến khóa dựa vào đó các quan sát giống nhau được xác
định. Biến khóa này phải cùng tên ở các hai tập tin cần hợp nhất. Các trường
hợp khơng thỏa mãn với biến khóa thì vẫn bao hàm trong tập dữ liệu mới
nhưng sẽ không được hợp với các trường hợp trong tập tin khác. Những
trường hợp này chỉ chứa đựng giá trị riêng biệt của tập dữ liệu mà nó bao
hàm từ trước (trước khi tiến hành hợp nhất) và các trường hợp này sẽ có giá
trị khuyết trong các biến chứa đựng trong tập tin thứ hai mà ta sẽ hợp nhất.



6. Hiệu đính dữ liệu trong bảng
Data View
Với Data Editor, có thể hiệu đính trị số của
dữ liệu trong bảng Data View theo nhiều
cách. Bạn có thể:
• Thay đổi trị số của dữ liệu
• Cắt, sao chép, và dán các trị số của dữ
liệu
• Thêm vào hoặc xố các đối tượng
• Thêm vào hoặc xố các biến
• Thay đổi trật tự của các biến


6.1 Để thay thế hoặc hiệu đính
một trị số của dữ liệu
Để xoá trị số cũ và nhập một trị
số mới:
• Trong bảng Data View, nhắp đúp



vào ơ. Trị số được thể hiện trong
khoang hiệu đính dữ liệu.



• Hiệu đính trị số trực tiếp từ ơ
hoặc trong khoang hiệu đính dữ •
liệu.

• Nhấn Enter (hoặc chuyển sang ơ



khác) để ghi trị số mới.




Cắt, sao chép và dán các trị
số của dữ liệu
Có thể cắt, sao chép và dán các trị
số của từng ơ hoặc một nhóm các trị
số trong Data Editor. Có thể:
Chuyển hoặc sao chép trị số của
một ơ sang một ô khác.
Chuyển hoặc sao chép trị số của
một ô sang một nhóm các ô.
Chuyển hoặc sao chép trị số của
một đối tượng sang cho một nhóm
các đối tượng.
Chuyển hoặc sao chép trị số của
một biến sang cho một nhóm các
biến.
Chuyển hoặc sao chép trị số của
một nhóm các ô sang cho một nhóm
các ô khác.


6.2 Chèn thêm các đối tượng mới

Để chèn một đối tượng mới giữa các đối
tượng đã có sẵn
• Trong Data View, chọn bất kỳ ô nào
trong đối tượng (hàng) nằm dưới vị trí
nơi mà bạn muốn chèn đối tượng mới.
• Từ thanh menu chọn: Data/Insert Case
Một hàng mới được chèn vào và mọi
biến của đối tượng mới này đều nhận
được trị số khuyết thiếu hệ thống.


6.3 Chèn một biến mới
Để chèn một biến mới giữa các biến đã
có sẵn
• Chọn bất kỳ ơ nào trong biến bên phải
của (bảng Data View) hoặc dưới (của
bảng Variable View) vị trí mà bạn muốn
chèn biến mới vào.
• Từ thanh menu chọn: Data / Insert
Variable
Một hàng mới được chèn vào với trị số
khuyết thiếu hệ thống cho mọi đối
tượng.


6.4 Để chuyển một biến trong
Data Editor
Nếu muốn đặt vị trí biến giữa hai biến đã có
sẵn, hãy chèn một biến vào vị trí nơi bạn
muốn di chuyển biến đến đó

• Đối với biến bạn muốn chuyển, nhắp tên
biến ở đỉnh của cột trong bảng Data View
hoặc số hàng trong bảng Variable View.
Tồn bộ biến sẽ được làm nổi bật/tơ sáng.
• Từ thanh menu chọn : Edit/Cut
• Nhắp vào tên biến (trong bảng Data View)
hoặc số hàng (trong bảng Variable View) nơi
bạn muốn di chuyển biến đến. Toàn bộ biến
này sẽ được mà nổi bật
• Từ thanh menu chọn : Edit/Paste


6.5 Thay đổi loại dữ liệu
Có thể thay đổi loại dữ liệu cho một biến bất
kể lúc nào có sử dụng hộp thoại Variable Type
trong bảng Variable View, và Data Editor sẽ
chuyển đổi các trị số hiện có sang loại mới.
Nếu khơng thể chuyển đổi được thì trị số
khuyết thiếu hệ thống sẽ được chỉ định.


6.6 Tình trạng lọc đối tượng
trong Data Editor

Các đối
tượng bị
lọc (bị
loại trừ)



×