Tải bản đầy đủ (.pdf) (29 trang)

Bài giảng Thống kê kinh doanh và SPSS - Bài 2: Nhập và mở các tệp dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (975.25 KB, 29 trang )

Bài 2
NHẬP VÀ MỞ CÁC TỆP DỮ LIỆU
1. Khái niệm về biến và các giá trị trong biến
2. Phương pháp định biến trong SPSS
3. Nhập dữ liệu
4. Mở các tệp dữ liệu
5. Hợp nhất các tập dữ liệu (Merge files) 
6. Hiệu đính dữ liệu trong bảng Data View
7. Mã hoá lại dữ liệu


1. Khái niệm về biến và 
các giá trị trong biến
• Biến là tập hợp những trả lời cho 
một câu hỏi.
Phân loại biến theo số lượng câu trả lời 
 Biến một trả lời 
 Biến nhiều trả lời  


Biến một trả lời 
• Câu hỏi 1: Hãy cho biết bạn ở nhóm tuổi nào 
trong số những nhóm tuổi sau:
          Nhóm tuổi

code

Dưới 18

 1


18 đến 30
31 đến 40
41 đến 50
Trên 50

 2
 3
 4
 5


Biến nhiều trả lời 
• Câu hỏi 2: Nói đến điện thoại di động, bạn biết được 
những nhãn hiệu nào trong danh sách liệt kê dưới đây:
          Nhãn hiệu
      code
 
Ericson
  
1
         LG                                      2
Motorola
  
3
Nokia
4
        Samsung                              5
Siemens
  
6

Panasonic
  
7
….V.V


Phân loại biến theo kiểu dữ liệu
 Biến định tính 
• Thang đo định danh (nominal scale)
• Thanh đo thứ bậc (ordinal scale)
 Biến định lượng  
• Thang đo khoảng cách (internal scale)
• Thang đo tỷ lệ (ratio)


2. Phương pháp định biến trong 
SPSS (Define Variable) 
• Gán tên (nhãn) cho biến (Name)
• Định dạng kiểu biến (Type) 
• Xác định số lượng con số hiễn thị cho giá trị (Width) và số 
lượng con số sau dấu phẩy hiển thị (Decimals) 
• Gán nhãn cho biến (Variable Label) 
• Định tên cho các giá trị trong biến (Value lables) 
• Định nghĩa các giá trị khuyết (Missing Values) 
• Định kích cở cho cột (Column format) 
• Định ra vị trí hiển thị các giá trị (align) 
• Định ra dạng thang đo mà biến thể hiện (measurement) 


Gán nhãn cho biến (Variable Label



Định dạng kiểu biến (Type)


3. Nhập dữ liệu 

Bạn có thể nhập dữ liệu theo đối tượng hoặc theo biến, hoặc 
theo khu vực được chọn, hoặc theo từng ô 


Một số chú ý

• Ô hoạt động (ô con trỏ) luôn được làm sáng
• Tên  biến  và  số  của  hàng  của  ô  hoạt  động  được  thể  hiện  ở  góc 
cao bên trái của cửa sổ Data Editor. 
• Khi  chọn  một  ô  và  nhập  một  trị  số  thì  nó  sẽ  được  thể  hiện  ở 
khoang hiệu đính dữ liệu nằm ở trên của Data Editor
• Các trị số không được ghi cho đến khi bạn nhấn Enter hoặc chọn 
ô khác
• Để nhập bất kỳ gì khác một dữ liệu dạng số, trước hết phải  định 
nghĩa loại dữ liệu.
• Nếu nhập một trị số vào một cột rỗng, Data Editor tự động tạo ra 
một biến mới và chỉ định một tên biến
• Nếu gõ một ký tự không được chấp nhận bởi loại biến, Data Editor 
sẽ phát ra tiếng kêu bíp và không nhập ký tự.
• Với các biến dạng chuỗi, các ký tự nằm ngoài độ rộng được định 
nghĩa sẽ không được chấp nhận.
• Với các biến dạng số, các trị số nguyên vượt quá độ rộng vẫn có 
thể  được  nhập  vào,  nhưng  Data  Editor  thể  hiện  hoặc  là  chú  giải 

khoa học hoặc là các dấu hoa thị trong ô để chỉ ra rằng trị số này 
rộng hơn độ rộng được định nghĩa. Để thể hiện trị số trong ô, thay 
đổi độ rộng của biến 


Để sử dụng nhãn của trị số khi 
nhập dữ liệu 
• Nếu  nhãn  trị  số  không  xuất  hiện  trong  bảng  Data 
View, từ thanh menu chọn:  View /  Value Labels
• Nhắp lên ô mà trong đó bạn muốn nhập trị số
• Chọn một nhãn trị số từ danh sách mở xuống
• Trị số được nhập vào và nhãn trị số được thể hiện 
trong ô.
Chú ý: Điều này chỉ làm việc nếu bạn đã định nghĩa 
nhãn trị số của biến.


4. Mở các tệp dữ liệu
Các file dữ liệu có các định dạng khác nhau, có thể 
mở được bằng phần mềm này:
• Các bảng tính worksheet được lập trong Excel hoặc 
Lotus
• Cơ sở dữ liệu được lập dưới định dạng dBASE và SQL
• Các file dạng text ASCII với kiểu Tab­deliminated
• Các file trong định dạng SPSS được lập trong các hệ 
điều hành khác
• Các file dữ liệu SYSTAT


Khởi động SPSS

 Run the tutorial: Chạy chương trình 
trợ giúp
 Type in data: Nhập dữ liệu mới
 Run an existing query: Chạy một 
truy vấn dữ liệu đã có sẵn
 Create new query using Database 
Wizard: Lập một truy vấn dữ liệu sử 
dụng Database Wizard
 Open an existing data source: Mở 
file dữ liệu đã có sẵn
(Chú ý: Hộp thoại này chỉ xuất hiện một 
lần khi bạn khởi động SPSS)


Để mở một tệp tin {file} Excel

Tại cửa sổ SPSS Data Editor, từ thanh menu chọn: File / Open / Data…
Trong hộp thoại Open File, chọn file mà bạn muốn mở
Nhắp Open
Trong hộp thoại Open File, chọn nnơi lưu giữ file (Look in); chọn loại file 
(Files of type) và sau đó chọn tên file (File name) 


5. Hợp nhất các tập dữ liệu 
(Merge files) 
• SPSS cho phép hợp nhất các dữ liệu từ trong 
một tập dữ liệu bên ngoài vào tập dữ liệu đang 
sử dụng. Hoặc hợp các biến mới trong tập dữ 
liệu bên ngoài vào tập dữ liệu đang hoạt động. 
Cả hai đều tạo ra một tập dữ liệu mới có thể 

chứa tất cả các quan sát được hợp lại hoặc tất 
cả các biến đưọc hợp tùy theo ta chọn Add 
Cases hay Add Variables 


5.1 Thêm vào các quan sát (Add 
Cases)


Chọn Data/Merge Files/Adds Cases 
Hộp thoại Read File cho phép ta 
lựa chọn tập dữ liệu sẽ được hợp 
với tập dữ liệu đang hoạt động 
(working file). Nhấn Open để xác 
nhận việc lựa chọn này 


Add Cases
Sau khi lựa chọn xong tập dữ sẽ được kết 
hợp, ta sẽ có một hộp thoại

Những  biến  được  liệt  kê  trong  hộp  thoại 
Unpaired  Variables  là  những  biến  có  những 
đặc điểm như sau:
Hai biến có tên biến được khai báo khác nhau 
Những biến có dạng dữ liệu khác nhau
Cả hai biến biến cùng là dạng chuổi nhưng lai 
không bằng nhau về số ký tự trong chuổi.

Unpaired  Variables:  liệt  kê  các  biến 

không  giống  nhau  giữa  hai  tập  dữ 
liệu  đang  được  tiến  hành  hợp  nhất 
lại,  các  biến  không  giống  nhau  này 
sẽ bị loại ra và không có trong tập dữ 
liệu mới được tạo ra từ việc hợp nhất 
hai tập dữ liệu ban đầu. Các biến này 
được  ký  hiệu  khác  nhau  với  ký  hiệu 
(*) đại diện cho các biến trong tập dữ 
liệu  đang  hoạt  động  và  (+)  đại  diện 
cho  các  biến  trong  tập  dữ  liệu  được 
truy xuất từ bên ngoài. 

Hộp thoại Variables in New Working 
Data File liệt kê các biến sẽ có trong 
tập  tin  mới  được  tạo  ra  từ  việc  hợp 
nhất  hai  tập  dữ  liệu  ban  đầu.  Toàn 
bộ các biến trong hai tập tin ban đầu 
thỏa  mãn  các  điều  kiện  giống  nhau 
về  tên  và  loại  dữ  liệu  (số  hoặc 
chuổi) sẽ được liệt kê vào hộp thoại 
này 




5.2. Thêm vào các biến (Add 
Variables)

Data/Merge Files/Adds Variables từ menu 


Excluded Variables liệt kê các biến sẽ bị 
loại trừ ra khỏi biến mới hợp thành. Những 
biến  này  là  những  biến  có  tên  biến  giống 
nhau.  Biến  trong  tập  tin  đang  hoạt  động 
được  ký  hiệu  là  (*),  và  những  biến  trong 
tập  tin  bên  ngoài  là  (+).  Nếu  muốn  các 
biến  giống  tên  nhau  này  có  trong  tập  dữ 
liệu mới ta phải tiến hành rename nó lại và 
chuyển  nó  sang  hộp  thoại  chứa  các  biến 
sẽ có trong tập tin mới
Key  Variables.  Biến  khóa  dựa  vào  đó  các  quan  sát  giống  nhau  được  xác  định.  Biến 
khóa này phải cùng tên ở các hai tập tin cần hợp nhất. Các trường hợp không thỏa mãn 
với biến khóa thì vẫn bao hàm trong tập dữ liệu mới nhưng sẽ không được hợp với các 
trường hợp trong  tập tin khác. Những trường hợp này  chỉ chứa  đựng  giá trị riêng  biệt 
của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và các trường 
hợp  này  sẽ  có  giá  trị  khuyết  trong  các  biến  chứa  đựng  trong  tập  tin  thứ  hai  mà  ta  sẽ 
hợp nhất.


6. Hiệu đính dữ liệu trong bảng Data 
View 
Với Data Editor, có thể hiệu đính trị số của dữ liệu 
trong bảng Data View theo nhiều cách. Bạn có thể:
• Thay đổi trị số của dữ liệu
• Cắt, sao chép, và dán các trị số của dữ liệu
• Thêm vào hoặc xoá các đối tượng
• Thêm vào hoặc xoá các biến
• Thay đổi trật tự của các biến



6.1 Để thay thế hoặc hiệu đính một 
trị số của dữ liệu
Để  xoá  trị  số  cũ  và  nhập  một  trị  số 
mới:

• Trong bảng Data View, nhắp đúp vào 
ô.  Trị  số  được  thể  hiện  trong  khoang 
hiệu đính dữ liệu.

•  Hiệu  đính  trị  số  trực  tiếp  từ  ô  hoặc 

trong khoang hiệu đính dữ liệu.
•  Nhấn  Enter  (hoặc  chuyển  sang  ô 
khác) để ghi trị số mới.





Cắt,  sao  chép  và  dán  các  trị  số 
của dữ liệu
  Có  thể  cắt,  sao  chép  và  dán  các  trị  số 
của  từng  ô  hoặc  một  nhóm  các  trị  số 
trong Data Editor. Có thể:
  Chuyển  hoặc  sao  chép  trị  số của  một  ô 
sang một ô khác.
  Chuyển  hoặc  sao  chép  trị  số của  một  ô 
sang một nhóm các ô.
 Chuyển hoặc sao chép trị số của một đối 
tượng sang cho một nhóm các đối tượng.

  Chuyển  hoặc  sao  chép  trị  số  của  một 
biến sang cho một nhóm các biến.
  Chuyển  hoặc  sao  chép  trị  số  của  một 
nhóm  các  ô  sang  cho  một  nhóm  các  ô 
khác.


6.2 Chèn thêm các đối tượng mới 
Để  chèn  một  đối  tượng  mới  giữa  các  đối  tượng 
đã có sẵn
• Trong  Data  View,  chọn  bất  kỳ  ô  nào  trong  đối 
tượng  (hàng)  nằm  dưới  vị  trí  nơi  mà  bạn  muốn 
chèn đối tượng mới.
• Từ thanh menu chọn: Data/Insert Case
   Một hàng mới được chèn vào và mọi biến của đối 
tượng  mới  này  đều  nhận  được  trị  số  khuyết  thiếu 
hệ thống.


6.3 Chèn một biến mới 
Để chèn một biến mới giữa các biến đã có sẵn
• Chọn  bất  kỳ  ô  nào  trong  biến  bên  phải  của 
(bảng Data View) hoặc dưới (của bảng Variable 
View) vị trí mà bạn muốn chèn biến mới vào.
• Từ thanh menu chọn: Data /
Insert Variable
Một  hàng  mới  được  chèn  vào  với  trị  số  khuyết 
thiếu hệ thống cho mọi đối tượng.



6.4 Để chuyển một biến trong Data 
Editor 
Nếu muốn đặt vị trí biến giữa hai biến đã có sẵn, hãy chèn 
một biến vào vị trí nơi bạn muốn di chuyển biến đến đó
• Đối với biến bạn muốn chuyển, nhắp tên biến ở đỉnh 
của cột trong bảng Data View hoặc số hàng trong bảng 
Variable View. Toàn bộ biến sẽ được làm nổi bật/tô 
sáng.
• Từ thanh menu chọn :  Edit/Cut
• Nhắp vào tên biến (trong bảng Data View) hoặc số hàng 
(trong bảng Variable View) nơi bạn muốn di chuyển biến 
đến. Toàn bộ biến này sẽ được mà nổi bật
• Từ thanh menu chọn :  Edit/Paste


6.5 Thay đổi loại dữ liệu 
    Có thể thay đổi loại dữ liệu cho một biến bất kể lúc nào 
có  sử  dụng  hộp  thoại  Variable  Type  trong  bảng  Variable 
View,  và  Data  Editor  sẽ  chuyển  đổi  các  trị  số  hiện  có 
sang  loại  mới.  Nếu không thể chuyển  đổi  được thì trị số 
khuyết thiếu hệ thống sẽ được chỉ định.


6.6 Tình trạng lọc đối tượng 
trong Data Editor 

Các  đối 
tượng  bị 
lọc  (bị 
loại trừ)



×