Tải bản đầy đủ (.doc) (12 trang)

Tài liệu Phân tích dữ liệu bằng SPSS - Phần 2 pptx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (252.17 KB, 12 trang )

Phân tích dữ liệu bằng SPSS
CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU
1. Mã hóa lại (Recode)
Recode là cơng cụ dùng để mã hóa lại các giá trị trong một biến thành các giá trị mã
hóa mới phù hợp với đòi hỏi của q trình phân tích dữ liệu. Ví dụ đối với câu hỏi
nguồn gốc nhận biết quảng cáo của sản phẩm X, người trả lời có thể trả lời cụ thể
trên báo Sài Gòn, Tuổi Trẻ, Tạp chí Sức Khỏe và Đời sống, Trên đài HTV7, Trên
đài VTV3, … Có thể ban đầu các nguồn quảng cáo được mã hóa một cách riêng
biệt. Tuy nhiên do nhu cầu xữ lý sau này, người nghiên cứu muốn nhóm các giá
trị được mã hóa riêng biệt này thành ba loại nguồn quảng cáo chính là Báo, Tạp
Chí và Tivi. Cơng cụ Recode cho phép ta định lại các giá trị riêng biệt về nguồn
quảng cáo ban đầu thành ba nguồn quảng cáo chung là Báo, Tivi và tạp chí.
SPSS cung cấp cho ta hai loại Recode là Recode trên cùng một biến (Recode into
same variables) và recode vào biến khác (Recode into different variable).
1.1. Mã hóa lại trên cùng một biến (Recode into same variables)
Recode trên cùng một biến là mã hóa lại những giá trị trong một biến hiện hữu thành
những giá trị mới và các giá trị mới này sẽ nằm ngay trong biến hiện hữu và thay thế
các giá trị củ trên biến đó. Khi sử dụng cơng cụ này ta sẽ mất đi các giá trị đã khai báo
ban đầu trong biến mà ta thực hiện lệnh Recode. Chú ý các giá trị vừa được tạo ra
chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến hành khai báo nhãn cho giá trị
(đã đề cập trong phần khai báo biến). Phương pháp này được thực hiện qua các bước
sau:
- Chọn transform/recode từ thanh menu chính. Ở đây ta lựa chọn Recode into
same variable để tiến hành định lại giá trị của biến trên cùng một biến. Ta có
hộp thoại như hình 5-1:
Biên soạn: Đào Hoài Nam 19
Phân tích dữ liệu bằng SPSS
Hình 5-1
- Chuyển các biến cần mã hóa lại sang hộp thoại variables, nhấn thanh Old and
New Values để chuyển các giá trị củ cần thay đổi thành các giá trị mới. Ta có
hộp thoại Old and New values như hình 5-2:


Hình 5-2
- Old value dùng để khai báo giá trị củ cần chuyển đổi. Giá trị củ này có thể là
một giá trị đơn lẻ(Value), một giá trị khuyết mặc định hay giá trị khuyết khai
báo (System-missing or User-missing), một dãy các giá trị (Range), hoặc
tồn bộ các giá trị nào đó trong biến (All other values). New value dùng để
khai báo giá trị mới sẽ thay thế cho giá trị củ tương ứng. Nhấn thanh Add để
lưu sự chuyển đổi này. Các giá trị chuyển đổi có thể sửa chửa hoặc loại bỏ
bằng cách di chuyển vệt tối đến biểu thức thể hiện sự chuyển đổi trong hộp
thoại Old->New và nhấn thanh Change cho sự thay đổi hoặc Remove để loại
bỏ.
- Nếu việc định lại giá trị của các giá trị của biến có một số điều kiện kèm theo,
ta có thể dùng cơng cụ if để định ra các điều kiện cho lệnh recode. Hộp thoại If
Cases như hình 5-3:
Hình 5-3
Biên soạn: Đào Hoài Nam 20
Phân tích dữ liệu bằng SPSS
- Trong hộp thoại If Cases, mặc định là khơng có điều kiện nào cả, phép định lại
giá trị của biến được thực hiện cho tất cả các quan sát, ở đây hiển thị là
Include all cases. Chọn lệnh include if case satisfies condition để xác định
các điều kiện trong việc định lại giá trị của biến. Chuyển tên biến cần định lại
các giá trị vào hộp thoại bên phải. Lúc này phép định lại giá trị của biến nói
trên chỉ được thực hiện đối với các quan sát nào thỏa mãn được biểu thức điều
kiện được thể hiện trong hộp thoại điều kiện này. Ví dụ chỉ thực hiện lệnh
recode đối với những trường hợp quan sát ở khu vực (biến kvuc) TP.HCM (có
giá trị mã hóa là 2) ta khai báo biểu thức điều kiện như sau kvuc = 2.
1.2. Mã hóa lại vào một biến khác (Recode into different variables)
Trong trường hợp định lại các giá trị hiện tại của một biến thành các giá trị mới trong
một biến mới ta sẽ lựa chọn transform/recode/into different variable và ta có hộp
thoại như hình 5-4:
Hình 5-4

Sử dụng phương pháp recode vào một biến mới máy tính sẽ tự động tạo ra một biến
mới trên cơ sở dữ liệu để chứa các giá trị mới vừa được tạo ra, đồng thời ta cũng vẫn
lưu giữ được biến củ với các giá trị mã hóa củ trên cơ sở dữ liệu. Chú ý các giá trị vừa
được tạo ra chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến hành khai báo nhãn
cho giá trị (đã đề cập trong phần khai báo biến). Việc mã hóa lại các giá trị vào trong
một biến mới được thực hiện qua các bước sau:
- Chuyển tên biến cần định lại giá trị vào trong hộp thoại variables. Khai báo tên
biến mới và nhãn biến mới sẽ chứa các giá trị vừa được mã hóa lại trong hộp
thoại Output variable. Nhấn thanh change để xác nhận sự khái báo này.
- Các cơng cụ If và Old and New Values cũng có ý nghĩa và thao tác tương tự
như trường hợp định lại giá trị cho cùng một biến, đã được đề cập ở phần trên.
Cơng cụ này có ưa điểm là ta vừa tạo ra được một biến mới với các giá trị được mã
hóa theo cách mới nhưng đồng thời vẫn giữa được biến gốc với các giá trị mã hóa ban
đầu. Trong khi với phương pháp mã hóa lại dữ liệu trên cùng một biến, các giá trị mã
hóa mới sẽ chồng lên các giá trị củ và ta đã mất đi các giá trị mã hóa ban đầu trên biến
đó.
Biên soạn: Đào Hoài Nam 21
Phân tích dữ liệu bằng SPSS
2. Cơng cụ tự động mã hóa lại (Automatic Recode)
Là phương pháp mã hóa tự động các giá trị dạng chuổi sang dạng số vào trong một
biến mới. Biến mới này sẽ chứa các con số ngun liên tục, mỗi con số ngun trong
biến mới sẽ đại diện cho các giá trị dạng chuổi giống nhau .
Ví dụ khi ban đầu ta nhập dữ liệu địa bàn nghiên cứu (quận) như Bình Thạnh, Quận 1,
Quận 2, Tân Bình, … ở dạng chuổi. Ta có thể recode các giá trị này thành các giá trị
số như 1, 2, 3 một các tự động bằng cơng cụ Automatic Recode. Và mỗi con số
ngun này sẽ đại diện cho từng địa bàn nghiên cứu, như Quận 1 được chuyển thành
1, quận 2 là 2, …, Quận Tân Bình là 19. Đối với cách Recode này các giá trị ngun
thủy (quận 1, quận 2, …) sẽ được sữ dụng như là nhãn của giá trị đã được recode
trong biến mới được tạo ra từ lệnh Automatic Recode. Các giá trị dạng chuổi được mã
hóa theo thứ tự alphabe.

3. Lựa chọn các quan sát (Select Cases)
Cơng cụ Select Cases đưa ra một vài phương pháp cho phép ta lựa chọn ra những
nhóm nhỏ các trường hợp quan sát dựa trên tiêu chuẩn hay điều kiện cụ thể. Ta cũng
có thể dùng phương pháp này để lựa chọn một mẫu ngẫu nhiên các trường hợp quan
sát từ tổng thể dữ liệu. Để thực hiện lệnh lựa chọn các quan sát này ta chọn
Data/select cases từ menu ta sẽ có hộp thoại như hình 5-5:
Trong hộp thoại Select Cases các biến được liệt kê ở bên trái hộp thoại, Bên phải hộp
thoại liệt kê các dạng lựa chọn. Lựa chọn All Cases là trạng thái lựa chọn mặc định và
ở trạng thái này có ý nghĩa là tồn bộ các trường hợp quan sát đang được lựa chọn.
Chú ý sau khi thực hiện việc chọn lựa các trường hợp. Các thao tác thống kê trong
SPSS lúc này chỉ thực hiện trên các trường hợp được lựa chọn. Do đó sau khi thực
hiện việc phân tích trên các trường hợp được lựa chọn, ta cần trả dữ liệu lại trạng thái
ban đầu (kh6ng có lựa chọn các trường hợp) bằng cách chọn All Cases trong phần
Select của hộp thoại Select Cases.
Trong phần Unselected Cases cho biết trạng thái của các trường hợp khơng được lựa
chọn. Filtered chỉ ra các trường hợp khơng được chọn vẫn được giữ lại trong tập tin
nhưng sẽ bị loại trừ ra mọi phân tích thống kê. Select Cases tạo ra một biến lọc
(FILTER_$), với các trường hợp được chọn có giá trị 1 và các trường hợp khơng
được chọn có giá trị 0. Deleted cho phép loại bỏ tồn bộ các trường hợp khơng được
chọn ra khỏi dữ liệu.
Biên soạn: Đào Hoài Nam 22
Phân tích dữ liệu bằng SPSS
Để nhận biết được các trường hợp nào được chọn hoặc khơng được chọn ta có thể
nhìn vào các giá trị trong biến FILTER_$, các trường hợp được chọn có giá trị 1 và
những trường hợp khơng được chọn có giá trị 0. Hoặc ta có thể nhìn vào màn hình
Data để phân biệt các trường hợp. Với các trường hợp khơng được lựa chọn sẽ có một
gạch chéo trong thanh số thứ tự hàng bên trái màn hình (Xem hình 20). Có thể dùng
cơng cụ Sort Cases để xắp xếp theo thứ tự các trường hợp được chọn hay khơng được
chọn (Sort cases theo biến FILTER_$).
Hình 5-5

Để tiến hành chọn lựa các trường hợp ta có thể dùng các cách sau:
- Lựa chọn cơng cụ If conditions are satisfied (xem hình 5-6) cho phép ta lựa
chọn các trường hợp dựa trên các biểu thức điều kiện. Một biểu thức điều kiện
cho ta các giá trị đúng hoặc sai của các trường hợp. Nếu kết quả của biều thức
điều kiện là đúng, trường hợp đó được lựa chọn. Nếu kết quả này là sai hoặc
thiếu thì các trường hợp đó khơng được chọn. Ví dụ đối với biến giới tính
(GTinh)có hai giá trị là Nam: 1 và Nữ: 2. Ta tiến hành chọn các trường hợp là
Nam bằng cách chọn biến giới tính trong hộp bên trái và chuyển sang hộp bên
phải. Hiễn thị biểu thức điều kiện như sau Gtinh=1. Lúc đó các trường hợp nào
thỏa mãn điều kiện Gtinh=1 sẽ được lựa chọn. Các biểu thức điều kiện có thể
bao gồm tên biến, các hằng số, các tốn tử, các con số, các hàm số, …
- Cơng cụ random sample of cases (hình 5-7) cho phép chúng ta lựa chọn một
mẫu ngẫu nhiên dựa trên một tỷ lệ phần trăm hoặc một số chính xác các trường
hợp sẽ lựa chọn.
Biên soạn: Đào Hoài Nam 23

×