chương 5 các phép biến đổi và thao tác trên tập dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (279.07 KB, 13 trang )

Phân tích dữ liệu bằng SPSS
CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU
1. Mã hóa l i (Recode)ạ
Recode là cơng c dùng mã hóa l i các giá tr trong m t bi n thành các giá tr mã hóaụ để ạ ị ộ ế ị
m i phù h p v i òi h i c a q trình phân tích d li u. Ví d i v i câu h iớ ợ ớ đ ỏ ủ ữ ệ ụ đố ớ ỏ
ngu n g c nh n bi t qu ng cáo c a s n ph m X, ng i tr l i có th tr l iồ ố ậ ế ả ủ ả ẩ ườ ả ờ ể ả ờ
c th trên báo Sài Gòn, Tu i Tr , T p chí S c Kh e và i s ng, Trên ài HTV7,ụ ể ổ ẻ ạ ứ ỏ Đờ ố đ
Trên ài VTV3, … Có th ban u các ngu n qu ng cáo c mã hóa m t cách riêngđ ể đầ ồ ả đượ ộ
bi t. Tuy nhiên do nhu c u x lý sau này, ng i nghiên c u mu n nhóm các giá trệ ầ ữ ườ ứ ố ị
c mã hóa riêng bi t này thành ba lo i ngu n qu ng cáo chính là Báo, T p Chí vàđượ ệ ạ ồ ả ạ
Tivi. Cơng c Recode cho phép ta nh l i các giá tr riêng bi t v ngu n qu ngụ đị ạ ị ệ ề ồ ả
cáo ban u thành ba ngu n qu ng cáo chung là Báo, Tivi và t p chí.đầ ồ ả ạ
SPSS cung c p cho ta hai lo i Recode là Recode trên cùng m t bi n (Recode intoấ ạ ộ ế
same variables) và recode vào bi n khác (Recode into different variable).ế
1.1. Mã hóa lại trên cùng một biến (Recode into same variables)
Recode trên cùng một biến là mã hóa lại những giá trị trong một biến hiện
hữu thành những giá trị mới và các giá trị mới này sẽ nằm ngay trong biến
hiện hữu và thay thế các giá trị củ trên biến đó. Khi sử dụng cơng cụ này ta
sẽ mất đi các giá trị đã khai báo ban đầu trong biến mà ta thực hiện lệnh
Recode. Chú ý các giá trị vừa được tạo ra chưa có nhãn, do đó sau khi thực
hiện lệnh ta phải tiến hành khai báo nhãn cho giá trị (đã đề cập trong phần
khai báo biến). Phương pháp này được thực hiện qua các bước sau:
- Ch n ọ transform/recode t thanh menu chính. ây ta l a ch n ừ Ở đ ự ọ Recode
into same variable ti n hành nh l i giá tr c a bi n trên cùng m t bi n.để ế đị ạ ị ủ ế ộ ế
Ta có h p tho i nh hình 5-1:ộ ạ ư
Biên soạn: Đào Hoài Nam 19
Phân tích dữ liệu bằng SPSS
Hình 5-1
- Chuy n các bi n c n mã hóa l i sang h p tho i variables, nh n thanh Oldể ế ầ ạ ộ ạ ấ
and New Values chuy n các giá tr c c n thay i thành các giá tr m i.để ể ị ủ ầ đổ ị ớ
Ta có h p tho i Old and New values nh hình 5-2:ộ ạ ư

Hình 5-2
- Old value dùng khai báo giá tr c c n chuy n i. Giá tr c này có th làđể ị ủ ầ ể đổ ị ủ ể
m t giá tr n lộ ị đơ ẻ(Value), m t giá tr khuy t m c nh hay giá tr khuy tộ ị ế ặ đị ị ế
khai báo (System-missing or User-missing), m t dãy các giá tr ộ ị (Range), ho cặ
tồn b các giá tr nào ó trong bi n (ộ ị đ ế All other values). New value dùng để
khai báo giá tr m i s thay th cho giá tr c t ng ng. Nh n thanh ị ớ ẽ ế ị ủ ươ ứ ấ Add
l u s chuy n i này. Các giá tr chuy n i có th s a ch a ho c lo iđể ư ự ể đổ ị ể đổ ể ử ử ặ ạ
b b ng cách di chuy n v t t i n bi u th c th hi n s chuy n iỏ ằ ể ệ ố đế ể ứ ể ệ ự ể đổ
trong h p tho i ộ ạ Old->New và nh n thanh ấ Change cho s thay i ho cự đổ ặ
Remove lo i b . để ạ ỏ
- N u vi c nh l i giá tr c a các giá tr c a bi n có m t s i u ki n kèmế ệ đị ạ ị ủ ị ủ ế ộ ố đ ề ệ
theo, ta có th dùng cơng c ể ụ if nh ra các i u ki n cho l nh recode.để đị đ ề ệ ệ
H p tho i ộ ạ If Cases nh hình 5-3:ư
Biên soạn: Đào Hoài Nam 20
Phân tích dữ liệu bằng SPSS
Hình 5-3
- Trong h p tho i ộ ạ If Cases, m c nh là khơng có i u ki n nào c , phép nhặ đị đ ề ệ ả đị
l i giá tr c a bi n c th c hi n cho t t c các quan sát, ây hi n th làạ ị ủ ế đượ ự ệ ấ ả ở đ ể ị
Include all cases. Ch n l nh ọ ệ include if case satisfies condition xácđể
nh các i u ki n trong vi c nh l i giá tr c a bi n. Chuy n tên bi n c nđị đ ề ệ ệ đị ạ ị ủ ế ể ế ầ
nh l i các giá tr vào h p tho i bên ph i. Lúc này phép nh l i giá tr c a bi nđị ạ ị ộ ạ ả đị ạ ị ủ ế
nói trên ch c th c hi n i v i các quan sát nào th a mãn c bi u th cỉ đượ ự ệ đố ớ ỏ đượ ể ứ
i u ki n c th hi n trong h p tho i i u ki n này. Ví d ch th cđ ề ệ đượ ể ệ ộ ạ đ ề ệ ụ ỉ ự
hi n l nh recode i v i nh ng tr ng h p quan sát khu v c (bi nệ ệ đố ớ ữ ườ ợ ở ự ế
kvuc) TP.HCM (có giá tr mã hóa là 2) ta khai báo bi u th c i u ki n nh sauị ể ứ đ ề ệ ư
kvuc = 2.
1.2. Mã hóa l i vào m t bi n khác (Recode into different variables)ạ ộ ế
Trong trường hợp định lại các giá trị hiện tại của một biến thành các giá trị
mới trong một biến mới ta sẽ lựa chọn transform/recode/into different
variable và ta có hộp thoại như hình 5-4:

Hình 5-4
S d ng ph ng pháp recode vào m t bi n m i máy tính s t ng t o ra m tử ụ ươ ộ ế ớ ẽ ự độ ạ ộ
bi n m i trên c s d li u ch a các giá tr m i v a c t o ra, ng th iế ớ ơ ở ữ ệ để ứ ị ớ ừ đượ ạ đồ ờ
ta c ng v n l u gi c bi n c v i các giá tr mã hóa c trên c s d li u. Chú ýũ ẫ ư ữ đượ ế ủ ớ ị ủ ơ ở ữ ệ
các giá tr v a c t o ra ch a có nhãn, do ó sau khi th c hi n l nh ta ph i ti nị ừ đượ ạ ư đ ự ệ ệ ả ế
hành khai báo nhãn cho giá tr ( ã c p trong ph n khai báo bi n). Vi c mã hóa l iị đ đề ậ ầ ế ệ ạ
các giá tr vào trong m t bi n m i c th c hi n qua các b c sau:ị ộ ế ớ đượ ự ệ ướ
- Chuy n tên bi n c n nh l i giá tr vào trong h p tho i ể ế ầ đị ạ ị ộ ạ variables. Khai báo
tên bi n m i và nhãn bi n m i s ch a các giá tr v a c mã hóa l i trongế ớ ế ớ ẽ ứ ị ừ đượ ạ
h p tho i ộ ạ Output variable. Nh n thanh ấ change xác nh n s khái báo này.để ậ ự
Biên soạn: Đào Hoài Nam 21
Phân tích dữ liệu bằng SPSS
- Các cơng c ụ If và Old and New Values c ng có ý ngh a và thao tác t ng tũ ĩ ươ ự
nh tr ng h p nh l i giá tr cho cùng m t bi n, ã c c p ư ườ ợ đị ạ ị ộ ế đ đượ đề ậ ở
ph n trên.ầ
Cơng c này có a i m là ta v a t o ra c m t bi n m i v i các giá tr c mãụ ư đ ể ừ ạ đượ ộ ế ớ ớ ị đượ
hóa theo cách m i nh ng ng th i v n gi a c bi n g c v i các giá tr mã hóaớ ư đồ ờ ẫ ữ đượ ế ố ớ ị
ban u. Trong khi v i ph ng pháp mã hóa l i d li u trên cùng m t bi n, các giá trđầ ớ ươ ạ ữ ệ ộ ế ị
mã hóa m i s ch ng lên các giá tr c và ta ã m t i các giá tr mã hóa ban u trênớ ẽ ồ ị ủ đ ấ đ ị đầ
bi n ó.ế đ
2. Cơng cụ tự động mã hóa lại (Automatic Recode)
Là ph ng pháp mã hóa t ng các giá tr d ng chu i sang d ng s vào trong m tươ ự độ ị ạ ổ ạ ố ộ
bi n m i. Bi n m i này s ch a các con s ngun liên t c, m i con s ngunế ớ ế ớ ẽ ứ ố ụ ỗ ố
trong bi n m i s i di n cho các giá tr d ng chu i gi ng nhau . ế ớ ẽ đạ ệ ị ạ ổ ố
Ví d khi ban u ta nh p d li u a bàn nghiên c u (qu n) nh Bình Th nh,ụ đầ ậ ữ ệ đị ứ ậ ư ạ
Qu n 1, Qu n 2, Tân Bình, … d ng chu i. Ta có th recode các giá tr này thành cácậ ậ ở ạ ổ ể ị
giá tr s nh 1, 2, 3 m t các t ng b ng cơng c Automatic Recode. Và m iị ố ư ộ ự độ ằ ụ ỗ
con s ngun này s i di n cho t ng a bàn nghiên c u, nh Qu n 1 cố ẽ đạ ệ ừ đị ứ ư ậ đượ
chuy n thành 1, qu n 2 là 2, …, Qu n Tân Bình là 19. i v i cách Recode này các giáể ậ ậ Đố ớ
tr ngun th y (qu n 1, qu n 2, …) s c s d ng nh là nhãn c a giá tr ãị ủ ậ ậ ẽ đượ ữ ụ ư ủ ị đ

c recode trong bi n m i c t o ra t l nh Automatic Recode. Các giá trđượ ế ớ đượ ạ ừ ệ ị
d ng chu i c mã hóa theo th t alphabe.ạ ổ đượ ứ ự
3. Lựa chọn các quan sát (Select Cases)
Cơng cụ Select Cases đưa ra một vài phương pháp cho phép ta lựa chọn ra
những nhóm nhỏ các trường hợp quan sát dựa trên tiêu chuẩn hay điều kiện
cụ thể. Ta cũng có thể dùng phương pháp này để lựa chọn một mẫu ngẫu
nhiên các trường hợp quan sát từ tổng thể dữ liệu. Để thực hiện lệnh lựa
chọn các quan sát này ta chọn Data/select cases từ menu ta sẽ có hộp
thoại như hình 5-5:
Trong hộp thoại Select Cases các biến được liệt kê ở bên trái hộp thoại,
Bên phải hộp thoại liệt kê các dạng lựa chọn. Lựa chọn All Cases là trạng
thái lựa chọn mặc định và ở trạng thái này có ý nghĩa là tồn bộ các trường
hợp quan sát đang được lựa chọn.
Chú ý sau khi thực hiện việc chọn lựa các trường hợp. Các thao tác thống
kê trong SPSS lúc này chỉ thực hiện trên các trường hợp được lựa chọn. Do
đó sau khi thực hiện việc phân tích trên các trường hợp được lựa chọn, ta
cần trả dữ liệu lại trạng thái ban đầu (kh6ng có lựa chọn các trường hợp)
bằng cách chọn All Cases trong phần Select của hộp thoại Select Cases.
Trong ph n ầ Unselected Cases cho bi t tr ng thái c a các tr ng h p khơng cế ạ ủ ườ ợ đượ
l a ch n. ự ọ Filtered ch ra các tr ng h p khơng c ch n v n c gi l iỉ ườ ợ đượ ọ ẫ đượ ữ ạ
trong t p tin nh ng s b lo i tr ra m i phân tích th ng kê. Select Cases t o raậ ư ẽ ị ạ ừ ọ ố ạ
Biên soạn: Đào Hoài Nam 22
Phân tích dữ liệu bằng SPSS
m t bi n l c ộ ế ọ (FILTER_$), v i các tr ng h p c ch n có giá tr 1 và các tr ngớ ườ ợ đượ ọ ị ườ
h p khơng c ch n có giá tr 0. ợ đượ ọ ị Deleted cho phép lo i b tồn b các tr ng h pạ ỏ ộ ườ ợ
khơng c ch n ra kh i d li u.đượ ọ ỏ ữ ệ
Để nhận biết được các trường hợp nào được chọn hoặc khơng được chọn
ta có thể nhìn vào các giá trị trong biến FILTER_$, các trường hợp được
chọn có giá trị 1 và những trường hợp khơng được chọn có giá trị 0. Hoặc ta
có thể nhìn vào màn hình Data để phân biệt các trường hợp. Với các trường

hợp khơng được lựa chọn sẽ có một gạch chéo trong thanh số thứ tự hàng
bên trái màn hình (Xem hình 20). Có thể dùng cơng cụ Sort Cases để xắp
xếp theo thứ tự các trường hợp được chọn hay khơng được chọn (Sort
cases theo biến FILTER_$).
Hình 5-5
ti n hành ch n l a các tr ng h p ta có th dùng các cách sau:Để ế ọ ự ườ ợ ể
- Lựa chọn cơng cụ If conditions are satisfied (xem hình 5-6) cho
phép ta lựa chọn các trường hợp dựa trên các biểu thức điều kiện.
Một biểu thức điều kiện cho ta các giá trị đúng hoặc sai của các
trường hợp. Nếu kết quả của biều thức điều kiện là đúng, trường hợp
đó được lựa chọn. Nếu kết quả này là sai hoặc thiếu thì các trường
hợp đó khơng được chọn. Ví dụ đối với biến giới tính (GTinh)có hai
giá trị là Nam: 1 và Nữ: 2. Ta tiến hành chọn các trường hợp là Nam
bằng cách chọn biến giới tính trong hộp bên trái và chuyển sang hộp
bên phải. Hiễn thị biểu thức điều kiện như sau Gtinh=1. Lúc đó các
trường hợp nào thỏa mãn điều kiện Gtinh=1 sẽ được lựa chọn. Các
biểu thức điều kiện có thể bao gồm tên biến, các hằng số, các tốn tử,
các con số, các hàm số, …
Biên soạn: Đào Hoài Nam 23
Phân tích dữ liệu bằng SPSS
- Cơng cụ random sample of cases (hình 5-7) cho phép chúng ta lựa
chọn một mẫu ngẫu nhiên dựa trên một tỷ lệ phần trăm hoặc một số
chính xác các trường hợp sẽ lựa chọn.
- Cơng cụ Base range (hình 5-8) cho phép lựa chọn các trưòng hợp
theo số thứ tự hàng hiễn thị bên trái màn hình dữ liệu của SPSS
Hình 5-6
Hình 5-7
Hình 5-8
4. Tách tập dữ liệu (Split File)
Cơng cụ Split File cho phép tách dữ liệu trong tập dữ liệu đang quan sát

thành những nhóm nhỏ riêng biệt và sau khi thực hiện lệnh Split file này các
phân tích xữ lý thống kê sẽ cho ta các kết quả thống kê đã được thực hiện
riêng biệt theo từng nhóm nhỏ dữ liệu này.
Biên soạn: Đào Hoài Nam 24
Phân tích dữ liệu bằng SPSS
Để thực hiện lệnh này ta chọn Data/Split File từ menu ta có hộp thoại như
hình 5-9:
Hình 5-9
Việc phân tách này dựa trên việc phân dữ liệu thành những nhóm tương
đương với các giá trị trong biến được lựa chọn để tiến hành phân nhóm.
Được sử dụng cho việc phân tích dựa trên những giá trị của một hay nhiều
biến đã được phân nhóm. Nếu ta lựa chọn việc phân tách dựa trên nhiều
biến, dữ liệu sẽ được nhóm theo thứ tự biến được khai báo trong hộp thoại
Groups Based On list.
- Chọn Compare groups: Các dữ liệu phân tích sẽ được tách theo các
giá trị của biến được lựa chọn để tách dữ liệu (hiễn thị trong hộp
Groups Based On list), và việc tách này mang tính chất so sánh do
đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách
này những vẫn được thể hiện trên cùng một bảng.
- Chọn Organize output by groups: Các dữ liệu phân tích sẽ được
tách theo các giá trị của biến được lựa chọn để tách dữ liệu (hiễn thị
trong hộp Groups Based On list), và việc tách này mang tính chất tổ
chức lại dữ liệu thành những nhóm nhỏ do đó khi tiến hành phân tích
dữ liệu các phân tích dựa trên sự phân tách và được thể hiện một các
riêng biệt giữa các nhóm phân tách
Chú ý sau ki tiến hành phân tích trên sự phân tách, để trở lại trạng thái bình
thường của dữ liệu đòi hỏi phải bỏ đi lệnh tách dữ liệu vừa đưa ra bằng cách
chọn phần Analyze all cases, do not create groups trong hộp thoại Slipt
Files
5. Cơng cụ tính tốn giữa các biến (Compute)

Biên soạn: Đào Hoài Nam 25
Phân tích dữ liệu bằng SPSS
Cơng c compute c dùng tính tốn gi a các giá tr trong các bi n và k t quụ đượ để ữ ị ế ế ả
s c l u gi trong m t bi n m i ho c là m t bi n khác s n có ho c bi nẽ đượ ư ữ ộ ế ớ ặ ộ ế ẳ ặ ế
ch a ng giá tr ang tính tốn. ứ đự ị đ
Để thực hiện cơng cụ này ta truy xuất cơng cụ compute variable từ
transform trên thanh menu ta có hộp thoại như hình 5-10:
Hình 5-10
- Target variable ch a ng tên bi n s nh n giá tr c tính. Ta có th kháiứ đự ế ẽ ậ ị đượ ể
báo ki u và gán nhãn cho các giá tr c a bi n b ng cách nh n vào thanhể ị ủ ế ằ ấ
Type&lable. Ơ Numeric Expression ch a ng các bi u th c s c dùngứ đự ể ứ ố đượ
tính giá tr cho bi n ích (bi n ch a ng giá tr m i), bi u th c này cóđể ị ế đ ế ứ đự ị ớ ể ứ
th dùng tên các bi n s n có, các h ng, các tốn t và các hàm s . Chúng ta co thể ế ẵ ằ ử ố ể
so n các bi u th c tính tốn vào th ng ơ ạ ể ứ ẵ Numeric Expression, và có th sể ữ
d ng các cơng c c hi n th trong h p tho i nh các phi m ụ ụ đượ ể ị ộ ạ ư ế (+), (-),
Function,…
- Cơng c ụ if dùng nh ra nh ng i u ki n c n thi t kèm theo trong tínhđể đị ữ đ ề ệ ầ ế
tốn n u có, c s d ng gi ng nh gi ng nh cơng c ế đượ ử ụ ố ứ ố ư ụ if trong h pộ
tho i ạ recode, ã c c p ph n trên.đ đượ đề ậ ở ầ
6. Cơng c m (Count)ụ đế
Biên soạn: Đào Hoài Nam 26
Phân tích dữ liệu bằng SPSS
Cơng cụ này được dùng để tạo ra một biến mới chứa kết quả số lần xuất
hiện (số đếm) của một giá trị hay nhiều giá trị được chỉ định ra trong danh
sách các biến được chọn trong ơ variables trong mỗi trường hợp. Từ
menus ta chọn Transform/count để có được hộp thoại như hình 5-11
Hình 5-11
M t bi n m i s c t o ra khi ta th c hi n th t c Count g i là bi n íchộ ế ớ ẽ đượ ạ ự ệ ủ ụ ọ ế đ
(Taget variable) s ch a ng giá tr c ng d n m i khi g p c giá tr c nẽ ứ đự ị ộ ồ ỗ ặ đượ ị ầ
m trong m t ho c nhi u bi n ã c khai báo tr c trong h p tho i đế ộ ặ ề ế đ đượ ướ ộ ạ Numeric

variables.
Giá tr c n m s c nh rõ trong ph n ị ầ đế ẽ đượ đị ầ Define values (hình 5-12). Giá tr khaiị
báo m có th là nh ng giá tr c th nàu ó để đế ể ữ ị ụ ể đ (Value), ho c nh ng giá tr r ngặ ữ ị ỗ
(System missing) ho c là m t dãy các giá tr ặ ộ ị (range). Sau khi khai báo giá tr c nị ầ
m ta dùng thanh đế Add xác nh n giá tr c n m vào trong h p tho i để ậ ị ầ đế ộ ạ Values to
count. S d ng ử ụ Change ho c ặ Remove thay th ho c lo i b giá tr c n mđể ế ặ ạ ỏ ị ầ đế
(giá tr ã c ánh d u b ng v t en).ị đ đượ đ ấ ằ ế đ
Hình 5-12
Biên soạn: Đào Hoài Nam 27
Phân tích dữ liệu bằng SPSS
Cơng c If dùng xác nh các i u ki n n u có khi th c hi n l nh Count, (gi ngụ để đị đ ề ệ ế ự ệ ệ ố
nh cơng c if trong ph n recode ã c c p trên)ư ụ ầ đ đưọ đề ậ ở
7. Hợp nhất các tập dữ liệu (Merge files)
SPSS cho phép ta h p các d li u quan sát t trong m t t p d li u bên ngồi vào t pợ ữ ệ ừ ộ ậ ữ ệ ậ
d li u ang s d ng. Ho c h p các bi n m i trong t p d li u bên ngồi vào t pữ ệ đ ử ụ ặ ợ ế ớ ậ ữ ệ ậ
d li u ang ho t ng. C hai u t o ra m t t p d li u m i có th ch aữ ệ đ ạ độ ả đề ạ ộ ậ ữ ệ ớ ể ứ
t t c các quan sát c h p l i ho c t t c các bi n c h p tùy theo ta ch nấ ả đượ ợ ạ ặ ấ ả ế đưọ ợ ọ
Add Cases hay Add Variables
7.1. Thêm vào các quan sát (Add Cases)
Cơng c Add Cases cho phép ta h p d li u trong t p d li u ang ho t ngụ ợ ữ ệ ậ ữ ệ đ ạ độ
v i d li u trong m t t p d li u bên ngồi, v i i u ki n t p d li u ó ph iớ ữ ệ ộ ậ ữ ệ ớ đ ề ệ ậ ữ ệ đ ả
ch a các bi n gi ng nh bi n trong t p d li u ang ho t ng. Sau khi thao tác,ứ ế ố ư ế ậ ữ ệ đ ạ độ
m t t p d li u m i (ch a c khai báo tên, và ta ph i ti n hành l u và khai báo tênộ ậ ữ ệ ớ ư đượ ả ế ư
m i) s c t o ra ch a các d li u trong c hai t p d li u v a c h p l iớ ẽ đượ ạ ứ ữ ệ ả ậ ữ ệ ừ đượ ợ ạ
v i nhau. Trong tr ng h p hai t p d li u h p v i nhau nh ng có các bi n khácớ ườ ợ ậ ữ ệ ợ ớ ư ế
nhau (khác nhau v tên bi n ho c lo i bi n) thì sau khi h p t p d li u m i s tề ế ặ ạ ế ợ ậ ữ ệ ớ ẽ ự
ng lo i b các bi n khác nhau này, ta có th s b m t d li u ch a trong cácđộ ạ ỏ ế ể ẽ ị ấ ữ ệ ứ
bi n b lo i b này.ế ị ạ ỏ
Cơng cụ này rất thích hợp cho việc hợp nhất dữ liệu nghiên cứu ở các khu
vực khác nhau, ví dụ như một cuộc khảo sát được tiến hành ở ba khu vực

Hà Nội, Đà Nẵng, và TP.HCM, dữ liệu thu thập về sẽ được nhập, chỉnh sửa
cho ba khu vực riêng biệt. Tuy nhiên sau đó ta có thể tiến hành hợp dữ liệu
ở ba khu vực này vào một tập dữ liệu thống nhất để tiến hành phân tích và
xữ lý. Chú ý phải thống nhất về các tên biến, loại biến và số lượng biến trong
cả ba khu vực trước khi nhập 3 file này lại với nhau.
Chọn Data/Merge Files/Adds Cases (Xem hình 5-13)
Hình 5-13
Biên soạn: Đào Hoài Nam 28
Phân tích dữ liệu bằng SPSS
H p tho i ộ ạ Read File cho phép ta l a ch n t p d li u s c h p v i t p dự ọ ậ ữ ệ ẽ đượ ợ ớ ậ ữ
li u ang ho t ng ệ đ ạ độ (working file). Nh n ấ Open xác nh n vi c l a ch n nàyđể ậ ệ ự ọ
Sau khi l a ch n xong t p d s c k t h p, ta s có m t h p tho i m iự ọ ậ ữ ẽ đượ ế ợ ẽ ộ ộ ạ ớ
nh hình 5-14:ư
Hình 5-14
 Unpaired Variables: li t kê các bi n khơng gi ng nhau gi a hai t p d li uệ ế ố ữ ậ ữ ệ
ang c ti n hành h p nh t l i, các bi n khơng gi ng nhau này s b lo iđ đượ ế ợ ấ ạ ế ố ẽ ị ạ
ra và khơng có trong t p d li u m i c t o ra t vi c h p nh t hai t pậ ữ ệ ớ đượ ạ ừ ệ ợ ấ ậ
d li u ban u. Các bi n này c ký hi u khác nhau v i ký hi u ữ ệ đầ ế đượ ệ ớ ệ (*) iđạ
di n cho các bi n trong t p d li u ang ho t ng và ệ ế ậ ữ ệ đ ạ độ (+) i di n cho cácđạ ệ
bi n trong t p d li u c truy xu t t bên ngồi. Nh ng bi n c li tế ậ ữ ệ đượ ấ ừ ữ ế đượ ệ
kê trong h p tho i ộ ạ Unpaired Variables là nh ng bi n có nh ng c i mữ ế ữ đặ đ ể
nh sau:ư
- Hai bi n có tên bi n c khai báo khác nhau ế ế đượ
- Nh ng bi n có d ng d li u khác nhauữ ế ạ ữ ệ
- C hai bi n bi n cùng là d ng chu i nh ng lai khơng b ng nhau vả ế ế ạ ổ ư ằ ề
s ký t trong chu i.ố ự ổ
Cac bi n này nh ã nói s b lo i b ra kh i t p d li u v a h p nh t,ế ư đ ẽ ị ạ ỏ ỏ ậ ữ ệ ừ ợ ấ
i u này ng ngh a ta b m t d li u sau khi h p nh t, do ó c n ph iđ ề đồ ĩ ị ấ ữ ệ ợ ấ đ ầ ả
kh c ph c sai sót này b o m tính y c a d li u sau khi h pắ ụ để ả đả đầ đủ ủ ữ ệ ợ
nh t. Các bi n này s c h p l i v i nhau b ng cánh ánh d u hai bi nấ ế ẽ đượ ợ ạ ớ ằ đ ấ ế

ó (trong h p tho i đ ộ ạ Unpaired Variables) và nh n thanh ấ Pair, lúc ó d li uđ ữ ệ
trong hai bi n này s c h p nh t và c ch a ng trong bi n l y tênế ẽ đượ ợ ấ đượ ứ đự ế ấ
bi n gi ng nh tên bi n trong t p tin ang ho t ng. Ho c ta có th dùngế ố ư ế ậ đ ạ độ ặ ể
cơng c Rename khai báo l i tên bi n ho c ki u bi n cho gi ng nhau.ụ để ạ ế ặ ể ế ố
Biên soạn: Đào Hoài Nam 29
Phân tích dữ liệu bằng SPSS
 H p tho i Variables in New Working Data File li t kê các bi n s có trong t pộ ạ ệ ế ẽ ậ
tin m i c t o ra t vi c h p nh t hai t p d li u ban u. Tồn b cácớ đượ ạ ừ ệ ợ ấ ậ ữ ệ đầ ộ
bi n trong hai t p tin ban u th a mãn các i u ki n gi ng nhau v tên vàế ậ đầ ỏ đ ề ệ ố ề
lo i d li u (s ho c chu i) s c li t kê vào h p tho i này ạ ữ ệ ố ặ ổ ẽ đượ ệ ộ ạ
Chúng ta c ng có th lo i b nh ng bi n mà chúng ta khơng mu n có trongũ ể ạ ỏ ữ ế ố
t p d li u h p nh t. B ng cách ánh d u các bi n ó (trong ơ ậ ữ ệ ợ ấ ằ đ ấ ế đ variables in
new data working file) và chuy n sang ơ ể Unpaired Variables
1.2. Thêm vào các biến (Add Variables)
Cơng c Add Variables cho phép h p nh t d li u trong t p tin ang ho t ngụ ợ ấ ữ ệ ậ đ ạ độ
v i m t t p tin bên ngồi v i i u ki n t p tin bên ngồi này ph i ch a ng cùng cácớ ộ ậ ớ đ ề ệ ậ ả ứ đự
quan sát v i t p tin ang s d ng, nh ng khác nhau v bi n (khai báo tên bi n khácớ ậ đ ử ụ ư ề ế ế
v i t p tin ang c s d ng), q trình này s t o ra m t t p d li u m iớ ậ đ đượ ử ụ ẽ ạ ộ ậ ữ ệ ớ
ch a cùng các quan sát nh ng t p h p t t c các bi n khác nhau trong hai t p dứ ư ậ ợ ấ ả ế ậ ữ
li u ban u. ệ đầ
Cơng c này thích h p v i các cu c nghiên c u c chia làm nhi u giai o n. Víụ ợ ớ ộ ứ đượ ề đ ạ
d nh nghiên c u v m c nh h ng c a m t ch ng trình qu ng cáo,ụ ư ứ ề ứ độ ả ưở ủ ộ ươ ả
ng i ta th ng nghiên c u m t s i t ng ng i tr l i v s n ph m x pườ ườ ứ ộ ố đố ượ ườ ả ờ ề ả ẩ ắ
c qu ng cáo tr c khi tung ch ng trình qu ng cáo ó ra th tr ng, g i làđượ ả ướ ươ ả đ ị ườ ọ
Pre-test. Sau ó s ti n hành m t cu c nghiên c u n a trên úng các i t ng óđ ẽ ế ộ ộ ứ ữ đ đố ượ đ
sau khi ch ng trình qu ng cáo ã c tung ra th tr ng, ta g i là Post-test. Phânươ ả đ đượ ị ườ ọ
tích th ng kê òi h i m t s so sánh (nh Paired-sample t test) các ý ki n c aố đ ỏ ộ ố ư ế ủ
nh ng ng i tiêu dùng này tr c và sau khi có ch ng trình qu ng cáo. th c hi nữ ườ ướ ươ ả Để ự ệ
cơng vi c này c n chú ý nh ng i m sau:ệ ầ ữ đ ể
- Các quan sát (Cases) trong cả hai tập tin cần hợp nhất biến phải được

xắp xếp theo cùng một thứ tự, thơng thường thứ tự này được quản lý
bằng một tập tin chứa các giá trị là số bảng câu hỏi. Chú ý các bảng câu
hỏi của đối tượng nghiên cứu trong lần phỏng vấn trước phải giống với
số bảng câu hỏi dùng để phóng vấn chính đối tượng đó trong lần sau. Khi
loại bỏ bảng câu hỏi nào của lần phỏng vấn trước hoặc sau ta phải loại
bỏ ln bảng câu hỏi đó trước khi tiến hành hợp nhất.
- Thơng thường ta dùng một hay nhiều biến khóa để bảo đảm các trường
hợp khớp với nhau (thường sử dụng biến ID chứa số bảng câu hỏi). Điều
phải bảo đảm trước khi tiến hành hợp nhất biến giữa hai tập dữ liệu này
là ta phải xắp xếp dữ liệu trong hai biến khóa của hai tập dữ liệu theo thứ
tự từ nhỏ đến lớn.
- Các biến có tên giống nhau trong tập tin đang hoạt động vào tập tin bên
ngồi sẽ bị loại trừ khỏi tập tin mới được tạo.
Biên soạn: Đào Hoài Nam 30
Phân tích dữ liệu bằng SPSS
T t p d li u ang thao tác ta m cơng c ừ ậ ữ ệ đ ở ụ Data/Merge Files/Adds Variables từ
menu, SPSS s truy su t h p tho i ẽ ấ ộ ạ Add Variables: Read File ta l a ch n t pđể ự ọ ậ
d li u s c h p v i t p d li u ang ho t ng. Nh n Open xác nh nữ ệ ẽ đượ ợ ớ ậ ữ ệ đ ạ độ ấ để ậ
vi c l a ch n này (gi ng nh tr ng h p Adds Cases - Xem hình 5-13). Sau khiệ ự ọ ố ư ườ ợ
l a ch n c t p d li u s h p bi n v i t p d li u ang ho t ng. SPSSự ọ đượ ậ ữ ệ ẽ ợ ế ớ ậ ữ ệ đ ạ độ
s truy su t cho ta h p tho i nh hình 5-15:ẽ ấ ộ ạ ư
Hình 5-15
- Excluded Variables liệt kê các biến sẽ bị loại trừ ra khỏi biến mới hợp
thành. Những biến này là những biến có tên biến giống nhau. Biến trong
tập tin đang hoạt động được ký hiệu là (*), và những biến trong tập tin
bên ngồi là (+). Nếu muốn các biến giống tên nhau này có trong tập dữ
liệu mới ta phải tiến hành rename nó lại và chuyển nó sang hộp thoại
chứa các biến sẽ có trong tập tin mới (New Working Data File)
- Key Variables. Biến khóa dựa vào đó các quan sát giống nhau được xác
định. Chú ý biến khóa này phải có cùng tên ở các hai tập tin cần hợp

nhất. Các trường hợp khơng thỏa mãn với biến khóa thì vẫn bao hàm
trong tập dữ liệu mới nhưng sẽ khơng được hợp với các trường hợp
trong tập tin khác. Những trường hợp này chỉ chứa đựng giá trị riêng biệt
của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và
các trường hợp này sẽ có giá trị khuyết trong các biến chứa đựng trong
tập tin thứ hai mà ta sẽ hợp nhất.
_____o0o______
Biên soạn: Đào Hoài Nam 31

chương 5 các phép biến đổi và thao tác trên tập dữ liệu

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về