18
Qun lý s liu - bin liên tc
(bin nh lng)
I. Qun lý s liu cho bin liên tc
1.1 Tìm hiu s liu
2i và lu tp tin s liu ivf.sav t trang web elearning ca khóa hc vào máy
tính ca bn.
Nhp chut vào b s liu ivf va ti v máy m tp tin. Nu trên ca s SPSS Data
Editor không phi ch “Data view” nhp vào tab Data View góc di trái ca ca
vào ch này.
6 liu này bao gm nhng bin s v nhng a tr sinh mt ca nhng bà m
c th thai trong ng nghim (in-vitro fertilisation). Nghiên cu này ã c báo
cáo trong tp chí BMJ (1990;300:1229-1233). Tp tin này bao gm 641 a tr. B
liu này gm có nhng bin s nào?
ng dn
: Có nhiu cách xác nh này có bao nhiêu bin s. Nu chúng ta trong
DataView, có th tìm thy tên bin hàng trên cùng ca li s liu tuy nhiên vi cách
ó chúng ta không có chi bit v các bin s. Mun bin v chi tit ca bin s chúng ta
có hai cách (a) s dng menu: Utilities/Variables bit có bao nhiêu bin s, nhng
bin só là gì và có nhng tính cht gì hoc (b) nhp vào tab “Variable View”. Nu
ang ch “Variable View” có th chuyn qua ch “Data View” bng cách nhp
vào tab “Data View”.
Tr li:
Sau khi thc hin nhng thao tác trên bn có kt qu:
S liu này gm 6 bin s có chi tit nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
19
Stt Tên bin Nhãn bin Gii thích
1 Id identity number of mother and
baby
Mã si tng
2 Matage maternal age in years Tui ca m (nm tui)
3 Ht hypertension 1=yes, 2=no Cao huyt áp thai kì 1= có 2 = không
4 Gestwks Gestational age in weeks Tui thai (tính theo tun)
5 Sex sex of baby 1=male, 2=female Gii tính ca tr 1=trai 2=gái
6 Bweight birth weight in gms Trng lng sinh tính theo grams
u ý: Id là mã si tng, do ó không phân tích v sau
6p tin này có bao nhiêu bn ghi?
ng dn:
bit tp tin có bao nhiêu bn ghi, có th lp bng phân phi tn sut ca
t bin s bt kì (thí d nh bin sex) bng cách nhp vào Analyze/Descriptive
Statistics/Frequencies
Và bn có kt qu :
Statistics
Sex of infant
641
0
Valid
Missing
N
Tr li: tp tin này có 641 bn ghi và không có quan sát nào bin gii tính b thiu
thông tin c.
6 Các giá tr ca bin id, ht, sex, matage, bweight, matagegp và gestcat có 2 s l
thp phân không cn thit nên chúng ta hãy loi b các con s thp phân này.
ng dn:
to nhãn cho các bin s, chuyn sang ch “Variable View” bng
cách nhp vào tab Variable View góc trái di màn hình. Nhp con tr vào ô ca hàng
id và ct Decimal ta thy hin lên mt nút có mi tên lên xung hin lên góc phi.
Nhp vào nút mi tên xung sao cho giá tr ca ô này (ô Decimal) bng 0.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
20
2Thc hin tng t vi các bin ht, sex, matage, bweight, matagegp và gestcat. (Ch
tr bin gestwks là cn phi làm s ch s thp phân).
6 Hãy to nhãn cho các bin s ht, sex, matagegp và gestcat
ng dn:
to nhãn cho các bin s, chuyn sang ch “Variable View” bng
cách nhp vào tab Variable View góc trái di màn hình. Nhp con tr vào ô ca hàng
ht và ct value ta thy hin lên mt nút lnh vi 3 du chm hin lên góc phi. (Nu
chúng ta nhp vào phía bên phi ca ô này thì ca s Value labels s hin lên). Nhp vào
nút lnh này hin ra ca s Value labels. Gán giá tr 1 là “cao huyet ap”.
Nhn nút Add và tip tc gán giá tr 2 là “khong cao huyet ap”. Nhp nút lnh Add ln
a.
Nhp vào nút lnh OK hoàn tt.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
21
ng t i vi bin sex ta gán giá tr 1=”nam” 2=”nu”; bin matagegrp ta gán
1=”<30” 2=”30-34” ; 3=”35-39” ; 4=”40+” và gestcat 1 = “sinh non” 2 = “sinh du
thang”
Sau ó nhp vào tab “Data View” xem các giá trã mã hoá. Nu các giá trã mã
hoá cha xut hin, hãy chn menu View/Variable Value làm hin th các giá trã
mã hoá.
6 Lu li tp tin.
ng dn: lu li tp tin chúng ta có th s dng mt trong 3 cách sau: a) Nhp vào
hình chic a mm trên Data Editor Toolbar b) Nhn Ctrl-S c) S dng menu File –
Save. Nu chúng ta không mun làm thay i giá tr ca s liu ngun hãy lu tp tin vi
tên khác bng cách s dng menu File/Save As.
1.2 Làm sch s liu cho bin liên tc
Trong làm sch s liu, chúng ta kim tra các li có th gp sau ây:
- Các giá tr bt thng
- Kim tra vic nhp liu
- Kim tra tính ng nht
1Kim tra giá tr bt thng
kim tra giá tr bt thng ca các bin snh lng, chúng ta s dng:
- Các thông s thng kê tóm tt: giá tr nh nht, giá tr ln nht
- Biu : a giác tn s (histogram)
1.2.1 Các s thng kê tóm tt
xem giá tr nh nht, ln nht, trung bình… chúng ta dùng lnh Frequencies
(Analysis /Descriptives Statistics/Frequencies) và có màn hình lnh nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
22
u ý: bn nên tt tùy chn Display frequency tables kt qu ca chúng ta không
có bng phân b tn s ca tng giá tr- vì nó quá dài và không có ích trong trng
p này.
Hãy chn bin mà bn mun tính và chuyn sang ca s Variable(s). Trong trng hp
này chúng ta chn bin bweight i kích vào du
chuyn sang. Sau ó bn hãy
kích vào tùy chn Options và bn có ca s nh sau hin lên:
t qu ca lnh nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
23
Descriptive Statistics
641 630.00 4650.00 3129.5055
641
Birthweight
Valid N (listwise)
N Minimum Maximum Mean
a vào con s nh nht, ln nht, chúng ta xem xét có giá tr bt thng nào hay không,
ví d nu cân nng khi sinh bng 0 hoc >6000 gram chng hn. Trong trng hp này,
không có s bt thng nào c.
1.2.2 Biu
Chúng ta dùng a giác tn s kim tra liu bin “trng lng s sinh” có giá tr bt
thng nào không.
va giác tn s ca bin trng lng s sinh, chúng ta hãy s dng menu Graphs –
Histogram. Chn bin s bweight vào hp Variable. Nhp nút lnh OK hoàn tt.
Biu a giác tn s ca trng lng s sinh c th hin trong ca s Output và có
ng nh sau. Nu bn mun th hin ng cong phân b chun thì các bn hãy kích
vào tùy chn Display normal curve trong ca s lnh trên.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
24
Khi ó, chúng ta s xem trên biu có s liu nào ln bt thng hoc nh bt thng
hay không (xem vòng tròn ).
6Hãy kim tra bin tui ca m nhng ph n trong nghiên cu này.
ng dn:
c 1: Dùng các s thng kê tóm tt.
mô t giá tr ln nht, nh nht, trung bình, và lch chun, tr li các bc nh mô
phn trên. Chn Miximum (nh nht) và Maximum (ln nht), Mean (trung bình) và
Standard variable ( lch chun), chúng ta có kt qu nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
25
Descriptive Statistics
641 23.00 43.00 33.9719 3.87046
641
Maternal age
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
ng này cng cho thy không có giá tr bt thng nào.
c 2: Hãy kim tra a giác tn s ca tui khi sinh ca nhng bà m trong nghiên cu
theo các bc trên bn s có nhng kt qu sau
a giác tn s vi ng cong phân b chun. Biu này cho thy không có giá tr nh
hoc ln bt thng nào.
6u có giá tr bt thng, chúng ta phi làm gì:
Khi phát hin có giá tr bt thng, chúng ta phi:
- So sánh vi b s liu gc, nu úng nh b s liu gc và s liu là chính xác,
gi nguyên.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
26
- u so vi b s liu gc và thy không úng vi giá tr trong b s liu gc, sa
theo giá tr trong b s liu gc.
- u không có b s liu gc và s lng giá tr bt thng không quá nhiu (<5%
s liu), không phân tích các s liu này.
- u không có b s liu gc và s lng giá tr bt thng nhiu (<5% b s
liu), có th s dng phân tích các s liu này.
1Kim tra vic nhp liu
Kim tra vic nhp liu c thc hin khi nhp liu vi mc ích là m bo vic nhp
liu y và chính xác. Thông thng:
- Nhp b s liu hai ln bi hai ngi khác nhau, sau ó so sánh hai b s liu.
Cách này khó thc hin i vi các b s liu ln do tn ngun lc và thi gian
- Nhp toàn b s liu 1 ln, sau ó ly khong 10 – 15% b s liu nhp riêng và
so sánh hai nhóm.
1Kim tra tính ng nht
Ví d kim tra nm sinh chc rng không có i tng nào có s tui âm.
1.3 To bin s mi
o bin s mi khi:
- Câu hi nghiên cu không có bin sn có trong b s liu, ví d câu hi nghiên
u “có bao nhiêu tr sinh tháng và thiu tháng?”, trong b s liu, chúng ta ch
có bin tui thai tính theo tun (bin nh lng) mà không có bin tháng hay
thiu tháng, do ó chúng ta phi to ra bin s này.
6 Hãy to ra các bin s mi theo yêu cu sau:
Bin cn phi phân nhóm Tên bin Phân nhóm
Tui ca m phân nhóm matagegrp (1=<30; 2=30-34;3=35-39;4=40+)
Tui thai phân nhóm gestcat (1= <37 tun; 2=37+tun)
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
27
ng dn: S dng Menu Transform/Recode/Into difference variables mã hoá
bin matage thành bin matagegrp
Sau khi xut hin ca s Recode into difference variables, chúng ta chn bin matage
vào hp Numeric variable và gõ tên matagegrp vào Output variable. Nhn nút lnh
Change. Sau ó nhp vào nút lnh Old and New Values hin ra ca s: Recode into
difference variable: Old and New Values. mã hoá bin matage có giá tr t ti thiu
lên n 29 thành bin matagegrp có giá tr là 1, chúng ta nhp vào nút chn Range
Lowest to và gõ vào hp s Range Lowest to giá tr 29 và hp Value (trong khung New
Value) giá tr 1 nh trong hình sau.
Sau ó chúng ta nhp vào nút lnh Add và tip tc chn nút chn Range __ through __
i giá tr 1 là 30 và giá tr sau là 34. Hp value khung New Value sc nhn giá tr
2.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
28
Nhn nút lnh Add. Thc hin tng t mã hoá matage t 35-39 là 3: tip tc nhp
vào chn nút chn Range __ through __ vi giá tr 1 là 35 và giá tr sau là 39. Hp
value khung New Value sc nhn giá tr 3. Nhn nút lnh Add.
mã hoá bin matage có giá tr t 40 tr lên thành giá tr 4. Chn nút chn Range
___
through highest, và gõ giá tr 40 vào ô này. Hp value khung New Value sc
nhn giá tr 4. Nhn nút lnh Add. Khi ó chúng ta ã có các yêu cu mã hoá nm
trong hp Old->New.
Nhp nút lnh Continue tr v ca s Recode into Different Variable. Nhp nút lnh
OK hoàn tt.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
29
u ý: Phi kim tra bin gc trc khi to bin mi. Ví d:
Phi kim tra bin tui trc khi to bin nhóm tui. Nu bin nhóm tui là tui chn
(tc là không có s thp phân sau du phy) nh 30, 31, 32 tui (không phi là 30.7
tui… ), thì to bin mi nh trên.
u là tui l (30,7 tui; 34,5 tui… ) thì khi to bin mi nh <30 tui, thì phi vit
“Lowest thru 29.99” nh trên.
2 ng t, ta s dng Menu Transform - Recode – Into difference variables mã
hoá bin gestwks thành bin gestcat.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m