Tải bản đầy đủ (.pdf) (12 trang)

QUẢN LÝ SỐ LIỆU - BIẾN LIÊN TỤC (BIẾN ĐỊNH LƯỢNG), ĐẠI HỌC Y TẾ CÔNG CỘNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (183.3 KB, 12 trang )

18
Qun lý s liu - bin liên tc
(bin nh lng)
I. Qun lý s liu cho bin liên tc
1.1 Tìm hiu s liu
2i và lu tp tin s liu ivf.sav t trang web elearning ca khóa hc vào máy
tính ca bn.
Nhp chut vào b s liu ivf va ti v máy  m tp tin. Nu trên ca s SPSS Data
Editor không phi  ch “Data view” nhp vào tab Data View  góc di trái ca ca
 vào ch này.
6 liu này bao gm nhng bin s v nhng a tr sinh mt ca nhng bà m
c th thai trong ng nghim (in-vitro fertilisation). Nghiên cu này ã c báo
cáo trong tp chí BMJ (1990;300:1229-1233). Tp tin này bao gm 641 a tr. B
 liu này gm có nhng bin s nào?
ng dn
: Có nhiu cách  xác nh này có bao nhiêu bin s. Nu chúng ta  trong
DataView, có th tìm thy tên bin  hàng trên cùng ca li s liu tuy nhiên vi cách
ó chúng ta không có chi bit v các bin s. Mun bin v chi tit ca bin s chúng ta
có hai cách (a) s dng menu: Utilities/Variables bit có bao nhiêu bin s, nhng
bin só là gì và có nhng tính cht gì hoc (b) nhp vào tab “Variable View”. Nu
ang  ch “Variable View” có th chuyn qua ch “Data View” bng cách nhp
vào tab “Data View”.
Tr li:
Sau khi thc hin nhng thao tác trên bn có kt qu:
S liu này gm 6 bin s có chi tit nh sau:
Click to buy NOW!
P
D
F
-
X


C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X

C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
19
Stt Tên bin Nhãn bin Gii thích
1 Id identity number of mother and
baby
Mã si tng
2 Matage maternal age in years Tui ca m (nm tui)

3 Ht hypertension 1=yes, 2=no Cao huyt áp thai kì 1= có 2 = không
4 Gestwks Gestational age in weeks Tui thai (tính theo tun)
5 Sex sex of baby 1=male, 2=female Gii tính ca tr 1=trai 2=gái
6 Bweight birth weight in gms Trng lng sinh tính theo grams
u ý: Id là mã si tng, do ó không phân tích v sau
6p tin này có bao nhiêu bn ghi?
ng dn:
 bit tp tin có bao nhiêu bn ghi, có th lp bng phân phi tn sut ca
t bin s bt kì (thí d nh bin sex) bng cách nhp vào Analyze/Descriptive
Statistics/Frequencies
Và bn có kt qu :
Statistics
Sex of infant
641
0
Valid
Missing
N
Tr li: tp tin này có 641 bn ghi và không có quan sát nào  bin gii tính b thiu
thông tin c.
6 Các giá tr ca bin id, ht, sex, matage, bweight, matagegp và gestcat có 2 s l
thp phân không cn thit nên chúng ta hãy loi b các con s thp phân này.
ng dn:
  to nhãn cho các bin s, chuyn sang ch  “Variable View” bng
cách nhp vào tab Variable View  góc trái di màn hình. Nhp con tr vào ô ca hàng
id và ct Decimal ta thy hin lên mt nút có mi tên lên xung hin lên  góc phi.
Nhp vào nút mi tên xung sao cho giá tr ca ô này (ô Decimal) bng 0.
Click to buy NOW!
P
D

F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D

F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
20
2Thc hin tng t vi các bin ht, sex, matage, bweight, matagegp và gestcat. (Ch
tr bin gestwks là cn phi làm s ch s thp phân).

6 Hãy to nhãn cho các bin s ht, sex, matagegp và gestcat
ng dn:
  to nhãn cho các bin s, chuyn sang ch  “Variable View” bng
cách nhp vào tab Variable View  góc trái di màn hình. Nhp con tr vào ô ca hàng
ht và ct value ta thy hin lên mt nút lnh vi 3 du chm hin lên  góc phi. (Nu
chúng ta nhp vào phía bên phi ca ô này thì ca s Value labels s hin lên). Nhp vào
nút lnh này  hin ra ca s Value labels. Gán giá tr 1 là “cao huyet ap”.
Nhn nút Add và tip tc gán giá tr 2 là “khong cao huyet ap”. Nhp nút lnh Add ln
a.
Nhp vào nút lnh OK hoàn tt.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u

-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u

-
t
r
a
c
k
.
c
o
m
21
ng t i vi bin sex ta gán giá tr 1=”nam” 2=”nu”; bin matagegrp ta gán
1=”<30” 2=”30-34” ; 3=”35-39” ; 4=”40+” và gestcat 1 = “sinh non” 2 = “sinh du
thang”
Sau ó nhp vào tab “Data View”  xem các giá trã mã hoá. Nu các giá trã mã
hoá cha xut hin, hãy chn menu View/Variable Value làm hin th các giá trã
mã hoá.
6 Lu li tp tin.
ng dn: lu li tp tin chúng ta có th s dng mt trong 3 cách sau: a) Nhp vào
hình chic a mm trên Data Editor Toolbar b) Nhn Ctrl-S c) S dng menu File –
Save. Nu chúng ta không mun làm thay i giá tr ca s liu ngun hãy lu tp tin vi
tên khác bng cách s dng menu File/Save As.
1.2 Làm sch s liu cho bin liên tc
Trong làm sch s liu, chúng ta kim tra các li có th gp sau ây:
- Các giá tr bt thng
- Kim tra vic nhp liu
- Kim tra tính ng nht
1Kim tra giá tr bt thng
 kim tra giá tr bt thng ca các bin snh lng, chúng ta s dng:
- Các thông s thng kê tóm tt: giá tr nh nht, giá tr ln nht

- Biu : a giác tn s (histogram)
1.2.1 Các s thng kê tóm tt
 xem giá tr nh nht, ln nht, trung bình… chúng ta dùng lnh Frequencies
(Analysis /Descriptives Statistics/Frequencies) và có màn hình lnh nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k

.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k

.
c
o
m
22
u ý: bn nên tt tùy chn Display frequency tables  kt qu ca chúng ta không
có bng phân b tn s ca tng giá tr- vì nó quá dài và không có ích trong trng
p này.
Hãy chn bin mà bn mun tính và chuyn sang ca s Variable(s). Trong trng hp
này chúng ta chn bin bweight i kích vào du
 chuyn sang. Sau ó bn hãy
kích vào tùy chn Options và bn có ca s nh sau hin lên:
t qu ca lnh nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d

o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d

o
c
u
-
t
r
a
c
k
.
c
o
m
23
Descriptive Statistics
641 630.00 4650.00 3129.5055
641
Birthweight
Valid N (listwise)
N Minimum Maximum Mean
a vào con s nh nht, ln nht, chúng ta xem xét có giá tr bt thng nào hay không,
ví d nu cân nng khi sinh bng 0 hoc >6000 gram chng hn. Trong trng hp này,
không có s bt thng nào c.
1.2.2 Biu 
Chúng ta dùng a giác tn s kim tra liu bin “trng lng s sinh” có giá tr bt
thng nào không.
 va giác tn s ca bin trng lng s sinh, chúng ta hãy s dng menu Graphs –
Histogram. Chn bin s bweight vào hp Variable. Nhp nút lnh OK  hoàn tt.
Biu a giác tn s ca trng lng s sinh c th hin trong ca s Output và có
ng nh sau. Nu bn mun th hin ng cong phân b chun thì các bn hãy kích

vào tùy chn Display normal curve trong ca s lnh trên.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o

m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o

m
24
Khi ó, chúng ta s xem trên biu  có s liu nào ln bt thng hoc nh bt thng
hay không (xem  vòng tròn ).
6Hãy kim tra bin tui ca m nhng ph n trong nghiên cu này.
ng dn:
c 1: Dùng các s thng kê tóm tt.
 mô t giá tr ln nht, nh nht, trung bình, và  lch chun, tr li các bc nh mô
 phn trên. Chn Miximum (nh nht) và Maximum (ln nht), Mean (trung bình) và
Standard variable ( lch chun), chúng ta có kt qu nh sau:
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u

-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u

-
t
r
a
c
k
.
c
o
m
25
Descriptive Statistics
641 23.00 43.00 33.9719 3.87046
641
Maternal age
Valid N (listwise)
N Minimum Maximum Mean Std. Deviation
ng này cng cho thy không có giá tr bt thng nào.
c 2: Hãy kim tra a giác tn s ca tui khi sinh ca nhng bà m trong nghiên cu
theo các bc  trên bn s có nhng kt qu sau
a giác tn s vi ng cong phân b chun. Biu  này cho thy không có giá tr nh
hoc ln bt thng nào.
6u có giá tr bt thng, chúng ta phi làm gì:
Khi phát hin có giá tr bt thng, chúng ta phi:
- So sánh vi b s liu gc, nu úng nh b s liu gc và s liu là chính xác,
gi nguyên.
Click to buy NOW!
P
D
F

-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F

-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
26
- u so vi b s liu gc và thy không úng vi giá tr trong b s liu gc, sa
theo giá tr trong b s liu gc.
- u không có b s liu gc và s lng giá tr bt thng không quá nhiu (<5%

 s liu), không phân tích các s liu này.
- u không có b s liu gc và s lng giá tr bt thng nhiu (<5% b s
liu), có th s dng phân tích các s liu này.
1Kim tra vic nhp liu
Kim tra vic nhp liu c thc hin khi nhp liu vi mc ích là m bo vic nhp
liu y  và chính xác. Thông thng:
- Nhp b s liu hai ln bi hai ngi khác nhau, sau ó so sánh hai b s liu.
Cách này khó thc hin i vi các b s liu ln do tn ngun lc và thi gian
- Nhp toàn b s liu 1 ln, sau ó ly khong 10 – 15% b s liu nhp riêng và
so sánh hai nhóm.
1Kim tra tính ng nht
Ví d kim tra nm sinh  chc rng không có i tng nào có s tui âm.
1.3 To bin s mi
o bin s mi khi:
- Câu hi nghiên cu không có bin sn có trong b s liu, ví d câu hi nghiên
u “có bao nhiêu tr sinh  tháng và thiu tháng?”, trong b s liu, chúng ta ch
có bin tui thai tính theo tun (bin nh lng) mà không có bin  tháng hay
thiu tháng, do ó chúng ta phi to ra bin s này.
6 Hãy to ra các bin s mi theo yêu cu sau:
Bin cn phi phân nhóm Tên bin Phân nhóm
Tui ca m phân nhóm matagegrp (1=<30; 2=30-34;3=35-39;4=40+)
Tui thai phân nhóm gestcat (1= <37 tun; 2=37+tun)
Click to buy NOW!
P
D
F
-
X
C
H

A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H

A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
27
ng dn: S dng Menu Transform/Recode/Into difference variables mã hoá
bin matage thành bin matagegrp
Sau khi xut hin ca s Recode into difference variables, chúng ta chn bin matage
vào hp Numeric variable và gõ tên matagegrp vào Output variable. Nhn nút lnh
Change. Sau ó nhp vào nút lnh Old and New Values hin ra ca s: Recode into
difference variable: Old and New Values. mã hoá bin matage có giá tr t ti thiu
lên n 29 thành bin matagegrp có giá tr là 1, chúng ta nhp vào nút chn Range

Lowest to và gõ vào hp s Range Lowest to giá tr 29 và hp Value (trong khung New
Value) giá tr 1 nh trong hình sau.
Sau ó chúng ta nhp vào nút lnh Add và tip tc chn nút chn Range __ through __
i giá tr 1 là 30 và giá tr sau là 34. Hp value khung New Value sc nhn giá tr
2.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c

k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c

k
.
c
o
m
28
Nhn nút lnh Add. Thc hin tng t mã hoá matage t 35-39 là 3: tip tc nhp
vào chn nút chn Range __ through __ vi giá tr 1 là 35 và giá tr sau là 39. Hp
value khung New Value sc nhn giá tr 3. Nhn nút lnh Add.
 mã hoá bin matage có giá tr t 40 tr lên thành giá tr 4. Chn nút chn Range
___
through highest, và gõ giá tr 40 vào ô này. Hp value khung New Value sc
nhn giá tr 4. Nhn nút lnh Add. Khi ó chúng ta ã có  các yêu cu mã hoá nm
trong hp Old->New.
Nhp nút lnh Continue  tr v ca s Recode into Different Variable. Nhp nút lnh
OK hoàn tt.
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w

w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-
X
C
H
A
N
G
E
w
w

w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
29
u ý: Phi kim tra bin gc trc khi to bin mi. Ví d:
Phi kim tra bin tui trc khi to bin nhóm tui. Nu bin nhóm tui là tui chn
(tc là không có s thp phân sau du phy) nh 30, 31, 32 tui (không phi là 30.7
tui… ), thì to bin mi nh trên.
u là tui l (30,7 tui; 34,5 tui… ) thì khi to bin mi nh <30 tui, thì phi vit
“Lowest thru 29.99” nh trên.
2 ng t, ta s dng Menu Transform - Recode – Into difference variables  mã
hoá bin gestwks thành bin gestcat.
Click to buy NOW!
P
D
F
-

X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m
Click to buy NOW!
P
D
F
-

X
C
H
A
N
G
E
w
w
w
.
d
o
c
u
-
t
r
a
c
k
.
c
o
m

×