THỐNG KÊ CHO BIẾN LIÊN TỤC
Nguyễn thị Trang Nhung
Mục tiêu
Sau khi hoàn thành bài học này, sinh viên có thể:
-Thực hiện được các kiểm định cho biến liên
tục
- Phiên giải được kết quả đầu ra của máy tính
-Viết được báo cáo phân tích số liệu cho biến
định lượng
Nội dung
• Ước lượng cho một giá trị trung bình mẫu
• Ước lượng, so sánh cho giá trị trung bình của
hai mẫu độc lập
• Ước lượng so sánh cho nhiều hơn hai giá trị
trung bình mẫu độc lập
• Ước lượng so sánh cho hai trung bình của hai
mẫu phụ thuộc
So sánh một giá trị TB mẫu
• Câu hỏi: TB tuổi khi sinh con của những phụ
nữ này có khác 35 tuổi không?
Để đánh giá một giá trị trung bình chúng ta tiến
hành kiểm tra phân bố của biến
So sánh một giá trị Tb mẫu
•Tiến hành kiểm
định t cho một giá
trị trung bình
Menu
Analyze/Compar
e Means/ One
Sample t test
So sánh một giá trị trung bình mẫu
One-Sample Statistics
640 33.9781 3.87029 .15299
Maternal age
N Mean Std. Deviation
Std. Error
Mean
One-Sample Test
-6.679 639 .000 -1.02188 -1.3223 7215
Maternal age
t df Sig. (2-tailed)
Mean
Difference
Lower Upper
95% Confidence
Interval of the
Difference
Test Value = 35
Trung bình tuổi sinh con của những phụ nữ trong nghiên cứu này là 34
tuổi thấp hơn tuổi sinh con có nguy cơ của nghiên cứu đựoc so sánh có
ý nghĩa thống kê (P< 0,001, 95% CI của sự khác biệt là 0,7 tuổi đến 1,3
tuổi).
So sánh hai giá trị TB mẫu
Giả định:
• Mẫu có phân bố chuẩn
• Phương sai đồng nhất.
Đánh giá phương sai đồng nhất:
9s
2
max
/s
2
min
< 3
9Kiểm định Levene
H0: hai phương sai đồng nhất
Ha: Hai phương sai không đồng nhất
So sánh hai giá trị TB mẫu
• Nếu biến không có phân bố chuẩn dùng kiểm
định phi tham số: Mann- Whitney hoặc
Wilconxon
• Nếu phương sai đồng nhất sử dụng kiểm định t
cho phương sai đồng nhất
• Nếu phương sai không đồng nhất sử dụng
kiểm định t cho phương sai không đồng nhất
So sánh hai giá trị TB mẫu
Câu hỏi: So sánh trọng lượng sơ sinh của trẻ nam
và trẻ nữ
-Kiểm tra tính chuẩn của biến (bweight)
-Kiểm định thống kê: dùng kiểm định t cho hai
mẫu độc lập:
Analyze/Compare Means/Independent
Samples T test
So sánh hai giá trị TB mẫu
Kết quả
Group Statistics
324 3208.6481 665.30226 36.96124
314 3043.3599 629.51611 35.52565
Sex of infant
trai
gai
Birthweight
N Mean Std. Deviation
Std. Error
Mean
Independent Samples Test
1.375 .241 3.221 636 .001 165.28828 51.31049 64.52981
2
66.04674
3.224 635.638 .001 165.28828 51.26602 64.61703
2
65.95952
Equal variances
assumed
Equal variances
not assumed
Birthweight
F Sig.
Levene's Test for
Equality of Variances
t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
Lower Upper
95% Confidence
Interval of the
Difference
t-test for Equality of Means
N
Độ lệch
chuẩn
•Giá trị P
của kiểm
định t
•Kiểm
định
Levene
Kết quả
Independent Samples Test
1.375 .241 3.221 636 .001 165.28828 51.31049 64.52981
2
66.04674
3.224 635.638 .001 165.28828 51.26602 64.61703
2
65.95952
Equal variances
assumed
Equal variances
not assumed
Birthweight
F Sig.
Levene's Test for
Equality of Variances
t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
Lower Upper
95% Confidence
Interval of the
Difference
t-test for Equality of Means
Giá trị của
kiểm định t
•Kiểm định
Levene không
có ý nghĩa
thống kê nên ps
hai nhóm đồng
nhất
Group Statistics
324 3208.6481 665.30226 36.96124
314 3043.3599 629.51611 35.52565
Sex of infant
trai
gai
Birthweight
N Mean Std. Deviation
Std. Error
Mean
Do s
2
max
/s
2
min
=
665*665/629*629 < 3
nên có thể kết luận là
phương sai đồng nhất.
Kết quả
• Trung bình cân nặng khi sinh của trẻ trai là 3,2
kg (SD = 0,7) cao hơn trung bình cân nặng của
trẻ gái là 3,0 kg (SD = 0,6) có ý nghĩa thống
kê (P< 0,001; 95%CI của sự khác biệt là 64,5-
266,0g)
So sánh hai giá trị TB mẫu
Câu hỏi: So sánh trọng lượng sơ sinh của con
của những bà mẹ bị THA và không bị THA
-Kiểm tra tính chuẩn của biến (bweight)
-Kiểm định thống kê: dùng kiểm định t cho hai
mẫu độc lập:
Analyze/Compare Means/Independent
Samples T test
Câu lệnh so sánh hai giá trị TB
Kết quả
Group Statistics
89 2742.16 812.95 86.17
552 3191.53 601.10 25.58
Hypertension
cao huyet ap
khong cao huyet ap
Birthweight
N Mean Std. Deviation
Std. Error
Mean
Independent Samples Test
18.319 .000 -6.200 639 .000 -449.37 72.47 -591.69 -307.06
-4.999 104.069 .000 -449.37 89.89 -627.63 -271.12
Equal variance
s
assumed
Equal variance
s
not assumed
Birthweigh
t
F Sig.
Levene's Test for
Equality of Variances
t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
Lower Upper
95% Confidence
Interval of the
Difference
t-test for Equality of Means
Kiểm định
Levene có ý nghĩa
nên ps không
đồng nhất
Kết quả kiểm
định t với ps
không đồng nhất
Phiên giải
Kết quả cho biết trọng lượng sơ sinh ở nhóm con bà mẹ cao
huyết áp là 2742 gram (độ lệch chuẩn = 813 gram) so với
trọng lượng sơ sinh ở nhóm con bà mẹ không cao huyết áp
là 3192 gram (độ lệch chuẩn 601 gram). Chúng ta cũng
nhận thấy trọng lượng trẻ con bà mẹ cao huyết áp thấp hơn
449 gram so với con bà mẹ không bị cao huyết áp (KTC
95% của hiệu số này là từ 271 gram đến 628 gram) và sự
khác biệt này có ý nghĩa thống kê với p<0.001
So sánh hai giá trị TB mẫu
Câu hỏi: So sánh tuổi thai của trẻ nam và trẻ nữ
-Kiểm tra tính chuẩn của biến (gestwks)
So sánh hai giá trị TB mẫu
Biến tuổi thai không có phân bố chuẩn nên chúng ta phải dùng kiểm định phi
tham số để so sánh hai giá trị trung bình: Mann – Whitney hoặc Wilcoxon
So sánh hai giá trị TB mẫu
Analyze/Non Parametric tests/2-
Independent-Samples Tests
Kết quả
Ranks
324 316.06 102404.00
314 323.05 101437.00
638
Sex of infant
trai
gai
Total
Gestational age
N Mean Rank Sum of Ranks
Test Statistics
a
49754.000
102404.000
479
.632
Mann-Whitney U
Wilcoxon W
Z
Asymp. Sig. (2-tailed)
Gestational
age
Grouping Variable: Sex of infant
a.
Không có sự khác biệt có ý nghĩa thống kê của thời gian
mang thai giữa trẻ nam và trẻ nữ (P = 0,632).
So sánh nhiều hơn hai giá trị trung bình
• Sử dụng phép phân tích phương sai (ANOVA)
• Giả định:
¾Biến có phân bố chuẩn
¾Và các phương sai đồng nhất
So sánh nhiều giá trị TB
• Nếu biến không có phân bố chuẩn thì kiểm
định Brown- Forsy or Welch thay thế kiểm
định ANOVA truyền thống
• Ngoài ra SPSS hỗ trợ thêm kiểm định Game –
Howel để dùng trong trường hợp biến không
có phân bố chuẩn. Nhưng kiểm định này chỉ
dùng khi cỡ mẫu của các nhóm so sánh không
bằng nhau
Kiểm định Post hoc
• LSD (Least –significant Difference): kiểm định này không
kiểm sóat sai lầm loại I mà chỉ thực hiện các kiểm định như
kiểm định t (so sánh từng cặp 1)
• Bonferroni: Kiểm sóat sai lầm loại 1 rất tốt khi mà số nhóm
so sánh là nhỏ.
• Turkey: kiểm sóat sai lầm loại 1 tốt nếu sử dụng khi số nhóm
so sánh là lớn và cỡ mẫu trong mỗi nhóm tương tự nhau.
• R-E-G-W Q : kiểm sóat sai lầm loại 1 tốt, được áp dụng nhiề
u
khi cỡ mẫu của các nhóm tương tự nhau.
• Gabriel and Hochberg’s GT2: sử dụng nhiều khi cỡ mẫu của
các nhóm so sánh khác nhau nhiều.
So sánh nhiều giá trị TB
Hãy so sánh trọng lượng khi sinh của bé con của
những bà mẹ có độ tuổi khác nhau
9Kiểm tra phân bố chuẩn cho biến (bweight)
9Kiểm định ANOVA : Analyze/Compare
Means/One-way ANOVA