Tải bản đầy đủ (.pdf) (46 trang)

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - ANOVA ĐƠN BIẾN CHO PHÉP ĐO LẶP LẠI

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.4 MB, 46 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

SPSS
ANOVA đơn biến cho phép đo lặp lại

BS. Lê Đông Nhật Nam

1


Lời nói đầu
Mùa hè năm 1994 tôi theo học tại trung tâm văn hóa ngoài giờ ở đường Lý Tự Trọng quận 1 TP. Hồ
Chí Minh. Lúc đó tôi rất kém về môn toán (gần như mất căn bản toàn bộ chương trình toán cấp 2),
và kết quả tất yếu là trong kì thi xếp lớp tôi lãnh một điểm zéro tròn vo. Người ta tập hợp tất cả
những học sinh « siêu cấp » như tôi vào chung một lớp do thầy Vũ Cao Thắng quản nhiệm (đây là
một trong những thầy giáo tuyệt vời nhất mà từng gặp). Chỉ sau 3 tháng lớp của thầy không chỉ lấy
lại căn bản mà còn xuất sắc vượt qua kì thi cuối khóa, và 9 tháng sau 100% học sinh trong lớp đều
trở thành học sinh giỏi toán và hầu hết thi đậu vào lớp 10 với điểm số rất cao. Nhiều bạn bè tôi còn
thi đậu vào khối A trường chuyên.
Câu chuyện này là bài học đầu tiên trong đời tôi về ý nghĩa thực sự của điểm số và những kì thi, từ
đó tôi hiểu rằng mọi vật trên đời đều thay đổi theo thời gian do tự bản thân hay dưới sự tác động
của một yếu tố bên ngoài.

Trong nghiên cứu y học, nếu chỉ khảo sát cắt ngang tại một thời điểm duy nhất ta có nguy cơ đưa ra
kết luận sai lầm về bản chất của một hiện tượng. Để nhìn thấy quy luật diễn tiến của một bệnh lý,
đánh giá hiệu quả của một phương pháp điểu trị, ta thường theo dõi cùng 1 bệnh nhân ở nhiều
thời điểm khác nhau, khảo sát 1 yếu tố ở các điều kiện khác nhau. Từ đó đặt ra vấn đề so sánh
những giá trị này để tìm sự khác biệt.
Phương pháp thống kê cho phép giải quyết bài toán này là phân tích phương sai cho phép đo lặp lại
(ANOVA for repeated measure) hay còn gọi là ANOVA cùng đối tượng (within subject).


Tài liệu này sẽ hướng dẫn chi tiết cách thực hiện ANOVA cho phép đo lặp lại bằng phần mềm IBMSPSS. Nội dung tài liệu có lẽ nhiều bạn đã biết, nhưng lần này chúng sẽ được trình bày dưới một
hình thức hoàn toàn mới. Mục đích của tôi là viết ra một tài liệu thống kê để người đọc cảm thấy
« dễ chịu và thú vị» khi theo dõi thay cho cảm giác bất an và khó chịu do sự khô khan của môn học
này.

2


Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất
hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý
thuyết thống kê. Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời
gian đi vào cách thực hiện chi tiết. Anh ta cũng hay trình bày lý thuyết
thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi
với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …

Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành
thạo SPSS. Như tên gọi của mình, BS Nhi có tính cách rất hồn
nhiên và sống ngây thơ như trẻ con, vì vậy cô luôn có khuynh
hướng đơn giản hóa tối đa mọi vấn đề. Cô ấy sẽ hướng dẫn
các bạn sử dụng SPSS từng bước cụ thể, chia sẻ những mẹo
vặt, thủ thuật để giúp các bạn đi đến kết quả nhanh và dễ
dàng nhất.


Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện rất đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.

3


1

1.1 Tình huống thí dụ

Rối loạn chuyển hóa phosphat là một yếu tố nguy cơ tử vong ở bệnh nhân
bỏng nặng.
Một bác sĩ tại khoa Bỏng thực hiện đề tài khảo sát sự thay đổi nồng độ
Phosphat trong huyết thanh ở bệnh nhân bỏng. Nghiên cứu được thực hiện
trên 20 bệnh nhân người lớn bị bỏng độ 2 hơn 30% tổng diện tích cơ thể
hoặc độ 3 quá 15% tổng diện tích cơ thể.
Biến số cần khảo sát là nồng độ phosphat trong huyết thanh (đơn vị mg/dl).
Bệnh nhân được lấy 2 mL máu tĩnh mạch vào buổi sáng ở thời điểm 3-6-9
ngày sau khi nhập viện. Mẫu máu sau đó sẽ được quay ly tâm để tách huyết
thanh và định lượng nồng độ phosphate bằng máy phân tích sinh hóa tự
động Hitachi-Boehringer-Mannheim.
Câu hỏi nghiên cứu của Bảo là tìm ra quy luật biến đổi của nồng độ serum
phosphat trong thời gian nằm viện, liệu nó sẽ tiếp tục giảm, dao động ngẫu
nhiên hay được cải thiện ?


Phương pháp thống kê thích hợp trong trường hợp này là «Phân tích phương
sai (ANOVA) đơn biến cho thí nghiệm lặp lại (còn gọi là ANOVA 1 yếu tố cho
các nhóm phụ thuộc hay ANOVA 1 yếu tố cùng đối tượng) »
Phương pháp này cho phép bạn phân tích sự biến đổi giá trị của 1 biến số
định lượng qua nhiều lần khảo sát (≥3 lần đo) trên cùng một đối tượng

Giả thuyết 0: giá trị trung bình là như nhau ở mỗi lần đo:
H0: µ1= µ2=…= µk (k ≥3)
Và giả thuyết thay thế: Có ít nhất 1 lần đo cho ra giá trị trung bình khác biệt so
với những lần đo còn lại.
Để kiểm tra giả thuyết này, ta tính hệ số F = tỉ lệ giữa sự biến thiên gây ra bởi
điều kiện khảo sát (ví dụ yếu tố thời gian, can thiệp, phương pháp đo) và biến
thiên gây ra do yếu tố ngẫu nhiên nội tại.
4


1

1.2 Giới thiệu

Biến thiên được khảo sát bằng Sum of square (SS), gồm nhiều loại:
SST : total variability : Thay đổi chung
SSB: khác biệt giữa đối tượng này so với với đối tượng khác (between subject)
SSw: Thay đổi giữa 2 lần đo khác nhau trên cùng 1 đối tượng (within subject)
SSw lại được chia ra thành 2 loại:
SSM: Model, thay đổi gây ra do điều kiện thí nghiệm (hiệu ứng của nhân tố can thiệp)
SSR: residual: Thay đổi do sai sót trong quá trình đo, hoàn toàn ngẫu nhiên

SST = S2*(N-1); với S= phương sai tổng quát của tất cả giá trị xét chung, không phân biệt lần đo, có độ tự do
df = (N-1)

𝑆𝑆𝑅 =

𝑛
𝑖=1

𝑥𝑖 − 𝑥𝑖

2

= 𝑠2 𝑛 − 1

với s = phương sai tính cho từng lần đo (n như nhau cho mỗi lần đo)

𝑆𝑆𝑤 = 𝑆12 ∗ 𝑛1 − 1 + ⋯ + 𝑆12 ∗ 𝑛𝑘 − 1
= biến thiên giá trị ở từng cá thể, rồi cộng tất cả lại; số lần đo = k
Mỗi cá thể có độ tự do dFi=(n-1) nên dF tổng cộng = tổng các dFi
𝑆𝑆𝑀 =

𝑘
𝑘=1 𝑛𝑘

𝑥𝑘 − 𝑥𝑔𝑟𝑎𝑛𝑑

2

và có độ tự do dFM = (k-1)

SSR = (SSW-SSM) = residual sum of square và có độ tự do dfR = dfW – dfM
Sau đó ta ước tính Mean square, để trung hòa ảnh hưởng sai lầm gây ra do số lần đo; gồm 2 loại:
Mean square chính hay của « mô hình »: MSM = SSM/dfM

Mean square của sai số: Residual (error) mean square: MSR=SSR/dFR
Từ đó, ta tính hệ số F:
F = MSM/MSR
Nếu F>1: hiệu ứng của yếu tố khảo sát lớn hơn sai biệt do ngẫu nhiên

5


1

1.2 Giới thiệu

Nguồn gốc của sự
biến thiên
Do điều kiện thí
nghiệm (mô hình)
Do cơ địa của đối
tượng
Do sai số ngẫu nhiên
Tổng hợp các yếu tố

Sum of square
(SS)
SSM

Độ tự do
(dF)
k-1

Mean of square

(MS)
MSM

MSM/MSR

SSB

n-1

MSB

MSB/MSR

SSR
SST

(k-1)*(n-1)
N-1

MSR

Kiểm tra các giả định

Thực hiện phân tích ANOVA
cho phép đo lặp lại

Tỉ số F

Sử dụng chức năng Explore của SPSS


Sử dụng chức năng GLM của SPSS
Có giả thuyết rõ ràng

Phân tích khuynh hướng
Phân tích tương phản

Phân tích sâu
Chưa có giả thuyết rõ ràng

Post hoc test

Tính hệ số ảnh
hưởng/tương phản

Qui trình phân tích phương sai đơn biến cho phép đo lặp lại
Bước 1: Thăm dò dữ liệu :
Kiểm tra điểm ngoại lai (giá trị cá biệt)
Kiểm tra giả định phân phối bình thường (chuẩn) của giá trị ở mỗi lần đo
Bằng các công cụ: Boxplots, QQ plot, thống kê mô tả, kiểm định Sapiro-Wilk…
Sau đó: Nếu có Outliers: Ta phải xử trí. Nếu Phân phối không chuẩn: xứ trí hoặc bỏ qua
Bước 2: Tiến hành phân tích ANOVA 1 yếu tố cho phép đo lặp lại
2-1) Kiểm tra giả định sphericity (đồng nhất về phương sai) bằng test Mauchly
2-2) Thực hiện F-test, có hoặc không có hiệu chỉnh tùy theo kết quả Mauchly test
Bước 3: Phân tích sâu
3A) Không có giả thuyết: Post-hoc (multivariate test)
3B) Có giả thuyết: phân tích tương phản (contrast )
Bước 4: Tính Effect size

6



1

1.2 Giới thiệu

Phân tích phương sai (ANOVA) đơn biến cho thí
nghiệm lặp lại có thể ứng dụng cho nhiều thiết kế
nghiên cứu như
1. Khảo sát sự biến thiên của 1 đại lượng theo
thời gian :
- Diễn tiến của một bệnh lý trong khoảng thời gian
nằm viện
- Đánh giá hiệu quả trị liệu: So sánh sự thay đổi của
triệu chứng (định lượng) trước và sau khi điều trị
- Nghiên cứu dược động học, sinh hóa học: khảo sát
nổng độ của một chất trong cơ thể theo thời gian.

2. So sánh giá trị 1 đại lượng giữa những điều
kiện khảo sát khác nhau:
- Nghiên cứu sự dao động của giá trị một đại lượng
ở các thời điểm khác nhau trong ngày
- Ảnh hưởng của môi trường (nhiệt độ, độ cao…),
chế độ ăn, tư thế… lên kết quả xét nghiệm
- So sánh những phương pháp đo, thiết bị đo khác
nhau

Bạn cần có:
1 biến số định lượng liên tục biểu thị cho đại lượng
cần nghiên cứu ; ví dụ: nồng độ 1 chất trong máu
1 biến số định tính để phân loại điều kiện đo (≥3

giá trị). Ví dụ: Thời gian

Biến số định lượng

ANOVA còn có thể được hiểu như một mô hình hồi
quy khảo sát sự biến thiên của biến số định lượng
theo thời gian (ở những lần đo khác nhau)

Lần đo 1

So sánh ?

2

3

4

7


2

2.1 Lập bảng số liệu

Trong cửa sổ Variable view: Trước hết ta tạo 3 biến số định lượng kiểu liên tục (
)
chỉ nồng độ phosphate huyết thanh đo ở ngày thứ 3,thứ 6 và thứ 9 (SP3,SP6,SP9), đơn vị là
mg/dl.
Cột

cho phép bạn mô tả ý nghĩa của biến số, điều này rất có ích nếu sau
này bạn muốn chuyển số liệu cho một đồng nghiệp khác sử dụng.

Số thứ tự
1
2
3

n

Lần đo
1
X11
X21
X31

Xn1

Lần đo
2
X12
X22
X32

Xn2



Lần đo k








X1k
X2k
X3k

XnK

Với ANOVA cho phép đo lặp lại, bạn không cần
tạo biến số định tính để phân nhóm mà chỉ cần
tạo 3 biến số định lượng riêng biệt tương ứng cho
mỗi lần đo.
Khi tạo bảng số liệu trong SPSS, bạn nên sắp xếp
các biến số (lần đo) theo thứ tự thời gian, thứ tự
này sẽ giúp tránh nhầm lẫn khi thiết kế cấu hình
của phân tích ANOVA.

8


2

2.2 Thăm dò số liệu và kiểm tra giả định
1

Kích hoạt chức năng thăm dò số liệu


2

3

Trong hộp thoại Explore,
bạn kéo tất cả những biến
số định lượng vào ô
Dependent list, sau đó
nhấn
để mở hộp
thoại vẽ biểu đồ.

4

5

9


2

2.2 Thăm dò số liệu và kiểm tra giả định

Vẽ biểu đồ Boxplot chung cho
các biến định lượng

6

Thực hiện kiểm định phân

phối bình thường

Sau khi chọn xong cấu hình, bạn nhấn
để trở về hộp thoại chính (Explore).

8

7

Nhấn OK để chạy thăm dò.

10


2

2.2 Thăm dò số liệu và kiểm tra giả định

4

Nếu bạn sử dụng lấp trình cú
pháp, đây là nội dung những lệnh
cần thiết cho bước thăm dò số
liệu.

5

7

6


DATASET ACTIVATE DataSet2.
EXAMINE VARIABLES=SP3 SP6 SP9
/PLOT BOXPLOT STEMLEAF HISTOGRAM NPPLOT
/COMPARE VARIABLES
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.

11


2

2.2 Thăm dò số liệu và kiểm tra giả định

Case Processing Summary
Cases
Valid

Missing

Total

N

Percent

N


Percent

N

Percent

Serum P Ngày thứ 3

20

100,0%

0

0,0%

20

100,0%

Serum P Ngày thứ 6

20

100,0%

0

0,0%


20

100,0%

Serum P Ngày thứ 9

20

100,0%

0

0,0%

20

100,0%

Kiểm tra việc thiếu sót dữ liệu
Descriptives
Serum P Ngày thứ 3

Mean

Statistic

Std. Error

2,49623


,093429

95% Confidence

Lower Bound

2,30068

Interval for Mean

Upper Bound

2,69178

5% Trimmed Mean

2,50206

Median

2,40000

Variance
Std. Deviation

,175
,417828

Minimum


1,688

Maximum

3,200

Range

1,513

Interquartile Range

,652

Skewness

,186

,512

Kurtosis

-,625

,992

Thông tin cần quan tâm: Giá trị trung bình và độ lệch chuẩn

12



2

2.2 Thăm dò số liệu và kiểm tra giả định
Có 2 cách kiểm tra giả định phân phối chuẩn:
1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov :
tối ưu cho trường hợp cỡ mẫu không quá lớn (<50 trường hợp), nhưng lại không đáng tin
cậy khi cỡ mẫu quá nhỏ)
2) Phương pháp trực quan - Sử dụng biểu đồ Q-Q plot: Thích hợp cho những cỡ mẫu lớn
(> 50 trường hợp)
Tests of Normality
Kolmogorov-Smirnova

Shapiro-Wilk

Statistic

df

Sig.

Statistic

df

Sig.

Serum P Ngày thứ 3


,121

20

,200*

,953

20

,420

Serum P Ngày thứ 6

,103

20

,200*

,978

20

,900

Serum P Ngày thứ 9

,132


20

,200*

,943

20

,278

*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Kết quả kiểm định Sapiro-Wilk
Với kiểm định Kolmogorov Smirnov hoặc Shapiro-Wilk, kết quả ta trông đợi là p > 0.05 .
Nếu p<0.05 tức là giả định phân phối chuẩn đã bị vi phạm.
Trong thí dụ này, phân phối của giá trị nồng độ phosphate.serum là bình thường cho cả 3 lần đo
(p> 0.05)

Phân phối không chuẩn

Phân phối chuẩn

Nếu bạn có cỡ mẫu lớn (> 50 trường hợp), có thể dùng biểu đồ Q-Q để phát hiện nhanh sự vi phạm
giả định phân phối chuẩn. Nếu các điểm giá trị phân phối chuẩn, chúng sẽ nằm rải rác gần đường
thẳng (màu xanh) như trong hình. Nếu có sự phân tán (các điểm phân bố xa khỏi đường thẳng này)
tức là phân phối không chuẩn (màu đỏ).

13



2

2.2 Thăm dò số liệu và kiểm tra giả định

*
X3
X1,5

*

Điểm giá trị cá biệt
Điểm giá trị chênh lệch cực độ

Biểu đồ Box-plots cho phép phát hiện nhanh các điểm giá trị cá biệt (chênh lệch quá
lớn so với độ lệch chuẩn). Biểu đồ này cũng dùng để báo cáo kết quả.
Bất cứ điểm nào có khoảng cách > 1,5 lần chiều dài của error bar được xem là điểm
ngoại lai.
Nếu cách biệt lớn hơn 3 lần, đó là giá trị rất phân cực.
Trong hình trên, không có điểm giá trị ngoại lai nào được phát hiện.
Nếu có trường hợp giá trị cá biệt, SPSS sẽ đánh dấu bằng mã số thứ tự cho phép ta
định vị dễ dàng trường hợp đó trong bảng số liệu.

Điểm giá trị cá biệt
(trường hợp thứ 5 trong bảng số liệu)

Điểm giá trị chênh lệch cực độ
(trường hợp thứ 4 trong bảng số liệu)

14



2

2.2 Thăm dò số liệu và kiểm tra giả định

Nếu có điểm giá trị ngoại
lai, ta phải xử trí thế nào
?

+ Đầu tiên, cần tìm hiểu nguyên nhân của giá trị cá biệt này: Có thể do nhập số liệu
sai ? Có thể do sai sót trong quá trình đo (đa số trường hợp). Sau khi đã loại trừ tất
cả nguyên nhân chủ quan, ta buộc phải kết luận rằng giá trị đó có thực và hoàn
toàn ngẫu nhiên (rất hiếm gặp, đồng nghĩa với việc đối tượng thực sự là một ngoại
lệ).
Nếu ta quyết định vẫn giữ điểm ngoại lai; ta có nhiều lựa chọn:
1) Sử dụng phương pháp phi tham số (kiểm định Friedman, là giải pháp thay thế
cho ANOVA trong phép đo lặp lại)
2) Thay đổi giá trị cá biệt bằng 1 giá trị khác gần với nó nhất có thể (ví dụ: nếu giá
trị x = 10 được xem là quá khác biệt, ta có thể thử giá trị x=8 , vẫn là giá trị cao nhất
nhưng còn nằm trong giới hạn cho phép) (Lưu ý: giá trị thay thế có thể là giả hay
thật đều được)
3) Chuyển dạng biến số (ví dụ đổi sang thang đo logarit)
4) Cầu kì hơn: Ta tiến hành làm ANOVA song song cho 2 trường hợp: Có và không
có điểm giá trị ngoại lai, nếu kết quả tương tự nhau, ta giữ, ngược lại ta bỏ.
Loại bỏ giá trị luôn là lựa chọn cuối cùng:
Nếu ta quyết định bỏ điểm ngoại lai này, cỡ mẫu sẽ bị giảm đi một số trường hợp
tương ứng cho cả những lần đo khác và effect size sẽ bị ảnh hưởng.

15



2

2.2 Thăm dò số liệu và kiểm tra giả định

Nếu giả định phân phối
chuẩn bị vi phạm ta
phải xử trí thế nào ?

Bạn có nhiều lựa chọn
1) Chuyển dạng biến số (ví dụ thang đo Logarit), với hy vọng sẽ có phân phối
chuẩn
2) Sử dụng phương pháp phi tham số (kiểm định Friedman, là giải pháp thay
thế cho ANOVA trong phép đo lặp lại)
3) Bỏ qua vi phạm và vẫn làm phân tích ANOVA (Thực ra điều kiện phân phối
không phải là tuyệt đối bắt buộc).
4) Làm ANOVA song song cho 2 mẫu số liệu: nguyên thủy và đã chuyển dạng
(logarit hóa), so sánh kết quả của chúng với nhau.

Lời khuyên của BS Nhi:
Nếu bạn có bất thường về số liệu, bạn NÊN báo cáo điều đó cụ thể trong phần kết
quả, nhất là cách bạn xử lý những điểm giá trị cá biệt.
Nếu phân phối lệch trái hay phải, ngoài giá trị trung bình và SD bạn nên cung cấp thêm
giá trị của Skewness và Kurtosis (trong bảng kết quả Explore)
Hành động này sẽ đánh vào tâm lý của các nhà phê bình và giám khảo, loại bỏ nghi
ngờ về việc gian lận và ngụy tạo số liệu, nhất là khi kết quả của bạn quá hoàn hảo.
Người đọc sẽ nghĩ: Tác giả là một người thành thật và nắm vững phương pháp thống
kê.


16


3

3.1 Thực hiện phân tích ANOVA

ANOVA cho phép đo lặp lại nằm trong mục GLM repeated measure (Mô hình tuyến tính
tổng quát cho phép đo lặp lại).

1

2

3

Tên của biến số định tính
phân nhóm điều kiện
(thường là thời gian)

Số lần đo

Tên của biến số định lượng

17


3

3.1 Thực hiện phân tích ANOVA


Với phép đo lặp lại, SPSS sẽ tạo 1 biến số ảo để chỉ điều
kiện, trong đa số trường hợp biến số này được xem là “Thời
gian”, bạn có thể đặt tên cho nó tùy ý, ví dụ: Lần đo, Điều
kiện, can thiệp, thiết bị…

4

sau đó nhập giá trị cho thứ bậc “level” (số lần đo=k), ví dụ
bạn khảo sát 3 lần thì nhập vào số 3
Sau khi làm xong, bạn nhấn nút

để xác nhận.

Biến số phân nhóm « Thoigian(3) » đã được xác nhận
Tiếp theo bạn sẽ quy định biến số định lượng cần khảo sát.
Tên của nó có thể đặt tùy ý, ví dụ: « SerumP »
Sau khi đặt tên, bạn nhấn nút

để xác nhận

Cuối cùng, bạn nhấn
để ghép 3 biến số rời trong
bảng số liệu vào bảng Within-subject variables.

5

6
18



3

3.1 Thực hiện phân tích ANOVA
Bạn phải gắn kết 3 biến số định
lượng với 3 điều kiện khảo sát.
Nếu bạn làm theo lời khuyên ở trên
là sắp xếp các biến số theo thứ tự
thời gian (cùng tên, phân biệt bằng
thứ tự lần đo:1,2,3…), bạn chỉ cần
chọn tất cả rồi nhấn nút
hay
kéo vào ô bên phải.

7

8

Nhấn nút
để mở
hộp thoại vẽ biểu đồ

19


3

3.1 Thực hiện phân tích ANOVA
Kéo biến số phân nhóm « Thoigian » vào ô
« Horizontal axis ». Lựa chọn này cho phép

vẽ 1 biểu đồ duy nhất khảo sát sự biến
thiên của serum Phosphat (trục tung) theo
thời gian ở « Trục hoành.

9

Biểu đồ này rất hữu ích vì cho ta thấy
khuynh hướng thay đổi, từ đó hình thành
giả thuyết tương phản.

10

Sau khi chọn xong, nhấn nút
xác nhận

Nhấn

để

để trở về hộp thoại chính.

11

20


3

3.1 Thực hiện phân tích ANOVA
Nhấn

để mở hộp thoại tùy
chọn phân tích thống kê.

12

Hộp thoại Option này cho phép
chúng ta làm thêm các loại phân tích
thống kê phụ; trong đó quan trọng
nhất là:

13

- Mô tả (Descriptive statistic)
- Ước tính hệ số ảnh hưởng
Các chức năng khác không cần thiết
cho phân tích ANOVA nên ta không
cần chọn.

14

Ngoài ra ta cũng có thể hiệu chỉnh
ngưỡng giá trị p (Significant level),
mặc định là 0.05
Sau khi chọn xong, bạn nhấn
để trở về hộp thoại chính

15

21



3

3.2 Diễn giải kết quả cơ bản

Nếu bạn chỉ muốn dừng lại ở phân
tích phương sai tổng quát (test F),
công việc đến đây là đủ, bạn có thể
nhấn
để chạy phân tích.

Nếu bạn muốn làm thêm post-hoc
test hay phân tích tương phản, xin
đọc phần tiếp theo.

16
Sau đây là phần kết quả của phân tích phương sai cơ bản
Within-Subjects Factors
Measure: SerumP

Kiểm tra lần cuối sự bắt cặp giữa biến số khảo sát (dependent variable)
và biến số phân nhóm điều kiện (Thời gian).

Dependent
Thoigian

Variable

1


SP3

2

SP6

3

SP9

Nếu bạn đã sắp thứ tự đúng thì không có gì phải bận tâm.

Descriptive Statistics
Mean

Std. Deviation

N

Serum P Ngày thứ 3

2,49623

,417828

20

Serum P Ngày thứ 6

3,35691


,489250

20

Serum P Ngày thứ 9

3,82986

,386590

20

Đọc bảng mô tả, cho biết giá trị trung
bình (mean) và độ lệch chuẩn (SD) của
đại lượng khảo sát ứng với mỗi điều kiện
(lần đo). Bằng trực giác, ta có thể có cái
nhìn sơ lược về khuynh hướng thay đổi
của giá trị này. Lưu ý: n phải như nhau ở
3 nhóm, ngược lại tức là có trường hợp
sót số liệu

Giá trị trung bình
Độ lệch chuẩn

Số trường hợp

Những thông tin ta sẽ cần khi báo cáo kết quả là: Mean, SD, khuynh hướng
(tăng/giảm/không đổi).


22


3

Kiểm tra giả định phương sai đồng nhất (Sphericity) dựa vào test Mauchly:
Đầu tiên, ta tính sự khác biệt giữa các cặp điều kiên :
Dif = Giá trị Lần đo sau – Giá trị Lần đo trước.
Ví dụ với k=3 , ta sẽ có 3 cặp tổ hợp (2-1) ; (3-1) ; (3-2)
Sau đó , tính phương sai của khác biệt cho mỗi cặp
+ Kiểm định Mauchly kiểm tra giả thuyết 0 : phương sai của sự khác biệt là như nhau giữa
các cặp tổ hợp
H0 : S dif(2-1)=S dif(3-1) = S dif(3-2)
+ Nếu test dương tính (chấp nhận giả thuyết H0), p<0.05 thì phương sai khác biệt không
đồng nhất, giả định sphericity bị vi phạm.
+ Test Mauchly âm tính, p>0.05 thì kết luận là số liệu thỏa mãn giả định Sphericity.

+ Một cách đơn giản, ta có thể hiểu giả định Sphericity tương đương với
giả định về phương sai đồng nhất của test trong ANOVA 1 yếu tố cho các
nhóm độc lập.
- Ta trông đợi p>0.05 cho test Mauchly
- Kết quả test Mauchly phụ thuộc vào cỡ mẫu: Cỡ mẫu lớn thì sai lệch dù
nhỏ cũng trở thành có ý nghĩa; cỡ mẫu nhỏ thì có nguy cơ bỏ sót vi
phạm.

- Thực ra giả định Sphericity bị vi phạm không ảnh hưởng đến phân phối
của F, chỉ giảm sức mạnh thống kê của test post-hoc.
- Sphericity thỏa: có thể dùng test Tukey, tuy nhiên trong bất cứ trường
hợp nào, post hoc test tối ưu vẫn là phương pháp Bonferonni.
Mauchly's Test of Sphericitya

Measure: SerumP
Epsilonb

Approx. ChiWithin Subjects Effect
Thoigian

Greenhouse-

Mauchly's W

Square

df

Sig.

Geisser

Huynh-Feldt

Lower-bound

,864

2,623

2

,269


,881

,964

,500

Kết quả kiểm định Mauchly cần được báo cáo, với các thông tin : giá trị χ2, độ tự do,
giá trị p.
Trong thí dụ này, ta có thể diễn giải như sau:
Kiểm định Mauchly cho thấy có sự đồng nhất về phương sai (thỏa giả định về
sphericity) với χ2(2) = 2.623 (p=0.269).

23


3

3.2 Diễn giải kết quả cơ bản

Nếu test Mauchly cho ra kết quả dương tính (p<0.05) , ta sẽ báo cáo như sau :
Có sự vi phạm giả định về sự đồng nhất phương sai của khác biệt giữa các lần đo, theo kết quả
của kiểm định Mauchly : χ2(df) =… p = …. (< 0.05)
Nếu giả định sphericity bị vi phạm, ta bắt buộc phải hiệu chỉnh độ tự do df trong phân tích
ANOVA, từ đó sẽ cho ra giá trị p khác. Chỉ số hiệu chỉnh gọi là epsilon (ε)
Mauchly's Test of Sphericitya
Measure: SerumP
Epsilonb

Approx. ChiWithin Subjects Effect
Thoigian


Greenhouse-

Mauchly's W

Square

df

Sig.

Geisser

Huynh-Feldt

Lower-bound

,864

2,623

2

,269

,881

,964

,500


Chỉ số hiệu chỉnh epsilon (ε)
Có 3 phương pháp hiệu chỉnh là :
(1) Greenhouse Geisser,

(2) Huynh-Feldt
(3) Lower bound
Việc lựa chọn phương pháp hiệu chỉnh dựa vào giá trị của (ε).
Hệ số này có giá trị nhỏ nhất = 1/(1/(k-1) , lớn nhất = 1
(ε) càng thấp, vi phạm giả định càng lớn (ε =1 khi có sự đồng nhất tuyệt đối)
Nếu ε > 0.75 : Nên sử dụng phương pháp Huynh-Feldt
Nếu ε < 0.75: nên sử dụng phương pháp Green-HG

24


3

3.2 Diễn giải kết quả cơ bản
Ý nghĩa
thống kê
Độ tự do dfM
Độ tự do dfError

Hệ số ảnh hưởng

Giá trị hệ số F

Tests of Within-Subjects Effects


Measure: SerumP
Type III Sum

M

Error(Thoigian)

E

Partial Eta

of Squares

df

Square

F

Sig.

Squared

Sphericity Assumed

18,287

2

9,143


176,194

,000

,903

Greenhouse-Geisser

18,287

1,761

10,383

176,194

,000

,903

Huynh-Feldt

18,287

1,927

9,489

176,194


,000

,903

Lower-bound

18,287

1,000

18,287

176,194

,000

,903

Sphericity Assumed

1,972

38

,052

Greenhouse-Geisser

1,972


33,462

,059

Huynh-Feldt

1,972

36,617

,054

Lower-bound

1,972

19,000

,104

Source
Thoigian

Mean

Đây là bảng kết quả chính của ANOVA, tương tự như trong phân tích ANOVA 1 yếu tố cho
nhiều phân nhóm độc lập, nó sẽ cho ta biết giá trị của hệ số F, độ tự do của F và ý nghĩa
thống kê.
Nếu giả định Sphericity không bị vi phạm, bạn có thể đọc kết quả trực tiếp ở hàng thứ 1:

“Sphericity assumed”, tức không cần hiệu chỉnh
Giá trị p (Sig) cho phép kết luận hay phủ định về sự khác biệt có ý nghĩa giữa các lần đo
khác nhau. P< 0.05 cho thấy có sự khác biệt ý nghĩa.
Khi báo cáo kết quả, ta cần trình bày những thông tin sau đây:
F: giá trị hệ số F

dfM: độ tự do của mô hình (model) hay tác động của điều kiện thí nghiệm
dfError: độ tự do của sai số (error) hay yếu tố ngẫu nhiên
Test F so sánh giá trị này với phân phối F:
Sig: ý nghĩa thống kê (giá trị p)
Ví dụ:
Kết quả phân tích phương sai cho thấy có sự khác biệt ý nghĩa về giá trị của serum
phosphate tại các thời điểm khảo sát khác nhau; F(2,38)= 176.19 ; p<0.001

25


×