Tài liệu hướng dẫn thống kê y học sử dụng SPSS - ANOVA HỖN HỢP

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.18 MB, 67 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

ANOVA hỗn hợp

Lê Đông Nhật Nam

Lời nói đầu
Có lần BS. Lê Ngọc Khả Nhi nhận xét về sự giao thoa giữa âm nhạc và cuộc đời mình như sau: « Hoàn cảnh
quyết định sở thích, sở thích hình thành nhân cách, và nhân cách quyết định số phận »…
Nhi kể với tôi rằng từ nhỏ đến khi học trung học cô bé chỉ toàn nghe nhạc cổ điển, vì nhà nghèo nên không có
cassette, CD, đêm nào cô cũng chỉ làm bạn với chiếc radio và những bản giao hưởng trên đài FM. Năm 25 tuổi
cô ấy lần đầu tiên xa nhà và qua Paris du học. Tưởng rằng thành phố châu Âu lãng mạn với những phòng hòa
nhạc nổi tiếng và kho tàng những bản thu âm cổ điển khổng lồ sẽ chắp cánh cho sở thích âm nhạc cổ điển bay
cao hơn; nhưng Nhi tâm sự rằng khi sống xa quê hương cô ấy mới biết yêu thích âm nhạc Việt. Dù vẫn đi
Théâtre Champs-Ellysée để nghe concerto, giao hưởng; nhưng hằng ngày trên những chuyến metro Nhi chỉ
cắm tai nghe chìm đắm trong những bản tình ca của Lam Phương, Trịnh Công Sơn, Ngô Thụy Miên… Nhi kể
càng nghe những bài hát xưa cũ đó, càng thấy xót xa cho quê hương và yêu thương con người nhiều hơn. Có
sự tương tác nào đó giữa nhạc và lời đã đánh thức những hạt giống tâm hồn của người Việt tưởng chừng ngủ
quên từ rất lâu. Đến bây giờ cô ấy vẫn còn nghe cả 2 dòng nhạc và nhìn cuộc đời bằng đôi mắt lãng mạn, đa
cảm.
Thời gian, nơi chốn, những tác đông từ bên ngoài và thay đổi nội tại từ bên trong… tất cả điều khiển, dẫn dắt
chúng ta từng ngày, từng giờ trên con đường mà ta gọi là số phận, ít người cảm nhận được cho đến một thời
điểm nào đó ta chợt ngỡ ngàng nhìn lại mình, so với người và thấy mình tự thay đổi, thế gian thay đổi từ lúc
nào không hay…
Trong y học cũng thế, nếu ở thời kỳ sơ khai người ta nghiên cứu một căn bệnh theo những mô hình đơn lẻ về
cơ chế bệnh sinh nội tại do rối loạn chức năng, hay bên ngoài do nhiễm khuẩn, và tìm cách điều trị chúng, thì
ngày nay cùng một vấn đề được liên kết với rất nhiều yếu tố, bên trong con người thì khoa học đã đi sâu đến
cấp độ gene, phân tử và tế bào, bên ngoài thì có dịch tễ, kinh tế xã hội, môi trường… và những tương tác giữa
chúng, ví dụ ngành biểu sinh học.

Để góp phần dù nhỏ bé, trong việc cung cấp những công cụ phân thích thống kê giúp các bạn khảo sát một
vấn đề theo nhiều chiều, kết hợp đa yếu tố và cảm nhận được sự tương tác giữa chúng, tài liệu nhỏ này sẽ
giới thiệu phương pháp ANOVA hỗn hợp. Bằng 1 thí dụ đơn giản, chúng ta sẽ thấy làm cách nào kết hợp 2
thiết kế nghiên cứu khác nhau lại làm một để khảo sát cùng lúc hiệu ứng nội tại của thời gian, và bên ngoài
của bệnh lý.
Như những lần trước, mọi vấn đề sẽ được đơn giản hóa tối đa. Các bạn có thể làm được cho nghiên cứu của
bản thân ngay hôm nay dù ngày hôm qua còn chưa biết ANOVA là gì.
Chúc các bạn thành công.

Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất
hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý
thuyết thống kê. Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời
gian đi vào cách thực hiện chi tiết. Anh ta cũng hay trình bày lý thuyết
thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi
với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …

Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành
thạo SPSS. Như tên gọi của mình, BS Nhi có tính cách hồn
nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh
hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ hướng
dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ
những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả

nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.

3

1

1.1 Tình huống thí dụ

Y

F1

F2

F3

T1

T2

3 tháng đầu

Tiền sản giật là một tình trạng bệnh lý trong thai
kỳ được đặc trưng bởi tăng huyết áp và protein
niệu cao. Tình trạng bệnh lý có thể phát triển dần
trong thai kỳ và có diễn tiến bất ngờ trong 3
tháng cuối, gây ra những biến chứng nguy hiểm
cho cả mẹ và thai nhi.
Một bác sĩ Sản khoa thực hiện nghiên cứu nhằm
khảo sát sự thay đổi nồng độ Magnesium (Mg)
huyết thanh trong thai kỳ. Đây là một ion tham
gia vào cơ chế điều hòa huyết áp. Nghiên cứu có
thiết kế như sau: Nồng độ Mg trong huyết thanh
được ghi nhận (hồi cứu) 3 lần vào thời điểm 3
tháng đầu, 3 tháng giữa và 3 tháng cuối thai kỳ ở
30 thai phụ chia thành 3 phân nhóm : 1) Thai kỳ
bình thường (hay nhóm chứng âm n=10); 2) Cao
huyết áp đơn thuần (Nhóm chứng dương, n=10)
và 3) Tiền sản giật (n=10).
Câu hỏi nghiên cứu gồm có: (A) Khảo sát khuynh
hướng thay đổi của nồng độ Mg huyết thanh
trong thai kỳ; (B) Liệu có sự khác biệt giữa 3 phân
nhóm ?
Chúng ta phải sử dụng phương pháp thống kê
nào trong trường hợp này ?

Nồng độ Mg
huyết thanh

Phân nhóm
F1: Bình thường

F2: Cao huyết áp
F3: Tiền sản giật

Thai kỳ

3 tháng giữa

T3
3 tháng cuối

Bảo thân mến, đây là một thiết kế nghiên
cứu khá phức tạp, vì có khả năng 2 yếu tố
thời gian mang thai và bệnh lý tương tác
với nhau.

Chúng ta sẽ sử dụng phân tích phương sai
hỗn hợp, là sự kết hợp giữa ANOVA cho
hiệu ứng bên ngoài và bên trong đối
tượng.

1

1.2 Danh pháp ANOVA

Cách trình bày trong sách vở làm cho chúng ta dễ ngộ nhận là có nhiều phương pháp ANOVA khác nhau.
Thực ra chúng đều dựa trên nguyên tắc chung duy nhất đó là mô hình hồi quy tuyến tính. Người ta phân
chia ra nhiều kiểu ANOVA là dựa trên 2 yếu tố:
+ Số lượng biến số độc lập (hay yếu tố ảnh hưởng ) ?
+ Thiết kế nghiên cứu

Danh pháp chung của ANOVA như sau:
Phân tích phương sai + [số lượng biến số độc lập] yếu tố + (loại thiết kế nghiên cứu)
1 biến số độc lập : ANOVA 1 yếu tố (hay ANOVA đơn biến, tiếng Anh: one way ANOVA)
2 biến số độc lập: ANOVA 2 yếu tố (two ways ANOVA)
Thiết kế nghiên cứu:
Nếu tất cả biến số được khảo sát trên cùng một đối tượng ở nhiều điều kiện khác nhau: Ta có ANOVA cho
phép đo lặp lại (repeated measure, within subject ANOVA)
Nếu tất cả biến số khảo sát ở nhiều đối tượng độc lập: Ta có ANOVA cho các nhóm độc lập
Nếu một vài biến số được khảo sát trên đối tượng độc lập, và những biến còn lại được khảo sát trên cùng
đối tượng: thiết kế hỗn hợp
Tên phương pháp

Số biến độc lập

Thiết kế nghiên cứu

ANOVA đơn biến (1 yếu tố)

1

Nhiều phân nhóm độc lập

ANOVA đơn biến cho phép đo lặp lại

1

Phép đo lặp lại trên cùng đối tượng

ANOVA 2 yếu tố

2

Nhiều phân nhóm độc lập

ANOVA 3 yếu tố

3

Nhiều phân nhóm độc lập

ANOVA 2 yếu tố cho phép đo lặp lại

2

Phép đo lặp lại trên cùng đối tượng

ANOVA 2 yếu tố hỗn hợp

2

1 yếu tố được khảo sát trên đối tượng
độc lập Yếu tố còn lại khảo sát nhiều lần
trên cùng đối tượng
Phân nhóm

+
F

F1

F2

F3

Đơn biến độc lập

=
T

T1

T2

T3

F1

Giá trị trung bình của Y

Y

Y

F2

F3

Phép đo lặp lại
T1

T2

T3

ANOVA hỗn hợp

Lần đo (T)

1.3 ANOVA đơn biến : hiệu ứng bên ngoài và bên trong

1

Bài toán ta đang xét là sự kết hợp của 2 câu hỏi :
1° Khảo sát hiệu ứng của bệnh lý (phân nhóm F) lên giá trị Y (nồng độ Mg)
2° Khảo sát hiệu ứng của thời gian mang thai (phân nhóm T) lên giá trị Y (nồng độ Mg)
Hai câu hỏi này nếu được giải đáp riêng lẻ, sẽ dẫn tới 2 mô hình mà ta đã biết, là ANOVA đơn
biến (cho F) và ANOVA phép đo lặp lại, cho T.

F

Mô hình thí nghiệm bao gồm:
Y= bo+b1.F+ sai số

Y

R

MB

Bài toán ANOVA đơn biến nhằm mục đích chứng minh bệnh lý (F) gây
ra hiệu ứng ngoại (Between subject) ý nghĩa làm thay đổi giá trị Y giữa 3
phân nhóm: F1, F2 và F3.
Nó có thể được biểu diễn bằng mô hình hồi quy có dạng:

Y

Y= bo+b1.F+ sai số
Giá trị Y được xác định do hiệu ứng chính, bên ngoài do F gây ra và
phần sai số không rõ nguyên nhân. Mục tiêu của ta là chứng minh mô
hình có ý nghĩa, thông qua test F. Sau đó ta dùng post-hoc test hay
Contrast để so sánh giá trị trung bình Y giữa các phân nhóm F1,F2,F3.

F

F1

F2

F3

T

Mô hình thí nghiệm bao gồm:
Y= bo+b2.T+ sai số

MW

Y

R

Bài toán ANOVA cho phép đo lặp lại nhằm mục đích chứng minh thời
gian mang thai gây ra hiệu ứng nội tại (Within subject) ý nghĩa làm thay
đổi giá trị Y giữa 3 thời điểm khảo sát, trên cùng đối tượng.
Nó có thể được biểu diễn bằng mô hình hồi quy có dạng:

Y

Y= bo+b2.T+ sai số

T

T1

T2

T3

Giá trị Y được xác định do hiệu ứng chính, nội tại do T gây ra và phần sai
số không rõ nguyên nhân. Mục tiêu của ta là chứng minh mô hình có ý
nghĩa, thông qua test F. Sau đó ta dùng post-hoc test hay Contrast để
so sánh giá trị trung bình Y giữa các phân nhóm T1,T2,T3.

M: hiệu ứng chính của mô hình thí nghiệm
MB: Hiệu ứng do yếu tố bên ngoài (B=between)
MW: Hiệu ứng biến thiên nội tại (W=Within)
Y: Đại lượng được khảo sát
T: Thời điểm khảo sát (thời gian)

F: Yếu tố phân nhóm
R: Sai số do yếu tố ngẫu nhiên, phần bất định

Vậy khi 2 bài toán này nhập lại thành 1, điều gì sẽ
xảy ra ? Mời bạn xem trang sau:

1.4 ANOVA hỗn hợp là một mô hình gốm 2 biến số

1

Mô hình thí nghiệm bao gồm:
Y= bo+b1.T+b2.F + sai số

MB

F

R

Y

R

T

Khi ta kết hợp hiệu ứng của cả 2 yếu tố T, F trong một
mô hình thí nghiệm, mô hình sẽ chứa 2 biến số T (thời
điểm khảo sát) và F (phân nhóm).
Hai trường hợp có thể xảy ra:

Trường hợp thứ nhất là hiệu ứng của F và của T độc lập
với nhau (không có tương tác giữa T và F). Lúc này mô
hình sẽ có dạng:

MW

Y= bo+b1.T+b2.F + sai số.

Phân nhóm

Giá trị trung bình của Y

F1

Giá trị Y sẽ được xác định bởi 2 hiệu ứng chính riêng biệt
T,F và bởi sai số ngẫu nhiên. Đây là phân tích ANOVA
hỗn hợp mà ta đang bàn tới.
Mục tiêu của chúng ta trong trường hợp này là chứng tỏ
mô hình nói trên có ý nghĩa thống kê, điều này được làm
thông qua test F.

F2
F3

Sau đó, ta sử dụng test post-hoc hoặc phân tích tương
phản để so sánh giá trị Y giữa các điều kiện khác nhau
của F và của T.
T1

T2

T3

Lần đo (T)

Lần đo (T)

1
Phân nhóm (F)

M: hiệu ứng chính của mô hình thí nghiệm
MB: Hiệu ứng do yếu tố bên ngoài (B=between)
MW: Hiệu ứng biến thiên nội tại (W=Within)
Y: Đại lượng được khảo sát
T: Thời điểm khảo sát (thời gian)
F: Yếu tố phân nhóm
R: Sai số do yếu tố ngẫu nhiên, phần bất định

2

3

F1

F1-1

F1-2 F1-3

F2

F2-1

F2-2 F2-3

F3

F3-1

F3-2 F3-3

Ma trận đa biến F*T

1.5 ANOVA hỗn hợp và sự tương tác giữa 2 yếu tố

1

Trường hợp thứ 2 của thiết kế ANOVA hỗn hợp, đó là
khi có hiệu ứng tương tác giữa T và F, kí hiệu là T*F.
Như vậy mô hình sẽ có dạng: Y= bo+b1.T+b2.F+b3.(T*F)
+ sai số
Giá trị Y lúc này được xác định nhờ vào hiệu ứng riêng
phần của F, của T, hiệu ứng tương tác giữa F và T, và
phần sai số ngẫu nhiên.

Mô hình thí nghiệm bao gồm:
Y= bo+b1.T+b2.F+b3.(T*F) + sai số

Y
MB

R
R R

Lúc này, ta không thể dùng test F đơn thuần để khảo
sát mô hình chung nữa, thay vào đó ta phải báo cáo về
ý nghĩa thống kê của tương tác T*F, sau đó phân tích
hiệu ứng riêng của T và F bằng cách:

MW

Thực hiện quy trình ANOVA đơn biến cho từng thời
điểm T1,T2,T3 (3 lần ANOVA đơn biến)

T*F
T

Thực hiện quy trình ANOVA phép đo lặp lại cho từng
phân nhóm F1, F2,F3 (3 lần ANOVA phép đo lặp lại).

Phân nhóm

Phân nhóm

F1

F1

Giá trị trung bình của Y

F2
F3

T1

T2

T3

Lần đo (T)

3 lần ANOVA đơn biến.
Y=bo+b1*F+Er

M: hiệu ứng chính của mô hình thí nghiệm, bao gồm
MB: Hiệu ứng do yếu tố bên ngoài (B=between)
MW: Hiệu ứng biến thiên nội tại (W=Within)
Y: Đại lượng được khảo sát
T: Thời điểm khảo sát (thời gian)
F: Yếu tố phân nhóm
R: Sai số do yếu tố ngẫu nhiên, phần bất định
T*F: Hiệu ứng của tương tác giữa T và F

F2
F3

T1

T2

T3

Lần đo (T)

3 lần ANOVA cho phép đo lặp lại.
Y=b’o+b2*T+Er

Lần đo (T)

Phân nhóm (F)

Giá trị trung bình của Y

F

1

2

3

F1

F1-1

F1-2 F1-3

F2

F2-1

F2-2 F2-3

F3

F3-1

F3-2 F3-3

Ma trận đa biến F*T

3 lần ANOVA đơn biến.
Y=bo+b1*F+Er

3 lần ANOVA cho phép đo lặp lại.
Y=b’o+b2*T+Er

2.1 Quy trình ANOVA hỗn hợp

2

Quy trình ANOVA hỗn hợp gồm những bước sau đây

1.1 Kiểm tra giả định phân phối chuẩn bằng
Trực quan hay test Shapiro-Wilk

1

2

1.2 Phát hiện giá trị cá biệt, điểm ngoại lai
bằng trực quan

Thăm dò số liệu

Kiểm tra hiệu ứng tương tác

Có

3 A

Khối lệnh
1,2

2. Xác định: có hay không hiệu ứng tương tác
giữa 2 yếu tố T và F ?

Khối lệnh
3A,3B,4

Không

3 B

Quy trình ANOVA đơn giản

Quy trình ANOVA hỗn hợp

Đọc kết quả của Khối

lệnh 3B, 4

3B.1 F test cho mô hình chứa T và F
3B.2 Phân tích sâu: test post hoc hoặc Contrast cho F
3B.3 Phân tích sâu: test post hoc hoặc Contrast cho T

3A.1 Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3
+ Phân tích sâu: test post hoc hoặc Contrast cho F
3A2 Thực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3
+ Phân tích sâu: test post hoc hoặc Contrast cho T

Khối lệnh 5
Khối lệnh 6

Trong tài liệu lần này, tác giả hoàn toàn dựa vào Syntax thay vì sử dụng giao diện của SPSS.
Ưu điểm của việc sử dụng Syntax đó là bạn sẽ tiết kiệm rất nhiều thời gian khi thực hiện các quy trình
phức tạp , nhất là khi bạn phải thử lại nhiều lần.
Nhược điểm của Syntax, dĩ nhiên là tính phổ quát, vì để dùng được Syntax, thiết kế nghiên cứu của
bạn phải tương đồng với thí dụ này; hoặc bạn phải thay đổi nội dung Syntax.
Dù sao thì ANOVA hỗn hợp cũng là 1 quy trình phức tạp, nên tác giả tập trung phân tích kỹ phần kết
quả để giúp bạn có thể diễn giải kết quả của chính mình. Về phần Syntax, bạn sẽ phải thay đổi 1 vài
điểm nhỏ trước khi thi hành, và phải chạy từng bước, tuy nhiên mọi thứ đều được hướng dẫn dụ thể.
Bạn có thể đọc thêm tài liệu về ANOVA đơn biến và ANOVA cho phép đo lặp lại của tác giả để hiểu
thêm về 1 số khái niệm như Post hoc test, phân tích tương phản, test F, hệ số ảnh hưởng v.v …

2

2.2 Tạo bảng số liệu
Tạo bảng số liệu

1) Đầu tiên, bạn tạo 1 bảng số liệu gồm 4 biến số:
Giá trị Mg huyết thanh (đo bằng mg/dL)
Tại 3 thời điểm khác nhau trong thai kì:

Y1 3 tháng đầu
Y2 3 tháng giữa

F

Y1

Y2

Y3

Y3 3 tháng cuối

F Phân nhóm: Mã hóa giá trị:
1= Bình thường (nhóm chứng âm)
2= Cao huyết áp (Nhóm chứng dương)
3= Tiền sản giật (Nhóm nghiên cứu)
Chú ý:
+ Bạn phải đặt tên biến là Y1,Y2,Y3 và F như trong hình,
để có thể sử dụng Syntax
+ Không cần dán nhãn giá trị cho biến số, ta sẽ làm việc
này bằng cách sửa nội dung syntax

2) Tải bộ syntax ANOVA hỗn hợp từ Google drive của tác giả về máy:
/>

3) Mở nội dung Syntax: Bạn có thể mở file syntax bằng 2 cách: Trực tiếp click chuột vào icon của file
syntax, hoặc thông qua giao diện của SPSS

2.3 Cách sử dụng Syntax

2

3

1
2

1
2

Để thi hành 1 khối lệnh tùy chọn:

3

Trước hết bạn đánh dấu chọn khối lệnh này
Sau đó click chuột phải mở Menu
và chọn Run Selection.

Trạng thái của bộ xử lý ở góc dưới phải màn hình
Đang thi hành quy trình…
Đã thực hiện xong quy trình và xuất
kết quả

Nội dung Syntax
3.1 Bước 1

3

* Bước 1: Dán nhãn biến số và nhãn giá trị
cho Y và F

Khối lệnh thứ 1- Khai báo biến số; rất quan trọng, nhất là vì bạn
cần phải thay đổi nội dung của nó cho phù hợp với nghiên cứu
của chính bạn trước khi thi hành những bước tiếp theo.
Mục đích của khối lệnh này nhằm :

VARIABLE LABELS
Y1 "3 tháng đầu"
Y2 "3 tháng giữa"
Y3 "3 tháng cuối".
VALUE LABELS
F
1 "Bình thường"
2 "Cao huyết áp"
3 "Tiền sản giật".

Y1

Tình trạng bệnh lý

1

Y2

2

Y3

3

F1

F1-1

F1-2 F1-3

F2

F2-1

F2-2 F2-3

F3

F3-1

F3-2 F3-3

T (Thời điểm)

1)

Đặt tên cho những biến số Y chỉ thời điểm khảo sát, mỗi

biến Y tương ứng với giá trị đo được tại một thời điểm. Bạn
nên đánh số Y theo thứ tự thời gian, ví dụ Y1 có thể hiểu là
lần đo thứ 1, diễn ra trước lần đo thứ 2 (Y2).

2)

Đặt tên cho giá trị mã hóa trong biến số F, bạn nên theo quy
ước : Đánh số từ thấp đến cao, nhóm chứng (âm) luôn nhận
giá trị thấp nhất (ví dụ 0 = không có hoặc 1= Bình thường),
các nhóm còn lại nhận giá trị tăng dần nếu chúng mang ý
nghĩa 1 thang đo.

Ví dụ, bạn có thể phân nhóm độ nặng 1 bệnh lý:
1=Nhẹ, 2=Trung bình, 3=Nặng
Hay 1 liều lượng của 1 thuốc điều trị
1=Liều thấp, 2=Liều trung bình, 3=Liều cao.

Ma trận đa biến F*T

Bạn có thể thay đổi nội dung gì ?
+ Số phân nhóm cho Y và F (từ 2 trở lên)
+ Tên của các phân nhóm F
+ Tên của phân nhóm Y

Trong trường hợp phân nhóm không có ý nghĩa định lượng, bạn
có thể đặt tên tùy ý:
1= Nhóm chứng âm, 2=Nhóm chứng dương, 3=Nhóm bệnh lý A,
4= Nhóm bệnh lý B…
(Y,F có thể chứa nhiều hơn 3 giá trị, thậm chí bạn cũng có thể
giảm số phân nhóm còn 2, không bắt buộc luôn phải có 3 phân

nhóm.

Ví dụ: khảo sát tác dụng của 3 loại thuốc điều trị cao huyết áp
lên huyết áp bệnh nhân đo ở 4 thời điểm khác nhau trong
ngày, khối lệnh trên sẽ được đổi thành:
VARIABLE LABELS
Y1 ‘’HA khi vừa thức giấc"
Y2 ‘’HA sau khi vận động"
Y3 ‘’HA sau bữa ăn"
Y4 ‘’HA trước khi ngủ’’.
VALUE LABELS
F
0 « Nhóm Placebo"
1« Loại thuốc A"
2 « Loại thuốc B »
3 « Loại thuốc C ».
(Chú ý: phải có dấu . Ở hàng lệnh cuối cùng

3

Nội dung Syntax
3.2 Bước 2
Khối lệnh thứ 2 nhằm mục đích thăm dò số liệu, gồm
các quy trình như sau:

* Bước 2: Thăm dò số liệu :
Kiểm tra giả định phân phối chuẩn của
Y1,2,3 tùy theo F

+ Thống kê mô tả : giá trị trung bình, độ lệch chuẩn,
Min, Max cùng các thông số phân phối… của Y cho MỖI
phân nhóm F.

set printback=OFF.

+ Thực hiện test Kolmogorov Smirnov và Shapiro-Wilk
để kiểm tra giả định phân phối chuẩn của Y trong từng
phân nhóm F.

EXAMINE VARIABLES=Y1 Y2 Y3 BY F
/PLOT BOXPLOT NPPLOT
/COMPARE VARIABLES
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE
/NOTOTAL.

+ Vẽ biểu đồ QQ, cũng để kiểm tra giả định phân phối
chuẩn của Y trong từng phân nhóm F.
+ Vẽ biểu đồ Box-plot để phát hiện những điểm giá trị
các biệt > 1,5 -3 lần độ lêch chuẩn.

Bạn có thể thay đổi nội dung gì ?

Ví dụ: Nếu nghiên cứu của bạn có 5 biến số Y (5 lần đo),
được đánh số thứ tự từ Y1 đến Y5, bạn sẽ thay đổi lệnh trên
thành:

+ Thêm bớt biến số Y, tùy theo thiết kế nghiên

cứu của bạn có bao nhiêu lần đo.

EXAMINE VARIABLES=Y1 Y2 Y3 Y4 Y5 BY F

Lưu ý: Cần thi hành riêng khối lệnh này, trước khi
làm những bước tiếp theo. Đây là các giả định
cần kiểm tra trước khi bạn làm ANOVA. Trong
trường hợp có vi phạm giả định bạn phải xử trí ,
kiểm tra lại nhiều lần.
Nếu có vi phạm giả định có thể không làm được
ANOVA, phải thay bằng test phi tham số, hoặc
phải làm ANOVA song song cho 2 mẫu số liệu. Vì
vậy không nên đi nhiều bước cùng lúc.

3

Nội dung Syntax
3.3 Bước 3A

* Bước 3: Chạy mô hình ANOVA hỗn hợp,
* Bước 3A: Kiểm tra trực quan sự tương tác
giữa lần đo và phân nhóm
*Biểu đồ cột

GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3)
F MISSING=LISTWISE
REPORTMISSING=NO

TRANSFORM=VARSTOCASES(SUMMARY="#
SUMMARY" INDEX="#INDEX")
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: SUMMARY=col(source(s),
name("#SUMMARY"))
DATA: INDEX=col(source(s),
name("#INDEX"), unit.category())
DATA: F=col(source(s), name("F"),
unit.category())
COORD: rect(dim(1,2), cluster(3,0))
GUIDE: axis(dim(2), label("Giá trị trung bình
của Y"))
GUIDE:
legend(aesthetic(aesthetic.color.interior),
label("Phân nhóm"))
SCALE: cat(dim(3), include("0", "1", "2"))
SCALE: linear(dim(2), include(0))
SCALE: cat(aesthetic(aesthetic.color.interior),
include("1", "2", "3"))
SCALE: cat(dim(1), include("1", "2", "3"))
ELEMENT:
interval(position(F*SUMMARY*INDEX),
color.interior(F), shape.interior(shape.square))
END GPL.

Phần 1 của khối lệnh 3A, nội dung là để vẽ biểu đồ hình cột so
sánh giá trị trung bình của Y1,Y2,Y3 cho 3 phân nhóm
F1,F2,F3. Kết quả xuất ra như hình trên.

Công dụng của biểu đồ này để kiểm tra tương tác của T và F
(sẽ giải thích rõ hơn bên dưới).
Bạn có thể thêm bớt biến số Y tùy theo nghiên cứu của bạn
có bao nhiêu lần đo:
Ví dụ nếu có 4 lần đo: Y1 đến Y4

GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3)
MEAN(Y4) F MISSING=LISTWISE

3

Nội dung Syntax
3.3 Bước 3A

*Biểu đồ đoạn thẳng
GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3) F
MISSING=LISTWISE
REPORTMISSING=NO
TRANSFORM=VARSTOCASES(SUMMARY="#SU
MMARY" INDEX="#INDEX")
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: SUMMARY=col(source(s),
name("#SUMMARY"))

DATA: INDEX=col(source(s),
name("#INDEX"), unit.category())
DATA: F=col(source(s), name("F"),
unit.category())
GUIDE: axis(dim(2), label("Giá trị trung bình
của Y"))
GUIDE:
legend(aesthetic(aesthetic.color.interior),
label("Phân nhóm"))
SCALE: cat(dim(1), include("0", "1", "2"))
SCALE: linear(dim(2), include(0))
SCALE:
cat(aesthetic(aesthetic.color.interior),
include("1", "2", "3"))
ELEMENT: line(position(INDEX*SUMMARY),
color.interior(F), missing.wings())
END GPL.

Phần 2 của khối lệnh 3A, nội dung là để vẽ biểu đồ đoạn
thẳng trình bày khuynh hướng biến thiên của Y theo thời gian
T cho 3 phân nhóm F1,F2,F3. Kết quả xuất ra như hình trên.
Công dụng của biểu đồ này để kiểm tra tương tác của T và F
(sẽ giải thích rõ hơn bên dưới).
Bạn có thể thêm bớt biến số Y tùy theo nghiên cứu của bạn
có bao nhiêu lần đo:

Ví dụ nếu có 4 lần đo: Y1 đến Y4
GGRAPH
/GRAPHDATASET NAME="graphdataset"
VARIABLES=MEAN(Y1) MEAN(Y2) MEAN(Y3) MEAN(Y4) F

MISSING=LISTWISE

3

Nội dung Syntax
3.4 Bước 3B

* Bước 3B: Quy trình ANOVA hỗn hợp có sao lưu
sai số
GLM Y1 Y2 Y3 BY F
/WSFACTOR=Thaiky 3 Simple(1)
/MEASURE=Mg
/METHOD=SSTYPE(3)
/SAVE=SRESID
/POSTHOC=F(BONFERRONI GH)
/PLOT=PROFILE(Thaiky*F)
/EMMEANS=TABLES(Thaiky) COMPARE
ADJ(BONFERRONI)
/EMMEANS=TABLES(F*Thaiky)
/PRINT=DESCRIPTIVE ETASQ OPOWER
HOMOGENEITY
/CRITERIA=ALPHA(.05)
/WSDESIGN=Thaiky
/DESIGN=F.

Khối lệnh 3B có nội dung:
1) Thực hiện quy trình ANOVA hỗn hợp với 2 yếu tố :
biến số ảo T chỉ thời gian, và biến số phân nhóm F.
Đặt tên cho biến số ảo T chỉ thời điểm, ví dụ: Thaiky

Kiểu phân tích tương phản đơn giản, chọn nhóm 1 làm
nhóm chứng
Đặt tên của đại lượng cần khảo sát, ví dụ ở đây là Mg
2) Quy trình bao gồm các bước kiểm định ban đầu cho
giả định Sphericity, sau đó là test F, kiểm tra quan hệ
tương tác giữa T và F, ý nghĩa của hiệu ứng chính
3) Thực hiện test Post-hoc theo 2 phương pháp:
Bonferroni và Games-Howell
4) Vẽ biểu đồ khảo sát Y theo thời gian và cho 3 phân
nhóm khác nhau. Trình bày bảng thống kê mô tả giá trị
Y trung bình cho mỗi phân nhóm.
5) Sao lưu sai số chuẩn hóa của mô hình dưới 1 biến số
có tên gọi là SRE_i

Lưu ý:

Nên chạy riêng khối lệnh này trước khi đi những bước tiếp theo, vì tùy theo kết quả của ý nghĩa yếu tố tương tác mà
ta sẽ có 2 hướng đi khác nhau.
Bạn có thể thay đổi nội dung gì ?
+ Tên của đại lượng cần khảo sát.
Ví dụ nghiên cứu của bạn đo đường huyết, thì lệnh /MEASURE sẽ được thay đổi thành:
/MEASURE=Duonghuyet
+Tên của biến số ảo T
Ví dụ bạn có thể gọi T= thời gian, và nếu bạn có 4 lần đo thì đổi lại con số:
/WSFACTOR=Thoigian 4 Simple(1)
Chú ý: tên bạn chọn không được chứa khoảng trắng, nên viết liền nhau.
+ Không nên thay đổi thứ tự các biến số Y, nếu không sẽ gây nhầm lẫn trong quá trình bắt cặp Y và T. Nếu bạn có 4
lần đo, chỉ cần thêm Y4 vào sau Y3:
GLM Y1 Y2 Y3 Y4 BY F

Nội dung Syntax
3.5 Bước 4

3
•

Trước khi chạy bước 4, nhìn lại bảng số liệu để xem
giá trị sai số Z có cao hơn 3 ?

SORT CASES SRE_1.
…
* Bước 4: Kiểm tra giả định phân phối chuẩn của Sai số
Z
PPLOT
/VARIABLES=SRE_1 SRE_2 SRE_3
/NOLOG
/NOSTANDARDIZE
/TYPE=Q-Q
/FRACTION=BLOM
/TIES=MEAN
/DIST=NORMAL.
* Dọn dẹp và phục hồi bảng số liệu
SORT CASES F.
DELETE VARIABLES SRE_1, SRE_2, SRE_3.

Như ghi chú; trước khi thi hành bước 4, bạn nên nhìn lại
bảng số liệu, cột biến số SRE_n để phát hiện những giá trị
phân tán quá mức của sai số.
SRE_n chính là sai số chuẩn hóa (hay Z score của sai số),

case nào có Z>3 là không phù hợp với mô hình vì sai số
quá cao.
Khối lệnh thứ 4 nhằm mục đích kiểm tra phẩm chất của
mô hình, thông qua giả định là sai số phân phối chuẩn.
Nội dung là vẽ biểu đồ Q-Q cho sai số chuẩn hóa ở từng
phân nhóm F.
Sau khi vẽ xong biểu đồ, tất cả biến sai số sẽ bị xóa sạch
để phục hồi lại bảng số liệu.
Lưu ý: Nếu biến số F có nhiều hơn 3 giá trị bạn sẽ có
thêm biến số SRE_4, SRE_5…, bạn phải thêm chúng vào
hàng lệnh PPLOT và DELETE VARIABLES

Ta tạm dừng lại ở bước 4 và đọc kết quả để kiểm tra quan hệ tương tác giữa T và F.

Nếu không có quan hệ tương tác ý nghĩa, ta không cần làm thêm bước 5 và 6, kết quả như vậy là đủ.
Nhưng nếu tương tác có ý nghĩa (bạn sẽ được hướng dẫn cách phát hiện điều này); bạn sẽ phải làm thêm bước 5 và 6.
Mục đích của chúng là khảo sát những hiệu ứng riêng của F và T.

Kiểm tra hiệu ứng tương tác

Có

Không
Quy trình ANOVA hỗn hợp

Quy trình ANOVA đơn giản

Đọc kết quả của Khối
lệnh 3B, 4

F test cho mô hình chứa T và F
Phân tích sâu: test post hoc hoặc Contrast cho F
Phân tích sâu: test post hoc hoặc Contrast cho T

Thực hiện 3 lần ANOVA đơn biến cho T1,T2,T3
+ Phân tích sâu: test post hoc hoặc Contrast cho F

Khối lệnh 5

Thực hiện 3 lần ANOVA phép đo lặp lại cho F1,F2,F3 Khối lệnh 6
+ Phân tích sâu: test post hoc hoặc Contrast cho T

3

Nội dung Syntax
3.6 Bước 5

* Bước 5: ANOVA đơn biến khảo sát yếu tố F
cho mỗi thời điểm T1,T2,T3

Khối lệnh thứ 5 mới nhìn có vẻ dài, nhưng thực chất chỉ là
1 quy trình đơn giản lặp lại 3 lần.

BOOTSTRAP
/SAMPLING
METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y1 INPUT=F
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000

/MISSING USERMISSING=EXCLUDE.
UNIANOVA Y1 BY F
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/POSTHOC=F(BONFERRONI GH)
/PRINT=OPOWER ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=F.

Nội dung của bước 5 là làm ANOVA đơn biến theo F, cho
mỗi thời điểm T1, T2,T3. Bạn để ý sẽ thấy nội dung của mỗi
quy trình ANOVA giống nhau, chỉ khác biến số Y:

T1

Ở thời điểm T1, tương ứng với Y1
Ví dụ nếu bạn có 4 lần đo, bạn chỉ cần copy 1 khối lệnh bất
kì, ví dụ Y1, sau đó thay đổi tên biến số Y1 thành Y4:

BOOTSTRAP
/SAMPLING
METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y2 INPUT=F
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000
/MISSING USERMISSING=EXCLUDE.
UNIANOVA Y2 BY F
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/POSTHOC=F(BONFERRONI GH)

/PRINT=OPOWER ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=F.

T2

BOOTSTRAP
/SAMPLING
METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y3 INPUT=F
/CRITERIA CILEVEL=95 CITYPE=BCA
NSAMPLES=1000
/MISSING USERMISSING=EXCLUDE.
UNIANOVA Y3 BY F
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/POSTHOC=F(BONFERRONI GH)
/PRINT=OPOWER ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=F.

T3

BOOTSTRAP
/SAMPLING METHOD=STRATIFIED(STRATA=F )
/VARIABLES TARGET=Y4 INPUT=F
/CRITERIA
CILEVEL=95
CITYPE=BCA
NSAMPLES=1000

/MISSING USERMISSING=EXCLUDE.
UNIANOVA Y4 BY F
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/POSTHOC=F(BONFERRONI GH)
/PRINT=OPOWER ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=F.
Mỗi quy trình ANOVA đơn biến gồm các bước:
+ Thực hiện Bootstrap để nâng cỡ mẫu lên nhiều lần, một
cách ngẫu nhiên.
+ Kiểm định Levene kiểm tra giả định phương sai đồng
nhất.
+ Test F cho mô hình Y(F), kiểm tra ý nghĩa hiệu ứng của F,
tính Effect size bằng hệ số Eta bình phương.
+ Làm test Post-hoc Bonferroni và Games-Howel.

3

Nội dung Syntax
3.7 Bước 6

* Bước 6: ANOVA-phép đo lặp lại cho từng phân
nhóm F1,F2,F3

SORT CASES BY F.
SPLIT FILE SEPARATE BY F.
GLM Y1 Y2 Y3 BY F
/WSFACTOR=Thaiky 3 Simple(1)

/MEASURE=Mg
/METHOD=SSTYPE(3)
/POSTHOC=F(BONFERRONI GH)
/PLOT=PROFILE(Thaiky*F)
/EMMEANS=TABLES(Thaiky) COMPARE
ADJ(BONFERRONI)
/EMMEANS=TABLES(F*Thaiky)
/PRINT=DESCRIPTIVE ETASQ OPOWER
HOMOGENEITY
/CRITERIA=ALPHA(.05)
/WSDESIGN=Thaiky
/DESIGN=F.
SPLIT FILE OFF.

Bạn có thể thay đổi nội dung gì ?
+ Tên của đại lượng cần khảo sát.
Ví dụ nghiên cứu của bạn đo đường huyết, thì lệnh
/MEASURE sẽ được thay đổi thành:
/MEASURE=Duonghuyet
+Tên của biến số ảo T
Ví dụ bạn có thể gọi T= thời gian, và nếu bạn có 4
lần đo thì đổi lại con số:
/WSFACTOR=Thoigian 4 Simple(1)
Chú ý: bạn cần thay đổi tất cả tên gọi của biến T
trong các hàng lệnh: /PLOT, /EMMEANS,
/WSDESIGN=
Chú ý: tên bạn chọn không được chứa khoảng
trắng, nên viết liền nhau.
+ Không nên thay đổi thứ tự các biến số Y, nếu
không sẽ gây nhầm lẫn trong quá trình bắt cặp Y và

T. Nếu bạn có 4 lần đo, chỉ cần thêm Y4 vào sau Y3:
GLM Y1 Y2 Y3 Y4 BY F

Khối lệnh thứ 6 được gắn liền với khối thứ 5, cả 2 nằm trong
quy trình khảo sát hiệu ứng riêng của F hoặc T cho từng phân
nhóm của yếu tố còn lại.
Nội dung của bước 6 là thực hiện ANOVA cho phép đo lặp lại
ở từng phân nhóm của F, như vậy cùng 1 quy trình ANOVA
được làm 3 lần tương ứng cho F1, F2 và F3.
Nếu để ý bạn sẽ thấy phần lõi của quy trình hoàn toàn giống
như mô hình GLM trong bước 3B, chỉ khác không có sao lưu
sai số.
Điểm quan trọng là trước khi thi hành quy trình ANOVA cho
phép đo lặp lại này, ta đã dùng lệnh SPLIT FILE để chia mẫu
khảo sát ra làm nhiều phần, theo giá trị của F.
Ví dụ F có 3 giá trị 1,2,3 thì quy trình ANOVA sẽ lần lượt được
thực hiện với F=1, F=2, F=3.
Quy trình ANOVA cho phép đo lặp lại gồm có:
1) Kiểm định ban đầu cho giả định Sphericity bằng test
Mauchly, sau đó là test F, kiểm tra ý nghĩa của hiệu ứng
chính do T gây ra.
2) Thực hiện test Post-hoc theo 2 phương pháp: Bonferroni
và Games-Howell

3) Phân tích tương phản đơn giản: so sánh T2 và T3 với T1
4) bảng thống kê mô tả giá trị Y trung bình cho mỗi phân
nhóm và biểu đồ.

4

Diễn giải kết quả thăm dò số liệu
4.1 Giả định phân phối chuẩn

Có 2 cách kiểm tra giả định phân phối chuẩn:
1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov : tối ưu
cho trường hợp cỡ mẫu không quá lớn (<50 trường hợp), nhưng lại không đáng tin cậy khi cỡ
mẫu quá nhỏ)

2) Phương pháp trực quan - Sử dụng biểu đồ Q-Q plot: Thích hợp cho những cỡ mẫu lớn (> 50
trường hợp)
Tests of Normality
Kolmogorov-Smirnova

3 tháng đầu

3 tháng giữa

3 tháng cuối

Shapiro-Wilk

F

Statistic

df

Sig.

Statistic

df

Sig.

Bình thường

,187

10

,200*

,912

10

,294

Cao huyết áp

,139

10

,200*

,950

10

,668

Tiền sản giật

,139

10

,200*

,950

10

,668

Bình thường

,160

10

,200*

,964

10

,834

Cao huyết áp

,112

10

,200*

,963

10

,819

Tiền sản giật

,112

10

,200*

,963

10

,819

Bình thường

,114

10

,200*

,985

10

,986

Cao huyết áp

,112

10

,200*

,963

10

,819

10

,200*

,963

10

,819

Tiền sản giật

,112

*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Với kiểm định Kolmogorov Smirnov hoặc Shapiro-Wilk, kết quả ta trông đợi là p > 0.05 .
Nếu p<0.05 tức là giả định phân phối chuẩn đã bị vi phạm.
Trong thí dụ này, phân phối của giá trị nồng độ phosphate.serum là bình thường cho cả 3 lần đo (p> 0.05)

Nếu bạn có cỡ mẫu đủ lớn (> 50 trường hợp), có thể
dùng biểu đồ Q-Q để phát hiện nhanh sự vi phạm giả
định phân phối chuẩn. Nếu các điểm giá trị phân phối
chuẩn, chúng sẽ nằm rải rác gần đường thẳng (màu
xanh) như trong hình. Nếu có sự phân tán (các điểm
phân bố xa khỏi đường thẳng này) tức là phân phối
không chuẩn (màu đỏ).
Phân phối không
chuẩn
Phân phối
chuẩn

4

Diễn giải kết quả thăm dò số liệu
4.1 Giả định phân phối chuẩn
Nếu giả định phân phối
chuẩn bị vi phạm ta
phải xử trí thế nào ?
Bạn có nhiều lựa chọn
1) Chuyển dạng biến số (ví dụ thang đo Logarit), với hy vọng sẽ có phân phối
chuẩn
2) Sử dụng 2 phương pháp phi tham số riêng biệt cho 2 yếu tố độc lập
kiểm định Kruskal-Wallis, là giải pháp thay thế cho ANOVA đơn biến độc lập,
kiểm định Friedman, là giải pháp thay thế cho ANOVA trong phép đo lặp lại)
3) Bỏ qua vi phạm và vẫn làm phân tích ANOVA hỗn hợp (Thực ra điều kiện
phân phối không phải là tuyệt đối bắt buộc).
4) Làm ANOVA hỗn hợp song song cho 2 mẫu số liệu: nguyên thủy và đã
chuyển dạng (logarit hóa), so sánh kết quả của chúng với nhau.

Lời khuyên của BS Nhi:
Nếu bạn có bất thường về số liệu, bạn NÊN báo cáo điều đó cụ thể trong phần kết
quả, nhất là cách bạn xử lý những điểm giá trị cá biệt, lựa chọn test thống kê. Nếu
phân phối lệch trái hay phải, ngoài giá trị trung bình và SD bạn nên cung cấp thêm giá
trị của Skewness và Kurtosis (trong bảng kết quả Explore).
Hành động này sẽ đánh vào tâm lý của các nhà phê bình và giám khảo, loại bỏ nghi
ngờ về việc gian lận và ngụy tạo số liệu, nhất là khi kết quả của bạn quá hoàn hảo.
Người đọc sẽ nghĩ: Tác giả là một người thành thật và nắm vững phương pháp thống
kê.

P<0,00001 à ?
Kết quả này quá đẹp nên
không thể tin được.

Phải triệu hồi
chuyên viên thống
kê ra làm chứng

Nghiên cứu sinh

4

Diễn giải kết quả thăm dò số liệu
4.2 Phát hiện giá trị cá biệt

Biểu đồ Box-plots cho phép phát hiện nhanh các điểm giá trị cá biệt (chênh lệch quá lớn so
với độ lệch chuẩn). Biểu đồ này cũng dùng để báo cáo kết quả.
Bất cứ điểm nào có khoảng cách > 1,5 lần chiều dài của error bar được xem là điểm ngoại
lai.
Nếu cách biệt lớn hơn 3 lần, đó là giá trị rất phân cực.
Trong hình trên, không có điểm giá trị ngoại lai nào được phát hiện.
Nếu có trường hợp giá trị cá biệt, SPSS sẽ đánh dấu bằng mã số thứ tự cho phép ta định vị
dễ dàng trường hợp đó trong bảng số liệu.

4

Diễn giải kết quả thăm dò số liệu
4.2 Phát hiện giá trị cá biệt

Nếu có điểm giá trị ngoại
lai, ta phải xử trí thế nào
?

+ Đầu tiên, cần tìm hiểu nguyên nhân của giá trị cá biệt này: Có thể do nhập số liệu
sai ? Có thể do sai sót trong quá trình đo (đa số trường hợp). Sau khi đã loại trừ tất
cả nguyên nhân chủ quan, ta buộc phải kết luận rằng giá trị đó có thực và hoàn
toàn ngẫu nhiên (rất hiếm gặp, đồng nghĩa với việc đối tượng thực sự là một ngoại
lệ).
Nếu ta quyết định vẫn giữ điểm ngoại lai; ta có nhiều lựa chọn:
1) Sử dụng phương pháp phi tham số : kiểm định Kruskal-Wallis, là giải pháp thay
thế cho ANOVA đơn biến độc lập, kiểm định Friedman, là giải pháp thay thế cho
ANOVA trong phép đo lặp lại
2) Thay đổi giá trị cá biệt bằng 1 giá trị khác gần với nó nhất có thể (ví dụ: nếu giá
trị x = 10 được xem là quá khác biệt, ta có thể thử giá trị x=8 , vẫn là giá trị cao
nhất nhưng còn nằm trong giới hạn cho phép) (Lưu ý: giá trị thay thế có thể là giả
hay thật đều được)
3) Chuyển dạng biến số (ví dụ đổi sang thang đo logarit)
4) Cầu kì hơn: Ta tiến hành làm ANOVA song song cho 2 trường hợp: Có và không
có điểm giá trị ngoại lai, nếu kết quả tương tự nhau, ta giữ, ngược lại ta bỏ.
Loại bỏ giá trị luôn là lựa chọn cuối cùng:
Nếu ta quyết định bỏ điểm ngoại lai này, cỡ mẫu sẽ bị giảm đi một số trường hợp
tương ứng cho cả những lần đo khác và effect size sẽ bị ảnh hưởng.

23

5

Diễn giải kết quả bước 3:

5.1 Kiểm tra yếu tố tương tác (3A)

1
Cách thứ 1 và cũng đơn giản nhất để kiểm tra về
quan hệ tương tác giữa T và F là sử dụng biểu đồ
đoạn thẳng.
Biểu đồ đoạn thẳng, mô tả sự biến thiên của giá trị Y trung bình tại 3
thời điểm khác nhau (trục hoành) và 3 phân nhóm khác nhau (màu
sắc).
Công dụng của biều đồ này là để phát hiện 1 cách trực quan sự tương
tác giữa biến số T (thời gian) và biến số phân nhóm (F: bệnh lý).

Trong trường hợp có quan hệ tương tác, một trong
những đường thẳng (nối 2 thời điểm T; tương ứng với
1 trong 3 phân nhóm F) sẽ cắt những đường còn lại.
Đường thẳng giao nhau = Có tương tác giữa T và F

Trong trường hợp không có quan hệ tương tác, Các đường
thẳng sẽ không cắt nhau, chúng gần như song song.
Đường thẳng không cắt nhau = Không có tương tác giữa T
và F

Ghi chú:
Đây là cách nhạy nhất và dễ dàng nhất để phát hiện tương tác T*F, tuy nhiên trong trường hợp không rõ ràng và
không chắc, bạn nên sử dụng bảng ANOVA cho yếu tố tương tác.

5

Diễn giải kết quả bước 3:

5.1 Kiểm tra yếu tố tương tác (3A)

2

Cách thứ 2 để kiểm tra về quan hệ tương tác giữa T
và F là sử dụng biểu đồ hình cột

Biểu đồ hình cột, mô tả sự biến thiên của giá trị Y trung bình tại 3 thời
điểm khác nhau (trục hoành) và 3 phân nhóm khác nhau (màu sắc).
Công dụng của biều đồ này cũng à để phát hiện 1 cách trực quan sự
tương tác giữa biến số T (thời gian) và biến số phân nhóm (F: bệnh lý).
Bạn chỉ cần chú ý 2 đặc điểm:
+ Khuynh hướng biến thiên của giá trị Y theo thời gian : giống nhau hay
khác nhau giữa các phân nhóm (ví dụ F1,F2) ?
+Khoảng cách d giữa 2 đỉnh của cột kết quả: giống nhau hay khác nhau
giữa các thời điểm T1, T2, T3 ?

Trường hợp A: Không có quan hệ tương tác giữa T và F:
Khuynh hướng biến thiên là như nhau ở F1 và F2 (2 đường thẳng gần
như song song).
Khoảng cách d bằng nhau tại tất cả thời điểm: d1=d2=d3

Trường hợp B: Có quan hệ tương tác giữa T và F:
Khuynh hướng biến thiên của F1 và F2 khác nhau (những đường thẳng
cắt nhau).
Khoảng cách d khác nhau giữa 2 thời điểm

Trong trường hợp còn nghi ngờ, chúng ta sẽ dùng kết quả MANOVA và
within subject ANOVA để kiểm tra quan hệ tương tác này.

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - ANOVA HỖN HỢP

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về