Tải bản đầy đủ (.pdf) (29 trang)

Tài liệu hướng dẫn thống kê y học sử dụng SPSS- KIỂM ĐỊNH Kruskal wallis VN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.24 MB, 29 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

Kiểm định Kruskal-Wallis

Lê Đông Nhật Nam


Lời nói đầu
Mỗi khi nói về test phi tham số, tôi lại nhớ câu chuyện về người bạn học chung lớp năm lớp
12. Đó là một cô gái không có tài năng nào đặc biệt. Cô ấy gần như lệch ra khỏi quỹ đạo của
chương trình phổ thông, khi luôn bị điểm kém cho tất cả những môn khoa học tự nhiên như
Toán, Lý, Hóa, Sinh… Nhiều lần cô ta trở thành trò cười cho cả lớp vì những phát biểu sai
lầm ngây thơ và những lỗi hết sức cơ bản. Cô giống như hình ảnh con vịt xấu xí bên cạnh
những người bạn học sinh giỏi khác. Thời gian trôi qua, thấm thoát tới hè và ai trong chúng
tôi cũng mải mê chạy theo kì thi tuyển sinh đại học. Sau mùa thi năm đó, khi hỏi thăm tin
tức của nhau chúng tôi mới nhận ra sự thực trái ngược hoàn toàn với những gì thầy cô và cả
lớp dự đoán. Nhiều học sinh giỏi nhất lớp trượt đại học khi thi vào những trường danh giá
như Bách Khoa, Y dược; một số khác đậu vào những nguyện vọng không như ý, nhưng chính
cô bạn mà hằng ngày ai cũng xem thường lại đỗ một trường đại học dân lập, tuy không
danh giá, nhưng hoàn toàn phù hợp với những môn xã hội như ngoại ngữ, Văn, là sở trường
của cô ta. Hơn thế nữa, một thời gian sau cô ấy tham gia một câu lạc bộ thời trang và trở
thành khuôn mặt người mẫu nổi tiếng trên báo chí, thậm chí tham gia làm MC trong các sự
kiện thể thao, văn nghệ trong giới trẻ. Trong khi đó nhiều cô bạn giỏi Toán, Lý, Hóa sau 4
năm đại học lại ra làm những công việc văn phòng bình thường, gần như vô danh trong xã
hội.
Có vẻ như con vịt ta tưởng là xấu xí, chỉ đơn giản vì nó không ở đúng vào thế giới của nó,
nếu sống trong môi trường thích hợp nó sẽ hóa thành con thiên nga xinh đẹp.
Những test phi tham số cũng vậy. Bên cạnh những phương pháp thông dụng như ANOVA,
mô hình hồi quy, test t,… thì test phi tham số phải chịu định kiến và hắt hủi một cách phi lý.
Nhiều người cho rằng chúng yếu hơn, lắm nguy cơ sai lầm, hoặc đơn giản là… họ không


thích, , né tránh sử dụng, và chỉ buộc phải dùng đến khi không còn giải pháp nào khác.
Bộ tài liệu này nhằm chuyển đến các bạn một thông điệp giản dị, đó là không có phương
pháp nào dở và xấu, mỗi loại đều có chỗ đứng độc lập của nó. Ví dụ test Kruskal Wallis
không chỉ là 1 giải pháp thay thế cho ANOVA, nó là chính nó và trong nhiều trường hợp còn
là giải pháp duy nhất. Khi bạn làm nghiên cứu trên một mô hình thực nghiệm động vật như
trong thí dụ sau đây, test phi tham số hết sức hữu ích.
Chúc các bạn thành công.

2


Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái

Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất hiện trước
mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và ôn lại cho bạn những
kiến thức cơ bản cũng như chuyên sâu về lý thuyết thống kê. Tuy nhiên BS Thái lại
rất bận rộn nên không đủ thời gian đi vào cách thực hiện chi tiết. Anh ta cũng hay
trình bày lý thuyết thuần túy và sử dụng nhiều công thức toán học nên không mấy
gần gũi với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống kê


Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành thạo SPSS. Như tên
gọi của mình, BS Nhi có tính cách hồn nhiên và ngây thơ như trẻ con, vì vậy
cô ấy luôn có khuynh hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ
hướng dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ những mẹo
vặt, thủ thuật để giúp các bạn đi đến kết quả nhanh và dễ dàng nhất.


Sinh viên Trần Quốc Bảo

Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên cứu khoa
học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra nhiều câu hỏi liên quan
đến thống kê. Mặc dù những đế tài do Bảo thực hiện còn đơn giản, nhưng
đồng hành với cậu ta, các bạn có cơ hội tích lũy cho mình nhiều kinh nghiệm
trong công việc phân tích số liệu và thiết kế nghiên cứu.

3


1

1.1 Tình huống thí dụ

Chứng âm

Chứng dương

1

2

(1) Phẫu thuật giả

Lấy mẫu máu

Y1 Amylase tụy
Y4 TNF-alpha

Y2 IL-6

Nhóm khảo sát

3

(+ Chế độ ăn với Oleuropein x 10 ngày)

(2) (3): Viêm tụy cấp thực nghiệm

Nghiên cứu giải phẫu bệnh học

Y3

Mức độ hoại tử mô tụy

Một nhóm nghiên cứu sinh làm thí nghiệm sau để khảo sát tác dụng kháng
viêm của Oleuropein, một chất chiết xuất từ quả Olive trong bệnh lý viêm
tụy cấp, dựa vào mô hình thực nghiệm trên chuột.
Có 3 phân nhóm chuột (n=10 con cho mỗi nhóm). Nhóm 1 được áp dụng
phẫu thuật giả, nhóm 2 được gây viêm tụy cấp thực nghiệm nhưng nhóm 3
được cung cấp Oleuropein 20g/kg trong 10 ngày trước khi gây viêm tụy
cấp thực nghiệm.

Sau khi phẫu thuật 24h, những thông số sau đây được khảo sát: Nồng độ một số chất thông tin gây phản ứng
viêm: TNF-alpha, Interleukin 6, nồng độ Amylase tụy trong máu, và mức độ hoại tử mô tụy trên giải phẫu
bệnh. Giả thuyết nghiên cứu đặt ra là: Liệu Oleuropein có làm giảm ý nghĩa hiện tượng viêm hệ thống và tác
hại cục bộ ở mô tụy hay không ? Phương pháp thống kê nào phù hợp nhất cho thiết kế này ?

Nghiên cứu này đòi hỏi phân tích phương sai để so sánh một đại lượng giữa

3 phân nhóm độc lập. Tuy nhiên do cỡ mẫu thấp và có biến số thứ hạng, nên
dự tính sẽ không áp dụng được ANOVA. Lúc này giải pháp thay thế là test phi
tham số Kruskal Wallis.
4


1

1.2 Test Kruskal Wallis

K
William Kruskal (19192005). Nhà toán học
người Mỹ

Kiểm định Kruskal-Wallis được thiết lập năm 1952 bởi 2
nhà thống kê người Mỹ William kruskal và Wilson Wallis,
như một giải pháp phi tham số, thay thế cho phân tích
phương sai (ANOVA). Như mọi phương pháp phi tham số
khác, test Kruskal Wallis dựa vào việc xếp thứ hạng chung
của các cá thể để có phân phối chuẩn, sau đó tính trị số
thống kê H và kiểm tra giả thuyết 0 dựa vào phân phối χ2

W
Wilson Allen Wallis
(1912-1998) Chuyên gia
kinh tế, thống kê người
Mỹ

Kruskal; Wallis (1952). "Use of ranks in one-criterion variance
analysis". Journal of the American Statistical Association 47

(260): 583–621.

Hình vẽ sau đây nhằm minh họa một cách đơn giản cho nguyên tắc so
sánh đặc tính phân phối giữa 3 phân nhóm A,B,C.
Trong thí dụ này, 3 phân nhóm A,B,C có đặc tính phân phối đồng dạng,
nhưng lệch nhau, và không chuẩn. Khi gộp chung lại với nhau, ta có thể
thấy khuynh hướng khác biệt giữa trung vị của A, B và C (Hình (a))
Việc xếp hạng là 1 hình thức chuyển dạng biến số để khắc phục vi phạm
giả định phân phối chuẩn. Sau khi xếp thứ hạng chung (không phân biệt
cá thể i thuộc về nhóm nào), ta sẽ có histogram thứ hạng, với phân phối
chuẩn như hình (b). Lúc này những cá thể có thứ hạng thấp sẽ dồn hết
về bên trái, ngược lại những cá thể hạng cao sẽ dồn về bên phải. Trong
SPSS có thể thực hiện xếp hạng dễ dàng bằng lệnh Rank.
Lưu ý : Kiểm định Kruskal Wallis yêu cầu một số giả định như sau
Các phân nhóm phải độc lập: Y được khảo sát 1 lần duy nhất trên
những cá thể khác nhau (Kruskall Wallis không áp dụng được cho
thiết kế khảo sát lặp lại theo thời gian).
Kruskal Wallis có thể áp dụng cho Y là thứ hạng, nhưng không chấp
nhận Y có ý nghĩa định tính rời rạc (ví dụ những phân loại bệnh lý khác
nhau)

(a)

(b)

Trang sau sẽ trình bày về công thức tính trị số H trong test Kruskal-Wallis
5


1


1.2 Test Kruskal Wallis
Công thức tổng quát : H = (N − 1)

r=
Trị số H

H

ni
j=1 rij

ri =

Với
1
2

k
2
i=1 ni ri −r
2
ni
k
i=1 j=1 rij −r

ni

N + 1 là trung bình của tất cả thứ hạng rij


𝑛𝑖 là số trường hợp trong phân nhóm i (cỡ mẫu của nhóm i)
𝑟𝑖𝑗 là thứ hạng của trường hợp j (sau khi xếp chung tất cả lại, không phân biệt
phân nhóm) vốn thuộc về nhóm i
N là tổng số trường hợp ở tất cả phân nhóm, và k là số phân nhóm (hay bậc giá trị
của
Nếu giả định không có trường hợp trùng hạng trong toàn bộ các phân nhóm, H có
thể ước tính theo cách đơn giản hơn:
12
H=
N(N + 1)

12
H=
N(N + 1)

k

ni ri −
i=1

N+1
2

2

k

ni ri 2 − 3(N + 1)
i=1


Nếu có trường hợp trùng hạng, H tính bởi công thức đơn giản cần phải được
hiệu chỉnh bằng cách chia cho hệ số hiệu chỉnh T: Hc = H/T
Với

T=1 −

T=1 −

2
𝐺
𝑖=1 𝑡𝑖 (𝑡𝑖 −1)
𝑁(𝑁2 −1)

3
𝐺
𝑖=1(𝑡𝑖 −𝑡𝑖 )
3
(𝑁 −𝑁)

Kiểm định Kruskal-Wallis dựa vào trị số H, có phân phối χ2 với độ tự do = (k-1)
Giả thuyết 0: Phân phối thứ hạng là như nhau trong mỗi phân nhóm.
Giả thuyết thay thế: Có sự khác biệt về đặc tính phân phối (của thứ hạng) giữa các phân nhóm.

Nếu các phân nhóm có phân phối đồng dạng, ta có thể so sánh trung vị với giả thuyết: Có sự khác biệt
về trung vị giữa các phân nhóm.
Ghi chú:
+ Test Kruskal Wallis được xem như phân tích phương sai, mặc dù nó không bắt buộc thứ hạng phải
phân phối chuẩn, nhưng nó vẫn đòi hỏi giả định phương sai đồng nhất (của thứ hạng). Cách kiểm tra
giả định này là dùng lệnh Rank để xếp thứ hạng trong SPSS, sau đó dùng lệnh Explore với test Levene.
+ Sau khi xếp thứ hạng, bạn vẫn có thể làm ANOVA trên chính giá trị thứ hạng này. Cách làm này sẽ cho

6
ra kết quả tương đương với test Kruskal Wallis.


1

1.3 Test Kruskal Wallis (không chỉ) là một giải pháp thay
thế cho ANOVA đơn biến
So sánh 1 đại lượng giữa ≥ 3 phân nhóm

Loại biến số

Không liên tục
(Thứ hạng)

1

Định lượng
liên tục

Đặc tính phân phối

Phân phối
không chuẩn

2

Xếp thứ hạng

Kruskal-Wallis

Giá trị cá biệt

3



Không

ANOVA đơn biến

Ứng dụng của kiểm định H theo Kruskal-Wallis
1.

Thay thế cho phân tích phương sai 1 yếu tố (ANOVA đơn biến) trong trường hợp : cỡ mẫu quá thấp, có vi
phạm các giả định về phân phối chuẩn và/hoặc có những điểm giá trị cá biệt. Bản thân Kruskall Wallis được
xem như 1 hình thức phân tích phương sai (ANOVA), cho phép so sánh đặc tính phân phối (hoặc trung vị) của Y
giữa nhiều (≥3) phân nhóm độc lập.

2.

Bắt buộc sử dụng test Kruskal Wallis khi đại lượng cần so sánh là một biến số không liên tục (thứ hạng, thang
điểm, giả định lượng).

Thí dụ:
Những nghiên cứu thuộc chuyên khoa chẩn đoán hình ảnh, giải phẫu bệnh lý thường dùng nhiều biến thứ hạng.
Các nghiên cứu dùng thang điểm, bảng câu hỏi… (ví dụ thăm dò chức năng giấc ngủ, mức độ đau, chất lượng cuộc
sống…).
Những mô hình thí nghiệm trên động vật, tế bào, mô. Các thí nghiệm Western-Blot, hóa mô miễn dịch (do cỡ mẫu
quá nhỏ, và/hoặc giá trị không liên tục).


F
Y

Biến số F, thuộc loại định tính (≥ 3 giá trị) dùng để phân nhóm

Y

Biến số Y, giá trị của đại lượng cần so sánh. Y có thể là
biến định lượng liên tục, hoặc giả định lượng (thứ
hạng).

7


1

1.3 Test Kruskal Wallis (không chỉ) là một giải pháp thay thế cho
ANOVA đơn biến

Ghi chú:
+ Sau khi xếp hạng, phân phối của Y xem như được chuẩn hóa, bạn vẫn có thế sử dụng ANOVA đơn biến nếu
thích, tuy không chính xác bằng mô hình theo thang đo định lượng liên tục. Ngược lại, test Kruskal Wallis vẫn cần
giả định về đồng nhất phương sai.
+ Ngay cả khi số liệu phân phối chuẩn, không có điểm cá biệt, bạn vẫn có thể dùng test Kruskal-Wallis, lúc này nó
được xem như 1 phương pháp độc lập, không chỉ thay thế cho ANOVA. Bản thân test Kruskal-Wallis dựa trên giả
thuyết 0 về đặc tính phân phối, nên cho ra kết luận phổ quát hơn mô hình ANOVA chỉ cho phép chứng minh hiệu
ứng ý nghĩa của yếu tố F lên giá trị trung bình của Y. Trong trường hợp ANOVA cho ra kết quả không rõ nét, bạn
có thể cân nhắc dùng test Kruskal Wallis với hy vọng tìm ra sự khác biệt (vì ít bảo thủ hơn).
+Ý nghĩa của 2 quy trình hoàn toàn khác nhau, nên cách diễn giải sẽ khác nhau. ANOVA dựa vào mô hình hồi quy
tuyến tính và so sánh nhiều giá trị trung bình; test Kruskal Wallis dựa vào thứ hạng và so sánh đặc tính phân phối

(hay trung vị).
Một khi đã dùng test Mann-Whitney bạn cần phải mô tả đặc tính phân phối của 2 phân nhóm (Trung vị,
Skewness, Kurtosis, bách phân vị, tứ phân vị…) thay vì dùng trung bình và độ lệch chuẩn, sai số chuẩn như
thường lệ.

8


2

2.1 Quy trình làm test Kruskal Wallis trong SPSS

Tính các giá trị: Trung vị, Skewness, Kurtosis
Kiểm tra giả định phân phối chuẩn của Y ở mỗi
phân nhóm, phát hiện điểm giá trị cá biệt

Khảo sát đặc tính phân phối của Y ở mỗi phân
nhóm

Khảo sát trực quan tính đồng dạng
của phân phối

Vẽ biểu đồ histogram cho mỗi phân nhóm
So sánh đặc tính phân phối giữa chúng

Giả thuyết 0 được phát biểu tùy theo tính
đồng dạng hay không giữa 2 phân phối…

Đặt ra giả thuyết 0


Thực hiện kiểm định H theo KruskalWallis

Xếp hạng, tính trị số H, kiểm tra giả thuyết 0.

Nếu p<0,05; ta cần thực hiện so sánh bắt cặp
tuần tự giữa các phân nhóm. Có nhiều phương
pháp để làm việc này:
+ Đơn giản nhất (nhưng cũng yếu nhất) là làm
Mann-Whitney tuần tự cho từng cặp phân
nhóm.
+ Kinh điển: Kiểm định Dunn (1964) – SPSS sử
dụng quy trình này
+ Hiện đại: Dwass-Steel-Critchlow-Fligner hoặc
Conover-Inman (1991) (không được hỗ trợ
trong SPSS).

Phân tích sâu: Test post-hoc

Diễn giải kết quả
Tính hệ số ảnh hưởng

SPSS cho phép thực hiện test kruskal Wallis theo 2 quy trình:
Những phiên bản cũ (17 trở về trước) áp dụng quy trình cũ, bạn phải tự xác định loại test cần sử
dụng, sau đó thiết lập một số tùy chỉnh thống kê. Kết quả được xuất thẳng ra dưới dạng bảng. Tuy
nhiên quy trình cũ có nhiều nhược điểm, ví dụ không làm được test Post-hoc, thay vào đó bạn phải
làm thủ công test Mann-Whitney hàng loạt để so sánh bắt cặp 2 phân nhóm.

Quy trình mới có nhiều ưu điểm hơn: Tự động xác định loại test phi tham số phù hợp với số liệu bạn
đưa vào, phần kết quả chi tiết hơn, bao gồm biểu đồ Box-plot, test post-hoc theo Dunn (1964) hoặc
test tương phản phân nhóm (Step-wise).

Chú ý:
+ Test Kruskal Wallis không cho phép tính hệ số ảnh hưởng (effect size) r trực tiếp, tuy nhiên có thể
tính được r thông qua Z của test Mann-Whitney hay Dunn, theo công thức:
𝑟 = 𝑍/ 𝑁
+ Thực ra phương pháp Dunn chưa phải là cách tối ưu để thực hiện post-hoc test, còn 2 phương pháp
hiện đại hơn là Dwass-Steel-Critchlow-Fligner và Conover-Inman, rất tiếc là SPSS không hỗ trợ 2
phương pháp này. Hiện nay chỉ có R và XLSTAT cho phép thực hiện 2 test này.
Dunn, O. J. (1964). Multiple comparisons using rank sums. Technometrics, 6, 241-252.

9


2

2.2 Tạo bảng số liệu và sử dụng syntax

Trong thí dụ này, trước hết chúng ta tạo 1 data base gồm 5 biến số
như trong hình vẽ: Biến Y1,Y2,Y3,Y4 lần lượt chỉ 4 đại lượng cần khảo
sát là : Amylase tụy, IL-6, mức độ hoại tử mô, TNF-alpha. Chú ý: Mặc
dù Y3 là biến thứ hạng nhưng ta vẫn đặt Measure = Scale, vì nếu
không SPSS không thể so sánh được.
Biến F= Phân nhóm , thuộc loại định tính, nhiều giá trị (Nominal),
nhận 3 giá trị: 1=Nhóm 1, 2=Nhóm 2, 3=Nhóm 3.
Sau khi nhập số liệu, bạn tải file Syntax về máy và mở nó lên:

Click chuột trái 2 lần vào icon
của file syntax, cửa sổ Syntax
editor sẽ mở ra cho phép đọc
nội dung syntax và thi hành
các lệnh này.


Không nên thi hành toàn bộ các lệnh cùng
một lúc. Thực ra trong tài liệu này chỉ có 1
vài khối lệnh thực sự quan trọng, những
bước còn lại chỉ mang tính chất minh họa và
giải thích.
Để thực hiện riêng 1 khối lệnh bất kì:
1° Đánh dấu chọn nội dung khối lệnh cần thi
hành.
2° Nhấp chuột phải để mở Menu, chọn Run
Selection.
10


2

2.3 Nội dung syntax

*Bước 1A: Thăm dò số liệu
EXAMINE VARIABLES=Y1 Y2 Y3 Y4 BY F
/PLOT BOXPLOT HISTOGRAM NPPLOT
SPREADLEVEL(1)
/COMPARE GROUPS
/PERCENTILES(5,10,25,50,75,90,95) HAVERAGE
/STATISTICS DESCRIPTIVES EXTREME
/CINTERVAL 95
/MISSING LISTWISE
/NOTOTAL.

Khối lệnh bước 1A có nội dung thăm dò số liệu, bao

gồm:
Bảng thống kê mô tả, tính giá trị trung vị, skewness,
kurtosis (Xem tài liệu về test Mann Whitney để rõ
công dụng những trị số này)
Đồng thời làm test Shapiro-Wilk để kiểm tra giả định
phân phối chuẩn.

Và vẽ Box-plot để phát hiện giá trị ngoại lai.
Ghi chú: Box-plot có thể dùng để báo cáo kết quả nếu
Y là biến liên tục. Một dạng biểu đồ khác phổ quát và
chính xác hơn là scatter dot, sẽ được vẽ trong bước
1C
Cuối cùng là test evene để kiểm tra giả định về
phương sai đồng nhất.

*Bước 1B: Thăm dò sau khi xếp hạng
RANK VARIABLES=Y1 Y2 Y3 Y4 (A)
/RANK
/PRINT=YES
/TIES=MEAN.
EXAMINE VARIABLES=RY1 RY2 RY3 RY4 BY F
/PLOT BOXPLOT NPPLOT SPREADLEVEL(1)
/COMPARE GROUPS
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE
/NOTOTAL.
DELETE VARIABLES RY1 RY2 RY3 RY4.

Khối lệnh bước 1B chỉ nhằm mục đích minh họa cho ý

tưởng: Sau khi xếp thứ hạng xong, những biến số có
phân phối không bình thường (như kết quả test
Shapiro-Wilk bước 1A cho thấy ) sẽ được chuẩn hóa,
và có phân phối (thứ hạng) bình thường.
Bước 1B còn dùng để kiểm tra giả định về đồng nhất
phương sai bằng test Levene, là điều kiện cho phép so
sánh trung vị bằng Kruskal Wallis, và làm ANOVA đơn
biến trên biến số sau khi xếp hạng.

11


2

2.3 Nội dung syntax

*Bước 1C: Vẽ biểu đồ so sánh giữa các phân nhóm cho Y1
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=F Y1
MISSING=LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: F=col(source(s), name("F"), unit.category())
DATA: Y1=col(source(s), name("Y1"))
GUIDE: axis(dim(1), label("Phân nhóm"))
GUIDE: axis(dim(2), label("Amylase tụy (IU/L)"))
SCALE: linear(dim(2), include(0))
ELEMENT: point(position(F*Y1))
END GPL.


GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=F Y3
MISSING=LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: F=col(source(s), name("F"), unit.category())
DATA: Y3=col(source(s), name("Y3"))
GUIDE: axis(dim(1), label("Phân nhóm"))
GUIDE: axis(dim(2), label("Mức độ hoại tử mô/GPB"))
SCALE: cat(dim(1), include("1", "2", "3"))
SCALE: linear(dim(2), include(0))
ELEMENT: point(position(F*Y3))
END GPL.

Nội dung khối lệnh bước 1C là để vẽ biểu đồ
scatter dots plot cho phép so sánh trực quan phân
phối giá trị Y giữa các phân nhóm. Trục hoành chỉ
phân nhóm (F), mỗi cá thể là 1 điểm giá trị.
Cách làm này chính xác hơn biểu đồ Box-Plots mà
SPSS cung cấp kèm theo test Kruskal Wallis.
Chú ý: Thay đổi tên biến Y và nội dung trục tung,
trục hoành cho phù hợp với nghiên cứu của bạn.

Nếu Y là 1 biến thứ hạng (không liên tục), bạn nhớ
thêm dòng lệnh SCALE: cat(…)

12



2

2.3 Nội dung syntax

*Bước 2A: Kruskal-Wallis theo quy trình mới
với so sánh bắt cặp hàng loạt theo phương pháp Dunn
(1964)
NPTESTS
/INDEPENDENT TEST (Y1 Y2 Y3 Y4) GROUP (F)
/MISSING SCOPE=ANALYSIS
USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.

*Bước 2B: Kruskal Wallis theo quy trình cũ,
với Post hoc test sử dụng Mann-Whitney hàng loạt
NPAR TESTS
/K-W=Y1 Y2 Y3 Y4 BY F(1 3)
/M-W= Y1 Y2 Y3 Y4 BY F(1 2)
/M-W= Y1 Y2 Y3 Y4 BY F(1 3)
/M-W= Y1 Y2 Y3 Y4 BY F(2 3)
/STATISTICS DESCRIPTIVES QUARTILES
/MISSING ANALYSIS.

*Bước 2C: Kruskal-Wallis theo quy trình mới,
bao gồm test tương phản

NPTESTS
/INDEPENDENT TEST (Y1 Y2 Y3 Y4) GROUP (F)
KRUSKAL_WALLIS(COMPARE=STEPWISE)

/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.

*Bước 3: ANOVA đơn biến cho thứ hạng
RANK VARIABLES=Y1 Y2 Y3 Y4 (A)
/RANK
/PRINT=YES
/TIES=MEAN.
ONEWAY RY1 RY2 RY3 RY4 BY F
/STATISTICS EFFECTS HOMOGENEITY
/MISSING ANALYSIS
/POSTHOC=BONFERRONI GH ALPHA(0.05).
DELETE VARIABLES RY1 RY2 RY3 RY4.

Test kruskal Wallis có thể thực hiện theo quy trình mới
và cũ. Quy trình mới có nhiều ưu điểm hơn, vì tự động
lựa chọn loại test phi tham số phù hợp với thiết kế biến
số (Ví dụ khi F có 2 giá trị, SPSS sẽ chọn test Mann
Whitney, F có 3 giá trị, SPSS sẽ làm test Kruskal Wallis.
Hơn nữa, quy trình mới cho phép làm post hoc test
(không được hỗ trợ trong quy trình cũ).
Khối lệnh 2A có nội dung: Làm test Kruskal Wallis và post
hoc test theo Dunn (1964).

Khối lệnh 2B có nội dung thực hiện test Kruskal Wallis
theo quy trình cũ, sau đó làm test Mann-Whitney hàng
loạt để so sánh bắt cặp tuần tự giữa các phân nhóm: F=1
vs F=2, F=1 vs F=3 và F=2 vs F=3.
Nhược điểm duy nhất là cách làm này không cho phép
hiệu chỉnh theo Bonferonni, nên chỉ thích hợp cho K=3.

Nếu bạn có từ 4 phân nhóm trở lên, nên sử dụng quy
trình mới.

Khối lệnh 2B có nội dung thực hiện test Kruskal Wallis
theo quy trình mới, nhưng thay vì làm test Post-hoc thì sẽ
phân tích tương phản để phân lớp giá trị cho các phân
nhóm. Cách làm này cho phép nhận diện nhanh sự tương
phản khi có nhiều nhóm, nhưng không phải lúc nào cũng
tính ra được giá trị p, nên bất tiện hơn so với PP. Dunn.

Khối lệnh bước 3 chỉ nhằm mục đích minh họa cho ý
tưởng: Có thể làm ANOVA đơn biến cho số liệu đã xếp
hạng. Thông thường kết quả sẽ như nhau so với Kruskal
Wallis. Nhưng cách làm này không chính thống và có thể
gây hiểu nhầm nếu diễn giải không đúng.

Ghi chú: Trong thực tế bạn chỉ cần làm duy nhất bước 2A. Những bước còn lại chỉ có ý nghĩa minh họa.
Lưu ý thay đổi nội dung màu đỏ trong các dòng lệnh để phù hợp với nghiên cứu của bạn. Với:
Y1,Y2,Y3,Y4 là tên các biến cần so sánh, F là biến số phân nhóm.
Nếu nghiên cứu của bạn có ít biến số hơn, hãy xóa bớt Y, nếu nhiều hơn, bạn có thể thêm tuần tự Y5,
Y6…
Nếu bạn có nhiều phân nhóm (ví dụ 4,5), thay đổi các dòng lệnh liên quan tới F trong bước 2B.
Nói chung chỉ có khối lệnh 2B là hơi phức tạp, còn lại đều đơn giản.
13


3

3. Diễn giải kết quả
3.1 Kiểm tra giả định phân phối bình thường


Tests of Normality
Kolmogorov-Smirnova

Phân nhóm

Amylase tụy (IU/L)

IL-6 (pg/ml)

Mức độ hoại tử mô/GPB

TNF-alpha

Shapiro-Wilk

Statistic

df

Sig.

Statistic

df

Sig.

1


,210

10

,200*

,924

10

,389

2

,253

10

,069

,691

10

,001

3

,236


10

,120

,815

10

,022

1

,143

10

,200*

,928

10

,428

2

,167

10


,200*

,912

10

,293

3

,135

10

,200*

,976

10

,937

1

,433

10

,000


,594

10

,000

2

,381

10

,000

,640

10

,000

3

,254

10

,067

,833


10

,036

1

,176

10

,200*

,909

10

,277

2

,140

10

,200*

,923

10


,381

3

,172

10

,200*

,922

10

,375

*. This is a lower bound of the true significance.
a. Lilliefors Significance Correction

Thông thường khi so sánh giữa nhiều phân nhóm, chúng ta sẽ kiểm tra 2 giả định về phân phối
chuẩn, giá trị cá biệt. Nếu chúng được thỏa mãn, bạn có thể làm ANOVA. Nhưng nếu có sự vi
phạm, vấn đề sẽ khó khăn hơn một chút, có thể bạn phải chuyển dạng biến số với hy vọng sẽ có
phân phối chuẩn. Test phi tham số là giải pháp cuối cùng khi tất cả hình thức chuyển dạng đã
thất bại.
Do đó, trong tài liệu này chúng ta cũng đi tuần tự theo các bước, bắt đầu bằng kiểm tra số liệu.
Nếu bạn thực hiện thăm dò với khối lệnh bước 1, bạn sẽ thấy bảng kết quả test Shapiro-Wilk,
chỉ cần đọc giá trị p ở cột cuối cùng. Giá trị trông đợi là p>0,05 (có phân phối bình thường).
Ngược lại p<0,05 tức là phân phối không bình thường.
Chú ý: Nếu cỡ mẫu đủ lớn (>50) bạn có thể dùng Q-Q plot một cách trực quan để kết luận về
phân phối chuẩn (xem thêm các tài liệu về ANOVA).

Trong trường hợp này, có 2 biến số vi phạm giả định về phân phối chuẩn: Amylase tụy (Y1) và
Mức độ hoại tử (Y3). Trong đó Y3 là biến thứ hạng nên vi phạm không nằm ngoài dự tính. Dù
sao với biến thứ hạng thì hiếm khi có thể dùng ANOVA, test Kruskal Wallis là giải pháp tối ưu
cho loại biến này.
Với 2 biến Y2 (IL-6) và TNF-alpha (Y4): Chúng thỏa giả định phân phối bình thường, nên bạn có
quyền dùng ANOVA để phân tích cho 2 biến này. Tuy nhiên trong tài liệu này tác giả áp dụng
Kruskal Wallis cho toàn bộ 4 biến số, trước hết bởi vì cỡ mẫu ở đây quá nhỏ (n=10) nên test
Shapiro-Wilk không đáng tin cậy, thứ hai là để minh họa cho ý tưởng : Không nên xem thường
hay né tránh test phi tham số và chỉ dùng nó như giải pháp thay thế, thực ra bạn hoàn toàn có
thể dùng nó bất cứ khi nào bạn thích. Test Kruskal Wallis không chỉ là một giải pháp thay thế, nó
là chính nó và hoàn toàn có thể đứng độc lập 1 mình trong mọi trường hợp.
14


3

3. Diễn giải kết quả
3.2 Kiểm tra giả định về điểm giá trị cá biệt

Để kiểm tra giả định về điểm giá trị cá biệt, chúng ta sẽ sử dụng biểu đồ Box-Plot như sau:
Giá trị chênh
lệch cực độ
Giá trị cá biệt

Quyết định sau cùng
Phân nhóm 1
(n=10)

Phân nhóm 2
(n=10)


Phân nhóm 3
(n=10)

Phương pháp

Amylase tụy (IU/L)

Bình thường
Có gt cá biệt

Không BT
Có gt cá biệt

Không BT
Có gt cá biệt

Kruskal Wallis

IL-6 (pg/mL)

Bình thường

Bình thường

Bình thường

ANOVA hoặc
Kruskal Wallis


TNF-α

Bình thường

Bình thường

Bình thường

ANOVA hoặc
Kruskal Wallis

Không BT

Không BT

Không BT

Kruskal Wallis

Mức độ hoại tử mô
tụy/GPB

15


3

3. Diễn giải kết quả
3.3 Kiểm tra lại số liệu sau khi xếp thứ hạng


Để minh họa cho ý tưởng: việc xếp hạng là một hình thức chuyển dạng biến số triệt để
nhất, cho phép lập lại phân phối chuẩn, loại bỏ các điểm giá trị cá biệt; tác giả đã dùng khối
lệnh Bước 1B. Như ta thấy, sau khi xếp hạng, phân phối của biến Y1 (Amylase tụy) trở nên
chuẩn (p>0,05) và không còn giá trị cá biệt nào cả. Vì lý do này bạn hoàn toàn có thể làm
ANOVA trên chính số liệu thứ hạng này, nếu chỉ quan tâm đến khuynh hướng khác biệt
(cách làm này làm mất đi ý nghĩa của mô hình định lượng liên tục, không thể mở rộng
thành GLM như ANOVA cho thang đo liên tục)
Tuy nhiên biến Y3 vẫn không thỏa giả định, vì nó là 1 biến thứ hạng không liên tục, và các
giá trị quá phân tán.

Sau khi xếp thứ hạng, ta cũng có
thể kiểm tra lại giả định về
phương sai đồng nhất bằng test
Levene như trong ANOVA.
Kết quả cho thấy tất cả biến số
đều thỏa giả định này, đây là 1
dấu hiệu tốt, ngay cả khi bạn đang
làm test phi tham số.

16


3

3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

Thứ tự biến số Y

Loại test phi tham số

Kết luận

Nội dung giả thuyết 0

Giá trị p

Khi thực hiện theo quy trình mới, kết quả test Kruskal Wallis được xuất ra như trên. Lưu ý đây mới
chỉ là bảng tóm tắt, nếu bạn click chuột vào bảng này, một cửa sổ phụ sẽ mở ra với nhiều thông tin
chi tiết hơn…

17


3

3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

Biểu đồ Box-plot so sánh giữa
các phân nhóm.
Chú ý: Biểu đồ này chỉ có ý nghĩa
nếu Y là một biến định lượng liên
tục. Không nên áp dụng nó cho
biến số thứ hạng.
Một hình thức khác chính xác
hơn là biểu đồ tập hợp điểm,
được hỗ trợ trong syntax.

Trị số χ2 hay H trong test Kruskal Wallis
Độ tự do = k-1

Giá trị p

Kết quả thống kê của test Kruskal Wallis được báo cáo như sau:
[Phát biểu về sự khác biệt ý nghĩa] (χ2(độ tự do)= H; giá trị p).
Diễn giải kết quả:
Có sự khác biệt ý nghĩa về đặc tính phân phối của nồng độ Amylase tụy giữa 3 nhóm : Phẫu
thuật giả, viêm tụy cấp thực nghiệm có và không dùng Oleuropein (χ2(2)= 19,365; p<0,001).
Hoặc:
Có sự khác biệt ý nghĩa về giá trị trung vị của nồng độ Amylase tụy giữa 3 phân nhóm. (χ2(2)=
19,365; p<0,001).
18


3

3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

Nhấn vào tab View: « Independent Samples Test View »
và chọn « Pairwise comparison » để xem kết quả test
post-hoc

Mỗi nút biểu thị cho thứ
hạng trung bình của 1 phân
nhóm
Khoảng cách giữa 2 nút
biểu thị cho mức độ tương
phản giữa 2 phân nhóm
Đường màu vàng:
Khác biệt CÓ ý nghĩa thống kê


Đường màu đen:
KHÔNG có ý nghĩa thống kê

Kết quả test post-hoc được trình bày gồm 2 nội dung: Sơ đồ trực quan và bảng kết quả của test so
sánh theo Dunn (1964).
Đầu tiên, sơ đồ trực quan cho phép nhận xét nhanh về sự tương phản giữa thứ hạng trung bình của
các phân nhóm. Mỗi nhóm tương ứng với 1 nút tròn, và nối với phân nhóm khác bằng 1 đoạn thẳng.
Độ dài của đoạn thẳng cho biết kích thước của sự tương phản, nếu khác biệt có ý nghĩa thì đoạn
thẳng có màu vàng, ngược lại nếu không có khác biệt ý nghĩa thì màu đen.
Tuy cách trình bày trực quan này khá thú vị, nhưng không có giá trị gì trong thực tiễn, không thể
dùng hình vẽ này để báo cáo kết quả.

19


3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

3

a

b

c

d

e


a

Khác biệt thứ hạng trung bình giữa 2 phân nhóm

b

Sai số chuẩn của khác biệt thứ hạng

c

Giá trị Z (test Mann-Whitney), dùng để tính kích thước hiệu ứng (Effect size): 𝑟 = 𝑍/√𝑁

d

Giá trị p (ý nghĩa thông kê)

e

Giá trị p hiệu chỉnh theo phương pháp Bonferonni (dùng để diễn giải kết quả).

Bảng kết quả post-hoc test :
SPSS áp dụng phương pháp của Dunn (1964) để so sánh bắt cặp tuần tự giữa các phân nhóm.
Cách làm này tương đương với việc thực hiện hàng loạt kiểm định Mann-Whitney cho mỗi cặp,
nhưng kèm theo hiệu chỉnh Bonferonni (điều chỉnh ngưỡng sai lầm alpha trước, dựa vào số phân
nhóm k rồi mới tính giá trị p).
Bạn chỉ cần đọc nhanh ý nghĩa thống kê ở cột cuối cùng. Giá trị trông đợi là p<0,05.
Kết quả được báo cáo như sau: [phát biểu về nghĩa thống kê] [Giá trị Z] [p hiệu chỉnh]
[Effect_size]
Trong thí dụ này ta có thể diễn giải như sau:

Kết quả so sánh bắt cặp theo Dunn (1964) cho thấy: Nồng độ amylase tụy cao hơn một cách có ý
nghĩa thống kê ở phân nhóm 2 (p=0,01:Z=-3,861;r=-0,705) và 3 (p<0,001;Z=-3,759;r=-0,686) so
với phân nhóm 1. Tuy nhiên, không có khác biệt ý nghĩa giữa phân nhóm 2 và 3
(p=1,0;Z=0,102;r=0,02).
Hay nói cách khác:
Viêm tụy cấp thực nghiệm gây tăng amylase tụy một cách ý nghĩa so với nhóm chứng (p<0,001).
Chế độ ăn với Oleuropein không làm thay đổi ý nghĩa mức amylase (p=1,0).
20


3

3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

Có sự khác biệt ý nghĩa về giá trị trung vị của nồng độ IL-6 giữa 3 phân nhóm. (χ2(2)=
25,551; p<0,001).
Test post-hoc (Dunn, 1964) cho thấy: IL-6 cao hơn một cách ý nghĩa ở nhóm viêm tụy
cấp thực nghiệm so với nhóm chứng âm (p<0,001; Z=-5,055; r=-0,92); oleuropein làm
giảm IL-6 một cách ý nghĩa so với nhóm không điều trị (p=0,038; Z=2,489; r=0,454) tuy
nhiên mức IL-6 ở nhóm Oleuropein vẫn còn cao hơn một cách ý nghĩa so với nhóm
chứng (p=0,031;Z=-2,565; r=-0,468).
Ghi chú: Z là trị số U chuẩn hóa (Std test statistics), r= Z/ 𝑁 với N là tổng số trường
hợp khảo sát (N= n1+n2+n3=30.)
21


3

3. Diễn giải kết quả

3.4 Kết quả Kruskal Wallis theo quy trình mới

Có sự khác biệt ý nghĩa về đặc tính phân phối của mức độ hoại tử mô giữa 3 phân
nhóm. (χ2(2)= 20,196; p<0,001).
Test post-hoc (Dunn, 1964) cho thấy: Mô tụy hoại tử cao hơn một cách ý nghĩa ở nhóm
viêm tụy cấp thực nghiệm so với nhóm chứng âm (p<0,001; Z=-3,519; r=-0,76);
Oleuropein không làm thay đổi mức độ hoại tử mô tụy một cách ý nghĩa so với nhóm
không điều trị (p=1; Z=0,661; r=-0,64).
Ghi chú: Z là trị số U chuẩn hóa (Std test statistics), r= Z/ 𝑁 với N là tổng số trường hợp
khảo sát (N= n1+n2+n3=30.)
22


3

3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

Có sự khác biệt ý nghĩa về giá trị trung vị của TNF-alpha giữa 3 phân nhóm. (χ2(2)=
16,169; p<0,001).
Test post-hoc (Dunn, 1964) cho thấy: Nồng độ TNF-alpha cao hơn một cách ý nghĩa ở
nhóm viêm tụy cấp thực nghiệm so với nhóm chứng âm (p<0,001; Z=-2,871; r=0,524); Oleuropein không làm thay đổi TNF-alpha một cách ý nghĩa so với nhóm
không điều trị (p=0,947; Z=-1,003; r=-0,183).
Ghi chú: Z là trị số U chuẩn hóa (Std test statistics), r= Z/ 𝑁 với N là tổng số trường
hợp khảo sát (N= n1+n2+n3=30.)

23


3


3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới

Nhấn vào tab View: « Independent Samples Test View »
và chọn « Homogeneous subsets » để xem kết quả phân
nhóm tương đồng/tương phản
Phân nhóm tương phản

Những phân nhóm
được khảo sát

Thứ hạng trung bình

Ý nghĩa thống kê
(p 2 phía và p hiệu chỉnh)

Một hình thức khác để phân tích sự khác biệt giữa các phân nhóm, đó là phân tích tương phản
Step-wise. Lúc này lệnh so sánh sẽ có nội dung: Compare = Stepwise.
NPTESTS
/INDEPENDENT TEST (Y1 Y2 Y3 Y4) GROUP (F)
KRUSKAL_WALLIS(COMPARE=STEPWISE)
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.

Trong phần kết quả, bạn cũng sẽ thấy bảng tóm tắt Kruskal Wallis, nhấp chuột vào đó bạn sẽ mở
cửa sổ kết quả chi tiết, và bên trong kết quả chi tiết này có mục « Homogeneous subsets ». Nội
dung sẽ có dạng 1 bảng gồm hàng x cột. Hàng biểu thị cho những phân nhóm cần so sánh, cột biểu
thị cho kết quả phân lớp tương đồng/tương phản. Những phân nhóm nào có thứ hạng trung bình
tương đương sẽ được xếp vào cùng 1 lớp (cột cùng màu), phân nhóm nào có thứ hạng trung bình

tương phản ý nghĩa với những nhóm còn lại sẽ đứng riêng 1 mình, và dưới 1 màu khác.
Trong thí dụ này, Nhóm 2-3 được xem như tương đồng (không có khác biệt ý nghĩa giữa Nhóm 2 và
3), và cao hơn nhóm 1 (đứng 1 mình). Hình ảnh này có thể được diễn giải: Với Y=Amylase tụy:
Nhóm 1 tương phản ý nghĩa với nhóm 2
Nhóm 1 tương phản ý nghĩa với nhóm 3
Nhóm 3 và 2 không có tương phản (p=0,88) và thuộc phân lớp giá trị cao.

24


3

3. Diễn giải kết quả
3.4 Kết quả Kruskal Wallis theo quy trình mới
Tương tự, kết quả phân tích tương phản cho 3 biến số
còn lại như sau:
Với Interleukin 6:
Nhóm 1 tương phản ý nghĩa với nhóm 2
Nhóm 1 tương phản ý nghĩa với nhóm 3
Nhóm 1 tương phản ý nghĩa với nhóm 3
Thứ tự: 3>2>1
Lưu ý: giá trị p không tính được cho trường hợp này. Đây là
giới hạn của phương pháp Step-wise so với phương pháp
Dunn.

Với Mức độ hoại tử mô
Nhóm 1 tương phản ý nghĩa với nhóm 2
Nhóm 1 tương phản ý nghĩa với nhóm 3
Không có sự tương phản giữa 2 và 3 (p=0,35)
Thứ tự: 3=2>1 (Nhóm 3 và 2 thuộc phân lớp giá trị cao)


Với TNF-alpha
Nhóm 1 tương phản ý nghĩa với nhóm 2
Nhóm 1 tương phản ý nghĩa với nhóm 3
Không có sự tương phản giữa 2 và 3 (p=0,151)
Thứ tự: 3=2>1 (Nhóm 3 và 2 thuộc phân lớp giá trị cao)

25


×