Tải bản đầy đủ (.pdf) (21 trang)

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - KIỂM ĐỊNH mann whitney

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.9 MB, 21 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

Kiểm định Mann-Whitney

Lê Đông Nhật Nam


Lời nói đầu
Khi tôi còn sống ở Paris, buổi chiều sau giờ học tôi thường không về nhà ngay mà chọn ngẫu nhiên một
trạm Metro nào đó, leo lên và đi dạo phố một vòng. Có thể là đồi Montre matre, Quai de Seine hay một
khu cổ xưa nào đó. Nhưng một lần nọ trạm metro gần nhà tôi bị đóng cửa, tôi phải đi xe bus để thay
thế. Chiếc xe chạy vòng vèo qua những con đường rất lạ, và dừng lại ở mỗi trạm cách nhau khoảng
200m. Ngồi trên xe, tôi chợt nhận ra là cảm giác thú vị hơn rất nhiều so với việc chen chúc trong các toa
metro và đi dưới đường hầm tối đen. Kể từ đó, tôi bắt đầu dùng xe bus để dạo chơi ở những con đường
mới lạ. Nhờ vậy, tôi biết khá nhiều tuyến bus tiện dụng, khám phá ra nhiều địa chỉ thú vị, ví dụ 1 quán ăn
Việt Nam, 1 cửa hàng bán đồ âm thanh, hay tiệm bán băng dĩa cũ hay tiệm bánh ngọt…
Trong việc phân tích số liệu có thể bạn cũng sẽ bắt gặp cảm giác tương tự. Một hôm nào đó khi so sánh
2 phân nhóm bạn không thể dùng được test t như thường lệ, vì nhiều giả định bị vi phạm, có thể cỡ mẫu
quá ít, có thể biến số không phải liên tục, có thể phân phối không chuẩn, hoặc có nhiều điểm giá trị cá
biệt. Có thể thầy cô sẽ gợi ý bạn dùng 1 test phi tham số để giải quyết vấn đề, trong trường hợp này là
test Mann-Whitney.
Test Mann-Whitney rất giản dị, thậm chí bạn có thể làm bằng tay nếu cỡ mẫu thấp, tuy nhiên không phải
ai cũng hiểu về nó và sử dụng nó đúng cách. Người lạc quan và ngây thơ sẽ nghĩ đơn giản rằng nó thay
thế hoàn toàn cho test t, cho phép chứng minh nhóm này có giá trị cao hơn nhóm khác. Người bi quan
sẽ cho rằng test phi tham số không chính xác bằng test t và tìm cách né tránh nó.
Thực ra, công dụng, ý nghĩa của 2 loại kiểm định hoàn toàn khác nhau, vì dựa trên những giả thuyết 0
khác nhau. Test Mann-Whitney thậm chí còn thông dụng hơn. Trong đời mình nếu có 5 lần so sánh bằng
test t, thì chắc số lần tôi dùng test Mann-Whitney phải đến 8-9, ngay cả luận văn tốt nghiệp của tôi cũng
hoàn toàn dựa vào Mann-Whitney thay vì test t. Không phải lúc nào số liệu của chúng ta cũng đẹp, và 1
số chuyên ngành bắt buộc phải dùng test phi tham số ví dụ như chẩn đoán hình ảnh, giải phẫu bệnh lý,


thăm dò chức năng giấc ngủ, v.v
Trong tài liệu ngắn này, Bs. Khả Nhi sẽ hướng dẫn các bạn làm test Mann-Whitney trên SPSS hoàn toàn
bằng syntax, nhưng quan trọng nhất là hiểu và diễn giải chính xác kết quả của nó. Như thường lệ, mọi
thứ sẽ được đơn giản hóa tối đa.
Chúc các bạn thành công.


Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất
hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý
thuyết thống kê. Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời
gian đi vào cách thực hiện chi tiết. Anh ta cũng hay trình bày lý thuyết
thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi
với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …

Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành
thạo SPSS. Như tên gọi của mình, BS Nhi có tính cách hồn
nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh
hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ hướng
dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ
những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả
nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo

Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.

3


1

1.1 Tình huống thí dụ
4

Phát hiện tình trạng tái
nhiễm HCV sau ghép gan

Nhuộm hóa mô miễn dịch với kháng thể
IG222 chống kháng nguyên vỏ E2 của HCV

1
Nhiễm virus HCV
Sinh thiết gan

3
Xơ gan do
HCV

2

Điều trị ghép gan

Một bác sĩ nội trú khoa ngoại tiêu hóa thực hiện đề tài khảo sát một
phương pháp nhuộm hóa mô miễn dịch với kháng thể IG222 mAb nhằm
phát hiện biến chứng tái nhiễm virus viêm gan C (HCV) trên mẫu sinh
thiết mô gan sau khi ghép cho những bệnh nhân bị xơ gan giai đoạn cuối
do HCV.

Mức độ phản ứng miễn dịch của mẫu mô sau khi nhuộm được đánh giá
một cách bán định lượng như sau: 0: không có tế bào dương tính, 1+, 2+,
3+ tương ứng với <5%, 5-20% và > 20% tế bào dương tính với HCV-E2.
Kết quả này được so sánh giữa : Phân nhóm có chẩn đoán xác định tái
nhiễm HCV và phân nhóm bị thải ghép, cũng như giữa phân nhóm hậu
phẫu ≤ 1 tháng và từ 3 tháng trở lên.
Cách đánh giá giả định lượng này không cho phép dùng test t, vậy chúng
ta có giải pháp nào thay thế không ?
Đây là một ví dụ điển hình về thiết kế nghiên cứu có đại lượng cần khảo sát là
một biến số giả định lượng, hay thứ hạng. Chúng ta không thể sử dụng test t
để so sánh biến số này, thay vào đó ta sẽ sử dụng phương pháp phi tham số là
kiểm định Mann-Whitney U hay còn gọi là test tổng thứ hạng Wilcoxon.
Mann, Henry B.; Whitney, Donald R. (1947). "On a Test of Whether one of Two Random
Variables is Stochastically Larger than the Other". Annals of Mathematical Statistics 18 (1):
50–60. doi:10.1214/aoms/1177730491


1

1.2 Giới thiệu về phương pháp
Mann-Whitney (1947) là một kiểm định phi tham số.
Mục đích ban đầu của nó là dùng để kiểm tra sự tương

đương về tính chất bất định của 2 mẫu phân phối, chứ
không phải tập trung vào một giá trị nhất định nào. Sau
này, test Mann-Whitney được mở rộng ý nghĩa, cho
phép so sánh trung vị cũng như đặc tính phân phối như 1
giải pháp thay thế cho test t Student.

Henry Berthold Mann
(1905-2000), nhà toán
học người Mỹ, đồng
tác giả của phương
pháp kiểm định U

Frank Wilcoxon
(1892–1965) nhà toán học
người Mỹ, người đặt nền
tảng lý thuyết cho các
phương pháp phi tham số

A

Nguyên tắc của test Mann Whitney là xếp hạng (thứ bâc)
cho giá trị của mỗi cá thể sau khi trộn chung 2 phân
nhóm với nhau, sau đó so sánh tổng thứ hạng mà mỗi
phân nhóm đạt được. Nếu có sự khác nhau về đặc tính
phân phối giữa 2 phân nhóm này, những trường hợp có
hạng cao sẽ dồn về một phân nhóm, và những trường
hợp hạng thấp sẽ dồn về phân nhóm còn lại.
Nếu 2 phân nhóm có cùng đặc tính phân phối, mỗi thứ
hạng sẽ có xác suất nằm ở mỗi phân nhóm như nhau.


A
B
B

Trường hợp I: 2 phân nhóm A và B có cùng đặc
tính phân phối (đồng dạng), nhưng lệch nhau.
Lúc này Test Mann-Whitney cho phép so sánh
giá trị trung vị giữa A và B
Trường hợp II: 2 nhóm A và B có đặc tính phân
phối hoàn toàn khác nhau. Lúc này test MannWhitney có ý nghĩa chứng minh sự khác biệt về
phân phối này.

Nếu 2 phân nhóm A, B có cùng đặc tính phân phối và gần
như chồng lắp lên nhau, test Mann-Whitney cho ra kết quả
âm tính, có thể nói A và B cùng chung 1 quần thể


1.2 Giới thiệu về phương pháp

1

Như những phương pháp phi tham số khác, Mann-Whitney test cũng dựa vào sự xếp thứ hạng (là 1
hình thức chuyển dạng biến số để chuẩn hóa về phân phối). Thí dụ rất đơn giản sau đây nhằm giải
thích cách thực hiện thủ công test Mann-Whitney với cỡ mẫu nhỏ.

2 nhóm bạn A và B chơi một trò chơi như sau: mỗi người thả xúc xắc và ghi lại số điểm. Thông
thường ta sẽ quyết định thắng bại bằng cách so sánh tổng số điểm của mỗi nhóm. Nhưng trong
trường hợp này, nhóm A có ít thành viên hơn nhóm B, nên cách tính điểm dựa vào tổng số không
thể áp dụng (thiếu công bằng). Một ý kiến khác cho rằng vấn đề ở đây là so sánh mức độ may mắn»,
hay « đặc tính phân phối điểm» giữa 2 nhóm. Do đó, ta sẽ sử dụng test Mann-Whitney.


1

A

Nhóm A (n=4)
Thành viên
Kết quả

1
2
3
4

B

2

Nhóm nào may mắn hơn ?

2
5
4
6

Thành viên
Kết quả
A1
2
A2

5
A3
4
A4
6
B1
1
B2
2
B3
3
B4
4
B5
5
B6
6
Tổng thứ hạng nhóm A
Tổng thứ hạng nhóm B

3 Bây giờ ta có thể tính trị số U cho mỗi phân nhóm
Cônng thức 1:
𝑈𝑖 = 𝑛1 ∗ 𝑛2 +

1
2
3
4
5
6

Thứ hạng
2.5
7.5
5.5
9.5
1
4
7.5
2.5
5.5
9.5
25
30

1
3
5
2
4
6
Từ 2 phân nhóm A,B (Bảng 1), ta gộp
chung tất cả thành viên lại với nhau,
không phân biệt phân nhóm, và xếp hạng
cho mỗi trường hợp từ thấp đến cao
(Bảng 2)
Điểm thấp nhất = Hạng 1
2 trường hợp có điểm bằng nhau sẽ nhận
thứ hạng trung bình; ví dụ thành viên A1
và B2 có điểm=2, nên hạng trung bình =
(2+3)/2=2.5

Sau khi việc xếp hạng hoàn tất, ta có thể
thống kê lại Tổng thứ hạng ở mỗi nhóm.

Đặc tính phân phối của U: Cho một phân nhóm bất kì, giá
trị U dao động từ 0 cho tới giá trị lớn nhất có thể đạt
được chính là tích số của 2 cỡ mẫu n1*n2 (khi đó nhóm
còn lại xem như có U=0).

𝑛𝑖 𝑛𝑖 + 1
− 𝑅𝑖
2

Công thức 2:

𝑈𝑖 = 𝑅𝑖 −

Nhóm B (n=6)
Thành viên
Kết quả

𝑛𝑖(𝑛𝑖 + 1)
2

Với: n1 và n2 lần lượt là số trường hợp của 2 phân
nhóm, Ri là tổng thứ hạng cho phân nhóm i với ni
trường hợp.
Ta có thể tính giá trị U cho mỗi phân nhóm và chọn giá
trị U thấp hơn để tra bảng nhằm kiểm định giả thuyết
0.


𝑈1 + 𝑈2 = 𝑛1𝑛2
Nếu ta có cỡ mẫu đủ lớn (>20 trường hợp cho mỗi phân
nhóm), U có thể xem như có phân phối chuẩn, lúc này ta
có thể tính giá trị trung bình, độ lệch chuẩn, và U chuẩn
hóa:
𝑛1𝑛2
𝑚𝑈 =
2

𝛿𝑈 =

𝑛1𝑛2(𝑛1 + 𝑛2 + 1)
12
𝑍=

𝑈 − 𝑚𝑈
𝛿𝑈


1

4

1.2 Giới thiệu về phương pháp

Cách đọc bảng U: Xác định giá trị ngưỡng của Ui tương ứng với n1 và n2 là cỡ mẫu của mỗi phân nhóm. Nếu
giá trị U của bạn tính ra THẤP hơn ngưỡng này, ta có thể phủ nhận giả thuyết 0 với một xác suất sai lầm nhất
định.
Bảng U chỉ sử dụng được cho n1 và n2 < 20. Khi cỡ mẫu n>20 thì không thể dùng bảng U được nữa, nhưng khi
đó có thể xác định trực tiếp giá trị U chuẩn hóa hay giá trị Z của U và từ đó xác định được giá trị p theo phân

phối chuẩn.

5

Kích thước ảnh hưởng (Effect size) r được tính bằng công thức của Rosenthal (1991)

𝑟=
Hay

𝑍
𝑛1+𝑛2

𝑟2 =

𝑍2
𝑛1+𝑛2

Một công thức khác của Hans Wendt (1972):
2𝑈
𝑟 =1−
(𝑛1 ∗ 𝑛2)

0.1: kích thước nhỏ (ảnh hưởng yếu)
0.3 : kích thước trung bình (ảnh
hưởng trung bình)

0.5 trở lên: kích thước lớn (ảnh
hưởng lớn)



1.3 Mann-Whitney (không chỉ) thay thế cho test t

1

So sánh 1 đại lượng giũa 2 phân nhóm

Loại biến số

2

Không liên tục
(Thứ hạng)

Định lượng
liên tục

Đặc tính phân phối

Giá trị cá biệt

3

Phân phối
không chuẩn

4



Không


Mann-Whitney U

Test t cho 2 mẫu độc lập

Ứng dụng của kiểm định U của Mann-Whitney
1.

Thay thế cho test T student trong trường hợp : cỡ mẫu quá thấp, có vi phạm các giả định về phân phối
bình thường và/hoặc có điểm giá trị cá biệt

2.

Bắt buộc sử dụng test Mann-Whitney nếu đại lượng cần so sánh là một biến số không liên tục (thứ hạng,
thang điểm, giả định lượng).

Thí dụ:
Những nghiên cứu thuộc chuyên khoa chẩn đoán hình ảnh, giải phẫu bệnh lý (dùng nhiều biến giả định lượng)
Các nghiên cứu dùng thang điểm, bảng câu hỏi… (ví dụ thăm dò chức năng giấc ngủ, mức độ đau, chất lượng
cuộc sống…
Những mô hình thí nghiệm trên động vật, tế bào, mô. Các thí nghiệm Western-Blot, hóa mô miễn dịch (do cỡ
mẫu quá nhỏ, và/hoặc giá trị không liên tục).
Ghi chú:
+ Một khi test t dùng được thì Mann-Whitney cũng dùng được, thậm chí ít bảo thủ hơn. Trong trường hợp test
t cho ra kết quả không rõ nét, bạn có thể cân nhắc dùng test Mann-Whitney thay cho test t, với hy vọng tìm ra
sự khác biệt.
+Ý nghĩa của 2 loại test hoàn toàn khác nhau, nên cách diễn giải sẽ khác nhau. Test t dựa vào mô hình hồi quy
tuyến tính và so sánh 2 giá trị trung bình; test Mann-Whitney dựa vào thứ hạng và so sánh đặc tính phân phối
(hay trung vị).
Một khi đã dùng test Mann-Whitney bạn cần phải mô tả đặc tính phân phối của 2 phân nhóm (Trung vị,

Skewness, Kurtosis, bách phân vị, tứ phân vị…) thay vì dùng trung bình và độ lệch chuẩn, sai số chuẩn như
thường lệ.


2

2.1 Quy trình trên SPSS

Khảo sát đặc tính phân phối của 2 phân nhóm

Khảo sát trực quan tính đồng dạng
của phân phối

Đặt ra giả thuyết 0

Tính các giá trị: Trung vị, Skewness, Kurtosis
Kiểm tra giả định phân phối chuẩn

Vẽ biểu đồ tháp phân phối
So sánh đặc tính phân phối giữa 2 phân nhóm

Giả thuyết 0 được phát biểu tùy theo tính
đồng dạng hay không giữa 2 phân phối…

Thực hiện kiểm định Mann-Whitney

Xếp hạng, tính thứ hạng trung bình, tổng thứ
hạng, tính trị số U, U chuẩn hóa (Z), xác định trị
số p


Diễn giải kết quả
Tính hệ số ảnh hưởng

Giữ hay phủ nhận giả thuyết 0.
Tính hệ số r theo Rosentham (1991) hoặc theo
Hans Wendt (1972)

Đầu tiên bạn tạo bảng số liệu với:
Y= đại lượng cần khảo sát, thuộc loại liên tục
F= Biến số phân nhóm, thuộc loại định tính, nhị phân
Ghi chú:
Nhằm minh họa cho ý tưởng: Test Mann-Whitney có thể đứng độc lập 1 mình chứ không chỉ thay thế cho test t,
nên tác giả quyết định dùng Y là 1 biến định tính nhiều giá trị (thang điểm). Tuy nhiên ngay cả khi Y là biến thứ
hạng hoặc giả định lượng, bạn phải đặt kiểu biến số là Scale để SPSS xử lý nó như 1 biến định lượng. Tuy nhiên
lúc này ta không chú ý về những giá trị như trung bình, độ lệch chuẩn nữa, mà chỉ quan tâm đến đặc điểm phân
phối.


2

2.1 Quy trình trên SPSS

Để khái quát hóa bộ Syntax, tác giả chỉ
dùng tên biến rút gọn : Y, F1, F2
Nội dung của biến được xác định bằng
cách dán nhãn, bao gồm nhãn tên biến và
nhãn mã hóa giá trị.
Bạn có thể dán nhãn thủ công hoặc dùng
syntax.
Sau khi khai báo xong biến, bạn nhập số

liệu.

1

Tải file syntax tên « Syntax Mann Whitney.sps» từ Google drive của tác giả về máy của bạn.
/>
2

Mở file syntax bằng cách click chuột 2 lần vào nó, cửa sổ syntax mở ra


2

2.2 Cách thi hành syntax và nội dung bên trong

1

2

Để thi hành một khối lệnh tùy chọn:

1° Đánh dấu chọn 1 khối lệnh cần thi hành
2° Click chuột phải trong syntax editor rồi
chọn Run Selection

Nội dung Syntax
* Khai báo tên biến và mã hóa giá trị

Khối lệnh đầu tiên :


VARIABLE LABELS
Y "Anti-HCV E2 grade"
F1 "Nhóm hậu phẫu"
F2 "Chẩn đoán".

Lệnh Variable Labels để đặt tên cho biến Y, F1 và F2
Ghi chú: Nếu nghiên cứu của bạn chỉ có 1 tiêu chuẩn chia phân
nhóm, ví dụ nhóm bệnh/nhóm chứng thì chỉ cần 1 F là đủ, không
cần F2.

* 2. Dán nhãn giá trị
VALUE LABELS
Y
0 "0+"
1 "1+"
2 "2+"
3 "3+".

Lệnh Value labels: để dán nhãn mã hóa giá trị cho Y (trong
trường hợp Y là một biến thứ hạng hay giả định lượng

VALUE LABELS
F1
1 "< 1 tháng"
2 ">= 3 tháng".

Lệnh Value labels để mã hóa giá trị cho biến F1 và F2

VALUE LABELS
F2

1 "Nhiễm HCV"
2 "Thải ghép".

Ghi chú: Trường hợp Y= biến định lượng liên tục thì không cần
lệnh này.

Ghi chú: Vì đây là test Mann-Whitney nên F1 hoặc F2 chỉ có thể
nhận tối đa 2 giá trị = 2 phân nhóm.


2

2.2 Cách thi hành syntax và nội dung bên trong

* Bước 1A: Thăm dò đặc tính phân phối của Y theo 2 biến F1
và F2
EXAMINE VARIABLES=Y BY F1 F2
/PLOT BOXPLOT HISTOGRAM NPPLOT
/COMPARE GROUPS
/PERCENTILES(5,10,25,50,75,90,95) HAVERAGE
/STATISTICS DESCRIPTIVES
/CINTERVAL 95
/MISSING PAIRWISE
/NOTOTAL.

Đầu tiên, ta dùng lệnh Examine Variables (tương
đương với quy trình Explore), mục đích là thăm
dò đặc tính phân phối của Y ở 2 phân nhóm.
Ghi chú: Nếu nghiên cứu của bạn chỉ có 1 tiêu
chuẩn chia phân nhóm, ví dụ nhóm bệnh/nhóm

chứng thì chỉ cần 1 F là đủ, không cần F2.
Nội dung của quy trình: Tính giá trị trung bình,
SD, trung vị, bách phân vị, kiểm tra giả định
phân phối chuẩn, vẽ histogram…

* Bước 1B: Vẽ Histogram
GGRAPH
/GRAPHDATASET NAME="graphdataset" VARIABLES=Y F1
MISSING=LISTWISE REPORTMISSING=NO
/GRAPHSPEC SOURCE=INLINE.
BEGIN GPL
SOURCE: s=userSource(id("graphdataset"))
DATA: Y=col(source(s), name("Y"))
DATA: F1=col(source(s), name("F1"), unit.category())
COORD: transpose(mirror(rect(dim(1,2))))
GUIDE: axis(dim(1), label("Anti-HCV E2 grade"))
GUIDE: axis(dim(1), opposite(), label("Anti-HCV E2 grade"))
GUIDE: axis(dim(2), label("Frequency"))
GUIDE: axis(dim(3), label("Nhóm hậu phẫu"), opposite(),
gap(0px))
GUIDE: legend(aesthetic(aesthetic.color), null())
SCALE: cat(dim(3), include("1", "2"))
ELEMENT:
interval(position(summary.count(bin.rect(Y*1*F1))),
color.interior(F1))
END GPL.

Tiếp theo, ta dùng lệnh Ggraph và quy trình GPL
để vẽ biểu đồ tháp phân phối. Biểu đồ này dùng
để so sánh trực quan tính đồng dạng của phân

phối ở 2 nhóm (ở đây làm cho F1= nhóm hậu
phẫu). Lý do vì sao sẽ được giải thích rõ hơn
trong phần diễn giải kết quả.

Ghi chú: Cho nghiên cứu của mình, bạn có thể thay đổi nội dung những đoạn màu đỏ, ví dụ tên biến số phân nhóm ở
đây là F1, bạn có thể chỉ cần F hoặc đổi thành F2, F3…
GUIDE: axis(dim(1), label("Anti-HCV E2 grade")) và GUIDE: axis(dim(1), opposite(), label("Anti-HCV E2 grade"))
Thay thế bằng tên của biến số Y trong nghiên cứu của bạn
GUIDE: axis(dim(3), label("Nhóm hậu phẫu"), opposite(), gap(0px))
Thay thế bằng tên của biến số F (yếu tố phân nhóm)
interval(position(summary.count(bin.rect(Y*1*F1))),…: Thay F1 bằng tên yếu tố phân nhóm trong nghiên cứu của bạn.


2

2.2 Cách thi hành syntax và nội dung bên trong

* Bước 2A: Test Mann-Whitney bằng quy trình Mới
NPTESTS
/INDEPENDENT TEST (Y) GROUP (F1)
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
NPTESTS
/INDEPENDENT TEST (Y) GROUP (F2)
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.

* Bước 2B: Test Mann-Whitney bằng Quy trình Cũ
NPAR TESTS
/M-W= Y BY F1(1 2)

/STATISTICS=DESCRIPTIVES QUARTILES
/MISSING ANALYSIS.
NPAR TESTS
/M-W= Y BY F2(1 2)
/STATISTICS=DESCRIPTIVES QUARTILES
/MISSING ANALYSIS.

Khối lệnh 2A: Thực hiện test Mann-Whitney bằng
quy trình mới (Cho SPSS phiên bản 18 trở về sau).
Ghi chú: Thay thế nội dung Y, F1, F2 bằng tên của
biến số cần so sánh và biến phân nhóm của chính
bạn.
Quy trình mới giải quyết vấn đề hoàn toàn tự động,
tức là bạn chỉ cần đưa biến số vào mô hình, SPSS sẽ
tự động xác định loại test phi tham số sẽ được sử
dụng, tùy theo số phân nhóm cần so sánh; tự động
đặt ra giả thuyết 0, chọn phương pháp tính p gần
đúng hay p chính xác tùy vào cỡ mẫu nhiều hay ít,
cuối cùng là đưa ra kết luận cho bạn. Ngoài ra quy
trình test Mann-Whitney còn vẽ luôn biểu đồ tháp
cho bạn (như bước 1B mà ta đã phải làm thủ công).

Khối lệnh 2B: Thực hiện test Mann-Whitney bằng
quy trình cũ (Cho SPSS phiên bản 17 trở về trước).
Trước đây, SPSS chưa có quy trình kiểm định phi
tham số tự động, người sử dụng phải tự mình xác
định loại test nào, và lựa chọn từ Tab Analyse, sau
đó tự thiết lập cấu hình cho test đó.
Quy trình Mann-Whitney cũ sẽ xuất ra kết quả gồm
2 bảng thống kê mô tả về giá trị và thứ hạng, bảng

kết quả Mann-Whitney U; tuy nhiên nó không vẽ
biểu đồ tháp phân phối như quy trình mới.

Ghi chú: Bạn chỉ cần chọn 1 trong 2 quy trình, cái nào cũng tốt cả.
Cho nghiên cứu của mình, bạn cần thay đổi nội dung màu đỏ, bao gồm tên biến số cần khảo sát (Y), tên biến số
phân nhóm (F) và 2 giá trị của nó (1,2).
Ví dụ bạn muốn so sánh biến Tuổi giữa 2 phân nhóm giới tính (Nam=1) và (Nữ =0) thì dòng lệnh của 2 quy trình sẽ
thay đổi thành:
NPTESTS
/INDEPENDENT TEST (Tuoi) GROUP (Gioitinh)
/MISSING SCOPE=ANALYSIS USERMISSING=EXCLUDE
/CRITERIA ALPHA=0.05 CILEVEL=95.
NPAR TESTS
/M-W= Tuoi BY Gioitinh (0 1)
/STATISTICS=DESCRIPTIVES QUARTILES
/MISSING ANALYSIS.
Cho quy trình cũ; bạn đặt thứ tự của giá trị F sao cũng được, kết quả sẽ không đổi.


3

Diễn giải kết quả
3.1 Bảng thống kê mô tả

Descriptives
Chẩn đoán
Anti-HCV E2 grade

Nhiễm HCV


Mean
95% Confidence

Lower

Interval for Mean

Bound

Statistic

Std. Error

1,85

,222

Trung bình

1,36
Upper
2,33
Bound
5% Trimmed Mean

1,83

Median

2,00


Variance

,641

Std. Deviation

,801

Minimum

1

Maximum

3

Range

2

Interquartile Range

2

Skewness

,307

,616


Độ lệch

Kurtosis

-1,282

1,191

Độ gù

Trung vị

Đây là thí dụ về bảng mô tả. Ta chỉ cần quan tâm 3 giá trị: Trung vị (Median), Độ lệch (Skewness) và Kurtosis (Độ gù).

Skewness âm: lệch phải

Kurtosis âm: bình nguyên

Skewness =0: Phân phối chuẩn

Kurtosis =0: Phân phối chuẩn

Skewness > 0: Lệch trái

Kurtosis > 0: Đỉnh nhọn

3 trị số này cho biết đặc tính của phân phối: phân phối chuẩn có Kurtosis và Skewness = 0, Trung bình = Trung vị
Có thể so sánh giữa 2 phân nhóm về Kurtosis và Skewness để thấy trung vị cao hơn/thấp hơn, bên nào lệch
phải/trái nhiều hơn. Đây là cách làm định lượng.

Cũng có thể so sánh định tính bằng biểu đồ hình tháp mà ta sẽ bàn trong phần kết quả.
Ghi chú: Đối với biến số giả định lượng, thứ hạng thì kết quả của bảng mô tả không quan trọng, có thể bỏ qua,
do đó thí dụ này chỉ để minh họa.


3

Diễn giải kết quả
3.1 Kết quả theo quy trình mới

Nếu bạn làm test bằng quy trình mới, kết quả xuất ra chỉ là bảng tóm tắt như sau.
Bạn không cần chú ý đến nội dung của nó vào lúc này, chỉ cần click chuột vào nó để mở cửa sổ nội dung chi tiết :

Kết quả tóm tắt

Biểu đồ tháp
phân phối

Bản kết quả chi tiết

Nếu với những loại test thống kê khác ta chỉ cần đọc giá trị p ngay lập tức thì ở đây ta không làm như
thế. Trước khi đọc kết quả test, bạn cần dành ít phút quan sát biểu đồ phân phối hình tháp ở góc trên
cửa sổ kết quả. Biểu đồ này cho phép so sánh trực quan đặc tính phân phối giữa 2 quần thể.
Tại sao cần phải so sánh đặc tính phân phối ? Đây là một điểm tế nhị của test Mann-Whitney vì tùy vào
tính đồng dạng hay khác biệt về phân phối giữa 2 phân nhóm mà giả thuyết 0 đặt ra sẽ khác nhau, dẫn
tới cách diễn giải kết quả khác nhau.
Có nhiều cách diễn đạt giải thuyết 0 của test Mann Whitney. Giả thuyết 0 thứ 1: Xác suất tìm thấy một
giá trị X(a) trong phân nhóm A cao (hay thấp) hơn giá trị X(b) trong phân nhóm B tương đương với xác
suất tìm thấy một giá trị Xb trong phân nhóm B cao (hay thấp) hơn giá trị Xa trong phân nhóm A.
P(XA>XB) = P(XB>XA) Hay P(Xa>Xb) + 0.5 P(Xa=Xb) =0.5


Giả thuyết 0 thứ hai (dễ hiểu hơn): Hai phân nhóm có đặc tính phân phối như nhau
Giả thuyết 0 thứ ba: Trung vị phân nhóm A = Trung vị phân nhóm B).
Nếu 2 phân phối đồng dạng thì test Mann-Whtney cho phép bạn so sánh 2 giá trị trung vị. Tính chất
đồng dạng không bắt buộc 2 histogram tuyệt đối trùng nhau, chỉ cần hình dạng của chúng gần giống
nhau là đủ (khuynh hướng quan trọng hơn giá trị chính xác).
Nếu 2 nhóm có phân phối không đồng dạng, giả thuyết 0 của test Mann-Whitney chỉ cho phép so sánh
đặc tính phân phối và giá trị p phải được diễn giải theo hướng này.


3

Diễn giải kết quả
3.1 Kết quả theo quy trình mới

1

Trong thí dụ này, đặc tính phân phối ở 2 phân nhóm không đồng dạng. Như vậy, giả thuyết 0 được đặt ra sẽ là:
Mức độ phản ứng với kháng thể HCV được phân phối như nhau ở 2 phân nhóm hậu phẫu.
Loại test phi tham số
Mann-Whitney
Nội dung giả thuyết 0

Giá trị p

2

2

Quyết định

về giả thuyết 0

Trong bảng kết quả tóm tắt, bạn đọc luận ở 2 cột cuối cùng (giá trị p và quyết định về giả thuyết 0): Nếu test
cho ra kết quả dương tính (p<0,05) thì cột này sẽ có màu vàng. Trong thí dụ này, p=0,083 > 0,05 nên kết luận là
ta giữ giả thuyết 0.

Bảng kết quả chi tiết cung cấp thêm những thông tin như sau:

3

(n1+n1)
Trị số U của MannWhitney
Trị số W của Wilcoxon
Trị số U nhỏ nhất
Sai số chuẩn
U chuẩn hóa (Zu)
Giá trị p ước lượng
Giá trị p chính xác


3

Diễn giải kết quả
3.1 Kết quả theo quy trình mới

Asymptotic là 1 phương pháp ước tính giá trị p một
cách gần đúng. Mức độ chính xác của giá trị p lúc này
sẽ phụ thuộc vào cỡ mẫu, cỡ mẫu càng cao thì p ước
tính càng chính xác, gần với giá trị thực.


Giá trị p chính xác tính bằng test Exact, dùng cho
trường hợp cỡ mẫu thấp (n1 hoặc n2 <20).

Chọn giá trị p nào để báo cáo:

Giá trị này không phài lúc nào cũng được báo cáo, SPSS
tự hiểu khi nào cỡ mẫu của bạn thấp đến mức phải tính
p Exact, và công thức tính ở đây dựa theo phương
pháp của Dineen và Blakesley (1973).

+ Nếu cỡ mẫu của bạn đủ lớn (n1 >20 và n2>20), bạn có thể báo cáo Asymptotic p
+ Ngược lại với cỡ mẫu nhỏ (n1 hoặc n2 <20) bạn nên sử dụng giá trị p chính xác, được trình bày ngay bên
dưới.
+ Nếu trong 2 phân nhóm có quá nhiều cặp giá trị bằng nhau (cùng thứ hạng), p exact cũng được tính nhưng
sẽ cao một cách quá đáng, lúc này bạn nên dùng p Asymptotic.
Trong thí dụ này, có nhiều cặp giá trị ngang nhau (giá trị 1+) ở 2 phân nhóm, do đó bạn không nên sử dụng
giá trị p Exact (quá cao), nên dù cỡ mẫu <20 nhưng bạn vẫn có thể dùng p Asymptotic.

Kết quả được báo cáo sẽ gồm những nội dung như sau:
+ Tính đồng dạng của phân phối (so sánh định lượng dựa vào trung vị, Skewness, Kurtosis hoặc trực quan
dựa vào hostogram).
+ Giá trị U và Zu (U chuẩn hóa)
+ Giá trị p Asymptotic hoặc p Exact.
+ Kết luận cuối cùng : Nếu 2 phân phối đồng dạng, kết luận sẽ là so sánh 2 trung vị. Nếu 2 phân phối không
đồng dạng, kết luận sẽ là so sánh đặc điểm phân phối.
Trong thí dụ này, ta có thể diễn giải và báo cáo như sau:
Không có sự khác biệt ý nghĩa về đặc điểm phân phối của mức độ phản ứng với kháng thể anti HCV của mô
gan ghép giữa các bệnh nhân hậu phẫu <1 tháng và >3 tháng (U=91;Z=1,919;p=0,055).

Sau cùng, ta tính hệ số ảnh hưởng theo 1 trong 2 công thức của Rosenthal hoặc Hans Wendt. Bạn dung công

thức nào cũng được, kết quả gần như nhau, chú ý lấy giá trị tuyệt đối của r nếu ra kết quả âm.

Dineen, L. C., & Blakesley, B. C. (1973). Algorithm AS 62: Generator for the sampling distribution of the MannWhitney U statistic. Applied Statistics, 22, 269-273.


3

Diễn giải kết quả
3.1 Kết quả theo quy trình mới
Test dương tính: Có sự khác
biệt ý nghĩa về đặc tính phân
phối giữa 2 nhóm

Phân phối không đồng dạng.
Test Mann-Whitney chỉ dùng
để so sánh đặc tính phân
phối

Cỡ mẫu <20 ở mỗi phân nhóm, nên dùng p exact

Giá trị U

Giá trị Z

Cỡ mẫu <20 ở mỗi phân nhóm, nên dùng p exact

Tương tự, bạn có thể diễn giải kết quả của test Mann-Whitney U cho 2 phân nhóm : Tái nhiễm HCV và
Thải ghép như sau: Có sự khác biệt ý nghĩa về đặc tính phân phối của mức độ phản ứng hóa miễn dịch
với kháng thể anti E2-HCV trên mô sinh thiết gan giữa 2 phân nhóm : Nhiễm HCV và Thải ghép
(U=17,5;Z=-3,205;p = 0,002 theo công thức Dineen -Blakesley (1973)).


Hoặc:
Kết quả test Mann-Whitney U cho thấy các bệnh nhân tái nhiễm HCV có mức độ phản ứng dương tính
hóa mô miễn dịch cao hơn 1 cách ý nghĩa (lệch phải) so với phân nhóm Thải ghép.
Ghi chú:
Trong trường hợp p<0,05 và phân phối không đồng dạng: bạn có thể diễn giải cụ thể hơn về sự khác
biệt khuynh hướng phân phối, ví dụ lệch trái, lệch phải, tập trung…)
Còn nếu phân phối đồng dạng, bạn sẽ diễn giải : Trung vị của Y cao hơn 1 cách ý nghĩa ở phân nhóm A
so với phân nhóm B, hoặc: Có sự khác biệt giá trị trung vị của Y giữa 2 phân nhóm A và B.


Diễn giải kết quả
3.2 Kết quả theo quy trình cũ

3

So với kết quả của quy trình mới, kết quả của quy trình cũ phong phú hơn về mặt định lượng, tuy
nhiên những thông tin hữu dụng lại rất ít, và không có gì khác so với quy trình mới.
Đầu tiên, quy trình cũ cung cấp bảng thống kê mô tả, tuy nhiên kết quả này không hữu dụng, vì
xét cho toàn bộ quần thể chung. Công dụng duy nhất của bảng này là để phát hiện dữ liệu bị sót.
Descriptive Statistics
Percentiles
N

Mean

Std. Deviation

Minimum


Maximum

25th

50th (Median)

75th

Anti-HCV E2 grade

23

1,35

,885

0

3

1,00

1,00

2,00

Chẩn đoán

23


1,43

,507

1

2

1,00

1,00

2,00

Tiếp theo là bảng thống kê xếp hạng ở mỗi phân nhóm, bao gồm n1, n2, thứ hạng trung bình, tổng thứ hạng.
Bảng này cho phép hình dung về sự khác biệt giá trị giữa 2 phân nhóm.
Ranks

Anti-HCV E2 grade

Chẩn đoán

N

Mean Rank

Sum of Ranks

Nhiễm HCV


13

15,65

203,50

Thải ghép

10

7,25

72,50

Total

23

Bảng cuối cùng có nội dung tương tự như bảng kết quả chi tiết trong quy trình mới. Nó cũng trình báy giá trị U,
Zu, giá trị p ước tính (Asymptotic) và p chính xác (Exact).
Test Statisticsa
Anti-HCV E2 grade
Mann-Whitney U

17,500

Wilcoxon W

72,500


Z

-3,205

Asymp. Sig. (2-tailed)

,001

Exact Sig. [2*(1-tailed Sig.)]

,002b

a. Grouping Variable: Chẩn đoán
b. Not corrected for ties.

Ghi chú:
Quy trình cũ không cung cấp biểu đồ tháp phân phối, tuy nhiên tác giả đã kết hợp với lệnh Ggraph và GPL để vẽ
biểu đồ này trong khối lệnh 1B ở trên. Cách diễn giải biểu đồ cũng tương tự, và bạn cần làm việc này trước khi
đọc bảng kết quả.


4

Diễn đạt văn bản khoa học

Phương pháp:
Số liệu được phân tích bằng phần mềm IBM-SPSS 23.
Mức độ phản ứng miễn dịch của mẫu mô được đánh
giá một cách bán định lượng như sau: 0: không có tế
bào dương tính, 1+, 2+, 3+ tương ứng với <5%, 5-20%

và > 20% tế bào dương tính với HCV-E2. Kết quả này
được so sánh giữa : Phân nhóm có chẩn đoán xác định
tái nhiễm HCV và phân nhóm bị thải ghép, cũng như
giữa phân nhóm hậu phẫu ≤ 1 tháng và từ 3 tháng trở
lên, bằng kiểm định Mann-Whitney. Giả thuyết 0 là
mức độ phản ứng dương tính với HCV được phân phối
như nhau giữa 2 nhóm. Ngưỡng ý nghĩa :p<0,05.
Kết quả:
Biểu đồ cho thấy mức độ dương tính với HCV có phân
phối không đồng dạng giữa 2 phân nhóm thời gian hậu
phẫu, cũng như 2 phân nhóm chẩn đoán.
Có sự khác biệt ý nghĩa về đặc tính phân phối của mức
độ phản ứng hóa miễn dịch với kháng thể anti E2-HCV
trên mô sinh thiết gan giữa 2 phân nhóm : Nhiễm HCV
và Thải ghép (U=17,5;Z=-3,205;p = 0,002 theo công
thức Dineen -Blakesley (1973), hệ số ảnh hưởng r theo
Rosenthal =0,67 (cao)).
Không có sự khác biệt ý nghĩa về đặc điểm phân phối
của mức độ phản ứng với kháng thể HCV của mô gan
ghép giữa các bệnh nhân hậu phẫu <1 tháng và >3
tháng (U=91;Z=1,919;p=0,055; hệ số ảnh hưởng r theo
Hans Wendt (1972) = 0,4 (trung bình)).


Thuốc này
có công hiệu
không ?

À, điều này còn tùy
vào giả thuyết

« Không » được phát
biểu như thế nào…

Bộ số liệu : />Syntax: />Liên lạc với tác giả:



×