Tải bản đầy đủ (.pdf) (42 trang)

Tài liệu hướng dẫn thống kê y học sử dụng SPSS - ANOVA ĐƠN BIẾN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.09 MB, 42 trang )

Tài liệu hướng dẫn
thống kê y học sử dụng SPSS

SPSS
ANOVA đơn biến

BS. Lê Đông Nhật Nam


Lời mở đầu
Mùa hè năm 1995, tôi tốt nghiệp trung học cơ sở và chuẩn bị lên cấp 3. Khi đó Bộ Giáo dục qui định
mỗi học sinh chỉ được nộp đơn thi tuyển sinhvào 1 trường duy nhất (đề thi chung của Bộ). Việc lựa
chọn trường để nộp đơn (và theo học 3 năm sau đó) thực sự là một vấn đề khó khăn. Tôi có ít nhất là
5 lựa chọn, trường Hùng Vương gần nhà nhất, sau đó là 4 trường thuộc nhóm « cao giá » là Nguyễn
Thượng Hiền, Bùi thị Xuân, Minh Khai và Lê Quý Đôn. Gia đình tôi đã so sánh tỉ lệ học sinh đặu đại học
giữa 5 trường và khuyên tôi thi vào trường chuyên Nguyễn Thượng Hiền. Bản thân tôi vì có một chấn
thương tâm lý nặng do áp lực học hành tại trường chuyên, lớp chọn thời cấp 2, nên tôi quyết định sẽ
KHÔNG thi vào bất cứ trường chuyên nào nữa, cũng không muốn gặp lại bất kì người bạn cũ nào. Tôi
thuyết phục gia đình thi vào một trường gần chót bảng mà tôi nghĩ rằng không ai muốn chọn, đó là
Marie Curie. Cuối cùng tôi nhận ra là điểm thi của tôi rất cao và theo lý thuyết tôi có thể vào học tại
bất cứ trường cấp 3 nào, nhưng mọi chuyện đã muộn, tôi phải học tại Marie Curie. Hai năm sau Marie
Curie bị giáng cấp xuống thành một trường bán công. Thời gian sau này gia đình tôi trách tôi rất nhiều
vì lựa chọn đó.
Trước một quyết định lớn trong đời, chúng ta thường lựa chọn bằng cách SO SÁNH. Và thường ta
không bao giờ dừng lại ở 2 nhóm mà luôn so sánh NHIỀU nhóm với nhau (Nếu bạn từng mua smart
phone hay laptop chắc sẽ hiểu điều này). Và đa số trường hợp ta so sánh những giá trị đo, đếm
được. Ví dụ, quyết định hệ trọng của bác sĩ khi hành nghề thường là lựa chọn phương pháp điều trị
tối ưu cho bệnh nhân, giữa 4-5 loại thuốc khác nhau chẳng hạn, khi đó vấn đề so sánh nhiều nhóm
được đặt ra.
Để giải đáp bài toán này, trong thống kê người ta dùng phương pháp ANOVA (phân tích phương sai).
ANOVA là một trong những loại phân tích số liệu thường gặp nhất trong khi làm luận văn, nghiên cứu


khoa học (tăng thêm 1 nhóm đồng nghĩa với việc vẽ ra nhiều giả thuyết hơn, đề tài trở nên hấp dẫn
hơn thay vì chỉ so sánh 2 nhóm). Hầu hết các luận văn y học tại VN đều có sử dụng ANOVA.
Đã có nhiều tài liệu viết về ANOVA tại Việt Nam, thậm chí của những thầy cô nổi tiếng, tuy nhiên tôi
vẫn muốn soạn 1 tài liệu hướng dẫn của riêng mình; cho những người bạn thân của tôi. Tôi muốn
hướng đến một mục đích hoàn toàn khác, thực dụng hơn, giản dị hơn. Tôi sẽ không đi quá sâu vào lý
thuyết để làm rối trí các bạn, đơn giản hóa mọi thứ đến mức tối đa, dựa trên công cụ có sẵn (SPSS) và
tình huống thực tế.
Tài liệu sẽ hướng dẫn các bạn từng bước một, đi từ câu hỏi nghiên cứu cho tới phân tích số liệu, diễn
giải kết quả và cuối cùng là trình bày kết quả trong văn bản khoa học, đảm bảo cho những bạn không
biết gì về thống kê vẫn có thể tự mình làm luận văn. Hy vọng có thể góp phần vào thành công của các
bạn.


Quy ước trình bày
Trong tài liệu này chúng ta sẽ làm quen với 3 nhân vật

Bác sĩ Nguyễn Văn Thái
Bác sĩ Thái là một cao thủ thống kê y học trên giang hồ. Anh ta sẽ xuất
hiện trước mọi vấn đề khó khăn, nhằm đưa ra câu trả lời chính xác và
ôn lại cho bạn những kiến thức cơ bản cũng như chuyên sâu về lý
thuyết thống kê. Tuy nhiên BS Thái lại rất bận rộn nên không đủ thời
gian đi vào cách thực hiện chi tiết. Anh ta cũng hay trình bày lý thuyết
thuần túy và sử dụng nhiều công thức toán học nên không mấy gần gũi
với sinh viên và gây không ít trở ngại cho các bạn vốn dị ứng với thống
kê …

Bác sĩ Lê Ngọc Khả Nhi
Khả Nhi là một nữ bác sĩ trẻ dễ thương và sử dụng thành
thạo SPSS. Như tên gọi của mình, BS Nhi có tính cách hồn
nhiên và ngây thơ như trẻ con, vì vậy cô ấy luôn có khuynh

hướng đơn giản hóa tối đa mọi vấn đề. Khả Nhi sẽ hướng
dẫn các bạn sử dụng SPSS qua từng bước cụ thể, chia sẻ
những mẹo vặt, thủ thuật để giúp các bạn đi đến kết quả
nhanh và dễ dàng nhất.

Sinh viên Trần Quốc Bảo
Bảo là sinh viên y khoa năm thứ sáu và bắt đầu làm quen với nghiên
cứu khoa học. Đây là một cậu sinh viên rất tò mò và luôn đặt ra
nhiều câu hỏi liên quan đến thống kê. Mặc dù những đế tài do Bảo
thực hiện còn đơn giản, nhưng đồng hành với cậu ta, các bạn có cơ
hội tích lũy cho mình nhiều kinh nghiệm trong công việc phân tích
số liệu và thiết kế nghiên cứu.

3


1

1.1 Tình huống thí dụ

Pregabalin là một loại thuốc giảm đau thần kinh, dựa vào tác dụng ức
chế việc tiết các chất dẫn truyền thần kinh phụ thuộc kênh Canxi.
Một bác sĩ nội trú muốn nghiên cứu hiệu quả điều trị giảm đau của
Pregabalin trên bệnh nhân sau phẫu thuật mở ống sống
(laminectomy).
Nghiên cứu được thực hiện trên 56 bệnh nhân chia thành 4 nhóm,
mỗi nhóm có 14 người. Điều trị giảm đau được thực hiện đồng thời
khi gây mê. Nhóm 1 được cung cấp Placebo, Nhóm 2 sử dụng một loại
thuốc giảm đau opioid là Tramadol liều 150 mg, Nhóm 3 sử dụng
Pregabalin liều thấp (75mg), nhóm 4 sử dụng Pregabalin liều cao (150

mg). Tại thời điểm 4h sau phẫu thuật bác sĩ thực hiện đánh giá mức độ
đau bằng thang điểm đau quy ước.
Hiệu quả điều trị được đánh giá qua mức độ đau, và vấn đề đặt ra là
phải so sánh giá trị này giữa 4 nhóm nêu trên. Chúng ta phải sử dụng
phương pháp thống kê nào cho trường hợp này ?

1
Thang điểm đau quy ước

2

Phẫu thuật mở ống sống

Đây là cách duy nhất đánh
giá mức độ đau như một
biến định lượng liên tục
(đơn vị: decibel)

3

4
(không có trên thực tế  )


1

1.2 Giới thiệu về ANOVA
Bảo thân mến, ở đây em muốn so sánh giá trị trung bình của một
biến số định lượng giữa 4 phân nhóm độc lập; nên ta sẽ áp dụng
phân tích phương sai 1 yếu tố (hay còn gọi là ANOVA đơn biến) cho

các nhóm độc lập

Trong giáo trình thống kê có rất nhiều kiểu ANOVA, em
không biết làm thế nào để phân biệt chúng ?

Đúng là cách trình bày trong sách vở làm cho chúng ta dễ ngộ nhận là có nhiều phương pháp
ANOVA khác nhau. Thực ra chúng đều dựa trên nguyên tắc chung duy nhất đó là mô hình
hồi quy tuyến tính. Người ta phân chia ra nhiều kiểu ANOVA là dựa trên 2 yếu tố:
+ Số lượng biến số độc lập (hay yếu tố ảnh hưởng ) ?
+ Thiết kế nghiên cứu
Danh pháp chung của ANOVA như sau:

Phân tích phương sai + [số lượng biến số độc lập] yếu tố + (loại thiết kế nghiên cứu)
1 biến số độc lập : ANOVA 1 yếu tố (hay ANOVA đơn biến, tiếng Anh: one way ANOVA)
2 biến số độc lập: ANOVA 2 yếu tố (two ways ANOVA)
Thiết kế nghiên cứu:
Nếu tất cả biến số được khảo sát trên cùng một đối tượng ở nhiều điều kiện khác nhau: Ta
có ANOVA cho phép đo lặp lại (repeated measure, within subject ANOVA)
Nếu tất cả biến số khảo sát ở nhiều đối tượng độc lập: Ta có ANOVA cho các nhóm độc lập
Nếu một vài biến số được khảo sát trên đối tượng độc lập, và những biến còn lại được khảo
sát trên cùng đối tượng: thiết kế hỗn hợp
Tên phương pháp

Số biến độc lập

Thiết kế nghiên cứu

ANOVA đơn biến (1 yếu tố)

1


Nhiều phân nhóm độc lập

ANOVA đơn biến cho phép đo lặp lại

1

Phép đo lặp lại trên cùng đối tượng

ANOVA 2 yếu tố

2

Nhiều phân nhóm độc lập

ANOVA 3 yếu tố

3

Nhiều phân nhóm độc lập

ANOVA 2 yếu tố cho phép đo lặp lại

2

Phép đo lặp lại trên cùng đối tượng

ANOVA 2 yếu tố hỗn hợp

2


1 yếu tố được khảo sát trên đối tượng
độc lập Yếu tố còn lại khảo sát nhiều lần
trên cùng đối tượng


1

1.2 Giới thiệu về ANOVA
Phân tích phương sai 1 yếu tố (One way ANOVA) cho phép bạn so sánh giá trị trung
bình của một biến số định lượng giữa nhiều nhóm không có liên hệ với nhau. Biến số
định lượng này được khảo sát 1 lần duy nhất và trên các đối tượng khác nhau giữa
các phân nhóm.
Giả thuyết 0 của ANOVA đơn biến: Giá trị trung bình của biến số khảo sát là như
nhau ở tất cả các phân nhóm. H0: µ1 = µ2 = µ3 = ... = µk (k= số nhóm so sánh)
Để kiểm tra giả thuyết 0 này, ANOVA sẽ tính tỉ số F = tỉ lệ sự sai biệt giữa các nhóm
(do thí nghiệm gây ra) so với sự sai biệt nội tại (ngẫu nhiên) trong cùng một nhóm. Tỉ
dựa vào phân phối Fisher cho phép ta xác định giá trị p = xác suất có được một giá trị
F cao như thế nếu giả thuyết H0 là đúng. Ta loại bỏ giả thuyết H0 nếu p<0,05; đồng
nghĩa với việc chấp nhận giả thuyết ngược lại: Có ít nhất một phân nhóm có giá trị
khác với những phân nhóm còn lại.

Biến số định lượng

Sai biệt giữa các nhóm
do thí nghiệm gây ra
𝑿𝑪: Trung bình phân nhóm C

Biến thiên nội tại
(ngẫu nhiên)


𝑿𝑨: Trung bình phân nhóm A

𝑿𝒈𝒓𝒂𝒏𝒅: Trung bình chung

F

𝑿𝑩: Trung bình phân nhóm B

Giá trị biến độc lập (phân nhóm)

A

B

C

𝑭=

𝑴𝑺𝑴
𝑴𝑺𝑹

Ghi chú: k = số phân nhóm hay bậc giá trị của biến định tính; N= tổng số trường hợp; n= số trường hợp trong
mỗi phân nhóm; xi = giá trị của 1 trường hợp; 𝑥𝑘: trung bình của mỗi phân nhóm; 𝑥𝑔𝑟𝑎𝑛𝑑 : trung bình chung
(không phân biệt phân nhóm); sk: phương sai của mỗi phân nhóm; sgrand: phương sai chung (không phân biệt
phân nhóm). MS: Mean of square; SS: Sum of square: M:Model hay hiệu ứng chính; R: error hay residual: sai số
ngẫu nhiên; T: total = tổng cộng


1.2 Giới thiệu về ANOVA


1

F for « Fisher »
Kiểm định F được GS. Ronald A. Fisher thiết kế
năm 1920. Test F không chỉ được dùng cho phân
tích phương sai mà còn dùng để kiểm tra giá trị của
các mô hình hồi quy.

Not this Fisher !

Giáo sư Ronald Aylmer Fisher
(1890-1962) Nhà di truyền học và
thống kê người Anh

Bạn có biết : Thực ra ANOVA có thể được hình dung như
1 mô hình hồi quy tuyến tính ?

𝑮𝒊á 𝒕𝒓ị 𝒀 = 𝒃𝒐 + (𝒃𝟏. 𝑿𝟏) + (𝒃𝟐 ∗ 𝑿𝟐) + (𝒃𝟑. 𝑿𝟑) + 𝒔𝒂𝒊 𝒔ố

Y

Mô hình này dự báo giá trị của biến số Y tùy
theo trường hợp X thuộc phân nhóm nào
X1, X2, X3 là những biến số giả chỉ phân nhóm,
chỉ nhận 1 trong 2 giá trị: =1 (đúng) hoặc =0 (sai)
Ví dụ khi bệnh nhân đưa vào nhóm 1 thì X1=1,
X2 và X3=0.

b3

𝒀

b2
b1

Tham số bo chính là giá trị của Y khi tất cả X=0

bo

X
1

2

3

Tham số b1,b2,b3 tương ứng cho X1,X2,X3; Đây
cũng chính là khoảng cách giữa Y1,Y2,Y3 và
trung bình của Y
Ví dụ: Mức độ đau = mức độ đau cơ bản + b1
(Placebo )+ b2(Pregabalin liều thấp +
b3(Pregabalin liều cao) + b4(Tramadol)+ sai số

Như vậy thí nghiệm của chúng ta chính là 1 loại mô hình hồi quy, dùng để mô phỏng một quy luật tự
nhiên có thực mà ta muốn xác nhận. Sau khi được đưa vào các phân nhóm X1,X2,X3… khác nhau trong
mô hình này, mỗi bệnh nhân sẽ cho ra giá trị Y khác nhau. Nếu thực sự có khác biệt ý nghĩa thống kê
giữa 3 phân nhóm, tức là mô hình thí nghiệm phải có ý nghĩa (phù hợp với quy luật tự nhiên).
Vì vậy tỉ số F cũng như một thước đo kiểm tra ý nghĩa xác thực của mô hình, nói cách khác, là kiểm tra ý
nghĩa của hiệu ứng mà yếu tố (thí nghiệm) gây ra. F càng cao thì mô hình càng có ý nghĩa, càng «phù
hợp» với hiện thực.



1

1.3 Ứng dụng của ANOVA

ANOVA 1 yếu tố có thể dùng trong những trường hợp
nào ?

Phân tích phương sai (ANOVA) đơn biến cho các nhóm độc lập có thể ứng dụng cho nhiều câu hỏi
nghiên cứu như
1. Khảo sát ảnh hưởng của một nhân tố lên giá trị của biến số định lượng
- Khảo sát hiệu quả của các loại thuốc khác nhau, hoặc 1 loại thuốc ở các liều lượng khác nhau (bao
gồm nhóm chứng placebo)
- Đánh giá hiệu quả trị liệu: So sánh sự thay đổi của triệu chứng (định lượng) trước và sau khi điều trị
bằng 1 số phương pháp khác nhau (ví dụ phẫu thuật can thiệp, chế độ dinh dưỡng…).
2. So sánh giá trị 1 đại lượng giữa các quần thể khác nhau
- So sánh đặc điểm sinh lý, sinh hóa bình thường hay bệnh lý giữa các địa phương, chủng tộc… khác
nhau
- So sánh độ nặng của triệu chứng lâm sàng tại các giai đoạn diễn tiến khác nhau của một bệnh lý.
- So sánh đặc điểm lâm sàng của nhiều bệnh lý khác nhau
Bạn cần có:
1 biến số định lượng liên tục biểu thị cho đại lượng cần nghiên cứu ; ví dụ: 1 triệu chứng lâm sàng
1 biến số định tính để phân nhóm (≥3 giá trị). Ví dụ: Liều thuốc, phương pháp điều trị, độ nặng…

N
Hiệu quả

So sánh ?


µ1

µ2

µ3

µ4

Liều thuốc
k phân nhóm

8


1

1.4 Quy trình làm ANOVA trong SPSS

Phân tích ANOVA gồm có 4 bước chính như sau:
Kiểm tra các giả định

Thực hiện phân tích
ANOVA

Sử dụng chức năng Explore của SPSS

Sử dụng chức năng Compare means của SPSS

Phân tích khuynh hướng
Phân tích tương phản


Có giả thuyết rõ ràng
Phân tích sâu
Chưa có giả thuyết rõ ràng

Post hoc test

Tính hệ số ảnh
hưởng/tương phản

9

1.5 Nhập số liệu
1

Trong cửa sổ Variable View, bạn tạo 2 biến
số:

2
1 biến số định tính (Nominal) kiểu số
(numeric) dùng để phân nhóm điều trị.
Biến này được dán nhãn giá trị như sau:
1= Placebo
2= Tramadol 150 mg
3= Pregabalin 75mg
4= Pregabalin 150 mg
Cột Label cho phép bạn mô tả ý nghĩa của biến
số, điều này rất có ích nếu sau này bạn muốn
chuyển số liệu cho một đồng nghiệp khác sử
dụng.


1 biến số định lượng (Scale) kiểu số
(numeric) để biểu thị mức độ đau


1

1.5 Nhập số liệu

3
4

Bạn nhập dữ liệu vào bảng, chỉ cần
nhập 1,2,3,4 cho biến số Nhom, sau
đó kích hoạt chế độ hiển thị nhãn
giá trị để có tên đầy đủ của mỗi
nhóm điều trị

2

2.1 Thăm dò số liệu
Kích hoạt chức năng thăm dò dữ liệu

1

2
3


2


2.1 Thăm dò số liệu

6
4
5

Trong hộp thoại Explore, bạn
kéo biến Nhóm điều trị vào
ô Factor list và biến Mức độ
đau vào ô Dependent list.

Nhấn nút « Statistic » để
chọn kiểu phân tích


2.1 Thăm dò số liệu

2

7
Tạo bảng mô tả (trình bày giá trị
trung bình, độ lệch chuẩn, Min,
max, vv) cho từng phân nhóm
Phát hiện điểm giá trị ngoại lai
(Sử dụng biểu đồ Blox-plot)

8
Nhấn Continue để trở ra


9

sau đó nhấn
để
mở hộp thoại vẽ biểu đồ.


2

2.1 Thăm dò số liệu

Hộp Explore:plots cho phép khảo sát sự phân phối giá trị của biến số định lượng ở từng phân
nhóm bằng trực quan (Histogram) và test thống kê.

10

Vẽ histogram
Kiểm tra giả định phân phối bình thường
(test Shapiro-Wilk và Kolmogorov-Smirnov)

Kiểm tra giả định phương sai đồng nhất
(Test Levene)

11

12


2


2.2 Kiểm tra các giả định

Có 2 cách kiểm tra giả định phân phối chuẩn:
1) Phương pháp toán học - Sử dụng kiểm định Shapiro-Wilk hoặc Kolmogorov-Smirnov :
tối ưu cho trường hợp cỡ mẫu không quá lớn (<50 trường hợp), nhưng lại không đáng tin
cậy khi cỡ mẫu quá nhỏ)
2) Phương pháp trực quan - Sử dụng biểu đồ Q-Q plot: Thích hợp cho những cỡ mẫu lớn
(> 50 trường hợp)
Tests of Normality
Nhóm điều trị

Kolmogorov-Smirnova
Statistic

Mức độ đau

df

Shapiro-Wilk

Sig.

Statistic

df

Sig.

Placebo


,176

14

,200*

Tramadol 150mg

,192

14

,175

,936

14

,370

,185

14

,200*

,924

14


,255

,224

14

,056

,876

14

,052

Pregabalin 75mg
Pregabalin 150
mg

,888

14

,075

*. This is a lower bound of the true significance.

Kết quả kiểm định Sapiro-Wilk

a. Lilliefors Significance Correction


Đầu tiên, chúng ta kiểm tra giả định: Phân phối bình thường, dựa vào bảng kiểm định KolmogorovSmirnov và Shapiro-Wilk. Chú ý cột giá trị p (Sig). Nếu p<0,05 tức là số liệu phân phối KHÔNG bình
thường.
Như vậy để thỏa giả định phân phối bình thường, kết quả ta trông đợi là p>0,05
Test of Homogeneity of Variance
Levene
Statistic
Mức độ đau

df1

df2

Sig.

Based on Mean

,200

3

52

,896

Based on Median

,263

3


52

,851

,263

3

48,614

,851

,221

3

52

,881

Based on Median and
with adjusted df
Based on trimmed mean

Kết quả kiểm định Levene
Tiếp theo, ta đọc bảng kết quả kiểm định Levene, để kiểm tra giả định về « Phương sai đồng
nhất ».
Nếu p<0,05 có nghĩa là các phân nhóm có phương sai KHÔNG đồng nhất.
Như vậy để thỏa giả định phương sai đồng nhất, kết quả test ta trông đợi là p>0,05
Trong trường hợp cả 2 giả định đều được thỏa mãn, ta có thể yên tâm đi tiếp



2

2.2 Kiểm tra các giả định

*
X3
X1,5

*

Điểm giá trị ngoại lai
Điểm giá trị chênh lệch cực độ

Biểu đồ Box-plots cho phép phát hiện nhanh các điểm giá trị cá biệt (chênh lệch quá
lớn so với độ lệch chuẩn). Biểu đồ này cũng dùng để báo cáo kết quả.
Bất cứ điểm nào có khoảng cách > 1,5 lần chiều dài của error bar được xem là điểm
ngoại lai.
Nếu cách biệt lớn hơn 3 lần, đó là giá trị rất phân cực.
Trong hình trên, không có điểm giá trị ngoại lai nào được phát hiện.
Nếu có trường hợp giá trị cá biệt, SPSS sẽ đánh dấu bằng mã số thứ tự cho phép ta
định vị dễ dàng trường hợp đó trong bảng số liệu.

Điểm giá trị cá biệt
(trường hợp thứ 5 trong bảng số liệu)

Điểm giá trị chênh lệch cực độ
(trường hợp thứ 4 trong bảng số liệu)



2

2.2 Kiểm tra các giả định

Nếu có điểm giá trị ngoại
lai, ta phải xử trí thế nào
?

+ Đầu tiên, cần tìm hiểu nguyên nhân của giá trị cá biệt này: Có thể do nhập số liệu
sai ? Có thể do sai sót trong quá trình đo (đa số trường hợp). Sau khi đã loại trừ tất
cả nguyên nhân chủ quan, ta buộc phải kết luận rằng giá trị đó có thực và hoàn
toàn ngẫu nhiên (rất hiếm gặp, đồng nghĩa với việc đối tượng thực sự là một ngoại
lệ).
Nếu ta quyết định vẫn giữ điểm ngoại lai; ta có nhiều lựa chọn:
1) Sử dụng phương pháp phi tham số (kiểm định Kruskal Wallis là giải pháp thay
thế cho ANOVA đơn biến - độc lập
2) Thay đổi giá trị cá biệt bằng 1 giá trị khác gần với nó nhất có thể (ví dụ: nếu giá
trị x = 10 được xem là quá khác biệt, ta có thể thử giá trị x=8 , vẫn là giá trị cao nhất
nhưng còn nằm trong giới hạn cho phép) (Lưu ý: giá trị thay thế có thể là giả hay
thật đều được)
3) Chuyển dạng biến số (ví dụ đổi sang thang đo logarit)
4) Cầu kì hơn: Ta tiến hành làm ANOVA song song cho 2 trường hợp: Có và không
có điểm giá trị ngoại lai, nếu kết quả tương tự nhau, ta giữ, ngược lại ta bỏ.
Loại bỏ giá trị luôn là lựa chọn cuối cùng:
Nếu ta quyết định bỏ điểm ngoại lai này, effect size và giá trị phổ quát của mô hình
có thể sẽ bị ảnh hưởng.


2


2.2 Kiểm tra các giả định

Nếu giả định phân phối
chuẩn bị vi phạm ta
phải xử trí thế nào ?

Bạn có nhiều lựa chọn
1) Chuyển dạng biến số (ví dụ thang đo Logarit), với hy vọng sẽ có phân phối
chuẩn
2) Sử dụng phương pháp phi tham số (kiểm định Kruskal-Wallis, là giải pháp
thay thế cho ANOVA đơn biến độc lập)
3) Bỏ qua vi phạm và vẫn làm phân tích ANOVA (Thực ra điều kiện phân phối
không phải là tuyệt đối bắt buộc).
4) Làm ANOVA song song cho 2 mẫu số liệu: nguyên thủy và đã chuyển dạng
(logarit hóa), so sánh kết quả của chúng với nhau.

Lời khuyên của BS Nhi:
Nếu bạn có bất thường về số liệu, bạn NÊN báo cáo điều đó cụ thể trong phần kết
quả, nhất là cách bạn xử lý những điểm giá trị cá biệt, lựa chọn test thống kê. Nếu
phân phối lệch trái hay phải, ngoài giá trị trung bình và SD bạn nên cung cấp thêm giá
trị của Skewness và Kurtosis (trong bảng kết quả Explore).

Hành động này sẽ đánh vào tâm lý của các nhà phê bình và giám khảo, loại bỏ nghi
ngờ về việc gian lận và ngụy tạo số liệu, nhất là khi kết quả của bạn quá hoàn hảo.
Người đọc sẽ nghĩ: Tác giả là một người thành thật và nắm vững phương pháp thống
kê.

P<0,00001 à ?
Kết quả này quá đẹp nên

không thể tin được.

Phải triệu hồi
chuyên viên thống
kê ra làm chứng

Nghiên cứu sinh


3

3.1 Thực hiện F test

1

2

3

4
5
Kéo biến số cần khảo sát
(Mức độ đau) vào ô
Dependent list, biến số
phân nhóm vào ô « Factor »

Nếu bạn chỉ cần làm
ANOVA tổng quát, không
cần phân tích sâu, bạn nhấn
nút « Option »


6


3.1 Thực hiện F test

3

Bảng thống kê mô tả
Kiểm tra giả định phương sai đồng nhất (test Levene)
ANOVA trong trường hợp phương sai
không đồng nhất (levene test có p<0,05)
Vẽ biểu đồ biến thiên giá trị trung
bình giữa các phân nhóm

Trong hộp Option, bạn có thể lựa chọn một số phân tích
phụ kèm theo, quan trọng nhất trong số này là: kiểm
định Levene (Homogeneity of variance test), phân tích
Brown-Forsythe và Welch. Nếu bạn đã thực hiện test
Levene trong bước 1, và có giá trị p<0,05, bạn bắt buộc
phải dùng PP Brown-Forsythe và Welch. Means plot có
thể hữu ích để phát hiện khuynh hướng tương phản

7

8

Nhấn OK ngay để chạy phân tích ANOVA cơ bản, hoặc tiếp tục đi vào phân
tích sâu (Xem chương 3A, 3B)



3

3.2 Diễn giải kết quả phân tích ANOVA tổng quát

Bảng đầu tiên: Descriptives trình bày kết quả thống kê mô tả, cho ta biết số case ở mỗi phân
nhóm, giá trị trung bình , độ lệch chuẩn , tối đa , tối thiểu và khoảng tin cậy 95% của biến số định
lượng (mức độ đau ) ở từng phân nhóm.

Nếu ta đã thực hiện test Levene ở bước 1, ta có thể bỏ qua bảng Test of Homogeneity of
Variances, nếu chưa, đây là cơ hội cuối để bạn kiểm tra lại giả định về phương sai đồng nhất. Ta
trông đợi giá trị p>0,05 của test levene, cho phép ta thực hiện ANOVA theo qui trình chuẩn, trong
trường hợp ngược lại, ta phải chuyển sang dùng PP của Welch và Brown-Forsythe.và test post hoc
của Games Howell.
Test of Homogeneity of Variances
Mức độ đau
Levene Statistic

df1

df2

Sig.

,200

3

52


,896

Trong trường hợp này, p=,896 cho thấy phương sai đồng nhất đã được thỏa mãn, ta có thể yên
tâm đi tiếp.
ANOVA
Mức độ đau
Sum of Squares

df

Mean Square

F

Sig.

Between Groups

82,714

3

27,571

21,308

,000

Within Groups


67,286

52

1,294

Total

150,000

55

Bảng tiếp theo là ANOVA, trong bảng này, dĩ nhiên trước hết ta sẽ nhìn vào giá trị p<0,05 cho thấy
có sự khác biệt ý nghĩa giữa các nhóm (một cách khái quát). Sau đó ta sẽ lần lượt quan tâm đến:
Giá trị F ratio cùng với độ tự do (dF) ở 2 loại: khác biệt giữa các nhóm (between groups, do thí
nghiệm gây ra) và trong cùng nhóm (within group, do hiệu ứng ngẫu nhiên).
Ghi chú: Đây là bảng ANOVA trong trường hợp tổng quát (không phân tích định hướng), bảng
ANOVA trong phân tích định hướng sẽ được trình bày trong chương 3B.
Ta cũng sẽ quay lại bảng ANOVA vào bước cuối cùng (Chương 4) để tính hệ số ảnh hưởng (còn gọi
2
2
2
là ω , η hoặc r ) để biết mức độ ảnh hưởng của can thiệp lên sự khác biệt giữa các nhóm.


3

3.3 Diễn giải kết quả phân tích ANOVA
cho trường hợp phương sai không đồng nhất


Nếu test levene ở trên cho ra giá trị p<0,05, bạn không thể sử dụng bảng ANOVA, mà phải chuyển sang
dùng kết quả của bảng Robust Tests of Equality of Means

Bảng này trình bày kết quả thống kê theo PP Welch và Brown-Forsythe, bạn cũng sẽ đọc giá trị p, giá trị F
(statistic) kèm theo độ tự do (df1,df2). Ở đây kết quả cũng cho thấy có sự khác biệt ý nghĩa giữa các phân
nhóm.
Robust Tests of Equality of Means
Mức độ đau
Statistica

df1

df2

Sig.

Welch

22,433

3

28,842

,000

Brown-Forsythe

21,308


3

51,231

,000

a. Asymptotically F distributed.

Bước tiếp theo sẽ tùy thuộc vào ý định nghiên cứu của bạn. Nếu bạn chưa có bất cứ giả thuyết nào cụ
thể, và chỉ muốn thăm dò toàn bộ các khả năng có thể xảy ra , bạn sẽ sử dụng test post-hoc để so sánh
bắt cặp hàng loạt giữa các phân nhóm.

Có giả thuyết rõ ràng

Phân tích khuynh hướng
Phân tích tương phản

Phân tích sâu

Chưa có giả thuyết rõ ràng

Post hoc test

3B
3A


3

A.1 Lựa chọn test post-hoc


7

8

9

Có quá nhiều loại test post hoc,
em phải chọn loại nào ?

Thật ra không thể kết luận bất cứ loại test nào là vượt trội so với những loại khác, ta cũng
không thể sử dụng một loại test duy nhất trong tất cả mọi trường hợp. Việc lựa chọn loại
test post-hoc tối ưu sẽ tùy thuộc vào từng hoàn cảnh. Tiêu chuẩn lựa chọn chủ yếu dựa
vào :
+ Độ chính xác : Test thống kê tốt phải có khả năng kiểm soát tối đa nguy cơ sai lầm Type I
(dương tính giả, do ngẫu nhiên…). Tuy nhiên sự chặt chẽ thường tỉ lệ nghịch với độ nhạy
của test và làm giảm sức mạnh thống kê.
+ Sức mạnh thống kê: Khả năng phát hiện ý nghĩa thống kê cao.
+ Phù hợp với điều kiện số liệu: có một số loại test không cần thỏa mãn các giả định (cỡ
mẫu bằng nhau, phương sai không đồng nhất), trong một vài hoàn cảnh số liệu không
22
hoàn hảo, ta bắt buộc phải chọn sử dụng những test này.


3

A.1 Lựa chọn test post-hoc
Trong hình, Nhi đã đánh dấu một số
loại test post-hoc thông dụng nhất.
Việc lựa chọn tùy vào các bạn, tùy

theo hoàn cảnh. Ví dụ nếu lo sợ bị
bắt bẻ về sai lầm type I, bạn nên
chọn loại test chặt chẽ và mạnh,
nếu bạn muốn tìm thấy giá trị
p<0,05 bằng mọi giá, bạn có thể sử
dụng test ít bảo thủ hơn.. vv

Kiểm định LSD (Least Significant Difference) của Fisher: đây là loại test yếu nhất, nó tương đương với
việc thực hiện một loạt kiểm định t, nó cũng không kiểm soát sai lầm loại I. Tuy nhiên nó giúp bạn dễ
dàng tìm ra khác biệt có ý nghĩa.
SNK (Studentized Newman Keuls) PP này cũng không kiểm soát sai lầm loại I
Bonferroni và Tukey : Đây là 2 loại test phổ biến nhất. Bonferroni có áp dụng hiệu chỉnh (ngưỡng ý nghĩa
thống kê dựa vào số nhóm so sánh) để kiểm soát tối đa sai lầm type I. Tuy nhiên cũng vì thế, loại test này
được xem là quá mức « bảo thủ » khi làm tăng nguy cơ sai lầm loại II và giảm đáng kể sức mạnh thống
kê.
Nếu ít nhóm cần so sánh (3-4 nhóm), Bonferroni là tối ưu vì nó mạnh hơn Tukey
Nếu có nhiều nhóm (>4), Tukey trở nên mạnh hơn. Tukey cũng mạnh hơn Duncan, Sidak và Scheffe
REGWQ (Ryan Einot Gabriel Welsch) Q: Đây là phương pháp tối ưu vì vừa kiểm soát chặt chẽ sai lầm
type I, vừa đảm bảo sức mạnh thống kê. Tuy nhiên nó không thể sử dụng trong trường hợp cỡ mẫu trong
mỗi nhóm khác biệt với nhau.
Trong trường hợp giả định phương sai đồng nhất bị vi phạm (Test Levene p<0,05); ta có thể sử dụng 1
trong 4 phương pháp: Dunnet’s C, Tamhane T2, Dunnet T3, Games-Howell.
Dunnet’s C, Tamhane T2,T3 là những PP bảo thủ, chúng kiểm soát tốt sai lầm loại I nhưng sức mạnh
thống kê kém.
Games-Howell là phương pháp tối ưu nhất, dĩ nhiên bạn vẫn phải chấp nhận nguy cơ sai lầm type I.
Tóm lại: Trong trường hợp phương sai đồng nhất, cùng cỡ mẫu ở các phân nhóm, bạn nên thử cùng lúc 3
Phương pháp: REGWQ, Tukey và Bonferroni, trong đó Tukey là chính, Bonferroni để tham chiếu. Tùy
theo kết quả, bạn sẽ chọn giá trị p thấp nhất để báo cáo.
Trong trường hợp phương sai không đồng nhất, bạn nên dùng phương pháp Games-Howell.
Nếu so sánh nhiều nhóm có cỡ mẫu khác nhau, bạn nên sử dụng PP Hochberg GT2 và Gabriel. Khi có

khác biệt quá lớn về cỡ mẫu giữa các nhóm, bạn nên dùng Hochberg. Nếu khác biệt không đáng kể, PP
Gabriel mạnh hơn.


3

A.2 Diễn giải kết quả test post-hoc : Tukey

Ở trên, Nhi đã giải thích về việc chọn lựa loại test post-hoc nào phù hợp nhất trong từng hoàn cảnh khác nhau
(về số lượng phân nhóm, số case ở mỗi nhóm, mức độ kiểm soát sai lầm type I và độ mạnh thống kê mong
muốn). Sau đây ta sẽ lần lượt diễn giải kết quả của một số test post hoc tối ưu nhất:
Đầu tiên là test post-hoc Tukey: Kết quả của test Tukey trình bày trong bảng so sánh hàng loạt (Multiple
Comparisons) và bảng phân lớp giá trị (Mức độ đau). Nội dung của bảng Multiple Comparisons là so sánh bắt
cặp tuần tự, cho tất cả các cặp phân nhóm, (I) là nhóm chứng, J là nhóm cần so sánh. Tại mỗi hàng, ta cần quan
tâm đến giá trị p (sig). Nếu p<0,05 thì khác biệt giữa I và J có ý nghĩa thống kê.
3 cột Mean difference , Standard error và CI95% cho biết giá trị trung bình , SE và khoảng tin cậy của khác biệt
(I)-(J).
Ví dụ: Không có sự khác biệt ý nghĩa về mức độ đau giữa 2 nhóm dùng Pregabalin liều cao và liều thấp (75mg
sv 150 mg) (p=0,148)
Có sự khác biệt ý nghĩa về mức độ đau giữa nhóm Placebo và nhóm điều trị bằng Tramadol (p<0,001).
Multiple Comparisons
Dependent Variable: Mức độ đau
Tukey HSD
Mean Difference
(I) Nhóm điều trị
Placebo

Tramadol 150mg

(J) Nhóm điều trị


(I-J)

Std. Error

Sig.

Lower Bound

Upper Bound

Tramadol 150mg

2,35714*

,42994

,000

1,2160

3,4983

Pregabalin 75mg

2,35714*

,42994

,000


1,2160

3,4983

Pregabalin 150 mg

3,28571*

,42994

,000

2,1446

4,4268

Placebo

-2,35714*

,42994

,000

-3,4983

-1,2160

,00000


,42994

1,000

-1,1411

1,1411

Pregabalin 75mg
Pregabalin 150 mg
Pregabalin 75mg

Pregabalin 150 mg

95% Confidence Interval

,92857

,42994

,148

-,2125

2,0697

-2,35714*

,42994


,000

-3,4983

-1,2160

Tramadol 150mg

,00000

,42994

1,000

-1,1411

1,1411

Pregabalin 150 mg

,92857

,42994

,148

-,2125

2,0697


-3,28571*

,42994

,000

-4,4268

-2,1446

Tramadol 150mg

-,92857

,42994

,148

-2,0697

,2125

Pregabalin 75mg

-,92857

,42994

,148


-2,0697

,2125

Placebo

Placebo

*. The mean difference is significant at the 0.05 level.

Mức độ đau
Tukey HSDa
Subset for alpha = 0.05
Nhóm điều trị

N

1

Pregabalin 150 mg

14

2,2143

Tramadol 150mg

14


3,1429

Pregabalin 75mg

14

3,1429

Placebo

14

Sig.

2

Trong bảng phân lớp giá trị mức độ đau,
kết quả cho thấy nhóm Placebo thuộc lớp
giá trị cao, tương phản với lớp giá trị thấp
là 3 nhóm có dùng thuốc; có thể kết luận
là sử dụng bất cứ loại thuốc giảm đau nào
cũng làm giảm mức độ đau trong cùng
phân lớp giá trị thấp) so với nhóm
Placebo.

5,5000
,148

1,000


Means for groups in homogeneous subsets are displayed.
a. Uses Harmonic Mean Sample Size = 14,000.

Giá trị p=0,148 cho thấy không có khác
biệt ý nghĩa giữa 3 giá trị trung bình trong
cùng 1 phân lớp (ví dụ phân lớp 1= giá trị
đều thấp)


3

A.3 Diễn giải kết quả test post-hoc Bonferroni

Mean

95% Confidence Interval

Difference (I(I) Nhóm điều trị
Placebo

(J) Nhóm điều trị

J)

Std. Error

Sig.

Lower Bound


Upper Bound

Tramadol 150mg

2,35714*

,42994

,000

1,2160

3,4983

Pregabalin 75mg

2,35714*

,42994

,000

1,2160

3,4983

Pregabalin 150 mg

3,28571*


,42994

,000

2,1446

4,4268

Chú ý: ngưỡng trên và dưới của CI95% có cùng dấu hay không ?
Nếu cùng dấu thì ta có thể yên tâm về sự khác biệt chắc chắn giữa 2 phân nhóm
Nếu không cùng dấu; đồng nghĩa với việc CI có thể chứa giá trị 0, như vậy trong quần
thể chung sẽ có nguy cơ không có sự khác biệt giữa 2 phân nhóm. Dĩ nhiên trong
trường hợp này, p sẽ > 0.05, hoặc nếu p< 0.05 đi nữa cũng không có ý nghĩa phổ quát.
Multiple Comparisons
Dependent Variable: Mức độ đau
Bonferroni
Mean

95% Confidence Interval

(I) Nhóm điều trị

(J) Nhóm điều trị

Difference (I-J)

Std. Error

Sig.


Lower Bound

Upper Bound

Placebo

Tramadol 150mg

2,35714*

,42994

,000

1,1778

3,5365

Pregabalin 75mg

2,35714*

,42994

,000

1,1778

3,5365


Pregabalin 150 mg

3,28571*

,42994

,000

2,1064

4,4650

Placebo

-2,35714*

,42994

,000

-3,5365

-1,1778

Pregabalin 75mg

,00000

,42994


1,000

-1,1793

1,1793

Pregabalin 150 mg

,92857

,42994

,213

-,2507

2,1079

-2,35714*

,42994

,000

-3,5365

-1,1778

Tramadol 150mg


,00000

,42994

1,000

-1,1793

1,1793

Pregabalin 150 mg

,92857

,42994

,213

-,2507

2,1079

-3,28571*

,42994

,000

-4,4650


-2,1064

Tramadol 150mg

-,92857

,42994

,213

-2,1079

,2507

Pregabalin 75mg

-,92857

,42994

,213

-2,1079

,2507

Tramadol 150mg

Pregabalin 75mg


Pregabalin 150 mg

Placebo

Placebo

Kết
quả của test post hoc có hiệu chỉnh (Bonferroni) trình bày trong bảng so sánh hàng loạt (Multiple
*. The mean difference is significant at the 0.05 level.
Comparisons). Bảng này cũng có cấu trúc như test Tukey, nhằm so sánh bắt cặp tất cả các trường hợp.
Ta quan tâm đến cột giá trị p (ý nghĩa thống kê)
Kết quả cho thấy cùng một khuynh hướng so với test Tukey.
Ví dụ: Không có sự khác biệt ý nghĩa về mức độ đau giữa 2 nhóm dùng Pregabalin liều cao và liều thấp (75mg
sv 150 mg) (p=0,213)
Có sự khác biệt ý nghĩa về mức độ đau giữa nhóm Placebo và nhóm điều trị bằng Tramadol (p<0,001).
Ghi chú: Giá trị p có thể thay đổi, Bonferroni cho ra p cao hơn Tukey, do tác động của sự hiệu chỉnh (càng
nhiều phân nhóm, qui định về ngưỡng ý nghĩa càng ngặt nghèo hơn nhằm kiểm soát chặt chẽ sai lầm type I,
nhưng đồng thời độ mạnh cũng kém đi).

25


×