A DECISION SUPPORT SYSTEM FOR PRIMARY HEADACHE DEVELOPED THROUGH MACHINE LEARNING

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (297.14 KB, 32 trang )

UNIVERSITY OF INFORMATION TECHNOLOGY
INFORMATION SYSTEM
-----🙞🙜🕮🙞🙜-----

A DECISION SUPPORT SYSTEM FOR PRIMARY
HEADACHE DEVELOPED THROUGH MACHINE
LEARNING
Lớp: IS254.N11
GVHD:
Nguyễn Hồ Duy Trí
Thành viên:
Trương Cơng Hưng

19521588

Trần Minh Quân

18521288

Phạm Thảo Nhi

19520815

Trịnh Linh Chi

19521285

Thành phố Hồ Chí Minh – 5/2022

LỜI CẢM ƠN

Lời đầu tiên, chúng em xin cảm ơn các thầy cô trường Đại học Công nghệ
Thông tin Đại học Quốc gia Thành phố Hồ Chí Minh đã tạo điều kiện tốt nhất và
cung cấp những kiến thức cần thiết để hồn thành mơn đồ án hệ hỗ trợ quyết
định.
Chúng em cũng xin gửi lời cảm ơn sâu sắc đến ThS Nguyễn Hồ Duy Trí,
người đã hỗ trợ, hướng dẫn nhóm và tạo điều kiện tốt nhất để nhóm hoàn thành
đề tài nghiên cứu này. Với sự hỗ trợ nhiệt tình của cơ, cuối cùng nhóm chúng em
cũng đã hồn thiện những kiến thức cần thiết thơng qua việc nghiên cứu và học
hỏi những kiến thức mới. Chúng em rất vui vì đã nhận được những ý kiến đóng
góp của cơ về đề tài của nhóm, chúng em sẽ cố gắng ngày càng hồn thiện mình
hơn trong tương lai và tiếp tục học tập chăm chỉ để đạt được kết quả tốt nhất.
Cuối cùng, xin kính chúc các thầy cơ giảng ln có sức khỏe dồi dào, cuộc
sống hạnh phúc, tiếp tục hoàn thành sứ mệnh cao cả là truyền thụ tri thức cho thế
hệ mai sau.
Xin chân thành cảm ơn q thầy cơ!

Thành phố Hồ Chí Minh, tháng 5 năm 2022
Nhóm sinh viên thực hiện
Trương Cơng Hưng
Trần Minh Quân
Phạm Thảo Nhi
Trịnh Linh Chi

NHẬN XÉT CỦA GVHD

Mục lục
CHAPTER 1:

TỔNG QUAN ĐỀ TÀI

1

1.1. Giới thiệu

1

1.2. Mô tả bài toán

3

CHAPTER 2:

PHƯƠNG PHÁP NGHIÊN CỨU

5

2.1. Thu thập dữ liệu

5

2.2. Quy trình ra quyết định, mơ tả hệ thống hỗ trợ quyết định

8

2.2.1.

Thiết lập mơ hình phân loại (Discriminant Model Establishment)

2.2.2.

Lựa chọn thuộc tính (Feature Selection)

CHAPTER 3:

KẾT QUẢ NGHIÊN CỨU

8
10
12

3.1. Đặc điểm cơ bản của bệnh nhân(Patient baseline characteristics)

12

3.2. Model building

12

3.3. Feature selection

14

CHAPTER 4:

ĐÁNH GIÁ KẾT QUẢ

18

4.1. Model building

18

4.2. Feature selection

19

CHAPTER 5:

TRIỂN KHAI MƠ HÌNH

21

5.1. Phân tích dữ liệu và các phương pháp tiền xử lý

21

5.2. Phân tích kết quả

22

5.3. Kết luận

23

CHAPTER 6:

KẾT LUẬN

24

BẢNG PHÂN CHIA CÔNG VIỆC

26

CHAPTER 7:

27

TÀI LIỆU THAM KHẢO

CHAPTER 1:
1.1.

TỔNG QUAN ĐỀ TÀI

Giới thiệu
Đau đầu là một trong những triệu chứng thường gặp ở các phòng khám chuyên

khoa thần kinh. Số liệu cho thấy mỗi năm hơn 90% dân số nói chung bị đau đầu. Ở
Trung Quốc, tỷ lệ đau đầu nguyên phát trong 1 năm được báo cáo là 23,8%. Tỷ lệ đau
nửa đầu là 9,3% và đau đầu do căng thẳng là 10,3%. Do dân số đông, bệnh nhân chi
672,7 tỷ nhân dân tệ mỗi năm vì đau đầu nguyên phát, chiếm 2,24% GDP của Trung
Quốc. Bệnh đau đầu tuy không đe dọa nghiêm trọng đến tính mạng người bệnh nhưng
lại ảnh hưởng nặng nề đến công việc và chất lượng cuộc sống, khiến họ phải rút lui
khỏi xã hội, đặt gánh nặng lên tâm, sinh lý của người bệnh và gia đình người bệnh
cũng như nền kinh tế quốc gia.
Đau đầu được chia thành đau đầu nguyên phát và đau đầu thứ phát. Có nhiều

nguyên nhân gây đau đầu. Do sự giống nhau của các triệu chứng, các bác sĩ đa khoa
rất dễ bỏ sót hoặc chẩn đoán nhầm loại đau đầu. Hơn nữa, Hiệp hội Đau đầu Quốc tế
(IHS) đã đưa ra bảng phân loại đau đầu mới nhất vào tháng 1 năm 2018, đó là Phân
loại Quốc tế về Rối loạn Đau đầu (ICHD-III) (Ủy ban Phân loại Đau đầu của Hiệp hội
Nhức đầu Quốc tế, 2018), trong đó liệt kê hơn 200 biến thể của cơn đau đầu. Sự phân
loại phức tạp này tạo ra một nhiệm vụ rất khó khăn cho các bác sĩ lâm sàng. Việc
Khơng có tiêu chuẩn vàng góp phần gây khó khăn cho việc chẩn đốn và phân loại
đau đầu. Ngoài ra, do lâu nay giới y khoa nhìn chung chưa quan tâm đúng mức đến
chứng đau đầu trong thực hành lâm sàng, trình độ thành thạo của các bác sĩ lâm sàng
về phân loại đau đầu khơng đồng đều. Ví dụ, “đau đầu mạch máu” và “đau đầu thần
kinh” vẫn được sử dụng để chẩn đoán đau đầu ngun phát.
Do đó, vẫn cịn nhiều cải tiến cần được thực hiện đối với việc tiêu chuẩn hóa và
cải thiện độ chính xác của chẩn đốn lâm sàng về đau đầu.
Theo các báo cáo, đau đầu nguyên phát xảy ra thường xuyên hơn so với đau
đầu thứ phát và tỷ lệ mắc chứng đau nửa đầu và đau đầu do căng thẳng đứng đầu
trong số các loại đau đầu nguyên phát. Chứng đau nửa đầu bao gồm chứng đau nửa
đầu có tiền triệu chứng và chứng đau nửa đầu khơng có tiền triệu chứng. Chứng đau
nửa đầu khơng có tiền triệu chứng thường là đau đầu một bên, theo nhịp đập và từ
trung bình đến nặng; hoạt động thể chất hàng ngày có thể làm trầm trọng thêm những
1

cơn đau đầu này và chúng thường đi kèm với buồn nôn/nôn và/hoặc chứng sợ ánh
sáng/sợ âm thanh. Tiền triệu chứng là sự xuất hiện dần dần của các triệu chứng thị
giác, cảm giác hoặc hệ thống thần kinh trung ương khác trước hoặc trong cơn đau đầu.
Nhức đầu do căng thẳng là loại đau đầu nguyên phát phổ biến nhất; các cơn đau đầu
kiểu này không thường xuyên và thường kéo dài vài phút đến vài ngày. Những cơn
đau đầu này thường được đặc trưng bởi cảm giác chèn ép hai bên từ nhẹ đến trung
bình; chúng khơng trầm trọng hơn do hoạt động thể chất hàng ngày và thường không
đi kèm với buồn nôn/nôn, hoặc chứng sợ ánh sáng/sợ âm thanh. Mặc dù có sự khác

biệt lớn giữa chứng đau nửa đầu điển hình và chứng đau đầu do căng thẳng, nhưng
các triệu chứng của hầu hết bệnh nhân khơng điển hình, đặc biệt là trong trường hợp
đau đầu do căng thẳng và chứng đau nửa đầu không có tiền triệu chứng. Vì vậy,
thường rất khó để phân loại giữa chúng. Do có nhiều sự khác biệt trong việc điều trị
hai chứng rối loạn, việc chẩn đoán sai và bỏ sót chẩn đốn chắc chắn sẽ làm chậm q
trình điều trị thích hợp cho bệnh nhân (Porter et al., 2019).
Phần mềm máy tính chất lượng cao có thể rất hữu ích để nhận biết chính xác
cơn đau đầu. Ngay từ năm 2013, Krawczyk et al. (2013) đã đề xuất chẩn đốn tự động
chứng đau đầu ngun phát thơng qua học máy.
So sánh hiệu suất chẩn đốn giữa cơng nghệ máy học tiên tiến và bác sĩ lâm
sàng cho thấy hệ thống hỗ trợ quyết định bằng máy tính đạt được độ chính xác chẩn
đốn cao hơn. Gần đây hơn, Vandewiele et al. (2018) đã đề xuất một hệ thống hỗ trợ
quyết định từ đầu đến cuối để cải thiện hiệu quả chẩn đoán và theo dõi trong điều trị
đau đầu nguyên phát. Hệ thống hỗ trợ quyết định bao gồm ba thành phần lớn và một
chương trình phụ trợ được chia sẻ: ứng dụng di động dành cho bệnh nhân, ứng dụng
web dành cho bác sĩ để trực quan hóa dữ liệu đã thu thập và mơ-đun chẩn đốn tự
động. Trong mơ-đun chẩn đốn tự động, cây quyết định được sử dụng để lập mơ hình
(Vandewiele et al., 2018). Xiangyong (2019) đã đề xuất một hệ thống ra quyết định
đau đầu chính dựa trên các tiêu chuẩn chẩn đoán đau đầu quốc tế và tiến hành đánh
giá lâm sàng trong 4 tháng tại Trung tâm Đau đầu Quốc tế của một bệnh viện đại học
ở Bắc Kinh. Kết quả tốt về độ nhạy và độ đặc hiệu của hệ thống này để chẩn đoán
chứng đau đầu đã được ghi nhận (Xiangyong, 2019). Xem xét các quy tắc ngôn ngữ
khơng hồn chỉnh khi các chun gia chia sẻ kiến thức của họ, Khayamnia et al.
2

(2019) đã cải tiến thuật toán và sử dụng thuật toán Learning-From-Examples (LEF) để
huấn luyện hệ mờ chẩn đoán và tỷ lệ nhận dạng đúng đạt 85%. Họ tiếp tục đề xuất các
hệ thống hỗ trợ quyết định dựa trên SVM - và perceptron đa lớp (MLP), đạt tỷ lệ
chính xác lần lượt là 90% và 88% (Khayamnia et al., 2019). Simi'c et al. (2021) tạo ra

một hệ thống thông minh kết hợp để chẩn đoán chứng rối loạn đau đầu nguyên phát,
áp dụng các kỹ thuật toán học, thống kê và trí tuệ nhân tạo khác nhau.
Mặc dù các loại hình nghiên cứu khác nhau đã được dành cho các hệ thống hỗ
trợ ra quyết định bằng máy tính, nhưng vẫn còn những trở ngại lớn đối với việc sử
dụng rộng rãi chúng trong thực hành lâm sàng. Học máy áp dụng cho hồ sơ y tế có thể
là một cơng cụ hiệu quả để dự đốn bệnh tật. Ở Trung Quốc, các phương pháp học
máy để chẩn đoán chứng đau đầu ngun phát vẫn cịn nhiều thiếu sót.
Vì vậy, để đạt được độ chính xác chẩn đốn đau đầu cao hơn, nhóm tác giả đã
thu thập thơng tin từ các bệnh nhân đau đầu nguyên phát tại các phịng khám thần
kinh thơng qua bảng câu hỏi và sau đó nhập dữ liệu vào hệ thống. Nhóm tác giả đã so
sánh các thuật toán học máy khác nhau để xác định mơ hình tốt nhất. Hơn nữa, thơng
qua lựa chọn đặc điểm, nhóm tác giả đã xác định được các yếu tố quan trọng nhất để
phân loại chứng đau nửa đầu với chứng đau đầu do căng thẳng, tạo cơ sở cho các bác
sĩ lâm sàng chẩn đoán nhanh chứng đau đầu.

1.2.

Mơ tả bài tốn
Chẩn đốn chính xác loại đau đầu là một thử thách lớn và thường không chính

xác, các phương pháp chẩn đốn đau đầu vẫn là trọng tâm của các nghiên cứu chuyên
sâu. Do đó, các tác giả giới thiệu vấn đề về chẩn đoán đau đầu nguyên phát và trình
bày cách phân loại hiện tại của nó. Vấn đề được xem xét được triển khai thành một hệ
thống sử dụng máy học để hỗ trợ ra quyết định lâm sàng cho chứng đau đầu nguyên
phát. Các thí nghiệm, được thực hiện trên tập dữ liệu do các tác giả thu thập, đã xác
nhận rằng các hệ thống hỗ trợ quyết định bằng máy tính có thể đạt được độ chính xác
nhận dạng cao và do đó là một cơng cụ hữu ích trong thực hành hàng ngày của bác sĩ.
Đây là điểm khởi đầu cho nghiên cứu trong tương lai về tự động hóa chẩn đoán đau
đầu nguyên phát.

3

⮚ Dữ liệu nhân khẩu học và đặc điểm đau đầu của 173 bệnh nhân được thu
thập bằng bảng câu hỏi.
⮚ Decision Tree, Random Forest, Logistic Regression, SVM và Gradient
Boosting được sử dụng để xây dựng mơ hình phân loại
⮚ Ma trận nhầm lẫn (confusion matrix) được sử dụng để tính tốn các chỉ
số đánh giá của mơ hình.
⮚ Thực hiện lựa chọn tính năng thơng qua phân tích thống kê đơn biến và
học máy

4

CHAPTER 2:

PHƯƠNG PHÁP NGHIÊN CỨU

Đây là một nghiên cứu cắt ngang được thiết kế để có được một mơ hình phân
loại chẩn đoán cho chứng đau nửa đầu và đau đầu kiểu căng thẳng và để sàng lọc các
yếu tố quan trọng nhất để phân loại hai loại này.
Nghiên cứu đã được phê duyệt bởi Ủy ban Đạo đức của Bệnh viện Nhân dân số
9 trực thuộc Đại học Y khoa Giao thông Thượng Hải (phê duyệt số SH9H-2021-T721) và đáp ứng các yêu cầu của Tuyên bố Helsinki.
Những bệnh nhân đủ điều kiện là những bệnh nhân được chẩn đoán mắc chứng
đau đầu trong khoảng thời gian từ tháng 10 năm 2019 đến tháng 9 năm 2020 tại Khoa
Thần kinh, Bệnh viện Nhân dân số 9 Thượng Hải. Tất cả các bệnh nhân đều là cư dân
của Trung Quốc. Trước khi nghiên cứu, nhóm tác giả đã nhận được sự đồng ý có chữ
ký của các bệnh nhân tham gia. Hai tuần sau khi bảng câu hỏi của bệnh nhân được thu
thập, các tác giả đã theo dõi sự cải thiện tình trạng đau đầu của bệnh nhân để xác minh

thêm chẩn đốn.
Cuối cùng, nhóm tác giả đưa 173 bệnh nhân được chẩn đoán xác định là đau
đầu nguyên phát (84 bệnh nhân đau nửa đầu và 89 bệnh nhân đau đầu kiểu căng
thẳng) để nghiên cứu.

2.1.

Thu thập dữ liệu
Đầu tiên, nhóm tác giả thiết kế một bảng câu hỏi để bệnh nhân ngoại trú hoàn

thành. Bảng câu hỏi bao gồm tổng cộng 19 câu hỏi để thu thập dữ liệu nhân khẩu học
(tuổi, giới tính, nghề nghiệp, chiều cao và cân nặng) của bệnh nhân và đặc điểm đau
đầu của họ (tiến trình, thời gian, tính chất, vị trí, cường độ nghiêm trọng, triệu chứng
kèm theo, yếu tố khởi phát, cách giảm nhẹ, và liệu hoạt động có làm nặng thêm cơn
đau đầu hay không). Sau khi phân tích và sửa đổi bảng câu hỏi bởi ba nhà thần kinh
học có kinh nghiệm, bảng câu hỏi được coi là hiệu quả để thu thập thông tin liên quan
đến bệnh nhân và dữ liệu thu được là đáng tin cậy ở một mức độ nhất định.
Hơn nữa, thông tin về các kiểm tra liên quan và MRI được sử dụng để loại trừ
các yếu tố phụ của bệnh nhân. Ba nhà thần kinh học đã được mời để chẩn đốn cho
từng bệnh nhân dựa trên thơng tin bảng câu hỏi mà nhóm tác giả thu thập được. Dựa
trên cả kết quả chẩn đoán và theo dõi, từng bệnh nhân được chẩn đốn chính xác. Do
5

tỷ lệ thấp của đau đầu nguyên phát như đau dây thần kinh và đau đầu cụm thấp trong
số các quan sát được thu thập, nhóm tác giả đã loại trừ những loại đau đầu hiếm gặp
này để giảm các vấn đề do mất cân bằng mẫu.
Cuối cùng, 173 bệnh nhân (84 bệnh nhân bị chứng đau nửa đầu và 89 bệnh
nhân bị đau đầu do căng thẳng) đã được đưa vào nghiên cứu (Hình 1). Mỗi cơn đau
đầu của bệnh nhân có thể có nhiều tính chất hoặc kèm theo nhiều triệu chứng. Do đó,

nhóm tác giả đã thực hiện phân loại nhị phân dữ liệu đã thu thập và thu được tổng
cộng 48 biến. Xem xét rằng tỷ lệ xảy ra của nhiều biến là cực kỳ thấp, trước tiên nhóm
tác giả đã xác định được 10 biến có sự khác biệt đáng kể về mặt thống kê giữa chứng
đau nửa đầu và đau đầu do căng thẳng. Sau khi chuyển đổi dữ liệu và giảm dữ liệu,
bảng dữ liệu được sử dụng để thu thập dữ liệu trong quá trình phỏng vấn lâm sàng
được trình bày trong Bảng 1.

Hình 1: Lưu đồ nghiên cứu

Thuộc tính

Migraine

Tension-type

(n = 84)

headache (n = 89)

Total

P-value

Giới tính/n(%)

–

–

–

–

Nữ

20(23.8)

39(43.8)

59(34.1)

P = 0.01

Nam

64(76.2)

50(56.2)

114(65.9)

Thời gian mắc bệnh/n(%)
6

Năm

11(13.1%)

38(42.7%)

49(28.3)

P < 0.001

Tháng

73(86.9%)

51(57.3%)

114(65.9)

Yes

17(20.2)

6(6.7)

23(13.3)

P = 0.01

No

67(79.8)

83(93.3)

150(86.7)

Yes

22(26.2)

43(48.3)

65(37.6)

P = 0.00

No

62(73.8)

46(51.7)

108(62.4)

Nhẹ

13(15.5)

30(33.7)

43(24.9)

Trung bình

44(52.4)

51(57.3)

95(54.9)

P < 0.001

Nặng

27(32.1)

8(9.0)

35(20.2)

Yes

44(52.4)

16(18.0)

60(34.7)

P < 0.001

No

40(47.6)

73(82.0)

113(65.3)

Nhói/n(%)

Đau chẩm/n(%)

Mức độ nghiêm trọng/n(%)

Buồn nơn/ Ĩi mửa/ n(%)

Chứng sợ ánh sáng/ Chứng sợ âm thanh/ n(%)
Yes

27(32.1)

4(4.5)

31(17.9)

P < 0.001

No

57(67.9)

85(95.5)

142(82.1)

Yes

11(13.1)

3(3.4)

14(8.1)

P = 0.02

No

73(86.9)

86(96.6)

159(91.9)

Nhìn thấy tia sáng/ n(%)

7

Thay đổi sau khi hoạt động/ n(%)
Trầm trọng hơn

41(48.8)

18(20.2)

59(34.1)

Không thay đổi

38(45.2)

62(69.7)

100(57.8)

P < 0.001

Giảm bớt

5(6.0)

9(10.1)

14(8.1)

Tiếp tục

9(10.7)

14(15.7)

23(13.3)

Ngừng

25(29.8)

45(50.6)

70(40.5)

P = 0.00

Sử dụng thuốc

48(57.1)

25(28.1)

73(42.2)

Khác

2(2.4)

5(5.6)

7(4.0)

Phương pháp giảm nhẹ/ n(%)

Bảng 1: Đặc điểm cơ bản của bệnh nhân.

2.2.

Quy trình ra quyết định, mô tả hệ thống hỗ trợ quyết định

2.2.1.

Thiết lập mơ hình phân loại (Discriminant Model

Establishment)
Sử dụng 10 thuộc tính đã được sàng lọc thông qua kiểm định Chi-square (bao
gồm: Sex, Course, Throbbing, Occiput, Severe intensity, Nausea/vomiting, Spark,
Change after activities, Photophobia/phonophobia, Alleviative methods), nhóm tác
giả chia ngẫu nhiên tồn bộ tập dữ liệu thành tập huấn luyện (training set) và tập
thử nghiệm (test set) theo các tỷ lệ (60:40, 70:30, 80:20) và sử dụng các phương
pháp như holdout (dữ liệu được phân chia ngẫu nhiên thành 2 phần là tập huấn
luyện và tập thử nghiệm) và xác thực chéo (cross-validation) để xây dựng các mơ
hình phân loại đau đầu thứ nguyên.

8

Các mơ hình học máy
Nhóm tác giả đã sử dụng các mơ hình học máy như: Decision Tree, Random
Forest, Logistic Regression, SVM và Gradient Boosting để xây dựng các mô hình
phân loại đau nửa đầu hay đau đầu kiểu căng thẳng.
Decision tree
Decision Tree (Cây quyết định) là một trong những thuật tốn học máy có giám
sát. Mục tiêu là tạo ra một mơ hình dự đốn giá trị của một biến mục tiêu bằng cách
tìm hiểu các quy tắc quyết định đơn giản được suy ra từ các biến thuộc tính đầu
vào. Cây quyết định là một cấu trúc cây mà trong đó mỗi nút bên trong đại diện cho
một phép thử trên một thuộc tính, mỗi nhánh đại diện cho kết quả của phép thử và
mỗi nút lá biểu thị một nhãn lớp, các đường đi từ gốc đến lá đại diện cho các quy
tắc phân loại.
Random forest

Random Forest (Rừng ngẫu nhiên) là một thuật tốn tích hợp (integrated
algorithm), nằm trong họ thuật toán cây quyết định (Decision Tree). Random Forest
là một bộ phân loại chứa nhiều cây quyết định trên các tập con khác nhau của tập
dữ liệu đã cho và lấy giá trị trung bình để cải thiện độ chính xác dự đốn của tập dữ
liệu đó. Thay vì dựa vào một cây quyết định, Random Forest lấy dự đoán từ mỗi
cây và dựa trên đa số phiếu dự đoán để dự đoán kết quả cuối cùng.
SVM
Support Vector Machine (SVM) là một thuật tốn thuộc nhóm học có giám sát
dùng để phân chia dữ liệu thành các nhóm riêng biệt (bài tốn phân lớp). Mục tiêu
của SVM là tìm ra một siêu phẳng trong khơng gian N chiều (ứng với N đặc trưng)
chia dữ liệu thành hai phần tương ứng với lớp của chúng. Để phân chia hai lớp dữ
liệu, rõ ràng là có rất nhiều siêu phẳng có thể làm được điều này. Mặc dù vậy, mục
tiêu của chúng ta là tìm ra siêu phẳng có lề rộng nhất tức là có khoảng cách tới các
điểm của hai lớp là lớn nhất.
Gradient boosting
Gradient Boosting là một loại kỹ thuật tăng cường học máy. Nó xây dựng một
mơ hình tốt hơn bằng cách hợp nhất các mơ hình trước đó cho đến khi mơ hình tốt
nhất giảm tổng lỗi dự đốn. Cịn được gọi là mơ hình dự báo thống kê, ý tưởng
9

chính của việc tăng cường độ dốc là đạt được một mơ hình loại bỏ các lỗi của các
mơ hình trước đó.
Logistic regression
Logistic Regression là một thuật tốn đơn giản nhưng lại rất hiệu quả trong các
bài toán phân loại (Classification), được sử dụng để dự đoán giá trị dữ liệu dựa trên
các quan sát trước đó của tập dữ liệu. Mục tiêu của Logistic Regression là ước tính
xác suất của các sự kiện bằng cách phân tích mối quan hệ giữa tất cả các biến độc
lập hiện có từ đó đự đốn xác suất của một biến dữ liệu phụ thuộc.
Để đánh giá hiệu suất của các mơ hình nêu trên, nhóm tác giả đã kết hợp độ

chính xác (accuracy) và F1-score làm chỉ số đánh giá mơ hình thơng qua ma trận
nhầm lẫn (confusion matrix), sau đó đo lường kết quả dự đốn được thơng qua độ
đo AUC-ROC, trong đó:
ROC là đường cong biểu diễn khả năng phân loại của một mơ hình phân loại tại
các ngưỡng threshold. Đường cong này dựa trên hai chỉ số :
● TPR (true positive rate): Hay còn gọi là recall hoặc sensitivity. Là tỷ lệ
các trường hợp phân loại đúng positive trên tổng số các trường hợp thực
tế là positive. Chỉ số này sẽ đánh giá mức độ dự báo chính xác của mơ
hình trên positive.
● FPR (false positive rate): Tỷ lệ dự báo sai các trường hợp thực tế là
negative thành positive trên tổng số các trường hợp thực tế là negative.
AUC là chỉ số được tính tốn dựa trên đường cong ROC (receiving operating
curve) nhằm đánh giá khả năng phân loại của mơ hình tốt như thế nào? Phần diện
tích gạch chéo nằm dưới đường cong ROC và trên trục hồnh là AUC (area under
curve) có giá trị nằm trong khoảng [0, 1]. Khi diện tích này càng lớn thì đường
cong ROC có xu hướng tiệm cận đường thẳng y=1 và khả năng phân loại của mơ
hình càng tốt.

2.2.2.

Lựa chọn thuộc tính (Feature Selection)

Mười thuộc tính đã nêu ở trên là dư thừa để các bác sĩ lâm sàng có thể nhanh
chóng phân loại được chứng đau nửa đầu hay đau đầu kiểu căng thẳng. Do đó,

10

nhóm tác giả đã xác định hai thuộc tính có ý nghĩa nhất để chẩn đoán chứng đau
nửa đầu và đau đầu kiểu căng thẳng thơng qua xếp hạng tính năng.

Đầu tiên, nhóm tác giả sẽ áp dụng phân tích sinh trắc học đơn biến truyền
thống và sau đó thực hiện phân tích học máy. Đối với thử nghiệm đơn biến, sử
dụng hệ số tương quan Pearson (Pearson correlation coefficient - PCC) và kiểm
định Chi-square để so sánh từng thuộc tính giữa hai nhóm.
PCC đại diện cho mối tương quan tuyến tính giữa các thuộc tính. Nếu các
thuộc tính tương quan tuyến tính, giá trị tuyệt đối của PCC sẽ tạo ra giá trị cao gần
bằng 1; ngược lại, nó sẽ gần bằng 0.
Kiểm định Chi-square được áp dụng cho hai thuộc tính để quan sát xác suất
phân phối xảy ra một cách ngẫu nhiên. Mỗi thuộc tính được thử nghiệm sẽ tạo ra
một giá trị p. Mặc dù giá trị P không đại diện cho độ mạnh của mối quan hệ giữa
hai biến, nhưng nó cung cấp một dấu hiệu: giá trị p càng thấp thì càng chắc chắn
rằng hai biến có liên quan với nhau.
Hơn nữa, nhóm tác giả đã xếp hạng tầm quan trọng của thuộc tính bằng
phương pháp Random Forest. Mơ hình Random Forest là một mơ hình kết hợp cây
quyết định phi tuyến, nó rất dễ thực hiện và có hiệu quả vượt trội. Nó từng được gọi
là “phương pháp đại diện cho trình độ của cơng nghệ học tập tích hợp”. Ý tưởng
chính của Random Forest là đánh giá mức độ đóng góp của từng thuộc tính đối với
mỗi cây trong Random Forest và sau đó lấy giá trị trung bình và đánh giá đóng góp
của từng thuộc tính riêng biệt. So với PCC, Random Forest có nhiều khả năng khai
thác được mối tương quan sâu sắc của các thuộc tính hơn.

11

CHAPTER 3:
3.1.

KẾT QUẢ NGHIÊN CỨU

Đặc điểm cơ bản của bệnh nhân(Patient baseline characteristics)

Trong nghiên cứu, thu nhận 300 bệnh nhân bị đau đầu nguyên phát. Tổng số

103 bệnh nhân được loại trừ theo các tiêu chuẩn loại trừ. Ngoài ra, 24 bệnh nhân
khơng được theo dõi trong vịng 2 tuần (Hình 1).
Cuối cùng, nghiên cứu bao gồm 173 bệnh nhân (84 bệnh nhân đau nửa đầu và
89 bệnh nhân đau đầu kiểu căng thẳng). Dữ liệu được chia ngẫu nhiên từ 173 bệnh
nhân này thành tập huấn luyện và tập thử nghiệm theo nhiều tỷ lệ khác nhau (60:40,
70:30, 80:20). Bảng câu hỏi đã thu thập thông tin về 48 đặc điểm của bệnh nhân thông
qua 19 câu hỏi. Sử dụng kiểm định chi-square để xác định 10 đặc điểm thông tin và
đưa chúng vào nghiên cứu (Bảng 1).

3.2.

Model building
Đối với 10 biến đặc trưng đã nêu ở trên, Nhóm tác giả đã sử dụng decision tree,

random forest, gradient boosting, logistic regression, and SVM algorithms để xây
dựng các mơ hình phân loại.
Sau khi xác nhận chéo, độ chính xác trung bình, điểm F1 được tính tốn thơng
qua confusion matrix (Bảng 2), đường cong kết quả phân loại (đường cong ROC)
được xây dựng và diện tích dưới đường cong ROC(AUROC) được đo. Độ chính xác
trung bình của Decision tree là 0,72, thấp hơn đáng kể so với thuật tốn học tích hợp
và SVM models. Random forest, gradient boosting algorithm and SVM models có tác
dụng phân loại tương tự; điểm chính xác trung bình của chúng lần lượt là 0,80, 0,79
và 0,82 và các khu vực trung bình dưới đường cong ROC lần lượt là 0,85, 0,82 và
0,82 và điểm F1 trung bình lần lượt là 0,79, 0,79 và 0,81.
Logistic regression có hiệu quả phân loại tốt nhất, với độ chính xác trung bình
đạt 0,84 và diện tích trung bình dưới đường cong ROC cũng lớn nhất trong số các
phương pháp là 0,90. Hiệu ứng phân loại đạt được bằng thuật toán tích hợp tốt hơn so
với phương pháp của một người học đơn lẻ (a single learner method) và trong số các

mơ hình, logistic regression đạt được hiệu quả phân loại tốt nhất.

80:20

70:30
12

AU

Accuracy F1

Decision tree

0.74

C

0.69 0.74

Accuracy F1

AUC

0.74

0.64

0.6
5

Random Forests

0.89

0.86 0.90

0.90

0.7

0.79

8
Gradient boosting

0.89

0.87 0.91

0.91

0.7

0.70

1

Logistic

0.91

0.90 0.95

0.95

regression
SVM-linear

0.8

0.88

2
0.89

0.87 0.84

0.84

0.8

0.82

1

60:40

Mean
AU

Accuracy F1

Decision tree

0.64

C

0.69 0.78

Accuracy F1

AUC

0.72

0.72

0.6
8

Random Forests

0.79

0.74 0.85

0.80

0.7

0.85

13

9
Gradient boosting

0.70

0.79 0.86

0.79

0.7

0.82

9
Logistic

0.88

0.77 0.87

0.84

regression
SVM-linear

0.8

0.90

3
0.82

0.75 0.81

0.82

0.8

0.82

1
Bảng 2: Đánh giá hiệu quả phân loại của các mơ hình khác nhau.

3.3.

Feature selection
Để lựa chọn tính năng, nhóm tác giả áp dụng hai phương pháp: phân tích thống

kê đơn biến và machine learning.
Đối với kiểm định đơn biến, sử dụng PCC (Hình 2) và kiểm định chi-square
(Bảng 3) để so sánh từng đặc điểm giữa hai nhóm và xếp hạng chúng theo giá trị p.
Thơng qua các bài kiểm tra chi-square đơn biến, Nhóm tác giả xác định rằng các giá
trị p nhỏ nhất thu được cho các biến cho biết liệu đau đầu có kèm theo buồn nơn / nơn
hay khơng và liệu đau đầu có kèm theo chứng sợ ánh sáng / tiếng ồn khơng.
Hai biến này có ý nghĩa lớn nhất trong việc phân loại hai rối loạn. PCC đã xác
nhận mối tương quan chặt chẽ giữa các yếu tố của hai danh sách. Tỷ lệ chênh lệch
(ORs) cho buồn nôn / nôn và sợ ánh sáng / tiếng ồn là 0,4 và cao hơn so với các biến
số gây đau đầu khác. Thơng qua một phân tích tương quan đơn giản, Nhóm tác giả
quan sát thấy rằng những bệnh nhân buồn nôn / nôn mửa hoặc sợ ánh sáng / tiếng ồn
có nhiều khả năng được chẩn đốn là đau nửa đầu hơn là đau đầu kiểu căng thẳng.
Để xác nhận và khám phá mối quan hệ sâu sắc hơn giữa hai rối loạn, Nhóm tác
giả thu được bảng xếp hạng tầm quan trọng của đặc điểm thông qua random forest
model (Bảng 4). Trong số các biến, buồn nôn / nơn và sợ ánh sáng / tiếng ồn có giá trị
quan trọng lần lượt là 0,1897 và 0,1573, xếp chúng là hai biến hàng đầu. Để xác minh
14

khả năng dự đốn của buồn nơn / nơn và chứng sợ ánh sáng / tiếng ồn, Nhóm tác giả
đã đào tạo hồi quy logistic trên hai đặc điểm này, với độ chính xác trung bình đạt 0,74
và diện tích trung bình dưới đường cong ROC đạt 0,74 (Bảng 5).

Hình 2: Hệ số tương quan Pearson(PCC).
Characteristic variable

P-value

Photophobia/phonophobia

P < 0.001

Nausea/vomiting

P < 0.001

Course

P < 0.001

Change after activities

P < 0.001

15

Severe intensity

P < 0.001

Alleviative way

P = 0.00

Occiput

P = 0.00

Throbbing

P = 0.01

Spark

P = 0.02
Bảng 3: Chi-square test.
Biến đặc trưng

Tầm quan trọng

Nausea/vomiting

0.1897

Photophobia/phonophobia

0.1573

Change after activities

0.1144

Course

0.1124

Severe intensity

0.1083

Alleviative way

0.0837

Occiput

0.0754

Spark

0.0604

16

A DECISION SUPPORT SYSTEM FOR PRIMARY HEADACHE DEVELOPED THROUGH MACHINE LEARNING

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về