Tải bản đầy đủ (.pdf) (20 trang)

Nghiên cứu tích hợp viễn thám, hệ thông tin địa lý và mô hình khai phá dữ liệu trong đánh giá nguy cơ mắc bệnh sốt rét tại tỉnh đăk nông =

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.53 MB, 20 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI

BÁO CÁO TỔNG KẾT
KẾT QUẢ THỰC HIỆN ĐỀ TÀI KH&CN
CẤP ĐẠI HỌC QUỐC GIA

Tên đề tài: Nghiên cứu tích hợp Viễn thám, Hệ thông tin địa lý và mô hình
khai phá dữ liệu trong đánh giá nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông
Mã số đề tài: QG.17.20
Chủ nhiệm đề tài: TS. Bùi Quang Thành

Hà Nội, 2019
1


PHẦN I. THÔNG TIN CHUNG
1.1. Tên đề tài: Nghiên cứu tích hợp Viễn thám, Hệ thông tin địa lý và mô hình khai phá dữ liệu
trong đánh giá nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông
1.2. Mã số: QG.17.20
1.3. Danh sách chủ trì, thành viên tham gia thực hiện đề tài
TT

1

2

Chức danh, học vị, họ và
tên

TS. Bùi Quang Thành


ThS. Nguyễn Quang Minh

Đơn vị công tác

Vai trò thực hiện đề tài

Đại học KHTN

Điều hành chung, tổ chức thực hiện các
nội dung nghiên cứu; Nghiên cứu xác
lập cơ sở khoa học về dịch bệnh sốt rét,
xây dựng mô hình dự báo, thiết lập
WebGIS, đề xuất các giải pháp giảm
thiểu nguy cơ mắc bệnh sốt rét

Đại học KHTN

Thư kí khoa học; ứng dụng VT-GIS và
mô hình khai phá dữ liệu trong nghiên
cứu nguy cơ mắc bệnh sốt rét

3

ThS. Hoàng Tuấn Anh
(NCS đề tài)

Đại học KHTN

Nghiên cứu sinh của đề tài; ứng dụng
VT-GIS và mô hình khai phá dữ liệu

trong nghiên cứu nguy cơ mắc bệnh sốt
rét

4

ThS. Dương Thị Thủy

Đại học KHTN

Nghiên cứu các điều kiện tự nhiên,
KTXH liên quan đến dịch bệnh sốt rét;
xây dựng CSDL

5

ThS. Đỗ Trung Hiếu

Đại học KHTN

Nghiên cứu các điều kiện tự nhiên,
KTXH liên quan đến dịch bệnh sốt rét;
xây dựng CSDL

1.4. Đơn vị chủ trì:
1.5. Thời gian thực hiện:
1.5.1. Theo hợp đồng:

từ tháng 02 năm 2017 đến tháng 02 năm 2019

1.5.2. Gia hạn (nếu có):


đến tháng….. năm…..

1.5.3. Thực hiện thực tế:

từ tháng 02 năm 2017 đến tháng 02 năm 2019

1.6. Những thay đổi so với thuyết minh ban đầu (nếu có):
(Về mục tiêu, nội dung, phương pháp, kết quả nghiên cứu và tổ chức thực hiện; Nguyên nhân; Ý
kiến của Cơ quan quản lý)
1.7. Tổng kinh phí được phê duyệt của đề tài: 300 triệu đồng.
PHẦN II. TỔNG QUAN KẾT QUẢ NGHIÊN CỨU
Viết theo cấu trúc một bài báo khoa học tổng quan từ 6-15 trang (báo cáo này sẽ được đăng trên
tạp chí khoa học ĐHQGHN sau khi đề tài được nghiệm thu), nội dung gồm các phần:
1. Đặt vấn đề
Bệnh sốt rét hiện nay vẫn còn là một vấn đề sức khoẻ lớn trên thế giới nói chung và tại Việt Nam
nói riêng. Theo ước tính của Tổ chức Y tế thế giới khoảng 40% dân số thế giới hiện nay đang sống
trong vùng có nguy cơ mắc sốt rét (World Health Organization, 2016). Hàng năm có khoảng 3502


500 triệu người mắc sốt rét và hơn 1 triệu người chết do sốt rét. Hiện nay, bất chấp những nỗ lực
trong công tác kiểm soát, bệnh sốt rét vẫn còn là một thách thức toàn cầu, đặc biệt ảnh hưởng đến
các nhóm dễ bị tổn thương do khả năng tiếp cận các dịch vụ y tế và công tác phòng chống còn hạn
chế (Darkoh, Larbi, & Lawer, 2017; Ge et al., 2016). Mặc dù có sự suy giảm về số lượng các ca
nhiễm, các khu vực trước đây miễn nhiễm với bệnh hiện đang đối diện với nguy cơ lây nhiễm do sự
thay đổi về điều kiện môi trường, các điều kiện kinh tế xã hội, đặc biệt trong bối cảnh biến đổi khí
hậu tác động đến tần suất và thời gian xảy ra các hiện tượng khí hậu cực đoan (Zinszer et al., 2012).
Tính dễ bị tổn thương của cộng đồng phụ thuộc vào nhiều yếu tố như các yếu tố sinh học, tâm lý
học, môi trường, xã hội và các yếu tố kinh tế (Pham Viet Hong, 2014). Các chương trình theo dõi
diễn biến bệnh cần nghiên cứu tích hợp các yếu tố đó, mối quan hệ tương hỗ của chúng, cũng như

yếu tố không gian và thời gian của chúng.
Tại Việt Nam, theo số liệu báo cáo hàng năm của chương trình phòng chống sốt rét Quốc gia nhiều
tỉnh có mức độ lưu hành sốt rét cao chủ yếu thuộc khu vực Miền Trung - Tây Nguyên. Hầu hết các
tỉnh có các xã, huyện có đường biên giới với Lào hoặc Campuchia đều có tỷ lệ bệnh nhân mắc sốt
rét cao hơn so với các địa phương khác trong toàn quốc (Thanh et al., 2015). Bệnh sốt rét tuy đã
giảm nhưng có nguy cơ quay trở lại lớn. Đối tượng dễ mắc bệnh là những người sống ở vùng sâu,
vùng xa và đặc biệt là những người dân sống ở vùng biên giới giữa Việt Nam với Lào và
Campuchia (Hoang, 2014). Tại các vùng này nguy cơ lan truyền sốt rét tiếp diễn và phức tạp, việc
nhiễm bệnh sốt rét chủ yếu thông qua giao lưu tự do nên rất khó khăn trong việc giám sát, phát hiện,
điều trị và quản lý bệnh nhân sốt rét.
Đối với công tác phòng chống giảm thiểu nguy cơ dịch bệnh, điều cấp thiết cần phải xây dựng một
hệ thống thông tin y tế cộng đồng trong khuôn khổ các chương trình giám sát sức khỏe và thông tin
dịch tễ (Q.-T. Bui, Nguyen, Pham, Pham, & Tran, 2018; Q. T. Bui & Pham, 2016). Về mặt kỹ thuật,
hiện có một số vấn đề còn tồn tại trong lĩnh vực dịch tễ học liên quan đến việc hiển thị các dữ liệu
về sức khỏe, phân tích xử lý không gian, truyền bá thông tin y tế và chia sẻ thông tin giữa đơn vị
quản lý và cộng đồng người dân. Một khi nhận biết được các khu vưc dễ bị tổn thương đối với bệnh
sốt rét, sẽ hỗ trợ các cán bộ y tế hiểu được các nguyên nhân hình thành và các yếu tố tác động đến
việc phân bố các khu vực nhiễm bệnh. Việc xác định và đo lường các khu vực dễ bị tổn thương
đóng vai trò quan trọng trong việc cung cấp các thông tin sơ bộ ban đầu đến các cán bộ y tế.
Việc quản lý phòng tránh sốt rét, trong đó có dự báo nguy cơ mắc bệnh sốt rét đòi hỏi phải có dữ
liệu chính xác về không gian và thông tin về thời gian (Guru Balamurugan & N Roy, 2011), trong
đó mô hình tích hợp các phương pháp phân tích không gian đang được sử dụng hiệu quả nhằm đánh
giá tính dễ bị tổn thương của xã hội khi đối diện với dịch bệnh. Việc quản lý cũng đòi hỏi các giải
pháp thích hợp, kết hợp kinh nghiệm ở tất cả các cấp, từ trung ương đến địa phương, có sự tham gia
của cộng đồng địa phương và phải được dựa trên dữ liệu có độ chính xác cao. Do đó các nhà chức
trách và cộng đồng địa phương cần được tiếp cận các dữ liệu về nguy cơ mắc bệnh sốt rét để phục
vụ cho việc dự báo và lên kế hoạch phương án đối phó hiệu quả hơn. Bản đồ tính dễ bị tổn thương
do sốt rét gây ra do đó cần phải được xây dựng sẵn phục vụ công tác dự báo các khu vực có nguy cơ
cao và công tác phòng chống dịch (Kiang et al., 2006). Việc xác định các khu vực dễ bị tổn thương
do sốt rét có thể đóng góp đáng kể vào việc nâng cao hiệu quả công tác dịch tễ thông qua việc hạn

chế di chuyển đến các khu vực dễ bị tác động, hoặc thay đổi các yếu tố gây bệnh.
Các thành phần cốt yếu của mô hình đánh giá tổn thương là bản đồ nguy cơ mắc bệnh sốt rét có khả
năng dự đoán xác suất của một khu vực phơi nhiễm với sốt rét. Mặc dù có rất nhiều công trình liên
quan đến các phương pháp dự báo nguy cơ sốt rét (Delmelle, Delmelle, Casas, & Barto, 2010;
Ndiath et al., 2015; Palaniy & Masimalai, 2014; Pham Viet Hong, 2014; Zinszer et al., 2015) nhưng
chúng rất khác nhau về phương pháp thu thập dữ liệu và phân tích tỷ lệ mắc bệnh cũng như phạm vi
ảnh hưởng của nó. Việc thành lập bản đồ nguy cơ mắc bệnh sốt rét về bản chất là nghiên cứu các
yếu tố tác động đến việc hình thành nên các khu vực có cộng đồng mắc bệnh (Q.-T. Bui et al.,
2018). Các yếu tố này về bản chất liên quan đến các điều kiện vật lý, địa hình khu vực, điều kiện
khí tượng, và các hoạt động kinh tế xã hội của con người (Kiang et al., 2006). Trên cơ sở tổng quan
3


tài liệu, hiện có nhiều nghiên cứu sử dụng mô hình trí thông minh nhân tạo trong dự báo nguy cơ
dịch bệnh được công bố trong các tạp trí khoa học có uy tín. Nhìn chung, các hướng nghiên cứu này
được chia thành ba hướng chính (1) dựa vào kiến thức chuyên gia (2) Sử dụng viễn thám, GIS (3)
sử dụng các mô hình thống kê kết hợp với chí thông minh nhân tạo, viễn thám và GIS. Các hướng
nghiên cứu này đều tìm hiểu mối quan hệ giữa các biến độc lập và xây dựng mô hình dự báo nguy
cơ mắc bệnh sốt rét dựa trên tập hợp biến đó.
Phần lớn các nghiên cứu gần đây đều theo hướng thứ (1) và (2), trong đó Hệ thông tin địa lý (GIS)
được chú ý đến như một công cụ để nhận thức thấu đáo và mường tượng ra trạng thái hiện tại của
sự phát sinh và tái phát sinh các bệnh dịch, đặc biệt là những bệnh dịch do thể truyền (Ge et al.,
2016). GIS đang từng bước được WHO đưa vào sử dụng như một công cụ thực hành thông thường
như mọi công cụ y tế khác trong việc đối phó với bệnh dịch. Dữ liệu viễn thám dùng để phân tích
lãnh thổ thông qua tích hợp trên GIS cũng đang đang được sử dụng rộng rãi cho việc nghiên cứu
một cách nhanh chóng và chính xác điều kiện môi trường của một vùng xác định
Các mô hình tuyến tính tích hợp viễn thám và GIS trong lập bản đồ nguy cơ sốt rét cũng có những
đóng góp về mặt khoa học và thực tiễn. Tuy nhiên, các mô hình dự báo truyền thống vẫn cần phải
được phát triển hoặc thay thế bằng các phương pháp mạnh mẽ và tự động để giải quyết những hạn
chế của của các kỹ thuật này. Hiện tại, hướng nghiên cứu thứ (3) đã chứng minh được tính hiệu quả

dựa trên cơ sở đánh giá độ chính xác của kết quả dự báo (Q.-T. Bui et al., 2018; Ge et al., 2016;
Kiang et al., 2006).
Ví dụ, tiếp cận thống kê và các phương pháp phân tích không gian đã được đề xuất trong nghiên
cứu của, phân tích thống kê dựa trên chuỗi thời gian (Cheng, Haworth, Anbaroglu, Tanaksaranond,
& Wang, 2014). Tuy nhiên, cách tiếp cận thống kê không giải quyết các cấu trúc phức tạp và phi
tuyến tính của mô hình dự báo nguy cơ sốt rét. Hiện nay, có nhiều nghiên cứu với xu hướng mới,
trong đó kết hợp sử dụng trí thông minh nhân tạo phân tích viễn thám và GIS trong quản lý dự báo
rủi ro sốt rét. Cụ thể hơn, một số nghiên cứ đã tích hợp mô hình Neural Network, Support Vector
Machine, Random Forest (Ch et al., 2014; Palaniy & Masimalai, 2014; Zacarias & Bostr, 2013) và
thuật toán tối ưu hóa đom đóm, ứng dụng logic mờ trong nghiên cứu về sốt rét (Buczak et al.,
2015). Những nghiên cứu này đã kết luận được tính ưu việt của mô hình so với các mô hình khác
dựa trên việc đánh giá độ chính xác của bản đồ kết quả.
Nghiên cứu dự báo phân vùng nguy cơ mắc bệnh sốt rét là vấn đề đang hết sức cấp thiết hiện nay
trên thế giới và ở Việt Nam do ảnh hưởng của các hiện tượng khí hậu cực đoan (hạn, lũ, sương
muối…) gây ra biến đổi khí hậu. Đặc biệt tại khu vực Tây nguyên, khu vực sinh sống của các cộng
đồng thiểu số, với điều kiện cơ sở hạ tầng còn thiếu và khả năng tiếp cận dịch vụ y tế còn hạn chế
(Q.-T. Bui et al., 2018; Q. T. Bui & Pham, 2016; Hoang, 2014) Mặc dù rất nhiều nghiên cứu được
tiến hành tại Việt Nam, nhưng chưa có mô hình nào được kiểm chứng, đánh giá độ chính xác dựa
trên dữ liệu thu thập ngoài thực địa. Do vậy nghiên cứu này tại Đăk Nông có tính thời sự cao và hết
sức cần thiết, nhất là trong giai đoạn gần đây có những báo cáo về sự bùng phát dịch sốt rét và sốt
xuất huyết tại các tỉnh Tây Nguyên.
Có nhiều nguyên nhân được giải thích, nhưng có thể suy luận rằng, các mô hình dự báo nguy cơ sốt
rét hiện có chưa đáp ứng được tất cả các yêu cầu. Điều này đòi hỏi cần phải nghiên cứu phát triển
các mô hình mới, nhằm nâng cao chất lượng phân vùng dự báo nguy cơ mắc bệnh sốt rét. Các mô
hình trí tuệ nhân tạo và tối ưu hóa đã được nghiên cứu thành công trong nhiều lĩnh vực, tuy nhiên
nghiên cứu ứng dụng vào phân vùng sốt rét còn ít. Vì vậy sự thành công của đề tài sẽ có ý nghĩa
khoa học lớn, là tạo ra hướng mới, cách tiếp cận mới nhằm nâng cao chất lượng dự báo. Mô hình có
thể nhân rộng ra các khu vực khác.
2. Mục tiêu
-


Làm rõ đặc điểm điều kiện tự nhiên, kinh tế xã hội và ảnh hưởng của chúng tới nguy cơ mắc
bệnh sốt rét ở tỉnh Đăk Nông
4


-

Xây dựng mô hình tích hợp Viễn thám, GIS, mô hình khai phá dữ liệu và ứng dụng trong đánh
giá nguy cơ mắc bệnh sốt rét tỉnh Đăk Nông

-

Đề xuất các giải pháp phòng tránh và giảm thiểu nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông

3. Phương pháp nghiên cứu
Bước 1: Thu thập dữ liệu, thành lập cơ sở dữ liệu không gian địa lý cho mô hình dự báo nguy
cơ sốt rét
Mô hình sốt rét sẽ được thực hiện dựa trên một cơ sở dữ liệu không gian địa lý sẽ được thiết lập cho
các khu vực nghiên cứu. Các dữ liệu sẽ được thu thập từ nhiều nguồn khác nhau, bao gồm (i) ảnh vệ
tinh Landsat-8 OLI (có sẵn trực tuyến ); (ii) Số liệu kinh tế xã hội;
(iii) bản đồ địa hình tỷ lệ 1: 50.000; (iv) DEM Aster (v) các điểm có người mắc bệnh; (vi) dữ liệu
khí tượng đo tại trạm. Những dữ liệu này sẽ được xử lý để xây dựng cơ sở dữ liệu GIS
Các dữ liệu về vị trí phân bố ca mắc, tỷ lệ mắc bệnh được thu thập từ nhiều nguồn khác nhau (Sở y
tế Đăk Nông). Nguồn tư liệu này được sử dụng để tham khảo hỗ trợ cho việc đi thực địa điều tra thu
thập dữ liệu bổ xung.
Bước 2: Cách tiếp cận mô hình và phát triển của các mô hình dự báo nguy cơ sốt rét
Mặc dù các phương pháp và kỹ thuật khác nhau đã được đề xuất cho dự báo nguy cơ sốt rét. Tuy
nhiên, do cấu trúc phức tạp và phi tuyến tính của mô hình hóa dịch bệnh, các phương pháp thông
thường không có khả năng để thực hiện đầy đủ các yêu cầu của việc dự báo nguy cơ dịch bệnh toàn

diện. Do đó cần có các nghiên cứu tìm ra các mô hình mới nhằm nâng cao độ chính xác dự báo.
Mục đích của đề xuất này là nghiên cứu cách cách tiếp cận mô hình mới có để cải thiện khả năng dự
đoán các khu vực có nguy cơ mắc bệnh sốt rét. Các mô hình trí tuệ nhân tạo mới đã được chứng
minh khả năng dự báo với độ chính xác cao hơn các mô hình thông thường trong nghiên cứu dịch
bệnh nói chung. Do đó nghiên cứu này sẽ tập trung vào các phương pháp trí tuệ nhân tạo mới và các
thuật toán tối ưu hóa. Các phương pháp trí tuệ nhân tạo khác nhau sẽ được tìm hiểu và nghiên cứu tỉ
mỉ cho mô hình dự báo, như mạng neuron nhân tạo (Artifical neural network), vector hỗ trợ
(Support vector machine), hồi quy logic (Kernel logic regression), v.v. Mỗi mô hình được đặc trung
bởi các tham số riêng biệt. Ngoài ra, các phương pháp kết hợp khác (ensemble) sẽ được nghiên cứu
như Bagging, AdaBoost, MultiBoost, Random Subspace. Thêm vào đó một số mô hình tối ưu hóa
sẽ được sử dụng trong nghiên cứu như Simulated Annealing.
Kết hợp với GIS, các mô hình tích hợp mới cho mô hình hóa nguy cơ sốt rét sẽ được phát triển và
kết quả được so sánh với các mô hình trước đây. Mô hình tối ưu sẽ được lựa chọn để thành lập bản
đồ các khu vực với mức độ nguy cơ mắc bệnh khác nhau.
Bước 3: Thành lập bản đồ nguy cơ mắc bệnh sốt rét
Mục tiêu tổng thể của gói công việc này là xây dựng bản đồ nguy cơ sốt rét từ mô hình được lựa
chọn trong Bước 2, lựa chọn các phương pháp phân ngưỡng để xây dựng các mức độ nguy cơ từ
thấp đến cao. Đề xuất các giải pháp phòng chống, giảm thiểu nguy cơ mắc bệnh sốt rét.
4. Tổng kết kết quả nghiên cứu
4.1 Đặc điểm dịch tễ học sốt rét
4.1.1 Nguồn gốc bệnh và phương thức truyền bệnh
Bệnh sốt rét là một bệnh truyền nhiễm, do ký sinh trùng Plasmodium của người gây lên. Bệnh lây
theo đường máu, do muỗi Anopheles truyền. Bệnh sốt rét lưu hành chủ yếu ở các quốc gia nhiệt đới
và cận nhiệt đới. Ký sinh trùng sốt rét (KSTSR) có thể gây nên bệnh sốt rét cho con người ở tất cả
các nhóm tuổi (đặc biệt có nguy cơ cao với trẻ em dưới 5 tuổi) và được truyền từ người này sang
người khác qua trung gian truyền bệnh là muỗi Anopheles. Bộ Y tế và tổ chức Y tế thế giới WHO
cũng đưa ra các biện pháp phòng chống sốt rét, đa phần các biện pháp đều liên quan chủ yếu là
5



ngăn chặn sự truyền bệnh từ muỗi (cụ thể là muỗi Anopheles) trong quá trình hút máu người (Hình
1)
Chu kì sinh sản của muỗi Anopheles gồm 2 giai đoạn: Giai đoạn dưới nước (trứng, bọ gậy, cung
quăng) và giai đoạn trên cạn (muỗi trưởng thành). Sự sinh sản của muỗi Anopheles phụ thuộc vào
sự có mặt của các điểm nước như: vũng nước, ao hồ, suối khe, giếng... tự nhiên hoặc do con người
tạo ra từ các vật dụng chứa nước lâu ngày (chum nước, thùng nước, gáo dừa, hòn non bộ…). Bọ
gậy có thể sống được ở nước từ 10oC - 40oC. Thời gian phát triển từ trứng đến muỗi trưởng thành ở
20oC là 28 ngày, ở 31oC là 7 ngày. Tuổi thọ của muỗi trưởng thành cũng phụ thuộc vào nhiệt độ.
Trung bình muỗi cái sống được từ 3 - 4 tuần, muỗi đực chỉ sống được vài ngày. Độ ẩm tương đối
trên 50% là phù hợp với chúng, dưới 50% thì phần lớn muỗi Anopheles bị chết.

Hình 1: Chu kỳ của KSTSR trong cơ thể người và muỗi (theo CDC, x)

4.1.2 Đặc điểm bệnh và dịch sốt rét
Thời gian phát triển ký sinh trùng ở người từ khi muỗi đốt (giai đoạn ủ bệnh): Tuỳ thuộc vào loại ký
sinh trùng sốt rét: P.falciparum từ 8-12 ngày; P.vivax, P.ovale từ 11-21 ngày; P.malariae từ 21-42
ngày.
Người mang ký sinh trùng sốt rét có thể có biểu hiện những triệu chứng lâm sàng điển hình: rét run,
nóng, ra mồ hôi và khát nước. Cũng có thể biểu hiện bằng những triệu chứng không điển hình: sốt
cao, nhức đầu, ớn lạnh, đau toàn thân, nhưng cũng có thể không biểu hiện gì cả đó là trường hợp
người mang ký sinh trùng lạnh. Tuỳ theo loài ký sinh trùng sốt rét mang trong người mà bệnh nhân
sốt mỗi ngày một cơn (P.falciparum), hai ngày một cơn (P.vivax), ba ngày một cơn (P.malariae)
cơn sốt thường xuất hiện đúng giờ có tính chu kỳ rõ rệt, ăn khớp với những đợt phát triển của ký
sinh trùng sốt rét trong cơ thể người.
4.2 Dữ liệu vị trí mẫu bệnh sốt rét
Thông tin về khu vực nhiềm bênh được lấy từ Trung tâm y tế dự phòng, Sở y tế Đăk Nông. Dựa
trên các báo cáo hàng tuần về số ca mắc bệnh mới, vị trí các ca bệnh được xác định thông qua báo
cáo và khảo sát thực địa. Tổng cộng vị trí tương đối của 198 ca mắc mới được được sử dung. Mục
tiêu của nghiên cứu này nhằm tính toán nguy cơ mắc bệnh tại khu vực nghiên cứu trong mối quan
hệ với điều kiện tự nhiên và kinh tế xã hội, từ đó mỗi vị trí không gian sẽ được tính toán giá trị nguy

cơ troing khoang [0 – 1]. Trong đó, 0 tương ứng không có nguy cơ và 1 có nguy cơ cao. Do đó 198
vị trí xác định có ca mới được gán giá trị 1 và 198 điểm ngẫu nhiên khác (nằm ngoài khu dân cư) tại
các vị trí không có ca bệnh được gán giá trị 0. Vị trí khu vực nghiên cứu và vị trí các điểm mẫu thể
hiện trong Hình 2

6


Hình 2: Vị trí khu vực nghiên cứu – tỉnh Đăk Nông

4.3 Các yếu tố ảnh hưởng dến dịch bệnh sốt rét
4.3.1 Các yếu tố tự nhiên
Dựa vào định nghĩa của bệnh sốt rét ở trên ta có thể thấy sự tồn tại và phát triển của bệnh dịch dựa
trên sinh cảnh của 3 nhân tố chính là con người, vectơ và ký sinh trùng. Nghiên cứu từng sinh cảnh
của những đối tượng này ta có thể xác định được trạng thái hiện tại cũng như sự phát triển của bệnh
trong một cộng đồng xác định.
Những sinh cảnh thuận lợi cho sự phát triển của vectơ truyền bệnh sốt rét thường là các loại sinh
cảnh rừng (bao gồm rừng rậm, rừng thưa, rừng nhiều tầng, bìa rừng), sinh cảnh đồng bằng ven biển,
sinh cảnh savan... Yếu tố sinh cảnh có vai trò rất quan trọng trong việc phân bố từng vectơ, ở vùng
sinh cảnh có độ che phủ cao, ổn định ít bị tàn phá thì rất thích hợp cho sự tồn tại và phát triển của
muỗi. Ngược lại, những sinh cảnh bị tàn phá để làm nương rẫy hoặc khai thác lâm sản thì thích hợp
cho sự tồn tại và phát triển của quần thể muỗi. Các nghiên cứu dịch tễ học cho thấy sinh cảnh cho
sự phát triển của sốt rét tập trung vào 4 nhân tố chính là khí hậu, độ che phủ thực vật, địa hình và
thuỷ văn.
Nghiên cứu các nhân tố môi trường tự nhiên ảnh hưởng đến bệnh sốt rét thực chất là nghiên cứu các
nhân tố đó liên hệ với véc tơ của bệnh. Cũng giống như mọi loài sinh vật khác, muỗi Anopheles
được đặc trưng bởi một môi trường sống nhất định (hay sinh cảnh) với những giới hạn của nhiệt độ,
độ ẩm, độ cao... Do vậy, khi nghiên cứu các yếu tố môi trường này ta có thể phát hiện ra ổ muỗi và
những nơi có thể xuất hiện ổ muỗi, từ đó, có biện pháp tiêu diệt và phòng, chống phù hợp.
4.3.2 Các yếu tố kinh tế - xã hội

Khi nghiên cứu điều kiện sinh cảnh của con người, tập trung chủ yếu nghiên cứu các điều kiện kinh
tế xã hội, tập quán sinh sống có ảnh hưởng đến sự lan truyền của dịch bệnh. Trong đó, bao gồm các
yếu tố sau: yếu tố vệ sinh (kiến thức của cộng đồng về sức khoẻ và sử dụng thuốc, kiến thức về vệ
sinh phòng dịch), yếu tố chính trị (quy hoạch kinh tế xã hội tại địa phương trong hiện tại và tương
lai, sự trợ giúp của chính quyền và các tổ chức), yếu tố kinh tế (bao gồm thu nhập, việc làm và tập
quán sinh sống, cơ sở hạ tầng), yếu tố tâm lý, văn hoá (trình độ dân trí, tâm lý dân chúng trước vấn
đề vệ sinh), yếu tố dân số (mật độ, cơ cấu dân số theo độ tuổi, gia tăng dân số tự nhiên và gia tăng
cơ học)
4.4 Xây dựng CSDL các yếu tố ảnh hưởng đến nguy cơ mắc bệnh sốt rét
Dựa trên việc xác định các yếu tố ảnh hưởng đến dịch bệnh sốt rét và cơ sở dữ liệu thu thập được,
đề tài xây dựng 15 lớp thông tin đầu vào để xây dựng bản đồ nguy cơ sốt rét tại tỉnh Đăk Nông
(Hình 3). Các lớp thong tin bao gồm (1) Độ cao địa hình – Elevation; (2) Hướng dốc – Aspect; (3)
7


Độ dốc – Slope; (4) Lượng mưa – Rain; (5) Nhiệt độ - Temperature; (6) Độ ẩm – Humidity; (7)
Nhiệt độ bề mặt – Land Surface Temperature (LST); (8) NDMI; (9) NDVI; (10) Gió – Wind; (11)
Khoảng cách đến khu dân cư – Distance to residence; (12) Khoảng cách đến đường giao thông –
Distance to road; (13) Khoảng cách đến vừng đất ngập nước – Distance to Wetland; (14) Khoảng
cách đến sông – Distance to river (15) Khoảng cách đến rừng – Distance to forest. Các lớp thông tin
được mô tả trong

8


Hình 3: Dữ liệu (biến) sử dụng trong xây dựng bản đồ nguy cơ

Trước khi xây dựng mô hình toán, 15 lớp thông tin được so sánh cặp để đánh giá hệ số tương quan,
kết quả đánh giá chỉ đã lọc bỏ 5 biến (do có giá trị tuyệt đối của hệ số tương quan > 0.7) và giữ lại
10 biến để thành lập bản đồ nguy cơ sớt rét. Hệ số tương quan giữa 10 biến được sử dụng được thể

hiện trong Bảng 1.
Bảng 1: Hệ số tương quan giữa các biến

-0.046

Dist to
Resident
0.358

Dist to
River
-0.034

Dist to
Road
0.301

-0.018

0.015

0.013

0.05

1

-0.011

0.407


-0.087

-

-

1

-0.07

-

-

-

-

-

-

-

-

-

-


NDVI

Aspect

DEM

Landuse

Rain

Slope

Temp

NDVI

1

0.022

-0.048

-0.242

0

0.083

Aspect


-

1

0.008

-0.008

0

-0.007

DEM

-

-

-0.117

0.058

0

-0.607

Landuse

-


-0.374

0.093

-0.232

0

0.035

Rain
Dist to
Resident
Dist to
Resident
Dist to
Resident
Dist to
Resident
Temp

1

-0.148

-0.312

0.041


0

-0.157

-

-

1

0.01

0.501

0.001

0.048

-

-

-

-

1

0.06


0

0.263

-

-

-

-

-

-

1

0.001

0.153

-

-

-

-


-

-

-

-

1

0

-

-

-

-

-

-

-

-

-


1

Thông thường các biến số được do ở các đơn vị khác nhau, nên cần được chuẩn hóa về cùng một
đơn vị trước khi xây dựng mô hình. Hiện có hai phương pháp chuẩn hóa (a) Phân lớp dựa trên phân
phối tự nhiên của dữ liệu, và gán các khoảng dữ liệu các lớp 1,2,3… Đây là phương pháp chuyển từ
dạng liên tục sang dạng rời rạc Bảng 2 (b) Chuẩn hóa dữ liệu về cùng 1 khoảng từ [0 – 1] sử dụng
công thức
.
Trong nghiên cứu này, cả 2 phương pháp được sử dụng trong thàn lập bản đồ nguy cơ sốt rét.
Bảng 2: Phân lớp các biến sử dụng trong xây dựng bản đồ nguy cơ bằng thuật toán Natural break algorithm
TT
1.
2.
3.
4.

Lớp dữ liệu
Landuse
Distance to
Residence (m)
Distance to
Road (m)
NDVI

Phân lớp
(Class 1) TTN, (2) SMN, (3) RSX, (4) RPH, (5) RDD, (6) OTC, (7) NTS, (8) NKH, (9)
CSK, 10) CSD, (11) CLN, (12) CHN (13), CDG, (14) CCC.
(1) 0 - 1,131; (2) 1,132 - 2,880; (3) 2,881 - 4,731; (4) 4,732 - 6,788; (5) 6,789 - 9,051; (6)
9,052 - 11,620; (7) 11,630 - 14,710; (8) 14,720 - 18,920; (9) 18,930 - 26,230
(1) 0 - 440.2; (2) 440.3 - 1,064; (3) 1,065 - 1,798; (4) 1,799 - 2,641; (5) 2,642 - 3,595; (6)

3,596 - 4,659; (7) 4,660 - 5,833; (8) 5,834 - 7,154; (9) 7,155 - 9,355
(1) -1.06 - -0.433; (2) -0.432 - -0.0101; (3) -0.01 - 0.256;(4) 0.257 – 0.404; (5) 0.405 0.514; (6) 0.515 - 0.608; (7) 0.609 - 0.702; (8) 0.703 - 0.796; (9) 0.797 - 0.936

9


5.

Slope (O)

6.

Distance to
River (m)

7.

DEM

8.

Rain

9.

Temp

10.

Aspect


(1) 0 - 4.81; (2) 0 - 4.81; (3) 8.66 - 12.3; (4) 12.4 - 15.9; (5) 16 - 19.7; (6) 19.8 - 23.8; (7)
23.9 - 28.4; (8) 28.5 - 34.6; (9) 34.7 - 61
(1) 0 - 165.8; (2) 165.9 - 372.1; (3) 372.2 - 623.6; (4) 623.7 - 944.7; (5) 944.8 - 1,379; (6)
1,380 - 1,977; (7) 1,978 - 2,797; (8) 2,798 - 3,840; (9) 3,841 - 5,974
(1) 119 - 388; (2) 389 - 511; (3) 512 - 620; (4) 621 - 729; (5) 730 - 831; (6) 832 - 955; (7)
956 - 1,150; (8) 1,160 - 1,420; (9) 1,430 - 1,970
(1) 140.3 - 144.3; (2) 144.4 - 150.5; (3) 150.6 - 157; (4) 157.1 - 162; (5) 162.1 - 167; (6)
162.1 - 167; (7) 172.1 - 176.8; (8) 176.9 - 181.8; (9) 181.9 - 189.4
(1) 23.3 – 24.0; (2) 24.1 – 25.0; (3) 25.1 - 26; (4) 26.1 – 27.0; (5) 27.1 – 28.0;
(1) Flat; (2) North; (3) Northeast; (4) East; (5) Southeast; (6) South; (7) Southwest; (8)
West; (9) Northwest (10) North

Các yếu tố sau đó được đánh giá dựa trên so sánh với vị trí của các điểm mẫu bệnh thu thập tại thực
địa. Trọng số được đánh giá bằng thuật toán Information Gain với khoảng giá trị [0 – 1], trong đó
biến số ảnh hưởng lớn có giá trị cao và ngược lại. Dựa trên đánh giá (Bảng 3), yếu tố sử dụng đất
(Landuse) có trọng số cao nhất, tiếp theo là khoảng cách đến khu dân cư, đường giao thông và chỉ
số thưc vật NDVI. Đánh giá này cho thấy tính tương đồng trong các nghiên cứu trước đây, trong đó
tình trạng lan truyền bệnh chịu ảnh hưởng lớn của các yếu tố xã hội và lớp phủ thực vật.
Bảng 3: Hệ số tác động của các biến đến nguy cơ sốt rét
Yếu tố (biến)
Landuse
Dist to Residence
Dist to Road
NDVI

Xếp hạng
0.76569
0.57649
0.50502

0.43205

Yếu tố (biến)
Slope
Dist to River
DEM
Rain

Xếp hạng
0.20215
0.07607
0.02400
0.01911

Yếu tố (biến)
Temp
Aspect

Xếp hạng
0.01263
0.00300

4.5 Thành lập bản đồ nguy cơ sốt rét tại tỉnh Đăk Nông
4.5.1 Bản đồ nguy cơ dựa trên các thuật toán Ensemble
Kết quả thử nghiệm của mô hình được đánh giá thông qua các chỉ số như RMSE, MAE, Kappa và
AUC. Kết quả thể hiện trong Hình 4. Các chỉ số đánh giá độ chính xác của mô hình tể hiện trong
Bảng 4. Trong đó thuật toán Random Subspace có giá trị AUC cao nhất, tiếp sau đó là Adaboost và
Bagging.

Hình 4: Đường cong ROC và giá trị AUC của các mô hình thử nghiệm

Bảng 4: Training results of six models by using ten-fold cross-validation
Classifiers
MLP
SVM
J48
Adaboost (J48)
Bagging (J48)

RMSE
0.2365
0.2535
0.2413
0.2549
0.2234

MAE Kappa
0.0791 0.8687
0.119
0.803
0.079 0.8689
0.0684 0.8636
0.0926 0.8737

Overall Accuracy
93.4343
90.1515
93.4533
93.1818
93.6869


10


RandomSubspace (J48)

0.2528

0.1888

0.8838

94.1919

Dựa trên các tham số của 6 mô hình thử nghiệm, 6 bản đồ nguy cơ sốt rét được thành lập. Ví dụ minh họa
bản đồ nguy cơ sốt rét một khu vực nhỏ được thành lập dựa trên 6 mô hình thử nghiệp thể hiện trong Hình 5.
Về mặt đồ họa không có nhiều sự khác biệt giữa các khu vực có nguy cơ mắc bệnh trên 6 bản đồ, trong đó
các khu vực có nguy cơ cao (màu đỏ) đều phân bố sung quanh khu dân cư và đường giao thông.

Hình 5: Ví dụ một số kết quả phân tích từ các mô hình ensemble

Thêm vào đó, nhằm kiểm tra bản đồ kết quả được thành lập từ các mô hình, nghiên cứu áp dụng
phương pháp kiểm định giả thiết thống kê t-test, với giả thuyết Ho: Các kết quả của 6 mô hình là
giống nhau và Giả thuyết đảo Ha: Không có sự giống nhau giữa các kết quả của 6 mô hình. Dựa trên
gia trị P (Bảng 5) cho thấy, kết quả của mô hình là khác biệt và mô hình Random Subspace cho ra
kết quả tốt nhất.
Bảng 5: Kiểm định t-test cho từng cặp kết quả của mô hình
TT So sánh cặp
1
2
3

4
5
6
7
8
9
10
11
12
13
14
15

AdaBoost vs Bagging
AdaBoost vs J48
AdaBoost vs Random
AdaBoost vs SVM
AdaBoost vs MLP
Bagging vs J48
Bagging vs RandomSubSpace
Bagging vs MLP
Bagging vs SVM
J48 vs RandomSubSpace
J48 vs MLP
J48 vs SVM
RandomSubSpace vs MLP
RandomSubSpace vs SVM
MLP vs SVM

Giá trị T


Giá trị P

549.19
387.63
-1267.35
165.97
299.08
179.14
-1598.23
-579.34
-127.12
-1171.24
-369.29
-203.53
1327.65
1281.17
213.29

< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16

< 2.2e-16
< 2.2e-16
< 2.2e-16
< 2.2e-16

11


4.5.2 Bản đồ nguy cơ dựa trên mô hình kết hợp ANFIS và Simulated Annealing
Bên cạnh thử nghiệm các mô hình Ensemble, nghiên cứu cũng xây dựng mô hình tích hợp giữa Hệ
thống Logic mờ, cụ thể là Adaptive Neuro-Inference System (ANFIS) và thuật toán tối ưu hóa dựa
trên nguyên lý của vật lý Simulated Annealing (SA). Trong đó SA được sử dụng nhằm tối ưu hóa
tham số cho ANFIS với hàm mục tiếu được sử dụng là RMSE. Sơ đồ minh họa của ANFIS được
trình bày trong Hình 6. Kết quả bản đồ nguy cơ được xây dựng từ mô hình này thể hiện trong Hình
7

Hình 6: Adaptive Neuro Fuzzy Inference System

Hình 7: Bản đồ nguy cơ sốt rét được xây dựng dựa trên mô hình ANFIS va Simulated Annealing

12


4.6 Các giải pháp phòng chống giảm thiểu nguy cơ sốt rét tại tỉnh Đăk Nông
Tại tỉnh Đăk Nông, nguy cơ xảy ra dịch còn rất lớn, khu vực có nguy cơ cao chiếm phần lớn diện
tích khu vực có địa hình thấp, nơi có dân cư sinh sống. Kết quả nghiên cứu cho thấy các yếu tố kinh
tế xã hội có trọng số lớn trong việc tác động đến nguy cơ lây lan dịch bệnh sốt rét, do đó, cần có sự
quan tâm hơn nữa đến công tác phòng, chống sốt rét như phun hoá chất, tẩm màn, phát thuốc, tuyên
truyền, giáo dục về sức khoẻ, kiểm soát các nguồn lao động từ vùng có nguy cơ lây nhiễm cao
(Hình 7)…Đồng thời, cũng cần có chính sách và đầu tư xây dựng cơ sở hạ tầng (Y tế, khám chữa

bệnh, giáo dục, thông tin...), tăng cường công tác ý tế dự phòng, phát triển nguồn nhân lực y tế,
nâng cao đời sống, trình độ dân trí của cộng đồng. Bên cạnh đó, các biện pháp quản lý tổng thể của
chính quyền trong lĩnh vực y tế dự phòng kết hợp với các tiến bộ trong nghiên cứu phân vùng, điều
trị bệnh.
Dựa vào kết quả của công trình này, có thể nhân rộng mô hình ra các quy mô lớn hơn với các tỉnh,
khu vực có những điều kiện tự nhiên, kinh tế – xã hội tương đồng, cũng như đối với các loại dịch
bệnh khác. Như vậy vấn đề quản lý dịch bệnh sẽ chặt chẽ và đồng bộ hơn ở các cấp. Việc tạo lập
một cơ sở dữ liệu y tế đầy đủ, logic cần được tiếp tục quan tâm nghiên cứu trong thời gian tới.
5. Đánh giá về các kết quả đã đạt được và kết luận
Từ kết quả nghiên cứu ứng dụng viễn thám, hệ thống thông tin địa lý, mô hình học máy (machine
learning) và các thuật toán tối ưu trong đánh giá nguy cơ sốt rét tại tỉnh Đắk Nông, có thể đưa ra các
đánh giá và kết luận như sau.
Phương pháp ứng dụng viễn thám, hệ thống thông tin địa lý, mô hình học máy và các thuật toán tối
ưu để đánh giá nguy cơ sốt rét đạt được mức độ tin cậy cao qua cách thức kiểm thử và đánh giá
tham số kết quả. Phương pháp ứng dụng này đã giảm thiểu tối đa sự đánh giá chủ quan của con
người so với những phương pháp truyền thống khác.
Kết quả đề tài khẳng định thêm mối quan hệ chặt chẽ giữa các yếu tố điều kiện tự nhiên, điều kiện
kinh tế - xã hội ở mỗi khu vực ảnh hưởng tới sự lây truyền của bệnh sốt rét, để từ đó có các biện
pháp dự báo, tuyên truyền, kết hợp cùng các biện pháp y tế dự phòng, biện pháp sinh học, quản lý
tài nguyên và môi trường trên địa bàn tỉnh để phòng chống bệnh tối ưu.
Các yếu tố sử dụng đưa vào mô hình nghiên cứu khai thác từ số liệu được thu thập bằng phương
pháp thống kê - trung bình nên còn hạn chế đi tính mùa vụ, tính thời điểm và có những dữ liệu
mang tính thời điểm nhưng lại không đảm bảo sự xuyên suốt của dữ liệu. Do đó để nâng cao độ
chính xác kết quả mô hình cần có các dữ liệu được cập nhật liên tục và có tính mới để sao các dữ
liệu đầu vào mô hình mô tả được chính xác nhất bức tranh từ thế giới thực.
Kết quả đề tài giúp hỗ trợ cho công tác Y tế dự phòng, quản lý tài nguyên và môi trường, các
nghiên cứu chuyên sâu về các yếu tố ảnh hưởng để từ đó có các giải pháp tác động, can thiệp làm
giảm số ca bị bệnh và kiểm soát dịch bệnh tốt hơn.
Định hướng nghiên cứu từ sau kết quả đề tài: Phát triển theo hướng nghiên cứu về tối ưu hóa mô
hình nhằm nâng cao hơn nữa mức độ tin cậy để tăng độ chính xác dự đoán; Hướng nghiên cứu đi từ

các yếu tố ảnh hưởng tới sự phát sinh và lan truyền dịch bệnh sốt rét để đưa ra các giải pháp giảm
thiểu nguy cơ, phòng chống sốt rét nhằm kiểm soát dịch bệnh đảm bảo sức khỏe cho cộng động,
phát triển kinh tế - xã hội.
6. Tóm tắt kết quả (tiếng Việt và tiếng Anh)
6.1 Tiếng Việt
Kết quả khoa học
Đề tài này thử nghiêm và đánh giá khả năng tích hợp dữ liệu viễn thám, hệ thông tin địa lý, mô hình
học máy và các thuật toán tối ưu trong nghiên cứu mối quan hệ phi tuyến giữa các khu vực có nguy
cơ mắc bệnh sốt rét và điều kiện tự nhiên kinh tế xã hội của tỉnh Đăk Nông, Việt Nam. Dựa trên cơ
13


sở đánh giá đặc của muỗi truyền bệnh, cơ sở dữ liệu của 15 yếu tố đầu vào (trong đó 10 yếu tố được
sử dụng) và hiện trạng mắc bệnh tại tỉnh được xây dựng. Các yếu tố này được sử dụng trong huấn
luyện và kiểm định các mô hình đề xuất. Độ chính xác kết quả được đánh giá qua các thông số như
RMSE, MAE, chỉ số Kappa, Độ chính xác tổng, ROC và phương pháp kiểm định t-test. Kết quả cho
thấy tất cả các mô hình thử nghiệm đều cho kết quả có độ chính xác cao. Tuy nhiên độ chính xác sẽ
thay đổi tùy thuộc vào khu dữ liệu đầu vào và đặc điểm tự nhiên, xã hội của khu vực nghiên cứu.
Dựa trên các chỉ số dùng để đánh giá, có thể khẳng định phương pháp tích hợp đề xuất nêu trên
thành lập được bản đồ có độ chính xác cao, có giá trị sử dụng trong nghiên cứu và trong các chương
trình phòng chống dịch bệnh tại địa phương.
Công bố
02 bài báo trên tạp chí ISI, 01 chương sách của nhà xuất bản Springer, 01 bài báo trên tạp chí của
Việt Nam
Đào tạo
Đào tạo 01 thạc sỹ, hỗ trợ 01 nghiên cứu sinh
6.2 Tiếng Anh
Scientific results
This study examines the potentials of remotely sensed data, GIS, machine learning classifiers,
ensemble techniques and optimization algorithms in the investigation of the non-linear relationship

between malaria occurrences and socio-physical conditions in the Dak Nong province of Viet Nam.
Fifteen socio-economic and physical predictor variables were investigated to build up spatial
database to train and validate the prediction models. Accuracy assessment was determined with
RMSE, MAE, Kappa, Overall Accuracy, and Receiver Operating Characteristic (ROC) curve and
pair t-test. All investigated models generated results with considerable high performance indicators.
However, the performances might vary according to geographic locations. It is concluded that the
machine learning classifiers combined with remotely sensed data and GIS is promising for malaria
vulnerability mapping, and the derived maps can be used as a fundamental basis for programs on
spatial disease control.
Publications
02 ISI papers, 01 Springer book chapter, 01 paper in Vietnam Journal.
Training results
Trained 01 Masters; support 1PhD.
7. Tài liệu tham khảo
Buczak, A. L., Baugher, B., Guven, E., Ramac-Thomas, L. C., Elbert, Y., Babin, S. M., & Lewis, S. H. (2015). Fuzzy
association rule mining and classification for the prediction of malaria in South Korea. BMC Medical Informatics
and Decision Making, 15(1), 1-17. doi: 10.1186/s12911-015-0170-6
Bui, Q.-T., Nguyen, Q.-H., Pham, V. M., Pham, M. H., & Tran, A. T. (2018). Understanding spatial variations of
malaria in Vietnam using remotely sensed data integrated into GIS and machine learning classifiers. Geocarto
International, 1-15. doi: 10.1080/10106049.2018.1478890
Bui, Q. T., & Pham, M. H. (2016). Web-based GIS for spatial pattern detection: application to malaria incidence in
Vietnam. SpringerPlus, 5(1), 1-14. doi: 10.1186/s40064-016-2518-5
Ch, S., Sohani, S. K., Kumar, D., Malik, A., Chahar, B. R., Nema, A. K., . . . Dhiman, R. C. (2014). A Support Vector
Machine-Firefly Algorithm based forecasting model to determine malaria transmission. Neurocomputing, 129, 279288. doi: />Cheng, T., Haworth, J., Anbaroglu, B., Tanaksaranond, G., & Wang, J. (2014). Spatiotemporal Data Mining. In M. M.
Fischer & P. Nijkamp (Eds.), Handbook of Regional Science (pp. 1173-1193). Berlin, Heidelberg: Springer Berlin
Heidelberg.
Darkoh, E. L., Larbi, J. A., & Lawer, E. A. (2017). A Weather-Based Prediction Model of Malaria Prevalence in
Amenfi West District, Ghana. Malaria Research and Treatment, 2017, 7820454. doi: 10.1155/2017/7820454

14



Delmelle, E., Delmelle, E. C., Casas, I., & Barto, T. (2010). H.E.L.P: A GIS-based Health Exploratory AnaLysis Tool
for Practitioners. Applied Spatial Analysis and Policy, 4(2), 113-137. doi: 10.1007/s12061-010-9048-2
Ge, Y., Song, Y., Wang, J., Liu, W., Ren, Z., Peng, J., & Lu, B. (2016). Geographically weighted regression-based
determinants of malaria incidences in northern China. Transactions in GIS, n/a-n/a. doi: 10.1111/tgis.12259
Guru Balamurugan, & N Roy, S. S., Vikas N Kurne, Deepshikha Purwar, Siddarth DD4. (2011). Applications of GIS in
Public Health Risk Reduction – ArcGIS approach. Paper presented at the 12th Esri India User Conference India.
Hoang, H. (2014). Malaria situation and evaluation of malaria control interventions in several border communes of
Huong Hoa district , Quang Tri province [in Vietnamese: Nghiên cứu thực trạng sốt rét và đánh giá kết quả can
thiệp phòng chống sốt rét tại một số xã biên giới của huyện Hướng Hóa, tỉnh Quảng Trị]. (PhD), Hue College of
Medicine and Pharmacy, Hue, Viet Nam.
Kiang, R., Adimi, F., Soika, V., Nigro, J., Singhasivanon, P., Sirichaisinthop, J., . . . Looareesuwan, S. (2006).
Meteorological, environmental remote sensing and neural network analysis of the epidemiology of malaria
transmission in Thailand. Geospatial Health; Vol 1, No 1 (2006).
Ndiath, M. M., Cisse, B., Ndiaye, J. L., Gomis, J. F., Bathiery, O., Dia, A. T., . . . Faye, B. (2015). Application of
geographically-weighted regression analysis to assess risk factors for malaria hotspots in Keur Soce health and
demographic surveillance site. Malaria Journal, 14, 463. doi: 10.1186/s12936-015-0976-9
Palaniy, & Masimalai, i. (2014). Remote sensing and Geographic Information Systems (GIS) as the applied public
health & environmental epidemiology. Int J Med Sci Public Health, 3(12), 1430-1438.
Pham Viet Hong, P. V. H., Pham Xuan Canh. (2014). Application of remote sensing and GIS for prevention-risk
warning of malaria in Gia lai areas. Paper presented at the Asian conference on Remote sensing 2014, Nay Pyi
Taw, Myanmar.
Thanh, P. V., Van Hong, N., Van Van, N., Van Malderen, C., Obsomer, V., Rosanas-Urgell, A., . . . Erhart, A. (2015).
Epidemiology of forest malaria in Central Vietnam: the hidden parasite reservoir. Malaria Journal, 14(1), 86. doi:
10.1186/s12936-015-0601-y
World Health Organization. (2016). World Malaria Report 2016. Geneva.
Zacarias, O. P., & Bostr, H. (2013). Comparing support vector regression and random forests for predicting malaria
incidence in Mozambique. Paper presented at the Advances in ICT for Emerging Regions (ICTer), 2013
International Conference on.

Zinszer, K., Kigozi, R., Charland, K., Dorsey, G., Brewer, T. F., Brownstein, J. S., . . . Buckeridge, D. L. (2015).
Forecasting malaria in a highly endemic country using environmental and clinical predictors. Malaria Journal, 14,
245. doi: 10.1186/s12936-015-0758-4
Zinszer, K., Verma, A. D., Charland, K., Brewer, T. F., Brownstein, J. S., Sun, Z., & Buckeridge, D. L. (2012). A
scoping review of malaria forecasting: past work and future directions. BMJ Open, 2(6), e001992. doi:
10.1136/bmjopen-2012-001992

PHẦN III. SẢN PHẨM, CÔNG BỐ VÀ KẾT QUẢ ĐÀO TẠO CỦA ĐỀ TÀI
3.1. Kết quả nghiên cứu
TT

Tên sản phẩm

1

Mô hình tích hợp Viễn thám,
GIS với mô hình khai phá
dữ liệu phục vụ đánh giá
nguy cơ mắc bệnh sốt rét
tỉnh Đăk Nông

Yêu cầu khoa học hoặc/và chỉ tiêu kinh tế - kỹ thuật
Đăng ký
Đạt được
CSDL các lớp thông tin làm dữ liệu đầu
vào bao gồm các yếu tố tự nhiên, kinh tế
xã hội, được chiết xuất từ dữ liệu bản đồ
và tư liệu viễn thám như các ảnh chỉ số:
NDVI, NDBI, DEM, NDMI
Đạt

CSDL được sử dụng để thiết lập và thử
(thể hiện trong
nghiệm mô hình dự báo nguy cơ sốt rét
phụ lục 1, và sản
trong đó thể hiện rõ các tham số và độ phẩm công bố)
chính xác của mô hình. Độ chính xác được
đánh giá bằng các chỉ số phổ biến như
Area Under Curve (AUC), Relative
operating characteristic (ROC), Root
Mean Square (RMS)

15


2

Kết quả phân tích đặc điểm
tự nhiên, kinh tế - xã hội và
ảnh hưởng của chúng tới
nguy cơ mắc bệnh sốt rét ở
tỉnh Đăk Nông

3

Kết quả đánh giá nguy cơ
mắc bệnh sốt rét tỉnh Đăk
Nông

4


Bản đồ nguy cơ mắc bệnh
sốt rét tỉnh Đăk Nông tỷ lệ
1/100.000

5

Các giải pháp phòng tránh
và giảm thiểu nguy cơ mắc
bệnh sốt rét tại tỉnh Đăk
Nông

Nêu bật các yếu tố chính (thể hiện thông
qua trọng số quyết định), bao gồm các yếu
tố tự nhiên, kinh tế xã hội. Đánh giá được
các tác động của các yếu tố này đến nguy
cơ mắc bệnh sốt rét tại tỉnh Đăk Nông
Yêu cầu thể hiện đầy đủ, chính xác và có
tính hệ thống về các điều kiện TN- KTXH
và và ảnh hưởng của chúng tới nguy cơ
mắc bệnh sốt rét ở tỉnh Đăk Nông
Kết quả dự báo nguy cơ mắc bệnh sốt rét
được xây dựng từ mô hình tích hợp Viễn
thám, GIS và mô hình khai phá dữ liệu có
độ chính xác cao (AUC > 90%). Nguy cơ
mắc bệnh được thể hiện thông qua xác
suất nguy cơ theo không gian
Kết quả đầy đủ, chính xác và có tính hệ
thống về sự phân bố các khu vực có nguy
cơ mắc bệnh
Bản đồ thể hiện xác suất nguy cơ mắc

bệnh sốt rét (0 - 100%) theo không gian.
Bản đồ được xây dựng được xây dựng từ
mô hình tích hợp Viễn thám, GIS và mô
hình khai phá dữ liệu có độ chính xác cao
(AUC > 90%) và dựa trên nền bản đồ địa
hình 1/100.000, thể hiện rõ các khu vực có
nguy cơ mắc bệnh sốt rét. Bản đồ được
thành lập theo đúng ngôn ngữ bản đồ
chuyên đề

Đạt
(thể hiện trong
phụ lục 2, và sản
phẩm công bố)

Đạt
(thể hiện trong
phụ lục 3, và sản
phẩm công bố)

Đạt
(thể hiện trong
phụ lục 3, và sản
phẩm công bố)

Đạt
Rõ ràng, đầy đủ cơ sở khoa học và luận cứ (thể hiện trong
phụ lục 1, và sản
đối với các đề xuất.
phẩm công bố)


3.2. Hình thức, cấp độ công bố kết quả
Tình trạng
Ghi địa chỉ Đánh
(Đã in/ chấp nhận và cảm ơn
giá
in/ đã nộp đơn/ đã sự tài trợ
chung
được chấp nhận
(Đạt,
của
Sản phẩm
đơn hợp lệ/ đã
TT
ĐHQGHN không
được cấp giấy xác đúng quy
đạt)
nhận SHTT/ xác
định
nhận sử dụng sản
phẩm)
1 Công trình công bố trên tạp chí khoa học quốc tế theo hệ thống ISI/Scopus
1.1 Quang-Thanh Bui, Quoc-Huy Nguyen, Van Manh
Ghi địa chỉ
Pham, Minh Hai Pham & Anh Tuan Tran (2018).
và cảm ơn sự
Understanding spatial variations of malaria in
tài trợ của
Đạt
Vietnam using remotely sensed data integrated into

Đã xuất bản
ĐHQGHN
GIS and machine learning classifiers, Geocarto
đúng quy
16


International, DOI: 10.1080/10106049.2018.1478890
định
1.2 Quang-Thanh Bui (2019) Metaheuristic algorithms
Ghi địa chỉ
in optimizing neural network: a comparative study
và cảm ơn sự
for forest fire susceptibility mapping in Dak Nong,
tài trợ của
Đã xuất bản
Vietnam, Geomatics, Natural Hazards and
ĐHQGHN
Risk, 10:1, 136-150,
đúng quy
DOI: 10.1080/19475705.2018.1509902
định
2 Sách chuyên khảo được xuất bản hoặc ký hợp đồng xuất bản
2.1
3 Đăng ký sở hữu trí tuệ
3.1
4 Bài báo quốc tế không thuộc hệ thống ISI/Scopus
4.1
5 Bài báo trên các tạp chí khoa học của ĐHQGHN, tạp chí khoa học chuyên ngành quốc
gia hoặc báo cáo khoa học đăng trong kỷ yếu hội nghị quốc tế

5.1 Tuan-Anh Hoang, Le Hoang Son, Quang-Thanh Bui,
Quoc-Huy Nguyen (2017), Understanding factors
affecting the outbreak of malaria using LocallyGhi địa chỉ
Compensated Ridge Geographically Weighted
và cảm ơn sự
Regression: Case study in DakNong, Vietnam,
tài trợ của
Proceedings of the 2017 International Conference on
Đã xuất bản
ĐHQGHN
Geo-spatial Technologies and Earth Resources
đúng quy
(GTER-ISM 2017), 5-6 October 2017, Hanoi,
định
Vietnam, in press. url:
/>5.2 BÙI QUANG, Thành. Combination of Adaptive
Fuzzy Inference System and Simulated Annealing
Ghi địa chỉ
Algorithm-based for Malaria Susceptibility Mapping
và cảm ơn sự
in Daknong Province. VNU Journal of Science:
tài trợ của
Earth and Environmental Sciences, [S.l.], v. 34, n. 4,
Đã xuất bản
ĐHQGHN
dec. 2018. ISSN 2588-1094. Available at:
đúng quy
< />định
doi: />6 Báo cáo khoa học kiến nghị, tư vấn chính sách theo đặt hàng của đơn vị sử dụng
7 Kết quả dự kiến được ứng dụng tại các cơ quan hoạch định chính sách hoặc cơ sở ứng

dụng KH&CN
Ghi chú:

Đạt

Đạt

Đạt

- Cột sản phẩm khoa học công nghệ: Liệt kê các thông tin các sản phẩm KHCN theo thứ tự
công trình, mã công trình đăng tạp chí/sách chuyên khảo (DOI), loại tạp chí ISI/Scopus>
- Các ấn phẩm khoa học (bài báo, báo cáo KH, sách chuyên khảo…) chỉ được chấp nhận nếu
có ghi nhận địa chỉ và cảm ơn tài trợ của ĐHQGHN theo đúng quy định.
- Bản phô tô toàn văn các ấn phẩm này phải đưa vào phụ lục các minh chứng của báo cáo.
Riêng sách chuyên khảo cần có bản phô tô bìa, trang đầu và trang cuối có ghi thông tin mã số xuất
bản.
3.3. Kết quả đào tạo
TT

Họ và tên

Thời gian và kinh phí

Công trình công bố liên quan

Đã bảo
17



(Sản phẩm KHCN, luận án, luận văn)

vệ

Tuan-Anh Hoang, Le Hoang Son, QuangThanh Bui, Quoc-Huy Nguyen
(2017), Understanding factors affecting the
outbreak of malaria using LocallyCompensated Ridge Geographically Weighted
Regression: Case study in DakNong,
Vietnam, Proceedings of the 2017
International Conference on Geo-spatial
Technologies and Earth Resources (GTERISM 2017), 5-6 October 2017, Hanoi,
Vietnam, in press. url:
/>
Chưa

tham gia đề tài
(số tháng/số tiền)
Nghiên cứu sinh

Hoàng Tuấn
Anh

1

42.652.500

Học viên cao học
Luận văn thạc sỹ đã bảo vệ. Tên đề tài “Ứng
Nguyễn Hồng
Phương


1

(Dựa trên thực tế đi
thực địa)

dụng viễn thám, hệ thống thông tin địa lý
và các thuật toán tối ưu trong đánh giá
nguy cơ sốt rét tại tỉnh Đắk Nông”

Đã bảo
vệ

Ghi chú:
- Gửi kèm bản photo trang bìa luận án/ luận văn/ khóa luận và bằng hoặc giấy chứng nhận
nghiên cứu sinh/thạc sỹ nếu học viên đã bảo vệ thành công luận án/ luận văn;
-

Cột công trình công bố ghi như mục III.1.

PHẦN IV. TỔNG HỢP KẾT QUẢ CÁC SẢN PHẨM KH&CN VÀ ĐÀO TẠO CỦA ĐỀ TÀI
TT

1
2
3
4
5
6
7

8
9

Sản phẩm
Bài báo công bố trên tạp chí khoa học quốc tế theo hệ thống
ISI/Scopus
Sách chuyên khảo được xuất bản hoặc ký hợp đồng xuất bản
Đăng ký sở hữu trí tuệ
Bài báo quốc tế không thuộc hệ thống ISI/Scopus
Số lượng bài báo trên các tạp chí khoa học của ĐHQGHN, tạp
chí khoa học chuyên ngành quốc gia hoặc báo cáo khoa học
đăng trong kỷ yếu hội nghị quốc tế
Báo cáo khoa học kiến nghị, tư vấn chính sách theo đặt hàng
của đơn vị sử dụng
Kết quả dự kiến được ứng dụng tại các cơ quan hoạch định
chính sách hoặc cơ sở ứng dụng KH&CN
Đào tạo/hỗ trợ đào tạo NCS
Đào tạo thạc sĩ

Số lượng
đăng ký

Số lượng
đã hoàn
thành

01

02


02

02

01
01

01
01

Kinh phí
thực hiện
(triệu đồng)

Ghi chú

PHẦN V. TÌNH HÌNH SỬ DỤNG KINH PHÍ
Nội dung chi

TT
A

Kinh phí
được duyệt
(triệu đồng)

Chi phí trực tiếp
18



1
2
3
4
5
6
7
8
B
1
2

Thuê khoán chuyên môn
Nguyên, nhiên vật liệu, cây con..
Thiết bị, dụng cụ
Công tác phí
Dịch vụ thuê ngoài
Hội nghị, Hội thảo, kiểm tra tiến độ, nghiệm thu
In ấn, Văn phòng phẩm
Chi phí khác
Chi phí gián tiếp
Quản lý phí
Chi phí điện, nước
Tổng số

209,015,400

209,015,400

47,840,000


47,840,000

21,250,000
6,894,600

21,250,000
6,894,600

15,000,000

15,000,000

300,000,000

300,000,000

PHẦN V. KIẾN NGHỊ (về phát triển các kết quả nghiên cứu của đề tài; về quản lý, tổ chức thực
hiện ở các cấp)
Nhóm thực hiện đề tài kiến nghị tiếp tục phát triển theo hướng nghiên cứu về tối ưu hóa mô hình
nhằm nâng cao hơn nữa mức độ tin cậy để tăng độ chính xác dự đoán; Hướng nghiên cứu đi từ các
yếu tố ảnh hưởng tới sự phát sinh và lan truyền dịch bệnh sốt rét để đưa ra các giải pháp giảm thiểu
nguy cơ, phòng chống sốt rét nhằm kiểm soát dịch bệnh đảm bảo sức khỏe cho cộng động, phát
triển kinh tế - xã hội.
PHẦN VI. PHỤ LỤC (minh chứng các sản phẩm nêu ở Phần III)

Hà Nội, ngày 14 tháng 02 năm 2019
Đơn vị chủ trì đề tài
(Thủ trưởng đơn vị ký tên, đóng dấu)


Chủ nhiệm đề tài
(Họ tên, chữ ký)

Bùi Quang Thành

19


PHỤ LỤC
1. Mô hình tích hợp Viễn thám, GIS với mô hình khai phá dữ liệu phục vụ đánh giá nguy
cơ mắc bệnh sốt rét tỉnh Đăk Nông
2. Kết quả phân tích đặc điểm tự nhiên, kinh tế - xã hội và ảnh hưởng của chúng tới nguy
cơ mắc bệnh sốt rét ở tỉnh Đăk Nông
3. Kết quả đánh giá nguy cơ mắc bệnh sốt rét tỉnh Đăk Nông ; Bản đồ nguy cơ mắc bệnh
sốt rét tỉnh Đăk Nông tỷ lệ 1/100.000 ( file số)
4. Các giải pháp phòng tránh và giảm thiểu nguy cơ mắc bệnh sốt rét tại tỉnh Đăk Nông
5. Bài báo ISI:
“Understanding spatial variations of malaria in Vietnam using remotely sensed data
integrated into GIS and machine learning classifiers”
6. Bài báo ISI:
“Metaheuristic algorithms in optimizing neural network: a comparative study for forest fire
susceptibility mapping in Dak Nong”
7. Chương sách của nhà xuất bản Springer
“Understanding factors affecting the outbreak of malaria using Locally-Compensated Ridge
Geographically Weighted Regression: Case study in DakNong, Vietnam”
8. Bài báo tạp chí ĐHQG HN
“Combination of Adaptive Fuzzy Inference System and Simulated Annealing Algorithmbased for Malaria Susceptibility Mapping in Daknong Province”
9. Kết quả đào tạo



Quyết định NCS của Hoàng Tuấn Anh



Quyết định HVCH, Biên bản bảo vệ thạc sỹ:
Học viên: Nguyễn Hồng Phường, với đề tài “Ứng dụng viễn thám, hệ thống thông tin
địa lý và các thuật toán tối ưu trong đánh giá nguy cơ sốt rét tại tỉnh Đắk Nông”

20



×