Tải bản đầy đủ (.pdf) (22 trang)

Đề thi phương pháp luận nghiên cứu khoa học (ĐÁP ÁN)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (526.55 KB, 22 trang )

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG

PHƯƠNG PHÁP LUẬN NGHIÊN CỨU KHOA HỌC
BÀI TIỂU LUẬN KẾT THÚC HỌC PHẦN
Giảng viên:

Nguyễn Thị Kim Chi

Sinh viên:

Phạm Thùy Trang

Mã sinh viên:

B19DCVT406

Lớp:

D19CQVT06-B

Số điện thoại:

0965680418

Hà Nội 2022


MỤC LỤC
LỜI MỞ ĐẦU…………………………………………………………………2
Câu 1: Trình tự logic của NCKH gồm những bước nào? Hãy phân tích các bước
đó với một cơng trình nghiên cứu khoa học trong ngành học của em?.....3


1. Trình tự logic của NCKH ........................................................................ 3
2. Phân tích các bước với một cơng trình nghiên cứu khoa học ................. 3
Câu 2: Trình bày cấu trúc của 1 bài báo khoa học. Lấy ví dụ 1 bài báo khoa học
trong ngành học của em và phân tích để thấy rõ các yêu cầu về cấu trúc đó (lưu
ý đính kèm bài báo cùng câu trả lời)…………………………………………….5
1. Trình bày cấu trúc của 1 bài báo khoa học .............................................. 5
2. Ví dụ một bài báo khoa học trong ngành………………………………5
Câu 3: Em hãy tìm hiểu 1 đồ án/khóa luận tốt nghiệp trong ngành học của em
tóm tắt lại các nội dung sau: Tên đồ án; Tác giả, Nơi công bố, Năm công bố;
Mục tiêu nghiên cứu; Cơ sở lý thuyết; Phương pháp thu thập và xử lý thông tin;
Kết quả đạt được; Hạn chế của cơng trình………………………………………8
Câu 4: Em hãy xây dựng đề cương nghiên cứu cho 1 đề tài nghiên cứu khoa học
trong ngành học của bản thân em mà em yêu thích (theo mẫu). .......................... 14
1. Họ tên tác giả ......................................................................................... 14
2. Tên đề tài ............................................................................................... 14
3. Mục tiêu nghiên cứu .............................................................................. 14
4. Ý nghĩa thực tiễn của đề tài ................................................................... 14
5. Tình hình nghiên cứu trong và ngồi nước ........................................... 15
6. Dự kiến kế hoạch thực hiện ................................................................... 19
LỜI CẢM ƠN…………………………………………………………………...21

1


LỜI MỞ ĐẦU
Chúng ta đang sống trong một kỷ nguyên mà mọi thành tựu khoa học và công nghệ đều
xuất hiện một cách hết sức mau lẹ và cũng đang được đổi theo một chu kỳ nhanh chóng.
Ngày nay, nghiên cứu khoa học (NCKH) là một hoạt động then chốt hàng đầu trong
những ngành khoa học. Bộ máy nghiên cứu khoa học đã trở thành khổng lồ, nó đang
nghiên cứu tất cả các góc cạnh của thế giới. Kết quả từ NCKH là những phát hiện mới

về kiến thức, về bản chất sự vật, phát triển nhận thức khoa học về thế giới, sáng tạo
phương pháp và phương tiện kỹ thuật mới có giá trị cao. Sự phát triển của khoa học hiện
đại không những đem lại cho con người những hiểu biết sâu sắc về thế giới, mà còn đem
lại cho con người những hiểu biết về phương pháp nhận thức thế giới. Thực tế cho thấy,
sinh viên khi bắt đầu làm luận văn tốt nghiệp và ngay cả những người mới ra trường làm
việc trong các cơ quan nghiên cứu địi hỏi phải có kiến thức và có phương pháp NCKH.
Vì vậy, mơn học phương pháp luận NCKH học là nền tảng để trang bị cho các sinh viên
tiếp cận NCKH.

2


Câu 1: Trình tự logic của NCKH gồm những bước nào? Hãy phân tích
các bước đó với một cơng trình nghiên cứu khoa học trong ngành học
của em?
1. Trình tự logic của NCKH bao gồm những bước sau:
1. Phát hiện vấn đề (Problem), để lựa chọn chủ đề (topic) nghiên cứu
2. Xác định mục tiêu (objective) nghiên cứu:
3. Nhận dạng câu hỏi (question) nghiên cứu
4. Đưa luận điểm, tức giả thuyết (hypothesis) nghiên cứu
5. Lựa chọn các phương pháp (methods) chứng minh giả thuyết
6. Tìm kiếm các luận cứ (evidence) để chứng minh luận điểm
2. Phân tích cơng trình nghiên cứu khoa học:
Đề tài nghiên cứu khoa học: Thanh toán bằng hình thức ví điện tử tại Việt Nam thực
trạng và giải pháp
1. Phát hiện vấn đề (Problem), để lựa chọn chủ đề (topic) nghiên cứu
- Nhằm thúc đẩy việc sử dụng ví điện tử ở Việt Nam
- Thanh tốn khơng dùng tiền mặt là xu hướng trên tồn thế giới và đang được
đông đảo người dân Việt Nam lựa chọn thay cho hình thức chi trả tiền mặt thơng thường.
Phương tiện thanh toán điện tử đã giúp người dân linh hoạt hơn trong giao dịch, an toàn

trong chi trả.
- Ví điện tử là một dịch vụ mới phát triển trên thế giới, là giải pháp thanh tốn
khơng dùng tiền mặt khá thơng minh hiện nay. Việc thanh tốn bằng ví điện tử đã được
áp dụng ở nhiều cơng ty lớn như Apple, Samsung, Google... đã cho thấy sự hiệu quả của
các hình thức thanh tốn này. Tại Việt Nam hình thức thanh tốn bằng ví điện tử vẫn
cịn khá mới mẻ với nhiều người dân và doanh nghiệp.
- Đây là hình thức thanh tốn có rất nhiều tiềm năng phát triển với nhiều tiện ích
phù hợp với sự phát triển như vũ bão của thương mại điện tử hiện nay.
2. Xác định mục tiêu (objective) nghiên cứu
- nhằm đánh giá những thành cơng, hạn chế, qua đó đề xuất các giải pháp thúc đẩy
phát triển hình thức thành tốn này ở Việt Nam trong thời gian tới.
3. Nhận dạng câu hỏi (question) nghiên cứu
- Ví điện tử là gì? Các loại ví điện tử?
- Ứng dụng của ví điện tử?
- Thực trạng sử dụng và giao dịch bằng ví điện tử?
- Giải pháp nhằm phát triển hình thức thanh tốn bằng ví điện tử tại Việt Nam là
gì?
4. Đưa luận điểm, tức giả thuyết (hypothesis) nghiên cứu

3


- Có thể tìm hiểu thực trạng ứng dụng hình thức thanh tốn bằng ví điện tử tại Việt
Nam Sau đó đưa ra giải pháp nhằm phát triển hình thức thanh tốn bằng ví điện tử tại
Việt Nam.
5. Lựa chọn các phương pháp (methods) chứng minh giả thuyết
- Phương pháp thu thập số liệu: Sử dụng phương pháp kế thừa để thu thập số liệu
thứ cấp là các báo cáo về tình hình sử dụng và thanh tốn qua ví điện tử ở Việt Nam
- Phương pháp xử lý, phân tích số liệu:
+ Phương pháp thống kế mơ tả: Sử dụng để mơ tả q trình hình thành và phát

triển, thực trạng sử dụng và giao dịch bằng hình thức ví điện tử tại Việt Nam
+ Phương pháp thống kê so sánh: Dùng phương pháp này để so sánh biểu phí nạp
tiền, rút tiền, các kênh chuyển tiền và thanh tốn bằng các ví của các doanh nghiệp cung
cấp ví điện tử hiện nay.
6. Tìm kiếm các luận cứ (evidence) để chứng minh luận điểm
Thực trạng sử dụng ví điện tử ở Việt Nam:
-

Hiện nay, có khá nhiều ngân hàng hỗ trợ dịch vụ ví điện tử ở Việt Nam như:
VietcomBank, VietinBank, TechcomBank, Đông Á Bank, MB Bank, BIDV,
VP Bank, SacomBank... và cũng có rất nhiều đơn vị chấp nhận thanh tốn bằng
ví điện tử như: siêu thị điện tử Golmar 7; Công ty Cổ phần thương mại Xuất
nhập khẩu Chọn và Mua; cơng ty TNHH Mytour Việt Nam…

-

Ví điện tử momo: Đây là dịch vụ đầu tiên ở Việt Nam hỗ trợ người tiêu dùng
có thể thực hiện các giao dịch thanh toán điện tử ngay trên điện thoại di động
một cách nhanh chóng và thuận tiện. Đến nay, ứng dụng đã có hơn 1 triệu người
dùng trên 3 hệ điều hành cơ bản (Android, iOS, Windows Phone).

-

Nganluong.vn: Chỉ sau 8 tháng thử nghiệm, Nganluong.vn đã được bình chọn
là ví điện tử ưa thích nhất do Hiệp hội Thương mại Điện tử Việt Nam
(VECOM) và Sở Công thương thành phố Hồ Chí Minh tổ chức đầu năm 2010.
Đến nay NganLuong.vn có trăm nghìn tài khoản ví đã được khởi tạo và hơn
2.000 website sử dụng dịch vụ của nhà cung cấp này…

Giải pháp pháp triển hình thức thanh tốn bằng ví điện tử ở Việt Nam:

-

Cần cộng sinh giữa các đơn vị cung cấp ví điện tử với ngân hàng: Các đơn vị
cung cấp dịch vụ ví điện tử cần phải hợp tác với các ngân hàng để dòng tiền
luân chuyển vào tài khoản ví điện tử một cách tiện lợi và nhanh chóng.

-

Mở rộng tính năng đáp ứng nhu cầu tối đa của khách hàng

-

Hồn thiện khn khổ pháp lý

-

Tăng cường công tác tuyên truyền, quảng bá để khuyến khích sự tiếp cận và sử
dụng dịch vụ ví điện tử của người dân…

4


Câu 2: Trình bày cấu trúc của 1 bài báo khoa học. Lấy ví dụ 1 bài báo
khoa học trong ngành học của em và phân tích để thấy rõ các u cầu
về cấu trúc đó (lưu ý đính kèm bài báo cùng câu trả lời)
1. Cấu trúc của một bài báo khoa học:
- Tiêu đề bài báo (Title): Chỉ tên bài báo, số lượng từ trong tiêu đề bài báo tùy
theo quy định từng tạp chí, thơng thường từ 10-18 từ phản ánh nội dung đề cập
trong bài báo. Dưới tiêu đề bài báo thường là tên tác giả, tập thể tác giả, email,
cơ quan công tác, ngày nhận bài báo và ngày chấp nhận đăng bài báo.

-

Tóm tắt (Abstract): Số lượng từ phần này tùy theo quy định của từng tạp chí,
thơng thường là 100-250 từ. Tóm tắt bài báo thường phải thể hiện vấn đề/mục
tiêu nghiên cứu, phương pháp nghiên cứu, thời gian, số liệu dùng cho nghiên
cứu, kết quả tác giả mới tìm ra, và kết luận. Tất cả được trình bày hết sức ngắn
gọn, cơ đọng. Dưới tóm tắt là từ khóa (Key words) gồm 3 – 5 từ quan trọng có
tần suất lặp lại nhiều.

-

Giới thiệu (Introduction): phần dẫn nhập này thường nói về cơ sở, lý do, tầm
quan trọng của vấn đề tác giả muốn nghiên cứu và cấu trúc của bài báo.

-

Lược sử về nghiên cứu trước đây (Literature review): Một số bài báo khoa
học gộp mục này với mục giới thiệu (introduction) bên trên, tùy vào ý đồ tác
giả, cũng có nhiều trường hợp tách riêng. Phần này tác giả phải nêu những
nghiên cứu quan trọng trước đây trên thế giới đã làm liên quan đến vấn đề mình
nghiên cứu.

-

Phương pháp và số liệu dùng cho nghiên cứu (Methodologies and Data):
Phần này đề cập nghiên cứu sử dụng phương pháp gì.

-

Kết quả và thảo luận (Results and Discussion): Phần này tác giả chỉ ra, giải

thích và thảo luận về các kết quả mình mới tìm thấy mà nghiên cứu trước chưa
tìm ra
Kết luận (Conclusion): Phần kết luận tổng lược kết quả nghiên cứu, nêu bật ý
nghĩa khoa học của kết quả nghiên cứu, ứng dụng của chúng vào thực tế cuộc
sống, hoặc giúp cho việc hoạch định chính sách ra sao (đóng góp (contribution)
của nghiên cứu), ưu nhược điểm của nghiên cứu như thế nào, và những định
hướng cho các nghiên cứu liên quan trong tương lai.

-

-

Tài liệu tham khảo (References): Mục này gồm các tài liệu có trích dẫn hoặc
là cơ sở quan trọng cho việc phân tích logic của nghiên cứu đề cập trong bài
báo.

-

Lời cám ơn (Acknowledgements) nếu có.

2. Ví dụ bài báo cáo trong ngành học:
Tiêu đề bài báo: Giải pháp mạng xếp chồng dịch vụ đảm bảo QoS trong mạng IP
Tác giả: Ks. Nguyễn Thu Hiên, TS. Lê Nhật Thăng, Tạp chí CNTT&TT kỳ 1 (3.2010)
Link:
/>
5


Tóm tắt: Bài báo trình bày tổng quan về mạng xếp chồng dịch vụ (SON) đã và đang
thu hút sự quan tâm của các nhà nghiên cứu mạng trong vài năm gần đây, trong đó có

hướng tới mục đích đảm bảo chất lượng dịch vụ (QoS) cho mạng IP. Đồng thời, bài báo
cũng phân tích một số ưu nhược điểm SON khi đưa vào ứng dụng, cùng một số biện
pháp thực hiện QoS trong SON.
Giới thiệu và Lược sử về nghiên cứu trước đây: Các nỗ lực để mở rộng mơ hình dịch
vụ IP hỗ trợ QoS được bắt đầu vào những năm 1990, với các mơ hình như mơ hình dịch
vụ tích hợp (IntServ) và mơ hình dịch vụ phân biệt (DiffServ). Song việc triển khai các
mơ hình kiến trúc này đã gặp phải một số trở ngại về khả năng mở rộng và sự ngang cấp
khơng tương thích giữa các nhà cung cấp dịch vụ khác nhau. Do vậy, gần đây đã có
nhiều nghiên cứu đề xuất sử dụng mơ hình mạng xếp chồng để đảm bảo QoS, đặc biệt
là QoS từ đầu cuối đến đầu cuối.
Phương pháp và số liệu dùng cho nghiên cứu:
-

Phương pháp tiếp cận được sử dụng để thực hiện định tuyến QoS trong mạng
SON là:
• Cố gắng cân bằng lưu lượng giữa các liên kết xếp chồng và các nút xếp
chồng, đồng thời thỏa mã yêu cầu QoS trong quá trình chọn liên kết xếp
chồng.
• Sử dụng giao thức định tuyến nguồn với cấu trúc mạng phân cấp. Tại mỗi
nút xếp chồng sẽ có cấu trúc mạng tổng thể. Khi có yêu cầu định tuyến, các
nút xếp chồng sẽ sử dụng cấu trúc mạng này và thuật tốn chọn đường dẫn
để tìm đường dẫn gần đúng. Sau đó, nút xếp chồng sẽ trao đổi thông tin với
một số nút xếp chồng khác trên đường dẫn gần đúng đỏ để có được thơng
tin chi tiết và cập nhật về hiệu năng của đường dẫn.


Sử dụng phương thức định tuyến thích nghi. Khi nút xếp chồng nhận biết
được tình trạng dung lượng của liên kết xếp chồng không đáp ứng được cho
lưu lượng xếp chồng hiện đang phục vụ. Nút xếp chồng sẽ thực hiện tìm
kiếm một số đường dẫn xếp chồng dự phịng đấu nối đến các nút xếp chồng

kế cận.


Kết quả và thảo luận: Rõ ràng với những cơ chế hoạt động riêng, giải pháp mạng SON
có thể hiện thực hố việc đảm bảo QoS cho dịch vụ mà không cần thay đổi hoặc bổ sung
thêm tính năng mới cho mạng IP hiện tại. Đổng thời, giải pháp mạng SON có thể triển
khai nhanh chóng thơng qua việc cài đặt ứng dụng vào các trạm đầu cuối. Hơn nữa, giải
pháp này còn đảm bảo cung cấp QoS ngay cả trong trường hợp dịch vụ đa mạng, tránh
được những khó khăn trong việc đảm bảo QoS giữa các miền mạng ngang cấp không
đồng nhất. Bởi việc điều khiển và quản lý chỉ còn chịu sự điều khiển của một nhà khai
thác mạng SON.
Ngoài ra, với khung làm việc QoS chung, giải pháp mạng SON có khả năng cung cấp
QoS độc lập với cơng nghệ QoS được triển khai trong mạng phía dưới để hỗ trợ đa dạng
cho các ứng dụng xếp chồng (như chia sẻ tệp ngang hàng, multicast, ...).
Tuy nhiên, khi cắn thực hiện và triển khai các nút xếp chống với tính thông minh nhất
định, các chức năng của các nút xếp chồng phải được đo kiểm trước khi đưa vào sử dụng
thực tế. Bên cạnh đó, với những cơ chế riêng trong mạng SON có thể ảnh hưởng xấu
đến hoạt động tối ưu của các miền mạng phía dưới, làm cho ma trận lưu lượng của các

6


mạng phía dưới trở nên động hơn, dễ bị thay đổi hơn, giảm hiệu quả của các hoạt động
kỹ thuật lưu lượng (TE) của các ISP phía dưới, làm cho tải trên các liên két IP lớn.
Kết luận: Hiện nay, với xu hướng cung cấp mọi loại hình dịch vụ ở mọi nơi, mọi lúc,
cho mọi đối tượng, trên tất cả các mạng thì vấn đề đảm bảo QoS từ đầu cuối đến đầu
cuối trở thành vấn đề cần được quan tâm hàng đầu. Khi đó, giải pháp mạng xếp chồng
dịch vụ cũng được xem như là một trong những giải pháp cần được hướng đến.
Tài liệu tham khảo:
[1]. YAIR AMIR, CLAUDIU DANILOV, CRISTINA NITA-ROTARU, High Performance,

Robust, Secure and Transparent Overlay Network Service, Proceedings of International
Workshop on Future Directions IntServ Distributed Computing, 2002.
[2]. D. ANDERSEN. H. BALAKRISHNAN, F. KAASHOEK, R. MORRIS, Resilient
Overlay Networks, 18th Symposium on Operating Systems Principles, (December 2001).
[3]. Z. DUAN, Z.-L. ZHANG, and Y. T. HOU, Service overlay networks: SLAS, QoS, and
Bandwidth Provisioning, ICNP'02: Proceedings of the 10th IEEE International Conference on
Network Protocols, (Washington, DC, USA), pp.334-343, IEEE Computer Society, 2002.
[4]. X. GU, K. NAHRSTEDT, R. N. CHANG, and C. WARD, QoS-Assured Service.
Composition in Managed Service Overlay Network, in Proceedings of IEEE 23rd
International Conference on Distributed Computing Systems, 2003.
[5]. R.KERALAPURA, N. TAFT, C. CHUAH, and G. IANNACCONE. "Can ISPs take the
heat from Overlay Networks?" In ACM SIGCOMM Workshop on Hot Topics in Networks,
November, 2004.
[6] L. LAO, S.S.GOKHALE, and J.HONG CUI, "Distributed QoS Routing for Backbone
Overlay Network", Lectures Notes IntServ Computer Science, Springer, Vol.3976/2006,
pp.1014-1025,
2006.
[7]. KEVIN Y. K. LIU, JOHN C. S. LUI, ZHI-LI ZHANG, Distributed Algorithm for Service
Replication in Service Overlay Network, NETWORKING 2004: pp.1156-1167, May 2004.
[8]. QIU, LILI and YANG, RICHARD YANG and ZHANG, YIN and SHENKER, Scott (2003)
"On Selfish Routing in Internet-Like Environments", in Proc. ACM SIGCOMM, pages 151162, August
2003
[9]. S. SAVAGE, "Sting: a TCP-based Network Performance Measurement Tools," In Proc.of
the 2nd USENIX Symposium on Internet Technologies and Systems, pp.71-79, Oct.1999.
[10]. L. SUBRAMANIAN, I. STOICA, H. BALAKRISHNAN, and R.
H. KATZ, Over QoS: An Overlay based Architecture for Enhancing Internet QoS, NSDI'04:
Proceedings of the 1st conference on Symposium on Networked Systems Design and
Implementation, (Berkeley, CA, USA), p.6, UNENIX Association, 2004.
[11]. H. T. HUNG and T.ZIEGLER, On the Service Overlay Concept for End-to-End QoS
Assurances, Technical Report, 2005.

[12]. L. ZHI and P. MOHAPATRA, "QRON: QoS-aware Routing in Overlay Networks,
"IEEE. J. Select. Areas Commun., vol. 22, pp. 29-40, January 2004.

7


Câu 3: Em hãy tìm hiểu 1 đồ án/khóa luận tốt nghiệp trong ngành học
của em tóm tắt lại các nội dung sau: Tên đồ án; Tác giả, Nơi công bố,
Năm công bố; Mục tiêu nghiên cứu; Cơ sở lý thuyết; Phương pháp thu
thập và xử lý thông tin; Kết quả đạt được; Hạn chế của cơng trình.
Tên đồ án: Phát hiện sớm mã độc IoT BOTNET trên các thiết bị IoT
Tác giả: Nguyễn Việt Dũng
Nơi công bố: Học viện bưu chính viễn thơng
Năm cơng bố: 2021
Mục tiêu nghiên cứu:
-

Nghiên cứu phương pháp phát hiện sớm mã độc IoT BOTNET dựa trên công
nghệ học máy và kết hợp nhiều nguồn dữ liệu hành vi của mã độc.

Cơ sở lý thuyết:
-

-

IoT là một cơ sở hạn tầng toàn cầu trong xã hội thơng tin, nó cho phép các dịch
vụ thơng minh hoạt động bằng cách kết nối các vật thể bao gồm cả vật lý và ảo
dựa trên các công nghệ thơng tin truyền thơng phù hợp hiện có và đang phát
triển. Từ khái niệm thiết bị IoT cho thấy rằng mơi trường IoT, có rất nhiều loại
thiết bị IoT khác nhau như: điện thoại di động thơng minh, máy tính cá nhân,

đồng hồ thông minh, smart TV, máy in, máy quét, IP Camera, thiết bị định
tuyến, thiết bị gia dụng thơng minh có kết nối Internet,…. Các thiết bị IoT có
mặt ở mọi nơi, hầu hết các nghành nghề, các mặt của đời sống con người như
y tế, quản lý dây truyền sản xuất, quản lý năng lượng, hệ thống giao thơng
thơng minh …. Ngồi các tiện ích đem lại và sự có mặt trong nhiều mặt của
cuộc sống, ngành nghề thì các thiết bị IoT cũng được dự báo sẽ đóng góp lớn
vào nền kinh tế tồn cầu.
Những đặc điểm của thiết bị IoT cỡ nhỏ:
• Mơi trường hoạt động ít chịu sự điều khiển trực tiếp của con người: Các
thiết bị IoT có tính di động và tự hành cao theo các kịch bản hoạt động được
cài đặt sẵn, hiếm khi cần sự điều khiển trực tiếp của con người.
• Tính đa nền tảng phần cứng và phần mềm: Khác với các thiết bị điện tử
truyền thông như máy tính đa phần sử dụng vi xử lý kiến trúc i386 thì các
thiết bị IoT cỡ nhỏ thường sử dụng nhiều loại các kiến trúc vi xử lý tiêu thụ
năng lượng thấp như: MIPS, ARM, PowerPC ,..
• Tài nguyên phần cứng hạn chế: Các thiết bị IoT cỡ nhỏ thường được trang
bị các phần cứng hạn chế tài nguyên dung lượng bộ nhớ ít, năng lực tính
tốn nhỏ, năng lượng pin dự trữ cho thời gian hoạt động ngắn.
• Trạng thái động: Trạng thái của các thiết bị IoT thay đổi linh hoạt, ví dụ
như lúc hoạt động và ngủ chờ, lúc kết nối và ngắt kết nối… phụ thuộc vào
hồn cảnh của các thiết bị gồm vị trí, chức năng và tốc độ di chuyển.
• Khả năng kết nối đa kênh: Các thiết bị IoT có khả năng kết nối với các thiết
bị và hạ tầng truyền dẫn theo nhiều giao thức khác nhau như Wifi,
Bluetooth, Zigbee, Z-wave, …

8


-


-

-

Mã độc IoT Botnet: là mã độc cho phép xây dựng mạng lưới Botnet dựa trên
các thiết bị IoT cỡ nhỏ.
Mã độc IoT Botnet chứa hầu hết hai thành phần cơ bản và bốn thành phần hỗ
trợ gồm:
• Mã độc botnet thực hiện tấn cơng DdoS khi nhận lệnh;
• Máy chủ C&C để điều khiển mã đọc botnet; Bộ Scanner để dị qt các thiết
bị IoT mới có thể bị khai thác;
• Máy chủ reporting có chức năng thu thập các dữ liệu dò quét của mã độc
botnet hoặc bộ Scanner;
• Bộ Loaders được sử dụng để đăng nhập vào các thiết bị IoT có thể bị khai
thác, và ra chỉ thị cho chúng tải về các tệp tin thực thi mã độc có kiến trúc
phù hơp;
• Máy chủ phân phối mã độc xác định vị trí lưu trữ mà đọc sẽ được tải về bởi
các thiết bị IoT đã bị lây nhiễm.
Cơ chế hoạt động chung cho hầu hết mã độc IoT botnet như sau:
• Bước 1: Mã độc dị qt dải địa chỉ IP ngẫu nhiên thơng qua TCP cổng
23/2323 để tìm kiếm các thiết bị IoT có lỗ hổng bảo mật để xâm nhập, lây
nhiễm mở rộng mạng lưới máy tính botnet.
• Bước 2: Sau khi dị quét được thiết bị có khả năng xâm nhập và đã thu thập
được thông tin để xác thực và leo thang đặc quyền trên các thiết bị thì mã
độc sẽ gửi những thông tin đặc trưng của thiết bị về máy chủ Report thơng
qua các cổng dịch vụ khác.
• Bước 3: Mã độc nhận lệnh từ C&C để kiểm tra thông tin đặc tả cảu thiết bị
như địa chỉ IP, kiến trúc phần cứng (MIPS, ARM, …)
• Bước 4: Sau khi máy chủ C&C tiếp nhận thông tin đặc tả về thiết bị thì sẽ
ra lệnh cho máy chủ Loader lựa chọn tập tin thực thi mã độc phù hợp.

• Bước 5: Máy chủ Loader gửi tới thiết bị muốn xâm nhập tập tin mã độc phù
hợp. Ngay sau khi tập tin mã đọc được tải về và thực thi trên thiết bị thì mã
đọc sẽ xóa tập tin thực thi và chỉ chạy trong bộ nhớ RAM để tránh bị phát
hiện, đồng thời mã đọc sẽ tắt các dịch vụ cho phép truy cập từ xa như Telnet,
SSH, vô hiệu hóa các chức năng của tường lửa.
• Bước 6 và 7: Thơng qua C&C kẻ tấn cơng có thể ra lệnh cho mã đọc thực
hiện các tấn công từ chối dịch vụ phân tán bằng nhiễu kỹ thuật như UDF
flood, GRE IP flood… tới một mục tiêu cụ thể.
Ngày nay với xu hướng mã đọc trên thiết bị IoT đặc biệt mà mã đọc IoT botnet
đang tăng trưởng không ngừng cả về số lượng và biến thể, kéo theo đó các dữ
liệu về chữ ký và hành vi mã đọc cũng tăng với số lượng lớn khiến việc xử lý,
phân tích được thực hiện bằng con người trở nên khó khăn. Nhằm khắc phục
các vấn đề trên, hiện nay các nhà nghiên cứu tiếp cận các phương pháp phát
hiện mã đọc dựa trên học máy. Phương pháp dựa trên học máy không sử dụng
chữ ký hay hành vi mã đọc cụ thể mà nó sử dụng các đặc trưng và các đặc trưng
này được xem là thành phần lõi của phát hiện dựa trên học máy. Thông qua
việc khảo sát có thể thấy, tất cả các hướng tiếp cận trên được nhóm thành hai
phương pháp chính là phân tích tĩnh và phân tích động.

9


• Phân tích tĩnh: là phương pháp phân tích nội dung của mã nguồn mà không
cần thực thi các tệp tin để phát hiện các hành vi nghi vấn. Phương pháp
phân tích tĩnh cho phép chi tiết hóa tồn bộ luồng điều khiển và luồng dữ
liệu thông qua các công cụ dịch ngược mã nguồn để phát hiện mã độc bằng
phân tích đặc trưng như mã thực thi, lời gọi hàm hệ thống hay các chuỗi ký
tự có nghĩa trong mã nguồn. Phương pháp này cho phép phân tích chi tiết
các tệp tin và đưa ra các khả năng kích hoạt của mã độc. Với những nghiên
cứu được khảo sát, phân tích tĩnh đem lại kết quả khả quan trong bảo mật

IoT nói chung và phát hiện mã độc IoT nói riêng. Tuy nhiên, phân tích tĩnh
vẫn tồn tại nhiều hạn chế cho việc phân tích, phát hiện mã độc IoT Botnet
như: Khó áp dụng đối với mã độc sử dụng kỹ thuật gây rối (obfuscation)
hoặc đóng gói (pack) phức tạp do hạn chế của cơng cụ Unpack và Debug;
Khó thu thập mẫu mã độc do mã độc chi lưu trữ trên RAM thiết bị, và biến
mất khi khởi động lại thiết bị; Kết quả dịch ngược có thể khơng chính xác
do các tùy chọn biên dịch khác nhau của công cụ dịch ngược đối với các
nền tảng CPU đa dạng của các thiết bị IoT. Vì vậy, với bài toán phát hiện
mã độc IoT Botnet trên các thiết bị IoT hiện nay, hướng tiếp cận dựa trên
phân tích tĩnh trở nên khó thực hiện.
• Phân tích động là phương pháp giám sát các hành vi trong khi các tập tin
đó đang chạy, từ đó phát hiện có hay khơng các hành vi độc hại, bất thường.
Môi trường thực thi các tập tin thường là một môi trường mô phỏng (như
sandbox) hoặc các thiết bị IoT thực tế (như cài đặt các tác tử). Những thông
tin được thu thập như các hành vi mức hệ thống (syscall, giá trị thanh ghi,
dữ liệu bộ nhớ), các hành vi mức mạng (dữ liệu luồng mạng peap). Phân
tích động sẽ loại bỏ được các kỹ thuật gây rối mã nguồn, không dịch ngược
được mã nguồn tệp tin thường gặp trong phân tích động. Tuy nhiên, khó
khăn khi thực hiện phân tích động là việc xây dựng môi trường cho phép
mã độc bộc lộ hồn tồn các hành vi và có khả năng giám sát đầy đủ các
hành vi đó. Việc sử dụng phân tích động để phát hiện IoT Botnet có thể
được phân loại theo hai phương pháp chính là phát hiện xâm nhập dựa trên
dữ liệu mạng (Network-based Intrusion Detection System – NIDS) và phát
hiện xâm nhập dựa trên dữ liệu máy chủ (Host-based Intrusion Detection
System – HIDS). Qua việc khảo sát các nghiên cứu trên về việc phát hiện
mã độc Botnet sử dụng phương pháp phân tích động cho thấy, phần lớn các
nhà nghiên cứu chú tâm vào việc phát hiện mã độc dựa trên luồng mạng
NIDS. Tuy nhiên hướng tiếp cận này chỉ phát hiện được IoT botnet khi thiết
bị đã bị lây nhiễm và bắt đầu truyền thông đến các máy chủ lệnh và điều
khiển, các bot khác hoặc chúng thực hiện tấn cơng. Hình thức hiện mã độc

dựa trên dữ liệu máy chủ HIDS có thể khắc phục được nhược điểm này.
Tuy nhiên các thiết bị IoT khác với các thiết bị điện tốn truyền thống vì
chúng hạn chế về tài nguyên xử lý cũng như năng lượng. Hơn nữa với sự
phát triển thần tốc về số lượng cũng như sự đa dạng về chức năng khiến cho
các thiết bị IoT trở nên bất đồng nhất cả về kiến trúc phần cứng, giao tiếp
truyền thông cũng như trạng thái hoạt động. Do đó, hướng tiếp cận phát
hiện mã độc chỉ bằng HIDS là khó khăn và chưa đầy đủ.

10


Phương pháp thu thập và xử lý thông tin:
-

Xây dựng mơ hình học máy phát hiện sớm mã độc IoT Botnet
• Để đáp ứng được u cầu phân loại chính xác trong việc sử dụng các bộ
phân loại học máy, mơ hình học máy cộng tác đã được luận văn đưa vào sử
dụng để tăng hiệu suất dự đoán của mơ hình. Mơ hình học máy cộng tác
đưa ra dự đoán từ việc sử dụng các bộ phân loại con và tổng hợp dự đoán
từ những bộ phân loại này để đưa ra quyết định. Từ những điểm đã nêu trên,
trong phần này luận văn sẽ xây dựng mơ hình học máy phát hiện sớm mã
độc IoT Botnet sử dụng các bộ dữ liệu có đặc trưng về thời gian của thiết
bị, thực hiện các phương pháp chọn lọc và chuẩn hóa dữ liệu, áp dụng mơ
hình học máy cộng tác các bộ phân loại con thích hợp cho bài toán phát
hiện sớm mã độc IoT Botnet.

-

Học máy cộng tác là quá trình sử dụng các bộ phân loại và kết hợp kết quả dự
đoán của các bộ phân loại này để tạo nên một mơ hình đưa ra quyết định phức

tạp nhưng cải thiện hiệu năng dự đoán hơn so với các bộ phân loại con. Phương
pháp kết hợp có thể linh hoạt dựa trên đặc trưng, hoặc kết quả phân loại.

-

Dựa vào phương thức kết hợp dữ liệu có thể chia các mơ hình học cộng tác
thành 3 nhóm chính:

-

-



Hợp nhất sớm: là phương pháp hợp nhất các dữ liệu đầu vào bằng cách tạo
ra một tập dữ liệu đại diện cho các tập dữ liệu con đơn lẻ. Tập dữ liệu đại
diện này được sinh ra bằng cách nối các đặc trưng của các tập dữ liệu con
vào với nhau để tạo thành tập dữ liệu đại diện có chứa tất cả các đặc trưng
của các tập dữ liệu con. Sau khi đã có được tập đại diện thì mơ hình phân
loại sử dụng một thuật tốn học máy duy nhất để thực hiện quá trình phân
loại dữ liệu đại diện.



Hợp nhất muộn: là phương pháp cho phép các tập hợp các kết quả phân loại
của các bộ học máy phân loại (Classifier) đơn lẻ thông qua hàm hợp nhất
(Fusion). Mỗi một bộ dữ liệu đặc trưng đầu vào sẽ được huấn luyện và phân
loại dựa trên các thuật toán học máy riêng biệt. Kết quả phân loại sẽ được
tổng hợp để đưa ra quyết định cuối cùng.




Hợp nhất trung gian: là cách hợp nhất các đặc trưng qua việc sử dụng các
lớp ẩn. Các đặc trưng đầu vào sẽ được đưa vào các thuật toán học máy có
lớp ẩn để tìm ra các đặc trưng có liên quan tới mục tiêu phân loại. Kết quả
phân loại từng bộ dữ liệu riêng lẻ này sẽ được đưa qua lớp hợp nhất và quyết
định cuối cùng cũng sử dụng một lớp ẩn để tổng hợp kết quả.

Các mô hình học máy cộng tác kể trên đều có ưu điểm và nhược điểm, bằng
việc nghiên cứu lý thuyết và qua quá trình thực nghiệm, luận văn đã lựa chọn
sử dụng phương pháp hợp nhất muộn cho bài toán phát hiện sớm mã đọc IoT
Botnet và đạt được hiệu quả khả quan.
Tổng qt của mơ hình học máy có 5 phần chính để trích xuất và xử lý dữ liệu
giúp đưa ra quyết định:

11


• Bộ phận thu thập dữ liệu: Luận văn đã tìm được một số mơi trường được
xây dựng cho việc thu thập dữ liệu hành vi trong bài toán phát hiện mã độc
trên các thiết bị IoT cỡ nhỏ như IoTBOX, Cuckoo, REMNUX, Limon và
V-SandBox. Sandbox có đầy đủ tính năng hơn so với các môi trường khác.
Với đầu vào là các tệp định dạng ELF, môi trường V-Sandbox tự động tạo
môi trường phù hợp cho phép tệp này thực thi và giám sát các hành vi tương
tác với hệ điều hành.
• Bộ phận tiền xử lý và chuẩn hóa dữ liệu: Trong bài toán phát hiện mã độc
IoT Botnet, các hành vi thường được những nhà nghiên cứu sử dụng để
nhận biết dấu hiệu của chúng thường là: các lời gọi hệ thống, các gói tin
trao đổi trong mạng và các thay đổi về tài nguyên của hệ thống. Do đó, luận
văn sử dụng ba loại hành vi phổ biến kể trên để thu thập dữ liệu phục vụ

cho đánh giá khả năng phát hiện mã độc IoT Botnet của mơ hình ứng dụng.
• Bộ phận trích chọn đặc trưng: Trích chọn đặc trưng giúp loại bỏ các đặc
trưng thừa, khơng đóng góp nhiều vào q trình phân loại của mơ hình,
cũng như các đặc trưng gây nhiễu, gây ảnh hưởng đến hiệu quả của bộ phân
loại. Do đó, trích chọn đặc trưng vừa giúp nâng cao độ chính xác cho mơ
hình, vừa giảm thiểu tình trạng q khớp. Trích chọn đặc trưng làm giảm
chiều vecto đặc trưng đầu vào, qua đó đẩy nhanh tốc độ tính tốn, giúp mơ
hình hội tụ nhanh hơn.
• Bộ tổng hợp dự đốn: Quá trình kết hợp kết quả phát hiện các bộ phân loại
học máy khác nhau cần đến sự tham gia của một hàm tổng hợp. Trong học
máy, các hàm tổng hợp kết quả phổ biến được sử dụng như Voting,
Stacking, Bagging và Boosting. Luận văn lựa chọn phương pháp bầy chọn
(Voting) để áp dụng cho bài toán phát hiện sớm của mình dựa trên kết quả
thực nghiệm. Kết quả cuối cùng của một dự đoán được thực hiện bởi đa số
“phiếu bầu” theo hai chiến lược khác nhau là biểu quyết cứng và biểu quyết
mềm.
Kết quả đạt được:
-

Sau khi thực nghiệm có thể đánh giá mơ hình ứng dụng có khả năng phát hiện
chính xác với ACC = 99.23%. Kết quả thực nghiệm này cho thấy hiệu quả của
việc sử dụng mơ hình học máy cộng tác cho 3 loại dữ liệu hành vi phổ biến
trong phát hiện IoT Botnet. Sử dụng Information Gain để trích chọn đặc trưng,
cách kết hợp các bộ phận lớp sử dụng thuật toán học máy với nhau trong một
mơ hình cộng tác đã góp phần làm tăng hiệu quả phát hiện của mơ hình. Mơ
hình kết hợp đã cho kết quả phát hiện vượt trội hơn các mơ hình học máy đơn
lẻ. Khả năng phát hiện sớm của mơ hình cũng được thể hiện ở đặc điểm chỉ lấy
một phần nhỏ lượng dữ liệu đặc trưng cho các hành vi đầu tiên của tệp đầu vào
đang được xử lý để thực hiện phân tích và phát hiện mã độc thay vì phải đợi
mã độc thực hiện đầy đủ hành vi để thu thập và xử lý với tồn bộ dữ liệu. Qua

đó, luận văn đã đạt được một số kết quả như sau:
• Nghiên cứu, lựa chọn, ứng dụng và xây dựng thử nghiệm thành cơng mơ
hình học máy cộng tác trong phân tích và phát hiện mã độc IoT Botnet.

12


• Thử nghiệm phát hiện mã đọc với các mô hình học máy đơn lẻ và so sánh
đánh giá với mơ hình học máy đã xây dựng. Kết quả cho thấy hiệu suất phát
hiện được cải thiện vượt trội so với việc sử dụng các bộ học máy đơn lẻ.
• Đem lại khả năng ứng dụng trọng thực thể khi mơ hình cho ra kết quả phát
hiện trong thời gian ngắn và chỉ yêu cầu lượng dữ liệu đầu vào nhỏ ngay
khi mã đọc bắt đầu thực hiện hành vi. Do đó giảm thiểu được hậu quả của
mã độc gây ra với thiết bị và hệ thống thông tin.
-

Kết quả của luận văn góp phần bổ sung vào các nghiên cứu phát hiện mã đọc
IoT Botnet dựa trên phương pháp phân tích động và tiềm năng ứng dụng cao.
Một số nội dung nghiên cứu trong luận văn cũng được chấp nhận công bố trên
Kỷ yếu hội nghị quốc tế lần thứ 3 về Điện tử, truyền thông và khoa học máy
tính (ICECCE) với bài báo “Adversaral Attack and Defense on Graph-based
IoT Botnet Detection Approach”.

Hạn chế của cơng trình:
-

Luận văn vẫn còn một số hạn chế, vướng mắc ở phần xử lý sandbox vì khơng
gian tài ngun u cầu lớn, thời gian khởi động chậm. Ngoài ra khi chạy VSandbox để thu thập hành vi dữ liệu của một số mẫu thì có thể xảy ra việc thực
hiện vịng lặp để thu thập thêm dữ liệu cho mỗi lần chạy khiến cho thời gian
xử lý 1 mẫu lến đến 3 phút.


13


Câu 4: Em hãy xây dựng đề cương nghiên cứu cho 1 đề tài nghiên cứu khoa học
trong ngành học của bản thân em mà em yêu thích (theo mẫu)
BỘ THƠNG TIN VÀ TRUYỀN THƠNG

CỘNG HỒ XÃ HỘI CHỦ NGHĨA VIỆT NAM

HỌC VIỆN CÔNG NGHỆ BCVT

Độc lập - Tự do - Hạnh phúc
Hà nội, ngày

tháng

năm

ĐỀ TÀI NGHIÊN CỨU KHOA HỌC
1. Họ tên tác giả: Phạm Thùy Trang
2. Tên đề tài: Nghiên cứu các mơ hình học máy với dữ liệu y tế và ứng dụng trong
sàng lọc bệnh tiểu đường
3. Mục tiêu nghiên cứu
Qua nghiên cứu các mơ hình máy học và ứng dụng trong chẩn đoán bệnh với dữ liệu
y tế, lập trình chương trình thực nghiệm với bộ dữ liệu thực, một số kết quả cần đạt
được như sau:
- Nắm được bản chất học máy và các mô hình học máy.
- Hiểu được tính thực tế của học máy tới nền y tế thông qua các ứng dụng học
máy.

- Áp dụng mơ hình học máy để xây dựng phần mềm chẩn đốn bệnh nhân có bị
tiểu đường hay không trên bộ dữ liệu thực.
- Rút ra được độ thực tiễn và ý nghĩa khoa học của việc áp dụng học máy vào
trong ứng dụng chẩn đoán bệnh với dữ liệu y tế.
4. Ý nghĩa thực tiễn của đề tài
Học máy (machine learning) đang đóng một vai trị cực kỳ quan trọng trong cuộc
cách mạng cơng nghiệp 4.0, nó đã thúc đẩy sự phát triển rất nhiều ngành, trong
đó có ngành y tế cũng được thúc đẩy mạnh mẽ. Phân tích dữ liệu lớn bằng học
máy mang lại lợi thế đáng kể cho việc đồng hóa và đánh giá một lượng lớn dữ
liệu chăm sóc sức khỏe phức tạp. Ưu điểm của học máy bao gồm tính linh hoạt
và khả năng mở rộng so với các phương pháp thống kê sinh học truyền thống,
việc này giúp học máy có thể triển khai cho nhiều nhiệm vụ khác nhau, ví dụ như
phân tầng rủi ro, chẩn đoán, phân loại và dự đốn tỷ lệ sống. Một ưu điểm khác
của mơ hình học máy là khả năng phân tích các loại dữ liệu khác nhau như hồ sơ
y tế, dữ liệu nhân khẩu học, dữ liệu xét nghiệm y tế, dữ liệu hình ảnh và áp dụng
chúng vào các tiên lượng, chẩn đoán về nguy cơ mắc bệnh, phương pháp điều trị
thích hợp. Mặc dù có những ưu điểm này, việc áp dụng học máy trong y tế vẫn
gặp nhiều khó khăn vì cơng việc thu thập dữ liệu bệnh nhân là khơng dễ dàng,
nếu khơng có sự cho phép của bệnh nhân thì việc sử dụng dữ liệu của bệnh nhân
đó cho bất cứ mục đích gì đều sẽ vi phạm pháp luật.
Tại Việt Nam, việc áp dụng học máy trong việc chẩn đốn bệnh đã được áp dụng
thành cơng trong y tế, điển hình là phương pháp chẩn đốn bệnh qua hình ảnh
với tỉ lệ chính xác cao của các bệnh viện lớn như bệnh viện Việt Nam Cuba, bệnh
Quân y 103, …. Tuy nhiên, vì việc thu thập dữ liệu cịn khó khăn bao gồm sự cần

14


cho phép của bệnh nhân và sự đồng ý chia sẻ giữa các bệnh viện nên việc áp dụng
học máy chưa được rộng rãi trong các bệnh viện khác.

Việc áp dụng học máy, trí tuệ nhân tạo đóng góp to lớn vào việc hỗ trợ bác sỹ,
chuyên gia trong chẩn đoán, điều trị bệnh. Luận văn này thực hiện một đề tài
nghiên cứu về các mơ hình học máy ứng dụng trong y học với các dạng dữ liệu
y tế khác nhau và thử nghiệm với một bài toán cụ thể là sàng lọc bệnh tiểu đường.
5. Tình hình nghiên cứu trong và ngoài nước
5.1 Ngoài nước:
-

-

Trong 5 năm trở lại đây, sự bùng nổ của dữ liệu lớn và năng lực tính tốn đã
giúp cho các mơ hình AI đạt được những bước tiến vượt bậc. Các đột phá trong
nghiên cứu cơ bản và nghiên cứu ứng dụng về AI trong y tế liên tiếp được công
bố và đưa vào triển khai thực tế. Nói một cách vắn tắt, các mơ hình AI có thể
tham gia hỗ trợ bác sĩ trong tồn bộ quy trình khám chữa bệnh lâm sàng dựa
trên hình ảnh y tế. AI cho phép tạo ra các hình ảnh y khoa nhanh hơn, chất
lượng hơn với giá thành rẻ hơn. Việc phân tích, chẩn đốn bệnh và tự động
xuất báo cáo… cũng đều có thể đảm nhiệm bởi các thuật toán AI. Trong các
tác vụ trên, AI được đã được ứng dụng rộng rãi nhất nhằm phục vụ chẩn đốn
bệnh dựa trên hình ảnh , đặc biệt là phát hiện sớm các bệnh lý liên quan đến
ung thư .
Năng lực của một hệ thống AI trong chẩn đốn hình ảnh (CĐHA) y tế có thể
chia làm 3 mức độ:
• (1) Detection: phát hiện các bất thường tiềm tàng từ hình ảnh, phân loại
giữa các hình ảnh bệnh nhân mắc bệnh và bệnh nhân không mắc bệnh. Chức
năng này của AI giúp giải quyết các bài toán sàng lọc diện rộng hoặc tối ưu
việc phân luồng bệnh nhân theo tính ưu tiên.
• (2) Characterization: đặc tả các tính chất của tổn thương, tiến hành khoanh
vùng, phân loại mức độ nguy hiểm theo các tiêu chuẩn y khoa. Ví dụ phân
loại mức độ ung thư hố của một tổn thương.

• (3) Monitoring: giám sát và đánh giá sự tiến triển của các tổn thương trên
hình ảnh. Theo dõi và đánh giá theo thời gian thực các tình huống khẩn cấp
nguy hiểm tới tính mạng của người bệnh.

-

Sự thiếu hụt nguồn lực y tế so với nhu cầu là một thực tế trên toàn thế giới hiện
nay. Theo thống kê, tại Nhật Bản chỉ có 36 bác sĩ CĐHA/triệu dân. Cả Liberia
chỉ có 2 bác sĩ CĐHA và 14 quốc gia tại châu Phi khơng có bác sĩ CĐHA. Ngay
cả đối với những quốc gia phát triển nhất, sự thiếu hụt nguồn nhân lực cũng là
một vấn đề nhức nhối. Tại Anh, ước tính có hơn 300.000 hình ảnh X-quang
phải chờ đến hơn 30 ngày trước khi được phân tích [8] tại một thời điểm bất kỳ
trong năm. AI được coi là xu hướng tất yếu và là công cụ mạnh nhất giúp bù
đắp những thiếu hụt này. Một loạt các công cụ AI mới đã được phát triển và
ứng dụng trong phân tích và chẩn đốn nhiều phương thức hình ảnh khác nhau
như X-quang phổi, X-quang vú, CT/MRI sọ não. Tại Mỹ, một số phần mềm AI
đã được Cục quản lý Thực phẩm và Dược phẩm Hoa Kỳ (FDA) cấp giấy phép
hoạt động. Chẳng hạn, phần mềm chẩn đoán đột quỵ não do thiếu máu cục bộ
cấp tính dựa trên phân tích hình ảnh CT não của Viz.AI. Thử nghiệm lâm sàng
cho thấy hệ thống AI của Viz.AI giúp giảm thiểu tới 45% thời gian chẩn đoán

15


và chăm sóc bệnh nhân, điều này đồng nghĩa với việc nhiều bệnh nhân sẽ được
cứu sống hơn.
• Với sự phát triển nhanh chóng của cơng nghệ, lượng thơng tin mới từ các
cơng trình nghiên cứu ngày càng nhiều và nhanh hơn. Hiện nay, lượng
thông tin y khoa đã tăng gấp đôi cứ sau mỗi 3 năm. Người ta ước tính rằng
nếu một bác sĩ muốn cập nhật tồn bộ thơng tin y khoa thì phải đọc 29 giờ

mỗi ngày. Ngoài ra, nguồn dữ liệu lớn (big data), bao gồm các dữ liệu
từ hồ sơ sức khoẻ điện tử (EHR), các dữ liệu “omic” - dữ liệu về di truyền
học (genomics), dữ liệu về chuyển hóa (metabolomics) và dữ liệu về
protein (proteomics), và dữ liệu về xã hội học và lối sống là những nguồn
dữ liệu sẽ khơng có ích nếu khơng được phân tích tồn diện. Giải pháp duy
nhất để có thể tiếp cận và sử dụng khối lượng thơng tin khổng lồ trong lĩnh
vực y tế đó là sử dụng cơng nghệ trí tuệ nhân tạo (Artificial Intelligence –
AI). IBM Watson là một trong những hệ thống hàng đầu hỗ trợ chăm sóc
sức khỏe bằng AI, giúp các bác sĩ đưa ra quyết định hiệu quả. Với khả năng
máy học (machine learning) và khả năng xử lý ngôn ngữ tự nhiên, hệ thống
này giúp các bác sĩ xem xét hồ sơ sức khoẻ điện tử của bệnh nhân và cập
nhật thông tin hướng dẫn điều trị từ các cơng trình nghiên cứu y khoa. Một
nghiên cứu mù đơi đã so sánh các quyết định của hội đồng các chuyên gia
ung thư với quyết định của trí tuệ nhân tạo từ hệ thống ung thư Watson. Kết
quả cho thấy 90% các khuyến nghị mà hệ thống đưa ra là phù hợp với các
khuyến nghị của hội đồng các chuyên gia, nhưng hệ thống chỉ mất 40 giây
để hoàn tất quy trình.
• Năm 2009, Bộ Y tế Hoa Kỳ bắt đầu khuyến khích áp dụng EHRs. Tuy
nhiên, q trình thực hiện đã gặp nhiều thách thức, các rào cản chính bao
gồm sự hài lòng thấp của nhân viên y tế với hệ thống EHR, nhất là các vấn
đề về khả năng tương tác và độ trễ trong thực hành hồ sơ sức khoẻ điện tử,
nhất là tại các cơ sở chăm sóc ban đầu. Hiện nay, EHR đã trở thành một
trong những công việc tiêu tốn nhiều thời gian nhất của nhân viên y tế tại
các cơ sở chăm sóc sức khỏe. Cơng nghệ AI hứa hẹn có thể giúp các nhà
cung cấp dịch vụ chăm sóc sức khỏe thu thập, lưu trữ, định dạng lại và theo
dõi dữ liệu lâm sàng, cũng như các kế hoạch và đánh giá cá nhân hóa.
• Tại Mỹ, ước tính tỷ lệ lỗi chẩn đoán ngoại trú là 5,08% tương đương 12
triệu người mỗi năm. Khoảng một nửa trong số các lỗi này là có khả năng
gây hại. Cơng nghệ AI đã được sử dụng để cải thiện chất lượng chẩn đoán,
đặc biệt là trong X quang. AI dựa trên nguồn dữ liệu 129.450 hình ảnh lâm

sàng để chẩn đốn bệnh ngồi da, kết quả đã chứng minh rằng hệ thống này
có thể phân loại ung thư da ở mức tương đương với các bác sĩ da liễu. Một
thuật tốn dựa trên hình ảnh cộng hưởng từ của chuyển động tim cho phép
dự đốn chính xác kết quả bệnh nhân bị tăng áp phổi; một phương pháp
phân loại nhịp tự động trong phân tích điện tâm đồ liên tục (ECGs) ở những
bệnh nhân mắc bệnh nghiêm trọng. Một nghiên cứu khác đã xem xét các
kết quả đầy hứa hẹn sử dụng AI trong hình ảnh đột quỵ và cho rằng cơng
nghệ AI có thể đóng một vai trị quan trọng trong việc quản lý bệnh nhân
đột quỵ.
• Watson của IBM ứng dụng học máy vào hỗ trợ phân loại các khối u theo
loại di truyền, cho phép bác sĩ đưa ra phương pháp điều trị hiệu quả nhất

16


với căn bệnh của bệnh nhân. Ứng dụng trí tuệ nhân tạo giúp giảm 78% thời
gian sàng lọc thử nghiệm lâm sàng từ 1h50p xuống còn 24 phút, với kết quả
chẩn đoán đạt tỷ lệ phù hợp tới 96% cho ung thư phổi, 81% với ung thư đại
tràng và 93% với các trường hợp ung thư trực tràng theo nghiên cứu tại
Trung tâm Ung thư toàn diện Manipal ở Bangalore, Ấn Độ.
• Ultromics – được phát triển bởi Bệnh viện John Radcliffe ở Anh – nền tảng
chẩn đoán hỗ trợ bởi AI giúp chẩn đoán các bệnh về tim một cách chính xác
hơn so với bác sĩ. Hay cơng ty Optellum đang phát triển hệ thống AI cho
chẩn đoán ung thư phổi bằng cách phân tích các cụm tế bào được phát hiện
qua ảnh chụp. Hay ông lớn Google phát triển hệ thống AI xác định chính
xác các dấu hiệu ung thư tuyến tiền liệt trong sinh thiết.
Các thuật toán máy tính có khả năng hỗ trợ đưa ra kết luận gần đúng mà không
cần con người nhập liệu trực tiếp. AI thực hiện điều này thơng qua các thuật
tốn học máy và học sâu. Theo CB Insights, 86% các tổ chức cung cấp dịch vụ
chăm sóc sức khỏe, các công ty khoa học đời sống và các nhà cung cấp cơng

nghệ chăm sóc sức khỏe sử dụng cơng nghệ trí tuệ nhân tạo. CB Insights ước
tính các cơng ty sẽ chi trung bình 54 triệu đơ cho các dự án AI vào năm 2020,
Frost & Sullivan dự kiến AI sẽ tạo ra khoản tiết kiệm hơn 150 tỷ đô la cho
ngành chăm sóc sức khỏe vào năm 2025.
5. 2 Trong nước:
-

Nghiên cứu và ứng dụng AI trong y tế tại Việt Nam đang ở giai đoạn đầu. Một
số ứng dụng AI hỗ trợ chẩn đốn do các cơng ty công nghệ quốc tế phát triển
đã được triển khai tại một số bệnh viện. Tuy nhiên, dữ liệu người Việt có tính
đặc thù. Điều này làm giảm hiệu quả của các thuật toán AI vốn được huấn luyện
dựa trên dữ liệu. Một số tập toàn trong nước như Vingroup, Viettel hay FPT
cũng đã từng bước phát triển các giải pháp thơng minh hỗ trợ y tế. Đây có thể
coi là điểm sáng và là hướng đi đúng đắn khi Việt Nam có thể tự chủ được cơng
nghệ lõi, đặc biệt là bảo đảm vấn đề bảo mật dữ liệu sức khoẻ của người dân.
• Y tế Việt Nam cũng đang tiến hành theo hướng bệnh viện số. Với làn sóng
của cách mạng công nghiệp 4.0, ứng dụng nâng cấp phần mềm trong máy
móc hỗ trợ chẩn đốn hình ảnh y tế được cập nhật thường xun, thậm chí
cịn nhanh hơn phần mềm điện thoại di động. Hiện nay, ứng dụng công nghệ
thông minh là hướng đi tương lai cho y học nước ta.
• Theo thơng tin từ Bộ Y tế, sau 3 năm triển khai, hầu hết các bệnh viện đã
kết nối, liên thông dữ liệu khám chữa bệnh BHYT với cơ quan giám định
và thanh toán BHYT, phục vụ giám định khám chữa bệnh BHYT điện tử.
Tại đa số các bệnh viện hiện nay cũng đã sử dụng CNTT trong công tác
quản lý bệnh viện. Khi bệnh nhân nhập viện, tồn bộ thơng tin được lưu vào
máy chủ và kết nối toàn khoa trong bệnh viện. Hai là phần mềm lưu trữ kết
quả hình ảnh PACS (lưu trữ phim chụp, kết quả xét nghiệm, siêu âm...), sau
khi chụp có kết quả sẽ gửi thẳng đến phòng mổ hoặc tới bác sĩ điều trị mà
không cần in phim. Tiếp theo đó là phần mềm quản lý dược. Sau khi bệnh
nhân được các bác sĩ kê đơn thuốc, thì tại khoa dược nhận được thông tin

và chuẩn bị sẵn các loại thuốc, bệnh nhân có thể lấy được thuốc ngay mà

17


không cần phải chờ đợi. Bộ Y tế đã triển khai hệ thống lưu trữ và truyền tải
hình ảnh tại một số bệnh viện. Đây là đề án rất có ý nghĩa, không chỉ nâng
cao chất lượng khám chữa bệnh, ứng dụng CNTT, ứng dụng các công nghệ
hiện đại mà cịn có ý nghĩa về bảo vệ mơi trường. Vì mỗi tấm phim thải ra
sẽ tồn tại và gây độc hại cho mơi trường hàng trăm năm.
• Trong phần thảo luận tại buổi tọa đàm “Nghiên cứu, phát triển và ứng dụng
trí tuệ nhân tạo trong y tế”, TS. Trần Thị Mai Oanh, Viện trưởng Viện Chiến
lược, Bộ Y tế cho biết: Trong những năm gần đây, ngành y tế rất quan tâm
đến việc ứng dụng CNTT, số hóa nhiều hoạt động. AI có vùng áp dụng rất
rộng, nhất là trong hỗ trợ, chăm sóc tồn diện sức khỏe người dân. Bao gồm:
Theo dõi sức khỏe cá nhân nhằm giảm thiểu nguy cơ bệnh, phát hiện sớm
bệnh thời đại như ung thư, tim mạch, tiểu đường giúp giảm chi phí và kéo
dài sự sống, giúp bệnh nhân tuân thủ việc uống thuốc, theo dõi diễn biến
bệnh. Việt Nam đã sử dụng AI trong y tế từ vài năm trước. Ứng dụng AI hỗ
trợ chẩn đoán và đưa ra phác đồ điều trị 13 loại ung thư đã được vận hành
tại một số bệnh viện và được đánh giá cao. Hiện tại, dù AI chưa được ứng
dụng nhiều trong các bệnh viện, nhưng một số ứng dụng đã chứng minh là
hỗ trợ rất nhiều trong công tác khám và điều trị bệnh.
• GS.TS. Đào Văn Long - nguyên Giám đốc Bệnh viện Đại học Y Hà Nội,
cho biết: Trong lĩnh vực nội soi tiêu hóa, hiện nay đội ngũ thầy thuốc của
Việt Nam mới đáp ứng được khoảng 5-10% nhu cầu. Đó mới chỉ là bác sĩ
nội soi, cịn làm sao để chẩn đốn đúng được tổn thương thì lại khó hơn rất
nhiều và càng thiếu chuyên gia. Để giải quyết vấn đề này, một trong những
khuynh hướng mà chúng tôi đang đi là áp dụng học máy trong nội soi tiêu
hóa. Với một tổn thương trong tiêu hóa, thay vì phải có chun gia giàu

kinh nghiệm, thậm chí phải làm xét nghiệm tế bào để chẩn đốn... thì máy
học có thể báo cho thầy thuốc biết ln tổn thương đó là ung thư hay chỉ là
ổ loét, điều đó tạo điều kiện để bác sĩ quyết định sớm hướng điều trị.
• Mới đây, hệ thống trí tuệ nhân tạo VinDr do Trung tâm Xử lý ảnh y tế, trực
thuộc VinBigdata phát triển cho phép CĐHA về bệnh lý phổi trên ảnh Xquang lồng ngực, chẩn đoán ung thư vú trên ảnh X-quang tuyến vú, xác
định các bất thường trên hình ảnh CT/MRI sọ não và phát hiện các bất
thường trên phim chụp X-quang cột sống đã được thử nghiệm lâm sàng tại
một số bệnh viện lớn như Bệnh viện Trung ương Quân đội 108, Bệnh viện
Đại học Y Hà Nội, Bệnh viện Đa khoa Quốc tế Vinmec. Theo đánh giá từ
đội ngũ chuyên gia y tế của các bệnh viện cho thấy, VinDr đã đảm bảo độ
chính xác cao, cho phép hỗ trợ đắc lực bác sĩ CĐHA trong chẩn đốn
bệnh. Hệ thống VinDr được xây dựng trên chính nguồn dữ liệu bệnh nhân
tại Việt Nam, với đặc điểm sinh lý, giải phẫu bệnh lý chính xác của người
Việt. Các bộ dữ liệu quy mô lớn được thu thập và gán nhãn bởi đội ngũ bác
sĩ CĐHA giàu kinh nghiệm chính là yếu tố tiên quyết để đảm bảo độ chính
xác của các thuật tốn AI. Ngồi ra, trước thách thức của đại dịch Covid19, VinDr cũng được ứng dụng trong chẩn đoán lao và bệnh phổi; hỗ trợ

18


đánh giá tiên lượng trong điều trị bệnh nhân Covid-19, giúp phát hiện nhanh
các dấu hiệu bất thường dựa trên ảnh X-quang ngực thẳng, kết hợp cùng xét
nghiệm PCR từ đó nâng cao độ chính xác, giảm thiểu tình trạng âm tính giả.
Thành cơng ban đầu của VinDr đã khẳng định trình độ của các nhà khoa học
Việt Nam. Số lượng các hệ thống AI được phát triển bài bản, áp dụng rộng rãi
và tạo được ảnh hưởng tích cực lên hiệu quả chẩn đốn bệnh hiện cịn hạn chế.
Việc ứng dụng các mơ hình học máy với dữ liệu y tế trong cơng tác chăm sóc,
nâng cao sức khỏe ở Việt Nam đã có bước phát triển quan trọng, đặt nền móng
xây dựng nền y tế thơng minh với 3 trụ cột chính là: Phịng bệnh, chăm sóc sức
khỏe thông minh; khám chữa bệnh thông minh và quản trị y tế thông minh. Sau

thời gian đi vào hoạt động, người dân bước đầu được hưởng lợi từ các thành
tựu từ trí tuệ nhân tạo, mơ hình học máy trong hoạt động y tế.
6. Dự kiến kế hoạch thực hiện
Dự kiến kế hoạch thực hiện:
-

Bố cục của nghiên cứu:
1. Bìa luận văn
2. Lời mở đầu
3. Mục lục
4. Nội dung:
• Chương 1: Giới thiệu đề tài
1.1 Tổng quan về đề tài
1.1.1. Lý do chọn đề tài
1.1.2. Mục tiêu và nhiệm vụ nghiên cứu
1.1.3. Đối tượng và phạm vi nghiên cứu
1.1.4. Phương pháp nghiên cứu
1.1.5. Ý nghĩa khoa học và thực tiễn
1.1.6. Bố cục luận văn
1.2 Tổng quan về học máy
1.3 Ứng dụng học máy trong y học
1.3.1. Ứng dụng học máy trong tiên lượng, chẩn đoán bệnh
1.3.2. Ứng dụng học máy trong nghiên cứu phát triển thuốc
1.3.3. Ứng dụng học máy trong điều trị bệnh
1.3.4. Ứng dụng học máy trong dự đốn dịch bệnh
1.3.4. Một số khó khăn của việc áp dụng học máy trong y học
• Chương 2: Nghiên cứu các mơ hình học máy với dữ liệu y tế
2.1. Phân loại mơ hình học máy
2.2. Ứng dụng học máy trong y tế
2.2.1. Ứng dụng với dữ liệu bệnh án điện tử

2.2.2. Học máy với dữ liệu ảnh y tế
2.3. Một số mơ hình học máy điển hình

19



×