Tải bản đầy đủ (.pdf) (6 trang)

KẾT LUẬN :Tiếp cận Máy học và Hệ chuyên gia để nhận dạng, phát hiện virus máy tính”

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.48 MB, 6 trang )








Kết luận



5.1. Những đóng góp mới của đề tài
Hơn 20 năm qua, các nhà nghiên cứu đã tốn rất nhiều công sức nhưng bài
toán nhận dạng virus máy tính vẫn chưa được giải quyết trọn vẹn. Virus máy tính là
sản phẩm trí tuệ phản diện của con người. Làm cách nào giúp máy tính học được
cách điều trị của các chuyên gia anti-virus để máy tính có thể tự khám và chữa khỏi
bệnh? Để trả lời câu hỏi này, tiếp cận máy họ
c và hệ chuyên gia được chọn nhằm
giải quyết bài toán chẩn đoán virus máy tính, vốn phức tạp và vượt khỏi sức tính
toán cơ học của con người.
Nghiên cứu khoa học trí tuệ nhân tạo theo trình tự logic học từ thấp đến cao,
đề tài xây dựng một phương pháp tiếp nhận và vận dụng tri thức chuyên gia trên cơ
sở kế thừa và kết hợp ưu điểm, khắc phục nh
ược điểm của các tiếp cận đã có, nhằm
giải quyết vấn đề một cách tự nhiên, phù hợp với bản chất của bài toán nhận dạng
virus máy tính. Phương pháp mới đó là:

Tiếp cận chuỗi mã+Tiếp cận hành vi+Tiếp cận ý định=Tiếp cận máy học và hệ chuyên gia
Virus máy tính vốn phức tạp với nhiều loại hình quấy rối, phát triển qua
nhiều thời kỳ với nhiều biến thể, lai tạp, kế thừa đan xen nhau. Tiếp cận giải quyết
vấn đề bằng cách định nghĩa các lớp virus dựa vào đặc điểm dữ liệu, sau đó áp dụng


các bài toán học phù hợp cho từng lớp. Trong từng bài toán, các kỹ thuật học được
vận d
ụng linh hoạt: phân cụm dữ liệu bằng V-Tree, rút luật nhận dạng với R2LTA
và ARCRD; phân lớp và giản lược không gian quan sát với NNSRM; khắc phục
Chương
5
- 97 -
nhiễu bằng kỹ thuật hợp nhất dữ liệu DF2RV; vận dụng mô hình AMKBD phối hợp
CSDL và CSTT; học khái niệm hành vi bằng mô hình máy ảo; vận dụng mô hình
không gian vectơ sử dụng nguyên lý TF-IDF để phân loại và nhận dạng mã độc…
Không chỉ thiết kế riêng cho bài toán nhận dạng virus máy tính, các kỹ thuật này
còn có thể áp dụng cho nhiều bài toán thuộc nhiều lĩnh vực khác nhau.
Là một trong những người đề x
ướng phương pháp hệ chuyên gia anti-virus,
tác giả luận án đã nghiên cứu xây dựng hệ phần mềm MAV (Machine Learning
Approach to Anti-virus Expert System) trên hệ thống mạng cục bộ mô hình client-
server. Là anti-virus hướng tri thức đầu tiên của Việt Nam, MAV còn là một trong
bốn hệ chuyên gia anti-virus thực nghiệm công bố thông tin sớm nhất trên Internet.
Đề tài mở ra hướng nghiên cứu mới trong lĩnh vực phòng chống virus máy
tính nói riêng, góp phần xây dựng cơ sở lý thuyết cho việc phát triển các mô hình
bảo vệ an toàn dữ
liệu cho các hệ thống CNTT nói chung.
5.2. Hạn chế của đề tài, cách khắc phục
Mặc dù “chia để trị” khá hiệu quả khi giải quyết bài toán nhận dạng virus
trên tập dữ liệu không đồng nhất, nhưng chiến lược này cũng làm giảm số lượng tập
mẫu trên mỗi lớp bài toán, khiến cho việc lựa chọn mô hình học gặp nhiều khó khăn
vì thiếu mẫu thử. Đây cũng là hạn chế chung của các AV trong nước hiện nay.
Hạn chế này có thể khắc phục b
ằng cách gia tăng số virus mẫu trong các lớp.
Việc làm này cần có thời gian (thu thập mẫu virus từ nhiều nguồn), kinh phí (mua

tập mẫu) và nhân lực (đào tạo chuyên gia, chuyển giao công nghệ). Virus máy tính
là loại dữ liệu đặc biệt nguy hiểm, không dễ kiếm được số lượng lớn trong một thời
gian ngắn (do cạnh tranh thương mại nên các anti-virus thường không chia xẻ tập
mẫu virus cho các hãng “đối thủ”).
Để thu thập mẫu virus nhanh trong thời gian ng
ắn, có thể xây dựng một hệ
sandbox tạo “vùng trũng” thu hút virus trên hệ thống mạng toàn cầu. Tuy nhiên,
phương án này cần kinh phí khá lớn để trang bị server, networking, thuê leased line,
hosting, chi phí duy trì domain, nhân lực thiết kế và vận hành hệ thống…
- 98 -
5.3. Hướng phát triển tương lai
Để đáp ứng nhu cầu thực tiễn xã hội, đề tài chỉ tập trung nghiên cứu các loại
virus máy tính lây lan trên các HĐH Windows 32 bit. Theo xu thế phát triển của
Internet, có thể dự báo loại hình quấy nhiễu tương lai vẫn là các loại mã độc lan
truyền qua mạng. Vì vậy lớp bài toán A-class phối hợp các kỹ thuật phân loại virus
và ước lượng mã độc là bài toán có hướng phát triển tốt nhất.
Ngày nay, công nghệ phần cứng cũng phát triển mạnh mẽ. Các b
ộ vi xử lý đa
luồng, đa nhân, lõi kép… ngày càng phổ biến. Công nghệ lưu trữ (RAM, HDD,
CD-ROM, DVD…) cũng đa dạng, khả năng lưu trữ lớn, tốc độ truy xuất nhanh, chi
phí thấp. Khi rào cản về tốc độ xử lý và không gian lưu trữ của nhóm giải pháp
‘quay về quá khứ’ được giải tỏa, lớp bài toán E-class hướng tiếp cận ý định với cơ
chế đa tác tử thông minh đa luồng x
ử lý sẽ có nhiều triển vọng.
Tiếp cận máy học và hệ chuyên gia được vận dụng để xử lý virus máy tính
dưới góc độ dữ liệu, do đó phương pháp này có thể áp dụng cho các loại virus lây
trên các HĐH khác, chạy trên các kiến trúc máy tính khác, sau khi tái cấu trúc mô
hình dữ liệu cho phù hợp. Trong tương lai, các virus trên môi trường Windows 32
bit sẽ từng bước nhường chỗ cho virus Windows Vista 64 bit, như chúng đã từng
truất phế các virus DOS 16 bit. Tuy nhiên do tương thích đi lên, các HĐH mới phải

ch
ấp nhận các ứng dụng cũ. Vì vậy các AV không thể loại bỏ hoàn toàn tập mẫu
virus 16 bit và 32 bit trên môi trường mới. Nói cách khác, việc các AV phải ‘gánh’
theo một CSDL mẫu virus khổng lồ qua nhiều thế hệ là điều khó tránh khỏi. Vì vậy,
cơ chế phân loại CSDL để nhận dạng nhanh và giảm thiểu chi phí miền nhớ như
cách làm của đề tài là lựa chọn tất yếu cho các anti-virus tương lai.
Song song với xu hướng phát triển của các ki
ến trúc máy tính cá nhân, công
nghệ liên lạc di động cũng phát triển mạnh với số lượng người dùng ngày càng gia
tăng. Mặc dù hiện nay các loại virus trên máy di động chưa phổ biến, nhưng tương
lai chúng sẽ hình thành lực lượng quấy nhiễu đông đảo, gây tác hại không nhỏ cho
người sử dụng. Trong bối cảnh đó, các phương án phân hoạch không gian tìm kiếm
sẽ rất hữu dụng cho môi trường tài nguyên hạn chế của các thiết b
ị cầm tay.
- 99 -
5.4. Đề nghị về các nghiên cứu tiếp theo
Nghiên cứu xây dựng các hệ phòng chống virus máy tính là việc làm cần
thiết trong giai đoạn hiện nay. Với những kết quả bước đầu, tiếp cận máy học và hệ
chuyên gia đã mở ra hướng đi mới trong công nghệ anti-virus. Các nghiên cứu tiếp
theo cần tập trung cải tiến chất lượng các bài toán bằng cách bổ sung các mô hình
học tiên tiến, áp dụng lý thuyết mờ để cải thiện độ dự báo bằng cách học các giá tr

tích lũy của hằng số λ, nghiên cứu phương án kế thừa tri thức chuyên gia từ các hệ
AV khác, xây dựng hệ tích hợp tri thức chẩn đoán virus máy tính…
Kết quả nghiên cứu của đề tài giúp có thêm một phương pháp phòng chống
virus mạnh mẽ, góp phần làm cho môi trường CNTT trong sạch hơn. Tuy nhiên AV
không phải là biện pháp bảo vệ duy nhất. Khi có dịch, đặc biệt là bệnh lạ, một bác sĩ
không thể chữa trị
cho tất cả mọi người mà cần huy động cả bệnh viện, thậm chí cả
guồng máy y tế. Một AV không thể đơn lẻ bảo vệ an ninh dữ liệu cho cộng đồng mà

cần sự phối hợp chặt chẽ với các AV khác nói riêng, các hệ thống an toàn dữ liệu
nói chung. Vì vậy, tiếp cận máy học và hệ chuyên gia trong lĩnh vực anti-virus là
một hướng đi đúng đắn, tạo tiền
đề nghiên cứu các hệ tích hợp tri thức chuyên gia,
tiến tới xây dựng các trung tâm chẩn đoán virus máy tính trên mạng.
Cùng với việc nghiên cứu các hình thức tấn công không xác định địa chỉ
(virus máy tính, sâu trình, trojan horse…), cần nghiên cứu xây dựng cơ chế bảo vệ
hệ thống CNTT khỏi các cuộc tấn công có địa chỉ xác định (SPAM, DoS/DDoS,
phishing, dirty tricks…) trên các website và cổng thông tin công cộng; từng bước
mở rộng nghiên cứu sang các hệ thống liên lạc di động (wireless, điện thoạ
i cầm
tay, máy iPod, máy nghe nhạc…) tạo thành một thế trận bảo vệ các hệ thống CNTT
chặt chẽ, liên hoàn và vững chắc.

YZ

- 100 -
CÔNG TRÌNH ĐÃ CÔNG BỐ
1.
Nguyễn Thanh Thủy, Trương Minh Nhật Quang
. Các giải pháp cho phần
mềm chống virus thông minh. Tạp chí Tin học và Ðiều khiển, T.13, S.3 (1997),
123-132.
2.
Nguyễn Thanh Thủy, Trương Minh Nhật Quang
. Các cơ chế chẩn đoán
virus tin học thông minh dựa trên tri thức. Tạp chí Tin học và Ðiều khiển,T.14,
S.2 (1998), 45-52.
3.
Nguyen Thanh Thuy, Truong Minh Nhat Quang.

Expert System Approach to
Diagnosing and Destroying Unknown Computer Viruses.

Proceedings of the
IASTED International Conference Artificial Intelligence and Soft Computing.
27-30 May 1998, Cancun – Mexico, 371-374. IASTED/ACTA Press.
4.
Nguyễn Thanh Thủy, Trương Minh Nhật Quang.
Cây chỉ thị nhị phân biểu
diễn không gian trạng thái chẩn đoán virus tin học. VN, Tạp chí Tin học &
Ðiều khiển, T.15, S.3 (1999), 40-45.
5.
Nguyen Thanh Thuy, Truong Minh Nhat Quang
. A Global Solution to Anti-
virus Systems. The Proc. of the 1st International Conference on Advanced
Communication Technology. 10-12 Feb. 1999, Muju-Korea, 374-377.
6.
Nguyễn Thanh Thủy, Trương Minh Nhật Quang
. Máy ảo, công cụ hỗ trợ
chẩn đoán và diệt virus tin học thông minh. Tạp chí Tin học & Ðiều khiển,
T.16, S.2 (2000), 37-40.
7.
Hoang Kiem, Nguyen Thanh Thuy, Truong Minh Nhat Quang
. A Machine
Learning Approach to Anti-virus System. Joint Workshop of Vietnamese
Society of AI, SIGKBS-JSAI, ICS-IPSJ and IEICE-SIGAI on Active Mining.
4-7 Dec. 2004, Hanoi-Vietnam, 61-65.
8.
Hoang Kiem, Nguyen Thanh Thuy, Truong Minh Nhat Quang
. Machine

Leaning Approach to Anti-virus Expert System with Nearest Neighbor Rule-
based Structural. RIVF’05, February 2005, Cantho-Vietnam. 295-298.

×