Tải bản đầy đủ (.pdf) (75 trang)

NGHIÊN cứu một số THUẬT TOÁN THÔNG MINH TRONG máy học và hệ MIỄN DỊCH NHÂN tạo ỨNG DỤNG xây DỰNG hệ THỐNG PHÁT HIỆN VIRUS máy TÍNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.67 MB, 75 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM

KHÓA LUẬN TỐT NGHIỆP

NGHIÊN CỨU MỘT SỐ THUẬT TOÁN
THÔNG MINH TRONG MÁY HỌC
VÀ HỆ MIỄN DỊCH NHÂN TẠO.
ỨNG DỤNG XÂY DỰNG HỆ THỐNG
PHÁT HIỆN VIRUS MÁY TÍNH

Giảng viên hƣớng dẫn: TS VŨ THANH NGUYÊN
ThS NGUYỄN HỮU THƢƠNG
Sinh viên thực hiện: NGUYỄN PHƢƠNG ANH
NGUYỄN VĨNH KHA
Lớp: CNPM
Khóa: K01

TP. Hồ Chí Minh, tháng 03 năm 2011


ABSTRACT
As a result of internet growing, the network attack is increasing
considerably in both type and number. Current anti-virus application just
work well with known issues, the ability to detect new variants of virus is
rather limited. In order to find out an affective solution for the problem, the
thesis focus on researching immune system and then - artificial immune
system, creating the base to build an adaptive virus detection system.
The thesis learns about the components and mechanisms of the human


body immune system in depth, and consequently studies the theoretical
background that allows emulating them on artificial immune system. Three
key problems of artificial immune system: pattern recognition, negative
selection and clone selection will be presented in essay thoroughly.
Based on the theoretical results, the authors implemented an adaptive
virus detection system. As a smart virus detection system, it is not only
capable of detecting known virus patterns but also have the ability to identify
new threats.


LỜI CẢM ƠN
Chúng em xin bày tỏ lòng biết ơn sâu sắc đến TS. Vũ Thanh Nguyên, trưởng
khoa Công Nghệ Phần Mềm, trường Đại học Công Nghệ Thông Tin, Đại học Quốc
gia TP. Hồ Chí Minh đã tận tình hướng dẫn, cung cấp kiến thức, truyền đạt những
kinh nghiệm quí báu giúp chúng em hoàn thành tốt luận văn này.
Xin chân thành cám ơn ThS. Nguyễn Hữu Thương, giảng viên khoa Công
Nghệ Phần Mềm, trường Đại học Công Nghệ Thông Tin, Đại học Quốc gia TP. Hồ
Chí Minh, người đã không ngừng quan tâm, nhắc nhở chúng em trong suốt thời
gian làm luận văn.
Xin cám ơn các Thầy, Cô trường Đại học Công Nghệ Thông Tin, Đại học
Quốc gia TP. Hồ Chí Minh đã hướng dẫn, cung cấp kiến thức giúp chúng em thực
hiện nghiên cứu luận văn.
Xin cám ơn cha, mẹ, các anh, chị em trong gia đình đã hỗ trợ, lo lắng và
động viên. Đồng thời, xin cám ơn tất cả các đồng nghiệp đã ủng hộ, giúp đỡ chúng
tôi trong quá trình thực hiện luận văn này.
Dù đã có nhiều cố gắng nhưng chắc chắn sẽ không tránh khỏi những thiếu
sót, chúng em rất mong nhận được sự đóng góp ý kiến của các Thầy giáo, Cô giáo
và các bạn để đề tài này được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn!
Tp Hồ Chí Minh, tháng 03 năm 2011

Sinh viên


NHẬN XÉT
(Của giảng viên hƣớng dẫn)
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................


NHẬN XÉT

(Của giảng viên phản biện)
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................
.......................................................................................................................................


-i-

MỤC LỤC
CHƢƠNG 1: MỞ ĐẦU.............................................................................................1
1.1. Giới thiệu đề tài ................................................................................................1

1.1.1. Lý do chọn đề tài .......................................................................................1
1.1.2. Đối tượng, phạm vi nghiên cứu của đề tài ................................................2
1.1.3. Các giai đoạn thực hiện đề tài ...................................................................2
1.2. Ý nghĩa khoa học và thực tiễn của đề tài .........................................................3
1.3. Cấu trúc của luận văn .......................................................................................3
CHƢƠNG 2: CÁC CƠ CHẾ CHUẨN ĐOÁN VIRUS MÁY TÍNH VÀ MỘT
SỐ VẤN ĐỀ LIÊN QUAN ........................................................................................5
2.1. Khảo sát virus máy tính ...................................................................................5
2.2. Các cơ chế chẩn đoán virus máy tính...............................................................5
2.2.1. Phát hiện virus dựa vào chuỗi nhận dạng .................................................6
2.2.2. Phát hiện virus dựa vào hành vi ................................................................6
2.2.3. Phát hiện virus dựa vào ý định ..................................................................7
CHƢƠNG 3: MỘT SỐ ĐẶC ĐIỂM CƠ BẢN CỦA HỆ MIỄN DỊCH SINH
HỌC ............................................................................................................................8
3.1. Các khái niệm miễn dịch sinh học ...................................................................8
3.2. Các thành phần chủ yếu của hệ miễn dịch .......................................................9
3.3. Các cơ chế kích hoạt (hoạt hoá) và nhận diện miễn dịch cơ bản ...................11
3.4. Chức năng sinh học của hệ miễn dịch............................................................13
3.4.1. Các cơ quan lymphoid tiên phát (Primary lymphoid organs) .................14
3.4.2. Các cơ quan lymphoid thứ phát (Secondary lymphoid organs)..............14
3.4.3. Các tầng bảo vệ của hệ miễn dịch ...........................................................15
3.5. Hệ miễn dịch bẩm sinh (Innate immune system) ...........................................16
3.6. Hệ miễn dịch thích nghi (Adaptive immune system) ....................................16
3.7. Nhận dạng mẫu (Pattern Recognition) ...........................................................17
3.8. Phân biệt Self và Nonself ...............................................................................19
3.8.1. Phép chọn lọc tích cực (Positive Selection) ............................................19

GVHD:

TS. Vũ Thanh Nguyên

ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- ii -

3.8.2. Chọn lọc tiêu cực (Negative Selection) ..................................................20
3.8.3. Chọn lọc nhân bản (Clonal Selection) ....................................................21
CHƢƠNG 4: TỔNG QUAN VỀ HỆ MIỄN DỊCH NHÂN TẠO .......................22
4.1. Khái niệm về hệ miễn dịch nhân tạo ..............................................................22
4.2. Phạm vi ứng dụng của hệ miễn dịch nhân tạo ...............................................23
4.3. Cấu trúc cơ bản của hệ miễn dịch nhân tạo ...................................................23
4.3.1. Mô hình chung cho các hệ thống phỏng tiến hoá sinh học .....................24
4.3.2. Mô hình cho hệ miễn dịch nhân tạo ........................................................24
4.3.3. Các mô hình trừu tượng của hệ miễn dịch và tương tác giữa chúng ......25
4.3.4. Một số thuật toán miễn dịch ....................................................................28
4.4. Các lĩnh vực ứng dụng của AIS .....................................................................32
4.4.1. Điều khiển ...............................................................................................32
4.4.2. An ninh máy tính.....................................................................................33
4.4.3. Phát hiện lỗi ............................................................................................34
4.4.4. Phát hiện bất thường trong hệ thống .......................................................34
4.4.5. Tối ưu hoá ...............................................................................................34
4.4.6. Khai phá dữ liệu ......................................................................................34
CHƢƠNG 5: XÂY DỰNG HỆ THỐNG PHÁT HIỆN VIRUS ..........................36
5.1. Xây dựng bộ phát hiện (Detector) ..................................................................36
5.2. Luật so khớp trùng chuỗi ...............................................................................37

5.3. Chọn lọc âm tính ............................................................................................41
5.3.1. Quá trình học (Learning Machine)..........................................................41
5.3.2. Quá trình kiểm tra ...................................................................................43
5.4. Chọn lọc nhân bản và siêu biến đổi ...............................................................44
5.5. Mô hình tổng thể hệ thống VDS ....................................................................48
5.5.1. Yêu cầu của hệ thống VDS .....................................................................48
5.5.2. Use-case của hệ thống VDS ....................................................................49
5.5.3. Mô hình dòng dữ liệu của hệ thống VDS ...............................................49
5.5.4. Mô hình các lớp của hệ thống VDS ........................................................50

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- iii -

CHƢƠNG 6: KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .....................................51
6.1. Kết luận ..........................................................................................................51
6.2. Hướng phát triển ............................................................................................51

PHỤ LỤC 1: CÁC LOẠI VIRUS MÁY TÍNH ....................................................52
PHỤ LỤC 2: HƢỚNG DẪN SỬ DỤNG CHƢƠNG TRÌNH ..............................60


TÀI LIỆU THAM KHẢO ......................................................................................65

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- iv -

DANH MỤC CÁC HÌNH, SƠ ĐỒ

Hình 3.1: Các dòng miễn dịch và thành phần của HMD ..........................................10
Hình 3.2: Sự nhận diện và cơ chế kích hoạt đơn giản ..............................................12
Hình 3.3: Các cơ quan sản sinh bạch cầu..................................................................13
Hình 3.4: Kiến trúc đa tầng của HMD ......................................................................15
Hình 3.5: B-cell .........................................................................................................17
Hình 3.6: T-cell .........................................................................................................18
Hình 3.7: Quá trình chọn lọc nhân bản .....................................................................21
Hình 4.1: Cấu trúc phân tầng của HMD nhân tạo.....................................................24
Hình 4.2: Kháng thể nhận diện kháng nguyên dựa vào phần bù ..............................26
Hình 4.3: Thuật toán lựa chọn tích cực .....................................................................31
Hình 4.4: Thuật toán lựa chọn tiêu cực .....................................................................32
Hình 4.5: Ánh xạ giữa các thành phần của HMD với kiến trúc của một máy chủ
nhằm bảo vệ các tiến trình hoạt động .......................................................................34

Hình 5.1: Nguyên tắc rút trích các đoạn bit nhị phân ...............................................36
Hình 5.2: Mã giả hàm kiểm tra so khớp dựa trên luật r-Contiguous ........................40
Hình 5.3: Quá trình chọn lọc âm tính.......................................................................41
Hình 5.4: Ví dụ minh họa quá trình học ...................................................................42
Hình 5.6: Ví dụ minh họa quá trình kiểm tra ............................................................43
Hình 5.7: Mô hình tổng quát của thuật toán CLONALG .........................................47
Hình 5.7: Ánh xạ hệ miễn dịch sinh học và hệ thống phát hiện virus ......................48
Hình 5.8: Use-case của hệ thống VDS ......................................................................49
Hình 5.9: Mô hình quá trình huấn luyện dữ liệu của hệ thống VDS ........................49
Hình 5.10: Mô hình quá trình kiểm tra dữ liệu của hệ thống VDS ...........................50
Hình 5.11: Mô hình lớp hệ thống VDS .....................................................................50

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-v-

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ CÁI VIẾT TẮT

Viết tắt

Viết đầy đủ


Ý nghĩa

AIS

Artificial Immune System

Hệ miễn dịch nhân tạo

VDS

Virus Detection System

Hệ thống phát hiện virus

AV

Anti - Virus

Phần mềm chống virus

HMD

Hệ miễn dịch

Hệ miễn dịch

HĐH

Hệ điều hành


Hệ điều hành

CNTT

Công nghệ thông tin

Công nghệ thông tin

TTNT

Trí tuệ nhân tạo

Trí tuệ nhân tạo

CLONALG

Clonal selection algorithm

Thuật toán chọn lọc nhân bản

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha



-1-

CHƢƠNG 1: MỞ ĐẦU
1.1. Giới thiệu đề tài
1.1.1. Lý do chọn đề tài
Ngày nay công nghệ thông tin trở thành một lĩnh vực mũi nhọn trong công
cuộc phát triển kinh tế xã hội. Cùng với công nghệ sinh học và năng lượng mới,
CNTT vừa là công cụ, vừa là động lực thúc đẩy quá trình công nghiệp hóa, hiện đại
hóa đất nước. Trong giai đoạn hội nhập quốc tế, CNTT giữ vai trò đặc biệt quan
trọng trong việc xử lý tính toán dữ liệu, kết nối thông tin liên lạc của các đơn vị tổ
chức trong và ngoài nước. Bảo vệ an toàn dữ liệu cho các hệ thống tính toán, giữ
vững an ninh mạng, đảm bảo liên lạc thông suốt, duy trì chất lượng phục vụ luôn là
vấn đề quan tâm hàng đầu của các nhà quản trị hệ thống.
Sự phát triển của Internet tạo điều kiện cho các loại hình xâm nhập luận lý
trái phép vào các hệ thống CNTT cả chiều rộng (lây lan trên quy mô toàn thế giới)
và chiều sâu (can thiệp vào hạt nhân hệ thống đích). Mỗi ngày các hệ thống mạng
phải đối phó với hàng loạt đợt tấn công bằng mã độc (malicious, harmful code) của
tin tặc, khiến nhiều hệ thống bị đình trệ, tắc nghẽn và tê liệt; gây thiệt hại không
nhỏ. Dự án nghiên cứu về sự phát triển toàn cầu của Viện Hàn lâm Công nghệ Quốc
gia Mỹ (National Academy of Engineering, USA - 2008) nhận định vấn đề an ninh
thông tin và virus máy tính là một trong 14 thách thức công nghệ lớn nhất của thế
kỷ 21 mà nếu giải quyết được, cuộc sống con người sẽ được cải thiện đáng kể.
Virus máy tính (từ đây gọi tắt là virus, phân biệt với từ “virút” trong y học)
thực sự trở thành mối đe dọa thường xuyên và cấp bách của các hệ thống CNTT
hiện nay.
Để phòng chống virus máy tính, các hệ thống CNTT sử dụng các phần mềm
chống virus (anti-virus, gọi tắt là AV). Qua khảo sát, phần lớn các AV chỉ phát huy
tác dụng trên các mẫu virus xác định, khả năng dự đoán virus mới còn hạn chế nên

thường bị động khi có dịch virus bùng phát.

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-2-

Đã có nhiều giải pháp ứng dụng TTNT đã ra đời nhằm mục đích dự báo,
chuẩn đoán các mẫu virus mới. Trong đó, điển hình nhất chính là HMD nhân tạo một phương pháp cách tiếp cận của tin sinh học - là khái niệm chỉ các hệ thống
thông minh nhân tạo, giải quyết vấn đề dựa trên các nguyên lý, chức năng và mô
hình hoạt động của HMD con người.
Giống như miễn dịch sinh học, HMD nhân tạo có một số đặc trưng chính
quan trọng như: chống chịu nhiễu, học không có giám sát, ghi nhớ, phân tán và tự tổ
chức. HMD nhân tạo được đánh giá như một phương pháp tính toán mềm mới có
hiệu quả. Phạm vi ứng dụng của HMD nhân tạo không chỉ đơn thuần giới hạn ở các
bài toán nhận dạngmà nó thực sự thu hút được sự chú ý của các nhà nghiên cứu
thông qua những ứng dụng trong các lĩnh vực như bảo mật và an toàn thông tin, học
máy, robot học, điều khiển học, tối ưu hoá…
Ở Việt Nam hiện nay, các công trình, tài liệu nghiên cứu về HMD nhân tạo
còn rất ít. Chính vì vậy chúng tôi đã quyết định chọn đề tài: “Nghiên cứu một số
thuật toán thông minh trong máy học và hệ miễn dịch nhân tạo. Ứng dụng xây
dựng hệ thống phát hiện virus máy tính” làm đề tài luận văn tốt nghiệp. Và

chúng tôi đã xây dựng một chương trình dựa trên lý thuyết của HMD nhân tạo
nhằm mục đích bước đầu áp dụng HMD nhân tạo vào việc phát hiện virus.
1.1.2. Đối tƣợng, phạm vi nghiên cứu của đề tài
-

Tìm hiểu chung về virus và các cơ chế dùng để chuẩn đoán virus.

-

Tìm hiểu các khái niệm liên quan đến HMD sinh học, HMD nhân tạo.

-

Tìm hiểu một số thuật toán miễn dịch và một số phương pháp tối ưu hàm.

-

Cài đặt ứng dụng về bảo mật: Hệ thống phát hiện xâm nhập virus bằng ngôn
ngữ lập trình C# trên nền dotNET 3.5.

1.1.3. Các giai đoạn thực hiện đề tài
-

GVHD:

Bước 1: Khảo sát tình hình virus, hacker, xâm nhập mạng hiện nay.

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương


SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-3-

-

Bước 2: Nghiên cứu tài liệu liên quan đến HMD sinh học.

-

Bước 3: Nghiên cứu tài liệu liên quan đến HMD nhân tạo.

-

Bước 4: Nghiên cứu các mô hình và thuật thoát dùng để triển khai HMD
nhân tạo.

-

Bước 5: Phát triển và cài đặt chương trình thử nghiệm.

-

Bước 6: Đánh giá hiệu năng của chương trình thử nghiệm, so sánh với khả
năng phát hiện virus của các chương trình chống virus hiện nay.


1.2. Ý nghĩa khoa học và thực tiễn của đề tài
Giống như trong công tác vệ sinh dịch tễ, trong lĩnh vực phòng chống virus
máy tính, phòng bệnh vẫn là chủ yếu với các hoạt động cơ bản: nhận dạng bệnh cũ
và dự báo bệnh mới. Các hoạt động này đều dựa vào các kỹ thuật chủ đạo của lớp
bài toán nhận dạng. Giải quyết vấn đề an toàn dữ liệu, đề tài nhận dạng virus máy
tính hướng tiếp cận máy học và HMD nhân tạo còn làm phong phú thêm tập lời giải
cho các bài toán nhận dạng cùng loại và có thể mở rộng để nhận dạng các đối tượng
biến đổi.
Ở nước ta mặc dù đã có nhiều đề tài nghiên cứu về virus máy tính, nhưng
hầu như chưa có công trình nào đề cập và giải quyết bài toán nhận dạng biến thể
virus máy tính ứng dụng HMD nhân tạo. Không chỉ dừng lại ở việc nghiên cứu lý
thuyết, đề tài cũng đặt ra mục tiêu thực tiễn là xây dựng một hệ thống phát hiện
virus máy tính, bước đầu ứng dụng HMD nhân tạo vào các bài toán nhận dạng
virus.
1.3. Cấu trúc của luận văn
Cấu trúc của luận văn được trình bày theo 5 chương:
Chương 1: Mở đầu
Chương 2: Các cơ chế chuẩn đoán virus và các vấn đề liên quan

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha



-4-

Chương 3: Một số đặc điểm cơ bản của hệ miễn dịch sinh học
Chương 4: Tổng quan về hệ miễn dịch nhân tạo
Chương 5: Xây dựng hệ thống phát hiện virus
Chương 6: Kết luận và hướng phát triển
Ngoài ra, ở phần phụ lục chúng tôi còn trình bày một số phân lớp virus hiện
nay, một số module sử dụng chính trong chương trình phát hiện virus đã được xây
dựng.

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-5-

CHƢƠNG 2: CÁC CƠ CHẾ CHUẨN ĐOÁN VIRUS MÁY
TÍNH VÀ MỘT SỐ VẤN ĐỀ LIÊN QUAN
2.1. Khảo sát virus máy tính
Virus máy tính (computer virus) là loại chương trình máy được thiết kế để
thực hiện các chỉ thị của nó sau chương trình khác. Bí mật sao chép bản thân nó vào
các hệ thống máy tính, virus lây từ máy này sang máy khác, làm suy giảm năng lực
hoạt động hệ thống và xâm phạm dữ liệu người dùng. Kể từ khi virus Brain xuất

hiện đầu tiên (1986), ngày nay có đến hàng chục ngàn biến thể virus máy tính lây
lan trên toàn thế giới. Biến thái qua nhiều thế hệ, virus máy tính ngày càng tinh vi,
mức độ quấy rối phá hoại càng nguy hiểm và nghiêm trọng.
Có nhiều định nghĩa về virus máy tính. Theo Bordera, virus máy tính là:
“Bất cứ chỉ thị, thông tin, dữ liệu hoặc chương trình làm suy giảm tính hoàn thiện
của tài nguyên máy tính, làm vô hiệu, gây nguy hiểm hoặc phá hủy, hoặc ghép bản
thân nó vào tài nguyên của máy tính khác và thi hành khi chương trình máy tính thi
hành”
Ngoài những tính chất chung, mỗi loại virus có nguyên tắc lây nhiễm, đặc
điểm dữ liệu khác nhau. Lúc đầu các chuyên gia phân loại virus theo hình thức lây
nhiễm. Về sau virus máy tính phát triển đa dạng với nhiều xu hướng kết hợp, phân
hóa, lai tạp, kế thừa… khiến việc phân loại gặp rất nhiều khó khăn (xem phụ lục 1).
2.2. Các cơ chế chẩn đoán virus máy tính
Hơn 20 năm qua, virus máy tính đã gây nguy hại cho nhiều hệ thống CNTT
trên thế giới. Các nhà khoa học đã tốn nhiều công sức nghiên cứu, xây dựng các hệ
phòng chống virus máy tính theo nhiều tiếp cận, kỹ thuật khác nhau. Cho đến nay,
có ba kỹ thuật nhận dạng virus máy tính đã được áp dụng: dựa vào chuỗi nhận dạng
virus (signature-based approach), dựa vào hành vi nghi ngờ virus (suspicious
behavior-based approach) và dựa vào ý định virus (intention-based approach).

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha



-6-

2.2.1. Phát hiện virus dựa vào chuỗi nhận dạng
Hoạt động theo nguyên lý nhận dạng mẫu, các AV sử dụng một CSDL chứa
mẫu virus (ID-virus library). Mỗi khi có virus mới, các chuyên gia anti-virus sẽ giải
mã, trích chọn và cập nhật chuỗi nhận dạng virus vào thư viện. Thông tin về đối
tượng chẩn đoán (ghi nhận từ hệ thống đích) cùng với thông tin của virus (trong thư
viện mẫu) sẽ cho kết luận về tình trạng của đối tượng.
Nhận dạng mẫu giúp AV phát hiện các virus đã biết trên tập dữ liệu chẩn
đoán với độ chính xác cao. Tuy nhiên phương pháp này có khá nhiều nhược điểm:
 Cồng kềnh: Kích thước thư viện mẫu tỷ lệ thuận với số virus đã cập nhật và
tỷ lệ nghịch với tốc độ tìm kiếm.
 Bị động: AV chỉ hiệu quả trên các mẫu virus đã cập nhật, không đáp ứng kịp
thời dịch bệnh do tốn thời gian cho việc thu thập mẫu virus mới, giải mã,
phân tích, lập thuật giải, cập nhật phiên bản mới, phát hành…
 Nhầm lẫn: Các hacker cố gắng tạo vỏ bọc an toàn cho virus. Khi AV so mẫu
chẩn đoán giống với virus, dữ liệu sạch của hệ thống sẽ bị tẩy nhầm.
2.2.2. Phát hiện virus dựa vào hành vi
Tiếp cận này nghiên cứu virus máy tính dưới góc độ thi hành của tập mã
lệnh. Cũng là chương trình máy tính, nhưng khác với các phần mềm hữu ích, virus
chỉ chứa các lệnh nguy hiểm. Nghiên cứu trật tự, quy luật hình thành các lệnh máy
của virus, tiếp cận này dựa vào khái niệm hành vi để xây dựng cơ chế nhận dạng
thông qua tập các thủ tục, hành vi của chúng.
Sử dụng tri thức hành vi từ kinh nghiệm chuyên gia nên tiếp cận này còn gọi
là phương pháp heuristic. Do các virus giống nhau thường có hành vi như nhau nên
AV có thể nhận dạng các virus cùng họ. Tuy nhiên AV khó phân biệt được các hành
vi giống nhau nhưng mục đích khác nhau (ví dụ các phần mềm thường tạo và xóa
tập tin tạm, trong khi virus tạo bản sao chính nó và xóa dữ liệu người dùng…) nên
tiếp cận này ít được sử dụng cho máy lẻ, trạm làm việc, vốn dành cho người dùng ít


GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-7-

kinh nghiệm.
2.2.3. Phát hiện virus dựa vào ý định
Do hãng Sandrasoft (Ấn Độ) đề xướng từ năm 2005, tiếp cận intention-based
(tên mã Rudra) lưu giữ hình ảnh chi tiết của máy tính trong tình trạng sạch, sau đó
tiếp tục theo dõi trạng thái hệ thống. Những thay đổi quan trọng trong tập tin, cấu
hình hệ thống hay HĐH đều được cảnh báo như một mối hiểm họa tiềm tàng. Khi
những thay đổi này được đánh giá nguy hiểm, hệ sẽ khôi phục máy về tình trạng
ban đầu. Mặc dù đơn giản nhưng tiếp cận này tỏ ra khá hiệu quả vì nó có thể bảo vệ
máy tính khỏi các mối đe dọa chưa được biết đến, kể cả virus máy tính.
Trong thực tế, tiếp cận “quay về quá khứ” đã được nhiều hãng phần mềm hệ
thống sử dụng: Symanteccó Norton Ghost và Norton Goback; VMware có System
Image Snapshot; Faronics có Deep Freeze… Bản thân Windows XP cũng có chức
năng phục hồi hệ thống bằng System Restore. Tuy nhiên tiếp cận này kém hiệu quả
khi các điểm trạng thái được ghi nhận lúc hệ thống bị nhiễm virus lạ. Mặt khác, hệ
cũng cần bộ nhớ ngoài đủ lớn để lưu toàn bộ hình ảnh hệ thống qua từng thời điểm.


GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-8-

CHƢƠNG 3: MỘT SỐ ĐẶC ĐIỂM CƠ BẢN CỦA HỆ MIỄN
DỊCH SINH HỌC
Để có thể hiểu rõ hơn về HMD nhân tạo, cấu trúc của HMD nhân tạo và một số
thuật toán miễn dịch, ta đi tìm hiểu những đặc điểm cơ bản của HMD sinh học.
3.1. Các khái niệm miễn dịch sinh học
Trong lịch sử, miễn dịch được dùng để chỉ sự không mắc bệnh, mà cụ thể là
các bệnh nhiễm trùng. Trong cơ thể, tất cả các tế bào và phân tử hoá học chịu trách
nhiệm về tính miễn dịch hợp thành hệ thống miễn dịch, và toàn bộ những đáp ứng
của chúng tạo ra đối với những chất lạ xâm nhập vào cơ thể được gọi là đáp ứng
miễn dịch. Qua đó, chúng ta có thể đưa ra khái niệm tổng quát về hệ miễn dịch như
sau:
Hệ miễn dịch là hệ thống sinh học bảo vệ cơ thể chống lại những tấn công
liên tục của các sinh vật từ bên ngoài, với hai chức năng chính là nhận diện và loại
bỏ những vi sinh vật xâm nhập vào cơ thể.
Miễn dịch học là một môn học hiện đại và là một ngành khoa học thực
nghiệm nghiên cứu về hệ miễn dịch. Miễn dịch học bắt đầu được biết đến với thành
tựu của Edward Jenner (1749 – 1823) trong việc chủng ngừa phòng bệnh đậu mùa.

Jenner là một thầy thuốc người Anh, ông đã quan sát thấy rằng những người vắt sữa
đã bị bệnh đậu bò và sau đó hồi phục thì không bao giờ mắc bệnh đậu mùa nữa.
Dựa vào nhận định này, ông đã lấy dịch từ vết thương của người bị đậu bò tiêm cho
một đứa trẻ 8 tuổi. Đứa trẻ này sau đó cho tiếp xúc trực tiếp với người bệnh đậu
mùa thì đã không mắc bệnh và ông gọi cách bảo vệ của mình là “vaccination”
(chủng ngừa) (chữ vaccination bắt nguồn từ tiếng Latinh “vacca” nghĩa là con bò
cái) và đã cho xuất bản quyển sách “Vaccination” vào năm 1798.
Năm 1980, Tổ chức Y tế Thế giới công bố rằng bệnh đậu mùa là căn bệnh
đầu tiên trên thế giới đã bị loại trừ nhờ vào công tác chủng ngừa. Từ đó khoa học về
miễn dịch liên tục phát triển và đến nay đã đạt được rất nhiều thành tựu cả về mặt lý

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


-9-

thuyết cũng như thực tế.
3.2. Các thành phần chủ yếu của hệ miễn dịch
Chức năng của hệ miễn dịch sinh học là nhận dạng tế bào và phân chia
chúng thành hai nhóm khác nhau: self (những tế bào của cơ thể tạo ra) và non-self
(những tế bào lạ), đồng thời loại bỏ các tế bào thuộc loại non-self.
Hệ miễn dịch bẩm sinh chủ yếu dựa vào bạch cầu hạt và đại thực bào, còn hệ

miễn dịch thích nghi dựa vào tế bào lympho (lymphocyte). Các tế bào lympho được
chia làm hai loại là B-cell và T-cell, chúng có khả năng ghi nhớ, thích nghi, và
mang những phần tử thụ cảm trên bề mặt có khả năng nhận diện kháng nguyên
(antigen). Vai trò chính của B-cell là sản sinh ra các kháng thể (antibody) tương ứng
với các tác nhân gây bệnh, còn chức năng chính của T-cell là điều chỉnh các tế bào
khác và tấn công trực tiếp các tế bào gây ra sự lây nhiễm trong cơ thể.
Khi có kháng nguyên xâm nhập vào cơ thể, các cơ quan thụ cảm trên bề mặt
của lympho bào được kích hoạt và thực hiện quá trình nhân rộng, đột biến và tạo ra
những kháng thể thích hợp có khả năng nhận diện cũng như loại bỏ kháng nguyên.
Một số lympho bào sẽ trở thành tế bào ghi nhớ và lưu thông trong cơ thể, sau đó,
nếu có loại kháng nguyên tương tự lây nhiễm thì hệ miễn dịch thích nghi có thể
nhanh chóng phát hiện và loại bỏ chúng. Khả năng "tự hoàn thiện" này của hệ miễn
dịch giúp cơ thể không mắc lại những bệnh cũ.
Hệ miễn dịch sinh học bao gồm hơn 107 mạng miễn dịch con (immune subnetwork) với các nguyên tắc hoạt động rất phức tạp. Nó thực sự là một hệ thống
hoạt động tin cậy, thống nhất, có khả năng tính toán song song và phân tán. Xét
theo quan điểm của khoa học máy tính, thì việc xây dựng hệ thống tính toán mô
phỏng hệ thống miễn dịch sinh học có rất nhiều ý nghĩa thực tiễn.
HMD là một cơ chế bảo vệ tự nhiên hiệu quả và tức thời, cho phép cơ thể
chống lại những lây nhiễm của các vi sinh vật bên ngoài. Nó bao gồm hai tầng bảo
vệ là: Hệ thống miễn dịch bẩm sinh và hệ thống miễn dịch thích nghi. Cả hai hệ

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha



- 10 -

thống hoạt động dựa trên các tế bào bạch huyết (white blood cells) còn gọi là bạch
cầu (leukocyte). Trong đó HMD bẩm sinh chủ yếu dựa vào bạch cầu hạt
(granulocyte) và đại thực bào (macrophage), còn HMD thích nghi dựa vào tế bào
lympho (lymphocyte – là một loại bạch cầu).
Imunnity

Innate

Granulocyte
s
Neutrophil
s

Eosinophil
s

Adaptive

Macrophage
s
Basophil
s

Lymphocytes

B-cell


T-cell

Hình 3.1: Các dòng miễn dịch và thành phần của HMD
HMD sinh học bao gồm các thành phần sau:
- Đại thực bào (Macrophage): Là thành phần của HMD bẩm sinh. Đại thực
bào có khả năng trình diện các kháng nguyên với các tế bào khác và được gọi là các
tế bào trình diện kháng nguyên (antigen-presenting cells – APC). Đại thực bào là
một tế bào dọn dẹp lớn (một thực bào) có trong mô liên kết và trong nhiều cơ quan
như tuỷ xương, lách, hạch bạch huyết, gan và thần kinh trung ương. Đại thực bào có
liên kết mật thiết với các bạch cầu hạt đơn nhân. Đại thực bào cố định (mô bào) ở
tại chỗ trong các mô liên kết; đại thực bào tự do di chuyển giữa các tế bào và tụ tập
ở các ổ nhiễm để loại bỏ vi trùng và các thể ngoại lai khác ra khỏi các mô và máu.
- Bạch cầu hạt (Granulocyte): Là thành phần của HMD bẩm sinh. Bạch cầu
hạt gồm các loại bạch cầu trung tính (Neutrophils), bạch cầu ưa eosin (Eosionphils),
bạch cầu ái kiềm (Basophils) có khả năng nuốt và tiêu huỷ một số vi sinh vật và một
số phần của kháng nguyên xâm nhập vào cơ thể.
- Bạch cầu trung tính (Neutrophils – Bạch cầu đa hình): Một bạch cầu có

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha



- 11 -

nhân hình thuỳ và trong bào tương có nhiều hạt nhỏ màu đỏ tía, bạch cầu trung tính
có khả năng nuốt và giết các vi trùng, tạo thành một cơ chế bảo vệ quan trọng chống
lại các bệnh nhiễm.
- Bạch cầu ưa eosin (Eosionphils): Là một loại bạch cầu trong bào tương có
những hạt thô nhuộm màu đỏ cam. Chức năng của loại bạch cầu này chưa được biết
đầy đủ, chỉ biết chúng có khả năng nuốt các hạt lạ, có mặt với số lượng lớn trong
niêm mạc và các cơ quan bề mặt bao phủ trong cơ thể đồng thời có liên quan đến
các đáp ứng dị ứng.
- Bạch cầu ái kiềm (Basophils): Chức năng của bạch cầu ái kiềm chưa được
biết rõ, chỉ biết chúng có khả năng nuốt các vật lạ có chứa histamine và heparin.
- Lympho bào (Lymphocyte): Là thành phần của HMD thích nghi. Là một
loại bạch cầu ở trong các hạch bạch huyết, lách, tuyến ức, thành ruột, và tuỷ xương.
Các lympho bào có nhân đặc và bào tương màu xanh lạt sáng. Lympho bào có thể
chia ra lympho bào B sản sinh ra kháng thể và lympho bào T liên quan đến việc loại
thải mô ghép. Lympho bào có nhiệm vụ nhận diện và loại bỏ tác nhân gây bệnh.
3.3. Các cơ chế kích hoạt (hoạt hoá) và nhận diện miễn dịch cơ bản
HMD chứa một tập tế bào (cells) và phần tử (molecules) bảo vệ cơ thể chống
lại sự lây nhiễm. Khi bị các kháng nguyên tấn công HMD thích nghi sẽ được kích
hoạt. Kháng nguyên có thể là những phần tử bên ngoài (antigen) như các phần tử
trên bề mặt của các tác nhân gây bệnh hoặc các kháng nguyên do tế bào của cơ thể
tạo ra (self-antigen).
Hình 3.2 là một ví dụ đơn giản về cơ chế kích hoạt và nhận diện của HMD.
Phần 1 của sơ đồ cho thấy cách thức hoạt động các tế bào trình diện kháng nguyên
(Antigen Presenting Cells – APC). Đầu tiên những kháng nguyên sẽ bị các cơ quan
trình diện kháng nguyên như đại thực bào nuốt và tiêu hoá, phân ra thành các
peptide kháng nguyên. Một phần của những peptide này kết hợp với các phần tử
MHC (Major Histocompatibility Complex – phức hợp các phần tử có nhiệm vụ


GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- 12 -

trình diện peptide kháng nguyên cho T-cell) trên bề mặt của APC tạo thành phức
hợp MHC/peptide (II).
T-cell mang những cơ quan thụ cảm bề mặt cho phép chúng nhận dạng các
phức hợp MHC/peptide khác nhau (III). Mỗi khi nhận diện được MHC/peptide, Tcell sẽ được kích hoạt, phân chia và tạo ra các lymphokine (là một loại bạch cầu)
hoặc các tín hiệu hoá học (chemical signals) kích thích các thành phần khác của
HMD hoạt động (IV).

Hình 3.2: Sự nhận diện và cơ chế kích hoạt đơn giản
APC (Antigen Presenting Cell): Tế bào trình diện kháng nguyên, MHC

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:


Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- 13 -

(Major Histocompatibility Complex): Phức hợp các phần tử có nhiệm vụ trình diện
peptide kháng nguyên cho T-cell, Pathogen: Tác nhân gây bệnh, Lymphokines: Là
một loại bạch cầu, B-cell: Tế bào lympho B, Actived B-cell: B-cell được kích hoạt,
T-cell: Tế bào lympho T, Activated T-cell: T-cell được kích hoạt, Plasma cell:
Tương bào.
Không giống T-cell (lympho bào T), B-cell (lympho bào B) có các cơ quan
thụ cảm có khả năng nhận diện kháng nguyên một cách tự do không cần hỗ trợ của
những phần tử MHC (V). Mỗi cơ quan thụ cảm trên bề mặt B-cell chỉ có thể nhận
diện một kháng nguyên cụ thể. Khi cơ quan thụ cảm B-cell nhận được tín hiệu, Bcell được kích hoạt và nhân rộng, biệt hoá (biến đổi) thành các tương bào (Plasma
cell), các tương bào sẽ sản sinh ra kháng thể với số lượng lớn. Những kháng thể này
sẽ vô hiệu hoá tác nhân gây bệnh. Một số B-cell và T-cell được kích hoạt này sẽ
chuyển thành các tế bào ghi nhớ (memory cell). Chúng sẽ tiếp tục lưu thông trong
cơ thể trong một khoảng thời gian dài, giúp cơ thể chống lại những kháng nguyên
tương tự lây nhiễm sau đó, nhờ có sự “suy luận” (elicit) của HMD.
3.4. Chức năng sinh học của hệ miễn dịch

Hình 3.3: Các cơ quan sản sinh bạch cầu

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:


Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- 14 -

Có nhiều bộ phận sản sinh bạch cầu trong cơ thể tạo nên HMD, những thành
phần này gọi là cơ quan lymphoid (lymphoid organ – cơ quan sản sinh bạch cầu),
mỗi thành phần giữ một vai trò nhất định trong việc sản sinh, trưởng thành và phát
triển của các lympho bào (lymphocyte – là một loại bạch cầu), chủ yếu là B-cell và
T-cell. Các cơ quan lymphoid có thể được chia thành 2 loại: Loại cơ quan tiên phát
(primary lymphoid organs), chúng có nhiệm vụ sản sinh lympho bào và tăng độ
thích hợp của chúng với các kháng nguyên bằng cơ chế chọn lọc và đột biến. Loại
cơ quan thứ phát (secondary lymphoid organs). Tại những cơ quan này các lympho
bào sau khi sinh ra tương tác với tác nhân kích thích kháng nguyên (antigentic
stimuli) làm cho đáp ứng miễn dịch thích nghi được kích hoạt. Hình 3.3 cho thấy
các cơ quan lymphoid (lymphoid organs) phân bố trong cơ thể.
3.4.1. Các cơ quan lymphoid tiên phát (Primary lymphoid organs)
- Tủy xương (Bone marrow): Nó là một nơi quan trọng có nhiệm vụ sản sinh
các loại tế bào màu, bao gồm hồng cầu (red bood cell), bạch cầu đơn nhân
(monocyte - có chức năng nuốt các hạt lạ), bạch cầu hạt (granulocayte), lympho bào
(lymphocyte - là một loại bạch cầu), tiểu huyết cầu (platelets - giúp máu đông). Nó
cung cấp môi trường để mỗi B-cell phân biệt một kháng nguyên nào đó và để xử lý
kháng nguyên.
- Tuyến ức (Thymus): ở sau xương ức sternum, ở phần trên và ở phần trước
của tim. Nó cung cấp môi trường để T-cell phân biệt kháng nguyên và tạo ra những
nhân tố hormon cho sự trưởng thành của T-cell.
3.4.2. Các cơ quan lymphoid thứ phát (Secondary lymphoid organs)
Các cơ quan lymphoid thứ phát là nơi lympho bào tương tác với tác nhân

kích thích kháng nguyên (antigentic stimuli) làm cho đáp ứng miễn dịch thích nghi
được kích hoạt. Bao gồm:
-

Hạch hạt nhân ở họng và amydam (Tonsils và adenoid)

-

Các nút Lympho (Lympho nodes)

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha


- 15 -

-

Ruột thừa và Máng Peyer (Appendix và peyer’s patches)

-

Lách (spleen)


-

Mạch lymphatic (Lymphatic vessels-Lymphatic system)

3.4.3. Các tầng bảo vệ của hệ miễn dịch
HMD có thể coi như một kiến trúc phân tầng với cơ chế điều chỉnh và bảo vệ
trong một số mức như hình 3.4.

Hình 3.4: Kiến trúc đa tầng của HMD
Pathogens: Tác nhân gây bệnh, Skin: Lớp da, Biochemical Barriers: Hàng
rào sinh hóa, Innate immune response: Đáp ứng miễn dịch bẩm sinh, Adaptive
immune response: đáp ứng miễn dịch thích nghi, Phagocyte: Thực bào,
Lymphocyte: Lympho bào (là một loại bạch cầu).
Các hàng rào vật lý (Physical barriers): Gồm lớp da và màng nhầy nằm ở các
tuyến hô hấp và tiêu hóa chứa đại thực bào (macrophage) và kháng thể ngăn không
cho những chất lạ xâm nhập vào cơ thể.
Hàng rào sinh hóa (Biochemical barriers): Các chất lưu như nước bọt, mồ
hôi nước mắt chứa những enzym có thể loại bỏ kháng nguyên. Các Axit trong da

GVHD:

TS. Vũ Thanh Nguyên
ThS. Nguyễn Hữu Thương

SVTH:

Nguyễn Phương Anh
Nguyễn Vĩnh Kha



×