Thám mã khối trên máy tính song song dùng hệ điều hành Linux

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (565.46 KB, 27 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO BỘ QUỐC PHÒNG

HỌC VIỆN KỸ THUẬT QUÂN SỰ

Hoàng Minh Tuấn

THÁM MÃ KHỐI TRÊN MÁY TÍNH SONG SONG
DÙNG HỆ ĐIỀU HÀNH LINUX

Chuyên ngành : Kỹ thuật điện tử
Mã số : 62.52.70.01

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT

Hà Nội – 2008

Công trình được hoàn thành tại
Học viện Kỹ thuật Quân sự

Người hướng dẫn khoa học :
1. PGS. TS. Lê Anh Dũng
2. TS. Vũ Minh Tiến

Phản biện 1: PGS. TS. Bùi Huy Hoàng
Phản biện 2: PGS. TSKH. Nguyễn Hồng Vũ
Phản biện 3: PGS. Phương Xuân Nhàn

Luận án được bảo vệ trước Hội đồng chấm luận án cấp
Nhà nước
Học viện KTQS.
Vào 13 giờ 30 ngày 3 tháng 9 năm 2008

Có thể tìm hiểu luận án tại các thư viện:
- Thư viện quốc gia
- Thư viện Học viện Kỹ thuật Quân sự

MỞ ĐẦU
Mã hóa (Encryption) từ lâu đã là một phần không thể tách rời
trong thực thi các giao dịch điện tử nhằm đảm bảo tính riêng tư và
các bí mật thương mại. Với nhu cầu trao đổi thông tin ngày càng lớn
thì việc mã hóa ngày càng có tầm quan trọng cao hơn. Trong mật mã
học hiện đại, có mã hoá đối xứng và bất đối xứng với các điểm mạnh

và mặt yếu riêng phù hợp với từng loại
ứng dụng. Trong số đó, mã
hóa khối (block ciphering) là những thuật toán mã hóa đối xứng hoạt
động trên những khối thông tin có độ dài xác định qua những phép
chuyển đổi xác định. Nội dung nghiên cứu của luận văn sẽ chỉ hạn
chế trong lĩnh vực mã khối, một phần do tính khả dụng của nó trong
lĩnh vực thông tin vô tuyến điện, an ninh mạng và giao dịch điện tử
nói chung là rất đáng quan tâm, ph
ần khác, do sự hạn chế khuôn khổ
nghiên cứu của một luận văn tiến sĩ mà tác giả không dám đặt ra một
phạm vi nghiên cứu rộng hơn.
Ngược lại với mã hóa, thám mã là công việc nhằm tìm ra khóa bí
mật với mục đích cuối cùng là “đọc được” các nội dung bản rõ được
mã hoá bởi các giải thuật mã hóa nói chung. Mục đích của nghiên
cứu thám mã nói chung và thám mã khối nói riêng nhằm kiểm chứng
các phương pháp mã hoá khác nhau cho các ứ
ng dụng cụ thể và
giúp lấy được các thông tin mật với một mục đích nhất định.
Trên thực tế, việc thám mã thành công là rất khó khăn và đã có
rất nhiều phương pháp thám mã được đề cập, trong số đó khá phổ
biến là việc sử dụng giải thuật vét cạn không gian khóa. Tuy nhiên
để hiện thực hoá giải thuật vét cạn ta cần giải quyết 2 vấn đề đặt ra :
c Xây d
ựng các máy tính có tốc độ tính toán cao hay còn gọi là
Siêu máy tính (SMT).
d Tìm kiếm và hoàn thiện các giải thuật và quy trình thám mã (gọi
chung là thám mã) với mục đích khai thác tối đa khả năng tính
toán của SMT, nhằm thám mã với thời gian ngắn nhất và chất
lượng cao nhất.
Trong phạm vi của một luận văn tiến sỹ chuyên ngành Điện tử,

với sự giúp đỡ của tập thể giáo viên hướng dẫn và các nhà khoa học
khác, tác giả tự
đặt cho mình nhiệm vụ trọng tâm là nghiên cứu các
2

giải pháp kỹ thuật hỗ trợ thám mã các bản mã với gốc (bản rõ) là các
văn bản thông thường (trong phạm vi bảng mã ASCII) của ba ngôn
ngữ : Tiếng Anh, tiếng Nga và tiếng Việt được mã hóa theo một số
chuẩn mã hóa khối (DES, AES128, AES192, AES256, IDEA) và có
khả năng mở rộng.
Nội dung nghiên cứu cụ thể bao gồm :
− Tổng quan về kỹ thuật thám mã khối. Phương pháp tiếp cận;
− Tiêu chuẩn bản rõ (TCBR) và các phương pháp tự động dừng
quá trình thám mã vét cạn khi có nhiều tiến trình;
− Xây dựng một mô hình máy tính song song (MTSS) cho mục
đích giải mã khối và tổ chức quá trình thám mã khối trên máy
này, bao gồm cả phương pháp sinh khoá cho các tiến trình.
Với mục tiêu trên luận án bao gồm phần mở đầu, 3 chương, phần
kết luận và phụ lục. Nội dung các chương như sau :
Chương 1
trình bày tổng quan về bài toán thám mã khối và các
nhiệm vụ nghiên cứu đặt ra nhằm thực hiện thám mã các khối văn
bản được mã hóa theo một số chuẩn mã hóa khối phổ biến.
Chương 2
nghiên cứu cơ sở lý thuyết và tính toán các tiêu chuẩn
bản rõ (1, 2, 3, 4 và 5 chiều) cho ba ngôn ngữ tiếng Anh, tiếng Nga
và tiếng Việt. Đồng thời ứng dụng các tiêu chuẩn bản rõ tự xây dựng
này cho một số giải thuật thám mã khối chuẩn (DES, IDEA và AES)
với các kỹ thuật rút gọn không gian khóa cần thử, cũng như các
phương pháp tự động dừng quá trình giải mã khi có nhiều tiến trình

Nội dung chương được thể hiện trong các bài báo [2], [3] và [4].
Chươ
ng 3 xây dựng máy tính song song (MTSS) và tổ chức quá
trình thám mã khối trên MTSS tự xây dựng, cùng một số kết quả thử
nghiệm cũng như các nghiên cứu hình thành bộ công cụ sinh khóa
(cấp, theo dõi và quản lý khóa) nhằm tận dụng nguồn lực tính toán.
Nội dung chương được thể hiện trong các bài báo [1] và [3].
CHƯƠNG I. TỔNG QUAN VỀ BÀI TOÁN THÁM MÃ KHỐI
VÀ CÁC NHIỆM VỤ NGHIÊN CỨU ĐẶT RA
1.1 Tổng quan về các loại mật mã đối xứng và ứng dụng
Mật mã kh
ối và mật mã dòng là 2 loại phổ biến trong các mật mã
3

đối xứng. Trong đó Mật mã khối [35], [56] (đối tượng nghiên cứu
của luận án) là là loại mật mã thực hiện trên các khối thông tin có độ
dài xác định (ký hiệu là n). Tính đến trước những năm giữa của thập
kỷ 1990 thì độ dài 64 bít thường được sử dụng, sau đó khối 128 bít
được dùng rộng rãi hơn nhờ sự tiến bộ của kỹ thuật máy tính, và nhờ
thế độ mật đượ
c cải thiện đáng kể. Trong các chế độ (mode) mã hóa
khối để xử lý trường hợp độ dài văn bản lớn hơn 1 khối, người ta
thường phải bổ sung thêm một số bít để văn bản chứa số nguyên lần
các khối. Độ dài thông thường của khóa K là 40, 56, 64, 80, 128, 192
và 256 bít. Năm 2006 độ dài tối thiểu của khóa là 80 bít với hy vọng
nó có thể chống lại tấn công vét cạn bằng các kỹ
thuật tính toán có
được tại thời điểm này.

Hình 1.2 Quy trình tổng thể mã/giải mã với chế độ mã hóa ECB
Các giải thuật mã/giải mã khối khá đơn giản và là hàm ngược
của nhau. Hai quy trình này được thể hiện trên hình 1.2 như thí dụ
cho trường hợp chế độ mã hoá ECB. Do tính đơn giản và độ bảo mật
dựa trên độ dài khóa nên mã hóa khối được ứng dụng rộng rãi cả
a. Quy trình mã hóa
Yes
No
I <
N
Khóa K
Bản rõ
[
I
]

Hàm mã hóa
các khối dữ
Bản mã[I]
Input : K, N
I = 0
;
I++
End
Y
es
No
I <
N
Khóa K
Bản mã[I]
Hàm giải mã
các khối mã
Bản rõ[I]
Input : K, N
I = 0
;
I++
End
b. Quy trình giải mã
4

trong phần cứng lẫn phần mềm. Các thống kê từ [70] cho thấy có
trên 50 loại mật mã khối đang thịnh hành. Con số đó cũng nói lên
tầm quan trọng của mã khối trong kỹ thuật mã hóa và thám mã nói
chung trong các ứng dụng thực tế.

1.2 Tổng quan về kỹ thuật thám mã khối
1.2.1 Các phương pháp thám mã khối
Phân tích quá trình thực hiện mã hóa ta có thể phân loại một số
phương pháp thám mã khối như sau : (i) Thám mã khối theo phương
pháp hộp đen – coi nó nh
ư một hộp đen để từ đó tìm kiếm các bản rõ
và khóa mật; (ii) Thám mã khối theo phương pháp đường tắt là các
dạng thám mã vi sai [6], [7], [9] cùng các biến thể của nó, thám mã
tuyến tính, thám mã vi sai tuyến tính [8] và một vài phương pháp
khác; và (iii) Phương pháp thám mã trên kênh biên như tấn công
trong khoảng thời gian mã hóa hoặc
đo mức tiêu thụ năng lượng của
các thiết bị phần cứng. Nội dung của luận văn sẽ đi sâu vào phương
pháp (i) – thám mã khối theo phương pháp hộp đen.
1.2.2 Thám mã khối theo phương pháp hộp đen
Đây là hướng nghiên cứu chính của luận văn. Những phương
pháp thám mã này bao gồm phương pháp vét cạn để tìm khóa đúng,
phương pháp sử dụng các hệ thống phần cứng chuyên dùng để thám
mã các bản mã nhiề
u lớp, phương pháp thám mã dựa trên sự xung
đột của khóa, phương pháp dựa trên việc cân bằng giữa thời gian và
bộ nhớ. Tuy nhiên, trong các phương pháp nêu trên nội dung của
luận văn cũng chỉ đi sâu vào việc nghiên cứu phương pháp vét cạn để
tìm khóa đúng, tức là phương pháp thử khóa, khóa này nối tiếp khóa
kia cho đến khi tìm ra một khóa đúng. Một đặc tính quan trọng của
phương pháp vét cạn là chúng ta có thể thực hiện thám mã song song
trên nhiều bộ x
ử lý hoặc trên các máy được thiết kế chuyên dùng cho
mục đích này.
Gợi ý cơ bản cho hướng nghiên cứu thám mã vét cạn là “Kiến

trúc hệ thống tấn công vét cạn phá vỡ khóa DES” [49] của nhóm
Rocke Verser, Matt Curtin, và Justin Dolske thực hiện tháng 5 năm
1998 như được thể hiện trên hình 1.3.
Thành phần tham gia tấn công này rất đơn giản gồm 1 mạng
5

LAN tại trung tâm thực hiện tấn công và các máy tính trên Internet.
Các kết quả được trao đổi thông qua giao thức UDP mở rộng thêm
các chức năng kiểm tra vét cạn khóa DES cùng với việc tổ chức các
hệ thống Server ủy quyền U2T (ủy quyền phân phối khóa), T2U (mô
phỏng lại giao thức Web để vượt qua Firewall) và HTTP (chuyển dữ
liệu đến T2U gateway cho các máy sử dụng Firewall ở lớp ứng
dụng).

Do là một vấn đề “nhậ
y cảm” nên các chi tiết kỹ thuật cụ thể và
giải thuật thực hiện thám mã của nhóm này đã không được công bố.
NCS tự đặt cho mình nhiệm vụ cụ thể hoá ý tưởng trên bằng việc đề
xuất các giải thuật và tổ chức quá trình thám mã song song trong các
chương tiếp theo, nhằm hiện thực hoá quá trình thám mã khối vét cạn
trong điều kiện Việt nam.
Hình 1.3 Kiến trúc hệ thống tấn công
vét cạn khóa DES
Máy chủ cấp
p
hát khóa
Internet
Tường lửa
28.8 Kbps
LAN KẾT NỐI INTERNET
LAN KẾT NỐI INTERNET
CÁC CLIENTS KẾT NỐI
INTERNET THÔNG QUA ISP
LAN CỦA TRUNG TÂM
THỰC HIỆN TẤN CÔNG
U2T
Proxy
U2T
Proxy
U2T

Proxy
HTTP
Proxy
T2U
Proxy
T2U
Proxy
6

1.2.3 Các nền tảng tính toán phục vụ thám mã khối theo
phương pháp hộp đen
Các nền tảng phần cứng có thể lựa chọn là máy tính song song
và mạng, tính toán lưới hoặc phương án sử dụng phần cứng chuyên
dụng. Tuy nhiên việc xây dựng máy tính song song chi phí thấp (bó
máy tính) là phương án khả thi và hiệu quả trong điều kiện Việt nam.
Nó đảm bảo tính dễ thực thi cũng như đầu tư kinh phí ban đầu không
lớn để triể
n khai.
1.3 Một số kết luận và đề xuất các nội dung cần nghiên cứu
1.3.1 Một số kết luận
Một số kết luận quan trọng của chương I bao gồm :
c Qua các chuẩn mã hoá hiện đại ta thấy độ an toàn của các
thông tin mã hóa vẫn luôn dựa vào độ dài của khóa mã và độ phức
tạp của giải thuật mã hoá. Hai biện pháp này luôn song hành nhằm
hạn chế tối đa khả năng thám mã củ
a con người dựa trên các nỗ lực
thông thường trong một khoảng thời gian hữu hạn có ý nghĩa thực tế.
d Cùng với sự phát triển của các chuẩn mã hóa là sự gia tăng
không ngừng của các nỗ lực thám mã. Nhiều nghiên cứu thám mã
dẫu còn mang nặng tính lý thuyết, vẫn chứng minh được khả năng

hiện thực hoá khi được tiến hành trên các công cụ phù hợp trong
những trường hợp và ngữ cảnh nhất
định.
e Hệ thống tấn công vét cạn thành công đối với chuẩn mã hóa
DES [49] cho thấy có thể thực hiện việc thám mã dựa trên các mạng
LAN chuyên biệt, hoặc các mạng máy tính lưới xuyên quốc gia và
thậm chí trên toàn bộ mạng Internet. Tuy nhiên chi tiết kỹ thuật và
các giải thuật quan trọng bổ sung để thực hiện thám mã thành công
đã không được công bố.
f Trong số nhiều phương pháp thám mã, thực tế và hiệu quả
nhất vẫn là ph
ương pháp vét cạn kết hợp với các biện pháp thu hẹp
không gian khóa dựa trên các biện pháp kỹ thuật và phi kỹ thuật.
Việc nghiên cứu để hiện thực hoá và xây dựng các công cụ thám mã
theo hướng này là rất cần thiết và quan trọng.
1.3.2 Đề xuất các nội dung nghiên cứu của luận án
Qua các kết luận ở trên ta nhận thấy một số vấn đề sau cần giải
7

quyết cụ thể trong kỹ thuật thám mã vét cạn (còn gọi là thám mã kiểu
hộp đen):
1- Xây dựng một số tiêu chuẩn bản rõ nhận dạng ngôn ngữ
văn bản, nhằm ứng dụng vào việc tự động nhận dạng khóa đúng
(gián tiếp thông qua bản rõ “đúng”) để kết thúc một tiến trình giải
mã. Trước mắt, tiêu chuẩn này được xây dựng cho ba ngôn ngữ :
Tiếng Anh, tiếng Việt (mã UNICODE) và ti
ếng Nga (mã
UNICODE). Trên cơ sở phương pháp xây dựng các tiêu chuẩn bản
rõ này sẽ tìm cách nhân rộng mô hình cho các ngôn ngữ khác.
2- Tổ chức quá trình tính toán song song thực hiện thám mã

khối theo phương pháp hộp đen trên “siêu máy tính” (SMT) sử dụng
hệ điều hành Linux. Các nghiên cứu này có thể mở rộng trong tương
lai.
3- Nghiên cứu xây dựng các công cụ sinh khóa (cấp phát, quản
lý, kiểm tra, kiểm soát khóa) phục vụ thám mã vét cạn nhờ SMT với
một không gian khóa ℜ được định ngh
ĩa trước.
Các giả thuyết sau được NCS áp dụng: (i) Hạn chế chỉ nghiên
cứu thám mã các bản mã mà đầu vào là các văn bản tường minh
(dạng ASCII) của ba ngôn ngữ Anh, Nga, Việt; (ii) Giả định giải
thuật mã/giải mã nằm trong số các chuẩn DES, IDEA, AES128,
AES192 và AES256, tuy vẫn xem xét khả năng mở rộng trong các
nghiên cứu tiếp theo và (iii) Hạn chế thám mã cho một chế độ mã
hóa điển hình – chế độ mã hóa cơ bản ECB (Electronic Codebook).
Các giả thiế
t này tạo thuận lợi cho NCS tập trung vào những vấn
đề cốt lõi của nội dung nghiên cứu, tuy không làm mất đi tính tổng
quát và khả năng mở rộng sau này.
CHƯƠNG II. XÂY DỰNG MÔ HÌNH THỐNG KÊ VÀ
TIÊU CHUẨN NHẬN DẠNG BẢN RÕ
2.1 Vai trò và phương pháp xây dựng tiêu chuẩn bản rõ
2.1.1 Vai trò của tiêu chuẩn bản rõ
Với một không gian khóa lớn nếu việc nhận dạng bản rõ thực
hiện thủ công trong quá trình thám mã vét cạn sẽ hoàn toàn không
khả thi do v
ượt quá khả năng của con người và phương tiện. Do vậy
vấn đề xây dựng các tiêu chuẩn bản rõ (TCBR) nhận dạng ngôn ngữ
8

và sử dụng nó như một mô đun tự động trong quá trình thám mã là

hết sức cần thiết.
2.1.2 Các phương pháp xây dựng tiêu chuẩn bản rõ
Có nhiều phương pháp đã được các nhà nghiên cứu đề xuất như
TCBR từ điển hoặc TCBR dùng từ giả định. Tuy nhiên những TCBR
này đều có những hạn chế như : Tốc độ nhận dạng bản rõ chậm, Kết
quả nhiều khi thiếu chính xác hoặc không thám mã
được; Từ đây đòi
hỏi ta cần nghiên cứu một TCBR tốt hơn, hiệu quả hơn.
2.2 Mô hình thống kê cho bản rõ
2.2.1 Mô hình Markov cho văn bản
Nếu đọc một văn bản từ chữ đầu đến chữ cuối nhiều nghiên cứu
chỉ ra rằng có thể coi đó như một quá trình Markov chuyển từ trạng
thái này sang trạng thái kia mà xác suất chuyển trạng thái của chúng
phụ thuộc vào đặc tính c
ủa ngôn ngữ. Nói cách khác, ngôn ngữ viết
được mô hình hóa bằng tập các trạng thái của xích Markov và ma
trận xác suất chuyển trạng thái giữa chúng. Như vậy, chúng ta có thể
dựa vào mô hình Markov này để giải quyết bài toán ngược lại là
nhận dạng ngôn ngữ cho các văn bản cụ thể.
Một mô hình Markov được định nghĩa gồm một bộ năm thành
phần (m, A, {Y
t
} t∈T, P, r). Trong đó : m là số các trạng thái của
xích, A là không gian các trạng thái, {Y
t
} t∈T là quá trình ngẫu
nhiên dừng với T ⊂ Z = { 0, ±1, ±2, }, P là ma trận các xác suất
chuyển trạng thái , r là cấp của xích Markov.
2.2.2 Cơ sở toán học để xây dựng tiêu chuẩn bản rõ
Các nghiên cứu xây dựng TCBR trong luận án dựa trên các ước

lượng thống kê và kiểm định các giả thiết thống kê.
Ước lượng thống kê
. Với mẫu ngôn ngữ X = x
1
x
2
x
n
cần nhận
dạng xem nó đọc được hay không ta sử dụng hai giả thiết đối nghịch
nhau H
0
và H
1
được phát biểu như sau :
− H
0
: Mẫu ký tự X đang xét là mẫu ký tự đọc được (bản rõ).
− H
1
: Mẫu X là mẫu không đọc được (bản mã).
Ta ký hiệu : P(X/H
0
) là ma trận tham số mật độ xác suất tương
ứng với giả thiết H
0
đúng mà ta cần ước lượng và P(X/H
1
) là ma trận
tham số mật độ xác suất tương ứng với đối thiết H

1
đúng được phân
9

bố ngẫu nhiên.
Quá trình ước lượng các tham số được thực hiện trên cơ sở xây
dựng mẫu văn bản, tính tần suất xuất hiện các ký tự đơn, tần suất bộ
đôi, bộ ba móc xích, … Tức là thực hiện việc ước lượng các tham số
cho các ma trận P(X/H
0
) và P(X/H
1
). Trên cơ sở của hai ma trận tham
số này ta tiến hành việc kiểm định các giả thiết thống kê.
Kiểm định các giả thiết thống kê
. Thực chất là việc xem xét xem
mẫu X gần với H
0
hay H
1
. Cụ thể nếu P(X/H
1
) ≥ P(X/H
0
) mẫu X
thuộc lớp bản mã (không đọc được), ngược lại X thuộc lớp bản rõ
(đọc được). Như vậy ∀ ký tự i thuộc mẫu X quan hệ trên thể hiện
bằng hàm thống kê [19] như sau:
)/(
)/(

)(
0
1
HXP
HXP
XT
i
i
i
=
(2.1)
Nói cách khác nếu T(X
i
) ≥ 1, X
i
thuộc bản mã, ngược lại X
i
thuộc
bản rõ. Cũng vậy, nếu k là một số nguyên dương ≥ 1, ta xét :
[]
⎥
⎦
⎤
⎢
⎣
⎡
==
)/(
)/(
log)(log.)(

0
1
1010
HXP
HXP
kXTkXT
i
i
ii
(2.2)
và nếu
)(
i
XT
≥ 0, X
i
thuộc lớp bản mã, ngược lại X
i
thuộc bản rõ.
Ước lượng (2.2) là ước lượng cơ bản dùng để tính các TCBR
nhận dạng ngôn ngữ.
Các tham số tính toán TCBR 1 chiều cho ngôn ngữ với m ký tự
:
P[X/H
1
] = {1/m, 1/m, , 1/m}; (2.3)
P[X/H
0
] cũng gồm m phần tử:
N

n
f
i
i
=
(2.4)
Trong đó f
i
là tần suất xuất hiện của các chữ cái thứ i trong văn
bản mẫu; n
i
là tổng số các ký tự tương ứng với chữ cái thứ i trong
bảng chữ cái xuất hiện trong văn bản mẫu; N là độ dài văn bản mẫu.
Các tham số tính toán TCBR 2 chiều cho ngôn ngữ với m ký tự
:
− Tương tự như trong mô hình Markov cấp 0 ta có :
⎥
⎥
⎥
⎥
⎦
⎤
⎢
⎢
⎢
⎢
⎣
⎡
=
mmm

mmm
mmm
HXP
mxm
/1 /1/1

/1 /1/1
/1 /1/1
]/[
1
(2.5)
− Các phần tử
ij
P
ˆ
(1 ≤ i, j ≤ m) của ma trận mật độ phân bố xác
10

suất P[X/H
0
]
mxm
các bộ đôi ký tự móc xích trong văn bản
mẫu (gồm N từ) được ước lượng như sau [19]:
mC
Cn
P
i
ij
ij

+
+
=
η
ˆ
(2.6)
− n
ij
là các phần tử của ma trận E
m x m
phần tử. n
ij
được tính
theo công thức [19] sau đây :
∑
−
=
=
1
1
),(
N
k
kij
jiXn (2.7)
Trong đó N là độ dài văn bản mẫu, X
k
(i, j) = 1 nếu cặp ký tự
thứ (i, j) xuất hiện tại vị trí thứ k; ngược lại X
k

(i, j) = 0.
− m là hằng số thể hiện số các chữ cái của ngôn ngữ, C = 1/m
là hằng số san bằng,
η
i
có giá trị bằng tổng số các giá trị tần
suất xuất hiện của bộ đôi chữ cái bắt đầu bằng chữ cái thứ i
kết hợp với toàn bộ bảng chữ cái của ngôn ngữ. Do vậy công
thức tính
η
i
như sau :
∑
=
=
m
j
iji
n
1
η
, với 1 ≤ i ≤ m; (2.8)
Thay C = 1/m vào công thức ta có :
1
/1
ˆ
+
+
=
i

ij
ij
mn
P
η
(2.9)
Với việc chấp nhận sai số nhỏ trong công thức (2.2) ta có thể
chọn k = 6 khi này ta có :
[]
⎥
⎦
⎤
⎢
⎣
⎡
==
)/(
)/(
log6)(log.)(
0
1
1010
HXP
HXP
XTkXT
i
i
ii
(2.10)
2.2.3 Bảng mã ngôn ngữ và cách loại trừ những yếu tố ảnh

hưởng tới các tiêu chuẩn bản rõ
Giả thuyết của luận án là xây dựng các tiêu chuẩn bản rõ dựa
trên bảng mã UNICODE (dựng sẵn). Khảo sát bảng mã của 3 ngôn
ngữ tiếng Anh, tiếng Nga và tiếng Việt NCS nhận thấy:
- Mã các chữ cái tiếng Anh là 1 byte, mã các chữ hoa luôn nhỏ
hơn mã các chữ thường một giá trị là 0x20 (viết theo hệ cơ số 16);
- Mã các ch
ữ cái tiếng Nga gồm 2 bytes, trong đó byte thứ 2 luôn
là 0x4, byte đầu là mã chữ cái trong bảng mã tiếng Nga và mã các
chữ hoa luôn nhỏ hơn mã các chữ thường một giá trị là 0x20 ngoại
trừ chữ Ё và ё sẽ là 0x50;
11

- Mã các chữ cái tiếng Việt gồm 2 bytes, được chia thành 04
nhóm. Nhóm 1 (22 chữ cái) là các chữ cái la tinh (byte 2 bằng 0x0,
byte 1 có giá trị như mã chữ cái tiếng Anh), nhóm 2 có byte 2 bằng
0x0 và byte 1 là một số chữ cái tiếng Việt (16) mã chữ hoa nhỏ hơn
mã chữ thường 0x20. Các nhóm 3 (6 chữ cái) và nhóm 4 (45 chữ cái)
có bytes thứ 2 lần lượt là là 0x1 và 0x1E với mã chữ hoa luôn nhỏ
hơn mã các chữ thường một giá trị là 0x1.
Từ đây NCS ánh xạ mã giả định của các ngôn ngữ về thành 1
byte có giá trị xắp x
ếp theo chỉ số trong bảng chữ cái (từ 0 đến m-1,
m là số chữ cái). Trên cơ sở đó loại bỏ tất cả các mã không thích hợp
trong văn bản mẫu đầu vào dùng cho việc tính tần suất.
2.2.4 Nghiên cứu lập văn bản mẫu cho các ngôn ngữ lựa chọn
Việc lập các văn bản mẫu
được thực hiện theo nguyên tắc “thể
hiện được nhiều nhất” đặc trưng của ngôn ngữ. NCS đã thực hiện
việc thành lập các văn bản mẫu đầu vào như sau :

- Văn bản mẫu tiếng Anh được lấy từ 150 mẫu văn phong đặc
trưng của tiếng Anh [
- Văn bản mẫu tiếng Nga và tiếng Việt được thành lập từ các văn
b
ản đăng tải trên Internet và mỗi văn bản đều được thành lập với ít
nhất 20 chủ đề khác nhau.Ví dụ nguồn văn bản cho tiếng Việt được
lấy từ www.laodong.com.vn.
0.00%
2.00%
4.00%
6.00%
8.00%
10.00%
12.00%
14.00%
abcde f gh i j k lmnopqr s t u vwxyz

Hình. 2.4 Biểu đồ tần suất đơn tiếng Anh
Mầu đậm là tần suất đối với file mẫu PSALMS.TXT
Mầu ít đậm là tần suất đối với file mẫu INPUT1.TXT
Với các văn bản mẫu đầu vào khác nhau ta nhận được các tham
12

số của các TCBR khác nhau. Tuy nhiên sự khác nhau này vẫn mang
tính hội tụ cho nên không có sự khác biệt về kết quả trong việc ứng
dụng các TCBR này để nhận diện bản rõ. Ví dụ tần suất đơn của 2
văn bản đầu vào cho tiếng Anh được thể hiện trên hình 2.4.
− Tổng tần suất của 13 chữ cái xuất hiện nhiều trong tiếng Anh
tính từ file PSALMS.TXT là 85,05%.
− Tổng tần suất 13 chữ cái này trong file INPUT1.TXT là 82,41%.

Sự
khác biệt rất nhỏ này chứng minh tính hội tụ của các TCBR.
Các kiểm nghiệm với tiêu chuẩn bản rõ 2 chiều cho tiếng Việt,
tiếng Nga và tiếng Anh cũng cho các kết quả nhận dạng chính xác.
Bảng 2.5 Số liệu về các văn bản mẫu
STT Tên File
Độ dài
(bytes)
Số ký tự thực
tế
Ngôn ngữ
1 Input1.txt 188.806 148.316 ENGLISH
2 russian2.txt 485.902 179.599 РУССКИЙ
3 vietnam2.txt 183.862 67.171 Tiếng Việt
4 psalms.txt 243.018 173.920 ENGLISH
5 russian.txt 224.246 89.673 РУССКИЙ
6 vietnam.txt 276.002 99.297 Tiếng Việt
Độ dài của mẫu ngôn ngữ cần nhận dạng. Độ dài mẫu N của
văn bản cần nhận dạng được đưa ra bởi [5], theo đó N = U (U là
khoảng cách duy nhất của ngôn ngữ khi áp dụng các TCBR để nhận
dạng) được xác định như sau :
ZLOG
MLOGMLOG
UN
P
2
22
1
−
==

(2.14)
Trong công thức trên M là số chữ cái của ngôn ngữ, LOG
2
Z =
LOG
2
M! và LOG
2
M
P
là Entropy Shannon của ngôn ngữ. Entropy
Shannon tiếng Anh được cho bởi [5], trong khi Entropy Shannon
tiếng Nga và tiếng Việt được cho bởi [2]. Chi tiết như sau :
Bảng 2.6. Entropy Shannon tiếng Anh, tiếng Nga và tiếng Việt
Entropy Shannon LOG
2
M
P
[bits]
STT
Bậc mô hình
Markov
Tiếng Anh Tiếng Nga Tiếng Việt
1 Bậc 0
≈ 4,17 ≈ 4,35 ≈ 4,52
2 Bậc 1
≈ 3,50 ≈ 3,52 ≈ 3,22
3 Bậc 2
≈ 3,20 ≈ 3,00
< 3,00

Ngoài ra các tham số LOG
2
M và LOG
2
(M!) của các ngôn ngữ
13

tiếng Anh, tiếng Nga và tiếng Việt tính trực tiếp như sau :
Bảng 2.7. Bảng tham số LOG
2
M và LOG
2
(M!) của các ngôn ngữ
tiếng Anh, tiếng Nga và tiếng Việt (Đơn vị tính là bits).
Tiếng Anh Tiếng Nga Tiếng Việt
M LOG
2
M LOG
2
M! M LOG
2
M LOG
2
M! M LOG
2
M LOG
2
M!

26 4,700 88,380 33 5,044 122,706 89 6,476 452,505

Từ các giá trị trong các bảng 2.6. và bảng 2.7. cùng công thức
(2.14.) ta tính được Độ dài tối tiểu N như sau :
Bảng 2.8. Độ dài tối tiểu N của mẫu ngôn ngữ nhận dạng
Tiếng Anh N
[ký tự]
Tiếng Nga N
[ký tự]
Tiếng Việt N
[ký tự]
TT

Bậc
Markov
Lý
thuyết
Làm
tròn
chẵn 8
Lý
thuyết
Làm
tròn
chẵn 8
Lý
thuyết
Làm
tròn
chẵn 8
1 0
≈ 167 168 ≈ 177 184 ≈ 231 232

2 1
≈ 74 80 ≈ 81 88 ≈ 139 144
3 2
≈ 59 64 ≈ 60 64 ≈ 130 136
Đây là các tham số độ dài mẫu nhận dạng được tính toán chi tiết
theo lý thuyết. Qua việc khảo sát trên thực tế ta thu được giá trị của
độ dài N = 56 cho cả ba ngôn ngữ tiếng Anh, tiếng Nga và tiếng Việt.
2.3 Tính toán các tiêu chuẩn bản rõ thống kê
2.3.1 Công cụ tính toán các tiêu chuẩn bản rõ
Trên cơ sở các văn bản mẫu đầu vào, và bộ các công thức từ 2.3
đến 2.10 NCS đã xây dựng 6 công cụ tính toán các TCBR cấp 0 và
cấp 1 cho 3 ngôn ng
ữ tiếng Anh, tiếng Nga và tiếng Việt.
2.3.2 Kết quả tính toán các tiêu chuẩn bản rõ
Bằng việc sử dụng các công cụ đã nêu NCS đã tính toán các
TCBR 1 chiều và 2 chiều cho 3 ngôn ngữ (Anh, Nga và Việt).
Cấu trúc dữ liệu TCBR một chiều cho tiếng Anh như sau :
int CriterionOneWayEN[26] = {
-2, 3, 2, -1, -4, 1, 1, -3, -2, 8, 4, -1, 0,
-2, -2, 2, 10, -2, -2, -3, 0, 3, 1, 11, 1, 12};
Một phần cấu trúc dữ liệu TCBR hai chiều cho tiếng Anh :
int Criterion2WayEN[26][26] = {
6, 1, 0, 1, 5, 3, 2, 3, -1, 8, 1, -3, 0, -5, 11, 4, 24, -3, -2, -4, 2, -1, 2,
10, 0, 15, 0, 7, 19, 6, -7, 7, 9, 4, 1, 9, 19, -4, 6, 19, -3, 19, 19, -3,
…………………………………………………………………………
10, 10, 10, 10, -2, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10 };
14

Các kết quả tương tự cho tiếng Nga và tiếng Việt trình bầy trong
luận án.

2.3.3 Những khả năng mở rộng.
Bằng cách làm tương tự ta có thể mở rộng cho ngôn ngữ khác.
Ngoài ra, từ các công thức tính toán các TCBR với mô hình Markov
bậc 0 và 1 theo [48] các TCBR với mô hình bậc cao hơn được tính
toán từ các ước lượng của mô hình Markov cấp 0 và cấp 1 theo công
thức :
1
),(
−
=∏
m
m
Psh
(2.16)
Trong đó Π
m
là ma trận chuyển cấp m của xích Markov cấp m, h
là xác suất chuyển trạng thái từ h sang s và P
m-1
được tính theo tích
Ten-xơ của phép nhân các ma trận cấp nhỏ hơn trước đó. Các tích
Ten – xơ được áp dụng trên công thức (2.16). Cụ thể các mô hình
Markov cấp 2, 3 và 4 tương ứng với các tích Ten-xơ sau :
− Mô hình Markov bậc 2 : T
2
(X
i
) = T
0
(X

i
) ⊗ T
1
(X
i
);
− Mô hình Markov bậc 3 : T
3
(X
i
) = (T
1
(X
i
) ⊗ T
1
(X
i
);
− Mô hình Markov bậc 4 : T
4
(X
i
) = T
0
(X
i
) ⊗ (T
1
(X

i
) ⊗ T
1
(X
i
)).
Phép nhân Ten – xơ được ký hiệu là ⊗. Sau khi tính được các
tích này ta áp dụng công thức (2.10) để thu được các TCBR tương
ứng. Các kết quả của các TCBR này được nêu trong bảng sau :
Bảng 2.10. Bảng các tiêu chuẩn bản rõ bậc cao đã tính toán
TT
Tên File tiêu
chuẩn bản rõ
Bậc
Markov
Ngôn ngữ Số phần tử Số bytes
1 EN3WAY.BIN 2 tiếng Anh 17.576 35.152
2 EN4WAY.BIN 3 tiếng Anh 456.976 913.952
3 EN5WAY.BIN 4 tiếng Anh 118.81.376 23.762.752
4 RUS3WAY.BIN 2 tiếng Nga 35.937 71.874
5 RUS4WAY.BIN 3 tiếng Nga 1.185.921 2.371.842
6 RUS5WAY.BIN 4 tiếng Nga 39.135.393 78.270.786
7 VN3WAY.BIN 2 tiếng Việt 704.969 1.409.938
8 VN4WAY.BIN 3 tiếng Việt 62.742.241 125.484.482
2.4 Sử dụng tiêu chuẩn bản rõ trong quá trình thám mã
Thuật toán sử dụng các TCBR được trình bày trên hình 2.6 dưới
đây. Trong sơ đồ thuật toán sử dụng giả thiết là chỉ thám các bản mã
đầu vào là các văn bản ASCII tường minh. Vì vậy ta có thể sử dụng
Hàm lọc thô đối với mỗi khối mã được giải. Nó xem xét nếu trong
khối mã được giải tồn tại một ký tự không ở dạng ASCII khóa dùng

15

để giải là sai. Như vậy sơ đồ thuật toán được diễn giải như sau :

Hình 2.6 Sơ đồ thuật toán ứng dụng các tiêu chuẩn bản rõ
Đầu vào là bản mã, khóa Ҝ[i] với i = 0, Số_Khối cần giải mã bắt
đầu từ khối j = 0, N là độ dài xâu mẫu tích lũy (N gán bằng 0 ở thời
điểm đầu và sẽ dừng khi đủ
độ dài là 56 bytes) và biến End_Flag để
khi cờ này = 1 sẽ không đi theo hướng kiểm tra xâu mẫu bởi các

Hàm lọc thô và Hàm lọc tinh nữa mà sẽ chấp nhận khóa đang dùng
là khóa đúng.
Vận hành của sơ đồ bắt đầu bằng việc giải một khối mã bằng
khóa Ҝ[i] thu được Input_Text[j]. Tiếp theo Hàm lọc thô xác nhận
Input_Text nếu hợp lệ và đủ độ dài xâu mẫu cần nhậ
n dạng sẽ
chuyển sang Hàm lọc tinh áp dụng các TCBR. Trong trường hợp
Hàm lọc thô thấy có ký tự không phải là ASCII nó chuyển sang khóa
K[i] = Ҝ[i], j = 0;
Giải khối mã j bằng K[i] và
thu được Input_Text[j]
End_Flag = 0 ?
Tốt
Không chấp
nhận
Hàm lọc thô
Input_Text [j]
Yes
Input : C, i = 0, Ҝ[i], Số_Khối, j = 0, N = 0, End_Flag = 0;
No
N = 0; i++;
N đủ độ
dà
i
?
Yes
No
Hàm lọc tinh
(Xâu mẫu [N])
j++;

Không
chấp nhận
End_Flag = 1
Tốt
j>Số_Khối?
Yes
END
No
16

khác. Khi qua được Hàm lọc thô nếu đủ độ dài xâu mẫu nó sẽ
chuyển sang Hàm lọc tinh và nếu hàm này không chấp nhận nó cũng
sẽ chuyển lấy khóa khác. Trong trường hợp chưa đủ độ dài xâu mẫu
nó lặp lại việc giải mã khối tiếp theo và lại đi qua Hàm lọc thô.
Ngược lại khi đủ độ dài xâu mẫu và Hàm lọc tinh chấp thuận từ đây
thuật toán cho rằng khóa được chọn là khóa đúng và tiế
p tục giải mã
bằng khóa này cho đến hết.
2.5 Kiểm nghiệm các tiêu chuẩn bản rõ
NCS sử dụng số liệu đầu vào là 100 files tiếng Anh, 100 files
tiếng Nga và 100 files tiếng Việt. Các ứng dụng kiểm tra được viết
bằng ngôn ngữ lập trình C trên các chuẩn DES, IDEA và AES. Các
khóa sử dụng để mã hóa được sinh ngẫu nhiên. Kết quả kiểm nghiệm
trên 14 TCBR của 3 ngôn ngữ đều cho kết quả nhận dạng chính xác.
Một kiểm nghiệm mang tính
độc lập được thực hiện trên 300 ngàn
files đầu vào, trong đó có 100 files tiếng Anh, 100 files tiếng Nga và
100 files tiếng Việt. Các files còn lại là các files ở dạng nhị phân. Kết
quả chương trình tự động nhận diện chính xác 300 files của 3 ngôn
ngữ nói trên. Các kiểm nghiệm về độ dài xâu mẫu xác định rằng N =

56 có thể áp dụng cho các TCBR của ba ngôn ngữ mà luận án đặt ra
để nghiên cứu.
2.6 Kết luận chương II
Từ các kết quả nghiên cứu th
ể hiện trong chương chúng ta đi đến
các kết luận sau đây :
c Việc mô hình hoá ngôn ngữ như một xích Markov hữu hạn
trạng thái để từ đó xây dựng các Tiêu chuẩn bản rõ (TCBR) dựa trên
nền tảng lý thuyết thống kê đã giúp ta ánh xạ bài toán nhận dạng bản
rõ mang tính định tính về bài toán mang tính định lượng với các phép
toán số học và so sánh dựa trên các tham số là các ma trận nhận dạng
bản rõ nhiều chiều.
d Các kết quả tính toán hình thành 5 tiêu chuẩn bản rõ cho
tiếng Anh, 5 tiêu chuẩn bản rõ cho tiếng Nga và 4 tiêu chuẩn bản rõ
cho tiếng Việt cùng với các thử nghiệm đa dạng để kiểm chứng độ
chính xác của hệ thống các TCBR mà luận án đưa ra đã minh chứng
cho tính đúng đắn và có triển vọng của hướng nghiên cứu xây dựng
17

các TCBR dựa trên nền tảng của lý thuyết thống kê. Các nghiên cứu
này sẽ là nền tảng tin cậy để NCS tiếp tục triển khai mở rộng theo 2
hướng :
 Tăng cấp của mô hình Markov;
 Mở rộng áp dụng tính toán TCBR cho các ngôn ngữ khác.
e Cách tiếp cận TCBR, ngoài việc phục vụ cho bài toán thám
mã, còn mở ra một hướng ứng dụng mới nhằm phân loại thông tin
theo ngôn ngữ (một bài toán có ý nghĩa rất thiết thự
c) tại các trung
tâm thu nhận và xử lý tin tức phục vụ cho các nhu cầu an ninh - quốc
phòng.

f Các tính toán theo lý thuyết về độ dài mẫu cùng với nhiều
thử nghiệm rút ngắn độ dài mẫu ngôn ngữ cần nhận dạng (N = 56)
mang lại hiệu quả rất lớn cho bài toán nhận dạng bản rõ trong quá
trình thám mã mà đầu vào bản mã là các văn bản dạng ASCII. Theo
đó, ta có thể nói rằng việc nhận dạng bản rõ hầu như không phụ
thuộc vào dung lượng của bản mã.
g Kết luận sau cùng là các nội dung nghiên cứu của chương II
đã được hoàn tất. Các Tiêu chuẩn bản rõ được thử nghiệm một cách
khoa học, khách quan và tin cậy. Giải thuật áp dụng các TCBR đủ
đơn giản và tiện dụng.
CHƯƠNG III. TỔ CHỨC THÁM MÃ KHỐI TRÊN
”SIÊU MÁY TÍNH” TỰ XÂY DỰNG
3.1 Siêu máy tính dạng Cluster và ứng dụng thám mã
Phương pháp xây dựng Siêu máy tính (SMT) được thực hiện
theo các bước: Lựa ch
ọn cấu hình phần cứng, Thiết lập môi trường,
Đánh giá hiệu năng, Phát triển các ứng dụng và Nghiên cứu môi
trường lập trình song song và triển khai các ứng dụng thực tiễn. Bằng
cách này, NCS đã tạo nên 1 SMT sử dụng để nghiên cứu và thử
nghiệm các giải thuật thám mã khối trong luận án.
3.2 Tóm tắt các nét chính của các chuẩn DES, IDEA và AES
Các chuẩn mã hóa dữ liệu được mô tả kỹ lưỡng trong nhiều
nguồn tài liệu. Trên cơ
sở này NCS tổng kết các nét cơ bản của các
chuẩn DES [35], IDEA [35] và AES [3], [16], [31], [38], [50], [51]
18

như sơ đồ giải thuật, các nét đặc biệt của từng chuẩn. Ngoài ra như
đã biết chuẩn DES ban đầu đưa ra với độ dài khóa là 64 bits. Tuy
nhiên các nghiên cứu cho thấy độ dài thực tế của khóa DES chỉ là 56

bits. Trên cơ sở nghiên cứu sơ đồ biến đổi khóa NCS đã đưa ra việc
thay thế bảng biến đổi PC1 [35] trong chuẩn DES về bảng PC1NEW
nhằm cấp phát tr
ực tiếp 56 bits cho mỗi khóa DES. Bằng cách này
không gian tổng thể của DES chỉ là 2
56
khóa thay vì 2
64
khóa.
Bảng 3.2. Bảng tham số hoán vị PC1 và PC1New
Bảng PC1

Bảng PC1New
57 49 41 33 25 17 9 50 43 36 29 22 15 8
1 58 50 42 34 26 18 1 51 44 37 30 23 16
10 2 59 51 43 35 27 9 2 52 45 38 31 24
19 11 3 60 52 44 36 17 10 3 53 46 39 32
63 55 47 39 31 23 15 56 49 42 35 28 21 14
7 62 54 46 38 30 22 7 55 48 41 34 27 20
14 6 61 53 45 37 29 13 6 54 47 40 33 26
21 13 5 28 20 12 4 19 12 5 25 18 11 4
3.3 Song song hóa giải thuật thám mã khối vét cạn trên SMT
3.3.1 Giả thuyết về phương pháp cấp khóa cho các tiến trình
Phương pháp cấp phát khóa được áp dụng là phương pháp cấp
phát khóa theo bộ số ở dạng bytes. Theo đó khóa của DES, IDEA,
AES 128, AES 192 và AES 256 lần lượt là bộ 7, 16, 16, 24 và 32
bytes. Từ đây xuất hiện các khái niệm chỉ số khóa (IDKEY) và bộ
khóa k bytes { m
1
, m

2
, , m
k
}. Các công thức biến đổi từ bộ k khóa
về IDKEY và ngược lại là :
IDKEY = m
1
*256
k-1
+m
2
*256
k-2
+ +m
k-1
*256
1
+m
k
*256
0
. (3.1)
k
1
= IDKEY/256, m
k
=IDKEY%256;
k
2
=k

1
/256, m
k-1
=k
1
%256;
…………………………………………
k
m-1
= k
m-2
/256 m
2
=k
m-2
%256;
k
m
= k
m-1
/256 m
1
=k
m-1
%256;
Trong đó k = 7, 16, 16, 24, 32 tương ứng với DES, IDEA và
AES 128, AES 192 và AES 256.
(3.2)
19

3.3.2 Phân tích lựa chọn mô hình phân rã song song
Mô hình phân rã song song được NCS chọn lựa là mô hình phân
rã theo không gian khóa. Trong đó việc cấp phát khóa được thực hiện
trên cơ sở chia đều từng phần các không gian khóa con trong không
gian khóa tổng thể.
3.3.3 Các biện pháp thực hiện chi tiết
NCS sử dụng 2 loại tiến trình riêng biệt để thực hiện bài toán
thám mã: Tiến trình quản lý cấp phát khóa (hình 3.6) và Tiến trình
thám mã (hình 3.7).
Vai trò của tiến trình quản lý cấp phát khóa
:
− Kết nạp các tiến trình mới, kiểm tra đánh giá khả năng và gửi dữ
liệu bản mã cho những tiến trình này;
− Gửi dữ liệu vùng khóa cần thám cho từng tiến trình mới và cũ;
− Định kỳ kiểm tra các tiến trình; Loại bỏ các tiến trình này nếu nó
gặp sự cố và giao vùng khóa cho tiến trình khác;
− Gửi thông báo kết thúc giải mã đến toàn bộ hệ thống khi nhận
được thông báo
đã tìm ra khóa đúng của một tiến trình thám mã;
− Kiểm soát số lượng tiến trình thám mã ở mọi thời điểm;
− Quản lý các vùng khóa đã cấp phát, vùng nào đã thực hiện xong;
− Kiểm tra sự hiện diện của tiến trình mới, đánh giá được khả năng
thực thi của tiến trình này và trao cho vùng khóa tương xứng;
− Lưu lại khóa, bản rõ và gửi thông báo kết thúc đến toàn bộ hệ
thống khi có thông báo tìm ra khóa đúng và nếu chưa tìm ra khóa
đúng nó cần tổ chức cấp vùng khóa mới.
Vai trò của các tiến trình thám mã
:
− Gửi yêu cầu tham gia thám mã;
− Nhận số liệu giải mã thử để kiểm tra khả năng;

− Nhận bản mã, nhận các vùng khóa để thực thi việc thám mã;
− Thực hiện thám mã vét cạn vùng khóa được trao với sự trợ giúp
của các TCBR. Nếu phát hiện khóa đúng nó gửi lại cho tiến trình
cấp phát/quản lý khóa dữ liệu bản rõ, khóa đúng và yêu cầu dừng
toàn bộ hệ thống. N
ếu không sẽ gửi yêu cầu cấp vùng khóa mới.
Các chức năng của tiến trình cấp phát và quản lý khóa.

20

− Mở một cổng giao tiếp để cho phép các tiến trình thám mã đăng
ký thực hiện công việc thám mã cũng như thực thi việc thám mã;
− Tiếp nhận các giao tiếp, kiểm tra khả năng thực hiện của tiến
trình thám mã và ghi lại các hồ sơ giao tiếp của một tiến trình;
− Gửi dữ liệu bản mã (nếu là tiến trình tham gia lần đầu), vùng
khóa cần thám cho các tiến trình thám mã.
− Định kỳ kiể
m tra sự hoạt động của các tiến trình thám mã. Nếu
không có sự trả lời của một tiến trình thám mã cần ghi nhận trên
hồ sơ về sự ”bỏ cuộc” của tiến trình này làm cơ sở cấp phát vùng
khóa nó đang đảm trách cho các tiến trình thám mã khác;

Init cổn
g

g
iao tiế
p
Chờ tiếp nhận
Có thôn
g
báo?
Yes
N
−
t = 0;
− Duyệt xem tiến trình
nào chưa trả lời;
− Phát lệnh kiểm tra.
Trả lời?

Yes
N
Đánh dấu loại bỏ.
Khôi phục vùng
khóa.
- Ghi dữ liệu bản rõ;
- Ghi khóa đúng.
Phát thôn
g
báo d
ừ
n
g
.
End
Thông báo dừng
Cấp phát mới Đăng ký
Ghi hồ sơ
Kiểm tra xác
định khả năng
Gửi bản mã
Duyệt và gửi vùng khóa
Tiếp nhận :
- Đăng ký;
- Cấp phát mới;
- Thông báo dừng;
t ≥ T
0
Yes
N

Hình 3.
6
Sơ
đ
ồ
vận hành của ti
ế
n trình c
ấ
p

p
hát và
q
uản l
ý
khóa
21

− Ghi nhận kết quả thám mã khi xuất hiện thông báo đã tìm ra
khóa đúng (ghi lại khóa và dữ liệu bản rõ), phát thông báo dừng.
− Dừng thực hiện công việc.
Các chức năng của tiến trình thám mã.

− Chức năng kết nối với tiến trình quản lý và cấp phát khóa. Chức
năng này cho phép các tiến trình thám mã thực hiện việc đăng ký
tham gia thám mã. Dữ liệu trao đổi lúc ở thời điểm đăng ký kết
nối ở dạng bản ghi khai báo các thông tin bao gồm : tên máy, địa

chỉ, băng thông thực hiện kết nối.

K
ế
t
n
ố
i
đă
n
g

k
ý
Nh
ậ
n d
ữ
li
ệ
u kiểm tra
Nhận bản mã;
Nhận vùng khóa;
Nh
ậ
n v
ù
n
g
kh
óa
Nhận thông
báo dừn
g
K
ế
t nối nh
ậ
n dữ l
i
ệ
u chính thứ

c
Chạy dữ liệu kiểm tra;
Gửi trả kết quả kiểm tra.
Thám mã với sự trợ giúp của
TCBR.
Khóa đún
g
?
Yes
No
Hết khóa ?
Yes
No
Lấ
y
khóa tiế
p
theo.
Vòng lặp
thám mã
Gửi yêu cầu dừng;
Gửi kết quả bản rõ;
Gửi khóa đúng;
End
Hình 3.
7
Sơ
đ
ồ
vận hành của một ti

ế
n trình thám mã
22

− Chức năng giải mã thử để xác định khả năng thực thi không gian
khóa tương ứng với khoảng thời gian mà tiến trình cấp phát và
quản lý khóa trông đợi.
− Chức năng nhận vùng khóa, dữ liệu bản mã;
− Chức năng thực thi giải mã dưới sự trợ giúp của các TCBR;
− Chức năng gửi dữ liệu khi tìm ra khóa đúng;
− Chức năng dừng nhiệ
m vụ khi nhận được thông báo kết thúc.
Kiểm tra xác định khả năng cac node và phân tải.

Tiến trình quản lý và cấp phát khóa khi nhận được yêu cầu tham
gia thám mã của một máy, nó sẽ gửi dữ liệu kiểm tra và thu lại tham
số thời gian thực tế giải mã. Từ đây quyết định cấp phát vùng khóa
thích hợp cho máy này sao cho mỗi lần vét trên một không gian khóa
con sẽ kết thúc trong khoảng T
0
(thực nghiệm sử dụng T
0
= 30 phút).
3.3.4 Phương thức cấp phát và sử dụng khóa
Phương thức sử dụng các bộ số ở dạng bytes cho phép đẩy nhanh
tốc độ giải mã và đáp ứng việc cấp phát khóa từ các không gian khóa
không liên tục do người dùng tự định nghĩa.
3.4 Kết luận chương III
Từ các kết quả nghiên cứu được trình bày trong chương III có

thể rút ra các kết luận quan trọng sau đây :
c Một lần nữa khẳng
định rằng để thực hiện bài toán thám mã
nói chung và thám mã khối nói riêng luôn song hành hai vấn đề cần
được giải quyết.
 Cần tạo ra một công cụ tính toán đủ mạnh mà việc xây dựng
SMT là một trong các giải pháp mang lại nhiều hứa hẹn.
 Cần tạo ra các giải thuật song song có thiết kế hợp lý áp
dụng một cách linh hoạt các TCBR đã xây dựng. Giải thuật
cần đảm bảo các yếu tố cơ
bản như : dễ thực hiện, khắc phục
tốt các sự cố thường gặp trong bài toán thám mã song song
dựa trên sự tham gia của nhiều máy tính và khả năng tận
dụng dễ dàng các nguồn tài nguyên tham gia thám mã.
d Khả năng xây dựng các hệ thống tính toán song song chi phí
23

thấp, hiệu năng cao giờ đây đã trở nên dễ dàng, và vì thế, việc tạo
dựng công cụ mạnh phục vụ bài toán thám mã với chi phí hợp lý đã
mở ra hướng tiếp cận đầy hứa hẹn cho các cơ sở nghiên cứu, đào tạo
và các đơn vị nghiệp vụ có nhu cầu.
e Các công cụ và giải thuật được đề xuất trong chương III rất
hữu ích trong việc giả
i bài toán thám mã vét cạn, tạo điều kiện cho
các chuyên gia thám mã giầu kinh nghiệm tham gia tích cực, thể hiện
ở việc tương tác với hệ thống nhằm thu hẹp không gian khoá;
f Thông qua các giải thuật áp dụng các TCBR cho các chuẩn
mã hóa DES, IDEA, AES128, AES192 và AES256 ta nhận thấy rằng
việc thám mã dựa trên nền tảng SMT và các TCBR do luận án xây
dựng có thể áp dụng cho việc thám nhiều loại mật mã khác trên cơ sở

vét cạn. Việc thám mã cũng không chỉ dừng lại ở các ngôn ng
ữ tiếng
Anh, tiếng Nga và tiếng Việt mà có thể mở rộng cho mọi ngôn ngữ
khi chúng ta đã có trong tay các TCBR nhận dạng cho các ngôn ngữ
cần thám mã.
KẾT LUẬN VÀ ĐỀ NGHỊ
Kết luận
Các đóng góp mới của luận án bao gồm :
1) Mô hình Siêu máy tính (SMT) dựa trên công nghệ bó cho
phép tao ra các SMT có hiệu năng nằm trong khoảng (60%÷70%) x
Số_nodes x Tốc_độ_xung_nhịp_CPU. Vì vậy các công cụ tính toán
mạnh, có hiệu năng lớn được xây dự
ng dễ dàng theo hướng công
nghệ này.
2) 5 tiêu chuẩn bản rõ (TCBR) nhận dạng tiếng Anh, 5 TCBR
nhận dạng tiếng Nga và 4 TCBR nhận dạng tiếng Việt được thử
nghiệm đa dạng đều mang lại kết quả nhận dạng bản rõ chính xác,
chứng tỏ các phương pháp tính toán các TCBR là tin cậy và hiệu
quả. Đây là cơ sở để phát triển các ứng dụng thám mã mới, hiệu quả
thay thế các ứng dụ
ng thám mã truyền thống (như nhận dạng dựa
trên từ điển hoặc nhận dạng dựa trên từ giả định).
3) Bộ công cụ tính toán các TCBR có khả năng tính toán và tạo
ra các TCBR cho nhiều ngôn ngữ khác nhau (như các ngôn ngữ
thuộc hệ ngôn ngữ Slavơ, hệ ngôn ngữ La – tinh) phục vụ đa dạng

Thám mã khối trên máy tính song song dùng hệ điều hành Linux

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về