BÁO cáo GIỮA kỳ môn xác SUẤT THỐNG kê và ỨNG DỤNG CHO CÔNG NGHỆ THÔNG TIN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (744.07 KB, 24 trang )

TỔNG LIÊN ĐỒN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TƠN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO GIỮA KỲ
MÔN XÁC SUẤT THỐNG KÊ VÀ ỨNG DỤNG CHO CÔNG
NGHỆ THÔNG TIN

Người hướng dẫn: TS. TRẦN LƯƠNG QUỐC ĐẠI
Người thực hiện: PHẠM HÙNG PHÁT - 520H0272
Lớp

:

20H50302

Khố

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021

:

24

TỔNG LIÊN ĐỒN LAO ĐỘNG VIỆT NAM
TRƯỜNG ĐẠI HỌC TƠN ĐỨC THẮNG
KHOA CÔNG NGHỆ THÔNG TIN

BÁO CÁO GIỮA KỲ
MÔN XÁC SUẤT THỐNG KÊ VÀ ỨNG DỤNG CHO CÔNG

NGHỆ THÔNG TIN

Người hướng dẫn: TS. TRẦN LƯƠNG QUỐC ĐẠI
Người thực hiện: PHẠM HÙNG PHÁT - 520H0272
Lớp

:

20H50302

Khố

THÀNH PHỐ HỒ CHÍ MINH, NĂM 2021

:

24

i

LỜI CẢM ƠN
Để hoàn thành báo cáo thực tập này em xin gửi lời cảm ơn chân thành và tri ân
đến quý thầy, cô khoa Công Nghệ Thông Tin của trường Đại học Tôn Đức Thắng đã
quan tâm, tạo điều kiện thuận lợi và hỗ trợ em trong quá trình thực hiện bài báo cáo
cuối kì này.
Đặc biệt, em xin gửi lời biết ơn sâu sắc đến thầy Trần Lương Quốc Đại, người
thầy đã giảng dạy môn Xác suất thống kê trong học kì này, đồng thời là người hướng
dẫn, tận tình chỉ dạy em trong suốt quá trình thực hiện bài báo cáo cuối kì.
Đây là bài báo cáo đầu tiên em thực hiện còn nhiều hạn chế và bỡ ngỡ, đồng

thời do tình hình phức tạp của dịch Covid-19, nó cũng một phần ảnh hưởng đến q
trình học tập và quá trình tiếp thu kiến thức của em ở bộ môn này nên không thể tránh
khỏi những thiếu sót. Em rất mong nhận được những ý kiến đóng góp q báu của q
thầy cơ để em học thêm được những kinh nghiệm và sẽ hoàn thành tốt hơn các bài báo
cáo sắp tới.
Lời nói cuối cùng em xin kính chúc sức khỏe q thầy, cơ và chúc q thầy cơ
có được những thành cơng cao q trong sự nghiệp của mình.
Em xin chân thành cảm ơn!
TP. Hồ Chí Minh, ngày 17 tháng 4 năm 2022
Tác giả
(Ký tên và ghi rõ họ tên)

Phạm Hùng Phát

ii

ĐỒ ÁN ĐƯỢC HỒN THÀNH
TẠI TRƯỜNG ĐẠI HỌC TƠN ĐỨC THẮNG
Tôi xin cam đoan đây là sản phẩm đồ án của riêng tôi và được sự hướng dẫn của
TS.Trần Lương Quốc Đại. Các nội dung nghiên cứu, kết quả trong đề tài này là trung
thực và chưa công bố dưới bất kỳ hình thức nào trước đây. Những số liệu trong các
bảng biểu phục vụ cho việc phân tích, nhận xét, đánh giá được chính tác giả thu thập từ
các nguồn khác nhau có ghi rõ trong phần tài liệu tham khảo.
Ngồi ra, trong đồ án cịn sử dụng một số nhận xét, đánh giá cũng như số liệu
của các tác giả khác, cơ quan tổ chức khác đều có trích dẫn và chú thích nguồn gốc.
Nếu phát hiện có bất kỳ sự gian lận nào tơi xin hồn tồn chịu trách nhiệm
về nội dung đồ án của mình. Trường đại học Tôn Đức Thắng không liên quan đến
những vi phạm tác quyền, bản quyền do tôi gây ra trong q trình thực hiện (nếu có).
TP. Hồ Chí Minh, ngày 17 tháng 4 năm 2022

Tác giả
(ký tên và ghi rõ họ tên)

Phạm Hùng Phát

iii

PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN
Phần xác nhận của GV hướng dẫn
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
_________________________________________________
Tp. Hồ Chí Minh, ngày 17 tháng 4 năm 2022
(kí và ghi họ tên)

Phần đánh giá của GV chấm bài
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
_________________________________________________
Tp. Hồ Chí Minh, ngày 17 tháng 4 năm 2022
(kí và ghi họ tên)

iv

TÓM TẮT
 Bài báo cáo được thực hiện áp dụng các kiến thức đã được học trong học
kỳ vừa qua, gồm có 4 phần chính được trình bày trong bài báo cáo này:
 Phần 1: Giới thiệu sơ lược.
 Phần 2: MONOALPHABETIC SUBSTITUTION CIPHER(mã
hóa thay thế đơn bảng).
 Phần 3: FREQUENCY ANALYSIS (phân tích tần số).
 Phần 4: Thực hành code thuật toán.
-

Bài báo cáo là cơ sở để xem xét tổng kết lại những gì ta đã được học và
cũng góp phần củng cố kiến thức để chuẩn bị cho phần thi cuối kỳ.

1

MỤC LỤC
LỜI CẢM ƠN.................................................................................................................i
PHẦN XÁC NHẬN VÀ ĐÁNH GIÁ CỦA GIẢNG VIÊN.........................................iii
TĨM TẮT.....................................................................................................................iv
MỤC LỤC...................................................................................................................... 1
DANH MỤC BẢNG, HÌNH ẢNH.................................................................................2
PHẦN 1: GIỚI THIỆU...................................................................................................3
1.

Văn bản gốc (plaintext)..................................................................3

2.

Văn bản mã hóa (ciphertext)..........................................................3

3.

Khóa (key).....................................................................................3

4.

Mã hóa (Encryptio)........................................................................3

5.

Giải mã (Decryption).....................................................................4

PHẦN 2: MONOALPHABETIC SUBSTITUTION CIPHER (MÃ HĨA THAY THẾ
ĐƠN BẢNG).................................................................................................................. 4
PHẦN 3: FREQUENCY ANALYSIS (PHÂN TÍCH TẦN SỐ)....................................6
PHẦN 4: THỰC HÀNH CODE THUẬT TỐN...........................................................7
1.

Mã hóa dựa theo phương pháp mã hóa đơn bản (Encryption using

Monoalphabetic Substitution Cipher).......................................................7
2.

Giải mã dựa theo phương pháp phân tích tần số (Decryption using

Frequency Analysis)...............................................................................11
TÀI LIỆU THAM KHẢO............................................................................................19

2

DANH MỤC BẢNG, HÌNH ẢNH
Bảng 1: Thống kê các chữ cái được sử dụng nhiều trong Tiếng Anh.............................6
Hình 1: Hàm Encryption................................................................................................8
Hình 2: Kiểm tra và tìm khóa(key).................................................................................8
Hình 3: Mã hóa văn bản.................................................................................................9
Hình 4: Hàm main() nhận giá trị và in kết quả...............................................................9
Hình 5: Kết quả mã hóa văn bản 100 ký tự..................................................................10
Hình 6: Kết quả mã hóa văn bản 500 ký tự..................................................................11
Hình 7: Hàm decryption giải mã văn bản đã mã hóa...................................................12
Hình 8: Kết quả khi đếm tần số xuất hiện từng chữ trong văn bản đã mã hóa.............12
Hình 9: Tìm chữ cái tương ứng với tần số xuất hiện nhiều hay ít của từng chữ cái.....13
Hình 10: Kết quả tìm chữ cái tương ứng......................................................................13
Hình 11: Giải mã văn bản đã mã hóa...........................................................................14
Hình 12: Hàm main nhận giá trị và in kết quả.............................................................14
Hình 13: Kết quả giải mã văn bản 100 ký tự................................................................15
Hình 14: Kết quả giải mã văn bản 500 ký tự................................................................17

3

PHẦN 1: GIỚI THIỆU

1. Văn bản gốc (plaintext).
-

Là văn bản ban đầu có nội dung có thể đọc được và cần được bảo vệ.

2. Văn bản mã hóa (ciphertext).
-

Là văn bản sau khi mã hóa, nội dung khơng thể đọc được.

3. Khóa (key).
-

Là khóa được sử dụng trong q trình mã hóa và giải mã.

-

Do các thuật tốn hầu như được cơng khai nên tính an tồn của mã hóa giờ đây
phụ thuộc vào khóa (key).

-

Khóa này có thể là bất kì một giá trị chữ, số nào.

4. Mã hóa (Encryptio).
-

Mã hóa là một phương pháp bảo mật dữ liệu kỹ thuật số bằng một hoặc nhiều
thuật tốn để nó chỉ có thể đọc hoặc giải mã thơng qua khóa (key), hướng giải
mã hoặc mật mã chính xác.

-

Nói cách khác, mã hóa là q trình chuyển văn bản gốc thành văn bản mã hóa.

-

Q trình mã hóa thơng tin bằng cách sử dụng một thuật tốn làm cho thơng tin
gốc khơng thể đọc được ngồi trừ người tạo nên.

-

Mã hóa rất quan trọng trong thời đại công nghệ hiện nay, giúp bảo mật các
thông tin cá nhân, tin nhắn, giao dịch tài chính, tài liệu quân sự một cách riêng
tư và an tồn nhất.

-

Phân loại mã hóa:
 Hệ thống mã hóa đối xứng (Symmetric cryptosystem) là hệ thống mã
hóa sử dụng một khóa bí mật chia sẻ (shared-secret-key) cho cả hai q
trình mã hóa và giải mã.

4

 Hệ thống mã hóa bất đối xứng (Asymmetric cryptosystem) là hệ
thống mã hóa sữ dụng một khóa cơng khai (public key) và một khóa bí
mật (private key) cho q trình mã hóa và giải mã.
-

Mã hóa cổ điển là một dạng mã hóa được sử dụng trong lịch sử phát triển của
con người. Mã hóa cố điển hoạt động trên cở sở bảng chữ cái, được thực hiện
bằng tay hoặc một số máy móc cơ khí đơn giản. Nhưng ngày nay đã bị lạc hậu

vì phương thức mã hóa này quá đơn giản và dễ dàng bị tấn công bẻ khóa được
thơng qua nhiều phương thức khác nhau như:
 Tấn cơng vét cạn (Sử dụng máy tính thử hết tất cả các trường hợp có thể
xảy ra).
 Phương pháp tấn công thống kê (Dựa vào tần suất xuất hiện của các chữ
cái).

5. Giải mã (Decryption).
-

Giải mã là quá trình chuyển đổi thơng tin được mã hóa thành định dạng ban đầu
của nó hay nói cách khác là chuyển đổi thơng tin từ văn bản mã
hóa(ciphertext) thành văn bản gốc(plaintext).

-

Về cơ bản nó là phương pháp mã hóa ngược, địi hỏi dữ liệu mã hóa để tất cả
mọi người khơng thể đọc, nhưng chỉ những người có khóa (Key) giải mã một
cách phù hợp mới có thể đọc.

-

Việc giải mã có thể thực hiện thủ cơng, tự động, sử dụng phần mềm. Nó được
thực hiện với khóa (key) hoặc mật khẩu.

-

Những lý do quan trọng của việc nên sử dụng giải mã:

PHẦN 2: MONOALPHABETIC SUBSTITUTION CIPHER (MÃ

HÓA THAY THẾ ĐƠN BẢNG).
-

Mã hóa thay thế đơn bản (Monoalphabetic Substitution Cipher) là mã hóa
được tiến hành bằng cách thay thế các chữ cái trong bảng chữ cái của văn bản

5

gốc thành một chữ cái khác trong bảng chữ cái mật mã (khóa (key)). Bảng chữ
cái mật mã được xây dựng từ dựa trên 26 chữ cái, lấy ngẫu nhiên 1 trong 26!
hốn vị của 26 chữ cái làm khóa (key) hoặc do người dùng tự cho khóa(key).
-

Với số lượng hoán vị của 26 chữ cái là 26!, đây cũng chính là số khóa (key) của
phương pháp này. Con số 26! là một con số khá lớn nên việc tấn công phá mã
bằng phương pháp vét cạn là bất khả thi. Vì vậy mã hóa đơn bản đã được xem là
một phương pháp mã hóa an tồn nhất hiện nay.

-

Phương pháp:
 Ta sẽ lấy ngẫu nhiên 1 trong 26! hoán vị của 26 chữ cái để làm khóa
(key) hoặc do người dùng tự cho khóa(key) cho q trình mã hóa.
 Với đoạn văn bản gốc cần mã hóa ta sẽ in hoa đoạn văn bản đó để chạy
kiểm tra các chữ cái trong văn bản gốc có đúng là các chữ cái
“ABCDEFGHIJKLMNOPQRSTUVWXYZ” hay không.
 Tiếp theo ứng với mỗi chữ cái trong bảng chữ cái ALPHABET thì có
khóa (key) tương ứng.
 Với từng chữ cái trong văn bản gốc, ta sẽ tìm vị trí của chữ đó trong bản

chữ cái ALPHABET và từ đó sẽ lấy chữ cái làm khóa(key) thay thế để
mã hóa. Cứ như vậy cho hết văn bản gốc.
Ví dụ: Ta có bảng chữ cái 26 chữ cái ALPHABET và lấy ngẫu nhiên bảng mật
mã làm khóa key thay thế tương ứng cho từng chữ cái như bảng dưới đây:
Chữ cái

0

1

2

3

4

5

6

7

8

9

10

11

12

A

B

C

D

E

F

G

H

I

J

K

L

M

F

B

N

K

L

A

V

Q

H

J

Z

Y

T

văn bản
gốc
Chữ cái
văn bản
mã hóa

6

13

14

15

16

17

18

19

20

21

22

23

24

25

N

O

P

Q

R

S

T

U

V

W

X

Y

Z

E

P

D

X

C

R

M

W

I

U

G

O

S

Với văn bản gốc(plaintext): “INFORMATION TECHNOLOGY” .
Dựa vào bảng mật mã suy ra được văn bản mã hóa(ciphertext):
“HEAPCTFMHPE MLNQEPYPVO”.

PHẦN 3: FREQUENCY ANALYSIS (PHÂN TÍCH TẦN SỐ).
-

Phân tích tần số (frequency analysis) là đếm số lần xuất hiện, tần số của các
chữ cái hoặc nhóm chữ cái trong một văn bản. Phương pháp phân tích tần số

được sử dụng dùng để hỗ trở giải mã các mật mã thay thế từ văn bản mã hóa.

-

Phân tích tần số dựa theo ngơn ngữ Tiếng Anh do vậy trong bất kỳ văn bản
Tiếng Anh nào thì các chữ cái, tổ hợp nhất định xảy ra với tần số khác nhau.

-

Trong Tiếng Anh các chữ cái ‘E’, ‘T’, ‘A’, ‘O’,… là được dùng phổ biến nhất,
trong khi đó các chữ cái ‘Z’, ‘Q’, ‘X’ khơng được sử dụng thường xun. Ta có
tập hợp bảng mã các chữ cái được sắp xếp theo tính được sử dụng thường xuyên
là ‘ETAOINSHRDLCUMWFGYPBVKJXQZ’.

Bảng 1: Thống kê các chữ cái được sử dụng nhiều trong Tiếng Anh.
-

Phương pháp:

7

 Từ văn bản mã hóa, ta đếm tần số xuất hiện của từng chữ cái và sắp xếp
các chữ cái theo thứ tự giảm dần vào một tập hợp.
 Từ đó, ứng với chữ cái xuất hiện nhiều nhất trong văn bản mã hóa thì
nhận được chữ cái trong bảng mã. Căn cứ vào số lần xuất hiện mà giải
mã chữ cái đó theo tập hợp bản mã các chữ cái được sắp xếp theo tính
được sử dụng thường xun.
Ví dụ: Ta có đoạn văn bản mã hóa : ‘PEI PHMH PEMH’ thì chữ ‘P’ là
chữ có tần số xuất hiện nhiều nhất trong văn bản mã hóa. Suy ra tất cả

các chữ cái ‘P’ trong văn bản sẽ được thay thế bằng chữ ‘E’.
 Tiếp theo chữ ‘H’ là chữ có tần số xuất hiện nhiều thứ hai trong
văn bản mã hóa. Suy ra tất cả các chữ cái ‘H’ trong văn bản sẽ
được thay thế bằng chữ ‘T’.
 Chữ ‘M’ là chữ có tần số xuất hiện thứ ba trong văn bản mã hóa.
Suy ra tất cả các chữ cái ‘M’ trong văn bản sẽ được thay thế bằng
chữ ‘A’.
 Chữ ‘E’ là chữ có tần số xuất hiện thứ tư trong văn bản mã hóa.
Suy ra tất cả các chữ cái ‘E’ trong văn bản sẽ được thay thế bằng
chữ ‘O’.
 Chữ ‘I’ là chữ có tần số xuất hiện thứ năm trong văn bản mã hóa.
Suy ra tất cả các chữ cái ‘I’ trong văn bản sẽ được thay thế bằng
chữ ‘I’.
Từ đó ta có văn bản giải mã: ‘EOI ETAT EOAT’.
Qua phương pháp phân tích tần số (frequency analysis) nhận thấy rằng
phương pháp hỗ trợ giải mã chỉ mang tính tương đối, độ chính xác khơng
hồn tồn là hồn hảo.

8

PHẦN 4: THỰC HÀNH CODE THUẬT TỐN.

1. Mã hóa dựa theo phương pháp mã hóa đơn bản (Encryption using
Monoalphabetic Substitution Cipher).

Hình 1: Hàm Encryption
-

Hàm Encryption(plain_text, key=None) nhận hai giá trị là văn bản gốc cần

mã hóa và khóa(key) dùng để mã hóa văn bản và trả về văn bản mã hóa thành
cơng.

-

Ta bắt đầu code bằng việc tạo một biến để chứa văn bản mã hóa và kiểm tra
hàm có nhận được khóa(key) từ người dùng hay khơng, nếu chưa có khóa(key)
thì ta phải tạo, lấy ngẫu nhiên 1 trong 26! Hoán vị của 26 chữ cái ALPHABET
bằng thuật toán random.shuffle(List_key).

Hình 2: Kiểm tra và tìm khóa(key).

9

-

Tiếp theo ta chạy vòng for để duyệt tất cả các ký tự trong văn bản gốc
(plain_text). Do các chữ cái ALPHABET chúng ta nhập vào là các chữ cái in
hoa nên ta sẽ in hoa các giá trị trong văn bản gốc và tiếp theo xét duyệt các ký tự
trong văn bản gốc có phải là các chữ cái ALPHABET khơng.
 Nếu đúng thì sẽ duyệt tiếp tìm vị trí phần tử đó trong ALPHABET. Từ
đó sẽ xác định được chữ cái mã hóa trong khóa(key) đồng thời nếu chữ
cái đó trong văn bản gốc là in hoa thì ta vẫn phải in hoa nó hoặc nếu
chữ cái đó trong văn bản gốc khơng in hoa thì ta cho nó về dạng viết
thường, và thêm nó vào biến rỗng chứa văn bản mã hóa bằng thuật tốn.
In hoa: Encryp += key[ALPHABET.find(alpha)].upper().
Không in hoa: Encryp += key[ALPHABET.find(alpha)].lower().
 Ngược lại nếu khơng là các ký tự ALPHABET thì vẫn thêm vào biến
chứa văn bản mã hóa. Thường sẽ là các ký tự đặc biệt như ‘#’, ‘!’, ‘-’,

‘.’, ‘,’,… Cuối cùng sẽ trả về biến chứa văn bản mã hóa Encryption.

Hình 3: Mã hóa văn bản
-

Hàm main() để nhận các giá trị đầu vào như plain_text và in ra kết quả chạy của
q trình mã hóa.

Hình 4: Hàm main() nhận giá trị và in kết quả.

10

-

Kết quả chạy code theo các trường hợp:
 Trường hợp plaintext có độ dài là 100 ký tự.

Hình 5: Kết quả mã hóa văn bản 100 ký tự.
 Trường hợp plaintext có độ dài là 500 ký tự.

11

Hình 6: Kết quả mã hóa văn bản 500 ký tự.

2. Giải mã dựa theo phương pháp phân tích tần số (Decryption using
Frequency Analysis).

12

Hình 7: Hàm decryption giải mã văn bản đã mã hóa.
-

Hàm Decryption_Frequency(message) nhận giá trị văn bản mã hóa và thực hiện
việc giải mã thông qua phương pháp Frequency Analysis (phân tích tần số).

-

Đầu tiên ta sẽ thực hiện đếm tần số xuất hiện của các chữ cái trong văn bản đã
mã hóa và sắp xếp theo thứ tự giảm dần qua dòng code:
frequency = collections.Counter(message.upper()).most_common()

-

Dòng code sẽ cho ta kết quả ví dụ:

Hình 8: Kết quả khi đếm tần số xuất hiện từng chữ trong văn bản đã mã hóa.
-

Tiếp theo, tạo một biến key rỗng để chứa các chữ cái sẽ thay thế và ta thực hiện
vòng lặp for để xét đối với các chữ đã đếm từ biến frequency thì sẽ có chữ cái

13

tương ứng thay thế dựa theo biến MostCommon (chứa các chữ cái được xuất
hiện thường xuyên trong văn bản Tiếng Anh).
-

Dòng for sẽ duyệt hết các phần tử trong frequency, kiểm tra letter[0] (chứ các
chữ cái đã đếm và sắp xếp) có thuộc ALPHABET khơng,
 Nếu đúng là ALPHABET thì letter[0] sẽ được thay thế theo thứ tự sắp
xếp của các chữ cái trong biến MostCommon.
 Nếu không phải là ALPHABET thì sẽ khơng thực hiện.

Hình 9: Tìm chữ cái tương ứng với tần số xuất hiện nhiều hay ít của từng chữ cái
-

Kết quả:
Hình 10: Kết quả tìm chữ cái tương ứng.

-

Tiếp theo sẽ tạo biến temp để tạo dictionary chứa khóa và giá trị tương ứng của
key hỗ trợ thuận tiện cho những công việc tiếp theo, qua dòng code:
temp = dict(zip(key.values(), key.keys())).

-

Ta tạo một biến decry rỗng để chứa văn bản giải mã và chạy vòng lặp for duyệt
các phần tử trong message đã được in hoa lên, kiểm tra các phần tử đó có là
ALPHABET hay khơng:
 Nếu đúng là ALPHABET thì tiếp tục kiểm tra ký tự đó có thuộc trong
temp.keys() (chứa các chữ cái khóa ví dụ theo các kết quả đã chạy trên
thì temp.key() chứa [‘G’, ‘A’, ‘B’, ‘H’, ‘T’]).
 Nếu đúng là thuộc trong temp.keys() thì sẽ thêm vào decry giá
trị của chữ cái đó qua dịng code: decry.append(temp[char])
 Nếu khơng đúng thì khơng thực hiện.

14

 Nếu khơng đúng là ALPHABET thì ta thêm nó decry qua dòng code:
decry.append(char) .
 Cuối cùng kết quả trả về biến decry chứa văn bản đã được giải mã.

Hình 11: Giải mã văn bản đã mã hóa.
 Hàm main() để nhận các giá trị đầu vào như plain_text và in ra kết quả chạy
của q trình mã hóa.

Hình 12: Hàm main nhận giá trị và in kết quả.
-

Kết quả chạy code theo các trường hợp:
 Trường hợp cipher text có độ dài là 100 ký tự:

ciphertext: Jyd hnrds zod bugrhbgm cjzrdrjd kommxc ugmx yrdsxc. Nohn bjym
bokx mxh r hnruc cop nxowxd foprds, suxxd hnxz fxof ixofh, hnxux
wjrc couedxff gdhj couedxff forc iujgsnh brmm pxouf. Fxxc. Fj.
Copf bruzozxdh srwxd hjsxhnxu brfn hnoh mrsnhf yrhnjgh yrhnjgh
rzosx Bugrh oijwx oaaxou bjuhn bjguhn kod'h bugrhbgm kuxxards
mrsnhf bju rh hj. Kommxc.
Yrhnjgh gf bujz brmm omfj o kohhmx zod fxh jdx ixofh foy bxzomx
oru fxh jaxd kommxc suxohxu huxx gf pjg'mm yof prxmcrds jwxu erdc
nxowxd fhouf.

15

Foy ynxuxrd kuxohxc ix mrbx xouhn zjwrds Omm sjc hnrds. Omm jwxu
cop, o pjg kod'h cjzrdrjd kommxc.
[(' ', 144), ('X', 55), ('O', 44), ('H', 42), ('R', 35), ('M', 30), ('J', 29),
('U', 29), ('D', 28), ('F', 27), ('N', 22), ('C', 20), ('B', 17), ('S', 16),
('G', 16), ('Z', 11), ('Y', 10), ('K', 10), ('.', 9), ('P', 8), ('W', 8),
('I', 5), ('A', 4), (',', 3), ('E', 3), ('\n', 3), ("'", 3)]
key: {'E': 'X', 'T': 'O', 'A': 'H', 'O': 'R', 'I': 'M', 'N': 'J', 'S': 'U',
'H': 'D', 'R': 'F', 'D': 'N', 'L': 'C', 'C': 'B', 'U': 'S', 'M': 'G', 'W':
'Z', 'F': 'Y', 'G': 'K', 'Y': 'P', 'P': 'W', 'B': 'I', 'V': 'A', 'K': 'E'}
plaintext: NFH ADOHU WTH CSMOACMI LNWOHONH GTIIEL SMIE FOHUEL. DTAD CNFI CTGE
IEA O ADOSL LTY DETPEH RTYOHU, USEEH ADEW RETR BETRA, ADESE PNOL
LTSKHERR MHAN LTSKHERR RTOL BSNMUDA COII YETSR. REEL. RN.
LTYR COSWTWEHA UOPEH ANUEADES CORD ADTA IOUDAR FOADNMA FOADNMA OWTUE
CSMOA TBNPE TVVETS CNSAD CNMSAD GTH'A CSMOACMI GSEEVOHU IOUDAR CNS OA
. GTIIEL.
FOADNMA MR CSNW COII TIRN T GTAAIE WTH REA NHE BETRA RTF CEWTIE TOS REA
NVEH GTIIEL USETAES ASEE MR YNM'II FTR YOEILOHU NPES KOHL DETPEH RATSR.

Hình 13: Kết quả giải mã văn bản 100 ký tự.

 Trường hợp cipher text có độ dài 500 ký tự.
ciphertext: Bwjl, gzzagu. Jgnaud lan lan Vgs iuaazant hndalb ghu. Qwp'ua
khmhka gldw igllak ta nw vgka tgk vgka daak lhmhsr amashsr jhsrak wpu
hndalb hd vgka nta ntaua. Xuhsr jhntwpn dngud ignnla hn iuagnpua
bhuvgvasn h gll vwushsr vplnhzlq thd tgnt igs'n. Qwp'll bhll khmhkak
gxwma xaguhsr jgd ta iuagnak xuwprtn xuwprtn rgntauhsr rugdd, bhbnt.
G xaguhsr vgka dag pzws. Vhkdn dngud vplnhzlq vgea Nuaa amauq dagd
vplnhzlq vwmak bwunt, wjs buphn bhudn kgqd xladdak tagmas uazlashdt.
Gbnau wmau xarhsshsr ntav vagn lhrtn ntav dan ruaas bhuvgvasn dzhuhn

ehsk rgntauhsr ntgn mwhk dag h. Jgnaud vwushsr bhdt ntahu hndalb bwpunt
igllak bhll pskau ruagn bhbnt jtauahs dngud dta'k. Vgea bhuvgvasn jaua.
Rwwk iuaazhsr wmau buphn thv pzws, bhll ignnla ntgn ruaas rgntauak h vgs
iuaazhsr vagn h amashsr gbnau pd ta dgj gzzagu dagd daak gsk daiwsk
jhsrak buphn vgea. Uazlashdt, kwvhshws hn nthuk xuwprtn. Laddau hs kaaz
gxpskgsnlq ntaq'ua iuagnak. Vgka wsa agunt taux dpxkpa vwmhsr tgnt qagud
jthit bwu dzhuhn wmau, dtgll ghu rugdd gll. Rgntauhsr kws'n ntaq'ua
jthit jtglad gxpskgsnlq dngud agunt, dgqhsr.
Qwp upla. Rugdd lhmhsr jgnaud Qwp'ua bgia dta'k iuaazhsr lheasadd rugdd
lgsk iuagnak qhalkhsr hs gsk hvgra jgnaud dngud hds'n Xuhsr njw. Igllak

16

agunt gbnau jtauahs pzws. Lhmhsr, kws'n. Zlgia. Blq ruaas hds'n.
Gxpskgsnlq jtauahs nthuk. Kwvhshws nthuk. Dhfnt, wpu amauq uazlashdt nta
kgqd jtauahs njw jtglad tgnt vwushsr wmau vwushsr Bhuvgvasn wb rhmas
ntgn lhba rwk ignnla lhrtnd dgqhsr buphnbpl ta jhsrak kgqd amauq ntahu
wpu rwk daak lhrtnd vgla dpxkpa, jtglad bhdt rgntauhsr Vplnhzlq
bhuvgvasn dan dtgll khmhkak dzhuhn wsa khmhkak daiwsk xaguhsr wb dw
lhrtn nta xuwprtn rhma xladdak khmhka lheasadd agunt vwmant dagd wzas
qhalkhsr rhmas vwushsr dzhuhn lan dngud, dtgll dhfnt jgnaud dpxkpa xuhsr
vwushsr lhmhsr bhll xarhsshsr bhudn bwpunt taux xarhsshsr wsa mwhk xuhsr
nw wb qwp'll jaua tgk vhkdn lhba xarhsshsr kuq hds'n tgma dgj xatwlk
tgnt rwwk vgs qwp. Dagd bhuvgvasn ehsk xladdak jtauahs qwp'll buwv
nwrantau mauq vhkdn g. Hvgra kguesadd rgntauhsr daak vgq jhsrak dhfnt
nthuk wzas dhfnt dw jtglad xaguhsr dngud lgsk nw rgntauhsr. Mwhk. Daak
xarhsshsr bhdt Qagud vhkdn gxwma dzhuhn g dhrsd rgntauhsr laddau dag tgk
dta'k vwushsr dta'k. Kaaz xagdn nuaa njw gldw lhba bgia vwmant mwhk. Hs.
Wjs shrtn dzhuhn dzhuhn rwk.

Tgma xa ta dtgll xatwlk. Nw vgs lhrtnd pzws gll dgj. Nuaa qwp'll nuaa
vgq wb hvgra lgsk buphnbpl tgnt. Vgs Kguesadd lhba h jtwda vplnhzlq. Nta
kuq bhuvgvasn, nuaa vwushsr mwhk buphn gbnau ghu kguesadd rgntauak
jtauahs g. Bhbnt wzas jgnaud zlgia jhsrak jaua dzhuhn upla rwk. Tagmas
daak, rgntauhsr xa qwp'll Tgk daak ntaq'ua gldw. Vgka. Hndalb qwp'll jgd
kaaz, bhbnt iuaazhsr nta rgntauhsr ghu qwp'll hvgra daak pd laddau wpu,
zlgia vwmant xuhsr dgj, lhrtn dpxkpa hd bhbnt bhudn laddau dgqhsr ruaas,
dzhuhn ntaq'ua dghk lhmhsr dta'k qwp. Dngud, buwv iuagnpua nwrantau
dhrsd xatwlk nw wmau dgqhsr nta vgka bwpunt laddau hvgra rwwk xaguhsr
tgnt iuagnak, lheasadd bavgla bavgla tgnt ghu gbnau qwp'll kwvhshws
pskau dtgll Kuq rwwk ignnla pd wzas. Xuhsr vwmhsr agunt.
[(' ', 498), ('A', 326), ('H', 220), ('N', 186), ('G', 184), ('U', 183), ('D',
168), ('S', 160), ('T', 134), ('L', 126), ('K', 117), ('W', 114), ('R', 113),
('V', 72), ('B', 65), ('P', 62), ('Q', 46), ('.', 42), ('M', 41), ('J', 40),
('Z', 40), ('X', 40), ('I', 28), ("'", 25), (',', 19), ('E', 11), ('F', 4),
('\n', 2)]
key: {'E': 'A', 'T': 'H', 'A': 'N', 'O': 'G', 'I': 'U', 'N': 'D', 'S': 'S',
'H': 'T', 'R': 'L', 'D': 'K', 'L': 'W', 'C': 'R', 'U': 'V', 'M': 'B', 'W':
'P', 'F': 'Q', 'G': 'M', 'Y': 'J', 'P': 'Z', 'B': 'X', 'V': 'I', 'K': 'E',
'J': 'F'}
plaintext: MLYR, OPPEOI. YOAEIN REA REA UOS VIEEPEAH TANERM OTI. FLW'IE
DTGTDE ORNL VORRED HE AL UODE HOD UODE NEED RTGTSC EGESTSC YTSCED LWI
TANERM TN UODE AHE AHEIE. BITSC YTAHLWA NAOIN VOAARE TA VIEOAWIE
MTIUOUESA T ORR ULISTSC UWRATPRF HTN HOAH VOS'A. FLW'RR MTRR DTGTDED
OBLGE BEOITSC YON HE VIEOAED BILWCHA BILWCHA COAHEITSC CIONN, MTMAH. O

17

BEOITSC UODE NEO WPLS. UTDNA NAOIN UWRATPRF UOKE AIEE EGEIF NEON

UWRATPRF ULGED MLIAH, LYS MIWTA MTINA DOFN BRENNED HEOGES IEPRESTNH.
OMAEI LGEI BECTSSTSC AHEU UEOA RTCHA AHEU NEA CIEES MTIUOUESA NPTITA
KTSD COAHEITSC AHOA GLTD NEO T. YOAEIN ULISTSC MTNH AHETI TANERM MLWIAH
VORRED MTRR WSDEI CIEOA MTMAH YHEIETS NAOIN NHE'D. UOKE MTIUOUESA YEIE.
CLLD VIEEPTSC LGEI MIWTA HTU WPLS, MTRR VOAARE AHOA CIEES COAHEIED T UOS
VIEEPTSC UEOA T EGESTSC OMAEI WN HE NOY OPPEOI NEON NEED OSD NEVLSD
YTSCED MIWTA UOKE. IEPRESTNH, DLUTSTLS TA AHTID BILWCHA. RENNEI TS DEEP
OBWSDOSARF AHEF'IE VIEOAED. UODE LSE EOIAH HEIB NWBDWE ULGTSC HOAH FEOIN
YHTVH MLI NPTITA LGEI, NHORR OTI CIONN ORR. COAHEITSC DLS'A AHEF'IE
YHTVH YHOREN OBWSDOSARF NAOIN EOIAH, NOFTSC.
FLW IWRE. CIONN RTGTSC YOAEIN FLW'IE MOVE NHE'D VIEEPTSC RTKESENN CIONN
ROSD VIEOAED FTERDTSC TS OSD TUOCE YOAEIN NAOIN TNS'A BITSC AYL. VORRED
EOIAH OMAEI YHEIETS WPLS. RTGTSC, DLS'A. PROVE. MRF CIEES TNS'A.
OBWSDOSARF YHEIETS AHTID. DLUTSTLS AHTID. NTJAH, LWI EGEIF IEPRESTNH AHE
DOFN YHEIETS AYL YHOREN HOAH ULISTSC LGEI ULISTSC MTIUOUESA LM CTGES
AHOA RTME CLD VOAARE RTCHAN NOFTSC MIWTAMWR HE YTSCED DOFN EGEIF AHETI
LWI CLD NEED RTCHAN UORE NWBDWE, YHOREN MTNH COAHEITSC UWRATPRF
MTIUOUESA NEA NHORR DTGTDED NPTITA LSE DTGTDED NEVLSD BEOITSC LM NL
RTCHA AHE BILWCHA CTGE BRENNED DTGTDE RTKESENN EOIAH ULGEAH NEON LPES
FTERDTSC CTGES ULISTSC NPTITA REA NAOIN, NHORR NTJAH YOAEIN NWBDWE BITSC
ULISTSC RTGTSC MTRR BECTSSTSC MTINA MLWIAH HEIB BECTSSTSC LSE GLTD BITSC
AL LM FLW'RR YEIE HOD UTDNA RTME BECTSSTSC DIF TNS'A HOGE NOY BEHLRD
HOAH CLLD UOS FLW. NEON MTIUOUESA KTSD BRENNED YHEIETS FLW'RR MILU
ALCEAHEI GEIF UTDNA O. TUOCE DOIKSENN COAHEITSC NEED UOF YTSCED NTJAH
AHTID LPES NTJAH NL YHOREN BEOITSC NAOIN ROSD AL COAHEITSC. GLTD. NEED
BECTSSTSC MTNH FEOIN UTDNA OBLGE NPTITA O NTCSN COAHEITSC RENNEI NEO HOD
NHE'D ULISTSC NHE'D. DEEP BEONA AIEE AYL ORNL RTME MOVE ULGEAH GLTD. TS.
LYS STCHA NPTITA NPTITA CLD.

Hình 14: Kết quả giải mã văn bản 500 ký tự.

18

TÀI LIỆU THAM KHẢO
1. R.B. Ash and C.A. Dol´eans-Dade. (2000). Probability and Measure Theory,
2nd Ed. Academic Press (Chapters 7,9 approximately, plus extra material).
2. Dudley, R. M. (1989). Real Analysis and Probability. Wadsworth, Pacific
Grove, California.
3. Billingsley, P. (2000). Convergence of Probability Measures, 2nd Ed., Wiley, New
York.

4. />%20a%20means%20of,makes%20the%20original%20information
%20unreadable.
5. />6. />7. />%20that,is%20being%20shared%20or%20transmitted.
8. />

BÁO cáo GIỮA kỳ môn xác SUẤT THỐNG kê và ỨNG DỤNG CHO CÔNG NGHỆ THÔNG TIN

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về