Tải bản đầy đủ (.doc) (47 trang)

Tìm hiểu một số thuật toán mã hóa dữ liệu và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (557.77 KB, 47 trang )

Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

LỜI CẢM ƠN
Em xin gửi lời cảm ơn chân thành tới quý thầy cô giáo khoa Công Nghệ
Thông Tin, trường Đại học Vinh nói chung và thầy cơ giáo trong bộ mơn Hệ
Thống Thơng Tin nói riêng, đã giúp đỡ, tạo điều kiện cho em trong suốt quá
trình làm đề tài.
Đặc biệt em xin chân thành cảm ơn thầy giáo, ThS. Cao Thanh Sơn,
người đã giúp đỡ, chỉ bảo, hướng dẫn tận tình cho em trong quá trình làm đề
tài. Trong thời gian làm việc với thầy, em khơng những học hỏi được nhiều
kiến thức bổ ích về các phương pháp mã hóa và tầm quan trọng của mã hóa
dữ liệu trong thời đại ngày nay mà cịn học được tinh thần làm việc, thái độ
nghiên cứu khoa học nghiêm túc của thầy.
Xin gửi lời cảm ơn chân thành đến gia đình, cha mẹ và bè bạn vì đã luôn
là nguồn động viên to lớn, giúp đỡ con vượt qua những khó khăn trong suốt
q trình làm việc.
Mặc dù em đã cố gắng hoàn thành đề tài với tất cả nổ lực của bản thân
nhưng chắc chắn sẽ khơng tránh khỏi những thiếu sót. Em kính mong nhận
được sự cảm thơng và tận tình chỉ bảo của q thầy cô và các bạn.
Một lần nữa, em xin chân thành cảm ơn và ln mong nhận được sự đóng
góp quý báu của tất cả mọi người.

Ngày 20 tháng 5 năm 2011


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

MỤC LỤC
LỜI CẢM ƠN
MỤC LỤC........................................................................................................- 2 PHẦN I: MỞ ĐẦU..........................................................................................- 4 PHẦN II: NỘI DUNG....................................................................................- 5 CHƯƠNG I: TỔNG QUAN VỀ HỆ MẬT MÃ........................................- 5 1.1 Khái niệm về mã hóa thơng tin.....................................................- 5 1.1.1 Khái niệm...................................................................................- 5 1.1.2 Vai trị của mã hóa.....................................................................- 5 1.1.3 Các thành phần của hệ mã hóa................................................- 6 1.2 Tiêu chuẩn để đánh giá hệ mã hóa..................................................- 6 1.2.1 Độ an tồn của thuật tốn.........................................................- 6 1.2.2 Tốc độ mã hóa và giải mã.........................................................- 7 1.2.3 Phân phối khóa..........................................................................- 7 1.3 Khóa.................................................................................................- 7 1.3.1 Khái niệm...................................................................................- 7 1.3.2 Ví dụ............................................................................................- 7 1.4 Phân loại các thuật tốn mã hóa...................................................- 7 1.4.1 Phân loại theo các phương pháp..............................................- 7 1.4.1.1 Mã hoá cổ điển....................................................................- 7 1.4.1.2 Mã hóa đối xứng.................................................................- 8 1.4.1.3 Mã hóa bất đối xứng..........................................................- 8 1.4.1.4 Mã hóa hàm băm................................................................- 8 1.4.2 Phân loại theo số lượng khóa....................................................- 9 1.4.2.1 Mã hóa khóa bí mật............................................................- 9 1.4.2.2 Mã hóa khóa công khai....................................................- 10 CHƯƠNG II: MỘT SỐ PHƯƠNG PHÁP MÃ HĨA CỔ ĐIỂN...........- 11 2.1 Hệ mã hóa thay thế..........................................................................- 11 2.1.1 Hệ mã hóa Ceasar....................................................................- 11 2.1.2 Hệ mã hóa Vigenere...............................................................- 12 2.2 Hệ mã hóa hốn vị........................................................................- 14 2.2.1 Đảo ngược toàn bộ bản rõ.......................................................- 14 2.2.2 Mã hóa theo mẫu hình học......................................................- 14 2.2.3 Đổi chổ cột................................................................................- 15 2.2.4 Hoán vị các ký tự của bản rõ theo chu kì cố định................- 15 CHƯƠNG III: MỘT SỐ THUẬT TỐN MÃ HĨA HIỆN ĐẠI..........- 17 3.1 Thuật tốn mã hóa DES..................................................................- 17 3.1.1 Lịch sử ra đời............................................................................- 17 2


Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

3.1.2 Mơ tả thuật tốn DES.............................................................- 17 3.1.2.1 Sơ đồ tổng quát.................................................................- 17 3.1.2.2 Tạo khóa.............................................................................- 19 3.1.2.3 Hốn vị khởi đầu...............................................................- 21 3.1.2.4 Mã hóa chi tiết một vịng.................................................- 21 3.1.2.5 Hốn vị cuối cùng.............................................................- 26 3.1.3 Giải mã DES.............................................................................- 27 3.1.4 Độ an toàn của thuật tốn.......................................................- 27 3.2 Thuật tốn mã hóa RSA..............................................................- 28 2.2.1 Khái quát về RSA....................................................................- 28 3.2.2 Mô tả về thuật tốn.................................................................- 28 3.2.2.1 Tạo khóa............................................................................- 29 3.2.2.2 Mã hóa...............................................................................- 29 3.2.2.3 Giải mã..............................................................................- 30 3.2.2.4 Sơ đồ thuật toán...............................................................- 30 3.2.2.5 Ví dụ minh họa..................................................................- 30 3.2.3 Một số phương pháp tấn công...............................................- 32 3.2.3.1 Phương pháp sử dụng φ(n)..............................................- 32 3.2.3.2 Áp dụng thuật tốn phân tích ra thừa số........................- 32 3.2.3.3 Bẻ khóa dựa trên tấn cơng lặp lại...................................- 33 3.2.4 Đánh giá thuật toán.................................................................- 34 3.3. Thuật tốn mã hóa MD5................................................................- 34 3.3.1 Hàm băm MD5........................................................................- 34 3.3.1.1 Khái niệm...........................................................................- 34 3.3.1.2 Ứng dụng............................................................................- 34 3.3.1.3 Thuật giải...........................................................................- 35 3.3.2 MD5...........................................................................................- 36 3.3.2.1 Mô tả...................................................................................- 36 3.3.2.2 Cách thực hiện...................................................................- 39 3.3.2.3 Thuật toán và sơ đồ khối...................................................- 42 PHẦN III: KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN................................- 46 TÀI LIỆU THAM KHẢO.............................................................................- 47 -

3

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

PHẦN I: MỞ ĐẦU
Lí do chọn đề tài
Trong những năm gần đây, mạng Internet đã trở thành nền tảng chính
cho sự trao đổi thơng tin trên tồn cầu. Có thể thấy một cách rõ ràng là
Internet đã và đang tác động lên nhiều mặt của đời sống chúng ta từ việc tìm
kiếm thơng tin, trao đổi dữ liệu đến việc hoạt động thương mại, học tập
nghiên cứu và làm việc trực tuyến... Nhờ Internet mà việc trao đổi thơng tin
cũng ngày càng tiện lợi, nhanh chóng hơn, khái niệm thư điện tử (email) cũng
khơng cịn mấy xa lạ với mọi người.
Tuy nhiên trên môi trường truyền thông này, ngồi mặt tích cực Internet
cũng tiềm ẩn những tiêu cực của nó đối với vấn đề bảo vệ thơng tin.
Do đó, những yêu cầu được đặt ra đối với việc trao đổi thông tin trên mạng:
- Bảo mật tuyệt đối thơng tin trong giao dịch.
- Đảm bảo tính tồn vẹn của thơng tin.
- Chứng thực được tính đúng đắn về pháp lí của thực thể tham gia trao đổi
thơng tin.

- Đảm bảo thực thể không thể phủ nhận hay chối bỏ trách nhiệm của họ về
những hoạt động giao dịch trên Internet.
Mã hóa thơng tin là một ngành quan trọng và có nhiều ứng dụng trong đời
sống xã hội. Ngày nay các ứng dụng mã hóa và bảo mật thơng tin đang được
sử dụng ngày càng phổ biến hơn trong các lĩnh vực khác nhau trên Thế giới,
từ các lĩnh vực an ninh, quân sự, quốc phòng…. Cho đến các lĩnh vực dân sự
như thương mại điện tử, ngân hàng…
Ở Việt Nam hiện nay nhu cầu trao đổi thông tin cũng như các hoạt động
khác thông qua thư điện tử cũng rất phát triển. Vì vậy việc bảo mật cho hệ
thống thư điện tử ở Việt Nam cũng trở nên cần thiết. Hiện có rất nhiều
phương pháp bảo mật dữ liệu trên Internet. Trong phần đề tài này tôi chỉ tìm
hiểu một số phương pháp mã hóa đang được sử dụng rộng rãi ngày nay.

4

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

PHẦN II: NỘI DUNG
CHƯƠNG I: TỔNG QUAN VỀ HỆ MẬT MÃ
1.1 Khái niệm về mã hóa thơng tin
1.1.1 Khái niệm
Mã hóa thơng tin là chuyển đổi thơng tin từ dạng rõ (dạng đọc được) sang
dạng mờ (dạng không thể đọc được) và ngược lại. Nhằm mục đích ngăn chặn
nguy cơ truy cập thông tin truyền đi trên mạng một cách bất hợp pháp. Thông
tin sẽ được truyền đi trên mạng dưới dạng mờ và không thể đọc được với bất
kỳ ai cố tình muốn lấy thơng tin đó.
Khi chúng ta có nhu cầu trao đổi thơng tin, thì Internet là mơi trường

khơng an tồn, đầy rủi ro và nguy hiểm, khơng có gì đảm bảo rằng thơng tin
mà chúng ta truyền đi không bị đọc trộm trên đường truyền. Vì vậy mã hóa là
biện pháp giúp ta bảo vệ chính mình cũng như thơng tin mà ta gửi đi.
Ngồi ra mã hóa cịn đảm bảo tính tồn vẹn của dữ liệu.
1.1.2 Vai trị của mã hóa
Các hệ mã hóa phải thực hiện được các vai trị sau.
- Các hệ mã hóa phải che dấu được nội dung của văn bản rõ (PlainText) để
đảm bảo sao cho chỉ người chủ hợp pháp của thơng tin mới có quyền truy cập
thơng tin, hay nói cách khác là chống truy cập không đúng quyền hạn.
- Tạo các yếu tố xác thực thông tin, đảm bảo thông tin lưu hành trên hệ thống
đến người nhận hợp pháp xác thực.
- Tổ chức các sơ đồ chữ kí điện tử, đảm bảo khơng có hiện tượng giả mạo,
mạo danh để gửi thông tin trên mạng.
Ưu điểm lớn nhất của các hệ mã hóa là có thể đánh giá được độ phức tạp
của tính tốn mà “kẻ địch” phải giải quyết bài tốn để có thể lấy được thông
tin của dữ liệu đã được mã hóa. Tuy nhiên mỗi hệ mã hóa đều có một số ưu và
nhược điểm khác nhau, nhưng nhờ đánh giá được độ phức tạp tính tốn mà ta
có thể ứng dụng cụ thể tùy theo yêu cầu về độ an toàn.

5

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

1.1.3 Các thành phần của hệ mã hóa
Một hệ mã hóa là một bộ 5 (P, C, D, K, E) thõa mã các điều kiện sau.
- P là một tập hợp hữu hạn các bản rõ (PlainText), nó cịn được gọi là
khơng gian bản rõ.

- C là tập hợp hữu hạn các bản mã (CipherText), nó cịn được gọi là
không gian bản mã. Mỗi phần tử của C có thể nhận được bằng cách áp
dụng phép mã hóa Ek lên một phần tử của P.
- K là tập hợp hữu hạn các khóa hay cịn gọi là khơng gian khóa. Đối
với mỗi phần tử k của K được gọi là một khóa (Key). Số lượng của
khơng gian khóa phải đủ lớn để “kẻ địch” không đủ thời gian để thử mọi
khóa (phương pháp vét cạn).
- E và D lần lượt là tập luật mã hóa và giải mã. Với mỗi k của K có
một quy tắc mã hóa ek: PC và một quy tắc giải mã tương ứng d k € D.
Mỗi ek: PC và dk: CP là những hàm mà: dk(ek(x))=x với mọi bản rõ x
€ P.

Hình 1.1: Mơ hình mã hóa
1.2 Tiêu chuẩn để đánh giá hệ mã hóa
1.2.1 Độ an tồn của thuật tốn
Ngun tắc đầu tiên trong mã hoá là “Thuật toán nào cũng có thể bị phá
vỡ”. Các thuật tốn khác nhau cung cấp mức độ an toàn khác nhau, phụ thuộc
vào độ phức tạp để phá vỡ chúng. Tại một thời điểm, độ an tồn của một thuật
tốn phụ thuộc.
- Nếu chi phí hay phí tổn cần thiết để phá vỡ một thuật tốn lớn hơn giá trị
của thơng tin đã mã hóa thuật tốn thì thuật tốn đó tạm thời được coi là an
toàn.

6

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng


- Nếu thời gian cần thiết dùng để phá vỡ một thuật tốn là q lâu thì thuật
tốn đó tạm thời được coi là an tồn.
- Nếu lượng dữ liệu cần thiết để phá vỡ một thuật toán quá lơn so với lượng
dữ liệu đã được mã hoá thì thuật tốn đó tạm thời được coi là an tồn.
1.2.2 Tốc độ mã hóa và giải mã
Khi đánh giá hệ mã hóa phải chú ý đến tốc độ mã hóa và giải mã. Hệ mã
hóa tốt thì thời gian mã hóa và giải mã nhanh.
1.2.3 Phân phối khóa
Một hệ mã hóa phụ thuộc vào khóa, khóa này được truyền cơng khai hay
truyền bí mật. Phân phối khóa bí mật thì chi phí sẽ cao hơn so với các thuật
tốn mã hóa khóa cơng khai. Vì vậy đây cũng là một tiêu chí khi lựa chọn hệ
mã hóa.
1.3 Khóa
1.3.1 Khái niệm
Một khóa mã hóa là một phần thơng tin đặc biệt được kết hợp với một
thuật toán để thi hành mã hóa và giải mã. Mỗi khóa khác nhau có thể tạo ra
các văn bản mã hóa khác nhau, nếu khơng chọn đúng khóa thì khơng thể mở
được tài liệu đã mã hóa trên, cho dù biết được thuật tốn trên dùng thuật tốn
mã hóa gì, sử dụng khóa càng phức tạp thì độ an tồn của dữ liệu càng lớn.
1.3.2 Ví dụ
Mã hóa nội dung của một bức thư với khóa là “Thay thế mỗi kí tự xuất hiện
trong bức thư bằng kí tự đứng thứ 3 sau nó”. Cùng thật tốn trên nhưng sử
dụng khóa là “Thay thế mỗi kí tự xuất hiện trong bức thư bằng kí tự đứng thứ
4 sau nó”. Như vậy kết quả của một bức thư có nội dung như nhau sau khi sử
dụng hai khóa khác nhau sẽ có hai bản mã khác nhau.
1.4 Phân loại các thuật tốn mã hóa
1.4.1 Phân loại theo các phương pháp
1.4.1.1 Mã hoá cổ điển
Xuất hiện trong lịch sử, thuật tốn sử dụng khóa đơn giản, dễ hiểu. Là
phương pháp mà từng kí tự (hay từng nhóm kí tự) trong bản rỏ được thay thế

bằng một kí tự (hay nhóm kí tự) khác tạo nên bản mã. Bên nhận chỉ cần đảo
ngược lại trình tự thay thế trên thì sẽ nhận được bản rõ ban đầu.
7

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Mã hóa cổ điển có hai phương pháp nổi bật là: Mã hóa thay thế và mã hóa
hốn vị.
Các hệ mã hóa thường được sử dụng trong lịch sử là: Hệ mã hóa Ceasar,
Vigenere, Hill…
1.4.1.2 Mã hóa đối xứng
Mã hóa đối xứng hay mã hóa chia sẽ khóa là mơ hình mã hóa hai chiều, có
nghĩa là tiến trình mã hóa và giải mã đều dùng chung một khóa. Khóa này
được chuyển giao bí mật giữa hai đối tượng tham gia giao tiếp. Khóa này có
thể được cấu hình trong Software hoặc được mã hóa trong Hardware. Mã hóa
đối xứng thực hiện nhanh nhưng có thể gặp rủi ro nếu khóa bị đánh cắp.
Một số thuật tốn mã hóa đối xúng nổi tiếng như: DES, AES, RC2, RC4,
RC5, RC6…
Ngồi ra cịn một số thuật tốn như: Skipjact, Blowfish, CATS-128.
1.4.1.3 Mã hóa bất đối xứng
Mã hóa bất đối xứng là mơ hình mã hóa hai chiều sử dụng một cặp khóa là
khóa chung (Public Key) và khóa riêng (Private Key). Trong đó khóa chung
Public Key có thể được cơng bố rộng rải. Thông thường thông tin được người
gửi sử dụng khóa Public Key để mã hóa và gửi đi. Người nhận thơng tin sẽ
dùng khóa Private Key để giải mã. Khóa Private Key chỉ do một người giữ do
đó các phương pháp mã hóa bất đối xứng đảm bảo tính bí mật hơn. Một điều
quan trọng của phương pháp mã hóa này là cặp khóa Public Key và Private

Key phải tương đồng nhau. Có nghĩa là chỉ có Private Key trong cùng một
cặp khóa mới có thể giải mã được dữ liệu đã mã hóa bởi khóa Public Key
tương ứng.
Thuật tốn mã hóa bất đối xứng nổi tiếng và được sử dụng nhiều nhất hiện
nay là RSA.
Ngồi ra cịn một số thuật tốn khac như: Hellman, Elgamal…
1.4.1.4 Mã hóa hàm băm
Là cách thức mã hóa một chiều tiến hành biến đổi bản rõ thành bản mã mà
không bao giờ giải mã được. Người ta ví loại mã hóa này như một củ hành
được băm nhuyễn thì sẽ khơng bao giờ tái tạo lại được củ hành ban đầu.

8

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Trong xử lý hàm băm, dữ liệu đầu vào có thể khác nhau về độ dài, nhưng
độ dài của xử lý băm luôn xác định. Hàm băm được xử lý trong mơ hình xác
thực Password.
Một số thuật tốn mã hóa hàm băm thường dùng như: MD4, MD5, SHA…
1.4.2 Phân loại theo số lượng khóa
1.4.2.1 Mã hóa khóa bí mật
Mã hóa khóa bí mật là thuật tốn mà tại đó khóa giải mã có thể được tính
tốn từ khóa mã hóa. Trong rất nhiều trường hợp khóa mã hóa và khóa giải
mã là giống nhau. Thuật tốn này u cầu người gửi và người nhận thõa thuận
một khóa trước khi thơng tin được gửi đi và khóa này phải đảm bảo tính bí
mật. Độ an tồn của thuật này phụ thuộc nhiều vào độ bí mật của khóa, nếu để
lộ khóa thì thì bất kì người nào cũng có thể mã hóa và giải mã thơng tin một

cách dễ dàng.

Hình 1.2: Mơ hình mã hóa khóa bí mật
Trong đó :
K1 có thể trùng K2.
K1 có thể được tính từ K2.
K2 có thể được tính từ K1.
Mã hóa khóa bí mật thường được sử dụng cho các trường hợp dễ chuyển
khóa. Tức là người nhận và người gửi có thể trao đổi khóa cho nhau an tồn,
khó bị kẻ khác tấn cơng. Thường dùng để trao đổi trong văn phịng.
Một số vấn đề liên quan
- Các phương pháp mã hóa khóa bí mật địi hỏi người mã hóa và người
giải mã phải cùng chung một khóa hoặc là có thể biết khóa của nhau, khi
đó khóa phải được giữ bí mật tuyệt đối. Do đó kẻ địch dễ dàng xác định
được một khóa nếu biết khóa kia.

9

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

- Phương pháp này không đảm bảo được sự an tồn nếu có xác suất cao
khóa người gửi bị lộ. Khóa phải được gửi đi trên kênh an tồn nếu kẻ địch
tấn cơng trên kênh này có thể phát hiện ra khóa.
- Vấn đề quản lý và phân phối khóa là khó khăn và phức tạp, người gửi và
người nhận phải thống nhất với nhau về khóa việc thay đổi khóa là khó
khăn và dễ bị lộ.
1.4.2.2 Mã hóa khóa cơng khai

Mã hóa khóa cơng khai là các thuật tốn sử dụng khóa mã hóa và khóa giải
mã là hồn tồn khác nhau. Hơn nữa khóa giải mã khơng thể tính tốn được
từ khóa mã hóa.
Khác với mã hóa khóa bí mật, khóa mã hóa của thuật tốn mã hóa cơng
khai được cơng bố rộng rải. Một người bất kì có thể sử dụng khóa cơng khai
để mã hóa thơng tin, nhưng chỉ có người nhận thơng tin có khóa giải mã phù
hợp với khóa mã hóa để mã hóa thơng tin.
Mơ hình mã hóa khóa cơng khai.

Hình 1.3: Mơ hình mã hóa khóa cơng khai.
Trong đó :
Khóa mã hóa khơng thể giống khóa giải mã.
Khóa giải mã khơng thể được tính từ khóa mã hóa.
Một điều đặc biệt của loại mã hóa này là cả khóa cơng khai và bản mã có
thể được gửi đi trên kênh khơng an tồn mà thơng tin vẫn khơng bị đọc trộm.
Chính vì mức độ an tồn cao nên mã hóa khóa cơng khai được sử dụng trên
mạng cơng khai Internet.

10

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

CHƯƠNG II: MỘT SỐ PHƯƠNG PHÁP MÃ HÓA CỔ ĐIỂN
2.1 Hệ mã hóa thay thế
2.1.1 Hệ mã hóa Ceasar
Hệ mã hóa CEASAR là một ví dụ điển hình cho hệ mã hóa thay thế. Nó
làm việc trong bảng chử cái tiếng Anh 26 kí tự. Ceasar sử dụng các số nguyên

thay cho các kí tự, đánh số các kí tự trong bảng chử cái theo thứ tự bảng sau.

Các phép toán số học được thực hiên trên Modul 26 (có nghĩa là 26 tương
ứng với 0, 27 tương ứng với 1, 28 tương ứng với 2,…, 79 = 26x3 + 1 tức 79
tương ứng với 1).
Hệ CAESAR sử dụng thuật tốn mã hóa E k, trong đó mỗi ký tự được thay
thế bởi một ký tự khác được xác định bằng cách dịch ký tự cần mã hóa sang
phải k bước theo modul 26.
Ek() = ( + k) MOD 26.
Với  là một ký tự, 0  k  26, MOD là phép chia lấy phần dư.
Thuật toán giải mã tương ứng Dk là lùi lại k bước trong bảng chữ cái theo
modul 26.
Dk() = ( - k) MOD 26
Khơng gian khóa của hệ CEASAR bao gồm 16 số: 0, 1, 2, …, 25.
Ví dụ: Với k = 3, A được thay bằng D, B được thay bằng E,…, W được
thay bằng Z,…, Y được thay bằng B và Z được thay bằng C. Ta có:
Bảng chử cái gốc.

Bảng chử cái dùng để mã hóa.

Trong trường hợp này bản rõ “DAI HOC VINH” được mã hóa thành “GDL
KRF YLQK”, (Chú ý: Các ký tự trống trong bảng mã được bỏ đi để đảm bảo
tính an tồn).
11

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng


Thêm một vài ví dụ minh họa:
E25(IBM) = HAL, E6(MUPiD) = SAVOJ,
E3(HELP) = KHOS, E1(HOME) = IPNF,
Hệ CEASAR là hệ mã hóa cũ và khơng an tồn vì khơng gian khóa của nó
rất nhỏ, do đó có thể thám mã theo phương pháp vét cạn. Khóa giải mã có thể
tính ngay ra được từ khóa mã hóa. Do chỉ có 26 khóa nên ta có thể thử lần
lượt các khóa cho đến khi tìm được khóa đúng.
2.1.2 Hệ mã hóa Vigenere
Hệ mã hóa này được đặt theo tên của một nhà mật mã người Pháp Blaise De
Vigenere (1523 – 1596).
Vinegere cũng giống như Caesar, nhưng ở đây khóa được thay đổi theo từng
bước. Hình vng VIGENERE được sử dụng để mã hóa và giải mã.

12

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

A B C D E F G H I

J

K L M N O P Q R S T U V WX Y Z

B C D E F G H I

J


K L M N O P Q R S T U V WX Y Z A

C D E F G H I

J

K L M N O P Q R S T U V WX Y Z A B

D E F G H I

J

K L M N O P Q R S T U V WX Y Z A B C

E F G H I

J

K L M N O P Q R S T U V WX Y Z A B C D

F G H I

J

K L M N O P Q R S T U V WX Y Z A B C D E

G H I

J


K L M N O P Q R S T U V WX Y Z A B C D E F

H I

J

K L M N O P Q R S T U V WX Y Z A B C D E F G

I

J

K L M N O P Q R S T U V WX Y Z A B C D E F G H

J

K L M N O P Q R S T U V WX Y Z A B C D E F G H I

K L M N O P Q R S T U V WX Y Z A B C D E F G H I

J

L M N O P Q R S T U V WX Y Z A B C D E F G H I

J

K

M N O P Q R S T U V WX Y Z A B C D E F G H I


J

K L

N O P Q R S T U V WX Y Z A B C D E F G H I

J

K L M

O P Q R S T U V WX Y Z A B C D E F G H I

J

K L M N

P Q R S T U V WX Y Z A B C D E F G H I

J

K L M N O

Q R S T U V WX Y Z A B C D E F G H I

J

K L M N O P

R S T U V WX Y Z A B C D E F G H I


J

K L M N O P Q

S T U V WX Y Z A B C D E F G H I

J

K L M N O P Q R

T U V WX Y Z A B C D E F G H I

J

K L M N O P Q R S

U V WX Y Z A B C D E F G H I

J

K L M N O P Q R S T

V WX Y Z A B C D E F G H I

J

K L M N O P Q R S T U

WX Y Z A B C D E F G H I


J

K L M N O P Q R S T U V

X Y Z A B C D E F G H I

J

K L M N O P Q R S T U V W

Y Z A B C D E F G H I

J

K L M N O P Q R S T U V WX

Z A B C D E F G H I

K L M N O P Q R S T U V WX Y

J

Hình 2.1: Hình vng Vigenere.
Mỗi cột của hình vng Vigenere có thể xem như là một hệ CEASAR, với
các khóa: 0, 1, 2,...., 25. Để mã hóa thì bản rõ được đọc từ các hàng và khóa
được đọc từ các cột.

13

Trang



Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Ví dụ: Mã hóa bản “DAI HOC VINH” với từ khóa “ KHOA KINH TE”.
Đầu tiên ta tìm điểm giao của hàng D cột K ta được N, tiếp tục ta tìm điểm
giao của hàng A cột H, ta được H. Cứ như vậy ta được bản mã là “ NHW
HYK IPGL” . Ta sẽ thu được bản mã tưng tự nếu ta đọc bản rõ tưng ứng với
cột và khóa đọc tưng ứng với hàng. Muốn giải mã thơng tin vừa mã hóa trên
ta thực hiện bằng cách, ta nhìn vào hàng nào chứa N trong cột K, ta tìm được
chữ D, tương tự nhìn vào hàng nào chứa H trong cột H, ta tìm được chữ A. Cứ
như vậy ta sẽ tìm được bản rõ là “DAI HOC VINH”.
Trong ví dụ trên thì độ dài bản rõ bằng độ dài khóa. Nhưng trong thực tế độ
dài bản rõ thường dài hơn rất nhiều so với khóa. Như vậy để mã hóa hay giải
mã thì ta phải áp dụng từ khóa một cách tuần hồn. Nghĩa là từ khóa được lặp
đi lặp lại nhiều lần sao cho các kí hiệu trong bản rõ phải được đọc hết.
Ta thÊy r»ng trong hƯ m· ho¸ VIGENERE, víi kho¸ cã độ dài
d thì sẽ có 26d khoá hợp lệ. Vì vậy, chỉ cần với giá trị d nhỏ
thì phơng pháp thám mà vét cạn cũng đòi hỏi khá nhiều thời
gian.
2.2 Hệ mã hóa hốn vị
Hệ mã hóa hốn vị hay cịn gọi là hệ mã hóa đổi chổ. Là hệ mã hóa mà các
kí tự của bản rõ vẫn được giữ nguyên, nhưng thứ tự của chúng được đổi chổ
vòng quanh.
Phương pháp này có các kỹ thuật mã hóa sau.
2.2.1 Đảo ngược toàn bộ bản rõ
Nghĩa là bản gốc được viết theo thứ tự ngược lại từ sau ra trước, để tạo bản
mã. Đây là phương pháp mã hóa đơn giản nhất vì vậy khơng đảm bảo an tồn.
Ví dụ Plaintext: SECURE EMAIL
Bản mã: LIAMEERUCES

2.2.2 Mã hóa theo mẫu hình học
Bản gốc được sắp xếp lại theo một mẫu hình học nào đó, thường là một
mảng hoặc ma trận hai chiều.

14

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Ví dụ: Bản rõ “KHOA CONG NGHE THONG TIN” được viết theo ma
trận 4x5 như sau:

Nếu lấy các ký tự ra theo số thứ tự cột 3, 1, 4, 2, 5 thì ta thu được bản mã
“OGTTKOHNANHIHNEGCGON”.
2.2.3 Đổi chổ cột
Đầu tiên đổi chổ các ký tự trong ban rõ thành dạng hình chữ nhật theo cột,
sau đó các cột được sắp xếp lại và các chữ cái được lấy ra theo hàng ngang.
Ví dụ: Bản rõ là “KHOA CONG NGHE THONG TIN” được viết dưới
dạng ma trận 4x5 theo cột như sau:

Vì có 5 cột nên ta có thể sắp xếp lại theo 5!=120 cách khác nhau. Để tăng
độ an tồn có thể chọn một trong các cách sp xp li ú.
Nếu ta chuyển vị các cột theo thứ tự 3, 5, 2, 4, 1 rồi lấy các


tự

ra


theo

hàng

ngang

ta

sẽ

đợc

bản





NGCTKGTOHHHINOOENGNA. Lu ý rằng các ký tự cách đợc bỏ
đi.
15

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

2.2.4 Hoán vị các ký tự của bản rõ theo chu kì cố định
NÕu hµm f lµ mét hoán vị của một khối gồm d ký tự thì

khoá mà hoá đợc biểu diễn bởi K(d,f).
Do vậy, bản rõ:
M = m1m2...mdmd+1...m2d
Với mi là các ký tự , và bản rõ sẽ đợc mà hoá thành:
Ek(M) = mf(1)mf(2)...mf(d)md+f(1)...md+f(d)
Trong đó mf(1)mf(2)...mf(d) là một hoán vị của m1m2...md.
Vớ d: Mó húa bn rõ “BAO MAT” chọn d=6 và f hoán vị dãy i= 123456
thành f(i)=351462

Theo bảng trên ta thấy ký tự đầu sau khi hốn vị chuyển đến vị trí thứ 3, ký
tự thứ 2 chuyển tới vị trí thứ 5, ký tự thứ 3 chuyển tới vị trí thứ 1,… Như vậy
sau khi mã hóa ta thu được bản mã là “OABMTA”.
Nếu kích thước bản rõ lớn hơn nhiều so với d thì ta sẽ phải chia bản rõ
thành các khối d ký tự và tiến hành mã hóa theo từng khối. Ví dụ:
Bản rõ “KHOA CONG NGHE THONG TIN”, giả sử d=6, và f hoán vị dãy
i= 12345 thành f(i)=35142
Ta thu được bản mã “OCKAHGGONNTOHHETNIG”

16

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

CHƯƠNG III: MỘT SỐ THUẬT TỐN MÃ HĨA HIỆN ĐẠI
3.1 Thuật tốn mã hóa DES
3.1.1 Lịch sử ra đời
Khoảng những năm 1970, tiến sĩ Horst Feistel đã đặt nền móng đầu tiên
cho chuẩn mã hóa DES với phương pháp mã hóa Feistel Cipher. Vào năm

1976 Cơ quan bảo mật quốc gia Hoa Kỳ (NSA) đã công nhận DES dựa trên
phương pháp Feistel là chuẩn mã hóa dữ liệu. Kích thức khóa của DES ban
đầu là 128 bit nhưng tại bản cơng bố FIPS kích thước được rút xuống 56 bit
để tăng tốc độ xử lý và đưa ra các tiêu chuẩn thiết kế một chuẩn mã hóa dữ
liệu.
Nội dung phương pháp mã hóa DES.
DES thực hiện mã hóa dữ liệu qua 16 vịng lặp mã hóa, mỗi vịng sử dụng
một khóa chu kỳ 48 bit được tạo ra từ khóa ban đầu có độ dài 56 bit. DES sử
dụng 8 bảng hằng số S-box để thao tác.
3.1.2 Mô tả thuật toán DES
3.1.2.1 Sơ đồ tổng quát
Phương pháp DES mã hóa khối thơng tin x có độ dài 64 bít với khóa k có
độ dài 56 bit thành khối y có độ dài 64 bít.
Nền tảng để xây dựng khối của DES là sự kết hợp đơn giản của các kỹ
thuật thay thế và hoán vị bản rõ dựa trên khóa, đó là vịng lặp. DES sử dụng
16 vịng lặp áp dụng cùng một kiểu kết hợp các kỹ thuật trên khối bản rõ.
Thuật toán chỉ sử dụng các phép tốn số học và logic thơng thường trên các
số 16 bít, vì vậy nó dễ dàng thực hiện vào những năm 1970 trong điều kiện về
công nghệ phần cứng lúc bấy giờ.
Sơ đồ tổng quát :

17

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Plaintext
IP

L0

R0


K1

L1=R0

R1=L0(R0,K1)


K2

L2=R1

R2=L1(R1,K2)

L15=R14

R15=L14(R14,K15


)
K16
L16=R15

R16=L15(R15,K16)
IP -1
Ciphertext


Hình 3.1: Sơ đồ tổng quát mã hóa DES.

18

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Q trình có 16 vịng thực hiện giống nhau trong q trình xử lý. Ngồi ra
có hai lần hoán vị đầu IP và cuối IP-1, hai hoán vị này được sử dụng với mục
đích đưa thơng tin vào và lấy thơng tin ra.
Muốn vào vịng mã hóa thì khối thơng tin x ban đầu 64 bít được chia làm
hai khối, mỗi khối 32 bít hàm f làm biến đổi một nữa của khối đang xử lý với
một khóa con tương ứng với vịng mã hóa.
Trong đầu ra của hàm có hàm f được kết hợp với nửa khối cịn lại bằng
phép tốn XOR, và hai phần được trao đổi để xử lý trong chu trình kế tiếp.
Cứ thực hiện các vòng như vậy cho tới vòng cuối cùng thì hai phần khơng
bị tráo đổi nữa, chính vì điều này mà q trình mã hóa và giải mã là giống
nhau.
3.1.2.2 Tạo khóa
Q trình mã hóa được thực hiện 16 vịng, mỗi vịng cần một khóa. Như
vậy từ khóa ban đầu tạo ra 16 khóa con cho 16 vịng lặp tương ứng.
Sơ đồ q trình tạo khóa.

Hình 3.2: Sơ đồ tạo khóa

19


Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Theo sơ đồ ta thấy đầu tiên khóa K có độ dài 64 bít, sau đó được giảm
xuống 56 bít bằng cách loại bỏ 8 bít chẵn lẽ. Sự loại bỏ được thực hiên khi đi
qua PC1.
Bảng PC1 :

Như vậy các bít ở vị trí 8, 16, 24, 32, 40, 48, 56, 64 bị loại bỏ. 56 bít thu
được chia làm hai phần, mỗi phần 28 bít, các phần được xử lý độc lập nhau.
Các phần này được dịch 1 hay 2 bít là phụ thuộc vào vịng đó. Số bít dịch
được cho trong bảng sau.

Sau khi dịch bit, 56 bit này được chọn ra 48 bit. Bởi vì sự thực hiện đổi chổ
thứ tự các bit như là sự lựa chọn một tập con các bit, nó cịn được gọi là hốn
vị nén hoặc hốn vị lựa chọn. Sự thực hiện này cung cấp một tập hợp các bit
cùng cỡ với đầu ra của hoán vị mở rộng. bảng 4 định nghĩa hoán vị nén (cũng
gọi là hốn vị lựa chon). Ví dụ, bit ở vị trí 33 của khóa được dịch chuyển tới
vị trí 35 của đầu ra và bit ở vị trí 8 của khóa bị bỏ qua.
Bảng PC2( hoán vị nén).

Như vậy sau khi đi qua PC2 cịn lại 48 bít, 48 bít này sẽ được sử dụng làm
khóa K1 để sử dụng trong vịng mã hóa.
Hai phần, mỗi phần 28 bít sau khi được dịch bít ở lần thứ nhất, tiếp tục dịch
bít ở lần thứ 2 và qua bảng PC2 để hoán vị nén 48 bít và làm K2.
Q trình cứ tiếp tục như vậy ta thu được 16 khóa Ki (i=1…16).

20


Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

3.1.2.3 Hốn vị khởi đầu
Mục đích của hốn vị khởi đầu là đổi chổ các bít của khối dữ liêu vịa
thơng qua bảng IP. Nó khơng ảnh hưởng đến sự an toàn của DES.
Với bản rõ cho trước x, một xâu bít x 0 sẽ được xây dựng bằng cách hốn vị
các bít của x theo phép hốn vị cố định ban đầu IP. Ta viết x 0=IP(x)=L0R0
trong đó L0 gồm 32 bít đầu và R0 gồm 32 bít cuối.
L

R

0

0

x0

Hình 3.3: Biểu diễn dãy 64 bít x chia thành 2 thành phần L0,R0
Bảng hoán vị khởi đầu IP.

3.1.2.4 Mã hóa chi tiết một vịng
Q trình xử lý các vịng là giống nhau, ta xét q trình xử lý của một vịng
i với 1 i  16.
L


i-1

R

i-1

K

f

i



L

i

R

i

Hình 3.4: Sơ đồ chi tiết một vòng.
Ta thấy:
Li = Ri-1
Ri =Li-1  f(Ri-1,Ki)
Hàm f có hai tham số là Ri-1 và Ki. Được thực hiện theo sơ đồ sau :
21

Trang



Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Hình 3.5: Sơ đồ hoạt động của hàm f.
Ri được mở rộng từ 32 bít thành 48 bít nhờ sự thay đổi thứ tự cảu các bít
bằng cách lặp lại một số bít nào đó, nó được hiểu như là một sự hoán vị mở
rộng.
Để xác định ở đầu vào có 32 bít, bít nào được lặp lại và xuất hiện tại vị trí
nào của đầu ra 48 bít người ta xác định như sau:
Đầu vào có 32 bít chia làm 8 bộ, mỗi bộ có 4 bít. Bít đầu tiên và bít cuối
cùng của mỗi bộ tương ứng với 2 bít của khối dữ liệu ra, trong khi bít thứ 2 và
bít thứ 3 của mỗi bộ tương ứng với một bít ở khối dữ liệu ra. Ví dụ, bít ở vị trí
thứ 3 của khối dữ liệu vào được chuyển tới vị trí thứ 4 trong khối dữ liệu ra,
bits thứ 8 trong khối dữ liệu vào thì được chuyển tới vị trí 11 và 13 trong khối
dữ liệu ra.
Hộp E.

22

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

1 2 3 4

5

6 7 8


9 10 11 12

13 14 15 16

48

32

Hình 3.6: Hốn vị mở rộng.
1 2163 bít4 của
5 6 R 7được
8 9 hốn
10 11 vị
12 hai13lần.
14 15
16 17
19 dữ
20 21
22 ra
23 rộng
Như vậy
Mặc
dù18khối
liệu
i
24
hơn khối dữ liệu vào, nhưng một khối dữ liệu vào chỉ có duy nhất một khối
dữ liệu ra.


Như vậy E(Ri-1) là một dãy 48 bít. Thực hiện phép tốn XOR cho dãy bít
E(Ri-1) với khóa Ki. Ta thu được dãy 48 bít B. Biểu diễn B thành từng nhóm 6
bít B = B1B2B3B4B5B6B7B8.
Sử dụng 8 hộp S = S1, S2, S3, S4, S5, S6, S7, S8. Mỗi hộp Si có kích thước
4 x 16. Mỗi dịng của hộp nhận đủ giá trí từ 015.
Xét dãy 6 bít Bi=b1b2b3b4b5b6. Si(Bi) được xác định bằng giá trị của phần tử
tại dòng m cột n. Trong đó m, n được xác định bằng cách.

23

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Giá trị m được xác định bằng bít b 1 và b6 được kết hợp thành một số 2 bít
nhận giá trị từ 0 đến 3. tương ứng với một hàng trong bảng.
Giá trị n được xác định bằng cách ghép bít b 2b3b4b5 thành một số 4 bít nhận
giá trị từ 0 đến 15 tương ứng với cột trong bảng.
Ví dụ:
B2=111010 ta có m= b1b6 = 10= 2 ; n = b2b3b4b5= 1101= 13.
Phần tử ở vị trí hàng 2 cột 13 là 6, sang giá trị nhị phân là 0110. Như vậy
0110 thay cho 111010.
Như vậy tập dãy 4 bít thu được C ta có dãy C = C 1, C2, C3, C4, C5, C6, C7,
C8.
Dãy 32 bít thu được bằng cách hốn vị hốn vị C theo quy luật P nhất
định. Đây là kết quả của hàm f(R i-1,Ki) XOR với Li-1 tạo thành khối Ri với 32
bít.
Các hộp S.
Hộp S thứ 1.


Hộp S thứ 2.

24

Trang


Tìm Hiểu Một Số Thuật Tốn Mã Hóa Dữ Liệu Và Ứng Dụng

Hộp S thứ 3.

Hộp S thứ 4.

Hộp S thứ 5.

Hộp S thứ 6.

25

Trang


×