Tải bản đầy đủ (.pdf) (56 trang)

Tài liệu Luận văn Vấn đề xác thực người dùng và tầm quan trọng của nó doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.76 MB, 56 trang )












Luận văn



Vấn đề xác thực người
dùng và tầm quan trọng
của nó










- 9 -




CHƯƠNG I: GIỚI THIỆU KHÁI QUÁT VỀ XÁC THỰC
1.1. Định nghĩa xác thực
Xác thực (tiếng anh: Authentication = thật hoặc chính cống) là một hành
động nhằm thiết lập hoặc chứng thực một cái gì đó (hoặc một người nào đó)
đáng tin cậy, có nghĩa là những lời khai báo do người đó đưa ra hoặc về vật đó
là sự thật. Xác thực một đối tượng còn có nghĩ
a là công nhận nguồn gốc của đối
tượng, trong khi, xác thực một người thường bao gồm việc thẩm tra nhận dạng
của họ. Việc xác thực thường phụ thuộc vào một hoặc nhiều nhân tố xác thực để
minh chứng cụ thể.
Xác thực là đặc biệt quan trọng để cho sự hoạt động của hệ thống được an
toàn. Hệ thống luôn luôn trước tiên xác thực mộ
t thực thể khi nó cố thử thiết lập
sự liên lạc. Khi đó nét nhận dạng của thực thể được dùng để xác định sự truy
nhập của nó như một đặc quyền hoặc để đạt được sự sẵn sàng phục vụ. Suốt quá
trình thực hiện giao thức xác thực, hai bên luôn luôn trao đổi bí mật chung, mà
nó sẽ được dùng để đưa đến sự bảo mật và toàn vẹn.
1.2. Vấn đề xác thực người dùng và tầm quan trọng của nó
Hệ thống xác thực người dùng đóng vai trò hết sức to lớn trong việc bảo
mật thông tin của người dùng trong thời kì hiện đại hoá ngày nay. Các bạn đã
bao giờ đặt ra câu hỏi nếu không có hệ thống xác thực người dùng thì làm sao
giữ an toàn được những thông tin bí mật hoặc làm sao quản lý được các bí mật
trong kinh doanh, thương mại và tài khoản ở ngân hàng hoặc những nguồ
n tài
nguyên được chia sẻ ở trên mạng từ một máy chủ?
Với tên và mật khẩu chính xác bạn có thể truy cập vào các tệp tin, thư điện
tử, tài khoản của bạn ở ngân hàng hay những thông tin cá nhân của bạn…Mà
bạn không muốn một người dùng nào khác biết được. Vì vậy có thể nói lợi ích
do hệ thống này mang lại là rất lớn đối với cuôc sống hiện đại ngày nay. Nhưng

các hệ thống xác th
ực người dùng hiện nay cũng gặp phải không ít những vấn đề
khó khăn:
Mật khẩu của bạn có thể bị đánh cắp bởi những người dùng trên mạng
internet. Những hacker có rất nhiều công cụ để có thể lấy được mật khẩu của
- 10 -
bạn. Do đó đối với hệ thống xác thực người dùng để đảm bảo an toàn thì người
dùng phải thay đổi mật khẩu thường xuyên, do đó sẽ làm cho người dùng khó
nhớ.
Trên thế giới hiện nay phương thức xác thực phổ biến vẫn là sử dụng các
ký tự làm mật khẩu và xu hướng đặt mật khẩu của người dùng có thể là sở thích,
tên một nhân vật nổi tiếng ư
a thích, hoặc ngày sinh nhật… Sẽ làm cho kẻ tấn
công sẽ dự đoán được.
Đối với những mật khẩu thông thường thì người dùng có thể mô tả được
hoặc ghi lại được vì vậy rất dễ bị lộ.
Để giải quyết những vấn đề trên trong tài liệu này chúng tôi tập trung trình
bày về một hệ thống xác thực còn khá mới mẻ đối với Việt Nam nhưng yêu cầu
đả
m bảo thông tin an toàn của hệ thống này là rất cao. Đó chính là hệ thống xác
thực người dùng bằng sinh trắc học. Hệ thống này sẽ được đề cập ở các chương
sau.
1.3. Các dạng xác thực
- Căn cứ vào tính chất và đặc điểm của các thành phần xác thực người ta
phân ra làm hai dạng xác thực sau:
+ Sự xác thực thực thể.
+ Sự xác thực trách nhiệm văn bản gốc.
Trong sự xác th
ực thực thể, người dùng yêu cầu được chấp nhận là người
chính thức hợp pháp của hệ thống. Dịch vụ xác thực thực thể đem đến sự đảm

bảo sự công nhận hoặc bác bỏ nét nhận dạng của người truy nhập. Sự xác thực
thực thể có thể một phía hoặc nhiều phía:
+ Trong sự xác thực một phía, chỉ một phía thực hiện sự
xác thực tự bản
thân mình khi liên lạc.
+ Trong sự xác thực thực thể đồng thời, cả hai bên phải xác thực lẫn nhau.
Sự xác thực trách văn bản gốc cung cấp bằng chứng để một đoạn dữ liệu,
cũng như một thư điện tử, trong thực tế được tạo bởi người sử dụng chính thức.
1.4. Các giao thức xác thực
Sức m
ạnh của một hệ xác thực phụ thuộc khả năng của hạ tầng, hỗ trợ để
lưu giữ khóa mật mã dài và thực hiện các phép toán mật mã. Con người không
có cả hai khả năng này. Trừ khi hạ tầng bổ sung thêm các đại lượng này cho
- 11 -
người dùng, và hệ thống xác thực cần phải dựa vào mật khẩu ngắn để kiểm tra
nhận dạng của người dùng. Điện thoại và thiết bị không kêu (dumb terminals) là
những ví dụ về hạ tầng không có khả năng này.
Nếu một người truy nhập đến một thiết bị thông minh, ví như máy tính
hoặc Smart card, bằng bất cứ cách nào, hệ thống xác thực hứa hẹn một giao thứ
c
xác thực tỉ mỉ hơn với thiết bị kiểm tra nét nhận dạng của người truy nhập. Các
giao thức này có thể thúc đẩy các phép toán mật mã tổng hợp và dùng khóa mật
mã dài để phá vỡ nhiều dạng tấn công thông tin.
+ Giao thức thử thách và trả lời : Giao thức thử thách và trả lời cho phép
người truy nhập tự xác thực mình với hệ thống bằng cách chứng minh hiểu biết
của mình về giá trị m
ật mã bí mật mà không yêu cầu người truy nhập tiết lộ bí
mật. Hệ thống xác thực đưa ra cho người truy nhập một số được tạo ra một cách
ngẫu nhiên được gọi là thử thách. Người truy nhập nhập số thử thách và giá trị
mật để hàm mật mã tính ra câu trả lời. Hệ thống xác thực nét nhận dạng của

người truy nhập nếu câu trả lời là giá trị mong đợi. Bở
i vì thử thách là một số
ngẫu nhiên, giao thức thử thách – trả lời cung cấp một lá chắn có hiệu quả chống
lại sự tấn công lặp lại.

Hình 1.1: Mô hình quá trình xác thực người dùng.
Hầu hết các hệ thống xác thực người dùng hiện nay người dùng muốn đăng
nhập đều phải nhập tên và mật khẩu. Trong đó tên và mật khẩu là do người dùng
tạo ra. Tên và mật khẩu của ngườ
i dùng sẽ được hệ thống mã hoá và lưu vào cơ
sở dữ liệu. Mật khẩu của người dùng phải được các hệ thống xác thực mã hoá để
- 12 -
đảm bảo an toàn bằng những thuật toán mã hoá khác nhau. Đặc biệt là các hệ
thống máy tính mật khẩu của người dùng phải được mã hoá bằng những thuật
toán đặc biệt, ví dụ như hệ điều hành Linux hay Unix sử dụng các thuật toán
DES, MD5, hay Blowfish để mã hoá mật khẩu thành hàm băm trước khi lưu vào
cơ sở dữ liệu, hay WindowNT sử dụng MD4 và DES để mã hoã mật khẩu. Khi
đăng nhập vào hệ thống thì người dùng phả
i nhập lại tên và mật khẩu mà người
dùng đã đăng kí. Hệ thống sẽ so sánh tên và mật khẩu mà người dùng nhập với
mật khẩu đã đăng kí. Nếu đúng người dùng đăng nhập thành công, ngược lại
người dùng sẽ phải đăng nhập lại. Hệ thống sẽ từ chối nếu sau một vài lần đăng
nhập không thành công. Hình vẽ 1.1 mô tả quá trình xác thực người dùng.
Trên thế giớ
i hiện nay các hệ thống xác thực người dùng phổ biến vẫn là sử
dụng các kí tự làm mật khẩu ví dụ như các hệ thống thư điện tử của yahoo hoặc
gmail, ATM…

Hinh 1.2: Hệ thống xác thực người dùng của Gmail.
+ Giao thức mật khẩu được chuyển đổi : Trong giao thức này, người truy

nhập chế biến mật khẩu của mình qua hàm băm rồi gửi kết quả
tới hệ thống xác
thực. Hệ thống so sánh giá trị băm với giá trị băm chính xác của mình và xác
thực nét nhận dạng của người sử dụng nếu hai giá trị như nhau. Nếu hệ thống
lưu giữ mật khẩu thay vì giá trị băm của chúng, hệ thống sẽ tính giá trị băm của
mật khẩu trước khi đưa ra so sánh. Giao thức mật khẩu được chuyển đổi th
ể hiện
mật khẩu dưới dạng hiện, nên nó dễ bị tổn thương trước sự tấn công lặp lại.
+ Giao thức mật khẩu sử dụng một lần : Giao thức mật khẩu sử dụng một
lần là một dạng quan trọng của giao thức mật khẩu được chuyển đổi để che chắn
- 13 -
chống lại sự tấn công lặp lại được thực hiện bởi kẻ nghe trộm. Giao thức này
yêu cầu người truy nhập và hệ thống xác thực chia một số bí mật nhỏ n. Người
truy nhập băm mật khẩu của mình n lần để tạo ra mật khẩu sử dụng một lần và
xác thực người truy nhập nếu hai kết quả là như nhau. Trên cơ sở
của sự xác
thực thành công, cả hai bên giảm lượng n. Một kẻ trộm không thể thực hiện việc
tấn công lặp lại bởi vì mật khẩu sử dụng một lần tiếp theo là khác và nó không
thể xác định từ giá trị trước đó. Trong giao thức này, cần phải thay đổi mật khẩu
của người dùng và lập lại n khi n tiến tới 0.
+ Giao thức chứng chỉ
số : Giao thức chứng chỉ số là một dạng của giao
thức thử thách – trả lời mà ở đó giá trị mật mã bí mật là một khóa riêng và hệ
thống xác thực dùng khóa công khai tương ứng với khóa riêng để xác thực câu
trả lời.
+ Giao thức nhận dạng sinh trắc học: Khi người dùng đăng nhập mật khẩu
của người dùng sẽ được so sánh với mật khẩu đã lưu trong cơ
sở dữ liệu thông
qua mạng máy tính. Nếu đúng quá trình xác thực thành công. Giao thức này có
độ bảo mật cao.

1.5. Các phương thức về xác thực
Phần này sẽ trình bày chi tiết về các phương thức xác thực truyền thống đó
là: Giới thiệu xác thực theo thẻ, xác thực dựa theo nhân trắc quan và xác thực
dựa trên ý thức. Qua đó đưa ra ưu, nhược điểm cũng như ứng dụng của các
phuơng th
ức của các hệ thống trong thực tế.
1.5.1. Xác thực theo thẻ
Xác thực theo thẻ, là công nghệ để xác thực người dùng muốn đăng nhập
vào một hệ thống, mạng hay máy chủ, được sử dụng khá phổ biến hiện nay trên
thế giới cũng như ở Việt Nam. Ví dụ như : key card, bank card, smart card,
ATM card… Mật khẩu mà người dùng phải nhớ đó là số PIN. Xác thực người
dùng bằng thẻ là giả
i pháp mang tính kinh tế cho các tổ chức. Mỗi một người
dùng sẽ có thẻ riêng, với lần đầu tiên dùng thẻ hệ thống sẽ sinh ngẫu nhiên cho
người dùng số PIN. Trên mỗi thẻ sẽ lưu một seed duy nhất (key) và key này
cũng được lưu trên cơ sỏ dữ liệu của server. Key này sẽ được mã hoá bằng
những thuật toán mã hoá như: DES, 3DES, AES 128-bit hoặc 192-bit và 256-
bit. Khi người dùng đăng nhập vào hệ thống phải đưa thẻ vào thiế
t bị nhập thẻ
- 14 -
sau đó nhập số PIN nếu đúng thì người dùng sẽ đăng nhập thành công, nếu sai
người dùng sẽ phải thực hiện lại quá trình trên. Thông thường sau mười lần liên
tục người dùng đăng nhập không thành công hệ thống sẽ khoá tài khoàn của
người dùng. Mật khẩu của người dùng là số PIN, người dùng có thể thay đổi mật
khẩu bất cứ lúc nào với độ dài mật khẩu do người dùng lựa chọn. Mật kh
ẩu có
thể là các kí tự, số. . . Người dùng tránh đặt những mật khẩu quá dễ nhớ.
Hệ thống xác thực sử dụng công nghệ này yêu cầu phải có các thiết bị vật
lý dùng để đọc thẻ và phải được kết nối với hệ thống máy tính để quản lý, đặt ở
nhiều nơi thuận tiện cho người dùng sử dụng. Dưới đây là một số hình ảnh về


thẻ mà người dùng sử dụng :





Hình 1.3: Crypto card.
Ưu điểm hệ thống xác thực theo thẻ là người dùng muốn đăng nhập vào tài
khoản của mình thì phải dùng thẻ, việc làm giả thẻ cũng khó không phải ai cũng
có thể làm được. Vì vậy những kẻ muốn tấn công vào tài khoản của người khác
- 15 -
phải có thẻ mới có thể tấn công được. Bởi vì hệ thống sử dụng các thiết bị vật lí
để đọc thẻ, cả thẻ và các thiết bị vật lí này có giá rất đắt, hơn nữa các thiết bị này
cần phải sử dụng nhiều trên một phạm vi rộng nên chi phí cho hệ thống xác thực
người dùng bằng thẻ là tốn kém. Ở nước ta xác thực người dùng theo thẻ chỉ
mới xuất hiện ở các ngân hàng, bằng việc sử dụng các thẻ ATM. Hình ảnh dưới
đây mô tả thiết bị đọc thẻ và thẻ của hệ thống xác thực người dùng sử dụng thẻ :



Hình 1.4: Thiết bị đọc thẻ của hệ thống xác thực người dùng.
Mật khẩu của người dùng là số PIN, chỉ người dùng biết và thay đổi được,
mặc dù rấ
t khó nhớ nhưng vẫn có thể đánh cắp được. Vì những lí do trên mà hệ
thống xác thực người dùng bằng thẻ bây giờ vẫn chưa sử dụng rộng rãi ngoài
khu vực ngân hàng.
1.5.2. Xác thực dựa theo tri thức
Xác thực dựa theo tri thức là phương thức sử dụng rộng rãi nhất hiện nay
trên thế giớ. Đây là phương thức đã rất quen thuộc với người dùng. Phương thức

này bao gồm c
ả sử dụng mật khẩu bằng dãy các kí tự và hình ảnh. Nhưng sử
dụng mật khẩu là các kí tự thì đang được phổ biến và rộng rãi hơn. Đối với hệ
thống sử dụng mật khẩu là dãy các kí tự thì buộc người dùng phải nhớ, dãy các
kí tự đó là một dãy các số, kí tự và một vài kí tự đặc biệt…Khi lần đầu đăng kí
vào hệ thống người dùng sẽ
phải tạo mật khẩu cho mình, mật khẩu mà người
dùng đặt là một dãy các kí tự mà người dùng bắt buộc phải nhớ. Mật khẩu của
- 16 -
người dùng sẽ được hệ thống mã hoã và lưu vào cơ sở dữ liệu trên máy chủ. Sau
đó để đăng nhập vào hệ thống thì người dùng phải nhập tên và mật khẩu. Mật
khẩu mà người dùng nhập vào sẽ được mã hoá sau đó so sánh với mật khẩu đã
có trong cơ sở dữ liệu ứng với tên của người dùng. Nếu đúng thì người dùng sẽ
đăng nhập được vào hệ th
ống. Tên của người mỗi người dùng là khác nhau. Nếu
nhập sai thì người dùng phải đăng nhập lại. Quá trình này sẽ chỉ lập lại một vài
lần. Có một số hệ thống còn yêu cầu mật khẩu phải dài trên 6 hoặc 8 kí tự để hệ
thống được an toàn hơn, ví dụ như một số hệ thống thư điện tử của Yahoo hay
Hotmail. . .
Nhưng với hệ thống này không c
ần phải sử dụng các thiết bị vật lý như hệ
thống xác thực người dùng dựa theo nhân trắc quan nên rất tiết kiệm về mặt kinh
tế. Do đó hệ thống này đã và đang sử dụng rất phổ biến trên thế giới cũng như ở
Việt Nam. Và có thể thích hợp với mọi ứng dụng, Web, và mọi thiết bị (PCs,
PDA…). Hình ảnh dưới đây mô tả
hệ thống xác thực người dùng dựa theo ý
thức:


Hình 1.5: Hệ thống xác thực người dùng của Yahoo mail.

Đối với những hệ thống mà mật khẩu là dãy kí tự thì rất dễ bị tấn công và
dễ dự đoán được mật khẩu của người dùng. Vì mật khẩu mà nguời dùng sử dụng
thường được đặt dựa trên các thói quen hằng ngày, các sở thích, hoặc cũng có
thể là tên của nh
ững nhân vật nổi tiếng mà họ yêu thích… Hơn nữa mật khẩu
- 17 -
dạng kí tự thì rất dễ miêu tả, tiết lộ với người khác hay ghi lại được. Các hacker
lại có rất nhiều công cụ hoặc có thể dùng từ điển dò mật khẩu để có thể crack
được mật khẩu của người dùng… Do đó tài khoản của người dùng sẽ dễ bị
người khác tấn công. Để hạn chế được sự tấn công của kẻ xấu thì người dùng
phả
i tạo được mật khẩu có tính an toàn cao, tránh sử dụng các từ quá dễ nhớ để
làm mật khẩu như là: millionair, football, darling’s name, số điện thoại, ngày
sinh nhật… theo như các khuyến cáo và phải thay đổi mật khẩu định kì. Nhưng
như vậy sẽ khó nhớ đối với người dùng.
1.5.3. Xác thực dựa theo nhân trắc quan


Hình 1.6: Kiến trúc chung của hệ thống xác thực người dùng dựa theo
sinh trắc học.
Xác th
ực dựa theo nhân trắc quan là phương thức sử dụng công nghệ như
nhận dạng vân tay, võng mạc, khuôn mặt, giọng nói, loại máu, những chi tiết
sinh học nhỏ trên cở thể người dùng… Hệ thống sẽ kiểm tra những đặc điểm
sinh học duy nhất của nguời dùng để xác định nguời dùng đó là ai bằng cách sử
dụng dấu vân tay hay âm thanh …của người dùng làm mật khẩu. Do đó mật
kh
ẩu không dễ dàng thay đổi được. Mật khẩu được mã hoã dưới dạng hàm băm
bằng hệ thống PKCs và được lưu ở một nơi khác. Khi người dùng đăng nhập
mật khẩu của người dùng sẽ được so sánh với mật khẩu đã lưu trong cơ sở dữ

liệu thông qua mạng máy tính. Nếu đúng quá trình xác thực thành công. Nó chỉ
- 18 -
được sử dụng ở một ở một số ít hệ thống. Đặc biệt là ở các hệ thống xác thực
của công ty hay tổ chức lớn. Bởi vì phương thức này sử dụng những đặc điểm
nhận dạng sinh học duy nhất mà người dùng có và người dùng biết nên độ an
toàn của hệ thống rất cao. Hình vẽ 1.6 mô tả kiến trúc của một hệ thống xác thực
người dùng dựa theo nhân trắc quan.
Trên thực tế, đôi khi phải kết hợp nhiều phương pháp xác thực để đảm bảo
tính an toàn đến một mức độ nào đó, bởi mỗi phương pháp xác thực đều có
những ưu và nhược điểm riêng xét cụ thể như sau:
+ Xác thực bằng mật khẩu có nhược điểm lớn nhất là người dùng thường
chọn mật khẩu dễ
nhớ, do vậy dễ đoán, nên dễ bị tấn công.
+ Phương pháp nhận dạng sinh học thì đòi hỏi phải dựa trên hạ tầng thông
tin tốt.
Các số đo sinh học cung cấp sự đảm bảo cho nét nhận dạng của người truy
nhập đặt cơ sở trên các đặc trưng số đo vật lý, hình dáng và nhận dạng. Các số
đo sinh học thường được dùng kết hợp với các nguyên lý xác th
ực khác để đem
đến một mức đảm bảo lớn hơn cho nhận dạng của người truy nhập. Ví dụ, một
hệ thống xác thực việc vào một tòa nhà, yêu cầu người làm ấn ngón tay cái lên
mặt kính, chuyển sổ lao động qua khe và nhập PIN. Sau đây là danh sách các số
đo vật lý theo thứ tự hiệu quả giảm dần:
+ Retina pattern (Mẫu võng mạc): Thiết bị dò mẫu duy nhất của mạch máu
trong mô võng mạ
c một người để xác định nét nhận dạng của người đó.
+ Fingerprint (Dấu ngón tay, dấu điểm chỉ): Thiết bị sử dụng mẫu duy nhất
của vân ngón tay để kiểm tra nét nhận dạng của người đó.
+ Handprint (Dạng bàn tay): Thiết bị kiểm tra các số đo hình học duy nhất
của bàn tay người để xác định nét nhận dạng của người đó.

+ Voice pattern (Mẫu giọng nói): Thi
ết bị khai thác mẫu phát âm, giọng
nói, ngữ âm hoặc ngôn ngữ của tiếng nói của một người để kiểm tra nét nhận
dạng của người đó.
+ Signature (Chữ ký): Thiết bị kiểm tra mẫu duy nhất và các đặc trưng của
chữ ký bằng tay của một người để xác định nét nhận dạng của người đó.
- 19 -
Trong các số đo sinh học được nêu trên thì giải pháp xác thực mới được
đưa ra để áp dụng cho Ngân Hàng Công Thương Việt Nam là phương pháp xác
thực vân tay.
- Các phương thức sinh trắc nhận dạng vân tay:
Đối sánh 1:1: Xác định “Một người có đúng là anh ta hay không” bằng
cách đối sánh vân tay của một người với vân tay lưu trữ tương ứng của người đó
trong Cơ sở dữ liệu để xác định nhân thân của người đó so vớ
i hồ sơ lưu trong
Cơ sở dữ liệu.
Đối sánh tra cứu 1:N: Tìm kiếm bằng cách đối sánh vân tay của một người
với các vân tay lưu trữ trong Cơ sở dữ liệu vân tay để xác định được danh sách
những người giống nhất với người cần xác định nhân thân.

- 20 -
CHƯƠNG II: XÁC THỰC VÂN TAY
2.1. Sự cần thiết của xác thực bằng sinh trắc
Xác thực sinh trắc đề cập đến việc sử dụng các đặc tính hành vi và thể chất
(ví dụ: vân tay, gương mặt, giọng nói…) có tính chất khác biệt để xác thực một
người một cách tự động.
Trong các tổ chức, cơ sở hành chính, khoa học…luôn có nhu cầu kiểm tra
và trả lời các câu hỏi: “một người có được quyề
n vào và sử dụng các thiết bị hay
không”, “một cá nhân có quyền truy cập thông tin mật”…

Người ta nhận thấy các đặc trưng sinh trắc không thể dễ dàng bị thay thế,
chia sẻ hay giả mạo. . , chúng được xem là đáng tin cậy hơn trong nhận dạng
một người so với các phương pháp dựa vào thẻ bài truyền thống (ví dụ dùng
chìa khóa…), phương pháp dựa vào trí thức (ví dụ dùng mật khẩu).
Xác thực sinh trắc ngày càng cung cấp mức độ an toàn cao h
ơn, tính hiệu
quả cao hơn, và càng thuận tiện cho người dùng. Vì vậy, các hệ thống sinh trắc
đang được triển khai và thử nghiệm ngày càng nhiều trong các khu vực quản lý
thuộc chính phủ (chứng minh thư, bằng lái xe…), khu vực dân sinh (thẻ thông
minh, đăng nhập mạng máy tính, …).
Nhiều công nghệ sinh trắc đã và đang được phát triển, một số chúng đang
được sử dụng trong các ứng dụng thực tế. Các đặc trưng sinh trắ
c thường được
sử dụng là vân tay, gương mặt, mống mắt, tiếng nói. Mỗi đặc trưng sinh trắc có
điểm mạnh và điểm yếu riêng, nên việc sử dụng đặc trưng sinh trắc cụ thể là tùy
thuộc vào yêu cầu của mỗi ứng dụng nhất định. Các đặc trưng sinh trắc có thể
được so sánh dựa vào các yếu tố sau: tính phổ biến, tính phân biệt, tính ổn định,
tính thu thậ
p, hiệu quả, tính chấp nhận. Vân tay - được biết tới với tính phân biệt
(tính chất cá nhân) và ổn định theo thời gian là đặc trưng sinh trắc được sử dụng
rộng rãi nhất.
2.2. Lịch sử của vân tay
Trên các mẫu khảo cổ học và các mẫu vật lịch sử, người ta đã tìm thấy
nhiều mẫu vân tay. Điều này cung cấp bằng chứng rõ ràng là người xưa đã nhận
ra tính cá nhân của vân tay, nh
ưng không xuất hiện bất kì cơ sở khoa học nào.
- 21 -
Mãi đến thế kỉ 16 các kĩ thuật vân tay khoa học hiện đại mới xuất hiện và từ đó
các lí thuyết và chương trình mô tả, xác thực vân tay mới phát triển mau chóng:



Hình 2.1: Một số bằng chứng vân tay tìm được thời xưa

Năm 1964:Nehemiah Grew nhà sinh thái học thực vật xuất bản những trang
sách đầu tiên các nghiên cứu có tính hệ thống của ông về vân tay.
Năm 1788: Mayer đã mô tả chi tiết thông tin giải phẫu của vân tay
để đặc
tính hóa, nhận dạng các đặc tính vân tay.
Năm 1809, Thomas Bewick bắt đầu sử dụng vân tay của mình như là biểu
tượng đăng kí thương mại – đã tạo ra một cột mốc quan trọng trong nghiên cứu
khoa học về nhận dạng vân tay.
Năm 1880: Henrry Fauld đã đưa ra giả thuyết khoa học khẳng định tính cá
nhân của vân tay dựa vào các nhận thức kinh nghiệm.
- 22 -
Năm 1888, Ngài Francis Galton giới thiệu các đặc trưng chi tiết phục vụ
cho đối sánh vân tay.
Đầu thế kỉ 20, cấu trúc của vân tay mới được mô tả một cách khá đầy đủ.
Các nguyên lý sinh học của vân tay được tổng kết như sau:
a. Biểu bì vân có các đặc tính khác nhau trên các vân tay khác nhau.
b. Cấu hình vân tay có sự thay đổi trên từng cá nhân, nhưng sự thay đổi nhỏ
này vẫn cho phép phân loại một cách có hệ thống các vân tay.
c. Các chi tiết và cấu hình của mỗi đường vân là ổn
định và không thay đổi.
Nguyên lý a) là cơ sở cho nhận dạng vân tay, nguyên lý b) là cơ sở để tiến
hành phân loại vân tay.
Cũng từ đầu thế kỉ 20, nhận dạng vân tay chính thức được chấp nhận như
một phương pháp nhận dạng cá nhân có giá trị và trở thành chuẩn trong pháp
luật. Ví dụ, năm 1924 FBI đã thiết lập một cơ sở dữ liệu có 810000 thẻ vân tay.
Phân loại vân tay
.

Dấu vân tay được sử dụng rộng rãi để nhận dạng cá nhân, để hội chẩn
những chứng bệnh do di truyền và phát hiện tiềm năng của con người. Ở Mỹ có
nhiều hệ thống phân loại và xử lí thông tin vân tay. Tuy nhiên, có thể phân loại
vân tay theo ba kiểu chính: xoáy tròn, móc và vòm. Ngoài ra, mỗi kiểu còn được
phân theo độ nghiêng: 0, 45, 90 và 135 độ.


Vân xoáy Xoáy đồng tâm Xoáy ốc Vân xoáy đôi


Vân xoáy dài Vân xoáy v
ỡ Vân xoáy mắt tròn
- 23 -

Vân móc Vân móc đôi Vân móc ngược Vân móc xuôi

Vân móc bẹp

Vân sóng Vân sóng thần Vân móc liên sóng Vân sóng cồn
Hình 2.2: Một số mẫu vân tay
Việc sử dụng dấu vân tay để nhận dạng được áp dụng rộng rãi trong đời
sống của các nước công nghiệp phát triển. Dấu vân tay không những được sử
dụng trong lĩnh vực hình sự mà còn được sử dụng trong việc xác nhận nhân thân
của cá nhân khi truy cập mạng hoặ
c mở khoá; một số ngân hàng đã bắt đầu
thanh toán thẻ ATM sử dụng máy đọc vân tay.
2.3. Phân tích và biểu diễn vân tay
2.3.1. Phân tích cấu trúc vân tay
Khi ấn ngón tay vào một bề mặt trơn, một vân tay được sao chép lại từ lớp
biểu bì da. Cấu trúc dễ nhận thấy nhất của vân tay là các vân lồi và vân lõm;

trong ảnh vân tay, vân lồi có màu tối trong khi vân lõm có màu sáng. Vân lồi có
độ rộng từ 100
μ
m đến 300
μ
m. Độ rộng của một cặp vân lỗi lõm cạnh nhau là
500
μ
m. Các chấn thương như bỏng nhẹ, mòn da. . không ảnh hưởng đến cấu
trúc bên dưới của vân, khi da mọc lại sẽ khôi phục lại đúng cấu trúc này.
- 24 -
Vân lồi và vân lõm thường chạy song song với nhau; chúng có thể rẽ thành
hai nhánh, hoặc kết thúc. Ở mức độ tổng thể, các mẫu vân tay thể hiện các vùng
vân khác nhau mà ở đó các đường vân có hình dạng khác biệt. Những vùng này
(gọi là các vùng đơn) có thể được phân loại thành các dạng: loop, delta và whorl
và được kí hiệu tương ứng là

,
Δ
,
Ω
. Vùng whorl có thể được mô tả bởi hai
vùng loop đối diện nhau.
Vài thuật toán đối sánh vân tay căn lề ảnh vân tay theo một điểm trung tâm
gọi là điểm nhân. Henrry (1900) đã định nghĩa điểm nhân là “điểm nằm về phía
bắc nhất của đường vân nằm trong cùng nhất”. Thực tế, điểm nhân là điểm trung
tâm của vùng loop nằm về phía bắc nhất. Nếu vân tay không chứa các vùng loop
hay whorl thì điểm nhân là
điểm mà tại đó độ cong của đường vân là lớn nhất.
Định nghĩa các vùng đơn thường được sử dụng để phân loại vân tay, với

mục đích làm đơn giản hóa các quá trình tìm kiếm.
Ở mức độ cục bộ, chúng ta tìm kiếm các đặc tính quan trọng, gọi là các chi
tiết. Các chi tiết mô tả cách mà các vân bị đứt quãng. Ví dụ vân có thể đi tới
điểm kết thúc, hay rẽ thành hai nhánh…. Ngài Francis Galton (1822-1911) là
người đầ
u tiên phân loại chi tiết và khẳng định chúng không thay đổi trong suốt
cuộc đời một cá nhân. Viện các chuẩn quốc gia Mĩ đề nghị phân loại chi tiết
theo bốn loại gồm: điểm kết thúc, điểm rẽ hai, điểm rẽ ba, và điểm không xác
định. Trong khi đó mô hình chi tiết của cục điều tra liên bang Mĩ chỉ có hai loại
chi tiết là điểm kết thúc và điểm rẽ hai. Mỗ
i chi tiết được đặc trưng bởi phân lớp,
hệ tọa độ xy, góc tạo bởi tiếp tuyến của đường vân tại chi tiết và trục ngang.
Trong các ảnh vân tay, các điểm kết thúc và rẽ hai có thể tráo đổi cho nhau
và ở cùng vị trí, ở ảnh âm bản điểm kết thúc xuất hiện như là điểm rẽ hai và
ngược lại.
Ở các ảnh vân tay có độ phân giải cao (trên 1000dpi), chúng ta có thể xác
định đượ
c các lỗ chân lông (kích thước từ 60
μ
m. đến 250
μ
m). Thông tin của lỗ
chân lông (số lượng, vị trí, hình dạng) có sự khác biệt rất cao, nhưng ít kĩ thuật
đối sánh sử dụng các lỗ chân lông bởi vì để xử lý hình ảnh các lỗ chân lông đòi
hỏi các ảnh có độ phân giải cao và chất lượng tốt.

- 25 -
2.3.2. Biểu diễn hình ảnh vân tay
Hầu hết các thuật toán phân loại và nhận dạng vân tay yêu cầu giai đoạn
trích chọn đặc trưng để xác định các đặc trưng nổi bật.

Hình ảnh vân tay thường được biểu diễn như là một bề mặt hai chiều. Kí
hiệu I là ảnh vân tay cấp xám với cấp xám g. I[x, y] là cấp xám của điểm ảnh [x,
y]. Kí hiệu z = S (x, y) là bề mặt rời rạc tương ứ
ng với ảnh I: S (x, y) = I[x, y].
Bằng cách chọn các điểm ảnh màu sáng có cấp xám là 0, và các điểm ảnh có
màu tối có cấp xám là g-1, thì các đường vân (xuất hiện có màu tối trong I)
tương ứng với bề mặt vân lồi còn khoảng không gian giữa các vân lồi (có màu
sáng) tương ứng là bề mặt vân lõm.

Hình 2. 3: Bề mặt S của một vùng vân tay.
2.3.3. Các hệ thống xác thực
Một hệ thống sinh trắc cơ bản là một hệ thống nh
ận dạng mẫu để nhận ra
một người bằng cách quyết định tính xác thực của một đặc tính sinh học hay
hành vi thuộc về người đó. Trong thiết kế một hệ thống sinh trắc, một vấn đề
quan trọng đặt ra là xác định cách một người được nhận dạng. Một hệ thống sinh
trắc có thể là một hệ thống kiểm tra hay một hệ thố
ng nhận dạng.
+ Hệ thống kiểm tra: là hệ thống xác thực một người bằng cách so sánh đặc
tính sinh trắc của người này với mẫu sinh trắc của chính người đó đã được lưu
trữ trước trong hệ thống.
- 26 -
+ Hệ thống nhận dạng: là hệ thống xác thực một cá nhân bằng cách tìm
kiếm và đối sánh đặc tính sinh trắc của người này với toàn bộ các mẫu sinh trắc
được lưu giữ trong cơ sở dữ liệu.
Ngoài ra một hệ thống sinh trắc có thể được phân loại theo một số đặc tính
của ứng dụng:
+ Phối hợp hoặc không phối hợp: đề cập đến hành vi củ
a kẻ giả mạo tương
tác với hệ thống. Ví dụ ở ngân hàng điện tử, là trường hợp có phối hợp kẻ mạo

danh phải đăng nhập hệ thống để sử dụng tài khoản, còn ở hệ thống không phối
hợp trong kiểm tra hộ chiếu đi máy bay, những kẻ khủng bố có thể bị phát hiện
khi sử dụng hộ chiếu.
+ Công khai và bí mậ
t: hệ thống là công khai nếu người sử dụng biết mình
đang được xác thực bởi hệ thống, còn khi người sử dụng không biết mình đang
được xác thực bởi hệ thống thì hệ thống là bí mật.
+ Thường xuyên và không thường xuyên: chỉ mức độ thường xuyên mà
người dùng sử dụng hệ thống sinh trắc. Ví dụ, ứng dụng đăng nhập máy tính là
một hệ thống sinh trắc thường xuyên bở
i vì ứng dụng này được sử dụng đều đặn,
còn ứng dụng làm bằng lái xe là hệ thống không thường xuyên do mỗi bằng lái
xe chỉ được làm mới sau vài năm.
+ Được thực hiện bởi con người và được thực hiện tự động: nếu được thực
hiện bởi con người thì dữ liệu sinh trắc sẽ được thu thập khi có sự hướng dẫn,
quản lý bởi một ngườ
i.
+ Môi trường điều hành chuẩn hay phi chuẩn: Môi trường điều hành là
chuẩn nếu hệ thống được hoạt động trong môi trường được điều khiển (các yếu
tố nhiệt độ, độ ẩm…).
+ Là ứng dụng công cộng hay ứng dụng kín: nếu là ứng dụng kín thì người
sử dụng hệ thống sinh trắc là khách hàng hay nhân viên của tổ chức triển khai hệ
thống.
+ Ứ
ng dụng mở và ứng dụng đóng: Ứng dụng mở sử dụng chung các mẫu
sinh trắc của một người với các ứng dụng khác, còn ứng dụng đóng phải sử
dụng các mẫu sinh trắc thích hợp dành riêng.

- 27 -
2.3.4. So sánh các đặc trưng sinh trắc

Một đặc tính sinh học hoặc hành vi của con người có thể được sử dụng như
là một đặc trưng sinh trắc trong nhận dạng một người nếu nó có các yêu cầu sau:
+ Tính phổ biến: mọi người đều có đặc trưng sinh trắc này.
+ Tính phân biệt: hai người khác nhau thì đặc trưng sinh trắc này phải khác
nhau.
+ Tính ổn định: đặc trưng sinh trắc này không thay đổi theo từng giai đoạn
thời gian (tương ứng với hạng mục đối sánh nhất định).
+ Tính thu thập: nghĩa là đặc trưng này có thể đo được và lượng hóa.
+ Hiệu năng: khả năng nhận dạng chính xác, tốc độ nhận dạng; các tài
nguyên cần thiết để đạt được tốc độ và độ chính xác mong muốn; các nhân tố
môi trường và hoạt động ảnh hưởng đến tốc độ và độ chính xác trong nhận dạng.
+ Tính chấp nhận: mọi người vui lòng chấp nhận các đặc trưng sinh trắc
trong đời sống hàng ngày của họ.
+ Khả năng phá hoại: là mức độ khó hay dễ để đánh lừa hệ thống bởi các
phương pháp lừa dố.
Sau đây là một số đặc trưng sinh trắc thông dụng: DNA, tai, mặt, dáng đi,
đồ hình bàn tay và ngón tay, mống mắt….

Hình 2.4: Một số đặc trưng sinh trắc: a) gương mặt, b) vân tay, c)
đồ
hình bàn tay, d) Mống mắt, e) võng mạc f) chữ kí, g) tiếng nói.
- 28 -
Một số đặc tính của vân tay
+ Tính ổn định vĩnh viễn và tính cá thể của vân tay là những cơ sở nền tảng
cho bộ môn khoa học nghiên cứu về sinh trắc nhận dạng vân tay.
+ Tính ổn định: Các vân tay (Fingerprint ridges) được hình thành khi thai
nhi đạt tới tháng thứ ba hoặc thứ tư. Các vân tay bao gồm các đặc trưng cá nhân,
trong đó bao gồm các điểm kết của các đường nổi (ridge endings), các điểm
phân nhánh (bifurcations) và các chấm (dots). Sau khi sinh ra, các vân tay của
trẻ sơ sinh phát triển dần đều về mọi hướng và vẫn giữ nguyên tỷ lệ quan hệ

giữa các điểm đặc trưng cá nhân không đổi trong suốt cuộc đời.
+ Hầu như tất cả mọi người đều có vân tay: Về nguyên tắc thì tất cả mọi
người đều có vân tay. Đôi khi do bệnh về da một số người có thể mất vân tay
vĩnh viễn hoặc trong một th
ời gian (do kỳ xoá hoặc bị trày da) và bởi vậy có thể
không nhận dạng được bằng vân tay. Tỷ lệ này thường chỉ ở mức từ khoảng 1-
5% tổng số dân tuỳ thuộc vào thiết bị lấy vân tay, phần mềm phân tích nhận
dạng vân tay và trình độ nghiệp vụ của cán bộ phân tích.
Đặc trưng của vân tay (minutia) là các điểm kết và các điểm phân nhánh
của các đường vân nổi (ridges) của vân tay. Đó là các đặ
c điểm biểu thị tính
“riêng nhất cá thể” ("uniqueness").
2.3.5. Các loại lỗi của hệ thống sinh trắc
Đối sánh trong một hệ thống nhận dạng vân tay dựa vào điểm đối sánh s
(không mất tính tổng quát, chúng ta giả sử giá trị của điểm này nằm trong [0,
1]). Điểm đối sánh được dùng để lượng hóa độ tương tự giữa biểu diễn của đầu
vào và biểu diễn củ
a mẫu cơ sở dữ liệu. Điểm này càng có giá trị gần 1 thì khả
năng cả hai vân tay đều của cùng một ngón tay càng cao, ngược lại điểm này
càng có giá trị gần 0 thì khả năng hai vân tay là của hai ngón tay khác nhau càng
lớn.
Quyết định của hệ thống được điều khiển bởi ngưỡng t. Với điểm s của hai
vân tay:
+ nếu s

t: kết luận là cặp so khớp (nghĩa là hai vân tay của cùng một ngón
tay).
- 29 -
+ nếu s


t: kết luận là cặp không so khớp (nghĩa là hai vân tay đến từ hai
ngón tay khác nhau).
Một hệ thống kiểm tra chấp nhận hai lỗi sau đây:
+ Kiểm tra các số đo sinh trắc từ hai ngón tay khác nhau với kết quả là của
cùng một ngón tay (ta gọi là so khớp sai).
+ Kiểm tra các số đo sinh trắc của cùng một ngón tay với kết quả là của hai
ngón tay khác nhau (ta gọi là không - so khớp sai).
Hai lỗi trên tương ứng còn được gọi là chấp nhận sai
và từ chối sa. Bởi vì
kẻ giả mạo có thể được chấp nhận sử dụng thiết bị hay hệ thống…nếu có sự so
khớp sai, và người có đủ thẩm quyền đăng nhập, sử dụng thiết bị hay hệ thống
lại bị từ chối nếu xảy ra sự không so khớp sa. Chúng ta lượng hóa hai lỗi trên
bằng các đại lượng: tỉ lệ chấ
p nhận sai và tỉ lệ từ chối sai.
Chúng ta sẽ đi sâu hơn vào các lỗi trong những hệ thống kiểm tra và trong
các hệ thống nhận dạng.
2.3.6. Các lỗi của hệ thống kiểm tra
Kí hiệu T là mẫu sinh trắc của một người đã được lưu trữ, I là biểu diễn
sinh trắc đầu vào cần được kiểm tra. Các giả thuyết đặt ra là:
+ H
0
: I

T, đầu vào và mẫu không của cùng một người.
+ H
1
: I = T, đầu vào và mẫu của cùng một người.
Tương ứng với các giả thuyết là các kết luận:
+ D
0

: người nay không có mẫu sinh trắc được lưu trữ trong hệ thống.
+ D
1
: người này đã có mẫu sinh trắc được lưu trữ trong cơ sở dữ liệu.
Đối sánh trong kiểm tra T và I sử dụng độ tương tự s (T, I). Nếu s nhỏ hơn
ngưỡng t thì kết quả là D
0
, nếu s lớn hơn hoặc bằng ngưỡng t thì cho kết luận
D
1
.
Từ các giả thuyết trên, chúng ta định nghĩa hai loại lỗi trong một hệ thống
kiểm tra:
+ Dạng I: đối sánh sai (kết luận là D
1
khi H
0
đúng)
+ Dạng II: không-đối sánh sai (kết luận là D
0
khi H
1
đúng)
- 30 -
Khi đó, tỉ lệ đối sánh sai (FMR) là xác suất của lỗi loại I, tỉ lệ không đối
sánh sai (FNMR) là xác suất của lỗi loại II:
+ FMR = P (D
1
| H
0

đúng).
+ FNMR = P (D
0
| H
1
đúng).
Để đánh giá tính chính xác của một hệ thống sinh trắc chúng ta phải thống
kê các điểm đối sánh s của các cặp vân tay của cùng một ngón tay (phân bố p
(s|H
1
đúng)-thường được gọi là phân bố chân chính) và điểm đối sánh s của các
cặp vân tay từ hai ngón tay khác nhau (phân bố p (s|H
0
sai)-thường được gọi là
phân bố giả mạo).
+ FNMR =
0
t

p (s|H
1
đúng)ds.
+ FMR =
1
t

p (s | H
0
đúng)ds.


Hình 2.5: FMR và FNMR với một ngưỡng t thể hiện phân bố chân
chính và phân bố giả mạo.
Trong hình vẽ FMR là phần trăm các cặp giả mạo có điểm đối sánh lớn hơn
hay bằng t và FNMR là phần trăm các cặp chân chính có điểm đối sánh nhỏ hơn
t.
- 31 -
Thực tế, cả FMR và FNMR đều là hàm của ngưỡng hệ thống t nên chúng ta
có thể viết chúng là FMR (t) và FNMR (t). Nếu t giảm thì hệ thống sẽ bỏ qua
nhiều lỗi và FMR (t) sẽ tăng, ngược lại khi tăng t để cho hệ thống an toàn hơn
thì FNMR (t) sẽ tăng tương ứng. Người thiết kế hệ thống kiểm tra thường không
biết trước hệ thống của mình sẽ ứng dụng ở lĩ
nh vực nào, vì vậy họ báo cáo hiệu
năng hệ thống ở tất cả các điểm hoạt động (ngưỡng t) bằng cách xây dựng
đường cong đặc tính hoạt động. Đường cong này biểu diễn các giá trị FNMR và
FMR ở theo ngưỡng hệ thống t.
Bên cạnh các phân bố và đồ thị trên, một vài chỉ số khác được dùng để
đánh giá tính chính xác của một hệ thống kiểm tra.
+ Tỉ lệ lỗi cân bằ
ng (EER): là tỉ lệ lỗi tại ngưỡng t mà FMR (t) = FNMR (t).
Trong thực tế, do chúng ta có một số hữu hạn các cặp vân để so sánh và do sự
lượng tự hóa giá trị nên EER không tồn tạ. Vì vậy thay vì đưa ra một giá trị đơn
duy nhất, người ta đưa ra một khoảng. Mặc dù EER là một chỉ số quan trọng,
nhưng các hệ thống kiểm tra vân tay ít khi hoạt động ở ngưỡng tương ứng với
EER mà hoạt động
ở các ngưỡng có FMR thấp.
+ ZeroFNMR là giá trị FMR nhỏ nhất mà tại đó không xảy ra không-đối
sánh sai.
+ ZeroFMR là giá trị FNMR nhỏ nhất mà tại đó không xảy ra đối sánh sai.
+ Tỉ lệ thất bại trong thu thập (FTC): là tỉ lệ phần trăm mà thiết bị không
thể tự động thu thập đặc trưng sinh trắc khi đặc trưng sinh trắc được đưa vào bộ

cảm biến.
+ Tỉ lệ thất bại trong ki
ểm tra (FTE) là tỉ lệ phần trăm mà người dùng
không được xử lý bởi hệ thống.
+ Tỉ lệ thất bại trong đối sánh (FTM) là tỉ lệ biểu diễn đầu vào không thể
được xử lý hoặc đối sánh với một mẫu sinh trắc có giá trị, bởi các biểu diễn sinh
trắc không đủ chất lượng.
- 32 -

Hình 2.6: Đánh giá thuật toán kiểm tra vân tay trong cuộc thi nhận
dạng vân tay 2002 (FVC2002) a) các phân bố chân chính và giả mạo được
tính trên 2800 cặp chân chính và 4950 cặp giả mạo b)FMR (t) và FNMR (t)
được tính từ các phân bố ở a. c) đường cong ROC dẫn xuất từ FMR (t) và
FNMR (t) ở b).



Hình 2.7: Một ví dụ của đồ thị FMR (t) và FNMR (t), với các điểm
tương ứng là EER, ZeroFNMR và ZeroFMR.
error
FMR (t) FNMR (t)
ZeroFNMR
ZeroFMR EER

×