Tải bản đầy đủ (.docx) (60 trang)

Báo cáo đồ án tốt nghiệp nhận dạng vân tay bằng ảnh số theo hướng có thể triển khai trong dân sự

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.79 MB, 60 trang )

1
MỤC LỤC

2
DANH MỤC CÁC HÌNH VẼ
3
BẢNG CÁC THUẬT NGỮ THƯỜNG DÙNG TRONG NHẬN DẠNG
VÂN TAY
Thuật ngữ Ý nghĩa
Ridge Đường vân tay trên ngón tay người
Vallay Đường rãnh xen kẽ hai đường vân tay
Singular
Điểm kỳ dị của vân tay trên ngón tay người, mang đặc
điểm phân loại
Core
Điểm “tâm” của vân tay, là một trong những điểm
singular
Minutiae Điểm đặc trưng của vân tay trên ngón tay con người
Termination
Điểm kết thúc của đường vân, một loại minutiae quan
trọng
Bifurcation
Điểm trẽ ba của đường vân, là một loại minutiae quan
trong
Sweat pores
Vòng xuyến xếp liên tiếp tạo thành đường vân (thường
quan sát được khi ảnh vân tay ở độ phân giải cao: >
1000dpi)
Orientation Image
Hình ảnh thể hiện các định hướng cục bộ của các
đường vân tay, bao gồm nhiều phần tử [0, ] tại các điểm


[i,j].
Direction Image Tương tự như Orientation Image nhưng [0,2 ].
Segmentation
Phân định giữa vùng ảnh thể hiện đường vân và vùng
ảnh nền
Varance field Một các thể hiện vùng ảnh thể hiện đường vân còn thô
Crossing number Một phương pháp dùng để phát hiện minutiae.
Poincare
Một phương pháp dùng để phát hiện core theo trường
vec-tơ và đường bao.
Ridge map
Ảnh đen trắng chỉ thể hiện các đường vân màu trắng
nhưng không nhất thiết các đường vân có độ rộng đồng
đều.
Thinned ridge map
Ảnh đen trắng thể hiện các đường vân màu trắng nhưng
nhất thiết các đường vân có độ rộng đồng đều 1pixel
4
MỞ ĐẦU
Với nhu cầu cấp bách đối với bảo mật cao ngày càng tăng, sinh trắc học
đã được nhắm vào để tạo ra một phương pháp nhận dạng cho thế hệ tiếp nối.
Trong số hàng loạt công nghệ sinh trắc học, nhận dạng vân tay được sử dụng
thời gian sớm nhất và mang đến nhiều cơ hội hơn là sử dụng những công nghệ
sinh trắc học khác.
Nhận dạng vân tay có thể là phương pháp phức tạp nhất của tất cả công nghệ
sinh trắc và được xác nhận qua nhiều ứng dụng. Nhận dạng vân tay đã chứng
thực một cách đặc biệt về tính hiệu quả cao của nó và là công nghệ được đề cao
xa hơn nữa trong ngành điều tra tội phạm hơn một thế kỷ.
Thậm chí như dáng đi con người, gương mặt, hoặc chữ ký có thể thay đổi
với thời gian và có thể được làm giả hoặc mô phỏng theo. Tuy nhiên,vân tay là

duy nhất hoàn hảo theo từng riêng lẻ và cố định không thay đổi theo thời gian.
Tính riêng biệt này đã minh chứng rằng nhận dạng vân tay là chính xác và hiệu
quả hơn các phương pháp nhận dạng khác.
5
Ngoài ra, vân tay có thể được chụp ảnh lại và được số hóa bằng những thiết
bị giá thành thấp và nén một cách hiệu quả nên chỉ mất một dung lượng nhỏ để
lưu trữ một lượng dữ liệu lớn của thông tin. Với những sức mạnh này, nhận
dạng vân tay là một phần chủ yếu trên thị trường an ninh và tiếp tục cạnh tranh
hơn những cái khác trên khắp thế giới ngày nay.
Đồ án này sẽ thực hiện nhận dạng vân tay bằng ảnh số theo hướng có thể
triển khai trong dân sự. Chính vì vây phương pháp nhận dạng là dựa trên cơ sở
phát hiện và sử dụng các điểm nút đặc trưng (gọi là minutiae). Đó là các ảnh số
vân tay lấy trong FVC2000(một bộ dữ liệu chuẩn quốc tế xây dựng bởi phòng
thí nghiêm hệ thống sinh trắc, đại học Bologna).Sử dụng các điểm minutea đã
trích chọn bước trước để đối sánh nhận dạng vân tay.
Đề tài trình bày theo cấu trúc:
Chương 1: Vân tay trong sinh trắc học.
Chương 2: Đại cương về ảnh và xử lý ảnh trong Matlab.
Chương 3: Thiết kế hệ thống nhận dạng vân tay.
Chương 4: Xây dựng chương trình và kết quả thực nghiệm.
Do đồ án có tính chất mới, trong quá trình làm đồ án em đã gặp rất nhiều
khó khăn. Được sự giúp đỡ, chỉ bảo tận tình của TS. em đã dần dần tiếp cận
được tới lĩnh vực này và bước đầu đã đạt được một số các kết quả. Sau thời gian
khẩn trương thực hiện đồ án đã được hoàn thành đúng kế hoạch. Em mong
những thiếu sót của em trong đồ án sẽ nhận được những ý kiến đóng góp quý
báu của các thầy, cô cùng các bạn sinh viên.
Em xin chân thành cảm ơn
6
Chương 1
VÂN TAY TRONG SINH TRẮC HỌC

Công nghệ sinh trắc học được áp dụng phổ biến và lâu đời nhất là công nghệ
nhận dạng vân tay. Dấu vân tay là một đặc điểm quan trọng để phân biệt giữa
người này và người khác. Sự phát triển của công nghệ thông tin có thể giúp thu
nhận và ghi nhớ được hàng triệu ghi chép dưới dạng số hoá. Nguyên lý hoạt
động của công nghệ nhận dạng vân tay: Khi đặt ngón tay lên trên một thiết bị
nhận dạng dấu vân tay, ngay lập tức thiết bị này sẽ quét hình ảnh ngón tay đó và
đối chiếu các đặc điểm của ngón tay đó với dữ liệu đã được lưu trữ trong hệ
thống. Quá trình xử lý dữ liệu sẽ được thiết bị chuyển sang các dữ liệu số và ra
thông báo rằng dấu vân tay đó là hợp lệ hay không hợp lệ để cho phép hệ thống
thực hiện các chức năng tiếp theo.
7
Trong chương này em sẽ trình bày những tiếp cận khởi đầu của quá trình
nhận dạng vân tay như vị trí của nhận dạng vân tay trong sinh trắc học; và
những khó khăn gặp phải khi nhận dạng vân tay.
1.1. Vị trí của nhận dạng vân tay trong sinh trắc học
Công nghệ Sinh trắc học (Biometric) - là một công nghệ sử dụng những
thuộc tính vật lý hoặc các mẫu hành vi, các đặc điểm sinh học đặc trưng như dấu
vân tay, giọng nói, khuôn mặt, dáng đi, để nhận diện con người.
8
Hình vẽ 1.1. Công nghệ sinh trắc học.
Hệ thống sinh trắc học sẽ ghi nhận mẫu vân tay của người dùng và lưu trữ
tất cả những dữ liệu đặc biệt này thành một mẫu nhận diện được số hoá toàn
phần. Có hai phương pháp để lấy dấu vân tay:
Hình vẽ 1.2. Vân tay trong sinh trắc học.
 Cách thứ nhất (cổ điển) là sao chép lại hình dạng vân tay (như lăn tay, hay
chạm vào một vật gì đó) thông qua máy quét ghi nhận và xử lý.
Hình vẽ 1.3. Sao chép lại hình dạng vân tay.
 Cách thứ hai, hiện tại đa số các nước đều sử dụng phần mềm hoặc thiết bị
quét vân tay để nhận dạng vân tay.
9

Hình vẽ 1.4. Sử dụng phần mềm quét vân tay.
Đặc điểm của dấu vân tay dù chỉ gồm có 7 loại (vòng móc đơn, vòng móc
kép, vòng tập trung ở giữa, vòng cung, vòng cung hình lều, vòng xoắn, vòng bất
thường) nhưng thể hiện về chi tiết khác nhau muôn hình muôn vẻ và không thay
đổi từ khi mới sinh ra cho đến khi về già. Khai thác tính độc nhất về cấu tạo
hình dạng vân tay của mỗi người, các nhà sinh trắc học sẽ biến nó thành chiếc
chìa khoá riêng mà chỉ bạn mới có thể sử dụng, giúp bạn tránh được nhiều phiền
toái trong cuộc sống như bị trộm cắp, lạm dụng hoặc giả mạo các loại giấy tờ
tuỳ thân, thẻ ngân hàng, hộ chiếu đảm bảo an ninh và bảo mật.
Việc phân tích dấu vân tay sẽ không hề ảnh hưởng đến quyền lợi cá nhân
của bạn vì công cụ sinh trắc học dấu vân tay được thiết kế để chụp lại vân tay
theo dạng hình ảnh, vì thế sẽ không ảnh hưởng gì đến dấu vân tay của khách
hàng. Việc chấm công, mở két sắt, hộ chiếu, mở tài khoản ngân hàng phải dựa
trên mô hình vân tay thật do cấu tạo da.
Ngành khoa học sinh trắc học dấu vân tay dựa trên những thành tựu khoa
học nghiên cứu về di truyền học, phôi học, sự cấu tạo của vân da tay và não bộ.
Tên gọi khoa học là DERMATOGLYPHICS. Phương pháp sinh trắc học dấu
vân tay phân tích mật độ dày đặc, độ dài – ngắn, các khúc quanh, hình dạng của
vân tay và các năng lực tiềm ẩn của não bộ.
10
Cho tới nay, vẫn chưa có bằng chứng xác thực 100% vân tay trên các ngón
tay tuyệt đối mang tính cá nhân và không hề lặp lại. Câu trả lời chính xác chỉ có
được khi đem so sánh từng mẫu vân tay của mười đầu ngón người với hơn sáu tỉ
người còn lại. Tuy nhiên khi không xét tới phần nhỏ lẻ ấy có thể rút ra một số
tính chất cơ bản của vân tay để nó trở thành phổ biến trong ứng dụng nhận dạng
và định danh con người:
- Tính “phổ thông”, mọi người đều có.
- Tính cá nhân và không lặp lại. Xác suất trùng khớp với người khác gần bằng
không.
- Tính “bất biến”. Hình dạng tổng thể của vân tay trên các ngón tay của con

người không thay đổi theo thời gian. Ngay cả trường hợp bị chấn thưong nhẹ,
dấu vân tay vẫn có khả năng khôi phục lại.
1.2. Khó khăn gặp phải khi nhận dạng vân tay
Do điều kiện thu nhận ảnh quyết định nhiều đến chất lượng ảnh thu thập nên
nhiều khi các chi tiết trên mẫu vân tay không thể hiện rõ ràng. Có thể liệt kê một
số trường hợp dưới đây:
Dry finger (vân tay thu nhận trong điều kiện “khô”): ảnh thu nhận sẽ có
nhiều chỗ đường vân bị mờ đi, đường vân bị lẫn với nền ảnh. Lực ấn của tay nhẹ
hoặc mực in không đủ (với vân tay lăn trên giấy) là các nguyên nhân chính làm
giảm chất lượng ảnh thu thập.
Wet finger (vân tay thu nhận trong điều kiện “ướt”): ảnh thu nhận sẽ có
nhiều chỗ đường vân bị dính liền. Lực ấn của ngón tay quá lớn hoặc mực in quá
nhiều (với vân tay lăn trên giấy) là các nguyên nhân chính tạo nhiễu trong
trường hợp này.
Vân tay thu nhận trong điều kiện bị biến dạng: ảnh thu nhận được có thể thể
hiện rõ nét nhưng các đường vân lại bị bóp méo không còn giống với mẫu thực.
Lực ấn, kéo và xê dịch tay là các nguyên nhân chính.
11
Vân tay thu thập không đầy đủ: ảnh thu thập được chỉ có một phần vân tay
trên ngón tay. Nguyên nhân chính là do ngón tay đặt không đúng vị trí chuẩn thu
thập. Tuy vậy trong thực tế cũng có nhiều mẫu vân tay thu thập trong điều kiện
tốt nên có chất lượng cao.
1.3. Kết luận
Nội dung chính của chương là đề cập một số bộ phận của sinh trắc học
(trong đó có nhận dạng vân tay) và những tính chất gì quyết định vân tay được
ứng dụng nhiều nhất trong sinh trắc học.
Chương 2
ĐẠI CƯƠNG VỀ ẢNH SỐ VÀ XỬ LÝ ẢNH TRONG MATLAB
Đồ án này không xây dựng bộ thu thập mẫu vân tay mà sử dụng bộ mẫu
chuẩn quốc tế FVC2000 do phòng thí nghiệm hệ thống sinh trắc, đại học

Bologna tạo ra. Trong cơ sở dữ liệu ấy, các mẫu được lưu dữ dưới dạng ảnh số.
Bởi vậy, quá trình xử lý tính toán thực hiện đồ án phải làm việc chính với dạng
số liệu đó. Cho nên, trong phần này em sẽ trình bày tóm tắt về ảnh số và một số
thuật toán xử lý ảnh số trong Matlab.
2.1. Khái quát về ảnh số
Ảnh số được tạo nên từ hàng trăm ngàn cho đến hàng triệu ô vuông rất nhỏ
được coi là những thành tố của bức ảnh và thường được biết dưới tên gọi là
pixels. Máy tính hay máy in sử dụng những ô vuông nhỏ này để hiển thị hay in
12
ra bức ảnh. Để làm được điều đó máy tính hay máy in chia màn hình, trang giấy
thành một mạng lưới chứa các ô vuông, sau đó sử dụng các giá trị chứa trong
file ảnh để định ra mầu sắc, độ sáng tối của từng pixel trong mạng lưới đó, ảnh
số được hình thành. Việc kiểm soát, định ra địa chỉ theo mạng lưới như trên
được gọi là bit mapping và ảnh số còn được gọi là ảnh bit-maps.
Hình vẽ 2.1. Ảnh số.
Có thể mường tượng ảnh số giống như bức tranh trên được tạo nên từ vô số
các hạt đậu tương được nhuộm mầu. Mỗi hạt đậu tương có thể coi như một
pixel.
Chất lượng của bức ảnh khi được in hay hiển thị trên màn hình phụ thuộc
một phần vào số lượng các pixels tạo nên bức ảnh (đôi khi được gọi là độ phân
giải-resolution). Số lượng các pixels càng nhiều thì các chi tiết càng được hiển
thị rõ, mức độ sắc nét càng tăng đồng nghĩa với việc độ phân giải cũng lớn hơn.
Nếu phóng đại bức ảnh đủ lớn thì mắt người sẽ nhận ra dược các pixel này .
Kích cỡ của ảnh số có thể được biểu thị theo một trong hai cách sau, theo
chiều dài và chiều rộng tính bằng đơn vị pixel hoặc theo tổng số pixel tạo nên
bức ảnh.
13
Hình vẽ 2.2. Ảnh có kích cỡ 1600 x 1200 pixel.
14
Hình vẽ 2.3. Số lượng pixel có trong bức ảnh sẽ quyết định kích cỡ ảnh, ảnh

hưởng đến độ lớn của file ảnh.
Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc số. Trong phần sẽ tập
trung vào biểu diễn ảnh số, cơ sở về màu và việc chuyển đổi màu.
2.1.1. Biểu diễn ảnh số
Ảnh xám cũng như các ảnh số khác là tập hợp các phần tử ảnh hay còn gọi
là các pixel [i, j]. Ảnh được biểu diễn như một ma trận hai chiều cỡ WxH, hai
thông số này cho biết thông tin về độ rộng và chiều cao ảnh. Giá trị của mỗi
phần tử của ma trận I[i, j] biểu diễn cho mức xám hay cường độ ảnh tại vị trí của
phần tử đó.

a) b)
Hình vẽ 2.4. Biểu diễn ảnh số
a) Hệ trục tọa độ trong Image Processing Toolbox; b) Ma trận biểu diễn ảnh
số.
Một ảnh số a[m, n] được mô tả trong một không gian hai chiều được lấy từ
ảnh thực a(x, y) trong một không gian hai chiều liên tục qua một khâu lấy mẫu
ảnh thường được gọi là số hóa. Tấm hình hai chiều liên tục a(x, y) được chia
thành N hàng và M cột. Giao điểm của một hàng và một cột được gọi là điểm
ảnh. Giá trị được gán cho các tọa độ số nguyên [m, n], với {m = 0, 1, 2, …, M–
1} và {n = 0, 1, 2, …, N–1} là a[m, n]. Thực ra, trong nhiều trường hợp a(x,y)
mà ta có thể coi là tín hiệu vật lý được tiếp nhận ở bề mặt hai chiều của thiết bị
đo lại là một hàm số của nhiều biến bao gồm độ sâu (z), màu (λ), và thời gian
15
(t). Nếu không nói gì thêm, ta sẽ coi các ảnh đều có dạng hai chiều, đơn sắc, và
là ảnh tĩnh.
Hình vẽ 2.5. Số hóa một ảnh liên tục.
Điểm ảnh tại tọa độ [m=10, n=3] có giá trị độ sáng là số nguyên bằng
110.Tùy theo yêu cầu lưu trữ, các pixel sẽ được mã hóa bằng 8-bit, 16-bit,…
tương ứng với ảnh xám 256, 65536 mức. Với ảnh đen trắng, các pixel này được
lưu trữ bằng 1-bit. Cường độ ảnh I chỉ có thể là một trong hai giá trị, I[i, j]

[0,1]. Ứng với giá trị 0 đó là các điểm đen, còn với giá trị 1 đó là điểm trắng.
Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh xám, chỉ khác là các
giá trị tại mỗi phần tử của ma-trận biểu diễn ba màu riêng biệt gồm: đỏ (Red-R),
lục (Green-G) và lam (Blue-B). Để biểu diễn cho ba màu riêng rẽ cần 24-bit, 24-
bit này được chia thành ba khoảng 8-bit. Mỗi khoảng này biểu diễn cho cường
độ sáng của một trong các màu chính.
2.1.2. Cơ sở màu
Ánh sáng màu là tổ hợp các ánh sáng đơn sắc. Mắt người có thể cảm nhận
được một số màu nhất định nhưng lại có thể phân biệt được rất nhiều màu (trong
16
vùng quang nhìn thấy, có dải bước sóng 400nm -750nm). Cảm nhận màu của
con người phụ thuộc vào ba thuộc tính B, H, S.
 B (brightness): độ chói,
 H (hue): sắc lượng,
 S (saturation): độ bão hòa.
Hình vẽ 2.6. Cảm nhận của các tế bào nhạy sáng trong võng mạc mắt với các
màu ánh sáng phụ thuộc vào chiều dài bước sóng ánh sáng.
Các màu gốc có liên quan đến các khái niệm sinh học hơn là vật lý, nó
dựa trên cơ sở phản ứng sinh lý học của mắt người đối với ánh sáng. Mắt người
có các tế bào cảm quang có hình nón nên còn được gọi là tế bào hình nón, các tế
bào này thông thường có phản ứng cực đại với ánh sáng vàng – xanh lá cây (tế
bào hình nón L), xanh lá cây (tế bào hình nón M) và xanh lam (tế bào hình nón
S) tương ứng với các bước sóng khoảng 564 nm, 534 nm và 420 nm. Ví dụ, màu
vàng thấy được khi các tế bào cảm nhận màu xanh ánh vàng được kích thích
nhiều hơn một chút so với tế bào cảm nhận màu xanh lá cây và màu đỏ cảm
nhận được khi các tế bào cảm nhận màu vàng xanh lá cây được kích thích nhiều
hơn so với tế bào cảm nhận màu xanh lá cây. Mặc dù biên độ cực đại của các
phản xạ của các tế bào cảm quang không diễn ra ở các bước sóng của màu “đỏ”,
“xanh lá cây” và “xanh lam”, ba màu này được mô tả như là các màu gốc vì
chúng có thể sử dụng một cách tương đối độc lập để kích thích ba loại tế bào

cảm quang. Để sinh ra khoảng màu tối ưu cho các loài động vật khác, các màu
gốc khác có thể được sử dụng. Với các loài vật có bốn loại tế bào cảm quang,
17
chẳng hạn như nhiều loại chim, người ta có lẽ phải nói là cần tới bốn màu gốc;
cho các loài vật chỉ có hai loại tế bào cảm quang, như phần lớn các loại động vật
có vú, thì chỉ cần hai màu gốc.
Trong võng mạc mắt người có các tế bào cảm thụ hình nón nhạy với ánh
sáng. Có khoảng 6 ,7 triệu tế bào loại này trong mắt, chúng chia làm ba nhóm
nhạy với ba màu ánh sáng khác nhau: 65% tế bào nhạy với ánh sáng đỏ (red),
32% tế bào nhạy với ánh sáng xanh lục (green) và 2% còn lại nhạy với ánh sáng
xanh lơ (blue).
Tổ hợp B, H, S đối với từng ánh sáng màu trong ba màu này giúp mắt con
người có thể phân biệt được hàng ngàn màu. R, G, B còn được gọi là các màu cơ
sở. Phân bổ phổ năng lượng của một nguồn sáng màu có bước sóng l ký hiệu là
C(l) và việc tổ hợp màu theo ba màu cơ sở (có các đường cong cảm nhận , , mô
tả bằng sơ đồ khối sau:
Hình vẽ 2.7. Tổ hợp màu.
Như vậy có thể tổ hợp màu theo phép cộng màu với là hệ số tổ hợp theo
công thức tổng quát sau:
X = R + G + B
Tổ chức quốc tế về chẩn hóa màu CIE đã đưa ra một số không gian màu
như: RGB, CMY, CMYK, HIS,… Trong đó mô hình RGB có vai trò quan
trọng.
18
=
a) b)
Hình vẽ 2.8. Hệ tọa độ màu
a) mô hình màu RGB;b) biểu diễn điểm ảnh trong hệ tọa độ màu RGB.
Mô hình màu RGB sử dụng mô hình bổ sung trong đó ánh sáng đỏ, xanh lá
cây và xanh lam được tổ hợp với nhau theo nhiều phương thức khác nhau để tạo

thành các màu khác. Từ viết tắt RGB trong tiếng Anh có nghĩa là đỏ (red), xanh
lá cây (green) và xanh lam (blue), là ba màu gốc trong các mô hình ánh sáng bổ
sung. Cũng lưu ý rằng mô hình màu RGB tự bản thân nó không định nghĩa thế
nào là “đỏ”, “xanh lá cây” và “xanh lam” một cách chính xác, vì thế với cùng
các giá trị như nhau của RGB có thể mô tả các màu tương đối khác nhau .
RGB là một dạng của tín hiệu thành phần của video, được sử dụng trong ngành
công nghiệp điện tử chế tạo các thiết bị nghe nhìn. Nó gồm có ba tín hiệu – đỏ,
xanh lá cây và xanh lam được truyền đi trong ba dây cáp riêng biệt. Các cáp bổ
sung đôi khi là cần thiết để truyền đi các tín hiệu đồng bộ. Các định dạng tín
hiệu RGB thông thường dựa trên các phiên bản sửa đổi của các tiêu chuẩn RS-
170 và RS-343 cho các thiết bị hiển thị video đơn sắc. Loại hình này của tín hiệu
video được sử dụng rộng rãi ở châu Âu vì nó là tín hiệu có chất lượng tốt nhất
có thể truyền đi trong các bộ kết nối SCART tiêu chuẩn. Ngoài phạm vi châu
Âu, RGB không phải là dạng tín hiệu video phổ biến S-Video chiếm vị trí này
trong phần lớn các khu vực phi Âu châu. Tuy nhiên, phần lớn các màn hình máy
tính trên thế giới sử dụng RGB.
19
2.1.3. Chuyển đổi màu
Hệ tọa độ màu do CIE quy định như một hệ quy chiếu và trên thực tế không
thể biểu diễn hết các màu. Tùy thuộc vào các ứng dụng khác nhau người ta đưa
ra thêm một số hệ tọa độ khác như NTSC, CMY, YIQ phù hợp với yêu cầu
hiển thị màu sắc. Việc chuyển đổi giữa các không gian biểu diễn màu thực hiện
theo nguyên tắc sau:
= A x *
Trong đó:
: Không gian biểu diễn màu ban đầu.
*: Không gian biểu diễn màu mới.
A: Ma trận phép biến đổi.
Ảnh dùng trong đồ án này là ảnh xám. Mức xám là kết quả của sự mã hóa
tương ứng một cường độ sáng của điểm ảnh với một trị số. Giá trị của nó phụ

thuộc vào mức độ lượng tử hóa ảnh, như các ảnh dùng làm cơ sở dữ liệu đã lấy
8-bit để mã hóa ảnh (ứng với 256 mức xám, trong đó mức xám 0 là màu đen,
mức xám 255 là màu trắng). Khi chuyển đổi từ ảnh màu RGB sang ảnh xám có
thể dùng công thức sau:
grayscale = R + G + B
các hệ số lần lượt như dưới đây.
=0,2989;=0,5870;=0,1140
2.2. Xử lý ảnh số trong Matlab
2.2.1. Giới thiệu xử lý ảnh
Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành
khoa học khác. Hiện nay nó đang là một trong những lĩnh vực được quan tâm và
đã trở thành môn học chuyên ngành của sinh viên hệ kỹ sư, cử nhân ngành công
nghệ thông tin.
20
Nhờ có công nghệ số hóa hiện nay, ngày nay con người đã có thể xử lý tín hiệu
nhiều chiều thông qua nhiều hệ thống khác nhau, từ những mạch số đơn giản
cho đến những máy tính song song cao cấp . Mục tiêu của xử lý này có thể chia
làm ba hướng như sau:
- Xử lý ảnh ban đầu để có ảnh mới theo một yêu cầu xác định.
- Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại,
nhận biết ảnh.
- Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn
2.2.2. Giới thiệu Matlab và xử lý ảnh trong Matlab
Matlab là một phần mềm toán học của hãng Mathworks để tính toán trên
các số và có tính trực quan rất cao. Matlab là viết tắt của Matrix Laboratory.
Matlab làm việc chủ yếu với các ma trận. Ma trận cỡ mxn là bảng số chữ nhật
gồm mxn số được sắp xếp thành m hàng và n cột. Trường hợp m=1 hoặc n=1 thì
ma trận trở thành vectơ dòng hoặc cột;trường hợp m=n=1 thì ma trận trở thành
một đại lượng vô hướng. Nói chung,
Matlab có thể làm việc với nhiều kiểu dữ liệu khác nhau. Với xâu chữ

(chuỗi ký tự) Matlab cũng xem là một dãy các ký tự hay là dãy mã số của các ký
tự. Matlab dùng để giải quyết các bài toán về giải tích số, xử lý tín hiệu số, xử lý
đồ họa, … mà không phải lập trình cổ điển. Hiện nay, Matlab có đến hàng ngàn
lệnh và hàm tiện ích. Ngoài các hàm cài sẵn trong chính ngôn ngữ, Matlab còn
có các lệnh và hàm ứng dụng chuyên biệt trong các Toolbox, để mở rộng môi
trường Matlab nhằm giải quyết các bài toán thuộc các phạm trù riêng. Các
Toolbox khá quan trọng và tiện ích cho người dùng như toán sơ cấp, xử lý tín
hiệu số, xử lý ảnh, xử lý âm thanh, ma trận thưa, logic mờ,…Người dùng cũng
có thể tạo nên các hàm phục vụ cho chuyên môn của mình, lưu vào tệp M-file để
dùng về sau.
Cần tính toán bằng công thức thì có thể dùng Toolbox SYMBOLIC. Để
có được f=‘cos(x)’ bằng cách lấy đạo hàm của g=‘sin(x)’ thì dùng lệnh
f=diff(‘sin(x)’). Ngược lại để có g là tích phân bất định của f thì dùng lệnh
21
g=int(f). Matlab còn có giao diện đồ họa khá đẹp mắt và dể sử dụng. Người
dùng có thể tính toán và tạo nên các hình ảnh đồ họa 2, 3 chiều cho trình ứng
dụng của mình. Với các hình ảnh, nếu không chỉ định vè canh trục, phối màu thì
Matlab thực hiện tự động một cách khá phù hợp.
Matlab là một phần mềm được ứng dụng rất nhiều trong toán học cũng
như trong các ngành công nghiệp kỹ thuật. Nếu Maple hay Mupad được xem là
chuyên sâu hơn về nghiên cứu toán học thì Matlab được nhiều công ty kỹ thuật
dùng như một công cụ hỗ trợ phát triển sản phẩm. Một ví dụ nhỏ trong ngành
công nghiệp ô tô, Matlab được dùng để giả lập chuyển động các bộ phận trong
một hệ thống. Sức mạnh của Matlab nằm ở khả năng giải Matrix. Do vậy việc
xử lý ảnh có thể làm bằng Matlab.
Một tấm ảnh được máy tính hiểu như một matrix, gồm chiều dài chiều rộng
là những cột (collum) và hàng (row). Mỗi một pixel của ảnh là một component
trong matrix. Màu sắc của từng pixel được quy định bởi 1 vector gồm 3
component (Red, Green và Blue). Tất cả màu sắc mà ta nhìn thấy đều có thể
dung ba màu cơ bản này kết hợp thành. Đây là hình ảnh với chuẩn màu RGB.

Trong Matlab có sẵn rất nhiều công cụ, lệnh hổ trợ xử lý ảnh. Đã có rất
nhiều tutorial về Matlab. Guide này ko hướng dẫn dùng những lệnh có sẵn hoặc
chuyên sâu mà thông qua edit matrix của ảnh để tạo ra effect. Thời gian đầu khi
làm project nhỏ này N luôn thấy thừa thãi vì tốn nhiều thời gian. Nhưng Project
giúp N hiểu rõ hơn về cách hoạt động những phần mềm xử lý ảnh, về matrix, về
cấu tạo ảnh. Điều đó cũng như người Đức nói “Horizont erweitern”.
Nhiều Toolbox hỗ trợ các ứng dụng chuyên sâu. Với bài toán nhận dạng
hình ảnh, các Toolbox thường được sử dụng gồm:
• Image Processing Toolbox
• Image Acqusition Toolbox
• Wavelet Toolbox
• Signal Processing
• Statistics Toolbox
• Neural Network Toobox
22
Các thuật toán xử lý trong đồ án đều được viết bằng ngôn ngữ lập trình phần
mềm Matlab. Các chương trình có sử dụng một một số thư viện của Matlab. Sau
đây là một số công cụ xử lý và thuật toán xử lý ảnh chính được ứng dụng trong
đồ án.
2.2.1. Histogram
Histogram (lược đồ xám) thể hiện tần suất xuất hiện mỗi mức xám trong
ảnh. Lược đồ xám biểu diễn trong hệ tọa độ Oxy: trục hoành biểu diễn N mức
xám (tùy theo số bit mã hóa pixel), trục tung biểu diễn số điểm ảnh một mức
xám tương ứng. Lược đồ xám cung cấp thông tin về phân bố mức xám của ảnh.
Nó cho phép phân tích trong khoảng nào đó phân bố phần lớn mức xám của ảnh.
Nếu ảnh sáng thì lược đồ xám lệch về phía bên trái, nếu ảnh tối thì lược đồ xám
lệch về bên phải so với điểm quy chiếu (giữa mức xám N).
Phương pháp cân bằng histogram được sử dụng nhằm làm tăng cường độ
tương phản toàn cục (global contrast) của bức ảnh, nó đặc biệt có ý nghĩa trong
tình huống dữ liệu đầu vào có giá trị điểm ảnh co cụm, độ tách bạch hình ảnh

thấp (close contrast value). Điều này có thể được nhận thấy rõ thông qua thể
hiện của biểu đồ histogram. Khi bạn nhận được một histogram của một hình đa
mức xám với dải giá trị điểm ảnh không phân tán đều [0-255] mà chỉ tập trung
trong một phân đoạn ngắn điều đó có nghĩa là nhiều khả năng bạn đang có trong
tay một ảnh có độ tương phản thấp. Mục tiêu của cân bằng Histogram là giúp
bạn biến đổi bức ảnh có độ tương phản thấp thành bức ảnh có độ tương phản cao
hơn bằng cách trải đều giá trị của pixel làm chúng phân tán trên vùng giá trị
rộng hơn, thay vì co cụm mà vẫn giữa được nội dung bức ảnh.
Phương pháp này có ưu điểm của sự đơn giản, trong sáng, tính toán không
nặng nề, cho phép phục hồi lại trạng thái ban đầu của ảnh trong tình huống cần
thiết. Tuy nhiên nó lại có một khuyết điểm rất quan trọng, đó là nó dễ dàng làm
tăng độ tương phản của nhiễu trong nền của ảnh và giảm các chi tiết hữu ích
trong ảnh.
23

a) b)

c) d)
Hình vẽ 2.9. Cân bằng Histogram
a) và c) là hình ban đầu; b) và d) là lược đồ cân bằng Histogram.
2.2.2. Phân ngưỡng cục bộ
Phân ngưỡng là phương pháp làm tăng độ tương phản các đối tượng cần
quan tâm đồng thời loại bớt nhiễu. Nếu phân ngưỡng toàn bộ ảnh nhiều khi tỏ ra
không hiệu quả, nhất là khi cường độ sáng của ảnh không đồng đều. Phân
ngưỡng cục bộ cũng giống như phân ngưỡng nhưng chỉ khác ở điểm: ngưỡng
được chọn thích nghi với từng vùng cục bộ của ảnh. Điều này rất có ý nghĩa
trong khâu nhị phân hóa ảnh vân tay. Vùng cục bộ thường dùng có thể là các
block dạng hình vuông hay hình chữ nhật.
Ảnh xám khi phân ngưỡng thì kết quả phân ngưỡng đi đôi với nhị phân
hóa ảnh. Một điểm bất kỳ (x, y) thuộc ảnh f khi có f (x, y) T thì được gọi là

object point (điểm trên nền), trường hợp còn lại gọi là background point (điểm
nền). Đối tượng ưu tiên trích chọn từ phân ngưỡng không quan trọng là
24
bachground point hay object point. Đấy chỉ là các tên gọi quy ước và chúng có
thể chuyển đổi dễ dàng cho nhau nhờ biến đổi âm bản.
Hình vẽ 2.10. Giá trị ngưỡng tối ưu.
Kết quả phân ngưỡng được ảnh g(x, y) thì nó được định nghĩa liên hệ:
g(x,y) =
2.2.3. Biến đổi Fourier-2D rời rạc
Biến đồi Fourier rời rạc là phương pháp lọc lấy các thành phần tín hiệu
ảnh có tần số trội. Với ảnh vân tay vùng ảnh co các đường vân đóng vai trò làm
tín hiệu có tần số trội. Có f (x, y) với x=và y= là một ảnh số cỡ M x N . Biến đổi
Fourier rời rạc của f là F(u,v) .
F(u,v)= với u=và v=
Biến đổi ngược Fourier rời rạc định nghĩa bởi công thức:
f(x,y)= với x =và y=
Biến đổi Fourier rời rạc của ảnh f còn được viết dưới dạng:
F(u,v)= |F(u,v)|
trong đó f (u,v)là góc pha, |F(u,v)| là phổ Fourier.
25
Các bước thực hiện lọc ảnh trong miền tần số bằng biến đổi Fourier rời
rạc có thể mô tả bởi sơ đồ dưới đây.
Hình vẽ 2.11. Các bước thực hiện lọc ảnh trong miền tần số.
2.2.4. Bộ lọc Sobel
Lọc Sobel là một trường hợp của lọc số tuyến tính. Bộ lọc dùng một
convolution-mask (cửa sổ dùng để nhân chập, gọi tắt mask), rồi lấy tổng có trọng
số các điểm lân cận với điểm ở chính giữa trong mask đó. Di chuyển mask trên
toàn bộ miền tín hiệu ảnh, mỗi bước một pixel, cuối cùng thu ảnh kết quả. Tổng
quát, lọc tuyến tính của ảnh số f cỡ M x N với convolution-mask có cỡ m x n
định bởi như sau:

g(x,y)=
trong đó a = (m-1)/2, b = (n-1)/2, x = và y =

×