Tải bản đầy đủ (.pdf) (71 trang)

Đề tài " thiết kế hệ thống nhận dạng vân tay từ ảnh số " pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (12.39 MB, 71 trang )








Đề tài

" Thiết kế hệ thống nhận
dạng vân tay từ ảnh số "
i


Mục lục

Mục lục i
Danh mục các hình vẽ iv
Danh mục một số thuật ngữ thường dùng vi
Lời nói đầu vii
1. Giới thiệu 1
2. Vân tay trong sinh trắc học 4
2.1. Vị trí của nhận dạng vân tay trong sinh trắc học 4
2.2. Uniqe là một thuộc tính của vân tay 5
2.3. Hình thức thể hiện và các đặc tả của vân tay 5
2.4. Khó khăn gặp phải khi nhận dạng vân tay 7
3. Đại cương về ảnh số và xử lý ảnh trong Matlab 8
3.1. Đại cương về ảnh số 8
3.1.1. Biểu diễn ảnh số 8
3.1.2. Cơ sở về màu 9
3.1.3. Chuyển đổi màu 12


3.2. Xử lý ảnh số trong Matlab 13
3.2.1. Histogram 13
3.2.2. Phân ngưỡng cục bộ 14
3.2.3. Biến đổi Fourier-2D rời rạc 15
3.2.4. Lọc ảnh Sobel 16
3.2.5. Phát hiện biên bằng toán tử gradient 18
3.2.6. Loang rộng và thu nhỏ đối tượng 20
4. Sơ đồ khối thiết kế hệ thống nhận dạng vân tay 22
4.1. Các nguyên lý nhận dạng vân tay 22
4.2. Hệ thống nhận dạng vân tay 23
4.3. Xây dựng hệ thống nhận dạng vân tay bằng ảnh số 24
ii

5. Tập mẫu ảnh vân tay 26
6. Trích chọn minutiae cho đối sánh vân tay 28
6.1. Chuẩn hóa ảnh đầu vào 29
6.1.1. Chuẩn hóa kích thước ảnh 29
6.1.2. Cân bằng cường độ sáng của ảnh 29
6.2. Tăng cường ảnh chất lượng ảnh 30
6.2.1. Tăng cường ảnh bằng cân bằng histogram 30
6.2.2. Tăng cường ảnh bằng biến đổi Fourier-2D 31
6.3. Ước lượng orientation image và khoanh vùng ảnh vân tay 32
6.3.1. Ước lượng orientation image 32
6.3.2. Khoanh vùng ảnh vân tay 34
6.4. Trích chọn minutiae 35
6.4.1. Nhị phân hóa và làm mảnh đường vân 36
6.4.2. Phát hiện minutiae 37
6.4.3. Ước lượng khoảng cách đường vân 39
6.4. Hiệu chỉnh đường vân và lọc minutiae sai 39
6.4.1. Hiệu chỉnh đường vân và lọc minutiae sai cấp một 39

6.4.2. Lọc minutiae sai cấp hai và tạo mã từ minutiae 41
7. Phân loại kiểu vân tay 43
7.1. Trích chọn đặc tính 44
7.2. Tạo vec-tơ đặc tính 45
7.3. Khâu phân loại kiểu vân tay 46
8. Đối chiếu vân tay để định danh mẫu 48
8.1. Khớp mẫu hai mẫu vân tay 49
8.2. Đối sánh vân tay 50
9. Tổng kết và hướng phát triển 52
9.1. Kết quả của đồ án 52
9.2. Những kiến thức bản thân thu được 53
9.3. Những hạn chế của đồ án 53
9.4. Hướng phát triển 53
Tài liệu tham khảo 55
iii

Phụ lục 56
Danh sách các script file khác trong đồ án 56
Các bước chạy phần mềm mô phỏng 57

iv


Danh mục các hình vẽ

Hình-1. Một số tín hiệu sinh trắc học cơ bản 4
Hình-2. Đóng góp của các ngành trong sinh trắc học 4
Hình-3. Vân tay thể hiện ở cấp độ very-fine 5
Hình-4. Vân tay thể hiện trong cấp độ global 6
Hình-5. Hai dạng minutiae quan trọng 7

Hình-6. Biểu diễn ảnh số 8
Hình-7. Cảm nhận của các tế bào nhạy sáng trong võng mạc mắt 9
Hình-8. Tổ hợp màu 10
Hình-9. Hệ tọa độ màu 11
Hình-10. Phân tích lược đồ xám 14
Hình-11. Giá trị ngưỡng tối ưu 15
Hình-12. Các bước thực hiện lọc ảnh trong miền tần số 16
Hình-13. Các bước lọc ảnh bằng toán tử không gian 17
Hình-14. Biểu diễn mask 18
Hình-15. Loang rộng đối tượng 20
Hình-16. Thu nhỏ đối tượng 21
Hình-17. Tạo mã vân tay 22
Hình-18. Sơ đồ khối hệ thống nhận dạng vân tay 24
Hình-19. Các loại vân tay 26
Hình-20. Thuật toán trích chọn minutiae 28
Hình-21. Tăng cường ảnh 30
Hình-22. Ước lượng orientation image 33
Hình-23. Khoanh vùng ảnh vân tay 35
Hình-24. Thông số của hai dạng minutiae quan trọng 36
Hình-25. Nhị phân hóa và làm mảnh đường vân 36
Hình-26. Phát hiện minutiae 38

v

Hình-27. Số minutiae phát hiện được 40
Hình-28. Lọc các minutiae 40
Hình-29. Các minutiae được trích chọn cuối để tạo mã 41
Hình-30. Năm kiểu vân tay trong thực tế 43
Hình-31. Sơ đồ khối mô tả thuật toán phân loại vân tay 44
Hình-32. Phương pháp chỉ số Poincaré 44

Hình-33. Lấy đặc tính cho phân loại 46
Hình-34. Kết quả cây quyết định của bài toán phân loại kiểu vân 46
Hình-35. Đường cong sai số học và kiểm tra 47
Hình-36. Đối chiếu vân tay dựa trên cơ sở minutiae 48
Hình-37. Khớp mẫu từng đối tượng 49
Hình-38. Thực hiện matching 50
Hình-39. Kết quả nhận dạng 51
Hình-40. Cửa sổ giao diện 57
Hình-41. Mở một file ảnh 57
Hình-42. Cân bằng lược đồ xám 58
Hình-43. Biến đổi Fourier rời rạc và cân bằng cường độ sáng 58
Hình-44. Nhị phân hóa ảnh 59
Hình-45. Trường định hướng 59
Hình-46. Segmentation 60
Hình-47. Phát hiện core 60
Hình-47. Làm mảnh đường vân 61
Hình-48. Lọc minutiae 61
Hình-49. Hiển thị minutiae 62
Hình-50. Đối sánh vân tay 62


vi

Danh mục một số thuật ngữ thường dùng
trong nhận dạng vân tay

· Ridge: Đường vân tay trên ngón tay người.
· Vallay: Đường rãnh xen kẽ hai đường vân tay.
· Singular: Điểm kỳ dị của vân tay trên ngón tay người, mang đặc điểm
phân loại.

· Core: Điểm “tâm” của vân tay, là một trong những điểm singular.
· Minutia: Điểm đặc trưng của vân tay trên ngón tay con người.
· Termination: Điểm kết thúc của đường vân, một loại minutia quan trọng.
· Bifurcation: Điểm trẽ ba của đường vân, là một loại minutia quan trong.
· Sweat pores: Vòng xuyến xếp liên tiếp tạo thành đường vân (thường quan
sát được khi ảnh vân tay ở độ phân giải cao: > 1000dpi).
· Orientation Image: Hình ảnh thể hiện các định hướng cục bộ của các
đường vân tay, bao gồm nhiều phần tử
[
]
ij
0,
qp
Î tại các điểm [i,j].
· Direction Image: Tương tự như Orientation Image nhưng
[
]
ij
0,2
qp
Î .
· Segmentation: Phân định giữa vùng ảnh thể hiện đường vân và vùng ảnh
nền.
· Varance field: Một các thể hiện vùng ảnh thể hiện đường vân còn thô.
· Crossing number: Một phương pháp dùng để phát hiện minutiae.
· Poincaré: Một phương pháp dùng để phát hiện core theo trường vec-tơ
và đường bao.
· Ridge map: Ảnh đen trắng chỉ thể hiện các đường vân màu trắng nhưng
không nhất thiết các đường vân có độ rộng đồng đều.
· Thinned ridge map: Ảnh đen trắng thể hiện các đường vân màu trắng

nhưng nhất thiết các đường vân có độ rộng đồng đều 1pixel


vii


Lời nói đầu

Hiện nay, việc thu thập, xử lý thông tin qua ảnh để nhận biết đối tượng đang
được quan tâm và ứng dụng rộng rãi. Với phương pháp nay, chúng ta có thể thu
nhận được nhiều thông tin từ đối tượng mà lại không cần tác động nhiều đến đối
tượng nghiên cứu.
Một trong những nhóm ứng dụng hay gặp trong xử lý thông tin bằng hình
ảnh là xác minh hoặc định danh mẫu. Nhận dạng vân tay là một bài toán cụ thể
mà cần phải giải quyết một trong hai vấn đề nêu trên: xác minh vân tay
(fingerprint verification) hoặc định danh vân tay (fingerprint identification). Qua
tìm hiểu thực tế em chọn đề tài: “Thiết kế hệ thống nhận dạng vân tay từ ảnh
số”. Đề tài này có nội dung bao trùm lên cả các hệ thống có kiểu nhận nhận
dạng verification (cần mã PIN cộng với ảnh vân tay).
Do đề tài có tính chất mới, trong quá trình làm đồ án em đã gặp rất nhiều khó
khăn. Được sự giúp đỡ, chỉ bảo tận tình của TSKH. TRẦN HOÀI LINH em đã
dần dần tiếp cận được tới lĩnh vực này và bước đầu đã đạt được một số các kết
quả (phân loại được hơn 90% các kiểu vân tay và định danh được vân tay).
Sau thời gian 15 tuần khẩn trương thực hiện đồ án tốt nghiệp, đề tài đã được
hoàn thành đúng kế hoạch. Em mong những thiếu sót của em trong đồ án sẽ
nhận được những ý kiến đóng góp quý báu của các thầy, cô cùng các bạn sinh
viên.
Em xin chân thành cảm ơn TSKH.TRẦN HOÀI LINH. Thầy đã tận tình chỉ
bảo em rất nhiều. Các thầy cô giáo trường Đại Học Bách Khoa, bộ môn Kỹ thuật
đo và Tin học công nghiệp đã cho em những kiến thức, kinh nghiệm, cùng

những bài học giúp trưởng thành hơn trong quá trình học tập ở trường.
Xin cảm ơn bạn bè, người thân, gia đình đã động viên, giúp đỡ và là chỗ dựa
vững chắc cho em trong quá trình học tập, làm đồ án.

viii

Xin cảm ơn Công ty TNHH Tin học và Điện tử Thăng Long cùng chú VŨ
QUANG THÀNH đã tạo điều kiện giúp đỡ, cho em nhiều lời khuyên bổ ích
trong quá trình thực tập tốt nghiệp và làm đồ án.

Hà Nội, ngày 20 tháng 5 năm 2007


Sinh viên thực hiện





Ngô Hồng Việt


1. GIỚI THIỆU

1

1. Giới thiệu
Nhận dạng vân tay là một bộ phận của nhận dạng sinh học. Khoa học nhận dạng
vân tay cũng đã hình thành từ khá lâu. Nhưng tới thời gian gần đây, cùng với sự
ra đời của máy tính nó mới đạt được nhiều kết quả quan trọng và trở thành một

trong những phương pháp sinh trắc có độ tin cậy nhất.
Ảnh vân tay dùng để nhận dạng thường bị ảnh hưởng nhiều bởi điều kiện thu
thập số liệu (hình ảnh vân tay không trọn vẹn, bị xoay góc, méo hay có nhiều
nhiễu…) nên việc so sánh trực tiếp hai mẫu vân tay sẽ rất phức tạp và khó khăn.
Do đó vân tay cần lọc nhiễu, sau đó tạo mã từ một số các đặc tính của nó (có thể
phân biệt với vân tay khác) nhằm mục đích giải quyết vấn xử lý, lưu trữ vân tay
với số lượng lớn mà vẫn đảm bảo chính xác.
Các kỹ thuật thực nhận dạng vân tay cũng có khá nhiều. Tựu trung, quá trình
này trải qua ba công đoạn chính: thu nhận vân tay (i); trích chọn đặc tính vân
tay (ii); đối sánh vân tay (iii) [1]. Bởi vì ngay trong từng công đoạn này lại có
nhiều biện pháp khác nhau, tùy vào ngữ cảnh và vùng ứng dụng các khâu này sẽ
thực hiện theo cách cụ thể.
Công nghệ nhận dạng vân tay ngày nay đã đạt tới độ chính xác rất cao. Tuy
vây, các hệ thống nhận dạng AFIS (Automated Fingerprint Identification
Systems) vẫn còn nhiều mặt hạn chế. Chẳng hạn như IAFIS của FBI có cơ sở dữ
liệu lớn tới hàng trăm triệu vân tay, thời gian tìm kiếm tính bằng phút cho một
mẫu, độ tin cậy cao… nhưng đó là một hệ thống đồ sộ gồm nhiều máy tính xử lý
song song và giới hạn trong giám định hình sự. Trong ứng dụng dân sư, các hệ
thống nhận dạng thường được giới hạn ở một mức độ ít phức tạp hơn: số mẫu
không lớn (khoảng vài nghìn), cấu trúc hệ thống kiểu nối tiếp, ảnh đầu vào
không có quá nhiều nhiễu (nhằm giảm bớt gánh nặng xử lý tính toán),… có vậy
mới giải quyết được vấn đề chi phí đồng thời vẫn đảm bảo độ tin cây.
Đồ án này sẽ thực hiện nhận dạng vân tay bàng ảnh số theo hướng có thể
triển khai trong dân sư. Chính vì vây phương pháp nhận dạng là dựa trên cơ sở
phát hiện và sử dụng các điểm nút đặc trưng (gọi là minutiae) [2]. Đây là
1. GIỚI THIỆU

2

phương pháp thứ hai trong ba phương pháp nhận dạng được áp dụng nhiều hiện

nay [1], ch. 4. Hệ thống AFIS nói chung cũng sử dụng phương pháp này [11].
· Phương pháp thứ nhất, sử dụng đặc trưng tương quan của hai mẫu vân
tay. Xếp chồng trực tiếp hai mẫu này và dựa vào tương quan giữa các
pixel để tính toán sự khác nhau giữa hai mẫu. Phương pháp này không
thích hợp với đồ án vì đòi hỏi khối lượng tính toán lớn mà chất lượng ảnh
phải đảm tốt.
· Phương pháp thứ ba, sử dụng các đặc trưng về đường vân. Đường vân của
các mẫu được trích ra khỏi ảnh ban đầu rồi so sánh giữa chúng. Phương
pháp này không thích hợp với đồ án vì nó chỉ thích hợp với các mẫu có
chất lượng xấu (chẳng hạn như vân tay tội phạm để lại hiện trường sau vụ
án).
Đồ án sẽ sử dụng bộ mẫu chuẩn các vân tay đã được chuẩn bị trước. Đó là
các ảnh số vân tay lấy trong FVC200 (một bộ dữ liệu chuẩn quốc tế xây dựng
bởi phòng thí nghiêm hệ thống sinh trắc, đại học Bologna).
Trong tâm của đồ án tập trung vào hai phần:
· Tạo vec-tơ đặc tính cho mục đích phân loại kiểu vân tay và cho đối sánh
vân tay (feature extraction).
· Sử dụng các điểm minutea đã trích chọn bước trước để đối sánh nhận
dạng vân tay (minutiae matching).
Đồ án trình bày theo cấu trúc:
· Chương 1: Giới thiệu chung.
· Chương 2: Vân tay trong sinh trắc học. Đề cập một số bộ phận của sinh
trắc học (trong đó có nhận dạng vân tay) và những tính chất gì quyết định
vân tay được ứng dụng nhiều nhất trong sinh trắc học.
· Chương 3: Đại cương về ảnh và xử lý ảnh trong Matlab, trình bày khái
quát về ảnh số và một số thuật toán xử lý ảnh trong Matlab sử dụng trong
đồ án.
1. GIỚI THIỆU

3


· Chương 4: Sơ đồ khối thiết kế hệ thống. Đề cập một số mô hình hệ thống
nhận dạng vân tay và xây dựng sơ đồ khối hệ thống nhận dạng vân tay
bằng ảnh số.
· Chương 5: Bộ dữ liệu ảnh sử dụng trong đồ án. Đây là bộ dữ liệu ảnh vân
tay trích ra từ FVC2000 (cơ sở dữ liệu ảnh vân tay chuẩn, hiện nay được
nhiều nhà khoa học chọn để nghiên cứu và kiểm nghiệm kết quả).
· Chương 6: Trích chọn đặc tính vân tay và đối sánh vân tay. Đây một
trong những công đoạn quan trọng nhất của đồ án. Giai đoạn này áp dụng
các thuật toán xử lý ảnh để tạo mã vân tay.
· Chương 7: Đối sánh vân tay. Mẫu vân tay được tạo mã từ minutiae ở
công đoạn trước được đối sánh trong công đoạn này.
· Chương 8: Phân loại kiểu vân tay. Trình bày về vấn đề tạo vec-tơ đặc tính
cho khâu phân loại kiểu vân tay và thực hiện phân loại kiểu vân tay.
· Chương 9: Tổng kết và hướng phát triển. Trình bày những kết quả của đồ
án, những kiến thức bản thân thu được, các hạn chế và hướng phát triển
đề tài.
· Tài liệu tham khảo. Liệt kê một số tài liệu dùng tham khảo chính trong
đồ án.
· Phụ lục. Bao gồm danh sách các script file của phân mềm mô phỏng và
các bước thực hiện chạy phần mềm mô phỏng nhận dạng vân tay.

2. VÂN TAY TRONG SINH TRẮC HỌC
4

2. Vân tay trong sinh trắc học
Trong phần này sẽ trình bày những tiếp cận khởi đầu, như: vị trí của nhận dạng
vân tay trong sinh trắc học; những tính chất của vân tay để trở thành đối tượng
cơ bản của sinh trắc học; hình thức thể hiện và đặc tả của một mẫu vân tay và
những khó khăn gặp phải khi nhận dạng vân tay.




a) b) c)
Hình-1. Một số tín hiệu sinh trắc học cơ bản: a) giọng nói; b) đồng tử; c) chữ ký.
2.1. Vị trí của nhận dạng vân tay trong sinh trắc học
Dựa vào tiêu chuẩn physiological sinh trắc học có: dạng vân tay, mặt, đồng tử,
giọng nói… Còn dựa vào tiêu chuẩn behavioral sinh trắc học có: nhận dạng chữ
viết, chữ ký… Dưới đây là biểu đồ tương quan ứng dụng sinh trắc (số liệu thống
kê của International Biometric Group, 2002).


Hình-2. Đóng góp của các ngành trong sinh trắc học.
(vân tay đứng vị trí hàng đầu trong các ứng dụng nhận dạng)
2. VÂN TAY TRONG SINH TRẮC HỌC
5

2.2. Uniqe là một thuộc tính của vân tay
Cho tới nay, vẫn chưa có bằng chứng xác thực 100% vân tay trên các ngón tay
tuyệt đối mang tính cá nhân và không hề lặp lại. Câu trả lời chính xác chỉ có
được khi đem so sánh từng mẫu vân tay của mười đầu ngón người với hơn sáu tỉ
người còn lại. Tuy nhiên khi không xét tới phần nhỏ lẻ ấy có thể rút ra một số
tính chất cơ bản của vân tay để nó trở thành phổ biến trong ứng dụng nhận dạng
và định danh con người [2, 11]:
· Tính “phổ thông”, mọi người đều có.
· Tính cá nhân và không lặp lại. Xác suất trùng khớp với người khác gần
bằng không.
· Tính “bất biến”. Hình dạng tổng thể của vân tay trên các ngón tay của con
người không thay đổi theo thời gian. Ngay cả trường hợp bị chấn thưong
nhẹ, dấu vân tay vẫn có khả năng khôi phục lại.

2.3. Hình thức thể hiện và các đặc tả của vân tay
Nhằm mục đích mô tả người ta đã định nghĩa một số hình thức thể hiện vân tay.
Mỗi một trường hợp thể hiện thì sẽ có hình thức trích chọn đặc tả vân tay tương
ứng. Vì vậy, căn cứ vào ảnh vân tay đầu vào chúng ta có thể lựa chọn được đặc
tính cần trích chọn và dự kiến phương án nhận dạng.


Hình-3. Vân tay thể hiện ở cấp độ very-fine: các sweat pores được khoanh tròn,
điểm vân chẽ ba (bifurcation) và vân cụt (termination) đánh dấu hình tròn.
2. VÂN TAY TRONG SINH TRẮC HỌC
6

Hình thức thể hiện vân tay được chia thành ba cấp độ: global (thể hiện tổng
thể vân tay), local (thể hiện vân tay bởi một số nút đặc trưng khi đường vân làm
mảnh đến một pixel), very-fine (thể hiện bởi các vòng xuyến tạo hình nên đường
vân - sweat pores) [1], tr. 28-31, 83-85.
Đối với cấp độ very-fine thì đòi hỏi các phương tiện xử lý tốn kém cũng như
các yêu cầu đặc biệt khác mà khó có thể ứng dụng trong dân sự. Chẳng hạn để
trích được các pores, ảnh cần có độ phân giải tối thiểu 1000dpi. Sau đây sẽ tìm
hiểu sâu hơn các đặc trưng vân tay ở hai cấp độ đầu.




a) b) c)






d) e)

Hình-4. Vân tay thể hiện trong cấp độ global: a) arch; b) whorl; c) tented arch; d) left loop;
e) right loop; hình vuông đánh dấu điểm loop, hình tam giác đánh dấu điểm delta.

Ở cấp độ global, đặc trưng vân tay liên quan nhiều đến sự tạo hình của
đường vân và các điểm kỳ dị (singular), chúng bao gồm: loop (đường vân tạo
vòng xoáy hở), delta (đường vân tạo hình tam giác). Điểm kỳ dị có vai trò quan
trọng trong việc thực hiện phân loại vân tay và tổ chức, xây dựng cơ sở dữ liệu.
2. VÂN TAY TRONG SINH TRẮC HỌC
7

Ở mức độ cục bộ, các đặc trưng của vân tay được gọi là minutiae. Người ta
đã thống kê có tới 150 đặc trưng loại này. Hai đặc trưng cơ bản và nổi trội hơn
cả là ride temination và ridge bifurcation (cũng được gọi tắt là minutiae)



a) b)
Hình-5. Hai dạng minutiae quan trọng: a) ridge termination; b) ridge bifurcation.

2.4. Khó khăn gặp phải khi nhận dạng vân tay
Do điều kiện thu nhận ảnh quyết định nhiều đến chất lượng ảnh thu thập nên
nhiều khi các chi tiết trên mẫu vân tay không thể hiện rõ ràng. Có thể liệt kê một
số trường hợp dưới đây:
· Dry finger (vân tay thu nhận trong điều kiện “khô”): ảnh thu nhận sẽ có
nhiều chỗ đường vân bị mờ đi, đường vân bị lẫn với nền ảnh. Lực ấn của
tay nhẹ hoặc mực in không đủ (với vân tay lăn trên giấy) là các nguyên
nhân chính làm giảm chất lượng ảnh thu thập.
· Wet finger (vân tay thu nhận trong điều kiện “ướt”): ảnh thu nhận sẽ có

nhiều chỗ đường vân bị dính liền. Lực ấn của ngón tay quá lớn hoặc mực
in quá nhiều (với vân tay lăn trên giấy) là các nguyên nhân chính tạo
nhiễu trong trường hợp này.
· Vân tay thu nhận trong điều kiện bị biến dạng: ảnh thu nhận được có thể
thể hiện rõ nét nhưng các đường vân lại bị bóp méo không còn giống với
mẫu thực. Lực ấn, kéo và xê dịch tay là các nguyên nhân chính.
· Vân tay thu thập không đầy đủ: ảnh thu thập được chỉ có một phần vân
tay trên ngón tay. Nguyên nhân chính là do ngón tay đặt không đúng vị trí
chuẩn thu thập.
Tuy vậy trong thực tế cũng có nhiều mẫu vân tay thu thập trong điều kiện tốt
nên có chất lượng cao
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

8

3. Đại cương về ảnh số và xử lý ảnh trong Matlab
Đồ án này không xây dựng bộ thu thập mẫu vân tay mà sử dụng bộ mẫu chuẩn
quốc tế FVC2000 do phòng thí nghiệm hệ thống sinh trắc, đại học Bologna tạo
ra. Trong cơ sở dữ liệu ấy, các mẫu được lưu dữ dưới dạng ảnh số. Bởi vậy, quá
trình xử lý tính toán thực hiện đồ án phải làm việc chính với dạng số liệu đó.
Cho nên, trong phần này sẽ trình bày tóm tắt về ảnh số và một số thuật toán xử
lý ảnh số trong Matlab.
3.1. Đại cương về ảnh số
Ảnh có thể biểu diễn dưới dạng tín hiệu tương tự hoặc số. Trong phần sẽ tập
trung vào biểu diễn ảnh số, cơ sở về mầu và việc chuyển đổi màu.
3.1.1. Biểu diễn ảnh số
Ảnh xám cũng như các ảnh số khác là tập hợp các phần tử ảnh hay còn gọi là
các pixel,
[,]
ij

. Ảnh được biểu diễn như một ma-trận hai chiều cỡ
WH
´
, hai
thông số này cho biết thông tin về độ rộng và chiều cao ảnh. Giá trị của mỗi
phần tử của ma-trận
[,]
Iij
biểu diễn cho mức xám hay cường độ ảnh tại vị trí
của phần tử đó.




éù
êú
êú
=
êú
êú
ëû
f(1,1)f(1,2)f(1,N)
f(2,1)f(2,2)f(2,N)
f
f(M,1)f(M,2)f(M,N)
L
L
MMM
L


a) b)
Hình-6. Biểu diễn ảnh số: a) hệ trục tọa độ trong Image Processing Toolbox;
b) ma-trận biểu diễn ảnh số
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

9

Tùy theo yêu cầu lưu trữ, các pixel sẽ được mã hóa bằng 8-bit, 16-bit,…
tương ứng với ảnh xám 256, 65536 mức.
Với ảnh đen trắng, các pixel này được lưu trữ bằng 1-bit. Cường độ ảnh I chỉ
có thể là một trong hai giá trị,
[
]
[,]0,1
IijÎ . Ứng với giá trị 0 đó là các điểm đen,
còn với giá trị 1 đó là điểm trắng.
Với ảnh màu, cách biểu diễn cũng tương tự như với ảnh xám, chỉ khác là các
giá trị tại mỗi phần tử của ma-trận biểu diễn ba màu riêng biệt gồm: đỏ (Red-R),
lục (Green-G) và lam (Blue-B). Để biểu diễn cho ba màu riêng rẽ cần 24-bit, 24-
bit này được chia thành ba khoảng 8-bit. Mỗi khoảng này biểu diễn cho cường
độ sáng của một trong các màu chính.
3.1.2. Cơ sở về màu
Ánh sáng màu là tổ hợp các ánh sáng đơn sắc. Mắt người có thể cảm nhận được
một số màu nhất định nhưng lại có thể phân biệt được rất nhiều màu (trong vùng
quang nhìn thấy, có dải bước sóng
400750
nmnm
¸
). Cảm nhận màu của con
người phụ thuộc vào ba thuộc tính B, H, S.


B (brightness):

độ chói,
H (hue):

sắc lượng,
S (saturation):

độ bão hòa.


Hình-7. Cảm nhận của các tế bào nhạy sáng trong võng mạc mắt với các màu ánh sáng phụ
thuộc vào chiều dài bước sóng ánh sáng.
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

10

Trong võng mạc mắt người có các tế bào cảm thụ hình nón nhạy với ánh
sáng. Có khoảng 6
¸
7 triệu tế bào loại này trong mắt, chúng chia làm ba nhóm
nhạy với ba màu ánh sáng khác nhau: 65% tế bào nhạy với ánh sáng đỏ (red),
32% tế bào nhạy với ánh sáng xanh lục (green) và 2% còn lại nhạy với ánh sáng
xanh lơ (blue).
Tổ hợp B, H, S đối với từng ánh sáng màu trong ba màu này giúp mắt con
người có thể phân biệt được hàng ngàn màu. R, G, B còn được gọi là các màu cơ
sở.
Phân bổ phổ năng lượng của một nguồn sáng màu có bước sóng
l

ký hiệu là
()
C
l
và việc tổ hợp màu theo ba màu cơ sở (có các đường cong cảm nhận
1
S
,
2
S
,
3
S
) mô tả bằng sơ đồ khối sau:


Hình-8. Tổ hợp màu.

Đáp ứng phổ
(
)
i
C
a
sẽ được tính như sau trong dải bước sóng


()
max
min

()()
ii
CScd
l
l
alll
=
ò
,
1,3
i
=
.

Với phân phối xác xuất của ba màu
(
)
k
px
,
1,3
k
=
nên có:


max
min
()1
x

k
x
pxdx
=
ò
.
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

11

Giả sử ba màu cơ bản được tổ hợp theo tỉ lệ
(
)
k
bl
,
1,3
i
=
. Để tạo ra một màu
có phân bố phổ năng lượng
(
)
C
l
sẽ bằng
3
1
()()
kk

k
px
bl
=
å
.
Thay giá trị vào phương trình về đáp ứng phổ:

maxmax
333
,
111
minmin
()()()()()()()()
iikkkikkik
kkk
cSxpxdxxSpxdxxa
ll
ll
albblb
===
æö
===
ç÷
èø
ååå
òò

trong đó:
max

i,k
min
()()
ik
Spxdx
l
l
al
=
ò
.
Như vậy có thể tổ hợp màu theo phép cộng màu với
i
a
là hệ số tổ hợp theo công
thức tổng quát sau:

123
XRGB
aaa
=++


Tổ chức quốc tế về chẩn hóa màu CIE đã đưa ra một số không gian màu như:
RGB, CMY, CMYK, HIS,… Trong đó mô hình RGB có vai trò quan trọng.


x
red
Pgreen

blue
éù
êú
=
êú
êú
ëû


a) b)
Hình-9. Hệ tọa độ màu: a) mô hình màu RGB;
b) biểu diễn điểm ảnh trong hệ tọa độ màu RGB.
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

12

3.1.3. Chuyển đổi màu
Hệ tọa độ màu do CIE quy định như một hệ quy chiếu và trên thực tế không
thể biểu diễn hết các màu. Tùy thuộc vào các ứng dụng khác nhau người ta đưa
ra thêm một số hệ tọa độ khác như NTSC, CMY, YIQ phù hợp với yêu cầu
hiển thị màu sắc. Việc chuyển đổi giữa các không gian biểu diễn màu thực hiện
theo nguyên tắc sau:

xx
PAP
*

,

trong đó:

x
P
:

không gian biểu diễn màu ban đầu,
x
P
*
:

không gian biểu diễn màu mới,
A
:

ma-trận phép biến đổi.

Ảnh dùng trong đồ án này là ảnh xám. Mức xám là kết quả của sự mã hóa
tương ứng một cường độ sáng của điểm ảnh với một trị số. Giá trị của nó phụ
thuộc vào mức độ lượng tử hóa ảnh, như các ảnh dùng làm cơ sở dữ liệu đã lấy
8-bit để mã hóa ảnh (ứng với 256 mức xám, trong đó mức xám 0 là màu đen,
mức xám 255 là màu trắng).
Khi chuyển đổi từ ảnh màu RGB sang ảnh xám có thể dùng công thức sau:

123
grayscaleRGB
aaa
=++,

các hệ số
i

a
lần lượt như dưới đây [6].

123
0,2989;0,5870;0,1140
aaa
===

3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

13

3.2. Xử lý ảnh số trong Matlab
Đứng về mặt xử lý tín hiệu nói chung và xử lý ảnh nói riêng, Matlab là công cụ
rất mạnh. Hầu hết các thuật toán về ảnh và xử lý ảnh đều đã được thể hiện trong
các hàm của Matlab như các hàm đọc, ghi ảnh, chuyển đổi giữa các hệ màu của
ảnh, các thuật toán phát hiện biên, tách đối tượng, khớp mẫu, các phép biến đổi
ảnh như xoay ảnh, chuẩn kích thước, tịnh tiến, Các thư viện ngày càng được
mở rộng, các hàm ứng dụng có thể được lập bởi người sử dụng. Ứng dụng phần
mềm Matlab trong xử lý ảnh sẽ có được nhiều tiện ích và trợ giúp.
Câu lệnh Matlab được gần với các thuật ngữ mô tả kỹ thuật, câu lệnh ngắn
gọn và có thể tra cứu nhanh trong chức năng Help.
Trong Matlab có nhiều Toolbox hỗ trợ các ứng dụng chuyên sâu. Với bài
toán nhận dạng hình ảnh, các Toolbox thường được sử dụng gồm:
· Image Processing Toolbox
· Image Acqusition Toolbox
· Wavelet Toolbox
· Signal Processing
· Statistics Toolbox
· Neural Network Toobox

Các thuật toán xử lý trong đồ án đều được viết bằng ngôn ngữ lập trình phần
mềm Matlab. Các chương trình có sử dụng một một số thư viện của Matlab (chủ
yếu trong Image Processing Toolbox, Statistics Toolbox). Sau đây là một số
công cụ xử lý và thuật toán xử lý ảnh chính được ứng dụng trong đồ án.
3.2.1. Histogram
Histogram (lược đồ xám) thể hiện tần suất xuất hiện mỗi mức xám trong ảnh.
Lược đồ xám biểu diễn trong hệ tọa độ Oxy: trục hoành biểu diễn N mức xám
(tùy theo số bit mã hóa pixel), trục tung biểu diễn số điểm ảnh một mức xám
tương ứng.
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

14

Lược đồ xám cung cấp thông tin về phân bố mức xám của ảnh. Nó cho phép
phân tích trong khoảng nào đó phân bố phần lớn mức xám của ảnh. Nếu ảnh
sáng thì lược đồ xám lệch về phía bên trái, nếu ảnh tối thì lược đồ xám lệch về
bên phải so với điểm quy chiếu (giữa mức xám N).



a) b)


c) d)
Hình-10. Phân tích lược đồ xám: a) ảnh sáng và b) lược đồ xám của (a) lệch phải;
c) ảnh tối và d) lược đồ xám của (c) lệch trái.

3.2.2. Phân ngưỡng cục bộ
Phân ngưỡng với mục đích làm tăng độ tương phản các đối tượng cần quan tâm
đông thời loại bớt nhiễu. Nếu phân ngưỡng toàn bộ ảnh nhiều khi tỏ ra không

hiệu quả, nhất là khi cường độ sáng của ảnh không đồng đều. Phân ngưỡng cục
bộ cũng giống như phân ngưỡng nhưng chỉ khác ở điểm: ngưỡng được chọn
thích nghi với từng vùng cục bộ của ảnh. Điều này rất có ý nghĩa trong khâu nhị
phân hóa ảnh vân tay. Vùng cục bộ thường dùng có thể là các block dạng hình
vuông hay hình chữ nhật.
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

15

Ảnh xám khi phân ngưỡng thì kết quả phân ngưỡng đi đôi với nhị phân hóa
ảnh. Một điểm bất kỳ (x, y) thuộc ảnh f khi có (,)
fxyT
³
thì được gọi là object
point (điểm trên nền), trường hợp còn lại gọi là background point (điểm nền).
Đối tượng ưu tiên trích chọn từ phân ngưỡng không quan trọng là
bachground point hay object point. Đấy chỉ là các tên gọi quy ước và chúng có
thể chuyển đổi dễ dàng cho nhau nhờ biến đổi âm bản.


Hình-11. Giá trị ngưỡng tối ưu.

Kết quả phân ngưỡng được ảnh
(,)
gxy
thì nó được định nghĩa liên hệ

( )
1:(,)
,

0:(,)
fxyT
gxy
fxyT
³
ì
=
í
<
î



3.2.3. Biến đổi Fourier-2D rời rạc
Biến đồi Fourier rời rạc trong xử lý ảnh số nhằm mục đích lọc lấy các thành
phần tín hiệu ảnh có tần số trội. Với ảnh vân tay vùng ảnh co các đường vân
đóng vai trò làm tín hiệu có tần số trội.

(,)
fxy
, với
0,1
xM
=-

0,1
yN
=-
là một ảnh số cỡ
MN

´
. Biến đổi
Fourier rời rạc của
f

(,)
Fuv
.

( )
11
2//
00
(,)(,)
MN
juxMvyN
xy
Fuvfxye
p

-+
==
=
åå
,
0,1
uM
=-
,
0,1

vN
=-
.
3. ĐẠI CƯƠNG VỀ ẢNH VÀ XỬ LÝ ẢNH

16

Biến đổi ngược Fourier rời rạc định nghĩa bởi công thức:

( )
11
2//
00
(,)(,)
MN
juxMvyN
uv
fxyFuve
p

-+
==
=
åå
,
0,1
xM
=-
,
0,1

yN
=-
.

Biến đổi Fourier rời rạc của ảnh f còn được viết dưới dạng:

(
)
,
(,)(,)
juv
FuvFuve
f
-
= ,

trong đó
(
)
,
uv
f
là góc pha,
(,)
Fuv
là phổ Fourier.
Các bước thực hiện lọc ảnh trong miền tần số bằng biến đổi Fourier rời rạc
có thể mô tả bởi sơ đồ dưới đây.



Hình-12. Các bước thực hiện lọc ảnh trong miền tần số.

3.2.4. Lọc ảnh Sobel
Lọc Sobel là một trường hợp của lọc số tuyến tính. Nghĩa là bộ lọc dùng một
convolution-mask (cửa sổ dùng để nhân chập, gọi tắt mask), rồi lấy tổng có trọng
số các điểm lân cận với điểm ở chính giữa trong mask đó. Di chuyển mask trên
toàn bộ miền tín hiệu ảnh, mỗi bước một pixel, cuối cùng thu ảnh kết quả.

×