Tải bản đầy đủ (.pdf) (104 trang)

PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO DẠNG CẮT DÁN LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.78 MB, 104 trang )

 

 

BỘ GIÁO DỤC VÀ ĐÀO TẠO 
TRƢỜNG ĐẠI HỌC LẠC HỒNG 
***

NGUYỄN HỮU NAM 

PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO
DẠNG CẮT/DÁN 
CẮT/DÁN 

Luận văn Thạc sĩ  Công nghệ Thông tin 

ĐỒNG NAI, 2011


 

 

BỘ GIÁO DỤC VÀ ĐÀO TẠO 
TRƢỜNG ĐẠI HỌC LẠC HỒNG 
***

NGUYỄN HỮU NAM

PHÁT HIỆN ẢNH KỸ THUẬT SỐ GIẢ MẠO
MẠO  


DẠNG CẮT/DÁN 
CẮT/DÁN 
Chuyên ngành: Công nghệ Thông tin 
Mã số: 60.48.05 

Luận văn Thạc sĩ  Công nghệ Thông tin 
 Ngƣời hƣớng dẫn khoa học: 
PGS. TS ĐỖ NĂNG TOÀN 

ĐỒNG NAI, 2011


 

 

LỜI CAM ĐOAN 
Tôi xin cam đoan luận văn thạc sĩ   công nghệ thông tin: “Phát hiện ảnh
kỹ thuật số giả mạo dạng cắt/dán” là kết quả của quá trình học ttập,
ập, nghiên
cứu khoa học độc lập, nghiêm túc. 
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, đƣợc
trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình
nghiên cứu đã đƣợc công bố, các website, … 
Các phƣơng pháp nêu trong luận văn đƣợc rút ra từ những cơ sở lý luận
và quá trình nghiên cứu tìm hiểu của tác giả. 
tháng 11

Đồng Nai,


Tác giả 

2011.

năm

 Nguyễn Hữu Nam 


 

 

LỜI CẢM ƠN 
 Lời đầu tiên tôi xin gửi lời cảm ơn  T hầy
hầy PGS. TS Đỗ Năng Toàn đã tận
tình giúp đỡ tôi trong suốt thời gian học tập vừa qua, đặc biệt là định hướng
nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận văn.
 Nếu không có  sự giúp đỡ tận tình của thầy,  tôi khó có thể hoàn thành luận
văn này.
 Bên cạnh đó , tôi chân thành cám ơn các thầy cô Trung tâm Thông tin
Tư liệu, trường Đại Học Lạc Hồng, nơi tôi công tác và nghiên cứu đã tạo
điều kiện và hỗ trợ tôi trong suốt thời gian qua.
Tôi cũng xin  chân thành cám ơn các thầy cô Khoa Công nghệ T hông
hông
tin đã tận tình giảng dạy, chỉ bảo và cung cấp cho tôi những kiến thức cần  
thiết trong suốt thời gian học  và cũng xin gởi lời cám ơn chân thành đến
những người thân, bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong
 suốt thời gian học tập cũng như
như trong thời gian thực hiện luận văn. 

Chân thành cám ơn ! 
 Biên Hòa, ngày 01 tháng 11 năm 2011 

 Nguyễn Hữu Nam 


 

 

MỤC LỤC 
Trang

LỜI CAM ĐOAN ............................................................................................... i
LỜI CẢM ƠN  ....................................................................................................ii
MỤC LỤC ........................................................................................................ iii
DANH MỤC CÁC TỪ VIẾT TẮT .................................................................. iv

DANH MỤC HÌNH ........................................................................................... v
DANH MỤC BẢNG BIỂU .............................................................................. vi
PHẦN MỞ ĐẦU ............................................................................................... 1
CHƢƠNG 1: KHÁI QUÁT VỀ XỬ  LÝ ẢNH VÀ ẢNH GIẢ MẠO ................ 3
1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh. ................................. 3
1.1.1. Xử lý ảnh là gì ? ............................................................................. 3
1.1.2. Biểu diễn ảnh số  .............................................................................. 3
1.1.3. Một số khái ni
niệm
ệm cơ sở trong xử lý ảnh ................................
................ .........................
......... 5

1.1.4. Các giai đoạn trong xử lý ảnh ...................................................... 10
1.1.4.1. Thu nhận ảnh ........................................................................ 10
1.1.4.2. Tiền xử lý ............................................................................ 10
1.1.4.3. Phân đoạn ảnh ..................................................................... 11
1.1.4.4. Hệ quyết định ...................................................................... 12
1.1.4.5. Trích chọn đặc điểm ............................................................. 12
................ .................................
.................................
............................
............ 13
1.1.4.6. Nhận dạng ................................

1.1.5. Biên và các phƣơng pháp dò biên ................................................. 14
1.1.5.1. Biên và các kiểu biên cơ bản trong ảnh ............................... 14
1.1.5.2. Vai trò của biên trong nhận dạng ......................................... 15
1.1.5.3. Các phƣơng pháp dò biên trực tiếp ...................................... 17
................. ...............................
............... 19
1.1.5.4. Một số phƣơng pháp dò biên
b iên .................................

1.1.5.4.1. Phƣơng pháp Canny ................................................... 19


 

 

 Cast an ................................
................ .......................

....... 21
1.1.5.4.2. Phƣơng pháp Shen –  Castan
................ .................. 21
1.1.6. Phát hiện và so khớp các đặc trƣng bất biến ................................

1.1.6.1. Điểm bất động và đặc trƣng bất biến ................................... 21
1.1.6.2. So khớp đặc trƣng ................................................................ 24
1.2. Ảnh giả mạo và phát hiện ảnh giả mạo ................................
............... .................................
....................
.... 25
1.2.1. Giới thiệu ảnh giả mạo .................................................................. 25
1.2.2. Các dạng ảnh giả mạo cơ bản .................................
................ .................................
.......................
....... 28
1.2.3. Một số ảnh nổi tiếng đã đƣợc phát hiện là ảnh giả mạo [18] ........ 30
1.2.4. Hƣớng tiếp cận bài toán phát hiện ảnh giả mạo ............................
................ ............ 35
1.2.4.1. Dựa vào hì
hình
nh dạng .............................................................. 35
1.2.4.2. Dựa vào phân tích nguồn sáng ............................................ 36
1.2.4.3. Dựa vào biến đổi màu sắc ................................................... 36
1.2.4.4. Dựa vào cơ sở dữ liệu ................................
................ .................................
..........................
......... 36
............... .... 37
1.2.4.5. Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ ...................


1.2.4.6. Dựa vào phân tích ánh sáng ................................................ 37
CHƢƠNG 2 : MỘT SỐ KỸ THUẬT PHÁT HIỆN  ẢNH KỸ THUẬT SỐ GIẢ 
MẠO ................................................................................................................ 38
2.1. Phát hiện ảnh giả mạo dựa vào Thuật toán Exact Match [3] ..................
................. . 38
2.2. Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thƣớc [3] ............ 40
............. 42
2.3. Phát hiện ảnh giả mạo dựa trên sự khác biệt hƣớng nguồn sáng .............

2.3.1. Các dạng nguồn sáng ................................
.............. .................................
.................................
....................
.... 42
2.3.1.1. Nguồn sáng ở vô tận (3-D) .................................
................. .................................
................... 43
................. .................................
................... 45
2.3.1.2. Nguồn sáng ở vô tận (2-D) .................................

2.3.1.3. Nguồn sáng ở gần (bộ phận) (2-D) ..................................... 46
2.3.1.4. Nhiều nguồn sáng ................................................................ 47
................ ....... 48
2.3.2. Phƣơng pháp ƣớ
ƣớcc lƣợng hhƣớng
ƣớng chiếu nguồn sáng .......................
 ............................. 48
2.3.2.1. Ƣớc lƣợng hƣớng chiếu của nguồn sáng.............................



 

 

................ ....... 49
49
2.3.2.2. Tìm những đƣờng có khả năng là biên khuất .......................

2.3.2.3. Ƣớc lƣợng hƣớng chiếu sáng cho từ
từng
ng đƣờng biên tì
tìm
m đƣợc
 ........................................................................................................... 50
............... ....... 50
2.3.2.4. Sử dụng mạng Bayes tìm ƣớc lƣợng tốt nhất ......................
2.3.3. Phƣơng Pháp dựa ttrên
rên sự khác biệt hƣớng nguồn sáng ............... 50

2.3.4. Phƣơng pháp xác định hƣớng ánh sáng theo đƣờng biên ............ 53
2.3.4.1. Loại bỏ các đối tƣợng nhỏ, nhiễu và làm mảnh biên .......... 56
................. ......... 56
2.3.4.1.1. Loại bỏ các đối tƣợng nhỏ và nhiễu ..........................

2.3.4.1.2. Làm mảnh biên và nối nét đứ
đứtt ...............................
............... ....................
.... 56

2.3.4.2. Lựa chọn các đoạn biên liên thông của đối tƣợng dùng ƣớc

lƣợng hƣớng nguồn sáng ................................................................... 59
2.3.4.3. Xây dựng thuật toán xác định hƣớng ánh sáng trên mỗi
đƣờng biên ......................................................................................... 60
2.3.4.4. Kết quả thực nghiệm ............................................................ 61
2.4. Phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán dựa vào thuật toán SIFT.
 ......................................................................................................................... 64
............... .......................
...... 84
2.5. So sánh một số kỹ thuật phát hiện ảnh giả m
mạo
ạo ................................

CHƢƠNG 3: CHƢƠNG TRÌNH THỰC NGHIỆM
 NGHIỆM........................................ 85
3.1. Bài toán .................................................................................................... 85
................ .................................
................... 86
3.2. Mô hình bài toán phát hiện ảnh giả mạo ................................

3.3. Chƣơng trình phát hiện ảnh kỹ thuật số giả mạo FImage 1.0 ..................
................. . 86
3.3.1. Cài đặt chƣơng trình ..................................................................... 86
3.3.2. Kết quả thực nghiệm .................................................................... 87
PHẦN KẾT LUẬN ......................................................................................... 90
TÀI LIỆU THAM KHẢO


 


 

CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT 
2D
3D

2 Dimensions (Không gian 2 chiều) 
3 Dimensions (Không gian 3 chiều) 

ADC
CPU
DoG
H
IC
LoG
RAM
RANSAC
SIFT
SVD

Analog to Digital Converter
Control Processing Unit
Difference of Gaussians
Homography
Inconsistency Coefficient
Laplacian of Gaussian
Random Access Memory
RANdom Sample Consensus algorithm
Scale Invarian Feature Tranorms

Singular Value Decomposition


 

 

DANH MỤC HÌNH ẢNH 
Trang
Hình 1.1- Biểu diễn ảnh bằng hàm  f ( X , Y )  ....................................................... 3
Hình 1.2 - Ma trận 8 láng giềng ........................................................................ 6
Hình 1.3 - Các bƣớc cơ bản trong xử lý ảnh số .............................................. 10
Hình 1.4 - Các thành phần cơ bản của một hệ xử lý ảnh ...............................
............... .................. 14
Hình 1.5 - Sơ đồ phân tích ảnh ...................................................................... 15
Hình 1.6 –  Làm trơn ảnh ................................................................................. 20
Hình 1.7 - Minh họa về việc giả mạo ảnh [3] ................................................. 26
Hình 1.8 - Ghép ảnh từ 2 ảnh riêng rẽ [3] ................................
............... .................................
.......................
....... 28
Hình 1.9 - Ảnh che phủ và bỏ đi đối tƣợng [16] .................................
................. ............................
............ 29
Hình 1.10 - Ảnh bổ sung đối tƣợng [16] ..........................................................
........................................................ 29
Hình 1.11 - Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến
tranh [18] ......................................................................................................... 30
Hình 1.12 - Ảnh giả của John Kerry và Jane Fonda đƣ
đƣợc

ợc cắt/dán từ hai ảnh

riêng lẻ. [16] .................................................................................................... 31
Hình 1.13 - Ảnh giả mạo Tổng thống Bush đọc sách ngƣợc [18] ..................
................. . 31
Hình 1.14 - Dàn khoan dầu, bão và sét [18] ................................................... 32
Hình 1.15 - Ảnh giả của Holmes với nam diễn viên Tom Cruise đƣợc cắt/dán

từ tạp chí bao gồm hiển thị Kimo với nữ diễn viên Katie Holmes [16] ......... 33
Hình 1.16 - Cá mập tấn công trực thăng [18] ................................................. 33
Hình 1.17 - Con mèo trắng khổng lồ [18] ................................
............... .................................
.......................
....... 34
Hình 1.18 - Sóng Thần ở Thái Lan [18] ......................................................... 35
Hình 1.19 - Sơ đồ việc phát hiện giả mạo dựa vào cơ sở dữ liệu [3] ............. 36
Hình 1.20 - Sự khác biệt của các hƣớng nguồn sáng khác nhau [8]. ............. 37


 

 

Hình 2.1 - Minh họa cho việc tìm kiếm khối bao của thuật toán Exact Match
 ......................................................................................................................... 38
Hình 2.2 - Mô hình ánh xạ các điểm ảnh từ ảnh gốc sang ảnh đích [3] ......... 40
Hình 2.3 - Minh họa hƣớng nguồn sáng và pháp tuyến bề mặt của đối tƣợng
 ......................................................................................................................... 45
Hình 2.4 - Hai đối tƣợng đƣợc chiếu bởi 1 nguồn sáng ở gần [8]. .................
................ . 47

Hình 2.5 –  Quả cầu hiển thị 3 nguồn sáng khác nhau trong khoảng từ –  20
 200

tới +200 ............................................................................................................ 48
Hình 2.6 –  Hƣớng nguồn sang từ bên trái sang .............................................. 50
Hình 2.7 - Ảnh ghép giữa căn nhà và cây thông có nguồn sáng khác nhau  ... 51
Hình 2.8 - Sơ đồ chức năng phát hiện ảnh giả mạo .................................
................. .......................
....... 52
Hình 2.9 - Kết quả đạo hàm theo 2 hƣớng x và y ........................................... 54
Hình 2.10 - Kết quả minh họa tính độ lớn biên .............................................. 54
Hình 2.11 –  Hƣớng pháp tuyến ....................................................................... 55
Hình 2.12 - Minh họa các liên thông theo 4, 8, 6 láng giềng ........................ 56
Hình 2.13 - Minh họa các điểm đƣợc đánh dấu để xóa [2]. ........................... 56
Hình 2.14 - Lân cận 8 của điểm p1 ................................................................. 57
Hình 2.15 - Minh họa các điểm đƣợc đánh dấu để nối nét đứt [2] .................
................ . 58
Hình 2.16 - Ảnh minh họa để xem có giả mạo không ................................
................ ....................
.... 61
Hình 2.17 - Ảnh minh họa kết quả xác định hƣớng ánh sáng trên bức ảnh là

khác nhau nên đây là ảnh giả mạo dạng cắt/dán  .................................
................. ............................
............ 61
Hình 2.18 –  Chỉ ra hƣớng nguồn sáng khác nhau bằng mũi trên ................... 62
Hình 2.19 –  Hình gốc chƣa cắt/dán, chỉ có 1 nguồn sáng duy nhất 125 0 ....... 62
Hình 2.20 –  Hình gốc chƣa cắt/dán, chỉ có 1 nguồn sáng duy nhất 80 0 ......... 63
Hình 2.21 - Minh họa kết quả xác định hƣớng ánh sáng trên bức ảnh gi
giảả mạo


có sẵn [15]. ...................................................................................................... 63
Hình 2.22 - Xây dựng một không gian tỷ lệ [9] ............................................. 65


 

 

Hình 2.23 - Các giá tr ị cực đại và cực tiểu của các ảnh DoG
D oG .........................
................ ......... 66
Hình 2.24 –  Hình ảnh ban đầu để xác định điểm khóa ...............................
............... ....................
.... 70
Hình 2.25 - Minh họa mô tả 4099 điểm khóa tìm đƣợ c.
c. ................................ 70
Hình 2.26 –  Trƣớc khi định vị điểm hấ p dẫn ................
................................
.................................
................... 71
Hình 2.27 - Sau khi định vị điểm hấp dẫn ..................................................... 72
Hình 2.28 - Tính độ lớn và hƣớng của gradient ...............................
............... ...............................
............... 74
74
Hình 2.29 - Bộ mô tả điểm khóa ..................................................................... 75
Hình 2.30 –  Kết quả thu đƣợc từ thuật  toán Sift và kết hhợp
ợp với nhiều điểm
khóa ................................................................................................................. 78

Hình 2.31 - Gán cho mỗi điểm khóa cho một nốt (cluster). ...........................
............... ............ 79
Hình 2.32 –  Tách điểm khóa thành các cụm Agglomerative ......................... 79
Hình 2.33 - Cách nhóm các cụm lại với nhau [15] ................................
............... ..........................
......... 80
Hình 2.34 –  Kế quả thu đƣợc là hình bị giả mạo ................................
................ ............................
............ 83
Hình 2.35 –  Kết quả thu đƣợc là hình bị nhân bản llên
ên thành 3 đối tƣợng

giống nhau [16] ............................................................................................... 83
Hình 3.1 - Sơ đồ chức năng phát hiện ảnh giả mạo [16] ................................ 86
Hình 3.2 - Ảnh minh họa để xem có giả mạo không ................................
............... .......................
...... 87
Hình 3.3 - Ảnh minh họa kết quả xác định hai đối tƣợng là giống nhau nên

đây là ảnh giả mạo dạng cắt/dán ..................................................................... 87
Hình 3.4 - Ảnh minh họa để xem có giả mạo không ................................
............... .......................
...... 88
Hình 3.5 - Ảnh minh họa kết quả xác định hai đối tƣợng là giống nhau nên

đây là ảnh giả mạo dạng cắt/dán ..................................................................... 88
Hình 3.6 –  Hai hình giả mạo trong cuộc thi “Worth1000 Photoshop”. Mỗi

hình ảnh đƣợc cắt/dán cùng một ngƣời [16]. .................................................. 89



 

 

DANH MỤC BẢNG BIỂU 
Trang

Bảng 1- So sánh ƣu, nhƣợc điểm của một số kỹ thuật phát hiện ảnh giả mạo ... 27


 

 
1

PHẦN MỞ  ĐẦU

Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật
của khoa học công nghệ  đƣợc ứng dụng vào thực tế và ảnh số chính là một
trong những thành quả đó. Ảnh số ngày càng dễ sửa chữa và hiệu chỉnh do
sức mạnh của các phần mềm soạn thảo và xử lý ảnh mà điển hình là
PhotoShop. Ngày nay, các chƣơng trình xử lý ảnh có thể thêm vào hoặc bỏ đi
các đặc trƣng của ảnh mà không để lại
lại các dấu hiệu về sự giả mạo. Điều đó
có nghĩa việc phát hiện ra ảnh giả mạo là vấn đề phải đặt ra ngày càng cấp
 bách và càng trở nên khó khăn. 
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã đƣợc công nhận  
 bởi cộng đồng các nhà nghiên cứu, nhƣng hiện nay rất ít tài liệu có giá trị về
lĩnh vực này. Nhất là trong điều kiện Việt Nam, chƣa có nhiều những nghiên

cứu này, trong khi thực tế đặt ra những nhu cầu, đòi hỏi. 
Xuất phát trong hoàn cảnh đó, luận văn lựa chọn đề tài “Phát hiện ảnh
kỹ thuật số giả mạo dạng cắt/dán” nhằm nghiên cứu một số kỹ thuật phát hiện
ảnh kỹ thuật số giả mạo đƣợc tạo ra bởi việc sử dụng các chƣơng trình xử lý
ảnh thông dụng, thông qua việc cắt/dán từ chính một ảnh và có sự thay đổi về
kích thƣớc đối với các đối tƣợng bị cắt/dán. Đây cũng chính là cách thƣờng
đƣợc các đối tƣợng sử dụng trong quá trình tạo ảnh số giả nhờ
kỹ thuật cắt/dán. 
* Nội dung chính của luận văn gồm:
- Phần mở đầu. 
- Chƣơng 1: Khái quát về xử lý ảnh và ảnh giả mạ o: Chƣơng này đề

cập đến các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh và các khái
niệm cơ bản về ảnh giả mạo. 


 

 
2

- Chƣơng 2:  Một số kỹ thuật phát hiện ảnh giả mạo: Chƣơng này

gồm các khái niệm cơ bản về các bài toán và một số phƣơng pháp để phát  
hiện ảnh kỹ thuật số giả mạo.
Trên cơ sở các thuật toán đã tìm hiểu và   áp dụng thuật toán để phát
hiện ảnh kỹ thuật số giả mạo dạng cắt/dán. 

- Chƣơng 3:  Xây dựng chƣơng trình thực nghiệm: Tiến hành xây


dựng chƣơng trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dạng
cắt/dán.
- Phần kết luận. 


 

 
3

 LÝ ẢNH VÀ ẢNH GIẢ MẠO
CHƢƠNG 1: KHÁI QUÁT VỀ XỬ  LÝ
1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh. 
1.1.1. Xử lý ảnh là gì ?
Con ngƣời thu nhận thông tin qua các giác quan trong đó thị giác đóng
vai tr ò quan trọng nhất vì 80% thông tin đƣợc thu nhận  bằng mắt tức là ở

dạng ảnh. Mặt khác với sự phát triển mạnh mẽ của phần cứng máy tính, xử lý
ảnh, đồ hoạ ngày càng có nhiều ứng dụng thực tiễn phục vụ cuộc sống. Nhƣ
vậy, xử lý ảnh đóng một vai trò rất quan trọng trong sự tƣơng tác giữa ngƣời
và máy.

Cũng nhƣ xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của
tin học ứng dụng. Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo,
các ảnh này đƣợc xem xét nhƣ là một cấu trúc dữ liệu và đƣợc tạo ra   bởi
bởi các
chƣơng trình. Xử lý ảnh số [2] bao gồm các phƣơng pháp và kĩ thuật để biến
đổi, để truyền tải hoặc mã hoá các ảnh tự nhiên.
1.1.2. Biểu diễn ảnh số


Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh đƣợc biểu diễn bằng một
hàm cƣờng độ sáng hai chiều  f ( X , Y ) , trong đó  X , Y  là các giá trị toạ độ không
gian và hàm giá trị của

 f    tại

một điểm

( X , Y ) bất

kỳ sẽ tỷ lệ với độ sáng hay

mức xám của điểm ảnh tại điểm này. [2,3]

* P(X,Y)

Hình 1.1- Biểu diễn ảnh bằng hàm  f ( X , Y )  

Trong một số trƣờng hợp hàm ảnh còn đƣợc biểu diễn với một trục thứ 3
gọi là hàm cƣờng độ sáng (với hình 1.1, trục thứ 3 bằng 0). 


 

 
4

Một ảnh số là một ảnh  f ( X , Y )   đƣợc gián đoạn theo không gian và
cƣờng độ sáng. Một ảnh số đƣợc xem nhƣ một ma trận với hàng và cột biểu
diễn một điểm trong ảnh và giá trị điểm ma trận tƣơng ứng với mức xám tại

điểm đó. Các phần tử của một dãy số nhƣ thế đƣợc gọi là các điểm ảnh.
Ánh sáng có dạng năng lƣợng  f ( X , Y )  phải
 phải khác 0 và hữu hạn: 
0   f ( X , Y )  

(1.1)  

Con ngƣời có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các
vật thể. Cơ sở của  f ( X , Y )  đƣợc đặc trƣng qua hai thành phần:
- Số lƣợng ánh sáng nguồn rơi trên cảnh vật đƣợc nhìn thấy. 
- Số lƣợng ánh sáng nguồn phản xạ từ vật thể ( trong cảnh vật). 

Chúng đƣợc gọi gần đúng là sự phát sáng và các thành phần phản xạ, và
đƣợc biểu diễn tƣơng ứng là i( X , Y )  và r ( X , Y ) . Bản chất của i( X , Y )  đƣợc xác
định bằng nguồn sáng và của r ( X , Y ) đƣợc xác định bằng các đặc trƣng của
vật thể. Hàm i( X , Y )  và r ( X , Y )  kết hợp với nhau để cho hàm  f  ( X , Y )  
 f ( X , Y )  i ( X , Y ) r ( X , Y )

Với:

(1.2)

( 0  i ( X , Y )  

 

0  r ( X , Y )  1 )

Ở đây ta gọi cƣờng độ sáng của một ảnh đen trắng tại tọa độ ( X , Y )   là
1.3), (1.4) , l   nằm trong khoảng: 

mức xám (l )  của ảnh tại điểm đó. Từ (1.2), (1.3),
 Lmin  l  Lmax
 
(1.3)  

Trong lý thuyết, chỉ cần  Lmin    0  và  Lmax hữu hạn. Trong thực tế: 
 Lmin  imin r min
 Lmax  imax r max

(1.4)

 

Sử dụng các giá trị chiếu sáng và phản xạ đã đƣợc tổng kết qua thực
nghiệm hoặc xem là các giá trị cơ bản  Lmin  0.005, Lmax  100   cho xử lý
ảnh. 


 

 
5

Khoảng  Lmin , Lmax    đƣợc gọi là thang xám. Ta có thể dịch khoảng này
 0  là đen và l  L  là trắng trong thang xám. Giá trị tức
đến 0,
0, L
 L , trong đó l   

thời là các dạng mức xám thay đổi liên tục từ đen đến trắng. 

1.1.3. Một số khái niệm cơ sở trong xử lý ảnh 
Để có thể xử lý bằng máy tính điện tử thì ảnh cần phải đƣợc số hóa. Đó là

quá trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc
lấy mẫu và lƣợng tử hóa. Trong quá trình này ngƣời ta sử dụng khái niệm
“pixel”. Mỗi pixel đƣợc đặc trƣng bởi một cặp tọa độ ( X , Y )   và màu sắc của
nó.[4]
 

Ảnh:  Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một

mảng hai chiều  I 

  có n   dòng và  p   cột, ảnh sẽ có n  p (pixel). Ta ký

( n, p )

hiệu I   ( X ,Y ) để chỉ điểm ảnh có toạ độ ( X , Y ) . 
 

Điểm ảnh: 
Gốc của ảnh là ảnh liên tục về không gian và độ sáng. Để xử lý bằng

máy tính, ảnh cần phải đƣợc số hoá.
Số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập điểm
 phù hợp với ảnh  thật về vị trí (không gian) và độ sáng (mức xám). Khoảng
cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời không phân biệt
đƣợc ranh giới giữa chúng.
Mỗi một điểm nhƣ vậy gọi là điểm ảnh (PEL: Picture Element [20])
hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel ứng với cặp tọa

độ (x,y). 
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc
chọn thích hợp sao cho mắt ngƣời cảm nhận sự liên tục về không gian và mức


 

 
6

xám (hoặc màu) của ảnh số gần nhƣ ảnh thật. Mỗi phần tử trong ma trận đƣợc
gọi là một phần tử ảnh. 
 

Các điểm 4 láng giềng:
Giả sử (i,j) là một điểm ảnh, khi đó các điểm 4 - láng giềng là:
 N4 = {(i-1, j); (i+1, j); (i, j-1); (i, j+1)}

 

Các điểm 8 láng giềng:
 N8 = N4   {(i-1,j-1);
 {(i-1,j-1); (j-1, j+1); (i+1, j-1); (i+1, j+1)}

P3 

P2 

P1 


P4 

P

P0

P5 

P6 

P7 

Hình 1.2 - Ma trận 8 láng giềng 
 

Đối tƣợng ảnh:
Ta chỉ xét tới ảnh nhị phân vì mọi ảnh đều có thể đƣa về dạng nhị phân

 bằng kỹ thuật phân ngƣỡng. Ký hiệu F là tập các điểm vùng, F là tập các
điểm nền. 
F: là điểm đen 
F : là điểm trắng 
Quan hệ K liên thông (K = 4, 8) là một quan hệ phản xạ, đối xứng, bắc
cầu, là quan hệ tƣơng đƣơng. Mỗi lớp tƣơng đƣơng của nó biểu diễn một
thành phần K liên thông của ảnh. Về sau ta gọi mỗi thành phần K liên thông
của ảnh là một đối tƣợng ảnh. 
 

Kỹ thuật phóng to, thu nhỏ ảnh: 

Khi ảnh quá lớn chúng ta muốn nhìn toàn bộ ảnh thì chúng ta phải thu

nhỏ ảnh lại và ngƣợc lại khi ta muốn xem chi tiết một bộ phận nào đó của ảnh
thì ta phải phóng to nó lên. 


 

 
7

+ Kỹ thuật phóng to ảnh: 
Khi phóng to ảnh với một tỉ lệ k   nào đó ta thu đƣợc ảnh mới to gấp k  
lần ảnh cũ (k  là độ phóng của ảnh) nhƣ thế ảnh mới sẽ có kích thƣớc là : 
 Height = Height * k
Width = Width * k

Việc tính các điểm ảnh tƣơng ứng của ảnh mới sẽ đƣợc tính theo
công thức: 
 xp=x/k
 yp=y/k

+ Kỹ thuật thu nhỏ ảnh: 
Tƣơng tự nhƣ phóng to ảnh, khi thu nhỏ ảnh ta thu đƣợc ảnh mới giống
ảnh cũ nhƣng có kích thƣớc nhỏ hơn ảnh cũ. Kích thƣớc của ảnh mới là :  
 Height=Height/k
Width=Width/k

Việc tính các điểm ảnh tƣơng ứng của ảnh mới sẽ đƣợc tính theo
công thức: 

 xp = x*k
 yp = y*k
 

Mức xám  (Gray level): Đó là kết quả của việc mã hóa, cho tƣơng ứng

một cƣờng độ sáng của mỗi điểm ảnh với một giá trị số, có thể là
16, 32, 64 mức. 
 

Biểu diễn ảnh:
ảnh: Trong biểu diễn ảnh ngƣời ta thƣờng sử dụng các phần

tử đặc trƣng của ảnh là pixel. Một hàm hai biến chứa các thông tin nhƣ một
 biểu diễn ảnh. Một số mô hình thƣờng dùng để biểu diễn ảnh là mô hình toán
(biểu diễn ảnh nhờ các hàm  cơ sở), mô hình thống kê (ảnh coi nhƣ một phần
tử của một tập hợp đặc trƣng bởi kỳ vọng toán, hiệp biến, phƣơng sai,
moment…).[2]


 

 
8

 

Tăng cƣờng ảnh:
ảnh: Đây là một bƣớc quan trọng bao gồm các kỹ thuật


lọc độ tƣơng phản, khử nhiễu, nổi màu…. 
 

Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng

các kỹ thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích
Kronecker.
 

Phân tích ảnh:
ảnh: Liên quan tới việc xác định các độ đo định lƣợng của

một ảnh để đƣa ra một mô tả đầy đủ về ảnh. Có những kỹ thuật cơ bản để hỗ
trợ phân tích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân
vùng ảnh [2]
 

Nhận dạng ảnh:
ảnh: Quá trình này liên quan đến các mô tả đối tƣợng mà

ngƣời ta muốn đặc tả nó. Nhận dạng ảnh thƣờng đi sau các quá trình trích
chọn các đặc trƣng chủ yếu của đối tƣợng. 
 Nhận dạng tự động (automatic recognition), mô tả đối tƣợng, phân loại và
 phân nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, đƣợc ứng
dụng trong nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra
r a là:
mẫu (pattern) là gì? Watanabe, một trong những ngƣời đi đầu trong lĩnh vực
này đã định nghĩa: “Ngƣợc lại với hỗn loạn (chaos), mẫu là một thực thể
(entity), đƣợc xác định một cách mơ hồ   (vaguely defined) và có thể gán cho


nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật
nào đó đƣợc chụp, một chữ viết, khuôn mặt ngƣời hoặc một ký đồ tín hiệu
tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu
đó có thể: 
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích
 phân biệt (discriminant analyis), trong đó mẫu đầu vào đƣợc định danh nhƣ
một thành phần của một lớp đã xác định. Hoặc phân loại không có mẫu
(unsupervised classification hay clustering) trong đó các mẫu đƣợc gán vào 


 

 
9

các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó. Các lớp này cho
đến thời điểm phân loại vẫn chƣa biết hay chƣa đƣợc định danh. 
Hệ thống nhận dạng tự động bao gồm ba khâu tƣơng ứng với ba giai đoạn
chủ yếu sau đây: 
- Thu nhận dữ liệu và tiền xử lý. 
- Biểu diễn dữ liệu. 
-  Nhận dạng, ra quyết định. 

Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là: 
- Đối sánh mẫu dựa trên các đặc trƣng đƣợc trích chọn. 
- Phân loại thống kê. 
- Đối sánh cấu trúc. 
- Phân loại dựa trên mạng nơ -ron nhân tạo. 
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận


đơn lẻ để phân loại “tối ƣu” do vậy cần sử dụng cùng một lúc nhiều phƣơng
 pháp và cách tiếp cận khác nhau. Do vậy, các phƣơng thức phân loại tổ hợp
hay đƣợc sử dụng khi nhận dạng và nay đã có những kết quả có triển vọn g
dựa trên thiết kế các hệ thống lại (hybrid system) bao gồm nhiều mô hình

kết hợp. 
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy
sinh trong cuộc sống không chỉ tạo ra những thách thức về thuật giải, mà còn
đặt ra những yêu cầu về tốc độ tính toán. Đặc điểm chung của tất cả những
ứng dụng đó là những đặc điểm đặc trƣng cần thiết thƣờng là nhiều, không
thể do chuyên gia đề xuất, mà phải đƣợc trích chọn dựa trên các thủ tục phân
tích dữ liệu. 


 

 
10

1.1.4. Các giai đoạn trong xử lý ảnh 
Bài toán xử lý ảnh bao gồm các giai đoạn tổng quát nhƣ sau:  

Scanner,
Camera

Thu nhận
ảnh 

Biểu diễn 


Phân đoạn 

Tiền xử lý 

Cơ sở tri thức 

 Nhận dạng
và nội suy 

Kết quả 

Hình 1.3 - Các bƣớc cơ bản trong xử lý ảnh số 

1.1.4.1. Thu nhận ảnh 

Đây là bƣớc đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này,
ta cần có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục đƣợc sinh ra
 bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu,
máy quét ảnh, ... Trong trƣờng hợp bộ thu ảnh cung cấp chƣa phải là dạng số
hoá ta
ta ccòn
òn phải chuyển đổi hay số hoá ảnh.
Quá trình chuyển đổi ADC (Analog
(Analog to Digit
Digital
al Converter) để thu nhận
dạng số hoá của ảnh. Các thông số quan trọng ở bƣớc này là độ phân giải,
chất lƣợng màu, dung lƣợng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị.
Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh hƣởng rất
nhiều đến công đoạn kế tiếp.

1.1.4.2. Tiền xử lý 

Ở bƣớc này, ảnh sẽ đƣợc cải thiện về độ tƣơng phản, khử nhiễu, khử
 bóng, khử độ lệch,v.v… với mục đích làm cho chất lƣợng ảnh trở nên tốt hơn
nữa, chuẩn bị cho các bƣớc xử lý phức tạp hơn về sau trong quá trình xử lý
ảnh. Quá trình này thƣờng đƣợc thực hiện bởi các bộ lọc. 


 

 
11

+

Khử nhiễu:  Nhiễu đƣợc chia thành hai loại: nhiễu hệ thống và nhiễu

ngẫu nhiên. Đặc trƣng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể
khử nhiễu này bằng việc  sử dụng phép biến đổi Fourier và loại bỏ các đỉnh
điểm. Đối với nhiễu ngẫu nhiên, trƣờng hợp đơn giản là các vết bẩn tƣơng
ứng với các điểm sáng hay tối, có thể khử bằng phƣơng pháp nội suy, lọc
trung vị và trung bình. 
+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng
đều của thiết bị thu nhận hoặc độ tƣơng phản giữa các vùng ảnh.
+ Chỉnh tán xạ: Ảnh thu nhận đƣợc từ các thiết bị quang học hay điện
tử có thể bị mờ, nhoè. Phƣơng pháp biến đổi Fourier dựa trên tích chập của
ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này. 
1.1.4.3. Phân đoạn ảnh 
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác


nhau hay còn gọi là các đối tƣợng để biểu diễn phân tích, nhận dạng ảnh. Ví
dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thƣ cho mục đích phân
loại bƣu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên ngƣời thành các từ,
các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ
độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều
vào công đoạn này. 
Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều
 phần tử khác nhau cấu tạo lên ảnh thô. Vì lƣợng thông tin chứa trong ảnh rất
lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trƣng nào
đó, do vậy cần có một quá trình để giảm lƣợng thông tin khổng lồ đó. Quá
trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu. 


 

 
12

1.1.4.4. Hệ quyết định 

Ảnh là một đối tƣợng khá phức tạp về đƣờng nét, độ sáng tố i, dung
lƣợng điểm ảnh, môi trƣờng để thu ảnh phong phú kéo theo nhiễu.
Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
 phƣơng pháp toán học đảm bảo tiện lợi cho xử lý, ngƣời ta mong muốn bắt
chƣớc quy trình tiếp nhận và xử lý ảnh theo cách của con ngƣời. Trong các
 bƣớc xử lý đó, nhiều khâu
kh âu hiện nay đã xử lý theo các phƣơng pháp trí tuệ con
ngƣời. Vì vậy, ở đây các cơ sở tri thức đƣợc phát huy.

1.1.4.5. Trích chọn đặc điểm 

Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt
ra những yêu cầu về tốc độ tính toán.
Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc trƣng
cần thiết thƣờng là nhiều, không thể do chuyên gia đề xuất, mà phải đƣợc
trích chọn dựa trên các thủ tục phân tích dữ liệu.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tƣợng ảnh chính xác, với tốc độ tính toán cao và dung lƣợng nhớ lƣu trữ
giảm xuống.
Các đặc điểm của đối tƣợng đƣợc trích chọn tuỳ theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh
sau đây:
- Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ,

điểm uốn v.v..
- Đặc điểm biến đổi: các đặc điểm loại này đƣợc trích chọn bằng việc

thực hiện lọc vùng (zonal filtering). Các bộ vùng đƣợc gọi là “mặt nạ đặc
điểm” (feature mask) thƣờng là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn v.v..)


 

 
13

- Đặc điểm biên và đƣờng biên: Đặc trƣng cho đƣờng biên của đối


tƣợng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến đƣợc
dùng khi nhận dạng đối tƣợng. Các đặc điểm này có thể đƣợc trích chọn nhờ
toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không”
(zero crossing) ..
1.1.4.6. Nhận dạng 
 Nhận dạng ảnh là quá trình xác định
định nội dung ảnh.
Quá trình này thƣờng thu đƣợc bằng cách so sánh với mẫu chuẩn đã
đƣợc lọc (hoặc lƣu) từ trƣớc. 
Đây là bƣớc cuối cùng trong quá trình xử lý ảnh.
 Nhận dạng ảnh có thể đƣợc nhìn nhận một cách đơn giản là việc gán
nhãn cho các đối tƣợng trong ảnh. Ví dụ nhƣ khi nhận dạng chữ viết, các đối
tƣợng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ
đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tƣơng ứng cho các mẫu
chữ thu đƣợc trong ảnh. Giải thích là công đoạn gán nghĩa cho một tập các
đối tƣợng đã đƣợc nhận biết. 
Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý
ảnh nào cũng bắt buộc phải tuân theo tất cả các bƣớc xử lý đã nêu ở trên, ví
dụ nhƣ các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bƣớc tiền xử lý.
Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng
và giải thích thƣờng chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán
tự động, đƣợc dùng để rút trích ra những thông tin quan trọng từ ảnh, ví dụ
nhƣ các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v… 
Để xử lý các quá trình trên thì cần một hệ thống xử lý ảnh bao gồm một
số thành phần cơ bản sau đây: 


×