Tải bản đầy đủ (.doc) (105 trang)

Thuật toán phát hiện ảnh giả mạo dạng cắt dán dựa trên các phép biến đổi ma trận

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.16 MB, 105 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

NGUYỄN HỒNG HẠNH

THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
DẠNG CẮT - DÁN DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI MA TRẬN

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN - 2014
Số hóa bởi Trung tâm Học liệu

/>

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN
THÔNG

NGUYỄN HỒNG HẠNH

THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
DẠNG CẮT - DÁN DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI MA TRẬN
Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60 48 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


HƯỚNG DẪN KHOA HỌC: PGS.TS PHẠM VĂN ẤT

THÁI NGUYÊN - 2014
Số hóa bởi Trung tâm Học liệu

/>

i

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ khoa học máy tính: “Thuật toán
phát hiện ảnh giả mạo dạng cắt - dán dựa trên các phép biến đổi ma trận” là
kết quả của quá trình học tập, nghiên cứu khoa học độc lập, nghiêm túc.
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, đợc
trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình
nghiên cứu đã được công bố, các website, …
Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận
và quá trình nghiên cứu tìm hiểu của tác giả.

Thái Nguyên, tháng năm 2014
Tác giả

Nguyễn Hồng Hạnh

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/



ii

LỜI CẢM ƠN
Lời đầu tiên tôi xin gửi lời cảm ơn thầy PGS. TS. Phạm Văn Ất đã tận
tình giúp đỡ tôi trong suốt thời gian học tập vừa qua, đặc biệt là định hướng
nghiên cứu và tận tình hướng dẫn cho tôi trong suốt quá trình làm luận v ăn.
Nếu không có sự giúp đỡ tận tình của thầy, tôi khó có thể hoàn
thành luận văn này.
Bên cạnh đó tôi cũng xin chân thành cảm ơn các thầy cô T r ư ờ
ng Đ ạ i h ọ c Công nghệ Thông tin & T r u y ề n t h ô n g đã tận tình
giảng dạy, chỉ bảo và cung cấp cho tôi những kiến thức cần thiết trong
suốt thời gian học và cũng xin gởi lời cám ơn chân thành đến những
người thân, bạn bè và đồng nghiệp đã giúp đỡ và động viên tôi trong
suốt thời gian học tập cũng như trong thời gian thực hiện luận văn.
Chân thành cảm ơn !

Thái Nguyên, tháng năm 2014
Tác giả

Nguyễn Hồng Hạnh

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/


iii

MỤC LỤC

LỜI CAM ĐOAN .............................................................................................i
LỜI CẢM ƠN ...................................................................................................................ii
MỤC LỤC......................................................................................................................... iii
DANH

MỤC

HÌNH

VẼ

..................................................................................................iv

MỞ

ĐẦU

.............................................................................................................................1
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÀN PHÁT
HIỆN
ẢNH GIẢ MẠO.................................................................................................................3
1.1.
TỔNG
QUAN
VỀ
ẢNH...............................................................................3

XỬ




1.1.1.
Xử

ảnh
gì?..........................................................................................................3
1.1.2.
Các
khái
niệm

ảnh.....................................................................9

bản

1.1.3.
Các
vấn
đề

bản
..........................................................................9



trong

trong

xử


xử



1.1.4.
Một
số
định
dạng
biến..............................................................................12

ảnh

1.2.
BÀI
TOÁN
PHÁT
...........................................................17

GIẢ

HIỆN

ẢNH

1.2.3. Các cách tiếp cận
....................................................21

trong


mạo

phát

hiện

MẠO
giả


ảnh

ảnh
phổ

1.2.1.
Ảnh
mạo.............................................................................................................17
1.2.2.
Các
loại
ảnh
giả
..................................................................................17



bản
giả


mạo

CHƯƠNG 2: THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT DÁN ....................................................................................................................................24
2.1. THUẬT TOÁN ĐỐI SÁNH CHÍNH XÁC (EXACT MATCH) PHÁT
HIỆN
Số hóa bởi Trung tâm Học
liệu

/>

iii

ẢNH
GIẢ
MẠO
DẠNG
DÁN............................................................................24

CẮT

2.1.1.
tưởng.....................................................................................................................24
2.1.2.
toán................................................................................................................25

Ý
Thuật

2.1.3.

Phân
tích
thuật
.................................................................................................26

toán

2.1.4.

dụ
minh
........................................................................................................26

họa

2.2. THUẬT TOÁN ĐỐI SÁNH BỀN VỮNG (ROBUST MATCH) PHÁT HIỆN
ẢNH GIẢ MẠO DẠNG CẮT - DÁN DỰA TRÊN PHÉP BIẾN ĐỔI COSIN
RỜI

RẠC

(DCT

-

Discrete

transform).........................................................................35

Số hóa bởi Trung tâm Học

liệu

tnu.edu.vn/

cosine


2.2.1. Ý tưởng.....................................................................................................................38
2.2.2. Thuật toán.................................................................................................................39
2.2.3. Phân tích thuật toán
................................................................................................44
2.3. THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT - DÁN
DỰA TRÊN PHÉP BIẾN ĐỔI DWT (Discrete Wavelet Transform)
...................................45
2.3.1. Ý tưởng.....................................................................................................................48
2.3.2. Thuật toán.................................................................................................................49
2.3.3. Phân tích thuật toán
.................................................................................................54
2.4. SO SÁNH CÁC PHƯƠNG PHÁP PHÁT HIÊN ẢNH GIẢ MẠO DẠNG
CẮT
- DÁN..................................................................................................................................55
CHƯƠNG 3: PHẦN MỀM THỬ NGHIỆM.............................................................56
3.1. PHÂN TÍCH YÊU CẦU BÀI TOÁN
.....................................................................56
3.2. TẠO ẢNH GIẢ MẠO...............................................................................................56
3.3. SƠ ĐỒ CHUNG CỦA THUẬT TOÁN ĐỐI SÁNH CHÍNH XÁC (exact
match)..................................................................................................................................57
3.4. SƠ ĐỒ CHUNG CỦA THUẬT TOÁN ĐỐI SÁNH BỀN VỮNG (robust
match)..................................................................................................................................58
3.5. LỰA CHỌN CÔNG CỤ

...........................................................................................59
3.6. MÔI TRƯỜNG CÀI ĐẶT VÀ XÂY DỰNG CÁC
HÀM...................................60
3.7. KẾT QUẢ THỰC NGHIỆM....................................................................................60
3.7.1. Phần mềm đối sánh bền vững dựa trên phép biến đổi DCT
...............................61
3.7.2. Phần mềm đối sánh bền vững dựa trên phép biến đổi DWT
..............................64
Số hóa bởi Trung tâm Học
liệu

/>

KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN..................................................................67
1. KẾT LUẬN....................................................................................................................67
2. KIẾN NGHỊ ...................................................................................................................68
TÀI LIỆU THAM KHẢO .............................................................................................69

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/


iv

DANH MỤC HÌNH VẼ
Hình 1.1. Các giai đoạn trong xử lý ảnh
............................................................................4
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh

..............................................8
Hình 1.3. Quá trình nén JPEG cơ
.....................................................................................16
Hình 1.4. Minh họa về việc giả mạo ảnh
......................................................................17
Hình 1.5. Minh họa cho loại ảnh giả mạo tăng cường ảnh
...........................................18
Hình 1.6. Ảnh che phủ và bỏ đi đối tượng ..................................................................20
Hình 1.7 thể hiện một dạng khác thường thấy của giả mạo ảnh, đó là việc bổ
sung
thêm đối tượng. .................................................................................................................21
Hình 1.8. Sơ đồ phát hiện ảnh giả mạo dựa vào cơ sở dữ liệu
......................................22
Hình 1.9. Sự khác biệt của các hướng nguồn sáng khác nhau.
................................23
Hình 2.1. Đánh số thứ tự các phần tử của ma trận hệ số DCT theo đường zigzag
.....41
Hình 2.2. Vectơ dịch chuyển của vùng cắt - dán
............................................................44
Hình 2.3. Áp dụng phép biến đổi DWT theo hàng và cột
.............................................48
Hình 2.4. Áp dụng phép biến đổi DWT theo hai mức
...................................................48
Hình 2.5. Vectơ dịch chuyển của vùng cắt - dán
............................................................54
Hình 3.1 Kết quả thực nghiệm 1 phát hiện ảnh giả mạo dạng cắt dán.......................61
Hình 3.2. Kết quả thực nghiệm 2 phát hiện ảnh giả mạo dạng cắt dán......................62
Hình 3.3. Kết quả thực nghiệm 3 phát hiện ảnh giả mạo dạng cắt dán......................63

Số hóa bởi Trung tâm Học

liệu

/>

iv

Hình 3.4. Kết quả thực nghiệm 4 phát hiện ảnh giả mạo dạng cắt dán......................64
Hình 3.5. Kết quả thực nghiệm 5 phát hiện ảnh giả mạo dạng cắt – dán, ảnh giả
nén
JPEG với hệ số Q=60
........................................................................................................65
Hình 3.6. Kết quả thực nghiệm 6 phát hiện ảnh giả mạo dạng cắt - dán nhiễu 1%
....66
Hình 3.7. Kết quả thực nghiệm 7 phát hiện ảnh giả mạo dạng cắt – dán nhiễu 1%
làm mờ 1px nén JPEG Q=60
...................................................................................................66

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/


1

MỞ ĐẦU

Ngày nay, ảnh số là phương tiện truyền thông được sử dụng rộng rãi,
đóng vai trò quan trọng trong đời sống con người, có tác động đến xã hội, tham
gia vào các quá trình pháp lý và kinh tế như: làm bằng chứng trong điều tra, xử

án, bảo hiểm, gian lận khoa học,… Hơn nữa, với sự phổ biến của máy ảnh kĩ
thuật số và các phần mềm chỉnh sửa (Photoshop, GIMP,…) dẫn đến ảnh số có
thể dễ dàng được chỉnh sửa mà không cần đến các kiến thức chuyên gia và việc
chỉnh sửa hầu như không để lại dấu vết mà mắt thường có thể nhận biết được.
Kết quả là khi những hình ảnh được chỉnh sửa sử dụng cho mục đích xấu nó có
thể dẫn đến những hậu quả nghiêm trọng. Do vậy, việc phát hiện ảnh giả mạo là
vấn đề đặt ra ngày càng cấp bách và càng trở lên khó khăn.
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã được công nhận
bởi cộng đồng các nhà nghiên cứu, nhưng hiện nay số tài liệu về lĩnh vực này
vẫn chưa nhiều. Trong việc chống giả mạo ảnh, người ta đã nghiên cứu các kỹ
thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào các bức
ảnh trước khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện
cho việc phát hiện các sửa đổi hoặc cắt ghép sau này. Theo cách tiếp cận này,
các thiết bị máy ảnh số và camera ngày nay thường bổ sung các tính năng bản
quyền ngay trong quá trình thu nhận ảnh. Dựa vào đó sau này ta có thể biết được
nguồn gốc của bức ảnh, biết được đó có phải là ảnh gốc hay không? Cách tiếp
cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thay đổi thông tin bản
quyền. Tuy nhiên, hạn chế của cách tiếp cận này là thông tin bản quyền phải
được chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn với các camera số được
trang bị đặc biệt. Ngoài ra, một giải pháp khác không cần dùng đến các thông tin
nhúng vào từ trước là các phương pháp thụ động phát hiện ảnh giả mạo.
Trong các loại giả mạo thì ảnh giả mạo dạng cắt - dán tương đối phổ biến
và dễ dàng thực hiện, nên chúng đã và đang được nhiều nhà nghiên cứu quan tâm.
Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/


2


Nhận thức được ý nghĩa khoa học và tính thực tiễn của vấn đề này nên em
đã chọn đề tài “Thuật toán phát hiện ảnh giả mạo dạng cắt - dán dựa trên các
phép biến đổi ma trận” cho luận văn tốt nghiệp của mình.
* Nội dung chính của luận văn gồm:
- Phần mở đầu.
Chương 1: Tổng quan về xử lý ảnh và bài toán phát hiện ảnh giả mạo.
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, một số định dạng ảnh phổ biến như định dạng Bitmap, định
dạng JPEG, đồng thời trình bày bài toán phát hiện ảnh giả mạo.
Chương 2: Thuật toán phát hiện ảnh giả mạo dạng cắt - dán
Chương này trình bày một số phép biến đổi ma trận, giới thiệu tổng quan
về ảnh giả mạo dạng cắt - dán và phát hiện ảnh giả mạo. Bên cạnh đó trình bày
một số thuật toán phát hiện ảnh giả mạo như: Thuật toán đối sánh chính xác,
thuật toán đối sánh bền vững và thuật toán phát hiện ảnh giả mạo dạng cắt - dán
dựa trên các phép biến đổi DWT.
Chương 3: Phần mềm thử nghiệm
Tiến hành xây dựng chương trình thực nghiệm để phát hiện ảnh kỹ
thuật số giả mạo dạng cắt - dán.
Kết luận
Do thời gian và trình độ còn hạn chế nên luận văn khó tránh khỏi những
thiếu sót, kính mong nhận được sự đóng góp, chỉ bảo của các thầy giáo, cô
giáo và các bạn.

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/



3

CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÀN PHÁT HIỆN ẢNH
GIẢ MẠO
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, một số định dạng ảnh phổ biến như định dạng Bitmap, định
dạng JPEG đồng thời trình bày bài toán phát hiện ảnh giả mạo.

1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tương đối mới mẻ so với nhiều ngành khoa học
khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất
hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ thống
xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào
tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh.
Trước hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thường ảnh thu nhận qua camera là tín hiệu tương tự (loại camera ống kiểu
CCIR), nhưng cũng có thể là tín hiệu số hóa (loại-Change Coupled Device).
Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay
ảnh, tranh được quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín
hiệu liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lượng hóa, trước khi
chuyển sang giai đoạn xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trước hết là công
việc tăng cường ảnh để nâng cao chất lượng ảnh. Do những nguyên nhân khác
nhau: Có thể do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu
ảnh có thể bị suy biến. Do vậy cần phải tăng cường và khôi phục lại ảnh để làm

Số hóa bởi Trung tâm Học
liệu


tnu.edu.vn/


4

nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng
thái gốc - trạng thái trước khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện
các đặc tính như biên, phân vùng ảnh, trích chọn các đặc tính,v.v…
Cuối cùng, tùy theo mục đích của người xử dụng, sẽ là giai đoạn nhận
dạng, phân lớp hay các quyết định khác. Các giai đoạn chính trong quá trình xử
lý ảnh được mô tả qua hình 1.1.

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/


5

Thu nhận
(Camera, Scanner,
Sensor…)

Tiền xử lý (Nắn
chỉnh, xóa,
nhiễu…)

Trích chọn đặc

trưng

Lưu trữ
Hậu xử lý (Chính
xác hóa, rút gọn,
…)

Kết Luận
Hệ quyết định

Hình 1.1. Các giai đoạn trong xử lý ảnh
1.1.1.1. Thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện điều này,
ta cần có bộ thu ảnh và khả năng số hoá những tín hiệu liên tục được sinh ra
bởi bộ thu ảnh đó. Bộ thu ảnh ở đây có thể là máy chụp ảnh đơn sắc hay màu,
máy quét ảnh, ... Trong trường hợp bộ thu ảnh cung cấp chưa phải là dạng
số hoá ta còn phải chuyển đổi hay số hoá ảnh.
Quá trình chuyển đổi ADC (Analog to Digital Converter) để thu nhận
dạng số hoá của ảnh. Các thông số quan trọng ở bước này là độ phân giải,
chất lượng màu, dung lượng bộ nhớ và tốc độ thu nhận ảnh của các thiết bị.
Mặc dù đây chỉ là công đoạn đầu tiên song kết quả của nó có ảnh
hưởng rất nhiều đến công đoạn kế tiếp.

Số hóa bởi Trung tâm Học
liệu

tnu.edu.vn/


1.1.1.2. Tiền xử lý

Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khử
bóng, khử độ lệch, v.v với mục đích làm cho chất lượng ảnh trở nên tốt hơn
nữa, chuẩn bị cho các bước xử lý phức tạp hơn về sau trong quá trình xử lý
ảnh. Quá trình này thường được thực hiện bởi các bộ lọc.
+ Khử nhiễu: Nhiễu được chia thành hai loại: nhiễu hệ thống và nhiễu
ngẫu nhiên. Đặc trưng của nhiễu hệ thống là tính tuần hoàn. Do vậy, có thể
khử nhiễu này bằng việc sử dụng phép biến đổi Fourier và loại bỏ các đỉnh
điểm. Đối với nhiễu ngẫu nhiên, trường hợp đơn giản là các vết bẩn tương
ứng với các điểm sáng hay tối, có thể khử bằng phương pháp nội suy, lọc
trung vị và trung bình.
+ Chỉnh mức xám: Đây là kỹ thuật nhằm chỉnh sửa tính không đồng
đều của thiết bị thu nhận hoặc độ tương phản giữa các vùng ảnh.
+ Chỉnh tán xạ: Ảnh thu nhận được từ các thiết bị quang học hay điện
tử có thể bị mờ, nhoè. Phương pháp biến đổi Fourier dựa trên tích chập của
ảnh với hàm tán xạ cho phép giải quyết việc hiệu chỉnh này.
1.1.1.3. Phân đoạn ảnh
Phân đoạn ảnh có nghĩa là chia một ảnh đầu vào thành nhiều phần khác
nhau hay còn gọi là các đối tượng để biểu diễn phân tích, nhận dạng ảnh. Ví
dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì thư cho mục đích phân
loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên người thành các từ,
các chữ, các số (hoặc các vạch) riêng biệt để nhận dạng.
Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều
vào công đoạn này.
Mục đích của phân đoạn ảnh là để có một miêu tả tổng hợp về nhiều


phần tử khác nhau cấu tạo lên ảnh thô. Vì lượng thông tin chứa trong ảnh rất
lớn, trong khi đa số các ứng dụng chúng ta chỉ cần trích một vài đặc trưng nào
đó, do vậy cần có một quá trình để giảm lượng thông tin khổng lồ đó. Quá

trình này bao gồm phân vùng ảnh và trích chọn đặc tính chủ yếu.
1.1.1.4. Hệ quyết định
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung
lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu.
Trong nhiều khâu xử lý và phân tích ảnh ngoài việc đơn giản hóa các
phương pháp toán học đảm bảo tiện lợi cho xử lý, người ta mong muốn bắt
chước quy trình tiếp nhận và xử lý ảnh theo cách của con người. Trong các
bước xử lý đó, nhiều khâu hiện nay đã xử lý theo các phương pháp trí tuệ con
người. Vì vậy, ở đây các cơ sở tri thức được phát huy.
1.1.1.5. Trích chọn đặc điểm
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới nảy sinh
trong cuộc sống không chỉ tạo ra những thách thức về giải thuật, mà còn đặt
ra những yêu cầu về tốc độ tính toán.
Đặc điểm chung của tất cả ứng dụng đó là những đặc điểm đặc trưng
cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được
trích chọn dựa trên các thủ tục phân tích dữ liệu.
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ
giảm xuống.
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh
sau đây:
- Đặc điểm không gian: phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn v.v


- Đặc điểm biến đổi: các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn v.v..).

- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích chọn các thuộc tính bất biến được
dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ
toán tử Gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không”
(zero crossing) ...
1.1.1.6. Nhận dạng
Đây là bước cuối cùng trong quá trình xử lý ảnh.
Nhận dạng ảnh là quá trình xác định nội dung ảnh. Quá trình này
thường thu được bằng cách so sánh với mẫu chuẩn đã được lọc (hoặc lưu)
từ trước.
Nhận dạng ảnh có thể được nhìn nhận một cách đơn giản là việc gán
nhãn cho các đối tượng trong ảnh. Ví dụ như khi nhận dạng chữ viết, các đối
tượng trong ảnh cần nhận dạng là các mẫu chữ, ta cần tách riêng các mẫu chữ
đó ra và tìm cách gán đúng các ký tự của bảng chữ cái tương ứng cho các mẫu
chữ thu được trong ảnh. Giải thích là công đoạn gán nghĩa cho một tập các
đối tượng đã được nhận biết.
Chúng ta cũng có thể thấy rằng, không phải bất kỳ một ứng dụng xử lý
ảnh nào cũng bắt buộc phải tuân theo tất cả các bước xử lý đã nêu ở trên, ví
dụ như các ứng dụng chỉnh sửa ảnh nghệ thuật chỉ dừng lại ở bước tiền xử lý.
Một cách tổng quát thì những chức năng xử lý bao gồm cả nhận dạng
và giải thích thường chỉ có mặt trong hệ thống phân tích ảnh tự động hoặc bán
tự động, được dùng để rút trích ra những thông tin quan trọng từ ảnh, ví dụ


như các ứng dụng nhận dạng ký tự quang học, nhận dạng chữ viết tay v.v…
Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối
thiểu như hình sau:
Màn hình
Đồ họa


Camera

Bộ xử lý tương tự

Bộ nhớ ảnh


Bộ nhớ
ngoài
Màn hình

Màn hình đồ họa

Bộ xử lý
ảnh số

Bàn phím

Máy in

Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh
Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera như là
con mắt của hệ thống: có hai loại camera ống loại CCIR và camera CCD. Loại
camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng.
Loại CCD gồm các photo điốt và làm tương ứng một cường độ sáng tại một
điểm ảnh với một phần tử ảnh (pixel). Như vậy, ảnh là tập hợp các điểm ảnh. Số
pixel tạo nên một ảnh gọi là độ phân giải
Bộ xử lý tương tự thực hiện các chức năng sau:
- Chọn camera thích hợp nếu hệ thống có nhiều camera.
- Chọn màn hình hiển thị tín hiệu.

- Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.
- Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).
Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn
đường bao, nhị phân hóa ảnh.


Máy chủ đóng vai trò điều khiển các thành phần ở trên.
Bộ nhớ ngoài: Dữ liệu ảnh cũng như các dữ liệu khác, để có thể
chuyển giao cho các quá trình khác, nó cần được lưu trữ.
1.1.2. Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cường độ sáng hay một dấu hiệu nào đó tại
một tọa độ nào đó của đối tượng trong không gian. Điểm ảnh là một hàm nhiều
biến P(x1, x2,..., xn) trong đó n là số chiều của ảnh.
Ảnh: là một tập hợp các điểm ảnh, thông thường được biểu diễn dưới
dạng ma trận các điểm ảnh.
Mức xám: là kết quả sự mã hóa tương ứng của mỗi cường độ sáng của
một điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã hóa
kinh điển thường dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: biểu đồ tần xuất của một mức xám g của ảnh I là số
điểm ảnh của I có mức xám g.
1.1.3. Các vấn đề cơ bản trong xử lý ảnh
1.1.3.1. Biểu diễn ảnh
Ảnh được thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh
được lưu trữ trên máy tính. Quá trình lưu trữ gồm 2 mục đích: tiết kiệm bộ nhớ
và giảm thời gian xử lý.
Ảnh được lưu trữ trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in
ấn và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thước do đó nếu sử dụng
càng nhiều điểm ảnh thì càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết của
ảnh, người ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải phụ
thuộc vào nhu cầu sử dụng và đặc trưng của từng loại ảnh cụ thể. Chẳng hạn, ảnh



dùng trong văn bản thường thể hiện dưới dạng đen trắng có độ phân giải 300
DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI.
Trên cơ sở đó, các ảnh được biểu diễn theo 2 mô hình cơ bản là RASTER
và VECTOR.
Mô hình RASTER:
Theo mô hình này, ảnh được biểu diễn dưới dạng ma trận các điểm ảnh.
Tùy theo yêu cầu thực tế mà mỗi điểm ảnh được biểu diễn bằng một hoặc nhiều
bit.
Ngày nay thiết bị phần cứng phát triển nhưng chủ yếu là theo định hướng
Raster cho cả thiết bị đầu vào cũng như đầu ra. Ví dụ: máy in, máy quét, v.v…
Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật
nén
ảnh, chia ra hai khuynh hướng đó là nén bảo toàn và nén không bảo toàn thông tin.
Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban đầu.
Nén không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu nhưng với
sai số chấp nhận được. Trên cơ sở đó người ta xây dựng được nhiều khuôn dạng
ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v…
Mô hình VECTOR:
Ảnh lưu trữ trên máy tính ngoài yêu cầu về giảm không gian lưu trữ, thời
gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong sự lựa
chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu
diễn Vector tỏ ra ưu việt hơn.
Trong mô hình Vector, ảnh được biểu diễn bởi các điểm ảnh và các đường
thể hiện hướng của một điểm. Ảnh dạng vector được thu nhận từ các thiết bị như
sensor, digitalier, v.v….


Ngày nay, các thiết bị phần cứng phát triển mạnh theo hướng Raster cho

cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô hình
Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.3.2. Nắn chỉnh biến dạng
Ảnh thu được sau quá trình thu nhận thường bị biến dạng do những thiết
bị quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.


Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển (pi, p‟i), ( i= 1,
…, n).
Cần tìm hàm: : Pi

(Pi) sao cho:

n
i 1

2

f ( pi )

pi

min

1.1.3.3. Khử nhiễu
Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại
nhiễu cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, như vết xước hoặc
nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục
bằng các phép biến đổi.

- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu
này thường khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông
thường sử dụng các phép lọc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc
tính chủ yêu của đối tượng. Có 2 kiểu đối tượng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)


Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v.v...) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan.
1.1.4. Một số định dạng ảnh phổ biến
1.1.4.1. Định dạng ảnh Bitmap
Ảnh Bitmap là định dạng ảnh do Microsoft đề xuất, có phần mở rộng là
BMP. Trong đồ họa máy vi tính, BMP còn được biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh khá phổ biến.
Các

tập

tin đồ


họa lưu dưới

dạng

BMP

thường



đuôi

là .BMP hoặc .DIB (Device Independent Bitmap).
Số bit trên mỗi điểm ảnh (bit per pixel), thường được ký hiệu bởi n. Một
n

ảnh BMP n-bit có 2 màu. Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng
rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh
256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP 24-bit có
chất lượng hình ảnh trung thực nhất.
Các thuộc tính tiêu biểu của một tập tin ảnh BMP (cũng như file ảnh nói
chung) là:
Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).
Chiều rộng của ảnh (width), cho bởi điểm ảnh.


×