Tải bản đầy đủ (.pdf) (77 trang)

thuật toán phát hiện ảnh giả mạo dạng cắt - dán dựa trên các phép biến đổi ma trận

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.59 MB, 77 trang )



Số hóa bởi Trung tâm Học liệu


ĐẠI HỌC THÁI
NGUYÊN

TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG




NGUYỄN HỒNG HẠNH




THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
DẠNG CẮT - DÁN DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI MA TRẬN








LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH









THÁI NGUYÊN - 2014


Số hóa bởi Trung tâm Học liệu

ĐẠI HỌC THÁI
NGUYÊN

TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG




NGUYỄN HỒNG HẠNH




THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
DẠNG CẮT - DÁN DỰA TRÊN CÁC PHÉP
BIẾN ĐỔI MA TRẬN

Chuyên ngành: KHOA HỌC MÁY TÍNH

Mã số: 60 48 01



LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH



HƢỚNG DẪN KHOA HỌC: PGS.TS PHẠM VĂN ẤT



THÁI NGUYÊN - 2014


Số hóa bởi Trung tâm Học liệu

i
LỜI

CAM

ĐOAN



Tôi

xin


cam

đoan

luận

văn

thạc


khoa học máy tính
:

“Thuật toán phát
hiện ảnh giả mạo dạng cắt - dán dựa trên các phép biến đổi ma trận”

k
ết

quả

của

quá

trình

học


tập,

nghiên cứu

khoa

học

độc

lập,

nghiêm

túc.


Các

số

liệu

trong

luận

văn




trung

thực,



nguồn

gốc



ràng,

đ
ƣ
ợc
trích

dẫn





tính

kế


thừa,

phát

triển

từ

các

tài

liệu,

tạp

chí,

các

công

trình
nghiên

cứu

đã

đ

ƣ
ợc

công

bố,

các

website,




Các

phƣơng

pháp

nêu

trong

luận

văn

đƣợc


rút

ra

từ

những



sở



luận


quá

trình

nghiên

cứu

tìm

hiểu

của


tác

giả.



Thái Nguyên,

tháng

năm

2014

Tác

giả



Nguyễn
Hồng Hạnh


Số hóa bởi Trung tâm Học liệu

ii
LỜI


CẢM

ƠN



Lời

đầu

tiên

tôi

xin

gửi

lời

cảm

ơn
t
hầy

PGS.

TS. Phạm Văn Ất


đã

tận
tình

giúp

đỡ

tôi

trong

suốt

thời

gian

học

tập

vừa

qua,

đặc

biệt




định

hướng
nghiên

cứu



tận

tình

hướng

dẫn

cho

tôi

trong

suốt

quá


trình

làm

luận
v
ăn.

Nếu

không



sự

giúp

đỡ

tận

tình

của

thầy,

tôi


khó



thể

hoàn

thành

luận văn

này.

Bên cạnh đó tôi

cũng

xin

chân

thành

cảm

ơn

các


thầy


Trường
Đại học
Công

nghệ

Thông tin
& Truyền thông
đã

tận

tình

giảng

dạy,

chỉ

bảo



cung

cấp


cho

tôi

những

kiến

thức

cần thiết

trong

suốt

thời

gian

học



cũng

xin

gởi


lời

cám

ơn

chân

thành

đến những

người

thân,

bạn





đồng

nghiệp

đã

giúp


đỡ



động

viên

tôi

trong suốt

thời

gian

học

tập

cũng

như

trong

thời

gian


thực

hiện

luận

văn.

Chân

thành

cảm

ơn

!


Thái Nguyên,

tháng

năm

2014

Tác


giả





Nguyễn Hồng Hạnh



Số hóa bởi Trung tâm Học liệu

iii
MỤC LỤC

LỜI

CAM

ĐOAN
i

LỜI

CẢM

ƠN
ii
MỤC LỤC iii
DANH MỤC HÌNH VẼ iv

MỞ ĐẦU 1
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÀN PHÁT HIỆN
ẢNH GIẢ MẠO 3
1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH 3
1.1.1. Xử lý ảnh là gì? 3
1.1.2. Các khái niệm cơ bản trong xử lý ảnh 9
1.1.3. Các vấn đề cơ bản trong xử lý ảnh 9
1.1.4. Một số định dạng ảnh phổ biến 12
1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO 17
1.2.1. Ảnh giả mạo 17
1.2.2. Các loại ảnh giả mạo cơ bản 17
1.2.3. Các cách tiếp cận trong phát hiện ảnh giả mạo 21
CHƢƠNG 2: THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT -
DÁN 24
2.1. THUẬT TOÁN ĐỐI SÁNH CHÍNH XÁC (EXACT MATCH) PHÁT HIỆN
ẢNH GIẢ MẠO DẠNG CẮT - DÁN 24
2.1.1. Ý tƣởng 24
2.1.2. Thuật toán
25
2.1.3. Phân tích thuật toán 26
2.1.4. Ví dụ minh họa 26
2.2. THUẬT TOÁN ĐỐI SÁNH BỀN VỮNG (ROBUST MATCH) PHÁT HIỆN
ẢNH GIẢ MẠO DẠNG CẮT - DÁN DỰA TRÊN PHÉP BIẾN ĐỔI COSIN RỜI
RẠC (DCT - Discrete cosine transform) 35


Số hóa bởi Trung tâm Học liệu

2.2.1. Ý tƣởng 38
2.2.2. Thuật toán 39

2.2.3. Phân tích thuật toán 44
2.3. THUẬT TOÁN PHÁT HIỆN ẢNH GIẢ MẠO DẠNG CẮT - DÁN DỰA
TRÊN PHÉP BIẾN ĐỔI DWT (Discrete Wavelet Transform) 45
2.3.1. Ý tƣởng 48
2.3.2. Thuật toán 49
2.3.3. Phân tích thuật toán 54
2.4. SO SÁNH CÁC PHƢƠNG PHÁP PHÁT HIÊN ẢNH GIẢ MẠO DẠNG CẮT
- DÁN 55
CHƢƠNG 3: PHẦN MỀM THỬ NGHIỆM 56
3.1. PHÂN TÍCH YÊU CẦU BÀI TOÁN 56
3.2. TẠO ẢNH GIẢ MẠO 56
3.3. SƠ ĐỒ CHUNG CỦA THUẬT TOÁN ĐỐI SÁNH CHÍNH XÁC - (exact
match) 57
3.4. SƠ ĐỒ CHUNG CỦA THUẬT TOÁN ĐỐI SÁNH BỀN VỮNG - (robust
match) 58
3.5. LỰA CHỌN CÔNG CỤ 59
3.6. MÔI TRƢỜNG CÀI ĐẶT VÀ XÂY DỰNG CÁC HÀM 60
3.7. KẾT QUẢ THỰC NGHIỆM 60
3.7.1. Phần mềm đối sánh bền vững dựa trên phép biến đổi DCT 61
3.7.2. Phần mềm đối sánh bền vững dựa trên phép biến đổi DWT 64
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 67
1. KẾT LUẬN 67
2. KIẾN NGHỊ 68
TÀI LIỆU THAM KHẢO 69


Số hóa bởi Trung tâm Học liệu

iv
DANH MỤC HÌNH VẼ

Hình 1.1. Các giai đoạn trong xử lý ảnh 4
Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh 8
Hình 1.3. Quá trình nén JPEG cơ 16
Hình 1.4.
Minh

họa

về

việc

giả

mạo

ảnh
17
Hình 1.5. Minh họa cho loại ảnh giả mạo tăng cƣờng ảnh 18
Hình
1.6.
Ảnh

che

phủ



bỏ


đi

đối tƣợng
20
Hình 1.7 thể hiện một dạng khác thƣờng thấy của giả mạo ảnh, đó là việc bổ sung
thêm đối tƣợng. 21
Hình 1.8. Sơ đồ phát hiện ảnh giả mạo dựa vào cơ sở dữ liệu 22
Hình

1.9.

Sự

khác

biệt

của

các hƣớng

nguồn

sáng

khác

nhau.
23

Hình 2.1. Đánh số thứ tự các phần tử của ma trận hệ số DCT theo đƣờng zigzag 41
Hình 2.2. Vectơ dịch chuyển của vùng cắt - dán 44
Hình 2.3. Áp dụng phép biến đổi DWT theo hàng và cột 48
Hình 2.4. Áp dụng phép biến đổi DWT theo hai mức 48
Hình 2.5. Vectơ dịch chuyển của vùng cắt - dán 54
Hình 3.1 Kết quả thực nghiệm 1 phát hiện ảnh giả mạo dạng cắt - dán 61
Hình 3.2. Kết quả thực nghiệm 2 phát hiện ảnh giả mạo dạng cắt - dán 62
Hình 3.3. Kết quả thực nghiệm 3 phát hiện ảnh giả mạo dạng cắt - dán 63
Hình 3.4. Kết quả thực nghiệm 4 phát hiện ảnh giả mạo dạng cắt - dán 64
Hình 3.5. Kết quả thực nghiệm 5 phát hiện ảnh giả mạo dạng cắt – dán, ảnh giả nén
JPEG với hệ số Q=60 65
Hình 3.6. Kết quả thực nghiệm 6 phát hiện ảnh giả mạo dạng cắt - dán nhiễu 1% 66
Hình 3.7. Kết quả thực nghiệm 7 phát hiện ảnh giả mạo dạng cắt – dán nhiễu 1% làm
mờ 1px nén JPEG Q=60 66


Số hóa bởi Trung tâm Học liệu

1
MỞ ĐẦU

Ngày nay, ảnh số là phƣơng tiện truyền thông đƣợc sử dụng rộng rãi,
đóng vai trò quan trọng trong đời sống con ngƣời, có tác động đến xã hội, tham
gia vào các quá trình pháp lý và kinh tế nhƣ: làm bằng chứng trong điều tra, xử
án, bảo hiểm, gian lận khoa học,… Hơn nữa, với sự phổ biến của máy ảnh kĩ
thuật số và các phần mềm chỉnh sửa (Photoshop, GIMP,…) dẫn đến ảnh số có
thể dễ dàng đƣợc chỉnh sửa mà không cần đến các kiến thức chuyên gia và việc
chỉnh sửa hầu nhƣ không để lại dấu vết mà mắt thƣờng có thể nhận biết đƣợc.
Kết quả là khi những hình ảnh đƣợc chỉnh sửa sử dụng cho mục đích xấu nó có
thể dẫn đến những hậu quả nghiêm trọng. Do vậy, việc phát hiện ảnh giả mạo là

vấn đề đặt ra ngày càng cấp bách và càng trở lên khó khăn.
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã đƣợc công nhận
bởi cộng đồng các nhà nghiên cứu, nhƣng hiện nay số tài liệu về lĩnh vực này
vẫn chƣa nhiều. Trong việc chống giả mạo ảnh, ngƣời ta đã nghiên cứu các kỹ
thuật về tạo bản quyền ảnh trên cơ sở giấu các thông tin cần thiết vào các bức
ảnh trƣớc khi phát hành để tránh tình trạng sao chép bất hợp pháp hoặc để tiện
cho việc phát hiện các sửa đổi hoặc cắt ghép sau này. Theo cách tiếp cận này,
các thiết bị máy ảnh số và camera ngày nay thƣờng bổ sung các tính năng bản
quyền ngay trong quá trình thu nhận ảnh. Dựa vào đó sau này ta có thể biết đƣợc
nguồn gốc của bức ảnh, biết đƣợc đó có phải là ảnh gốc hay không? Cách tiếp
cận này dựa vào giả thiết rằng việc giả mạo ảnh sẽ làm thay đổi thông tin bản
quyền. Tuy nhiên, hạn chế của cách tiếp cận này là thông tin bản quyền phải
đƣợc chèn vào tại thời gian thu nhận ảnh nên chỉ giới hạn với các camera số đƣợc
trang bị đặc biệt. Ngoài ra, một giải pháp khác không cần dùng đến các thông tin
nhúng vào từ trƣớc là các phƣơng pháp thụ động phát hiện ảnh giả mạo.
Trong các loại giả mạo thì ảnh giả mạo dạng cắt - dán tƣơng đối phổ biến và
dễ dàng thực hiện, nên chúng đã và đang đƣợc nhiều nhà nghiên cứu quan tâm.


Số hóa bởi Trung tâm Học liệu

2
Nhận thức đƣợc ý nghĩa khoa học và tính thực tiễn của vấn đề này nên em
đã chọn đề tài “Thuật toán phát hiện ảnh giả mạo dạng cắt - dán dựa trên các
phép biến đổi ma trận” cho luận văn tốt nghiệp của mình.
*

Nội

dung


chính

của

luận

văn

gồm:

-

Phần

mở

đầu.

Chương 1: Tổng quan về xử lý ảnh và bài toán phát hiện ảnh giả mạo.
Chƣơng này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, một số định dạng ảnh phổ biến nhƣ định dạng Bitmap, định
dạng JPEG, đồng thời trình bày bài toán phát hiện ảnh giả mạo.
Chương 2: Thuật toán phát hiện ảnh giả mạo dạng cắt - dán
Chƣơng này trình bày một số phép biến đổi ma trận, giới thiệu tổng quan
về ảnh giả mạo dạng cắt - dán và phát hiện ảnh giả mạo. Bên cạnh đó trình bày
một số thuật toán phát hiện ảnh giả mạo nhƣ: Thuật toán đối sánh chính xác,
thuật toán đối sánh bền vững và thuật toán phát hiện ảnh giả mạo dạng cắt - dán
dựa trên các phép biến đổi DWT.
Chương 3: Phần mềm thử nghiệm

Tiến

hành

xây dựng

chƣơng

trình

thực

nghiệm

để

phát

hiện

ảnh

kỹ

thuật

số

giả


mạo

dạng cắt - dán.
Kết luận
Do thời gian và trình độ còn hạn chế nên luận văn khó tránh khỏi những
thiếu sót, kính mong nhận đƣợc sự đóng góp, chỉ bảo của các thầy giáo, cô
giáo và các bạn.



Số hóa bởi Trung tâm Học liệu

3
CHƢƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ BÀI TOÀN PHÁT HIỆN ẢNH
GIẢ MẠO
Chương này trình bày tổng quan về một hệ thống xử lý ảnh, các vấn đề cơ
bản trong xử lý ảnh, một số định dạng ảnh phổ biến như định dạng Bitmap, định
dạng JPEG đồng thời trình bày bài toán phát hiện ảnh giả mạo.

1.1. TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì?
Xử lý ảnh là một khoa học tƣơng đối mới mẻ so với nhiều ngành khoa học
khác, nhất là trong quy mô công nghiệp, song trong xử lý ảnh đã bắt đầu xuất
hiện những máy tính chuyên dụng. Để có thể hình dung cấu hình một hệ thống
xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào
tạo, trƣớc hết chúng ta sẽ xem xét các bƣớc cần thiết trong xử lý ảnh.
Trƣớc hết là quá trình thu nhận ảnh. Ảnh có thể thu nhận qua camera.
Thƣờng ảnh thu nhận qua camera là tín hiệu tƣơng tự (loại camera ống kiểu
CCIR), nhƣng cũng có thể là tín hiệu số hóa (loại-Change Coupled Device).

Ảnh cũng có thể thu nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay
ảnh, tranh đƣợc quét trên scanner. Tiếp theo là quá trình số hóa để biến đổi tín
hiệu liên tục sang tín hiệu rời rạc (lấy mẫu) và số hóa bằng lƣợng hóa, trƣớc khi
chuyển sang giai đoạn xử lý, phân tích hay lƣu trữ lại.
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trƣớc hết là công
việc tăng cƣờng ảnh để nâng cao chất lƣợng ảnh. Do những nguyên nhân khác
nhau: Có thể do chất lƣợng thiết bị thu nhận ảnh, do nguồn sáng hay do nhiễu
ảnh có thể bị suy biến. Do vậy cần phải tăng cƣờng và khôi phục lại ảnh để làm


Số hóa bởi Trung tâm Học liệu

4
nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống nhất với trạng
thái gốc - trạng thái trƣớc khi ảnh bị biến dạng. Giai đoạn tiếp theo là phát hiện
các đặc tính nhƣ biên, phân vùng ảnh, trích chọn các đặc tính,v.v…
Cuối cùng, tùy theo mục đích của ngƣời xử dụng, sẽ là giai đoạn nhận
dạng, phân lớp hay các quyết định khác. Các giai đoạn chính trong quá trình xử
lý ảnh đƣợc mô tả qua hình 1.1.







Hình 1.1. Các giai đoạn trong xử lý ảnh
1.1.1.1.

Thu


nhận

ảnh


Đây



bƣớc

đầu

tiên

trong

quá

trình

xử



ảnh.

Để


thực

hiện

điều

này,
ta

cần



bộ

thu

ảnh



khả

năng

số

hoá

những


tín

hiệu

liên

tục

đƣợc

sinh

ra
bởi

bộ

thu

ảnh

đó.

Bộ

thu

ảnh




đây



thể



máy

chụp

ảnh

đơn

sắc

hay

màu,
máy

quét

ảnh,




Trong
trƣờng
hợp

bộ

thu

ảnh

cung

cấp
chƣa
phải



dạng

số hoá

ta

còn

phải

chuyển


đổi

hay

số

hoá

ảnh.

Quá

trình

chuyển

đổi

ADC

(Analog

to

Digital

Converter)

để


thu

nhận
dạng

số

hoá

của

ảnh.

Các

thông

số quan

trọng

ở bƣớc

này



độ


phân

giải,
chất

l
ƣ
ợng

màu,

dung lƣợng

bộ

nhớ



tốc

độ

thu

nhận

ảnh

của


các

thiết

bị.

Mặc



đây

chỉ



công

đoạn

đầu

tiên

song

kết

quả


của





ảnh
hƣởng

rất nhiều

đến

công

đoạn

kế

tiếp.

Thu nhận
(Camera, Scanner,
Sensor…)
Tiền xử lý
(Nắn chỉnh, xóa,
nhiễu…)
Trích chọn đặc
trƣng

Lƣu trữ
Hậu xử lý
(Chính xác hóa, rút
gọn,…)

Kết Luận
Hệ quyết định


Số hóa bởi Trung tâm Học liệu

5
1.1.1.2.

Tiền

xử



Ở bƣớc

này,

ảnh

sẽ

đ
ƣ

ợc

cải

thiện

về

độ tƣơng phản,

khử

nhiễu,

khử
bóng,

khử

độ

lệch, v.v với

mục

đích

làm

cho


chất lƣợng

ảnh

trở

nên

tốt

hơn
nữa,

chuẩn

bị

cho

các bƣớc

xử



phức

tạp


hơn

về

sau

trong

quá

trình

xử


ảnh.

Quá

trình

này thƣờng đƣợc

thực

hiện

bởi

các


bộ

lọc.

+

Khử

nhiễu:

Nhiễu

đ
ƣ
ợc

chia

thành

hai

loại:

nhiễu

hệ

thống




nhiễu
ngẫu

nhiên.

Đặc trƣng của

nhiễu

hệ

thống



tính

tuần

hoàn.

Do

vậy,




thể
khử

nhiễu

này

bằng

việc

sử

dụng

phép

biến

đổi

Fourier



loại

bỏ

các


đỉnh
điểm.

Đối

với

nhiễu

ngẫu

nhiên,

tr
ƣ
ờng

hợp

đơn

giản



các

vết


bẩn tƣơng
ứng

với

các

điểm

sáng

hay

tối,



thể

khử

bằng phƣơng

pháp

nội

suy,

lọc

trung

vị



trung

bình.

+

Chỉnh

mức

xám:

Đây



kỹ

thuật

nhằm

chỉnh


sửa

tính

không

đồng
đều

của

thiết

bị

thu

nhận

hoặc

độ

t
ƣ
ơng

phản

giữa


các

vùng

ảnh.

+

Chỉnh

tán

xạ:

Ảnh

thu

nhận

đ
ƣ
ợc

từ

các

thiết


bị

quang

học

hay

điện
tử



thể

bị

mờ,

nhoè. Phƣơng

pháp

biến

đổi

Fourier


dựa

trên

tích

chập

của
ảnh

với

hàm

tán

xạ

cho

phép

giải

quyết

việc

hiệu


chỉnh

này.

1.1.1.3.

Phân

đoạn

ảnh

Phân

đoạn

ảnh



nghĩa



chia

một

ảnh


đầu

vào

thành

nhiều

phần

khác
nhau

hay

còn

gọi



các

đối tƣợng

để

biểu


diễn

phân

tích,

nhận

dạng

ảnh.


dụ:

để

nhận

dạng

chữ

(hoặc



vạch)

trên


phong



th
ƣ

cho

mục

đích

phân
loại bƣu

phẩm,

cần

chia

các

câu,

chữ

về


địa

chỉ

hoặc

tên

ng
ƣ
ời

thành

các

từ,
các

chữ,

các

số

(hoặc

các


vạch)

riêng

biệt

để

nhận

dạng.

Đây



phần

phức

tạp

khó

khăn

nhất

trong


xử



ảnh



cũng

dễ

gây

lỗi,
làm

mất

độ

chính

xác

của

ảnh.

Kết


quả

nhận

dạng

ảnh

phụ

thuộc

rất

nhiều
vào

công

đoạn

này.

Mục

đích

của


phân

đoạn

ảnh



để



một

miêu

tả

tổng

hợp

về

nhiều


Số hóa bởi Trung tâm Học liệu

6

phần

tử

khác

nhau

cấu

tạo

lên

ảnh

thô.

Vì lƣợng

thông

tin

chứa

trong

ảnh


rất
lớn,

trong

khi

đa

số

các

ứng

dụng

chúng

ta

chỉ

cần

trích

một

vài


đặc

tr
ƣ
ng

nào
đó,

do

vậy

cần



một

quá

trình

để

giảm

l
ƣ

ợng

thông

tin

khổng

lồ

đó.

Quá
trình

này

bao

gồm

phân

vùng

ảnh



trích


chọn

đặc

tính

chủ

yếu.

1.1.1.4.

Hệ

quyết

định

Ảnh



một

đối tƣợng khá

phức

tạp


về đƣờng nét,

độ

sáng

tối,

dung
lƣợng

điểm

ảnh,

môi trƣờng

để

thu

ảnh

phong

phú

kéo


theo

nhiễu.

Trong

nhiều

khâu

xử





phân

tích

ảnh

ngoài

việc

đơn

giản


hóa

các
phƣơng pháp

toán

học

đảm

bảo

tiện

lợi

cho

xử

lý, ngƣời

ta

mong

muốn

bắt

chƣớc

quy

trình

tiếp

nhận



xử



ảnh

theo

cách

của

con ngƣời.

Trong

các
bƣớc


xử



đó,

nhiều

khâu

hiện

nay

đã

xử



theo

các phƣơng

pháp

trí

tuệ


con
ng
ƣ
ời.



vậy,



đây

các



sở

tri

thức đƣợc

phát

huy.

1.1.1.5.


Trích

chọn

đặc

điểm

Việc

giải

quyết

bài

toán

nhận

dạng

trong

những

ứng

dụng


mới

nảy

sinh
trong

cuộc

sống

không

chỉ

tạo

ra

những

thách

thức

về

giải

thuật,




còn

đặt
ra

những

yêu

cầu

về

tốc

độ

tính

toán.

Đặc

điểm

chung


của

tất

cả

ứng

dụng

đó



những

đặc

điểm

đặc trƣng
cần

thiết thƣờng là

nhiều,

không

thể


do

chuyên

gia

đề

xuất,



phải đƣợc
trích

chọn

dựa

trên

các

thủ

tục

phân


tích

dữ

liệu.

Việc

trích

chọn

hiệu

quả

các

đặc

điểm

giúp

cho

việc

nhận


dạng

các

đối
tƣợng

ảnh

chính

xác,

với

tốc

độ

tính

toán

cao



dung lƣợng

nhớ lƣu trữ

giảm

xuống.

Các

đặc

điểm

của

đối tƣợng đƣợc

trích

chọn

tuỳ

theo

mục

đích

nhận
dạng

trong


quá

trình

xử



ảnh.



thể

nêu

ra

một

số

đặc

điểm

của

ảnh

sau

đây:

-

Đặc

điểm

không

gian:

phân

bố

mức

xám,

phân

bố

xác

suất,


biên

độ,
điểm

uốn

v.v



Số hóa bởi Trung tâm Học liệu

7
-

Đặc

điểm

biến

đổi:

các

đặc

điểm


loại

này đƣợc

trích

chọn

bằng

việc
thực

hiện

lọc

vùng

(zonal

filtering).

Các

bộ

vùng đƣợc gọi




“mặt

nạ

đặc
điểm”

(feature

mask) thƣờng



các

khe

hẹp

với

hình

dạng

khác

nhau


(chữ
nhật,

tam

giác,

cung

tròn

v.v ).

-

Đặc

điểm

biên



đ
ƣ
ờng

biên:

Đặc trƣng


cho đƣờng

biên

của

đối
tƣợng và

do

vậy

rất

hữu

ích

trong

việc

trích

chọn

các


thuộc

tính

bất

biến đƣợc
dùng

khi

nhận

dạng

đối tƣợng.

Các

đặc

điểm

này



thể đƣợc

trích


chọn

nhờ
toán

tử

Gradient,

toán

tử

la

bàn,

toán

tử

Laplace,

toán

tử

“chéo


không”
(zero

crossing)



1.1.1.6.

Nhận

dạng

Đây

là bƣớc

cuối

cùng

trong

quá

trình

xử




ảnh.

Nhận

dạng

ảnh



quá

trình

xác

định

nội

dung

ảnh. Quá

trình

này
thƣờng thu đƣợc


bằng

cách

so

sánh

với

mẫu

chuẩn

đã đƣợc

lọc

(hoặc
lƣu
)

từ
trƣớc
.

Nhận

dạng


ảnh



thể đƣợc nhìn

nhận

một

cách

đơn

giản



việc

gán
nhãn

cho

các

đối tƣợng

trong


ảnh.



dụ nhƣ

khi

nhận

dạng

chữ

viết,

các

đối
tƣợng

trong

ảnh

cần

nhận


dạng



các

mẫu

chữ,

ta

cần

tách

riêng

các

mẫu

chữ
đó

ra



tìm


cách

gán

đúng

các



tự

của

bảng

chữ

cái tƣơng

ứng

cho

các

mẫu
chữ


thu đƣợc

trong

ảnh.

Giải

thích



công

đoạn

gán

nghĩa

cho

một

tập

các
đối tƣợng

đã đƣợc


nhận

biết.

Chúng

ta

cũng



thể

thấy

rằng,

không

phải

bất

kỳ

một

ứng


dụng

xử


ảnh

nào

cũng

bắt

buộc

phải

tuân

theo

tất

cả

các bƣớc xử




đã

nêu



trên,


dụ nhƣ

các

ứng

dụng

chỉnh

sửa

ảnh

nghệ

thuật

chỉ

dừng


lại

ở bƣớc tiền

xử

lý.

Một

cách

tổng

quát

thì

những

chức

năng

xử



bao


gồm

cả

nhận

dạng


giải

thích thƣờng

chỉ



mặt

trong

hệ

thống

phân

tích


ảnh

tự

động

hoặc

bán
tự

động, đƣợc

dùng

để

rút

trích

ra

những

thông

tin

quan


trọng

từ

ảnh,



dụ


Số hóa bởi Trung tâm Học liệu

8
nhƣ

các

ứng

dụng

nhận

dạng



tự


quang

học,

nhận

dạng

chữ

viết

tay

v.v…

Với các giai đoạn trên, một hệ thống xử lý ảnh gồm các thành phần tối
thiểu nhƣ hình sau:









Hình 1.2. Các thành phần chính trong hệ thống xử lý ảnh
Đối với một hệ thống xử lý ảnh thu nhận qua camera-camera nhƣ là

con mắt của hệ thống: có hai loại camera ống loại CCIR và camera CCD. Loại
camera ứng với chuẩn CCIR quét ảnh với tần số 1/25 và mỗi ảnh gồm 625 dòng.
Loại CCD gồm các photo điốt và làm tƣơng ứng một cƣờng độ sáng tại một
điểm ảnh với một phần tử ảnh (pixel). Nhƣ vậy, ảnh là tập hợp các điểm ảnh. Số
pixel tạo nên một ảnh gọi là độ phân giải
Bộ xử lý tƣơng tự thực hiện các chức năng sau:
- Chọn camera thích hợp nếu hệ thống có nhiều camera.
- Chọn màn hình hiển thị tín hiệu.
- Thu nhận tín hiệu video bởi bộ số hóa. Thực hiện lấy mẫu và mã hóa.
- Tiền xử lý ảnh khi thu nhận: dùng kỹ thuật bảng tra (Look Up Table).
Bộ xử lý ảnh số gồm nhiều bộ xử lý chuyên dụng: xử lý lọc, trích chọn
đƣờng bao, nhị phân hóa ảnh.
Camera
Bộ xử lý tƣơng tự
Bộ nhớ ảnh
Màn hình
Đồ họa
Màn hình đồ họa
Bàn phím
Màn hình
Máy in
Bộ nhớ
ngoài
Bộ xử lý
ảnh số


Số hóa bởi Trung tâm Học liệu

9

Máy chủ đóng vai trò điều khiển các thành phần ở trên.
Bộ nhớ ngoài: Dữ liệu ảnh cũng nhƣ các dữ liệu khác, để có thể
chuyển giao cho các quá trình khác, nó cần đƣợc lƣu trữ.
1.1.2. Các khái niệm cơ bản trong xử lý ảnh
Điểm ảnh (pixel): Biểu diễn cƣờng độ sáng hay một dấu hiệu nào đó tại
một tọa độ nào đó của đối tƣợng trong không gian. Điểm ảnh là một hàm nhiều
biến P(x
1,
x
2, ,
x
n
) trong đó n là số chiều của ảnh.
Ảnh: là một tập hợp các điểm ảnh, thông thƣờng đƣợc biểu diễn dƣới
dạng ma trận các điểm ảnh.
Mức xám: là kết quả sự mã hóa tƣơng ứng của mỗi cƣờng độ sáng của
một điểm ảnh với một giá trị số - kết quả của quá trình lƣợng hóa. Cách mã hóa
kinh điển thƣờng dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: biểu đồ tần xuất của một mức xám g của ảnh I là số
điểm ảnh của I có mức xám g.
1.1.3. Các vấn đề cơ bản trong xử lý ảnh
1.1.3.1. Biểu diễn ảnh
Ảnh đƣợc thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh
đƣợc lƣu trữ trên máy tính. Quá trình lƣu trữ gồm 2 mục đích: tiết kiệm bộ nhớ
và giảm thời gian xử lý.
Ảnh đƣợc lƣu trữ trong bộ nhớ có ảnh hƣởng rất lớn đến việc hiển thị, in
ấn và xử lý. Ảnh là tập hợp các điểm ảnh có cùng kích thƣớc do đó nếu sử dụng
càng nhiều điểm ảnh thì càng mịn càng đẹp và càng thể hiện rõ hơn chi tiết của
ảnh, ngƣời ta gọi đặc điểm này là độ phân giải. Việc lựa chọn độ phân giải phụ
thuộc vào nhu cầu sử dụng và đặc trƣng của từng loại ảnh cụ thể. Chẳng hạn, ảnh



Số hóa bởi Trung tâm Học liệu

10
dùng trong văn bản thƣờng thể hiện dƣới dạng đen trắng có độ phân giải 300
DPI, ảnh bản vẽ, bản đồ có độ phân giải 200DPI.
Trên cơ sở đó, các ảnh đƣợc biểu diễn theo 2 mô hình cơ bản là RASTER
và VECTOR.
Mô hình RASTER:
Theo mô hình này, ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh. Tùy
theo yêu cầu thực tế mà mỗi điểm ảnh đƣợc biểu diễn bằng một hoặc nhiều bit.
Ngày nay thiết bị phần cứng phát triển nhƣng chủ yếu là theo định hƣớng
Raster cho cả thiết bị đầu vào cũng nhƣ đầu ra. Ví dụ: máy in, máy quét, v.v…
Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật nén
ảnh, chia ra hai khuynh hƣớng đó là nén bảo toàn và nén không bảo toàn thông tin.
Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban đầu.
Nén không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu nhƣng với
sai số chấp nhận đƣợc. Trên cơ sở đó ngƣời ta xây dựng đƣợc nhiều khuôn dạng
ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v…
Mô hình VECTOR:
Ảnh lƣu trữ trên máy tính ngoài yêu cầu về giảm không gian lƣu trữ, thời
gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong sự lựa
chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ thuật biểu
diễn Vector tỏ ra ƣu việt hơn.
Trong mô hình Vector, ảnh đƣợc biểu diễn bởi các điểm ảnh và các đƣờng
thể hiện hƣớng của một điểm. Ảnh dạng vector đƣợc thu nhận từ các thiết bị nhƣ
sensor, digitalier, v.v….



Số hóa bởi Trung tâm Học liệu

11
Ngày nay, các thiết bị phần cứng phát triển mạnh theo hƣớng Raster cho
cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô hình
Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.3.2. Nắn chỉnh biến dạng
Ảnh thu đƣợc sau quá trình thu nhận thƣờng bị biến dạng do những thiết
bị quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.
Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển (p
i
, p‟
i
), ( i= 1,
…, n).
Cần tìm hàm: : P
i
(P
i
) sao cho:
2
1
)(
n
i
ii
ppf
min
1.1.3.3. Khử nhiễu
Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại

nhiễu cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, nhƣ vết xƣớc hoặc
nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục
bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu
này thƣờng khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông
thƣờng sử dụng các phép lọc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tƣợng mà ngƣời ta
muốn đặc tả nó. Quá trình nhận dạng thƣờng đi sau quá trình trích chọn các đặc
tính chủ yêu của đối tƣợng. Có 2 kiểu đối tƣợng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)


Số hóa bởi Trung tâm Học liệu

12
Trên thực tế, ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v.v ) phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơron đang đƣợc áp dụng và cho kết quả khả quan.
1.1.4. Một số định dạng ảnh phổ biến
1.1.4.1. Định dạng ảnh Bitmap
Ảnh Bitmap là định dạng ảnh do Microsoft đề xuất, có phần mở rộng là

BMP. Trong đồ họa máy vi tính, BMP còn đƣợc biết đến với tên tiếng Anh
khác là Windows bitmap, là một định dạng tập tin hình ảnh khá phổ biến.
Các tập tin đồ họa lƣu dƣới dạng BMP thƣờng có đuôi
là .BMP hoặc .DIB (Device Independent Bitmap).
Số bit trên mỗi điểm ảnh (bit per pixel), thƣờng đƣợc ký hiệu bởi n. Một
ảnh BMP n-bit có 2
n
màu. Giá trị n càng lớn thì ảnh càng có nhiều màu, và càng
rõ nét hơn. Giá trị tiêu biểu của n là 1 (ảnh đen trắng), 4 (ảnh 16 màu), 8 (ảnh
256 màu), 16 (ảnh 65536 màu) và 24 (ảnh 16 triệu màu). Ảnh BMP 24-bit có
chất lƣợng hình ảnh trung thực nhất.
Các thuộc tính tiêu biểu của một tập tin ảnh BMP (cũng nhƣ file ảnh nói
chung) là:
Chiều cao của ảnh (height), cho bởi điểm ảnh (pixel).
Chiều rộng của ảnh (width), cho bởi điểm ảnh.


Số hóa bởi Trung tâm Học liệu

13
Loại ảnh này đƣợc truyền tải, sử dụng rộng rãi trên máy tính và các thiết
bị điện tử khác. Ảnh Bitmap đƣợc chia thành ba dạng: Ảnh đen trắng, ảnh đa
mức xám và ảnh màu.
Ảnh đen trắng: là ảnh mà mỗi điểm ảnh chỉ thể hiện một trong hai trạng
thái 0 và 1 để biểu diễn trạng thái điểm ảnh đen hay trắng.
Ảnh đa mức xám: là ảnh mà mỗi điểm ảnh đƣợc biểu diễn bởi một giá trị
và đó là cƣờng độ sáng của điểm ảnh.
Ảnh màu: Mỗi điểm ảnh đƣợc đại diện bởi ba giá trị màu RGB, ứng
với mỗi đại lƣợng R,G, B ta sẽ đƣợc một giá trị màu tƣơng ứng. Số lƣợng
màu thực của ảnh có thể lên tới 256

3
màu khác nhau. Nhƣng số màu thực của
một ảnh nào đó có thể là khá nhỏ. Để tiết kiệm bộ nhớ, với các ảnh có số
lƣợng màu nhỏ hơn 256 thì màu của các điểm ảnh đƣợc lƣu trữ dƣới dạng
bảng màu (PALLETE). Với các ảnh có số màu lớn thì màu của điểm ảnh
không tổ chức dƣới dạng bảng màu, khi đó giá trị của các điểm ảnh chính là
giá trị của các thành phần màu R, G, B.
Với ảnh có số lƣợng màu lớn, tuỳ theo chất lƣợng ảnh mà quyết định số
bit để biểu diễn cho mỗi màu thƣờng là 24 bit, hoặc 32 bit. Với ảnh 24 bit, mỗi
thành phần màu đƣợc biểu diễn bởi một byte (8 bit).

Một file ảnh BMP gồm ba phần:
* BitmapHeader
* Palette màu
* BitmapData


BitmapHeader (54 byte)
Bảng màu (có thể có hoặc không)
Thông tin ảnh (Bitmap Data)


Số hóa bởi Trung tâm Học liệu

14
Cấu trúc cụ thể của ảnh BMP như sau:
** Cấu trúc và nội dung của bitmap File Header (bắt đầu từ byte 0 của tệp)

Byte
Data

Giá trị
Độ tin cậy
1
Kiểu tệp
„B‟

2
Kiểu tệp
„M‟

3-6
Size of the file
Unsigned long
Không
7-10
Reserved
Zero

11-14
Byte offset to bitmap data
Số TT (tính từ 0) byte
đầu của BMP data


** Cấu trúc và nội dung của bitmap Info (bắt đầu từ byte 14 của tệp)

Byte
Data
Giá trị
Độ tin cậy

qua test
1 - 4
Number of byte in Bitmap Info
40

5-8
Width of bitmap
In pixel

9-12
Height of bitmap
In pixel

13-14
Number of color planes
1

15-16
Number of bits per pixels
1,4,8 hoặc 24

17-20
Type of compression


21-24
Size image
In bytes
Không
25-28

Horizontal resolution


29-32
Vertical resolution


33-36
Number of color
In color Pallete
Ảnh 24 bít - 0
Ảnh 8 bít - nếu 0 thì
256 màu

37-40
Number of colors importal





Số hóa bởi Trung tâm Học liệu

15
** Cấu trúc và nội dung của Color Pallete (bắt đầu từ byte 54 của tệp)
(Chỉ có ảnh nhỏ hơn hoặc bằng 8 bít màu mới có bảng màu)
Byte
Data
Giá trị
Entry – Chỉ số màu

1
Blue color value
0-255
0
2
Green color value
0-255
0
3
Red color value
0-255
0
4
Reserved
0
0
5
Blue color value
0-255
1
6
Green color value
0-255
1
7
Red color value
0-255
1
8
Reserved

0
1
9
….



** Cấu trúc và nội dung của Bitmap Data (bắt đầu từ tg byte Offset to Bitmap Data)
+) Với ảnh 8 bít màu:
Mỗi byte chứa chỉ số màu (tính từ 0) của một điểm ảnh. Các điểm ảnh
đƣợc lƣu trữ trên file theo từng hàng từ dƣới lên trên. Các điểm ảnh mỗi hàng
đƣợc chứa từ trái sang phải
+) Với ảnh 24 bít màu:
Mỗi nhóm 3 byte biểu diễn màu của một điểm ảnh (byte 1 – Red, byte 2 –
Green, byte 3 - Blue). Thứ tự lƣu trữ các điểm ảnh trong file cũng đƣợc mô tả
nhƣ trong bảng Bitmap Header
1.1.4.2. Định dạng ảnh JPEG (Joint Photographic Experts Group)
Chuẩn JPEG là kết quả của sự hợp tác giữa Liên hiệp viễn thông quốc tế
(International Telecommunication Union (ITU)), Tổ chức tiêu chuẩn quốc tế
(International Organization for Standardization (ISO)), Ủy ban điện quốc tế


Số hóa bởi Trung tâm Học liệu

16
(International Electrotechnical Commission (IEC)). Tên chính thức của nó là
“ISO/IEC 10918-1 Digital compression and coding of continuous-tone still
image" hoặc "ITU-T Recommendation T.81".
Với lƣợc đồ nén JPEG cơ sở (JPEG baseline), một ảnh RGB đầu tiên
đƣợc chuyển đổi sang không gian luminance/chrominace (YCbCr). Mỗi kênh

sau đó đƣợc chia thành các khối pixel 8*8. Các giá trị này tiếp tục đƣợc chuyển
đổi từ số nguyên không dấu [0,255] thành số nguyên có dấu [-128,127]. Tiếp
theo mỗi khối đƣợc chuyển đổi sang không gian tần số sử dụng phép biến đổi
cosin rời rạc 2 chiều (2-D Discrete Cosine Transform - DCT). Gọi mỗi hệ số
DCT là C, C tiếp tục đƣợc lƣợng tử hóa bởi giá trị q:
)/(
ˆ
qCroundC

Ở đây giá trị lƣợng tử hóa q phụ thuộc vào tần số và kênh. Giá trị q càng
lớn thì tỷ lệ nén càng cao và chất lƣợng ảnh sau khi bị nén càng thấp. Sau khi
lƣợng tử hóa nhiều hệ số DCT sẽ trở thành 0 (đặc biệt đối với vùng tần số cao).
Cuối cùng các hệ số này đƣợc nén bằng phƣơng pháp Runlengh và Huffman.
Quá trình nén ảnh JPEG đƣợc mô tả nhƣ trong sơ đồ sau:

Hình 1.3. Quá trình nén JPEG cơ
Tƣơng tự, để giải nén ảnh JPEG thực hiện các bƣớc ngƣợc lại với quá
trình nèn ảnh JPEG nhƣ trên.
Color
components
(Y, C
b
, C
r
)
Perform
DCT

Quantizer
Quantization

Table
Zig-zag
reordering
Difference
Encoding
Huffman
coding
Huffman
coding
JPEG
bit-stream
Huffman
Table
Huffman
Table
AC
DC
Ảnh B.
(R,G,B)


Số hóa bởi Trung tâm Học liệu

17
1.2. BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO
1.2.1. Ảnh giả mạo
Ảnh giả mạo đƣợc xem là ảnh không có thật, việc có đƣợc ảnh là do sự
ngụy tạo bởi các chƣơng trình xử lý ảnh hoặc quá trình thu nhận ảnh.
Sức mạnh của các chƣơng trình xử lý ảnh số nhƣ PhotoShop, Corel Draw,
v.v giúp việc tạo ra các ảnh giả mạo từ một hay nhiều ảnh khác nhau trở nên dễ

dàng. Một trong những ví dụ cho việc gải mạo này là hình 1.4. Hình này đƣợc
tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và Saddam Hussein. Bill Clinton và
Saddam Hussein đƣợc cắt và dán vào bức ảnh Nhà trắng. Các hiệu ứng về bóng
và ánh sáng cũng đƣợc tạo ra làm cho bức ảnh nhìn có vẻ hoàn toàn nhƣ thật.

Hình 1.4.
Minh

họa

về

việc

giả

mạo

ảnh
1.2.2. Các loại ảnh giả mạo cơ bản
Ảnh giả mạo thƣờng chia làm hai loại chính. Ảnh giả nhƣng thật, tức là
hiện trƣờng đƣợc dựng thật và việc thu nhận ảnh là thật. Loại thứ hai là ảnh giả
đƣợc tạo lập trên cơ sở các phần của ảnh gốc thật nhƣ hình 1.4 hoặc đƣợc cắt dán


Số hóa bởi Trung tâm Học liệu

18
để thêm vào hay che đi các chi tiết trên ảnh.
Trong luận văn này tôi quan tâm đến một số dạng giả mạo thuộc loại thứ

hai. Trong dạng ảnh giả mạo thứ hai có thể chia làm 3 loại chính: Ghép ảnh, tăng
cƣờng ảnh, cắt - dán vùng trên ảnh và tôi tập trung chủ yếu tìm hiểu về ảnh giả
mạo dạng cắt - dán và các kỹ thuật phát hiện ảnh giả mạo dạng cắt - dán.
1.2.2.1. Tăng cường ảnh

(a) (b)

(c) (d)
Hình 1.5. Minh họa cho loại ảnh giả mạo tăng cƣờng ảnh: (a) ảnh gốc, (b) ảnh
đƣợc thay đổi màu sắc, (c) ảnh tăng độ tƣơng phản, (d) ảnh đƣợc làm mờ nền.
Hình 1.5 gồm một ảnh gốc (hình 1.5(a)), và 3 ví dụ cho loại giả mạo tăng

×