Tải bản đầy đủ (.pdf) (11 trang)

Những phương pháp tiếp cận về kỹ thuật giám định ảnh số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (901.86 KB, 11 trang )

TẠP CHÍ KHOA HỌC ĐẠI HỌC SÀI GÒN

Số 20 (45) - Tháng 9/2016

Những phương pháp tiếp cận
về kỹ thuật giám định ảnh số
Approaches to techniques of digital image forensics

r

han r ng
i n h ng
ng Đại h c B ch hoa

Phan Trong Le, BEng.
Le Tien Thuong, Assoc.Prof.,Ph.D.
Ho Chi Minh City University of Technology

Tóm t t
Một bức ảnh số có thể d dàng đ ợc chỉnh sửa về mặt hiển thị nh vào các phần mềm chỉnh sửa ảnh
nhất định ơ sở của việc gi m định tính chân thực của ảnh là mặc dù ảnh giả có thể hơng để lại bất kỳ
dấu v t hay điểm bất th ng gì báo hiệu đã qua chỉnh sửa, nh ng có thể đặc tính thống kê pixel trên ảnh
đã bị thay đổi. Bài vi t này là một tổng quan về ph ơng ph p gi m định ảnh số, chú tr ng vào ph ơng
pháp phát hiện mù từ cơng trình khởi đầu của Fridrich năm 2003 đ n các cơng trình mới trong nửa đầu
năm 2016 Hầu h t c c ph ơng ph p hiện tại đều đ ợc x p vào các nhóm phân loại và đ ợc phân tích đi
kèm với nhận xét và trích dẫn từ tác giả. Bài vi t cũng đề ra thách thức và tiêu chí đ nh gi trong việc
gi m định ảnh giả, từ đó làm cơ sở để phân tích và so sánh giữa c c ph ơng ph p h c nhau
Từ khóa: phát hiện ảnh giả, pháp chứng, kỹ thuật watermarking, chữ ký signature, ảnh cloning,
splicing, retouching, ảnh tạo hồn tồn từ máy tính (CGI), biến đổi cosine rời rạc (DCT), phân tích
thành phần chính (PCA), máy vector hỗ trợ (SVM).
Abstract


A digital image can be visually changed with ease by using certain editing software. A foundation on
which we are relying is the assumption that although digital forgeries may leave no visual evidences
indicating the tampering, they may have altered the statistical properties of pixel values in the image. This
paper is a literature review on digital image forgery detection focusing on blind detection approach, from
the very beginning work of Fridrich in 2003 to the recent ones in the first half of 2016. Most of the
proposed methods are well classified into categories and analyzed with comments and citations. This work
also indicates the vital challenges and criteria of performance evaluation to the detection of forgery
images, which are considered as the basis of comparison between different methods.
Keywords: digital image forgery, forensics, watermarking, signature, copy-move, splicing or retouching
image, computer-generated imagery (CGI), affine transform, discrete cosine transform (DCT), discrete
wavelet transform (DWT), principal component analysis (PCA), support vector machine (SVM).

3


detection). Với trạng thái bị động về nguồn
tin, yêu cầu đặt ra là chỉ dựa vào bức ảnh
đang có mà ta phải x c định liệu ảnh này có
thật hay bị chỉnh sửa gì hay không. Với sự
quan sát về bản chất rằng: mặc dù ảnh giả
có thể hông để lại dấu v t trực quan cho
mắt trần của con ng i nhận bi t dấu hiệu
chỉnh sửa, nh ng ảnh đó có thể đã bị thay
đổi về mặt số liệu thống kê ở mức giá trị
pixel. Các thuộc tính thống kê này có thể
đ ợc phân tách và trích l c để tạo thành các
đặc tr ng giúp nhận bi t sự can thiệp về
chỉnh sửa ảnh. Hình 2 cho thấy mức độ
quan tâm trong lĩnh vực gi m định ảnh
thông qua số l ợng bài báo công bố giai

đoạn 2004 – 2013.

1. ặt v
v k thu t
nh
nh s
Nhi p ảnh dần trở thành lĩnh vực phổ
bi n trong cuộc sống con ng i từ những
năm hởi đầu ở th kỷ XIX. Dù ở mức độ
chuyên nghiệp hay nghiệp d , ai cũng có
thể d dàng tạo đ ợc một bức ảnh kỹ thuật
số (từ đây, g i tắt là ảnh) bằng camera trên
điện thoại hoặc máy ảnh, sau đó chỉnh sửa
ảnh trực ti p tr n điện thoại hoặc chuyên
sâu hơn, chỉnh sửa trên máy tính (Personal
Computer) bằng các phần mềm chuyên
dụng. M i chuyện sẽ hông có gì đ ng nói
n u nh m i bức ảnh đều đ ợc sử dụng
đúng với mục đích và chức năng của nó:
truyền tải cho ng i nhìn thông tin ghi
nhận lại trong th giới thực. Vấn đề nảy
sinh khi một ng i dùng ảnh đã chỉnh sửa
nh là một công cụ để khi n cho ng i xem
tin vào thông điệp mà ng i đó muốn
truyền tải. Hiện t ợng này dẫn tới nhu cầu
sử dụng giải pháp khoa h c để gi m định
tính chân thực trong nội dung hiển thị của
ảnh. Hình 1 là ảnh giả từng đ ợc sử dụng
trong truyền thông.
hông th ng, để bảo vệ tác quyền ảnh

và xác thực nguồn gốc, kỹ thuật
watermar ing hay signature đ ợc áp dụng
vào trong ảnh. Từ đó, n u nội dung ảnh bị
chỉnh sửa thì dữ liệu đ ợc mã hóa vào ảnh
(vốn đ ợc xem là thông điệp nhận dạng
mang tính bí mật) sẽ bị thay đổi. Việc xác
thực ảnh đ ợc thực hiện bằng cách trích
xuất ng ợc lại mã nhúng từ ảnh rồi kiểm tra
mã này có t ơng ứng với mã mà ng i giữ
bản gốc đang sở hữu hay hông Đây là
c ch gi m định chủ động (active), khi mà
ảnh gốc và ảnh giả đều sẵn có, hiện hữu.
Mặt h c, th ng bức ảnh nhận đ ợc
hông đi èm với bất cứ thông tin bi t
tr ớc nào Điều này dẫn tới c ch gi m định
bị động (passive) hoặc phát hiện mù (blind

a)
b)
Hình 1: Ảnh ch p c u tổng th ng Pháp
z
p gi i Tour de
France: nh g c (a) và nh ch nh s a (b).
[T p chí Le Parisien, 07/2015.
www.fourandsix.com]

Hình 2: S bài báo khoa h c IEEE và
c
nh
nh s

n 2004 - 2013. [23]
Phần còn lại của bài vi t có bố cục nh
4


sau: mục II. trình bày các loại ảnh giả, mục
III. và IV. phân loại các giải ph p gi m định
theo h ớng Active và Passive, mục V. và VI.
lần l ợt là các thách thức và ti u chí đ nh gi
khi thực hiện gi m định ảnh, cuối cùng là
thảo luận và k t luận ở mục VII. và VIII.
2. Phân lo i nh gi
A. Cloning
Một phần của ảnh đ ợc sao chép và
dán (clone) vào một nơi h c của cùng một
ảnh ban đầu với mục đích là để che giấu
hoặc tạo thêm chi ti t trong ảnh. Ví dụ điển
hình đ ợc cho ở hình 3.

p dụng cho loại ảnh giả này để tăng c ng
hay giảm bỏ c c chi ti t gốc. ột ví dụ
đ ợc cho ở hình 5.

a)
Hình 5:
a)


b)


b):

ú

ê
ặ [35]
D. Computer-Generated Imagery (CGI)
Thay vì làm giả một phần, một bức ảnh
có thể đ ợc làm giả hoàn toàn (không chụp
bằng camera) nh các công cụ đồ h a trên
máy tính. Một ví dụ đ ợc cho ở hình 6.

a)
b)
Hình 3: Ví d nh cloning. Ảnh g c (a)
và nh gi (b) v i vùng nh hai con mèo
. [2]
B. Splicing
ỹ thuật này giống cloning, ngoại trừ
việc vùng ảnh sao chép đ ợc lấy từ nguồn
ảnh h c b n ngoài Nói cách khác,
splicing là tr ng hợp tổng qu t hơn
cloning. ột ví dụ ảnh splicing đ ợc cho ở
hình 4.

Hình 6: Ví d v nh CGI. Ảnh g c
(n a mặt trái) và nh gi (n a mặt ph i):
h un
nh
m khác

bi t bằng m
ờng. [22]
3.
ng ti p c n phát hi n nh gi
- Active
rong ỹ thuật watermar ing, dữ liệu
nhúng là thông tin đã đ ợc x c định tr ớc,
nh là một ảnh biểu t ợng th ơng hiệu
hoặc một đoạn văn bản au hi mã hóa
thông tin vào ảnh, dữ liệu nhúng có thể
đ ợc hiển thị tr n ảnh, hoặc cũng có thể để


a,
b)
c). [7]
C. Retouching
Nâng cao chất l ợng ảnh (cân bằng
trắng, đổi màu, tạo nhòe, v v ) th ng đ ợc
Hình 4:

5


ẩn hoàn toàn, hoặc t hợp cả hai c ch
(hình 7). Việc trích xuất lại watermar
cũng có hai c ch: giải thuật có dùng thêm
thông tin từ ảnh gốc (non-blind) và không
dùng ảnh gốc (blind) rong hi ỹ thuật
watermar ing thực hiện nhúng thông tin

đ ợc ch n tr ớc vào ảnh, thì ỹ thuật
signature thực hiện lấy đặc tr ng độc nhất
từ ảnh rồi mã hóa thành dạng chữ ý số

bi n đổi ng ợc để t i tạo lại watermar đã
dùng. Kỹ thuật watermar ing trải phổ [10]
đ ợc sử dụng phố bi n và có nhiều thuật
toán mới đ ợc đề xuất ph t triển; đồng
th i, đây cũng là giải ph p mang tính bền
vững cao
Tiwari et al. [34] dùng bi n đổi DW
hai mức cho ảnh gốc và dữ liệu nhúng
đ ợc mã hóa DE (Data Encryption
tandard) tr ớc hi t hợp nhúng với ảnh
gốc
t quả là watermar chống chịu hiệu
quả với phép nội suy hối nh ng vẫn giữ
đ ợc chất l ợng ảnh ở hệ số chất l ợng QF
lớn hơn 90 Jiansheng et al. [16] t hợp
DW với D
cho ra t quả watermar
đ ợc ẩn hoàn toàn, đồng th i chống ch i
đ ợc một số phép xử lý thông dụng nh
l c, tăng c ng sắc nét, nhi u muối ti u,
nén và cắt ảnh
Những năm gần đây, c c h ớng
nghi n cứu dựa trên ba loại bi n đổi cơ bản
này vẫn đ ợc chú tr ng ph t triển. Pathak
et al. [27] dùng lý thuy t to n huỗi hỗn
loạn (Chaotic sequence) để trải phổ tín hiệu

watermar vào c c hệ số DW , giúp giữ
nguy n chất l ợng ảnh gốc (cải thiện chỉ số
NR) và tăng tính bền vững đối với c c
phép bi n đổi nh phân t n dữ liệu nhúng
tr n vùng phổ rộng và mang đặc tính giống
nhi u (hình 8). Hu et al. [14] tăng c ng
hả năng chống chịu tấn công nén J E và
thay đổi nhi u bằng c ch điều ch gi trị
trung bình của hệ số D
đổi dấu một
phần ( A) có ph ơng sai điều chỉnh theo
bảng l ợng tử J E hoặc chỉ số bi n dạng
đ ng chú ý (JND) của mô hình ệ thống
thị gi c con ng i ( V ) Su et al. [32]
dùng phép bi n đổi mới hơn là ontourlet,
t hợp phép phân tích essenberg để
nhúng watermar trong ảnh màu, t quả
đạt tính vô hình cao hơn và hả năng
chống ch i tốt hơn từ c c cuộc tấn công về

a)
b)
Hình 7:
a)
(“
” Africa Studio,
www.shutterstock.com) và bán
b)
(“20 0
©” Klaus Herrmann,

).
ó hai h ớng ti p cận: nhúng
watermar trong miền hông gian và trong
miền tần số Trong miền hông gian, ba ỹ
thuật chính là Bit tr ng số thấp nhất (LSB)
[8, 37], ập hối (Patchwork) [3] và ã dự
đo n (Predictive coding) [39]. Ba ph ơng
pháp trên, theo thứ tự t ơng ứng, rất nhạy
với nhi u thay đổi tr n gi trị pixel (từ
nh truyền, phép xử lý hậu ỳ nh xoay,
dịch và cắt ảnh), bị giới hạn l ợng thông
tin nhúng và ém về mặt giữ nguy n chất
l ợng ảnh, n n watermar miền tần số
đ ợc quan tâm xem xét nhiều hơn nh
hắc phục đ ợc c c y u điểm này.
Trong miền tần số, ba phép bi n đổi
chính là Wavelet r i rạc - DWT, osine r i
rạc - DCT và Fourier r i rạc - DFT. Bức
ảnh đ ợc biểu di n d ới dạng tần số, vốn
là đặc tính của tín hiệu nói chung, thông
qua c c hệ số của miền bi n đổi. Thông tin
mã nhúng đ ợc lồng vào c c hệ số này và
hi ti n hành x c minh, ta thực hiện phép
6


nén J E , l c tích chập và nhi u cộng

w


Hình 8:
)Ả
w

còn đề xuất ph ơng ph p tối u hơn là
Robust Match bằng cách dùng hệ số DCT
thay vì giá trị pixel cho b ớc so sánh khối.
h ơng ph p này cho hiệu quả cao hơn
nh ng vẫn còn vài giới hạn về độ tin cậy.
Ngoài ra, ph ơng ph p này cũng hông bền
vững tr ớc các phép bi n đổi tuy n tính.
Bảng 1 thống kê k t quả đạt đ ợc
t ơng ứng với các loại đặc tr ng khác nhau,
thay vì dùng mức xám hay hệ số D
nh
đã phân tích ở đoạn tr ớc. Công trình tiêu
biểu gần đây trong nhóm kỹ thuật này là
Kaur và Walia [24] với việc sử dụng ớc
l ợng nhi u và đặc tr ng về độ dốc có định
h ớng biểu đồ tần suất ( O ) h ơng
pháp này có khả năng đồng th i phát hiện
và định vị vùng ảnh giả. K t quả (hình 9)
đ ợc thử nghiệm trên tập dữ liệu CASIA.

ú
)Ả

W [40].
)Ả
w


.
ng ti p c n phát hi n nh gi

4.
- Passive
Hầu h t các kỹ thuật mù phát hiện ảnh
giả đều có thể phân loại thành năm nhóm:
dựa vào pixel, định dạng, máy ảnh và độ r i
sáng (từ mục A. đ n D.). Ngoài ra, có một
cách phân nhóm khác dựa trên loại đặc
tr ng [30], n n năm nhóm trên có thể sắp
x p lại thành hai nhóm lớn: dựa trên khối
pixel và keypoint.
A. Dựa vào pixel
Các khối pixel, vốn là cơ sở hình thành
nên ảnh số, đ ợc chú tr ng khảo s t để tìm
sự h c th ng trong thống kê ở mức giá trị
pixel, từ đó t luận về dấu v t chỉnh sửa
của vùng ảnh giả. Trong công trình khởi
đầu h ớng nghiên cứu gi m định ảnh,
Fridrich et al. [11] đề xuất ph ơng ph p
Exhausive Search cho ảnh cloning bằng
cách tìm hai vùng chứa giá trị pixel giống
nhau Đây là ph ơng ph p rất cơ bản và
đơn giản nh ng hông đủ để dùng giám
định ảnh giả thực t , đồng th i lại cần khối
l ợng tính toán lớn au đó, công trình này

a) Ảnh gốc

b) Ảnh giả
Hình 9: Phát hi
nh v vùng nh
gi
trong hình b) dùng k
thu Ư
ng nhi

HOG [18].
B. Dự và định dạng ảnh
r ớc khi bị làm giả, ảnh đ ợc mở
bằng phần mềm chỉnh sửa au đó, ảnh
đ ợc l u mới và qua thêm một lần nén ảnh
(ví dụ định dạng J E ) Để tận dụng tính
chất nén không bảo toàn JPEG, có ba
ph ơng ph p đ ợc đề xuất:
1. Lượng tử JPEG

7


B ng 1: So sánh k t qu
h ơng ph p
Popescu và

Đặc tr ng
PCA

Farid [28]
Gopi et al.[13]


n nh cloning [23]

ệ số tự hồi quy

Độ chính xác

Bộ phân lớp

ắp x p theo thứ tự t n 100% hối pixel 16x16
(lexicographic)
50% hối pixel nhỏ hơn
ạng nơron nhân tạo

94.83%

Lin et al. [19]

ng độ s ng trung ắp x p theo cơ số và 98%
bình của hối pixel tính vector dịch

Bashar et al. [1]

DWT và KPCA

Thajeel và Sulong [33] CR LBP

huật to n ph t hiện 95.55% (DWT)
nhân bản dựa theo điểm
90.94% (KCPA)

ắp x p theo thứ tự t n

> 91% (với phép xoay
và phép xoay
t hợp
với phép bi n đổi khác)
99% tr n tập dữ liệu
CASIA v1.0 và tập màu
DVMM

Isaac và Wilscy [15]

Gabor Wavelet và SVD
l ợng tử pha cục bộ
(LPQ)

Kaur và Walia [18]

Ước l ợng nhi u Phân nhóm k-Means và ~70% cho tập dữ liệu
dựa tr n
A và đặc SVM
CASIA v1.0 và v2.0
tr ng O

Khi nén, mỗi hệ số DCT c đ ợc l ợng
tử với hệ số q: c/q. Việc lựa ch n giá trị q
khác nhau cho ra bảng l ợng tử khác nhau;
do đó, một dạng chữ ý độc nhất về l ợng
tử sẽ đ ợc nhúng vào ảnh JPEG ở đầu ra.
2. Nén JPEG hơn một lần

Phát hiện ảnh giả dựa trên hiện diện
của nhi u (artifact) khi có nhiều hơn một
lần nén ảnh. Giải pháp là phân tích tính chu
kỳ lặp lại của nhi u l ợng tử đôi trong
histogram sau khi ảnh bị nén từ lần thứ hai
(hình 10).

3. Nhiễu khối JPEG
Phát hiện ảnh giả dựa trên sự bất đồng
nhất trong nhi u khối. Giải pháp là tìm ma
trận nhi u khối và quan sát phân lớp mẫu.
Ảnh giả qua nhiều lần nén sẽ gây nhi u
trong hai quan sát này.
Lin và Tsay [21] dùng bộ ớc l ợng
ích th ớc khối nhi u (áp dụng kỹ thuật lấy
mẫu ngẫu nhiên, bầu ch n và hợp lý cực
đại - maximum likelihood) và phân tích
tính nhất quán của ích th ớc khối nhi u
JPEG (hình 11), khối cục bộ nào có kích
th ớc khác với ích th ớc khối chính thì
đ ợc xem là vùng ảnh giả.

a)
b)
Hình 10: K t qu phân tích nén JPEG và
nhi
ng t (b) t nh gi (a). Xem
ngu n nh th t hình 3. [2]

a) Ảnh splicing.

b) K t quả.
Hình 11: Phát hi n nh Splicing dùng k
thu Ư
ng kh i nhi u [21].
8


Tuy nhiên, thực t khó sử dụng h ớng
ti p cận này vì với phát hiện mù, việc bi t
tr ớc thông tin về loại cảm bi n hay bản đồ
nhi u cho tr ớc, hoặc sở hữu tập ảnh đ ợc
chụp từ cùng một cảm bi n thì hoàn toàn
không khả thi.
D. Dự và cườ g độ rọi sáng và màu
Vì c c phần ảnh giả đ ợc cắt ghép từ
nhiều nguồn h c nhau n n chúng hông
đảm bảo đ ợc tính nhất qu n của h ớng
nguồn s ng đặt l n đối t ợng Do đó, phân
tích sự bất th ng trong hiệu ứng nh s ng
đ ợc r i l n c c đối t ợng giúp chỉ ra dấu
v t của chỉnh sửa ó hai c ch để tận dụng
h ớng ti p cận này: vị trí nguồn s ng và
phân lớp màu (ví dụ hình 14). Tuy nhiên,
số l ợng lớn c c đối t ợng trong màu sắc
h c nhau dẫn tới sự hó hăn trong việc
ph t hiện tất cả đối t ợng giả cùng một lúc
Do đó, phần lớn công trình nghi n cứu gần
đây tập trung vào sử dụng một phần hông
gian màu để giới hạn loại đối t ợng xem
xét, ví dụ nh chỉ xem xét đối t ợng màu

da ng i [5].
Johnson và Farid [17] đã vận dụng t
quả nghi n cứu Ước l ợng tự động h ớng
nguồn s ng [25] để đ nh gi mức độ phản
xạ cục bộ hoặc toàn cục tr n c c vùng ảnh
có t cấu h c nhau (hình 13). Carvalho et
al. [6] xây dựng mô hình 3 chiều của đối
t ợng (chỉ từ một ảnh) tr ớc hi ớc l ợng
h ớng nguồn s ng đ ợc đặt l n đối t ợng
đó uy t quả hông đ ợc đ nh gi tr n
một tập dữ liệu lớn, nh ng từ t quả thí
nghiệm cho thấy ph ơng ph p này hiệu
quả ngay cả với nguồn s ng phức tạp
Mặc dù kỹ thuật phân tích h ớng
nguồn sáng và thông tin màu rất hứa hẹn trở
thành một công cụ gi m định ảnh hiệu quả,
nh ng trong 5 năm trở lại đây, số l ợng
công trình về h ớng nghiên cứu này vẫn
còn rất ít so với c c h ớng ti p cận khác.

Tóm lại, những kỹ thuật này chỉ có lợi
th trên bức ảnh đ ợc l u lại hơn một lần.
Việc chỉ dùng mỗi thông tin về định dạng
ảnh hông đủ để xây dựng ph ơng ph p
phát hiện ảnh giả bền vững. Ngoài ra, n u
chỉ dùng thông tin nén ảnh thì d dẫn đ n
phát hiện sai, đơn cử là tr ng hợp ảnh gốc
đ ợc phóng to theo thuật toán nội suy hoặc
đ ợc làm nhòe, sau đó đ ợc l u lại Nh
vậy, mặc dù nội dung ảnh hông thay đổi

nh ng vẫn sẽ bị đ nh gi là ảnh giả, vì cũng
có trải qua thêm một lần nén.
C. Dựa vào máy ảnh
Phân tích nhi u đ ợc tạo ra từ một hệ
thống máy ảnh nhất định; từ đó, sự không
nhất quán trong nhi u có thể đ ợc dùng để
chỉ ra dấu v t chỉnh sửa ảnh. Có bốn cơ sở
để áp dụng: h c th ng về màu sắc, Mảng
l c màu, àm đ p ứng của máy ảnh và
Nhi u cảm bi n.
Fridrich et al. [12] sử dụng kỹ thuật
Ước l ợng đ p ứng hông đồng nhất của
máy ảnh để tận dụng thông tin từ nhi u của
cảm bi n hông tin này đ ợc xem xét nh
là đặc tr ng nhận dạng (hình 12) cho việc
phát hiện ảnh đ ợc chụp bởi máy ảnh thật
hay từ cùng một máy ảnh hay không. Theo
đó, tất cả cảm bi n đều có các thuộc tính
t ơng tự cho việc tạo đặc tr ng nhận dạng
dựa tr n cơ sở rằng chúng đ ợc tạo từ công
nghệ sản xuất giống nhau.

Hình 12: Phóng to m t ph n nh nhi u
trên c m bi n Canon G2. Giá tr pixel
c chia t l theo d [0 255] quan
sát. [12]
9


giống nhau, bầu tr i, mảng mây).

 Có khả năng hoanh vùng và định
vị vùng ảnh giả.
 Loại bỏ các thông tin thừa khi tìm
vùng ảnh giả: ví dụ nh chữ bìa báo
trong hình 1.
 Các thuật to n có dùng ng ỡng để
phân loại k t quả th ng ch n giá
trị ng ỡng cố định và mang tính
kinh nghiệm. Cần xây dựng hàm lấy
ng ỡng thích hợp có khả năng tùy
bi n thích nghi và có mối liên hệ
chặt chẽ với c c đặc tính đang xem
xét của ảnh để tối u điểm lấy
ng ỡng theo hàm mục ti u độ chính
xác cực đại.
Gần đây, Zerni e moments và lựa ch n
bi n đổi tuy n tính t ơng đồng (SATS)
đ ợc dùng cho phát hiện xoay [31, 9], SIFT
cho xoay và tỉ lệ [26], SUFT cho xoay, tỉ lệ,
nhi u cộng và nhòe [4], SVM cho phát hiện
vùng nhòe [36]. Bi n đổi FMT thì bền vững
đối với xoay, tỉ lệ, nhi u và nhòe với chi
phí tính toán thấp.
6. ê
 Độ chính x c: ỉ lệ số lần ph t hiện
đúng tr n tổng số ảnh giả đầu vào

hi phí tính to n: l ợng tính to n
cần dùng để cho ra t quả, cần l u
ý hi ứng dụng vào hệ thống th i

gian thực
 Độ nhạy với c c phép bi n đổi: chỉ
ra mức độ t quả bị ảnh h ởng bởi
c c điều iện thử nghiệm h c nhau.
 Không nhạy với thay đổi của nhi u.

ức độ tự động: giảm thiểu can
thiệp của con ng i trong việc di n
dịch và đ a ra t luận gi m định.
Độ chính x c n n là ti u chí hàng đầu,
vì đây là t quả cuối cùng ảnh h ởng tới
quy t định gi m định, nhất là hi liên quan
tới luật pháp, còn các tiêu chí h c có thể

a)
b)
Hình 13: Ảnh giả (a) cho thấy góc ước
lượng hướng ánh sáng cách biệt giữa hai
người, 123o và 86o. Ảnh thật (b) cho thấy
góc ước lượng hướng ánh sáng của hai
người tương đương nhau, 98o và 93o. [17]

a)
Hình 14:
sáng (b)

b)

(a). [5]


5. Các thách th c
nh nh
Cần x c định rõ các thách thức sẽ phải
đối mặt trong việc phát hiện ảnh giả để l u
ý các vấn đề cần giải quy t và đặt ra giả
thuy t phù hợp trong quá trình nghiên cứu:
 Giảm tỉ lệ phát hiện sai
 Hoàn toàn tự động (không cần con
ng i can thiệp để di n dịch k t quả)
 Không phụ thuộc vào định dạng
nguồn ảnh (nén ảnh)
 ăng độ tin cậy và bền vững đối với
bi n đổi tuy n tính và phi tuy n.
 Tránh giới hạn số l ợng và kích
th ớc của vùng ảnh giả có thể phát
hiện đ ợc bởi thuật toán.
 Tận dụng thông tin màu, thay vì chỉ
dùng ảnh xám.
 Tránh phát hiện sai c c đối t ợng thật
có tính chất giống nhau hoặc đồng
nhất tự nhiên (ví dụ: lốc các hộp sữa
10


đ nh đổi qua lại Độ nhạy có thể đ ợc giới
hạn ở một số hía cạnh và ứng dụng để
ph ơng ph p đề ra có thể đ p ứng tốt một
số mục ti u nhất định.
iệu năng có thể đ ợc biểu di n d ới
dạng thống

độ chính x c, độ nhạy và độ
ri ng biệt Độ nhạy (Sensitivity) là thông
số đo l ng độ chính x c phân loại đúng
đối với ảnh giả (tức, ảnh giả đ ợc x p loại
là giả), Độ ri ng biệt ( pecificity) đo l ng
độ chính x c phân loại đúng đối với ảnh
thực (tức, ảnh thực đ ợc x p loại là thực)
và Độ chính x c (Accuracy) là tỉ lệ phần
trăm giữa số ảnh phân loại đúng tr n tổng
số ảnh xem xét (tức, ảnh giả đ ợc x p loại
là giả và ảnh thực đ ợc x p loại là thực),
tính nh (1):
TP  TN


Accuracy  100 
 (1)
TP  TN  FN  FP 

Với:
 TP (True Positive): số ảnh giả đ ợc
x p đúng là ảnh giả
 FN (False Negative): số ảnh giả
đ ợc x p sai thành ảnh thực
 FP (False Positive): số ảnh thực
đ ợc x p sai thành ảnh giả
 TN (True Negative): số ảnh thực
đ ợc x p đúng là ảnh thực
7.
l

rong hi ỹ thuật watermar và
signature đ ợc dùng nh là công cụ chủ
động để giúp chủ nhân của c c bức ảnh số
bảo vệ quyền t c giả của mình, thì phần
còn lại của câu chuyện gi m định ảnh là
ph t hiện mù tr n những bức ảnh hông rõ
nguồn gốc
ớng ti p cận dựa vào độ r i
sáng và không gian màu là ph ơng ph p
ph t hiện hứa hẹn ph t triển nhất vì nó
hông phụ thuộc vào c c phép bi n đổi p
dụng tr n vùng ảnh giả uy nhi n, h ớng
ti p cận này cũng phải đối mặt với hó
hăn về định vị và hoanh vùng ảnh giả

r i lại, h ớng ti p cận dựa vào m y ảnh
mang tính ém hả thi nhất vì nó y u cầu
đ ợc bi t một số thông tin có tr ớc từ ảnh
hả nghi, điều mà vốn hông thể đạt đ ợc
trong ứng dụng thực t
hép bi n đổi nh
D
hay F
ti p tục là ỹ thuật hiệu quả
để biểu di n lại ảnh với ích th ớc nhỏ hơn
(giảm thông tin d thừa) để giảm hối
l ợng tính to n Ngoài ra, hai tập dữ liệu
ảnh th ng dùng phổ bi n trong c c công
trình gần đây đ ợc đ nh gi là đủ tốt để
thử nghiệm và so s nh giữa c c ph ơng

ph p, đó là o oFoD (từ phòng thí
nghiệm Video ommunications, Đại h c
Zagreb, roatia) và A IA (từ Viện ự
động Nhận dạng ẫu,
c việc hoa h c
Quốc gia, rung Quốc)
ổng quan, nhiều ph ơng ph p đã
đ ợc đề xuất để xử lý c c th ch thức trong
ph t hiện ảnh giả, tuy nhi n chúng vẫn còn
nhiều giới hạn về tính ứng dụng thực t
ột phần là vì có đặt tr ớc giới hạn trong
giả thuy t ban đầu, một phần là vì thi u
một mô hình chung và chuẩn hóa để hội tụ
c c nh nh nghi n cứu còn đang ri ng lẻ
Việc đ nh gi tính bền vững đối với c c
loại phép bi n đổi đ ợc dùng tr n vùng ảnh
giả vẫn dựa tr n thực nghiệm iểm chứng
là chủ y u, n n nhu cầu về một mô hình
to n h c hỗ trợ cho việc phân tích t quả
cũng nh là dự đo n và ớc l ợng tr ớc
tính bền vững của giải ph p (hay cụ thể là
loại đặc tr ng) đ ợc đề xuất là cần thi t
8.
l n
Bài hảo s t này đã tóm tắt phần lớn
các h ớng nghi n cứu về lĩnh vực gi m
định ảnh giả trong 15 năm gần đây, tập
trung chủ y u vào h ớng ph t hiện mù
rong h ớng ti p cận chủ động, có hai ỹ
thuật chính đ ợc dùng là watermar ing và

signature; còn h ớng ti p cận bị động, có
năm nhóm chính là dựa vào pixel, định
11


dạng, m y ảnh và độ r i s ng ai ỹ thuật
dựa vào hối pixel và eypoint cũng là một
c ch phân loại h c Bài vi t cũng đã chỉ ra
u nh ợc điểm của mỗi nhóm phân loại
Nhiều ỹ thuật đ ợc đ a ra cho thấy sự cải
thiện lớn về độ chính x c l n tới 99%; tuy
nhi n, th ng luôn có sự đ nh đổi giữa độ
chính xác, mức phức tạp và độ bền vững
trong giải thuật Ngoài ra, việc đối phó với
c c phép bi n đổi tuy n tính cũng là một
trong c c th ch thức lớn nhất trong việc
xây dựng giải ph p mang tính bền vững, do
sự đa dạng và tính t hợp của c c phép
bi n đổi đ ợc dùng hi tạo ảnh giả.

8. Chang, C. C., Hsiao, J. Y., và Chan, C. S.
(2003). Finding optimal least-significant-bit
substitution in image hiding by dynamic
programming strategy. Pattern Recognition,
36(7), 1583-1595.
9. Christlein, V., Riess, C., và Angelopoulou, E.
(2010). On rotation invariance in copy-move
forgery detection. In Information Forensics
and Security (WIFS), 2010 IEEE International
Workshop on, pages 1-6. IEEE.

10. Cox, I. J., Kilian, J., Leighton, F. T., và
Shamoon, T. (1997). Secure spread spectrum
watermarking
for
multimedia.
IEEE
Transactions
on
Image
Processing,
6(12):1673-1687.
11. Fridrich, A. J., Soukal, B. D., và u š, A. J.
(2003). Detection of copy-move forgery in
digital images. In in Proceedings of Digital
Forensic Research Workshop. Citeseer.
12. Fridrich, J. (2009). Digital image forensics.
Signal Processing Magazine, IEEE, 26(2):26-37.
13. Gopi, E., Lakshmanan, N., Gokul, T., Kumara
Ganesh, S., và Shah, P. R. (2006). Digital
image forgery detection using artificial neural
network and auto regressive coefficients. In
Electrical and Computer Engineering, 2006.
E E’06 anadian onference on, pages
194-197. IEEE.
14. Hu, H. T., Chang, J. R., và Hsu, L. Y. (2016).
Robust blind image watermarking by
modulating the mean of partly sign-altered
DCT coefficients guided by human visual
perception. AEU-International Journal of
Electronics and Communications.

15. Isaac, M. M., và Wilscy, M. (2015). Image
Forgery Detection Based on Gabor Wavelets
and Local Phase Quantization. Procedia
Computer Science, 58, 76-83.
16. Jiansheng, M., Sukang, L., và Xiaomei, T.
(2009). A digital watermarking algorithm
based on DCT and DWT. In Proceedings of
the 2009 International Symposium on Web
Information Systems and Applications
(WI A’09) Nanchang, R
hina, pages
104-107. Citeseer.
17. Johnson, Micah K., và Hany Farid. (2005)
Exposing digital forgeries by detecting
inconsistencies in lighting. Proceedings of the
7th workshop on Multimedia and security.
ACM.
18. Kaur, M., và Walia, S. (2016). Forgery
Detection Using Noise Estimation and HOG
Feature Extraction. International Journal of

Lời c
ông trình này đ ợc tài trợ bởi quỹ Đại h c
Quốc gia Thành phố Hồ Chí Minh với mã
sốB2015-20-02.
TÀI LIỆU THAM KHẢO
1. Bashar, M., Noda, K., Ohnishi, N., và Mori,
K. (2010). Exploring duplicated regions in
natural images. IEEE Transactions on Image
Processing, vol. PP, no. 99, pp. 1-1.

2. Belkasoft, Belkasoft database. [Online].
Available: />3. Bender, W., Gruhl, D., Morimoto, N., và Lu,
A. (1996). Techniques for data hiding. IBM
systems journal, 35(3.4), pp. 313-336.
4. Bo, X., Junwen, W., Guangjie, L., và Yuewei, D.
(2010). Image copymove forgery detection based
on surf. In Multimedia Information Networking
and Security (MINES), 2010 International
Conference on, pages 889-892. IEEE.
5. Carvalho, T. J. d., Riess, C., Angelopoulou,
E., Pedrini, H., và de Rezende Rocha, A.
(2013). Exposing digital image forgeries by
illumination color classification. Information
Forensics and Security, IEEE Transactions
on, 8(7):1182-1194.
6. Carvalho, Tiago, Hany Farid, và Eric Kee.
(2015). Exposing photo manipulation from
user-guided 3D lighting analysis. SPIE/IS&T
Electronic Imaging. International Society for
Optics and Photonics.
7. CASIA. Tampering detection dataset. [Online].
Available:

12


Multimedia and Ubiquitous Engineering,
11(4), 37-48.
19. Lin, H.-J., Wang, C.-W., Kao, Y.-T., và Chen,
S. (2009a). An efficient method for copy-move

forgery detection. In WSEAS International
Conference. Proceedings. Mathematics and
Computers in Science and Engineering,
number 8. World Scientific and Engineering
Academy and Society.
20. Lin, H.-J., Wang, C.-W., Kao, Y.-T., et al.
(2009b). Fast copy-move forgery detection.
WSEAS Transactions on Signal Processing,
5(5): 188-197.
21. Lin, C. S., và Tsay, J. J. (2015). Passive
forgery detection for JPEG compressed image
based on block size estimation and
consistency analysis. Applied Mathematics
and Information Sciences, 9(2), 1015.
22. Luxion.
Keyshot
program.
[Online].
Available:
23. Mushtaq, S. và Mir, A. H. (2014). Digital
image forgeries and passive image
authentication
techniques:
A
survey.
International Journal of Advanced Science
and Technology, 73:15–32.
24. Myrna, A., Venkateshmurthy, M., và Patil, C.
(2007). Detection of region duplication
forgery in digital images using wavelets and

log-polar mapping. In Conference on
Computational Intelligence and Multimedia
Applications, 2007. International Conference
on, volume 3, pages 371-377. IEEE.
25. Nillius, Peter, và Jan-Olof Eklundh. (2001).
Automatic estimation of the projected light
source direction. Computer Vision and
Pattern Recognition, 2001. CVPR 2001.
Proceedings of the 2001 IEEE Computer
Society Conference on. Vol. 1. IEEE.
26. Pan, X. và Lyu, S. (2010). Detecting image
region duplication using sift features. In
ICASSP, pages 1706–1709.
27. Pathak, S., Tiwari, S., và Agrawal, S. (2016).
Digital image watermarking in Wavelet
domain using chaotic. Futuristic Trends in
Engineering, Science, Humanities, and
Technology FTESHT-16, 108.
28. Popescu, A. và Farid, H. (2004). Exposing
digital forgeries by detecting duplicated
image region [technical report]. 2004-515.
Hanover, Department of Computer Science,

Ngày nhận bài: 30/8/2016

Dartmouth College. USA.
29. Qazi, T., Hayat, K., Khan, S. U., Madani, S.
A., Khan, I. A., Ko lodziej, J., Li, H., Lin, W.,
Yow, K., và Xu, C.-Z. (2013). Survey on
blind image forgery detection. Image

Processing, IET, 7(7):660-670.
30. Rajkumar, R., Chanu, T. A., và Singh, N. N.
(2016). Copy move forgery detection
approaches: A survey. ADBU Journal of
Engineering Technology,
31. Ryu, S.-J., Lee, M.-J., và Lee, H.-K. (2010).
Detection of copy-rotatemove forgery using
zernike moments. In Information Hiding,
pages 51–65. Springer.
32. Su, Q., Wang, G., Lv, G., Zhang, X., Deng,
G., và Chen, B. (2016). A novel blind color
image watermarking based on Contourlet
transform and Hessenberg decomposition.
Multimedia Tools and Applications, 1-21.
33. Thajeel, S. A. N., và Sulong, G. (2015). A
novel approach for detection of copy move
forgery using completed robust local binary
pattern. Journal of Information Hiding and
Multimedia Signal Processing, 6(2), 351-364.
34. Tiwari, N., Ramaiya, M. K., và Sharma, M.
(2013). Digital watermarking using DWT and
DES. In Advance Computing Conference
(IACC), 2013 IEEE 3rd International, pages
1100–1102.
35. Unknown. Retouching image. [Online].
Available:
www.retouchingphotos.wikispaces.com
36. Wang, B., Kong, X., Bertino, E., và Fu, H.
(2009). Exposing copypasteblur forgeries
based on color coherence. Chinese Journal of

Electronics, 18(3):487-490.
37. Wang, R. Z., Lin, C. F., và Lin, J. C. (2001).
Image hiding by optimal LSB substitution and
genetic algorithm. Pattern recognition, 34(3),
671-683.
38. Yang, R., Bai, Z., Yin, L., và Gao, H. (2015).
Detecting of copy-move forgery in digital
images using fractional Fourier transform. In
Seventh International Conference on Digital
Image Processing (ICDIP15) (pp. 96310B96310B). International Society for Optics and
Photonics.
39. Yu, Y. H., Chang, C. C., và Hu, Y. C. (2005).
Hiding secret data in images via predictive
coding. Pattern Recognition, 38(5), 691-705.

Biên tập xong: 15/9/2016
13

Duyệt đăng: 20/9/2016



×