TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NÔI
KHOA CÔNG NGHỆ THÔNG TIN
ĐỀ TÀI KHOA HỌC
TÌM HIỂU MỘT SỐ PHƯƠNG PHÁP
DÒ TÌM, PHÁT HIỆN SỰ GIẢ MẠO TRONG ẢNH SỐ
- -
1
Tìm hiểu một số phương pháp dò tìm, phát hiện sự giả mạo trong ảnh số
Information
MỤC LỤC
Lời mở đầu
Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH
1.1. Biểu diễn ảnh số
1.2 Một số khái niệm cơ sở trong xử lý ảnh
1.3 Các giai đoạn trong xử lý ảnh
Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠo
2.1 Bài toán phát hiện ảnh giả mạo
2.2 Hướng tiếp cận bài toán
2.2.1 Dựa vào hình dạng
2.2.2 Dựa vào phân tích nguồn sáng
2.2.3 Dựa vào biến đổi màu sắc
2.2.4 Dựa vào cơ sở dữ liệu
2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ
2.2.6 Dựa vào phân tích ánh sáng
Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁCH BIỆT HƯỚNG NGUỒN
SÁNG
3.1 Giới thiệu
3.2 Các loại nguồn sáng
3.3 Ước lượng hướng chiều nguồn sáng
3.3.1 Ước lượng hướng chiều của nguồn sáng
3.3.2 Tìm những đường có khả năng là biên khuất
3.3.3 Ước lượng hướng chiều sáng cho từng đường biên tìm được
3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất
3.4 Nguồn sáng ở vô tận (3-D)
3.5 Nguồn sáng ở vô tận (2-D)
3.6 Nguồn sáng ở gần (bộ phận) (2-D)
3.7 Nhiều nguồn sáng
Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN EXACTMATCh
4.1 Ý tưởng
4.2 Thuật toán
4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước
4.4 Thuật toán cải tiến Exacta match*
4.5 Kết luận
Tài liệu tham khảo
- -
2
MỤC LỤC
Lời mở đầu……………………………………………………...4
Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH……………………………..7
1.1. Biểu diễn ảnh số……………………………………………………………7
1.2 Một số khái niệm cơ sở trong xử lý ảnh…………………………………..8
1.3 Các giai đoạn trong xử lý ảnh…………………………………………….10
Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO……………...12
2.1 Bài toán phát hiện ảnh giả mạo…………………………………………….12
2.2 Hướng tiếp cận bài toán…………………………………………………….12
2.2.1 Dựa vào hình dạng……………………………………………………….12
2.2.2 Dựa vào phân tích nguồn sáng……………………………………………12
2.2.3 Dựa vào biến đổi màu sắc………………………………………………...13
2.2.4 Dựa vào cơ sở dữ liệu…………………………………………………….13
2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ…………………………...14
2.2.6 Dựa vào phân tích ánh sáng………………………………………………14
Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁCH
BIỆT HƯỚNG NGUỒN SÁNG……………………………………..15
3.1 Giới thiệu…………………………………………………………………….15
3.2 Các loại nguồn sáng………………………………………………………….15
3.3 Ước lượng hướng chiều nguồn sáng…………………………………………15
3.3.1 Ước lượng hướng chiều của nguồn sáng………………………………..15
3.3.2 Tìm những đường có khả năng là biên khuất……………………………16
3.3.3 Ước lượng hướng chiều sáng cho từng đường biên tìm được…………..17
3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất……………………………17
3.4 Nguồn sáng ở vô tận (3-D)…………………………………………………..17
3.5 Nguồn sáng ở vô tận (2-D)………………………………………………….18
- -
3
3.6 Nguồn sáng ở gần (bộ phận) (2-D)………………………………………….20
3.7 Nhiều nguồn sáng……………………………………………………………20
Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN
EXACTMATCH………..……………………………………………21
4.1 Ý tưởng………………………………………………………………………….21
4.2 Thuật toán……………………………………………………………………….22
4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước…………………...22
4.4 Thuật toán cải tiến Exacta match
*
……………………………………………...24
4.5 Kết luận…………………………………………………………………………26
Tài liệu tham khảo…………………………………………………………………..27
LỜI MỞ ĐẦU.......................................................................................5
Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH.............................................8
1.1 Biểu diễn ảnh số .................................................................................................8
1.2 Một số khái niệm cơ sở trong xử lý ảnh..........................................................9
1.3 Các giai đoạn trong xử lý ảnh.........................................................................11
Phần 2: BÀI TOÁN PHÁT HIỆN ẢNH GIẢ MẠO........................13
2.1 Bài toán phát hiện ảnh giả mạo ....................................................................13
2.2 Hướng tiếp cận bài toán...................................................................................13
2.2.1 Dựa vào hình dạng...................................................................................................13
2.2.2 Dựa vào phân tích nguồn sáng....................................................................................13
2.2.3 Dựa vào biến đổi màu sắc...........................................................................................13
2.2.4 Dựa vào cơ sở dữ liệu.................................................................................................14
2.2.5 Dựa vào dấu vết của quá trình điều chỉnh tỷ lệ .........................................................14
2.2.6 Dựa vào phân tích ánh sáng .......................................................................................15
Phần 3: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN SỰ KHÁC
BIỆT HƯỚNG NGUỒN SÁNG..........................................................15
3.1 Giới thiệu...........................................................................................................15
3.2 Các loại nguồn sáng.........................................................................................16
- -
4
3.3 Ước lượng hướng chiếu nguồn sáng...............................................................16
3.3.1 Ước lượng hướng chiếu của nguồn sáng...................................................................16
3.3.2 Tìm những đường có khả năng là biên khuất............................................................16
3.3.3 Ước lượng hướng chiếu sáng cho từng đường biên tìm được...................................17
3.3.4 Sử dụng mạng Bayes tìm ước lượng tốt nhất............................................................18
3.4 Nguồn sáng ở vô tận (3-D).............................................................................18
3.5 Nguồn sáng ở vô tận (2-D)..............................................................................18
Đơn giản hóa những giả định về hằng số độ tương phản...................................................20
3.6 Nguồn sáng ở gần (bộ phận) (2-D).................................................................20
3.7 Nhiều nguồn sáng............................................................................................20
Phần 4: PHÁT HIỆN ẢNH GIẢ MẠO DỰA TRÊN THUẬT TOÁN
EXACT MATCH..................................................................................21
4.1 Ý tưởng..............................................................................................................21
4.2. Thuật toán.......................................................................................................22
4.3 Phát hiện ảnh giả mạo dựa vào kỹ thuật thay đổi kích thước....................22
٭ Các kỹ thuật thay đổi kích thước....................................................................................22
4.4 Thuật toán cải tiến Exact match*..................................................................24
4.5 Kết luận............................................................................................................25
LỜI MỞ ĐẦU
Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật tiên tiến
được ứng dụng vào thực tế và ảnh số là một trong những thành quả đó. Với khả năng
- -
5
của các phần mềm biên tập và sử lý ảnh, các bức ảnh có thể dễ dàng bị sửa chữa và
hiệu chỉnh. Các chương trình phần mềm có thể thêm vào hay bỏ đi các đặc trưng của
ảnh mà không để lại nhiều dấu vết về sự giả mạo.
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau như
việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội
v.v…
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau như
việc vu cáo, tạo ra các tin giật gân, đánh lừa đối thủ, làm sai lệch chứng cứ phạm tội
v.v…
Ví dụ:
- Tháng 8/2006, một bức ảnh minh họa của Hãng tin Reuters xuất hiện trên các
trang báo lớn nhỏ trên khắp thế giới. Nội dung của bức ảnh là những cột khói tỏa lên
từ một số tòa nhà cao tầng sau một đợt không kích tại Beirut. Nhưng sau đó họ đã
phát hiện ra một phần của bức ảnh đã bị người ta sao chép (copy), rồi cắt dán lặp lại
nhiều lần trong bức ảnh, có lẽ tác giả ảnh muốn cho người xem cảm nhận được sự tàn
phá và hãi hùng vì... khói.
-
- -
6
Hình 4: Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến
tranh
- Một ảnh giả khác được tạo lập từ 3 bức ảnh: Nhà trắng, Bill Clinton và
Saddam Hussein. Hình ảnh Bill Clinton và Saddam Hussein được cắt và dán vào bức
ảnh Nhà trắng. Các hiệu ứng về bóng và ánh sáng cũng được tạo ra làm cho bước ảnh
có vẻ nhìn gần giống như thật, rất khó nhận biết bằng mắt thường.
- Một bức ảnh khác mô là hình ghép giữa hai bức ảnh khác nhau xuất hiện trong
chiến dịch tranh cử tổng thống Mỹ năm 2004, cho thấy ứng viên John Kerry nói
chuyện với cựu nữ diễn viên Jane Fonda tại một cuộc biểu tình phản chiến vào những
năm 60 của thế kỷ trước, bên dưới có đóng “nhãn hiệu cầu chứng” là The Associated
Press.
-
Hình 5: Ảnh giả của John Kerry và Jane Fonda được cắt ghép từ hai ảnh riêng lẻ
Một số cựu binh Mỹ thời chiến tranh Việt Nam phản ứng mạnh bằng thái độ
giận dữ khi thấy một ứng viên tổng thống lại chia sẻ diễn đàn với một nữ diễn viên
tích cực chống chiến tranh
Như vậy ảnh hưởng của những thông tin từ những bức ảnh là rất lớn, thông tin
hình ảnh luôn có tác động mạnh và trực tiếp tới con người. Do vậy ảnh được coi là
công cụ biểu diễn và truyền đạt thông tin rất phổ biến và hữu dụng.
- -
7
Phần 1: GIỚI THIỆU VỀ XỬ LÝ ẢNH
1.1 Biểu diễn ảnh số
Đối với ảnh đơn giản (ảnh đen trắng) thì ảnh được biểu diễn bằng một hàm
cường độ sáng hai chiều
,( )X Yf
, trong đó
,X Y
là các giá trị toạ độ không gian và hàm
giá trị của
f
tại một điểm
( , )X Y
bất kỳ sẽ tỷ lệ với độ sáng hay mức xám của điểm
ảnh tại điểm này. [2,4]
Hình 1: Biểu diễn ảnh bằng hàm
,( )X Yf
Trong mộ số trường hợp hàm ảnh còn được biểu diễn với một trục thứ 3 gọi là
hàm cường độ sáng (với hình 1.1, trục thứ 3 bằng 0).
Một ảnh số là một ảnh
,( )X Yf
được gián đoạn theo không gian và cường độ
sáng. Một ảnh số được xem như một ma trận với hàng và cột biểu diễn một điểm
trong ảnh và giá trị điểm ma trận tương ứng với mức xám tại điểm đó. Các phần tử
của một dãy số như thế được gọi là các điểm ảnh.
Ánh sáng có dạng năng lượng
,( )X Yf
phải khác 0 và hữu hạn:
,0 ( ) (1.1)X Yf< < ∞
Con người có khả năng nhận các hình ảnh từ ánh sáng phản xạ qua các vật thể.
Cơ sở của
,( )X Yf
được đặc trưng qua hai thành phần:
Số lượng ánh sáng nguồn rơi trên cảnh vật được nhìn thấy.
- -
* P(X,Y)
8
Số lượng ánh sáng nguồn phản xạ từ vật thể ( trong cảnh vật).
Chúng được gọi gần đúng là sự phát sáng và các thành phần phản xạ, và được
biểu diễn tương ứng là
,( )X Yi
và
,( )X Yr
. Bản chất của
,( )X Yi
được xác định bằng
nguồn sáng và của
,( )X Yr
được xác định bằng các đặc trưng của vật thể. Hàm
,( )X Yi
và
,( )X Yr
kết hợp với nhau để cho hàm
,( )X Yf
Với:
, , ,
,
,
( ) ( ) ( ) (1.2)
( 0 ( )
0 ( ) 1)
X Y X Y X Y
X Y
X Y
f i r
i
r
=
< < ∞
< <
Ở đây ta gọi cường độ sáng của một ảnh đen trắng tại tọa độ
,( )X Y
là mức xám
( )l
của ảnh tại điểm đó. Từ
(1.2), (1.3), (1.4)
,
l
nằm trong khoảng:
min max
(1.3)L l L≤ ≤
Trong lý thuyết, chỉ cần
min
0L >
và
max
L
hữu hạn. Trong thực tế:
min min min
max max max
(1.4)L i r
L i r
=
=
Sử dụng các giá trị chiếu sáng và phản xạ đã được tổng kết qua thực nghiệm
hoặc xem là các giá trị cơ bản
min max
0.005, 100L L≈ ≈
cho xử lý ảnh.
Khoảng
[ ]
min max
,L L
được gọi là thang xám. Ta có thể dịch khoảng này đến
[ ]
0, L
, trong đó
0l =
là đen và
l L=
là trắng trong thang xám. Giá trị tức thời là các dạng
mức xám thay đổi liên tục từ đen đến trắng.
1.2 Một số khái niệm cơ sở trong xử lý ảnh
Để có thể xử lý bằng máy tính điện tử thì ảnh cần phải được số hóa. Đó là quá
trình biến đổi ảnh từ tín hiệu liên tục sang tín hiệu rời rạc thông qua việc lấy
mẫu và lượng tử hóa. Trong quá trình này người ta sử dụng khái niệm “pixel”.
Mỗi pixel được đặc trưng bởi một cặp tọa độ
,( )X Y
và màu sắc của nó.[4]
- -
9
Ảnh: Là một tập hợp các pixel có cấu trúc, ta có thể coi ảnh là một mảng hai
chiều
( , )n p
I
có
n
dòng và
p
cột, ảnh sẽ có
n p×
(pixel). Ta ký hiệu
( , )X Y
I
để chỉ
điểm ảnh có toạ độ
,( )X Y
.[4]
Mức xám (Gray level): Đó là kết quả của việc mã hóa, cho tương ứng một
cường độ sáng của mỗi điểm ảnh với một giá trị số, có thể là 16, 32, 64 mức.
Biểu diễn ảnh: Trong biểu diễn ảnh người ta thường sử dụng các phần tử đặc
trưng của ảnh là pixel. Một hàm hai biến chứa các thông tin như một biểu diễn
ảnh. Một số mô hình thường dùng để biểu diễn ảnh là mô hình toán (biểu diễn
ảnh nhờ các hàm cơ sở), mô hình thống kê (ảnh coi như một phần tử của một
tập hợp đặc trưng bởi kỳ vọng toán, hiệp biến, phương sai, moment…).[4]
Tăng cường ảnh: Đây là một bước quan trọng bao gồm các kỹ thuật lọc độ
tương phản, khử nhiễu, nổi màu….
Biến đổi ảnh: Thao tác chủ yếu trên một tập các ma trận và sử dụng các kỹ
thuật để biến đổi ảnh qua ma trận: Biến đổi Furie, Sin, Cosin, tích Kronecker.
Phân tích ảnh: Liên quan tới việc xác định các độ đo định lượng của một ảnh
để đưa ra một mô tả đầy đủ về ảnh. Có những kỹ thuật cơ bản để hỗ trợ phân
tích ảnh: Dò biên, lọc vi phân, dò theo quy hoạch động, phân vùng ảnh [4]
Nhận dạng ảnh: Quá trình này liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Nhận dạng ảnh thường đi sau các quá trình trích chọn các đặc
trưng chủ yếu của đối tượng.[1,4]
- -
10