1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HỮU TUYÊN
ĐÁNH GIÁ CÁC PHƢƠNG PHÁP PHÁT HIỆN
ẢNH SỐ GIẢ MẠO
LUẬN VĂN THẠC SĨ
Hà Nội - 2013
2
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ
NGUYỄN HỮU TUYÊN
ĐÁNH GIÁ CÁC PHƢƠNG PHÁP PHÁT HIỆN
ẢNH SỐ GIẢ MẠO
Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60 48 05
LUẬN VĂN THẠC SĨ
NGƢỜI HƢỚNG DẪN KHOA HỌC: TS. Lê Vũ Hà
Hà Nội - 2013
3
MỤC LỤC
DANH MỤC CÁC HÌNH 5
DANH MỤC CÁC BẢNG 6
DANH MỤC CÁC TỪ VIẾT TẮT 7
LỜI NÓI ĐẦU 8
Chương 1: TỔNG QUAN VỀ NHẬN DIỆN ẢNH GIẢ MẠO 10
1.1. Một số ví dụ từ lịch sử 10
1.2. Một số phương ph|p giả mạo ảnh số thường gặp 11
1.2.1. Tút ảnh (Retouching) 12
1.2.2. Ghép ảnh (Splicing) 12
1.2.3. Sao - chuyển vùng ảnh (Copy-Move) 13
Chương 2: TỔNG QUAN VỀ CÁC KỸ THUẬT PHÁT HIỆN ẢNH SỐ GIẢ MẠO 15
2.1. Dựa trên đặc trưng điểm ảnh (Pixel Based) 15
2.1.1. Nh}n bản (Cloning) 15
2.1.2. Lấy mẫu lại (Re-sampling) 16
2.1.3. Ghép (Splicing) 16
2.2. Dựa trên định dạng ảnh (Format Based) 17
2.2.1. Lượng tử hóa JPEG (JPEG quantization) 17
2.2.2. Phần đầu ảnh JPEG (JPEG Header) 18
2.2.3. Nén kép (Double JPEG) 20
2.2.4. Hiệu ứng khối JPEG (JPEG Blocking) 21
2.3. Dựa trên đặc điểm m|y ảnh (Camera-Based) 22
2.3.1. Quang sai màu (Chromatic Aberration) 22
2.3.2. Mảng lọc m{u (Color Filter Array) 23
2.3.3. Đ|p ứng của m|y ảnh (Camera Response) 24
2.3.4. Nhiễu có cấu trúc (Pattern Noise) 25
2.4. Một số phương ph|p trực quan kh|c 27
2.4. 1. Nguồn s|ng 28
2.4.2. Hướng mắt nhìn v{ vị trí 29
2.4.3. Điểm s|ng trên mắt 30
2.4.4. Hình học 31
2.5. Kết luận 31
4
Chương 3: NGHIÊN CỨU SỬ DỤNG MỘT SỐ PHƯƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ
MẠO 33
3.1. Phương ph|p sử dụng DCT ph|t hiện sao - chuyển ảnh 33
3.1.1. Phương ph|p 33
3.1.2. Thuật to|n 36
3.1.3. Kết quả thực nghiệm 36
3.1.4. Kết luận 38
3.2. Phương ph|p ph}n tích mức độ lỗi JPEG (ELA) 39
3.2.1. Phương ph|p 39
3.2.2. Thuật to|n 40
3.2.3. Thực nghiệm 41
3.2.4. Kết luận 43
3.3. Quang sai màu (Chromatic Aberration) 43
3.3.1. Phương ph|p 43
3.3.2. Thuật toán 45
3.3.3. Thực nghiệm 45
3.3.4. Kết luận 48
Chương 4: ĐÁNH GIÁ CÁC PHƯƠNG PHÁP PHÁT HIỆN ẢNH SỐ GIẢ MẠO 49
4.1. Thực nghiệm so s|nh ba phương ph|p ph|t hiện ảnh số giả mạo 49
4.2. Đề xuất mô hình ph|t hiện ảnh số giả mạo 52
KẾT LUẬN 54
TÀI LIỆU THAM KHẢO 55
5
DANH MỤC CÁC HÌNH
Hình 1.1 Bức ảnh giả Joseph Goebbels đã bị xóa bỏ ra khỏi bức ảnh so với ảnh
gốc 10
Hình 1.2 Bức ảnh giả của tướng Grant được cắt ghép từ ba hình ảnh riêng biệt 10
Hình 1.3 Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh 11
Hình 1.4 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật tút ảnh (retouching) 12
Hình 1.5 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật cắt ghép (Splicing) 13
Hình 1.6 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật sao - chép vùng ảnh 13
Hình 2.1 Quá trình nén dữ liệu JPEG 18
Hình 2.2 Mô phỏng sử dụng quang sai để phát hiện ảnh giả 22
Hình 2.3 Hình ảnh hai mẫu nhiễu lấy được từ 2 loại sensor có công nghệ khác
nhau 25
Hình 2.4 Mô phỏng hướng nguồn sáng tới bề mặt một quả cầu 28
Hình 2.5 Mô phỏng việc phân tích nguồn sáng để phát hiện ảnh giả 29
Hình 2.6 Hình ảnh mô phỏng hướng mắn nhìn và vị trí 29
Hình 2.7 Mô phỏng bức ảnh giả được phát hiện dựa trên phân tích tròng mắt 30
Hình 2.8 Mô phỏng vị trí của điểm sáng trên mắt 30
Hình 2.9 Mô phỏng vị trí của điểm sáng trên mắt 31
Hình 3.1 Các kết quả thử nghiệm phương pháp DCT với các bức ảnh được lấy
từ nhiều nguồn khác nhau 38
Hình 3.2 Kết quả thực nghiệm khi chạy chương trình mô phỏng phát hiện ảnh
giả dựa trên độ nén JPEG 41
Hình 3.3 Ảnh thực nghiệm phương pháp CA 45
Hình 3.4 Kết quả chạy thực nghiệm phương pháp CA 46
Hình 3.5 Các kết quả thử nghiệm phương pháp CA với các bức ảnh giả được lấy
từ nhiều nguồn khác nhau 47
Hình 4.1 Ảnh giả bởi kỹ thuật sao - chuyển vùng ảnh trong thư viện CASIA
v1.0 50
Hình 4.2 Ảnh giả bởi kỹ thuật ghép ảnh (splicing) trong thư viện CASIA v1.0 50
Hình 4.3 Mô hình đề xuất phát hiện ảnh số giả mạo 53
6
DANH MỤC CÁC BẢNG
Bảng 3.1 Kết quả thực nghiệm phương pháp DCT phát hiện ảnh giả mạo 37
Bảng 3.2 Các kết quả thử nghiệm phương pháp phân tích mức độ lỗi ELA với
các bức ảnh được lấy từ nhiều nguồn khác nhau 43
Bảng 3.3 Kết quả so sánh thực nghiệm giữa các phương pháp phát hiện ảnh giả
50
7
DANH MỤC CÁC TỪ VIẾT TẮT
Viết tắt
Đầy đủ - mô tả
JPEG
Joint Photographic Experts Group - Là một phương pháp nén ảnh
hiệu quả
DCT
Discrete Cosine Transform - Dãy biến đổi cosine rời rạc
PCA
Principal Component Analysis - Phân tích thành phần chính
EM
Expectation Maximization - Thuật toán kỳ vọng cực đại
EXIF
Exchangeable Image Tệp format -Tiêu chuẩn xác định định dạng ảnh
BAM
Blocking Artifact Matrix - Ma trận các khối dấu hiệu
CFA
Color Filter Array - Mảng lọc màu sắc
FPN
Fixed Pattern Noise - Mẫu nhiễu có cấu trúc
PNU
Pixel Non-Uniformity - Điểm ảnh không đồng nhất
PRNU
Pixel Response Non-Uniformity- Ảnh hưởng không đồng nhất của
nhiễutớiđiểmảnh
ELA
Error Level Analysis - Phân tích mức độ lỗi
CA
Chromatic Aberration - Quang sai màu
IFD
Image File Directory - Đường dẫn tệp tin hình ảnh
MAP
Maximum A Posteriori Estimation - Ước lượng hậu cực đại
8
LỜI NÓI ĐẦU
Ngày nay, cùng với sự phát triển của công nghệ xử lý ảnh, nhiều phần
mềm xử lý ảnh ra đời giúp người ta tạo ra được những bức ảnh giả mạo có độ tin
cậy cao, như là đã được chụp tự nhiên từ một máy ảnh. Trong nhiều trường hợp,
không thể xác định được bằng quan sát bởi mắt thường, mà nó cần phải được
xác minh bằng các công cụ phân tíchảnh.
Người ta tạo những bức ảnh giả mạo nhằm vào nhiều mục đích khác nhau
như việc vu cáo, tạo ra các tin giật gân, làm sai lệch chứng cứ phạm tội v.v…
Nhiều phương pháp phát hiện loại ảnh giả được phát triển, tuy nhiên,
không có phương án nào là tối ưu cho mọi ảnh giả. Vì vậy cần thiết phải so sánh
các phương pháp phát hiện ảnh giả với nhau, từ đócó thể đưa ra giải pháp tốt để
phát hiện ảnh số giả mạo. Chính vì vậy, tôi đã chọn đề tài “Đánh giá các
phƣơng pháp phát hiện ảnh số giả mạo”.
Mục tiêu nghiên cứu được đề ra như sau:
- Tìm hiểu một số phương pháp giả mạo ảnh số thường gặp.
- Tìm hiểu một số kỹ thuật phát hiện ảnh số giả mạo.
- Cài đặt các kỹ thuật được tìm hiểu và thử nghiệm nhằm so sánh đánh giá
hiệu quả của các kỹ thuật này chống lại các phương pháp giả mạo ảnh khác
nhau.
Bố cục của luận văn được trình bày như sau:
Mở đầu
Đặt vấn đề về ý nghĩa, tính cấp thiết và tính thực tế của đề tài.
Chƣơng 1: Tổng quan về nhận diện ảnh giả mạo
Chương này sẽ giới thiệu với người đọc khái quát một số phương pháp giả
mạo ảnh số thường gặp, bao gồm lịch sử ra đời, các đặc điểm, đồng thời cũng
trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó giúp người
đọc có cái nhìn tổng quan về lĩnh vực nhận diện ảnh số giả mạo.
Chƣơng 2: Tổng quan về các kỹ thuật phát hiện ảnh số giả mạo
Chương này trình bày một cách khái quát về các phương pháp phát hiện
ảnh số giả mạo và sự phân loại giữa chúng, từ đó lựa chọn ba phương pháp để
9
tiến hành thực nghiệm nhằm so sánh, đánh giá các phương pháp phát hiện ảnh
số giả mạo.
Chƣơng 3: Nghiên cứu, thực nghiệm một số phƣơng pháp phát hiện ảnh số
giả mạo
Chương này trình bày việc tiến hành nghiên cứu, thực nghiệm các phương
pháp phát hiện ảnh số giả mạo, bao gồm ý tưởng, thuật toán, cài đặt thuật toán
và thực nghiệm.
Chƣơng 4: Đánh giá các phƣơng pháp phát hiện ảnh số giả mạo
Chương này, tôi trình bày kết quả so sánh các phương pháp dựa trên các
kết quả thực nghiệm, ưu nhược điểm của từng phương pháp, từ đó đề xuất
mộtphương pháp nhận diện ảnh số giả mạo dựa trên các kỹ thuật sẵn có.
Kết luận
10
Chƣơng 1: TỔNG QUAN VỀ NHẬN DIỆN ẢNH GIẢ MẠO
Mục tiêu của chương này là giới thiệu với người đọc một số phương pháp
giả mạo ảnh số thường gặp bao gồm lịch sử ra đời, các đặc điểm, đồng thời
cũng trình bày một số kỹ thuật phát hiện ảnh số giả mạo hiện nay, để từ đó, giúp
người đọc có cái nhìn tổng quan về lĩnh vực nhận diện ảnh giả mạo.
1.1. Một số ví dụ từ lịch sử
Ngành nhiếp ảnh đã bị mất đi sự tự nhiên của nó từ rất nhiều năm trước
đây. Chỉ vài thập kỷ sau khi Niepce tạo ra bức ảnh đầu tiên vào năm 1814 [15],
các bức ảnh đã được chế tác, cùng với sự ra đời của các máy ảnh có độ phân giải
cao, sự phát triển mạnh mẽ của máy tính cá nhân và các phần mềm chỉnh sửa
hình ảnh, việc chế tác hình ảnh đã trở nên phổ biến. Để mở đầu, tôi giới thiệu
các ví dụ về hình ảnh giả mạo nổi tiếng trong lịch sử.
Hình 1.1Bức ảnh giả Joseph Goebbels đã bị xóa bỏ ra khỏi bức ảnh so với ảnh gốc
Năm 1937: Adolf Hitler đã loại JosephGoebbels ra khỏi bức ảnh. [1]
Hình 1.2Bức ảnh giả của tướng Grant được cắt ghép từ ba hình ảnh riêng biệt
11
Năm 1964:Một bứcảnh được làm giả với ngụ ý, tổng tư lệnh quân đội miền
Nam- tướng Ulysses S. Grant đứng trước quân đội của mình tại thành phố
Virginia trong cuộc nội chiến Mỹ. Công việc phát hiện sự giả mạo này được
thực hiện bởi một nhóm nhà nghiên cứu tại thư viện quốc hội Mỹ, cho thấy ảnh
in này được ghép từ ba bức ảnh riêng biệt. Bức ảnh thứ nhất được lấy từ chân
dung của tướng Grant, thứ hai, lấy hình ảnh con ngựa và cơ thể của một vị tướng
có tên là Alexander M.McCook và thứ ba, nền được lấy từ một bứ ảnh chụp
những tù nhân miền Bắc bị bắt. [1]
Hình 1.3Bức ảnh giả chỉnh sửa nhằm tăng độ mạnh của thông tin chiến tranh
Tháng 8/2006: một bức ảnh minh họa của hãng tin Reuters xuất hiện trên các
trang báo lớn nhỏ trên khắp thế giới. Nội dung của bức ảnh là những cột khói
tỏa lên từ một số tòa nhà cao tầng sau một đợt không kích của không quân Isarel
vào Beirut. Nhưng sau đó họ đã phát hiện ra một phần của bức ảnh đã bị người
ta sao chép (copy), rồi dán lặp lại nhiều lần trong bức ảnh, nhằm làm tăng liều
lượng khói.
Bằng cách này hay cách, với mục đích này hay mục đích khác, người ta
đã tạo ra rất nhiều bức ảnh giả mạo nhằm phục vụ các mục đích khác nhau.
Nhiệm vụ của các nhà khoa học đó là làm thế nào để phát hiện ra các bức ảnh
giả đó và chứng minh phương pháp phát hiện của mình là đúng đắn.
1.2. Một số phƣơng pháp giả mạo ảnh số thƣờng gặp
Kỹ thuật giả mạo ảnh số không khác nhiều so với kỹ thuật giả mạo ảnh
thông thường. Thay vì sử dụng các bức ảnh, thì kỹ thuật giả mạo ảnh số sử dụng
các ảnh số lưu trên các thiết bị lưu trữ như thẻ nhớ máy ảnh, ổ cứng máy tính…
Quá trình tạo ra hình ảnh giả mạo đã được đơn giản rất nhiều với sự phát triến
12
mạnh mẽ của các phần mềm chỉnh sửa hình ảnh, phần mềm đồ họa máy tính như
Adobe Photoshop, GIMF, Paint Shop, Corel…
Có rất nhiều cách để giả mạo một bức ảnh số. Dựa trên các kỹ thuật tạo ra
một bức ảnh giả mạo, người ta có thể phân biệt thành ba nhóm chính: tút ảnh
(Retouching),ghép ảnh (Splicing) và sao - chuyển vùng ảnh (Copy-Move).
1.2.1. Tút ảnh (Retouching)
Loại này có thể coi là ít nguy hiểm nhất trong các cách giả mạo ảnh số.
Hình ảnh bị chỉnh sửa không đáng kể, thay vào đó, nó tăng cường hoặc giảm các
thuộc tính nhất định của một hình ảnh. Kỹ thuật này phổ biến đối với các biên
tập viên ảnh của tạp chí. Có thể nói rằng hầu như tất cả các trang bìa tạp chí sẽ
sử dụng kỹ thuật này để làm các bức ảnh của họ trở nên hấp dẫn hơn.
Hình 1.4Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật tút ảnh (retouching)
Hình ảnh bên trái là ảnh gốc, ảnh phía bên trái là kết quả của việc chỉnh
sửa hình ảnh sử dụng phương pháp Retouching.
1.2.2. Ghép ảnh (Splicing)
Kỹ thuật này nguy hiểm hơn kỹ thuật tút ảnh (retouching). Ghép ảnh
(Splicing) là một kỹ thuật có liên quan đến việc một hỗn hợp gồm hai hay nhiều
hình ảnh kết hợp tạo ra một bức ảnh giả mạo. Trong hình ảnh dưới đây, hình ảnh
chú cá mập được sao chép lên hình ảnh nền (máy bay trực thăng cứu hộ) tạo ra
một bức ảnh giả hoàn hảo.
13
Hình 1.5 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật cắt ghép (Splicing)
1.2.3. Sao - chuyển vùng ảnh (Copy-Move)
Kỹ thuật sao - chuyển vùng ảnh về mức độ nguy hiểm tương tự như kỹ
thuật ghép ảnh, theo cách nhìn cả hai kỹ thuật này đều làm thay đổi một vùng
của ảnh gốc. Tuy nhiên, thay vì cần một hình ảnh bên ngoài như kỹ thuật ghép
ảnh, kỹ thuật sao - chuyển vùng ảnh dùng chính vùng trên ảnh gốc để tạo ra bức
ảnh giả. Nói cách khác, nguồn và đích của đều bắt nguồn từ một hình ảnh. Trong
một thao tác sao - chuyển vùng ảnh, một phần của ảnh sẽ được cắt và dán đến
một vị trí mong muốn của bức ảnh. Điều này thường được thực hiện để che dấu
một số chi tiết hoặc nhân bản một số đối tượng trên hình ảnh. Các kỹ thuật làm
mờ thường được áp dụng dọc theo biên của khu vực sao - chuyển vùng ảnh để
làm giảm hiệu ứng bất thường giữa khu vực gốc và khu vực được sao - chuyển
vùng ảnh. Hình ảnh dưới đây cho thấy một hình ảnh mẫu đã bị giả mạo bằng
cách sử dụng sao - chuyển vùng ảnh. Bên trái là ảnh giả và bên phải là ảnh thật.
Hình 1.6 Hình ảnh ví dụ về ảnh bị làm giả bởi kỹ thuật sao - chép vùng ảnh
Trong khuôn khổ của đề tài, tôi tập trung nghiên cứu cách phát hiệnhai
loại ảnh giả là sao - chuyển vùng ảnh và ghép ảnh, có mức độ nguy hiểm lớn vì
nó làm sai lệch thông tin so với ảnh gốc. Còn loại ảnh tút ảnh (retouching) - loại
14
ảnh làm đẹp cho các tạp chí, các ảnh quảng cáo với mức độ nguy hiểm thấp, do
không làm sai khác nhiều thông tin, sẽ chỉ được giới thiệu ở chương này.
15
Chƣơng 2: TỔNG QUAN VỀ CÁC KỸ THUẬT PHÁT HIỆN
ẢNH SỐ GIẢ MẠO
Hiện tại trên thế giới cũng có rất nhiều các nhóm nghiên cứu về nhận
diện ảnh giả mạo cũng như phát triển các công cụ khác nhau để phát hiện ra
ảnh bị làm giả. Dựa vào các đặc trưng để nhận diện ảnh giả người ta cũng chia
ra làm 5 loại [3]: 1) Pixel-Based: dựa vào các dặc trưng củacác điểm ảnh, mỗi
liên hệ giữa ở cấp độ điểmảnh của ảnh. 2) Format-Based: dựa trên các đặc
trưng của định dạng ảnh, dựa trên mối tương quan thống kê. 3)Camera-Based:
dựa trên đặc điểm kỹ thuật của máy ảnh như cảm biến máy ảnh, ống kính hoặc
trên chip xử lý máy ảnh. 4) Physically-Based: dựa trên các tính chất vật lý và
mối tương tác giữa ánh sáng và máy ánh. 5) Geometric-Based: Dựa trên đặc
trưng hình học của các đối tượng.
2.1. Dựa trên đặc trưng điểm ảnh (Pixel Based)
Trong tất cả các ngành khoa học, các đặc điểm đầu tiên được đưa ra phân
tích và nhận dạng chính là các nhân tố nhỏ nhất tạo nên cấu trúc của sự vật, hiện
tượng (Trong y học nhận dạng nhờ phân tích ADN, tế bào, trong địa chất nhận
dạng các phần tử đất, trong hóa học nhận dạng các nguyên tử, phân tử….).
Trong lĩnh vực xử lý ảnh, các cấu trúc nhỏ nhất đó chính là các điểm ảnh. Người
ta nghiên cứu mối tương quan giữa các điểm ảnh để tìm dấu hiệu của sự giả mạo
ảnh kỹ thuật số.
2.1.1.Nhân bản (Cloning)
Một trong những thao tác cơ bản nhất của việc tạo ra một bức ảnh giả đó
là sao - chuyển vùng ảnh(copy-move), một phần hình ảnh sẽ được che giấu bởi
một người hoặc một đối tượng trong cảnh. Các thao tác sao - chuyển vùng ảnh
được thực hiện trên cùng một bức ảnh nên nó sẽ xuất hiện các vùng giống nhau
trên bức ảnh giả, các khu vực này chính là bằng chứng của giả mạo.
Ta có thể dễ dàng tìm kiếm hai khu vực giống hệt nhau trong hình ảnh
bằng cách so sánh các giá trị của điểm ảnh hoặc các khối ảnh với nhau. Tuy
nhiên, nếu vùng nhân bản đó bị thay đổi kích thước hay màu sắc, hay bị nén
JPEG, nó sẽ gây ra sự khó khăn trong việc so sánh để tìm ra các vùng nhân bản.
Hiện nay, có hai phương pháp chính nghiên cứu để phát hiện ra các vùng
nhân bản của ảnh giả dạng sao - chuyển vùng ảnh. Thứ nhất đó là phương pháp
dựa trên thuật toán dãy biến đổi cosin rời rạc (DCT). Khu vực nhân bản sẽ được
16
phát hiện bởi từ điển phân loại khối hệ số DCT và nhóm các khối tương tự. Thứ
hai đó là phương pháp dựa trên việc phân tích thành phần chính (PCA), việc sử
dụng PCA nhằm xác định các vector cơ sở và tìm khu vực trùng lặp phát hiện
bởi từ điển phân loại khối vector cơ sở và nhóm các khối tương tự.
2.1.2. Lấy mẫu lại (Re-sampling)
Để tạo ra một bức ảnh thuyết phục, người ta có thể phải thay đổi kích
thước, xoay ảnh hoặc kéo dài các phần của hình ảnh. Quá trình này yêu cầu lấy
mẫu lại (re-sampling) vào một lưới mẫu mới. Mặc dù việc lấy mẫu lại bình
thường không dễ nhận thấy, nhưng nó có mối tương quan đặc biệt với hình ảnh,
khi phát hiện nó có thể được sử dụng làm bằng chứng của sự giả mạo.
Xét ví dụ đơn giản với tín hiệu một chiều x(n) có độ dài là M. Lấy mẫu lại
tín hiệu này để có tín hiệu mới là y(n) có độ dài 2M. Các mẫu lẻ của tín hiệu
được lấy mẫu lại bằng giá trị của tín hiệu ban đầu: y(2i-1)= x(i), i=1,…
,. Các
mẫu chẵn sẽ là trung bình của các tín hiệu liền kề.
y(2i) =
1
2
x(i)+
1
2
x(i+1) (2.1)
Hay là:
y(2i) =
1
2
y(2i-1) +
1
2
y(2i+1) (2.2)
Ta thấytrong tín hiệu được lấy mẫu lại y(n), mỗi giá trị là sự kết hợp tuyến
tính của hai giá trị lân cận. Trong trường hợp đơn giản này, một tín hiệu lấy mẫu
lại có thể được phát hiện bởi tất cả các giá trị mẫu đều có sự tương quan với các
giá trị lân cận chúng và tương quan đó xuất hiện theo chu kỳ. Thuật toán kỳ
vọng cực đại (EM) có thể được sử dụng để tìm sự tương quan. Thuật toán EM
bao gồm hai bước lặp:
1) Bước kỳ vọng: Tính xác suất ước lượng các điểm ảnh có thể tương quan
với các điểm lân cận.
2) Bước cực đại: Các dạng cụ thể của các mối tương quan giữa các điểm ảnh
được ước tính.
Giả sử có một mô hình nội suy tuyến tính, bước kỳ vọng làm giảm ước
lượng Bayesian và bước cực đại làm giảm trọng số các khoảng ước lượng. Xác
suất ước tính sau đó được sử dụng để xác định nếu một phần của hình ảnh đã
được lấy mẫu lại.
2.1.3. Ghép (Splicing)
17
Một hình thức phổ biến của việc giả mạo ảnh số đó là ghép hai hoặc nhiều
ảnh vào với nhau. Khi họ thực hiện một cách cẩn thận không thể thấy được biên
giới giữa các vùng ghép đó bằng mắt thường. Tuy nhiên, một số nhà nghiên cứu
đã cho thấy có thể sử dụng thống kê Fourier bậc cao để phát hiện ra sự ghép nối
đó. Xét một tín hiệu một chiều x(n) và có dãy biến đổi Fourier X(). Phổ năng
lượng biểu diễn là P(Ω)=X(Ω)X*(Ω) được sử dụng để phân tích các thành phần
của tần số tín hiệu. Ngoài phổ, ta có công thức thống kê sử dụng để tìm kiếm các
tương tác không tuyến tính:
B(Ω
1
,Ω
2
) = X(Ω
1
)X(Ω
2
)X*(Ω
1
+Ω
2
) (2.3)
Dựa vào công thức, ta thấy được sự tương quan giữa bathành phần tần
sốΩ
1
, Ω
2
và Ω
1
+ Ω
2
. Những khoảng bất thường chứng tỏ đã bị ghép nối.
2.2. Dựa trên định dạng ảnh (Format Based)
Nguyên tắc đầu tiên trong việc phân tích tìm bằng chứng là các bằng
chứng phải được bảo toàn. Về phương diện này, việc mất dữ liệu trong nén hình
ảnh qua các phần mềm nén, chẳng hạn như JPEG, có thể được coi như là một
khó khăn trong việc phân tích. Ngược lại, một số thuộc tính độc đáo của việc
mất mát dữ liệu trong quá trình nén ảnh lại có thể được khai thác để phân tích
tìm các bằng chứng để chứng minh sự giả mạo trong ảnh số.
2.2.1. Lượng tử hóa JPEG (JPEG quantization)
Hầu hết các ảnh nén được sử dụng hiện nay đều theo định dạng JPEG. Kỹ
thuật nén được sử dụng trong cả các máy ảnh số. Các nhà sản xuất máy ảnh
thường cấu hình cho thiết bị của họ khác nhau để cân bằng và nén với các chất
lượng khác nhau để phù hợp với nhu cầu và thị hiếu của thị trường. Sự khác biệt
này có thể được sử dụng để xác định nguồn gốc của một hình ảnh.
Với ba kênh màu ảnh (RGB), quá trình nén của chuẩn JPEG được tiến
hành như sau: Những hình ảnh RGB đầu tiên được chuyển đổi thành không gian
độ sáng/màu sắc (YCbCr). Mỗi kênh sau đó được phân chia thành các khối 8x8
điểm ảnh. Các giá trị được chuyển đổi từ số nguyên dương sang số nguyên có
dấu (ví dụ từ [0 255] thành [-128,127]). Mỗi khối được chuyển đổi sang không
gian tần suất bằng cách sử dụng biến đổi cosin rời rạc (DCT-2D). Tùy thuộc vào
tần số và kênh cụ thể, mỗi hệ số DCT, c, sẽ được lượng tử hóa bởi một lượng q:
/
. Giai đoạn này chính là nguồn nén. Bảng lượng tử hóa đầy đủ bao gồm
192 giá trị - tập 8x8 giá trị tương ứng với một tần số cho một trong ba kênh màu
(YCbCr). Đối với tỷ lệ nén thấp, các giá trị có xu hướng tiến tới 1 và tăng dần
18
với tỷ lệ nén cao hơn. Với một số biến thể khác nhau, trình tự nêu trên được phát
triển bởi các bộ mã hóa JPEG trong máy ảnh kỹ thuật số và phần mềm chỉnh sửa
hình ảnh. Các nguồn chính của các bộ mã hóa là sự chọn lựa các bảng lượng tử.
Như vậy, một dấu hiệu sắp xếp đã được nhúng vào trong mỗi ảnh JPEG. Bảng
lượng tử hóa có thể được triết xuất từ bộ mã hóa ảnh JPEG hoặc ước lượng từ
các hình ảnh được chụp từ máy ảnh này. Do các máy ảnh sử dụng các bộ mã hóa
khác nhau vì thế chúng ta có thể so sánh bảng lượng tử hóa của chúng và có thể
xác định được nguồn gốc của một hình ảnh, có thể được chụp bằng loại máy ảnh
này hay không.
2.2.2. Phần đầu ảnh JPEG (JPEG Header)
Sau khi lượng tử hóa, các hệ số DCT được đưa đến quá trình mã hóa dữ
liệu thường sử dụng mã hóa Huffman. Huffman là một phương pháp mã hóa với
độ dài từ mã biến đổi trong đó các giá trị xuất hiện thường xuyên hơn được gán
từ mã có độ dài ngắn hơn, còn các giá trị xuất hiện ít thường xuyên hơn được
gán các từ mã có độ dài lớn hơn. Đây là phương pháp mã hóa (nén) không mất
mát, được tăng hiệu quả nhờ sự lượng tử hóa các hệ số DCT trước khi mã hóa.
Hình 2.1 Quá trình nén dữ liệu JPEG
Các chuẩn JPEG không quy định quá trình lượng tử hóa bảng mã hay mã
hóa Huffman. Các bộ nén có thể tùy ý cân đối giữa việc nén và chất lượng cho
nhu cầu và thị hiếu riêng của họ. Các bảng lượng tử hóa và các bảng mã
Huffman được sử dụng để giải mã một tập tin JPEG sẽ được nhúng vào phần
đầu (header) của JPEG. Các bảng lượng tử hóa JPEG và mã Huffman cùng với
các trích xuất dữ liệu từ các phần đầu của tệp ảnh JPEG có thể coi là một dấu
hiệu riêng biệt của bộ nén và có thể được sử dụng để nhận dạng.
Ba thành phần đầu tiên chứa dấu hiệu của máy ảnh đó là kích thước ảnh,
bảng lượng tử hóa và các mã Huffman. Các kích thước hình ảnh được sử dụng
để phân biệt các bộ nén của các thiết bị chụpảnh khác nhau với các bộ cảm biến
19
khác nhau. Bộ ba bảng lượng tử hóa 8x8 quy về mảng một chiều bao gồm 192
giá trị. Các mã Huffman được xác định gồm 6 bộ của 15 giá trị tương ứng với số
lượng chiều dài tữ mã 1,2… 15: mỗi một trong 3 kênh yêu cầu 2 giá trịcode, một
cho hệ số DC và một cho hệ số AC. Sự biểu diễn này là nhân tố chính cho sự so
sánh dựa trên việc phân tích chiều dài các từmã. Tổng cộng có 284 giá trị được
chiết xuất từ hình ảnh có độ phân giải đầy đủ: 2 kích thước hình ảnh, 192 giá trị
lượng tử hóa và 90 từmã Huffman.
Một phiên bản thu nhỏ của hình ảnh có độ phân giải đầy đủ thường được
nhúng vào trong (header) của tệp ảnh JPEG. Ba thành phần xác định đặc điểm
của bộ nén được chiết xuất từ hình ảnh thu nhỏ này. Hình ảnh thu nhỏ thường
không có kích thước lớn hơn 100 điểm ảnhvà được tạo ra bằng cách cắt, lọc, và
lấy mẫu đầy đủ độ phân giải của ảnh. Hình ảnh thu nhỏ sau đó thường được nén
và lưu trữ trong phần đầu của tệp ảnh JPEG như một hình ảnh trong JPEG. Như
vậy, thành phần tương tự có thể được chiết xuất từ những hình ảnh thu nhỏ
giống như toàn bộ độ phân giải như được trình bày trong phần trước. Một số
thiết bị chụpảnh số, nhà sản xuất không tạo ra hình ảnh thu nhỏ hoặc không mã
hóa chúng như một hình ảnh JPEG. Trong những trường hợp như vậy, có thể là
một giá trị 0 cho tất cả các thông tin của hình ảnh thu nhỏ. Thay vì làmột hạn
chế, nó được coi là đặc tính riêng biệt của bộ nén máy ảnh số.
Thành phần cuối cùng của nhận dạng bộ nén được chiết xuất từ dữ liệu
EXIF của ảnh. Các dữ liệu được tìm thấy trong phần đầu (header) của tệp ảnh
JPEG lưu trữ hàng loạt các thông tin về thiết bị chụp ảnh số và hình ảnh. Theo
tiêu chuẩn EXIF, có năm thành phần chính được sắp xếp trong một tệp ảnh (1)
Phần chính (2) Exif (3) Khả năng tương thích (4) Ảnh thu nhỏ (5) GPS. Nhà sản
xuất thiết bị chụp ảnh số có thể tùy ý đưa bất kỳ thông tin vào trong tệp ảnh số.
Một biểu diễn nhỏ của họ có thể được chiết xuất bằng cách đếm số lượng các
mục của một trong năm thành phần chính. Bởi vì tiêu chuẩn EXIF cho phép tạo
ra thêm các thành phần bổ sung. Tổng số bất kỳ một IFD và tổng số các mục
trong IFD cũng được sử dụng để nhận dạng. Một số nhà sản xuất máy ảnh tùy
chỉnh những dữ liệu theo cách không phù hợp với tiêu chuẩn EXIFsẽ gặp lỗi khi
phân tích các dữ liệu. Những lỗi này được coi là một tính năng của máy ảnh
được thiết kế và tổng số lỗi phân tích cú pháp được sử dụng như một tính năng
để nhận dạng. Trong tám giá trị được chiết xuất từ dữ liệu, năm lần đếm cho
năm phần trong IFD, một lần đếm số bổ sung của IFD, một cho đếm các lỗi
phân tích cú pháp.
20
Trong phần tóm lược, có 284 giá trị chiết xuất từ độ phân giải đầy đủ của
hình ảnh, tương đương với 284 giá trị của phần đầu (header) trong hình ảnh thu
nhỏ, 8 từ chuẩn EXIF, tổng cộng là 576 giá trị hình thành nên 576 dấu hiệu riêng
có thể dùng là nhận dạng. Trong phạm vi mà hình ảnh phần mềm chỉnh sửa ảnh
sử dụng các thông số JPEG khác từ bộ nén khác, bất kỳ thay đổi sẽ làm thay đổi
nhận dạng ban đầu và do đó có thể được phát hiện.
Cụ thể, sự thay đổi hình ảnh được phát hiện bằng cách giải nén các dấu
hiệu riêng và so sánh nó với một cơ sở dữ liệu các dấu hiệu riêng của máy ảnh
đó. Bất kỳ một vùng nào của máy ảnh tạo ra cũng có thể được đưa ra so sánh với
các đặc điểm riêng của mô hình dữ liệu EXIF. Sự không phù hợp là bằng chứng
thuyết phục cho một sự giả mạo.
Một số thí nghiệm của các nhà khoa học cũng cho thấy rằng, các dấu hiệu
từ các phiên bản của phần mềm Adobe Photoshop (ver 3, 4, 7, CS, CS2, CS3,
CS4, CS5) được so sánh với dấu hiệu của 9.163 dấu hiệu riêng của bộ nén trên
máy ảnh. Trong trường hợp này chỉ có hình ảnh và hình ảnh thu nhỏ, bảng lượng
tử và bảng mã Huffman được sử dụng để so sánh. Không có sự chồng chéo nào
được tìm thấy từ bất kỳ phiên bản nào của phần mềm Photoshop và dấu hiệu của
bộ nén. Như vậy, dấu hiệu riêng của Photoshop là duy nhất, điều này có nghĩa là
bất kỳ chỉnh sửa nào của Photoshop có thể dễ dàng phát hiện. [4]
2.2.3. Nén kép (Double JPEG)
Bất kỳ một ảnh số bị làm giả nào cũng phải được mở bởi một chương
trình phần mềm chỉnh sửa ảnh số và được ghi lại. Như vậy, sự phát hiện ra sự
nén kép cũng là một bằng chứng đáng tin cậy cho việc hình ảnh đã bị làm giả.
Nhắc lại quá trình mã hóa một ảnh JPEG gồm ba bước cơ bản: DCT, lượng tử
hóa và mã hóa các hệ số DCT. Giải mã một dữ liệu đã được thực hiện ngược
quá trình, giải mã dữ liệu mẫu, lượng tử hóa và nghịch đảo DCT.
Xét một tín hiệu tổng quát rời rạc một chiều x(n). Lượng tử hóa là một
hoạt động thông thường là mô tả một tham số gồm các hàm:
=
(2.4)
Trong đó, các bước lượng tử hóa (là một số nguyên dương), a: hệ số
lượng tử hóaq, u biểu diễn một giá trị của x(n). Lượng tử hóa lại sẽ đem lại giá
trị lượng tử ban đầu. Chú ý hàm
() không phải là hàm khả nghịch và
21
quátrình ngượi lại của lượng tử hóakhông phải là hàm nghịch đảo của lượng tử.
Hoạt động hai lần lượng tử hóa là hoạt động được mô tả bởi hàm:
=
(2.5)
Trong đó a và b là các bước lượng tử hóa (số nguyên dương), Lượng tử
hóa kép có thể biểu diễn với ba bước: lượng tử hóavới a, đảo ngược lại bước
lượng tử hóa với hệ số a, sau đó lượng tử hóa với hệ số b.
2.2.4. Hiệu ứng khối JPEG (JPEGBlocking)
Như mô tả trong phần trước, cơ sở cho việc nén JPEG là biến đổi DCT.
Vì mỗi một khối DCT được biến đổi riêng biệt và được lượng tử hóa, dấu hiệu
riêng sẽ xuất hiện ở biên của các khối lân cận ở các cạnh dọc và ngang. Khi một
hình ảnh bị thay đổi, các dấu hiệu riêng của các khối sẽ bị thay đổi. Người ta
cũng dựa vào các dấu hiệu thay đổi này để tìm ra việc làm giả hình ảnh. Họ xem
xét các giá trị khác biệt của điểm ảnh trong và giữa ranh giới các khối. Những sự
khác biệt này có xu hướng trong khối sẽ nhỏ hơn ngoài khối. Khi một hình ảnh
được cắt và nén lại, tập các dấu hiệu khối mới có thể sẽ khác với ranh giới ban
đầu. Các giá trị điểm ảnh khác nhau của trong và giữa ranh giới được tính toán
từ bốn điểm ảnh lân cận bằng một giá trị xác định, trong đó một điểm ảnh lân
cận hoặc nằm trong khối và là biên hoặc chồng lấp lên một khối JPEG. Biểu đồ
của những sự khác biệt này được tính từ tất các các khối JPEG 8x8 bị chồng lấp.
Ma trận các khối dấu hiệu (BAM) được tính toán như sự khác biệt trung bình
giữa các biểu đồ. Đối với hình ảnh không nén, ma trận này là ngẫu nhiên, trong
khi với một hình ảnh nén, ma trận này có một mô hình cụ thể. Khi một hình ảnh
được cắt và nén lại, mô hình này bị phá vỡ. Mô hình giám sát phân loại được sử
dụng để phân biệt dấu hiệu xác thực hay giả dối từ BAMs.
22
2.3. Dựa trên đặc điểm máy ảnh (Camera-Based)
Mỗi một máy ảnh đều có đặc điểm riêng biệt (có thể cùng một nhà sản
xuất, cùng một loại máy ảnh), khi ta chụp ảnh bằng những chiếc máy ảnh,
những bức ảnh sẽ để lại một số dấu hiệu riêng của máy ảnh mà tạo ra nó. Một số
nhà nghiên cứu cũng đã khác thác dấu hiệu riêng đó để phân biệt giữa ảnh thật
và ảnh bị làm giả.
2.3.1. Quang sai màu (Chromatic Aberration)
Trong một hệ thống hình ảnh lý tưởng, ánh sáng đi qua ống kính được tập
trung vào một điểm duy nhất trên cảm biến. Trong hệ thống quang học thực tế
trái với mô hình lý tưởng, nó không hoàn toàn tập trung ánh sáng của tất cả các
bước sóng. Cụ thể, phương quang sai thể hiện vị trí nơi mà các ánh sáng có bước
sóng khác nhau chiếu đến bộ cảm biến. Người ta đã chỉ ra rằng, phương quang
sai này có thể được coi như là mở rộng hoặc co lại của màu sắc với các kênh
màu khác nhau. Thể hiện trong hình (a), hình ảnh chồng lên ảnh với các vector
không thẳng hàng đại diện cho các kênh màu đó so với các kênh màu xanh lá
cây. Thể hiện trong hình (b), hình ảnh này đã được ghép thêm hình ảnh của một
con cá. Trong trường hợp này, quang sai bên trong khu vực ghép vào khác với
quang sai toàn cục.
Hình 2.2 Mô phỏng sử dụng quang sai để phát hiện ảnh giả
Trong quang học cổ điển, sự khúc xạ ánh sáng ở biên giới giữa hai nguồn
sáng được mô tả theo luật Snell‟s: sin
=
sin
, trong đó là góc sáng,
23
là góc khúc xạ, n và n
f
là chỉ số khúc xạ của các phương tiện truyền ánh sáng
mà qua đó, ánh sáng đi qua. Chỉ số khúc xạ của thủy tinh n
f
phụ thuộc vào bước
sóng của ánh sáng đi qua nó. Điều này phụ thuộc kết quả trong đa sắc ánh sáng
được phân chia theo bước sóng của nó sau khi thoát khỏi ống kính và chiếu vào
bộ cảm biến. Thể hiện trong hình (c) là một sơ đồ mạch cho thấy sự phân tách
ánh sáng có bước sóng ngắn (tia màu xanh lá cây) với ánh sáng có bước sóng
dài (tia màu đỏ). Kí hiệu vị trí của các tia màu đỏ và màu xanh là (x
r
, y
r
) và (x
g
,
y
g
). Trong việc biểu diễn quang sai, vị trí của các tia được mô hình hóa như sau:
=
0
+
0
(2.6)
=
0
+
0
(2.7)
Trong đó là một giá trị vô hướng và (x
0
, y
0
) là gốc khúc xạ.
Việc ước tính thông số của mô hình này như là chìa khóa để giải quyết
vấn đề. Khi quang sai cho kế quả không thẳng hàng giữa các kênh màu. Mô hình
tham số được ước tính bằng cách tối đa hóa sự liên kết của các kênh màu. Cụ
thể, thông tin giữa các kênh màu đỏ và màu xanh lá cây được tối đa (một ước
lượng tương tự được thực hiện để xác định sự biến dạng giữa các kênh màu
xanh và màu xanh lá cây). Tính toán quang sai của khu vực sau đó so sánh với
quang sai toàn cục ta sẽ phát hiện ra sự giả mạo.
2.3.2. Mảng lọc màu (Color Filter Array)
Một hình ảnh kỹ thuật số bao gồm ba kênh màu chứa sự khác nhau về dải
tần quang phổ màu sắc. Hầu hết các máy ảnh kỹ thuật số đều trang bị bộ cảm
biến CCD hoặc CMOS và các ảnh màu được chụp qua mảng lọc màu (CFA).
Hầu hết các bộ lọc màu gồm ba màu (đỏ, xanh và xanh lá cây), được đặt trên
mỗi đỉnh của bộ cảm biến. Kể từ khi chỉ là một mẫu màu duy nhất được ghi lại
tại mỗi vị trí điểm ảnh, hai mẫu màu sắc phải được ước tính từ màu lân cận để
có được một màu gồm có cả ba kênh màu. Việc ước tính của các màu bị mất
được gọi là phép nội suy hoặc khử (Demosaicking) CFA. Demosaicking là
phương pháp dựa trên những hoạt động hạt nhân trên mỗi kênh độc lập (ví dụ,
nội suy tuyến tính hoặc song lập phương). Hơn thế nữacác thuật toán nội suy
tuyến tính sẽ làm mờ các tính năng hình ảnh. Bất kể triển khai cụ thể thực tế,
CFA nội suy đưa ra thống kê cụ thể mối tương quan giữa một tập hợp các điểm
ảnh với mỗi một kênh màu. Khi mà mảng lọc màu CFA thường được sắp xếp
theo một khuôn mẫu định kỳ, với những mối tương quan định kỳ, cùng lúc đó,
các điểmảnh sẽ được ghi lần lượt với sự tương quan đó. Như vậy, các mối tương
24
quan này có thể được sử dụng như một dấu hiệu để nhận dạng. Để xác định sự
tương quan này, người ta sử dụng thuật toán kỳ vọng cực đại (EM). Thuật toán
kỳ vọng cực đại (EM) bao gồm hai bước lặp:
1) Bước kỳ vọng: Ước tính xác suất của mỗi điểm ảnh được tương quan với
các điểm lân cận.
2) Bước cực đại: hình thức cụ thể của mối tương quan được ước tính.
Bằng cách mô hình hóa các mối tương quan CFA với một mô hình tuyến
tính đơn giản, bước kỳ vọng làm giảm ước lượng Bayesian và bước cực đại làm
giảm trọng số của vùng ước lượng. Trong một ảnh thật thì mô hình định kỳ của
các điểm ảnh với các điểm lân cận có sự tương quan với nhau, nếu có sự chênh
lệch nó sẽ là bằng chứng về sự giả mạo một vùng so với toàn cục.
2.3.3. Đáp ứng của máy ảnh (Camera Response)
Vì hầu hết các cảm biến của hình ảnh kỹ thuật số gần như tuyến tính, có
một mối quan hệ tuyến tính giữa số lượng ánh sáng được đo bởi mỗi phần tử
cảm biến tương ứng và tương quan với giá trị điểm ảnh cuối cùng đạt được. Tuy
nhiên, hầu hết các máy ảnh áp dụng một quá trình phi tuyến để nâng cao chất
lượng hình ảnh cuối cùng đạt được. Các nhà nghiên cứu đã ước tính lập bản đồ
này, được gọi là hàmđáp ứng (response function), từ một hình ảnh duy nhất. Sự
khác biệt trong các chức năng đáp ứng trên toàn bộ hình ảnh này sau đó được sử
dụng để phát hiện giả mạo.
Xem xét một cạnh mà các điểm ảnh dưới cạnh là một hằng số màu c
1
và
các điểm ảnh trên của cạnh đó có màu sắc khác là c
2
. Nếu đáp ứng máy ảnh là
tuyến tính thì các điểm ảnh dọc theo cạnh đó phải là một sự kết hợp tuyến tính
màu sắc của các điểm ảnh lân cận. Độ lệch của các điểm ảnh trung gian dự kiến
sẽ đáp ứng tuyến tính được sử dụng để ước tính chức năng đáp ứng của máy
ảnh. Chức năng đáp ứng nghịch đảo của máy ảnh sẽ được lấy từ mối tương quan
giữa các điểm ảnh màu trước và mối quan hệ tuyến tính được ước tính từ ước
lượng hậu cực đại (MAP). Để ổn định ước lượng các cạnh được lựa chọn trên cả
hai mặt của cạnh tương tự, sự chênh lệch ở hai bên cạnh là nhỏ, sự khác biệt
giữa c
1
và c
2
là lớn và các điểm ảnh dọc theo cạnh là giữa c
1
và c
2
. Hạn chế của
phương pháp này là cần thiết phải có tăng đơn điệu với nhiều nhất một điểm ảnh
có sự thay đổi và nên xét trên mỗi kênh màu. Khi có thể ước tính được đáp ứng
ở mức độ bộ phận, ta cũng có thể so sánh với đáp ứng trên toàn cục để tìm ra
vùng bị làm giả.
25
2.3.4. Nhiễu có cấu trúc (Pattern Noise)
Trung tâm của mọi máy ảnh kỹ thuật số là cảm biến hình ảnh. Cảm biến
chia thành những địa chỉ rất nhỏ điểm ảnhđó là tập hợp photon và giấu chúng
vào điện áp được lấy mẫu từ bộ chuyển đổi A/D. Trước khi ánh sáng từ cảnh vật
được truyền đến cảm biến, nó đi qua các ống kính máy ảnh, bộ lọc khử răng cưa
(làm mờ), và sau đó thông qua một mảng lọc màu (CFA). CFA là một khảm của
bộ lọc màu có nhiệm vụ chặn một phần nhất định của quang phổ, cho phép mỗi
điểmảnh nhận một màu sắc cụ thể. Bộ cảm biến Foveon
TM
X3 là cảm biến duy
nhất mà không sử dụng CFA và có thể nắm bắt tất cả ba màu cơ bản ở mỗi
điểmảnh.
Nếu cảm biến sử dụng CFA, đầu ra cảm biến số hóa bị suy giảm sử dụng
thuật toán thêm màu để có được tất cả ba màu cơ bản cho mỗi điểm ảnh. Kết quả
tín hiệu được tiếp tục xử lý màu sửa chữa và điều chỉnh cân bằng sáng. Việc
thêm vào quá trình xử lý bao gồm cấu trúc sửa chữa hai thành phần chính của
nhiễu đó là nhiễu có cấu trúc cố định (Fixed Pattern Noise - FPN) và nhiễu
không đồng nhất do ánh sáng môi trường. Nhiễu có cấu trúc cốđịnh đề cập đến
sự khác nhau từ điểmảnhtới điểmảnh khi mà mảng cảm biến không tiếp xúc với
ánh sáng (còn gọi là miền tối hiện hành). Nhiễu có cấu trúc cốđịnh là một kiểu
nhiễu cộng và một số phụ gia để nâng cao khả năng của máy ảnh có thể chặn
được nhiễu bằng cách trừ đi một khung tối từ tất cả bức ảnh mà họ có được.
Nhiễu có cấu trúc cốđịnh cũng tùy thuộc vào tiếp xúc và nhiệt độ.
Hình 2.3 Hình ảnh hai mẫu nhiễu lấy được từ 2 loại sensor có công nghệ khác nhau
Cácảnh hưởngkhông đồng nhấtcủa nhiễu tới hìnhảnh (FPRN), đây là phần
chi phối của mẫu nhiễu (PN) trong hìnhảnh được chụp từ tự nhiên.Mô hình toán