Tải bản đầy đủ (.docx) (64 trang)

Ứng dụng phương pháp biến đổi ma trận phát hiện ảnh giả mạo dạng sao chép – dịch chuyển.

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.44 MB, 64 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC GIAO THÔNG VẬN TẢI

ĐỀ CƯƠNG CHI TIẾT LUẬN VĂN THẠC SĨ
Tên đề tài: Ứng dụng phương pháp biến đổi ma trận phát hiện
ảnh giả mạo dạng sao chép – dịch chuyển.

Giáo viên hướng dẫn:
Học viên thực hiện:
Mã học viên:
Khóa:
Ngành: Công nghệ thông tin

Hà Nội - 2016


LỜI CAM ĐOAN
Tôi xin cam đoan luận văn thạc sĩ công nghệ thông tin: “Ứng dụng
phương pháp biến đổi ma trận phát hiện ảnh giả mạo dạng sao chép – dịch
chuyển” là kết quả của quá trình học tập, nghiên cứu khoa học độc lập,
nghiêm túc.
Các số liệu trong luận văn là trung thực, có nguồn gốc rõ ràng, được
trích dẫn và có tính kế thừa, phát triển từ các tài liệu, tạp chí, các công trình
nghiên cứu đã được công bố, các website, …
Các phương pháp nêu trong luận văn được rút ra từ những cơ sở lý luận
và quá trình nghiên cứu tìm hiểu của tác giả.
Hà Nội, ngày

tháng năm 2017.
Sinh viên


Lê Ngọc Linh


LỜI CẢM ƠN
Em xin chân thành cảm ơn thầy giáo Thạc sỹ ……..… - giảng viên khoa
CNTT – Trường Đại học Giao thông vận tải, người đã trực tiếp hướng dẫn tận
tình và tạo mọi điều kiện thuận lợi để em hoàn thành luận văn của mình.
Em cũng xin gửi lời cảm ơn chân thành tới tất cả các thầy cô trong bộ
môn Công Nghệ Thông Tin - Trường Đại học Giao thông vận tải cũng như
các thầy cô trong trường đã nhiệt tình chỉ dạy và cung cấp những kiến thức
quý báu để em có thể hoàn thành tốt đồ án tốt nghiệp này.
Cuối cùng, em xin cảm ơn gia đình và bạn bè luôn tạo điều kiện, động
viên và giúp đỡ em trong suốt thời gian học tập, cũng như quá trình nghiên
cứu, hoàn thành đồ án này.
Vì thời gian có hạn, kiến thức của bản thân còn nhiều hạn chế cho nên
trong đồ án không tránh khỏi những thiếu sót, em rất mong nhận được sự
đóng góp ý kiến của tất cả các thầy cô giáo cũng như các bạn để đồ án của em
được hoàn thiện hơn.
Em xin chân thành cảm ơn!
Hà Nội, ngày … tháng …. năm 2017
Sinh viên

Lê Ngọc Linh

3


Mục Lục:

4



CÁC THUẬT NGỮ VÀ CÁC TỪ VIẾT TẮT
2D
3D
ADC
CPU
DoG
H
IC
LoG
RAM
RANSAC
SIFT
SVD

2 Dimensions (Không gian 2 chiều)
3 Dimensions (Không gian 3 chiều)
Analog to Digital Converter
Control Processing Unit
Difference of Gaussians
Homography
Inconsistency Coefficient
Laplacian of Gaussian
Random Access Memory
RANdom Sample Consensus algorithm
Scale Invarian Feature Tranorms
Singular Value Decomposition



DANH MỤC HÌNH ẢNH
Hình 1.1. Biểu đồ histogram của ảnh đa cấp xám Lena……………………… 9
Hình 1.2. Cấu
…………..11

trúc

tệp

ảnh

BMP

………………………………….

Hình 1.3. Mô hình nén ảnh JPEG ……………………………………………
14
Hình
1.4.
Tổ
chức
MCU
4:1………………………………………….16

với

tỷ

lệ


Hình 1.5. Một khối điểm ảnh của ảnh Lena………………………………..
….18
Hình 1.6. Khối hệ số DCT ứng với khối giá trị điểm ảnh Hình 1.5 ……….…18
Hình 1.7. Hệ số DCT sau khi làm tròn các hệ số Hình 1.6
…………………….19
Hình 1.8. P – Ma trận điểm ảnh ………………………………………………
20
Hình 1.9. D- Ma trận hệ số DCT …………………………………………….
20
Hình
1.10.
Q

Ma
trận
………………………………………..20

hệ

số

lượng

tử

Hình 1.11. Q – Hệ số DCT sau khi lượng tử ………………………………..…
21
Hình 1.12. Đường zigzag ………………………………………………..……
21
Hình 1.13. Ảnh giả được tạo từ 3 ảnh nguồn khác nhau. ………………….

….22
Hình
1.14.
Ảnh
giả
……………………………………..24

dạng

Hình
1.15.
Ảnh
giả
dán………………………………………...26
Hình
1.16.
Ảnh
giả
……………………….....26

của

John

Hình 1.17. Ảnh giả
ngược…………………..27

mạo

Tổng


Hình
1.18.

mập
thăng.............................................................27

tăng

cường

ảnh

mạo

dạng

cắt

Jane

Fonda.

Kerry
thống
tấn


Bush


công

đọc

sách
trực


Hình 1.19. Sự khác
nhau.........................29

biệt

Hình
2.1:
Minh
họa
mạo…………………………...33
Hình
2.2:
Phát
hiện
sáng…………………………....33

của

các

sao


hướng

chép

mâu

nguồn
dịch

thuẫn

sáng

khác

chuyển

giả

hướng

nguồn

Hình 2.3: Sơ đồ khối của phát hiện ảnh giả mạo dạng sao chép, di chuyển..…
41
Hình 2.2.3: Kết quả so sánh phân tích PCA và SVD…………………………44
Hình 2.3: Ảnh trước và sau khi sử dụng phương pháp biến đổi ma trận SVD…
44
Hình
3.1.

Mở
chương
Matlab……………………………………….49

trình

trên

Hình 3.2. Giao diện chung của chương trình……………………………….…
50
Hình 3.3. Giao diện chọn ảnh
….51

…………………………………………….

Hình 3.4. Hình ảnh phát hiện giả mạo của thuật toán…………………..
……..51
Hình 3.5. Hình ảnh thử nghiệm của SVD với ảnh gốc ……………………...…
53
Hình 3.6. Hình ảnh thử nghiệm với ảnh giả mạo (64x64)của SVD………..
….54
Hình 3.7. Hình ảnh thử nghiệm của SVD với ảnh giả mạo 40
dB……………...55
Hình 3.8. Hình thử nghiệm của SVD với ảnh sau khi làm giả sẽ cắt theo đường
viền một pixel, sau đó dãn ra bằng kích thước cũ của ảnh……………………
56
Hình 3.9. Hình thử
64………………….57

nghiệm của QR


với ảnh giả mạo 64 x

Hình 3.10. Hình thử nghiệm của QR với ảnh giả mạo 40 dB…………………
58


Hình 3.11. Hình thử nghiệm của QR với ảnh sau khi làm giả sẽ cắt theo đường
viền một pixel, sau đó dãn ra bằng kích thước cũ của
ảnh…………………….58
Hình 3.12. Bảng kết quả phát hiện giả mạo theo thuật toán dùng SVD………
60
Hình 3.13. Bảng kết quả phát hiện nhầm theo thuật toán dùng QR………..…
61


PHẦN MỞ ĐẦU
Với sự phát triển của khoa học công nghệ, ngày càng có nhiều kỹ thuật
của khoa học công nghệ được ứng dụng vào thực tế và ảnh số chính là một
trong những thành quả đó. Ảnh số ngày càng dễ sửa chữa và hiệu chỉnh do
sức mạnh của các phần mềm soạn thảo và xử lý ảnh mà điển hình là
PhotoShop. Ngày nay, các chương trình xử lý ảnh có thể thêm vào hoặc bỏ đi
các đặc trưng của ảnh mà không để lại các dấu hiệu về sự giả mạo. Điều đó
có nghĩa việc phát hiện ra ảnh giả mạo là vấn đề phải đặt ra ngày càng cấp
bách và càng trở nên khó khăn.
Mặc dù nhu cầu về việc phát hiện các giả mạo ảnh số đã được công nhận
bởi cộng đồng các nhà nghiên cứu, nhưng hiện nay rất ít tài liệu có giá trị về
lĩnh vực này. Nhất là trong điều kiện Việt Nam, chưa có nhiều những nghiên
cứu này, trong khi thực tế đặt ra những nhu cầu, đòi hỏi.
Xuất phát trong hoàn cảnh đó, luận văn lựa chọn đề tài “Phát hiện ảnh

kỹ thuật số giả mạo dạng cắt/dán” nhằm nghiên cứu một số kỹ thuật phát
hiệnảnh kỹ thuật số giả mạo được tạo ra bởi việc sử dụng các chương trình xử
lý ảnh thông dụng, thông qua việc cắt/dán từ chính một ảnh và có sự thay đổi
về kích thước đối với các đối tượng bị cắt/dán. Đây cũng chính là cách
thường được các đối tượng sử dụng trong quá trình tạo ảnh số giả
nhờ kỹ thuật cắt/dán.
• Nội dung chính của luận văn gồm:
- Phần mở đầu.
- Chương 1: Khái quát về xử lý ảnh và ảnh giả mạo: Chương này đề cập đến
các khái niệm cơ bản về xử lý ảnh số, quá trình xử lý ảnh và các khái niệm cơ
bản về ảnh giả mạo.


- Chương 2: Một số kỹ thuật phát hiện ảnh giả mạo: Chương này gồm các
khái niệm cơ bản về các bài toán và một số phương pháp để phát hiện ảnh kỹ
thuật số giả mạo.
Trên cơ sở các thuật toán đã tìm hiểu và áp dụng thuật toán để phát hiện
ảnh kỹ thuật số giả mạo dạng cắt/dán.
- Chương 3: Xây dựng chương trình thực nghiệm: Tiến hành xây dựng
chương trình thực nghiệm để phát hiện ảnh kỹ thuật số giả mạo dạng cắt/dán.
- Phần kết luận.

CHƯƠNG 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ ẢNH GIẢ MẠO
1.1. Xử lý ảnh và một số vấn đề cơ bản trong xử lý ảnh.
1.1.1. Xử lý ảnh là gì ?
Con người thu nhận thông tin qua các giác quan trong đó thị giác đóng
vai trò quan trọng nhất vì 80% thông tin được thu nhận bằng mắt tức là ở


dạng ảnh. Mặt khác với sự phát triển mạnh mẽ của phần cứng máy tính, xử lý

ảnh, đồ hoạ ngày càng có nhiều ứng dụng thực tiễn phục vụ cuộc sống. Như
vậy, xử lý ảnh đóng một vai trò rất quan trọng trong sự tương tác giữa người
và máy.
Cũng như xử lý dữ liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của
tin học ứng dụng. Xử lý dữ liệu bằng đồ hoạ đề cập đến những ảnh nhân tạo,
các ảnh này được xem xét như là một cấu trúc dữ liệu và được tạo ra bởi các
chương trình. Xử lý ảnh số bao gồm các phương pháp và kĩ thuật để biến đổi,
để truyền tải hoặc mã hoá các ảnh tự nhiên.
1.1.2. Ảnh số
Ảnh số là tập hợp bao gồm hữu hạn các phần tử được gọi là điểm ảnh
(pixel), mỗi điểm ảnh được biểu diễn bởi một số hữu hạn các bít.
Trên phương diện toán học, ảnh số được xem như là ma trận nguyên
dương gồm hàng và cột, mỗi phần tử của ma trận đại diện cho một điểm ảnh.
1.1.3. Các giai đoạn trong xử lý ảnh
Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ
sáng. Để có thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh.
Trong quá trình số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc
thông qua quá trình lấy mẫu (rời rạc hoá về không gian) và lượng hoá thành
phần giá trị mà về nguyên tắc bằng mắt thường không phân biệt được hai
điểm kề nhau. Trong quá trình này, người ta sử dụng khái niệm Picture
element mà ta quen gọi hay viết là Pixel - điểm ảnh.
Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại một toạ độ
trong không gian của đối tượng .
Ảnh được xem như là một tập hợp các điểm ảnh. Khi được số hoá, nó
thường được biểu diễn bởi bảng hai chiều I(n,p): n dòng và p cột. Ta nói ảnh
gồm n x p điểm ảnh. Người ta thường kí hiệu I(x,y) để chỉ một điểm ảnh.
Thường giá trị của n chọn bằng p và bằng 256. Một điểm ảnh có thể lưu trữ
trên 1, 4, 8 hay 24 bit .
Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x, y là



các biến tọa độ. Giá trị số ở điểm (x,y) tương ứng với giá trị xám hoặc độ
sáng của ảnh (x là các cột, y là các hàng). Giá trị của hàm ảnh f(x,y) được hạn
chế trong phạm vi của các số nguyên dương: 0 ≤ f(x,y) ≤ fmax. Thông thường
đối với ảnh xám, giá trị fmax là 255 bởi vì mỗi phần tử ảnh được mã hóa bởi
một byte. Khi quan tâm đến ảnh màu, ta có thể mô tả màu qua ba hàm số:
thành phần màu đỏ qua hàm R(x,y), thành phần màu lục qua hàm G(x,y) và
thành phần màu lam qua hàm B(x,y).
Số điểm ảnh tạo nên một ảnh gọi là độ phân giải (resolusion). Độ phân
giải thường được biểu thị bằng số điểm ảnh theo chiều dọc và chiều ngang
của ảnh. Ảnh có độ phân giải càng cao càng rõ nét. Như vậy, ảnh càng to thì
càng bị vỡ hạt, độ mịn càng kém.
Mức xám: là kết quả sự mã hóa tương ứng của mỗi cường độ sáng của
một điểm ảnh với một giá trị số - kết quả của quá trình lượng hóa. Cách mã
hóa kinh điển thường dùng 16, 32 hay 64 mức.
Biểu đồ tần suất: biểu đồ tần xuất của một mức xám g của ảnh I là số
điểm ảnh của I có mức xám g.
1.1.4. Biểu diễn ảnh
Ảnh được thu nhận từ các thiết bị thu nhận ảnh. Sau khi thu nhận, ảnh
được lưu trữ trên máy tính. Quá trình lưu trữ gồm 2 mục đích: tiết kiệm bộ
nhớ và giảm thời gian xử lý.
Trên cơ sở đó, các ảnh được biểu diễn theo 2 mô hình cơ bản là
RASTER và VECTOR.
Mô hình RASTER:

Theo mô hình này, ảnh được biểu diễn dưới dạng ma trận các điểm ảnh.
Tùy theo yêu cầu thực tế mà mỗi điểm ảnh được biểu diễn bằng một hoặc
nhiều bit.
Ngày nay thiết bị phần cứng phát triển nhưng chủ yếu là theo định
hướng Raster cho cả thiết bị đầu vào cũng như đầu ra. Ví dụ: máy in, máy

quét, v.v…


Một trong những nghiên cứu chủ yếu trong mô hình raster là kỹ thuật
nén ảnh, chia ra hai khuynh hướng đó là nén bảo toàn và nén không bảo toàn
thông tin.
Nén bảo toàn thông tin là có khả năng phục hồi hoàn toàn dữ liệu ban
đầu. Nén không bảo toàn thông tin là có khả năng phục hồi dữ liệu ban đầu
nhưng với sai số chấp nhận được. Trên cơ sở đó người ta xây dựng được
nhiều khuôn dạng ảnh khác nhau: *.pcx, *.tif, *.gif, *.jpg, *.jpeg, v.v…
Mô hình VECTOR:

Ảnh lưu trữ trên máy tính ngoài yêu cầu về giảm không gian lưu trữ,
thời gian xử lý, dễ dàng cho hiển thị và in ấn còn phải đảm bảo dễ dàng trong
sự lựa chọn, sao chép, di chuyển và tìm kiếm. Theo những yêu cầu này, kỹ
thuật biểu diễn Vector tỏ ra ưu việt hơn.
Trong mô hình Vector, ảnh được biểu diễn bởi các điểm ảnh và các
đường thể hiện hướng của một điểm. Ảnh dạng vector được thu nhận từ các
thiết bị như sensor, digitalier, v.v….
Ngày nay, các thiết bị phần cứng phát triển mạnh theo hướng Raster
cho cả đầu vào và đầu ra nên một trong những nghiên cứu chủ yếu của mô
hình Vector là tập trung cho chuyển đổi từ ảnh Raster sang ảnh Vector.
1.1.5. Nắn chỉnh biến dạng
Ảnh thu được sau quá trình thu nhận thường bị biến dạng do những thiết bị
quang học và điện tử. Do đó cần phải có khâu nắn chỉnh biến dạng.
Để nắn chỉnh biến dạng ta dựa vào tập các điểm điều khiển (pi, p’i), ( i= 1,
…, n).
n

Cần tìm hàm: ƒ: Pi → ƒ(Pi) sao cho:



i =1

2

f ( pi ) − p i

→ min

(1.1)

1.1.6. Khử nhiễu
Trong quá trình thu nhận ảnh không thể tránh khỏi bị nhiễu. Có 2 loại nhiễu


cơ bản:
- Nhiễu hệ thống: là loại nhiễu gây ra bởi hệ thống, như vết xước hoặc
nguồn sáng ngoại lai. Loại nhiễu này có tính chất chu kỳ và có thể dễ khắc phục
bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: là các vết bẩn không rõ nguyên nhân. Loại nhiễu này
thường khó khử, tùy vào từng ảnh cụ thể mà có cách khắc phục. Thông thường sử
dụng các phép lọc.
1.1.7. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người ta
muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn các đặc
tính chủ yêu của đối tượng. Có 2 kiểu đối tượng:
- Mô tả tham số (nhận dạng theo tham số)
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc)
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với

nhiều đối tượng khác nhau như: Nhận dạng ảnh vân tay, nhận dạng chữ (chữ cái,
chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hóa quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết, kiểu
chữ, v.v...) được phục vụ cho nhiều lĩnh vực.
Ngoài hai kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới dựa
vào kỹ thuật mạng nơron đang được áp dụng và cho kết quả khả quan.
1.1.8. Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. Trong
phân tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của


đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh.
Có thể nêu ra một số đặc điểm của ảnh sau đây: Đặc điểm không gian: Phân bố
mức xám, phân bố xác suất, biên độ, điểm uốn v.v.. Đặc điểm biến đổi: Các đặc
điểm loại này được trích chọn bằng việc thực hiện lọc vùng (zonal filtering). Các
bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường là các khe hẹp với
hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..) Đặc điểm biên và đường
biên: Đặc trưng cho đường biên của đối tượng và do vậy rất hữu ích trong việc
trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng. Các đặc
điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử
Laplace, toán tử “chéo không” (zero crossing) v.v.. Việc trích chọn hiệu quả các
đặc điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính
toán cao và dung lượng nhớ lưu trữ giảm xuống.
1.1.9. Nén ảnh
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai
cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không
bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi thì kém
hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:

Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.
Một ví dụ điển hình cho phương pháp này là *TIF
Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm
ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong
các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn. *.JPG chính là tiếp
cận theo kỹ thuật nén này.
Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện
sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc
ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.


1.2. Histogram của ảnh
Histogram là khái niệm cơ bản trong xử lý ảnh. Histogram là bảng thống kê
tần số giá trị cường độ sáng của các điểm ảnh. Đối với ảnh màu, cường độ sáng
của một điểm ảnh được xác định theo công thức:
(1.2)
trong đó: là giá trị các thành phần màu và là cường độ sáng của điểm ảnh.
Ví dụ: Từ ảnh màu pepper ta có thể dễ dàng xác định được biểu đồ
histogram tương ứng như Hình 1.1.

(a) Ảnh Lena

(b) Biểu đồ histogram

Hình 1.1. Biểu đồ histogram của ảnh đa cấp xám Lena.
1.3. Biểu đồ histogram
Như đã đề cập ở trên, chất lượng ảnh chứa tin là một trong những yếu tố

quan trọng trong giấu tin mật, đặc biệt là thủy vân số. Chất lượng ảnh chứa tin có
thể được đánh giá bằng hệ số (Peak Signal-to-Noise Ratio). Lược đồ có hệ số
càng lớn thì chất lượng ảnh chứa tin càng cao. Hệ số của ảnh chứa tin so với
ảnh gốc kích thước được tính theo công thức:
(1.3)
Trong đó, là giá trị cực đại của điểm ảnh và (Mean Square Error) được xác
định theo công thức:


(1.4)
đối với ảnh màu, giá trị có thể chấp nhận được nếu thuộc khoảng từ 30 dB đến
50 dB.
1.4. Phân loại ảnh
1.4.1 Phân loại ảnh theo màu sắc
Dựa theo màu sắc ta có thể chia ảnh số thành 3 dạng cơ bản như: Ảnh nhi
phân, ảnh đa cấp xám và ảnh màu (true color).
-

Ảnh nhị phân là ảnh chỉ có hai màu, một màu đại diện cho màu nền và màu còn
lại cho đối tượng của ảnh. Nếu hai màu là đen và trắng thì gọi là ảnh đen trắng.

-

Như vậy, ảnh nhị phân được xem như một ma trận nhị phân.
Ảnh đa cấp xám là ảnh có thể nhận tối đa 256 mức sáng khác nhau trong khoảng
màu đen – màu trắng. Như vậy, ảnh đa cấp xám xem như là ma trận không âm có

-

giá trị tối đa 255.

Ảnh màu hay còn gọi là ảnh true color, mỗi điểm ảnh được biểu diễn bởi một số
byte (thường 3 byte) đại diện cho 3 thành phần màu và . Như vậy, ảnh màu có thể
xem như 3 ma trận nguyên ứng với 3 thành phần màu của các điểm ảnh.
Trong lĩnh vực giấu tin, mỗi dạng ảnh có những thuận lợi, khó khăn và cách
tiếp cận riêng. Tuy nhiên, một lược đồ giấu tin trên ảnh nhị phân ta có thể dễ dàng
áp dụng cho ảnh đa cấp xám, hoặc ảnh màu thông qua tính chẵn lẻ của giá trị
điểm ảnh. Nhưng từ lược đồ giấu tin trên ảnh màu hoặc ảnh đa cấp xám khó có
thể áp dụng đối với ảnh nhị phân.
1.4.2 Ảnh bitmap
Tệp ảnh bitmap là một trong những định dạng ảnh thông dụng được hỗ trợ
bởi hầu hết các hệ điều hành và thiết bị điện tử. Tệp ảnh bitmap được chia thành
4 phần như sau:


Hình 1.2. Cấu trúc tệp ảnh BMP.

Trong đó:


Bitmap File Header gồm 14 byte



Bitmap Info gồm 40 byte



Color palette - Bảng màu (đối với ảnh 24 bít không có bảng mầu)




Bitmap Data

Cấu trúc và nội dung của Bitmap File Header
Byte#

Data

Giá trị

1

Kiểu tệp

‘B’

2

Kiểu tệp

‘M’

3-6

Size of the file

Unsigned long

7-10


Reserved

Zero

11-14

Byte offset to bitmap data

Số TT (tính từ 0) byte đầu của BMP
data


Cấu trúc và nội dung của Bitmap Info
Byte#

Data

Giá trị

1-4

Number of bytes in Bitmap Info

40

5-8

Width of bitmap

In pixels


9-12

Height of bitmap

In pixels

13-14

Number of color planes

15-16

Number of bits per pixels

17-20

Type of compression

21-24

Size of image

25-28

Horizontal resolution

29-32

Vertical resolution


33-36

Number of colors In color Palette

1
1, 4, 8 hoặc 24

In bytes

Ảnh 24 bít – 0
Ảnh 8 bít - nếu 0 thì
256 mầu

37-40

Number of colors importal

Cấu trúc và nội dung của Color Palette
Byte

Data

Giá trị

Entry - chỉ số mầu

1

Blue color value


0 – 255

0

2

Green color value

0 – 255

0

3

Red color value

0 – 255

0

4

Reserved

0

0

5


Blue color value

0 – 255

1

6

Green color value

0 – 255

1


7

Red color value

8

Reserved

9



0 – 255


1

0

1

Bitmap Data


Với ảnh 8 mầu:
Mỗi byte chứa chỉ số mầu (tính từ 0) của một điểm ảnh. Các điểm ảnh được

lưu trữ trên file theo từng hàng từ dưới lên trên. Các điểm ảnh mỗi hàng được
chứa từ trái sang phải.


Với ảnh 24 mầu:
Mỗi nhóm 3 byte biểu diễn mầu của một điểm ảnh (byte 1 – Red, byte 2 –

Green, byte 3 – Blue). Thứ tự lưu trữ các điểm ảnh trong file cũng như với ảnh 8
màu.
1.4.3 Ảnh JPEG
JPEG (Joint Photographic Experts Group) là một chuẩn nén quốc tế sử dụng
cho ảnh tĩnh có tính liên tục, bao gổm ảnh đa cấp xám và ảnh màu. Chuẩn JPEG
bao gồm hai phương pháp nén: Nén mất thông tin (DCT) và nén không mất thông
tin. Phương pháp nén mất thông tin hay còn được gọi là kỹ thuật baseline,
phương pháp này được sử dụng phổ biến trong các thiết bị và ứng dụng xử lý ảnh.
Qui trình nén ảnh JPEG



Hình 1.3. Mô hình nén ảnh JPEG

Theo hình 1.3, ảnh RGB được chuyển sang mô hình màu Trong mô hình
thành phần đại diện cho cường độ sáng của ảnh và có vai trò quan trọng hơn so
với hai thành màu (màu đỏ, màu xanh). Mối quan hệ giữa mô hình màu RGB và
được xác định:
-

Chuyển từ RGB sang :

0.587000
0.114000   R   0 
 Y   0.299000
C  =  −0.168736 −0.331264 0.500002  G  + 128
 b 
  

Cr   0.500000 −0.418688 −0.081312   B  128 
-

Chuyển từ sang RGB:


R
1.0
G  = 1.0
 





B
1.0

0.0
−0.34414
1.77180

1.40210  
Y



−0.71414  Cb − 128



0.0
  Cr − 128 


Tổ chức MCU
Sau khi đã chuyển đổi không gian màu, các thành phần được phân hoạch
thành các khối trước khi tổ chức MCU (Minimum Coding Unit). Mục địch của
việc tổ chức MCU là giảm số lượng khối .
Một MCU gồm một số khối (của các thành phần ). Do là thành phần quan
trọng của ảnh nên chuẩn JPEG không giảm số khối của mà chỉ giảm số khối của
hai thành phần và . Theo [14], có 4 cách tổ chức các thành phần :
-


, tỷ lệ 4:1 (dùng 1 khối đại diện cho 4 khối)
, tỷ lệ 2:1 (dùng 1 khối đại diện cho 2 khối theo chiều cao ảnh)
, tỷ lệ 2:1 (dùng 1 khối đại diện cho 2 khối theo chiều rộng ảnh)
, tỷ lệ 1:1 (không giảm)
Như vậy, nếu chọn tỷ lệ 4:1 (hình 1.4) thì sẽ gihì được 50% số khối trên

toàn bộ ảnh.


4 khối của Y

4 khối của

4 khối của

8x8

8x8

MCU – Minimum Coding Unit
Hình 1.4. Tổ chức MCU với tỷ lệ 4:1

Biến đổi DCT 2-D
Áp dụng phép biến đổi Cosine rời rạc hai chiều đối với các khối điểm ảnh
nhận được các khối DCT (khối các hệ số DCT). Theo [14], ma trận Cosine rời
rạc cấp được xác định theo công thức:
(1.5)
(T là ma trận trực chuẩn nên .
Khi đó, phép biến đổi Cosine rời rạc hai chiều đối với khối điểm ảnh để
nhận được khối hệ số DCT như sau :

(1.6)
và phép biến đổi tương tứng (IDCT):
(1.7)
Mỗi khối DCT gồm 64 phần tử, phần tử góc trên bên trái được gọi là phần tử


DC và 63 phần tử còn lại được gọi là phần tử AC. Phép biến đổi Cosine rời rạc có
một tính chất quan trọng, năng lượng của ảnh được tập trung vào phần tử DC, nói
cách khác giá trị tuyệt đối của phần tử DC luôn lớn hơn các phần tử khác trong
khối.
Xét ví dụ về biến đổi DCT 2D
Để tiện theo dõi, ta xét ví dụ minh họa biến đổi DCT 2D với một khối dữ
liệu ảnh Lena như sau:
161

161

161

162

163

162

159

157

162


161

161

162

162

160

157

155

162

161

160

160

160

158

156

153


160

159

158

159

159

158

156

154

158

157

156

157

158

158

157


155

157

156

155

156

157

158

157

156

158

157

155

156

157

157


157

156

159

158

156

156

156

157

156

155

Hình 1.5. Một khối điểm ảnh của ảnh Lena

Sau khi biến đổi cosine rời rạc hai chiều ta nhận được khối hệ số DCT tương
ứng như sau:
1264.1

6.7192

-3.9313


6.2073

0.375

0.14007

-0.67169

-0.42002

11.699

4.5744

-5.1517

0.084447

0.35485

-0.099139

0.25577

0.47145

-0.408

0.26517


-0.19204

-0.26851

0.19688

-0.097903

0.16332

-0.26473

4.0106

0.12832

0.036612

-0.31665

0.111

-5.3454

0.056504

0.12369
0.01428


0.20051

5

0.375

0.69017

0.092001
-0.06765

0.087278

0.2094

0.32887

-0.375

9

0.07181
0.20633

-0.018506

6

0.056627
-0.17538


-0.3624

8


-0.44353

0.21225

0.26517

0.093833

0.62526

-0.018664

0.21339

-0.06756

0.22145

0.31925

0.19749

0.2371


0.011224

0.21339

-0.026756

-0.08157
5

Hình 1.6. Khối hệ số DCT ứng với khối giá trị điểm ảnh Hình 1.5

Các số liệu trên Hình 1.6 cho thấy, các hệ số DCT góc trên bên trái có giá trị
lớn hơn các hệ số góc dưới phải. Hệ số DC có giá trị lớn nhất. Nếu ta làm tròn các
hệ số DCT sẽ được kết quả như sau:

Hình 1.7. Hệ số DCT sau khi làm tròn các hệ số Hình 1.6
Theo Hình 1.7, hầu hết các hệ số DCT góc dưới phải sau khi làm tròn đều có giá
trị nhỏ (theo giá trị tuyệt đối) hoặc bằng 0.

Lượng tử hóa và mã hóa
Các khối DCT được lượng tử bằng cách chia nguyên cho các hệ số lượng tử.
Để tăng cương chất lượng ảnh, hệ số lượng tử của thành phần thường nhỏ hơn hệ
số lượng tử của hai thành phần màu và .
Gọi là ma trận hệ số lượng tử (hình 1.8) và D là ma trận hệ số DCT. Khi đó,
ma trận hệ số DCT sau khi lượng tử được tính theo công thức:
(1.8)
Xét ví dụ, với ma trận điểm ảnh cho như sau:



×