Tải bản đầy đủ (.docx) (17 trang)

BÀI TẬP LỚN MÔN HỌC KỸ THUẬT GIẤU TIN Đề tài 23 : KỸ THUẬT THỦY VÂN CỦA VIDEO MPEG4

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (691.83 KB, 17 trang )

HỌC VIỆN KỸ THUẬT MẬT MÃ

KHOA AN TỒN THƠNG TIN

BÀI TẬP LỚN MÔN HỌC

KỸ THUẬT GIẤU TIN
Đề tài 23 :

KỸ THUẬT THỦY VÂN CỦA VIDEO MPEG4
Sinh viên thực hiện :

NGUYỄN MINH HOÀNG AT150121
VŨ TRẦN HOÀNG ANH AT150102
HOÀNG NHẬT HỒNG AT150122
LÊ CƠNG SẢN AT150150
NGUYỄN VĂN NGHĨA AT150141

Nhóm :
Giảng viên hướng dẫn :

9
Th.S HOÀNG THU PHƯƠNG

Hà Nội, 02/2022


TÓM LƯỢC
Phương pháp tạo thủy vân video miền nén MPEG-4 được đề xuất và thể
hiện của nó được nghiên cứu ở tốc độ bit video từ 64 Kb / s đến 900
Kb / s. Thủy vân được chèn bằng cách sửa đổi hệ số Discrete Cosine


Transformation (DCT). Cường độ của thủy vân được thay đổi theo đặc
tính khung cục bộ để giảm tác động đến chất lượng hình ảnh. Thể hiện
của thuật toán cũng được nghiên cứu để tạo thủy vân các bit trong khung
hình khác nhau, từ 1 Kb / khung hình đến 3 Kb / khung hình. Thủy vân
không bị tấn công trước các cuộc tấn công như chia tỷ lệ, xoay và cắt
xén ngay cả khi sử dụng kỹ thuật mù

Mục lục
1. Giới thiệu.............................................................................................2
2. Tổng quan về MPEG-4.......................................................................3
3. Phương án đề xuất..............................................................................3
3.1 Tín hiệu thủy vân trải phổ.............................................................4
3.2 Nhúng thủy vân..............................................................................4
3.3 Phương pháp tăng thích ứng cục bộ.............................................6
4. Kết quả...............................................................................................10
5. Đánh giá chủ quan............................................................................12
6. Kết luận..............................................................................................15

1. Giới thiệu
Kỹ thuật thủy vân số là việc chèn thông tin một cách trong suốt vào dữ
liệu đa phương tiện, nó đóng vai trị như một chữ ký trong video.


Phương pháp cổ điển để tạo thủy vân cho luồng video nén là giải nén
video và sử dụng kỹ thuật tạo thủy vân miền không gian hoặc miền biến
đổi, sau đó nén lại video đã được thêm thủy vân. Một số nhược điểm của
phương pháp này là: Tăng tính nhiễu do q trình nén lại, chất lượng
khơng tốt do khơng hiểu biết về kết quả các tham số nén và độ phức tạp
trong tính tốn. Một cách khác là chỉ chèn thủy vân trong miền nén.
Theo cách tiếp cận này, thủy vân được chèn vào một số thành phần cú

pháp như hệ số DCT của video được giải mã một phần
Hartung mô tả các kỹ thuật để nhúng thủy vân trải phổ vào video nén
MPEG-2 cũng tương tự vào video không nén. Đối với kỹ thuật thủy vân
miền nén, họ giải mã video để thu được hệ số DCT của mỗi khung hình
và chèn thủy vân bằng cách sửa đổi các hệ số DCT đó. Langelaar mơ tả
kỹ thuật thủy vân miền nén được gọi là Differential Energy Watermark
(DEW), trong đó video được chia thành nhóm các khối, mỗi nhóm được
chia thành hai bộ có kích thước bằng nhau được xác định bởi khóa
nhúng thủy vân. Bằng cách so sánh năng lượng của các hệ số DCT đã
chọn trong hai bộ, một bit trọng tải duy nhất được biểu thị. Jordan và
cộng sự đề xuất một phương pháp tạo thủy vân cho video nén để nhúng
thông tin vào các vectơ chuyển động. Hsu và Wu trình bày một phương
pháp cho kỹ thuật thủy vân điều chỉnh hệ số DCT tần số trung bình liên
quan đến các khối lân cận về mặt không gian và thời gian. Nicholson đã
đánh giá độ bền của thủy vân và chất lượng video sau khi video được tạo
thủy vân và nén bằng MPEG-4. Tuy nhiên, khơng có kỹ thuật nào trong
số này giải quyết được thủy vân trực tiếp của các video MPEG-4 này.
Trong bài báo này, một kỹ thuật thủy vân miền nén mới cho các luồng
video MPEG- 4 được trình bày. Cách tiếp cận tương tự như thủy vân
được chèn vào hệ số DCT. Tuy nhiên, việc sử dụng các mẫu đồng bộ hóa
làm cho nó trở nên mạnh mẽ và đạt được cải thiện cục bộ về chất lượng
Phần 2 giới thiệu tổng quan về kỹ thuật MPEG-4. Tiếp theo là phương
pháp được đề xuất và kết quả trong Phần 3 và Phần 4 tương ứng. Phần 5


đề xuất một giao thức để đánh giá chủ quan của hệ thống và kết luận
trong Phần 6.

2. Tổng quan về MPEG-4
MPEG-4 mã hóa thơng tin hình ảnh dưới dạng các đối tượng (video tự

nhiên, tổng hợp và kết cấu tĩnh). MPEG-4 mã hóa mơ tả cảnh để kết
xuất thích hợp tất cả các đối tượng. Khung ảnh của MPEG-4 có thể bao
gồm một hoặc nhiều đối tượng video. Mỗi đối tượng video được đặc
trưng bởi thông tin không gian và thời gian dưới dạng hình khn,
chuyển động và kết cấu và tương ứng với một đối tượng 2D trong cảnh.
Bề mặt đối tượng video (Video Object Plane - VOP) là một mẫu thời
gian của đối tượng video. VOP có thể được mã hóa độc lập với nhau
hoặc phụ thuộc nhau bằng cách bù trừ chuyển động. Một VOP chứa dữ
liệu video được mã hóa ở dạng khối khơng chồng lấn. Một khối không
chồng lấn chứa một phần của độ chó sáng và các thành phần sắc độ được
lấy mẫu theo khơng gian. Trong tiêu chuẩn hình ảnh MPEG-4, chỉ hỗ trợ
một định dạng sắc độ cho khối không chồng lấn là định dạng 4:2:0. Ở
định dạng này, mỗi macroblock chứa 4 khối độ chói sáng và 2 khối sắc
độ. Mỗi khối gồm 8x8 pixel được mã hóa bằng cách sử dụng phép biến
đổi DCT. Các hệ số DCT sau đó được lượng tử hóa một cách thích ứng
để đạt được tốc độ bit thấp.

3. Phương án đề xuất
Trong phương pháp được đề xuất, một tín hiệu thủy vân được chèn trực
tiếp vào chuỗi nhị phân nén MPEG-4 trong khi quá trình phát hiện được
thực hiện bằng cách sử dụng chuỗi nhị phân nén mà khơng có bất kỳ tín
hiệu thủy vân nào. Phần 3.1 thảo luận về sự hình thành tín hiệu thủy vân
từ các mẫu đồng bộ và tín hiệu thơng điệp gốc. Phần 3.2 đề cập đến q
trình mà tín hiệu thủy vân được nhúng vào các video MPEG-4. Phần 3.3
thảo luận về phương pháp tăng thích ứng cục bộ để tăng chất lượng
video.


3.1 Tín hiệu thủy vân trải phổ
Tín hiệu thủy vân thường được giới hạn ở một giá trị nhỏ để đảm bảo

tính trong suốt và có thể bị nhiễu từ tín hiệu chủ và nhiễu bổ sung phát
sinh từ quá trình xử lý sau đó. Tín hiệu trải phổ dễ bị xảy ra lỗi đồng bộ
hóa sau q trình chia tỷ lệ, cắt xén và phép quay. Một cặp mẫu được áp
dụng trên tín hiệu trải phổ để chống lại sự mất tính đồng bộ. Mẫu đầu
tiên hạn chế tín hiệu thủy vân để có cấu trúc tuần hồn định kỳ. Đặc biệt,
tín hiệu thủy vân được xây dựng bằng cách lặp lại một ô thủy vân sơ
cấp theo một cách không chồng chéo. Nếu việc lát được thực hiện đúng
cách, đỉnh luôn xảy ra ở tâm của mỗi ô. Nếu một phép biến đổi tuyến
tính A được áp dụng cho VOP đã được thủy vân một hệ số tự tương quan
, do đó các đỉnh mới di chuyển đến và theo
(1)
Mẫu đồng bộ hóa thứ hai buộc phải chứa một tập các đỉnh trong miền
yêu cầu. Yêu cầu này được đáp ứng bằng cách khiến là sự kết hợp của
thơng điệp mang ký hiệu và tín hiệu đồng bộ . Trong miền tần số này
chứa các đỉnh ở băng tần trung bình, mỗi đỉnh chiếm một hệ số tần và có
độ lớn thống nhất. Sau q trình chuyển đổi hình học A được áp dụng
cho hình ảnh, hệ số FFT di chuyển đến một vị trí mới theo phương
trình
(2)
Do sử dụng hai phương trình trên, chúng ta có thể thu được phép biến
đổi tuyến tính A áp dụng cho hình ảnh và thực hiện hồn ngun phép
biến đổi để thực hiện phương pháp phát hiện. Hình 1 (a) Phác thảo q
trình tạo ra tín hiệu thủy vân
3.2 Nhúng thủy vân
Phần này mô tả kỹ thuật nhúng thủy vân trực tiếp vào chuỗi nhị phân
được tạo ra để phù hợp với Advanced Simple Profile (ASP) của tiêu
chuẩn MPEG-4. Tín hiệu thủy vân sẽ được thêm vào mặt phẳng độ chói


sáng của VOPs. Vì DCT là một phép biến đổi tuyến tính để thêm tín

hiệu thủy vân được biến đổi trực tiếp vào hệ số DCT của các khối chói
sáng, nó tương đương phép cộng trong miền khơng gian. Một luồng nhị
phân sơ cấp được phân tích cú pháp thành mức khối, vectơ chuyển động
được mã hóa có độ dài biến đổi và hệ số DCT. Các vectơ chuyển động
được tái cấu trúc sử dụng giải mã VLC và đảo ngược các bước đốn
trước nếu có thể. Sau khi tín hiệu thủy vân được nhúng, các mã VLC
được tái tạo lại và chuỗi nhị phân được tái cấu trúc. Hình 1 (b): Mơ tả
tồn bộ đại cương.
Vì tín hiệu 96x96 được nhúng trong hình ảnh 192x192, nên một khối
8x8 sẽ được nhúng trong một khối 16x16. Do đó, tổng số hốn vị có thể
là . Thuộc tính này giúp giới thiệu Giấy phép kỹ thuật số (Digital
License Number). Mỗi người dùng được ủy quyền có một khóa được
ánh xạ tới một trong các cấu hình của tất cả các hốn vị có thể xảy ra.
Chuỗi bậc hai là một phương pháp mà lặp lại các , trong đó K là số giấy
phép tạo ra 64 vị trí để chèn thủy vân. Bảng băm là một cách tiếp cận
khác để làm điều tương tự.

Tín hiệu khơng
được đánh dấu
Đồng bộ hóa
theo mẫu

Tín hiệu thủy vân

Chia tỉ lệ và nhúng

Chia tỉ lệ và bổ sung

Sửa lỗi


(a)

Sự gắn kết

Tín hiệu đã thủy vân


Dịng Bit khơng được đánh
dấu

Dịng Bit đã thủy vân

Thơn tin tiêu đề và hình
dạng
Vecto chuyển động

Các hệ
số DCT

Nhúng thủy vân

Các hệ số DCT đã thủy
vân

(b)
Hình 1. a) Sơ đồ chuẩn bị tín hiệu thủy vân. b) Phác thảo cho một trình
nhúng thủy vân. Trình nhúng bắt chước giải mã MPEG-4
3.3 Phương pháp tăng thích ứng cục bộ
Phương pháp tăng thích ứng cục bộ để cải thiện việc thể hiện của thủy
vân. Đối với các vùng tương đối mịn của video, nơi thậm chí chỉ một

lượng nhỏ sai lệch cũng có thể thấy, kiểm soát tăng cục bộ sẽ giảm sức


mạnh của nhúng thủy vân để giảm thiểu khả năng cảm nhận thủy vân.
Đối với các vùng hình ảnh hay biến đổi và vùng kết cấu của hình ảnh,
kiểm sốt tăng cục bộ làm tăng sức mạnh nhúng để cải thiện độ mạnh
mẽ. Phương pháp tăng cục bộ sử dụng thước đo hoạt động cục bộ để
điều chỉnh công suất thủy vân trên cơ sở từng khối, được thu trực tiếp từ
hệ số DCT cho các khối trong và được dự đốn bằng cách sử dụng thơng
tin vectơ chuyển động cho các khối được dự đốn. Mơ hình tăng cho ra
tăng cục bộ . Các hệ số thủy vân sau đó được tính trọng số bằng để tạo
ra tín hiệu thủy vân sẽ được nhúng vào video:
(3)
trong đó là thủy vân sẽ được nhúng, là mức tăng toàn cầu do người
dùng lựa chọn và là tín hiệu thủy vân trước khi điều chỉnh mức tăng.
Đối với mỗi VOP, trọng số tăng cục bộ được quyết định dựa trên hoạt
động ước tính trong VOP. Đối với mã hóa nội khung VOP, là
(4)
trong đó và là ánh xạ pixel thứ thành hệ số DCT . Đối với VOP được
dự đoán, sẽ sử dụng cùng một cơng thức nhưng thay vì tổng năng lượng
là , nó là
(5)
trong đó , , và là số pixel đã di chuyển từ Khu vực A, B, C, D đến khối
hiện đang được xem xét. Bản phác thảo cho tăng thích ứng cục bộ được
thể hiện trong Hình 2 (a).


(a)

(b)


(c)
Hình 2. a) Bản phác thảo cho phương pháp tăng thích ứng cục bộ. b) Tín
hiệu thủy vân gốc sẽ được chèn. c) Tín hiệu thủy vân cuối sau khi lát


(a)Video I (900 Kb/sec)


(b) Video II (64 Kb/sec)
Hình 3. a) Video đã được thủy vân có tốc độ bit 900 Kb / giây và tốc độ
bit trọng tải là 1 Kb / khung hình. b) Video đã được thủy vân có tốc độ
bit 64 Kb / giây và tốc độ bit trọng tải là 1 Kb / khung hình

4. Kết quả
Thuật tốn đã được thử với hai video (một video có nhiều kết cấu so với
video khác) được thực hiện trong IIT Kanpur vì khơng có tập dữ liệu
video tiêu chuẩn cho các phương pháp tạo thủy vân. Các video được nén
ở các tốc độ bit khác nhau (64-900 Kb / giây) và tốc độ bit của tín hiệu
thủy vân thay đổi từ 1 kb / khung hình đến 3 Kb / khung hình. Các
khung có kích thước 192 x 192 và thủy vân 32 x 32 đã được chèn vào.
Việc chuẩn bị tín hiệu thủy vân đã được thể hiện trong các hình 2 (b), 2
(c). Kết quả nhúng thủy vân ở 1 Kb / khung hình và video 900 kb / s và


64 kb / s được thể hiện trong Hình 3. Hình 4 cho thấy hiệu suất của mơđun tăng thích ứng cục bộ

(a)Khơng có tăng thích ứng cục bộ



(b)Có tăng thích ứng cục bộ
Hình 4. a) Video đã được thủy vân có tốc độ bit 900 Kb / giây và tốc độ
trọng tải thủy vân là 3Kb / giây và khơng có mơ-đun tăng thích ứng cục
bộ. b) Video thủy vân có tốc độ bit 900 Kb / giây và tốc độ trọng tải thủy
vân là 3Kb / giây với áp dụng tăng thích ứng cục bộ. Sự khác biệt là chất
lượng khá rõ ràng ở các vùng có kết cấu thấp như bầu trời và bức tường

5. Đánh giá chủ quan
Một giao thức để đánh giá chất lượng của các khung video có thủy vân
đã được xác định dựa trên khuyến nghị P.910 của ITU-T và ITU-R Rec.
BT.500. Các khuyến nghị này đề xuất các giao thức khác nhau dựa trên
mục tiêu của các đánh giá và sự sẵn có của hiểu biết nền tảng. Trong
giao thức Absolute Category Rating (ACR), các hình ảnh được hiển thị
và sau đó các câu hỏi liên quan đến chất lượng của nó được đưa ra.


Thang đo là rời rạc với các giá trị 1-5. Trong giao thức Degradation
Category Rating (DCR), đầu tiên nguồn được trình bày theo đó là hệ
thống thử nghiệm. Thang đo sử dụng là thang điểm suy giảm rời rạc.
Các thang đo ACR, DCR khơng được tn thủ vì chúng sử dụng các
thang đo rời rạc và do đó làm mất đi sự tự do để phân biệt với việc sử
dụng. Một giao thức được thiết kế trong đó đối tượng được hiển thị hiểu
biết nền tảng và hệ thống thử nghiệm nhưng thang đo là liên tục. Trong
mỗi phiên kiểm tra, người dùng lần đầu tiên được làm quen với các giao
diện. Tiếp theo là phần thử để kiểm tra độ quen thuộc. Sau đó, chúng tơi
đã có một phiên kiểm tra bắt đầu với một dãy ổn định. Điểm số cao hơn
mức thơng thường và điểm số trung bình đã được tính tốn
Bài kiểm tra nhận thức chủ quan được thực hiện trên 5 đối tượng là
người dùng cuối và khơng phải chun gia về xử lý hình ảnh. Thang
điểm mà các đối tượng bình chọn là liên tục. Trong phiên đầu tiên của

bài kiểm tra, video bên dưới có tốc độ bit là 900 Kb / s. Trong phiên thứ
hai, tốc độ bit đã được thay đổi và các khung riêng lẻ được hiển thị. Tỷ
lệ thủy vân vẫn là 1 Kb / khung hình. Các biểu đồ sau (hình 5 (a) và hình
5 (b)) cho thấy hiệu suất của hai video.


(a)Tốc độ bit tải trọng đã thay đổi

(b) Tốc độ bit của video đã thay đổi


Hình 5. a) Đánh giá chủ quan về các video có tốc độ bit tải trọng đã
thay đổi. b) Đánh giá chủ quan về video có tốc độ bit của video đã
thay đổi

6. Kết luận
Một kỹ thuật mới để thủy vân số các chuỗi nhị phâm MPEG-4 trong
miền nén được đề xuất. Kỹ thuật này không chỉ mạnh mẽ đối với các lỗi
đồng bộ hóa mà cịn cải thiện chất lượng video bằng cách sử dụng kỹ
thuật thích ứng cục bộ.

7. Tài liệu tham khảo
[1] Hartung, F., Girod, B.: Watermarking of uncompressed and
compressed video. Signal Processing 66 (1998) 283–301
[2] Hartung, F.: Watermarking and fingerprinting of uncompressed and
compressed video. Signal Processing 66 (1998) 283–301
[3] ISO: Information technology - generic coding of moving pictures
and associated audio information. ISO/IEC 13818-2 (1994)
[4] Langelaar, G., R.Lagendijk: Optimal differential energy
watermarking of dct encoded images and video. IEEE Transactions on

image Processing 10 (2001) 148– 158
[5] F. Jordan, M.K., Ebrahimi, T.: Proposal of a watermarking technique
for hiding/retrieving data in compressed and decompressed video.
ISO/IEC document JTC1/SC29/WG11 MPEG97/M2281 (1997)
[6] Hsu, C., Wu, J.: Hidden digital watermarks in images. IEEE
Transactions on Image Processing 8 (1999) 58–68
[7] D. Nicholson, P.K., Delaigle, J.: Watermarking in mpeg4 context.
European Conference on Multimedia Application Services and
Techniques (1999) 472–492


[8] ISO: Information technology - coding of audio/video objects:video.
ISO/IEC 14486-2 (October 1998)
[9] ITU-T: Methodology for subjective assesment of the quality of
television pictures. Recommendation P.910 (1996)
[10] ITU-R: Subjective video quality assesment methods for multimedia
applications. Recommendation BT. 500-11 (1995)



×