Tải bản đầy đủ (.pdf) (76 trang)

Ứng dụng watermarking trong xây dựng hệ thống quản lý và bảo vệ bản quyền dữ liệu video tại đài truyền hình vĩnh long

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.48 MB, 76 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

HÀ NGỌC HẢI

ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG
HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU
VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG

LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - Năm 2017


ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

HÀ NGỌC HẢI

ỨNG DỤNG WATERMARKING TRONG XÂY DỰNG
HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU
VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG

Chuyên ngành : Khoa học máy tính
Mã số : 60.48.01.01

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: PGS. TS. Nguyễn Thanh Bình

Đà Nẵng - Năm 2017




i

LỜI CAM ĐOAN

Tơi cam đoan đây là cơng trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận văn là trung thực và chưa từng được ai cơng bố trong bất kỳ cơng trình
nào khác.

Tác giả luận văn

Hà Ngọc Hải


ii

TÓM TẮT LUẬN VĂN
ỨNG DỤNG WATERMARKING
TRONG XÂY DỰNG HỆ THỐNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN
DỮ LIỆU VIDEO TẠI ĐÀI TRUYỀN HÌNH VĨNH LONG
Hà Ngọc Hải - học viên cao học khóa 31, chun ngành Khoa học máy tính
Tóm tắt - Sự phát triển của internet băng thông rộng đang thúc đẩy mạnh mẽ sự phát triển
của công nghệ đa truyền thông Multimedia. Các nguồn dữ liệu multimedia như âm thanh, hình
ảnh, văn bản… có thể được truy cập và được phân phối nhanh hơn và rộng hơn. Xu thế này
mang lại nhiều lợi ích cho người sở hữu các sản phẩm multimedia, nhưng cũng thách thức
quyền sở hữu của chúng ta bởi vì hầu hết các dữ liệu multimedia được phân phối dưới các định
dạng không bảo mật. Hiện nay, việc sao chép và phân phối lại bất hợp pháp các sản phẩm
multimedia đang diễn ra liên tục khơng có kiểm sốt. Khi ra pháp luật, để phân xử quyền sở
hữu các sản phẩm multimedia là việc không dễ dàng nếu khơng có một cơ chế có thể đảm bảo

tính tồn vẹn chân thực quyền tác giả. Trong luận văn này chúng tôi xây dựng một hệ thống
quản lý và bảo vệ bản quyền video tại Đài THVL sử dụng watermarking thông qua các biến
đổi DWT – DCT. Hệ thống giúp kiểm sốt q trình truy cập các video của người dùng trong
mạng nội bộ, chèn watermark bản quyền vào video, và trích xuất ra khi cần thiết. Các kết quả
đạt được bước đầu và hướng phát triển tiếp theo của ứng dụng.
Từ khóa - Quản lý video; DWT; DCT; watermaking; bản quyền video; truyền hình Vĩnh
Long.

WATERMARKING APPLYING FOR BUILDING
VIDEO DATA COPYRIGHT MANAGING AND PROTECTING SYSTEM
AT VINH LONG TELEVISION STATION
Abstract - The development of the broadband internet has been boosting the development
of multimedia technology. The multimedia data resources such as audio, video, image and text
are able to be accessed and distributed faster and widely. This trend is beneficial for the owners
of multimedia products. However, there are challenges for copyright holder because most of
multimedia data files have been distributed in insecure formats. Currently, the illegal copying
and redistribution of multimedia products are taking place continuously without much control.
Meanwhile, the legal arbitration about copyright issues on multimedia products will be hard, if
we do not have an effective method of checking the integrity and accuracy of the copyright. In
this thesis, we have developed a system to manage and protect the video copyright at the Vinh
Long Television Station (VLTS) using watermarking base on DWT - DCT transformation. The
system is able to control the users’ process of accessing videos in the local area network,
inserting the copyright watermark of VLTS into videos, and extracting it when necessary. The
thesis also includes the initial result, and the future development of the application.
Key words - Video Management; DWT; DCT; watermarking; video copyright; Vinh Long
Television Station.


iii


MỤC LỤC
LỜI CAM ĐOAN .............................................................................................................i
TÓM TẮT LUẬN VĂN ................................................................................................ ii
MỤC LỤC ..................................................................................................................... iii
DANH MỤC CÁC TỪ VIẾT TẮT ................................................................................vi
DANH MỤC CÁC BẢNG ........................................................................................... vii
DANH MỤC CÁC HÌNH ........................................................................................... viii
MỞ ĐẦU .........................................................................................................................1
1. Lý do chọn đề tài ................................................................................................1
2. Mục đích và ý nghĩa đề tài ..................................................................................3
3. Mục tiêu và nhiệm vụ .........................................................................................4
4. Đối tượng và phạm vi nghiên cứu ......................................................................4
5. Bố cục luận văn...................................................................................................5
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT ................................................................................6
1.1. TỔNG QUAN VỀ TẬP TIN VIDEO ..................................................................... 6
1.1.1. Cấu trúc tập tin video chuẩn mpeg ............................................................... 6
1.1.2. Phép biến đổi DCT (Discrete Cosine Transform) ........................................ 8
1.1.3. Phép biến đổi DWT (Discrete Wavelet Transform) ................................... 10
1.1.4. Phép biến đổi DFT (Discrete Fourier Transform) ...................................... 14
1.2. MÔ HÌNH NHÚNG THÔNG TIN BẢN QUYỀN VÀO VIDEO ....................... 15
1.2.1. Giới thiệu chung về watermarking ............................................................. 15
1.2.2. Các tiêu chí cần có của một thuật tốn watermarking mạnh mẽ ................ 16
1.2.2.1. Tính bảo mật ........................................................................................16
1.2.2.2. Tính vơ hình ........................................................................................17
1.2.2.3. Tính vơ hình đối với thống kê .............................................................17
1.2.2.4. Tỉ lệ bit ................................................................................................17
1.2.2.5. Q trình dị đáng tin cậy ....................................................................17
1.2.2.6. Tính mạnh mẽ ......................................................................................17
1.2.2.7. Nhúng nhiều watermark ......................................................................18



iv

1.2.2.8. Blind/non-blind, public/private watermarking ....................................18
1.2.2.9. Watermarking đọc được và dò được ...................................................19
1.2.2.10. Tính khả đảo và tính thuận nghịch của watermark ...........................19
1.2.2.11. Tính có thể thay đổi tỉ lệ (scalability) ...............................................19
1.2.3. Mơ hình watermarking trên video .............................................................. 19
1.2.4. Kỹ thuật watermarking trên video sử dụng biến đổi DWT ........................ 20
1.2.4.1 Kỹ thuật watermarking của Mehul R và Priti R ...................................20
1.2.4.2 Kỹ thuật watermarking của Tao P. và Eskicioglu A. M ......................21
1.2.5 Watermarking trên video bằng biến đổi DWT – DCT ................................ 23
1.3. KẾT CHƯƠNG .................................................................................................... 25
CHƯƠNG 2. XÂY DỰNG ỨNG DỤNG QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN
VIDEO CHO ĐÀI THVL .............................................................................................26
2.1. MƠ TẢ BÀI TỐN VỀ QUẢN LÝ VÀ BẢO VỆ BẢN QUYỀN DỮ LIỆU
VIDEO TẠI ĐÀI PTTH VĨNH LONG ......................................................................... 26
2.2. LỰA CHỌN MƠ HÌNH ....................................................................................... 27
2.2.1. Các mơ hình quản lý bản quyền số ............................................................. 27
2.2.1.1. Kiến trúc chung ...................................................................................27
2.2.1.2. Kỹ thuật nhúng thông tin ẩn ................................................................29
2.2.1.3. Giải pháp của Microsoft ......................................................................30
2.2.2. Mơ hình đề xuất phù hợp với Đài THVL ................................................... 33
2.3. LỰA CHỌN KỸ THUẬT WATERMARKING .................................................. 34
2.3.1. Các hệ số DWT - DCT trong quá trình thực hiện watermarking ............... 34
2.3.2. Các kiểu tấn công dữ liệu trên tập tin video ............................................... 38
2.3.3. Yêu cầu với hệ thống video watermarking ............................................... 39
2.4. MƠ HÌNH QUẢN LÝ TẬP TIN VIDEO THEO DẠNG CLIENT – SERVER . 39
2.4.1. Thiết kế cơ sở dữ liệu ................................................................................. 39
2.4.2. Phân quyền người dùng .............................................................................. 43

2.4.3. Bảo mật hệ thống ........................................................................................ 43
2.4.4. Truyền tải tập tin trong mạng ..................................................................... 43
2.5. KẾT CHƯƠNG .................................................................................................... 44


v

CHƯƠNG 3. CÀI ĐẶT VÀ THỬ NGHIỆM ...............................................................45
3.1. MÔI TRƯỜNG CÀI ĐẶT ..................................................................................... 45
3.2. CÀI ĐẶT HỆ THỐNG ........................................................................................... 45
3.3. KẾT QUẢ THỬ NGHIỆM .................................................................................... 48
3.3.1. Đối với hệ thống quản lý video .................................................................. 48
3.3.2. Đối với công cụ watermarking ................................................................... 48
3.4. ĐÁNH GIÁ KẾT QUẢ ........................................................................................ 54
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN LUẬN VĂN ...............................................56
TÀI LIỆU THAM KHẢO .............................................................................................57
QUYẾT ĐỊNH GIAO ĐỀ TÀI.
BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC
PHẢN BIỆN.


vi

DANH MỤC CÁC TỪ VIẾT TẮT

DCT

Discrete Cosine Transform

Biến đổi consin rời rạc


IDCT

Inverse Discrete Cosine Transform

Biến đổi consin rời rạc nghịch

DWT

Discrete Wavelet Transform

Biến đổi wavelet rời rạc

HVS

Human Visual System

Hệ thống thị giác ở người

IDWT

Inverse Discrete Wavelet Transform

Biến đổi wavelet rời rạc nghịch

MSE

Mean Square Error

Sai lệch trung bình bình phương


PSNR

Peak Signal to Noise Ratio

Tỷ số tín hiệu đỉnh trên nhiễu

SVD

Singular Value Decomposition

Biến đổi giá trị số ít

LBS

Least significant bit

Bít ít quan trọng nhất

MAM

Media Asset Manager

Quản lý tài sản đa phương tiện

THVL

Truyền hình Vĩnh Long



vii

DANH MỤC CÁC BẢNG

Số hiệu

Tên bảng

bảng
3.1
3.2

MSE và PSNR giữa các frame ảnh gốc và frame đã
watermark
Kết quả trích xuất hình ảnh bản quyền sau các tấn công

Trang

52
53


viii

DANH MỤC CÁC HÌNH
Số hiệu
hình
1.1
1.2
1.3

1.4
1.5
1.6
1.7
1.8
1.9
2.1
2.2
2.3
2.4
2.5
2.6
2.7
2.8
2.9
2.10
2.11
2.12
3.1
3.2
3.3
3.4
3.5
3.6

Tên hình

Trang

Cấu trúc tập tin Mpeg

Ảnh gốc và năng lượng phân bố của ảnh qua phép biến
đổi DCT
Phân chia 3 miền tần số ảnh của phép biến đổi DCT
Lọc theo tần số thấp và tần số cao.
Q trình phân tích và tổng hợp tín hiệu
Biến đổi dwt hai mức
Phân loại watermarking
Mơ hình tổng qt watermark cho tập tin video
Sơ đồ giải thuật để nhúng watermark vào video
Kiến trúc hệ thống quản lý bản quyền số
Tiến trình watermarking
Mơ hình quản lý bản quyền số của Microsoft
Mơ hình sử dụng khóa trong license
Mơ hình client-server quản lý video phù hợp cho Đài
THVL
Công thức biến đổi qua lại giữa hệ màu RGB và YUV
Mặt phẳng màu U-V tại giá trị Y = 0.5, nằm trong phổ
màu RGB.
Giải thuật nhúng watermark cho video của Đài THVL
Giải thuật cải tiến nhúng watermark dành cho Đài
THVL
Sơ đồ cơ sở dữ liệu của MAM cho THVL (phần quản
trị)
Sơ đồ cơ sở dữ liệu của MAM cho THVL (phần hệ
thống)
Sơ đồ cơ sở dữ liệu của MAM cho THVL (phần video)
Giao diện đăng nhập vào hệ thống
Giao diện chính của hệ thống
Quá trỉnh tải video lên hệ thống
Nhập thông tin metadata vào tập tin video tải lên

Danh sách các tập tin video đã tải lên hệ thống
Cấu hình hệ thống địa chỉ máy server

8
9
10
11
12
12
16
19
23
27
29
30
32
34
34
35
35
35
40
41
42
45
46
46
47
47
48



ix

Số hiệu
hình
3.7
3.8
3.9

Tên hình
Watermark dùng để nhúng và watermark trích xuất
được
So sánh kết quả của ảnh gốc và ảnh sau khi được
watermarking
Ảnh watermark trích xuất với hệ số K=4

Trang
48
51
51


1

MỞ ĐẦU

1. LÝ DO CHỌN ĐỀ TÀI
Tháng 4/1977, Tỉnh Cửu Long ra quyết định xây dựng Đài Phát thanh Cửu Long,
phát sóng thử nghiệm từ 2/9/1977 trên sóng 950 Khz tức 315m. Năm 1984, Đài Phát

thanh Cửu Long đổi tên thành Đài PT-TH Cửu Long. Năm 1989, Đài lắp đặt 1 máy
phát thanh 10Kw, sóng phát thanh phủ sóng tồn tỉnh và các tỉnh lân cận. Năm 1992,
tách tỉnh Cửu Long thành 2 tỉnh Vĩnh Long và Trà Vinh, Đài đổi tên là Đài PT-TH
Vĩnh Long. Tháng 12/1993 Đài lắp đặt thêm máy pháp sóng cơng suất 250w trên kênh
12 VHF, xây dựng Trung tâm kỹ thuật truyền hình. Đài Phát thanh và Truyền hình
tỉnh Vĩnh Long là đơn vị sự nghiệp thuộc Ủy ban nhân dân tỉnh tỉnh Vĩnh Long, thực
hiện chức năng cơ quan báo chí của Đảng bộ, chính quyền và nhân dân tỉnh Vĩnh
Long. Từ đó đến nay, Đài Phát thanh và Truyền hình tỉnh Vĩnh Long ln nâng cao
chất lượng phát thanh và truyền hình, trở thành một trong những đài có chỉ có người
xem cao của khu vực và cả nước.
Trong các năm qua, Đài PTTH Vĩnh Long (THVL) luôn nỗ lực đổi mới nội dung
các chương trình phát thanh và truyền hình, mang lại cho khán thính giả những
chương trình hay và bổ ích. Ngồi các chương trình phim truyện nước ngồi, phim
truyện Việt Nam và các chương trình trị chơi truyền hình (games show) cũng được
đài đầu tư phát triển.
Cùng với sự phát triển của ngành công nghệ thông tin, Đài THVL thực hiện việc
chuyển đổi từ lưu trữ tương tự (analog) trên băng từ sang lưu trữ số dưới dạng các tập
tin video và audio trên các server để thuận tiện việc sao chép, xử lý và phát sóng.
Đài THVL phát triển website của đài tại địa chỉ www.thvl.vn thực hiện việc đưa
thông tin đến với nhiều người hơn thông qua internet. Tại đây, kênh tivi trực tuyến
cũng được phát song song với việc phát sóng truyền hình.
Nhận thấy được vai trị của internet trong việc đưa thơng tin đến với người dùng,
Đài THVL phát triển thêm kênh youtube để đưa các chương trình giải trí, gameshow,
phim truyện,… đã được phát sóng để khán giả trong và ngồi nước có thể xem lại tại
địa chỉ Kênh youtube của Đài nhận được
sự ủng hộ nhiệt tình của khán giả với hơn 975,163 lượt đăng ký theo dõi (Subscribe).
Tuy nhiên, việc tải lên internet các tập tin video không được bảo vệ một cách có
hiệu quả, khiến cho việc “đánh cắp” rất dễ dàng. Rất nhiều trang web đã lấy tín hiệu từ



2
kênh tivi trực tuyến của đài để phát lại, thu hút người xem. Một số tập tin trên kênh
youtube của đài đã bị sao chép, và phát tán lại công khai trên internet.
Tương tự như với kênh youtube, các video của Đài PTTH Vĩnh Long rất có khả
năng bị đánh cắp và phát tán bằng những hình thức khác. Vậy khi có tranh chấp bản
quyền tập tin video, thì đâu sẽ là bằng chứng để giải quyết tranh chấp? Do đó, vấn đề
đặt ra là, cần có một giải pháp bảo vệ hiệu quả bản quyền các tập tin video, trong
trường hợp cụ thể là các tập tin video của đài THVL. Giải pháp cần phải thêm được
thông tin bản quyền vào tập tin video dưới dạng ẩn, và khi cần thiết, có thể trích xuất
lại nội dung ẩn trong video đã được bảo vệ. Bên cạnh đó, cần có một công cụ quản lý
các tập tin video một cách tập trung, công cụ này dùng để xác thực những người dùng
nào được quyền truy xuất vào tập tin video được lưu trữ, nhằm hạn chế tối đa khả
năng đánh cắp video. Đây là nội dung chính được đề cập đến của quyển luận văn này.
Watermarking là một cách để bảo vệ quyền sở hữu các hình ảnh hoặc video số
thông qua các thông tin được nhúng vào bên trong chúng. Có thể chia watermarking
thành 2 loại: watermarking có thể nhìn thấy được (visible watermarking, non-blind
watermarking) và watermarking ẩn (invisible watermarking, blind watermarking)
Watermarking miền biến đổi sử dụng các phép biến đổi như DCT (Discrete
Cosine Transform), DFT (Discrete Fourier Transform), DWT (Discrete Wavelet
Transform) lên ảnh hoặc video số, bằng cách thay đổi các hệ số của các phép biến đổi,
thông tin có thể được nhúng vào đối tượng sau biến đổi.
Nén video là vấn đề tất yếu của các hệ thống truyền dẫn. Xu thế của các hệ thống
sử dụng multimedia là phải làm sao đạt được tỷ số nén video cao mà vẫn đảm bảo chất
lượng của hình ảnh sau khi khôi phục. MPEG là chuẩn nén ảnh động có tốc độ bit thấp
nhưng vẫn đảm bảo chất lượng yêu cầu. Chuẩn nén MPEG dành cho video hiện rất
phổ biến và trở nên thông dụng trong nhiều lĩnh vực sử dụng multimedia, đặc biệt là
phát thanh truyền hình. Hiện tại, MPEG-4 (AVC/ H.264) được sử dụng để nén tín hiệu
các kênh truyền hình độ nét cao HD (High Definition). Xa hơn nữa là chuẩn nén
HEVC/ H.265 đang được nghiên cứu và phát triển có thể giúp cải thiện 50% tốc độ bit
so với chuẩn H.264 với cùng chất lượng. Phương thức nén MPEG nói chung và chuẩn

H.264, H.265 nói riêng, thực hiện dựa trên biến đổi DWT để nén video.
Ngồi việc bảo vệ bằng watermarking, chúng ta cần có một công cụ quản lý tập
tin video một cách tập trung và có phân quyền truy cập để kiểm sốt tất cả các tập tin
video. Công cụ quản lý tập tin được thiết kế theo mơ hình client – server. Các máy
client được cung cấp một phần mềm giao tiếp với server. Phần mềm client cung cấp
cho người dùng các chức năng để thực hiện việc ingest tập tin video, tìm kiếm, trích
xuất tập tin video cần thiết sau khi người dùng đăng nhập với quyền tương ứng. Phần
mềm chạy trên máy server sẽ thực hiện việc kiểm tra đăng nhập của người dùng,


3
quyền truy xuất để đưa ra các chức năng tương ứng. Phần mềm chạy phía server kiêm
ln chức năng thêm watermarking vào tập tin video. Như vậy, với các video được
trích xuất từ hệ thống, sẽ được kiểm sốt bằng quyền truy cập của người dùng, và
watermarking ẩn khi có tranh chấp bản quyền.
Đứng trước yêu cầu quản lý và bảo vệ bản quyền dữ liệu video của Đài THVL,
đồng thời thấy được tầm quan trọng và hướng phát triển của các biến đổi đối với kỹ
thuật nén video, luận văn này tập trung vào nghiên cứu và xây dựng “Ứng dụng
watermarking trong xây dựng hệ thống quản lý và bảo vệ bản quyền dữ liệu
video tại Đài Truyền hình Vĩnh Long”

2. MỤC ĐÍCH VÀ Ý NGHĨA ĐỀ TÀI
2.1. Mục đích
Hiện tại, việc bảo vệ bản quyền video, hình ảnh, âm thanh của Đài THVL cịn
đơn giản, chưa có một biện pháp hữu hiệu để xác thực bản quyền. Việc chia sẻ hình
ảnh, video, audio của người dùng trên mạng internet hiện nay hết sức đơn giản và phổ
biến. Từ đó, đặt ra u cầu về thơng tin bản quyền tác giả của các hình ảnh, video, hay
audio này. Việc bảo vệ sẽ được nâng lên một mức khi các tập tin video được quản lý
tập trung, kiểm soát được người dùng nào được quyền truy xuất dữ liệu. Luận văn sẽ
đưa ra mơ hình và chạy mơ phỏng q trình nhúng thơng tin bản quyền vào đoạn video

được nén theo chuẩn MPEG, cùng với công cụ quản lý tập trung tập tin video theo mơ
hình clients – server. Áp dụng mơ hình đó để ghi thơng tin chủ sở hữu, và quản lý
người dùng, giúp bảo vệ bản quyền video của Đài THVL.

2.2. Ý nghĩa khoa học
Luận văn giúp hiểu rõ hơn về chuẩn nén video MPEG, phép biến đổi DWT cũng
như phương thức sử dụng các hệ số DWT vào kỹ thuật nhúng thông tin bản quyền vào
video. Từ đó, làm nền tảng áp dụng cho chuẩn nén video mới HECV/ H.265 đang
được phát triển.
Phương thức quản lý tập tin video tập trung và các vấn đề phát sinh như cân bằng
tải trong hệ thống mạng nội bộ, quá trình lập lịch chuyển đổi định dạng các tập tin
video để đảm bảo độ ổn định và tối ưu hóa sức mạnh của server.
Quản lý tập tin video địi hỏi thêm yêu cầu bảo mật thông tin từ việc xác định
người dùng hợp lệ, quá trình truyền tải tập tin trong mạng phải được tính tồn vẹn của
tập tin video, cũng như việc sao lưu và phục hồi hệ thống khi cần thiết.

2.3. Ý nghĩa thực tiễn
Kết quả mong muốn đạt được là một chương trình chạy theo mơ hình clients server dùng để nhúng thơng tin xác định bản quyền vào đoạn video sử dụng biến đổi


4
DWT, quản lý tập tin video, tìm kiếm, trả về kết quả,... Chương trình quản lý phải có
phân quyền người dùng một cách rõ ràng, tương ứng với mỗi người dùng sẽ có những
thao tác nhất định với tập tin video như chỉ được ingest, được tìm kiếm, được trích
xuất tập tin video,…Bên cạnh đó, có một chương trình để trích xuất thơng tin bản
quyền ra khỏi đoạn video và đối chiếu thông tin được nhúng ban đầu. Đây là giải pháp
hữu ích giúp bảo vệ bản quyền video của Đài PTTH Vĩnh Long khi có cách tranh chấp
bản quyền xảy ra.

3. MỤC TIÊU VÀ NHIỆM VỤ

3.1. Mục tiêu
- Nghiên cứu phương pháp nhúng dữ liệu vào tập tin video thơng qua biến đổi
DWT, DCT đồng thời trích xuất được dữ liệu đã nhúng vào khi cần thiết.
- Hiểu rõ cách thức nén tập tin video theo chuẩn mpeg.
- Mô hình clients – server, quản lý dữ liệu có dung lượng lớn là các tập tin video.
- Phân quyền người dùng, xác thực thông tin người dùng truy cập vào hệ thống.
- Lưu trữ tối ưu tập tin video, tạo bản sao tập tin video chất lượng thấp để dùng
làm preview khi người dùng tìm kiếm.
- Bảo mật hệ thống khi xác nhận thông tin người dùng đăng nhập.
- Bảo đảm tính tồn vẹn của tập tin video khi truyền tải trong mạng.

3.2. Nhiệm vụ
Để đạt được những mục tiêu trên thị nhiệm vụ đặt ra của đề tài là:
- Nghiên cứu về phép biến đổi DWT, và các phép biến đổi DCT, DFT để thấy
được phép biến đổi tối ưu hơn.
- Nghiên cứu cấu trúc tập tin video, cụ thể là tập tin mpeg 2.
- Xây dựng giải thuật và cài đặt mã nguồn để thực hiện nhúng thông tin vào tập
tin video.
- Thiết kế cơ sở dữ liệu tối ưu cho việc phân quyền của người dùng.
- Xây dựng giải thuật và cài đặt mã nguồn phần mềm clients – phần mềm server.
- Phân quyền người dùng, nhóm người dùng trong hệ thống.
- Tối ưu hóa tốc độ truyền tải tập tin qua mạng do đặc điểm tập tin video là tập
tin có dung lượng lớn.
- Tối ưu hóa dữ liệu metadata để phục vụ cho việc tìm kiếm tập tin video sau này.
- Đánh giá kết quả theo yêu cầu của đề tài.

4. ĐỐI TƯỢNG VÀ PHẠM VI NGHIÊN CỨU
Trong khuôn khổ của luận văn thuộc loại ứng dụng, tôi chỉ giới hạn nghiên cứu
các vấn đề sau:



5
- Phép biến đổi trên miền DWT, DCT.
- Cấu trúc tập tin mpeg 2.
- Công cụ mô phỏng nhúng thông tin và trích xuất thơng tin với tập tin video.
Luận văn sẽ tập trung nghiên cứu biến đổi DWT, DCT trong xử lý ảnh và đưa ra
phương pháp để đưa những thông tin bản quyền vào trong một đoạn video. Mơ hình sử
dụng cho luận văn cũng dựa vào mơ hình chung của kỹ thuật watermarking. Chương
trình sẽ gồm 2 thành phần: Nhúng watermarking và phát hiện, trích xuất
watermarking.
Như vậy, luận văn sẽ tập trung vào giải quyết vấn đề watermarking mà cụ thể là
các thông số của biến đổi DWT, DCT sao cho phù hợp với MPEG video nhằm đạt
được hiệu quả tốt.
Mơ hình clients – server quản lý dữ liệu tập trung, phân quyền người dùng.
Chương trình quản lý tập tin video thực hiện việc chuyển đổi video về một chuẩn
thống nhất được chọn lựa trước. Tập tin video nguồn từ nhiều định dạng khác nhau sẽ
được chuyển đổi sang định dạng “chuẩn”, đồng thời các dữ liệu metadata sẽ được
trong cơ sở dữ liệu để thực hiện việc tìm kiếm sau này. Dữ liệu metadata do người
dùng cung cấp thơng qua giao diện làm việc phía clients bao gồm: thể loại, tên tác
phẩm, diễn viên, thời lượng, tác giả, quay phim, đạo diễn, … Phía server sẽ thực hiện
việc chuyển mã các định dạng video từ các nguồn khác nhau về dạng nhất định
(trường hợp này là chuẩn mpeg 2), thêm watermarking, thực hiện các truy vấn của
người dùng, trả về kết quả, trả về tập tin video cho người dùng khi được yêu cầu.

5. BỐ CỤC LUẬN VĂN
Chương 1. Cơ sở lý thuyết. Chương này trình bày các cơ sở lý thuyết của các
phép biến đổi trên miền tần số, cũng như cấu trúc của tập tin video theo định dạng
MPEG, đây là cơ sở để thực hiện việc watermarking bảo vệ bản quyền video cho đài
THVL.
Chương 2. Xây dựng ứng dụng quản lý và bảo vệ bản quyền video cho đài

THVL. Chương này trình bày các mơ hình về bảo vệ bản quyền video, từ đó rút ra
một mơ hình thích hợp để xây dựng ứng dụng cho đài THVL. Lựa chọn cách thức
watermarking để bảo vệ bản quyền video.
Chương 3. Cài đặt và thử nghiệm. Chương này trình bày quá trình cài đặt và
thử nghiệm hệ thống; một số kết quả thực nghiệm và đánh giá.
Phần kết luận.


6

CHƯƠNG 1
CƠ SỞ LÝ THUYẾT
Để xây dựng ứng dụng bảo vệ bản quyền video cho Đài THVL, một số nội dung
lý thuyết cần được nghiên cứu, làm cơ sở cho việc cài đặt vào ứng dụng. Nội dung
chương này tập trung vào giới thiệu về cấu trúc tập tin chuẩn mpeg, các phép biến đổi
trong miền không gian DWT, DCT, DFT, và các giải thuật watermaking được áp
dụng.

1.1.

TỔNG QUAN VỀ TẬP TIN VIDEO

Trước khi máy tính trở nên phổ biến, phim ảnh được lưu trữ trên băng từ, chính
vì vậy rất hạn chế trong các thao tác chỉnh sửa, biên tập, hay sao chép. Sau khi máy
tính trở nên phổ biến, việc chuyển đổi cách thức lưu trữ được thực hiện nhằm mục
đích tiết kiệm thời gian và chi phí. Để chuyển đổi cách lưu trữ tuần tự sang dạng số
cần thiết phải có các định dạng chuẩn để lưu trữ hiệu quả, từ đó, nhiều định dạng tập
tin video lần lượt ra đời như mpeg, avi, wmv, mkv, …Đáng kể nhất phải kể đến chuẩn
nén mpeg do nhóm chuyên hình ảnh được thành lập từ tháng 2 năm 1988 Motion
Pictures Expert Group giới thiệu. Các định dạng được giới thiệu bao gồm MPEG-1,

MPEG-2, MPEG-3, và MPEG-4 (hay H.264).

1.1.1. Cấu trúc tập tin video chuẩn mpeg
Định dạng mpeg bao gồm 6 lớp [19].
• Lớp khối (block): gồm khối 8x8 các điểm ảnh tín hiệu chói và tín hiệu màu
dùng cho phương pháp nén DCT.
• Lớp tổ hợp cấu trúc khối (macroblock): một nhóm các khối tương ứng với
lượng thơng tin chứa đựng trong kích thước 16x16 điểm trên bức ảnh, lượng thông tin
chứa trong khối sẽ thay đổi tùy theo cấu trúc mẫu được sử dụng. Thông tin đầu tiên
trong cấu trúc khối mang dạng của nó và các vector bù chuyển động.
• Lớp cắt lát dịng bít (slice): Mảng bao gồm một và cấu trúc khối kề nhau. Kích
thước lớn nhất của mảng có thể bao gồm tồn bộ bức ảnh và kích thước nhỏ nhất của
mảng là một cấu trúc khối. Thông tin đầu tiên chứa đựng vị trí của mảng trong tồn bộ
ảnh, và hệ số cân bằng lượng tử…
• Lớp ảnh (picture): cho phép bộ giải mã xác định loại ảnh được mã hóa. Thơng
tin đầu dùng để chỉ thứ tự truyền khung (để bộ mã hóa có thể sắp xếp các ảnh lại theo
thứ tự đúng) và các thông tin về đồng bộ, độ phân giải và phạm vi vector chuyển động.
Trong nén MPEG người ta sử dụng 3 loại ảnh sau:


7
o Ảnh I (Intra Pictures): được mã hóa độc lập mà không cần tham khảo các
ảnh khác. Hiệu quả nén tín hiệu đạt được do loại bỏ được dư thừa về khơng gian
mà khơng có yếu tố thời gian tham gia vào quá trình. Ảnh I được dùng một cách
tuần hồn để tạo thành điểm tựa cho dịng dữ liệu trong quá trình giải mã.
o Ảnh P (Predicted Pictures): được mã hoá từ ảnh I hoặc ảnh P ngay trước
để bù chuyển động và chính nó cũng có thể dùng để tham khảo cho việc tiên
đoán ảnh tiếp theo. Mỗi khối ảnh trong ảnh P có thể được mã hóa theo kiểu tiên
đốn hoặc mã hóa một cách độc lập. Do sử dụng cả nén không gian và thời gian
nên hiệu quả nén của ảnh P cao hơn đáng kể so với ảnh I.

o Ảnh B (Bidirectionally Predictive Pictures) có thể sử dụng các ảnh I và P
phía trước và phía sau nó để bù chuyển động vì vậy cho tỷ lệ nén cao nhất. Mỗi
khối trong ảnh B có thể tiên đốn theo chiều ngược, xi, cả hai hướng hoặc
được mã hóa độc lập. Tuy nhiên để tiên đốn ngược từ một bức ảnh phía sau nó
thì bộ mã hóa phải sắp xếp lại các bức ảnh. Do vậy sẽ tạo ra độ trễ do phải sắp
xếp lại thông tin, độ trễ lớn hay nhỏ phụ thuộc vào số bức ảnh B liên tiếp nhau
được truyền.
• Lớp nhóm ảnh (GOP): các ảnh I, P, B thường xuất hiện theo một thứ tự lặp đi
lặp lại một cách tuần hoàn. Vì vậy xuất hiện nhóm ảnh GOP. Chất lượng ảnh không
chỉ phụ thuộc vào tỷ lệ nén trong từng khuôn hình mà cịn phụ thuộc vào độ dài của
nhóm ảnh GOP. Chúng là đơn vị mang thông tin độc lập của MPEG và bắt buộc phải
bắt đầu bằng một ảnh I. Tiếp sau đó là một loạt các ảnh P và B. Cấu trúc của một GOP
được mô tả bởi 2 tham số: N (số ảnh trong GOP) và M (khoảng cách giữa các ảnh P)
• Lớp dãy ảnh (sequence): đoạn video bao gồm thơng tin đầu, một số nhóm ảnh
và thông tin kết đoạn.
- Mỗi lớp này hỗ trợ một chức năng nhất định: một là chức năng xử lý tín hiệu
(DCT và bù chuyển động). Hai là chức năng logic (tái đồng bộ, điểm truy xuất ngẫu
nhiên).


8

Hình 1.1. Cấu trúc tập tin Mpeg
1.1.2. Phép biến đởi DCT (Discrete Cosine Transform)
Biến đổi Cosin rời rạc viết tắt là DCT (Discrete Cosine Transform) do Ahmed và
các đồng nghiệp của ơng đưa ra vào năm 1974. Từ đó cho đến nay, nó được sử dụng
rất phổ biến trong nhiều kỹ thuật xử lí ảnh số. Trong các kỹ thuật watermark ảnh dựa
trên phép biến đổi dữ liệu ảnh sang miền tần số thì phép biến đổi DCT được sử dụng
nhiều nhất.
Trong lĩnh vực xử lý ảnh số ta sử dụng biến đổi DCT 2 chiều có dạng như sau:


2
M

Yij

2
N

M 1N 1
i

X uv cos

j
u 0 v 0

(2u 1)i
(2v 1) j
cos
2M
2N

Với Yij là giá trị tại vị trí hàng i, cột j của ma trận DCT.

X uv

là giá trị tại hàng u, cột v của ma trận ảnh gốc X.

M, N là kích thước của ảnh gốc (M hàng, N cột).


i

1
:i 0
2
1: i 1, 2,..., M 1


9

j

1
:j 0
2
1: j 1, 2,..., N 1

Và biến đổi ngược của nó là:

X ij

2
M

2 M 1N 1
Nu 0v 0

u


Y cos

v uv

(2i 1)u
(2 j 1)v
cos
2M
2N

- Đặc điểm của phép biến đổi DCT trên ảnh hai chiều
Biến đổi DCT trên ảnh thể hiện đặc tính nội dung về tần số của thơng tin ảnh. Hệ
số góc trên là lớn và đặc trưng cho giá trị trung bình thành phần một chiều gọi là hệ số
DC, cịn các hệ số khác có giá trị nhỏ hơn biểu diễn cho các thành phần tần số cao theo
hướng ngang và theo hướng thẳng đứng gọi là các hệ số AC.

Hình 1.2. Ảnh gốc và năng lượng phân bố của ảnh qua phép biến đổi DCT
Bản thân biến đổi DCT không nén được dữ liệu.
Theo nguyên lý chung, khi biến đổi chi tiết giữa các điểm ảnh càng lớn theo
một hướng nào đó trong khối các điểm ảnh, hướng ngang, hướng thẳng đứng
hay theo đường chéo, thì tương ứng theo các hướng đó, các hệ số biến đổi
DCT cũng lớn.
Tóm lại, DCT làm giảm độ tương quan khơng gian của thơng tin trong khối ảnh.
Điều đó cho phép biểu diễn thích hợp ở miền DCT do các hệ số DCT có xu hướng có
phần dư thừa ít hơn.
Khối hệ số DCT có thể chia thành 3 miền, miền tần số thấp chứa các thông tin
quan trọng ảnh hưởng đến tri giác, miền tần số giữa, và miền tần số cao. Các thông tin
trong miền tần số cao thường mang tính trị giác thấp.



10

(a)

(b)

(c)

Hình 1.3. Phân chia 3 miền tần số ảnh của phép biến đổi DCT
(a) Miền tần số thấp, (b) Miền tần số ở giữa, (c) Miền tần số cao
Trong các thuật toán watermark, miền hệ số DCT tần số cao thường khơng được
sử dụng do nó thường khơng bền vững với các phép xử lí ảnh, hoặc nén ảnh JPEG.
Miền tần số thấp cũng ít được sử dụng do một sự thay đổi dù nhỏ trong miền này cũng
làm giảm chất lượng tri giác của ảnh. Vì vậy, miền tần số ở giữa thường hay được sử
dụng nhất và cũng cho kết quả tốt nhất.

1.1.3. Phép biến đổi DWT (Discrete Wavelet Transform)
Đây là phép biến đổi mới nhất áp dụng cho ảnh số. Ý tưởng của DWT cho tín
hiệu một chiều như sau: Tín hiệu được chia thành hai phần, phần tần số cao và phần
tần số thấp. Đối với nhiều tín hiệu, phần nội dung có tần số thấp chứa những thơng tin
quan trọng nhất - những đặc tính nhận dạng. Trái lại, phần nội dung có tần số cao chỉ
mang sắc thái của tín hiệu. Bởi vậy, trong biến đổi sóng nhỏ, người ta thường nói về
các phần gần đúng (approximations) và các phần tiểu tiết (details) của tín hiệu. Phần
gần đúng là những thành phần có tỷ lệ cao (highscale) nhưng có tần số thấp của tín
hiệu. Phần tiểu tiết là những thành phần có tỷ lệ thấp nhưng có tần số cao của tín hiệu.
Để tách một tín hiệu thành hai phần như trên, người ta dùng hai bộ lọc bù nhau.
Bộ lọc thứ nhất gọi là low-pass filter chỉ cho phép các thành phần có tần số thấp đi
qua. Bộ lọc thứ hai gọi là high-pass filter chỉ cho phép các thành phần có tần số cao đi
qua.
Quá trình lọc ở mức cơ bản nhất có dạng như sau.



11

Hình 1.4. Lọc theo tần số thấp và tần số cao.
Tín hiệu gốc S qua hai phép lọc được phân tích thành hai tín hiệu, A và D. Có
một điều cần lưu ý là, nếu chúng ta thực hiện quá trình này trên một tín hiệu số thực sự
thì sẽ thu được một số lượng dữ liệu gấp đôi số lượng ban đầu. Ví dụ, giả sử tín hiệu
gốc S gồm 1000 mẫu dữ liệu thì mỗi tín hiệu được lọc ra cũng sẽ gồm 1000 mẫu. Tổng
cộng sẽ có 2000 mẫu. Nhưng để đảm bảo có thể tổng hợp lại tín hiệu ban đầu, chúng ta
thực sự chỉ cần sử dụng một nửa số tín hiệu được lọc. Do đó, nên có một qui trình
giảm bớt một nửa số mẫu của A và D. Qui trình này được gọi là downsampling. Sau
khi giảm đi một nửa, chúng ta sẽ có hai tín hiệu tương ứng là cA và cD. Các dữ liệu
của cA và cD được gọi là các hệ số sóng nhỏ.
Tồn bộ hai q trình trên đây, lọc và cắt giảm mẫu được gọi là phân tích các tín
hiệu hoặc biến đổi sóng nhỏ rời rạc (DWT). Đó là q trình xi, cịn ngược lại phải
làm như thế nào để có thể lắp ghép các tín hiệu thu được thành tín hiệu gốc mà khơng
bị mất thơng tin. Quá trình này được gọi là tổng hợp các tín hiệu hoặc biến đổi sóng
nhỏ rời rạc ngược (IDWT).
Để tổng hợp tín hiệu, người ta sẽ tăng số mẫu lên gấp đơi, được gọi là
upsampling và sau đó lọc ngược trở lại. Các bộ lọc phân tích (L và H) và các bộ lọc
tổng hợp (L” và H”) cần phải được chọn lựa để thoả mãn một số điều kiện đảm bảo
cho q trình phân tích và tổng hợp là đồng nhất. Các bộ lọc này được gọi là đối xứng
gương trực giao (quadrature mirror filters). Quá trình phân tích và tổng hợp một tín
hiệu có thể được mơ tả như sau:


12

Hình 1.5. Q trình phân tích và tổng hợp tín hiệu

Trên đây chúng ta mới nói đến q trình phân tích các tín hiệu thành hai tín hiệu
xấp xỉ và chi tiết. Q trình này được gọi là phân tích một mức. Có thể lặp lại q trình
này bằng cách tiếp tục phân tích tín hiệu xấp xỉ thành hai tín hiệu ở giải tần thấp hơn.
Từ đây xuất hiện một khái niệm được gọi là phân tích nhiều mức.
Về mặt lý thuyết, q trình này có thể lặp lại vơ hạn. Tuy nhiên, trong thực tế,
việc phân tích chỉ có thể tiếp diễn cho đến khi phần chi tiết chỉ còn một mẫu hay một
điểm. Việc lựa chọn số mức phân tích hồn tồn phụ thuộc vào bản chất của tín hiệu.
Tương tự như các tín hiệu một chiều, các tín hiệu hai chiều (tức là các bức ảnh)
cũng có thể được phân tích tương tự bằng DWT nhưng theo cả hai chiều dọc và ngang.
Một bộ lọc tần số thấp và một bộ lọc tần số cao sẽ được sử dụng kết hợp để lọc các tín
hiệu. Đầu tiên, ảnh gốc sẽ được lọc thấp theo chiều dọc. Sau đó, nếu lọc lại bằng chính
bộ lọc này theo chiều ngang ta sẽ có băng LL và nếu lọc lại bằng bộ lọc cao ta sẽ có
băng LH. Tiếp theo, ảnh gốc sẽ được lọc cao theo chiều dọc và sau đó sẽ được lọc lại
theo chiều ngang bằng lọc thấp để có băng HL và bằng lọc cao để có băng HH.
Q trình trên lại có thể tiếp tục đối với băng LL để tạo ra phép biến đổi DWT
hai mức như minh hoạ trong hình dưới đây:

Hình 1.6. Biến đổi dwt hai mức


13
Về mặt tốn học, ta có thể tạo lại ảnh ban đầu bằng q trình DWT ngược hay
IDWT.
Ta có thể mơ tả bằng tốn học DWT và IDWT như sau:
DWTf (m, n) a0 m/2

f (t )

f (t )


m,n
m

*

(a0 mt nb0 )dt

,f

m,n

(t )

n

Đặt
H( )

hk e

jkw

gk e

jkw

k


G( )

k

Là lọc thông thấp và lọc thông cao tương ứng, mà thỏa mãn một vài điều kiện
cho việc tái xây dựng ảnh ban đầu. Một tín hiệu F(n) có thể được phân tích đệ quy như
sau:

fi low
1 (k )

hn

2k

f j (n)

n



fi high
1 (k )

gn

2k

f j (n)

n


Với j-J+1,J,…,Jo với fj+1(k)=F(j), k ∈ Z, J+1 là chỉ số mức phân giải cao còn J0 là
chỉ số mức phân giải thấp.
ℎ𝑖𝑔ℎ

Các hệ số 𝑓𝑗𝑙𝑜𝑤
0 (𝑘 ), 𝑓 0
𝑗
của tín hiệu F(n), với
ℎ𝑖𝑔ℎ

𝑓𝑗 0

ℎ𝑖𝑔ℎ
ℎ𝑖𝑔ℎ
(𝑘 ), 𝑓𝑗𝑙𝑜𝑤
(𝑘 ) được gọi là các dwt
0+1 (𝑘 ), 𝑓 0+1 (𝑘 ), … , 𝑓
𝑗

𝑓𝑗𝑙𝑜𝑤
0 (𝑘 )

𝑗

là phần phân giải nhỏ nhất (xấp xỉ) của F(n) và

(𝑘 ) là phần chi tiết của F(n) tại các dãi tần khác nhau.

Tín hiệu ban đầu F(n) có thể được xây dựng lại từ các hệ số DWT bằng cách đệ
quy như sau:



14

f jlow (n)

hn

2k

k

f jk1

gn

2k

f jhigh
(k )
1

k

Để đảm bảo quan hệ giữa DWT và IDWT thì H(𝜔) và G(𝜔) phải thỏa mãn điều
kiện trực giao sau H ( )

2

G( )


2

1

Một ví dụ như thế về H ( ) và G ( ) là
1

1

2

2

𝐻 (𝜔) = + 𝑒 −𝑗𝜔

1

1

2

2

𝐺 (𝜔) = + 𝑒 −𝑗𝜔
Ví dụ trên là bộ lọc wavelet của Haar. Các bộ lọc khác được dùng trong xử lý
ảnh là học các bộ lọc trực giao Daubechies (D-4, D-6, D-8, D-10, D-12) và các bộ lọc
bi-orthogonal (B-5/3, B-7/9).
Biến đổi DWT và IDWT cho mảng hai chiều MxN có thể được định nghĩa tương
tự bằng cách thực hiện các biến đổi một chiều DWT và IDWT cho mỗi chiều tương

ứng. Biến đổi sóng có rất nhiều lợi thế so với các biến đổi khác, đó chính là:
- Biến đổi sóng lăn là một mô tả đa độ phân giải của ảnh. Q trình giải mã có
thể được xử lý tuần tự từ độ phân giải thấp cho đến độ phân giải cao.
- Biến đổi DWT gần gũi với hệ thống thị giác người hơn biến đổi DCT vì vậy, có
thể nén với tỉ lệ cao bằng DWT mà sự biến đổi ảnh khó nhận thấy hơn nếu dùng DCT
với tỉ lệ tương tự.
Biến đổi sóng tạo ra một cấu trúc được gọi là biểu diễn tỉ lệ không gian (scalespace representation). Trong biểu diễn này, các tín hiệu tần số cao được xác định chính
xác trong miền điểm ảnh (pixel), cịn các tín hiệu tần số thấp được xác định chính xác
trong miền tần số.

1.1.4. Phép biến đổi DFT (Discrete Fourier Transform)
Phép biến đổi Fourier rời rạc viết tắt là DFT (Discrete Fourier Transform) là một
cơng cụ tốn học được dùng để chuyển cách biểu diễn tín hiệu và hệ thống rời rạc hoặc
liên tục sang miền tần số rời rạc. Thực chất của cách biểu diễn này là lấy từng điểm rời
rạc trên vòng tròn đơn vị trong mặt phẳng Z để biểu diễn. Việc biểu diễn trong miền
tần số rời rạc đặc biệt hiệu quả khi xuất hiện các thuật tốn tính tốn nhanh DFT ta gọi
là phép biến đổi Fourier nhanh FFT (Fast Fourier Transform).
Biểu diễn dưới dạng tốn học bằng cơng thức sau


×