Tải bản đầy đủ (.pdf) (63 trang)

Nghiên cứu kỹ thuật thủy văn trong âm thanh số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.73 MB, 63 trang )

CHƢƠNG 1
TỔNG QUAN VỀ KỸ THUẬT GIẤU TIN VÀ THỦY VÂN
Chương này trình bày những khái niệm cơ bản liên quan đến giấu tin nói
chung, phân loại các kỹ thuật giấu tin, mục đích của giấu tin, các đặc tính của âm
thanh, âm thanh số và quy trình giấu, tách tin trong âm thanh.
1.1.Khái niệm về giấu tin
Giấu tin là phương pháp nhúng hoặc làm ẩn thông tin trong một đối tượng
thông tin khác. Đây là phương pháp hiện đang được ứng dụng rộng rãi và đem lại
hiệu quả thiết thực trong các ngành như: côngnghiệp phần mềm, âm nhạc, phim
ảnh, sách báo...
Ý tưởng che giấu thông tin để truyền đi được con người nghĩ ra và sử dụng
từ hàngnghìn năm trước đây. Có nhiều câu chuyện lịch sử đề cập đến kỹ thuật giấu
tin được lưu truyền. Sớm nhất liên quan về vấn đề này, có lẽ là các ghi chép được
tìm thấy là của sử gia Herodotus, chép lại những câu chuyện từ thời Hy Lạp cổ.
Một trong số ghi chép đó vào năm 440 trước Công nguyên kể về bạo chúa
Histaiacus bị vua Darius bắt và giam giữ cẩn mật. Để có thể liên lạc với con rể là
Aristagoras ở Miletus, ông đã cạo đầu một sứ giả tin cậy và xăm trên da đầu của
người đó một thông điệp thúc giục con rể nổi dậy chống lại nhà vua. Đến khi tóc
của người sử giả mọc ra đủ dài để che hình xăm thì anh ta được gửi tới nơi cần
đến.
Một câu chuyện khác do Herodotus ghi lại về thời Hy Lạp cổ đại.
Demeratus, một người Hy Lạp, cần thông báo cho Sparta rằng Xerxes có ý định
xâm chiếm Hy Lạp. Để tránh bị phát hiện, Demeratus đã bóc lớp sáp ra khỏi các
viên thuốc và khắc thông báo lên bề mặt các viên thuốc này, sau đó bọc lại viên
thuốc đó bằng lớp sáp mới. Những viên thuốc này đã được ngụy trang cùng với các
viên thuốc khác vượt qua sự kiểm soát của quân đội Xerxes một cách dễ dàng.
Thờikỳnày, các kỹ thuật giấu tin được áp dụng chủ yếuđể truyền thông tin bí
mật trong chiến tranh và một sốít trong các lĩnh vực khác.

1



Sau này, với sự phát triển của kỹ thuật, chữ viết với kích cỡ nhỏ được sử
dụngđemgiấu trong các vật dụng thông thường để gửi đi, hoặc gắn vào chim bồ
câu để gửi thông tin nhằm tránh sự phát hiện. Đến thế kỷ 17, người gửi sử dụng
phương phápmã hóacác ký tự cần giấu trên nội dung của một văn bản, một quyển
sách hoặc một nội dung có chủ định nào đó rồi thực hiệngửi tới người nhận. Tiếp
theo đó, với sự phát triểncủa mực không màu - là một sản phẩm dạng chất lỏng
không màu, chỉ hiển thị rõ màukhi có phản ứng lý hóa phù hợp. Ngày nay, do xuất
hiện phương pháp kiểm tra độ ẩm bề mặt nên mực không màu không còn nhiều tác
dụng trong giấu tin nữa, tuy vậy, mực không màu vẫn được sử dụng cho các chi
tiết phát quang khi bị chiếu tia cực tím.Vi phim là bước phát triển tiếp theo trong
giai đoạn ở nửa cuối thế kỉ 19.Với sản phẩm này được các thợ ảnh chuyên nghiệp
thực hiện thì kích cỡ của mỗi thông điệp cần giấu chỉ bằng dấu chấm nhỏ.
Trong văn viết, giấu thông tin cũng được sử dụng bằng cách chọn theo quy
luật nào đó,chẳng hạn như dựa theo tần suất xuất hiện các từ hoặc các chữ cái.
Bằng cáchkhác,người Trung Hoa trước kia cũng sử dụng rất nhiều là dùng một tờ
giấy mẫu có đục các lỗ làm mặt nạ để viết trước các nội dung cần giấu tại các vị trí
đục lỗ, sau đó viết tiếp theo các nội dung vô hại khác lên sau. Với phương pháp
này, người Trung Hoa đãthực hiện khai thác đặc điểmvề tính chất tượng hình và
các từ đồng âm khác nghĩa khác nhau trong chữ Hán.
Gầnđây, Uỷ ban di sản văn hóa quốc gia Italia đã công bố một thông tin làm
xôn xao dư luận và gây tranh luận nhiều trong giớikhoa học về bức họa nổi tiếng
có nụ cười bíẩn của nàng MonaLisa. Khi các sử gia dùng kính lúp cóđộ phóngđại
cao soi bức tranh nguyên gốc hiệnđang trưng bàyở bảo tàng Louvre nước Pháp , họ
cho rằngđã tìm thấy những ký tự và con số nhỏ xíu trong đôi mắt nàng. Có thể,
một thiên tài như Leonardo Da Vinci trong khi vẽ tác phẩm này đã bí mật truyền đi
một thông điệp nào đó mà hiện nay các nhà nghiên cứu vẫn chưa giải mãđược.
Nếu nhưquá trình lịch sử của thời kỳđầu cho thấy, giấu tin thườngáp dụngđể
truyền thông tin mật thì ngày nay, với sựphát triển củacông nghệ thông tin đã
dẫnđến việc cáckỹ thuật giấu tin (chủ yếu là thủy vân số) ứng dụng trong bảo


2


vệsản phẩm văn hóa dạngkỹ thuật số ngày càng gia tăng. Cho đến nay, đã có nhiều
bài báo vànhiều công trình nghiên cứu khoa học khác nhau đề cậpđến vấn đề này.
Giấu tin có một ưu điểm mà mật mã học (Cryptography) còn hạn chế đó là
có thể “bảo vệ được bản quyền số, hay khi giữa các đối tượng liên lạc mật với nhau
trên các kênh thông tin công cộng mà ít bị nghi ngờ”. Lý do vì bản quyền số đã mã
hóa sau khi được giải mã thì khó có thể giữ được bản quyền, hay thông tin mật cần
trao đổi giữa các bên, sau khi được mã hóa sẽ làm cho người khác biết rõ là các
bên có trao đổi thông tin mật nào đó cho nhau. Giấu tin trong dữ liệu đa phương
tiện chính là những bổ sung cho các vấn đề trên của mật mã học.
Giấu thông tin trong audio dựa vào hệ thống thính giác của con người nên
thường khó hơn trong các dữ liệu số khác do hệ thống thính giác của con người
khá nhạy cảm với các nhiễu, tuy nhiên audio cũng là loại dữ liệu được sử dụng khá
phổ biến trên internet hiện nay vì vậy nó vẫn được quan tâm, nghiên cứu rộng rãi
cho nhiều mục đích khác nhau: bảo vệ bản quyền, chống sao chép, xuyên tạc nội
dung...
Trong các năm 1990 và 1993, Tanaka, Caronni và Tirkel lần lượt đưa ra
những ấn bản đầu tiên về thủy vânnhưng chưa nhận được sự quan tâm đúng mức
của các nhà nghiên cứu. Đến năm 1995, chủ đề này mới bắt đầu được quan tâm và
từ đó thủy vân đã phát triển tốc độ nhanh cùng với nhiều hướng nghiên cứu và
phương pháp thực hiện khác nhau. Thủy vân đã được ứng dụng trong nhiều lĩnh
vực khác nhau như bảo vệ quyền sở hữu, xác thực giấy tờ, đảm bảo tính toàn vẹn
hay truyền đạt các thông tin khác,… Trong đó, ứng dụng phổ biến là cung cấp
bằng chứng về bản quyền tác giả của các dữ liệu số bằng cách nhúng các thông tin
liên quan đến bản quyền và đảm bảo tính toàn vẹn của dữ liệu giấu.
Ý tưởng cơ bản của thủy vân là thêm tín hiệu thủy vân vào dữ liệu gốc để
được thủy vân hóa một cách kín đáo và an toàn trong hỗn hợp tín hiệu, nhưng có

thể khôi phục lại một phần hoặc toàn phần từ hỗn hợp tín hiệu nếu khóa mật mã an
toàn được sử dụng.

3


Để đảm bảo việc không thể nhận thấy được của sự thay đổi gây ra bởi việc
nhúng thủy vân, người ta sử dụng một số loại tiêu chuẩn về khả năng cảm nhận.
Việc làm này có thể công khai hoặc kín đáo với dữ liệu gốc. Do yêu cầu của chất
lượng cảm nhận, từng mẫu đơn lẻ (ví dụ điểm ảnh hay các hệ số biến đổi) liên
quan tới nhúng thủy vân có thể được thay đổi bởi một số lượng biên độ nhỏ hoặc
trung bình.
Để đảm bảo tính bền vững bất chấp những thay đổi nhỏ, người ta thường
phân phối các thông tin thủy vân dư thừa trên nhiều mẫu (ví dụ: các điểm ảnh) của
dữ liệu gốc. Do đó, việc khôi phục sẽ bền vững hơn nếu có nhiều dữ liệu được thủy
vân để khôi phục.
Nói chung, hệ thống thủy vân sử dụng một hoặc nhiều khóa mã hóa an toàn
để đảm bảo an ninh nhằm chống lại các thao tác xóa hoặc vô hiệu hóa thủy vân.
Có 3 vấn đề chính cho việc thiết kế một hệ thống thủy vân[8]:
Vấn đề 1: Thiết lập một tín hiệu thủy vân W để được thêm vào tín hiệu gốc.
Thông thường, tín hiệu thủy vân phụ thuộc vào một khóa K và thông tin thủy vân I
trong đó mà nó được nhúng:
W=f0(I, K)

(1.1)

Vấn đề 2: Thiết lập phương pháp nhúng tự kết hợp tín hiệu thủy vân W vào
trong dữ liệu gốc X tạo thành dữ liệu thủy vân Y:
Y=f1(X, W)


(1.2)

Vấn đề 3: Thiết lập phương pháp trích chọn để khôi phục thông tin thủy vân
từ hỗn hợp tín hiệu sử dụng khóa và với sự hỗ trợ của dữ liệu gốc:
I=g(X,Y, K)

(1.3)

Hoặc không có dữ liệu gốc:
I=g(Y, K)

(1.4)

Trong hai vấn đề đầu tiên, thiết lập tín hiệu thủy vân và nhúng tín hiệu thủy
vân thường được coi là một, đặc biệt khi thủy vân nhúng có khả năng tương thích
với tín hiệu gốc.

4


1.2.Phân loại các kỹ thuật giấu thông tin [18]
Hiện nay, giấu thông tin có nhiều cách để phân loạivới các tiêu chí khác
nhau như: phân loại theo phương tiện chứa tin hoặcphân loại theo các phương pháp
tương tác lên phương tiện chứa tin hay phân loại dựa theo các mục đích sử dụng.
1.2.1. Phân loại giấu thông tin theo phương tiện chứa tin
1.2.1.1. Giấu thông tin trong ảnh
Giấu thông tin trong ảnh số là một phần của khái niệm giấu thông tin với
việc sử dụng ảnh số làm phương tiện chứa, bản chất là việc giấu các mẩu tin cũng
là dạng số vào các ảnh nhị phân sau cho không bị phát hiện. Hiện nay, giấu thông
tin trong ảnh là phương pháp chiếm tỷ lệ lớn nhất hệ thống giấu tin trong đa

phương tiện.Điều này là bởi lẽ lượng thông tin được trao đổi trong hình ảnh là rất
lớn và hơn nữa đóng vai trò hết sức quan trọng trong các ứng dụng an toàn thông
tin như: xác thực thông tin, bảo vệ bản quyền tác giả, điều khiển truy cập và
phát hiện xuyên tạc thông tin. Chính vì thế mà nội dung này đã nhận được
nhiều sự quan tâm của các nhà nghiên cứu.
Ngày nay, với sự phát triển mạnh mẽ của công nghệ,trong đó có ảnh số, thì
giấu thông tin trong ảnh đã mang lại nhiều ứng dụng trong cuộc sống. Chẳng hạn,
trong một số ứng dụng về nhận dạng thông qua thẻ chứng minh thư, hộ chiếu...,
việc giấu thông tin trên các ảnh thẻ để xác thực thông tin cũng được sử dụng rộng
rãi. Thông tin trong ảnh số được giấu một cách “vô hình”, do vậy với cách thức
truyền thông tin theo phương pháp này thì ngoài người gửi và người nhận, người
ngoài không thể biết được, bởi sau khi giấu thông tin thì chất lượng ảnh gần như
không thay đổi, đặc biệt đối với ảnh màu hay ảnh xám.
1.2.1.2. Giấu tin trong audio
Đây là phương pháp giấu tincó những đặc điểm khác biệt với giấu thông tin
trong các đối tượng dữ liệu đa phương tiện khác. Đảm bảo tính chất ẩn của thông
tin được giấu, đồng thời không làm ảnh hưởng đến chất lượng nghe của dữ liệu
gốc là yêu cầu quan trọng nhất của giấu tin trong audio. Nếu như kỹ thuật giấu tin
trong ảnh phụ thuộc vào khả năng nhận diện từ hệ thống thị giác - HVS (Human

5


Vision System), thìkỹ thuật giấu tin trong audio lại phụ thuộc vào khả năng cảm
nhận từ hệ thống thính giác của con người - HAS (Human Auditory System). Bên
cạnh đó, hệ thống thính giác của con người chỉ có thể nghe được các tín hiệu ở các
giải tần rộng và công suất lớn nên đã gây khó khăn đối với các phương pháp giấu
tin trong audio. Tuy vậy, hệ thống thính giác của con người lại khó có thể cảm
nhận được trong việc phát hiện sự khác biệt giữa các dải tần và công suất. Do đó,
vớicác âm thanh nhỏ, tần số thấp sẽ có thể được che giấu bởi các âm thanh lớn,tần

số cao. Thông qua các phân tích khi nghiên cứu đã chỉ ra các đặc điểm trên và
thông tin này sẽ hữu ích cho việcchọn lựa các audio thích hợp khi thực hiện giấu
tin. Kênh truyền tin cũng là khó khăn tiếp theo đối với kỹ thuật giấu thông tin
trong audio. Nếu kênh truyền tốc độchậm sẽ ảnh hưởng đến chất lượng thông tin
sau khi thực hiện giấu. Chẳng hạn,với đoạn mã java applet, để nhúng vào một đoạn
audio (16 bit, 44.100 Hz) thì các yêu cầu nói chung cần tốc độ truyềntối thiểu là 20
bit/s. Giấu thông tin trong audio đòi hỏi yêu cầu rất cao về tính đồng bộ và tính an
toàn của thông tin. Các phương pháp giấu thông tin trong audio đều lợi dụng điểm
yếu trong hệ thống thính giác của con người.
1.2.1.3.Giấu thông tin trong video
Cũng giống như giấu thông tin trong ảnh hay trong audio, giấu tin trong
video cũng được quan tâm và được phát triển mạnh mẽ cho nhiều ứng dụng như
điều khiển truy cập thông tin, nhận thực thông tin và bảo vệ bản quyền tác giả. Ta
có thể lấy một ví dụ là các hệ thống chương trình trả tiền xem theo video clip (pay
per view application). Các thuật toán trước đây thường cho phép giấu ảnh vào
trong video, nhưng gần đây kỹ thuật cho phép giấu cả âm thanh và hình ảnh vào
video.
Thủy vân số và giấu tin mật là haiphương pháp giấu tin trong video được
phát triển khá mạnh mẽ. Cox đưa ra phương pháp giấu tin trong video sử dụng
phương pháp phân bố đều. Về cơ bản, ý tưởng của phương pháp nàylà thông tin
giấu được phân phối dàn trải theo tần số của dữ liệu gốc. Sử dụng các hàm cosin
riêng và các hệ số truyền sóng riêng để giấu tin là cách nhiều nhà nghiên cứu ứng

6


dụng. Ban đầu, trong các thuật toán, thường các kỹ thuật mới chỉ thực hiện được
giấu các ảnh vào trong video, nhưng hiện nay, với sự phát triển của kỹ thuật đã cho
phép giấu cả âm thanh và hình ảnh vào trong video. Như phương pháp của
Swanson đã sử dụng phương pháp giấu theo khối, phương pháp này đã giấu được

hai bit vào khối 8*8. Hay gần đây nhất là phương pháp của Mukherjee là kỹ thuật
giấu audio vào video sử dụng cấu trúc lưới đa chiều...
Giấu tin là một công nghệ mới rất phức tạp, đang được tập trung nghiên cứu
ở nhiều nước trên thế giới như Đức, Mỹ, Italia, Canada, Nhật Bản... Những kết quả
thực nghiệm cho thấy cần phải có thêm thời gian để nghiên cứu thẩm định.Mặc dù
vậy, các nhà nghiên cứu khẳng định rằng đây là một công nghệ mới đầy hứa hẹn
cho vấn đề bảo mật và an toàn thông tin.
1.2.1.4. Giấu thông tin trong văn bản dạng text
Giấu thông tin vào các văn bản dạng text khó thực hiện hơn do có ít các
thông tin dư thừa, để làm được điều này người ta phải khéo léo khai thác các dư
thừa tự nhiên của ngôn ngữ. Một cách khác là tận dụng các định dạng văn bản (mã
hóa thông tin và khoảng cách giữa các từ hay các dòng văn bản). Từ nội dung của
thông điệp cần truyền đi, người ta cũng có thể sử dụng văn phạm phi ngữ cảnh để
tạo nên các văn bản “phương tiện chứa” rồi truyền đi.
1.2.2. Phân loại giấu thông tin theo cách thức tác động lên các phương tiện
1.2.2.1.Phương pháp chèn dữ liệu
Phương pháp này tìm các vị trí trong tệp (file) dễ bị bỏ qua và chèn các dữ
liệu cần giấu vào đó, cách giấu này không làm ảnh hưởng gì tới sự thể hiện của các
file dữ liệu ví dụ như dữ liệu được giấu sau các ký tự EOF (End of file).
1.2.2.2. Phương pháp thay thế
Thực hiện việc thay thế các phần tử không quan trọng của phương tiện chứa
bằng các dữ liệu của thông điệp cần chuyển đi. Vì thay thế vào các phần tử không
quan trọng của phương tiện chứa nên dễ đánh lừa được cảm nhận của con người.
Phương pháp thay thế có nhiều cách thực hiện như: thay thế các bit ít quan trọng,
thay thế trong miền tần số, các kỹ thuật trải phổ, thống kê.

7


1.2.2.3. Phương pháp tạo các phương tiện chứa

Xuất phát từ các thông điệp cần được chuyển, sẽ tạo ra các phương tiện chứa
phục vụ cho việc truyền thông tin đó. Ở phía người nhận, sẽ dựa trên các phương
tiện chứa này để tái tạo lại các thông điệp đã giấu.
1.2.3. Phân loại giấu thông tin theo các mục đích sử dụng
1.2.3.1.Giấu thông tin bí mật
Từ trước đến nay, giấu thông tin bí mật là ứng dụng phổ biến nhất. Đối với
giấu thông tin bí mật người ta quan tâm chủ yếu tới các vấn đề sau:
+ Tính an toàn của thông điệp hay nói cách khác là khả năng không bị phát
hiện của tin giấu.
+ Lượng thông tin tối đa có thể giấu trong một phương tiện chứa cụ thể mà
vẫn đảm bảo an toàn.
+ Độ bí mật của thông tin trong trường hợp giấu tin bị phát hiện.
Yêu cầu về tính bền vững của phương tiện chứa không phải là yếu tố quan
trọng đối với giấu thông tin bí mật, đơn giản là bởi có thể thực hiện việc gửi và
nhận nhiều lần phương tiện chứa đã được giấu tin.
1.2.3.2. Giấu thông tin thủy vân
Xuất phát từnhu cầu bảo vệ bản quyền, xác thực và chống xuyên tạc thông
tin... nên giấu tin thủy vân có yêu cầu khác với giấu tin bí mật. Yêu cầu đầu tiên là
các dấu hiệu thủy vân phải đủ bền vững trước các tấn công vô tìnhhay cố ý gỡ bỏ
nó. Cùng với đó, các dấu hiệu thủy vân phải có ảnh hưởng tối thiểu về mặt cảm
nhận đối với các phương tiện chứa. Do vậy lượng thông tin cần giấu càng nhỏ càng
tốt.
Tùy theo từng trường hợp cụ thể, che giấu thông tin nói chung có rất nhiều
ứng dụng. Đối với việc bảo mật thông tin, giấu thông tin bí mật là sự bổ sung lý
tưởng, góp phần thực hiện “tàng hình” các phiên liên lạc.
Phân biệt giấu thông tin mật và thủy vân có thể mô tả tóm lược trong các
bảng 1.1 sau [18]:
Bảng 1.1. So sánh sự khác biệt giữa giấu tin mật và thủy vân số

8



Mục tiêu

Giấu thông tin mật

Thủy vân số

(Steganography)

(Watermark)

Tàng hình các phiên liên lạc, để

Chủ yếu phục vụ cho mục đích bảo vệ bản

bảo mật thông tin

quyền

Dùng trong các liên lạc xác định

Chủ yếu dùng trong các hoạt động xuất bản

Cách thực

Không làm “thay đổi” phương

Có thể tác động nhỏ về cảm nhận tới


hiện

tiện chứa

phương tiện chứa

Yêu cầu

Giấu được nhiều thông tin nhất

Chỉ cần nhúng ít dữ liệu

Không cần quan tâm tới độ bền

Dữ liệu nhúng cần phải mạnh

của phương tiện chứa

Đảm bảo trước các phương pháp nén dữ liệu

Không thể quan sát được việc

Dữ liệu nhúng có thể nhận thấy hay không

giấu thông tin

nhận thấy

Không kiểm tra được nếu không


Không kiểm tra được nếu không có khoá

có khoá thích hợp

thích hợp.

Information Hiding (giấu thông tin)

Steganography (giấu tin mật)

Watermarking (thủy vân số)

Robust copyright marking
(Thủy vân bền vững)

Imperceptible watermarking
(thủy vân ẩn)

Fragile Watermarking
(Thủy vân “dễ vỡ”)

Visible Watermarking
(thủy vân hiển)

Hình 1.1. Sơ đồ phân loại giấu tin
được Fabien A.P.Petitcolas đề xuất năm 1999 [18].
1.3. Mục đích của giấu tin [18]
Tùy theo từng trường hợp, có khá nhiều ứng dụng liên quan đến che giấu
thông tin nói chung. Việc thực hiện “tàng hình” các phiên liên lạc trong giấu thông
9



tin bí mật là một bổ sung hoàn hảo cho công tác bảo mật thông tin. Dưới đây là
một số ứng dụng đang được triển khai trên thế giới:
- Thực hiện bảo vệ bản quyền tác giả (copyright protection): Với mỗi thông
tinmang ý nghĩa xác thực quyền sở hữu tác giả (hay còn gọi là thủy vân) sẽ được
giấu vào trong các đối tượng dữ liệu đa phương tiện và chỉngười sở hữu hợp pháp
các sản phẩm đó có thủy vân và được dùng làm minh chứng cho bản quyền sản
phẩm của mình. Chẳng hạn, có một sản phẩm dữ liệu dạng đa phương tiện như một
bức ảnh, một tệp âm thanh hoặc video cần được lưu trên mạng. Dán tem bản quyền
là cách để bảo vệ các sản phẩm sở hữu đó tránh các hành vi lấy cắp hoặc bị làm
giả. Việc dán tem bản quyền chính là thực hiện “nhúng” thủy vân, với mục đích
làđể đảm bảo hạn chế tối đa các ảnh hưởng lớn đến chất lượng sản phẩm. Một yêu
cầu quan trọng đối với các sản phẩm là tính bền vữngcủa thủy vân trước các tấn
công cùng với sản phẩm đó.
- Xác thực thông tin hay phát hiện xuyên tạc thông tin (authentication and
tamper detection): Việc nhận biết dữ liệu trên phương tiện gốc có bị thay đổi hay
không thực hiện thông qua việc sử dụng các thông tin được giấu trong chính
phương tiện chứa. Trong thực tế, người ta mong muốn phát hiện đượcnhững vị trí
bị xuyên tạc cũng như phân biệt được các thay đổi đã thực hiệntrên các ứng dụng.
Chẳng hạn như phân biệt một bức ảnh, một đoạn âm thanh hoặc một đoạn video
chứa giấu thông tin đã bị sửa đổi hay là do bị nén mất dữ liệu.
- Giấu vân tay hay dán nhãn (fingerprinting and labeling): Trong ứng dụng
phân phối sản phẩm, thủy vân được sử dụng để nhận diện người gửi hay người
nhận đối với một thông tin nào đó. Trong trường hợp này, thủy vân tương tự như
số serial duy nhất củamỗi sản phẩm phần mềm. Trước khi chuyển cho người nhận,
các thủy vân khác nhau sẽ được nhúng vào các bản copy khác nhau của thông tin
gốc. Yêu cầu đảm bảo độ an toàn cao cho các thủyvân với các ứng dụng này tránh
sự xoá dấu vết trong khi phân phối.
- Kiểm soát sao chép (copy control): Việc tồn tại kỹ thuật chống sao chép

trái phép dữ liệu là điềuquan trọng đối với các hệ thống phân phối dữ liệu đa

10


phương tiện. Thủy vân có thể được sử dụng để chỉ trạng thái sao chép của dữ liệu.
Trong trường hợp này, đối với các thông tin, thủy vân được sử dụng để kiểm soát
chống lại các sao chép bất hợp pháp. Hiện nay, các thiết bị phát hiện ra thủy vân
thường được gắn sẵn vào trong các hệ thống đọc/ghi. Thủy vân mang các giá trị
chỉ trạng thái cho phép sao chép dữ liệu như “không được sao chép” (copy never)
hay “chỉ được sao chép một lần” (copy once), sau khi copy xong, bộ đọc /ghi thủy
vân sẽ ghi thủy vân mới chỉ trạng thái mới lên DVD. Các ứng dụng trong trường
hợp này cũng yêu cầu thủy vân phải được đảm bảo an toàn và sử dụng được
phương pháp phát hiện thủy vân đã giấu mà không cần thông tin gốc.
- Giấu tin mật (steganography): Đối với trường hợp này, càng nhiều các thông
tin có thể giấu được càng tốt và vẫn phải đảm bảo yêu cầu không thể phát hiện.
Trong giấu tin mật, yêu cầu thông tin giấu phải được bảo mật là điều quan trọng
nhất trong khi các yêu cầu về chống tấn công ở mức độ thấp hơn.
1.4.Âm thanhvà đặc tính của âm thanh [19]
1.4.1. Sóng âm và cảm giác âm
Khi một vật dao động về một phía nào đó, nó làm cho các lớp không khí liền
trước bị nén lại và lớp không liền sau dãn ra. Sự nén và dãn không khí như vậylặp
đi lặp lại một cách tuần hoàn nên đã tạo ra trong không khí một sóng đàn hồi. Sóng
này truyền tới tai, nén vào màng nhĩ khiến cho màng nhĩ cũng dao động với cùng
tần số. Khi màng nhĩ dao động, các vị trí phân biệt của màng nhĩ trên bề mặt giống
như nó chuyển động về trước hay sau đáp ứng với các sóng âm vào. Khi cùng một
thời điểm ta nghe thấy nhiều âm, thì mọi âm thanh phân biệt này được trộn với
nhau một cách tự nhiên trong tai giống như một hình mẫu đơn của áp suất không
khí thay đổi. Tai và óc làm việc cùng nhau để phân tích tín hiệu này ngược lại
thành những cảm giác về âm riêng biệt.

1.4.2. Độ cao của âm
Độ cao của âm là một đặc tính sinh lý của âm và nó phụ thuộc vào một đặc
tính của âm là tần số. Những âm có tần số khác nhau, tạo nên cảm giác về các âm
khác nhau: âm có tần số lớn gọi là âm cao hay âm thanh; âm có tần số nhỏ gọi là

11


âm thấp hay âm trầm. Sự cảm nhận về mức độ to nhỏ của âm thanh gọi là cường
độ (pitch). Và cường độ có liên quan rất gần với một thuộc tính về mặt vật lý gọi là
tần số (frequency).
1.4.3. Âm sắc của âm
Âm sắc là một đặc tính sinh lý của âm và nó được cấu thành trên cơ sở các
đặc tính vật lý của ầm là tần số và biên độ. Đây là một đặc trưng riêng của từng
nguồn phát âm. Khi một nguồn phát ra một tần số f1 thì đồng thời cũng phát ra các
âm có tần số f2 =2*f1, f3=3*f1,…
Âm có tần số f1 gọi là âm cơ bản hay họa âm thứ nhất. Các âm có tần số f2,
f3,.. gọi là các họa âm thứ hai, thứ ba,… Tùy theo đặc tính của từng nguồn phát âm
mà tạo ra các họa âm khác nhau với biên độ hay khoảng kéo dài khác nhau. Do đó
âm do một nguồn phát ra là sự tổng hợp của âm cơ bản và các họa âm. Nên mặc dù
có cùng tần số f1 của âm cơ bản nhưng đường biểu diễn không còn là một đường
hình sin đơn thuần mà là một đường phức tạp có chu kỳ.
1.5.Âm thanh số[17]
Dạng chung nhất của các quá trình thu âm thanh số là dạng điều biến mã
xung (PCM-Pulse Code Modulation). Đây là dạng mà phần lớn các đĩa compact và
các tệp Wave sử dụng. Trong phần cứng thu thanh dạng PCM, một microphone
chuyển dạng biến đổi áp suất không khí (các sóng âm thanh) thành dạng biến đổi
điện áp. Sau đó một bộ chuyển đổi tương tự - số đo dòng điện áp tại các quãng thời
gian đều nhau. Ví dụ như trong một đĩa compact có tới 44.100 mẫu được lấy mỗi
giây. Mỗi điện áp mẫu hóa nhận được sẽ được chuyển đổi sang dạng số nguyên 16bit. Một đĩa CD chứa 2 kênh dữ liệu: một cho tai trái, một cho tai phải (đối với âm

thanh dạng stereo). Hai kênh được thu thanh độc lập, được đặt theo cạnh trên đĩa
compact. Dữ liệu nhận được từ quá trình thu thanh PCM là một hàm theo thời gian.
1.5.1.Mã hóa âm thanh wave [17]
Dữ liệu âm thanh trong WAV là dạng dữ liệu âm thanh không nén (RAW
data) dựa trên định dạng mã hóa PCM (Pulse Code Modulation). Định dạng WAV
có ưu điểm là cấu trúc đơn giản và chất lượng âm thanh được bảo toàn, nhưng có

12


nhược điểm là dùng lượng file khá lớn. Chẳng hạn, nếu được lấy mẫu với tần số
44.1 kHz (44100 lần/giây) ở độ phân giải 16 bit (tương đương với chất lượng CD)
thì trong 1 phút, âm thanh sẽ cần tới dung lượng 10 MB, như vậy với một bài hát
khoảng 5 phút sẽ tốn tới 50MB ổ cứng. Phổ biến hơn là các chuẩn nén âm thanh
không bảo toàn nội dung (Lossy) như MP3,WMA,AC-3 … mặc dù âm thanh
không còn nguyên vẹn, nhưng chất lượng cũng tương đối tốt, và đặc biệt chỉ chiếm
khoảng 5MB cho một bài hát khoảng 5 phút (tương đương 10% so với định dạng
WAV).
Trong phạm vi của đề tài này, vì một số hạn chế, ứng dụng chỉ hỗ trợ file
WAV mà thôi. Trong tương lai, sẽ tiếp tục mở rộng để hỗ trợ các chuẩn nén thông
dụng hiện nay như MP3, WMA…

Hình 1.2. Định dạng tệp wave[17]
Trích mẫu
Như đã biết, sóng âm là một loạt các dao động của vật chất trong môi trường
truyền âm. Tại mỗi thời điểm nhất định, vật chất có một biên độ nhất định. Tưởng
tượng như trong dao động của con lắc đồng hồ,mỗi lúc con lắc có một độ lệch nào
đó so với vị trí cân bằng ở chính giữa.
Khi muốn đưa âm thanh vào mã hóa trên máy tính, ta cần phải xác định biên
độ dao động của sóng âm vào các thời điểm khác nhau. Việc đó gọi là trích/lấy

mẫu. Trong một giây phát ra âm thanh, người ta trích lấy một số mẫu biên độ và
đưa vào dữ liệu. Số liệu đó gọi là tần số trích mẫu (Sample rate). Ví dụ, khi thực
hiện mở phần thuộc tính của một tập tin âm thanh và thấy ghi tần số trích mẫu
Sample rate bằng 44.1 kHz (hay44100 Hz), điều đó có nghĩa là trong một giây thực
13


hiện trích mẫu 44100 lần. Dễ dàng nhận thấy rằng tần số trích mẫu càng lớn thì âm
thanh được mã hóa càng chính xác.

Hình 1.3. Trích mẫu[17]
Trong hình 1.3đường màu xanh là đồ thị sóng âm. Mỗi khung (lát cắt) màu
xám là một mẫu âm thanh. Các chấm đỏ là các giá trị biên độ dao động sẽ được
trích lấy.
Chiều sâu bit
Một yếu tố khác cũng tác động tới độ chính xác của việc trích mẫu âm
thanh, đó là chiều sâu bit, trên bảng thuộc tính tập tin WAV ghi là Audio sample
size, thường là 8 hoặc 16 bits. Ta biết, 8 bits là 1 byte, lưu được 256 giá trị (từ 0 tới
255). Còn 16 bits là 2 bytes tức 1 word, lưu được 65536 giá trị (từ -32768 tới
32767). Số bit càng lớn thì âm thanh lấy mẫu càng chính xác. Giống như thang
điểm 100 sẽ chấm chi tiết hơn thang điểm 10 vậy.

14


Kênh âm thanh (Channels)
Âm thanh chia ra 2 kênh trái-phải gọilà Stereo. Cũng có âm thanh chỉ một
kênh (tức là cùng một luồng dữ liệu đi ra hai loa) gọi là Mono.
Đối với âm thanh hai kênh, các mẫu trích (sample) cũng phân ra hai kênh.
Kích thước mẫu trích

Công thức kích thước mẫu trích (tính bằng byte) là:
LengthOfSample = Channels * AudioSampleSize / 8
1.5.2.Cấu trúc tập tin âm thanh [17]
WAVE có phần mở rộng là *.wav, nằm trong họ RIFF (Resource
Interchange File Format) của Microsoft, bao gồm WAV, AVI, ANI và một số định
dạng khác. Một tập tin WAV được chia ra thành các phần gọi là chunk.
Phần dưới đây liệt kê các chunk và nội dung của chúng theo thứ tự: vị trí,
kích thước và mô tả.
 RIFF chunk

 FORMAT chunk

 DATA chuck

15


Nếu âm thanh là 2 kênh và 16 bits thì mỗi mẫu trích có kích thước 4 bytes: 2
bytes đầu cho kênh trái, 2 bytes sau cho kênh phải. Nếu 2 kênh và 8 bits thì mỗi
kênh 1 byte, mẫu trích 2 bytes. Nếu 1 kênh và 16 bits thì mẫu trích cũng 2 bytes.
Nếu chiều sâu bit là 8 thì kiểu dữ liệu là BYTE không dấu (0 tới 255). Nếu là 16
thì kiểu dữ liệu là WORD (2bytes) có dấu (-32768 tới 32767).
 Thứ tự Byte
Dữ liệu trên tập tin WAVE tuân theo quy tắc Little-endian. Ví dụ, ta có tần
số trích mẫu bằng 44100 Hz. Giá trị 4 bytes, hệ thập lục phân của nó là
0x0000AC44 (mỗi cặp số là một byte). Trên tập tin, con số này sẽ được lưu theo
thứ tự: 44 AC 00 00. Như vậy gọi là Little-endian. (Kiểu sắp xếp bình thường gọi
là Big-endian.)
1.6.Quy trình giấu và tách thủy vân trong âm thanh
Lược đồ thủy vân chung cho quá trình nhúng được hiển thị trong hình sau:


Hình 1.4. Lược đồ nhúng thủy vân[8]
Đầu vào của lược đồ là tín hiệu thủy vân, dữ liệu gốc và khóa công khai
hoặc khóa bí mật. Tùy thuộc vào các ứng dụng mà dữ liệu gốc có thể được nén
hoặc không nén. Tuy nhiên, hầu hết các phương pháp hoạt động dựa trên dữ liệu
không được nén. Thủy vân có thể là bất kỳ loại nào như số, văn bản hoặc hình ảnh.
Khóa bí mật hoặc công khai được sử dụng để tăng cao tính bảo mật. Nếu thủy vân
không được đọc hay được xác nhận bản quyền thì khóa có thể được sử dụng để bảo

16


vệ thủy vân. Trong việc kết hợp giữa khóa bí mật hoặc khóa công khai, kỹ thuật
thủy vân thường được gọi tương ứng là kỹ thuật thủy vân bí mật và công khai.
Tiến trình chung khôi phục thủy vân được mô tả trong hình sau:

Hình 1.5. Lược đồ khôi phục thủy vân[8]
Đầu vào trên lược đồ là dữ liệu được thủy vân, khóa công khai hoặc bí mật.
Đầu ra của quá trình khôi phục thủy vân vừa khôi phục được thủy vân, vừa xác
định được rằng thủy vân đầu vào được gửi trước trong dữ liệu có sự kiểm soát.
Nhiều lược đồ thủy vân mượn ý tưởng từ truyền thông hình ảnh. Người ta
gán thủy vân bằng việc thêm các chuỗi giả ngẫu nhiên với biên độ thấp vào dữ liệu
gốc. Các chuỗi giả ngẫu nhiên đặc trưng có thể được phát hiện bằng cách sử dụng
máy thu tương quan hoặc một bộ lọc phù hợp. Nếu chuỗi giả ngẫu nhiên được gán
thêm được lựa chọn phù hợp, khả năng cảnh báo sai sẽ rất thấp.

17


CHƢƠNG2

CƠ SỞ LÝ THUYẾT
Chương này trình bày về những nội dung liên quan đến cở sở lý thuyết về
biến đổi miền tín hiệu sang miền biến đổi Fourier, miền Cepstrum, lọc âm thanh và
các phương pháp đánh giá chất lượng âm thanh sau khi biến đổi.
2.1. Biến đổi miền tín hiệu thời gian sang miền biến đổi Fourier, miềnbiến đổi
Cepstrum
2.1.1. Biến đổi miền tín hiệu thời gian sang miền biến đổi Fourier[13]
Biến đổi Fourier là một biến đổi tích phân dùng để khai triển một hàm
số theo các hàm số sin cơ sở, nghĩa là dưới dạng tổng hay một tích phân của các
hàm số sin được nhân với các hằng số khác nhau (hay còn gọi là biên độ). Biến đổi
Fourier có rất nhiều dạng khác nhau được mô tả dưới đây, chúng phụ thuộc vào
dạng của hàm được khai triển.
2.1.1.1. Biến đổi Fourier liên tục
Biến đổi Fourier liên tục là một toán tử tuyến tính chuyển một hàm khả
tích (theo tích phân Lebesgue) sang một hàm khả tích khác. Theo ngôn ngữ của
chuyên ngành xử lý tín hiệu hay trong vật lý, biến đổi Fourier khai triển một hàm
số theo các thành phần trong phổ của nó và ngược lại biến đổi Fourier nghịch đảo
xây dựng lại một hàm số thông qua các thành phân tần số của nó. Đây cũng là ý
tưởng chính của các dạng khác của biến đổi Fourier, bao gồm cả biến đổi Fourier
rời rạc.
Xét một hàm số phức khả tích Lebesgue x(t ) . Một biến đổi Fourier của nó
sang miền tần số góc  được cho bởi hàm:
X ( ) 

1
2








x(t )e it dt

(2.1)

18


Với tất cả các số thực  , i  1 đơn vị số ảo, và X ( ) là một hàm nhận
giá trị phức.
Biến đổi nghịch đảo của nó cũng có dạng tương tự. Nếu hàm X ( ) được
định nghĩa như công thức (2.1), và hàm xliên tục bậc vô hạn, khi đó :
1
2

x(t ) 







X ( )eit d

(2.2)

cho tất cả các số thực .

2.1.1.2. Chuỗi Fourier
Chuỗi Fourier của một hàm tuần hoàn là một cách biểu diễn hàm đó dưới
dạngtổng của các hàm tuần hoàn có dạng e jnx , trong đó, e là số Euler và j là đơn
vị số ảo.Theo công thức Euler, các chuỗi này có thể được biểu diễn một cách tương
đương theo các hàm sin và hàm cos.
Về khái niệm chung: cho một hàm số f với giá trị phức và biến thực t,

f : R  C , mà f(t) là liên tục và khả vi gián đoạn, tuần hoàn với chu kỳ T, và bình
phương khả tích trên đoạn t1 và t2 với chiều dài T, nghĩa là:
t2



f (t ) d (t )  
2

(2.3)

t1

với:
T  t2  t1 là chu kì,
t1 và t 2 là cận tích phân.

Chuỗi Fourier của f là:

1
f (t )  a0  [an cos(0t )  bn sin(0t )]
2
n 1


(2.4)

Trong đó, với các số nguyên không âm n,

0 
a0 

2
là tần số góc thứ n (theo radian) của hàm số f,
T

2 T
 f (t )dt
T T
0

(2.5)

19


an 

2 T
 f (t )cos(0t )dt là các hệ số Fourier chẵn của f, và
T T

bn 


2 T
 f (t )sin(0t )dt là các hệ số Fourier lẻ của f
T T

0

0

Một cách tương đương, dưới dạng mũ hàm phức,


 c e

f (t ) 

i

nt

n

n 

(2.6)

với:
cn 

1 t
f (t )e i t dt ,


t
T
2

n

1

i là đơn vị ảo, và
ei t  cos(nt )  i sin(nt ) theo đúng công thức Euler.
n

Chuỗi Fourier cho các hàm số tuần hoàn có chu kì 2
Với một hàm tuần hoàn khả tích f ( x) trên đoạn   ,  , các số

an 

1





  f ( x)cos(nx)dx ,


1

n0




Và bn 

f ( x)sin(nx)dx , được gọi là các hệ số Fourier của
 

f.

Tổng

một



( S N f )( x) 



phần

của

chuỗi

Fourier của f ,

được


hiệubởi:

a0 N
  an cos(nx)  bn sin(nx)  , N  0
2 n1

Tổng một phần của f là các đa thức lượng giác. Tổng một phần S N f xấp xỉ
hàm số f , và sự xấp xỉ tốt dần lên khi N tiến ra vô hạn. Chuỗi vô hạn

ao 
  an cos(nx)  bn sin(nx) được gọi là chuỗi Fourier của f .
2 n1
2.1.1.3. Biến đổi Fourier rời rạc
Biến đổi Fourier rời rạc (DFT) đôi khi còn được gọi là biến đổi Fourier hữu
hạn, là một biến đổi trong giải tích Fourier cho các tín hiệu thời gian rời rạc. Đầu
vào của biến đổi này là một chuỗi hữu hạn các số thực hoặc số phức, làm biến đổi
này là một công cụ lý tưởng để xử lý thông tin trên các máy tính. Đặc biệt, biến đổi
20


này được sử dụng rộng rãi trong xử lý tín hiệu và các ngành liên quan đến phân
tích tần số chứa trong một tín hiệu, để giải phương trình đạo hàm riêng và để làm
các phép như tích chập. Biến đổi Fourier rời rạc có thể được tính nhanh bởi thuật
toánbiến đổi Fourier nhanh (FFT).
Dãy số của N số phức: x0 , …, xN 1 được biến đổi thành chuỗi của N số
phức X 0 ,…, X N 1 bởi công thức sau đây:
N 1

X k   xne




2 i
kn
N

k  0,..., N  1

n 0

(2.5)

Trong đó: e là cơ số của lôgarit tự nhiên, i là đơn vị ảo  i 2  1 . Phép biến
đổi đôi khi được kí hiệu bởi F , như sau X  F{x} .
Phép biến đổi Fourier rời rạc ngược (IDFT) được cho bởi công thức sau:
2 i
kn
1 N 1
xn   X k e N n  0,..., N  1
N k 0

(2.6)

Những phương trình này có thể được mô tả đơn giản như sau: các số
phức X k đại diện cho biên độ và pha ở các bước sóng khác nhau của "tín hiệu vào"
xn . Phép biến đổi DFT tính các giá trị X k từ các giá trị xn ,trong khi IDFT tính xn
2 i
kn
1
bằng tổng của các sóng thành phần X k e N với tần số k/N. Khi viết các phương

N

trình dưới dạng như trên, ta đã sử dụng công thức Euler để biểu diễn các hàm
lượng giác dưới dạng lũy thừa số phức để biến đổi được dễ dàng. Khi viết X k dưới
dạng tọa độ cực, ta thu được biên độ Ak / N và pha  k từ modulus và argument của
Xk :

Ak  X k  Re( X k )2  Im( X k )2 ,

k  arg( X k )  a tan 2(Im( X k ),Re( X k )) ,
Trong đó: a tan 2 là dạng hai đối số của hàm arctan. Cần lưu ý rằng các thừa
số chuẩn hóa của DFT và IDFT (ở đây là 1 và 1/ N ) và dấu của các số mũ chỉ là
quy ước, và có thể khác nhau trong các tài liệu khác nhau. Điều kiện duy nhất cho

21


các quy ước này là DFT và IDFT có dấu ngược nhau ở các số mũ và tích của hai
thừa số chuẩn hóa phải là 1/ N .
2.1.2. Miền biến đổi Cepstrum[3]
Miền Cepstrum đã được áp dụng rộng rãi trong phân tích và nhận diện âm
thanh, trong đó bao gồm một chuỗi các thao tác: biến đổi Fourier, lấy logarit, và
đảo ngược biến đổi Fourier. Ba thao tác này là tuyến tính và tín hiệu ban đầu trong
miền thời gian có thể được phục hồi chính xác từ tín hiệu trong miền Cepstrum.
Sau một cuộc tổng tấn công, giá trị trung bình được thống kê từ các hệ số
Cepstrum ít nhiều có sự khác biệt nhau. Do khả năng tấn công bất biến, thông tin
thủy vân có thể được bảo toàn.

Hình 2.1. Biến đổi tín hiệu từ miền thời gian sang miền Cepstrum[3]


Hình 2.2. Nghịch đảo phép biến đổi tín hiệu từ miền Cepstrum sang miền thời gian[3]
2.2. Lọc âm thanh
Trước đây, tín hiệu được xử lý dựa trên kỹ thuật tương tự. Mặc dù nghiên
cứu lý thuyết đã có nhiều thành tựu trong xử lý tín hiệu tương tự nhưng với sự ra
đời của công nghệ máy tính và viễn thông, tín hiệu số dần thay thế tín hiệu tương
tự. Tín hiệu số được ứng dụng rộng rãi trong nhiều lĩnh vực như truyền thông, âm
nhạc số, hình ảnh… mà tín hiệu tương tự đã áp dụng, nhưng nó có những ưu điểm
mềm dẻo khi lập trình, dễ dàng sao chép, bền vững và giảm giá thành.
Âm thanh số là một loại tín hiệu biểu diễn âm thanh sử dụng trong một vài
ứng dụng như xử lý nhận dạng tiếng nói, nén và mã hóa dữ liệu âm thanh trong
điện thoại, nhạc số. Một bài toán cơ sở đối với âm thanh số là phân tích và xử lý
phổ tần số âm thanh dựa trên biến đổi Fourier.
Lọc tần số có thể áp dụng trong miền thời gian hoặc miền tần số. Giải thuật
biến đổi Fourier chuyển đổi từ miền thời gian tới miền tần số, và nó được áp dụng
22


chủ yếu trong bài toán xử lý và nhận dạng. Trong khi đó, thừa kế những kết quả
với biến đổi Laplace đã có tạo ra những bộ lọc cho tín hiệu số. Ưu điểm của nó có
thể thực hiện lọc dải tần mà không phải chuyển đổi tín hiệu từ miền thời gian sang
miền tần số. Giữa miền Laplace và miền Z có sự tương đương hai chiều nên kết
quả gần như với tín hiệu tương tự.
Cũng giống như bộ lọc xử lý ảnh, người ta cũng nghiên cứu các bộ lọc thông
thấp (Low pass filter), thông cao (High pass filter), thông dải (Band pass filter), lọc
chắn dải (Band stop filter) trong âm thanh số. Đối với bộ lọc số, đặc tính tần số
được lựa chọn, tùy theo cách chọn hệ số của nó mà tín hiệu được truyền đi với dải
tần số nhất định trong khi làm suy yếu hoặc thay đổi phần tần số còn lại.
Bộ lọc cho các thành phần tần số của tín hiệu trong một dải tần nào đó đi
qua và ngăn không cho các thành phần của tần số khác đi qua. Dải tần số cho đi
qua gọi là dải thông (passband) và dải tần số không cho qua gọi là dải chắn

(stopband). Tần số giới hạn giữa dải thông và dải chắn gọi là tần số cắt (cut-off
frequency).
2.2.1. Lọc thông thấp (Low pass filter)
Bộ lọc thông thấp là bộ lọc chỉ cho thành phần tần số thấp hơn tần số cắt đi
qua, thành phần tần số cao thì bị loại bỏ.

Hình 2.3. Lọc thông thấp[15]
2.2.2. Lọc thông cao (High pass filter)
Bộ lọc thông cao là bộ lọc chỉ cho phép tín hiệu hoạt động từ tần số cắt của
nó đến vô cùng, các tín hiệu tần số thấp nhỏ hơn tần số cắt sẽ được lọc đi.
23


Hình 2.4. Lọc thông cao[15]
2.2.3. Lọc thông dải (Band pass filter)
Bộ lọc thông dải là bộ lọc chỉ cho các thành phần có tần số trong một dải đi
qua, các thành phần bé hơn và lớn hơn thì loại bỏ.

Hình 2.5. Lọc thông dải[15]
2.2.4. Lọc chắn dải (Band stop filter)
Bộ lọc chắn dải là bộ lọc mà cho đi qua hầu hết các tần số được giữ nguyên,
nhưng làm suy giảm biên độ trong một phạm vi cụ thể đến mức rất thấp.

Hình 2.6. Lọc chắn dải[15]

24


2.3.Mã BCH
Mã BCH có tên viết tắt của ba người sáng lập ra nó là Bose, Chaudhuri và

Hocquenghem. Đây là mã vòng có khả năng sửa được nhiều lỗi. Mã BCH dựa trên
thực hiện kỹ thuật thủy vân âm thanh trong miền Cepstrum được đề xuất bởi Liu
và cộng sự. Bằng cách sử dụng cả hai tính năng tấn công bất biến của miền
Cepstrum và khả năng tự sửa lỗi của mã BCH, chúng biểu lộ mạnh mẽ việc chống
lại hầu hết các cuộc tấn công không đồng bộ so với các kỹ thuật nổi tiếng khác.
Các mã BCH là các khối dựa trên việc sửa lỗi với một loạt các ứng dụng
trong truyền thông kỹ thuật số và lưu trữ. Nó được xác định bởi các đa thức với các
hàm sinh mã, độ dài của mã BCH chính xác là n, với n=2 m-1, m≥3. Số có sẵn để
hiệu chỉnh là t, với t < (2m -1)/2, n-k≤mt. Như vậy không hoàn toàn tất cả các giá
trị của n và k có thể thỏa mãn bất đẳng thức đã đề cập trước đó.
Bảng 2.1. Các tham số có sẵn cho mã BCH[9]

Bằng cách sử dụng các tính năng tấn công bất biến của phân tích Cepstrum
và khả năng sửa lỗi của mã BCH, người ta có thể làm tăng sự vững mạnh của thủy
vân âm thanh.

Hình 2.7. Tín hiệu ban đầu trong miền thời gian [9]

25


×