Tải bản đầy đủ (.pdf) (87 trang)

Nghiên cứu một số phương pháp bảo vệ bản quyền âm thanh và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.71 MB, 87 trang )



























ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ






TẠ MINH THẮNG





NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP
BẢO VỆ BẢN QUYỀN ÂM THANH VÀ ỨNG DỤNG









LUẬN VĂN THẠC SĨ

















HẢI PHÒNG - 2011


2


























ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ




TẠ MINH THẮNG




NGHIÊN CỨU MỘT SỐ PHƯƠNG PHÁP
BẢO VỆ BẢN QUYỀN ÂM THANH VÀ ỨNG DỤNG



Ngành: Công nghệ thông tin
Chuyên ngành: Hệ thống thông tin
Mã số: 60.48.05


LUẬN VĂN THẠC SĨ




NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS. TRỊNH NHẬT TIẾN














HẢI PHÒNG - 2011


1
MỤC LỤC
MỤC LỤC 1
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT 4
DANH SÁCH HÌNH VẼ 5
MỞ ĐẦU 6
Chương 1 : CÁC KHÁI NIỆM CƠ BẢN 7
1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN 7
1.1.1. Vấn đề An toàn thông tin 7
1.1.2. Mục tiêu của An toàn thông tin 8
1.1.3. Các kỹ thuật bảo đảm An toàn thông tin. 8
1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ 9

1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố 9
1.2.2. Không gian và cấu trúc nhóm 10
1.2.3. Độ phức tạp thuật toán 11
1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH 13
1.4. XỬ LÝ TÍN HIỆU SỐ 17
1.4.1. Đại cƣơng về tín hiệu và nhiễu 17
1.4.1.1 Khái niệm tín hiệu 17
1.4.1.2 Khái niệm nhiễu 17
1.4.1.3. Phân loại tín hiệu 18
1.4.2. Phân tích Fourier 19
1.4.2.1 Biến đổi Fourier rời rạc (DFT) 19
1.4.2.2 Biến đổi Fourier nhanh (FFT) 19
1.4.2.3. Ứng dụng 20
1.4.3. Lý thuyết trải phổ 22
1.4.3.1. Định nghĩa trải phổ 22
1.4.3.2. Đặc điểm của trải phổ 22
1.4.4. Chuỗi giả ngẫu nhiên (PN – Pseudo Noise) 23
1.4.5. Mô hình giả lập hệ thính giác 24

2
Chương 2: MỘT SỐ PHƢƠNG PHÁP BẢO VỆ BẢN QUYỀN ÂM THANH 26
2.1. THUỶ VÂN SỐ (DIGITAL WATERMARKING) 26
2.1.1. Tổng quan về thuỷ vân số 26
2.1.1.1. Khái niệm thủy vân số 26
2.1.1.2. Các ứng dụng của thủy vân số 28
2.1.1.3. Các đặc tính của thủy vân 29
2.1.1.4. Phân loại thủy vân 30
2.1.2. Thuỷ vân trên audio 31
2.1.2.1. Giới thiệu 31
2.1.2.2. Phân loại thuỷ vân trên audio 33

2.1.3. Nhóm các phƣơng pháp giao thoa tín hiệu gốc 33
2.1.3.1. Nhận xét chung 33
2.1.3.2. Phương pháp mã hóa pha 34
2.1.3.3. Phương pháp điều biến pha 34
2.1.4. Nhóm các phƣơng pháp không giao thoa tín hiệu gốc 35
2.1.4.1. Nhận xét chung 35
2.1.4.2. Nhóm các phương pháp trải phổ 35
2.1.4.3. Nhóm phương pháp tập đôi (two - set method) 43
2.1.4.4. Nhóm các phương pháp sử dụng bản sao 44
2.1.4.5 Nhóm các phương pháp tự đánh dấu 48
2.2. CHỮ KÝ SỐ 50
2.2.1. Khái niệm “chữ ký số” 50
2.2.1.1. Giới thiệu “chữ ký số” 50
2.2.1.2. Sơ đồ “chữ ký số” 51
2.2.2. Phân loại “chữ ký số” 52
2.2.2.1. Phân loại chữ ký theo đặc trưng kiểm tra chữ ký 52
2.2.2.2. Phân loại chữ ký theo mức an toàn 52
2.2.2.3. Phân loại chữ ký theo ứng dụng đặc trưng 52
2.2.3. Một số loại chữ ký số 53

3
2.2.3.1. Chữ ký RSA 53
2.2.3.2. Chữ ký Elgamal 54
2.2.3.3. Chữ ký DSS 56
2.3. MỘT SỐ KHẢ NĂNG TẤN CÔNG BẢN QUYỀN ÂM THANH 59
2.3.1. Phân loại các kiểu tấn công 59
2.3.2. Một số kiểu tấn công bản quyền âm thanh 59
2.3.2.1. Tấn công đơn giản 59
2.3.2.2. Tấn công gây nhập nhằng 60
2.3.2.3. Tấn công hình học 60

Chương 3: CHƢƠNG TRÌNH THỬ NGHIỆM 61
3.1. CHƢƠNG TRÌNH THUỶ VẤN SỐ 61
3.1.1. Cấu hình hệ thống 61
3.1.2. Các thành phần của chƣơng trình 61
3.1.3. Hƣớng dẫn sử dụng chƣơng trình Audio Watermarking 62
3.1.3.1. Hướng dẫn sử dụng chương trình nhúng thuỷ vân 62
3.1.3.2. Hướng dẫn sử dụng chương trình tách thuỷ vân 64
3.2. CHƢƠNG TRÌNH KÝ SỐ TRÊN ÂM THANH 66
3.2.1. Cấu hình hệ thống 66
3.2.2. Các thành phần của chƣơng trình 66
3.2.3. Hƣớng dẫn sử dụng chƣơng trình Digital Signature 67
3.2.3.1. Hướng dẫn sử dụng phần Tính khoá 67
3.2.3.2. Hướng dẫn sử dụng phần Ký số 69
3.2.3.3. Hướng dẫn sử dụng phần Kiểm tra 71
KẾT LUẬN 73
TÀI LIỆU THAM KHẢO 74
PHỤ LỤC 75

4
DANH MỤC CÁC KÝ HIỆU, CHỮ VIẾT TẮT

STT
Ký hiệu
Thuật ngữ
Ý nghĩa
1
ABR
Average Bitrate
Tốc độ bit trung bình
2

BPSK
Binary Phase Shift Keying
Điều chế khoá chuyển
pha cơ số 2
3
CBR
Constant Bitrate
Tốc độ bit không đổi
4
dB
Decibel
Đơn vị âm thanh
5
DFT
Discrete Fourier Transform
Biến đổi Fourier rời rạc
6
DS
Direct Sequence
Chuỗi trực tiếp
7
FFT
Fast Fourier Transform
Biến đổi Fourier nhanh
8
HAS
Human Auditory System
Hệ thính giác người
9
ISS

Improvements Spread Spectrum
Trải phổ cải tiến
10
LSB
Least Significant Bit
Bit ít quan trọng nhất
11
MP3
MPEG-1 Audio Layer 3
File âm thanh nén
12
PCM
Pulse Code Modulation
File âm thanh không nén
13
PDF
Probability Distribution Function
Hàm mật độ xác suất
14
PN
Pseudo Noise
Giả tạp âm
15
PSD
Power Spectrial Density
Mật độ phổ công suất
16
VBR
Variable Bitrate
Tốc độ bit thay đổi

17
WAV
Waveform Audio File Format
File âm thanh không nén
18
WMA
Windows Media Audio
File âm thanh nén


5
DANH SÁCH HÌNH VẼ
Hình 1: Biến đổi sóng âm thanh thành tín hiệu số
14
Hình 2: Hình minh hoạ cho sóng của tín hiệu
17
Hình 3: Nhiễu đều
18
Hình 4: Nhiễu phân bố Gaussian
18
Hình 5: Đáp ứng xung
21
Hình 6: Mạch thanh ghi dịch cơ số 2
23
Hình 7: Mô hình giả lập hệ thính giác

24
Hình 8: Phương pháp phân loại thủy vân
30
Hình 9: Phân loại Watermarking trên Audio

33
Hình 10: Ý tưởng của phương pháp trải phổ truyền thống.
36
Hình 11: Tiền xử lý tín hiệu âm thanh Watermark.
37
Hình 12: Thành phần tín hiệu sau khi thủy vân
39
Hình 13: Sơ đồ tạo thủy vân
40
Hình 14: Sơ đồ nhúng thủy vân.
41
Hình 15: Sơ đồ tách thủy vân
42
Hình 16: Ẩn dữ liệu theo phương pháp echo.
46
Hình 17: Điều chỉnh tỉ lệ thời gian trong Watermarking
48
















6
MỞ ĐẦU
Ngày nay sự phát triển mạnh mẽ của Internet cùng với cuộc cách mạng thông
tin số đã đem lại những bước phát triển vượt bậc trong xã hội. Truyền thông băng
tần rộng cùng với các định dạng dữ liệu số phong phú hiện nay đã mở ra nhiều cơ
hội cũng như không ít thách thức. Các thiết bị số, các phần mềm xử lý đa phương
tiện ngày càng mạnh mẽ hiện đại, dễ dàng sử dụng dẫn đến vấn nạn xâm phạm bản
quyền như giả mạo, ăn cắp tác phẩm, sử dụng các tác phẩm không có bản
quyền,…ngày càng trở nên phổ biến và tinh vi. Theo kết quả thống kê của Hiệp hội
bảo vệ tác quyền thế giới (International Intellectual Property Alliance - gọi tắt là
IIPA), mỗi năm ngành công nghiệp giải trí nói chung và âm nhạc nói riêng thất
thoát hàng ngàn tỉ đô-la.Các nước đang phát triển có tỉ lệ vi phạm bản quyền rất cao
(trên 90%), trong đó Việt Nam dẫn đầu (với 92% ). Tuy nhiên với các phương pháp
bảo vệ dữ liệu truyền thống như mã hoá, sử dụng khóa đều không đem lại hiệu quả
cao trong tình hình hiện nay. So với các loại truyền thông đa phương tiện khác, âm
thanh số là dạng dữ liệu rất khó bảo vệ bởi đặc tính thu – phát trực tiếp.
So với các loại truyền thông sử dụng tín hiệu tương tự truyền thống thì
truyền thông số ngày nay mang lại rất nhiều lợi ích: dung lượng lớn, thao tác đơn
giản (sao chép, lưu trữ, phát tán),… Tuy nhiên đó cũng là những điểm hạn chế để
nạn vi phạm bản quyền tấn công. Trong các phương tiện giải trí số đang tồn tại ở
nước ta hiện nay : game, hình ảnh, video, thì âm thanh có thể được xem là hình
thức giải trí thông dụng và gần gũi nhất. Trên cở sở các kiến thức đã có đề tài tập
trung tìm hiểu, nghiên cứu, so sánh đánh giá các phương pháp bảo vệ bản quyền âm
thanh số (chủ yếu vào hai hướng chính là “Giấu tin” -Steganography và “Thuỷ ấn
số” -Watermarking ) và một số các phương pháp tấn công bản quyền âm thanh số.

7
Chương 1 : CÁC KHÁI NIỆM CƠ BẢN

1.1. KHÁI NIỆM VỀ AN TOÀN THÔNG TIN
1.1.1. Vấn đề An toàn thông tin
Sự phát triển của Internet và các mạng cục bộ giúp cho việc trao đổi thông
tin trở nên nhanh chóng, dễ dàng, thương mại điện tử cho phép thực hiện các giao
dịch buôn bán trên mạng,… Tuy nhiên những thông tin quan trọng nằm trong kho
dữ liệu hay trên đường truyền có thể bị lấy trộm, làm sai lệch hoặc giả mạo, điều
này có thể làm ảnh hưởng đến các tổ chức, công ty hay cả một quốc gia. Ngoài ra
khi trao đổi thông tin trên mạng còn nảy sinh vấn đề đó là khi nhận một tài liệu số
(văn bản, tranh ảnh, âm thanh,…) truyền qua mạng thì lấy gì để đảm bảo rằng nó là
của đối tác gửi cho mình và làm sao xác định được tài liệu này có bị làm thay đổi
hay sai lệch đi, cũng như vậy làm thế nào để chứng minh rằng một tài liệu số thuộc
bản quyền của một tổ chức hay cá nhân nào.
Để giải quyết các vấn đề trên, An toàn thông tin đã được đặt ra cấp thiết và
cùng với sự phát triển mạnh mẽ của Công nghệ thông tin An toàn thông tin đã trở
thành một ngành khoa học thực thụ.
Các ứng dụng của khoa học An toàn thông tin
- An ninh Quốc phòng
- Các hoạt động xã hội: bỏ phiếu điện tử, thăm dò điện tử,….
- Các giao dịch hành chính
- Thương mại điện tử
- Phục vụ đào tạo
- Bảo vệ bản quyền thông tin: Bảo vệ các tài liệu số ( hình ảnh, âm thanh,
văn bản,….)




8
1.1.2. Mục tiêu của An toàn thông tin
- Bảo đảm bí mật: Tin tức không bị lộ đối với người không được ủy quyền.

- Bảo đảm toàn vẹn: Ngăn cản, hạn chế việc tạo mới, bổ sung, xóa hay sửa
dữ liệu mà không được sự uỷ thác.
- Bảo đảm xác thực: Xác thực đúng nguồn gốc thông tin, hay xác thực sự
toàn vẹn của thông tin.
- Bảo đảm sẵn sàng: Thông tin sẵn sàng cho người dùng hợp pháp.
1.1.3. Các kỹ thuật bảo đảm An toàn thông tin.
+ Kỹ thuật Diệt trừ: VIRUS máy tính, chương trình trái phép,…
+ Kỹ thuật Tường lửa (Firewall): Ngăn chặn truy cập trái phép, lọc thông tin
không hợp pháp.
+ Kỹ thuật Mạng riêng ảo (Virtual Private Network)
+ Kỹ thuật Giấu tin (Information Hiding)
+ Kỹ thuật Truy tìm dấu vết trộm tin.
+ Kỹ thuật Mật mã.

9
1.2. KHÁI NIỆM TRONG SỐ HỌC VÀ ĐẠI SỐ
1.2.1. Tính chia hết, quan hệ đồng dƣ và số nguyên tố
1/.Tính chia hết
Xét 2 số nguyên a và b. Ta gọi a chia hết cho b số nguyên n thỏa mãn
a=b*n. Khi đó a được gọi là bội số của b, b được gọi là ước số của a. Ký hiệu a|b.
a được gọi là chia cho b dư r số nguyên k và r thỏa mãn a = k.b + r. Khi
đó r gọi là số dư của phép chia a cho b.
Xét dãy số ( a
1,
a
2
,… a
n
).
Nếu b là ước số chung của tất cả các số trong dãy số trên, và tất cả các ước

số chung khác của dãy đều là ước số của b, thì ta gọi b là ước số chung lớn nhất của
dãy.
Ký hiệu b = UCLN (a
1,
a
2
,… a
n
) = gcd (a
1,
a
2
,… a
n
).
Nếu b là bội số chung của tất cả các dãy trong dãy số trên, và tất cả các bội
số chung khác của dãy đều là bội số của b, thì ta gọi b là bội số chung nhỏ nhất của
dãy.
Ký hiệu b = BCNN (a
1,
a
2
,… a
n
) = lcm (a
1,
a
2
,… a
n

).
Ta có: gcd (a, b) = 1 với mọi a và b nguyên tố cùng nhau.
2/.Quan hệ đồng dư
a và b đồng dư theo modulo n (a - b)|r.
Ký hiệu a b (mod n).
3/.Số nguyên tố
Số nguyên tố là số tự nhiên lớn hơn 1, chỉ chia hết cho 1 và chính nó.
Các số tự nhiên không phải là số nguyên tố thì gọi là hợp số.
Số nguyên tố đóng một vai trò rất quan trọng trong lĩnh vực an toàn thông
tin. Ví dụ: số nguyên tố là tham số để tính các khoá mật mã

10
Số lượng các số nguyên tố là vô hạn, đồng thời cho đến nay người ta vẫn
chưa tìm ra được quy luật của dãy số nguyên tố.
Số nguyên tố đã được nghiên cứu từ trước Công nguyên. Hiện nay, đã có rất
nhiều thuật toán được nghiên cứu nhằm xác định một số có phải là số nguyên tố hay
không.
Gần đây nhất, vào tháng 8 năm 2008, đã tìm ra số nguyên tố có gần 13 triệu
chữ số, là một số nguyên tố dạng Mersenne.
1.2.2. Không gian và cấu trúc nhóm
1/.Không gian và các phép tính cơ bản:
được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n.
= {1, 2, … n - 1}.
* được định nghĩa là tập hợp các số tự nhiên nhỏ hơn n và nguyên tố cùng
nhau với n.
*= {x|x , gcd (x, n) = 1}.
Trong không gian , các phép toán đều được thực hiện theo modulo n.
Phép cộng, phép trừ và phép nhân được thực hiện bình thường như trong
không gian Z, tuy nhiên kết quả cuối cùng phải được tính lại theo modulo n.
Phép chia trong không gian liên quan tới khái niệm phần tử nghịch đảo.

Phần tử nghịch đảo của a định nghĩa là b thỏa mãn a.b=1(mod n),
ký hiệu b = (mod n).
Vì vậy, phép chia a cho b trong không gian chỉ có nghĩa nếu b có phần tử
nghịch đảo, bởi vì a/b = a. .
2/.Cấu trúc nhóm:
* Nhóm là một bộ hai phần tử (G, *), trong đó G là tập hợp khác rỗng, * là
phép toán hai ngôi thỏa mãn:
Tính kết hợp: (a * b) * c = a * (b * c) với a,b,c G.

11
Tồn tại phần tử trung lập e G thỏa mãn: e * x = x * e = e với x G.
Với x G, phần tử nghịch đảo của x thỏa mãn: x * = * x = e.
* Nhóm con của nhóm (G, *) là nhóm (S, *) thỏa mãn:
S G.
Phần tử trung lập e của G nằm trong S.
S khép kín đối với phép * và lấy nghịch đảo trong G.
Nhóm được gọi là nhóm cyclic nếu nó được sinh ra từ một trong các phần tử
của nó. Phần tử đó gọi là phần tử nguyên thủy.
1.2.3. Độ phức tạp thuật toán
Thuật toán được định nghĩa là một dãy hữu hạn các chỉ thị mô tả một quá
trình tính toán nào đó.
Một bài toán được gọi là “giải được” nếu tồn tại thuật toán giải quyết bài
toán đó. Ngược lại bài toán gọi là “không giải được”.
Tuy nhiên, không phải bài toán nào thuộc lớp bài toán “giải được” cũng có
thể giải được trong thực tế. Do đó, người ta đưa ra khái niệm chi phí để giải một bài
toán, chi phí này liên quan mật thiết tới thuật toán giải bài toán đó, phụ thuộc vào
bốn tiêu chí sau:
 Thuật toán có dễ hiểu không.
 Thuật toán có dễ cài đặt không.
 Số lượng bộ nhớ dùng trong thuật toán.

 Thời gian thực hiện thuật toán.
Trong các tiêu chí đó, tiêu chí thời gian thực hiện thuật toán là quan trọng
nhất.



12
Độ phức tạp thời gian của thuật toán, thường được hiểu là số các phép tính
cơ bản mà thuật toán phải thực hiện, trong trường hợp xấu nhất. Với cỡ dữ liệu đầu
vào là n, thời gian thực hiện thuật toán là t(n) được gọi là tiệm cận tới hàm f(n) nếu
với n đủ lớn thì tồn tại số c thỏa mãn t(n) c.f(n). Nếu f(n) là một hàm đa thức thì
thuật toán được gọi là có độ phức tạp thời gian đa thức.
Hiện nay, hầu hết các bài toán giải được trong thực tế đều là các bài toán có
độ phức tạp thời gian đa thức. Các bài toán có độ phức tạp số mũ thực tế là khó thể
giải được (có thể mất nhiều triệu tới nhiều tỷ năm).
Lý thuyết độ phức tạp tính toán là lý thuyết quan trọng của khoa học máy
tính. Nó cũng là cơ sở cho các phép toán gần đúng và xấp xỉ, hiện đang có nhiều
ứng dụng trong khoa học.
Từ lý thuyết độ phức tạp tính toán, xuất hiện một khái niệm rất quan trọng
trong lĩnh vực an toàn thông tin: hàm một phía và hàm một phía có cửa sập.
Hàm một phía (one way function): hàm số y = f(x) được gọi là hàm một
phía, nếu khi biết giá trị của x thì ta dễ dàng tính được giá trị của y, nhưng ngược
lại, nếu biết giá trị của y, ta “khó” tính được giá trị của x.

13
1.3. ĐẶC TRƢNG CỦA DỮ LIỆU ÂM THANH
Âm thanh số (digital audio) là kết quả của quá trình biến đổi từ sóng âm
thanh thành tín hiệu số. Sóng âm thanh là các sóng cơ học có dạng hình sin tuần
hoàn liên tục (analog), trong khi “âm thanh số” chỉ là những xung điện tử rời rạc
(digital). Do đó, bằng những “mẩu” rời rạc, âm thanh số chỉ có thể mô phỏng một

cách gần giống nhất với âm thanh thực tế mà thôi. Việc mô phỏng đó được đặc
trưng bởi các thông số sau:
- BitRate: Là thông số thu gọn, đại diện cơ bản cho các thuộc tính trên.
Bitrate có đơn vị Kbps (Kilobits per second) – dung lượng (tính theo bit) của âm
thanh số trên một giây. Với Bitrate, ta có thể xác định nhanh chóng dung lượng
cũng như phần nào chất lượng của bản nhạc. Một phút nhạc 128 kbps có dung
lượng khoảng 1 MB và bản nhạc 320 kbps thì chắc chắn sẽ hay hơn bản nhạc 128
kbps.
- Sample: Là một bộ phận của âm thanh analog được mã hóa thành dạng số.
Sample có thể dùng để chỉ một điểm đơn lẻ trong stream âm thanh số (là đơn vị nhỏ
nhất của dữ liệu dùng để biểu diễn một tín hiệu âm thanh tại một khoảng thời gian
nhất định). Một âm thanh hoàn chỉnh hay toàn bộ một stream âm thanh số được cấu
tạo từ việc kết hợp những sample riêng biệt (một chuỗi sample) cũng có thể được
coi là một sample.
- Sample Rate: Là số sample (tạm dịch là mẫu) trong một khoảng thời gian
nhất định (thường là 1 giây) của âm thanh kỹ thuật số, quyết định trực tiếp tới chất
lượng âm thanh. Khi một tập tin âm thanh dạng số được ghi lại, nó phải được
convert vào một chuỗi những mẫu (series of sample) mà bản thân chúng có thể lưu
lại được trên bộ nhớ, trên các thiết bị lưu trữ kỹ thuật số. Sample rate sẽ thông báo
cho ta biết trong tập tin âm thanh có bao nhiêu mẫu được ghi lại trong một giây.
Đơn vị của sample rate là Hz.

14
Ví dụ dễ hiểu, một tập tin âm thanh được ghi ở sample rate 44100 sẽ cần đến
44100 mẫu/giây để lưu giữ âm thanh trong một chuỗi mẫu.
Sample rate càng cao, chất lượng của chuỗi mẫu càng tốt và càng ít xảy ra
hiện tượng gọi là aliasing (là hiện tượng xuất hiện những tần số âm thanh không
mong muốn sinh ra bởi việc thiếu hụt thông tin từ sample rate). Mỗi mẫu sẽ cần một
lượng bit nhất định để lưu trữ gọi là sample size, và ta có thể tính toán dung lượng
cần thiết cho một sample.

Ví dụ: với âm thanh 16 bit, ta cần sử dụng 16bit hay 2byte cho một mẫu (8bit
= 1byte). Như vậy 1 giây âm thanh với sample rate 44100/16 bit mono (một kênh
âm thanh) sẽ có độ lớn là 44100x2=88200byte.
Nếu cũng với các thông số như vậy nhưng thay vì mono, ta sử dụng stereo (2
kênh âm thanh), dung lượng sẽ phải nhân đôi và trở thành 176400 byte. Đây là lý do
vì sao âm thanh vòm (5.1) hay các loại âm thanh sử dụng nhiều kênh khác (6.1, 7.1,
…) lớn hơn rất nhiều sơ với âm thanh stereo hay mono mặc dù chúng cũng có được
nén ở cùng chất lượng.


Hình 1: Biến đổi sóng âm thanh thành tín hiệu số

15
- BitDepth: Để lưu lại dưới dạng số, mỗi mẫu được biểu diễn bằng một
lượng bit dữ liệu nhất định, gọi là BitDepth. Các bản nhạc hiện nay thường có
BitDepth là 16 bits, 24 bits…BitDepth càng lớn âm thanh càng sắc nét, trung thực
nên nó còn được gọi là Resolution (độ nét).
- Kênh âm thanh (Channel): Bằng các thuật toán, tín hiệu số sẽ được tách ra
thành nhiều kênh sao cho khi nghe bằng hệ thống loa thích hợp sẽ có cảm giác như
khi đang nghe nhạc trong không gian thực tế.
- Âm thanh Lossy, lossless và uncompressed
Âm thanh uncompressed là loại âm thanh không áp dụng bất kỳ một phương
pháp nén nào. Được sử dụng dưới định dạng WAV hay PCM.
Âm thanh lossless là loại âm thanh sử dụng phương pháp loại bỏ những dữ
liệu không liên quan tồn tại trong file gốc để thu được một file nhỏ hơn nhưng vẫn
giữ được chất lượng như ban đầu. Âm thanh xử lý lossless sẽ có bitrate thấp hơn so
với âm thanh chưa nén.Âm thanh lossless được sử dụng rộng rãi và phát triển thành
những định dạng quen thuộc như AC3, AAC, DTS, MPEG-1/2/3, Vorbis, Real
Audio
Âm thanh lossy là loại âm thanh thu được khi sử dụng những phần mềm

encode âm thanh phổ biến hiện nay để chuyển đổi các định dạng âm thanh. Đây là
loại âm thanh bị giảm chất lượng vì quá trình lossy encode sẽ không giữ nguyên
những phần cần thiết trong file âm thanh gốc. Lấy ví dụ, khi encode từ WAV sang
MP3, bạn đã thực hiện phương pháp lossy encode cho file âm thanh WAV chưa nén
của mình, và file MP3 thu được đã bị giảm chất lượng so với file gốc, nó là âm
thanh lossy. Mọi chuyện thậm chí còn tồi tệ hơn với việc encode file MP3 lossy đó
thành OGG (có thể là định dạng khác), file OGG thu được đã bị quá trình encode
lossy giảm chất lượng tới 2 lần.


16
- Các dạng bitrate CBR/ABR/VBR
CBR-Constant bitrate: nghĩa là bitrate của stream là một hằng số và không
thay đổi tại bất kỳ điểm nào của stream.
ABR-Average bitrate: nghĩa là stream có thể sử dụng bitrate thay đổi cho
mỗi frame, nhưng bitrate trung bình của toàn bộ stream là cố định.
VBR-Variable bitrate: nghĩa là stream có thể sử dụng bitrate thay đổi cho
mỗi frame và tùy biến để đạt được bitrate cần thiết cho mỗi frame,vì vậy bitrate
trung bình không thể xác định trước khi encode hay tính toán cụ thể.
- Âm thanh Stereo, joint stereo, và dual channel:
Dual channel tích hợp bởi 2 kênh mono, nghĩa là mỗi kênh sẽ được encode
với một nửa của toàn bộ bitrate.
Stereo tích hợp bởi 2 kênh âm thanh độc lập với nhau. Bitrate cung cấp giữa
2 kênh âm thanh thay đổi phù hợp với lượng thông tin được chứa trong mỗi kênh.
Joint stereo cũng tích hợp 2 kênh âm thanh nhưng có một bước tiến xa hơn vì
có thể sử dụng được những mẫu chung thường xuất hiện ở cả 2 kênh. Do đó độ nén
sẽ tốt hơn so với stereo bình thường.

17
1.4. XỬ LÝ TÍN HIỆU SỐ

1.4.1. Đại cƣơng về tín hiệu và nhiễu
1.4.1.1 Khái niệm tín hiệu
Tín hiệu là sự biến thiên của biên độ theo thời gian. Biên độ có thể là điện
áp, dòng điện, công suất, . . . nhưng thường được hiểu là điện áp. Các yếu tố trong
tín hiệu mà chúng ta thường nhắc tới là biên độ và thời gian.
Ví dụ: Xét sóng của tín hiệu x = sin(2*pi *100 *t) .

Hình 2: Hình minh hoạ cho sóng của tín hiệu
1.4.1.2 Khái niệm nhiễu
Nhiễu là tín hiệu do chính bản thân mạch điện tử và môi trường truyền thông
phát sinh ra. Giảm nhiễu hoặc khử nhiễu là thao tác chính trong xử lý tín hiệu số.
Nhiễu trắng là nhiễu có độ lớn như nhau ở mọi tần số (trên lý thuyết), trong thực tế
chúng ta chỉ xét trong phạm vi giới hạn băng tần khá rộng hay nói đúng hơn nhiễu
trắng là tín hiệu có mật độ công suất phổ (PSD) cố định ở mọi băng tần.
Có hai loại phân bố xác suất của nhiễu thường nhắc tới là nhiễu phân bố đều
và nhiễu Gauss.
+ Phân bố đều là phân bố có hàm mật độ PDF f(x) không đổi trong khoảng
biến thiên của biến số x, có giá trị kỳ vọng là μ = 0 .
+ Phân bố Gauss là phân bố chuẩn. Dạng nhiễu phổ biến nhất trong thực tế
là nhiễu trắng có phân bố Gauss.

18


Hình 3: Nhiễu đều



Hình 4: Nhiễu phân bố Gaussian



1.4.1.3. Phân loại tín hiệu
Tuỳ theo từng tiêu chuẩn mà có nhiều cách phân loại khác nhau:
 Dạng sóng: tín hiệu sin, vuông, tam giác, xung. . . .
 Tần số: hạ tần, cao tần (HF), âm tần (AF), siêu cao tần (VHF) . . .
 Sự liên tục: tín hiệu liên tục, tín hiệu rời rạc.
 Tính xác định: tín hiệu xác định, tín hiệu ngẫu nhiên.




19
1.4.2. Phân tích Fourier
1.4.2.1 Biến đổi Fourier rời rạc (DFT)
Tín hiệu tuần hoàn rất ít gặp trong thực tế, trong khi đó tín hiệu không tuần
hoàn và có số mẫu giới hạn lại thường xảy ra. Đối với các tín hiệu này lại không
phù hợp với phép biến đổi Fourier rời rạc theo thời gian. Do đó đối với tín hiệu
không tuần hoàn có độ dài hữu hạn N, người ta thường xem nó như là tín hiệu tuần
hoàn ở chu kỳ N, theo định nghĩa Fourier rời rạc của tín hiệu ta có:





1
0
2
)(
N
n

kn
N
j
k
enxX


với k = 0, 1,. , N-l. Đây là phép biến đôi Fourier thuận, ký hiệu DFT.
X
K
được gọi là hệ số phổ.
Ngược lại, tín hiệu tổng hợp từ các hệ số phổ là:
kn
N
j
N
k
k
eX
N
nx

2
1
0
1
)(






với n = 0, 1 ,. . . , N- 1 .
Đây là phép biến đôi Fourier ngược, ký hiệu là IDFT.
1.4.2.2 Biến đổi Fourier nhanh (FFT)
Biểu thức DFT và IDFT chỉ thực hiện trên các phép nhân và phép cộng
nhưng vì có quá nhiều phép toán nên cần nhiều thời gian xử lý. Tuy nhiên một lợi
điểm là trong DFT và IDFT có hàm mũ, sin, cosin dẫn tới nhiều trùng lắp trong các
phép tính. FFT là thuật toán để tính nhanh DFT và IDFT. Vì có nhiều thuật toán
FFT nên có nhiều tên gọi khác nhau.



20
Xét biểu thứ DFT





1
0
2
)(
N
n
kn
N
j
k

enxX











1
0
2
sin
2
cos)(
N
kn
N
jkn
N
nx



Vậy phần thực, phần ảo, biên độ và pha lần lượt là
 
)(

)(
)(
)()()(
2
sin)()(
2
cos)()(
1
2
1
2
1
0
1
1
0
kX
kX
arctgk
kXkXkX
kn
N
nxkX
kn
N
nxkX
R
R
N
N

R












1.4.2.3. Ứng dụng
o Phân tích phổ - rò rỉ phổ
Phân tích phổ số là phân ly tín hiệu số thành các thành phần tần số. Đây là
một kỹ thuật rất hữu ích trong khoa học công nghệ. Chúng ta nên phân biệt phân
tích phổ và lọc, phân tích phổ đơn giản là phân tích, kiểm nghiệm tín hiệu chứ
không lọc. Đối tượng của phân tích phổ là các tín hiệu trong tự nhiên như là: tiếng
nói, tín hiệu địa chất, tín hiệu sinh học, dữ liệu thị trường. Phân tích phổ còn được
áp dụng cho việc khảo sát các hệ thống như hệ thống lọc.
Lọc tín hiệu ra khỏi miền nhiễu Dùng DFT và FFT là cách hiệu quả để phát
hiện tín hiệu chìm trong nền nhiễu. Ví dụ: một tín hiệu sóng vuông bị chìm trong
nhiễu, bề ngoài chúng ta rất khó xác định được chúng. Qua FFT, năng lượng tín
hiệu sẽ tập trung ở một số phổ vạch, còn nhiễu thì trải rộng, nhờ đó chúng ta có thể
phát hiện ra tín hiệu.


21
o Đáp ứng cửa số

Biên đổi Fourier là phương pháp cơ bản để thiết kế các lọc phổ phi đệ qui.
Gọi G(Ω) là đáp ứng tần sổ được yêu cầu và H(Ω) xung của hệ thống. Đối
với G(Ω) đáp ứng xung được cho bởi biểu thức Fourier như sau:




deGnh
jn



)(
2
1
)(

Xem mạch lọc là thông thấp lý tưởng tức là tức G(Ω) = 1 khi -Ω
C
< Ω < Ω
C

ngược lại thì G(Ω) = 0.
o Độn không
Đây là thao tác thực hiện chèn bit 0 vào các thành phần trống của tín hiệu sau
khi thực hiện lọc qua cửa sổ.
o Nhân chập nhanh
Giúp thực hiện nhanh các thao tác tính toán nhân chập trên tín hiệu.
o Đáp ứng xung
Lưu ý:

Đáp ứng xung của hệ thống H là tín hiệu ra h(t), tín hiệu vào là một xung lực
đơn vị
)(t
. Vì xung lực ở t = 0 nên đáp ứng xung cũng bắt đầu ở t = 0.


Hình 5: Đáp ứng xung

Đáp ứng xung :





n
jn
enhH )()(


22
1.4.3. Lý thuyết trải phổ
1.4.3.1. Định nghĩa trải phổ
Trải phổ là kỹ thuật truyền tín hiệu, được sử dụng rộng rãi trong truyền
thông. Trong đó năng lượng của tín hiệu được “trải” trên một băng thông rộng hơn
nhiều lần lượng băng thông cần thiết tối thiểu nhờ sử dụng mã giả ngẫu nhiên, mã
này độc lập với tín hiệu thông tin. Bên nhận thông tin sẽ tiến hành “giải trải” bằng
cách đồng bộ hóa mã giả ngẫu nhiên.
Có 4 kiểu trải phổ:
 Trải phổ trực tiếp
 Nhẩy tần

 Nhẩy thời gian
 Hệ lai
1.4.3.2. Đặc điểm của trải phổ
Điều chế trải phổ có nhiều tính năng quan trọng như sau:
 Chống lại các nhiễu cố ý hay vô tình.
 Có khả năng loại trừ ảnh hưởng của truyền sóng nhiễu tia.
 Có khả năng dùng chung băng tần với người sử dụng khác.
 Sử dụng được cho thông tin vệ tinh ở chế độ CDMA
 Đảm bảo tính riêng tư nhờ sử dụng các mã trải phổ giả ngẫu nhiên.
 Được phép hoạt động không cần giấy phép ở ba lĩnh vực là: công nghiệp,
khoa học, y tế, với công suất đến 1W ở các băng tần: 902-928 MHZ, 2.4-
2.4835GHZ, 5.725-5.85 GHZ.



23
1.4.4. Chuỗi giả ngẫu nhiên (PN – Pseudo Noise)
Các tín hiệu trải phổ băng thông rộng tựa tạp âm được tạo ra bằng các chuỗi
giả ngẫu nhiên. Các chuỗi này phải được tạo ra theo một quy luật xác định, nhưng
ngẫu nhiên trước các quan sát bình thường.
Chuỗi m có độ dài cực đại 2
m
được xem là chuỗi giả ngẫu nhiên quan trọng
nhất được tạo thành thông qua ghi dịch nối tiếp và các cổng XOR. Chuỗi này được
xác định bằng một đa thức tạo mã tuyến tính g(x) bậc m ( m > 0).
g(x) =
01
2
2
1

1
gxgxgxgxg
m
m
m
m
m
m





(1)
Trong đó g
i
có giá trị là 0 hoặc 1 và g
m
= g
0
= 1.
Cho g(x) = 0 . Ta có sự hồi quy như sau:
1 =
m
m
m
m
xgxgxgxg 



2
1
2
21

(2)
Với thể hiện đơn vị trễ. Nếu = 1, khóa tương ứng là mạch đóng, ngược
lại khóa tương ứng là mạch mở. Thanh ghi dịch là một mạch cơ số có 2 trạng thái
với m phần tử nhớ. Vì thế số trạng thái khác 0 cực đại là 2
m
-1.

Hình 6: Mạch thanh ghi dịch cơ số 2
Giả sử (j) biểu diễn giá trị phần tử thứ j trong thanh ghi dịch ở xung đồng
hồ i là vecto có độ dài hữu hạn = [ (1), (2), …, (m) ]. Đầu ra ở nhịp xung
thứ i là = (m). Thay vào (2), ta có :
mimmimiii
cgcgcgcgc


112211

(3)
)2(mod
112211 iimmimimi
ccgcgcgc 

(4)
c(t) =




 )(
cTk
kTtc
c

(5)

×