Tải bản đầy đủ (.doc) (88 trang)

nén tín hiệu audio theo tiêu chuẩn mpeg -2 và các ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (422.74 KB, 88 trang )

MỞ ĐẦU
Trong những năm qua, cùng với kỹ thuật số hoá audio, kỹ thuật nén
cũng mang lại nhiều thành tựu tốt đẹp. Nó đã góp phần không nhỏ tạo điều
kiện cho việc xử lý, truyền, lưu trữ thông tin đạt hiệu quả cao. Việc số hoá
tín hiệu đã giải quyết được những mâu thuẫn giữa khối lượng thông tin khổng
lồ, trong khi giải thông của các thiết bị có mức độ. Quá trình nén tín hiệu là
biện pháp hiệu quả cao trong việc giảm bớt dòng thông tin và nâng cao chất
lượng âm thanh.
Sự phát triển kỹ thuật số và việc ứng dụng công nghệ số vào các lĩnh
vực kỹ thuật, làm cho khái niệm về “nén” trở thành đề tài nóng hổi trong
nhữnh năm gần đây. Nhiều kỹ thuật nén mất và không mất thông tin đã được
phát triển trong nhiều năm qua, nhưng chỉ có một số Ýt trong chúng có thể áp
dụng được cho việc nén tín hiệu audio số. Những tiêu chuẩn nén audio số mà
ta thường gặp như MPEG, AC-3, trong các hệ thống âm thanh hoặc hệ thống
âm thanh có hình ảnh đi kèm, trong đó tiêu chuẩn nén audio được dùng phổ
biến đó là tiêu chuẩn nén dòng số liệu audio sè MPEG.
Trong các lĩnh vực truyền thanh, truyền hình và các mạng đa dịch vụ
khác, audio số đang là một xu thế phát triển mạnh, đặc biệt là ở nước ta từ nay
cho đến năm 2005.
1
Đứng trước nhu cầu bức bách của thực tế, đề tài “ Nén tín hiệu audio
theo tiêu chuẩn MPEG -2 và các ứng dụng” mà tôi chọn, nhằm góp phần
hoàn thiện việc tập trung kiến thức, thông tin đầy đủ về kỹ thuật audio số,
đồng thời mở ra hướng nghiên cứu để tiếp cận nhanh với công nghệ hiện đại
trong thời đại ngày nay.
Đồ án trình bày 3 chương:
Chương 1: Cơ sở xử lý tín hiệu âm thanh.
Chương này trình bày một số nét điển hình về cơ sở lý luận của xử lý
tín hiệu âm thanh (audio). Đó là những vấn đề lý luận chủ yếu liên quan tới
quá trình số hoá tín hiệu, biến đổi tín hiệu từ miền thời gian sang miền tần số,
từ đó ứng dụng nén tín tín hiệu audio.


Chương 2: Nén tín hiệu au dio đã được số hoá.
Chương này đi sâu về một số vấn đề về công nghệ nén, từ đó làm cơ sở
cho công việc nén tín hiệu audio đã được số hoá. Đồng thời đưa ra sơ bộ các
tiêu chuẩn về nén tín hiệu audio.
Chương 3: Nén tín hiệu âm thanh theo tiêu chuẩn MPEG-2.
Đây là nội dung chính của đề tài. Trong chương này trình bày quá trình
phát triển của tiêu chuẩn MPEG, phương pháp “nén” và “giải nén” audio của
tiêu chuẩn MPEG, đồng thời đi sâu phân tích kỹ các tiêu chuẩn nén MPEG-2.
Mặt khác cũng đưa ra những ứng dụng thực tế tiêu chuẩn nén này.
Do điều kiện thời gian có hạn, Đồ án chưa thể đi sâu vào nhiều khía
cạnh của lý thuyết và thực tế của công nghệ nén audio sè. Song những vấn đề
mà luận văn đề cập tới là những yếu tố quan trọng đã và đang được thực hiện
đưa vào sử dụng.
2
Nhân dịp này, bản thân xin chân thành cảm ơn sự hướng dẫn tận tình
của PSG-TSVũ Đức Lý, cùng toàn thể các thầy cô ở Khoa điện tử viễn thông
đã giảng dạy, truyền đạt kiến thức và tạo mọi điều kiện cho tôi hoàn thành
bản đồ án này./.
Chương I
Cơ sở xử lý tín hiệu âm thanh
Để xử lý tín hiệu âm thanh, người ta sử dụng rất nhiều tới lý thuyết về
tín hiệu. Đặc biệt là vấn đề xử lý tín hiệu như: biến đổi tín hiệu từ miền thời
gian sang miền tần số, số hoá tín hiệu, trong đó những khâu lấy mẫu và mã
hoá là những khâu ảnh hưởng trực tiếp tới nội dung và chất lượng xử lý, từ đó
để nén được âm thanh đảm bảo chất lượng cao.
1.1. Âm thanh và các đặc tính của âm thanh.
1.1.1. Âm thanh.
Âm thanh là do vật thể rung động, phát ra tiếng và lan truyền trong
không khí, tai ta nghe được âm thanh là nhờ có màng nhĩ, nó được nối liền
với hệ thống thần kinh. Âm thanh cũng có thể lan truyền được trong các chất

khí, chất lỏng, chất rắn, v.v nhưng không lan truyền được trong khoảng
chân không. Một số chất truyền dẫn âm rất kém, thường là loại mềm xốp, như
bông, cỏ, dạ , và được gọi là chất hót âm.
Vận tốc truyền lan của âm thanh phụ thuộc vào chất truyền âm. Ví dụ
trong không khí là 340 m/s, trong nước là 1480 m/s, trong sắt là 5000 m/s.
3
Trong không khí, tốc độ truyền lan phụ thuộc vào nhiệt độ và được tính
theo công thức:
Trong đó: T
0
- là nhiệt độ tuyệt đối của không khí. (1.1)
Như vậy nhiệt độ càng cao thì âm thanh truyền càng nhanh. Người ta
thường chọn C = 340 m/s, tốc độ tương ứng với T
0
= 290
0
K (tức là 17
0
C).
1.1.2. Các đặc tính của âm thanh.
* Tần số:
Tần số biểu thị độ cao của âm thanh: tiếng trầm có tần số thấp, tiếng
bổng có tần số cao. Tai người có thể nghe thấy được các tần số thấp tới 16 Hz
và tần số cao tới 20 KHz. Dải tần số từ 16 Hz đến 20KHz gọi là giải tần số âm
thanh, gọi tắt là âm tần. Những âm có tần số dưới 16 Hz gọi là hạ âm, những
âm có tần số trên 20KHz gọi là siêu âm. Dòng điện có tần số trong khoảng
16Hz đến 20KHz gọi là dòng điện âm tần.
Trong dải âm tần, người ta chia ra: tiếng trầm từ 16Hz đến 300Hz,
tiếng trung từ 300Hz đến 3000Hz, tiếng thanh từ 3000Hz đến 20000Hz.
*áp suất âm thanh:

Sóng âm trên không là dạng nhiễu loạn vật lý trong không khí, môi
trường đàn hồi. Độ lớn tức thời của sóng ở thời điểm riêng trong không gian
và thời gian có thể được biểu diễn theo những cách khác nhau. Tuy nhiên,
tính chất được sử dụng và đo rộng rãi nhất của sóng âm là áp suất âm thanh,
thăng giáng trên và dưới áp suất khí quyển do sóng gây ra, áp suất âm thanh
gọi tắt là thanh áp, áp suất đo âm thanh tạo thêm ra ở một điểm gọi là thanh
áp ở điểm đó.
4
Đơn vị đo thanh áp là: Bar . Mét bar là thanh áp tác động lên một diện
tích 1cm
2
mét lực 1 đin, hay 1 bar = 1 đin/cm
2
.
Ngày nay, người ta thường sử dụng đơn vị Pascan (Pa) đo thanh áp.
Với: 1 bar = 100 KPa ; 1Pa = 1 N/m
2
.
*Mức áp suất âm thanh:
áp suất âm thanh quan trọng đối với kỹ thuật điện tử nằm trong khoảng
từ tiếng ồn yếu nhất vốn có thể gây nhiễu cho ghi âm tới những âm thanh
mạnh nhất mà màng loa có thể phát ra, khoảng này xấp xỉ 10
6
. Do đó các áp
suất âm thanh thường được vẽ trên thang loga, gọi là mức áp suất âm thanh
biểu thị theo đexiben (dB).
Đexiben là đơn vị dược dùng cho nhiều mục đích trong kỹ thuật điện
tử, bắt nguồn từ kỹ thuật âm tần (trong điện thoại) và được gọi theo tên của
A.G.Bell. áp suất chuẩn đối với âm thanh trong không khí, tương ứng với
0dB, được định nghĩa như áp suất âm thanh 20 àPa (trước đây là

0,00002đin/cm
2
). Đó là áp suất âm thanh chuẩn p
0
. Như vậy mức áp suất âm
thanh L
P
theo đexiben tương ứng với áp suất âm thanh p được định nghĩa bởi:
L
P
= 20 log (p/p
0
) dB(1.2) (1.2)
áp suất chuẩn P
0
xấp xỉ áp suất âm thanh nghe được yếu nhất ở
2000Hz. Do đó, phần lớn các giá trị dB của mức áp suất âm thanh đều có dấu
dương.
*Công suất âm thanh:
Công suất âm thanh là năng lượng âm thanh đi qua một diện tích S
trong thời gian 1 giây. Công suất âm thanh có thể tính bằng công thức:
P = p.s.v(1.3) (1.3)
Trong đó: p là thanh áp, v là tốc độ dao động của một phần tử không
khí tại đó và s là diện tích. Công suất âm thanh tính theo Oát (W).
Công suất âm thanh nói chung tỉ lệ với bình phương áp suất âm thanh.
5
Tăng gấp đôi áp suất âm thanh sẽ làm tăng gấp 4 cường độ trường âm thanh,
đòi hỏi gấp 4 lần công suất từ nguồn âm thanh.
*Cường độ âm thanh:
Cường độ âm thanh I là công suất âm thanh đi qua một đơn vị diện tích

là 1 cm
2
.
I = P/S = p.v(1.4) (1.4)
Ba đại lượng áp suất âm thanh, công suất âm thanh, cường độ âm thanh
gắn liền với nhau. Cả ba đều biểu thị độ lớn nhỏ của âm thanh. Âm thanh có
năng lượng càng lớn thì công suất, cường độ và áp suất của âm thanh càng
lớn.
*Phổ âm thanh:
Phổ tần của âm thanh là sự mô tả sự phân giải của nó thành các thành
phần tần số khác nhau và biên độ khác nhau. Thông thường: trục hoành là
thang tần số loga hoặc thang dải bát độ (hoặc phần bát độ) với mỗi điểm được
vẽ như trung bình nhân của các tần số giới hạn dải, thang tung độ là mức áp
suất âm thanh. Hiệu pha thường được bỏ qua (trừ khi chúng ảnh hưởng tới
mức âm thanh) do chóng thay đổi thật lớn theo vị trí đo, nhất là trong môi
trường phản xạ.
Phổ vạch là các đồ thị vạch đối với âm thanh chiếm ưu thế bởi các
thành phần tần số rời rạc. Phổ liên tục là các đường cong cho biết phân bố của
mức áp suất âm thanh bên trong dải tần với các thành phần bó chặt, tung độ
của đuờng cong phổ liên tục thường gọi là mức phổ. Phổ tổ hợp là thích hợp
đối với nhiều âm thanh trong đó các thành phần vạch mạnh chồng chập lên
phông phổ liên tục tản mạn hơn. Phổ octave (quãng tám) trong đó tung độ là
mức áp suất âm thanh đối với các dải rộng một octave, là rất thuận tiện để đo
và đặc trưng thiếu các chi tiết phổ tinh tế.
*Đặc trưng đáp ứng và méo:
6
Các tỉ số Ra/Vào phụ thuộc tần số là khổ dữ liệu thông dụng nhất trong
kỹ thuật điện tử âm tần. Thang tần số âm tần (20Hz đến 20KHz) thường là
thang loga, tung độ có thể là mức ra âm thanh hoặc điện theo đexiben khi tần
số thay đổi theo tín hiệu vào điện hoặc âm thanh không không đổi, hoặc nó có

thể là tỉ số của tín hiệu ra trên tín hiệu vào (biểu thị theo đexiben) chõng nào
chúng liên hệ tuyến tính bên trong khoảng đo.
Khi đo đặc tuyến tần số vào lọc từ đầu ra, thì suy ra đặc tuyến méo tần.
Nó có thể được lọc tiếp để thu được các đường cong cho mỗi hài nếu cần.
1.2.Tín hiệu và hệ thống.
1.2.1.Tín hiệu.
Tín hiệu audio là trường hợp riêng của tín hiệu, bởi vậy cơ sở của nó là
cơ sở về tín hiệu nói chung. Về mặt toán học, tín hiệu là hàm biểu diễn trạng
thái vật lý của hệ thống, nhìn chung tín hiệu là một hàm phức tạp của nhiều
thông số. Để đơn giản, người ta coi tín hiệu là hàm của biến thời gian. Tín
hiệu có các dạng cơ bản sau:
-Tín hiệu liên tục: Là tín hiệu được biểu diễn bằng hàm số có biến số
thời gian độc lập.
-Tín hiệu rời rạc: Còn gọi là tín hiệu trích mẫu. Là dãy giá trị liên tục ở
từng thời điểm rời rạc và tín hiệu đó được biểu diễn dưới dạng một dãy số.
Tín hiệu này gặp ở đầu ra mạch lượng tử theo thời gian (mạch trích mẫu).
-Tín hiệu rời rạc lượng tử theo biên độ: Là tín hiệu rời rạc được lượng
tử theo biên độ, thực chất là dãy các giá trị mẫu được qui tròn theo các mức
lượng tử biên độ. Tín hiệu này gặp ở đầu ra bộ lượng tử biên độ.
-Tín hiệu số: Là tín hiệu lượng tử theo biên độ và mã hoá.
Như vậy người ta phân chia tín hiệu làm 3 loại: tín hiệu liên tục, tín
hiệu rời rạc và tín hiệu số.
Các loại tín hiệu này có mặt ở các vị trí của sơ đồ biến đổi tín hiệu liên
7
tục thành tín hiệu số, hình 1.1.
Tín hiệu Tín hiệuTín hiệu Tín hiệu TÝn hiÖu TÝn
hiÖu TÝn hiÖu
liên tục rời rạc lượng tử theo biên độ sè rêi
r¹c lîng tö theo biªn ®é sè
Hình 1.1. Sơ đồ biến đổi tín hiệu liên tục thành tín hiệu số.

Hình 1.2. biểu diễn cụ thể dạng tín hiệu tương tự (hinh1.2.a), tín hiệu
rời rạc (hình 1.2.b), tínhiệu rời rạc theo biên độ (hình1.2.c) và tín hiệu sè
(hình1.2.d)
a)t t
8
Lîng tö
theo thêi
gian
Lîng tö
theo biªn ®é M· ho¸
b)t t
7
6
5
4
3
2
1
c)t t
100 110 111 110 100 001 001 100 111 110 100
001 001 100
d)t t
Hình 1.2. Các dạng tín hiệu trên bộ biến đổi số.
1.2.2.Hệ thống xử lý tín hiệu.
Quá trình xử lý tín hiệu là quá trình qua đó người ta thu được những tin
tức nhất định từ tín hiệu được xử lý, hoặc thực hiện sự biến đổi vì mục đích
nhất định.
Người ta phân chia hệ thống xử lý ra làm bốn loại:
9
-Hệ thống xử lý tín hiệu tương tự.

-Hệ thống xử lý tín hiệu rời rạc.
-Hệ thống xử lý tín hiệu số.
-Hệ thống xử lý tín hiệu tương tù - số.
Đối với tín hiệu số, có thể coi là một bộ phận nằm trong tín hiệu rời rạc,
bởi vậy lý thuyết về kỹ thuật xử lý tín hiệu rời rạc sẽ bao hàm và đúng cho cả
tín hiệu số. Một hệ thống xử lý tín hiệu tương tù - số là một hệ thống kết hợp
giữa hệ thống xử lý tín hiệu tương tự và tín hiệu số. Có thể mô tả mô hình các
hệ thống xử lý tín hiệu trên hình 1.3.
VàoRa Ra
Tín hiệu sốTín hiệu TÝn hiÖu
Tín hiệu rời rạc lượng tử theo lîng tö theo
Tín hiệu tương tựbiên độ biªn ®é
Hình 1.3.Mô hình các hệ thống xử lý tín hiệu.
1.2.3.Các hệ thống sử lý tín hiệu rời rạc.
Một hệ thống xử lý tín hiệu sẽ xác lập mối quan hệ nhân quả giữa tín
hiệu ra và tín hiệu vào. Tín hiệu vào gọi là tác động, còn tín hiệu ra gọi là đáp
ứng, hệ thống xử lý tín hiệu rời rạc được thực hiện qua các điều kiện ràng
buộc đối với phép biến đổi T[ ]. Mô hình một hệ thống xử lý tín hiệu rời rạc
10
M¹ch t¬ng tù
M¹ch rêi r¹c
M¹ch sè DAAD
Kh«i phôcLÊy mÉu
được mô tả trên hình 1.4.
X(n)Y(n) Y(n)
Tác độngĐáp ứng §¸p øng
Hình 1.4. Mô hình hệ thống xử lý tín hiệu rời rạc.
Điều kiện ràng buộc thường là mối quan hệ hàm số giữa đáp ứng và tác
động hoặc sự thay đổi của đáp ứng theo thời gian. Hệ thống xử lý tín hiệu rời
rạc được chia làm hai loại là: hệ tuyến tính và hệ phi tuyến.

Một hệ thống được gọi là tuyến tính nếu như nó thoả mãn nguyên lý
xếp chồng. Giả sử y
1
(n) và y
2
(n) là đáp ứng của hệ tương ứng với tác động
đầu vào x
1
(n) và x
2
(n), hệ là tuyến tính nếu:
T[ a.x
1
(n) + b.x
2
(n) ] = a.y
1
(n) + b.y
2
(n). (1.5)
Với a và b là hai hệ số tỷ lệ bất kỳ.
Một hệ thống gọi là phi tuyến nếu mối quan hệ giữa đáp ứng đầu ra và
tác động đầu vào không phải là tuyến tính, tức là hệ không thoả mãn nguyên
lý xếp chồng. Đối với các hệ phi tuyến rời rạc rất khó, nên thường nằm trong
các công trình nghiên cứu chuyên khảo. Bởi vậy thường chỉ xét với các hệ
tuyến tính, nghĩa là chỉ xét với các phép biến đổi T [ ] là tuyến tính.
Một hệ thống xử lý tuyến tính có thể được phân ra: hệ thay đổi theo
thời gian và hệ bất biến theo thời gian. Một hệ gọi là bất biến theo thời gian
nếu như đáp ứng y(n) đối với tác động x(n) thoả mãn tính chất y(n-k) là đáp
ứng của tác động x(n-k). Nghĩa là nếu tín hiệu vào bị dịch đi một đoạn thời

gian là k thì tín hiệu ra cũng chỉ dịch đi một đoạn là k.
Với hệ tuyến tính ta có:
11
T[ ]
(1.6)

ở đây h
k
(n) = T[δ(n-k)] gọi là đáp ứng xung của hệ đối với tác động đầu vào
là xung, δ(n-k) là tín hiệu xung một mẫu nằm tại thời điểm k.
Như vậy, mọi hệ tuyến tính và bất biến theo thời gian đều được tập
chung hoàn toàn bằng đáp ứng xung h(n). Biến h(n) ta hoàn toàn tính ra đáp
ứng y(n) của tín hiệu vào x(n).
(1.7)
Công thức (1.7) còn được gọi là tổng chập của hai tín hiệu x(n) và h(n)
và còn ký hiệu:
y(n) = x(n)*h(n) (1.8)
Khi xuất hiện khái niệm đáp ứng xung người ta còn dùa vào độ dài của
đáp ứng để phân loại hệ thống xử lý. Nếu theo độ dài của đáp ứng xung hệ
được phân ra làm hai loại: hệ có đáp ứng xung với độ dài hữu hạn và hệ có
đáp ứng dài vô hạn.
1.3. Biến đổi fourier.
Cùng với các công cụ biến đổi khác như biến đổi Z, biến đổi Walsh-
Hadamar, biến đổi Fourier là một công cụ mạnh và hữu hiệu trong biến đổi tín
hiệu nói chung và xử lý tín hiệu audio nói riêng. Biến đổi Fourier có thể thực
hiện trên cả hai loại tín hiệu analog và digital.
1.3.1. Hiểu biết về Fourier của tín hiệu.
Như ta đã biết bất kỳ tín hiệu liên tục x(t) nào tồn tại trong khoảng thời
gian ( t
0

, t
0
+T ) đều có thể biểu diễn dưới dạng:
(1.9)
Trong đó:
12
Như vậy, x(t) có thể biểu diễn bằng một số thực {a
0
,a
n
,b
n
}. Mối liên hệ giữa
tín hiệu x(t) và các hệ số phân tích qua định lý Parseval, như sau: Công suất
trung bình của tín hiệu x(t) bằng tổng công suất các thành phần chuỗi Fourier
của nó, tức là:
(1.10)
Từ công thức (1.10) ta thấy rằng: công suất của tín hiệu x(t) có thể xác
định bằng một tập số thực {a
0
2
,(a
n
2
+b
n
2
)/2}.
Dạng phức, có thể biểu diễn (1.9) dưới dạng phức bằng cách sử dụng
các công thức sau:

với
i
2
= (-1) (1.11)
Đưa vào hệ sè:
C
n
= (a
n
-ib
n
)/2 (1.12)
thay (1.11) và (1.12) vào công thức (1.9) và biến đổi ta nhận được:
13
(1.13)
ở đây:
Như vậy, tín hiệu x(t) cũng có thể biểu diễn bằng một tập số phức {c
n
},
từ công thức (1.13) có thể chứng minh được công thức sau:
(1.14)
Từ (1.14) thấy rằng: phân bố công suất trong x(t) có thể được biểu diễn
bằng một tập số thực { c
0
, 2|c
n
| }.
Công thức : C C
n
= ( a

n
- i b
n
) / 2
có thể viết:C C
n
= |C
n
| exp (i φ
n
)(1.15) (1.15)
ở đây : |C
n
| là modul của C
n

Minh hoạ hình học của (1.15) nêu trên hình 1.5.
Trục ảo
|C
n
| φ
n
0 Trục thực
Hình 1.5. Minh hoạ hình học của (1.15)
1.3.2. Biến đổi Fourier của tín hiệu.
14
Biểu diễn của tín hiệu x(t) theo trục tần số được gọi là phổ X(f) của tín
hiệu. Nếu x(t) là một dao động hình sin (tín hiệu đơn sắc) thì phổ của nó là
một vạch. Khi x(t) tuần hoàn thì phổ của nó gồm các vạch phổ biểu thị các
thành phần dao động hình sin của tín hiệu có các tần số bằng nguyên lần tần

số f
0
. Khi x(t) không tuần hoàn thì phổ của nó là một hàm của tần số và được
gọi là phổ đặc. Tín hiệu x(t) (không nhất thiết tuần hoàn) liên hệ với X(f)
thông qua cặp biến đổi Fourier:
Biến đổi thuận:
(1.16)
Biến đổi ngược:
(1.17)
Cặp biến đổi Fourier tồn tại nếu x(t) khả tích bình phương, tức là:
(1.18)
Biến đổi Fourier được dùng để biến đổi qua lại một cách duy nhất tín
hiệu giữa miền tần số và miền thời gian, vì vậy biến đổi Fourier là một công
cụ không thể thể thiếu trong phân tích, đánh giá và thiết kế các hệ thống.
Biến đổi Fourier có các tính chất sau:
+Tính tuyến tính:
nếu F[x
1
(t)] = X
1
(f)
và F
2
[x
2
(t)] = X
2
(f)
thì:
F[ax

1
(t) + bx
2
(t)] = aX
1
(f) + bX
2
(f)
với mọi a , b (1.19)
+Tính đối ngẫu :
15
nếu x(t) và X(f) là một cặp biến đổi Fourier thì :
F[X(t)] = x(-f) (1.20)
+Dịch trục thời gian:
F[x(t-t
0
)] = X(f).exp( -j2πft
0
) (1.21)
tức là dịch trục về mặt thời gian dẫn đến dịch pha trên miền tần
số, lượng dịch pha này tuyến tính với f.
+Dịch trục tần số:
F[x(t).exp(j2πf
0
t)] = X(f-f
0
) (1.22)
( mét ví dụ về ứng dụng của dịch trục tần số là:
việc điều chế biên độ:
F[x(t).cos2πf

0
t)] =[ X(f+f
0
) +X(f-f
0
)]/2) (1.23)
+Đổi thang thời gian:
(1.24)
+Đạo hàm:
(1.25)
tức là việc lấy đạo hàm tín hiệu trên miền thời gian dẫn tới việc nhân
phổ của nó với một lượng j2πf.
+Tích phân:
(1.26)
+Tích chập:
F[x(t)*h(t)] = X(f).H(f) (1.27)
và F[x
1
(t).x
2
(t)] = X
1
(f)*X
2
(f) (1.28)
tức là tích thường trên miền thời gian qua biến đổi Fourier sẽ dẫn đến
16
tích chập trên miền tần số và ngược lại.
1.3.3. Biến đổi Fourier nhanh(FFT).
Việc biểu diễn qua lại tín hiệu số trên các miền tần số và thời gian được

thực hiện thông qua các phép biến đổi thuận-ngược Fourier nhanh (FFT-
IFFT). Đặc biệt biến đổi Fourier nhanh là phép biến đổi được sử dụng nhiều
trong xử lý tín hiệu audio số chất lượng cao. Về bản chất, các phép biến đổi
này dùa trên việc lấy mẫu tín hiệu trên miền thời gian, do đó các tích phân của
biến đổi Fourier thường trở thành các tổng rời rạc (biến đổi Fourier rời rạc
DFT-Discrete Fourier Transform) và trên cơ sở nhóm một cách thích hợp các
mẫu sẽ tiết kiệm được số phép tính trong việc tính các tổng rời rạc, tức là tiết
kiệm được thời gian tính toán.
Để chứng minh điều này, ta có thể xét ví dụ sau.
Bài toán đặt ra là: Giả sử có dãy { X(m), m =0,1, ,N-1} nhận dược do
lấy mẫu tín hiệu liên tục X(t). Yêu cầu tính hệ số phân tích C
x
(k), theo công
thức biến đổi Fourier thuận:
(1.29)
Nếu như tính toán trực tiếp theo công thức (1.29) thì thời gian lâu và
nếu thực hiện trên máy tính thì số ô nhớ cần cho lưu trữ số liệu sẽ lớn khi N
lớn. Bởi vậy để tính nhanh được C
x
(k) dùng thuật toán biến đổi Fourier nhanh
để tính.
Giả sử ta xét với trường hợp khi N = 8. ta có công thức (1.29) như sau:
với:
m = 0,1, ,7
k = 0,1, ,7. (1.30)
17
Ta sử dụng dạng biểu diễn nhị phân đối với X(m), m, k trong quá trình
lập luận tìm thuật toán, với m và k đã cho ta có thể viết:
m = m
2

2
2
+ m
1
2
1
+ m
0
2
0
k = k
2
2
2
+ k
1
2
1
+ k
0
2
0
(1.31)
Với m
2
, m
1
, m
0
và k

2
, k
1
, k
0
có thể có các giá trị 0 hay 1, khi đó (1.30)
có thể viết:
(1.32)
ta ký hiệu:
(1.33)
để tính (1.33) ta thay biểu diễn nhị phân của k sẽ bằng:
(1.34)
W
4
= -1
lưu ý rằng:
(1.35)
thay (1.35) vào công thức (1.32) ta có:
(1.36)
Nhìn vào (1.36) nếu ta lấy tổng theo m
2
thì cuối cùng ta được một hàm
số phụ thuộc vào các biến k
0
, m
1
, m
0
mà thôi. Nghĩa là:
18

(1.37)
Thay (1.37) vào công thức (1.32), ta có:
(1.38)
Ta kí hiệu:
(1.39)
Ta tính M
1
theo m
1
, do W
2
= -i và thay k = 4k
2
+2k
1
+k
0
vào công thức
(1.29), ta có:
(1.40)
với:
lúc đó M
1
xác định theo công thức sau:
(1.41)
Nhìn vào công thức (1.41), sau khi lấy tổng theo m
1
, thì cuối cùng ta
được một hàm số phụ thuộc vào các biến k
0

, k
1
,và m
0
, nghĩa là:
(1.42)
Thay (1.42) vào công thức (1.32) ta được:
(1.43)
với:
và thay :
19
k = 4k k = 4k
2
+2k
1
+k
0

vào công thức (1.43), ta được:
(1.44)
Lấy tổng (1.44) theo m
0
, ta được một hàm số phụ thuộc vào các biến
k
0
, k
1
, k
2
, nghĩa là:

(1.45)
Từ (1.45) ta có thể viết:
áp dụng tính liên hợp ta chỉ cần tính:
C
x
(0), C
x
(1), C
x
(2), C
x
(3), C
x
(4).
còn:
Như vậy C
x
(k) ta phải tính bắt đầu bằng X
^
1
( ) rồi tính X
^
2
( ) cuối
cùng tính X
^
3
( ) , với N = 8 ta có 3 bước lặp:
Tính bước lặp 1:
Từ công thức (1.36), với:

20
ta có:
với: và
ứng với k
0
= 0 ta có 4 phương trình ứng với m
1
m
0
=(00,01,10,11)
trường hợp ứng với k
0
= 1 và m
1
m
0
=(00,01,10,11), ta có:
Tính bước lặp 2:
Từ công thức (1.41) và(1.42) với m
1
= {0,1} ta có:
k
1
k
0
nhận 4 giá trị (00,01,10,11)
m
0
nhận 2 giá trị (0,1), xảy ra các trường hợp sau:
Trường hợp k

1
k
0
= 00 , ứng với:
m
0
= 0 thì
m
0
= 1 thì
21
Trường hợp k
1
k
0
= 01 , ứng với:
m
0
= 0 thì
m
0
= 1 thì
Trường hợp k
1
k
0
= 10 , ứng với:
m
0
= 0 thì

m
0
= 1 thì
Trường hợp k
1
k
0
= 11 , ứng với:
m
0
= 0 thì
m m
0
= 1 thì
Tính bước lặp 3: TÝnh bíc lÆp 3:
Từ công thức (1.44) và (1.45) , ta có:
các biến k
0
, k
1
, k
2
nhận 8 giá trị, theo tính chất liên hợp phức ta
chỉ xét 5 trường hợp:
Trường hợp 1:
k
2
k
1
k

0
= 0 0 0 , có:
Trường hợp 2:
22
k
2
k
1
k
0
= 0 0 1 , có:
Trường hợp 3:
k
2
k
1
k
0
= 0 1 0 , có:
Trường hợp 4:
k
2
k
1
k
0
= 0 1 1 , có:
Trường hợp 5:
k
2

k
1
k
0
= 1 0 0 , có:
Từ các tính toán trên ta có:
Dùng tính chất liên hợp phức có thể tính, với k = 1,2,3, :
Tổng hợp tất cả các phương trình tính từ bước lặp 1 đến bước lặp 3, ta
hình thành được lược đồ thuật toán C
x
(k) với N = 8 trên hình 1.6.
X(0)X X
1
(0) X X
2
(0) X X
3
(0)C
C
x
(0)
X(1)X X
1
(1) X X
2
(1) X X
3
(1)C
23
C

x
(1)
X(2)X X
1
(2) X X
2
(2) X X
3
(2)C
C
x
(2)
X(3)X X
1
(3) X X
2
(3) X X
3
(3)C
C
x
(3)
X(4)X X
1
(4) X X
2
(4) X X
3
(4)C
C

x
(4)
X(5)X X
1
(5) X X
2
(5) X X
3
(5)C
C
x
(5)
X(6)X X
1
(6) X X
2
(6) X X
3
(6)C
C
x
(6)
X(7)X X
1
(7) X X
2
(7) X X
3
(7)C
C

x
(7)
Hình 1.6. Lược đồ thuật toán
1.4. Điều chế mã xung (pcm).
Dạng tiêu biểu của mã hoá dạng sóng là điều chế mã xung (PCM)
thường gặp nhất trong các hệ thống xử lý audio sè.
1.4.1. Nguyên tắc.
Điều chế xung mã PCM được thực hiện theo mét qui trình bốn bước có
tính nguyên tắc như sau:
a)Lọc nhằm hạn chế phổ tần của tín hiệu liên tục cần xử lý: Biến đổi
Fourier của tín hiệu liên tục thực tế là vô hạn theo biến tần số, chí Ýt còng do
thời gian tồn tại của chúng hữu hạn. Chính vì vậy, các tín hiệu liên tục cần xử
lý nhất thiết phải được lọc nhằm hạn chế phổ tới tần số cực đại W nào đó
nhằm thoả mãn tiền đề về băng tần hạn chế của định lý lấy mẫu.
b)Lấy mẫu: Tín hiệu liên tục sau lọc được rời rạc hoá nhờ lấy mẫu tín
hiệu liên tục bằng chuỗi xung nhịp có tần số f
s
theo địng lý lấy mẫu để có
được các tín hiệu điều biên xung (PAM-Pulse Amplitude Modulation).
c)Lượng tử hoá: Số giá trị có thể có của tín hiệu PAM sau lấy mẫu là
24
vụ hn, do vy s bit cn thit mó cỏc giỏ tr ca cỏc xung PAM l vụ hn
v iu ny khụng th thc hin c. hn ch s bit mó cn s dng, giỏ
tr ca tng xung PAM cn c lm trũn thnh mt trong cỏc giỏ tr mu xỏc
nh gi l cỏc mc lng t (cú s lng hu hn) v quỏ trỡnh ny c gi
l lng t hoỏ.
d)Mó hoỏ: Cỏc giỏ tr mc lng t ng vi cỏc xung PAM c mó
hoỏ bng t hp mó nh phõn thc hin trờn h thng x lý số.
S mụ t cỏc cụng on iu ch mó xung c th hin trờn s
hỡnh 1.7.

Tớn hiu Tớn hiu cú bng Cỏc xungCỏc xung PAMTớn hiu Tín hiệu có
băng Các xung Các xung PAM Tín hiệu
liờn tc hn ch PAMlng t hoỏ PCM hạn chế PAM
lợng tử hoá PCM
f
s
Hỡnh 1.7. S thc hin PCM.
1.4.2. Lc hn bng.
Ph ca tớn hiu audio t 20Hz n 20KHz. Vic ct b cỏc thnh phn
tn s ngoi núi trờn khụng gõy ra nhng mộo cm th c quỏ ln, tc l
khụng gõy ra nhng mộo th cm quỏ ln, tc l khụng gõy ra nhng tr ngi
c bit i vi quỏ trỡnh x lý audio. hn ch ph tớn hiu cú th tin
hnh loi b cỏc thnh phn tn s ln hn 20KHz, tc l cú th chn tn s
cc i ca tớn hiu audio l 20KHz. Trong trng hp ny, sai s lc hn
bng gõy ra ch yu l bi khụng th ch to c mch lc thụng thp lý
tng m ch cú th ch to c cỏc mch lc vi c tớnh lc khụng dc
ng ti tn s ct. khụng gõy nờn nhng mộo cú th th cm rừ rt c,
tn s ct ca mch lc hn bng phi chn cao hn 20KHz.
1.4.3. Ly mu.
25
Lọc Lấy
mẫu
Lợng
tử

hoá

×