Tải bản đầy đủ (.doc) (70 trang)

Nén tín hiệu audio theo tiêu chuẩn mpeg 2 và các ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (415.47 KB, 70 trang )

mở đầu
Trong những năm qua, cùng với kỹ thuật số hoá audio, kỹ thuật nén
cũng mang lại nhiều thành tựu tốt đẹp. Nó đà góp phần không nhỏ tạo điều
kiện cho việc xử lý, truyền, lu trữ ... thông tin đạt hiệu quả cao. Việc số hoá
tín hiệu đà giải quyết đợc những mâu thuẫn giữa khối lợng thông tin khổng lồ,
trong khi giải thông của các thiết bị có mức độ. Quá trình nén tín hiệu là biện
pháp hiệu quả cao trong việc giảm bớt dòng thông tin và nâng cao chất lợng
âm thanh.
Sự phát triển kỹ thuật số và việc ứng dụng công nghệ số vào các lĩnh
vực kỹ thuật, làm cho khái niệm về nén trở thành đề tài nóng hổi trong
nhữnh năm gần đây. Nhiều kỹ thuật nén mất và không mất thông tin đà đợc
phát triển trong nhiều năm qua, nhng chỉ có một số ít trong chúng có thể áp
dụng đợc cho việc nén tín hiệu audio số. Những tiêu chuẩn nén audio số mà ta
thờng gặp nh MPEG, AC-3, trong các hệ thống âm thanh hoặc hệ thống âm
thanh có hình ảnh đi kèm, trong đó tiêu chuẩn nén audio đợc dùng phổ biến
đó là tiêu chuẩn nén dòng số liệu audio số MPEG.
Trong các lĩnh vực truyền thanh, truyền hình và các mạng đa dịch vụ
khác, audio số đang là một xu thế phát triển mạnh, đặc biệt là ở nớc ta từ nay
cho đến năm 2005.
Đứng trớc nhu cầu bức bách của thực tế, đề tài Nén tín hiệu audio
theo tiêu chuẩn MPEG -2 và các ứng dụng mà tôi chọn, nhằm góp phần
hoàn thiện việc tập trung kiến thức, thông tin đầy đủ về kỹ thuật audio số,
đồng thời mở ra hớng nghiên cứu để tiếp cận nhanh với công nghệ hiện đại
trong thời đại ngày nay.
Đồ án trình bày 3 chơng:
Chơng 1: Cơ sở xử lý tín hiệu âm thanh.
Chơng này trình bày một số nét điển hình về cơ sở lý luận của xử lý tín
hiệu âm thanh (audio). Đó là những vấn đề lý luận chủ yếu liên quan tới quá
trình số hoá tín hiệu, biến ®ỉi tÝn hiƯu tõ miỊn thêi gian sang miỊn tÇn số, từ
đó ứng dụng nén tín tín hiệu audio.
Chơng 2: Nén tín hiệu au dio đà đợc số hoá.


1


Chơng này đi sâu về một số vấn đề về công nghệ nén, từ đó làm cơ sở
cho công việc nén tín hiệu audio đà đợc số hoá. Đồng thời đa ra sơ bộ các tiêu
chuẩn về nén tín hiệu audio.
Chơng 3: Nén tín hiệu âm thanh theo tiêu chuẩn MPEG-2.
Đây là nội dung chính của đề tài. Trong chơng này trình bày quá trình
phát triển của tiêu chuẩn MPEG, phơng pháp nén và giải nén audio của
tiêu chuẩn MPEG, đồng thời đi sâu phân tích kỹ các tiêu chuẩn nén MPEG-2.
Mặt khác cũng đa ra những ứng dụng thực tế tiêu chuẩn nén này.
Do điều kiện thời gian có hạn, Đồ án cha thể đi sâu vào nhiều khía cạnh
của lý thuyết và thực tế của công nghệ nén audio số. Song những vấn đề mà
luận văn đề cập tới là những yếu tố quan trọng đà và đang đợc thực hiện đa
vào sử dụng.
Nhân dịp này, bản thân xin chân thành cảm ơn sự hớng dẫn tận tình của
PSG-TSVũ Đức Lý, cùng toàn thể các thầy cô ở Khoa điện tử viễn thông đÃ
giảng dạy, truyền đạt kiến thức và tạo mọi điều kiện cho tôi hoàn thành bản đồ
án này./.

Chơng I

Cơ sở xử lý tín hiệu âm thanh
Để xử lý tín hiệu âm thanh, ngời ta sử dụng rất nhiều tới lý thuyết về tín
hiệu. Đặc biệt là vấn đề xử lý tín hiệu nh: biến đổi tÝn hiƯu tõ miỊn thêi gian
sang miỊn tÇn sè, sè hoá tín hiệu, trong đó những khâu lấy mẫu và mà hoá là
những khâu ảnh hởng trực tiếp tới nội dung và chất lợng xử lý, từ đó để nén đợc âm thanh đảm bảo chất lợng cao.
1.1. Âm thanh và các đặc tính của âm thanh.
1.1.1. Âm thanh.
Âm thanh là do vật thể rung động, phát ra tiếng và lan truyền trong

không khí, tai ta nghe đợc âm thanh là nhờ có màng nhĩ, nó đợc nối liền với
hệ thống thần kinh. Âm thanh cũng có thể lan truyền đợc trong các chất khí,
2


chất lỏng, chất rắn, v.v... nhng không lan truyền đợc trong khoảng chân
không. Một số chất truyền dẫn âm rất kém, thờng là loại mềm xốp, nh bông,
cỏ, dạ..., và đợc gọi là chất hút âm.
Vận tốc truyền lan của ©m thanh phơ thc vµo chÊt trun ©m. VÝ dơ
trong không khí là 340 m/s, trong nớc là 1480 m/s, trong sắt là 5000 m/s.
Trong không khí, tốc độ truyền lan phụ thuộc vào nhiệt độ và đợc tính
theo công thức:

C 331

T
(m / s)
273

Trong đó: T0 - là nhiệt độ tuyệt đối của không khí. (1.1)

Nh vậy nhiệt độ càng cao thì âm thanh truyền càng nhanh. Ngời ta thờng chọn C = 340 m/s, tốc độ tơng ứng với T0 = 290 0 K (tức là 170C).
1.1.2. Các đặc tính của âm thanh.
* Tần số:
Tần số biểu thị độ cao của âm thanh: tiếng trầm có tần số thấp, tiÕng
bỉng cã tÇn sè cao. Tai ngêi cã thĨ nghe thấy đợc các tần số thấp tới 16 Hz và
tần số cao tới 20 KHz. Dải tần số từ 16 Hz đến 20KHz gọi là giải tần số âm
thanh, gọi tắt là âm tần. Những âm có tần số dới 16 Hz gọi là hạ âm, những
âm có tần số trên 20KHz gọi là siêu âm. Dòng điện có tần số trong khoảng
16Hz đến 20KHz gọi là dòng điện âm tần.

Trong dải âm tần, ngời ta chia ra: tiếng trầm tõ 16Hz ®Õn 300Hz, tiÕng
trung tõ 300Hz ®Õn 3000Hz, tiÕng thanh từ 3000Hz đến 20000Hz.
*áp suất âm thanh:
Sóng âm trên không là dạng nhiễu loạn vật lý trong không khí, môi trờng đàn hồi. Độ lớn tức thời của sóng ở thời điểm riêng trong không gian và
thời gian có thể đợc biểu diễn theo những cách khác nhau. Tuy nhiên, tính
chất đợc sử dụng và đo rộng rÃi nhất của sóng âm là áp suất âm thanh, thăng
giáng trên và dới áp suất khí quyển do sóng gây ra, áp suất âm thanh gọi tắt là
thanh áp, áp suất đo âm thanh tạo thêm ra ở một điểm gọi là thanh áp ở điểm
đó.
Đơn vị đo thanh áp là: Bar . Một bar là thanh áp tác động lên mét diƯn
tÝch 1cm 2 mét lùc 1 ®in, hay 1 bar = 1 ®in/cm 2 .
3


Ngày nay, ngời ta thờng sử dụng đơn vị Pascan (Pa) đo thanh áp. Với: 1
bar = 100 KPa ; 1Pa = 1 N/m 2 .
*Mức áp suất âm thanh:
áp suất âm thanh quan trọng đối với kỹ thuật điện tư n»m trong kho¶ng
tõ tiÕng ån u nhÊt vèn cã thể gây nhiễu cho ghi âm tới những âm thanh
mạnh nhất mà màng loa có thể phát ra, khoảng này xấp xỉ 10 6. Do đó các áp
suất âm thanh thờng đợc vẽ trên thang loga, gọi là mức áp suất âm thanh biểu
thị theo đexiben (dB).
Đexiben là đơn vị dợc dùng cho nhiều mục đích trong kỹ thuật điện tử,
bắt nguồn từ kỹ thuật âm tần (trong điện thoại) và đợc gọi theo tên của
A.G.Bell. áp suất chuẩn đối với âm thanh trong không khí, tơng ứng với 0dB,
đợc định nghĩa nh áp suất âm thanh 20 àPa (trớc đây là 0,00002đin/cm2 ). Đó
là áp suất âm thanh chuẩn p0 . Nh vậy mức áp suất âm thanh LP theo đexiben tơng ứng với áp suất âm thanh p đợc định nghĩa bởi:
LP = 20 log (p/p0) dB
(1.2)
áp suất chuẩn P0 xấp xỉ áp suất âm thanh nghe đợc yếu nhất ở 2000Hz.

Do đó, phần lớn các giá trị dB của mức áp suất âm thanh đều có dấu dơng.
*Công suất âm thanh:
Công suất âm thanh là năng lợng ©m thanh ®i qua mét diƯn tÝch S trong
thêi gian 1 giây. Công suất âm thanh có thể tính bằng công thức:
P = p.s.v
(1.3)
Trong đó: p là thanh áp, v là tốc độ dao động của một phần tử không
khí tại đó và s là diện tích. Công suất âm thanh tính theo Oát (W).
Công suất âm thanh nói chung tỉ lệ với bình phơng áp suất âm thanh.
Tăng gấp đôi áp suất âm thanh sẽ làm tăng gấp 4 cờng độ trờng âm thanh, đòi
hỏi gấp 4 lần công suất từ nguồn âm thanh.
*Cờng độ âm thanh:
Cờng độ âm thanh I là công suất âm thanh đi qua một đơn vị diện tích
là 1 cm2.
I = P/S = p.v
(1.4)
Ba đại lợng áp suất âm thanh, công suất âm thanh, cờng độ âm thanh
gắn liền với nhau. Cả ba đều biểu thị độ lớn nhỏ của âm thanh. Âm thanh có
năng lợng càng lớn thì công suất, cờng độ và áp suất của âm thanh càng lớn.
*Phổ âm thanh:
4


Phổ tần của âm thanh là sự mô tả sự phân giải của nó thành các thành
phần tần số khác nhau và biên độ khác nhau. Thông thờng: trục hoành là
thang tần số loga hoặc thang dải bát độ (hoặc phần bát độ) với mỗi điểm đợc
vẽ nh trung bình nhân của các tần số giới hạn dải, thang tung độ là mức áp
suất âm thanh. Hiệu pha thờng đợc bỏ qua (trừ khi chúng ảnh hởng tới mức
âm thanh) do chúng thay đổi thật lớn theo vị trí đo, nhất là trong môi trờng
phản xạ.

Phổ vạch là các đồ thị vạch đối với âm thanh chiếm u thế bởi các thành
phần tần số rời rạc. Phổ liên tục là các đờng cong cho biết phân bố của mức áp
suất âm thanh bên trong dải tần với các thành phần bó chặt, tung độ của đuờng
cong phổ liên tục thờng gọi là mức phổ. Phổ tổ hợp là thích hợp đối với nhiều
âm thanh trong đó các thành phần vạch mạnh chồng chập lên phông phổ liên
tục tản mạn hơn. Phổ octave (quÃng tám) trong đó tung độ là mức áp suất âm
thanh đối với các dải rộng một octave, là rất thuận tiện để đo và đặc trng thiếu
các chi tiết phổ tinh tế.
*Đặc trng đáp ứng và méo:
Các tỉ số Ra/Vào phụ thuộc tần số là khổ dữ liệu thông dụng nhất trong
kỹ thuật điện tử âm tần. Thang tần số âm tần (20Hz đến 20KHz) thờng là
thang loga, tung độ có thể là mức ra âm thanh hoặc điện theo đexiben khi tần
số thay đổi theo tín hiệu vào điện hoặc âm thanh không không đổi, hoặc nó có
thể là tỉ số của tín hiệu ra trên tín hiệu vào (biểu thị theo đexiben) chừng nào
chúng liên hệ tuyến tính bên trong khoảng đo.
Khi đo đặc tuyến tần số vào lọc từ đầu ra, thì suy ra đặc tuyến méo tần.
Nó có thể đợc lọc tiếp để thu đợc các đờng cong cho mỗi hài nếu cần.
1.2.Tín hiệu và hệ thống.
1.2.1.Tín hiệu.
Tín hiệu audio là trờng hợp riêng của tín hiệu, bởi vậy cơ sở của nó là
cơ sở về tín hiệu nói chung. Về mặt toán học, tín hiệu là hàm biểu diễn trạng
thái vật lý của hệ thống, nhìn chung tín hiệu là một hàm phức tạp của nhiều
thông số. Để đơn giản, ngời ta coi tÝn hiƯu lµ hµm cđa biÕn thêi gian. TÝn hiệu
có các dạng cơ bản sau:
-Tín hiệu liên tục: Là tín hiệu đợc biểu diễn bằng hàm số có biến số thời
gian độc lập.
-Tín hiệu rời rạc: Còn gọi là tín hiệu trích mẫu. Là dÃy giá trị liên tục ë
5



từng thời điểm rời rạc và tín hiệu đó đợc biểu diễn dới dạng một dÃy số. Tín
hiệu này gặp ở đầu ra mạch lợng tử theo thời gian (mạch trích mẫu).
-Tín hiệu rời rạc lợng tử theo biên độ: Là tín hiệu rời rạc đợc lợng tử
theo biên độ, thực chất là dÃy các giá trị mẫu đợc qui tròn theo các mức lợng
tử biên độ. Tín hiệu này gặp ở đầu ra bộ lợng tử biên độ.
-Tín hiệu số: Là tín hiệu lợng tử theo biên độ và mà hoá.
Nh vậy ngời ta phân chia tín hiệu làm 3 loại: tín hiệu liên tục, tín hiệu
rời rạc và tín hiệu số.
Các loại tín hiệu này có mặt ở các vị trí của sơ đồ biến đổi tín hiệu liên
tục thành tín hiệu số, hình 1.1.
Lợng tử
theo thời
gian

Tín hiệu
liên tục

Lợng tử
theo biên độ

Tín hiệu
rời rạc

MÃ hoá

Tín hiệu
lợng tử theo biên độ

Tín hiệu
số


Hình 1.1. Sơ đồ biến đổi tín hiệu liên tục thành tín hiệu số.
Hình 1.2. biểu diễn cụ thể dạng tín hiệu tơng tự (hinh1.2.a), tín hiệu rời
rạc (hình 1.2.b), tínhiệu rời rạc theo biên độ (hình1.2.c) và tÝn hiƯu sè
(h×nh1.2.d)

a)

t

6


b)

t

7
6
5
4
3
2
1

c)

t
100


110

111

110

100

001

001 100

d)

t

Hình 1.2. Các dạng tín hiệu trên bộ biến đổi số.
1.2.2.Hệ thống xử lý tín hiệu.
Quá trình xử lý tín hiệu là quá trình qua đó ngời ta thu đợc những tin
tức nhất định từ tín hiệu đợc xử lý, hoặc thực hiện sự biến đổi vì mục đích nhất
định.
Ngời ta phân chia hệ thống xử lý ra làm bốn loại:
-Hệ thống xử lý tín hiệu tơng tự.
-Hệ thống xư lý tÝn hiƯu rêi r¹c.
-HƯ thèng xư lý tÝn hiƯu sè.
-HƯ thèng xư lý tÝn hiƯu t¬ng tù - số.
Đối với tín hiệu số, có thể coi là một bé phËn n»m trong tÝn hiƯu rêi r¹c,
bëi vËy lý thut vỊ kü tht xư lý tÝn hiƯu rêi r¹c sẽ bao hàm và đúng cho cả
tín hiệu số. Một hƯ thèng xư lý tÝn hiƯu t¬ng tù - sè là một hệ thống kết hợp
giữa hệ thống xử lý tín hiệu tơng tự và tín hiệu số. Có thể mô tả mô hình các

7


hệ thống xử lý tín hiệu trên hình 1.3.
Mạch tơng tự

Vào

Lấy mẫu

Mạch rời rạc

AD

Mạch số
DA
Tín hiệu số
Tín hiệu rời rạc
Tín hiệu tơng tự

Khôi phục

Ra

Tín hiệu
lợng tử theo
biên độ

Hình 1.3.Mô hình c¸c hƯ thèng xư lý tÝn hiƯu.
1.2.3.C¸c hƯ thèng sư lý tÝn hiƯu rêi r¹c.

Mét hƯ thèng xư lý tÝn hiệu sẽ xác lập mối quan hệ nhân quả giữa tÝn
hiƯu ra vµ tÝn hiƯu vµo. TÝn hiƯu vµo gäi là tác động, còn tín hiệu ra gọi là đáp
ứng, hệ thống xử lý tín hiệu rời rạc đợc thực hiện qua các điều kiện ràng buộc
đối với phép biến đổi T[ ]. Mô hình một hệ thống xử lý tín hiệu rời rạc đợc mô
tả trên hình 1.4.
X(n)
Tác động

T[ ]

Y(n)
Đáp ứng

Hình 1.4. Mô hình hệ thống xử lý tín hiệu rời rạc.
Điều kiện ràng buộc thờng là mối quan hệ hàm số giữa đáp ứng và tác
động hoặc sự thay đổi của đáp ứng theo thời gian. Hệ thống xử lý tín hiệu rời
rạc đợc chia làm hai loại lµ: hƯ tun tÝnh vµ hƯ phi tun.
Mét hƯ thèng đợc gọi là tuyến tính nếu nh nó thoả mÃn nguyên lý xếp
chồng. Giả sử y1(n) và y2(n) là đáp ứng của hệ tơng ứng với tác động đầu vào
x1(n) vµ x2(n), hƯ lµ tun tÝnh nÕu:
T[ a.x1(n) + b.x2(n) ] = a.y1(n) + b.y2(n). (1.5)
Víi a vµ b lµ hai hÖ sè tû lÖ bÊt kú.
8


Mét hƯ thèng gäi lµ phi tun nÕu mèi quan hệ giữa đáp ứng đầu ra và
tác động đầu vào không phải là tuyến tính, tức là hệ không thoả mÃn nguyên
lý xếp chồng. Đối với các hệ phi tuyến rời rạc rất khó, nên thờng nằm trong
các công trình nghiên cứu chuyên khảo. Bởi vậy thờng chỉ xét với các hệ
tuyến tính, nghĩa là chỉ xét với các phép biến đổi T [ ] là tuyến tính.

Một hệ thống xử lý tuyến tính có thể đợc phân ra: hệ thay đổi theo thời
gian và hệ bất biến theo thời gian. Mét hƯ gäi lµ bÊt biÕn theo thêi gian nếu
nh đáp ứng y(n) đối với tác động x(n) thoả mÃn tính chất y(n-k) là đáp ứng
của tác động x(n-k). Nghĩa là nếu tín hiệu vào bị dịch đi một đoạn thời gian là
k thì tín hiệu ra cũng chỉ dịch đi một đoạn là k.
Với hệ tuyến tính ta cã:






k 

k 

k 

y ( n) T [  x ( k ). ( n  k )]  x( k ).T [ ( n  k )]  x( k ).hk ( n).

(1.6)
ở đây hk(n) = T[(n-k)] gọi là đáp ứng xung của hệ đối với tác động đầu vµo lµ
xung, δ(n-k) lµ tÝn hiƯu xung mét mÉu n»m tại thời điểm k.
Nh vậy, mọi hệ tuyến tính và bất biến theo thời gian đều đợc tập chung
hoàn toàn bằng đáp ứng xung h(n). Biến h(n) ta hoàn toàn tính ra đáp ứng y(n)
của tín hiệu vào x(n).


y ( n)   x (k ).h(n  k ).


(1.7)

k 

C«ng thức (1.7) còn đợc gọi là tổng chập của hai tín hiệu x(n) và h(n)
và còn ký hiệu:
y(n) = x(n)*h(n)
(1.8)
Khi xuất hiện khái niệm đáp ứng xung ngời ta còn dựa vào độ dài của
đáp ứng để phân loại hệ thống xử lý. Nếu theo độ dài của đáp ứng xung hệ đợc
phân ra làm hai loại: hệ có đáp ứng xung với độ dài hữu hạn và hệ có đáp ứng
dài vô hạn.
1.3. Biến đổi fourier.
Cùng với các công cụ biến đổi khác nh biến đổi Z, biến đổi WalshHadamar, biến đổi Fourier là một công cụ mạnh và hữu hiệu trong biến đổi tín
hiệu nói chung và xử lý tín hiệu audio nói riêng. Biến đổi Fourier có thể thực
hiện trên cả hai loại tín hiệu analog và digital.
9


1.3.1. HiĨu biÕt vỊ Fourier cđa tÝn hiƯu.
Nh ta ®· biết bất kỳ tín hiệu liên tục x(t) nào tồn tại trong khoảng thời
gian ( t0 , t0+T ) đều cã thĨ biĨu diƠn díi d¹ng:
x(t ) a0   an cos n 0 (t )  bn sin n 0 (t )

(1.9)

Trong ®ã:
2
T
1

a0  x(t ) dt
TT
1
a n  x (t ) cos  0 tdt
TT
1
bn  x (t ) sin  0 tdt
TT

0 

Nh vËy, x(t) cã thÓ biĨu diƠn b»ng mét sè thùc {a 0,an,bn}. Mèi liªn hệ giữa tín
hiệu x(t) và các hệ số phân tích qua định lý Parseval, nh sau: Công suất trung
bình của tín hiệu x(t) bằng tổng công suất các thành phần chuỗi Fourier của
nó, tức là:
1 2
1
x (t )dt a02   ( an  bn ).

TT
2 n 1

(1.10)

Tõ c«ng thøc (1.10) ta thÊy r»ng: c«ng st cđa tÝn hiƯu x(t) có thể xác
định bằng một tập số thực {a02 ,(an2+bn2)/2}.
D¹ng phøc, cã thĨ biĨu diƠn (1.9) díi d¹ng phøc bằng cách sử dụng các
công thức sau:
e in t e
cos n 0 t 

2i
in t  e
e
sin n 0 t
2i
0

0

in 0 t

;

in 0 t

;

với

i2= (-1)

(1.11)

Đa vào hệ số:

Cn= (an-ibn)/2

(1.12)
thay (1.11) và (1.12) vào công thức (1.9) và biến đổi ta nhận đợc:
x (t )




c

n

e in t .
0

n

(1.13)
10


ở đây:
1
c0 a0 x (t ) dt.
T T
1
c n  x (t )e  in t dt.
T T
0

Nh vËy, tÝn hiƯu x(t) cịng cã thĨ biĨu diƠn b»ng mét tËp sè phøc {c n},
tõ c«ng thøc (1.13) cã thĨ chứng minh đợc công thức sau:

1
2

x 2 (t )dt c02  2 cn .

TT
n 1

(1.14)

Tõ (1.14) thÊy r»ng: ph©n bè công suất trong x(t) có thể đợc biểu diễn
bằng một tËp sè thùc { c0, 2|cn| }.
C«ng thøc :
Cn = ( an- i bn ) / 2
cã thÓ viÕt:

Cn = |Cn| exp (i n)

ở đây :

|Cn| là modul của Cn


b

arctg n ;
n
an

0 ;

(1.15)


n 1,2,....
n 0

Minh hoạ hình học của (1.15) nêu trên hình 1.5.
Trục ảo

|Cn|

0

n
Trục thực

Hình 1.5. Minh hoạ hình học của (1.15)
1.3.2. Biến đổi Fourier của tín hiƯu.
BiĨu diƠn cđa tÝn hiƯu x(t) theo trơc tÇn sè đợc gọi là phổ X(f) của tín
hiệu. Nếu x(t) là một dao động hình sin (tín hiệu đơn sắc) thì phổ của nó là
một vạch. Khi x(t) tuần hoàn thì phổ của nó gồm các vạch phổ biểu thị các
thành phần dao động hình sin của tín hiệu có các tần số bằng nguyên lần tần
số f0. Khi x(t) không tuần hoàn thì phổ của nó là một hàm của tần số và đợc
gọi là phổ đặc. Tín hiệu x(t) (không nhất thiết tuần hoàn) liên hệ với X(f)
11


thông qua cặp biến đổi Fourier:
Biến đổi thuận:


X ( f ) F [ x (t )]  x (t ).e


j 2ft

(1.16)

dt.



Biến đổi ngợc:


(1.17)

x (t ) F 1 [ X ( f )]  X ( f ).e j 2ft df .


Cặp biến đổi Fourier tồn tại nếu x(t) khả tích bình phơng, tức là:


x (t )

2

(1.18)

dt



Biến đổi Fourier đợc dùng để biến đổi qua lại một cách duy nhất tín

hiệu giữa miền tần số và miền thời gian, vì vậy biến đổi Fourier là một công
cụ không thể thể thiếu trong phân tích, đánh giá và thiết kế các hệ thống.
Biến đổi Fourier có các tính chất sau:
+Tính tuyến tính:
nếu F[x1(t)] = X1(f)

F2[x2(t)] = X2(f)
thì:
F[ax1(t) + bx2(t)] = aX1(f) + bX2(f)
víi mäi a , b
(1.19)
+TÝnh ®èi ngẫu :
nếu x(t) và X(f) là một cặp biến đổi Fourier thì :
F[X(t)] = x(-f)
(1.20)
+Dịch trục thời gian:
F[x(t-t0)] = X(f).exp( -j2ft0)
(1.21)
tức là dịch trục về mặt thời gian dẫn đến dịch pha trên miền tần
số, lợng dịch pha này tuyến tính với f.
+Dịch trục tần số:
F[x(t).exp(j2f0t)] = X(f-f0)
(1.22)
( một ví dụ về ứng dụng của dịch trục tần số là:
việc điều chế biên độ:
F[x(t).cos2f0t)] =[ X(f+f0) +X(f-f0)]/2)
+Đổi thang thời gian:

(1.23)


12


F [ x ( at )] 

1
. X ( f / a ).
a

(1.24)

+Đạo hàm:
dx
F j 2f . X ( f ).
 dt 

(1.25)

tøc lµ viƯc lÊy đạo hàm tín hiệu trên miền thời gian dẫn tới việc nhân
phổ của nó với một lợng j2f.
+Tích phân:
t

F [ x( )d 


1
1
. X ( f )  X (0). ( f ).
j 2f

2

(1.26)
+TÝch chËp:
F[x(t)*h(t)] = X(f).H(f)
(1.27)

F[x1(t).x2(t)] = X1(f)*X2(f)
(1.28)
tøc lµ tích thờng trên miền thời gian qua biến đổi Fourier sẽ dẫn đến
tích chập trên miền tần số và ngợc lại.
1.3.3. Biến đổi Fourier nhanh(FFT).
Việc biểu diễn qua lại tín hiệu số trên các miền tần số và thời gian đợc
thực hiện thông qua các phép biến đổi thuận-ngợc Fourier nhanh (FFT-IFFT).
Đặc biệt biến đổi Fourier nhanh là phép biến ®ỉi ®ỵc sư dơng nhiỊu trong xư
lý tÝn hiƯu audio số chất lợng cao. Về bản chất, các phép biến đổi này dựa trên
việc lấy mẫu tín hiệu trên miền thời gian, do đó các tích phân của biến đổi
Fourier thờng trở thành các tổng rời rạc (biến đổi Fourier rời rạc DFT-Discrete
Fourier Transform) và trên cơ sở nhóm một cách thích hợp các mẫu sẽ tiết
kiệm đợc số phép tính trong việc tính các tổng rời rạc, tức là tiết kiệm đợc thời
gian tính toán.
Để chứng minh điều này, ta có thể xét ví dụ sau.
Bài toán đặt ra là: Giả sử có dÃy { X(m), m =0,1,...,N-1} nhận dợc do
lấy mẫu tín hiệu liên tục X(t). Yêu cầu tính hệ số phân tích C x(k), theo công
thức biến ®æi Fourier thuËn:
N1

C x (k )  X (m).W km .

(1.29)


m 0

Nếu nh tính toán trực tiếp theo công thức (1.29) thì thời gian lâu và nếu
thực hiện trên máy tính thì số ô nhớ cần cho lu trữ số liƯu sÏ lín khi N lín. Bëi
13


vậy để tính nhanh đợc Cx(k) dùng thuật toán biến ®ỉi Fourier nhanh ®Ĩ tÝnh.
Gi¶ sư ta xÐt víi trêng hợp khi N = 8. ta có công thức (1.29) nh sau:
7

C x (k )  X (m).W km .
m 0

víi:
m = 0,1,...,7
k = 0,1,...,7.
(1.30)
Ta sư dơng d¹ng biĨu diƠn nhị phân đối với X(m), m, k trong quá trình
lập luận tìm thuật toán, với m và k đà cho ta cã thÓ viÕt:
m = m222 + m121 + m020
k = k222 + k121 + k020
(1.31)
Víi m2 , m1 , m0 vµ k2 , k1 , k0 cã thĨ cã các giá trị 0 hay 1, khi đó (1.30)
có thể viÕt:



C x (k )    X (m0 , m1 , m2 ).W 4 km .W 4 km W 4 km .

2

m0

m1

0

1

m2

(1.32)
ta ký hiÖu:
(1.33)


M 2  X (m2 , m1 , m0 ).W 4 km

2

m2

®Ĩ tÝnh (1.33) ta thay biểu diễn nhị phân của k sẽ bằng:


C x ( k )  X (m0 , m1 , m2 ).W 4 km ( 4 k
2

2  2 k1  k 0 )


m2

(1.34)
W4 = -1
lu ý r»ng:

 1m ( 4 k 2 k k ) 1
2

2

1

(1.35)

0

thay (1.35) vào công thức (1.32) ta cã:


M 2  X ( m2 , m1 , m0 ).( 1k m ).
0

2

(1.36)

m2


Nhìn vào (1.36) nếu ta lấy tổng theo m2 thì cuối cùng ta đợc một hàm
số phụ thuộc vào các biến k0 , m1 , m0 mà thôi. Nghĩa là:
14




(1.37)

M 2  X (k 0 , m1 , m0 ).

Thay (1.37) vào công thức (1.32), ta có:


C x (k )   X (k 0 , m1 , m0 ).W 2 km .W km .
0

1

m0

m1

(1.38)
Ta kÝ hiÖu:


M 1  X 1 ( k 0 , m1 , m0 ).W 2 km .

(1.39)


1

m1

Ta tÝnh M1 theo m1, do W2 = -i và thay k = 4k2+2k1+k0 vào công thức
(1.29), ta cã:


M 1  X 1 ( k 0 , m1 , m0 ).( i ) ( 4 k

2  2 k1  k 0

) m1

.

(1.40)

m1

víi:
( i ) 4 k m 1.
2

1

lúc đó M1 xác định theo công thức sau:



M 1  X 1 (k 0 , m1 , m0 ).( i ) ( 2 k k
1

0

) m1

.

(1.41)

m1

Nhìn vào công thức (1.41), sau khi lÊy tỉng theo m 1, th× ci cùng ta đợc một hàm số phụ thuộc vào các biÕn k0 , k1 ,vµ m0 , nghÜa lµ:


(1.42)

M 1  X 2 (k 0 , m1 , m0 ).

Thay (1.42) vào công thức (1.32) ta đợc:


C x (k ) M 0  X 2 (k 0 , m1 , m0 ).W km .

(1.43)

0

m0


víi:
1 i
W 
.
2

vµ thay :
k = 4k2+2k1+k0
vµo công thức (1.43), ta đợc:

1 i (4k
C x (k ) M 0  X 2 (k 0 , m1 , m0 ).(
)
m
2

2  2 k1  k 0 ) m0

.

0

(1.44)
Lấy tổng (1.44) theo m0 , ta đợc một hàm số phụ thuộc vào các biến k 0,
15


k1, k2 , nghÜa lµ:



C x (k 2 , k1 , k 0 ) M 0  X (k 0 , k1 , k 2 ).

(1.45)

Tõ (1.45) ta cã thÓ viÕt:




C x (0) C x (000)  X 3 (000)  X 3 (0).




C x (1) C x (001)  X 3 (001)  X 3 (1).
.....................................................




C x (7) C x (111)  X 3 (111)  X 3 (7).

¸p dụng tính liên hợp ta chỉ cần tính:
Cx(0), Cx(1), Cx(2), Cx(3), Cx(4).
cßn:


C x (5) C x (1)  X 3 (4).



C x (6) C x (2)  X 3 ( 2).


C x (7) C x (3)  X 3 (6).

Nh vậy Cx(k) ta phải tính bắt đầu bằng X ^1(...) råi tÝnh X^2(...) cuèi cïng
tÝnh X^3(...) , víi N = 8 ta có 3 bớc lặp:
Tính bớc lặp 1:
Từ công thøc (1.36), víi:
1
m2 
0

ta cã:



k
X ( k 0 , m1 , m0 )  X 0 (0, m , m )  X (1, m , m ).( 1) n
1
2
0
1
2

víi:

0
k 0 

1



00
 01

m1 m2 
10

11

øng víi k0 = 0 ta có 4 phơng trình ứng với m1m0 =(00,01,10,11)



















X 1 (000)  X (000)  X (100)  X 1 (0)  X (0)  X ( 4).


X 1 (001)  X (001)  X (101)  X 1 (1)  X (1)  X (5).


X 1 (010)  X (010)  X (110)  X 1 (2)  X (2)  X (6).


X 1 (011)  X (011)  X (111)  X 1 (3)  X (3)  X (7).

trờng hợp ứng với k0 = 1 và m1m0 =(00,01,10,11), ta cã:
16





















X 1 (100)  X (000)  X (100)  X 1 (4)  X (0)  X ( 4).


X 1 (101)  X (001)  X (101)  X 1 (5)  X (1)  X (5).


X 1 (110)  X (010)  X (110)  X 1 (6)  X ( 2)  X (6).


X 1 (111)  X (011)  X (111)  X 1 (7)  X (3) X (7).

Tính bớc lặp 2:
Từ công thức (1.41) vµ(1.42) víi m1 = {0,1} ta cã:






X ( k 0 , k1 , m0 )  X ( k 0 ,0, m0 )  (  i ) ( 2 k1  k0 ) . X ( k 0 ,1, m0 )

k1 k0 nhận 4 giá trị (00,01,10,11)
m0 nhận 2 giá trị (0,1), xảy ra các trờng hợp sau:
Trờng hỵp k1 k0 = 00 , øng víi:













m0 = 0 th×

X 2 (000)  X 1 (000)  X 1 (010)  X 2 (0)  X 1 (0)  X 1 (2)

m0 = 1 th×

X 2 (001)  X 1 (001)  X 1 (011)  X 2 (1)  X 1 (1)  X 1 (3)

Trêng hỵp k1 k0 = 01 , øng víi:













m0 = 0 th×

X 2 (100)  X 1 (100)  i X 1 (110)  X 2 (4)  X 1 (4)  iX 1 (6)

m0 = 1 th×

X 2 (101)  X 1 (101)  i X 1 (111)  X 2 (5)  X 1 (5)  iX 1 (7)

000  C x (0)
001  C (1)
x






C x (k )  X 3 (k 0 , k1 , k 2 )  X 3 010  C x (2)
011  C (3)
x





C
( 4)
100



x

Trêng hỵp k1 k0 = 10 , øng víi:












m0 = 0 th×

X 2 (010)  X 1 (000)  X 1 (010)  X 2 (2)  X 1 (0)  X 1 (2)

m0 = 1 th×

X 2 (011)  X 1 (001)  X 1 (011)  X 2 (3)  X 1 (1)  X 1 (3)

Trêng hỵp k1 k0 = 11 , øng víi:











m0 = 0 th×

X 2 (110)  X 1 (100)  ( i ) 3 X 1 (110)  X 2 (6)  X 1 (4)  iX 1 (6)

m0 = 1 th×

X 2 (111)  X 1 (101)  ( i ) 3 X 1 (111)  X 2 (7)  X 1 (5) iX 1 (7)



Tính bớc lặp 3:
Từ công thức (1.44) vµ (1.45) , ta cã:

17






X 3 ( k 0 k1 k 2 )  X 2 ( k 0 k1 m0 ).W ( 4 k2  2 k1  k0 ) m0 
m0






 X 2 ( k 0 k1 0)  X 2 ( k 0 k11).W ( 4 k2  2 k1  k0 )

c¸c biÕn k0 , k1 , k2 nhËn 8 giá trị, theo tính chất liên hợp phức ta
chỉ xét 5 trêng hỵp:
Trêng hỵp 1:
k2 k1 k0 = 0 0 0 , cã:






X 3 (000)  X 2 (000)  X 2 (001)  X 3 (0)  X 2 (0)  X 2 (1).

Trêng hỵp 2:
k2 k1 k0 = 0 0 1 , cã:






X 3 (100)  X 2 (100)  W 1 X 2 (101)  X 3 ( 4)  X 2 ( 4)  W 1 X 2 (5).

Trêng hỵp 3:
k2 k1 k0 = 0 1 0 , cã:







X 3 (010)  X 2 (010)  W 2 X 2 (011)  X 3 (2)  X 2 (2)  W 2 X 2 (3).

Trêng hỵp 4:
k2 k1 k0 = 0 1 1 , cã:






X 3 (110)  X 2 (110)  W 3 X 2 (111)  X 3 (6)  X 2 (6)  W 3 X 2 (7).

Trêng hỵp 5:
k2 k1 k0 = 1 0 0 , cã:






X 3 (001)  X 2 (000)  W 4 X 2 (001)  X 3 (1)  X 2 (0)  W 4 X 2 (1).

Từ các tính toán trên ta có:
C x (0) X 3 (0)  X 2 (0)  X 2 (1).
C x (1)  X 3 (4)  X 2 ( 4)  W 1 . X 2 (5).
C x ( 2)  X 3 (2)  X 2 (2)  W 2 . X 2 (3).

C x (3)  X 3 (6)  X 2 (6)  W 3 . X 2 (7).
C x ( 4)  X 3 (1)  X 2 (0)  W 4 . X 2 (1).

Dùng tính chất liên hợp phức có thể tính, víi k = 1,2,3,... :
C x ( 4  k ) C x ( 4  k ).
C x (5) C x (3)  X 3 (6)  X 2 (6)  W 3 . X 2 (7).
C x (6) C x ( 2)  X 3 ( 2)  X 2 ( 2)  W 2 . X 2 (3).
C x (7) C x (1)  X 3 (4)  X 2 ( 4)  W 1 . X 2 (5).

Tổng hợp tất cả các phơng trình tính từ bớc lặp 1 đến bớc lặp 3, ta hình
18


thành đợc lợc đồ thuật toán Cx(k) với N = 8 trên hình 1.6.
X(0)
X(1)
X(2)
X(3)
X(4)
X(5)
X(6)
X(7)

X1(0)
X1(1)
X1(2)
X1(3)
X1(4)
X1(5)
X1(6)

X1(7)

X2(0)
X2(1)
X2(2)
X2(3)
X2(4)
X2(5)
X2(6)
X2(7)

X3(0)
X3(1)
X3(2)
X3(3)
X3(4)
X3(5)
X3(6)
X3(7)

Cx(0)
Cx(1)
Cx(2)
Cx(3)
Cx(4)
Cx(5)
Cx(6)
Cx(7)

Hình 1.6. Lợc đồ thuật toán

1.4. Điều chế mà xung (pcm).
Dạng tiêu biểu của mà hoá dạng sóng là điều chế mà xung (PCM) thờng gặp nhất trong các hệ thống xử lý audio số.
1.4.1. Nguyên tắc.
Điều chế xung mà PCM đợc thực hiện theo một qui trình bốn bớc có
tính nguyên tắc nh sau:
a)Lọc nhằm hạn chế phổ tần của tín hiệu liên tục cần xử lý: Biến đổi
Fourier của tín hiệu liên tục thực tế là vô hạn theo biến tần số, chí ít cũng do
thời gian tồn tại của chúng hữu hạn. Chính vì vậy, các tín hiệu liên tục cần xử
lý nhất thiết phải đợc lọc nhằm hạn chế phổ tới tần số cực đại W nào đó nhằm
thoả mÃn tiền đề về băng tần hạn chế của định lý lấy mẫu.
b)Lấy mẫu: Tín hiệu liên tục sau lọc đợc rời rạc hoá nhờ lấy mẫu tín
hiệu liên tục bằng chuỗi xung nhịp có tần số f s theo địng lý lấy mẫu để có đợc
các tín hiệu điều biên xung (PAM-Pulse Amplitude Modulation).
c)Lợng tử hoá: Số giá trị có thể có của tín hiệu PAM sau lấy mẫu là vô
hạn, do vậy số bit cần thiết để mà các giá trị của các xung PAM là vô hạn và
điều này không thể thực hiện đợc. Để hạn chế số bit mà cần sử dụng, giá trị
của từng xung PAM cần đợc làm tròn thành một trong các giá trị mẫu xác
định gọi là các mức lợng tử (có số lợng hữu hạn) và quá trình này đợc gọi là lợng tử hoá.
d)Mà hoá: Các giá trị mức lợng tử ứng với các xung PAM đợc mà hoá
bằng tổ hợp mà nhị phân để thực hiện trên hệ thống xử lý số.
Sơ đồ mô tả các công đoạn điều chế mà xung đợc thể hiện trên sơ đồ
hình 1.7.
Tín hiệu
liên tục

Lọc

Tín hiệu có băng
hạn chế


Lấy
mẫu

Các xung
PAM

Lợng
tử

Các xung PAM
lợng tử hoá


hoá

Tín hiệu
PCM

19


fs

Hình 1.7. Sơ đồ thực hiện PCM.
1.4.2. Lọc hạn băng.
Phổ của tín hiệu audio từ 20Hz đến 20KHz. Việc cắt bỏ các thành phần
tần số ngoài nói trên không gây ra những méo cảm thụ đợc quá lớn, tức là
không gây ra những méo thụ cảm quá lớn, tức là không gây ra những trở ngại
đặc biệt đối với quá trình xử lý audio. Để hạn chế phổ tín hiệu có thể tiến hành
loại bỏ các thành phần tần số lớn hơn 20KHz, tức là có thể chọn tần số cực đại

của tín hiệu audio là 20KHz. Trong trờng hợp này, sai số lọc hạn băng gây
ra chủ yếu là bởi không thể chế tạo đợc mạch lọc thông thấp lý tởng mà chỉ có
thể chế tạo đợc các mạch lọc với đặc tính lọc không dốc đứng tại tần số cắt.
Để không gây nên những méo có thể thụ cảm rõ rệt đợc, tần số cắt của mạch
lọc hạn băng phải chọn cao hơn 20KHz.
1.4.3. Lấy mẫu.
Quá trình lấy mẫu đợc thực hiện bằng cách nhân tín hiệu audio liên tục
với một chuỗi xung nhịp có tần số f s ≥ 2 ω . ViƯc chän tÇn sè nhịp lớn hơn
hai lần sẽ làm mở rộng băng tÇn chiÕm cđa tÝn hiƯu sè, do vËy tÇn sè nhịp
phải chọn nhỏ nhất mà không gây méo tín hiệu. Sai số lấy mẫu gây bởi việc
không thể lấy mẫu trong một thời gian dài vô hạn thờng không đáng kể và có
thể bù đắp bằng việc chọn fs lớn hơn 2 một chút. Quá trình lấy mẫu tín hiệu
audio đợc mô tả trên hình 1.8.
s(t)
Các xung PAM
Tín hiệu liên tục s(t)
Xung nhịp

Tín hiêu
PAM
Mạch
nhân

Tín hiệu xung nhịp

Hình 1.8. Lấy mẫu tín hiệu liên tục
1.4.4.Lợng tử hoá.
Lợng tử hoá đợc thực hiện đơn giản nhất bằng cách chia giải động tín
hiệu [-a , +a] thành Q mức cách đều nhau, đợc gọi là lợng tử hoá đều. Khoảng
20




×