Tải bản đầy đủ (.doc) (127 trang)

Đồ Án Tốt Nghiệp DigitalSound

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (958.56 KB, 127 trang )

Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

Mục lục

Mục lục....................................................................................................................1

Giới thiệu chung...............................................................................11
1. Giới thiệu chung............................................................................................11
2. Đặt vấn đề......................................................................................................11
3. Chủ đề của luận án.........................................................................................12
Chơng 1..................................................................................................................13
Chơng 1..................................................................................................................13
lý thuyết xử lý tín hiệu số......................................................................13
1. Tín hiệu số.....................................................................................................13
2. Xử lý tín hiệu số (DSP - Digital Signal Processing)......................................13
2.1. Phép biến đổi Z......................................................................................14
2.2. Biến đổi Fourier rời rạc (DFT - Discrete Fourier Transform)................16
2.3. Lọc tín hiệu............................................................................................16
2.4. Hàm cửa sổ............................................................................................17
2.5. Phép biến đổi nhanh Fourier (FFT - Fast Fourier Transform)...............18
2.6. Cepstrum................................................................................................19
Chơng 2..................................................................................................................20
Chơng 2..................................................................................................................20
giới thiệu chung về âm thanh số.........................................................20
1. Âm thanh và đặc tính của âm thanh..............................................................20
1.1. Sóng âm và cảm giác âm........................................................................20
1.2. Độ cao của âm.......................................................................................20
1.3. Âm lợng của âm (độ to của âm).............................................................20
1.4. Âm sắc của âm.......................................................................................21


2. Âm thanh số...................................................................................................21
2.1. Nguyên lý...............................................................................................21
2.2. Tần số và cờng độ..................................................................................22
3. Định dạng dữ liệu..........................................................................................23


§å ¸n tèt nghiÖp

X©y dùng ch¬ng tr×nh xö lý ©m thanh sè

4. Khu«n d¹ng lu tr÷..........................................................................................25
sox filename.au filename.wav..............................................................26
Ch¬ng 3..................................................................................................................27
Ch¬ng 3..................................................................................................................27
khu«n d¹ng tÖp ©m thanh.........................................................................27
1. Khu«n d¹ng lu tr÷..........................................................................................27
1.1. Au/ Snd .................................................................................................27
1.2. Voc ........................................................................................................29
1.3. Wave/ Riff .............................................................................................33
1.4. Aiff/ Aiff-C/ Aif/ Snd ............................................................................37
1.5. IFF/8 SVX .............................................................................................40
1.6. MIDI......................................................................................................43
1.7. Mod/ Sam ..............................................................................................46
1.8. MPEG ...................................................................................................49
1.9. VBA , VBase ADPCM (.VBA)..............................................................52
1.10. VCE, NMS VCE (.VCE)......................................................................52
1.11. TXT......................................................................................................52
1.12. SMP, SampleVision (.Smp)..................................................................53
1.13. VOX.....................................................................................................53
1.14. PCM, PCM Raw Data (.PCM) ............................................................53

1.15. DWD , DiamondWare Digitized (.DWD)............................................54
1.16. RA, RealAudio 3.0 (.RA)....................................................................54
2. Thao t¸c víi tÖp ©m thanh..............................................................................54
2.1. Thu thanh t¹o tÖp ©m thanh....................................................................54
2.2. So¹n th¶o................................................................................................54
2.3. Ph¸t ©m..................................................................................................55
Ch¬ng 4..................................................................................................................56
Ch¬ng 4..................................................................................................................56
Hµm cöa sæ vµ läc tÝn hiÖu.......................................................................56
1. Hµm cöa sæ....................................................................................................56
1.1. Rectangular............................................................................................56
1.2. Hamming...............................................................................................57
1.3. Hanning..................................................................................................57
1.4. Triangle (Bartlett)..................................................................................57


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

1.5. Black man..............................................................................................58
Real Function I0(X).........................................................................................58
DS=1.0..................................................................................................................58
D=0.0....................................................................................................................58
S=1.0.....................................................................................................................58
1 D=D+2.0..............................................................................................................58
DS=DS*X*X/(D*D).............................................................................................58
S=S+DS................................................................................................................58
IF(DS-.2E-8*S) 2, 1, 1.........................................................................................58
2 I0 = S...................................................................................................................58

Return...............................................................................................................58
End.......................................................................................................................58
1.6. Flat top...................................................................................................58
1.7. Exponent down......................................................................................58
2. Lọc tín hiệu....................................................................................................59
Chơng 5..................................................................................................................60
Chơng 5..................................................................................................................60
FFt và cepstrum...............................................................................................60
1. FFT (Fast Fourier Transform).......................................................................60
1.1. Nguyên lý...............................................................................................60
1.2. FFT trong âm thanh số...........................................................................60
2. Cepstrum........................................................................................................61
Chơng 6..................................................................................................................63
Chơng 6..................................................................................................................63
Phơng pháp thiết kế......................................................................................63
1. Khái quát chức năng......................................................................................63
2. Cơ chế thực hiện............................................................................................64
Chơng 7..................................................................................................................65
Chơng 7..................................................................................................................65


§å ¸n tèt nghiÖp

X©y dùng ch¬ng tr×nh xö lý ©m thanh sè

Thao t¸c víi tÖp ©m thanh.......................................................................65
1. Truy nhËp tÖp Wave.......................................................................................65
WaveHeader=record...................................................................................65
case boolean of...........................................................................................65
false:(....................................................................................................................65

rID:longint;

{ 'RIFF'

rLen:longint;
wID:longint;

}..........................................................65

{ dLen+36

}.................................................65

{ 'WAVE'

fID:longint;

{ 'fmt '

fLen:longint;

{ 16

wFT:word;

}.....................................................65
}.........................................................65
............................................................65

{ FormatTag : 1:PCM


}......................................65

nC:word;

{ Chanel: 1-mono; 2-stereo

nSp:word;

{ NumSamplesPerSecond

}...............................65

nAB:word;

{ 0: AvegBytesPerSecond

}................................65

nBA:word;

{ BlockAligne = nSp*un1

}..................................65

Fs:word;

{ 0: FormatSpecific

}................................65


}...........................................65

un1:word;

{ BitsPerSample:1-PCM8bit;2-PCM16bit }.............65

un2:word;

{ cbSize: 8-PCM8bits; 16-PCM16bits }......................65

dID:longint;
dLen:longint;

{ 'data'

}.......................................................65

{NumBytes of TotalSamples

}.....................65

);.............................................................................................................................65
true:(hb:array[0..43]of byte);..................................................................65
end;..........................................................................................................................65
i:= 0;...........................................................................................................................66
While i < numSamples do............................................................................66
Begin........................................................................................................................66



Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

For c:= 0 to numChannels - 1 do.............................................................66
{...xử lý Sample[i+c]...};..................................................................................66
i:= i + numChanels;.........................................................................................66
End;...........................................................................................................................66
2. Truy nhập tệp Voc.........................................................................................66
VocBlockFormat = record......................................................................66
header: VocBlockHeader;..............................................................66
data:

VocData;......................................................................................66

End;...........................................................................................................................66
VocBlockHeader = record......................................................................66
blockType:byte; {1 byte định danh dạng khối }....................66
dataLen: longint; {3 byte xác định độ dài dữ liệu }.............66
End;...........................................................................................................................66
VocData1 = record.........................................................................................67
SamRateCode :byte; {1 byte mã tần số lấy mẫu}.......................67
DataCompresCode :byte; {1 byte mã phơng thức nén dữ
liệu} ........................................................................................................................67
End;...........................................................................................................................67
VocData8 = record.........................................................................................67
SamRateCode :word; {2 byte mã tần số lấy mẫu}......................67
DataCompresCode :byte; {1 byte mã phơng thức nén dữ
liệu} ........................................................................................................................67
Mode :byte; {0: mono; 1: stereo}..........................................................67

End;...........................................................................................................................67
VocData9 = record.........................................................................................67
SamRate :longint; {4 byte tần số lấy mẫu}..................................67
NumBitsPerSam :byte;

{Số bits cho mỗi mẫu}.............................67


Đồ án tốt nghiệp

NumChannel :byte;

Xây dựng chơng trình xử lý âm thanh số

{Số kênh truyền: 1-mono; 2-stereo}....67

DataCompresCode :word; {2 byte mã phơng thức nén dữ
liệu} ........................................................................................................................67
Exten :longint; {Phần mở rộng}..........................................................67
End;...........................................................................................................................67
3. Cấu hình dữ liệu.............................................................................................67
4. Soạn thảo........................................................................................................68
4.1. Nguyên lý...............................................................................................68
Assigned(F, MainFilename);.......................................................................69
Assigned(Fsave, CurentFilename);.......................................................69
Reset(F);.................................................................................................................69
Rewrite(Fsave);................................................................................................69
BlockRead(F, Header, 44);...........................................................................69
{... Thay đổi tham số về độ dài dữ liệu ...}..........................................69
BlockWrite(Fsave, Header);....................................................................69

Close(F);.................................................................................................................69
Close(Fsave);......................................................................................................69
4.2. Thao tác dới dạng trực quan...................................................................69
4.3. Cơ chế thực hiện....................................................................................71
Begin........................................................................................................................71
for i:=StartPoint to FinitPoint do DelCut[i]:=false;..............71
CutDel:=true;....................................................................................................71
End;...........................................................................................................................71
Seek(F,44);..............................................................................................................71
For i:=1 to DebutPoint-1 do.......................................................................71
{... sao chép các mẫu từ F sang Fsave ...};...........................................71
seek(F,
44+
(DebutPoint
+
NumSamples)*numBytesPerSample);...................................................71


§å ¸n tèt nghiÖp

X©y dùng ch¬ng tr×nh xö lý ©m thanh sè

While not eof(F) do .......................................................................................71
{... sao chÐp d÷ liÖu tõ F sang Fsave ...};..............................................71
for i:= 1 to NumSamples do........................................................................71
begin........................................................................................................................71
if DelCut[i] then.........................................................................................71
begin...................................................................................................................71
seek(F,44+ (DebutPoint+i)*numBytesPerSample);...............71
{... read(F,temp);write(fSave,temp);...}........................................71

end;......................................................................................................................71
end;...........................................................................................................................71
seek(F,44 + (DebutPoint + StartPoint)* numBytesPerSample);
.....................................................................................................................................72
for i:= 1 to (FinitPoint-StartPoint+1)*numBytesPerSample
do...............................................................................................................................72
begin........................................................................................................................72
read(F,temp);.................................................................................................72
write(fSave,temp);....................................................................................72
end;...........................................................................................................................72
seek(F,44+ (StartPoint + DebutPoint)*numBytesPerSample);
.....................................................................................................................................73
for i:= 1 to (FinitPoint-StartPoint+1)*numBytesPerSample
do...............................................................................................................................73
begin........................................................................................................................73
read(F,temp);.................................................................................................73
PointEdit[i + NumEdit] :=temp;............................................................73
end;...........................................................................................................................73
NumEdit:=NumEdit+(FinitPoint-StartPoint+
1)*numBytesPerSample;...............................................................................73


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

5. Phát thanh......................................................................................................74
5.1. Thu thanh...............................................................................................74
5.2. Phát thanh..............................................................................................74
PlaySound('Path', 0, SND_SYNC);...............................................................74

f:=CreateFile ('Path',GENERIC_READ,0,nil,OPEN_EXISTING,0,0);
.....................................................................................................................................74
if not (f=INVALID_HANDLE_VALUE) then..............................................74
begin........................................................................................................................74
ReadFile(f,ArrSample, MaxSize,sizs,nil);.........................................74
CloseHandle;.....................................................................................................74
end;...........................................................................................................................74
.....................................................................................................................................74
PointDat:=ArrSample;.................................................................................74
PlaySound(PointDat, 0, SND_ASYNC or SND_MEMORY);................74
MediaPlayer.FileName:=OpenDialog.FileName;.........................75
MediaPlayer.Open;.........................................................................................75
Chơng 8..................................................................................................................76
Chơng 8..................................................................................................................76
Phân tích tín hiệu ..........................................................................................76
1. Phổ biên độ....................................................................................................76
Hàm cửa sổ (Windows).................................................................................79
2. Cepstrum .......................................................................................................84
3. Một vài trợ giúp khác.....................................................................................89
3.1. Xác định tần số trội (tần số trung bình vùng biên độ đỉnh)...................89
3.2. Tính phổ của mẫu cho trớc.....................................................................90
Chơng 9..................................................................................................................91
Chơng 9..................................................................................................................91
Hớng dẫn sử dụng............................................................................................91
1. Giao diện chơng trình....................................................................................91


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số


2. Tuỳ chọn chức năng.......................................................................................92

Đánh giá chơng trình...................................................................93
1. Đánh giá chơng trình.....................................................................................93
2. Hớng phát triển..............................................................................................93
3. Kết luận.........................................................................................................94
Phụ lục A...............................................................................................................95
Phụ lục A...............................................................................................................95
Giải thích thuật ngữ....................................................................................95
PAM...........................................................................................................................95
PWM..........................................................................................................................95
PCM...........................................................................................................................95
DPCM.........................................................................................................................95
Phụ lục B...............................................................................................................96
Phụ lục B...............................................................................................................96
Tài liệu tham khảo........................................................................................96
( Đồ án tốt nghiệp - DigitalSound)....................................................................97
...........................................................................................................................97
Chơng 3..................................................................................................................97
Chơng 3..................................................................................................................97
khuôn dạng tệp âm thanh.........................................................................97
1. Khuôn dạng lu trữ..........................................................................................97
Dịch phần IV: General File Formats ................................................................97
Trong sách: A Programmer's Guide To Sound..................................................97
Addison - Wesley / 1998, Tim Kientzle..................................................97
1.1. Au/ Snd .................................................................................................97
1.2. Voc ........................................................................................................99
1.3. Wave/ Riff ...........................................................................................103
1.4. Aiff/ Aiff-C/ Aif/ Snd ..........................................................................107

1.5. IFF/8 SVX ...........................................................................................111
Dịch phần V: music File Formats ..................................................................114
Trong sách: A Programmer's Guide To Sound................................................114


§å ¸n tèt nghiÖp

X©y dùng ch¬ng tr×nh xö lý ©m thanh sè

Addison - Wesley / 1998, Tim Kientzle................................................114
1.6. MIDI....................................................................................................114
1.7. Mod/ Sam ............................................................................................117
DÞch phÇn III: 14. mpeg Audio .......................................................................121
Trong s¸ch: A Programmer's Guide To Sound................................................121
Addison - Wesley / 1998, Tim Kientzle................................................121
1.8. MPEG .................................................................................................121
DÞch phÇn: C¸c d¹ng file ©m thanh .................................................................125
Trong: cool edit Pro.........................................................................................125
1.9. VBA , VBase ADPCM (.VBA)............................................................125
1.10. VCE, NMS VCE (.VCE)....................................................................125
1.11. TXT....................................................................................................125
1.12. SMP, SampleVision (.Smp)................................................................126
1.13. VOX...................................................................................................126
1.14. PCM, PCM Raw Data (.PCM) ..........................................................126
1.15. DWD , DiamondWare Digitized (.DWD)..........................................126
1.16. RA, RealAudio 3.0 (.RA)..................................................................126


Đồ án tốt nghiệp


Xây dựng chơng trình xử lý âm thanh số

Giới thiệu chung

1. Giới thiệu chung
Cùng với sự phát triển của cuộc cách mạng khoa học và công nghệ đang
diễn ra một cách sôi động, chúng ta đang tiến dần tới thế giới của sự số hoá.
Với các u điểm của xử lý số, nhanh gọn, chính xác với chất lợng cao, mọi lĩnh
vực hoạt động của xã hội loài ngời, nhất là các ngành trong các lĩnh vực thông
tin liên lạc, phát thanh truyền hình ... đều tiến tới việc áp dụng một cách đồng
bộ và có hiệu quả các công cụ cũng nh các phép xử lý số. Trong đó, âm thanh
là một lĩnh vực đặc biệt quan trọng, đây là một phơng thức dùng để trao đổi
cũng nh cảm nhận tin, không chỉ là tiếng nói, bản nhạc mà đó là tất cả các âm
mà ta cảm nhận đợc trong cuộc sống hàng ngày, do đó, lĩnh vực về âm thanh
không thể nằm ngoài xu hớng phát triển chung mà còn cần sự nghiên cứu sâu
hơn nữa.
2. Đặt vấn đề
Với âm thanh số, bằng việc lu trữ âm thanh dới dạng các dãy số, chúng
ta đạt đợc yêu cầu về tốc độ truyền cũng nh về khối lợng lu trữ và độ trung
thực trong các phép xử lý nh khử nhiễu, soạn thảo hay các hiệu quả tạo độ
vang, trễ ... Do vậy, ngoài các phơng tiện sử dụng kỹ thuật số, nh camera số,
thiết bị ghi số, điện thoại số... với chất lợng cao, thì những âm thanh tơng tự đợc ghi từ micro với các nhạc cụ truyền thống đều đợc chuyển đổi sang dạng số
hoá.
Hơn nữa, với âm thanh, chúng ta không chỉ quan tâm tới khả năng cảm
nhận một cách trung thực nhất âm thanh tự nhiên, mà ta còn hớng tới việc tạo
ra (hay tổng hợp) đợc những âm thanh mà ta mong muốn. Do đó, khi nói đến
âm thanh số thì cần thiết phải xét tới 3 khía cạnh:
Các khuôn dạng lu trữ âm thanh với các đặc tính riêng biệt. Đây là yêu
cầu trớc tiên của bất kỳ quá trình thu thanh hay khi cần đọc dữ liệu để
phân tích. Cần phải hiểu rõ các đặc tính cả từng khuôn dạng thì mới có

thể lu trữ một cách hiệu quả nhất.
Thao tác với các tệp âm thanh qua một trình soạn thảo âm thanh với các
phép sao chép, cắt, dán, lọc, trộn âm hay chuyển đổi khuôn dạng tệp lu
trữ cũng nh phơng thức lu trữ dữ liệu. Đây là cách để chúng ta có thể
cảm nhận đợc âm thanh một cách rõ nét.
Phân tích tín hiệu của âm thanh bằng cách biểu diễn dữ liệu âm thanh d-


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

ới dạng tín hiệu tuỳ theo mục đích phân tích. Dữ liệu đọc từ tệp, sau đó
qua các phép xử lý tín hiệu số nh lọc, hàm cửa sổ, biến đổi FFT,
Cepstrum ... để có thể rút ra các tham số đặc trng, các thông tin cần
thiết cho các quá trình nhận dạng hay tổng hợp âm sau đó.
3. Chủ đề của luận án
Chính vì vậy, với đề tài Xây dựng chơng trình xử lý âm thanh số thì
nhiệm vụ trớc tiên sẽ phải nghiên cứu, tìm hiểu các khuôn dạng lu trữ dữ liệu,
sau đó xây dựng một chơng trình (xử dụng ngôn ngữ lập trình Delphi) để thao
tác với các tệp âm thanh và phân tích tín hiệu của các âm thanh đó.


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

Chơng 1

lý thuyết xử lý tín hiệu số


1. Tín hiệu số
Tín hiệu là biểu hiện vật lý của thông tin. Về mặt toán học, tín hiệu đợc
coi là một hàm của một hay vài biến độc lập. Để phân loại tín hiệu, ta có thể
xét đến tính chất của biến độc lập thời gian hay phân loại theo biên độ tín hiệu
(liên tục hay rời rạc).
Từ đó ta có định nghĩa: Tín hiệu số (Digital Signal) là tín hiệu rời rạc (theo
biến độc lập thời gian) đồng thời có biên độ cũng rời rạc hoá (lợng tử hoá).
x
3
2
1
0
-1
-2
-3

t

Hình 2.1: Tín hiệu số

Theo định nghĩa trên, tín hiệu có vai trò là vật mang thông tin. Nên tín
hiệu cần phải đợc xử lý sao cho có thể dễ dàng rút ra các thông tin mong muốn
hay lu trữ thông tin một cách tối u. Cho nên việc phát triển các kỹ thuật cũng
nh các hệ thống xử lý tín hiệu đóng vai trò hết sức quan trọng. Thông thờng
các phép xử lý tín hiệu là các phép biến đổi tín hiệu thành dạng khác mong
muốn, tuỳ theo yêu cầu thu nhận thông tin từ tín hiệu đó. Ví dụ nh việc lọc bỏ
nhiễu ra khỏi tín hiệu có ích, hay xác định thông số mang tin nào đó.
2. Xử lý tín hiệu số (DSP - Digital Signal Processing)
Xử lý tín hiệu đợc sử dụng trong rất nhiều lĩnh vực khoa học khác nhau,



Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

và xử lý âm thanh là một trong số đó. Trong quá trình xử lý, các phép xử lý
DSP chuẩn cơ bản là: FFT, lọc, thiết kế các bộ lọc thời gian, decimation,
interpolation (nội suy), tích chập (convolution), ...
Các chức năng DSP (Digital Signal Processing) đợc thực hiện bởi
soundcard tơng đơng với một tập các khả năng của phần cứng tổng hợp âm
nhạc điện tử analog: trộn, lọc, điều chế tần số, biên độ... và nén. Tất cả các
hiệu quả đợc tạo ra bằng cách dùng bộ trễ tín hiệu nh: vang, lặp.... đều có thể
sử lý bằng DSP. Sự khác nhau là DSP (cả phần cứng và phần mềm) có thể thực
hiện các chức năng trên dạng sóng số hóa. Nhiều soundcard có tích hợp DSP
để tăng tốc độ xử lý.
Việc phân tích và thiết kế của các hệ thống tuyến tính đã đợc thực sự
đơn giản hoá bởi các phép biểu diễn trong miền tần số của cả tín hiệu và hệ
thống. Trong đó biến đổi Fourier và biến đổi Z đóng vai trò quan trọng trong
việc biểu diễn các tín hiệu và hệ thống rời rạc theo thời gian.
2.1. Phép biến đổi Z

Nói chung, phép biến đổi Fourier là một công cụ mạnh để nghiên cứu
tín hiệu số và tơng tự về cả mặt lý thuyết và thực hành. Nhng đối với tín hiệu
rời rạc, phép biến đổi Z đợc sử dụng rộng rãi hơn bởi đây là phép biến đổi
mạnh về phơng diện lý thuyết.
Định nghĩa

Phép biến đổi z của tín hiệu x(n) là: X(z) =






n =

x(n).z-n

(1.1)

Trong đó X(z) là hàm biến phức của biến phức z. Chuỗi X(z) còn đợc
gọi là chuỗi Laurent. X(z) và các đạo hàm của nó đều là liên tục trong miền
hội tụ. Đây là phép biến đổi z hai bên (n chạy từ - tới ), đợc dùng để nghiên
cứu hệ thống xác lập của hệ thống. Với tín hiệu nhân quả, ta dùng phép biến
đổi z một phía:
X(z) =



x ( n) z

n

(1.2)

n =0

Phép biến đổi z một phía dùng để nghiên cứu chế độ quá độ của hệ thống.
Phép biến đổi z ngợc


Về mặt lý thuyết, phép biến đổi z ngợc có thể thiết lập sau khi dùng định lý
Côsi (Cauchy) về tích phân trên đờng cong khép kín trên mặt phẳng phức:
I=

1
z l 1 dz
2j

(1.3)

trong đó là đờng cong khép kín bao quanh gốc toạ độ trên mặt phẳng z.


Đồ án tốt nghiệp

Kết quả là:

Xây dựng chơng trình xử lý âm thanh số

I=

với l = 0
với l 0

1
0

Bằng cách nhân hai vế của biến đổi z với z l-1/2j, lấy tích phân quanh
gốc toạ độ và nằm trong vùng hội tụ, và sau đó can thiệp tích phân và tổng, ta
có biểu thức biến đổi z ngợc nh sau:

x(l) =

1
X ( z ) z l 1 dz

2j

(1.4)

Biểu thức thoả mãn với mọi l, đờng cong là đờng cong khép kín, nằm trong
miền hội tụ và chạy theo chiều dơng (ngợc chiều kim đồng hồ).
Phép biến đổi z đợc áp dụng trong quá trình giải các phơng trình sai
phân tuyến tính hệ số hằng. Và các tính chất của biến đổi z tạo nhiều thuận lợi
trong các vấn đề xử lý tín hiệu số. Nh tính tuyến tính cho ta cách tính biến đổi
z ngợc thông qua việc phân tích một hàm phức tạp thành các hàm đơn giản.
Quan hệ của phép biến đổi Z với phép biến đổi Fourier

Từ công thức định nghĩa phép biến đổi z (1.1), thay z=ej, tức là biểu diễn trong
toạ độ cực, và với = 2f.
X(z) =





n =

x(n).r-n.e-j2fn

Qua công thức trên, ta thấy phép biến đổi z là phép biến đổi Fourier của

tích tín hiệu này với một tín hiệu hàm số mũ r -n. Hơn nữa, phép biến đổi
Fourier của tín hiệu rời rạc là phép biến đổi z tính trên đờng tròn đơn vị (|z| = 1
hay r = 1), với điều kiện miền hội tụ của phép biến đổi z phải chứa đờng tròn
đơn vị. Hay nói cách khác, trên đờng tròn đơn vị phép biến đổi z và Fourier là
đồng nhất.
X(f) = X(z) =





n =

x(n).e-2jfn

với |z| = 1

(1.5)

So với phép biến đổi Laplace

Xét tín hiệu tơng tự Xa(t), phép biến đổi Laplace của tín hiệu này là:


Xa(t) =



xa(t).e-stdt




Nếu tín hiệu Xa(t) đợc lấy mẫu đều với chu kỳ T s và (t) là hàm xung
Dirac, thì phép biến đổi Laplace của tín hiệu lấy mẫu là:


Xe(s) =





n =

xa(t).(t-n.Ts).e-stdt


Đồ án tốt nghiệp

Xe(s) =

Xây dựng chơng trình xử lý âm thanh số


x

n =

a


(n.Ts ).e n.Ts .s

(1.6)

So sánh biểu thức này với biến đổi z của tín hiệu x(n) = x a(nTs), ta thấy
biến đổi Laplace của tín hiệu lấy mẫu là biến đổi z của tín hiệu số tơng ứng và
đợc tính với z = exp(s.Ts). Có nghĩa là: X(z) = Xe(s) với z = e s.T .
s

2.2. Biến đổi Fourier rời rạc (DFT - Discrete Fourier Transform)

DFT đợc sử dụng rộng rãi trong quá trình tính toán sự đánh giá phổ, các
hàm tự tơng quan và việc cài đặt các bộ lọc số. Đây là phép biến đổi Fourier
rời rạc của tín hiệu x(n) có độ dài hữu hạn và có trục tần số cũng đợc rời rạc
hoá. Trong đó, tín hiệu x(n) có độ dài hữu hạn là tín hiệu có giá trị khác 0
trong một khoảng hữu hạn thời gian nào đó và chúng bằng 0 trong khoảng còn
lại.
Với x(n) đợc dùng nh là một chu trình của tín hiệu, ta có thể xây dựng
tín hiệu xp(n) tuần hoàn với chu kỳ N bằng cách xếp chồng tuần hoàn x(n):
Xp(n) =



x(n + iN )

(1.7)

i =

Khi xếp chồng tuần hoàn, nếu M N (với M = N2 - N1 +1, trong đó N1

và N2 là thời điểm mà trong đó tín hiệu tồn tại), thì hiện tợng trùm thời gian
giữa các phần của x p(n) sẽ không xảy ra, nghĩa là có thể dễ dàng lấy ra x(n)
ban đầu. Lúc này tín hiệu x(n) có độ dài là N với các mẫu từ M tới N-1 có giá
trị bằng 0.
Và ta quy ớc: xp(n) = x((n))N.
Ta có các công thức biến đổi Fourier nh sau:
N 1
nk
x (n).W N
X(k) = n = 0
0
1
x(n) = N
0

N 1

X (k ).W
k =0

0 k N 1

(1.8)

với k còn lại
nk
N

0 n N 1


(1.9)

với n còn lại

Trong đó X(k) là một chu kỳ của X p(k), với Xp(k) là các mẫu trên đờng
tròn đơn vị của biến đổi z một chu kỳ của x p(n), hay biến đổi Fourier X(f) của
một chu kỳ của xp(n).
2.3. Lọc tín hiệu

Các bộ lọc đợc sử dụng để thay đổi giá trị tần số của âm thanh. Đây là
khâu xử lý cơ bản cho một chuỗi các bớc xử lý âm thanh tiếp theo. Ví dụ nh,


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

quá trình lọc có thể là gỡ bỏ nhiễu ra khỏi quá trình thu thanh hay tách biệt
một âm, giọng nào đó bằng cách chỉ cho các tần số xác định nào đó đi qua.
Chính vì vậy, lọc số là một ứng dụng quan trọng nhất của xử lý tín hiệu.
Các bộ lọc số đã dần dần thay thế các bộ lọc tơng tự. Việc thiết kế các bộ lọc
số thực tế đều đi từ lý thuyết các bộ lọc số lý tởng.
Các bộ lọc số tiêu biểu là:
Bộ lọc số thông thấp (Low pass filter)
Bộ lọc số thông cao (High pass filter)
Bộ lọc số thông dải (Band pass filter)
Bộ lọc số chắn dải (Band stop filter)
Trong đó, các bộ lọc đợc sử dụng để lọc tần số chính, nên tất cả các đặc trng
của lọc tần số đều đợc cho theo đáp ứng biên độ.
2.4. Hàm cửa sổ


Nh ta đã biết, phép biến đổi Fourier rời rạc DFT tác động trên tín hiệu
có độ dài hữu hạn, nên cần thiết phải hạn chế độ dài đối với các tín hiệu có độ
dài vô cùng hoặc quá lớn để có thể nghiên cứu phổ của chúng. Để làm điều
này ta thờng dùng hàm cửa sổ, tức là nhân tín hiệu x(n) với cửa sổ w(n-n 0) để
nhận đợc một đoạn xN(n) trong khoảng n0 tới n0+N-1 để phân tích.
x ( n)

xN(n) = x(n). w(n- n0) =
0

n0 n n0 + N 1
với n còn lại

(1.10)

Việc nhân tín hiệu với hàm cửa sổ theo thời gian tơng đơng với việc nhân chập
phổ của tín hiệu x(n) với phổ của cửa sổ:
f0 + 1

XN(f) =



X(g)W(f-g)dg = X(f)*W(f)

(1.11)

f0


Trong đó XN(f), X(f), và W(f) là biến đổi Fourier tơng ứng của xN(n), x(n), và
w(n).
Kết quả nhận đợc từ tín hiệu sau khi đã cho qua cửa sổ không những
phụ thuộc vào dạng cửa sổ mà còn phụ thuộc vào số điểm tín hiệu phân tích N,
cũng nh vị trí cửa sổ đợc đặt ở đâu, tức là tìm n0 phù hợp. Ta phải chọn vị trí
cửa sổ sao cho cửa sổ bao trùm lên phần quan trọng của tín hiệu và bỏ qua
những chỗ có biên độ nhỏ, và phải chọn N sao cho một chu kỳ x p(n) là xấp xỉ
của x(n) với sai số cho phép và không để xảy ra hiện tợng trùm thời gian. Nh
vậy, với những tín hiệu bất kỳ, do không có đủ thông tin để có thể chọn n 0 và
N một cách hợp lý thì sẽ không thể nhận đợc một kết quả phân tích tối u. Khi
đó tốt nhất ta nên xem xét ở khía cạnh tần số để xác định N.


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

2.5. Phép biến đổi nhanh Fourier (FFT - Fast Fourier Transform)

Đây thực chất là DFT nhng với một thuật toán nhanh, gọn và hiệu quả.
FFT đã tạo ra một bớc ngoặt mới và thực sự đóng vai trò hết sức quan trọng
trong việc phân tích, thiết kế và thực hiện các thuật toán xử lý tín hiệu số cũng
nh tín hiệu tơng tự. Tuy có nhiều thuật toán tính FFT khác nhau, nhng nguyên
tắc chung của tất cả các thuật toán này là dựa trên việc phân tích cách tính
DFT cuả một dãy N số (gọi tắt là DFT N điểm) thành các phép tính DFT của
các dãy nhỏ hơn, trong đó số phép tính tỷ lệ với N.log(N).
Trong các cách tính này, FFT có 2 lớp cơ bản: thuật toán FFT đợc phân
chia theo thời gian và phân chia theo tần số. Cả hai thuật toán đều sử dụng
phép tính toán tại chỗ (in place), và số phép nhân phức trong cả hai thuật giải
là nh nhau. Sự khác nhau cơ bản giữa hai cách tính là thứ tự xắp xếp dữ liệu

đầu vào và đầu ra.
Thông thờng, ta xét tới 2 cách tính FFT: tính FFT thuận và FFT ngợc.
Bắt đầu từ cặp công thức biến đổi Fourier rời rạc thuận và ngợc:
X(k) =

N 1


k =0

1
x(n) =
N

x(n).WNkn
N 1


k =0

với k = 0, 1, .., N-1

X(k).WN-kn

với n = 0, 1, .., N-1

Cặp công thức trên là tơng tự nhau, chỉ khác ở hệ số tỷ lệ

1
và dấu của

N

mũ của hệ số W. Nh vậy, ta có thể dùng công thức tính FFT thuận để tính FFT
ngợc bằng cách lấy liên hợp phức của cả hai vế công thức * và chuyển hệ số tỷ
lệ N sang trái:


N.x (n) =

N 1


k =0

X(k).WknN

(1.12)

Vế phải chính là DFT của dẫy X*(k) nên có thể tính đợc bằng bất kỳ chơng
trình tính FFT nào. Còn dãy x(n) có thể tính bằng cách lấy liên hợp phức hai vế
công thức * và chia cho n:
1 N 1

X (k ).W Nkn
x(n) =


N k =0





(1.13)

Tóm lại, để tính FFT ngợc từ chơng trình tính FFT thuận ta thực hiện các bớc
sau:
Lấy liên hợp phức của X(k) bằng cách đổi dấu phần ảo của X(k).
Tính FFT của dãy X(k) đã đổi dấu.
Đổi dấu phần ảo của kết quả thu đợc, sau đó chia dãy cho hệ số tỷ lệ N


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

để có kết quả cuối cùng.
2.6. Cepstrum

Phép biến đổi tín hiệu sang dạng Cepstrum tơng ứng là một phép biến
đổi homomorphic, phép giải các bài toán không tuyến tính bằng các công cụ
toán tuyến tính đã biết. Cepstrum là từ đảo của từ Spectrum (phổ) có nghĩa là
chúng ta đang tiếp tục thực hiện việc phân tích phổ nào đó trên một phổ tần số.
Khái niệm về Cepstrum là một phần cơ bản của lý thuyết trong các hệ thống
homomorphic cho quá trình xử lý tín hiệu.
Ngoài ra, ta có khái niệm: Cepstrum phức có nghĩa là biến đổi ngợc
Fourier (hay Z) của logarit tự nhiên phức của phổ phức; và Cepstrum thực là
phép biến đổi của Fourier ngợc của logarit thực của biến đổi Fourier của hàm
đó.
x(n)


x(n)

A

y(n)

Hệ thống
homomorphic

F

A

-1

y(n)

Hình 2.2: Hệ thống xử lý Homomorphic

Ưu điểm của hệ thống xử lý này là thuật toán có thể đợc tách thành các
thuật toán mắc dây chuyền nh trên. Trong đó, các khối A và A -1 là các khối
nghịch đảo của nhau. Còn khối F là hệ thống tuyến tính, bất biến, hay nói
chung đó là một bộ lọc tuyến tính đơn giản.


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

Chơng 2


giới thiệu chung về âm thanh số

1. Âm thanh và đặc tính của âm thanh
1.1. Sóng âm và cảm giác âm

Khi một vật dao động về một phía nào đó, nó làm cho các lớp không khí
liền trớc bị nén lại, và lớp không liền sau dãn ra. Sự nén và dãn không khí nh
vậy lặp đi lặp lại một cách tuần hoàn nên đã tạo ra trong không khí một sóng
đàn hồi. Sóng này truyền tới tai, nén vào màng nhĩ khiến cho màng nhĩ cũng
dao động với cùng tần số. Khi màng nhĩ dao động, các vị trí phân biệt của
màng nhĩ trên bề mặt giống nh nó chuyển động về trớc hay sau đáp ứng với
các sóng âm vào. Khi cùng một thời điểm, ta nghe thấy nhiều âm, thì mọi âm
thanh phân biệt này đợc trộn với nhau một cách tự nhiên trong tai giống nh
một hình mẫu đơn của áp suất không khí thay đổi. Tai và óc làm việc cùng
nhau để phân tích tín hiệu này ngợc lại thành những cảm giác về âm riêng biệt.
1.2. Độ cao của âm

Độ cao của âm là một đặc tính sinh lý của âm và nó phụ thuộc vào một
đặc tính của âm là tần số. Những âm có tần số khác nhau, tạo nên cảm giác về
các âm khác nhau: âm có tần số lớn gọi là âm cao hay âm thanh; âm có tần số
nhỏ gọi là âm thấp hay âm trầm. Sự cảm nhận về mức độ to nhỏ của âm thanh
đợc gọi là cờng độ (pitch). Và cờng độ có liên quan rất gần với một thuộc tính
về mặt vật lý gọi là tần số (frequency).
1.3. Âm lợng của âm (độ to của âm)
Năng lợng của âm

Giống nh các sóng cơ học, sóng âm cũng mang năng lợng sóng tỷ lệ với
bình phơng biên độ sóng.
Và cờng độ âm chính là năng lợng đợc sóng âm truyền trong một đơn vị

thời gian qua một đơn vị diện tích đặt vuông góc với phơng truyền (đơn vị
W/m2).
Tuy nhiên, để cảm nhận một âm, ta không đánh giá qua giá trị tuyệt đối


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

của cờng độ âm I, mà xét theo mức cờng độ âm L.
Tức là: L(B) = lg(I/I0) , với I0 là một giá trị chuẩn nào đó.
Thông thờng, L lấy đơn vị là deciben (ký hiệu là dB). Với L=1dB (I lớn
gấp 1,26 lần I0) là mức cờng độ nhỏ nhất mà tai ta có thể phân biệt đợc.
Âm lợng của âm

Để có thể tạo ra cảm giác âm, cờng độ âm phải lớn hơn một ngỡng nào
đó. Với các tần số trong khoảng 1000-5000Hz, ngỡng nghe khoảng 1012W/m2. Với tần số 50Hz thì ngỡng nghe lớn gấp 105 lần. Và mức âm lợng
của âm phụ thuộc vào cả cờng độ âm và tần số.
1.4. Âm sắc của âm

Âm sắc là một đặc tính sinh lý của âm và nó đợc cấu thành trên cơ sở
các đặc tính vật lý của âm là tần số và biên độ. Đây là một đặc trng riêng của
từng nguồn phát âm. Khi một nguồn phát ra một âm có tần số f 1, thì đồng thời
cũng phát ra các âm có tần số f2=2* f1, f3=3* f1 ...
Âm có tần số f1 gọi là âm cơ bản hay hoạ âm thứ nhất. Các âm có tần số
f2, f3, ... gọi là các hoạ âm thứ hai, thứ ba ... Tuỳ theo đặc tính của từng nguồn
phát âm mà tạo ra các hoạ âm khác nhau với biên độ hay khoảng kéo dài khác
nhau. Do đó âm do một nguồn âm phát ra là sự tổng hợp âm cơ bản và các hoạ
âm. Nên, mặc dù có cùng tần số f 1 của âm cơ bản nhng đờng biểu diễn không
còn là một đờng hình sin đơn thuần mà là một đờng phức tạp có chu kỳ.

2. Âm thanh số
Dạng chung nhất của các quá trình thu âm thanh số là dạng điều biến
mã xung (PCM - Pulse Code Modulation). Đây là dạng mà phần lớn các đĩa
compact và các tệp Wave sử dụng. Trong phần cứng thu thanh dạng PCM, một
microphone chuyển dạng biến đổi áp suất không khí (các sóng âm thanh)
thành dạng biến đổi điện áp. Sau đó một bộ chuyển đổi tơng tự-số đo (mẫu
hoá) dòng điện áp tại các quãng thời gian đều nhau. Ví dụ nh, trong một đĩa
compact có tới 44,100 mẫu đợc lấy mỗi giây. Mỗi điện áp mẫu hoá nhận đợc
sẽ đợc chuyển đổi sang dạng số nguyên 16-bit. Một đĩa CD chứa 2 kênh dữ
liệu: một cho tai trái, và một cho tai phải (đối với âm thanh dạng stereo). Hai
kênh đợc thu thanh độc lập, đợc đặt theo cạnh (side) trên đĩa compact (dữ liệu
cho các kênh trái và phải luân phiên nhau...trái, phải, trái, phải, ...). Dữ liệu
nhận đợc từ quá trình thu thanh PCM là một hàm theo thời gian.
2.1. Nguyên lý

Về cơ bản, âm thanh tơng tự và số là khác nhau, nên ta luôn bị mất
thông tin khi làm phép chuyển đổi giữa chúng. Khi đợc số hoá, sóng âm thanh
đợc biểu diễn nh là một chuỗi các số (đợc gọi là các mẫu), mà chúng biểu diễn
áp suất không khí hay tín hiệu điện tại các thời điểm kế tiếp nhau theo thời
gian. Khi mẫu hoá một tín hiệu tơng tự, ta luôn gặp phải 2 vấn đề: thứ nhất,
mỗi giá trị kế tiếp trong dạng biểu diễn dạng số là một quãng xác định nào đó


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

của thời gian, và mỗi khối có một độ rộng xác định; thứ hai là các số số hoá là
rời rạc. Chỉ có một số xác định các độ cao có thể cho mỗi khối. Theo hình vẽ,
ta thấy độ cao các khối không ăn khớp với đờng tín hiệu gốc.


Tín hiệu tương tự

Tín hiệu số

Hình 2.3: Chuyển đổi tín hiệu sang dạng các mẫu số

Đây là hai lỗi cơ bản trong tín hiệu âm thanh số. Lỗi này có thể đợc
kiểm soát bằng cách thay đổi khuôn dạng chi tiết của dạng biểu diễn âm thanh,
nhng không thể loại bỏ đợc hoàn toàn. Chính vì vậy, tuỳ theo ứng dụng ta sẽ
phải chấp nhận một số lỗi nhất định. Và các hệ số khác nh kích thớc dữ liệu
hay tần số xử lý yêu cầu ta phải chấp nhận một sai số lớn hơn từ một số nguồn
để có thể giảm hơn nữa các sai số khác.
2.2. Tần số và cờng độ

Tần số của một sóng hình sin là khoảng thời gian mà nó dùng cho một
chu kỳ hoàn chỉnh. Tần số đợc tính theo hertz (Hz), là số các chu kỳ hoàn
chỉnh mà chúng xuất hiện trong một giây. Tai ngời có thể nghe thấy các sóng
hình sin có tần số dao động trong khoảng 30 Hz tới 20.000 Hz. Những dao
động trong miền tần số này gọi là dao động âm hay âm thanh.
Chu kỳ (periodic) là nghịch đảo của tần số, là khoảng thời gian mà tín
hiệu lặp lại một cách chính xác. Mặc dù rất nhiều hàm toán học đợc sử dụng
để làm việc với âm thanh dựa trên các tín hiệu lặp một cách lý tởng, đặc biệt là
phép biến đổi Fourier, nhng lại có rất ít các âm thanh thực là thực sự tuần
hoàn. Trong thực tế, tần số chỉ có ý nghĩa trực tiếp cho các sóng hình sin.
Tuy nhiên, mọi âm thanh đều có thể làm vỡ thành một tập các sóng
hình sin. Ta có thể tạo bất cứ âm thanh nào bằng cách thêm vào một tập các
sóng hình sin phù hợp, cũng nh có thể chia các âm thanh phức tạp thành các
sóng hình sin riêng biệt, đơn giản.
Ngoài ra, trong quá trình thu thanh số hoá, cần chú ý tới biên độ đỉnh để

có thể tránh sự méo cắt (mà nó xuất hiện khi biên độ đỉnh vợt quá khuôn dạng
lu trữ) trong khi giữ tỷ lệ tín hiệu/nhiễu ở mức cao nhất có thể.


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

3. Định dạng dữ liệu
Quá trình chuyển đổi âm thanh tơng tự sang dạng âm thanh số cũng nh
việc lu trữ âm thanh số liên quan tới 2 vấn đề:
Lấy mẫu (sampling): Quá trình lấy mẫu liên quan tới việc tính toán một
cách tuần hoàn tín hiệu tơng tự, và sử dụng các mẫu này thay cho tín
hiệu gốc trong quá trình xử lý.
Lợng tử hoá (quantization): Quá trình xử lý các mẫu tơng tự với độ chính
xác không xác định và làm tròn chúng.
3.1. PAM (Pulse Amplitude Modulation)

Trong thực tế, các bộ chuyển đổi DAC và ADC thờng xuyên sử dụng
dạng PAM (Pulse Amplitude Modulation) nh một khuôn dạng trung gian,
trong đó âm thanh đợc coi nh một chuỗi các xung, và biên độ của mỗi xung
(độ cao) biểu diễn độ mạnh của âm thanh tại điểm đó.

Tín hiệu tương tự

Xung PAM

Hình 2.4: PAM
3.2. PWM (Pulse Width Modulation)


Ngoài ra, ta còn dạng biểu diễn khác là PWM (Pulse Width
Modulation), cũng giống nh PAM, đây là dạng biểu diễn mỗi mẫu nh một
xung, nhng nó sử dụng độ rộng hay khoảng kéo dài của xung (thay cho biên
độ) để biểu diễn độ mạnh của âm thanh.


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số
Tín hiệu tương tự

Xung PWM

Hình 2.5: PWM
3.3. PCM (Pulse Code Modulation)

Đây là dạng biểu diễn mỗi mẫu nh một chuỗi các xung, mà các xung đó
biểu diễn mã nhị phân (code binary) của nó. Nhng biểu diễn dạng này rất khó
xác định đâu là điểm bắt đầu và kết thúc của mỗi mã. Tuy nhiên, không khó
khăn để có thể khắc phục điều này, ví dụ nh ta có thể xây dựng các mã theo
một dạng riêng để không có mã nào chứa 3 số 1 liên tiếp (111) và sau đó chèn
111 vào tín hiệu tại điểm bắt đầu của mỗi mã. Trong bộ nhớ máy tính, các mã
nhị phân liên tiếp đợc lu trữ nh các số. Thông thờng, dữ liệu âm thanh dạng
PCM đợc lu trữ với 8 hay 16 bits (1 hay 2 bytes) mỗi mẫu.

Tín hiệu tương tự

Xung PCM

Hình 2.6: PCM

3.4. Tần số lấy mẫu

Nói chung, các hệ thống lấy mẫu âm thanh đều đợc đặc trng bởi tần số
lấy mẫu (đơn vị: mẫu/giây hay Hz) (sampling rate), đây là số các mẫu đợc sử
dụng để biểu diễn một giây của âm thanh. Và Harry Nyquist (1889-1976) đã
khám phá ra rằng, một tín hiệu âm thanh đã đợc lấy mẫu có thể tạo lại một


Đồ án tốt nghiệp

Xây dựng chơng trình xử lý âm thanh số

cách chính xác bất cứ âm thanh nào mà tần số của nó nhỏ hơn một nửa tần số
lấy mẫu. Do đó, một nửa tần số lấy mẫu thờng xuyên đợc tham chiếu nh một
giới hạn Nyquist (Nyquist limit).
Khi xét tới âm thanh số, ta phải xét tới hiệu ứng aliasing bởi có thể có
nhiều sóng hình sin có thể phát sinh ra các mẫu nh nhau nên có khả năng chọn
nhầm tín hiệu. Đối với quá trình thu thanh thì điều đó không quan trọng bởi
một bộ lọc thông thấp đợc kèm vào quá trình chuyển đổi số-tơng tự sẽ gỡ bỏ
các thành phần tần số cao. Tuy nhiên, đó thực sự là một vấn đề trong quá trình
tổng hợp âm thanh số.
Thông thờng, nên làm việc trên các tệp âm thanh với dạng dữ liệu
không nén. Một khi đã nén, chơng trình xử lý sẽ phải giải nén mỗi khi sử dụng,
và với bất cứ lu đồ (giải thuật) nén nào cũng đều gây nguy hiểm tới chất lợng
âm thanh, không kể đến thời gian dùng để giải nén. Vì thế các tệp âm thanh số
dùng để phát lại (playback) không nên sử dụng dạng nén.
4. Khuôn dạng lu trữ
4.1. Khuôn dạng chung

Khi ghi âm, âm thanh có thể đợc lu dới dạng tệp. Có nhiều khuôn dạng

tệp âm thanh khác nhau. Và 3 dạng chính là:
Dạng tự nhiên: nh các tệp có đuôi WAV, AIF... các tệp này cho âm
thanh tốt song thời gian truyền lâu.
Dạng nén: các tệp Shock wave, Quick Time, MPEG... để phát lại cần có
phần mềm đặc biệt. Ưu điểm là kích thớc nhỏ, nhng mất thời gian giải
nén, và chất lợng giảm.
Dạng MIDI: khuôn dạng đơn giản, kích thớc nhỏ, thuận lợi trong việc
soạn thảo âm thanh, nhng chất lợng phụ thuộc vào thiết bị.
Nói chung, các tệp âm thanh số đợc lu trữ trong một khuôn dạng tơng
ứng với header của loại đó. Một số khuôn dạng nh sau:
AU: là các tệp có đuôi .au. Hỗ trợ các tệp dạng mono và stereo với độ
phân giải từ 8bit tới 16bit, tần số lấy mẫu trong khoảng 8KHz tới 48KHz.
Nguyên gốc trên nền UNIX, song cũng hỗ trợ bởi các ứng dụng PC và MAC.
AIFF: là các tệp có đuôi .aif (Audio Interchange File Format). Hỗ trợ
tệp âm thanh không nén dạng mono, stereo hoặc khuôn dạng đa kênh
(multichannel). Độ phân giải và tần số lấy mẫu trong phạm vi rất rộng, đạt tới
chất lợng CD (16bit, lấy mẫu 44KHz). Nguyên gốc trên nền Macintosh nhng
cũng hỗ trợ trên PC và UNIX.
WAV: là các tệp có đuôi .wav (Waveform Audio). Hỗ trợ dạng mono,
stereo, hoặc khuôn dạng đa kênh với tần số lấy mẫu 44KHz, 16bit mẫu. Khuôn
dạng WAV nguyên gốc trên nền Windows, hiện nay đây là dạng tệp âm thanh
phổ biến trên Internet. WAV tơng tự cấu trúc .aif nhng khác phần đầu thông


×