Tải bản đầy đủ (.pdf) (107 trang)

Ứng dụng FPGA cho nhận dạng tiếng nói tiếng việt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.44 MB, 107 trang )


GVHD: TS. Hoàng Trang Trang iv
TÓM TT LUNăVĔN

Vấnăđ nhn dng ting nói ting Vităđƣăđc nghiên cu và phát trin  Vit
Nam nhiuănĕmăqua,ăvi nhiu thut toán khác nhau trên nn tngăcácădòngăviăđiu
khin, DSP,ầ khác nhau. Tuy nhiên vấnăđ nhn dngăchaăđt kt qu tiăuăv
mcăđ chính xác và tcăđ x lý.
FPGA là mt vi mch có th lpătrìnhăđc, có tcăđ x lý cao, h tr mnh
vic x lý tín hiu s,ầăđƣăđc mt s ni trên th gii ng dngăđ nhn dng và
x lý ting nói.
Phn lunăvĕnăs điătìmăhiu và nghiên cu thut toán trích chn đcătrngă
MFCC, lng t vector VQ và mô hình Markov năHMMăđ ng dng vào vic
nhn dng các từ đnălẻ ca ting nói ting Vit nhằm mcăđíchănơngăcaoătcăđ x
lỦăvƠăđ chính xác khi nhn dng.
Vic nhn dngăđc thc thi trên Nios ca kit FPGA DE2 ca hãng Altera,
vi b từ vng gm 10 ký t s và 5 ký t đntheo ba mô hình nhn dng vi hai
kíchăthc codebook khácănhau.ăĐ chính xác nhn dng trung bình ca các mô
hình khi thc hin nhn dng 100 ln cho mi từ là:
- Viăcodebookă128:ămôăhìnhă1ăcóăđ chính xác trung bình 56.5%, mô hình 2
cóăđ chínhăxácătrungăbìnhă94,73%,ămôăhìnhă3ăcóăđ chính xác trung bình
96.87%
- Vi codebook 32:ămôăhìnhă1ăcóăđ chính xác trung bình 49.2%, mô hình 2
cóăđ chínhăxácătrungăbìnhă94.8%,ămôăhìnhă3ăcóăđ chính xác trung bình
91.53%.

T khóa:
tríchăđcătrngăMFCC, mô hình Markov n HMM, Lng t vector VQ,
Kit DE2, Nios System, SoPC.



GVHD: TS. Hoàng Trang Trang v
MASTER ESSAY SUMMARRY

The matter of Vietnamese speech recognition has been researched and
developed for many years in Viet Nam with a number of diffirent algorithm based
on different families of micro ậ controller, DSP, etc. However, does not reach the
best of the aspects of exact and speed of processing.
FPGA is an integrate circuit that is able to be programable, high speed
processing and strong on support to digital signal processing, etc, has been applied
to recognition and voiceprocessing by lots of places in the world.
The Master Essay Summarry is going to study and research the algorithm of
feature extraction method MFCC, vector quantization and the Hidden Markov
Model to be applied to recognition single words of Vietnamese speech, in order to
enhance the exact and speed of processing when being in the process of recognition.
The system recognition is carried out on Nios of Kit FPGA DE2 of Altera
companywith the vocabulary including 10 numbers and 5 single letters according to
three recognition models with two different codebook sizes. The average exact of
the models when being applied tothe recognizing process of 100 times for each
word is:
- In Codebook 128: the average exact of the model 1 is 56.5%, the average
exact of the model 2 is 94.73%, the average exact of the model 3 is
96.87%.
- In Codebook 32: the average exact of the model 1 is 49.2%, the average
exact of the model 2 is 94.8%, the average exact of the model 3 is 91.53%.

Keyword:
Feature extranction MFCC, Hidden Markov Model (HMM), vector
quantization (VQ), Kit DE2, Nios System, SoPC.

GVHD: TS. Hoàng Trang Trang vi

MC LC
TRANG
TRANG TA
QUYTăĐNHăGIAOăĐ TÀI
XÁC NHN CA CÁN B HNG DN
LÝ LCH KHOA HC i
LIăCAMăĐOAN ii
LIăCMăT iii
TÓM TT LUNăVĔN iv
MASTER ESSAY SUMMARRY v
MC LC vi
DANH SÁCH CÁC CH VIT TT x
DANH SÁCH CÁC HÌNH xi
DANH SÁCH CÁC BNG xiii
Chngă1 1
TNG QUAN 1
1.1. TNG QUAN CHUNG V LƾNHăVC NGHIÊN CU: 1
1.1.1. Tng quan v nhn dng ting nói: 1
1.1.2. Các kt qu nghiên cuătrongăvƠăngoƠiănc: 2
1.2. MC TIÊU, KHÁCH TH VẨăĐIăTNG NGHIÊN CU: 3
1.2.1. Mc tiêu: 3
1.2.2.ăĐiătng nghiên cu: 3
1.3. NHIM V CAăĐ TÀI VÀ PHM VI NGHIÊN CU: 4
1.3.1. Nhim v: 4
1.3.2. Phm vi nghiên cu: 4
1.4.ăPHNGăPHỄPăNGHIểNăCU: 5
1.5. NIăDUNGăĐ TÀI: 5
1.6.ăụăNGHƾAăTHC TIN CAăĐ TÀI: 7
Chngă2 8
ĐCăTRNGăTING NÓI TING VIT 8


GVHD: TS. Hoàng Trang Trang vii
2.1. TNG QUAN V TING NÓI: 8
2.2.ăCácăđcătrngăcăbn ca Ting Vit: 8
2.2.1. Âm tit: 8
2.2.2 Âm v: 10
2.2.3. Nguyên âm và ph âm: 10
2.2.4.ăThanhăđiu: 11
Chngă3 12
MÔ HÌNH NHN DNG TING NÓI TING VIT 12
3.1. Phân loi các h thng nhn dng ting nói: 12
3.1.1. Nhn dng từ liên tc và nhn dng từ cách bit: 12
3.1.2. Nhn dng ph thucăngiănóiăvƠăđc lpăngi nói: 12
3.2. Các yu t nhăhngăđn kt qu nhn dng ting nói: 14
3.3. Cấu trúc h nhn dng ting nói: 15
3.4. Gii thut h thng nhn dng ting nói ting Vit dùng Markov n: 16
3.5. Voice Acivation Detection (VAD): 17
3.6.ăPhngăphápătríchăđcătrngăting nói MFCC: 18
3.6.1. Pre - emphasis: 19
3.6.2. Frame blocking: 20
3.6.3. Windowing: 21
3.6.4. Binăđi FFT: 24
3.6.5. Lc tn s theo thang tn s Mel: 25
3.6.6. Phân tích cepstral: 28
3.6.7.ăTínhătoánănĕngălng: 29
3.6.8. H s delta: 29
3.7.ăăLng t vector: 30
3.7.1. Tng quan v lng t vector (VQ): 30
3.7.2. Cấu trúc và tp huấn luyn VQ: 31
3.7.3.ăĐoăđ méo: 32

3.7.4. Phân nhóm các vector huấn luyn: 32

GVHD: TS. Hoàng Trang Trang viii
Chngă4: 34
MÔ HÌNH MARKOV N HMM 34
4.1. Quá trình Markov: 34
4.2. Mô hình Markov n: 36
4.3. Gii pháp toán hcăchoăbaăbƠiătoánăcăbn ca mô hình Markov n: 39
4.3.1. Bài toán 1: 39
4.3.2. Bài toán 2: 42
4.3.3. Bài toán 3: 43
4.4. Các loi mô hình Markov n: 46
Chngă5: 48
KIT DE2 CA HÃNG ALTERA 48
5.1. Tng quan kit DE2: 48
5.2. Tng quan v SoPC trên FPGA: 49
5.3. Thit lp h thng NIOS trên kit DE2: 50
Chngă6: 54
THIT K H THNG NHN DNG TRÊN KIT DE2 VÀ KT QU ĐT
ĐC 54
6.1. Mô hình 1: 55
6.1.1. Lấy mu và tách khong lng: 55
6.1.2.ăTríchăđcătrngăMFCC: 57
6.1.3.ăLng t vetor VQ: 58
6.1.4. Huấn luyn mô hình HMM: 59
6.1.5.ăLuăđ gii thut nhn dng: 62
6.2. Mô hình 2: 63
6.3. Mô hình 3: 65
6.3.1.ăTríchăđcătrngăMFCC: 65
6.3.2. Huấn luyn mô hình HMM: 67

6.3.3. Gii thut nhn dng: 68
6.4. Kt qu thc hin: 68

GVHD: TS. Hoàng Trang Trang ix
6.4.1. Kt qu nhn dng: 68
6.4.1.1. Kt qu nhn dng ca mô hình 1: 69
6.4.1.2. Kt qu nhn dng ca mô hình 2: 71
6.4.1.3. Kt qu nhn dng ca mô hình 3: 73
6.4.2. Kt qu đánhăgiáăs xung clock ca từng mô hình: 75
6.4.2.1. Mô hình 1: 75
6.4.2.2. Mô hình 2: 76
6.4.2.3. Mô hình 3: 77
6.5. Nhn xét kt qu: 78
Chngă7: 79
KT LUN 79
7.1. Kt Lun: 79
7.1.1. Nhng mcătiêuăđtăđc: 79
7.1.2. Hn ch caăđ tài : 80
7.2. Hng phát trinăđ tài: 80
TÀI LIU THAM KHO 81
PH LC 83


GVHD: TS. Hoàng Trang Trang x
DANH SÁCH CÁC CH VIT TT

MFCC Mel Frequency Cepstrum Coefficients
VQ Vector Quantization
LPC Linear Predictive Coding
DSP Digital Signal Proccesing

HMM Hidden Markov Model
CD-HMM Continuous Density ậ Hidden Markov Model
VAD Voice Acivation Detection
DFT Discrete Fourier Transform
FFT Fast Fourier Transform
DCT Discrete Cosin Transform
FPGA Field Programmable Gate Array
RAM Random Access Memory
SRAM Static Random Access Memory
SDRAM Synchronous Dynamic Random Access Memory
PLL Phase Locked Loop
JTAG Joint Test Action Group
SD Secure Digital
SPI Serial Peripheral Interface
TV Television
SoPC System on a Programmable Chip
ADC Analog to Digial Converter
DAC Digial to Analog Converter
UART Universal Asynchronous Receiver/Transmitter
BGA Ball Grid Array
LEs Logic Elements
DPDT Double Pole Double Throw
LBG: Linde-Buzo-Gray

GVHD: TS. Hoàng Trang Trang xi
DANH SÁCH CÁC HÌNH

HÌNH TRANG
Hìnhă3.ă1:ăNgiănóiăkhácănhauăsăphátăơmăkhácănhau 13
Hìnhă3.ă2:ăMôăhìnhănhnădngătingănóiăbánăđcălpăngiănói 14

Hình 3. 3: Cấuătrúcătngăquátăcaămtăhăthngănhnădngătingănói 15
Hìnhă3.ă4:ăLuăđăgiiăthutăhăthngănhnădngătingăVitădùngăMarkovăn 16
Hìnhă3.ă5:ăĐonămuăơmăthanhătrcăkhiăVAD 17
Hìnhă3.ă6:ăĐonămuăơmăthanhăsauăkhiăVAD 17
Hình 3. 7: CácăbcăxălỦăcaăphngăphápătríchăđcătrngăMFCC 19
Hình 3. 8:ăĐápăngătnăsăđcăchunăhóaăcaăbălcăpreăậ emphasis 20
Hình 3. 9:ăTínăhiuătrcăvƠăsauăpreăậ emphasisătrongăminăthiăgian 20
Hình 3. 10: Các frame trongăphơnătíchătingănói 21
Hình 3. 11: CaăsăHammingă160ăđim 22
Hình 3. 12:ăTínăhiuătrcăkhiăcaăsăhóa 23
Hình 3. 13:ăTínăhiuăsauăkhiăcaăsăhóa 23
Hình 3. 14:ăCaăsăHammingădùngătrongăphơnătíchătingănói 24
Hìnhă3.ă15:ăQuáătrìnhăphơnătíchăphătínăhiu 25
Hình 3. 16:ăĐăthăbiuădinămiăquanăhăgiaătnăsăMelăvƠăHertz 26
Hình 3. 17:ăBĕngăbălc,ă(a)ătrongăthangăđoăMel;ă(b)ătrongăthangăđoăthôngăthng 27
Hìnhă3.ă18:ăS đăkhiăcấuătrúcăcaăVQăhuấnăluynăvƠăphơnălp 31
Hìnhă3.ă19:ăLuăđăgiiăthutăVQ 33
Hìnhă4.ă1:ăXíchăMarkovă5ătrngătháiăS
1
,S
2
, S
5
vƠăcácăxácăsuấtăchuynătrngăthái 34
Hìnhă4.ă2:ăVíădămtămôăhìnhăMarkovănăsáuătrngăthái 37
Hình 4. 3: Môătăcácădƣyăphépătoánăđcăthcăhinăđătínhăα
t
(i) 41
Hìnhă4.ă4:ăMôătăcácădƣyăphépătoánăđcăthcăhinăđătínhăbinăβ
t

(i) 42
Hình 5. 1: KIT FPGA DE2 ca hãng Altera 48
Hình 5. 2:ăSăđăkhiăkităDE2 48
Hìnhă5.ă3:ăSăđăkhiătngăquanăcaăSoPCătrênăFPGA 49

GVHD: TS. Hoàng Trang Trang xii
Hình 5. 4:ăThitălpăNiossăIIăprocessor 51
Hìnhă5.ă5:ăCấuăhìnhăchoăkhiăAudio 52
Hìnhă5.ă6:ăCấuăhìnhăchoăkhiăAV_Config 52
Hìnhă5.ă7:ăSoPCăđƣăđcătoăhoƠnăchnh 53
Hìnhă6.ă1:ăSăđ khi h thng nhn dng ting nói trên kit DE2 54
Hìnhă6.ă2:ăLuăđăgiiăthutăloiăbăkhongălng 55
Hìnhă6.ă3:ăLuăđăgiiăthutătríchăđcătrngăMFCCăcaămôăhìnhă1 57
Hìnhă6.ă4:ăLuăđăgiiăthutălngătăvector 59
Hìnhă6.ă5:ăLuăđăquáătrìnhăhuấnăluynăHMMătheoămôăhìnhă1 60
Hìnhă6.ă6:ăLuăđăgiiăthutăhuấnăluynăHMM 61
Hìnhă6.ă7:ăLuăđăgiiăthutănhnădngătheoămôăhìnhă1 62
Hình 6. 8: LuăđăgiiăthutătríchăđcătrngăMFCCăcaămôăhìnhă2 64
Hìnhă6.ă9:ăLuăđăgiiăthutătríchăđcătrng MFCC theo mô hình 3 66
Hìnhă6.ă10:ăLuăđăhuấnăluynăHMMătheoămôăhìnhă3 67
Hìnhă6.ă11:ăLuăđăgiiăthutănhnădngătheoămôăhìnhă3 68


GVHD: TS. Hoàng Trang Trang xiii
DANH SÁCH CÁC BNG


BNG TRANG
Bngă2.ă1:ăCấuătrúcătngăquátăcaămtăơmătitătingăVit 10
Bng 3. 1:ăĐ chính xác nhn dng khi s dng b lc tam giác vi s lng các b

lc khác nhau 27
Bng 6. 1: Kt qu nhn dng ca mô hình 1 viăkíchăthc codebook 128 69
Bngă6. 2: Ktăquănhnădngăcaămôăhìnhă1ăviăkíchăthcăcodebookă32 70
Bngă6.ă3:ăKtăquănhnădngăcaămôăhìnhă2ăviăkíchăthcăcodebookă128 71
Bngă6.ă4:ăKtăquănhnădngăcaămôăhìnhă2ăviăkíchăthcăcodebookă32 72
Bngă6.ă5:ăKtăquănhnădngăcaămôăhìnhă3ăviăkíchăthcăcodebookă128 73
Bngă6.ă6:ăKtăquănhnădngăcaămôăhìnhă3ăviăkíchăthcăcodebookă32 74
Bngă6.ă7:ăKtăquăđánhăgiáăsăxungăclockăcaămôăhìnhă1ăviăcodebookă128 75
Bngă6.ă8:ăKtăquăđánhăgiáăsăxungăclockăcaămôăhìnhă1ăviăcodebookă32 75
Bngă6.ă9:ăKtăquăđánhăgiáăsăxungăclockăcaămôăhìnhă2ăviăcodebookă128 76
Bngă6.ă10:ăKtăquăđánhăgiáăsăxungăclockăcaămôăhìnhă2ăviăcodebookă32 76
Bngă6.ă11:ăKtăquăđánhăgiáăsăxungăclockăcaămôăhìnhă3ăviăcodebookă128 77
Bngă6.ă12:ăKtăquăđánhăgiáăsăxungăclockăcaămôăhìnhă3ăcóăcodebookă32 77

Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 1
Chngă1
TNG QUAN

1.1.TNG QUAN CHUNG V LĨNHăVC NGHIÊN CU:
1.1.1. Tng quan v nhn dng ting nói:
Nhn dng ting nói bao gm c nhn dng âm tit ri rc, liên tc, nhn dng
ngi nói, ngôn ng nói và cao cấpăhnăcóăth nhn dngăđc trng thái tâm lý ca
ngi nói. Có rất nhiu ng dng ca nhn dng tingănóiătrongăđi sng xã hi
nh:ăxác nhnăthôngătin,ăđiu khinărobot,ăvoiceămail,ăđin thoi,ầTuyănhiênăđiu
mà miăngi c gng nghiên cu là làm sao có th giao tip giaăngi và máy
tính thông qua ting nói.
Nhn dng ting nói là mtălƿnhăvc ca x lý ngôn ng t nhiên, tc là v că
bn nhn dng ting nói ph thuc vào ngôn ng nói. Do vy, ngôn ng nhn dng
ting Vit khác so vi ting Anh và các th ting khác.

Nhn dng ting nói là mt quá trình nhn dng mu, vi mcăđíchălƠăphơnălp
thôngătinăđu vào là tín hiu ting nói thành mt dãy tun t các muăđƣăđc hc
trcăđóăvƠăluătr trong b nh. Các muălƠăcácăđnăv nhn dng, chúng có th là
các từ, hoc các âm v. Nu các mu này là bất binăvƠăkhôngăthayăđi thì công vic
nhn dng ting nói tr nênăđnăgin bằng cách so sánh d liu ting nói cn nhn
dng vi các muăđƣăđc hcăvƠăluătr trong b nh.ăKhóăkhĕnăcăbn ca ting
nói là ting nói luôn bin thiên theo thi gian và có s khác bit ln gia ting nói
ca nhngăngi nói khác nhau, tcăđ nói, ng cnh và môiătrng âm hc khác
khau.ăXácăđnh nhng thông tin bin thiên nào ca ting nói là có ích và nhng
thôngătinănƠoălƠăkhôngăcóăíchăđi vi nhn dng ting nói là rất quan trng.ăĐơyălƠă
mt nhim v rấtăkhóă khĕn.ăCácănghiênăcu v nhn dng ting nói da trên ba
nguyên tcăcăbn sau:
 Tín hiu tingănóiăđc biu din chính xác bi các giá tr ph trong mt
khung thi gian ngn. Nh vy ta có th tríchăraăcácăđcăđim ting nói từ
Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 2
nhng khong thi gian ngnă vƠă dùngă cácă đcă đim này làm d liuă đ
nhn dng ting nói.
 Ni dung ca tingănóiăđc biu dinădi dng ch vit, là mt dãy các
ký hiu ng ơm.ăDoăđó,ăỦănghƿaăca mtăphátăơmăđc bo toàn khi chúng
ta phiên âm phát âm thành dãy các ký hiu ng âm.
 Nhn dng ting nói là mt quá trình nhn thc. Thông tin v ng nghƿa,ă
d đoánăcóăgiáătr trong quá trình nhn dng ting nói, nhất là khi thông tin
v âm hc là không rõ ràng.
1.1.2. Các kt qu nghiên cuătrongăvƠăngoƠiănc:
Hinănayăcóărấtănhiuăphngăphápănhnădngătingănóiăđƣăđcăthcăhinănhă
mô hìnhăFujisakiăđcăngădngărngărƣiătrongăhăthngăcaătingăNht,ămôăhìnhă
MFGI (Mixdorff ậ Fujisakiă modelă ofă Germană Intonation)ă đcă ngă dngă trongă
tingăĐc,ầăvitănamăcũngăđƣăcóămtăsămôăhìnhănhnădngătingănóiăđƣăđcă
xơyădngănh:

 Tngă hpă vƠă nhnă dngă tingă Vită caă GS.TSKHă Bchă Hng
Khang[1]:NghiênăcuăcăsălỦăthuytăcaăcácăhăthngănhnădngătingănóiă
vƠăđcătrngătingăVit.
 KỹThută nhnă dngă tingă nóiă vƠă ngă dngă trongă điuă khină caă TS.
NguynăVĕnăGiápăvƠăăKS.ăTrnăHngăVit [2]: ĐătƠiănƠyăthănghimăhă
thngă nhnă dngă tingă nóiă tingă Vită trênă máyă tínhă bằngă phngă phápă
MFCCăvƠănhnădngăbằngămôăhìnhăMarkovănăHMM,ăngădngătrongăđiuă
khinăkhinăxeăviăbătừăvngăgmă4ătừ:ăắtrái,ăphi,ătin,ălùi” viăktăquă
chínhăxácăđtăđcătrênă90%.ă
 NhnădngătingăVitădùngămngăneuronăktăhpătríchăđcătrngădùngăLPCă
và AMDFcaăTS.ăHoƠngăĐìnhă Chin[3]: đătƠiăxơyădngă môă hìnhănhnă
dngătingănóiă tingăVităviăbă từă vngăắlên,ăxung,ă trái,ă phi,ă ti,ă lùi,ă
xoay,ădừng”,ăchoăktăquăchínhăxácănhnădngătrungăbìnhălƠă99,4%.
ThutătoánătríchăchnăđcătrngătingănóiăMFCCăvƠămôăhìnhăMarkov năHMMă
lƠăhaiăthutătoánăđcănghiênăcuăvƠăngădngănhiuătrongăvicănhnădngătingănói,ă
Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 3
bênăcnhăđóăvicăsădngămáy tính, viăđiuăkhin,ăDSP, FPGA vào nhnădngătingă
nóiăcũngăđcăphátătrinănhiuănĕmăqua. Vicăxơyădngămôăhìnhănhnădngătingă
nóiă trênă viă điuă khină thìă dă dƠngă thcă hină vìă viă điuă khină trênă thă trngă rấtă
phongăphú,ădăkimăvƠăgiáărẻ,ătuyănhiênătcăđăxălỦăkhôngăcao.ăTrongăkhiăđóăvică
xơyădngăhăthngănhnădngătrênăFPGAăbằngăngônăngăVerilogăHDLăcóătcăđăxă
lỦănhanh,ăătuyănhiênăvicăthcăhinăhăthngăquáăphcătp.ăDoăđó,ăvicăxơyădngăhă
thngănhnădngădùngăSoPC,ăchngătrìnhăđcăthcăthi trênăNiosăcaăFPGA caă
hƣngăAlteraăvừaăciăthinăđcătcăđăxălỦăsoăviăvicădùngăviăđiuăkhinăvừaărútă
ngnă thiă gian xơyă dngă chngă trìnhă vƠă giiă thută soă viă vică dùngă ngônă ngă
Verilog HDL.
NhimăvăchínhăcaălunăvĕnălƠăxơyădngămôăhình nhnădngătingănóiătingă
Vităsă dngă thutătoánătríchăchnăđcă trngăMFCC,ă lngătă vectoră VQ và mô
hình Markov năHMM dùng SoPCătrênăFPGAăcaăhƣngăAltera.

1.2. MC TIÊU, KHÁCH TH VẨăĐIăTNG NGHIÊN CU:
1.2.1.Mc tiêu:
- Nghiên cu h thng nhn dng ting nói.
- Nghiên cu thutătoánătríchăđcătrngăMFCC ng dngăvƠoătríchăđcătrngă
ting nói ting Vit.
- Nghiên cuă phngăphápă lng t vectorăđ ng dng vào mô hình nhn
dng ting nói ting Vit.
- Nghiên cu mô hình Markov n HMM ng dng vào huấn luyn và nhn
dng ting nói ting Vit.
- Xây dng mô hình nhn dng ting nói ting Vit trên NIOS ca kit FPGA
DE2 ca hãng Altera.
1.2.2.ăĐiătng nghiên cu:
- Lý thuyt nhn dng ting nói.
- Thut toán MFCC và ng dng.
- Phngăphápălng t vector VQ và ng dng.
- Mô hình Markov n HMM và ng dng.
Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 4
- Kit FPGA DE2 ca hãng Altera.
1.3. NHIM V CAăĐ TÀI VÀ PHM VI NGHIÊN CU:
1.3.1. Nhim v:
 Giaiăđon 1 (2/2012 ậ 3/2012): Tìm tài liu tham kho
 Giaiăđon 2 (4/2012 ậ 6/2012): Tìm hiu và nghiên cu
- Lý thuyt v nhn dng ting nói.
- Thut toán MFCC và ng dng.
- Lng t vector VQ và ng dng.
- Mô hình Markov n HMM và ng dng.
- Kit FPGA DE2 ca hãng Altera.
 Giaiăđon 3 (7/2012 ậ 6/2013): Xây dng mô hình nhn dng
- Xây dng mô hình nhn dng ting nói ting Vit trên NIOS ca kit FPGA

DE2 ca hãng Altera.
- Đánhăgiá đ chính xác ca mô hình trong nhn dng ting nói ting Vit.
- Đánhăgiáăs xung clock ca mô hình nhn dng ting nói ting Vit.
 Giaiăđon 4(7/2013): Vit báo cáo
1.3.2. Phm vi nghiên cu:
- Đ tài tp trung vào vic nghiên cu lý thuyt nhn dng ting nói.
- Tìm hiu và ng dng thut toán tríchăđcătrngăMFCC vào mô hình nhn
dng ting nói ting Vit.
- Tìm hiu và ng dng phngăphápălng t vector vào mô hình nhn dng
ting nói ting Vit.
- Tìm hiu và ng dng mô hình Markov n HMM vào mô hình nhn dng
ting nói ting Vit.
- Xây dng mô hình nhn dng ting nói ting Vit trên NIOS ca kit FPGA
DE2 ca hãng Altera vi s lng từ nhn dng là 10 ký t s và 5 ký t đnă
ắtin”,ăắlùi”,ăắtrái”,ăắphi”,ăắdừng”.
- Đánhăgiáăđ chính xác và s xung clock ca mô hình nhn dngăđ đaăraă
nhng gii pháp hu ích cho vic nhn dng ting nói ting Vit.
Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 5
1.4.ăPHNGăPHỄPăNGHIểNăCU:
Ngi thc hinăđ tƠiăđƣăs dngăcácăphngăăphápăsauăđơy:
- Phngăphápănghiênăcu tài liu: các tài liuăliênăquanăđn nhn dng ting
nói,ă phngă phápă tríchă đcă trngă MFCC,ă lng t vector VQ, mô hình
Markov năHMM,ăđcăđim ting Vit. Các tài liu liên quan v FPGA và kit
DE2 ca hãng Altera.
- Phngăphápăphơnă tích:ăphơnă tíchăđcă đim ting Vit,ă phngăphápă trích
chnăđcătrngăMFCC,ăphngăphápălng t vector VQ, mô hình Markov
n HMM trong nhn dng ting Vit.
- Phngăphápăchuyênăgia:ăthamăkho ý kin ca chuyên gia v FPGA, trích
chnăđcătrngăMFCC,ălng t vector VQ, mô hình Markov n HMM trong

nhn dng ting nói ting Vit, và kh nĕngăng dng vào thc t.
- Phngăphápăthc nghim: thc nghim vic nhn dng ting nói ting Vit
trên kit FPGA DE2 ca hãng Altera.
1.5. NIăDUNGăĐ TÀI:
Niădungăđ tài gm các phn sau:
Chngă1:ăTng quan
- Tng quan chung v lƿnhăvc nghiên cu.
- Mc tiêu và nhim v.
- PhmăviăvƠăphngăphápănghiênăcu.
Chngă2:ăĐcătrngăting nói ting Vit
- Phân tích tng quan v ting nói.
- Cácăđcătrngăcăbn ca ting Vit.
Chngă3:Mô hình nhn dng ting nói ting Vit
- Phân loi các h thng nhn dng ting nói.
- Các yu t nhăhngăđn kt qu nhn dng ting nói.
- Cấu trúc ca h nhn dng ting nói.
- Gii thut h thng nhn dng ting nói ting Vit.
- Phơnătíchăphngăphápătríchăđc trngăMFCC.
Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 6
- Phơnătíchăphngăphápălng t vector VQ.
Chngă4:Mô hình Markov n HMM
- Căs lý thuyt v mô hình Markov n HMM.
- ng dng mô hình Marko n HMM vào nhn dng ting nói ting Vit.
Chngă5:ăKit DE2 ca hãng Altera
- Tng quan v kit DE2.
- Mt s thành phn h tr ca kit DE2 cho nhn dng ting nói.
Chngă6:ăThit k h thng nhn dng trên kit DE2 và kt qu đtăđc
- Xây dng thut toàn tin x lý ting nói ting Vit trên Nios ca kit DE2.
- Xây dng thut toán trích chnăđcătrngăting nói ting vit MFCC cho ba

mô hình trên NIOS ca kit DE2.
- Xây dng thutătoánălng t vector VQ viăhaiăkíchăthc codebook 32 và
codebook 128 cho ba mô hình trên NIOS ca kit DE2.
- Xây dng thut toán mô hình Markov n cho ba mô hình trên NIOS ca kit
FPGA DE2.
- Xây dng thut toán huấn luyn và nhn dng ting nói ting Vit cho ba mô
hìnhvi haiăkíchăthc codebook 128 và codebook 32.
Đaăcácăch tiêu quan trng v nhn dngăvƠăđ chính xác ca mô hình nhn
dng,ăđánhăgiáăs xung clock ca mô hình nhn dngăvƠăhng phát trinăđ tài.
- S từ nhn dng.
- Kt qu nhn dng caă baă môă hìnhă theoă kíchă thc codebook 128 và
codebook 32.
- Đánhăgiáăs xung clock ca ba mô hình nhn dngătheoăkíchăthc codebook
128 và codebook 32.
Chngă7:Kt lun
- Nhng mcătiêuăđtăđc.
- Hn ch caăđ tài
- Hng phát trinăđ tài.

Chngă1:ăTNG QUAN
GVHD: TS. Hoàng Trang Trang 7
1.6.ăụăNGHĨAăTHC TIN CAăĐ TÀI:
Đ tài nghiên cu có th đc s dng làm tài liu nghiên cu và ging dy
choăsinhăviênăđi hc và cao hcătrongăđƠoătoăcácăchuyênăngƠnhăĐin ậ Đin t,
Đin t vin thông,ầ
ng dng mô hình nhn dng ting nói ting Vit trong các h thng nhn
dng,ăđiu khin thit b,ărobot,ầbằng ting nói ting Vit.
Kt qu nhn dng, s xung clock ca từng mô hình vi ch s codebook khác
nhau là nn tnăcăs cho vic la chnăphngăán tiăuăchoămôăhìnhănhn dng
khi xây dng h thng nhn dng trong các ng dng thc t.

Chngă2:ăĐCăTRNGăTING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 8
Chngă2
ĐCăTRNGăTING NÓI TING VIT

Tín hiu tingănóiăđc xem là tín hiu ngu nhiên vì chúng ta không th xác
đnhăchínhăxácăbiênăđ và tn s ca tín hiu tingănóiăđc nói. Tuy nhiên, mi từ
ca ting nói li cha nhng thành phnăđcătrngăriêngăđcătrngăchoătừ đó,ăvìăvy
vicătáchăđcătrngăting nói là quá trình quan trng trong h thng nhn dng ting
nói. Các h thng nhn dng s phân bit các từ khác nhau trong ting nói da trên
đcătrngăriêngăca mi từ.ăQuáătrìnhătríchăđc trng tingănóiălƠăquáătrìnhăcôăđng
tín hiu ting nói ca mi từ thành các thông s đcătínhăđcătrngăchoătừ đó,ănhằm
gim nhẹ công vic nhn dngăvƠătĕngăđ chính xác cho h thng nhn dng.
2.1. TNG QUAN V TING NÓI:
Ting nói là mt loi sóng âm. Khi chúng ta nói, tingă nóiă đc truynă điă
mangătheoăthôngătinădi dngăcácădaoăđng truynăđnătaiăngi nghe. Mcăđ
truyn tin ca tingănóiăđc xem là nhanh nhất trong các kh nĕngăt nhiên ca
conăngi.
Tín hiu ting nói cha các thông tin có tn s tp trung trong khong từ 4kHz
tr xung.ăĐơyăcũngăchínhălƠăkhong tn s chaănĕngălng ch yu ca tín hiu
ting nói.
Trong khong thi gian dài, tín hiu ting nói là tín hiu không dừng,ănhngă
trong khong thiăgianăđ ngn tín hiu tingănóiăđcăxemănhătínăhiu dừng.
Đi vi quá trình nhn dng ting nói, thì ngoài vic nhnăraăcácăđcătrngăca
ting nói thì quá trình hc thích nghi viăcácăthayăđi caăđcătrngătingănóiăcũngă
rất quan trng.
2.2.ăCácăđcătrngăcăbn ca Ting Vit:
2.2.1. Âm tit:
Ting vit có nhngăđcătrngăkhácăbit so vi các ngôn ng khác trong cách
phátăơmăcũngănhăghépăcácăơmăthƠnhătừ có nghƿa.ăĐnăv nh nhất ca ting Vit là

âm tit (ting), âm tit có nhngăđcăđimănhăsau:
Chngă2:ăĐCăTRNGăTING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 9
 Tínhăđc lp: tc là mi âm tit là mt thành phn nh, chúng rõ ràng và
tách bit vi nhau, mi từ đi din cho mt âm tit duy nhất.
 Không có hinătng ni âm: trong ting Vit,ădùăngi nói nói nhanh hay
nói chm thì mi từ phátăraăđu riêng lẻ, không có s ni âm hay nut âm
nhătrongătingăAnh.ăĐiu này làm cho ranh gii gia các âm tit rõ ràng
vi nhau, không có s chng lấp gia các từ.
 Ting vit có hai loi từ là từ đnăvƠătừ ghép. Từ đnălƠătừ đc to từ mt
âm tit, từ ghép là từ đc to từ nhiu từ đn.ăTrongăđaăs cácătrng hp
mi từ đnăđuămangăỦănghƿaăđyăđ, vic ghép các từ đnăcóănghƿaăthƠnhă
mt từ ghépăcóănghƿaăkhácălƠmăchoăvấnăđ nhn dng từ ghép tr nên khó
khĕnăhn.
Khi phát âm mt âm tit,ăcácăcătht ca b máyăphátăơmăđu tri qua ba giai
đon:ătĕngăcngăđ cĕng,ăđnhăđimăcĕngăthẳng và gimăđ cĕng.
Da vào cách kt thúc, các âm tit ting Vităđc chia thành hai loi ln là
âm tit m và âm tit khép. Trong mi loi li có hai loi nh hn,ănhăvy có bn
loi âm tit trong ting Vitănhăsau:
 Âm tit na khép: là nhng âm tităđc kt thúc bằng mt ph âm vang
nh:ăm,ăng,ănh,ầ
 Âm tit khép: là nhng âm tităđc kt thúc bằng mt ph âm không vang
nh:ăp,ăt,ăk,ầ
 Âm tit na m: là nhng âm tit kt thúc bằng mtăbánănguyênăơmănh:ă
tay,ăcay,ăcau,ầ
 Âm tit m: là nhng âm tităđc kt thúc bằng cách gi nguyên âm sc
ca nguyên âm  đnh âm titănh:ăta,ăma,ăto,ầ
Âm tit ting Vit có mt cấu trúc cht ch, nó không ch là mtăđnăv ngôn
ng đnăthun mà còn là mtăđnăv từ vng và ng pháp ch yu. Mô hình cấu
trúc tng quát ca mt âm tit ting Vităđc th hin trong bng 2.1.



Chngă2:ăĐCăTRNGăTING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 10
Bng 2. 1:Cấu trúc tng quát ca mt âm tit ting Vit
Thanhăđiu
Ểmăđu
Vn
Ểmăđm
Âm chính
Ểmăcui

2.2.2 Âm v:
Mt ting nói gm mt chuiăcácăơmăcăbn gi là âm v. Xét v mc ng âm,
âm v lƠăđnăv nh nhất ca ting nói, là mtăđnăv trừuătng mà chúng ta không
th quan sát trc tip trong tín hiu ting nói. Mi âm v có hai chcănĕng:
 Cấu to nên v âm thanh caăcácăđnăv cóănghƿa.
 Phân bit v âm thanh caăcácăđnăv cóănghƿa.
Ví d v từ ắtôi”ăcóăbaăơmăv lƠăắt”,ăắô”ăvƠăắi”.
2.2.3. Nguyên âm và ph âm:
 Nguyên âm:
Nguyên âm là mt âm thanh trong ngôn ng nói,ăđc phát âm vi thanh qun
m,ădoăđóăkhôngăcóăs tíchălũyăápăsuất không khí trên bất c đim nào ca thanh
môn, ca b phn cấu âm, vì vyănguyênăơmăkhôngăcóăđim cấu âm.
NgoƠiăcácănguyênăơmăđn,ătrong ting Vităcònăcóăcácănguyênăơmăđôi,ăhayăcònă
gi là nh âm. Trong ting vit có 16 âm v lƠănguyênăơm,ătrongăđóăcóă13ănguyênăơmă
đnăvƠă3ănguyênăơmăđôi.
 Ph âm:
Ph ơmăđc to ra do lungăhiăb chn  mtăđimănƠoăđóătrongăb phn cấu
âm khi phát âm, vì vy ph ơmăcóătiêuăđim cấu âm. Khi phát ph ơmăthìăđ cĕngă

thng tp trung  tiêuăđim cấu âm. Ph ơmăđc chia làm các loiăcăbn sau:
 Ph âm btăhi:ăơmăđc phát ra từ s phá v các cn tr và c xát
gia hai mép dây thanh. Ví d ph âm btăhiănh:ăắth”,ăắt”,ăắtr”,ầ
 Ph ơmămũi:ăơmăđc phát ra từ lungăkhôngăkhíăđc to ra và thoát
ra ngoài nhẹ nhƠnăquaăkhoangămũi.ăKhiăquaăkhoangămũi,ăơmănƠyăchu
Chngă2:ăĐCăTRNGăTING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 11
cngăhng caăkhoanămũi.ăPh ơmănƠyăcònăđc gi là âm vang. Ví
d v ph ơmămũiănh:ăắm”,ăắn”,ăắnh”,ầ
 Ph ơmăxát:ăkhôngăkhíăđiăraăb cn tr không hoàn toàn, phi lách ra
mt khẻ h nh giaăhaiăcăquanăcấu âm, gây nên ting c xát nhẹ. Ví
d v ph ơmăxácănh:ăắv”,ăắg”,ầ
2.2.4.Thanhăđiu:
Thanhă điuă lƠăđcă tínhă đcă trngăca ting Vit nói riêng và các ngôn ng
ting nóiăcóăthanhăđiu nói chung so vi các ngôn ng khácănhătingăAnh,ăPháp,ầ
Thanhăđiu là mt thành phn ng âm, không phi là nhấn ging, giúp phân
bit các từ đng âm.
Ngi ta phân bităthanhăđiu da vào hai yêu t lƠăơmăđiu và âm vc. Âm
điu là s thayăđi tn s căbn caăthanhăđiuăhayăđng nét caăthanhăđiu, còn
âm vc là min giá tr ca tn s căbn.
Trong ting Vit tng cngăcóă6ăthanhăđiuănhăsau:
 Thanh ngang: âm phát ra bằng phẳng và không có lên hay xung từ đu
đn cui âm.
 Thanh huyn: âm phát ra bằng phẳngă nhngăhiă xung v phía cui âm
mtăcáchăđuăđng.
 Thanh hi:ă ơmă phátă raă điă xung  gia thanh ri li tip tcă điă lênă đn
ngang viăđim btăđu.
 Thanh sc:ăơmăphátăraătĕngălênăkhôngăđu từ thấp và có th lên rất cao, và
cui cùng kt thúc bằng mt nét tt ging.
 Thanhăngƣ:ăơmăphátăraăcóăđim btăđu thấp và không bằng phẳngăcóăđon

dc b đc quãng do thanh hu nghn li to nên khong giánăđon  gia
thành và cui cùng li lên cao nhanh chóng.
 Thanh nng: âm phát ra btăđu thấp và từ từ xung thấpăhnăna ri cui
cùng kt thúc bằng mt nét tt ging.
Chngă3:ăMỌăHỊNHăNHN DNG TING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 12
Chngă3
MÔ HÌNH NHN DNG TING NÓI TING VIT

3.1. Phân loi các h thng nhn dng ting nói:
3.1.1. Nhn dng t liên tc và nhn dng t cách bit:
Môt h nhn dng ting nói có th là mt trong hai dng: nhn dng liên tc và
nhn dng từ cách bit. Nhn dng liên tc tc là nhn dng tingănóiăđc phát liên
tc trong mt chui tín hiu, chẳng hnănhămt câu nói, mt mnh lnh hoc mt
đonăvĕnăđcăđc biăngi dùng. Các h thng loi này rất phc tp, chúng phc
tp  ch các từ đc phát liên tc gây khóăkhĕnătrongăvic x lý kp nu cn thi
gian thc, hoc khó tách ra nuănhăngi nói liên tc không có khong ngh. Kt
qu tách từ nhăhng rất lnăđnăcácăbc sau, cn phi x lý tht tt trong quá
trình tách từ.
Trái li, vi mô mình nhn dng từ riêng lẻ, mi từ cn nhn dngăđc phát
âm mt cách ri rc, có các khong ngh trc và sau khi phát âm mt từ. Mô hình
nƠyădƿănhiênăđnăginăhnămôăhìnhănhn dng liên tc,ăđng thiăcũngăcóănhng
ng dng thc tin,ănhătrongăcácăh thngăđiu khin bằng ging nói, quay s bằng
gingănói,ầvi đ chính xác khá cao, tuy nhiên khó áp dng rng rãi so vi mô
hình nhn dng liên tc.
3.1.2. Nhn dng ph thucăngiănóiăvƠăđc lpăngi nói:
Đi vi nhn dng ph thucăngi nói thì mi mt mô hình nhn dng ch
phc v đc cho mtăngi, và mô hình s không hiuăngi khác nói gì nuănhă
chaăđc huấn luyn li từ đu.ăDoăđó,ăh thng nhn dngăngiănóiăkhóăđc
chấp nhn rng rãi vì không phiăaiăcũngăđ kh nĕngăkin thc và nhất là kiên

nhnăđ huấn luyn h thng.ăĐc bit là h thng loi này không th ng dng 
niăcôngăcng.
Ngc li, h thng nhn dngăđc lpăngiănóiăthìălỦătngăhn,ăng dng
rngărƣiăhn,ăđápăngăđc hu ht các yêu cuăđ ra.ăNhngăkhóăkhĕnălƠăh thng
lỦătngănhăvy gp mt s vấnăđ, nhấtălƠăđ chính xác ca h thng.
Chngă3:ăMỌăHỊNHăNHN DNG TING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 13
Trong thc t, miăngi có mt ging nói khác nhau, thm chí ngay cùng
mtăngiăcũngăcóăging nói khác nhau  nhng thiăđimăkhácănhau.ăĐiu này nh
hng rất lnăđn vic nhn dng, nó làm gimăđ chính xác ca h thng nhn
dng xung nhiu ln.ăDoăđóăđ khc phc khuytăđim này, h thng nhn dng
đc lpăngi nói cnăđc thit k phc tpăhn,ăđòiăhiălng d liu huấn luyn
lnăhnănhiu ln.ăNhngăđiuănƠyăcũngăkhôngăci thinăđc bao nhiêu chấtălng
nhn dng.ăDoăđó,ătrongăthc t có mt cách gii quytălƠăbánăđc lpăngi nói.
PhngăphápănƠyăthc hin bằng cách thu mu mt s lng ln các ging nói khác
bit nhau. Khi s dng, h thng s đcăđiu chnh cho phù hp vi ging ca
ngi dùng, bằng cách nó hc thêm mt vài câu có cha các từ cn thit.
Nhn dngăđc lpăngiănóiăkhóăhnărất nhiu so vi nhn dng ph thuc
ngi nói. Cùng mt từ, mtăngi, dù có c gng phát âm cho tht gingăđiăna thì
cũngăcóăs khác bit.ăĐi vi b nƣoăconăngi, mt h thng hoàn ho, thì s khác
bităđóăcóăth đc b qua do ng cnh, và do có phn x lý làm m điăca não.
Nhngăđi vi máy tính thì rất khó xây dngăđc mt mô hình gii quyt cho tất
c cácătrng hp khác bităđó.

Hình 3. 1: Ngi nói khác nhau s phát âm khác nhau
Chngă3:ăMỌăHỊNHăNHN DNG TING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 14
Liănói
Rút trích
đcătrng

Xấpăxă
thamăs
Laăchnă
nhóm
Mô hình
ngiăthăi
Mô hình
toƠnăcc
Thuănhnă
dăliu
Liănói
Rút trích
đcătrng
Chinălcă
soăkhp
Chinălcă
loiătrừ
Thuănhnă
dăliu
Huấnăluyn
Nhnădng

Hình 3. 2: Mô hình nhn dng tingănóiăbánăđc lpăngi nói
3.2. Các yu t nhăhởngăđn kt qu nhn dng ting nói:
Vic nhp d liu ting nói thc hin d dƠngăhnăcácăloi d liu khác do tính
đnăgin,ănhanh,ălƠmăđc trong khi vnălƠmăđc vicăkhác,ầTuyănhiên,ădoătínhă
phc tp ca d liu ting nói, nên vic nhn dng tingănóiămangăđ phc tp cao
hnăsoăvi các h thng nhn dng khác. Vì vy, h thng nhn dng ting nói có
rất nhiu yu t nhăhngăđn kt qu ca quá trình nhn dngănh:
 S lngă ngi dùng: s lngă ngi dùng càng ln thì h thng nhn

dng phiăđc thit k sao cho có th nhn dngăđc nhiuăngi khác
nhau,ădoăđóăđ chính xác nhn dng càng cao khi h thngăđc thit k
cho s lngăngi s dng càng ít.
 Kíchă thc ca b từ vng:ă kíchă thc ca b từ vng càng ln thì h
thng nhn dng cn phân bit rõ gia các từ trong b từ vng vi nhau, do
đóăviăkíchăthc ca b từ vng càng nh thìăđ chính xác ca h thng
nhn dng càng ln.
 Tingănóiăđc thu âm mt cách ri rc trong nhng khon thiăgianăđ
lnăthìăđ chính xác ca h thng nhn dngăcaoăhnătingănóiăđc thu
mt cách liên tc.ăNhăvy, vic nhn dng các từ đnăthng chính xác
hnăsoăvi vic nhn dng mt câu nói liên tc.
Chngă3:ăMỌăHỊNHăNHN DNG TING NÓI TING VIT
GVHD: TS. Hoàng Trang Trang 15
 H thng nhn dngătrongămôiătrng nhiu, nhiu tp âm s làm gimăđ
chínhăxácăhnăsoăviătrongămôiătrngăyênătƿnh,ăítătp âm.
 Thit b thuăơmăđuăvƠoăcũngănhăhngăđn kt qu ca h thng nhn
dng, vi nhng thit b thu âm kém chấtălng có th làm mất mát thông
tin, sai lchăthôngătin,ầă lƠmăchoăh thng nhn dng s khó nhn dng
chínhăxácăhn.
3.3. Cu trúc h nhn dng ting nói:
Hình 3.3trình bày cấu trúc nguyên lý ca mt h nhn dng ting nói. Tín hiu
tingănóiătrc htăđc x lý bằng cách áp dng quá trình trích chnăđcătrngăvà
quá trình tin x lý. Kt qu thuăđc sau quá trình trích chnăđcătrngălƠătp các
đcătrngăơmăhcăđc to dng thành mt vector.
TinăxălỦ Tríchăchnăđcătrng Soăsánhătngăđng
Tingănóiă
đuăvƠo
Vector
đcătrng
Môăhìnhăơmăhc

Môăhìnhăngônăng
Từăđin
Giiămƣ
Đuăra

Hình 3. 3: Cấu trúc tng quát ca mt h thng nhn dng ting nói
Vicăsoăsánhătrc ht thc hin bằng vic huấn luyn xây dngăcácăđcătrng,ă
sauăđóăs dngăđ so sánh vi các tham s đuăvƠoăđ thc hin vic nhn dng.
Trong quá trình huấn luyn h thngăcácăvectorăđcătrngăđcăđaăvƠoăh thngăđ
călng các tham s ca mu tham kho. Mt mu tham kho có th mô phng
mt từ, mtăơmăđnăhoc mtăđnăv tingănóiănƠoăđó.ăTùyăthuc vào nhim v ca
h thng nhn dng, quá trình huấn luyn h thng s bao gm mt quá trình x lý
ít phc tp hoc nhiu phc tp.
Vic trích chnăcácăđcătrngătiêuăbiu và xây dng mt mô hình tham kho là
mt quá trình tn thi gian và là mt công vic phc tp.

×