B GIÁO DO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
Phạm Ngọc Hưng
NHẬN DẠNG TỰ ĐỘNG TIẾNG NÓI PHÁT ÂM LIÊN TỤC
CHO CÁC PHƯƠNG NGỮ CHÍNH CỦA TIẾNG VIỆT
THEO PHƯƠNG THỨC PHÁT ÂM
Chuyên ngành: Hệ thống thông tin
Mã số: 62480104
LUẬN ÁN TIẾN SĨ HỆ THỐNG THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
1. PGS.TS. Trịnh Văn Loan
2. TS. Nguyễn Hồng Quang
Hà Nội - 2017
LỜI CAM ĐOAN
tt c các ni dung trong lun dng t ng ting nói
phát âm liên t chính ca ting Vit là
cơng trình nghiên cu c a riêng tôi. Các s liu, kt qu trong lun án là trung th c và
c công b trong bt k cơng trình nào khác c
công b trong lun án này. Vic tham kho các ngun tài li c thc hin trích dn
và ghi ngun tài liu tham khnh.
™. TP TH NG DN KHOA HC
TÁC GI LU N ÁN
PGS.TS. Tr
Phm Ng
2
LỜI CẢM ƠN
Tơi xin bày t lịng bii hc Bách khoa Hà Ni, Vin Công ngh
Thông tin và Truyn thông, B mơn K thut máy tính, B mơn H tho
u kin thun li cho tơi trong q trình hc tp tng.
Tôi mun gi li c c bit ti tp th ng dn trc tip là
PGS.TS. Trn Hng Quang. Hai Th,
ng li khun, nhng khoa hc r tơi có th trin khai
và hồn thành cơng vic nghiên cu ca mình.
Xin chân thành c ng nghip trong B môn H thng
Thông tin, B môn K thut máy tính, Vin Cơng ngh Thơng tin và Truyn thơng,
i hc Bách khoa Hà Ni i hc tp, thc hi tài nghiên c t
ng viên tôi trong sut q trình nghiên cu.
C Khoa Cơng ngh Thơng tin và Tng i h m K thut
Yênu kin cho tơi trong sut q trình nghiên cu và
hồn thành lun án này.
Vi t m lòng bin các thy cô, các nhà khoa hng nghip và bn bè
thân h tơi trong q trình nghiên cu.
Cui cùng tơi mun bày t lòng bi c tng và là
ngung l t mi tr ng hoàn thành lun án này.
Phạm Ngọc Hưng
3
MỤC LỤC
MC LC ............................................................................................................................. 4
GII THÍCH CÁC KÝ HIU VÀ CH VIT TT............................................................ 7
DANH MC CÁC BNG .................................................................................................. 10
DANH MC CÁC HÌNH TH .......................................................................... 12
M U ............................................................................................................................. 14
1.
TNG QUAN V NHN DNG TING NÓI VÀ NHN DNG
19
1.1.
Nhn dng ting nói .............................................................................................. 19
1.1.1.
Tng quan v nhn dng ting nói ................................................................ 19
1.1.2.
Lch s phát trin và các tin b trong nghiên cu nhn dng ting nói ...... 20
1.1.3.
Các thách thi vi nhn dng t ng ting nói ..................................... 21
1.1.4.
Phân loi h thng nhn dng t ng ting nói ........................................... 22
1.2.
Nhn d......................................................................................... 24
1.2.1.
Các mơ hình nhn d ............................................................. 24
1.2.2.
Nhn d n khác nhau............................. 25
1.3.
Nghiên cu nhn dng ting nói và nhn d ting Vit ............... 30
1.4.
Mt s mơ hình nhn dng ................................................................................... 31
1.4.1.
Mơ hình GMM .............................................................................................. 31
1.4.2.
B phân lp SVM .......................................................................................... 33
1.4.3.
Mn to .................................................................................... 39
1.5.
K............................................................................................................ 43
2. XÂY DNG B NG LIU CHO NGHIÊN CU NHN D
TING VIT ....................................................................................................................... 45
2.1.
T ting Vit ........................................................................ 45
2.1.1.
ting Vit........................................ 45
2.1.2.
m ng chính ca ting Vit ....................... 46
2.1.3.
S khác bit v t vng và ng ting Vit 47
2.2.
Cu trúc âm tit, âm v ting Vit ........................................... 49
2.2.1.
Âm tit và âm v trong ting Vit .................................................................. 49
2.2.2.
m và cách kt h ............................. 53
4
2.3.
Ph ting Vit ............................................................. 54
2.3.1.
H thng ph u ..................................................................................... 54
2.3.2.
So sánh h thng ph Bc-Trung-Nam ................... 56
2.4.
H thu và các bin th ting Vit ...................... 56
2.4.1.
H thu Hà Ni .......................................................................... 57
2.4.2.
H thu Ngh - ...................................................... 57
2.4.3.
H thng và Thành ph H Chí Minh .......................... 58
2.4.4.
Mt s nhn xét v h thu cá ............................. 59
2.5.
ng c ti nhn dng ting nói ........................................... 60
2.6. Ng li trên th gii và xây dng b ng liu dùng cho nhn dng
ting Vit ..................................................................................................... 60
2.6.1.
ng b ng li ting Vit ......................... 62
2.6.2.
Chun b và chun ..................................................................... 62
2.6.3.
Ghi âm ........................................................................................................... 64
2.6.4.
Kt qu c tính VDSPEC ............................................................ 67
2.7.
2.7.1.
Bin thiên tn s u c .................. 68
2.7.2.
Phân tích thng kê phân b F0 cu........................................ 70
2.7.3.
Phân tích d liu dùng LDA .......................................................................... 72
2.8.
3.
Phân tích mt s ting Vit ca b ng liu VDSPEC .... 68
K............................................................................................................ 76
NHN D TING VIT .......................................................... 78
3.1.
Nhn d ting Vi t vi GMM ...................................................... 78
3.1.1.
Công c th nghim nhn d ALIZE .................................... 78
3.1.2.
L a chn s ng h s MFCC.................................................................... 80
3.1.3. Th nghim nhn d ting Vi ng hp kt hp
MFCC vi tham s F0 ................................................................................................. 81
3.1.4. Th nghim nhn d ting Vi ng hp kt hp
formant, dng và tham s F0 .............................................................. 84
3.1.5. ng ca s ng thành ph i vi hi n d ng
ting Vit ................................................................................................. 85
3.2.
SVM nhn d ting Vit ............................................................... 87
3.2.1.
B phân lp SMO .......................................................................................... 87
5
3.2.2.
3.3.
Th nghim nhn d ting Vit s dng SMO ..................... 88
lBk nhn d ting Vit .................................................................. 92
3.3.1.
B phân lp IBk ............................................................................................ 92
3.3.2.
Kt qu nhn d ting Vit s dng IBk ............................... 95
3.4.
Nhn d ting Vi t vi b phân lp MultilayerPerceptron .......... 96
3.4.1.
B phân lp MultilayerPerceptron trong Weka ............................................ 96
3.4.2.
MultilayerPerceptron nhn d ting Vit .............................. 96
3.5.
JRip nhn d ting Vit ................................................................ 97
3.5.1.
B phân lp JRip ........................................................................................... 97
3.5.2.
Nhn d ting Vi t vi JRip .................................................. 98
3.6.
Nhn d ting Vi t vi PART ...................................................... 99
3.6.1.
B phân lp PART ........................................................................................ 99
3.6.2.
Kt qu dùng PART nhn d ting Vit ............................... 99
3.7.
K............................................................................................................ 99
4. CI THIN HI N DNG TING VIT VI THÔNG TIN V
................................................................................................................ 102
4.1.
HMM nhn dng ting Vit nói .......................................................................... 102
4.1.1.
Mơ hình HMM ............................................................................................ 102
4.1.2.
HMM nhn dng ting Vi chính........................ 115
4.2.
ng
Ci thin hi n dng ting Vit nói thơng qua s d
120
4.2.1.
Mơ hình nhn dng ting Vit nói vi vic s d 120
4.2.2.
Nhn dng ting Vi .............................. 122
4.3.
K.......................................................................................................... 123
KT LUN VÀ KIN NGH ........................................................................................... 125
TÀI LIU THAM KHO ................................................................................................. 128
DANH MC CA LUN ÁN ............................ 140
6
GIẢI THÍCH CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
Chữ viết tắt
Chữ viết đầy đủ
Giải thích
AANN
Auto-Associative Neural Network
AM
Acoustic Model
Mơ hình âm hc
ANN
Artificial Neural Network
M-ron nhân to
ARFF
Attribute-Relation File Format
nh dng file tham s
trong Weka
ASR
Automatic Speech Recognition
T ng nhn dng ting nói
BKSPEC
Bach Khoa SPEech Corpus
B ng lic phát trin ti B
môn K thut Máy tính Vin
Cơng ngh Thơng tin và Truyn
thơng i hc Bách khoa Hà Ni
BKTC
Bach Khoa Text Code
BMMI
Boosted Maximum Mutual
Information
c
ng
CD
Concept Description
Mô t khái nim
CFG
Context-Free Grammar
Ng pháp phi ng cnh
CMS
Cepstral Mean Subtraction
Tr trung bình Cepstral
CMU SLM
Carnegie Mellon University
Statistical Language Modeling
Toolkit
B cơng c mơ hình hóa ngơn ng
thng kê cng Carnegie
Mellon
DCF
Detection Cost Function
Hàm giá phát hin
DET
Detection Error Tradeoff
Cân bng sai s phát hin
DL
Descrition Length
dài mô t
DNN
Deep Neural Networks
M-ron sâu
ELRA
European Language Resources
Association
Hi tài nguyên ngôn ng châu Âu
EM
Expectation Maximization
Ci hóa k vng
ERM
Empirical Risk Minimization
Ti thiu hóa ri ro theo kinh
nghim
F0
Fundamental frequency
Tn s n
fMLLR
feature-space MLLR
fMMI
feature-space MMI
fMPE
feature-space Minimum Phone Error
FST
Finite-State-Transducer
Chuyn trng thái hu hn
GMM
Gaussian Mixture Model
Mơ hình hn hp Gauss
7
HLDA
Heteroscedastic Linear Discriminant
Analysis
Phân tích phân bit tuyn tính hip
ng nht
HMM
Hidden Markov Model
Mơ hình Markov n
HTK
Hidden Markov Model Toolkit
B cơng c mơ hình Markov n
IBk
Instance Based k
Tên gi b phân lp k láng ging
gn nht trong Weka
IBL
Instance Based Learning
Hc dng
IREP
Incremental Reduced Error Pruning
JRip
KKT
KarushKuhnTucker
u kin KarushKuhnTucker
k-NN
k-Nearest Neighbour
K láng ging gn nht
LDA
Linear Discriminant Analysis
Phân tích phân bit tuyn tính
LDC
Linguistic Data Consortium
H liu ngơn ng
LLR
Log Likelihood Ratio
LPC
Linear Prediction Coding
MAP
Maximum a Posteriori
MFCC
Mel Frequency Cepstral Coefficients
MHAH
Mô hình âm hc
MHNN
Mơ hình ngơn ng
MLLR
Maximum Likelihood Linear
Regression
MLLT
Maximum Likelihood Linear
Transforms
MMI
Maximum Mutual Information
MPE
Minimum Phone Error
Cc tiu hóa li âm
NIST
National Institute of Standards and
Technology
Vin Tiêu chun và Công ngh
Quc gia ca M
NLP
NN
N
lL
P
Neural Networks
X lý
n tính
i
Các h s
tn s Mel
ơ
hiê
PART
PCA
Principal Component Analysis
Phân tích các thành phn chính
PLP
Perceptual Linear Prediction
m th tuyn tính
PNB
Bc
PNN
nam
PNT
Trung
8
PPR
Parallel Phone Recognition
PPRLM
Parallel Phone Recognition followed
by Language Modeling
PRLM
Phone Recognition followed by
Language Modeling
QP
Quadratic Programming
Quy ho
RBF
Radial Basis Function
ng Gauss
RIPPER
Repeated Incremental Pruning to
Produce Error Reduction
RM
Risk Minimization
Ti thiu hóa ri ro
SAT
Speaker Adaptive Training
Hun luyi nói
SBS
Sequential Backward Selection
La chn lùi lt
SFS
Sequential Forward Selection
La chn tin lt
SMO
Sequential Minimal Optimization
Thut gii tc tiu ln
t
SRILM
Stanford Research Institute
Language Modeling
B cơng c to mơ hình ngơn ng
SRI
SRM
Structural Risk Minimization
Ti thiu hóa ri ro cu trúc
SVM
Support Vector Machines
Máy véc- tr
TTS
Text-to-Speech
n thành ting nói
VDSPEC
Vietnamese Dialect Speech Corpus
B ng li ting Vit
VTLN
Vocal Tract Length №rmalization
Chun hóa chiu dài tuyn âm
WER
Word Error Rate
T l li t
9
DANH MỤC CÁC BẢNG
Bng 2.1: S khác bit gi v t và cách s dng t.............................. 48
Bng 2.2: Cu trúc âm tit ting Vit .................................................................................. 50
Bng 2.3: H thng ph u ............................................................................. 51
Bng 2.4: B ................................................................ 52
Bng 2.5: Cách th hin bng ch vit các nguyên âm ....................................................... 52
Bng 2.6: V trí các âm v trong h thng âm cui.............................................................. 53
Bng 2.7: H thng ph u Bc B .......................................................................... 55
Bng 2.8: So sánh các h thng ph u gia PNB, PNT và PNN ............................... 56
Bng 2.9: Phân lou theo truyn thng............................................................... 56
Bn theo ch ............................................................................ 63
Bng 2.11: T ch liu ca ng liu VDSPEC ...................................................... 67
Bng 2.12: Thng kê thng ghi âm c .......................... 67
Bng 2.13: Thng kê thng ghi âm ca VDSPEC theo ch ................................... 68
Bng 2.14: Ng cnh chn t khu .............................................................. 69
Bng 3.1: Kt qu nhn dng dùng GMM vi các tham s MFCC, F0 và các giá tr chun
hóa t F0 .................................................................................................................... 83
Bng 3.2: Ma trn nhm ln nhn d không ph thuc gii tính khi s dng
h s MFCC kt hp vi tham s F0 ......................................................................... 83
Bng 3.3: Kt qu th nghim nhn d ting Vi ng hp kt hp
formant, dng và các tham s F0....................................................... 85
Bng 3.4: T l nhn dng trung bình vi s ng thành phn Gauss khác nhau ............. 87
Bng 3.5: B phân lp SMO, kt qu nhn dng vi 384 tham s ..................................... 89
Bng 3.6: B phân lp SMO, ma trn sai nh m vi 384 tham s ....................................... 90
Bng 3.7: B phân lp SMO, kt qu nhn dng khi khơng có thơng tin liên quan trc ti p
F0 ............................................................................................................................... 90
Bng 3.8: B phân lp SMO, ma tr n sai nh m khi không c thông tin liên quan tr c tip
F0 ............................................................................................................................... 90
Bng 3.9: B phân lp SMO, kt qu th nghim khi ch dùng tham s liên quan trc ti p
F0 ............................................................................................................................... 91
Bng 3.10: B phân lp SMO, ma tr n sai nh m khi ch s dng
tham s liên quan trc
tip F0 ........................................................................................................................ 91
Bng 3.11: B phân lp SMO, kt qu nhn d ng khi ch dùng tham s liên quan trc tip
MFCC......................................................................................................................... 91
Bng 3.12: B phân lp SMO, ma tr n sai nh m khi ch dùng tham s liên quan trc tip
MFCC......................................................................................................................... 91
Bng 3.13: Thut gii IBl, CD Concept Description [8] .................................................. 93
10
Bng 3.14: Mô t thut gii k-láng ging gn nht ............................................................. 94
Bng 3.15: B phân lp IBk, kt qu nhn dng vi k = 1 ................................................. 95
Bng 3.16: B phân lp IBk, ma trn sai nh m vi k=1 ..................................................... 95
Bng 3.17: B phân lp IBk, kt qu nhn dng vi k=5 ................................................... 95
Bng 3.18: B phân lp IBk, ma trn sai nh m vi k=5 ..................................................... 96
Bng 3.19: Kt qu nhn d ting Vit dùng MultilayerPerceptron ........... 97
Bng 3.20: Ma trn sai nh m nhn d
dng
ting Vit
MultilayerPerceptron.................................................................................................. 97
Bng 3.21: Kt qu dùng b phân lp JRip nhn d ting Vit .................. 98
Bng 3.22: Ma tr n sai nh m khi dùng JRip nh n d ting Vit ................ 98
Bng 3.23: Kt qu s dng PART nhn d ting Vit .............................. 99
Bng 3.24: Ma tr n sai nh m khi s dng PART nhn d ting Vit ......... 99
Bng 4.1: Phân chia tp d liu dùng cho hun luyn và th nghim .............................. 119
Bng 4.2: Kt qu nhn d ................................... 119
Bng 4.3: Kt qu nhn dt thông tin v .................................. 122
11
DANH MỤC CÁC HÌNH ẢNH, ĐỒ THỊ
Hình 1.1: Quynh l mm .............................................................................................. 34
n luyn SVM: Chunking, Osuna và SMO ....... 38
Hình 1.3: Mơ hình m-ron ............................................................................................ 39
Hình 1.4: Bii làm mn to ra do có thiên áp bk k = bk nu uk = 0. .............. 41
-ron phi tuyn.................................................................................... 41
Hình 2.1: V m trong âm tit ..................................................................... 51
kt hm /w/ vi các nguyên âm PNB và PNT .......................... 54
Hình 2.3: So sánh cu trúc âm tit PNB, PNT vi PNN ..................................................... 54
bii các ph âm ngc hóa trong PNB và PNN ................................... 55
th h thu Hà Ni (a), Hu (b), TP H Chí Minh (c) ............... 59
Hình 2.6: S phân b các âm v trong VDSPEC ................................................................. 63
ng tn s ca SM48 ................................................................................... 64
Hình 2.8: (a) Dng sóng tín hi c ghi âm. (b) T s tín hiu trên nhi u tính theo dB và
giá tr trung bình ca t s này.................................................................................... 66
Hình 2.9: Biu ca ging n Hà Ni (a), Hu (b) và Thành ph H
Chí Minh (c) ............................................................................................................... 69
Hình 2.10: Biu ca ging nam Hà Ni (a), Hu (b) và Thành ph
H Chí Minh (c) ......................................................................................................... 69
Hình 2.11: Bin thiên F0 ca thanh hi ............................................................................... 70
Hình 2.12: Bin thiên F0 ca thanh ngã .............................................................................. 70
Hình 2.13: Bin thiên F0 ca thanh nng ............................................................................ 71
Hình 2.14: Bin thiên F0 ca thanh ngang .......................................................................... 71
Hình 2.15: Bin thiên F0 ca thanh huyn .......................................................................... 71
Hình 2.16: Bin thiên F0 ca thanh sc ............................................................................... 71
c thc hin phân lp theo LDA ............................................................ 74
Hình 2.18: Phân l dùng LDA cho thanh sc (t ........................... 75
Hình 2.19: Phân l dùng LDA cho thanh ngang (t ........................ 75
Hình 2.20: Phân l dùng LDA cho thanh nng (t ........................ 75
Hình 2.21: Phân l dùng LDA cho thanh huyn (t ...................... 75
Hình 2.22: Phân l dùng LDA cho thanh hi (t .............................. 76
Hình 2.23: Phân l dùng LDA cho thanh ngã (t ............................ 76
h thng nhn d ting Vi t .............................................. 79
Hình 3.2: Th nghia chn s h s MFCC ................................................. 80
th DET vi s thành phn Gauss (M) t n 4096.................................. 86
Hình 3.4: Hai nhân t Lagrange phng tt c các ràng buc c. . 88
12
Hình 3.5: ng gn nht .................................................................... 94
Hình 4.1: Kin trúc b nhn dng da trên HMM ............................................................ 104
Hình 4.2: Mơ hình âm v da trên HMM .......................................................................... 106
Hình 4.3: Mơ hình âm ph thuc ng cnh ....................................................................... 108
Hình 4.4: To mơ hình kt ni các trng thái .................................................................... 109
Hình 4.5: Phân cm cây quynh................................................................................... 110
Hình 4.6: Minh hi t ................................................................................................ 113
Hình 4.7: Minh ha mng nhm ln .................................................................................. 114
Hình 4.8: Ci t to ra bi h thng HTK ......................................................... 115
Hình 4.9: Mơ hình nhn dng t ng ting nói ............................................................... 116
n luyn ca Kaldi................................................................. 117
h thng nhn dng ting Vit nói s d ....... 120
h thng nhn dng ting nói s d trên b ng
liu VDSPEC ........................................................................................................... 121
13
MỞ ĐẦU
1.
Lý do chọn đề tài
Ngày nay, vi s phát trin mnh m ca máy tính, các ng d ng ca máy tính
trong mc ca cuc sy sinh nhiu yêu c u nhn hố q
trình s du qu khai thác máy tính và các ng dng trên máy tính. Trong bi
cnh lý ting nói nói chung và nhn dng ting nói nói riêng là v
c quan tâm nghiên cu, phát trin ng dng nhm nâng cao hiu qu s dng ca máy
tính phc v i trong cuc sng.
Trên th gi u nghiên cu v v c nhiu thành
công. Nhiu sn phm hu ích t các k t qu nghiên cc ng dng trong thc t.
Riêng v nhn dng ting Vit, mu nghiên cc các thành công
nh trin khai thành các sn phm ng dng thc t vn còn nhi u mt hn
chc bi chính xác, chng nhn dn dng
ting nói nói chung, nhn dng ting Vit nói cịn gp tr ngi ln phi k n là v v
ting Vit.
Ting Vit có nhi khác nhau. Gi có s khác bit
c v t vng và ng âm t ng âm là yu t quan trng t o nên s khác bit và
. Xét v t vng, s khác nhau có th mt s b phn cu
thành t hay s bi n i ca t. S xut phát t ngun gc ca t.
Ví d khi nói v soi), theo cách gi min Bc,
c phân bit rõ ràng bi t kínhgươngđeo kínhsoi gương
, min Nam, c hai vt này ch c gi bng mt t là ki ng (bin th v âm ca
kính). Tđeo kính Nam li dùng cách đeo kiếng.
vy, soi gương Nam li dùng cách nói soi kiếng min Trung,
hai vt c gi bng t gươngthao tác
c dit bsoi gươngđeo gương mt ng âm, s khác bit
gi c th hin khá rõ ràng. Chng hn v Nam, hai ph
âm cunhchng b binty, t
tịchng min Nam thì ltựtiư
ph âm cuchthoc nhanhnhănmìnhmừn
S khác bit nêu trên i khi giao
tip vi s d khác. Rõ ràng, s khác bing ti các
h thng nhn dng ting Vit nói, làm gim hiu qu nhn dng ca các h thng nhn
dng ting nói. Cùng mt n m dn
n ti u vào cho h thng nhn d u này có th gây ra s sai
nhm trong nhn dng ting nói. Các nghiên cu nhn dng ti ng Vi n hin ti
thy có s chú trng v khác bit v trong phát âm ca ting nói
n dng ni dung. Do vy, nu h thng nhn dng ting nói chung
thì khó tránh khi các ng do s khác bic
14
phát âm m ng lên và làm sai lch kt qu nhn d ng. Nu h thng
nhn dng ting nói bic ting nói cn nhn dng là thu nào thì có th
la chn các tham s phù hp, s dc hun lu
nhn d y có th gi c các sai nhm và giúp ci thin hi
thng nhn dng dng.
Chính vì vy, cn thit phi nghiên cu v nhn dng ting Vit nói theo các
khác nhau nhm tìm ra gii pháp k thut nâng cao hi u qu nhn dng
ting Vit c khi tin hành nhn dng ni dung ting nói, nu có th c
ti nào thì có th xây dng h thng nhn d ng vi ng liu
c t chc phù hp cho t và s dng ng liu này nhn dng ting
nói ca ng. Vi cách xây dng h thng nhn dng ti y,
các sai nhm nhn dng ca h thng do c phát âm hay thm chí là c do s
dng t c gi m bt, hiu nhn dng ca h thng s c ci thin.
T các lý do nêu trên, lun án la ch tài nghiên c ng nhn dng ting
nói phát âm liên t chính ca ting Vit
nhm nghiên c v x lý nhn d ng ting Vit nói, gii quyt mt s hn
ch trong nhn dng ting Vit nói hin t và góp phn phát
trin các ng dng cơng ngh i Vin phm ng dng
công ngh thông tin s dng ting Vi t trong dch t ng, giao ti p và imáy.
2.
Mục tiêu nghiên cứu của luận án
Mc tiêu chính ca lun án là Nghiên cu nhn dng ting Vi t nói cho các vùng
chính, ánh giá ng c n hia h thng nhn
dng và xut gii pháp k thut nhn d áp dng vào h thng nhn dng
ting Vit nói nhm nâng cao hiu nhn dng.
3.
Nhiệm vụ nghiên cứu của luận án
t m ra, lun án cn thc hin các nhim v chính sau:
(1) Nghiên c ting Vit t c
khác bit gi chính ca ting Vi cho
nghiên cu nhn d ting Vit. Lu ánh giá s nh
ng c ti h thng nhn dng t ng ting Vit nói.
(2) Xây dng b ng li ting Vit phc v cho nghiên cu nhn
d ting Vit và nhn dng ting Vit nói.
(3) Nghiên c xut mơ hình h thng nhn dng t ng, b tham s phù hp
nhn d ting Vit.
(4) Nghiên c xut mơ hình h thng nhn dng t ng ti ng Vit nói theo
chính ca ting Vit. H thng mi s dng các thông tin v
nhm nâng cao hia h thng nhn dng ting Vit nói.
15
4.
Đối tượng và phạm vi nghiên cứu của luận án
ng nghiên cu trng tâm ca lun án là nhn d ting Vit.
T kt qu nhn d , xây dng mơ hình nhn dng ting Vi t nói theo
. Mơ hình mi s dng thơng tin v nhm ci thin hi
thng nhn dng ting Vit nói. Vic nghiên c ting Vit ch yu ch tp
ng x lý tín hiu.
ting Vit rt phong phú. V mc phát âm,
có th i theo tng làng, xã. Tuy nhiên, trong phm vi nghiên cu ca
lun án, do thi gian có hn, lun án ch gii hn nghiên c u nhn d
chính và ph bin ca ting Vi Bc (ly ging
Hà N i di Trung (ly ging Hu i di
Nam (ly ging Thành ph H i din).
Bên c i mc tiêu ng dng k t qu nhn d ting Vit vào
h thng nhn dng t ng ti ng Vi t nói nhm ci thin hin dng, nhn dng
c c ti n x lý trong h thng nhn dng t ng ting Vit.
Vic nhn d cc tic khi nhn dng ni dung,
th t ni dung ting nói. Vì vy, thao tác ca h thng nhn dng
h khai thác các thông tin v t yu là khai thác
thông tin v c phát âm c.
Các th nghim nhn d mà lun án ti n hành da trên ng liu vi
s ng t vng hn ch t g ca t
xut mơ hình nhn d nhm nâng cao chng h thng nhn dng ting
Vit nói.
5.
Ý nghĩa khoa học và thực tiễn của luận án
Ni dung nghiên cu, kt qu d kic ca lun án s
cho m rng nghiên c u v ting Vit. Các nghiên cu v ting
Vic trin nay ch yu thc hin ngơn ng. Nghiên
cu v n x lý tín hiu vn còn hn ch. Do v ng nghiên cu theo
n x lý tín hiu s giúp m rng phm vi nghiên c
ng dng các kt qu c nghiên cu x lý ti ng Vit nói nói
chung và nhn dng ting Vit nói nói riêng.
T kt qu nhn d xut mơ hình mi nhn dng ting Vi t nói
s dng thơng tin nhm ci thin hi thng nhn dng ting Vit nói,
góp phn hồn thi n dng ca h thng nhn dng t ng ting Vit
nói.
6.
Phương pháp nghiên cứu
u ca lun án là kt hp nghiên cu lý thuyt vi nghiên
cu thc nghim.
16
V lý thuyt: lun án nghiên cu tng quan v ting Vi t, các mơ hình
nhn d ca mt s ngơn ng trên th gii, các mơ hình nhn dng ting nói
da trên các tài liu, cơng trình khoa hc cơng b, sách báo, giáo trình liên quan.
V thc nghim: lun án xây dng b ng liu ting Vit mi phc v cho nghiên
cu nhn d ting Vi t và nhn dng ni dung ting Vi t nói. Lu
s dng các công c mã ngun m kt hp lp trình phn mm x lý d liu, thc hin các
nghiên cu, th nghim nhn d ting Vit, xây dng và th nghim mơ
hình nhn d n dng ting Vi.
7.
Kết quả nghiên cứu, đóng góp của luận án
Kt qu nghiên ca lun án tm chính sau:
(1) ting Vit, s khác bi t gi
chính ca ting Vit v n phát âm v mt x lý tín hi u.
(2) Xây dng b ng liu ting Vit mi phc v cho nghiên cu nhn dng
ting Viu khác v nhn dng ting Vit
nói; thc hin mt s nghiên cu, th nghim c
ng ting Vit.
(3) xut mơ hình nhn d ting Vi t và b tham s phù hp cho
mơ hình nhn d ting Vit.
(4) S dng mơ hình HMM (Hidden Markov Model) nhn dng ting Vit nói trên
b ng li.
(5) xut mơ hình nhn dng ting Vi.
8.
Nội dung luận án
Ni dung chính ca luc trình bày trong 4 :
ng quan v nhn d ng ting nói và nhn d.
này trình bày t ng quan v nhn dng ting nói, lch s phát tri n và các tin b trong
nghiên cu nhn dng ti ng nói; các nghiên cu và kt qu c v nhn d
ng; vic nghiên cu v nhn dng ting nói và ting Vit, các v còn tn
ti trong nghiên cu, nhn dng ting Vit nói và ting Vit; làm rõ v
cn nghiên cu, gii quyt trong lun án.
Xây d ng b ng liu cho nghiên c u nhn d ting
Vit. N cp các nghiên c u chi ti v ting Vit,
t ho thy s khác bit gi, c bic phát âm,
s cho nghiên cu nhn d ting Vit. C
pháp xây dng b ng liu dùng cho nghiên cu nhn d ting Vi t và kt
qu phân tích i vi mt s ting Vit da trên ng
ling.
n d ng ting Vit. C tp trung vào nghiên
cu các mơ hình nhn d ting Vit, vic la chn tham s ng dng cho
17
mi mơ hình và trình bày các kt qu th nghim nhn d ng ting Vit s
dng các mô hình và tham s xut.
Ci thin hin d ng ti ng Vit vi thông tin v .
Lun án s trình bày mơ hình nhn dng ting nói da trên HMM s dng các thông tin v
nhm ci thin hin dng ting Vit nói. Kt qu th nghim cho
thy mơ hình nhn dng ting Vit nói có s d cho hi
nhn dng ti ng hp khơng có thơng tin v .
Cui cùng, phn Kt lun tng hp các kt qu nghiên cu cng m
rng nghiên cu, phát tri tài và c ca lun án.
18
CHƯƠNG 1
1.
TỔNG QUAN VỀ NHẬN DẠNG TIẾNG NÓI VÀ NHẬN
DẠNG PHƯƠNG NGỮ
cp ni dung t ng quan v nhn dng ting nói và nhn dg
ng chính mà lun án quan tâm. Trong n án tp trung tng
hp, phân tích tình hình nghiên c c v nhn d ng ting nói và nhn
d nhng tip ci quyt các bài tốn
c này. ng thi, tng hp các nghiên cu liên quan v nhn
dng ting Vit ting Vit, nêu bt nhng mt còn tn ti, nhng v
cn gii quyi vi nhn dng ting Vit và ting Vit t ìng tip
cn nhm nâng cao hi thng nhn dng ting Vit nói.
1.1. Nhận dạng tiếng nói
1.1.1. Tổng quan về nhận dạng tiếng nói
Nhim v ca h thng nhn dng ting nói là làm cho h thng hi c ting
nói ci. Nh h thng này, ting nói có th c chuyi t
bn, hoc t u khin các quá trình khác [179]. Pc truyn thơng t nhiên
nhi vi là thơng qua ti ng nói nên i cùng ca nhn dng ting
nói là cho phép con i có ngơn ng khác nhau giao ti p vi nhau và vi máy mt cách
t nhiên, hiu qu . Có th nói, các ng dng nhn dng ting nói hi n tr
nên ph bin, phc v i si c k thut khác nhau.
c i máy, nhn dng ti
thng máy tính có th chp nhu vào là lnh dng file âm thanh và to ra
n cha nng ng.
Nhn dng t ng ting nói ASR (Automatic Speech Recognition) mơ phng kh
u li nói ci. H thng ASR có th chuyi li nói thành
n. Bài tốn nhn d ng t ng ting nói là mp nhu
vào là các mu ting nói và ti có th hi
khi trc tip nghe ti. ASR là mt trong các c ca nhn dng mu. ASR
phát trin mng vc khác ca nhn dng mu vì mong mun to ra
c c máy có kh c các quy nh phc tp và thc t, có ch
ng thi có th hi c l bt k h thng
nhn dng mu nào, ASR tìm ki hi c các mu ti u vào. Các nghiên
cu v x lý tín hiu, x lý tic bi t là nhn dng ti u
nhà khoa hc tham gia và mang li nhiu thành t c này [33, 37, 55, 57,
63, 75, 94, 95, 135].
19
Mc ti trình bày c v lch s phát tri n và các tin b
trong nghiên cu nhn dng ting nói.
1.1.2. Lịch sử phát triển và các tiến bộ trong nghiên cứu nhận dạng
tiếng nói
u u tiên quan trng cn phi k n trong lch s phát trin ca nhn dng
ting nói là vic thành lp các mơ hình thng kê và các thut gii liên quan tu kin
cho vic thc hin các mơ hình này. Mơ hình HMM c gii thit mơ hình
âm hc ca h thng nhn dng ting nói t u nhng n [12, 82]
n còn c s dng rng rãi. Mng ln các mơ hình và thut
gii xut và s dng hiu qu c này. Thut gii t vng
EM (Expectation Maximization) và thut gii quay lui (Forward Backward) hoc thut
gii Baum Welch [14, 36] yu và quan trng trong vic hun luyn mơ
hình HMM mt cách hiu qu y, mơ hình ngơn ng N-gram và các bin
th c hun luyn vn hoc s dng k thut EM-c
các hiu qu quan trng. Bên cnh mô hình âm hc HMM và mơ hình ngơn ng n
N-gram u mc công b n [38, 39, 60] và
các mơ hình ngơn ng và ti ng nói có c u trúc [27, 40, 176]. Các thut gii thích nghi hiu
qu cho phép tích hp c trên các ng di x n
n thành công cho vic phát trin các sn ph i ca cơng ngh nhn dng
ting nói. Các k thut thích nghi ph bin có th k n là t t hu nghim
MAP (Maximum a Posteriori probability), ng MLLR (Estimation và Maximum
Likelihood Linear Regression) [96]. Các k thuc tng quát hun
luyn các mô hình chung, mi di n tt trong s k n là mơ hình thng kê
tồn th ca t p d liu hun luy. K thuc gi là k thut hun luyn
i nói SAT (Speaker Adaptive Training) [9]. Huang cùng cng s
nghiên c n d c l i nói, nhn dng ph thuc
i nói và nhn di nói [74]. Kt qu nghiên cu này cho thy: khi
nhn d c l i nói, t l li t t 4,3%, còn khi s dng d liu ph thuc
i nói, t l li t m n 1,4%. Trong các th nghim, nhóm tác gi u áp dng
ch i nói.
Nhóm th hai trong nhng tin b cc x lý ting nói là s hình
h t ng tính tốn mnh v phn cng cho phép phát tri c các thut gii,
mơ hình thng kê nêu trên. nh lut Moore quan sát s tin b trong c phát trin
ca máy tính và d báo kh sau mi khong thi gian t 12 n
18 tháng. C vy, chi phí cho b nh s c gi. h t ng mnh nói trên
n cho phép các nhà nghiên c u v nhn dng ting nói có th phát tri n và
phc tp các thut gii trên các tác v ln. Ng liu ti
quan tr thc hin các nghiên cu nhn dng ting nói. Ng liu ting nói ln cho
phép các mơ hình thng kê hc hiu qu Trong nh qua, Vi n Tiêu chun và
20
Công ngh NIST (National Institute of Standard and Technology), Hi p hi d liu ngôn
ng hc LDC (Linguistic Data Consortium), Hip hi Tài nguyên Ngôn ng châu Âu
ELRA (European Language Resources Association) và các t chc khác c
các b ng liu ting nói, chú gii và chia s rng rãi cho cng trên toàn th gii. Vi
s phát trin, hi nhp và chia s trên phm vi toàn cu, hin nay, nhi u phịng thí nghim,
các nhà nghiên c ng li ích t các cơng c phc v cho nghiên c c
cung cp mi (Hidden Markov Model Toolkit), Sphinx, CMU LM toolkit
và SRILM toolkit. Mt khác, các h tr cho nghiên cu sâu, rng, kt hp vi các hi ngh,
hi tho, h thng c DARPA (U.S. Department of Defense Advanced
Research Projects Agency) và các t ch c, cá nhân khác tài tr tr nên cn thit cho s
phát trin h thng nhn dng ting nói hin nay.
Nhóm tin b th 3 có th k n thuc v c biu din tri thc. Các k thut
phân tích tham s ting nói MFCC (Mel-Frequency Cepstral Coefficients) [35], tiên
cm th tuyn tính PLP (Perceptual Linear Prediction) [70], chun hóa thơng qua tr
trung bình cepstral CMS (Cepstral Mean Subtraction) [139], RASTA [70] và chun hóa
chiu dài tuyn âm VTLN (Vocal Tract Length №rmalization) [42]. G có nhiu
thut gii xut cho nhn dng ting nói mang li hiu qu Phân tích
phân bit tuyn tính hi ng nht HLDA (Heteroscedastic Linear
Discriminant Analysis) [90], cc tiu li t fMPE (feature-space
Minimum Phone Error) [132] và mc [112].
Nhóm cui cùng trong các tin b ln ca nhn dng ti ng nói là gii mã và các
thut gii tìm kim. u tp trung vào gip (thut gii tìm kim A ) [84]
và tìm ki ng b thi gian Viterbi (time-synchronous Viterbi search) [115, 143, 169,
171]. Nu khơng có các thut gii kh thi thì các nhn dng ting nói liên t c có quy mơ
ln khó có th thc hic.
y có th thy, nhn dng ti t c nhiu ti n b
qua. Có nhi u mơ hình nhn d xut t vi nn tng
chính khơng có nhi i song vic mơ hình hóa, các k thut c th vn liên
t c ci tin. Vì th, HMM vn gi c v trí quan trng trong các h thng nhn
dng ting nói. Bên c thut phân tích tham s c nhc
tin quan trng. Các thut gii tìm kic ci tin giúp b gii mã thc hin các nhim
v tìm kim, cho ra li gii hiu qu
1.1.3. Các thách thức đối với nhận dạng tự động tiếng nói
Vì có nhi c tin ng dng, nhn dng
tiu nhà khoa hi mt vi
nhiu thách thc.
Thách thc ln u tiên i vi nhn dng t ng ting nói có th k n là làm
th x c các bin thiên trong ti ng nói. Cùng mt âm do cùng mi nói
nhng th m khác nhau song tín hiu ting nói có th
21
Trong các h thng nhn dng ting nói ph thu i nói, s khác bit ca ti ng nói
ng khơng ln so vi h thng nhn dng c lp i nói. Ngay c khi ting nói
c gii hn bi mi nói thì s i v u kin nói, thit
b ghi âm... vn là tn t i khách quan t o ra s khác bit trong tín hiu ting nói cn nhn
dng.
Thách thc li vi ASR là phi gii quyt bài toán nhn dng nhm, khi
mà h thng phi mt vi thc t là ting nói cn nhn dng khơng hồn tồn
ng vi ti c hun luyn. Trong ASR, mt s ng s c
c chn t c và s dng ti xây dng
các mơ hình. chính xác ca ASR thng t l vi s gia d liu hun luyn
và d liu th nghim. D dàng nhn thy, h thng nhn d chính xác cao khi
d liu hun luyn và nhn du do mi nói và n
gim khi d liu th nghim và d liu dùng hun luyn là ting nói ca
nh i khác nhau, n ng, thi t b ghi âm khác
nhau. Thách thi vi thit k ASR là phi chun b v mt d liu và
t thut gii tt.
Tác ng phc t p nht ti tín hiu ting nói mà ASR phi x lý là nhi u kênh,
nhiu nn và các nhi u khác t bên ngoài. K thut tr ph n giúp gi i quyc
v nhiu cng trong khi mt s k thut khác giúp kh c nhiu chp.
Mc dù phi mt vi nhiu thách thc song nhn dng t ng ti ng nt
c nhi c tin quan trng. Các kt qu nghiên c c sng tr
thành các ng d c này vn tip tc thu hút nhiu nhà khoa hc
tham gia nhm tip t c ci thin hin d ng dng trong
thc tin.
1.1.4. Phân loại hệ thống nhận dạng tự động tiếng nói
Các h thng nhn dng t ng ting nói có th c phân loi theo các cách khác
nhau tùy thuc tiêu chí s dng phân loa trên s ph thum
liên tc hay ri rc ca ting nói cn nhn dng ln ca t vng.
Theo tiêu chí s ph thui nói, h thng nhn dng ting nói có th c
chia làm 3 loi gm h thng nhn d ng ting nói ph thui nói, h thng nhn dng
ting nói c lp i nói và h thng nhn dng ti i nói, c th
1) Hệ thống nhận dạng tiếng nói phụ thuộc người nói: h thi
dùng phi hun luyn h thng bng chính ting nói c
ting nói cn nhn dng và ting nói dùng cho hun luy u do cùng mt
i nói. H thng này có th c xây dng mt cách d dàng vi chi phí
thp chính xác cao. Tuy nhiên, m linh hot ca h thng li thp
i h thng nhn dng khơng ph thu i nói và h thng nhn
di nói.
22
2) Hệ thống nhận dạng khơng phụ thuộc người nóim là i
i dùng phi hun luyn h thng bng chính ging nói ca mình. Nói cách
khác, h thng có th c hun luy c lp, s dng ting nói c i
hun luyn mà vn có kh n d c ti c phát
âm b i không tham gia hun luyn. H thng này có th làm vic vi
ti c phát âm t i nói bt k. Vic xây dng h thng y
ng phc t hm là h thng rt linh
hot ng th so vi h thng ph thui nói.
3) Hệ thống nhận dạng tiếng nói thích nghi người nóic xây d có kh
i nói mi. H thng nàc hun luyn sc
khi s dng bng ti ng nói có th khác vi ting nói ci s dng. Trong
quá trình ho ng, h thng s tip nh m c i nói
m u chnh nhm riêng ci nói mi.
H thng này có v trí xp hng nm gia hai h th
thng v a có tính linh hot vì khơng ràng buc hun luyn và s dng cùng
thng ph thui nói li v chính xác nh
kh i nói.
Các h thng nhn dng tic phân loi dm ca ting nói
hun luyn và nhn dng s gm bn lo
1) Hệ thống nhận dạng tiếng nói theo từ rời rạc: h th c thit k
nhn dng tic phát âm thành tng t ri rc. Gi a các t có khong
l ln và phân tách vi nhau. H thng này là dn nht ca h
thng nhn dng ting nói. Tuy kh n dng có hn ch thng
này lc s dng ph bin trong các sn phm thc.
2) Hệ thống nhận dạng tiếng nói cho các từ có liên kết với nhaung hp
này, h thng nhn dng ti c thit k nhn d ng các t
thng nhn dng t ri rc. Tuy nhiên, các t này có liên kt vi nhau
nên h thng cho phép ti ng nói cn nhn dng có th c phân tách vi nhau
bi các khong lng nh.
3) Hệ thống nhận dạng tiếng nói phát âm liên tục: h thng làm vic vi ting nói
khơng có khong lng v mt tín hiu gia các t. H thng cho phép
i dùng có th phát âm mt cách t nhiên, cùng v thc
hin vic nhn dng ni dung. Các h thng loi x lý phc t
vì vinh các t là rt khó v mt tín hiu.
4) Hệ thống nhận dạng tiếng nói tự nhiên: h th c thit k nhn dng
c tic phát âm mt cách t nhiên vi các t phát ra mt cách liên
tip có th xen k nhng "", "à"... thm chí là nói
lp.
23
H thng nhn dng ting nói có th phân long t vng. Theo cách
này, các h thng nhn dng ting nói có th chia thành 3 loi bao gm h thng nhn dng
vi t vng ít (s ng t ch n hàng chc t), h thng nhn dng ting nói vi t vng
trung bình (s ng t ) và h thng nhn dng ting nói vi t vng ln
(s ng t n hàng nghìn t).
H thng nhn dng ting nói rng và phong phú. Cách tip cn trong nghiên
cu nhn dng ti. Mc dù mc tiêu, ni dung c th ca tng
nghiên cu là khác nhau m chung là ci thin hi u qu
hong ca h thng nhn dng.
1.2. Nhận dạng phương ngữ
Nhn d da trên tín hiu ting nói là m c ca x lý tín
hiu ting nói thu hút nhiu nhà khoa hc tham gia. ng ng có th hiu là ti ng nói
mm khác bi t vi ting nói
khác. S khác bi t có th là t vng, ng pháp, ng bàn lun chi tit
khái nim và s phân ca ti ng Vit. Nu
nhn d chính xác thì có th giúp ci thin nhiu ng dng, d ch v
n d ng t ng ting nói, h th c khn t (e-health), các h
thng e-learning,... Nhn d có nhi n dng ngơn ng
tuy nhiên phc tp và ch ng nhi u thách th i nhn dng ngơn ng ca
ting nói.
1.2.1. Các mơ hình nhận dạng phương ngữ
p cn c a nhn d
c dùng trong nhn dng ngơn ngp cn này có th chia làm
hai nhóm bao gm a trên âm h d a trên ràng buc âm
vu d ca ti ng n
pháp th hai da trên vic mơ hình ngơn ng nhn dng các t
1.2.1.1.
Mơ hình ràng bu c âm v
Vi mi ngôn ng, các t c cu thành t mt tp các âm v. Các mơ hình
nhn dng da ràng buc âm v (Phonotactic Modeling)
c xây dng da trên các b nhn d ng âm v. B nhn dng âm v s tin hành phân
tích ting nói cn nhn dng thành các âm v. Mi t u có th c phiên âm bi mt tp
các âm v t. Nhi m v t ra là phi xây dc b nhn d ng âm v
chính xác cao. Mt cách thc hing tip cn này là xây d ng b nhn dng âm
v theo mơ hình ngơn ng PRLM (Phone Recognition followed by Language Modeling)
[20]. Tip theo, b nhn dng âm v c s dng nhn dng . B
nhn dng âm v s to ra mt dãy các âm v dùng hun luyn các mơ hình ngơn ng
N-gram cho m. Trong q trình nhn dng, ting nói cn nhn dng s c
24
n bng cách s dng b nhn dng âm v ng ng theo mơ
hình ngơn ng s m s cao nht ng v nhn dng c. M rng
c là s dng b nhn d ng âm v song song theo mơ
hình ngơn ng PPRLM (Parallel Phone Recognition followed by Language Modeling).
PPRLM s dng các b nhn dng âm v nhi u ra thay cho b nhn d ng âm v
c s dng trong PRLM. Ting nói cn nhn dng s c np vào mt dãy các b nhn
dng âm v c hun luyn cho tu ra ca các b nhn dng là các
m s c tính thơng qua mt dãy các mơ hình ngơn ng. C
c s dng cho ng hp d liu phiên âm b hn ch. Khi d liu phiên âm
sn có và phong phú, có th s dng các b nhn dng âm v c lp trong i b nhn
dng có riêng mt mơ hình ngơn ng. Trong quá trình nhn dng, tp các b nhn dng âm
v c s d ng và cho ra dãy âm v c t i b nhn dng có mt
mơ hình ngơn ng cc gg pháp nhn dng
âm v song song PPR (Parallel Phone Recognition). P gp tr ngi là cn
phi có d liu phiên âm cho tt c cn nhn dng.
Trong c , vic nhn d u d a trên kt qu
phân tích, nhn dng âm v ca ting nói cn x lý và mơ hình ngơn ng ng vi
m có th nhn dng.
1.2.1.2.
Mơ hình âm h c
Cách tip c nhn d thay cho cách tip cn d a trên mơ
hình ràng buc âm v là s dng mơ hình âm hc (Acoustic Modeling) [186]. Cách tip cn
này s dng mơ hình hn hp Gauss GMM (Gaussian Mixture Model) xây dng h
thng nhn dng c s dng thành công trong các ng dng nhn dng
[29, 51, 110]. GMM s dng các tham s c tra ti ng nói cn
nhn dn trong thi gian ngn ca ting nói bao gm ph,
thơng tin v n s ng bao tn s n, ti các
phc bit ca ting nói và bin thiên theo thi gian ca ng, ng u,
ng,... GMM là mt trong các công c c s dng ph bi n hi n nay trong nhn
dng ting nói, nhn dng ngơn ng và nhn d . Mơ hình GMM s trình
bày chi tia lun án.
1.2.2. Nhận dạng phương ngữ theo các phương diện khác nhau
1.2.2.1.
Theo
n ngôn ng
h c
là khía cnh phc tp trong nhn dng ti ng v c
a ngôn ng trong mt cng giao tip c th không phi là c
i theo tha lý, lãnh th. D dàng nhn thy, trong
giao ti p ca th h tr hin nay, ngồi ngơn t vn có ca ngơn ng dng h còn
dùng nhng t, cm t mc s di thi gian, ngôn
ng b thay i kéo theo m ca i.
25