Tải bản đầy đủ (.pdf) (40 trang)

Tài liệu Xử lý tiếng nói - Text to Speech System pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (370.39 KB, 40 trang )

Bài 4:Bài 4:
Các hệ thống chuyển đổivănbảnCác hệ thống chuyển đổivănbảnCác hệ thống chuyển đổi văn bản Các hệ thống chuyển đổi văn bản
thành giọng nóithành giọng nói

Các hệ thống chuyển đổi văn bản thành Các hệ thống chuyển đổi văn bản thành
giọng nói có thể được xem như là hệ thống giọng nói có thể được xem như là hệ thống
ểểmã hóa tiếng nói cho phép lựa chọn kiểu mã hóa tiếng nói cho phép lựa chọn kiểu
cách nói, tốc độ, cường độ và các hiệu ứngcách nói, tốc độ, cường độ và các hiệu ứng
Các thành phầntronghệ thống TTSCác thành phầntronghệ thống TTSCác thành phần trong hệ thống TTSCác thành phần trong hệ thống TTS

Thành phần phân tích văn bản:Thành phần phân tích văn bản:
––Xác định cấu trúc tài liệu, chuyển đổi ký hiệu, Xác định cấu trúc tài liệu, chuyển đổi ký hiệu,
phân tích cấu trúc ngôn ngữphân tích cấu trúc ngôn ngữ
–– Chuyển đổi các ký hiệu sang dạng chuẩn.Chuyển đổi các ký hiệu sang dạng chuẩn.
Chuyển đổicácsố sang dạng chữ tương ứngChuyển đổicácsố sang dạng chữ tương ứng–– Chuyển đổi các số sang dạng chữ tương ứng Chuyển đổi các số sang dạng chữ tương ứng
–– Phân tích khoảng trống, dấu chấm câu để xác Phân tích khoảng trống, dấu chấm câu để xác
định cấu trúc ngôn ngữđịnh cấu trúc ngôn ngữị ggị gg

Thành phần phân tích ngữ âm:Thành phần phân tích ngữ âm:
–– Chuyển đổi các từ đã chuẩn hóa sang các âm vị Chuyển đổi các từ đã chuẩn hóa sang các âm vị y g ịy g ị
tương ứng (với thông tin như trọng âm, thời gian tương ứng (với thông tin như trọng âm, thời gian
phát âm)phát âm)

Các quá trình trong thành phần Các quá trình trong thành phần qgpqgp
phân tích văn bảnphân tích văn bản

Xác định cấu trúc tài liệu: Xác định cấu trúc tài liệu:
–– Cung cấp ngữ cảnh phục vụ cho các quá trình Cung cấp ngữ cảnh phục vụ cho các quá trình
thựchiệnsaunàythựchiệnsaunàythực hiện sau nàythực hiện sau này
––Ngắt câu, phân đoạn văn bảnNgắt câu, phân đoạn văn bản



Chuẩnhóavănbản:Chuẩnhóavănbản:

Chuẩn hóa văn bản: Chuẩn hóa văn bản:
–– Chuyển đổi ký hiệu ở dạng dạng khác nhau về Chuyển đổi ký hiệu ở dạng dạng khác nhau về
dạng chuẩndạng chuẩn
Phâ tí h ô ữPhâ tí h ô ữ

Phân tích ngôn ngữ: Phân tích ngôn ngữ:
–– Phân tích đặc điểm cú pháp, ngữ nghĩa của câu Phân tích đặc điểm cú pháp, ngữ nghĩa của câu
từ để có thể chọn cách phát âm thích hợptừ để có thể chọn cách phát âm thích hợptừ để có thể chọn cách phát âm thích hợptừ để có thể chọn cách phát âm thích hợp
Các quá trình trong thành phần Các quá trình trong thành phần qgpqgp
phân tích ngữ âmphân tích ngữ âm

Phân biệt từ có cách viết giống nhau nhưng Phân biệt từ có cách viết giống nhau nhưng
khác âmkhác âm

Phân tích từ để xác định cách phát âm thích Phân tích từ để xác định cách phát âm thích
hợphợp

Chuyển đổi ký tự sang âm thanh và xây Chuyển đổi ký tự sang âm thanh và xây
dựng từ điển phát âmdựng từ điển phát âm

Các quá trình được thực hiện trước có thể Các quá trình được thực hiện trước có thể
sinh ra nhiều kết quả và chuyển cho quá sinh ra nhiều kết quả và chuyển cho quá
ằằtrình sau với hy vọng rằng quá trình sau có trình sau với hy vọng rằng quá trình sau có
thể xác định kết quả đúng đắn khi có nhiều thể xác định kết quả đúng đắn khi có nhiều
thông tin hơnthông tin hơnthông tin hơnthông tin hơn
––Ví dụ: dấu chấm câu có thể được dùng sau một Ví dụ: dấu chấm câu có thể được dùng sau một
từ viếttắthoặc dùng để kết thúc câutừ viếttắthoặc dùng để kết thúc câutừ viết tắt hoặc dùng để kết thúc câutừ viết tắt hoặc dùng để kết thúc câu
Một vài ví dụ về trường hợp nhầm lẫn trong Một vài ví dụ về trường hợp nhầm lẫn trong ộ ụ g ợp gộ ụ g ợp g

chuẩn hóa văn bảnchuẩn hóa văn bản
Các luồng dữ liệuCác luồng dữ liệuCác luồng dữ liệuCác luồng dữ liệu

Hầu hết các hệ thống TTS cung cấp tập hợp Hầu hết các hệ thống TTS cung cấp tập hợp
các thẻ đánh dấu để cung cấp thêm thông các thẻ đánh dấu để cung cấp thêm thông
tin cho việc đọc văn bảntin cho việc đọc văn bản


W (Words): cấu trúc từW (Words): cấu trúc từ

ΣΣ: cấu trúc âm tiết: cấu trúc âm tiết

C (Controls): cấu trúc âm vịC (Controls): cấu trúc âm vị

S (Syntax/Semantic): cú pháp, ngữ nghĩaS (Syntax/Semantic): cú pháp, ngữ nghĩaS (Sy ta /Se a t c) cú p áp, gữ g aS (Sy ta /Se a t c) cú p áp, gữ g a
–– NP (Noun Phrase)NP (Noun Phrase)
–– VP (Verb Phrase)VP (Verb Phrase)
–– S (Sentence)S (Sentence)

W W ÆÆ ΣΣ, C: cấu trúc âm tiết và âm vị được , C: cấu trúc âm tiết và âm vị được
sinh ra từ cấu trúc từ W bằng từ vựng và sinh ra từ cấu trúc từ W bằng từ vựng và
ắắcác quy tắccác quy tắc

W W ÆÆ S: cấu trúc từ được dùng để xác định S: cấu trúc từ được dùng để xác định
úhá à ữ hĩ Ví d h dhừúhá à ữ hĩ Ví d h dhừcú pháp và ngữ nghĩa. Ví dụ như danh từ cú pháp và ngữ nghĩa. Ví dụ như danh từ
(NP), động từ (VP), câu (S)(NP), động từ (VP), câu (S)
SS ÆÆ Púhá ữ hĩ đượ dù đểPúhá ữ hĩ đượ dù để

S S ÆÆ P: cú pháp, ngữ nghĩa được dùng để P: cú pháp, ngữ nghĩa được dùng để
xác định âm vị sử dụng trong phát âm.xác định âm vị sử dụng trong phát âm.

Xác định cấu trúc tài liệuXác định cấu trúc tài liệuXác định cấu trúc tài liệuXác định cấu trúc tài liệu

Văn bản thôVăn bản thô

Trang webTrang webgg

Tài liệu XMLTài liệu XML

EmailEmailaa
Thuật toán ngắtcâuThuật toán ngắtcâuThuật toán ngắt câuThuật toán ngắt câu
ChuẩnhóavănbảnChuẩnhóavănbảnChuẩn hóa văn bảnChuẩn hóa văn bản

Văn bản thường bao gồm các từ viết tắt Văn bản thường bao gồm các từ viết tắt
như FDA cho từ “Food and Drug như FDA cho từ “Food and Drug
Administration” hay WTO cho từ World Administration” hay WTO cho từ World
Trade OrganizationTrade Organization
Tài liệ kỹ h ậ óhể b ồ ábiểTài liệ kỹ h ậ óhể b ồ ábiể

Tài liệu kỹ thuật có thể bao gồm các biểu Tài liệu kỹ thuật có thể bao gồm các biểu
thức toán học, đồ thị, bảng biểuthức toán học, đồ thị, bảng biểu
Nộid il óthể óábiể tượNộid il óthể óábiể tượ

Nội dung email có thể có các biểu tượng Nội dung email có thể có các biểu tượng
cảm xúccảm xúc
ChuẩnhóavănbảnChuẩnhóavănbảnChuẩn hóa văn bảnChuẩn hóa văn bản

Chuẩn hóa văn bản là quá trình đưa về biểu Chuẩn hóa văn bản là quá trình đưa về biểu
diễn đồng nhất cho các từ, các số, dấu ngắt diễn đồng nhất cho các từ, các số, dấu ngắt
câu, các ký hiệucâu, các ký hiệu


Ví dụ: “The 7% Solution” được đọc là THE Ví dụ: “The 7% Solution” được đọc là THE
SEVEN PERCENT SOLUTIONSEVEN PERCENT SOLUTIONSEVEN PERCENT SOLUTIONSEVEN PERCENT SOLUTION

Sau khi chuẩn hóa, nó nên được đánh dấu Sau khi chuẩn hóa, nó nên được đánh dấu
bằ thẻ ídbằ thẻ ídbằng thẻ, ví dụ: bằng thẻ, ví dụ:

The <tn snor=”SEVEN PERENT”>7%</tn> The <tn snor=”SEVEN PERENT”>7%</tn>
SolutionSolutionSolutionSolution

Ví dụ: “at 8 am I …”Ví dụ: “at 8 am I …”

Có thể được chuyển thành:Có thể được chuyển thành:ợ yợ y

At <time> eight am </time> I …At <time> eight am </time> I …

At <number> eight </number> am I …At <number> eight </number> am I …tubeegt/ubeatubeegt/ubea

×