Tải bản đầy đủ (.pdf) (10 trang)

thiết kế hệ thống trả lời tự động, chương 7 pptx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (357.79 KB, 10 trang )

Chương 7: Mô hình thiết kế của TAPI
Mô hình thiết kế TAPI ñược chia làm 2 lĩnh vực, mỗi lĩnh vực có
các
lời gọi TAPI khác nhau tuỳ thuộc vào thiết bị mà từng lĩnh vực sủ dụng:
+ Các thiết bị ñường truyền (Line Devices) : Là mô
hình sử dụng ñường truyền vật lý ñiện thoại ñể gửi và nhận
tiếng nói (voice) và dữ liệu giữa 2 ñịa ñiểm.
+ Các thiết bị ñiện thoại (Phone Devices) : Là mô hình
ñể thực hiện và nhận cuộc các gọi.
Lines
Trong TAPI, các thiết bị ñường truyền thực chất không phải là
một ñường dây vật lý. Nó như là một ñối tượng ñại diện cho 1
ñường dây vật lý. Trong các hàm TAPI, một chương trình có thể
nắm giữ nhiều thiết bị ñường truyền, mỗi thiết bị ñường truyền này
kết nối tới một ñường dây vật lý.
Ví dụ như một chương trình TAPI có thể ñược thiết kế ñể
cung cấp voice (gọi ñiện thoại), fax, và liên kết dữ liệu cho người sủ
dụng. Ứng dụng sẽ ñịnh danh 3 thiết bị ñường truyền. Một là ñể
cho voice, một ñể truyền dẫn fax, một là ñể gửi và nhận dữ liệu
thông qua một modem. Nếu PC chỉ có một ñường truyền ñiện thoại
vật lý, ứng dụng TAPI sẽ chia sẻ ñường tryền này cho cả 3 thiết bị
ñường truyền.
ð
iều này ñược gọi là qui hoạch ñộng ñường truyền
(dynamic line mapping).
Hình 2. 2: Mô hình của TAPI
Vào mỗi thời ñiểm, ứng dụng TAPI sẽ khởi ñộng một thiết bị
ñường truyền, nó sẽ yêu cầu ñường truyền vật lý. Nếu ñường truyền
vật lý chưa sẵn sàng, một thông báo sẽ ñược gửi trả về. Trong một
số trường hợp, ví dụ như truyền dẫn fax, ứng dụng có thể “xếp hàng”


các yêu cầu ñể xử lý dần dần.
Nếu có 2 ñường truyền sẵn sàng, TAPI sẽ ñiều khiển chúng
như chúng yêu cầu. Nếu thiết bị ñường truyền thứ 3 lúc này cũng
gửi yêu cầu thì ứng dụng TAPI sẽ nhận biết rằng không còn ñường
truyền nào rỗi và sẽ thông báo cho người sử dụng biết.
Phone
Mô hình này cho phép người lập trình dễ dàng tạo ra các
“máy ñiện thoại ảo”. Ví dụ như 1 PC với 1 sound card, loa, và
microphone có thể thực hiện ñược tất cả các chức năng của một ñiện
thoại ñể bàn. Những “ñiện thoại ảo” này cũng giống như các thiết bị
ñường truyền, tức là không cần có sự tương quan 1-1 với ñường
truyền vật lý. Một PC có thể có nhiều thiết bị ñiện thoại, mỗi thiết
bị ñiện thoại có ñặc ñiểm riêng. Khi “1 cuộc gọi thực sự” ñược
yêu cầu, người sủ dụng có thể lựa chọn một trong các thiết bị ñiện
thoại, gõ số ñiện thoại và sau ñó ứng dụng TAPI sẽ gán thiết bị ñiện
thoại với một thiết bị ñường truyền sẵn có(sẵn sàng).
2. 1. 7. Cấu trúc các lớp của TAPI.
Cấu trúc lớp của TAPI ñược gói gọn trong 5 phần :
LineApp, Line, Call, PhoneApp, Phone. Chúng ñược mô tả như hình
vẽ dưới ñây:
Hình 2. 3: Cấu trúc các lớp Của TAPI
2. 2 Công nghệ tổng hợp giọng nói.
2. 2. 1 Lịch sử.
Từ lâu trước khi kỹ thuật xử lý tín hiệu bằng thiết bị ñiện tử
hiện ñại ra ñời, các nhà nghiên cứu giọng nói ñã cố gắng xây
dựng các máy móc bắt chước giọng nói của người. Các ví dụ ñầu
tiên của các máy này ñược chế tạo bởi Gerbert ở Aurillac (1003,
Albertus Magnus(1198–1280), và Roger Bacon (1214–1294). Năm
1779, nhà khoa học người
ð

an Mạch Christian Kratzenstein, lúc ñó
làm việc tại Viện Hàn lâm Khoa học Nga, xây dựng một mô hình có
thể bắt chước giọng nói người với năm nguyên âm ([a], [e], [I], [o]
và [u]).
Năm 1961, nhà vật lý học John Larry Kelly, Jr dùng máy tính
IBM 704 ñể tổng hợp giọng nói, ñây là sự kiện ñáng nhớ trong lịch
sử của phòng thí nghiệm Bell. Máy ghi âm và tổng hợp giọng nói
của Kelly tạo ra bài hát Daisy Bell, với âm nhạc phụ họa bởi
Max Mathews. Vào lúc trình diễn, Arthur C. Clarke ñang thăm Ta
và ñồng nghiệp John Pierce ở khu thí nghiệm Bell ở Murray Hill.
Clarke ñã bị ấn tượng mạnh bởi trình diễn của máy phát âm và ñã
dùng hình ảnh này trong tiểu thuyết và kịch bản phim của ông 2001:
A Space Odyssey, [1] trong ñó máy tính HAL 9000 hát cùng bài
hát khi nó
sắp bị nhà du hành vũ trụ Dave Bowman ñặt vào trạng thái ngủ. [2]
Công nghệ tổng hợp giọng nói ñã tiến hóa nhanh kể từ ñó. Hiện
nay có hàng trăm hệ thống tổng hợp giọng nói, thương mại cũng như
tự do (xem liên kết ngoài). Tuy ñã ñạt ñược thành tựu trong tổng
hợp giọng nói bằng kỹ thuật ñiện tử, các nghiên cứu vẫn ñang ñược
tiến hành ñể tạo ra bộ tổng hợp giọng nói cơ học, mô phỏng thanh
quản của người, dùng trong robot dạng người. Các bộ tổng hợp
giọng nói ñiện tử bị giới hạn bởi chất lượng của loa, bộ phận cuối
cùng tạo ra âm thanh, dù tín hiệu ñiện tử có hoàn hảo. Có hy vọng
rằng bộ thanh quản cơ khí có thể tạo ra giọng nói chuẩn hơn loa
thông thường.
2. 2. 2 Khái Niệm.
Trên máy tính, tổng hợp giọng nói là việc tạo ra giọng nói của
người từ ñầu vào là văn bản hay các mã hóa việc phát âm. Hệ thống
thực hiện việc này còn gọi là máy tổng hợp giọng nói, có thể là hệ
thống phần mềm hoặc phần cứng. Hệ thống này còn ñược gọi là văn

bản-sang-tiếng nói (text-to-speech, TTS); tuy rằng không phải hệ
thống tổng hợp giọng nói nào cũng có ñầu vào là văn bản (nhiều hệ
thống thu nhận mã hóa cách phát âm, ví dụ mã IPA, như ñầu vào).
Các hệ thống này có nhiều ứng dụng. Ví dụ như hệ thống này có thể
giúp người khiếm thị nghe ñược máy ñọc ra văn bản; ñặc biệt là
các văn bản có thể xử lý trên máy tính. Hệ thống như vậy có thể
lắp ñặt trong phần mềm xử lý văn bản hay trình duyệt mạng.
Hình 2.4 Mô hình hệ thống mã hóa giọng nói.
2. 2. 3. Tổng quan.
Một máy tổng hợp giọng nói bao gồm hai phần: ngoại
diện và hậu trường. Phần ngoại diện nhận ñầu vào ở dạng
văn bản rồi cho ñầu ra là thể hiện biểu tượng ngôn ngữ của
văn bản (tức là một cách mã hóa cách phát âm văn bản).
Phần hậu trường nhận lấy thể hiện biểu tượng ngôn ngữ
như ñầu vào và cho ra giọng nói tổng hợp ở dạng sóng âm
thanh.
Phần ngoại diện có hai nhiệm vụ chính. Trước tiên, nó
nhận văn bản và chuyển ñổi các ký tự như các chữ số hay
cách viết tắt thành dạng viết ñầy ñủ. Quá trình này gọi là
chuẩn hóa văn bản, hay tiền xử lý. Sau ñó nó cho ra mã
phát âm ứng với từng từ, rồi phân chia và ñánh dấu văn bản
thành từng ñoạn văn, nhóm từ, mệnh ñề, hay câu văn. Quá
trình chuyển văn bản sang mã phát âm ñược gọi là văn
bản-sang-âm vị. Kết hợp mã phát âm và thông tin ñoạn
văn tạo nên ñầu ra cuối cùng thể hiện biểu tượng ngôn ngữ.
Phần hậu trường, nhận lấy thể hiện biểu tượng ngôn
ngữ rồi chuyển nó thành âm thanh. Phần này thường ñược
gọi là máy tổng hợp. Có nhiều kỹ thuật tổng hợp, ñược
mô tả bên dưới.

×