Tải bản đầy đủ (.doc) (2 trang)

Xây dựng bộ điều khiển và nhận dạng tiếng nói phần 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (54.26 KB, 2 trang )

GVHD:Thầy Lê Tuấn Anh Giới Thiệu
GIỚI THIỆU
I. Tổng quan:
Luận văn này thực hiện việc xây dựng bộ điều khiển và nhận dạng tiếng
nói bằng xử lý tín hiệu số DSP56002.
Một vài thập niên trước đây, việc nhận dạng tiếng nói bằng máy chỉ tồn
tại trong suy nghó của các nhà khoa học viễn tưởng, tuy nhiên trong một vài năm
gần đây, vấn đề tìm hiểu và thực hiện một hệ thống nhận dạng tiếng nói một
cách tự động đã được đưa vào nghiên cứu trong các viện nghiên cứu trên khắp
thế giới. Những ứng dụng thực tiễn mà hệ thống này sẽ mang lại là vô cùng lớn
như các máy tính của chúng ta sẽ không cần bàn phím, các hệ thống điều khiển
sẽ không cần các bảng điều khiển phức tạp, máy điện thoại sẽ không còn cần
đến các bàn quay số... có thể xem là một bước đột phá trên tất cả các lónh vực
trong cuộc sống của chúng ta. Do đó vấn đề nghiên cứu các phương pháp nhận
dạng tiếng nói là một vấn đề đã và đang thu hút rất nhiều sự đầu tư và nghiên
cứu của các nhà khoa học trên khắp thế giới. Tuy nhiên cho đến nay kết quả
mang lại còn rất hạn chế vì sự phức tạp của tiếng nói con người.
Đối với nước ta, vấn đề nhận dạng tiếng nói đang ở trong giai đoạn đầu
và các kết quả đạt được cho đến nay vẫn còn khiêm tốn. Luận văn này nghiên
cứu thử nghiệm một hướng nhận dạng tiếng nói dựa trên đặc trưng ngữ âm
quan trọng của tiếng nói là formant. Công cụ toán học có thể sử dụng là phép
phân tích Fourier thời gian ngắn STFT(Short Time Fourier Transform). Nhận
dạng tiếng nói là bộ phận nòng cốt trong bộ điều khiển tiếng nói cần thiết kế.
SVTH:Huỳnh Quốc Trâm 1-1
GVHD:Thầy Lê Tuấn Anh Giới Thiệu
II . Những nội dung chính của luận văn:
Các chương 2, 3, 4, 5, 6 giới thiệu về xử lý tín hiệu số DSP56002, bộ giao
tiếp âm thanh đa năng Codec 4215, bộ nhớ mở rộng, mạch giao tiếp và điều
khiển. Chương 2 giới thiệu tổng quát về bộ xử lý tín hiệu số DSP56002. Tiếp
đến Chương 3 mô tả cụ thể các chức năng của DSP56002 bao gồm: cấu trúc và
các chế độ đònh đòa chỉ củûa DSP56002; các thanh ghi trong và chế độ hoạt động


của các PORT của DSP56002. Chương 4 mô tả tập lệnh xử lý tín hiệu số
DSP56002. Chương 5 giới thiệu về CODEC giao tiếp âm thanh đa năng CS4215,
bộ đồng bộ giao tiếp nối tiếp (SSI) của bộ xử lí DSP56002 được sử dụng để
thích nghi với sự truyền dữ liệu nối tiếp từ hai bộ chuyển đổi A/D của CS4215
đến DSP56002 và từ DSP56002 đến hai bộ chuyển đổi D/A của CS4215.
Chương 6 mở rộng bộ nhớ cho DSP56002; chương này sẽ trình bày về sơ đồ
mạch của DSP56002EVM, bộ nhớ mở rộng, sơ đồ điều khiển động cơ DC và
các linh kiện sử dụng trong mạch. Các chương sau sẽ giới thiệu về các công cụ
toán học và phương pháp nhận dạng tiếng nói. Chương 7 giới thiệu về phép biến
đổi Fourier với tín hiệu liên tục và rời rạc, và giới thiệu phương pháp biến đổi
nhanh Fourier FFT thực hiện trên DSP56002 sử dụng giải thuật phân chia theo
thời gian DIT (decimation-in-time). Tiếp theo Chương 8 trình bày phép tổng
quát về biến đổi Fourier thời gian ngắn STFT. Cuối cùng là Chương 9 sẽ tập
trung vào phép biến đổi Fourier thời gian ngắn để trích formant của tín hiệu,
Sau khi trích formant của tín hiệu sẽ sử dụng phương pháp kết hợp mẫu để nhận
dạng tiếng nói.
III. Kết luận sơ bộ:
Luận văn đã thực hiện được việc :mở rộng bộ nhớ cho DSP56002, nhận
dữ liệu âm thanh từ ngoài qua giao tiếp SSI giữa DSP56002 và CS4215, thực
hiện trích formant của tín hiệu tiếng nói dùng giải thuật STFT. Cuối cùng là đã
thực hiện được việc nhận dạng tiếng nói và ứng dụng để điều khiển.
SVTH:Huỳnh Quốc Trâm 1-2

×