Tải bản đầy đủ (.pdf) (3 trang)

Tìm hiểu, nghiên cứu và ứng dụng một số thuật toán nén tiếng nói

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (454.78 KB, 3 trang )

Tìm hiểu, nghiên cứu và ứng dụng một số
thuật toán nén tiếng nói


Nguyễn Như Hiền


Trường Đại học Công nghệ. Đại học Quốc gia Hà Nội
Luận văn ThS. Công nghệ Thông tin : 60 48 05
Người hướng dẫn : GS. TS. Nguyễn Văn Xuất
Năm bảo vệ: 2013
61 tr .

Abstract.Trình bày những vấn đề lý thuyết làm cơ sở cho các chương sau như nén dữ
liệu, Zero Crossing, phép biến đổi Cosine, phép biến đổi Wavelet Haar, hệ số tương
quan Peason. Trình bày cơ sở lý thuyết về âm thanh, tiếng nói và nhận dạng tiếng nói.
Trình bày các phương pháp số hóa âm thanh, tiếng nói. Xây dựng ứng dụng để nhận
dạng tiếng Việt, trình bày cách lấy đặc trưng tiếng nói, kỹ thuật nén các đặc trưng và
thử áp dụng cho bài toán nhận dạng tiếng nói các từ đơn tiếng Việt.
Keywords.Hệ thống thông tin; Nhận dạng tiếng nói; Âm thanh số; Thuật toán nén
tiếng nói
Content.
Tiếng nói là một phương tiện trao đổi thông tin tiện ích vốn có của còn người. Ước
mơ về những “máy nói”, “máy hiểu tiếng nói” đã không chỉ xuất hiện từ những câu
truyện khoa học viễn tưởng xa xưa mà còn là động lực thôi thúc của nhiều chuyên gia
nghiên cứu trên thế giới. Hiện nay, nhiều thành tựu tiên tiến đã được đưa vào ứng dụng
trong cuộc sống. Tuy vậy, việc có được một “máy nói” mang tính tự nhiên (về giọng
điệu, phát âm, …) cũng như một “máy hiểu tiếng nói” thực sự cho đến nay vẫn còn xa
với mong muốn và yêu cầu thực tế của con người. Cùng với xu thế phát triển của khoa
học công nghệ ngày càng thúc đẩy việc hoàn thiện hơn nữa công nghệ để có thể đạt
được mục tiêu của con người về lĩnh vực xử lý tiếng nói. Chính vì thế, việc nắm bắt


được các kỹ thuật cơ bản cũng như các công nghệ tiên tiến cho việc xử lý tiếng nói là
thực sự cần thiết cho việc xây dựng các ứng dụng xử lý tiếng nói. Với mục đích đó,
luận văn đã tập trung vào việc tìm hiểu, nghiên cứu và tìm kiếm các đặc trưng của
tiếng nói phục vụ cho việc nhận dạng.Trên cơ sở các kết quả nghiên cứu luận văn xây
dựng ứng dụng để kiểm tra, đánh giá các đặc trưng.Với mục đích trên, không làm giảm
ý nghĩa của nội dung nghiên cứu, luận văn đã chọn tiếng Việt để thử nghiệm. Luận văn
gồm các chương sau:
Chương 1: Cơ sở toán học của luận văn
Chương này trình bày những vấn đề lý thuyết làm cơ sở cho các chương saunhư
nén dữ liệu, Zero Crossing, phép biến đổi Cosine, phép biến đổi Wavelet Haar, hệ số
tương quan Peason
Chương 2: Âm thanh, tiếng nói và nhận dạng tiếng nói
Chương này trình bày cơ sở lý thuyết về âm thanh, tiếng nói và nhận dạng tiếng
nói.
Chương 3: Số hóa âm thanh
Chương này trình bày các phương pháp số hóa âm thanh, tiếng nói.
Chương 4: Xây dựng ứng dụng để nhận dạng tiếng Việt
Chương này trình bày cách lấy đặc trưng tiếng nói, kỹ thuật nén các đặc trưng và
thử áp dụng cho bài toán nhận dạng tiếng nói các từ đơn tiếng Việt.
TÀI LIỆU THAM KHẢO
Tiếng Việt
1. Nguyễn Quang Hoan (2006), Xử lý ảnh, Học viện Công nghệ Bưu chính
Viễn thông, tr.99-103.
2. Nguyễn Thị Thanh Hà (2009), Watermarking dùng Wavelets đối với ảnh số,
Luận văn thạc sĩ ngành Vật lý vô tuyến và Điện tử hướng kỹ thuật, Đại học
Khoa học Tự nhiên, Đại học Quốc gia Thành phố Hồ Chí Minh, tr.38-44.
3. Nguyễn Văn Xuất (2006), Mutilmedia, (Cấu trúc file wave), Học viện Kỹ
thuật quân sự.
4. Trần Anh Tuấn(6/2012),Sử dụng điểm cắt zero để nén và giải nén dữ liệu
âm thanh, tạp chí khoa học Đại học Cần Thơ, tr.36-39.

Tiếng Anh
5. HarmanpreetKaur, RamanpreetKaur (July-August 2012), “Speech
compression and decompression using DCT and DWT”, International
Journal Computer Technology &Applications,Vol (3), Issue (4), pp.1501-
1503.
6. M.V.Patil, Apoorva Gupta, Ankita Varma, Shikhar Salil (2013), “Audio and
Speech Compression Using DCT and DWT Techniques”,International
Journal of Innovative Research in Science, Engineering and
Technology,Vol.(2), Issue (5), pp.1715-1718.
7. Musawir Ali, An Introduction to Wavelets and the Haar
Transform,( School of Electrical
Engineering and Computer Science.
8. O. Rioul and M. Vetterli (Oct. 1991), “Wavelets and Signal Processing”,
IEEE Signal Process, Mag, Vol (8), pp.14-38.
9. David Salomon (2004), Data Compression The Complete
Reference,Springer, New York.
10. Scott Wilson (Jan 20, 2003), WAVE PCM soundfile format,
(
University.

×