Tải bản đầy đủ (.pdf) (2 trang)

042_Một số khía cạnh của cơ sở âm thanh và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (165.59 KB, 2 trang )


- 50 -
MỘT SỐ KHÍA CẠNH CỦA
CƠ SỞ DỮ LIỆU ÂM THANH VÀ ỨNG DỤNG

Sinh viên: Hồ Tất Thành
Mã sinh viên: SV0220288
Email:

Cán bộ Hướng dẫn: PGS. TS. Đỗ Trung Tuấn
Trường Đại học Khoa học tự nhiên - ĐHQGHN

1.Mở đầu
Đa phương tiện đã trở nên phổ biến và đang
dần chiếm vai trò chủ đạo trong phương pháp
cung cấp và tiếp cận thông tin trên máy tính của
con người. Trong đó, âm thanh đóng vai trò rất
quan trọng.
2.Về dữ liệu đa phương tiện
2.1. Khái quát
Nghiên cứu về đa phương tiện bao trùm các
nghiên cứu về tạo, lưu trữ, biến đổi, khai phá,
thể hiện nội dung đa phương tiện.
2.2. Khó khăn của việc nghiên cứu đa
phương tiện
Trước tiên, phải thấy rằng dữ liệu đa phương
tiện là dữ liệu lớn. Hơn nữa, dữ liệu đa phương
tiện thường có cấu trúc phức tạp và không thống
nhất. Việc tương tác với con người và biểu đạt
dữ liệu đa phương tiện cũng là một vấn đề lớn.
2.3. Âm thanh trong đa phương tiện


Âm thanh là một thành phần quan trọng
trong hệ thống đa phương tiện. Âm thanh là loại
dữ liệu có khả năng chế tác bằng máy tính. Cơ
sở dữ liệu âm thanh lưu trữ các đoạn âm thanh
và siêu dữ liệu của âm thanh).
3.Các lĩnh vực nghiên cứu về âm thanh
Có hai lĩnh vực nghiên cứu chính về âm
thanh là xử lý tín tín hiệu âm thanh và thu thập
thông tin âm thanh
4.Tổng quan về tín hiệu âm thanh số
4.1. Các kiến thức cơ bản về âm thanh
và âm tâm lý
Sóng âm là một loại sóng cơ.
Các đơn vị vật lý của âm thanh dựa trên tính
khách quan và cả tính chủ quan của âm thanh
(tác động của âm thanh lên tai người). Tiêu biểu
có: áp suất âm, cường độ âm, decibel – mức
cường độ âm, mức áp suất âm, bát độ, bán cung.
Nghiên cứu về âm tâm lý là nghiên cứu về
cách thức và khả năng nhận thức âm thanh của
con người.
4.2. Lưu trữ âm thanh
Phương pháp lưu trữ dựa trên lấy mẫu ghi lại
thay đổi áp suất của sóng âm theo từng khoảng
thời gian nhất định. Phương pháp lưu trữ dạng
miêu tả dùng các miêu tả mang nghĩa trừu
tượng.
5.Tổng quan về xử lý tín hiệu âm
thanh
Có nhiều miền biểu diễn tín hiệu âm thanh.

Chuỗi tín hiệu lấy mẫu là sự biểu diễn sóng âm
trong miền thời gian. Trong miền tần số, sóng
âm được xem như là tổng hợp của các sóng đơn
tần ở các tần số khác nhau. Người ta dùng biến
đổi Fourier để phân tích một tín hiệu tổng hợp
thành các tín hiệu đơn tần, chuyển biểu diễn tín
hiệu từ miền thời gian sang miền tần s
ố. Biến
đổi Fourier thời gian ngắn rời rạc X(m,ω) cho
biết biên độ và pha của các sóng đơn tần tại
từng thời điểm cụ thể.
Phổ tần số là đồ thị miêu tả cường độ của các
tần số khác nhau. Ảnh phổ là kết quả của việc
tính toán phổ tần số theo cửa sổ trượt trên tín
hiệu tổng hợp, cho biế
t biến thiên theo thời gian
về năng lượng của các tần số sóng.
Việc biến đổi tín hiệu trên các miền khác
nhau thực chất là việc thay đổi giá trị các tín
hiệu, các hàm của tín hiệu trên các miền đó.
6.Nghiên cứu một số hiệu ứng âm
thanh
6.1. Thay đổi độ to
Thay đổi độ to là tăng giảm âm lượng, thực
hiện bằng cách nhân tỷ lệ áp suất của sóng lên
một số lần nào đó.Thay đổi độ to không làm
thay đổi phân bố năng lượng, cao độ, nhưng làm
thay đổi cường độ tổng thể và cường độ từng
sóng đơn tần.
6.2. Làm mờ âm

Làm mờ âm là thay đổi độ to một cách từ từ.
6.3. Tăng độ trầm của âm
Tăng độ trầm của âm thực hiện bằng cách
tăng biên độ các sóng thành phần ở tần số rất

- 51 -
thấp, thực hiện trên miền tần số. Tăng độ trầm
ảnh hưởng ít đến phổ, cao độ, cường độ âm
6.4. Tăng độ cao của âm
Tương tự như tăng độ trầm nhưng ở tần số
cao.
6.5. Bộ cân chỉnh âm
Đặc trưng quan trọng của bộ cân chỉnh âm là
việc tăng giảm âm ở các dải tần số khác nhau là
độc lập
6.6. Tái lấy mẫu
Tái lấy mẫu làm thay đổi tần số lấy mẫu
nhưng cố gắng giữ nguyên tính chất của âm,
được thực hiện bằng phương pháp nội suy mẫu.
6.7. Thay đổi tốc độ phát
Thay đổi tốc độ phát là việc biến đổi tốc độ
hoặc thời gian phát một đoạn âm thanh. Thay
đổi tốc độ phát cố gắng giữ nguyên cao độ. Có
hai phương pháp cơ bản là Phase Vocoder trên
miền tần số và phương pháp trên miền thời gian.
Thay đổi tốc độ phát làm co giản ảnh phổ, đồ thị
cao độ, đồ thị cường độ theo trục thời gian
6.8. Thay đổi cao độ
Thay đổi cao độ làm thay đổi mức cao thấp
của đoạn âm thanh mà cố gắng giữ nguyên tốc

độ phát. Thay đổi cao độ có hai phương pháp
tương tự thay đổi tốc độ phát. Thay đổi cao độ
làm co giãn ảnh phổ, đồ thị cao độ theo trục tần
số, ít ảnh hưởng tới cường độ.
6.9. Lọc nhiễu
Lọc nhiễu dựa vào loại “mẫu nhiễu”. Lọc
nhiễu giúp cho việc thu thập thông tin âm thanh
dễ dàng hơn
7.Xây dựng cơ sở dữ liệu về âm thanh
7.1. Phân đoạn âm thanh
Phân đoạn âm thanh có thể dựa vào khoảng
thời gian cố định, khoảng lặng hoặc dựa vào
định danh.
7.2. Một ứng dụng cơ sở dữ liệu âm
thanh
Âm thanh có thể được lưu trữ trực tiếp trong
hệ thống, hoặc là tài nguyên bên ngoài, được hệ
thống tham khảo tới. Hệ thống được tổ chức
thành 4 phần: ứng dụng trực quan, ứng dụng hệ
phục vụ, CSDL siêu dữ liệu, hệ thống tập tin.
Các bản âm có thể được tìm kiếm theo cây
phân mục hoặc tìm kiếm dựa trên từ khoá.
Trong phương pháp tìm kiếm dựa trên từ khoá,
các b
ản âm kết quả được sắp xếp theo độ phù
hợp. Các bản âm thanh còn được tổ chức dạng
cây cơ sở - dẫn xuất.
Có nhiều vấn đề phát triển trong tương lai
được đề xuất dựa trên hệ thống này.
8.Kết luận

Nghiên cứu về âm thanh và cơ sở dữ liệu âm
thanh đang là một vấn đề còn rất mới mẻ, nhất
là ở Việt Nam hiện nay. Với đề tài “Một số khía
cạnh của cơ sở dữ liệu âm thanh và ứng dụng”,
tác giả hi vọng góp phần đưa những nghiên cứu
như vậy gần gũi hơn và đóng góp vào nghiên
cứu chung.
Tài liệu tham khảo chính
[1] Paul Boersma, David Weenink.
Praat: doing phonetics by computer.
www.praat.org
, 2006.
[2] V.S.Subrahmanian. Principles of
Multimedia database systems.
Morgan Kaufmann Publishers, Inc;
San Francisco, California, 1998.
[3] Wikipedia, The Free Encyclopedia.
www.wikipedia.org
, 2006.
[4] www.adobe.com
. Adobe Audition
References. 2006.

×