Ứng dụng:
Nhận dạng người nói
Nhóm báo cáo số 3
Thực hiện: Ngô Anh Tuấn
Cơ sở lý thuyết về nhận dạng người nói
• Tiếng nói tự nhiên ngoài thông tin ngữ nghĩa mà người nói muốn truyền đạt (thông
tin có thể ghi lại dưới dạng chữ viết) còn chứa các thông tin như trạng thái tình cảm
khi nói, hay những thông tin riêng của giọng người nói…
• Các thông tin riêng biệt này được chia làm hai loại: mức cao và mức thấp.
Mức cao gồm các thông tin như phương ngữ, ngữ cảnh, phong cách nói…
Mức thấp là các thông tin như cao độ (pitch), trường độ…Các thông tin này không
phải bất biến từ lúc người biết nói đến lúc già, nhưng nó có tính khá ổn định trong
giai đoạn dài của cuộc đời.
• Khi con người đã trưởng thành, những thói tật khi nói, những đặc trưng khu biệt
trong cấu âm sẽ hình thành và mang tính ổn định cao. Đây chính là cơ sở khoa
học cho việc xây dựng các hệ thống nhận dạng người nói.
Phân loại bài toán nhận dạng tiếng nói
Định danh người nói
(speaker identification):
kiểm tra xem người
cần kiểm tra là ai, hay là không
có trong hệ thống
Xác thực người nói (speaker
verification): xác minh liệu người
đang nói có đúng là người mà máy
tính đã được biết trước hay không?
(tính xác thật của giọng nói)
Phương pháp nhận dạng người nói
Nhận dạng phụ thuộc vào từ khóa
• Nhận dạng người nói dựa trên sự kết hợp giữa đặc trưng
người nói với nội dung nói. (mật khẩu)
Nhận dạng không phụ thuộc vào từ khóa
• Nhận dạng người nói chỉ dựa vào đặc trưng
của người nói
Nhận dạng người nói không phụ thuộc vào từ khóa
Tín hiệu đầu vào
Trích chọn
đặc trưng
Hu
yện
u
l
n
ấ
Xác
Mô hình người
nói
Cơ sở dữ liệu
th ự
c
So khớp mẫu
ID người nói
Điều kiện quyết định
Quyết định
Đặc trưng tiếng nói của người nói
• Đặc trưng vật lý
1. Độ cao: Độ cao hay độ trầm bổng của âm thanh chính là tần số của sóng
cơ học của âm thanh. Đối với tiếng nói, tần số dao động của dây thanh quy
định độ cao giọng nói của con người.
2. Cường độ: Độ to nhỏ của âm thanh. Trong tiếng nói cường độ của nguyên
âm phát ra thường lớn hơn của
phụ âm. Do vậy chúng ta thường dễ phát hiện ra nguyên âm hơn là phụ âm.
Đặc trưng tiếng nói của người nói
• Đặc trưng vật lý
3. Trường độ: Trường độ hay độ dài của âm phụ thuộc vào sự chấn động
lâu hay nhanh của các phần tử không khí.
4. Âm sắc: Âm sắc là bản sắc, sắc thái riêng của âm. Cùng một nội dung,
độ cao nhưng khi nói mỗi người có một âm vị khác nhau
Một vài ứng dụng của nhận dạng người
nói
- Điều khiểu truy cập
Một vài ứng dụng của nhận dạng người
nói
- Nhận dạng tội phạm
- Chứng thực giao dịch
Một vài ứng dụng của nhận dạng người
nói
- Thu thập thông tin cá nhân
- Hệ thống bán hàng gián tiếp
(thu thập lại thông tin khách hàng)