cơ
và các
bạn
Đề tài: Áp dụng cơng nghệ
chuyển đổi giọng nói thành văn
bản để phục vụ công việc ghi
chép của thư ký trường DHCNHN
Giáo viên hướng dẫn : Ths Lê Như Hiền
Nguyễn Viết Vượng
Lê Trần Anh Tú
Lê Văn Xuân
V
M
Đinh Thị Mừng
V
Đàm Lê Tuấn Vũ
T
X
Tổng Quan Đề Tài
1
Mở đầu
2
3
Kết quả và
đánh giá
4
Nội dung
của đề tài
Kết luận
1. MỞ ĐẦU
1. Lí do chọn đề tài
- Ngày nay, cơng nghệ
thơng tin, đặc biệt là các
ứng dụng của trí tuệ nhân
tạo đang được sử dụng rộng
rãi trong tất cả các lĩnh vực
của đời sống xã hội.
-Có thể nói sự phát triển
của công nghệ thông tin đã
giúp con người giải quyết
các bài tốn khó trong thời
gian ngắn, mà trước đây địi
hỏi con người phải mất
nhiều thời gian và cơng sức
với độ chính xác và độ tin
Trong thời đại cơng nghệ số, việc
chuyển đổi giọng nói thành văn
bản đang trở thành một nhu cầu
thiết yếu trong đời sống và công
việc của con người
Phần mềm này giúp cho người
dung tiếp kiệm thời gian và nỗ
lực trong công việc chuyển giọng
nói thành văn bản, đồng thời
giảm sự mệt mỏi và sai sót trong
q trình thực hiện cơng việc này
Đặc biệt đối với công việc
thư ký khi phải rất khó khăn
trong việc vừa phải tập
trung cao độ để lắng nghe,
vừa phải động não để lọc
những thông tin quan trọng
để ghi chép, đơi khi vẫn bị
bỏ xót thơng tin quan
trọng.
2. Mục tiêu của đề tài
0
1
0
2
0
3
Tìm hiểu những đặc trưng của
giọng nói như từ loại, ngữ nghĩa,
cú pháp.
Thu thập và phân tích yêu cầu cho
một sản phẩm chuyển đổi giọng nói
thành văn bản
.Ứng dụng vào cơng việc ghi chép
của thư ký
.
3. Phạm vi nghiên cứu
Phạm vi của đề tài này là tập trung
vào nghiên cứu các công nghệ
chuyển đổi giọng nói thành văn
bản hiện có trên thị trường. Đưa ra
khuyến nghị để áp dụng cơng nghệ
chuyển đổi giọng nói thành văn
bản trong quá trình ghi chép của
thư ký.
4. Cấu Trúc của đề tài
Mở đầu
Đưa ra lí do,
mục đích,
phạm vi
Cơ sở lí
thuyết
Nền tảng lí
thuyết,
Thu thập, xác
Thu thập
thơng tin,
định
Thiết kế, xây
dựng
Xây dựng
phần mềm
Chương 1: Nội dung của
đề tài
1. KHẢO SÁT NHU CẦU VÀ TÍNH
NĂNG
Xác định
nhu cầu
Đánh giá
hiệu quả
Tìm kiếm
giải pháp
Phát triển
chất
lượng dịch
vụ
2. KIẾN THỨC VÀ NỘI DUNG LIÊN
QUAN
Tốc độ chuyển đổi
Độ chính xác
Tính di động
Tính bảo mật
Tích hợp với các ứng
dụng khác
•Phần mềm: trung tâm của hệ
thống, được thiết kế để chuyển
đổi giọng nói thành văn bản
•Thiết bị cần thiết: để sử dụng
phần mềm, thư kí cần phải có
thiết bị điện tử hỗ trợ, chẳng
hạn như smartphone hoặc máy
tính bảng, để ghi âm và kết nối
với phần mềm chuyển đổi
giọng nói thành văn bản
0
1
0
2
0
3
3. Các cơng nghệ sử dụng
Mơ hình Markov:
Nhận dạng giọng nói dựa trên
độ
cong
thời
gian
động
(DTW)
Mạng
lưới
thần
( Neural networks)
kinh
4. THIẾT KẾ VÀ XÂY DỰNG HỆ
4.1 THIẾT KẾ:
THỐNG
+ Một yếu tố quan trọng đầu tiên là xác định yêu cầu
chức năng của hệ thống
+Sau khi xác định các yêu cầu chức năng, cần thiết kế
kiến trúc hệ thống
+Một phần khác của thiết kế là thiết kế giao diện người
dùng
4.2 Xây dựng
B1
B2
B3
B4
THU THẬP VÀ
CHUẨN BỊ DỮ
LIỆU
TIỀN XỬ LÝ VÀ ĐẶC
TRƯNG HĨA DỮ
LIỆU ÂM THANH
HUẤN LUYỆN MƠ
HÌNH CHUYỂN ĐỔI
GIỌNG NĨI THÀNH
VĂNKHAI
BẢN HỆ
TRIỂN
THỐNG CHUYỂN
ĐỔI GIỌNG NÓI
THÀNH VĂN BẢN
CHƯƠNG 2. KẾT QUẢ VÀ ĐÁNH GIÁ
Chương trình chỉ có khả năng
chuyển đổi những âm thanh của
từ vững thành văn bản chứ không
thể xét được các phân đoạn ngắt
nghỉ để thêm dấu câu hay in hoa
chữ cái. Vì thế, ta chỉ so sánh và
thống kế từ vựng được chuyển
đổi.
Trong tổng quan, việc áp dụng
cơng nghệ chuyển đổi giọng nói
thành văn bản để phục vụ cho
công việc ghi chép của thư kí là
một ứng dụng tiềm năng và đầy
CHƯƠNG 3 : KẾT LUẬN
•Kiến thức về mơ hình chuyển đổi giọng nói thành văn bản sử
dụng mạng nơron nhiều lớp, cũng như các mơ hình xử lý khác như
Mơ hình Markov ẩn, Nhận dạng giọng nói dựa trên độ cong thời
gian động
•Kiến thức về việc xác định yêu cầu của phần mềm thông qua
việc khảo sát người dùng bằng phiếu điều tra.
•Kĩ năng làm việc nhóm
•Kĩ năng viết báo cáo
•Kĩ năng giao tiếp
•Trách nhiệm và giữ cam kết