ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
LÊ MỸ LỆ
NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI
VÀ PHƢƠNG PHÁP THÁM
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN, NĂM 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
LÊ MỸ LỆ
NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI
VÀ PHƢƠNG PHÁP THÁM
Chuyên ngành : Khoa học máy tính
Mã số
: 60 48 01 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
HƢỚNG DẪN KHOA HỌC: TIẾN SỸ HỒ VĂN CANH
THÁI NGUYÊN, NĂM 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
i
LỜI CAM ĐOAN
Tôi xin cam đoan, những nội dung liên quan tới đề tài được trình bày trong
luận văn là do bản thân tự nghiên cứu, tổng hợp dưới sự hướng dẫn khoa học của
TS Hồ Văn Canh. Các nhận xét, kết luận được trích dẫn đầy đủ theo bản gốc.
Tôi xin chịu trách nhiệm trước pháp luật lời cam đoan của mình.
Thái Nguyên, ngày 8 tháng 10 năm 2015
Học viên viên thực hiện
Lê Mỹ Lệ
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
ii
LỜI CẢM ƠN
Trên thực tế không có sự thành công nào mà không gắ n liề n với
những nỗ lực củ a bả n thân sự hỗ trợ, giúp đỡ dù ít hay nhiề u, dù trực
tiế p hay gián tiế p củ a ngƣời khác. Trong suố t thời gian từ khi bắ t đầ u họ c
tậ p ở Đạ i họ c Thái Nguyên -Trường Đạ i họ c CNTT & TT đế n nay em đã
nhậ n đƣợc rấ t nhiề u sự quan tâm, giúp đỡ củ a quý thầ y cô, gia đình, bạ n
bè.
Với lòng biế t ơn sâu sắ c nhấ t, em xin gửi tới quý Thầ y/cô thuộ c
Việ n Công nghệ Thông tin-Việ n Hàn lâm Khoa họ c và Công nghệ Việ t
Nam và Thầ y/cô thuộ c ĐH Thái Nguyên - Trƣờng Đạ i họ c Công nghệ
Thông tin và Truyề n thông đã cùng với tri thức và tâm huyế t củ a mình để
truyề n đạ t vố n kiế n thức quý báu cho chúng em trong suố t thời gian họ c
tậ p tạ i trƣờng. Em xin chân thành cả m ơn Ts. Hồ Văn Canh đã hƣớng
dẫ n em trong quá trình làm luậ n văn.
Quá trình thực hiệ n và hoàn thành luậ n văn kiế n thức củ a em con
hạ n chế và nhiề u bỡ ngỡ. Do vậ y, không tránh khỏ i những thiế u sót là
điề u chắ c chắ n, em rấ t mong nhậ n đƣợc những ý kiế n đóng góp quý báu
củ a quý Thầ y Cô và các bạ n họ c cùng lớp để kiế n thức củ a em trong lĩnh
vực này đƣợc hoàn thiệ n hơn.
Sau cùng, em xin kính chúc quý Thầ y Cô và đặ c biệ t là Ts. Hồ Văn
Canh thậ t dồ i dào sức khoẻ , niề m tin để tiế p tụ c thực hiệ n sứ mệ nh cao
đẹ p củ a mình là truyề n đạ t kiế n thức cho thế hệ mai sau.
Trân trọ ng!
Thái Nguyên, ngày 8 tháng 10 năm 2015
Học viên viên thực hiện
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
iii
Lê Mỹ Lệ
MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i
LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC .................................................................................................................iii
DANH MỤC TỪ VIẾT TẮT................................................................................... vi
DANH MỤC BẢNG BIỂU, ĐỒ THỊ ..................................................................... vii
MỞ ĐẦU .................................................................................................................... 1
Chƣơng 1: TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI ................ 3
1.1. Mở đầu ............................................................................................................ 3
1.2. Tổng quan bộ máy phát âm ......................................................................... 4
1.2.1. Bộ máy phát âm ....................................................................................... 4
1.2.2. Cơ chế phát âm.......................................................................................... 5
1.3. Biểu diễn tín hiệu tiếng nói ............................................................................ 6
1.3.1. Xác định tần số lấy mẫu ............................................................................ 9
1.3.2. Nén tín hiệu tiếng nói .............................................................................. 10
1.4. Đặc tính của tiếng nói .................................................................................. 11
1.4.1. Âm hữu thanh .......................................................................................... 11
1.4.2. Âm vô thanh ............................................................................................ 11
1.4.3. Âm vị ....................................................................................................... 11
1.4.4. Nguyên âm .............................................................................................. 12
1.4.5. Phụ âm ..................................................................................................... 12
1.4.6. Các đặc tính khác .................................................................................... 12
1.5. Mô hình tạo tiếng nói ................................................................................... 14
1.6. Kỹ thuật xử lý tiếng nói cơ bản ................................................................... 17
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
iv
1.6.1. Tổng hợp tiếng nói .................................................................................. 18
1.6.2. Nhận dạng tiếng nói ................................................................................ 19
1.6.3. Phương pháp ghép nối............................................................................. 22
1.7. Mã hoá tham số tín hiệu .............................................................................. 25
1.8. Kết luận chƣơng ........................................................................................... 25
Chƣơng 2: TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ
TIẾNG NÓI ............................................................................................................. 27
2.1. Mã hoá vùng thời gian ................................................................................ 27
2.1.1. Công nghệ PCM ...................................................................................... 27
2.2. Mã hoá vùng tần số (Frequence Domain Coding of speech) .................... 32
2.3. Mã hoá dải nhỏ(Sbc) .................................................................................... 32
2.4. Mã hoá biến đổi thích nghi (ATC) .............................................................. 35
2.5. Mã hoá tham số nguồn (resourd parameters method) ............................. 37
2.5.1. Bộ mã hoá nguồn theo kênh .................................................................... 38
2.5.2. Phương pháp dự đoán tuyến tính LPC .................................................... 39
2.6. Mã hoá theo hệ mật mã khoá đối xứng AES ............................................. 40
2.6.1. Giới thiệu khái quát ................................................................................. 42
2.7. Các phƣơng pháp mã hoá khác .................................................................. 50
2.7.1. Phương pháp mã hoá DPCM ( Điều xung mã vi sai) ............................. 51
2.7.2. Phương pháp DM ( điều chế delta) ......................................................... 52
2.7.3. Phương pháp mã hoá ADPCM ............................................................... 53
2.8. Phép biến đổi Fourier .................................................................................. 53
2.8.1. Sự hội tụ của phép biến đổi Fourier ........................................................ 54
2.8.2. Phép biến đổi Fourier rời rạc (Discriete Fourier Transform - DFT)....... 54
2.8.3. Phép biến đổi fourier nhanh (FFT) ......................................................... 55
2.8.4. Quan hệ giữa biến đổi Z và biến đổi Fourier .......................................... 56
2.8.5. Phép biến đổi Fourier ngược ................................................................... 57
2.8.6. Các tính chất của phép biến đổi Fourier ................................................. 57
2.9. Tổng quát phƣơng pháp thám .................................................................... 58
2.9.1. Tấn công bản mã khi đã có từ giả định .................................................. 58
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
v
2.9.2. Tấn công bản mã khi không có đoạn tiếng nói gốc cho trước (không có
từ giả định) đối với hệ thống phép hoán vị cố định. ......................................... 59
2.9.3. Tấn công vào bản mã khi thay đổi hệ thống phép hoán vị. .................... 62
2.10. Kết luận chƣơng ......................................................................................... 66
Chƣơng 3: ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HOÁ TIẾNG NÓI 69
3.1. Các khái niệm và quy ƣớc ........................................................................... 69
3.2. Sơ đồ luồng thực hiện ................................................................................ 70
3.2.1. Chi tiết các bước thực hiện quá trình mã hóa ......................................... 71
3.2.2. Cấu trúc lớp trong chương trình .............................................................. 71
3.3. Phƣơng pháp thám ....................................................................................... 71
3.3.1. Bước 1: Phân loại bản mã ....................................................................... 73
3.3.2. Bước 2 : Xác định mã pháp ..................................................................... 74
3.4. Đề mô chƣơng trình ..................................................................................... 77
KẾT LUẬN .............................................................................................................. 78
DANH MỤC TÀI LIỆU THAM KHẢO ............................................................... 79
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
vi
DANH MỤC TỪ VIẾT TẮT
ADC
Analog Digital Converter
ADM
Adaptive Delta Modulation
ADPCM
Adaptive Differential Pulse Code Modulation
AES
Advanced Encryption Standard
ARK
AddRoundKey
CSR
Continuous Speech Recognition
DCT
Discrete cosine transform
DFT
Discrete furier transform
DHT
Discrete wash – Had transform
DPCM
Differential PCM
FFT
Fast FT
FIR
Finite Impulse Response
FT
Fourier Transform
IDFT
Inverse Discrete FT
IDTFT
Inverse DTFT
IFT
Inverse FT
IMC
InvMixColumns
ISB
InvSubBytes
ISR
InvShiftRows
MC
MixColumns
PST
Prolate spheroidal transform
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
vii
SB
SubBytes
SR
ShiftRows
DANH MỤC BẢNG BIỂU, HÌNH VẼ
Danh mục bảng biểu:
Bảng 1.1. Giá trị tần số cơ bản của con người. ........................................................13
Bảng 2.1. Chia dải tần của tiếng nói bằng phương pháp Sbc ...................................33
Bảng 2.2. Bảng thế S-BOX của AES ........................................................................47
Bảng 2.3. Việc tấn công vào bản mã (có từ giả định) ...............................................59
Bảng 2.4. Tỷ lệ % của các thành phần qua 2 phép biến đổi DCT và DFT ...............61
Bả
...................................................................................62
Bảng 2.6. Đo khoảng cánh thể hiện(c/minh) chất lượng tiếng nói ...........................62
Danh mục hình:
Hình 1. 1. Bộ máy phát âm con người. .......................................................................5
Hình 1.2. Biểu diễn tín hiệu tiếng nói. ........................................................................7
Hình 1.3. Thông lượng cho các phương pháp biểu diễn tiếng nói. .............................8
Hình 1.4. Mô hình hoá nguồn âm đối với âm hữu thanh. .........................................14
Hình 1.5. Chuỗi 5 đoạn ống âm học lý tưởng. ..........................................................15
Hình 1.6. Các biểu diễn lý học và toán học. .............................................................16
Hình 1.7. Mô hình số của hệ thống phát âm. ............................................................17
Hình 1.8. Một vài ứng dụng xử lý tiếng nói.............................................................18
Hình 1.9. Cấu trúc cơ bản của một bộ tổng hợp Formant nối tiếp............................21
Hình 1.10.. Cấu trúc cơ bản của một bộ tổng hợp Formant song song.....................22
Hình 1.11. Sự phân tầng bộ mã hoá tiếng nói ...........................................................24
Hình 2.1. Cấu hình cơ bản của phương pháp thông tin PCM. ..................................28
Hình 2.2. Quá trình lấy mẫu ......................................................................................29
Hình 2.3. Tạp âm lượng tử theo biên độ tín hiệu đầu vào ........................................30
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
viii
Hình 2.4. Đặc tính nén và giãn ..................................................................................31
Hình 2.5. Sơ đồ bộ mã hóa và giải mã dải nhỏ .........................................................35
Hình 2.6. Mô tả State trong thuật toán mã hóa AES được biểu diễn dạng ma trận 4x4 .. 43
.............................................44
Hình 2.8. Lưu đồ thực hiện SB và ISB .....................................................................45
Hình 2.9. Biến đổi SubBytes () đối với mảng trạng thái...........................................46
Hình 2.10. Lưu đồ thực hiện SR ...............................................................................48
Hình 2.11. Quá trình xử lý MixColumns .................................................................48
Hình 2.12. Mô tả bước trong Key scheduling ...........................................................50
Hình 2.13. Sơ đồ mã hóa và giải mã DPCM .............................................................51
Hình 2.14. Sơ đồ mã hóa và giải mã AD .................................................................53
Hình 3.1. Lưu đồ cấu trúc lặp của thuật toán mã hóa AES .......................................69
Hình 3.2. Sơ đồ mã hoá tiếng nói bằng AES - áp dụng FFT ....................................70
Hình 3.3. Quy trình giải mã AES ..............................................................................72
Số hóa bởi Trung tâm Học liệu - ĐHTN
/>
Luận văn đầy đủ ở file: Luận văn full