Tải bản đầy đủ (.pdf) (89 trang)

Nghiên cứu kỹ thuật mã hóa tiếng nói và phương pháp thám (Luận văn thạc sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (765.79 KB, 89 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LÊ MỸ LỆ

NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI
VÀ PHƢƠNG PHÁP THÁM

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

THÁI NGUYÊN, NĂM 2015
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

LÊ MỸ LỆ

NGHIÊN CỨU KỸ THUẬT MÃ HÓA TIẾNG NÓI
VÀ PHƢƠNG PHÁP THÁM
Chuyên ngành : Khoa học máy tính
Mã số
: 60 48 01 01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

HƢỚNG DẪN KHOA HỌC: TIẾN SỸ HỒ VĂN CANH

THÁI NGUYÊN, NĂM 2015


Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

i

LỜI CAM ĐOAN

Tôi xin cam đoan, những nội dung liên quan tới đề tài được trình bày trong
luận văn là do bản thân tự nghiên cứu, tổng hợp dưới sự hướng dẫn khoa học của
TS Hồ Văn Canh. Các nhận xét, kết luận được trích dẫn đầy đủ theo bản gốc.
Tôi xin chịu trách nhiệm trước pháp luật lời cam đoan của mình.

Thái Nguyên, ngày 8 tháng 10 năm 2015
Học viên viên thực hiện

Lê Mỹ Lệ

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

ii

LỜI CẢM ƠN

Trên thực tế không có sự thành công nào mà không gắ n liề n với
những nỗ lực củ a bả n thân sự hỗ trợ, giúp đỡ dù ít hay nhiề u, dù trực
tiế p hay gián tiế p củ a ngƣời khác. Trong suố t thời gian từ khi bắ t đầ u họ c
tậ p ở Đạ i họ c Thái Nguyên -Trường Đạ i họ c CNTT & TT đế n nay em đã

nhậ n đƣợc rấ t nhiề u sự quan tâm, giúp đỡ củ a quý thầ y cô, gia đình, bạ n
bè.
Với lòng biế t ơn sâu sắ c nhấ t, em xin gửi tới quý Thầ y/cô thuộ c
Việ n Công nghệ Thông tin-Việ n Hàn lâm Khoa họ c và Công nghệ Việ t
Nam và Thầ y/cô thuộ c ĐH Thái Nguyên - Trƣờng Đạ i họ c Công nghệ
Thông tin và Truyề n thông đã cùng với tri thức và tâm huyế t củ a mình để
truyề n đạ t vố n kiế n thức quý báu cho chúng em trong suố t thời gian họ c
tậ p tạ i trƣờng. Em xin chân thành cả m ơn Ts. Hồ Văn Canh đã hƣớng
dẫ n em trong quá trình làm luậ n văn.
Quá trình thực hiệ n và hoàn thành luậ n văn kiế n thức củ a em con
hạ n chế và nhiề u bỡ ngỡ. Do vậ y, không tránh khỏ i những thiế u sót là
điề u chắ c chắ n, em rấ t mong nhậ n đƣợc những ý kiế n đóng góp quý báu
củ a quý Thầ y Cô và các bạ n họ c cùng lớp để kiế n thức củ a em trong lĩnh
vực này đƣợc hoàn thiệ n hơn.
Sau cùng, em xin kính chúc quý Thầ y Cô và đặ c biệ t là Ts. Hồ Văn
Canh thậ t dồ i dào sức khoẻ , niề m tin để tiế p tụ c thực hiệ n sứ mệ nh cao
đẹ p củ a mình là truyề n đạ t kiế n thức cho thế hệ mai sau.
Trân trọ ng!
Thái Nguyên, ngày 8 tháng 10 năm 2015
Học viên viên thực hiện
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iii

Lê Mỹ Lệ

MỤC LỤC
LỜI CAM ĐOAN ....................................................................................................... i

LỜI CẢM ƠN ............................................................................................................ ii
MỤC LỤC .................................................................................................................iii
DANH MỤC TỪ VIẾT TẮT................................................................................... vi
DANH MỤC BẢNG BIỂU, ĐỒ THỊ ..................................................................... vii
MỞ ĐẦU .................................................................................................................... 1
Chƣơng 1: TỔNG QUAN VỀ TIẾNG NÓI VÀ XỬ LÝ TIẾNG NÓI ................ 3
1.1. Mở đầu ............................................................................................................ 3
1.2. Tổng quan bộ máy phát âm ......................................................................... 4
1.2.1. Bộ máy phát âm ....................................................................................... 4
1.2.2. Cơ chế phát âm.......................................................................................... 5
1.3. Biểu diễn tín hiệu tiếng nói ............................................................................ 6
1.3.1. Xác định tần số lấy mẫu ............................................................................ 9
1.3.2. Nén tín hiệu tiếng nói .............................................................................. 10
1.4. Đặc tính của tiếng nói .................................................................................. 11
1.4.1. Âm hữu thanh .......................................................................................... 11
1.4.2. Âm vô thanh ............................................................................................ 11
1.4.3. Âm vị ....................................................................................................... 11
1.4.4. Nguyên âm .............................................................................................. 12
1.4.5. Phụ âm ..................................................................................................... 12
1.4.6. Các đặc tính khác .................................................................................... 12
1.5. Mô hình tạo tiếng nói ................................................................................... 14
1.6. Kỹ thuật xử lý tiếng nói cơ bản ................................................................... 17
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

iv
1.6.1. Tổng hợp tiếng nói .................................................................................. 18
1.6.2. Nhận dạng tiếng nói ................................................................................ 19
1.6.3. Phương pháp ghép nối............................................................................. 22

1.7. Mã hoá tham số tín hiệu .............................................................................. 25
1.8. Kết luận chƣơng ........................................................................................... 25
Chƣơng 2: TỔNG QUAN CÁC PHƢƠNG PHÁP MÃ HÓA VÀ THÁM MÃ
TIẾNG NÓI ............................................................................................................. 27
2.1. Mã hoá vùng thời gian ................................................................................ 27
2.1.1. Công nghệ PCM ...................................................................................... 27
2.2. Mã hoá vùng tần số (Frequence Domain Coding of speech) .................... 32
2.3. Mã hoá dải nhỏ(Sbc) .................................................................................... 32
2.4. Mã hoá biến đổi thích nghi (ATC) .............................................................. 35
2.5. Mã hoá tham số nguồn (resourd parameters method) ............................. 37
2.5.1. Bộ mã hoá nguồn theo kênh .................................................................... 38
2.5.2. Phương pháp dự đoán tuyến tính LPC .................................................... 39
2.6. Mã hoá theo hệ mật mã khoá đối xứng AES ............................................. 40
2.6.1. Giới thiệu khái quát ................................................................................. 42
2.7. Các phƣơng pháp mã hoá khác .................................................................. 50
2.7.1. Phương pháp mã hoá DPCM ( Điều xung mã vi sai) ............................. 51
2.7.2. Phương pháp DM ( điều chế delta) ......................................................... 52
2.7.3. Phương pháp mã hoá ADPCM ............................................................... 53
2.8. Phép biến đổi Fourier .................................................................................. 53
2.8.1. Sự hội tụ của phép biến đổi Fourier ........................................................ 54
2.8.2. Phép biến đổi Fourier rời rạc (Discriete Fourier Transform - DFT)....... 54
2.8.3. Phép biến đổi fourier nhanh (FFT) ......................................................... 55
2.8.4. Quan hệ giữa biến đổi Z và biến đổi Fourier .......................................... 56
2.8.5. Phép biến đổi Fourier ngược ................................................................... 57
2.8.6. Các tính chất của phép biến đổi Fourier ................................................. 57
2.9. Tổng quát phƣơng pháp thám .................................................................... 58
2.9.1. Tấn công bản mã khi đã có từ giả định .................................................. 58
Số hóa bởi Trung tâm Học liệu - ĐHTN

/>


v
2.9.2. Tấn công bản mã khi không có đoạn tiếng nói gốc cho trước (không có
từ giả định) đối với hệ thống phép hoán vị cố định. ......................................... 59
2.9.3. Tấn công vào bản mã khi thay đổi hệ thống phép hoán vị. .................... 62
2.10. Kết luận chƣơng ......................................................................................... 66
Chƣơng 3: ỨNG DỤNG HỆ MẬT MÃ AES TRONG MÃ HOÁ TIẾNG NÓI 69
3.1. Các khái niệm và quy ƣớc ........................................................................... 69
3.2. Sơ đồ luồng thực hiện ................................................................................ 70
3.2.1. Chi tiết các bước thực hiện quá trình mã hóa ......................................... 71
3.2.2. Cấu trúc lớp trong chương trình .............................................................. 71
3.3. Phƣơng pháp thám ....................................................................................... 71
3.3.1. Bước 1: Phân loại bản mã ....................................................................... 73
3.3.2. Bước 2 : Xác định mã pháp ..................................................................... 74
3.4. Đề mô chƣơng trình ..................................................................................... 77
KẾT LUẬN .............................................................................................................. 78
DANH MỤC TÀI LIỆU THAM KHẢO ............................................................... 79

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vi

DANH MỤC TỪ VIẾT TẮT

ADC

Analog Digital Converter


ADM

Adaptive Delta Modulation

ADPCM

Adaptive Differential Pulse Code Modulation

AES

Advanced Encryption Standard

ARK

AddRoundKey

CSR

Continuous Speech Recognition

DCT

Discrete cosine transform

DFT

Discrete furier transform

DHT


Discrete wash – Had transform

DPCM

Differential PCM

FFT

Fast FT

FIR

Finite Impulse Response

FT

Fourier Transform

IDFT

Inverse Discrete FT

IDTFT

Inverse DTFT

IFT

Inverse FT


IMC

InvMixColumns

ISB

InvSubBytes

ISR

InvShiftRows

MC

MixColumns

PST

Prolate spheroidal transform

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

vii
SB

SubBytes

SR


ShiftRows

DANH MỤC BẢNG BIỂU, HÌNH VẼ
Danh mục bảng biểu:
Bảng 1.1. Giá trị tần số cơ bản của con người. ........................................................13
Bảng 2.1. Chia dải tần của tiếng nói bằng phương pháp Sbc ...................................33
Bảng 2.2. Bảng thế S-BOX của AES ........................................................................47
Bảng 2.3. Việc tấn công vào bản mã (có từ giả định) ...............................................59
Bảng 2.4. Tỷ lệ % của các thành phần qua 2 phép biến đổi DCT và DFT ...............61
Bả
...................................................................................62
Bảng 2.6. Đo khoảng cánh thể hiện(c/minh) chất lượng tiếng nói ...........................62
Danh mục hình:
Hình 1. 1. Bộ máy phát âm con người. .......................................................................5
Hình 1.2. Biểu diễn tín hiệu tiếng nói. ........................................................................7
Hình 1.3. Thông lượng cho các phương pháp biểu diễn tiếng nói. .............................8
Hình 1.4. Mô hình hoá nguồn âm đối với âm hữu thanh. .........................................14
Hình 1.5. Chuỗi 5 đoạn ống âm học lý tưởng. ..........................................................15
Hình 1.6. Các biểu diễn lý học và toán học. .............................................................16
Hình 1.7. Mô hình số của hệ thống phát âm. ............................................................17
Hình 1.8. Một vài ứng dụng xử lý tiếng nói.............................................................18
Hình 1.9. Cấu trúc cơ bản của một bộ tổng hợp Formant nối tiếp............................21
Hình 1.10.. Cấu trúc cơ bản của một bộ tổng hợp Formant song song.....................22
Hình 1.11. Sự phân tầng bộ mã hoá tiếng nói ...........................................................24
Hình 2.1. Cấu hình cơ bản của phương pháp thông tin PCM. ..................................28
Hình 2.2. Quá trình lấy mẫu ......................................................................................29
Hình 2.3. Tạp âm lượng tử theo biên độ tín hiệu đầu vào ........................................30
Số hóa bởi Trung tâm Học liệu - ĐHTN


/>

viii
Hình 2.4. Đặc tính nén và giãn ..................................................................................31
Hình 2.5. Sơ đồ bộ mã hóa và giải mã dải nhỏ .........................................................35
Hình 2.6. Mô tả State trong thuật toán mã hóa AES được biểu diễn dạng ma trận 4x4 .. 43
.............................................44
Hình 2.8. Lưu đồ thực hiện SB và ISB .....................................................................45
Hình 2.9. Biến đổi SubBytes () đối với mảng trạng thái...........................................46
Hình 2.10. Lưu đồ thực hiện SR ...............................................................................48
Hình 2.11. Quá trình xử lý MixColumns .................................................................48
Hình 2.12. Mô tả bước trong Key scheduling ...........................................................50
Hình 2.13. Sơ đồ mã hóa và giải mã DPCM .............................................................51
Hình 2.14. Sơ đồ mã hóa và giải mã AD .................................................................53
Hình 3.1. Lưu đồ cấu trúc lặp của thuật toán mã hóa AES .......................................69
Hình 3.2. Sơ đồ mã hoá tiếng nói bằng AES - áp dụng FFT ....................................70
Hình 3.3. Quy trình giải mã AES ..............................................................................72

Số hóa bởi Trung tâm Học liệu - ĐHTN

/>

Luận văn đầy đủ ở file: Luận văn full

















×