Tải bản đầy đủ (.pdf) (84 trang)

Lọc nhiễu tín hiệu thoại dùng phương pháp EMD

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.57 MB, 84 trang )

i

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƢỜNG ĐẠI HỌC BÁCH KHOA
KHOA ĐIỆN – ĐIỆN TỬ
BỘ MÔN VIỄN THÔNG




LUẬN VĂN TỐT NGHIỆP ĐẠI HỌC
HỆ CHÍNH QUY


LỌC NHIỄU TÍN HIỆU THOẠI DÙNG
PHƢƠNG PHÁP EMD




GVHD: PGS. TS. HOÀNG ĐÌNH CHIẾN
SVTH: 1. TRẦN HIẾU TRUNG
MSSV: 40602711
2. DƢƠNG MINH TIẾN
MSSV: 40602471




TP. HỒ CHÍ MINH, THÁNG 1 NĂM 2011
ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH CỘNG HÒA XÃ HỘI CHŨ NGHĨA VIỆT NAM


TRƯỜNG ĐẠI HỌC BÁCH KHOA Độc lập – Tự do – Hạnh phúc.

Số: ______ /BKĐT Khoa: Điện – Điện tử
Bộ Môn: Viễn Thông

NHIỆM VỤ LUẬN VĂN TỐT NGHIỆP

HỌ VÀ TÊN: 1. TRẦN HIẾU TRUNG – MSSV: 40602711
2. DƢƠNG MINH TIẾN – MSSV: 40602471
NGÀNH: VIỄN THÔNG LỚP: DD06DV03
1. Đề tài: “LỌC NHIỄU TÍN HIỆU THOẠI DÙNG PHƢƠNG PHÁP EMD”
2. Nhiệm vụ (Yêu cầu về nội dung và số liệu ban đầu):






3. Ngày giao nhiệm vụ luận văn:
4. Ngày hoàn thành nhiệm vụ:
5. Họ và tên người hướng dẫn: Phần hướng dẫn
1.
2.

Nội dung và yêu cầu LVTN đã được thông qua Bộ Môn.
Tp. HCM, ngày … tháng… năm 2011
CHỦ NHIỆM BỘ MÔN NGƢỜI HƢỚNG DẪN CHÍNH








PHẦN DÀNH CHO KHOA, BỘ MÔN:
Người duyệt (chấm sơ bộ):
Đơn vị:
Ngày bảo vệ:
Điểm tổng kết:
Nơi lưu trữ luận văn:


TRƢỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
KHOA ĐIỆN – ĐIỆN TỬ Độc lập – Tự do – Hạnh phúc

Ngày … tháng … năm 2011
PHIẾU CHẤM BẢO VỆ LUẬN VĂN
(Dành cho người hướng dẫn)

1. HỌ VÀ TÊN: TRẦN HIẾU TRUNG -MSSV: 40602711
DƢƠNG MINH TIẾN -MSSV:40602471
NGÀNH: VIỄN THÔNG
2. Đề tài: “LỌC NHIỄU TÍN HIỆU THOẠI DÙNG PHƢƠNG PHÁP EMD”
3. Họ tên người hướng dẫn: PGS. TS. HOÀNG ĐÌNH CHIẾN
4. Tổng quát về bản thuyết minh:
Số trang ……… Số chương ……….
Bảng số liệu ……… Số hình vẽ ……….
Số tài liệu tham khảo ……… Phần mềm tính toán ……….
5. Những ưu điểm chính của LVTN
…………………………………………………………………………………………

…………………………………………………………………………………………
6. Những thiếu sót của LVTN
…………………………………………………………………………………………
…………………………………………………………………………………………
Đề nghị: Được bảo vệ Bổ sung thêm để bảo vệ
Không được bảo vệ
7. Câu hỏi sinh viên trả lời trước Hội Đồng
a. …………………………………………………………………………………
b. …………………………………………………………………………………
c. …………………………………………………………………………………
d. …………………………………………………………………………………
e. …………………………………………………………………………………
8. ĐÁNH GIÁ CHUNG (bằng chữ: GIỎI, KHÁ, TB)…………Điểm: … …………….
Ký tên (ghi rõ họ tên)



TRƢỜNG ĐẠI HỌC BÁCH KHOA CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM
KHOA ĐIỆN – ĐIỆN TỬ Độc lập – Tự do – Hạnh phúc

Ngày … tháng … năm 2011
PHIẾU CHẤM BẢO VỆ LUẬN VĂN
(Dành cho người phản biện)

1. HỌ VÀ TÊN: TRẦN HIẾU TRUNG -MSSV: 40602711
DƢƠNG MINH TIẾN -MSSV:40602471
NGÀNH: VIỄN THÔNG
2. Đề tài: “LỌC NHIỄU TÍN HIỆU THOẠI DÙNG PHƢƠNG PHÁP EMD”
3. Họ tên người hướng dẫn: PGS. TS. HOÀNG ĐÌNH CHIẾN
4. Tổng quát về bản thuyết minh:

Số trang ……… Số chương ……….
Bảng số liệu ……… Số hình vẽ ……….
Số tài liệu tham khảo ……… Phần mềm tính toán ……….
5. Những ưu điểm chính của LVTN
…………………………………………………………………………………………. .
…………………………………………………………………………………………
6. Những thiếu sót của LVTN
…………………………………………………………………………………………
…………………………………………………………………………………………
Đề nghị: Được bảo vệ Bổ sung thêm để bảo vệ
Không được bảo vệ
7. Câu hỏi sinh viên trả lời trước Hội Đồng
a. …………………………………………………………………………………
b. …………………………………………………………………………………
c. …………………………………………………………………………………
d. …………………………………………………………………………………
e. …………………………………………………………………………………
8. ĐÁNH GIÁ CHUNG (bằng chữ: GIỎI, KHÁ, TB)…………Điểm: …………………
Ký tên (ghi rõ họ tên)


ii



LỜI CẢM ƠN


Trước tiên, chúng tôi xin gửi lời cám ơn chân thành đến PGS.TS.
Hoàng Đình Chiến vì đã cho chúng tôi cơ hội được làm việc

trong lĩnh vực xử lý thoại, với những hướng dẫn tận tình và đầy
kinh nghiệm của thầy, cũng như những lời động viên, khuyến
khích tôi trong suốt quá trình làm luận văn. Sự tận tình của thầy
vừa là nguồn động lực vừa tạo cho chúng tôi sự ham thích
nghiên cứu khoa học.Chúng tôi luôn trân trọng những hướng dẫn
và gợi ý rất chuyên môn, sự kiên nhẫn và đặc biệt sự thân thiện
của thầy.
Kế đến, chúng tôi cũng xin được tri ân quý thầy cô khoa Điện-
Điện tử, đặc biệt là Bộ môn Viễn thông đã vung đấp cho chúng
tôi nền tảng kiến thức để có thể thực hiện luận văn này.
Sau nữa, chúng tôi cũng gửi lời cám ơn đến Anh Võ Tuấn Nam
là người trực tiếp chỉ bảo, hướng dẫn tận tình cho chúng tôi khi
chúng tôi gặp khó khăn.Và cũng xin cám ơn hai bạn Hà Hải
Triều và Mai Văn Định, vốn là những người cùng làm về đề tài
xử lý tín hiệu thoại, vì những trao đổi của các bạn là nguồn động
lực cho chúng tôi trong quá trình nghiên cứu.
Cuối cùng, chúng tôi xin cám ơn gia đình và bạn bè đã giúp đỡ
chúng tôi trong suốt thời gian qua.



iii

TÓM TẮT

Nhiễu nền là một trong những vấn đề gây khó khăn nhất trong hệ thống viễn thông và
các hệ thống thoại vì làm suy giảm chất lượng cũng như nội dung của tín hiệu thoại.
Do đó, cần có một phương pháp lọc nhiễu để cải thiện chất lượng của tín hiệu thoại
trong hệ thống. Mục đích của việc lọc nhiễu tín hiệu thoại là cải thiện cảm nhận của
người nghe hoặc nâng cao chất lượng của tín hiệu thoại dùng trong các hệ thống nhận

dạng và tổng hợp tiếng nói ứng dụng trong lĩnh vực robot, thiết bị tự động để có thể
giao tiếp với con người bằng tiếng nói…Trong suốt hai mươi năm gần đây, việc
nghiên cứu và phát triển rộng rãi của hệ thống thông tin số đã mở ra xu hướng nghiên
cứu vềcác phương pháp lọc nhiễu tín hiệu thoại trong lĩnh vực xử lý tín hiệu. Với mục
đích đó, nội dung của luận văn này sẽ trình bày một số phương pháp lọc nhiễu tín hiệu
thoại dựa trên việc áp dụng một số thuật toán lấy ngưỡng trong miền EMD (Empirical
Mode Decomposition - Mô hình thực nghiệm phân rã).
Trong tự nhiên, tín hiệu thoại là phi tuyến(non-linear) và không dừng (non-stationary),
vì vậy mà hiệu quả của việc cải thiện chất lượng tín hiệu thoại phụ thuộc rất lớn vào
phương pháp phân tích.Mặc dù biến đổi Fourier và phân tích Wavelet đã có những
đóng góp rất lớn trong xử lý tín hiệu, nhưng các phương pháp này vẫn gặp phải một số
hạn chế với tín hiệu phi tuyến và không dừng.Gần đây, phương pháp EMD được
Huang [16], [17]đưa ra như một phương pháp phân tích mới mẽ và hiệu quả cho tín
hiệu phi tuyến và không dừng, mở ra một hướng mới trong nghiên cứu việc cải thiện
chất lượng thoại.Về cơ bản, EMD là một phương pháp phân tích dữliệu thích nghi cho
các dạng dữ liệu phức tạp để phân rã chúng thành các thành phần dao động có trung
bình không (zero mean), gọi là Hàm dao động nội tại IMF(Intrinsic mode
function).Những nghiên cứu gần đây phát hiện rằng chúng ta có thể xác định thành
công các thành phần nhiễu từ các IMF của tín hiệu bị can nhiễu. Chính vì lý do này mà
việc cải thiện tín hiệu thoại dựa trên phương pháp EMD ngày càng được chú ý hơn.
Lọc nhiễu tín hiệu thoại sử dụng phương pháp EMD được thực hiện dựa vào thuật toán
lấy ngưỡng.Đây là một thuật toán lọc nhiễu được sử dụng rộng rãi trong rất nhiều các

iv

phương pháp lọc nhiễu.Ý tưởng của thuật toán lấy ngưỡng là xác định một mức
ngưỡng cho từng đoạn rồi trừ vào thành phần tín hiệu được cho là nhiễu.Tuy nhiên,
việc xác định và loại trừ các thành phần nhiễu mà vẫn không làm suy giảm thành phần
thoại ban đầu là một vấn đề không hề dễ dàng. Do đó nhược điểm lớn nhất của loại
thuật toán này là làm suy giảm tín hiệu thoại gốc, đặc biệt là đối với tín hiệu có tỷ số

tín hiệu trên nhiễu (SNR) cao. Để hạn chế sự suy giảm này, người ta áp dụng thuật
toán lấy ngưỡng mềm để áp dụng cho từng khoảng tín hiệu.Các IMF của tín hiệu thoại
bị can nhiễu được lọc nhiễu bằng cách áp dụng giải thuật lấy ngưỡng mềm đối với
từng hệ số của mỗi IMF. Với giải thuật này thì hầu hết các thành phần nhiễu bị loại bỏ
thành công trong khi các thành phần thoại vẫn được bảo toàn.Tuy nhiên trở ngại lớn
nhất trong giải thuật lấy ngưỡng mềm này là làm sao để xác định chính xác mức
ngưỡng tương ứng trong từng IMF.Đó mà vấn đề mà luận văn này đang vấp phải.
Do hệ thống lý thuyết của phương pháp EMD cũng như thuật toán lọc nhiễu trong
miền EMD chưa hoàn chỉnh, vẫn đang trong quá trình nghiên cứu nên luận văn này
trình bày một số phương pháp lấy ngưỡng khác nhau trong miền EMD để xem xét hiệu
quả của từng phương pháp.



v

MỤC LỤC
Nội dung
Trang Phụ bìa i
Lời cảm ơn ii
Tóm tắt iii
Mục lục v
Danh sách các từ viết tắt vii
Danh sách các bảng viii
Danh sách các hình x
Chƣơng 1:TỔNG QUAN 1
1.1Giới thiệu chung 1
1.2 Một số ứng dụng của việc lọc nhiễu tín hiệu thoại 2
1.3 Tính cấp thiết của đề tài nghiên cứu 2
1.4 Các phương pháp lọc nhiễu tín hiệu thoại 3

1.4.1 Phân loại 3
1.4.2 Trừ phổ 4
1.4.3 Lấy ngưỡng Wavelet 6
1.4.4 Lấy ngưỡng DCT 8
1.4.5 Hướng nghiên cứu của đề tài 9
1.5Mục tiêu nghiên cứu 10
1.5.1 Mục tiêu tổng quát 10
1.5.2 Mục tiêu cụ thể 10
1.6 Tính mới và những đóng góp của đề tài 10
1.7Đối tượng và phạm vi nghiên cứu 10
1.8 Phương pháp nghiên cứu 11
1.9 Phát biểu bài toán 11
Chƣơng 2 GIỚI THIỆU EMD 13
2.1 Giới thiệu 13
2.2 Khái niệm cơ bản của EMD 13
2.2.1 Hàm chế độ nội tại IMF 13
2.2.2 Quá trình chọn lọc 15
2.3 Năng lượng nhiễu của các IMF 18

vi

2.4 EMD cho tín hiệu thoại 20
Chƣơng 3 LỌC NHIỄU TRONG MIỀN EMD 22
3.1 Giới thiệu 22
3.2 Lấy ngưỡng EMD dựa trên đặc tính trong khoảng giữa của hai điểm về không 24
3.2.1 Lấy ngưỡng EMD – IT 24
3.2.2 Lấy ngưỡng EMD - SIT 28
3.2.3 Lấy ngưỡng EMD - IIT 32
3.2.4 EMD - CIIT 34
3.3 Lấy ngưỡng EMD - SST 36

3.4 Lấy ngưỡng mềm kết hợp DCT - EMD 40
3.4.1 Lấy ngưỡng mềm DCT ở tầng thứ nhất 42
3.4.2 Lấy ngưỡng mềm EMD ở tầng thứ hai 42
Chƣơng 4 THỰC HIỆN MÔ PHỎNG 45
4.1 Các thông số mô phỏng 45
4.1.1 Khung tín hiệu 45
4.1.2 Phương sai nhiễu của các IMF 46
4.1.3 Vector lấy ngưỡng 46
4.2 Kết quả mô phỏng 47
4.2.1 Các phương pháp lấy ngưỡng trên từng khoảng về không. 47
4.2.2 Phương pháp lấy ngưỡng EMD - SST 51
4.2.3 Phương pháp lấy ngưỡng kết hợp DCT – EMD 52
4.3 Khảo sát các thông số ảnh hưởng đến chất lượng tín hiệu 53
4.3.1 Ảnh hưởng của vector lấy ngưỡng 54
4.3.2. Ảnh hưởng của thông số M1, M2 57
4.3.3. Ảnh hưởng của hệ số lặp k 59
4.3.4. Ảnh hưởng của cách chuyển đổi ngẫu nhiên vị trí các mẫu của IMF đầu tiên trong phương
pháp lặp 61
Chƣơng 5 KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN 63
5.1 Kết luận 63
5.2 Hướng phát triển 65
TÀI LIỆU THAM KHẢO 67


vii

DANH SÁCH CÁC TỪ VIẾT TẮT

CIIT
Clear Iterative Interval- Thresholding

DCT
Discrete Cosine Transform
DFT
Discrete Fourier Transform
DWT
Discrete Wavelet Transform
EMD
Empirical Mode Decomposition
IIT
Iterative Interval- Thresholding
IMF
Intrisic Mode Function
iSNR
Signal to Noise Ratio input
IT
Interval Thresholding
MAD
Median Absolute Deviation
oSNR
Signal to Noise Ratio output
SCAD
Smoothly Clipped Absolute Deviation
SIT
Soft Interval Thresholding
SST
Subframe - Soft Thresholding



viii


DANH SÁCH CÁC BẢNG

Chƣơng 4
Bảng 4.1: So sánh kết quả SNR đầu ra của 3 phương pháp lấy ngưỡng trên từng
khoảng về 0 48
Bảng 4.2: So sánh kết quả SNR đầu ra của phương pháp EMD – CIIT dựa trên 3 thuật
toán lấy ngưỡng là IT, SIT, và SCAD. 50
Bảng 4.3: So sánh kết quả SNR đầu ra của phương pháp lấy ngưỡng EMD – SST và
lấy ngưỡng kết hợp DCT - EMD. 53
Bảng 4.4:Ảnh hưởng của thông số C đối với phương pháp lấy ngưỡng cứng trên từng
khoảngvềkhông (EMD - IT) 54
Bảng 4.5: Ảnh hưởng của thông số C đối với phương pháp lấy ngưỡng cứng trên từng
khoảngvềkhông (EMD – SIT) 54
Bảng 4.6: Ảnh hưởng của thông số C đối với phương pháp lấy ngưỡng EMD – SCAD
55
Bảng 4.7: Ảnh hưởng của thông số λ đối với phương pháp lấy ngưỡng EMD –SST 55
Bảng 4.8: Ảnh hưởng của thông số λđối với phương pháp lấy ngưỡng kết hợp DCT –
EMD 56
Bảng 4.9: Ảnh hưởngcủa M2 đối với phương pháp lấy ngưỡng cứng trên từng
khoảngvềkhông (EMD - IT) 57
Bảng 4.10: Ảnh hưởngcủa M2 đối với phương pháp lấy ngưỡng mềm trên từng
khoảngvề không EMD - SIT) 58
Bảng 4.11: Ảnhhưởngcủa M2 đối với phương pháp lấy ngưỡng mềm SCAD
trêntừngkhoảngvềkhông (EMD - SCAD) 58
Bảng 4.12: Ảnhhưởngthôngsố Kđối với phương pháp lấy ngưỡng cứng 59
Bảng 4.13: Ảnhhưởngthôngsố Kđối với phương pháp lấy ngưỡng mềm 60

ix


Bảng 4.14: Ảnhhưởngthôngsố Kđối với phương pháp lấy ngưỡng mềm SCAD 60
Bảng 4.15: Ảnhhưởngcáchhoánđổimẫuđối với phương pháp lấy ngưỡng cứng 62


x

DANH SÁCH CÁC HÌNH

Chƣơng 2
Hình 2.1: Một loại IMF với số cực trị và số zero crossing bằng nhau, và các biên trên
và biên dưới đối xứng nhau có trung bình bằng 0 14
Hình 2.2: Quá trình chọn lọc 15
Hình 2.3: EMD của tín hiệu thoại bị can nhiễu có SNR là 10dB và 8 IMF đầu tiên
thêm phần dư hằng số. 17
Hình 2.4: Tần số tức thời của các IMF 18
Hình 2.5: Đường cong diễn tả mối quan hệ giữa năng lượng của các IMF tương ứng
với quá trình EMD sử dụng số lần chọn lọc từ 1 đến 15. Đường cong màu đỏ được thể
hiện đề xuất của Flandrin và cộng sự. 19
Hình 2.6: So sánh về năng lượng giữa mô hình các IMF chỉ có nhiễu và IMF thực tế
20

Chƣơng 3
Hình 3.1: Thuật toán lấy ngưỡng dựa vào đặc tính của khoảng giữa hai điểm về 0 a)
trên một IMF; b) trên một đoạn của IMF trước và sau khi lấy ngưỡng. 26
Hình 3.2: Phương pháp EMD – IT trên tín hiệu Dopler: a) Tín hiệu bị can nhiễu có
SNR=5dB; b) tín hiệu được lọc nhiễu so với tín hiệu sạch ban đầu 27
Hình 3.3: Phương pháp EMD – IT trên tín hiệu thoại thực tế: a) Tín hiệu sạch ban đầu;
b) Tín hiệu bị can nhiễu có SNR=5dB; b) Tín hiệu được lọc nhiễu 28
Hình 3.4: Phương pháp EMD – SIT trên tín hiệu Dopler: a) Tín hiệu bị can nhiễu có
SNR=5dB; b) tín hiệu được lọc nhiễu so với tín hiệu sạch ban đầu 29

Hình 3.5: Phương pháp EM – SIT trên tín hiệu thoại thực tế: a) Tín hiệu sạch ban đầu;
b) Tín hiệu bị can nhiễu có SNR=5dB; b) Tín hiệu được lọc nhiễu 29
Hình 3.6: Phương pháp EMD – SCAD trên tín hiệu Dopler: a) Tín hiệu bị can nhiễu có
SNR=5dB; b) tín hiệu được lọc nhiễu so với tín hiệu sạch ban đầu 31

xi

Hình 3.7: Phương pháp EMD –SCAD trên tín hiệu thực tế: a) Tín hiệu sạch ban đầu;
b) Tín hiệu bị can nhiễu có SNR=5dB; b) Tín hiệu được lọc nhiễu. 31
Hình 3.8: Phương pháp EMD – IIT lấy ngưỡng dựa vào EMD – SIT trên tín hiệu
Dopler: a) Tín hiệu bị can nhiễu có SNR=5dB; và tín hiệu được lọc nhiễu so với tín
hiệu sạch ban đầu lặp với b) K=3; c) K=20. 33
Hình 3.9: Phương pháp EMD – IIT lấy ngưỡng dựa vào EMD – SIT trên tín hiệu thoại
thực tế: a) Tín hiệu sạch ban đầu; b) Tín hiệu bị can nhiễu có SNR=5dB; b) Tín hiệu
được lọc nhiễu với K=10. 34
Hình 3.10: Phương pháp EMD - CIIT: a) Tín hiệu bị can nhiễu có SNR=5dB; b) tín
hiệu được lọc nhiễu so với tín hiệu sạch ban đầu lặp với K=15. 35
Hình 3.11: Phương pháp EMD – CIIT lấy ngưỡng dựa vào EMD – SIT trên tín hiệu
thoại thực tế: a) Tín hiệu sạch ban đầu; b) Tín hiệu bị can nhiễu có SNR=5dB; b) Tín
hiệu được lọc nhiễu với K=10. 36
Hình 3.12: Sơ đồ khối của phương pháp lấy ngưỡng EMD – SST 37
Hình 3.13: Phương pháp lấy ngưỡng EMD - SST: a) Tín hiệu sạch ban đầu; b) Tín
hiệu bị can nhiễu có SNR=5dB; b) Tín hiệu được lọc nhiễu. 39
Hình 3.14: Sơ đồ khối của phương pháp lấy ngưỡng mềm EMD – DCT 41
Hình 3.15: Phương pháp kết hợp DCT – EMD với tín hiệu thoại thực tế: a) Tín hiệu
sạch; b) Tín hiệu bị can nhiễu; Tín hiệu được lọc nhiễu bằng phương pháp: c) DCT; d)
DCT EMD 43

Chƣơng 4
Hình 4.1: Kết quả lọc nhiễu trên từng khoảng về không: a) tín hiệu sạch; b) tín hiệu bị

can nhiễu; Tín hiệu sau khi lọc nhiễu bằng phương pháp: c) EMD - IT; d) EMD – SIT;
e) EMD – SCAD 47
Hình 4.2: Kết quả lọc nhiễu bằng phương pháp EMD – CIIT dựa trên thuật toán lấy
ngưỡng EMD - IT: a) tín hiệu sạch; b) tín hiệu bị can nhiễu có SNR= 0dB; Tín hiệu
sau khi lọc nhiễu dựa trên thuật toán lấy ngưỡng: c) K=1; d) K=10. 49
Hình 4.3: Kết quả lọc nhiễu bằng phương pháp EMD – CIIT dựa trên thuật toán lấy
ngưỡng EMD - SIT: a) tín hiệu sạch; b) tín hiệu bị can nhiễu có SNR= 0dB; Tín hiệu
sau khi lọc nhiễu dựa trên thuật toán lấy ngưỡng: c) K=1; d) K=10. 49

xii

Hình 4.4: Kết quả lọc nhiễu bằng phương pháp EMD – CIIT dựa trên thuật toán lấy
ngưỡng EMD - SCAD: a) tín hiệu sạch; b) tín hiệu bị can nhiễu có SNR= 0dB; Tín
hiệu sau khi lọc nhiễu dựa trên thuật toán lấy ngưỡng: c) K=1; d) K=10 50
Hình 4.5: Kết quả lọc nhiễu bằng phương pháp lấy ngưỡng EMD - SST: a) tín hiệu
sạch; b) tín hiệu bị can nhiễu có SNR=0dB (I) và SNR=10dB (II); Tín hiệu sau khi lọc
nhiễu. 51
Hình 4.6: Kết quả lọc nhiễu bằng phương pháp lấy ngưỡng kết hợp DCT - EMD: a) tín
hiệu sạch; b) tín hiệu bị can nhiễu có SNR=0dB (I) và SNR=10dB (II); Tín hiệu sau
khi lọc nhiễu. 52
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 1

Chƣơng 1
TỔNG QUAN

1.1 Giới thiệu chung
Trong nhiều hệ thống, đa phần tín hiệu thoại đều bị tác động rất lớn từ các nguồn can
nhiễu. Những nguồn can nhiễu này làm suy giảm chất lượng cũng như nội dung của

tín hiệu thoại gốc, do đó làm suy giảm thậm chí là mất đi khả năng thực thi các ứng
dụng của chúng trong hệ thống. Các nguồn can nhiễu này có thể là nhiễu băng rộng
với hình thức nhiễu trắng hoặc nhiễu màu, hoặc các tín hiệu như tiếng vo ve, tiếng ồn
trong môi trường đông người, tiếng động cơ, tiếng mưa… hay một dạng của nhiễu
fading. Một tín hiệu thoại có thể bị tác độngđồng thời một hoặc nhiều nguồn can nhiễu
khác nhau. Trong đó, dạng nhiễu phổ biến nhất và khó loại trừ nhất là nhiễu trắng.Đó
là lý do mà trong luận văn này chúng tôi tập trung vào loại nhiễu này.
Như đã nói, sự ảnh hưởng của nhiễu nền lên tín hiệu thoại làm suy giảm chất lượng
cũng như tính khả thi của hệ thống thoại.Do vậy mà việc lọc nhiễu được đặt ra là cần
thiết để cải thiện chất lượng tín hiệu thoại. Việc cải thiện chất lượng thoại phải giúp
nâng cao chất lượng thính giác và bảo toàn nội dung của tín hiệu thoại mà thiết bị hay
người nghe có thể hiểu được trong môi trường nhiễu, chủ yếu thông qua các giải thuật
lọc nhiễu. Các loại giải thuật như vậy có thể được ứng dụng cho các hệ thống thông tin
di động, hệ thống nhận dạng và tổng hợp tiếng nói ứng dụng trong lĩnh vực robot, thiết
bị tự động để có thể giao tiếp với con người bằng tiếng nói…
Đặc trưng của một hệ thống được đánh giá qua hai tiêu chí là chất lượng và tính hiểu
được (nội dung) của thông tin.Chất lượng của tín hiệu thoại sau khi cải thiện liên quan
tới độ trong của tín hiệu, mức độ dư nhiễu của tín hiệu… Hầu hết các phương pháp cải
thiện chất lượng thoại đều nâng cao được chất lượng của tín hiệu tuy nhiên lại làm
giảm đi tính hiểu được của nó, nghĩa là mức độ hay số từ mà người nghe nhận ra được
khi nghe.Thậm chí chỉ bằng cách lắng nghe kỹ hơn người nghe có thể nhận được nhiều
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 2

thông tin từ tín hiệu bị can nhiễu hơn là tín hiệu được cải thiện. Chính vì vậy, chúng ta
cần tìm ra thuật toán đảm bảo đầy đủ hai đặc trưng này để nâng cao chất lượng của hệ
thống thông tin thoại.
1.2 Một số ứng dụng của việc lọc nhiễu tín hiệu thoại
Trong kỹ thuật thông tin ngày nay, có nhiều lĩnh vực mà cải thiện chất lượng thoại

được sử dụng để nâng cao chất lượng của hệ thống
Hệ thống nhận và tổng hợp tiếng nói: hệ thống làm giảm ảnh hưởng của nhiễu
nền cũng như các nguồn can nhiễu. Hệ thống áp dụng trong việc giao tiếp giữa
người và máy, hệ thống lái xe tự động Đây là lĩnh vực sẽ phát triển mạnh mẽ
và phổ biến trong tương lai, khi đó, giữa người và máy móc, robot sẽ giao tiếp
trực tiếp bằng tiếng nói.
Viễn thông: việc cải thiện chất lượng thoại tập trung vào việc loại bỏ các thành
phần nhiễu nền trong hệ thống. Ngoài ra, hệ thống viễn thông còn có một vấn
đề khác nằm ở nhiễu kênh. Bằng cách cải thiện chất lượng thoại trước khi đưa
nó vào kênh truyền, hệ thống có thể giảm được ảnh hưởng của nhiễu kênh.
Các hệ thống trợ thính số: Người nghe thường khó hiểu được thông tin thoại
trong môi trường nhiễu lớn như ngoài đường, trong nhà máy, trên tàu thuyền…
Do đó, hệ thống này là phần rất quan trọng để nâng cao sự cảm nhận thông tin
thoại trong môi trường nhiễu cho người nghe.
1.3 Tính cấp thiết của đề tài nghiên cứu
Như đã nói ở trên, yêu cầu xây dựng một phương pháp lọc nhiễu mạnh mẽ, thích hợp
cho tín hiệu phi tuyến và không dừng như tín hiệu thoại đang ngày càng trở nên cấp
thiết.Cho đến nay, có rất nhiều phương pháp được dùng để cải thiện chất lượng tín
hiệu như các phương pháp lấy ngưỡng trong miền Fourier, Wavelet, và biến đổi cosine
rời rạc -DCT (Discrete Cosine Transform).Mặc dù các phương pháp này đã có những
đóng góp rất lớn trong xử lý tín hiệu, nhưng chúng vẫn gặp phải một số hạn chế với tín
hiệu phi tuyến và không dừng như tín hiệu thoại.Gần đây, phương pháp lọc nhiễu dựa
trên thuật toán lấy ngưỡng trong miền EMD được đánh giá như là một phương pháp
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 3

phân tích mới và mạnh mẽ cho tín hiệu phi tuyến và không dừng, mở ra một hướng
mới trong nghiên cứu lĩnh vực cải thiện chất lượng thoại.
Về cơ bản, EMD có ưu điểm là thích nghi hoàn toàn với dữ liệu để phân tích chúng

thành các thành phần dao động có trung bình không (zero mean), gọi là Hàm dao động
nội tại (IMF - Intrinsic mode function).Những nghiên cứu gần đây phát hiện rằng
chúng ta có thể xác định thành công các thành phần nhiễu từ các IMF của tín hiễu bị
can nhiễu với phương pháp EMD. Cụ thể với trường hợp nhiễu trắng, các thành phần
nhiễu thường chỉ tập trung ở 3 IMF đầu tiên.Chính vì lý do này mà việc lọc nhiễu dựa
trên phương pháp lấy ngưỡng trong miền EMD ngày càng được nghiên cứu rộng rãi
hơn.
1.4 Các phƣơng pháp lọc nhiễu tín hiệu thoại
1.4.1 Phân loại
Cho tới nay, có rất nhiều phương pháp được đưa ra cho cải thiện chất lượng thoại.Các
thuật toán được đưa ra có thể phân thành 2 lớp chính là các phương pháp có tham số
(parametric) và không có tham số (non-parametric).
Phương pháp có tham số giả định một mô hình cho quá trình tạo ra tín hiệu. Mô
hình này mô tả các cấu trúc được tiên đoán trước và các mẫu có thể quan sát
được trong quá trình hình thành tín hiệu. Việc giảm nhiễu được thực hiện phụ
thuộc vào thông tin theo cách diễn dịch này. Do việc lọc nhiễu dựa trên mô hình
tham số nên việc lựa chọn mô hình là quan trọng nhất trong những thuật toán
này.
Phương pháp không có tham số thì chỉ cần ước lượng nhiễu, thông thường là
phương sai nhiễu. Phổ nhiễu này có thể được ước lượng từ khoảng ngừng mà
người nói im lặng (đơn kênh) hoặc một nguồn tham chiếu (đa kênh).
Tuy nhiên, việc phân loại thành lọc nhiễu đơn kênh và lọc nhiễu đa kênh lại được sử
dụng phổ biến hơn.Phân biệt cơ bản giữa lọc nhiễu thoại đơn kênh và đa kênh là dựa
trên số lượng kênh và loại tín hiệu có thể quan sát được.
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 4

Lọc nhiễu đơn kênh chỉ dùng một nguồn âm (thanh) và do đó chỉ có một nguồn
bị can nhiễu để đưa ra các thông tin phổ. Phổ nhiễu này phải được ước lượng từ

khoảng ngừng và nhiễu này được xem như ổn định và không gián đoạn. Điều
này làm cho sự cải thiện chất lượng thoại đơn kênh gặp nhiều thách thức. Đó là
lý do tại sao chất lượng của kỹ thuật đơn kênh bị hạn chế.
Lọc nhiễu đa kênh dùng đồng thời nhiều nguồn âm hoạt động trong môi trường,
dẫn tới có nhiều nguồn bị can nhiễu. Nhiều nguồn bị can nhiễu này đưa ra ưu
điểm của việc đưa vào thông tin cả miền không gian mà miền phổ. Tuy nhiên,
vì nhiều nguồn âm (thanh) sẽ tác động về giá thành.
Trong luận văn này, chúng tôi chỉ trình bày các phương pháp lọc nhiễu đơn kênh và
không có tham số.Do đó, phần tiếp theo chúng tôi xin giới thiệu tổng quát về một số
phương pháp lọc nhiễu trong nhóm này.
1.4.2 Trừ phổ
Trừ phổ là một trong những phương pháp cổ điển nhất và cũng là kỷ thuật phổ biến
nhất được đưa ra nhầm giảm thiểu ảnh hưởng của nhiễu nền.Kỹ thuật trừ phổ sớm nhất
được đưa ra vào năm 1974 bởi ông Weiss.Như đã nói ở trên, trừ phổ là một phương
pháp không có tham số nên chỉ đòi hỏi một thuật toán ước lượng về phổ nhiễu.Trong
trường hợp đơn kênh, sự ước lượng này được thực hiện trong các khoảng thời gian mà
người nói im lặng, được xem như các khoảng ngừng. Ý tưởng chính của phương pháp
này là ước lượng phổ của tín hiệu nhiễu và loại trừ nó khỏi tín hiệu bị can nhiễu để thu
được tín hiệu sạch. Do phổ nhiễu được ước lượng từ các khoảng ngừng và được sử
dụng cho toàn bộ dữ liệu nên kỹ thuật trừ phổ chỉ thích hợp với các nguồn nhiễu ổn
định hoặc thay đổi rất chậm để sự thay đổi trong phổ công suất nhiễu được cập nhật.
Giả sử rằng tín hiệu thoại sạch bị can nhiễu bởi nguồn nhiễu để tạo ra một
nguồn bị can nhiễu:
(1.1)
Dùng biến đổi Fourier để thu được:
(1.2)
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 5


Nhân hai vế cho liên hiệp phức của chúng ta được:
(1.3)
Trong đó là sai pha giữa tín hiệu thoại và nhiễu
(1.4)
Lấy giá trị kỳ vọng của hai vế ta được:

(1.5)
Công thức trên cần đủ hai giả thuyết:
1. Giá trị của phổ biên độ của nhiễu và thoại là độc lập với nhau.
2. Pha của nhiễu và thoại là độc lập với nhau và độc lập với biên độ của chúng.
Có khá nhiều phương pháp dựa trên lý thuyết trừ phổ, chúng có thể được chia thành 2
lớp chính được trình bày sau đây.
1.4.2.1 Trừ phổ công suất
Với phương pháp trừ phổ công suất, chúng ta giả sử rằng trong công thức
(1.5) bằng 0, ta sẽ có:
(1.6)
Mật độ phổ công suất được ước lượng từ khoảng lặng của tiếng nói và giả sử rằng sự
biến thiên mật độ phổ nhiễu nằm trong giới hạn cho phép, nó sẽ được trừ ra khỏi mật
độ phổ tín hiệu thoại bị can nhiễu để thu được tín hiệu thoại được cải thiện
(1.7)
1.4.2.2 Trừ phổ biên độ
Với phương pháp trừ phổ biên độ, giả sử rằng , do đó:
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 6



Suy ra:
(1.8)

Mật độ phổ biên độ nhiễu được lấy trung bình trong suốt khoảng lặng của tiếng nói và
với giả sử rằng nhiễu là cố định, thì mật độ phổ biên độ của tín hiệu thoại sẽ được ước
lượng bằng cách trừ đi mật độ phổ trung bình của nhiễu nền từ mật độ phổ biên độ của
tín hiệu bị can nhiễu.
(1.9)
1.4.3 Lấy ngƣỡng Wavelet
Biến đổi wavelet được sử dụng rộng rãi trong nhiều lĩnh vực xử lý tín hiệu.Do những
ưu điểm của nó trong việc sử dụng các cửa sổ thời gian có thể thay đổi kích thước cho
mỗi băng tần khác nhau, biến đổi Wavelet trở thành một công cụ mạnh mẽ cho dạng
tín hiệu không dừng như tín hiệu thoại. Hơn nữa, trong trường hợp đơn kênh, nhìn
chung, việc sử dụng quá trình xử lý băng con (sub-band) cũng đạt kết quả chất lượng
tốt hơn. Do đó, phép biến đổi wavelet có thể cung cấp một mô hình xấp xỉ tín hiệu
thoại cho việc lọc nhiễu.
Với tín hiệu thoại bị can nhiễu, mức năng lượng của thoại sạch thường tập trung ở một
wavelet có kích thước (cửa sổ) nhỏ. Mặc khác, năng lượng nhiễu lại trải khắp một
lượng lớn các hệ số.Đó là lý do tại sao các hệ số của khung có kích thước nhỏ được
đem so sánh một cách tương đối với các hệ số của khung khác. Vì vậy, bằng cách xác
định mức ngưỡng và gán các hệ số nhỏ hơn về 0, chúng ta có thể lọc nhiễu gần như tối
ưu trong khi vẫn duy trì được thông tin quan trọng của tín hiệu thoại.
Giả sử rằng tín hiệu thoại sạch bị can nhiễu bởi nhiễu trắng có phương sai
giống như công thức (1.1). Bằng cách áp dụng phân tích Wavelet rời rạc, chúng ta
có được:
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 7

(1.10)
Trong đó biểu diễn phép biến đổi wavelet.Các hệ số wavelet của tín hiệu bị can
nhiễu được lấy ngưỡng để thu được tín hiệu sạch ban đầu. Việc lấy ngưỡng có thể
được thực hiện bằng nhiều cách và có nhiều kỹ thuật khác nhau được đưa ra để đáp

ứng mục đích này.Tuy nhiên, hai thuật toán phổ biến nhất là lấy ngưỡng cứng và lấy
ngưỡng mềm.
1.4.3.1 Lấy ngưỡng cứng
Xét là hệ số của khung wavelet thu được từ tín hiệu bị can nhiễu và là mức
ngưỡng của thuật toán lọc nhiễu. Thuật toán lấy ngưỡng cứng gán bất kỳ hệ số nào có
giá trị tuyệt đối nhỏ hơn hoặc bằng mức ngưỡng về 0:
(1.11)
Trong đó là hệ số đã được lấy ngưỡng.Giá trị của phụ thuộc vào độ lệch chuẩn
được ước lượng từ tín hiệu nhiễu và có thể thay đổi phụ thuộc vào các thuật toán được
đưa ra.Theo Donoho [3], [4], giá trị của được đưa ra như sau:
(1.12)
Với là kích thước của khung wavelet.
1.4.3.2 Lấy ngưỡng mềm
Thuật toán lấy ngưỡng mềm gán các hệ số có giá trị tuyệt đối nhỏ hơn hoặc bằng mức
ngưỡng về 0, và các hệ số lớn hơn mức ngưỡng bị trừ đi giá trị ngưỡng.
(1.13)
Thuật toán lấy ngưỡng mềm này được sử dụng rộng rãi và cũng thích hợp cho phương
pháp trừ phổ, và phân tích Fourier.Có thể thấy rằng, thuật toán lấy ngưỡng mềm cóthể
loại bỏ các thành phần nhiễu tốt hơn thuật toán lấy ngưỡng cứng.Tuy nhiên thuật toán
này cũng làm suy hao thành phần tín hiệu cao hơn.
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 8

1.4.4 Lấy ngƣỡng DCT
Trong hai thập kỷ gần đây, phương pháp biến đổi cosine rời rạc (DCT) đang nổi lên
như một phương pháp phân tích phổ biến trong nhiều hệ thống xử lý ảnh, âm thanh và
cả video.Về bản chất DCT là phép biến đổi Fourier rời rạc (DFT) nhưng chỉ sử dụng
các số thực.
Giả sử rằng tín hiệu thoại sạch bị can nhiễu bởi nhiễu trắng để tạo ra tín

hiệu với , giống như công thức (1.1). Bằng cách áp dụng
phép biến đổi DCT, chúng ta có được:

Với và
(1.15)
Cũng như wavelet, phép biến đổi DCT cũng dựa vào hai phương pháp lấy ngưỡng
chính là lấy ngưỡng cứng và lấy ngưỡng mềm.
1.4.4.1Lấy ngưỡng cứng
Thuật toán lấy ngưỡng trong miền DCT được thực hiên tương tự như trong
wavelet.Thuật toán này cũng gán các hệ số DCT nhỏ hơn mức ngưỡng về không theo
công thức (1.11) với có thể thay đổi tùy theo thuật toán đề xuất.
1.4.4.2 Lấy ngưỡng mềm
Thuật toán lấy ngưỡng mềm tương tự như công thức (1.13).Tuy nhiên, trong phần này
chúng tôi sẽ trình bày một giải thuật khác.Thuật toán này dựa vào việc phân tín hiệu
thành các đoạn trong khoảng thời gian ngắn và áp dụng phép biến đổi DCT trên từng
khung thay vì trên toàn tín hiệu.Các hệ số DCT của mỗi khung được phân thành 8
khung con, mỗi khung gồm có L hệ số DCT. Để xác lấy ngưỡng thích hợp, từng khung
con được phân thành khung có tín hiệu trội hoặc có nhiễu trội phụ thuộc vào mật độ
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 9

năng lượng thoại và nhiễu.Nếu một khung thỏa điều kiện (1.16) thì khunng đó được
gọi là khung có tín hiệu trội và ngược lại gọi là khung có nhiễu trội.

Với L là số hệ số DCT trong một khung tần số, là hệ số DCT thứ Ktrong khung
con, là phương sai nhiễu.
Khi khung tần số được phân loại, việc lấy ngưỡng sẽ được áp dụng khác nhau.Ở đây,
khung có nhiễu trội được lấy ngưỡng theovector tuyến tính thay cho giá trị hằng số để
hạn chế mất mác thông tin thoại trong khung. Còn với các khung có tín hiệu trội, việc

lấy ngưỡng có thể gây tác động ngược.Vì vậy mà đối với khung tín hiệu trội này tốt
nhất là giữ nguyên, không lấy ngưỡng.
Trong trường hợp khung có nhiễu trội, đầu tiên các giá trị tuyệt đối của các hệ số DCT
được sắp xếp theo thứ tự tăng dần và áp dụng lấy ngưỡng tuyến tính như sau:
(1.17)
Trong đó, là hàm ngưỡng tuyến tính và là hệ số sắp xếp . Giá trị ước lượng
của có thể được ước lượng như sau: [5], [6]

Với , và là giá trị hằng số được ước lượng cho phù hợp với mức SNR của
tín hiệu đầu vào.
1.4.5 Hƣớng nghiên cứu của đề tài
Như đã nói ở trên, mặc dù phương pháp lọc nhiễu đa kênh cho hiệu quả cao hơn lọc
nhiễu đơn kênh, nhưng trong thực tế nó lại ít được sử dụng hơn vì các nguồn thoại đa
kênh đòi hỏi chi phí cao và không phải luôn luôn có thể lắp đặt được ở mọi môi
trường. Do đó, luận văn này đi theo hướng giải quyết bài toán lọc nhiễu thoại đơn
Chương 1: Tổng quan GVHD: PGS. TS. Hoàng Đình Chiến
SVTH: Trần Hiếu Trung
Dương Minh Tiến 10

kênh. Bên cạnh đó, EMD là một phương pháp phân tích dữ liệu còn khá mới; với mục
đích đơn giản, luận văn chọn phương pháp không tham số làm cơ sở.Tóm lại, luận văn
này giải quyết bài toán lọc nhiễu thoại đơn kênh và không tham số bằng thuật toán lấy
ngưỡng trong miền EMD.
1.5 Mục tiêu nghiên cứu
1.5.1 Mục tiêu tổng quát
Mục đích của đề tài Lọc nhiễu tín hiệu thoại dùng phương pháp EMDlà đề xuất thuật
toán lấy ngưỡnghiệu quả trong miền EMDđối với tín hiệu thoại bị can nhiễu và qua đó
chứng minh khả năng mạnh mẽ của EMD trong việc phân tích các tín hiệu phức tạp
như thoại. Tín hiệu quan sát được là một kênh thoại bị can nhiễu bởi nguồn nhiễu có
phân bố Gausse, tương tác cộng và không tương quan với thoại, trong đó tập trung

vào trường hợp nhiễu trắng. Trên cơ sở nghiên cứu thuật toán lấy ngưỡng trong miền
EMD và mô phỏng, người thực hiện đề xuất một số giải pháp để cải thiệnchất lượng
thoại với nguồn thoại có SNR thay đổi trong một khoảng rộng.
1.5.2 Mục tiêu cụ thể
- Góp phần hệ thống hóa cơ sở lý thuyết và thực tiễn về ứng dụng EMD vào lĩnh vực
lọc nhiễu thoại.
- Đề xuất một số phương pháp lọc nhiễu thoại để tìm ra phương pháp có hiệu quả cao.
- Đánh giá khả năng ứng dụng thuật toán nghiên cứu vào thực tiễn.
1.6 Tính mới và những đóng góp của đề tài
Việc lọc nhiễu thoại trong miền EMD hiện vẫn còn là giải pháp mới, đang trong quá
trình nghiên cứu và chưa thật sự hoàn thiện về hệ thống lý thuyết cũng như giải pháp
thực hiện.Với đề tài này, chúng tôi hy vọng đề xuất được một giải pháp có hiệu quả
cao, bền vững và ứng dụng được trong thực tiễn.
1.7 Đối tƣợng và phạm vi nghiên cứu

×