Tải bản đầy đủ (.pdf) (54 trang)

Nghiên cứu kĩ thuật mã hoá tiếng nói trong hệ thống di động gsm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.43 MB, 54 trang )

TRƢỜNG ĐẠI HỌC VINH

621.382

KHOA ĐIỆN TỬ VIỄN THÔNG

ĐỒ ÁN

TỐT NGHIỆP ĐẠI HỌC
Đề tài:

NGHIÊN CỨU KĨ THUẬT MÃ HỐ TIẾNG NĨI
TRONG HỆ THỐNG DI ĐỘNG GSM

Giáo viên hướng dẫn :

ThS. Lê Văn Chƣơng

Sinh viên thực hiện

:

Nguyễn Văn Đồng

Lớp

:

50K2 - ĐTVT

Mã số sinh viên



:

0951080313

Khóa học

:

2009 - 2014

Nghệ An - 01/2014


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC VINH
---------------------------

BẢN NHẬN XÉT ĐỒ ÁN TỐT NGHIỆP
Họ và tên sinh viên:

Nguyễn Văn Đồng

Mã số sinh viên: 0951080313

Ngành:

Điện tử - Viễn thơng

Khố: 50


Giảng viên hƣớng dẫn: ThS. Lê Văn Chƣơng
Cán bộ phản biện:

ThS. Đặng Thái Sơn

1. Nội dung thiết kế tốt nghiệp:
...............................................................................................................................
................................................................................................................ ...............
............................................................................................................................. ..
.................................................................................................................. .............
............................................................................................................................. ..
.................................................................................................................... ...........
............................................................................................................................. ..
...................................................................................................................... .........
2. Nhận xét của cán bộ phản biện:
............................................................................................................................. ..
............................................................................................................................. ..
...............................................................................................................................
............................................................................................................................. ..
...............................................................................................................................
............................................................................................................................. ..
...............................................................................................................................
............................................................................................................................. ..
...............................................................................................................................
............................................................................................................................. ..
Ngày

tháng


năm 2014

Cán bộ phản biện

2


MỤC LỤC
Trang
LỜI NÓI ĐẦU ...................................................................................................................... 4
TÓM TẮT ĐỒ ÁN ............................................................................................................... 5
DANH MỤC CÁC BẢNG BIỂU ....................................................................................... 6
DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ .............................................................................. 7
DANH MỤC CÁC CHỮ VIẾT TẮT ................................................................................. 7
CHƢƠNG 1. XỬ LÝ TÍN HIỆU TRONG THƠNG TIN DI ĐỘNG ............................. 8
1.1 Số hoá và mã hoá tiếng nói ............................................................................................ 8
1.2 Mã hố kênh.................................................................................................................... 9
1.3 Tổ chức cụm ................................................................................................................. 10
1.4 Ghép xen ....................................................................................................................... 11
1.5 Mật mã hoá ................................................................................................................... 13
1.6 Điều chế ........................................................................................................................ 13
CHƢƠNG 2. CÁC PHƢƠNG PHÁP MÃ HĨA TIẾNG NĨI ....................................... 15
2.1 Q trình tạo tiếng nói .................................................................................................. 15
2.1.1 Chuỗi thoại ............................................................................................................ 15
2.1.2 Phát âm .................................................................................................................. 16
2.1.2.1 Kích thích ...................................................................................................... 17
2.1.2.2 Vocal tract ..................................................................................................... 18
2.1.3 Dạng bộ lọc nguồn ................................................................................................ 20
2.1.3.1 Vocal tract ..................................................................................................... 20
2.1.3.2 Kích thích ...................................................................................................... 20

2.1.3.3 Dạng bộ lọc nguồn tổng quát ....................................................................... 21
2.2 Các phƣơng pháp cơ sở mã hố tiếng nói ................................................................... 22
2.2.1 Phƣơng pháp mã hố tiếng nói dạng sóng ........................................................... 23
2.2.1.1 PCM (Pulse Code Modulation) ................................................................... 23
2.2.1.2 DM (Delta Modulation) ................................................................................ 24
2.2.1.3 DPCM (Differential PCM) ........................................................................... 25
2.2.1.4 ADPCM (Adaptive Differential PCM)-G.726 ............................................ 25
2.2.2 Phƣơng pháp mã hóa tiếng nói kiểu Vocoder ..................................................... 26

3


2.2.3 Phƣơng pháp mã hóa lai (Hybrid)........................................................................ 27
2.2.3.1 Mã hố phân tích AbS .................................................................................. 28
a, Dự đốn ngắn hạn STP (Short Term Predictor) .............................................. 29
b, Dự đoán dài hạn LTP (Long Term Predictor)................................................. 34
2.3 ng dụng các phƣơng pháp cơ sở mã hóa âm thanh trong truyền thơng ................. 35
2.3.1 Các yêu cầu đối với một bộ mã hóa âm thoại ..................................................... 35
2.3.2 Các tham số liên quan đến chất lƣợng thoại ....................................................... 36
2.3.3 Các phƣơng pháp đánh giá chất lƣợng thoại cơ bản .......................................... 37
2.3.3.1 Phƣơng pháp đánh giá ch quan (MOS) ..................................................... 37
2.3.3.2 Các phƣơng pháp đánh giá khách quan ...................................................... 37
CHƢƠNG 3. MÃ HOÁ VÀ GIẢI MÃ TIẾNG NĨI TRONG HỆ THỐNG
THƠNG TIN DI ĐỘNG GSM......................................................................................... 39
3.1 Các bộ mã hố tiếng nói dự tuyển cho hệ thống GSM .............................................. 39
3.1.1 SBC- APCM ......................................................................................................... 39
3.1.2 SBC-ADPCM ....................................................................................................... 39
3.1.3 MPE-LTP .............................................................................................................. 39
3.1.4 RPE-LTP ............................................................................................................... 40
3.2 Bộ mã hoá tiếng nói RPE-LTP.................................................................................... 41

3.2.1 Tiền xử lý .............................................................................................................. 41
3.2.2 Lọc phân tích STP ................................................................................................ 42
3.2.3 Lọc phân tích LTP ................................................................................................ 43
3.2.4 Tính tốn RPE ...................................................................................................... 45
3.3 Bộ giải mã tiếng nói RPE-LTP.................................................................................... 47
3.3.1 Giải mã RPE ......................................................................................................... 51
3.3.2 Lọc tổng hợp LTP ................................................................................................ 51
3.3.3 Lọc tổng hợp STP................................................................................................. 51
3.3.4 Hậu xử lý............................................................................................................... 51
KẾT LUẬN ........................................................................................................................ 51
TÀI LIỆU THAM KHẢO ......................................................................................... 52

4


LỜI NĨI ĐẦU
Ngày nay, các phƣơng tiện truyền thơng phát triển và số lƣợng ngƣời sử dụng các
phƣơng tiện liên lạc ngày càng tang lên, vấn đề mã hóa tiếng nói đƣợc nghiên cứu và
ứng dụng càng rộng rãi trong các cuộc gọi điện thoại truyền thống, gọi điện thoại qua
mạng di động, qua Internet hay qua vệ tinh, ... Mạc dù với sự phát triển c a công nghệ
truyền thông qua cáp quang đã làm cho băng thông không còn là vấn đề lớn trong các
cuộc goi điện truyền thống. Tuy nhiên, bang thông trong các cuộc gọi đƣờng dài, các
cuộc gọi quốc tế, các cuộc gọi qua vệ tinh hay các cuộc gọi di động thì cần phải duy trì
bang thơng ở một mức nhất định. Chính vì thế việc mã hóa tiếng nói là rất cần thiết,
giúp giảm thiểu số lƣợng tín hiệu cần truyền đi trên đƣờng truyền nhƣng vẫn đảm bảo
chất lƣợng cuộc gọi.
Xuất phát từ những yêu cầu ở trên, với mục đ ch t m hiểu s u hơn về kĩ thuật mã
hoá tiếng nói, em đã quyết định thực hiện đề tài “Nghiên cứu kĩ thuật mã hố tiếng nói
trong hệ thống di động GSM”.
Nội dung đề tài bao gồm 3 chƣơng ch nh:

- Xử lý tín hiệu trong thơng tin di động.
- Các phƣơng pháp cơ sở mã hố tiếng nói.
- Mã hố và giải mã tiếng nói trong hệ thống thông tin di động GSM.
Em xin chân thành cảm ơn ThS. Lê Văn Chƣơng đã hƣớng dẫn, tận tình giúp
đỡ em hoàn thành đề tài này. Nhƣng do thời gian và kinh nghiệm nghiên cứu còn
hạn chế nên đồ án thực hiện cịn nhiều thiếu sót. Em rất mong sự nhận xét, đánh giá,
đóng góp từ thầy cơ và bạn bè để nội dung đồ án đƣợc hoàn thiện hơn.

4


TĨM TẮT ĐỒ ÁN
Trong thơng tin di động thì mã hóa tiếng nói để giảm thiểu tín hiệu cần truyền
đi trên đƣờng truyền nhƣng vẫn đảm bảo chất lƣợng cuộc gọi là một yếu tố cần thiết
và quan trọng. Đồ án này giới thiệu tổng quan về xử lý tín hiệu trong thông tin di
động; các phƣơng pháp cơ sở mã hóa tiếng nói và các bộ mã hóa, giải mã tiếng nói
trong hệ thống GSM. Dựa vào điểm số ý kiến trung bình MOS thì bộ mã hóa tiếng
nói RPE-LTP cho kết quả tốt nhất. Điểm số này dựa trên các tiêu chí: chất lƣợng
giọng nói, khả năng kháng tạp nhiễu, các trễ xử lý và độ tính tốn phức tạp c a
chúng. RPE-LTP là bộ mã hóa dựa trên nền tảng k ch th ch xung đều RPE và dự
đốn dài hạn LTP. Nó đã thể hiện đặc t nh vƣợt trội với MOS là 4/5 lớn hơn rất
nhiều so với các bộ mã hóa cịn lại. Vậy nên đồ án này đã tr nh bày chi tiết về bộ mã
hóa tiếng nói RPE-LTP.

ABSTRACT

In mobile communication, the voice encoder to minimize the signal
transmitted on transmission while ensuring call quality is an important factor and
important. This thesis introduces an overview of signal processing in mobile
communication, these base method voice encoder and the ministries encoder,

decode voice in the system GSM. Based on the average scores opinions MOS, the
RPE-LTP voice encoder for best results. This score is based on the criteria: voice
quality, possibility noise resistance, processing delay and computational complexity
of our. RPE-LTP encoder based on regular pulse excitation RPE and long term
prediction LTP. It has demonstrated superior properties with MOS is 4/5, much
greater than the other encoder. So this thesis has presented details of the voice
encoder RPE-LTP.

5


DANH MỤC CÁC BẢNG BIỂU
Bảng 3.1 So sánh điểm số ý kiến trung bình MOS giữa các Codec ......................... 33
Bảng 3.2 Lƣợng tử các hệ số LARc(i) .............................................................................. 36
Bảng 3.3 Nội suy các tham số LAR (J=khối hiện tại) ..................................................... 36
Bảng 3.4 Bảng lƣợng tử cho tham số khuếch đại LTP .................................................... 38
Bảng 3.5 Vị trí bit các tham số ng ra c a bộ mã hố tiếng nói RPE-LTP trong khung
thoại 20ms ........................................................................................................................... 42

DANH MỤC CÁC HÌNH VẼ ĐỒ THỊ
Hình 1.1 Q trình biến đổi tín hiệu trong GSM ................................................................ 1
Hình 1.2 Biến đổi A/D ......................................................................................................... 2
Hình 1.3 Mã hố thoại .......................................................................................................... 2
Hình 1.4 Mã hố kênh .......................................................................................................... 3
Hình 1.5 Ghép xen tín hiệu tiếng nói .................................................................................. 5
Hình 2.1 Quá trình tạo thoại ................................................................................................ 8
Hình 2.2 Phát m c a vocal tract ....................................................................................... 10
Hình 2.3 Dạng sóng tiếng nói c a đoạn thoại (âm hữu thanh) ngắn ............................... 11
Hình 2.4 Log cƣờng độ phổ c a một đoạn thoại (âm hữu thanh) ngắn .......................... 12
Hình 2.5 Dạng bộ lọc nguồn tổng qt ............................................................................. 14

Hình 2.6 Mơ hình chung bộ mã hố phân tích bằng tổng hợp AbS................................ 21
Hình 2.7 Đồ thị hàm mật độ xác suất c a 8 hệ số LAR đầu tiên .................................... 26
Hình 2.8 Mối quan hệ giữa khung, khung con và cửa sổ Hamming .............................. 27
H nh 3.1 Sơ đồ khối bộ mã hóa RPE-LTP ...................................................................... 34
Hình 3.2 Đáp ứng xung (trái) và đáp ứng tần số (phải) c a bộ lọc trọng số ................ 39
Hình 3.3 Vị trí các mẫu trong 4 chuỗi con ........................................................................ 39
H nh 3.4 Sơ đồ khối bộ giải mã RPE-LTP ....................................................................... 40

6


DANH MỤC CÁC CHỮ VIẾT TẮT
A/D

Analog to Digital

AB
Abs

Access Burst
Analysis by Synthesis

ADPCM

Adaptive Differently PCM

DB
DM
DPCM
FC

FEC

Dummy Burst
Delta Modulation
Differential PCM
Frequency Correction Burst
Forward Error Correction

GMSK

Gaussian Minimum Shift Keying

GSM
LAR
LP
LPC
LTP
MOS
MPE-LTP
NB
PCM
PDF
QMF
QoS
RELP
RPE
RPE-LTP
SB
SNR
STP


Global System For Mobile
Communications
Logarithm Area Ratio
Linear Prediction
Linear Prediction Coding
Long Term Predictor
Mean Opinion Score
Multi-Pulse Excited LPC Codec
with Long term Predictor
Normal Burst
Pulse Code Modulation
Probability Density Function
Quadrature Mirror Filter
Quality of Service
Residual Excited Linear
Prediction
Regular Pulse Excitation
Regular Pulse Excited - Long
Term Prediction
Synchronization Burst
Signal to Noise Ratio
Short term Predictor

7

Chuyển đổi tín hiệu từ tƣơng tự
sang số
Cụm truy xuất
Phân tích bằng tổng hợp

Điều chế mã xung vi sai thích
ứng
Cụm giả
Điều chế Delta
Điều chế mã xung vi sai
Cụm điều chỉnh tần số
Mã sửa lỗi hƣớng đi
Điều chế khóa chuyển pha cực
tiểu
Hệ thống thơng tin di động tồn
cầu
Tỉ số vùng logarith
Dự đốn tuyến tinh
Mã hóa dự đốn tuyến tính
Dự đốn dài hạn
Điểm số ý kiến trung bình
Dự đốn tuyến tính kích thích
bằng tín hiệu sau dự đốn
Cụm thƣờng
Điều chế xung mã
Hàm mật độ xác suất
Bộ lọc gƣơng cầu phƣơng
Chất lƣợng dịch vụ
Dự đốn tuyến tính kích thích
bằng tín hiệu sau dự đốn
K ch th ch xung đều
K ch th ch xung đều – Dự đoán
dài hạn
Cụm đồng bộ
Tỉ số hiệu trên nhiễu

Dự đoán ngắn hạn


CHƢƠNG 1: XỬ LÝ TÍN HIỆU TRONG THƠNG TIN DI ĐỘNG
Q trình biến đổi và xử lý tín hiệu trong mạng thơng tin di động GSM đƣợc
mơ tả nhƣ sau:

Hình 1.1 Q trình biến đổi tín hiệu trong mạng thơng tin di động GSM
1.1 Số hoá và mã hoá tiếng nói
Đầu tiên, tiếng nói đƣợc microphone biến đổi sang tín hiệu điện ở dạng tƣơng tự.
Microphone bao gồm một màn mỏng và một cuộn d y đạt trong khe từ trƣờng c a một
nam ch m. Để giảm lƣợng dữ liệu cần thiết tƣơng ứng với sóng âm, ta cho tín hiệu
qua bộ lọc thơng dải trong khoảng tần số từ 300 Hz đến 3.4 kHz. Sau đó, t n hiệu này
đƣợc biến đổi sang tín hiệu số bằng bộ biến đổi A/D dùng kĩ thuật điều xung mã
PCM với tần số lấy mẫu là 8kHz và mã hoá mỗi mẫu bằng 13 bit. Do đó, luồng tín
hiệu số sau khi đƣợc biến đổi có tốc độ 104 kbps.
Tín hiệu số ở ng ra c a bộ biến đổi A/D có tốc độ 104 kbps đƣợc nén lại bằng
bộ mã hố tiếng nói. Mã hố tiếng nói là phƣơng pháp nén t n hiệu thoại ở dạng số.
Yêu cầu c a mã hố tiếng nói là phải đảm bảo thời gian thực và chất lƣợng có thể
chấp nhận đƣợc. Trong GSM, ngƣời ta sử dụng mã Vocoder. Nguyên tắc c a kỹ thuật
này là thay vì truyền đi luồng số từ tiếng nói thì ta sẽ truyền đi thơng số c a cơ quan
phát âm tại thời điểm phát ra tiếng đó. Nhƣ vậy, chuỗi bit truyền đi sẽ ngắn hơn nên
tốc độ sẽ giảm xuống.

8


Hình 1.2 Biến đổi A/D
Tín hiệu số ở ngõ ra c a bộ biến đổi A/D có tốc độ 104 kbps đƣợc chia thành
từng đoạn có chiều dài 20ms, nhƣ vậy mỗi đoạn chứa 2080 bit (tƣơng ứng 160 mẫu).

Để truyền đi chuỗi này, ngƣời ta sẽ thay thế thông số c a bộ lọc có chiều dài 260 bit.
Nhƣ vậy, 260 bit mỗi 20ms tƣơng ứng với tốc độ truyền đi thật sự là 13 kbps.

Hình 1.3 Mã hóa thoại
1.2 Mã hoá kênh
Mã kênh là thêm vào mỗi từ mã cần truyền một số bit dƣ thừa để làm tang
khoảng cách Hamming c a bộ từ mã, nhằm mục đ ch là giúp cho đầu thu phát hiện và
sửa đƣợc nhiều lỗi hơn.
Bộ mã hố tiếng nói đƣa các khối 260 bit/20ms đến bộ mã hoá kênh. Các bit này
đƣợc chia thành 182 bit loại I (các bit đƣợc bảo vệ) và 78 bit loại II (các bit không
đƣợc bảo vệ), dựa theo tầm quan trọng c a các bit nhận đƣợc từ các thí nghiệm ch
quan. Các bit loại I đƣợc chia thành 2 loại, Ia và Ib.
9


50 bit đầu c a loại I đƣợc bảo vệ bởi mã CRC để phát hiện lỗi và tạo thành 53
bit. Các bit thêm vào này đƣợc tính dựa trên đa thức tạo mã g(x)= 1+x+x3 . Sau đó,
các bit loại I cùng với các bit chẵn lẻ (185 bit) đƣợc bổ sung thêm 4 bit đuôi bằng
0 và đƣợc mã hóa xoắn theo hai đa thức: g1(x)=1+x3+x4 và g2(x)=1+x+x3+x4 tạo
thành 378 bit. Các bit nhóm II khơng đƣợc bảo vệ. Nhƣ vậy, đầu ra c a mã hoá kênh
sẽ là 456 bit tƣơng ứng với 22,8 kbps.

Hình 1.4 Mã hóa kênh
1.3 Tổ chức cụm
Khi MS cần truy xuất vào mạng thì sẽ đƣợc hệ thống cung cấp cho một khe thời
gian. Mỗi khe thời gian có độ dài 0,577 ms nhƣng thông tin truyền đi trong khe này là
chỉ chiếm có 0,546 ms. Thơng tin trong khoảng thời gian này đƣợc gọi là cụm và
khoảng thời gian còn lại hai đầu là thời gian bảo vệ dài 0,031 ms.
Tuỳ theo mỗi loại tín hiệu khác nhau mà các tổ chức cụm trong GSM khác nhau.
Có 5 loại cụm trong thông tin di động GSM:

 Cụm thường (Normal Burst)
TB
3

57 bit thông
tin

F
1

Chuỗi hướng
dẫn 26 bit

F
1

57 bit thông
tin

TB

GP

3

8.25

TB: Tail bit (3 bit), là các bit đuôi, đạt ở đầu và cuối cụm.
Chuỗi hƣớng dẫn: 26 bit, dùng để xác định khe thời gian và giúp máy thu điều
chỉnh tín hiệu thu.

Mỗi cụm thƣờng chứa 114 bit thông tin và đƣợc chia thành hai gói, mỗi gói 57
bit, xen giữa hai gói là một chuỗi hƣớng dẫn chiều dài 26 bit. Ở hai đầu cụm sử dụng
bit đuôi cho mỗi đầu.
10




Cụm điều chỉnh tần số (Frequency Correction Burst)

Cụm này chứa 142 bit cố định làm tín hiệu điều khiển, các bit khởi tạo và kết
thúc cụm là 3 bit, đƣợc sử dụng cho kênh FCCH.
TB
3

TB
3

142 bit thông tin


GB
8.25

Cụm đồng bộ (Synchronization Burst)

Đƣợc sử dụng để đồng bộ thời gian cho trạm di động. Cụm chứa 78 bit đƣợc mật
mã hoá mang thông tin về FN (số khung) c a TDMA và c a BSIC (mã nhận dạng trạm
gốc). Cụm SB đƣợc sử dụng để truyền kênh SCH.
TB

3

39 bit thông tin


Chuỗi đồng bộ
64 bit

39 bit thông tin

TB
3

GB
8.25

TB
3

GP
8.25

Cụm truy xuất (Access Burst)

Đƣợc sử dụng cho các kênh điều khiển còn lại.
TB
3

Chuỗi đồng bộ 41


Các bit thông tin 36

 Cụm giả (Dummy Burst)
Cụm DB có tổ chức giống nhƣ cụm NB nhƣng thơng tin trong cụm DB là thông
tin giả, sử dụng các bit hỗn hợp. Đƣợc sử dụng trong các khe thời gian rỗi.
TB
3

Các bit hỗn hợp
58

Chuỗi hướng
dẫn 26 bit

Các bit hỗn
hợp58

TB

GP

3

8.25

1.4 Ghép xen
Ở thông tin di động, do tác động c a fading nên các lỗi bit thƣờng xảy ra từng
cụm dài. Tuy nhiên, mã hoá kênh đạt biệt là mã hoá xoắn chỉ hiệu quả nhất khi phát
hiện và sửa chữa các lỗi ngẫu nhiên đơn lẻ và cụm lỗi khơng q dài. Để đối phó với
vấn đề này ngƣời ta chia khối bản tin cần gởi thành các cụm ngắn rồi hoán vị các

cụm này với các cụm c a khối bản tin khác. Do đó, khi xảy ra cụm lỗi dài mỗi bản
tin chỉ mất đi một cụm nhỏ, phần còn lại c a bản tin vẫn cho phép các dạng mã hố
kênh khơi phục lại đƣợc đúng sau khi đã sắp xếp lại các cụm c a bản tin theo thứ tự
nhƣ ở phía phát. Quá tr nh nói trên đƣợc gọi là ghép xen.

11


Các bit sau khi mã hố có chiều dài 456 bit đƣợc tổ chức lại và đƣợc ghép xen
theo 8 nửa cụm. Mỗi nửa cụm chứa 57 bit. Việc ghép xen lƣu lƣợng đƣợc thực hiện
theo các bƣớc sau:
B1: Chia 456 bit thành 8 nhóm
-

Nhóm 0: 1, 9 , 17 ……….. 449

-

Nhóm 1: 2, 10, 18 ……….. 450

-

Nhóm 2: 3, 11, 19 ……….. 451

-

Nhóm 3: 4, 12, 20 ……….. 452

-


Nhóm 4: 5, 13, 21 ……….. 453

-

Nhóm 5: 6, 14, 22 ……….. 454

-

Nhóm 6: 7, 15, 23 ……….. 455

-

Nhóm 7: 8, 16, 24 ……….. 456

B2: Sau đó, các nhóm nói trên đƣợc ghép xen ở mức thứ 2. Ở ghép xen này ta
thấy bốn nhóm đầu c a một từ mã (cụ thể là nhóm 0, 1, 2, 3) đƣợc đạt vào vị tr đầu
tiên c a bốn cụm, bốn nhóm còn lại đƣợc đạt vào vị tr sau c a bốn cụm tiếp theo.
Phần còn lại c a các cụm này đƣợc dùng để ghép t n hiệu c a các từ mã lân cận. Nhƣ
vậy, để truyền đi hết một từ mã 456 bit thì phải cần 8 cụm liên tiếp.

Hình 1.5 Ghép xen tín hiệu tiếng nói

12


1.5 Mật mã hoá
Mục đ ch c a mật mã hố là bảo mật tín hiệu trên đƣờng truyền vơ tuyến. Khi
MS và BTS giao tiếp với nhau thì giữa chúng có chung một mật mã. Mỗi cuộc gọi
khác nhau thì có mật mã khác nhau.
Trong GSM, để thực hiện mật mã, ở đầu phát tạo ra một chuỗi tín hiệu giả

ngẫu nhiên để kết hợp với chuỗi tín hiệu cần truyền. Ở đầu thu muốn khơi phục lại tín
hiệu thì máy thu phải biết chuỗi ngẫu nhiên ở đầu thu, do vậy chuỗi ngẫu nhiên đƣợc
gọi là mật mã.
Mật mã hố tín hiệu đạt đƣợc bằng cổng XOR giữa chuỗi ngẫu nhiên với 114 bit
c a cụm b nh thƣờng. Để giải mật mã, ngƣời ta thực hiện thao tác XOR giữa tín hiệu
thu với chuỗi ngẫu nhiên giống đầu phát.
1.6 Điều chế
Điều chế là phép toán chuyển đổi từ một tín hiệu mang tin tức sang một tín hiệu
khác mà không làm thay đổi về tin tức mang theo.
Điều chế số là quá tr nh trong đó các dữ liệu số đƣợc mã hố vào trong sóng
mang hình sin thích hợp với các đạc tính kênh truyền. Kỹ thuật truyền tín hiệu điều
chế số cịn gọi là kỹ thuật truyền tín hiệu dãy thơng.
Dạng tổng qt c a sóng mang h nh sin s(t) là:
s(t) = A(t).cos[ω0(t) + Φ(t)]
Trong đó A

(1.1)

: biên độ

ω = 2πf :tần số góc
Φ

: góc pha

Giải điều chế số là quá tr nh ngƣợc lại với điều chế số nhằm phục hồi các luồng
bit từ dạng sóng thu đƣợc càng ít lỗi càng tốt, mạc dù tín hiệu số có thể méo dạng hoạc
nhiễu.
GSM sử dụng phƣơng pháp điều chế khoá chuyển pha cực tiểu GMSK (Gaussian
Minimum Shift Keying). Đ y là phƣơng pháp điều chế bang hẹp dựa trên kỹ thuật

điều chế dịch pha. Để giải th ch GSMK, trƣớc hết chúng ta xét MSK bằng cách so
sánh nó với PSK. Ta có thể tr nh bày sóng mang đã đƣợc điều chế đối với PSK và
MSK nhƣ sau:
s(t) = A.cos[ω0(t) +ψ(t) +

φ0]

(1.2)
13


Trong đó A

: biên độ khơng thay đổi.

ω0=2πf (rad/s) : tần số góc c a sóng mang
ψ(t)

: góc pha phụ thuộc vào luồng số mang lên điều chế φ0
là góc pha ban đầu.

Đối với điều chế pha bốn trạng thái, ta đƣợc góc pha ψ(t) nhƣ sau: ψ(t) = nπ/2
với n= 0, 1, 2, 3 tƣơng ứng với các cạp bit đƣợc đƣa lên điều chế là {00, 01, 11,
10}.
Đối với điều chế MSK ta đƣợc góc pha

nhƣ sau:

(1.3)
Trong đó, chuỗi bit đƣa lên điều chế là {…


,

,

,…)

là khoảng thời gian c a bit
Ta thấy, ở MSK nếu bit điều chế ở thời điểm xét giống nhƣ bit ở thời điểm trƣớc
đó, ψ(t) sẽ thay đổi tuyến tính từ 0 đến

, ngƣợc lại nếu bit điều chế ở thời điểm xét

khác với bit trƣớc đó th ψ(t) sẽ thay đổi tuyến tính từ 0 đến - .
Sự thay đổi góc pha ở điều chế MSK cũng dẫn đến thay đổi tần số theo
quan hệ sau
Trong đó
Nếu chuỗi bit đƣa lên điều chế khơng đổi ( tồn số 1 hoặc số 0) ta có tần số sau:

Nếu chuỗi bit đƣa lên điều chế thay đổi lu n phiên (1,0,1,0,1,0…) th ta có tần số
sau:
Để thu hẹp phổ tần c a tín hiệu điều chế, luồng bit đƣa lên điều chế đƣợc đƣa qua
bộ lọc Gauss. Ở GSM, bộ lọc Gauss đƣợc sử dụng tích giải thơng chuẩn hóa BT = 0.3
trong đó B là độ rộng băng tần.
14


Mục đ ch dùng GMSK là để tạo ra tín hiệu băng thông nhỏ, độ dịch tần nhỏ.

CHƢƠNG 2: CÁC PHƢƠNG PHÁP MÃ HĨA TIẾNG NĨI


2.1 Q trình tạo tiếng nói
Để hiểu đƣợc các phƣơng pháp mã hố thoại, điều đầu tiên là ta cần phải hiểu
cấu trúc cơ quan phát m và cơ quan th nh giác c a con ngƣời, hiểu về ngôn ngữ, sinh
lý, các mức m thanh cũng nhƣ việc ứng dụng nó vào trong các kĩ thuật mã hố thoại
hiện nay.
Mã hố thoại có ƣu điểm là đƣợc tạo ra dựa vào cấu trúc vocal tract (tuyến m)
c a con ngƣời. Đạc điểm này cũng xác định và giới hạn cấu trúc c a t n hiệu thoại.
2.1.1 Chuỗi thoại
Để r hơn ta xét quá tr nh hai ngƣời hội thoại với nhau, một ngƣời nói và một
ngƣời nghe. Chuỗi thoại đƣợc tạo ra và truyền đến tai ngƣời nghe nhƣ trong h nh 2.1.
Đầu tiên, ngƣời nói sẽ sắp xếp các suy nghĩ c a m nh, xác định xem thử anh ta muốn
nói gì và đạt những suy nghĩ đó vào trong một dạng ngơn ngữ bằng cách chọn các từ,
cụm từ, nhóm từ ch nh xác và đạt chúng vào đúng cấu trúc ngữ pháp c a ngơn ngữ
mình nói.

15


Hình 2.1 Quá trình tạo thoại
Quá trình này kết hợp với não ngƣời nói, nơi sẽ đƣa ra các lệnh dƣới dạng
các xung. Các xung này theo các dây thần kinh điều khiển cơ và cơ quan phát
m nhƣ lƣỡi, môi, quai hàm và d y thanh chuyển động làm áp suất khơng khí
xung quanh thay đổi tạo ra sóng âm truyền trong khơng khí. Sóng âm này truyền
đến tai ngƣời nghe và kích hoạt cơ quan thị giác. Cơ qua th nh giác cũng tạo ra
các xung thần kinh đƣa đến não ngƣời nghe và não sẽ giúp nhận biết, hiểu đƣợc
các thơng tin từ ngƣời nói.
Các dây thần kinh th nh giác c a ngƣời nói cũng đƣợc hồi tiếp lại não. Não sẽ
tiếp tục so sánh với m thanh đã nói để có những điều chỉnh thích hợp. Sự hồi tiếp này
là rất cần thiết để giúp cho ngƣời nói có thể dự đốn đƣợc ngƣời nghe có nghe rõ ràng

và chính xác hay khơng ?
2.1.2 Phát âm
Do hoạt động và vị tr c a cơ quan phát m nên m thanh c a mỗi ngƣời
khác nhau. Khi chúng ta nói khí từ phổi sẽ đi qua vocal tract và ra ngồi tạo
thành tiếng nói.
Tín hiệu thoại là tín hiệu động có dạng sóng rất phức tạp. Bằng cách phân tích tín
hiệu, ngƣời ta thấy rằng phân bố nang lƣợng theo tần số trong một đoạn thoại ngắn có
nhiều dạng khác nhau. Nang lƣợng phân bố theo tần số đƣợc gọi là phổ công suất. Phổ
công suất có thể tập trung ở tần số cao, tần số thấp hoạc ở hai bên một dải tần số nào
đó. Cấu trúc c a phổ có thể ngẫu nhiên hoạc xác định điều hoà. Phổ c a c a thoại ln
thay đổi làm cho mã hố càng thêm phức tạp. Để khắc phục điều này, ngƣời ta sắp xếp
thành các mức vật lý khác nhau. Bằng cách nghiên cứu cơ quan phát m và hoạt động
c a nó, các dạng tín hiệu thoại khác nhau đƣợc xét riêng lẻ.
Hình 2.2 cho thấy sơ đồ đơn giản hoạt động c a vocal tract. Khơng kh từ phổi
đẩy vào khí quản, đi qua d y thanh và cuối cùng vào hốc mũi và miệng. Thanh mơn
cho phép một lƣợng khơng khí vừa đ từ phổi đi qua hoạc có thể ngắt luồng khơng khí
thành các xung tuần hồn.
16


Hình 2.2 Phát âm c a vocal tract
2.1.2.1 Kích thích
Tín hiệu thoại là do khơng khí từ phổi đƣợc biến đổi thành dạng nang lƣợng
k ch th ch vocal tract rung và ta xem đ y là t n hiệu kích thích trong bộ mã hố.
Dây thanh rung tạo ra các xung truyền đến mũi và miệng. Vì vậy, nang lƣợng kích
thích ở nhiều tần số và cƣờng độ c a các tần số này phụ thuộc vào tốc độ chuyển
động c a vocal tract.
Tổng quát, k ch th ch đƣợc chia làm hai dạng: hữu thanh (voice) và vô thanh
(unvoice). Âm thanh tạo ra do sự rung động c a d y thanh đƣợc gọi là hữu thanh. Tất
cả các nguyên âm và một số phụ âm là âm hữu thanh. Âm thanh đƣợc tạo ra không

phải do sự rung c a các d y thanh mà do không kh bị vocal tract co thắt thì đƣợc gọi
là âm vơ thanh, ví dụ nhƣ m “s”, “p”. Đạc điểm c a m hữu thanh và âm vô thanh
phụ thuộc vào:
- K ch thƣớc chia nhỏ luồng khơng khí từ phổi tạo thành các xung tựa tuần hoàn.
Nang lƣợng để thực hiện điều này là kích thích âm hữu thanh nhƣ là các ngun m.
- Luồng khơng khí từ phổi đến mũi, giống nhƣ là nhiễu loạn tạo ra do sự co
thắt vocal tract. Nang lƣợng để thực hiện quá trình này là kích thích âm vơ thanh
17


nhƣ m “s”.
Ngồi hai dạng trên cịn có một dạng hỗn hợp c a nó v dụ nhƣ “z”. Tuy nhiên,
ta chỉ xét hai loại là hữu thanh và vô thanh dựa vào sự có mạt hay vắng mạt c a
kích thích tuần hồn. Do đó, “z” cũng đƣợc xem là âm hữu thanh.
Pich
Tần số c a k ch th ch tuần hoàn (hoạc tựa tuần hoàn) đƣợc gọi là pitch. Khoảng
thời gian giữa điểm bắt đầu cũng nhƣ điểm kết thúc c a d y thanh đến điểm tƣơng
ứng trong chu kì kế tiếp đƣợc gọi là chu kì pitch.

Hình 2.3 Dạng sóng tiếng nói c a đoạn thoại (âm hữu thanh) ngắn
Hình 2.3 cho ta dạng sóng thời gian c a một đoạn thoại dài 40 ms c a m hữu
thanh. Trục x là trục thời gian (ms). Trục y là biên độ. Giá trị biên độ cao ở điểm bắt
đầu xung pitch, chu kì pitch là 10 ms và tần số pitch là 1/10ms bằng 100 Hz.
2.1.2.2 Vocal tract
Kích thích là một trong hai hệ số quan trọng tác động đến tiếng nói. Cho kích
thích là âm hữu thanh hoạc m vô thanh, khi vocal tract thay đổi sẽ cho các âm thanh
khác nhau. Khi hình dạng và vị tr c a vocal tract thay đổi thì sẽ làm cho tần số cộng
hƣởng c a vocal tract thay đổi theo.
Các tần số cộng hƣởng này cho các đỉnh phổ nằm ở các tần số ứng với từng dạng
vật lý c a vocal tract. Tần số cộng hƣởng đƣợc gọi là formant và vị trí tần số c a

chúng đƣợc gọi là tần số formant.
18


H nh 2.4 Log cƣờng độ phổ c a một đoạn thoại (âm hữu thanh) ngắn
Cách phát âm
Trong vocal tract, sự co thắt và ống dẫn khơng khí sẽ tạo nên cách phát m. Để
tạo ra các m khác nhau th k ch th ch đƣợc tạo ra bởi vocal tract phải khác nhau. Ví
dụ nguyên m đƣợc tạo ra bởi kích thích tuần hồn và luồng khơng kh đi qua vocal
tract có tốc độ khơng bị hạn chế. Tuy nhiên, tốc độ này khơng đều, nó cịn phụ thuộc
vào tần số formant. Ngƣợc lại, âm vơ thanh khơng có các thành phần tuần hoàn và
đƣợc tạo ra do một số sự co thắt.
Phụ âm dừng hay còn gọi là âm bật, đƣợc tạo ra do áp suất luồng không khí
bị chạn đột ngột. Phụ âm dừng có thể là m hữu thanh nhƣ “b” hoạc âm vô thanh
nhƣ m “p”.
Phụ âm mũi đƣợc tạo ra do luồng khơng khí qua vịm miệng, mơi bị giảm để
chuyển sang mũi nhƣ các m “m”, “n”.
Vị trí phát âm
Cách phát m xác định nhóm âm thanh và vị tr phát m xác định ch nh xác điểm
19


co thắt. Vị tr ch nh xác c a vocal tract sẽ tạo nên âm thanh đạc trƣng c a từng ngƣời.
Nguyên m đƣợc phân biệt nhờ lƣỡi tạo nên sự co thắt, ví dụ:
- Một nguyên m trƣớc nhƣ trong từ “beet”
- Một nguyên âm giữa nhƣ trong từ “bet”
- Một nguyên m sau nhƣ trong từ “boot”
Trong từ “beet” lƣỡi sẽ chạm lên phần trên c a miệng và phần sau c a rang, còn
“boot” th lƣỡi lùi lại phía sau gần quai hàm tạo ra sự co thắt. Các m “p”, “t”, “k”
đƣợc tạo ra do vị tr khác nhau trong vocal tract nơi sự co thắt đƣợc thực hiện để dừng

luồng khơng kh trƣớc khi nói.
“p”: đóng mơi.
“t”: lƣỡi ở giữa hai hàm rang.
“k”: lƣỡi ở sau miệng
2.1.3 Dạng bộ lọc nguồn
Để dễ dàng phân tích tín hiệu thoại, hầu hết bộ mã hố tiếng nói đều có dạng
vocal tract. Dạng này thƣờng đƣợc dùng ở hầu hết các q trình mã hố và giải mã.
Khi mã hố, các kiểu thơng số đƣợc xác định để miêu tả chính xác thoại ng vào. Đối
với giải mã, cũng có cấu trúc tƣơng tự và dựa vào các thông số này để tái tạo lại thoại
ban đầu.
Một dạng tạo thoại thƣờng đƣợc sử dụng nhất đó là dạng bộ lọc nguồn. Bộ lọc
nguồn này có dạng giống nhƣ vocal tract. Nguồn tín hiệu cung cấp cho bộ lọc nguồn
này là tín hiệu kích thích.
2.1.3.1 Vocal tract
Cổ họng, mũi, lƣỡi và miệng là hốc cộng hƣởng không kh để tạo nên tiếng nói
c a con ngƣời. Vocal tract có cấu trúc khác nhau thì sẽ có các tần số cộng hƣởng khác
nhau. Tần số cộng hƣởng cùng với tín hiệu kích thích là hai hệ số ch nh điều khiển
vocal tract tạo ra các âm vị.
2.1.3.2 Kích thích
Đối với tiếng nói âm hữu thanh, dạng sóng tuần hồn tạo k ch th ch đến vocal
tract. Dạng sóng tuần hồn từ các xung thanh môn sẽ làm cho dây thanh sẽ rung. Dạng
đơn giản và hay dùng cho âm vô thanh là nhiễu trắng. Nhiễu trắng thƣờng ngẫu nhiên
và có phổ bằng phẳng ở mọi tần số có cùng cơng suất. Giả sử nhiễu trắng đƣợc tạo ra
20


khi không kh đi qua bộ phận co thắt. Một số m nhƣ m /z/ đƣợc tạo ra vừa bởi một
kích thích tuần hồn và vocal tract co thắt khơng kh . Điều này đƣợc gọi là kích thích
pha trộn. Vì vậy, nhiệm vụ ch nh c a mã hố thoại là phải phân biệt đ u là m hữu
thanh, âm vơ thanh hay là pha trộn c a nó.

2.1.3.3 Dạng bộ lọc nguồn tổng quát
Sơ đồ hình 2.5 chứng minh rằng luồng tín hiệu và thơng tin c a một bộ lọc nguồn
tổng quát. Thông tin pitch thƣờng đƣợc chứa trong giá trị chu kì pitch. Giá trị này thay
đổi tuỳ theo sự thay đổi c a t n hiệu thoại. Dựa vào chu kì pitch, khối “k ch th ch tuần
hồn” tạo ra một dạng sóng xung đại diện cho các xung thanh mơn. Khối “nhiễu kích
th ch” có ng ra là nhiễu liên tục với đáp ứng phổ bằng phẳng. Hai kích thích này
đƣợc cho vào bộ quyết định trộn. Thoại cũng sẽ cho vào một ngõ vào khác. Dựa vào
các mức c a thoại gốc, khối “quyết định trộn” kết hợp với “k ch th ch tuần hoàn” và
“nhiễu k ch th ch” sẽ tạo ra tín hiệu kích thích phù hợp.

Hình 2.5 Dạng bộ lọc nguồn tổng quát
Thƣờng có 2 dạng, bộ lọc nguồn sẽ kết hợp quyết định cứng âm hữu thanh/âm vô
thanh đối với mỗi đoạn thoại. Trong trƣờng hợp này, chức nang c a khối “quyết định
trộn” nhƣ một chuyển mạch với kích thích là âm hữu thanh/âm vơ thanh. Thơng tin
vocal tract đƣợc cung cấp vào khối “vocal tract” để tạo ra một bộ lọc vocal tract. Bộ
lọc sẽ làm cho phổ c a k ch th ch giống nhƣ c a t n hiệu thoại gốc. Thực tế, thông tin
vocal tract đƣợc tạo ra bằng một số phƣơng pháp bao gồm một dự đốn tuyến tính và
giá trị Fourier. K ch th ch đƣợc lọc bởi vocal tract để tạo ra thoại tổng hợp đến tai
ngƣời nghe sao cho giống tín hiệu thoại ban đầu nhất.
21


2.2 Các phƣơng pháp cơ sở mã hố tiếng nói
Về cơ bản bộ mã hóa tiếng nói có 3 loại:
 Mã hóa dạng sóng (waveform).
 Mã hóa nguồn (source).


Mã hóa lai (hybrid): là sự kết hợp c a mã hoá dạng sóng và mã
hố nguồn.


Ngun lý c a mã hóa dạng sóng là tìm cách số hóa dạng sóng c a tiếng nói
theo cách th ch hơp . Tại phía phát, bộ mã hóa sẽ nhận các tín hiệu nói tƣơng tự liên tục
và chuyển thành tín hiệu số trƣớc khi truyền đi. Tại phía thu sẽ làm nhiệm vụ ngƣợc
lại để khơi phục tín hiệu tiếng nói. Khi khơng có lỗi truyền dẫn thì dạng sóng c a tiếng
nói khơi phục rất giống với dạng sóng c a tiếng nói gốc. Ƣu điểm c a loại mã hóa này
là: độ phức tạp , giá thành thiết kế , độ trễ và cơng suất tiêu thụ thấp. Bộ mã hóa dạng
sóng đơn giản nhất là điều chế xung mã (PCM), điều chế Delta (DM)... Tuy nhiên,
nhƣợc điểm c a bộ mã dạng sóng là khơng tạo đƣợc tiếng nói chất lƣợng cao, tốc độ
dƣới 16kbit/s.
Bộ mã hóa nguồn khắc phục đƣợc nhƣợc điểm này. Nguyên lý c a mã hóa là mã
hóa kiểu phát âm (vocoder), ví dụ nhƣ bộ mã hóa bằng dự đốn tuyến tính (Linear
Prediction Coding - LPC). Các bộ mã hóa này có thể thực hiện đƣợc tại tốc độ bit lớn
hơn 1kbps. Hạn chế ch yếu c a mã hóa kiểu phát m LPC là việc mơ phỏng nguồn
kích thích cịn đơn giản nên tiếng nói tái tạo đƣợc là tiếng nói dạng tổng hợp, chất
lƣợng khơng cao và khó có thể nhận ra giọng ngƣời nói chuyện. Vào năm 1982, Atal
đã đề xuất một mơ hình mới về k ch th ch, đƣợc gọi là k ch th ch đa xung. Trong mơ
hình này, khơng cần biết trƣớc xem đó là m hữu thanh hay vơ thanh. Sự kích thích
đƣợc mơ hình hóa bởi một số xung có biên độ và vị tr đƣợc xác định bằng việc cực
tiểu hóa sai lệch, có t nh đến trọng số thụ cảm , giữa tiếng nói gốc và tiếng nói tổng
hợp. Việc đƣa ra mơ h nh này đã g y chú ý và đó là mô h nh đầu tiên c a một thế hệ
mới c a các bộ điều chế tiếng nói phân tích bằng tổng hợp (Analisis by Synthesis). Tín

22


hiệu kích thích sẽ đƣợc tối ƣu hóa một cách kỹ lƣỡng và ngƣời ta sử dụng kỹ thuật
mã hóa dạng sóng để mã hóa tín hiệu kích thích này một cách có hiệu quả.
Chỉ tiêu đánh giá thuật tốn mã hoá:
- Hai mục tiêu quan trọng đạt ra là: tối thiểu hóa tốc độ bit và tối ƣu hóa chất

lƣợng. Hai mục tiêu này thƣờng có mâu thuẫn với nhau. Tốc độ bit đƣợc tính bằng
bps. Chất lƣợng đƣợc đánh giá ở việc đƣợc tái tạo lại dạng tƣơng tự với một sai số
càng nhỏ càng tốt. Việc lấy mẫu khơng ảnh hƣởng đến chất lƣợng. Cịn lƣợng tử hóa
thì có thê gây ra những sai số làm mất mát thơng tin so với tín hiệu ban đầu đƣợc
gọi là nhiễu lựơng tử. T số tín hiệu trên nhiễu (SNR) đƣợc dùng đánh giá chất lƣợng
tiếng nói. Nếu tỉ số này thấp ngƣời nghe sẽ thu đƣợc tiếng nói khơng tốt.
- Chất lƣợng chấp nhận đƣợc có SNR khoảng trên 30 dB. Theo tính tốn việc
thêm 1 bit biểu diễn giá trị lƣợng tử sẽ làm tăng SNR lên khoảng 6dB, tƣơng tự sẽ
giảm 1 bit làm SNR giảm xuống 6dB.
- Ngƣời ta thƣờng dùng một tiêu chuẩn gọi là MOS (Mean Opinion Score ) để so
sánh chất lƣợng mã hố tiếng nói, với thang giá tri từ 1 đến 5, cho ta biết một thuật toán
điều chế đạt đƣợc chất lƣợng có gần với tiếng nói tự nhiên hay khơng .
2.2.1 Phƣơng pháp mã hố tiếng nói dạng sóng
Kiểu mã hóa này cố gắng mã hóa dạng sóng c a tiếng nói một cách có hiệu quả,
dạng đơn giản là điều chế xung mã PCM , ngoài ra cịn có các thuật tốn khác có thể
làm giảm tốc độ bit hơn nữa. Cơng nghệ mã hóa dạng sóng thƣờng cho tiếng nói chất
lƣợng tốt với bang thơng 16kbps trở lên.
Để tránh hiện tƣợng chồng phổ, tiếng nói tƣơng tự đƣợc lọc trƣớc khi số hóa để
loại trừ các thành phần tần số cao không mong muốn. Phổ tiếng nói có thể gồm cả
những thành phần tần số tới 10 kHz, nhƣng do hầu hết các tần số tiếng nói tập trung
vào khoảng từ (300 Hz - 3.4 kHz) nên tín hiệu tiếng nói đƣợc lọc đi để lọai bỏ thành
phần ngoài khoảng tần số ấy. Theo định luật lấy mẫu thì tần số lấy mẫu sẽ là 8 kHz.
Hệ thống nhƣ vậy gọi là PCM (Pulse Code Modulation). Phổ biến hiện nay ngƣời ta
chọn tốc độ lấy mẫu là 8 kHz và số bit lƣợng tử n =8, tức là tốc độ truyền sẽ là 64 kbps.
Các bit mã hóa đƣợc truyền tuần tự trên đƣờng truyền .
2.2.1.1 PCM (Pulse Code Modulation)
PCM đều (uniform PCM): Đầu vào c a bộ lƣợng tử là tín hiệu tƣơng tự đã đƣợc
23



đƣa qua bộ lấy mẫu .Với một bộ lƣợng tử dùng N bit từ mã, miền giá trị lƣợng tử đƣợc
chia thành 2N mức, mỗi từ mã N bit tƣơng ứng với 1 giá trị. Khoảng cách giữa các
mức gọi là bƣớc lƣợng tử (step size). Bộ lƣợng tử quyết định xem với mỗi giá trị đầu ra
là giá trị lớn nhất c a miền giá trị. Trong kiểu PCM đều, các giá trị lƣợng tử cách đều
nhau. Bƣớc lƣợng tử phải đƣợc chọn sao cho đ nhỏ để có thể tối thiểu nhiễu lƣợng tử,
nhƣng lại có thể đ lớn để miền giá trị c a cả bộ lƣợng tử có độ lớn th ch hơp. Vơi
một bộ lƣợng tử N bit cóbƣớc lƣợng tử là S, thì miền giá trị là R=2N*S. Nếu N khơng
đ lớn thì việc cắt xén tín hiệu vƣợt qua miền giá trị sẽ xảy ra nhiều hơn và đó là dĩ
nhiên là một nguyên nhân khác c a nhiễu lƣợng tử.
Phƣơng pháp này có nhƣợc điểm là SNR ,tức là chất lƣợng khơng chỉ phụ thuộc
vào bƣớc lƣợng tử mà còn phụ thuộc và cả biên độ c a t n hiệu lấy mẫu.
ượng t h

i u

đều : Cần N cỡ 11 bit trở lên để có thể đảm bảo chất

lƣợng tiếng nói. Điều này làm tốc độ bit lớn nên chúng t đƣợc sử dụng trong thực tế.
ượng t h

og ithm (logarithmic PCM): Mục tiêu c a phƣơng pháp này là

duy trì một t số SNR t thay đổi trong toàn phạm vi giá trị biên độ. Thay v lƣợng tử
hóa giá trị tƣơng tự c a tín hiệu lấy mẫu, trƣớc tiên ta t nh toán hàm logarithm c a
từng giá trị rồi mới lƣợng tử hóa chúng. SNR sẽ chỉ phụ thuộc vào bƣớc lƣợng tử.
Lƣợng tử logarithm là một quá trình nén, chúng làm giảm miền giá trị đầu vào một
cách đáng kê tùy thuộc vào dạng hàm logarithm đƣợc dùng . Sau khi nén, một quá
tr nh ngƣợc lại là mũ hóa đƣợc sử dụng để tái tạo lại tín hiệu ngun th y ban đầu.
Tồn bộ chu trình đƣợc gọi là Companding(Compressing/expanding).
Hai tiêu chuẩn đƣợc dùng phổ biến hiện nay là luật μ và luật A. Lƣợng tử hoá

theo luật μ sử dụng ở Bắc Mỹ và Nhật Bản, trong khi đó lƣợng tử hố theo luật A
đƣợc sử dụng ở châu Âu.
Các mẫu tín hiệu rời rạc theo biên độ đƣợc mã hố nhị phân. Ví dụ, mã hoá theo
luật A, ngƣời ta chia đƣờng cong logarith thành 13 đoạn.
Bit thứ nhất là bit có trọng số lớn nhất, là bit đầu. Giá trị 1 chỉ thị tín hiệu dƣơng
và giá trị 0 chỉ thị tín hiệu âm.
Bit 2, 3, 4 xác định đoạn lƣợng tử hoá theo mỗi vùng m và dƣơng.
Bit 5, 6, 7, 8 là các bit có trọng số nhỏ nhất, xác định vị tr c a giá trị lƣợng tử
hoá trong đoạn.
24


×