công nghệ thông tin Công nghệ số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (959.69 KB, 45 trang )

Báo cáo thực tập
LỜI MỞ ĐẦU
Truyền hình từ trước đến nay luôn có sự biến đổi và phát triển mạnh mẽ.
Thời kỳ đầu còn là những thiết bị thô sơ, tín hiệu hầu như được truyền bằng
tương tự. Ngày nay với sự phát triển mạnh mẽ của hệ thống thông tin số và
truyền dẫn số. Đặc biệt là truyền dẫn bằng tín hiệu HD với độc sắc nét cao về
hình ảnh.
Vì vậy, em đã lựa chọn đề tài này làm báo cáo thực tập. Dưới sự hướng
dẫn nhiệt tình của thầy Vũ Việt Hưng mà em có thể hoàn thành báo cáo này.
Trong quá trình làm báo cáo, do thời gian có hạn nên trong báo cáo còn
nhiều thiếu sót. Vì vậy, em rất mong nhận được sự đóng góp nhiệt tình từ các
thầy cô và các bạn trong Khoa để báo cáo được hoàn thiện hơn.
1
Sinh viên: Nguyễn Văn Hưng MSSV: 069
1
Báo cáo thực tập
PHẦN 1:
TỔNG QUAN VỀ CÔNG NGHỆ SỐ
1. Lấy mẫu
Tín hiệu tương tự liên tục theo thời gian nhưng trong quá trình xử lýtín
hiệu, thông thường ta xử lý trên tín hiệu số. Do đó cần phải thực hiện chuyển
đổi tín hiệu liên tục thành tín hiệu rời rạc để xử lý. Quá trình này gọi là lấy
mẫu tín hiệu (sampling), đó là thay tín hiệu liên tục bằng biên độ của nó ở
những thời điểm cách đều nhau, gọi là chu kỳ lấy mẫu. Các giá trị này sẽ
được chuyển thành số nhị phân để có thể xử lý được. Vấn đề ở đây là phải lấy
mẫu như thế nào để có thể khôi phục lại tín hiệu gốc. Tín hiệu lâýu mẫu của
tín hiệu gốc s(t) biểu diễn là s(nT) với T là chu kỳ lấy mẫu.
s(nT) = s(t)u(t) (1.1)
Trong đó u(t) là chuỗi xung Dirac
( ) ( )
n

u t t nT
∞
=−∞
= δ −
∑
(1.2)
Phổ của tín hiệu lấy mẫu là tích chập của S(f) và U(f), do đó:
s
n
1 n
S (f ) S(f )* U(f ) S f
T T
∞
=−∞
 
= = −
 ÷
 
∑
(1.3)
2
Sinh viên: Nguyễn Văn Hưng MSSV: 069
2
Báo cáo thực tập
Hình 1.1: Tín hiệu lấy mẫu và phổ
Quá trình lấy mẫu mô tả ở trên là quá trình lấy mẫu lý tưởng. Trong thực
tế, do tín hiệu u(t) là các xung lấy mẫu với chu kỳ T, độ rộng
τ
và biên độ a
nên phổ tín hiệu thực tế sẽ không chỉ là hàm S(f) mà là:

( )
( )
sin f
S f a
f
π τ
τ
π τ
(1.4)
(do giá trị lấy mẫu là
( )
nT / 2
nT / 2
a s t dt
+τ
−τ
∫
)
Tuy nhiên do
τ
<< T nên sai lệch không đáng kể.
1.1. Tần số lấy mẫu
Xét tín hiệu sin có tần số f và quá trình lấy mẫu với các chu kỳ lấy mẫu
khác nhau.
Hình 1.2: Lấy mẫu tín hiệu với các tần số khác nhau
Như vậy, ta thấy rằng nếu tần số lấy mẫu càng cao thì dạng của tín hiệu
càng có khả năng khôi phục giống như tín hiệu gốc. Tuy nhiên, nếu tần số
càng cao thì cần phải dùng dung lượng lớn hơn để lưu trữ và đồng thời tốc độ
xử lý sẽ chậm lại do cần xử lý số lượng dự liệu lớn. Từ đó, ta cần xác định tần
3

Sinh viên: Nguyễn Văn Hưng MSSV: 069
3
Báo cáo thực tập
số lấy mẫu sao cho có thể khôi phục lại gần đúng dạng tín hiệu với yêu cầu
tốc độ xử lý giới hạn trong mức cho phép.
1.2. Định lý lấy mẫu
Định lý lấy mẫu xác định điều kiện để một tập mẫu có thể cho phép khôi
phục lại chính xác tín hiệu trước khi lấy mẫu. Như khảo sát ở trên (hình 1.1),
phổ của tín hiệu lấy mẫu là tín hiệu có chu kỳ trên miền tần số. Để khôi phục
lại dạng của tín hiệu, ta chỉ cần giới hạn phổ tần của tín hiệu. Quá trình này có
thể thực hiện bằng một mạch lọc thông thấp với hàm truyền:
( )
s
s
s
1 f
0 f
f 2
H f
f
0 f
2

< <


=


≥



(1.5)
Hay:
( )
( )
sin t /T
h t
t /T
π
=
π
(1.6)
Phổ của tín hiệu sau khi khôi phục là:
S(f) = S
s
(f) H(f) (1.7)
Hay:
( )
n
sin( (t t ')/ T
s t s(t') (t ' nT) dt'
(t t')/T
∞
∞
=−∞
−∞
τ −
 
= δ −

 
π −
 
∑
∫
( ) ( )
n
sin (t / T n)
s t s nT
(t / T n)
∞
=−∞
π −
=
π −
∑
(1.8)
4
Sinh viên: Nguyễn Văn Hưng MSSV: 069
4
Báo cáo thực tập
Hình 1.3: Khôi phục tín hiệu sau khi lấy mẫu
Như vậy, ta có thể khôi phục lại tín hiệu trước khi lấy mẫu khi phổ tín
hiệu sau khi qua mạch lọc phải giống hệt với phổ tín hiệu gốc. Theo hình 1.3,
điều kiện này thỏa mãn khi phổ tín hiệu gốc không chứa thành phần tần số lớn
hơn f
s
/2.
Trong trường hợp ngược lại, phổ của tín hiệu lấy mẫu sẽ bị méo dạng
nên khi sử dụng mạch lọc để khôi phục tín hiệu thì tín hiệu này sẽ khác với tín

hiệu gốc, hiện tượng này gọi là chồng phổ (aliasing).
Hình 1.4: Hiện tượng chồng phổ
Từ đó định lý lấy mẫu phát biểu như sau:
"Một tín hiệu không chứa bất kỳ thành phần tần số nào lớn hơn hay
bằng một giá trị f
m
có thể biểu diễn chính xác bằng tập các giá trị của nó
5
Sinh viên: Nguyễn Văn Hưng MSSV: 069
5
Báo cáo thực tập
với chu kỳ lấy mẫu T = 1/2f
m
".
Như vậy, tần số lấy mẫu phải thỏa mãn điều kiện f
s
≥
2f
m
trong đó f
m
là
thành phần tần số lớn nhất có trong tín hiệu. Tần số giới hạn này được gọi là
tần số Nyquist và khoảng (-f
s
/2, f
s
/2) gọi là khoảng Nyquist. Trong thực tế, tín
hiệu trước khi lấy mẫu sẽ bị giới hạn bằng một mạch lọc để tần số tín hiệu
nằm trong khoảng Nyquist.

Vi dụ như tín hiệu âm thanh thường nằm trong khoảng (300, 34000) Hz
nên người ta sẽ đưa tín hiệu qua mạch lọc thông thấp để loại các thành phần
tần số bậc cao và thực hiện lấy mẫu ở tần số tối thiểu là 6,8 KHz.
1.3. Lấy mẫu tín hiệu sin và tín hiệu ngẫu nhiên
1.3.1. Tín hiệu sin
Xét s(t) = cos
( )
2 ftπ + θ
với
0 / 2≤ θ ≤ π
được lấy mẫu với chu kỳ T=1.
Tín hiệu lấy mẫu là:
S(n) = cos
( )
2 fnπ + θ
(1.9)
Nếu tỷ số f/f
s
= f là số hữu tỉ, nghĩa là f = N
1
/ N
2
với N
1
, N
2
là các số
nguyên:
( ) ( )
( )

( ) ( )
2 2
s n N cos 2 f n N cos 2 fn+ s n
+ = π + + θ = π θ =
(1.10)
Như vậy, tập hợp s(n) là tập hợp có chu kỳ N
2

→
không cần phải lấy
mẫu toàn bộ tín hiệu sin mà chỉ cần lấy mẫu một phần.
1.3.2. Tín hiệu ngẫu nhiên
Xét tín hiệu s(t) được lấy mẫu với chu kỳ T, tín hiệu ngẫu nhiên rời rạc
tạo ra s(nT) sẽ có hàm phân phối xác suất biên độ giống như s(t). Hàm tự
tương quan của tín hiệu rời rạc s(nT) là:
( ) ( ) ( )
r nT E s i s i nT
= −
 
 
(1.11)
Hàm tự tương quan của tín hiệu s(t) là:
( ) ( ) ( )
xx
r E s t s t
τ = − τ
 
 
(1.12)
6

Sinh viên: Nguyễn Văn Hưng MSSV: 069
6
Báo cáo thực tập
Như vậy, chuỗi r(n) cũng chính là chuỗi tạo ra từ quá trình lấy mẫu tín
hiệu r
xx
( )
τ
. Tương tự công thức (1.3), quan hệ giữa hàm mật độ phổ công suất
của tín hiệu rời rạc
(f )Φ
và tín hiệu liên tục
( )
xx
fΦ
là:
( )
xx
n
1 n
f f
T T
∞
=−∞
 
Φ = Φ −
 ÷
 
∑
(1.13)

Từ đó, nếu tần số tín hiệu lấy mẫu quá nhỏ hay tần số của tín hiệu ngẫu
nhiên vô hạn thì gây hiện tượng chồng phổ.
Nếu s(t) là tín hiệu có chu kỳ N
0
thì:
( ) ( ) ( )
0
N 1
i 0
0
1
r n s i s i n
N
−
=
= −
∑
(1.14)
Cũng là chuỗi có chu kỳ N
0
2. Lượng tử hóa
Lượng tử hóa là quá trình xấp xỉ các giá trị của tín hiệu lấy mẫu s(nT)
bằng bội số của một giá trị q (q gọi là bước lượng tử). Nếu q không thay đổi
thì quá trình lượng tử gọi là đồng nhất. Quá trình này thực hiện bằng hàm bậc
thang mô tả như sau:
Hình 1.5: Hàm lượng tử với bước lượng tử q = 1
Quá trình lượng tử có thể thực hiện bằng cách định nghĩa giá trị trung
7
Sinh viên: Nguyễn Văn Hưng MSSV: 069
7

Báo cáo thực tập
tâm của hàm lượng tử. Ví dụ như trong hình 1.5, các giá trị trong khoảng từ (n
- 1/2)q đến (n + 1/2) q sẽ được làm tròn là n. Phương pháp này sẽ cực tiểu hóa
công suất của tín hiệu lỗi. Một phương pháp khác có thể sử dụng là dùng hàm
cắt, nghĩa là các giá trị trong khoảng [nq, (n+1)q] sẽ làm tròn thành n.
Hình 1.6: Lỗi lượng tử
Như vậy, quá trình lượng tử hóa sẽ làm méo dạng tín hiệu và xem như
tồn tại một tín hiệu nhiễu. Sự méo dạng này gọi là méo lượng tử hay còn gọi
là nhiễu lượng tử.
s(n) = s
q
(n) + e(n) (1.15)
Biên độ của tín hiệu nhiễu lượng tử sẽ nằm trong khoảng (-q/2, q/2). Do
sai số lượng tử không biết trước nên việc mô tả sai số lượng tử mang tính
thống kê. Tổng quát, ta có thể xem e(n) là chuỗi các biến ngẫu nhiên trong đó:
- Thống kê của e(n) không thay đổi theo thời gian (nhiễu lượng tử hóa là
quá trình ngẫu nhiên dừng).
- Nhiễu lượng tử e(n) là chuỗi các biến ngẫu nhiên không tương quan.
8
Sinh viên: Nguyễn Văn Hưng MSSV: 069
8
Báo cáo thực tập
- Nhiễu lượng tử e(n) không tương quan với tín hiệu ngõ vào s(n).
- Hàm mật độ xác suất của e(n) phân bố đều trên tầm các giá trị của sai
số lượng tử.
Như vậy, nhiễu lượng tử được phân bố đều trên khoảng (-q/2, q/2) và có
phương sai (công suất nhiễu lượng tử) là:
2
2
e

q
12
σ =
(1.16)
Tín hiệu được lấy mẫu và lượng tử hóa bao gồm một tập hợp các số và
được lưu trữ ở dạng nhị phân. Đối với số nhị phân N bit sẽ có tối đa 2
N
giá trị
khác nhau ứng với 2
N
mức lượng tử khác nhau. Như vậy, phạm vi lượng tử sẽ
bị giới hạn trong khoảng từ q đến 2
N
q, bất kỳ biên độ tín hiệu nào vượt quá
giá trị này thì sẽ bị cắt bỏ.
Giả sử tín hiệu mã hóa có biên độ trong khoảng [-A
m
, A
m
]:
A
m
= 2
N
q/2 (1.17)
Từ đó, giả sử công suất tín hiệu là
2
s
σ
thì tỷ số tín hiệu trên nhiễu lượng

tử hóa (SQNR - signal to Quantizing Noise Ratio) là:
SQNR [dB] =
( )
2
s m
2
c s
A
10log 6.02 N 1 10.79 20log
σ
= − + −
σ σ
(1.18)
3. Mã hóa
Tín hiệu ở ngõ ra bộ lượng tử hóa được đưa đến bộ mã hóa, bộ mã hóa
sẽ gán một số nhị phân cho mỗi mức lượng tử. Quá trình này gọi là mã hóa.
Có nhiều phương pháp mã hóa khác nhau nhưng trong đa số hệ thống xử
lý tín hiệu số sử dụng phương pháp bù 2. Một ví dụ đối với N = 3 như sau:
Số nhị phân Giá trị Số nhị phân Giá trị
000 0 000 0
001 1/4 001 1/4
010 1/2 010 1/2
011 3/4 011 3/4
9
Sinh viên: Nguyễn Văn Hưng MSSV: 069
9
Báo cáo thực tập
111 -1/4 100 1
110 -1/2 101 5/4
101 -3/4 110 3/2

100 -1 111 7/4
Ngoài phương pháp mã hóa tuyến tính như trên (các mức lượng tử có
cùng số bit nhị phân bằng nhau), ta còn sử dụng phương pháp mã hóa phi
tuyến. Phương pháp này sử dụng các bước lượng tử thay đổi theo biên độ tín
hiệu. Một phương pháp được chuẩn hóa bởi CCITT là luật mã hóa 13 đoạn
thường dùng trong mạng viễn thông.
Luật mã hóa 13 đoạn (13 - segment coding law) thực hiện chuyển đổi
biên độ của tín hiệu x thành tín hiệu y như sau:
1
16x 0 x
64
1 1 1
8x x
8 64 32
1 1 1
4x x
4 32 16
3 1 1
y 2x x (1.19)
8 16 8
1 1 1
x x
2 8 4
1 5 1 1
x x
2 8 4 2
1 3 1
x x 1
4 4 2


≤ ≤



+ ≤ ≤



+ ≤ ≤



= + ≤ ≤



+ ≤ ≤



+ ≤ ≤



+ ≤ ≤


10
Sinh viên: Nguyễn Văn Hưng MSSV: 069
10

Báo cáo thực tập
Hình 1.7: Mô tả luật mã hóa 13 đoạn với biên độ dương
11
Sinh viên: Nguyễn Văn Hưng MSSV: 069
11
Báo cáo thực tập
CHƯƠNG 2:
CHUẨN NÉN TÍN HIỆU SỐ GỒM CÓ
CÁC PHẦN CHUẨN SAU
1. Chuẩn MJPEG
Đây là một trong những chuẩn cổ nhất mà hiện nay vẫn sử dụng, MJPEG
(Morgan JPEG). Chuẩn này hiện chỉ sử dụng trong các thiết bị DVR rẻ tiền,
chất lượng thấp. Không những chất lượng hình ảnh kém, tốn tài nguyên xử lý,
cần nhiều dung lượng ổ chứa, và còn hay làm lỗi đường truyền.
2. Chuẩn MPEG 2
Chuẩn MPEG là một chuẩn thông dụng. Đã được sử dụng rộng rãi trong
hơn một thập kỷ qua. Tuy nhiên, kích thước file lớn so với những chuẩn mới
xuất hiện gần đây, và có thể gây khó khăn cho việc truyền dữ liệu.
Ví dụ như trong MPEG-2, nơi mà nội dung được tạo ra từ nhiều nguồn
như video ảnh động, đồ họa, văn bản… và được tổ hợp thành chuỗi các khung
hình phẳng, mỗi khung hình (bao gồm các đối tượng như người, đồ vật, âm
thanh, nền khung hình…) được chia thành các phần tử ảnh pixels và xử lý
đồng thời, giống như cảm nhận của con người thông qua các giác quan trong
thực tế. Các pixels này được mã hóa như thể tất cả chúng đều là các phần tử
ảnh video ảnh động. Tại phía thu của người sử dụng, quá trình giải mã diễn ra
ngược với quá trình mã hóa không khó khăn. Vì vậy có thể coi MPEG-2 là
một công cụ hiển thị tĩnh, và nếu một nhà truyền thông truyền phát lại chương
trình của một nhà truyền thông khác về một sự kiện, thì logo của nhà sản xuất
chương trình này không thể loại bỏ được. Với MPEG-2, bạn có thể bổ xung
thêm các phần tử đồ họa và văn bản vào chương trình hiển thị cuối cùng (theo

phương thức chồng lớp), nhưng không thể xóa bớt các đồ họa và văn bản có
trong chương trình gốc.
3. Chuẩn MPEG 4
12
Sinh viên: Nguyễn Văn Hưng MSSV: 069
12
Báo cáo thực tập
MPEG - 4 là chuẩn cho các ứng dụng MultiMedia. MPEG-4 trở thành
một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ họa
và Video tương tác hai chiều (Games, Videoconferencing) và các ứng dụng
Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm
phân phát dữ liệu Video như truyền hình cáp, Internet Video…). MPEG - 4 đã
trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và
truy cập vào các hệ thống video. Nó đã góp phần giải quyết vấn đề về dung
lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường
truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên.
Với MPEG-4, các đối tượng khác nhau trong một khung hình có thể
được mô tả, mã hóa và truyền đi một cách riêng biệt đến bộ giải mã trong các
dòng cơ bản ES (Elementarry Stream) khác nhau. Cũng nhờ xác định, tách và
xử lý riêng các đối tượng (như nhạc nền, âm thanh xa gần, đồ vật, đối tượng
ảnh video như con người hay động vật, nền khung hình…), nên người sử
dụng có thể loại bỏ riêng từng đối tượng khỏi khuôn hình. Sự tổ hợp lại thành
khung hình chỉ được thực hiện sau khi giải mã các đối tượng này.
4. Chuẩn H 2.64
Chuẩn H 2.64 VC, cũng được biết đến như là chuẩn MPEG 10, nổi lên
dẫn đầu trong lĩnh vực công nghệ nén hình ảnh tốt nhất, kích thước file nhỏ
nhất, hỗ trợ DVD, và truyền với tốc độ cao so với các chuẩn trước đó. H 2.64
cũng là một chuẩn phức hợp.
Moving Picture Experts Group (MPEG), thuộc ISO/IEC. Nhóm các
chuyên gia hình ảnh động và âm thanh kỹ thuật số. Từ năm 1998 nhóm đưa ra

tiêu chuẩn MPEG-1 nó là nền tảng để sản xuất các Video CD, đĩa CD tương
tác và các file nhạc nén MP3 sau này.
Sau đó là tiêu chuẩn MPEG-2, nó là nền tảng cho các chương trình
truyền hình kỹ thuật số và đĩa DVD.
Kế tiếp không phải là MPEG-3, người ta dự định tổ chức chuẩn này để
13
Sinh viên: Nguyễn Văn Hưng MSSV: 069
13
Báo cáo thực tập
phục vụ cho truyền hình có độ phân giải cao, nhưng sau này sáp nhập với
chuẩn MPEG-2.
MPEG-4 là tiêu chuẩn cho các phương tiện đa truyền thông tích hợp
trong trang Web tĩnh hay động, truyền hình kỹ thuật số và tương tác đồ họa
ứng dụng. MPEG-4 đang trở thành chuẩn multimedia toàn cầu trong giai đoạn
hiện nay và sẽ phát triển mạnh mẽ hơn nữa ở tương lai gần.
Tiếp theo là MPEG-7 tiêu chuẩn để mô tả nội dung đa truyền thông và
truy tìm âm thanh cũng như các nội dung trực quan khác, rồi bắt đầu từ tháng
6/2000 mới hơn nữa là chuẩn MPEG-21 "Multimedia Franmework".
Tìm hiểu về chuẩn MPEG
Chuẩn MPEG (Moving Picture Experts Group) là chuẩn nén, giải nén và
đồng bộ hóa các tín hiệu Video và Audio. Với tỷ lệ nén dữ liệu 1.2 Mbps, với
độ phân giải 352 x 240 quét 30 Hz thông thường thì chất lượng Video có thể
so sánh với chuẩn VHS.
Chất lượng hình ảnh có thể được cải thiện đáng kể bằng cách dùng tỷ lệ
nén dữ liệu lớn hơn mà không cần thay đổi độ phân giải. MPEG không phải là
một công cụ nén đơn lẻ mà ưu điểm của nén MPEG chính là ở chỗ nó có một
tập hợp các công cụ mã hóa chuẩn, chúng có thể được kết hợp với nhau một
cách linh động để phục vụ cho một loạt các ứng dụng khác nhau.
Các chuẩn MPEG hiện có gồm:
+ MPEG-1: là chuẩn lưu trữ và phục hồi ảnh động và Audio trong lưu

trữ Media, MPEG-1 có thể nén tín hiệu video tới 1.5 Mbits/s với chất lượng
VHS và âm thanh lập thể (stereo audio) với tốc độ 192 bit/s. Nó được dùng để
lưu trữ video và âm thanh trên CD-ROM.
+ MPEG-2: là chuẩn cho TV số.
+ MPEG-4: là chuẩn cho các ứng dụng MultiMedia. MPEG-4 trở thành
một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ họa
và Video tương tác hai chiều (Games, Videoconferencing) và các ứng dụng
14
Sinh viên: Nguyễn Văn Hưng MSSV: 069
14
Báo cáo thực tập
Multimedia tương tác hai chiều (World Wide Web hoặc các ứng dụng nhằm
phân phát dữ liệu Video như truyền hình cáp, Internet Video…). MPEG-4 đã
trở thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và
truy cập vào các hệ thống Video. Nó đã góp phần giải quyết vấn đề về dung
lượng cho các thiết bị lưu trữ, giải quyết vấn đề về băng thông của đường
truyền tín hiệu Video hoặc kết hợp cả hai vấn đề trên.
+ MPEG-7: chứa đặc tả thông tin, giao diện cho việc tìm kiếm thông tin.
MPEG-1 và MPEG-2 đã được chuẩn hóa trong khi MPEG-4 và MPEG-7
đang được phát triển. Dữ liệu MPEG bao gồm 2 lớp:
+ Lớp hệ thống (System Layer) chứa thông tin về thời gian (Timing) và
các thông tin khác cần thiết cho việc tách các dòng dữ liệu Video và Audio
đồng thời đồng bộ hóa Video và Audio trong quá trình phát (Playback).
+ Lớp dữ liệu nén (Compression Layer) bao gồm các dòng dữ liệu Video
và Audio.
Hệ thống giải mã sẽ tách các thông tin về thời gian từ dữ liệu hệ thống
MPEG và gửi nó đến thiết bị hệ thống khác (việc đồng bộ hóa sẽ cần thêm
nhiều thông tin về thời gian). Hệ thống giải mã cũng tách các dữ liệu Video và
Audio từ dữ liệu ban đầu, sau đó gửi chúng đến từng bộ giải mã thích hợp.
Bộ giải mã Video (Video Decoder) và Audio (Audio Decoder) giải nén

các dòng dữ liệu Video và Audio. Hầu hết các sơ đồ nén MPEG đều dùng kỹ
thuật lấy mẫu bổ xung (Sbusambling) và lượng tử hóa (Quantization) trước
khi mã hóa. Lấy mẫu bổ xung nhằm mục đích để làm giảm kích thước khung
hình đầu vào theo cả theo chiều ngang và chiều dọc, như vậy sẽ giảm số
lượng các điểm ảnh trước mã hóa. Trong một số trường hợp người ta còn lấy
mẫu bổ xung theo thời gian để làm giảm số lượng các khung hình trong cảnh
trước khi mã hóa. Đây được xem như là một kỹ thuật rất cơ bản nhằm loại bỏ
sự dư thừa dựa vào khả năng lưu ảnh của mắt người cảm thụ.
Chuẩn MPEG định nghĩa một kiểu phân cấp cấu trúc trong dữ liệu Video
15
Sinh viên: Nguyễn Văn Hưng MSSV: 069
15
Báo cáo thực tập
như sau:
- Cảnh (Video Sequence): bắt đầu với một Sequence Header, bao gồm
một hoặc một nhóm khung hình và kết thúc với mã End-of-Sequence.
-GOP (Group of Picture): một dãy liên tiếp các ảnh (Picture) trong cảnh.
- Khung hình (Picture): là thành phần mã hóa chính. Thường thường
chúng ta có thể phân biệt sự thay đổi về độ sáng của ảnh (Brightness) tốt hơn
so với sự thay đổi về màu (Chrominance). Do đó trước hết các sơ đồ nén
MPEG sẽ tiến hành chia khung hình ảnh các thành phần độ sáng Y và thành
phần độ màu Cb, Cr (một thành phần về độ sáng và hai thành phần về độ
màu). Một khung hình sẽ gồm có ba ma trận ứng với các thành phần về độ
sáng (Y) và hai thành phần về độ màu Cb và Cr.
Ma trận Y có số hàng và cột bằng nhau (ma trận vuông). Ma trận Cb và
Cr có số hàng và cột bằng nửa ma trận. Hình 3 cho thấy quan hệ và vị trí của
Y và các thành phần Cb và Cr. Lưu ý rằng cứ 4 giá trị Y lại có 2 giá trị kết
hợp một của Cb và một nửa của Cr (Vị trí của giá trị Cb và Cr là tương
đương).
- Slide: Dãy các Mảcoblock, thứ tự của các Macroblock bên trong Slide

được xác định từ trái qua phải, trên xuống dưới. Slide rất quan trọng trong
việc định lỗi. Nếu dòng dữ liệu (Bitstream) có chứa lỗi, bộ giải mã có thể bỏ
qua và tiếp tục ở Slide kế tiếp. Nhiều Slide trên dòng dữ liệu cho phép che
dấu lỗi tốt hơn và được dùng để cải thiện chất lượng hình ảnh.
- Macroblock: 16 pixel trong 16 hàng của thành phần Y tương ứng với 8
pixel trong 8 hàng của thành phần Cb và Cr. Trong hình 3 cho thấy không
gian của thành phần Y và Cb, Cr. Một Macroblock chứa 4 Y Block với 1 Cb
Block và 1 Cr Block như trong hình 4 với các con số ứng với thứ tự của
Block trong dòng dữ liệu.
- Block: là tập hợp 8 pixel trong 8 hàng các giá trị của thành phần Y hoặc
Cb, Cr.
16
Sinh viên: Nguyễn Văn Hưng MSSV: 069
16
Báo cáo thực tập
Chuẩn MPEG cũng định nghĩa cấu trúc phân cấp dữ liệu được chấp
nhận, giải mã và xuất ra Audio. Dữ liệu MPEG Audio cũng như MPEG Video
gồm hàng loạt các gói (Packet). Mỗi gói chứa Audio Packet Header và dãy
các Audio Frame.
Mỗi Audio Header chứa các thông tin sau:
+ Packet Start Code: xác định gói là Audio Parket.
+ Packet Leghth: xác định lượng thông tin trong Audio Packet.
Mỗi Audio Frame chứa các thông tin:
+ Audio Frame Header: chứa đồng bộ, ID, độ nén thông tin (Bit rate),
thông tin về tần số lấy mẫu.
+ Error Checking Code: chứa thông tin cho việc kiểm tra lỗi.
+ Audio Data: chứa thông tin.
+ Ancillary Data (dữ liệu phụ thuộc): chứa dữ liệu do người dùng xác
định.
Nén MPEG là sự kết hợp hài hòa của bốn kỹ thuật cơ bản: Tiền xử lý

(Preprocessing), đoán trước sự chuyển động của các khung hình (Picture) ở
bộ mã hóa (Temporal Prediction), bù chuyển động ở bộ giải mã (Motion
Compensation) và mã lượng tử hóa (Quatization Coding).
Các bộ lọc tiền xử lý sẽ lọc ra những thông tin không cần thiết từ tín hiệu
Video và những thông tin khó mã hóa nhưng không quan trọng cho sự cảm
thụ của mắt người. Kỹ thuật đoán chuyển động dựa trên nguyên tắc là các
khung hình trong một cảnh Video (Video Sequence) dường như có liên quan
mật thiết với nhau theo thời gian: Mỗi khung hình tại một thời điểm nhất định
sẽ có nhiều khả năng giống với các khung hình đứng ngay phía trước và ngay
phía sau nó. Các bộ mã hóa sẽ tiến hành quét lần lượt từng phần nhỏ trong
mỗi khung hình gọi là Macroblock, sau đó nó sẽ phát hiện Macroblock nào
không thay đổi từ khung hình này tới khung hình khác. Bộ mã hóa sẽ tiên
đoán trước sự xuất hiện của các Macroblock khi biết vị trí và hướng chuyển
17
Sinh viên: Nguyễn Văn Hưng MSSV: 069
17
Báo cáo thực tập
động của nó. Do đó chỉ những sự thay đổi giữa các Macroblock trong khung
hình hiện tại và các Macroblock được tiên đoán mới được truyền tới bên phía
thu. Phía bên thu tức bộ giải mã đã lưu trữ sẵn những thông tin mà không thay
đổi từ khung hình này tới khung hình khác trong bộ nhớ đệm của nó và chúng
được dùng để điền thêm một cách đều đặn vào các vị trí trống trong ảnh được
khôi phục.
Nén tín hiệu Video được thực hiện nhờ việc loại bỏ cả sự dư thừa về
không gian (Spatial Coding) và thời gian (Temporal Coding). Trong MPEG,
việc laọi bỏ dư thừa về thời gian (nén liên khung hình) được thực hiện trước
hết nhờ sử dụng các tính chất giống nhau giữa các khung hình liên tiếp (Inter-
Picture). Chúng ta có thể sử dụng tính chất này để tạo ra các khung hình mới
nhờ vào những thông tin từ những khung hình đã gửi trước nó. Do vậy ở phía
bộ mã hóa, chỉ cần gửi những khung hình có thay đổi so với những khung

hình trước trước, sau đó dùng phương pháp nén về không gian (Spatial
Coding) để loại bỏ sự dư thừa về không gian trong chính khung hình sai khác
này. Nén về không gian dựa trên nguyên tắc là phát hiện sự giống nhau của
các điểm ảnh (pixel) lân cận nhau (Intra - Picture).
6. Cơ bản về nén tín hiệu (1)
Ngày nay, MPEG (Moving Picture Group) đã trở thành một kỹ thuật nén
Audio và Video phổ biến nhất vì nó không chỉ là một tiêu chuẩn riêng biệt,
mà tùy thuộc vào yêu cầu cụ thể của từng thiết bị sẽ có khoảng tiêu chuẩn
thích hợp nhưng vẫn trên cùng một nguyên lý thống nhất. Kỹ thuật số có
những bước tiến rất nhanh, thông tin số ngày càng trở nên phổ cập hơn và có
thể mã hóa để loại bỏ những sai số một cách có hiệu quả. Điều đó có nghĩa là
loại bỏ được những mất mát thông tin trong quá trình lưu trữ và truyền dẫn.
Đĩa CD là một sản phẩm tiêu dùng đầu tiên chứng minh điều đó.
Tuy CD có sự cải thiện về chất lượng đáng kể so với trước đây, nhưng để
so sánh chất lượng một cách tuyệt đối còn phải cân nhắc. Nhưng, điểm thực tế
18
Sinh viên: Nguyễn Văn Hưng MSSV: 069
18
Báo cáo thực tập
là kỹ thuật ghi và truyền dẫn số cho phép thay đổi một cách mềm dẻo mức độ
chất lượng, điều mà kỹ thuật tương tự không thể thực hiện được. Trước tiên
tín hiệu Video và Audio được số hóa và nội dung được chuyển đổi thành dạng
số liệu. Các số liệu này được cất giữ giống như các loại số liệu chung khác.
Như vậy, tín hiệu Video và Audio đã được chuyển đổi thành số liệu và có thể
xử lý bằng công nghệ máy tính.
Sự hội tụ của kỹ thuật máy tính và Audio/ Video dẫn tới việc tìm ra mối
liên hệ mấu chất giữa kỹ thuật tính toán và kỹ thuật mã hóa xung (Pulse Code
Modulation). Phương tiện giao tiếp số có thể lưu trữ bất kỳ loại thông tin số
nào, nhưng sẽ thuận lợi hơn khi sử dụng những thiết bị lưu trữ của máy tính
để lưu trữ tín hiệu Audio và Video. Một trạm làm việc phi tuyến tính chính là

ví dụ đầu tiên về ứng dụng của sự hội tụ công nghệ mà không cần đến phần
tương tự (Analogue) dẫn trước. Một ví dụ khác, kỹ thuật đa phương tiện
Multimedia là sự kết hợp bộ nhớ của các loại khác nhau như Audio, Video,
Graphic, Text và các dữ liệu khác.
a. Nguyên nhân nén tín hiệu
Có hai kỹ thuật nén cơ bản có thể áp dụng để giảm bớt số lượng số liệu
truyền tải nội dung thông tin. Về cơ bản các hệ thống nén là sự kết hợp của
hai nguyên lý này nhưng với nhiều cách thực hiện khác nhau.
Kỹ thuật thứ nhất là cải thiện hiệu quả mã hóa. Có rất nhiều phương
pháp để mã hóa một lượng thông tin có sẵn, và hầu hết các số liệu Video và
Audio đơn giản đều chứa phần dư thừa. Khái niệm Entropy sẽ được đề cập ở
phần sau.
Có nhiều phương pháp được sử dụng để loại bỏ phần dư thừa; như hệ
thống mã (run-length coding) và mã hóa có độ dài thay đổi như mã Huffman.
Khi được sử dụng hợp lý, kỹ thuật này cho phép chuyển đổi ngược một cách
hoàn hảo để sao cho sau khi phân tích, dữ liệu nhận được giống như dữ liệu
gốc đưa vào hệ thống. Đây là loại nén không tổn hao. Các chương trình lưu
19
Sinh viên: Nguyễn Văn Hưng MSSV: 069
19
Báo cáo thực tập
trữ máy tính như PKZip sử dụng nén không tổn hao.
Rõ ràng, nén không tổn hao là lý tưởng, nhưng nó không thể đáp ứng
được mức độ nén mà các thiết bị Audio và Video yêu cầu. Tuy nhiên vì nó là
nén không tổn hao nên người ta có thể bố trí nó tại bất cứ điểm nào trong hệ
thống, và thực tế chúng hay được lắp ở tầng cuối của hệ thống nén có tổn hao.
Nếu như việc loại bỏ phần dư thừa không làm giảm đáng kể như yêu cầu
đặt ra thì có thể bỏ đi một phần thông tin có ích. Hệ thống nén có tổn hao loại
bỏ số liệu bằng cách bớt đi những thông tin không liên quan hoặc ít liên quan.
Đây không phải là kỹ thuật chung có thể cung cấp cho mọi dòng dữ liệu; việc

đánh giá tính liên quan có thể chỉ được tạo ra bởi tình huống cụ thể của từng
ứng dụng, với sự hiểu biết về loại số liệu cụ thể hay mục đích sử dụng chúng.
Đối với kỹ thuật truyền hình thì hình ảnh và âm thanh và hình ảnh của con
người để thiết kế hệ thống nén phù hợp.
Một số thông tin trong tín hiệu Video sẽ không thể cảm nhận được bằng
hệ thống mắt người, do vậy đây thực sự là thông tin rất quan trọng để loại bỏ
phần dư thừa sinh lý này cho hệ thống. Một hệ thống nén loại bỏ phần thông
tin hình ảnh không liên quan được hiểu như một hệ thống nén không tổn hao.
b. Nén trong các thiết bị truyền hình
Tín hiệu truyền hình, dù là tương tự hay số đều mang một lượng thông
tin rất lớn, vì vậy kỹ thuật làm giảm băng tần luôn được sử dụng trong mọi
phạm vi hoạt động. Có thể kỹ thuật quét cách dòng là ví dụ đầu tiên thực hiện
việc làm giảm độ rộng băng tần của tín hiệu truyền hình. Với một số lượng
dòng quét và tỷ lệ khuôn hình xác định, quét cách dòng đã giảm độ rộng băng
tần yêu cầu xuống còn một nửa. Quá trình này không làm mất thông tin, quét
cách dòng đã tạo ra một cảm giác giả do sự tác động giữa thông tin về mặt
(vertical) và thông tin về thời gian, vì vậy đã giảm được độ phân giải về mặt
(vertical) của hình ảnh.
Tuy nhiên, do đã bỏ đi số lượng lớn các thành phần không liên quan nên
20
Sinh viên: Nguyễn Văn Hưng MSSV: 069
20
Báo cáo thực tập
quét cách dòng chỉ là cách biểu diễn đơn giản và có giá trị trong thời điểm ra
đời mà thôi. Thật không may khi quét cách dòng và hiệu ứng giả mà nó tạo ra
lại làm rối loạn và gây phức tạp cho sơ đồ nén số. Cấu trúc MPEG-2 trở nên
phức tạp hơn rất nhiều khi phải cố gắng duy trì tín hiệu quét cách dòng, đồng
thời đây còn là nguyên nhân gây mất mát thông tin trong mã hóa hiệu quả so
với tín hiệu quét liên tục.
Ví dụ đáng kể tiếp theo là việc giảm băng tần đối với tín hiệu màu.

Camera màu tạo ra tín hiệu RGB, bình thường thì ba tín hiệu này tạo ra lượng
thông tin lớn gấp ba lần tín hiệu chói - nhưng trong truyền dẫn, ba tín hiệu
màu được truyền đi với băng thông chỉ bằng tín hiệu đen trắng.
Phần đầu tiên được truyền đi là tín hiệu độ sáng (thông thường là tín hiệu
Y) cộng với hai thành phần màu U và V, hoặc I và Q. Thông thường tín hiệu
độ sáng được truyền đi bằng kênh dẫn tương ứng với tín hiệu đen trắng, còn
tín hiệu màu được hạn chế về băng tần.
Về mặt sinh học, hệ thống mắt người rất nhạy cảm đối với độ sáng, và có
thể nhìn hình ảnh với độ phân giải rất cao. Nhưng mắt người lại không nhạy
cảm với thành phần màu và nó cảm nhận màu sắc với độ phân giải tương đối
thấp. Kết quả là với một giới hạn băng tần, tín hiệu đen trắng thu nhận được là
không rõ ràng thì các thông tin về màu sắc vẫn sắc nét. Rõ ràng là không thể
tận dụng được đặc điểm này khi ta làm việc với tín hiệu RGP khi mỗi tín hiệu
đều bao gồm cả thành phần độ sáng và màu sắc. Tuy nhiên, trong không gian
YUV, hầu hết thông tin về độ sáng đều được thể hiện qua tín hiệu Y và chỉ có
một phần rất nhỏ chứa đựng trong tín hiệu hiệu màu. Vì vậy có thể lọc bớt tín
hiệu màu để giảm bớt thông tin cho truyền dẫn.
Một số kỹ thuật trong thế giới số là hoàn toàn khác nhau nhưng lại có
chung một nguyên lý. Ví dụ MPEG chuyển đổi tín hiệu sang dạng hiệu để
đơn lập thông tin không liên quan.
Trong hệ thống truyền hình truyền thống, tín hiệu RGB của Camera
21
Sinh viên: Nguyễn Văn Hưng MSSV: 069
21
Báo cáo thực tập
được chuyển đổi thành tín hiệu Y, Pb, Pr thành phần dùng cho quá trình sản
xuất và mã hóa thành tín hiệu Video composite để truyền dẫn. Trong các thiết
bị hiện đại ngày nay, tín hiệu này được chuyển đổi thành Y, Cr, Cb dưới dạng
tín hiệu số nối tiếp (SDI) cho quá trình sản xuất hay mã hóa MPEG cho
truyền dẫn (hình vẽ 1). Rõ ràng MPEG là giải pháp để các nhà quảng bá lựa

chọn để thay thế hiệu quả cho tín hiệu Video composite. Nhìn chung, MPEG
có khả năng linh hoạt hơn rất nhiều so với mã hóa Video composite vì tốc độ
bit có thể điều chỉnh một cách tùy ý để phù hợp với lĩnh vực ứng dụng. Với
tốc độ bit và độ phân giải thấp, MPEG có thể dùng cho các hội thảo Video
hay ứng dụng Video phone.
Hình 1
DVB và ATSC (tiêu chuẩn truyền hình số quảng bá của Châu Âu và Mỹ)
Sẽ không thể tồn tại được nếu không áp dụng nén tín hiệu vì giải thông yêu
cầu là quá lớn.
Nén tín hiệu còn cho phép kéo dài thời gian phát của các DVD (Digital
Virsatile Disk), cho phép ghi chọn một phim dài lên một đĩa, không gây cảm
giác khó chịu cho người xem khi phải dừng lại để thay đĩa.
c. Nén tín hiệu Video
Trong tất cả các chương trình gốc, có hai loại thành phần của tín hiệu:
thành phần tín hiệu mới không thể đoán trước được và thành phần tín hiệu có
thể cảm thấy trước được. Thành phần tín hiệu mới được gọi là Entropy và đó
chính là phần mang thông tin của tín hiệu. Phần còn lại của tín hiệu được gọi
là phần dư thừa. Phần dư thừa có thể là không gian, đó là khoảng không gian
22
Sinh viên: Nguyễn Văn Hưng MSSV: 069
22
Báo cáo thực tập
rộng của hình ảnh nơi mà các pixel liền kề có giá trị gần giống nhau. Dưa
thừa còn có thể là thời gian, đó là loại dư thừa mà hình ảnh kế tiếp giống như
hình ảnh trước đó. Tất cả các hệ thống nén tín hiệu đều hoạt động trên nguyên
tắc tách Entropy ra khỏi phần dư thừa tại bộ mã hóa. Chỉ thành phần Entropy
mới được ghi lại hoặc truyền đi và bộ giải mã sẽ được tính toán để loại bỏ
phần dư thừa khỏi tín hiệu có ích (xem hình 2-a).
Hình 2
Bộ mã hóa lý tưởng sẽ tách ra toàn bộ phần Entropy và chỉ truyền phần

Entropy này tới bộ giải mã. Một bộ giải mã lý tưởng sẽ tái tạo được tín hiệu
nguyên gốc. Trong thực tế, bộ mã hóa lý tưởng sẽ rất phức tạp và sẽ tốn rất
nhiều thời gian cho việc tính toán phần dư thừa. Trong một số ứng dụng cụ
thể nào đó chẳng hạn như ghi hình hay phát quảng bá thì có thể chấp nhận
được sự trễ này, nhưng sẽ là không thể đối với các ứng dụng hội thảo Video.
Một bộ phận mã hóa lý tưởng sẽ rất đắt tiền, vì vậy thực tế không có một hệ
thống nén lý tưởng.
Trong thực tế, mức độ yêu cầu của bộ mã hóa tùy thuộc vào mức độ trễ
của quá trình xử lý và độ phức tạp của nó. Cách mà bộ mã hóa thực hiện trong
quá trình nén số liệu được thông báo cho bộ giải mã để bộ giải mã có thể tự
động phát hiện ra phần việc mà bộ mã hóa đã làm.
Trong MPEG-2, việc mã hóa được phân ra nhiều Profile có độ phức tạp
khác nhau, và trong mỗi Profile này có thể thực hiện một mức khác nhau tùy
23
Sinh viên: Nguyễn Văn Hưng MSSV: 069
23
Báo cáo thực tập
thuộc vào độ phân giải của tín hiệu đầu vào.
Có rất nhiều định dạng Video số khác nhau và mỗi định dạng này lại có
một tốc độ bit. Ví dụ như hệ thống truyền hình độ phân giải cao có tốc độ bit
cao gấp khoảng 6 lần so với hệ truyền hình tiêu chuẩn. Tuy nhiên, nếu chỉ
quan tâm đến tốc độ bit ở đầu ra của bộ mã hóa là chưa đủ. Cần lưu ý đến vấn
đề hệ số nén, đó là tỷ số giữa tốc độ bit đầu vào với tốc độ bit nén, ví dụ như:
2:1, 5:1 v.v…
Tuy nhiên, trong thực tế do có sự tham gia bởi nhiều yếu tố khác nhau
nên việc xác định hệ số nén rất khó khăn. Đối với một bộ mã hóa lý tưởng,
nếu toàn bộ phần Entropy được truyền đi sẽ cho chất lượng tốt. Nhưng, nếu
hệ số nén tăng lên trong khi giảm tốc độ bit thì không phải toàn bộ Entropy
được truyền đi, do vậy lại làm giảm chất lượng. Trong một hệ thống nén, nếu
xuất hiện hiện tượng giảm chất lượng thì đó là điều không chấp nhận được.

Nếu tốc độ bit không đầy đủ thì cách tốt hơn là ngăn ngừa hiện tượng này
bằng cách giảm nhỏ Entropy của hình ảnh đầu vào. Việc này được thực hiện
bằng các bộ lọc. Nhưng cách này có thể gây ra việc làm giảm độ phân giải
hình ảnh.
Để nhận biết Entropy một cách hoàn hảo, người ta sử dụng một bộ xử lý
lý tưởng có độ siêu phức tạp. Một bộ xử lý thực tế có thể kém phức tạp hơn
do vấn đề kinh tế và bắt buộc phải gửi đi số lượng số liệu nhiều hơn để đảm
bảo truyền hết được Entropy.
Entropy của các loại tín hiệu khác nhau là khác nhau, ví dụ như hình ảnh
ghi một phát thanh viên có độ dư thừa rất cao, vì vậy dễ dàng cho nén tín
hiệu. Ngược lại, sẽ rất khó khăn cho việc nén tín hiệu của những chiếc lá đung
đưa trước gió hay tín hiệu bóng đá, đó là những đối tượng luôn luôn thay đổi
và có độ dư thừa rất nhỏ (có nhiều thông tin hơn và Entropy lớn hơn). Trong
trường hợp này, nếu toàn bộ Entropy không được truyền đi sẽ làm giảm chất
lượng. Vì vậy, chúng ta có thể lựa chọn giữa hai phương án, hoặc kênh truyền
24
Sinh viên: Nguyễn Văn Hưng MSSV: 069
24
Báo cáo thực tập
có tốc độ bit không đổi nhưng có chất lượng thay đổi, hoặc có chất lượng
không đổi nhưng tỷ lệ bit thay đổi.
Mạng viễn thông lựa chọn phương án tốc độ bit không đổi cho các mục
đích thực tế, nhưng một bộ nhớ đệm được sử dụng để điều tiết Entropy trung
bình khi có xảy ra hiện tượng tăng độ trễ. Trong lĩnh vực ghi hình, một tốc độ
bit có thể dễ dàng điều hành hơn, chẳng hạn DVD dùng phương án tốc độ bit
thay đổi, sử dụng bộ đệm để duy trì tốc độ bit trung bình trong khả năng của
hệ thống đĩa.
Intra - coding (intra = within = trong) là kỹ thuật khai thác những dư
thừa không gian trong hình ảnh; Inter coding (inter = between = liên) là kỹ
thuật khai thác những dư thừa về thời gian. Intra - coding có thể sử dụng độc

lập, sử dụng độc lập, như trong tiêu chuẩn JPEG cho ảnh tĩnh, còn MPEG là
sự kết hợp giữa Intra - coding và Inter - coding.
Intra - coding nhận biết hai đặc điểm nổi bật của hình ảnh. Thứ nhất,
không phải tất cả tần số không gian đều xuất hiện đồng thời, thứ hai, ứng với
tần số không gian càng cao thì biên độ tương ứng càng thấp. Intra - coding
yêu cầu phân tích tần số không gian trong một bức ảnh. Điều phân tích này
nhằm biến đổi Wavelet hoặc DCT (Discrete Cosine Tranform). Quá trình biến
đổi này là phép hệ số hóa các biên độ của mỗi tần số không gian. Điều đặc
biệt là đa số các hệ số này đều bằng không hoặc xấp sỉ bằng không và vì vậy
các hệ số này có thể bỏ qua mà không làm giảm đáng kể đến tốc độ bit.
Inter - coding tìm ra những điểm tương đồng giữa các ảnh kế tiếp nhau.
Nếu một ảnh đã được gửi tới bộ giải mã, ảnh tiếp theo chỉ cần gửi những
thông tin khác biệt với ảnh trước đó. Sự khác biệt của các ảnh sẽ tăng lên khi
các đối tượng chuyển động, nhưng sự thay đổi này có thể được bù đắp lại
bằng cách dùng bù chuyển động khi sự chuyển động của đối tượng là không
quá lớn. Nếu sự chuyển động này có thể đo đạc được thì phép gần đúng sẽ
chính xác hơn bằng cách dịch chuyển phần hình ảnh trước đó sang vị trí mới.
25
Sinh viên: Nguyễn Văn Hưng MSSV: 069
25

công nghệ thông tin Công nghệ số

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về