Tải bản đầy đủ (.doc) (44 trang)

đồ án truyền dẫn tín hiệu truyền hình số

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (447.45 KB, 44 trang )

Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
MỤC LỤC
1.2.Cơ chế nén MPEG-2 4
2.Nguyên tắc chuyển đổi A/D 9
2.2.Lượng tử hóa 12
2.3.Mã hóa 13
I.Dòng cơ sở (elementary stream) 16
II.Dòng cơ sở đóng gói (packetized elementary stream) 19
1.Giới thiệu chung về dòng cơ sở đóng gói 19
2.Cú pháp dòng cơ sở đóng gói 22
II.Ghép kênh dòng truyền tải (Transport Stream MUX) 29
1.Giới thiệu chung về dòng truyền tải: 29
2.Cấu trúc gói truyền tải 31
4.Thông tin đặc tả chương trình (PSI) 39
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 1
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Chương I
MÃ HÓA
I. MÃ HÓA VIDEO
1. Mã hóa MPEG -2 :
1.1. Khái quát chung
MPEG-2 là một tiêu chuẩn mã hóa nén (thường được gọi tắt là chuẩn nén)
trong bộ tiêu chuẩn MPEG dùng để mã hóa luồng dữ liệu hình có kết hợp với các
thông tin về âm thanh. Đây là một phương thức mã hóa dữ liệu có tổn hao cho phép
lưu trữ và truyền phim ảnh trên nền hệ thống và băng thông hiện thời. MPEG-2
được mở rộng dựa trên chuẩn MPEG để hỗ trợ việc nén dữ liệu để truyền Video số
chất lượng cao. Để hiểu được tại sao nén Video là rất quan trọng, ta cần tìm hiểu
băng thông (Bandwidth) cần thiết để truyền các khung hình Video số không nén.
Tín hiệu video số sau khi nén MPEG-2 có dạng một dòng dữ liệu cơ sở video
(Elementary Stream - ES) với chiều dài gần như vô tận và chỉ chứa những thông tin
tối cần thiết để có thể khôi phục lại hình ảnh ban đầu.


PAL (Phase Alternate Line) là chuẩn để truyền tín hiệu TV tuần tự (Analog)
được sử dụng ở khá nhiều nước trên thế giới. Khung hình TV dùng PAL không nén
đòi hỏi băng thông rất lớn tới 216 Mbps, lớn hơn rất nhiều khả năng của truyền
sóng radio. Một số nước dùng hệ thống Analog TV là NTSC. Hệ thống này cung
cấp các thông tin về màu sắc kém trung thực hơn với tỉ lệ truyền các khung khác
nhau. Tín hiệu NTSC không nén đòi hỏi dung lượng đường truyền thấp hơn không
đáng kể ở mức 168 Mbps. TV độ phân giải cao HDTV (High Definition TV) yêu
cầu băng thông tối thiểu là 1 Gbps.
Do chuẩn MPEG-2 cung cấp khả năng nén rất cao bằng cách dùng các thuật
toán tiêu chuẩn, nó trở thành chuẩn cho TV số với các đặc tính:
+Nén Video tương thích với MPEG-1.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 2
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
+Chế độ Full-screen kết hợp với cải tiến chất lượng Video (cho TV và màn
hình PC).
+Cải tiến mã hoá Audio (chất lượng cao, mono, stereo ).
+Truyền phối hợp nhiều thành phần.
+Các dịch vụ khác.
Các hệ thống sử dụng MPEG-2 đang rất phát triển như: TV số, VoD, Digital
Versatile Disc (DVD) Thuật toán nén Video MPEG-2 đạt được khả năng nén cao
nhờ lợi dụng sự dư thừa in thông tin Video. MPEG-2 loại bỏ cả dư thừa về không
gian và dư thừa về thời gian trong các cảnh Video.
Dư thừa thời gian xuất hiện khi các khung Video liên tiếp hiển thị hình ảnh
của những hình ảnh giống nhau. Nó chứa các hình ảnh gần như không đổi hoặc thay
đối rất nhỏ giữa các khung hình liên tiếp. Dư thừa không gian xảy ra khi một phần
của ảnh được tái tạo lại (với thay đổi không đáng kể) trong một khung Video.
Dữ liệu từ các Macroblock cần được mã hoá sẽ được đưa đến cả bộ trừ
(Subtractor) và bộ đoán chuyển động (Motion Estimator). Bộ đoán chuyển động sẽ
so sánh các Macroblock mới được đưa vào này với các Macroblock đã được đưa
vào trước đó và được lưu lại dùng để tham khảo. Kết quả là bộ đoán chuyển động sẽ

tìm ra các Macroblock trong khung hình tham khảo gần giống nhất với Macroblock
mới này. Bộ đoán chuyển động sau đó sẽ tính toán Vector chuyển động (Motion
Vector), Vector này sẽ đặc trưng cho sự dịch chuyển theo cả hai chiều dọc và ngang
của Macroblcok mới cần mã hoá so với khung hình tham khảo. Lưu ý rằng Vector
chuyển động có độ phân giải bằng một nửa do thực hiện quét xen kẽ.
Hình 1: Dự đoán chuyển động.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 3
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Bộ đoán chuyển động cũng đồng thời gửi các Macroblock tham khảo được
gọi là các Macroblock tiên đoán (Predicted Macroblock) tới bộ trừ để trừ với
Macroblock mới cần mã hoá. Từ đó ta sẽ được các sai số tiên đoán (Error
Prediction) hoặc tín hiệu dư, chúng sẽ đặc trưng cho sự sai khác giữa Macroblock
cần tiên đoán và Macroblock thực tế cần mã hoá.
Tín hiệu dư hay sai số tiên đoán này sẽ được biến đổi DCT, các hệ số nhận
được sau biến đổi DCT sẽ được lượng tử hoá để làm giảm số lượng các bits cần
truyền. Các hệ số này sẽ được đưa tới bộ mã hoá Huffman, tại đây số bits đặc trưng
cho các hệ số tiếp tục được làm giảm đi một cách đáng kể. Dữ liệu từ đầu ra của mã
hoá Huffman sẽ được kết hợp với Vector chuyển động và các thông tin khác (thông
tin về I, P, B-picture) để gửi tới bộ giải mã.
Đối với trường hợp P-picture, các hệ số DCT cũng được đưa đến bộ giải mã
nội bộ (nằm ngay trong bộ mã hoá). Tín hiệu dư hay sai số tiên đoán được biến đổi
ngược lại dùng phép biến đổi IDCT và được cộng thêm vào khung hình đứng trước
để tạo nên khung hình tham khảo (tiên đoán). Vì dữ liệu khung hình trong bộ mã
hoá được giải mã luôn nhờ vào bộ giải mã nội bộ ngay chính bên trong bộ mã hoá,
do đó có thể thực hiện thay đổi thứ tự các khung hình và dùng các phương pháp tiên
đoán ở trên.
1.2. Cơ chế nén MPEG-2
Tất cả các chuẩn quốc tế hiện tại cho nén video như là MPEG-1,2,4, ITU-T
H261, H263, H264 đều là các sơ đồ mã hóa lai . Các sơ đồ này dựa trên các nguyên
lý của dự đoán bù chuyển động và mã hóa chuyển đổi trên cơ sở khối.

SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 4
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Hình 2: Mô hình sơ đồ khối bộ mã hóa MPEG-2
Các khung mã hóa Intra (các khung I) được phân chia thành các khối 8x8
pixels. Các khối này tiếp theo được nén sử dụng DCT, lượng tử hóa (Q), quét
zigzag, mã hóa Entropy (sử dụng kỹ thuật mã hóa có độ dài từ mã thay đổi VLC).
Các khung mã hóa Inter (các khung B và P) là kết quả của bù chuyển động bằng
cách trừ đi một dự đoán đã được bù chuyển động. Các khung dư (khung sai số) sau
đó được chia thành các khối 8x8 pixel và được nén theo cách giống như với các
khối của khung I.
- Biến đổi cosine rời rạc (DCT)
Biến đổi cosine rời rạc là một công cụ toán học xử lý các tín hiệu như ảnh
hay video. Nó sẽ chuyển đổi các tín hiệu từ miền không gian sang miền tần số và
biến đổi ngược lại từ miền tần số quay trở lại miền không gian mà không gây tổn
hao đến chất lượng. Lý do chọn biến đổi cosine cho xử lý ảnh số là: đầu tiên, nó có
thể loại bỏ sự tương quan giữa các pixel ảnh trong miền không gian. Thứ hai là biến
đổi cosine rời rạc yêu cầu ít sự phức tạp tính toán và tài nguyên hơn .
- Lượng tử hóa các hệ số DCT
Sau khi biến đổi cosine rời rạc, sự tương quan giữa các pixel của một ảnh
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 5
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
trong miền không gian đã được giải tương quan thành các tần số rời rạc khác nhau
trong miền tần số. Do sự cảm nhận thị giác của con người là rất nhạy với hệ số DC
và các tần số thấp, một phương pháp lượng tử hóa vô hướng được thiết kế cẩn thận
có thể giảm sự dư thừa dữ liệu mà vẫn dữ được tính trung thực của ảnh.
- Quét zigzag các hệ số DCT.
Sau khi biến đổi DCT ta thu được các khối 8x8 biểu diễn cho các hệ số tần
số. Trong khối này thì các hệ số tần số thấp sẽ tụm lại ở góc cao phía trái của ma
trận DCT. Quét zigzag sẽ sắp xếp lại thứ tự của ma trận để các hệ số được sắp xếp
theo tần số theo thứ tự tăng dần.

- Mã hóa Entropy
Sau DCT và lượng tử hóa là các thuật toán miền mã. Các thuật toán này
thường được gọi là mã hóa Entropy, bao gồm mã hóa Huffman, mã hóa số học…,
đây là phương pháp mã hóa không tổn hao. Ý tưởng cơ bản của mã hóa Entropy là
các biểu tượng thường xuyên xuất hiện sẽ được mã hóa bằng các bít ngắn, trong khi
đó các biểu tượng ít xuất hiện hơn sẽ được mã hóa bằng các bít dài hơn. Phương
pháp này còn gọi là mã hóa có độ dài từ mã thay đổi (VLC), và một phương pháp
cho hiệu quả cao là mã hóa Huffman. Điều này sẽ làm cho tốc độ bit của luồng
giảm đáng kể.
- Ước lượng và bù chuyển động
Nén video có thể đạt được với việc lấy mẫu không gian màu, loại bỏ các hệ
số DCT tần số cao, lượng tử hóa, mã hóa không tổn hao, dự đoán và bù chuyển
động trong miền thời gian. Chuẩn MPEG chấp nhận việc dự đoán và bù chuyển
động dựa trên khối trong miền không gian. Thực tế, dự đoán và bù chuyển động
cũng làm việc trong miền DCT vì các biến vị trí trong miền không gian có thể
chuyển đổi với các biến tần số trong miền DCT.
Quá trình khôi phục lại khung hình tại bộ giải mã là hoàn toàn ngược lại. Từ
luồng dữ liệu nhận được ở đầu vào, Vector chuyển động được tách ra và đưa vào bộ
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 6
Remove
Intra-Frame
Redundancy
Rate
Control
Quantise
Sample
Run-Length
Compress
Buffer
Store

Remove
Inter-Frame
Redundancy
Analogue
video
sampling
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
bù chuyển động (Motion Compensator), các hệ số DCT được đưa vào bộ biến đổi
ngược IDCT để biến tín hiệu từ miền tần số thành tín hiệu ở miền không gian. Đối
với P-picture và B-picture, Vector chuyển động sẽ được kết hợp với các
Macroblock tiên đoán để tạo thành các khung hình tham khảo.
Không cần thiết phải luôn nén mọi khung hình Video cùng một mức độ, một
phần của Clip có thể có độ dư thừa không gian thấp (ví dụ các hình ảnh phức tạp)
trong khi đó các phần khác của Clip lại có độ dư thừa thời gian thấp (ví dụ các cảnh
chuyển động nhanh). Vì thế dữ liệu Video đương nhiên sẽ ở các tỉ lệ nén (Bit rate)
thay đổi trong khi việc truyền dữ liệu thường yêu cầu tốc độ cố định. Chìa khoá để
điều khiển tốc độ truyền là trật tự dữ liệu đã nén trong bộ đệm (Buffer).Việc nén có
thể được tiến hành với việc loại bỏ một vài thông tin đã được lựa chọn. Ảnh hưởng
nhỏ nhất đối với chất lượng toàn bộ khung hình có thể đạt được bằng cách bỏ bớt
các thông tin chi tiết. Điều này đảm bảo giới hạn tỉ lệ nén dữ liệu trong khi chất
lượng của khung hình suy giảm tối thiểu.
Hình 3: Cơ chế nén MPEG II.
MPEG-2 bao gồm cơ chế nén trong một phạm vi rộng. Một bộ mã hoá với cơ
chế nén phải phù hợp với một hoặc đoạn cảnh riêng biệt. Nói chung bộ mã hoá rất
phức tạp, nó phải lựa chọn được cơ chế nén thích hợp nhất bởi vậy tăng chất lượng
khung hình đối với tỉ lệ nén dữ liệu truyền. Bộ giải mã MPEG-2 cũng có nhiều kiểu,
khả năng đa dạng và các lựa chọn khi kết nối.
Số lượng các Level và Profile được định nghĩa cho việc nén Video MPEG-2.
Hệ thống MPEG-2 được phát triển trên một tập nào đó các Level và Profile:
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 7

Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
+Profile: chất lượng của Video.
+Level: độ phân giải của Video.
Hệ thống cơ bản với tên MPML (Man Profile Man Level) nén dữ liệu Video
từ 1-15 Mbps. Các Level khác nhau như: High Level, High Level 1440, Low Level
và các Profile như: Simple, SNR, Spatial, 4:2:2 & High.
Các bộ giải mã điển hình:
+ 720 x 576 x 25 fps (PAL CCIR 601).
+ 352 x 576 x 25 fps (PAL Half-D1).
+ 720 x 480 x 30 fps (NTSC CCIR 601).
+ 352 x 480 x 30 fps (NTSC Half-D1).
Hầu hết các bộ giải mã đều hỗ trợ MPEG-1:
+ 352 x 288 x 25 fps (PAL SIF).
+ 352 x 240 x 30 fps (NTSC SIF).
Chuẩn MPEG-2 định nghĩa một sự phối hợp mã hoá Audio. Audio số có thể
được mã hoá trong các dạng mã hoá khác nhau ở các tỉ lệ nén khác nhau.MPEG-2
cũng cung cấp các hỗ trợ cho việc truyền dữ liệu. MPEG-2 phân biệt hai kiểu dữ
liệu:
+ Service Information: thông tin về Video, Audio và Data truyền bởi MPEG-
2.
+ Private Data: thông tin người sử dụng hoặc thiết bị thu.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 8
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
II. MÃ HÓA AUDIO
1. Tín hiệu Audio số
Hiện nay ,các thiết bị Audio số đã dần chiếm lĩnh và thay thế các thiết bị
Audio tương tự trong phát sóng và sản xuất.
Ưu điểm của tín hiệu Audio số như:
Độ méo tín hiệu nhỏ một cách lý tưởng (0.1%).
Dải động âm thanh lớn gần ở mức tự nhiên (> 90dB).

Tuyến tần số bằng phẳng (±0.5 dB)
Việc tìm kiếm dữ liệu nhanh chóng, dễ dàng, độ bền ổn định lâu dài… . Kết
quả là đã cải thiện chất lượng ghi xử lý âm thanh, đồng thời nó đáp ứng được nhu
cầu lưu trữ và các hệ thống sản xuất chương trình bằng máy tính.
Tiêu chuẩn Audio số ra đời với sự liên kết giữa hai Hiệp hội kỹ thuật : Audio
AES và EBU (Hiệp hội truyền thanh truyền hình châu Âu) . Nó hạn chế hiện tượng
méo tín hiệu âm thanh trong hai quá trình biến đổi tương tự – số và ngược lại, từ đó
chất lượng âm thanh được nâng cao rõ rệt.
2. Nguyên tắc chuyển đổi A/D
Các bước của quá trình biến đổi A/D tín hiệu âm thanh là:
- Lấy mẫu (rời rạc hoá theo thời gian).
- Lượng tử hoá (rời rạc hoá theo biên độ).
- Mã hoá (gán giá trị nhị phân cho các mẫu).
2.1.Lấy mẫu
- Lấy mẫu lí tưởng
Nguyên lý lấy mẫu là quá trình lấy biên độ của dạng sóng tương tự tại từng
thời điểm theo một chu kỳ nhất định.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 9
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Thực chất quá trình lấy mẫu bao gồm việc nhận các tín hiệu tương tự với một
chuỡi xung truyền lặp đi lặp lại theo thời gian có tần số là tần số lấy mẫu.
Chúng ta sẽ tìm hiểu trường hợp lấy mẫu lý tưởng với khoảng thời gian xung
lấy mẫu gần bằng 0.
Phổ của dãy PAM (trong miền tần số)
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 10
Biên
độ
t
Phổ tín hiệu
Audio

F
max
Biên
độ
tf
s
-f
max
2f
s
Phổ tín hiệu
Audio lấy
mẫu
Điều chế
biên độ
f
s
2f
s
3f
s
t
Phổ tần số lấy
mẫu “sóng
mang”
f
s
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Khôi phục tín hiệu Audio tương tự
Quá trình lấy mẫu và kết quả dãy PAM (trong miền thời gian)

- Lấy mẫu thực tế
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 11
Tín hiệu lấy
mẫu
(PAM)
Biên
độ
t
Biên
độ
tf
s
2f
s
Phổ tín hiệu
Audio lấy
mẫu
Lọc thông
thấp
Biên độ Tín hiệu
Audio
t
Biên
độ
t
Phổ tín hiệu
Audio
F
max
t

Biên độ Tín hiệu Audio
t
Điều chế
biên độ
Biên độ
t
Xung lấy mẫu
Biên độ
Tín hiệu lấy
mẫu
(PAM)
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Trong thực tế, trong thời gian cho phép của bộ chuyển đổi A/D, giá trị biên
độ xung cho mỗi mẫu sẽ được duy trì đến tận thời gian mẫu tiếp theo được lấy.Vì
vậy, tạo ra tín hiệu Audio tương tự đã được lấy mẫu có dạng bậc thang, khoảng thời
gian tồn tại này đúng bằng chu kỳ lấy mẫu (1/f
sa
).
Quá trình lấy mẫu thực tế
2.2. Lượng tử hóa
Từng mẫu của tín hiệu tương tự nguyên thuỷ được ấn định cho một giá trị mã
số nhị phân bởi một thiết bị còn gọi là bộ lượng tử hoá. VD : 4 bít -> 16 bit giá trị
nhị phân để mã hoá tương ứng biên độ xung cho mỗi mẫu.
Tín hiệu Audio tương tự có biên độ thấp được lượng tử hoá với rất ít các mức
rời rạc. Điều này gây nên lỗi lượng tử của các tín hiệu vào mức thấp. Vì vậy, để
giảm độ lớn của lỗi lượng tử có thể bằng cách tăng mức số rời rạc.
Nếu biên độ tín hiệu Audio tương tự vượt qua vùng lượng tử, khi đó quá
trình cắt số sẽ được thực hiện.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 12
Biên độ

Tín hiệu Audio
t
Điều chế
biên độ
Xung lấy mẫu
t
Biên độ
Tín hiệu đã lấy
mẫu
t
Biên độ
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
2.3. Mã hóa
Mỗi giá trị nhị phân sau khi lượng tử hoá được mã hoá theo một cấu trúc
thích hợp để tạo nên cấu trúc mẫu tín hiệu phục vụ cho truyền dẫn và các thiết bị
lưu trữ. Hầu hết, các hệ thống mã hoá đều sử dụng phương pháp điều xung mã
(PCM), điều chế xung rộng (PWM), mã hoá vi sai (DPCM), điểm di động .
- Điều chế xung mã PCM
Điều xung mã PCM là quá trình biến đổi tương tự sang số ( A/D ) trong đó
thông tin đầu vào dưới dạng các mẫu tín hiệu tương tự được biến đổi thành các tổ
hợp mã nối tiếp ở đầu ra
 Điều xung mã PCM bao gồm 3 quá trình:
1. Lấy mẫu
2. Lượng tử hoá
3. Mã hoá
Để chuyển đổi tín hiệu analog thành tín hiệu digital dùng phương pháp PCM,
cần thực hiện 3 bước như hình dưới.
Trước hết phải lấy mẫu tín hiệu thoại, tức là chỉ truyền các xung tín hiệu tại
các thời điểmnhất định.
Bước thứ hai là lượng tử hoá biên độ, nghĩa là chia biên độ của xung mẫu

thành các mứcvà lấy tròn biên độ xung đến mức gần nhất.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 13
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Bước thứ ba mã hoá xung lượng tử thành từ mã nhị phân có m bit.
- PCM vi sai (DPCM)
Đây là phương pháp dựa trên tính chất tương quan của tín hiệu tiếng nói , chỉ
truyền đi độ chênh lệch giữa các mẫu cạnh nhau của tín hiệu tiếng nói :
Tín hiệu tiếng nói tương tự vào qua bộ lọc thông thấp , hạn chế băng tần của
tín hiệu vào (thường là một nữa tần số lấy mẫu ) máy phát lượng tử và mã hóa
lượng tử chênh lệch giữa xung lấy mẫu tương tự x
n
và tín hiệu dự đoán x
n
lấy từ đầu
ra bộ dự đoán x
n

. Giá trị dự đoán của mẫu tiếp theo có được là nhờ loại suy từ p giá
trị mẫu cho trước .
- Điều chế PWM
Điều chế PWM có tên tiếng anh là Pulse Width Modulation là phương pháp
điều chỉnh điện áp ra tải hay nói cách khác là phương pháp điều chế dựa trên sự
thay đổi độ rộng của chuỗi xung vuông dẫm đếm sự thay đổi điện áp ra.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 14
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Các PWM khi biến đổi thì có cùng 1 tần số và khác nhau về độ rộng của
sườn dương hay hoặc là sườn âm.
Đồ thị xung điều chế PWM
Trên là đồ thị dạng xung khi điều khiển bằng PWM. Với độ rộng xung đầu ra
tương ứng và được tính bằng %. Tùy thích do chúng ta điều khiển.

Chương II
ĐÓNG GÓI
Dòng cơ sở (elementary stream) và dòng cơ sở đóng
gói (packetized elementary stream)
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 15
0
0
0
12
V
12
V
20% duty cycle
40% duty cycle
90% duty cycle
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
I. Dòng cơ sở (elementary stream)
Tín hiệu video số dạng thức CCIR-601(tiêu chuẩn truyền hình số cơ bản) sau
khi nén MPEG có dạng một dòng dữ liệu video cơ sở (Elementary Stream - ES).
Dòng ES chỉ chứa những thông tin cần thiết để khôi phục lại hình ảnh ban đầu.
Tương tự, tín hiệu audio số dạng thức AES/EBU (Tần số lấy mẫu 48kHz,
24bit/mẫu, tốc độ bít 1152kbps) được mã hóa thành dòng cơ sở audio (audio ES).
Dòng cơ sở về cơ bản là tín hiệu gốc tại đầu ra của bộ mã hóa và chỉ chứa
những thông tin cần thiết để giúp bộ giải mã tái tạo lại hình ảnh, âm thanh ban đầu.
Sơ đồ dòng cơ sở
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 16
Mã hóa
Video
Mã hóa
audio

(AES/EBU)
(REC 601)
Dữ liệu video
Dữ liệu audio
Dòng cơ sở
Elementary Stream
ES
Dòng cơ sở
Elementary Stream
ES
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Hình trên mô tả cách thức tạo ra dòng cơ sở. Tín hiệu video sau khi qua bộ
mã hóa hai chiều, cho kết quả là các thông tin về các vector chuyển động, bảng
lượng tử, và các dữ liệu về không gian. Những dữ liệu này sau khi được mã hóa
bằng các phương thức khác nhau sẽ được trộn vào thành một dòng cơ sở duy nhất.
Dữ liệu sau bộ ghép (mux) nhiều hay ít là tùy vào lượng thông tin có trong ảnh.
Nhưng tốc độ bit của dòng cơ sở là không đổi nhờ qua một bộ đệm. Bộ đệm này có
khả năng cảm nhận tốc độ dữ liệu đi ra để điều khiển tốc độ mã hóa dữ liệu đầu vào.
Tốc độ của dòng đi ra được qui định bởi thiết bị đồng hồ yêu cầu (demand clock).
Đồng hồ này là do kênh truyền hoặc thiết bị lưu trữ quyết định.
Hình thành dòng cơ sở.
Cấu trúc dòng cơ sở được mô tả như sau:
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 17
Mã hóa 2
chiều
Mã hóa entropy
và mã hóa độ dài
từ mã thay đổi
Mã hóa vi sai
Bộ ghép

Bộ đệm
Tín hiệu
Video
Đồng hồ yêu cầu
Vector
chuyển động
Điều khiển
tốc độ
Slice
Dữ liệu
không gian
Bảng lượng tử
Dòng cơ
sở
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Cấu trúc dòng cơ sở
Đầu tiên là một tập hợp hợp các hệ số biểu diến khối DCT. Sáu hoặc tám
khối DCT tạo nên một macro block. Ở ảnh B và ảnh P mỗi macro block sẽ tương
ứng với một vector bù chuyển động. Một số macro block sẽ tạo thành một lát ảnh
(slice) biểu thị sọc ngang của hình ảnh từ trái sang phải. Tập hợp các lát ảnh tạo
thành một ảnh, ảnh này thì cần biết giá trị cờ I/P/B để biết được loại ảnh tương ứng.
Một số ảnh tạo thành một nhóm ảnh (GOP - Group of Picture). Một nhóm ảnh bắt
đầu bằng ảnh I, giữa hai ảnh I liền nhau là một số ảnh P và có thể có thêm ảnh B.
Một tập hợp các nhóm ảnh tạo thành đoạn dữ liệu video. Bắt đầu mỗi chuỗi video
đều có phần tiêu đề chứa những thông tin quan trọng hỗ trợ cho bộ giải mã.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 18
Khối các hệ
số DCT
Macro block Slice Ảnh
Nhóm ảnhVideo sequence

x
n
x
n
x
n
x
n
x
n
Vector
chuyển động
Tín hiệu
đồng bộ
I/P/B
Tín hiệu định
thời
Mở/ Đóng
Cỡ ảnh
Tỉ lệ khuôn
hình
Đồng bộ
Quét liên tuc/
xen kẽ
Loại
mẫu
Tín hiệu
ra
Tốc độ
ảnh

Ma trận
lượng tử
Level
Profile
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
II. Dòng cơ sở đóng gói (packetized elementary stream)
1. Giới thiệu chung về dòng cơ sở đóng gói
Do dòng dữ liệu cơ sở là liên tục, có chiều dài tùy thuộc vào lượng dữ liệu
đưa vào bộ mã hóa, để có thể truyền đi với độ tin cậy cao, dòng ES được đóng gói
thành dòng cơ sở đóng gói ( Packetized Elementary Stream - PES ). Mỗi gói PES
gồm một tiêu đề và dữ liệu của dòng cơ sở.
Hình 2.1: Dòng cơ sở đóng gói
Hình 2.2: Cấu trúc gói PES
Dòng cơ sở video là dòng bit liên tục mang thông tin về hình ảnh. Trong việc
lưu trữ và truyền dẫn thì sẽ thích hợp hơn nhiều nếu sử dụng những khối dữ liệu rời
rạc, do vậy dòng cơ sở được đóng gói tạo thành dòng cơ sở đóng gói PES
(packetized elementary stream). Tương tự như vậy, dữ liệu audio cũng cần được
đóng gói. Cấu trúc của một gói được mô tả trong hình 2.2. Gói được bắt đầu bằng
phần tiêu đề chứa một mã bắt đầu gói và một mã để phân biệt loại dữ liệu chứa
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 19
Đóng gói
Đóng gói
(Audio ES)
(Video
ES)
Dòng cơ sở video
Dòng cơ sở audio
Video PES
Audio
PES

Start code Stream ID PTS
DTS
D
at
a
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
trong gói. Ngoài ra có thể có thêm một số nhãn thời gian để đồng bộ với bộ giải mã
hình ảnh trong thời gian thực và đồng bộ với âm thanh.
Hình 2.3 chỉ ra rằng nhãn thời gian thực chất là lấy mẫu trạng thái của một bộ
đếm được điều khiển bởi đồng hồ 90kHz. Đồng hồ này có được nhờ chia tần một
đồng hồ chủ 27MHz cho 300. Có hai loại nhãn thời gian là nhãn thời gian trình diễn
PTS (presentation time stamp) và nhãn thời gian giải mã DTS (decode time stamp).
Nhãn thời gian trình diễn được dùng để xác định khi nào thì hình ảnh sẽ được thể
hiện trên màn ảnh, còn nhãn thời gian giải mã xác định khi nào hình ảnh được giải
mã. Trong mã hóa hai chiều, những nhãn thời gian này có thể không khác nhau.
Hình 2.3: Nhãn thời gian
Gói dữ liệu âm thanh chỉ có nhãn thời gian trình diễn. Vì khi có sự đồng bộ
âm thanh, thì dòng dữ liệu audio và video phải được gán nhãn từ cùng một bộ đếm.
Một minh họa được cho ở hình 2.4. Nhóm ảnh được bắt đầu bởi ảnh I, sau đó
ảnh P được gửi trước ảnh B
1
và B
2
. Ảnh P phải được giải mã trước khi B
1
và B
2
giải
mã. Tại một thời điểm chỉ có một ảnh được giải mã, ảnh I được giải mã ở thời điểm
N nhưng phải tới thời điểm N+1 thì nó mới được thể hiện trên màn ảnh. Khi ảnh I

được thể hiện thì ảnh P
1
được giải mã. P
1
sẽ được lưu giữ trong RAM. Tại thời điểm
N+2, ảnh B
1
được giải mã và thể hiện ngay trên màn hình. Vì lí do này mà nó không
cần nhãn thời gian giải mã. Tại thời điểm N+3, thì ảnh B
2
được giải mã và thể hiện.
Tại N+4, thì ảnh P
1
mới được thể hiện. Ta thấy P
1
có sự khác nhau nhiều nhất của
hai nhãn thời gian. Cùng thời điểm này thì ảnh P
2
được giải mã và lưu trữ để giải mã
ảnh B
3
. Quá trình giải mã và trình diễn cứ thế tiếp tục.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 20
27 MHz
: 300
90 kHz
33-bit
count
Encoder
clock

Time
stamp
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Hình 2.4: Sử dụng nhãn thời gian PTS/DTS trong việc đồng bộ giải mã 2 chiều.
Trên thực tế, khoảng thời gian giữa các hình ảnh đến bộ giải mã thường là
không đổi, do vậy sẽ là thừa nếu gói nào cũng gán thêm nhãn thời gian PTS/DTS.
Nhãn thời gian có thể chiếm một khoảng 700ms trong dòng chương trình (program
stream) và 100ms trong dòng truyền tải (transport stream). Vì lí do đó mà không
phải mọi gói đều có nhãn PTS/DTS. Vì trong dòng bit, mỗi loại ảnh (I, B hoặc P)
đều được gán một cờ để xác định, do đó bộ giải mã có thể suy ra nhãn thời gian cho
mọi ảnh trong dòng bít.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 21
Khi truyền
N+4 N+2 N+3 N+7 N+5N+1
N+1 - - N+4 -N
P
1
B
1
B
2
P
2
B
3
I
B
1
B
2

P
1
B
3
I
PTS
DTS
Khi giải mã
Khi trình diễn
I P
1
B
1
B
2
P
2
B
3
N
N+1
N+2
N+3 N+4 N+5
N+1 N+2 N+3 N+4 N+5
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
2. Cú pháp dòng cơ sở đóng gói
Hình 2.5: Cú pháp gói PES
1. Mã tiền tố khởi đầu (PES start code prefix): đây là mã 24-bit có giá trị là
0x000001. Mã này xác định điểm bắt đầu của một gói PES.
2. Nhận dạng dòng (stream ID): mã 8-bit xác định loại của dữ liệu chứa trong dòng

cơ sở.
3. Độ dài gói PES (PES packet length): trường 16-bit, chỉ ra số byte của gói cơ sở
đóng gói đi sau trường này.
4. Các byte tiêu đề và đệm PES:
4.1. Các byte đệm (stuffing bytes): có giá trị cố định là 0xFF, được bộ mã hóa chèn
thêm vào gói PES, đến bộ giải mã các byte này được bỏ qua.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 22
PES
SCRAMBLING
CONTROL
(2 BIT)
PES
PRIORITY
(1 BIT)
DATA
ALIGNMENT
INDICATOR
(1 BIT)
COPYRIGHT
(1 BIT)
ORIGINAL
OR COPY
(1 BIT)
7 FLAGS
(8 BIT)
PES HEADER
DATA
LENGTH
(8 BIT)
“10”

(2 BIT)
OPTIONAL
FIELDS
ESCR
(48 BIT)
ES RATE
(24 BIT)
PES
EXTENSION
PTS
DTS
(40 BIT)
ADDITIONAL
COPY INFO
(8 BIT)
DSM
TRICK MODE
(8 BIT)
PES CRC
(16 BIT)
5 FLAGS OPTIONAL
FIELDS
PES
PRIVATE
DATA
PACK
HEADER
FIELD
PROGRAM PACKET
SEQ COUNTER

(16 BIT)
P- STD
BUFFER
(16 BIT)
PES
EXTENSION
FIELD
STREAM ID
(1BYTE)
PES
HEADER
PES PACKET
LENGTH (2 BYTE)
STUFFING
BYTES
PES START CODE
PREFIX (3 BYTE)
PES PACKET
DATA
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
4.2. Điều khiển đảo mã PES (PES scrambling control): trường 2-bit. Giá trị và ý
nghĩa được cho theo bảng sau:
Giá trị Ý nghĩa
00 Không đảo mã
01 Người dùng tự định nghĩa
10 Người dùng tự định nghĩa
11 Người dùng tự định nghĩa
4.3. Ưu tiên PES (PES priority): trường 1 bit, chỉ thị mức ưu tiên của tải tin ở trong
gói PES này. Những gói có giá trị trường này là “1” sẽ được ưu tiên hơn những gói
có giá trị “0”.

4.4. Chỉ thị sắp xếp dữ liệu (data alignment indicator): trường cờ 1 bit. Khi cờ này
có giá trị “1” nghĩa là có sự sắp xếp dữ liệu, giá trị “0” nghĩa là không có sự sắp
xếp.
4.5. Bản quyền tác giả (copy right): trường 1 bit. Giá trị “1” có nghĩa là dữ liệu
trong gói được bảo vệ bởi quyền tác giả, giá trị “0” có nghĩa là không được bảo vệ.
4.6. Bản gốc hay là bản sao (original or copy): trường 1 bit. Khi trường này mang
giá trị “1” nghĩa là nội dung của phần tải tin trong gói PES này là bản gốc. Còn khi
có giá trị “0” thì có nghĩa là nội dung trong đó là bản sao.
4.7. Các giá trị cờ (flags):
4.7.1. Cờ nhãn thời gian (PTS DTS flags): trường 2-bit.
Giá trị “10”: nhãn thời gian trình diễn (PTS – presentation time stamp) có
trong tiêu đề của gói PES.
Giá trị “11”: cả nhãn thời gian trình diễn PTS và nhãn thời gian giải mã (DTS
– decode time stamp) đều có trong tiêu đề của gói PES.
Giá trị “00”: cả hai nhãn thời gian đều không có.
Giá trị “01”: bị cấm dùng.
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 23
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
4.7.2. Cờ ESCR (Elementary Stream Clock Reference Flag): trường 1 bit. Khi
được đặt là “1” có nghĩa là giá trị của ESCR có trong tiêu đề của gói PES. Giá trị
trường là “0” có nghĩa là không có ESCR trong tiêu đề của gói PES này.
4.7.3. Cờ RATE (ES rate flag): trường 1 bit, thể hiện sự có mặt hay không của
trường ES rate trong tiêu đề của gói PES.
4.7.4. Cờ TM (DSM trick mode flag): cờ 1 bit, thể hiện sự có mặt của trường 8-bit
mô tả hoạt động của Phương tiện lưu trữ số (DSM – Digital Storage Media).
4.7.5. Cờ ACI (additional copy information flag): cờ 1 bit, thể hiện sự có mặt của
trường thông tin thêm về loại dữ liệu (bản gốc hay là bản sao).
4.7.6. Cờ CRC (PES CRC flag) : cờ 1 bit, thể hiện sự có mặt của trường kiểm tra
dư thừa vòng CRC (Cyclic Redundancy Check) trong tiêu đề của gói PES.
4.7.7. Cờ EXT (PES extension flag): cờ 1 bit, thể hiện sự có mặt của trường mở

rộng (extension field) trong tiêu đề của gói PES.
4.8. Chiều dài dữ liệu tiêu đề (PES header data length): trường 8-bit, chỉ định số
byte của trường tùy chọn và các byte đệm trong tiêu đề của gói PES này.
4.9. Trường tùy chọn (optional field):
4.9.1. Nhãn thời gian trình diễn (PTS – Presentation Time Stamp): được sử dụng để
xác định thời điểm một đơn vị dữ liệu được thể hiện ở máy thu.
4.9.2. Nhãn thời gian giải mã (DTS – Decode Time Stamp): được sử dụng để xác
định thời điểm một đơn vị dữ liệu được đưa đến bộ giải mã.
4.9.3. Chuẩn đồng hồ dòng cơ sở (ESCR – Elementary Stream Clock Reference):
trường 48-bit, trong đó 42-bit được dùng để biểu diễn các trường ESCR cơ sở
(ESCR base) và ESCR mở rộng (ESCR extension).
4.9.4. Tốc độ dòng cơ sở (ES rate - Elementary Stream Rate): trường 24-bit, cho
biết tốc độ nhận byte của gói PES khi đến bộ giải mã. Đơn vị đo của trường này là
50 bytes/giây. Giá trị trường này của các gói PES khác nhau có thể thay đổi.
4.9.5. Trường DSM Trick Mode: trường 8-bit, gồm có:
4.9.5.1. Điều khiển phương thức kĩ xảo (trick mode control): cho biết thông tin về
kĩ xảo sử dụng trong dòng bit tương ứng như sau:
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 24
Đồ án: Truyền Dẫn Tín Hiệu Truyền Hình Số GVHD: Thầy Lê Nghĩa Lâm
Giá trị Mô tả
000 Chạy đi nhanh (Fast forward)
001 Chuyển động chậm (Slow motion)
010 Đông khung hình (Freeze frame)
011 Chạy ngược nhanh (Fast reverse)
100 Chạy ngược chậm (Slow reverse)
101 tới 111 Dự phòng
4.9.5.2. Nhận dạng mành (field id): trường 2-bit, chỉ thị những mành nào được thể
hiện trên màn ảnh.
Giá trị Mô tả
00 Chỉ thể hiện mành 1

01 Chỉ thể hiện mành 2
10 Thể hiện cả 2 mành
11 Dự phòng
4.9.5.3. Phục hồi lát trong ảnh (intra slice refresh): trường 1-bit. Khi trường này
mang giá trị “1” có nghĩa là có thể có những macroblocks bị thiếu trong dữ liệu
video của gói PES này. Lúc này bộ giải mã sẽ thay những macroblock bị thiếu bởi
macroblock tương ứng của hình được giải mã trước đó. Giá trị “0” có nghĩa là
không bị thiếu.
4.9.5.4. Cắt tần số (frequency truncation): trường 2-bit, chỉ thị sự hạn chế các hệ số
tần số được sử dụng trong mã hóa dữ liệu hình ảnh.
Giá trị Mô tả
00 Chỉ có hệ số 1 chiều là khác 0
01 Chỉ 3 hệ số đầu tiên khác 0
SVTH :Ngọc Bình – Minh Nhật – Thu Hà – Kiều Loan 25

×