Tải bản đầy đủ (.pdf) (156 trang)

Bài giảng Xử lý Audio và Video doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.18 MB, 156 trang )






BÀI GIẢNG

XỬ LÝ AUDIO & VIDEO
LỜI MỞ ĐẦU
Bài giảng Xử lý Audio và Video là tài liệu được biện soạn nhằm phục vụ cho
đối tượng học viên thuộc chuyên ngành Kỹ thuật Điện tử - Viễn thông. Để giúp
học viên tìm hiểu môn học một cách dễ dàng, tài liệu đã được chọn lọc biên soạn
với những nội dung rất căn bản về lý thuyết theo một trình tự logic, được trình bày
qua 5 chương.
 Chương 1, đại cương về tín hiệu audio và video, đây là bức tranh toàn cảnh
về tín hiệu audio và video.
 Chương 2, số hóa tín hiệu audio và video, trình bày những đặc trưng về
biến đổi của tín hiệu audio và video tương tự-số.
 Chương 3, truyền dẫn tín hiệu audio và video, trình bày những nguyên tắc
truyền dẫn tín hiệu audio và video số.
 Chương 4, ghi phát tín hiệu audio và video số, trình bày những nguyên tắc
ghi phát (lưu trữ) tín hiệu audio và video số.
 Chương 5, nén dữ liệu audio và video, trình bày những phương pháp xử lý
nén audio và video.
Biên soạn tài liệu này, tác giả đã tổng hợp và chọn lọc những nội dung dựa
theo các tài liệu của các tác giả đã được xuất bản, qua đó cũng đã cập nhật những
nội dung mới nhằm làm phong phú cho môn học. Tuy đã có nhiều cố gắng và thận
trọng nhưng tài liệu không sao tránh khỏi những sai sót, mong sự thông cảm và
đóng góp ý kiến của bạn đọc.



Chương 1: Đại cương về tín hiệu audio và video
Chương 1
ĐẠI CƯƠNG VỀ AUDIO VÀ VIDEO
1.1. QUÁ TRÌNH PHÁT TRIỂN
Khoảng cuối thế kỷ 19 đầu thế kỷ 20, nhiều thiết bị xử lý âm thanh điện tử ra
đời, đã mở ra một hướng phát triển mới trong chế tạo các thiết bị điện tử dân dụng.
Trong giai đoạn này các nhà khoa học đã thành công trong chế tạo các thiết bị xử lý
âm thanh như: hệ thống máy điện thoại, máy cassette, các máy quay đĩa và máy
phát thanh…Ngày nay âm thanh điện tử được ứng dụng rộng rãi trong các thiết bị
dân dụng, nhiều thiết bị âm thanh số ra đời có tính năng kỹ thuật cao từng bước thay
thế cho các thiết bị âm thanh tương tự trước đây. Cho đến nay, hầu như các gia đình
đều sở hữu một vài thiết bị điện tử phục vụ đời sống tinh thần.
Khi kỹ thuật truyền thanh ra đời thì truyền hình là tiêu điểm nghiên cứu quan
trọng cho các nhàkhoa học. Đến khoảng giữa thế kỷ 20, thời kỳ thế chiến thứ II, kỹ
thuật truyền hình ảnh động đấu tiên ra đời, nhưng chỉ nhằm để phục vụ cho mục
đích quâ sự. Sau khi kết thúc chiến tranh, truyền hình ở các quốc gia mới thực sự
nhằm vào mục đích dân dụng, từ đó kỹ thuật truyền hình không ngừng được cải tiến
và phát triển. Cho đến nay, thế giới thực sự đổi thay từ khi mọi gia đình có thể
thưởng thức thông tin bằng hình ảnh và âm thanh.
Trong suốt hơn 50 năm qua, truyền hình đóng một vai trò quan trọng trong sự
phát triển của nền kinh tế tri thức của thế giới. Cho đến nay cùng với sự phát triển
mạnh mẽ của công nghệ điện tử, nhiều công nghệ truyền hình thế hệ mới ra đời với
những tính năng kỹ thuật cao dần thay thế cho truyền hình tương tự trước đây,
truyền hình số với những công nghệ khác nhau như: truyền hình mặt đất, truyền
hình cáp, truyền hình vệ tinh đã thực sự làm cho thế giới truyền hình ngày càng
sóng động hơn.
1.2. ẢNH TỰ NHIÊN
Ảnh tự nhiên là những gì mà chúng ta có thể trông thấy xung quanh thế giới
thực, chúng được tạo ra bởi các nguồn ánh sáng mặt trời hoặc ánh sáng nhân tạo
phản xạ lên các vật thể mà ta có thể trông thấy. Truyền hình là một hệ thống tín hiệu

hình ảnh và tín hiệu âm thanh analog được phát triển rất cao. Cơ sở của hệ thống
truyền hình là dựa trên đặc tính của thị giác con người, đặc tính này cũng được áp
dụng trong hệ thống truyền hình kỹ thuật số hiện nay.

1
Chương 1: Đại cương về tín hiệu audio và video
Mục đích hệ thống tái tạo ảnh điện tử (video) là thu ảnh tự nhiên và tái tạo lại
với những khoảng cách về không gian, hoặc cả hai (hình 1.1). Ở đây chúng ta quan
tâm đến hai thuộc tính nhìn thấy của cảnh quan là màu sắc và độ chói.











Chuyển đổi
ảnh-tín hiệu
Xử lý tín hiệu
Tạo xung
đồng bộ
Lưu trữ hoặc
truyền dẫn
Xử lý tín hiệu
Chuyển đổi
tín hiệu-ảnh

Tách xung
đồng bộ
Mắt người
xem
Ảnh tái tạo
Ảnh tự
nhiên
Ống kính
Hình 1.1. Hệ thống tái tạo ảnh điện tử
Nhưng cảnh tự nhiên ít khi được tạo nên từ một nguồn sáng đơn sắc. Ảnh tại
mọi điểm trong cảnh quan là tổng của ánh sáng từ các nguồn đồng nhất với ánh
sáng phản xạ từ các vật xung quanh. Sự chiếu sáng vừa nêu đã được sửa đổi bởi các
thành phần phản chiếu từ các vật xung quanh môi trường tạo ra một sự chiếu sáng
mà màu sắc và độ sáng của nó thay đổi theo từng cảnh. Đối với những cảnh phức
tạp hơn, mắt người có thể thích nghi với sự thay đổi từng khu vực chiếu sáng cho
đến lúc không còn cảm nhận được nữa khi quan sát trực tiếp. Hệ thống tái tạo hình
ảnh cũng cần tạo ra một kết quả tương tự .
Quá trình chuyển đổi tín hiệu-ảnh hoàn toàn đồng bộ và đồng pha với quá
trình chuyển đổi ảnh-tín hiệu thì mới khôi phục được ảnh quang đã truyền đi. Để
thực hiện sự đồng bộ và đồng pha, trong hệ thống truyền hình phải dùng một bộ tạo
xung đồng bộ. Xung đồng bộ được đưa đến bộ xử lý tín hiệu để khống chế quá trình
phân tích ảnh, đồng thời đưa đến bộ xử lý tín hiệu hình rồi truyền sang phía thu, tín
hiệu hình được cộng thêm xung đồng bộ gọi là tín hiệu truyền hình.
1.3. ÂM THANH TỰ NHIÊN
Âm thanh là những biến đổi áp suất nhanh xảy ra trong không khí do nhiều
quá trình tự nhiên gây nên. Tiếng gió thổi trên cành cây, tiếng sóng biển vỗ bờ ,
tiếng chim kêu…tất cả đều là âm thanh tự nhiên. Nhiều hệ thống do con người chế

2
Chương 1: Đại cương về tín hiệu audio và video

tạo cũng tạo ra những biến đổi áp suất tương tự, đôi khi còn có ý chủ định, hay đôi
khi còn do khách quan. Một dàn nhạc tạo ra những âm thanh có chủ định với mục
đích thưởng thức âm nhạc. Trong khi, âm thanh của một động cơ phản lực phát ra
khi cất cánh lại được coi là do khách quan gây lên.
Tai con người phản ứng lại những biến đổi áp suất không khí ở phạm vi tần số
trong khoảng từ 30Hz đến 15000Hz sau đó đưa đến não và đó chính là âm thanh.
Độ lớn hay biên độ dao động của những biến đổi áp suất này tạo nên cảm giác về
tiếng ồn.
Âm thanh chuyển động trong không khí theo quy tắc truyền sóng, vì vậy người
ta có thể nghe thấy một âm thanh phát ra từ khoảng cách khá xa và những biến đổi
áp suất âm thanh thường được gọi là sóng âm. Trong mọi trường hợp, sóng âm
thanh là sóng tương tự. Sóng âm chuyển động trong không khí với vận tốc xắp xỉ
bằng 345m/s ở nhiệt độ phòng và mực nước biển. Theo lý thuyết về sóng, mối liên
hệ giữa tần số f và bước sóng λ là:
λ = v/f (1.1)
Ngoài ra, các tính chất khác của sóng âm thanh cũng có tầm quan trọng đối với
việc thiết kế các thiết bị âm thanh. Sóng âm sẽ phản xạ với bề mặt cứng (những bề
mặt không hấp thụ sóng âm) tạo nên hiệu ứng về tiếng vọng và vang âm. Sóng âm
thanh bị nhiễu xạ, chúng có thể xuyên qua các lỗ hỏng, các khe hở và đến từng ngóc
ngách. Sóng âm thanh cũng có thể bị khúc xạ, nó sẽ bị bẻ cong khi vận tốc truyền
thay đổi ở những khu vực khác nhau với nhiệt độ và mật độ không khí khác nhau.
Tầm quan trọng của những hệ quả này là hàm điều kiện môi trường và bước sóng.
Về mặt toán học, việc tạo những đường truyền sóng âm thanh trong một môi trường
thực tiễn khá phức tạp.
Âm thanh tự nhiên không chỉ liên quan đến hai yếu tố là nguồn phát và người
nghe, bởi vì sóng âm luôn phản xạ với các đồ vật xung quanh môi trường. Người
nghe tiếp nhận âm thanh phản xạ ngay sau khi âm thanh đó được phát ra. Người ta
gọi các yếu tố có liên quan đến âm thanh này là môi trường âm thanh. Môi trường
này rất quan trọng đối với việc tái tạo lại âm thanh bằng hệ thống điện tử.
Một trong những yếu tố chủ yếu của môi trường âm thanh được tạo ra do hiện

tượng phản xạ, thường xảy ra ở những không gian kín (như phòng hoà nhạc). Do
tốc độ giới hạn của âm thanh, song âm được truyền đi trong một phòng kín mất
nhiều thời gian để đến được tai người hơn là âm thanh trực tiếp và được gọi là
những âm bị trễ mà có thể nghe thấy sự lặp lại của âm thanh trước. Chúng ta có thể
nhận thấy rõ tiếng vọng xẩy ra khi sự trễ âm phản xạ lớn hơn khoảng 50m/s, tương
đương với khoảng cách là 17m. Tiếng vọng rõ nhất với những âm thanh có thời
gian trễ lớn hơn, ví dụ như tiếng vọng xảy ra trong một thung lũng.

3
Chương 1: Đại cương về tín hiệu audio và video
Ở những khu vực không gian hẹp hơn, có thể có rất nhiều phản xạ mà không
một phản xạ nào có thể bị trễ khác biệt hẳn tới mức là tiếng vọng. Tuy nhiên, âm
thanh vẫn tiếp tục truyền đi trong phòng cho đến khi nó biến mất hoàn toàn do có
hiện tượng hấp thụ âm, và gọi là hiện tượng tiếng vọng.
Hiện tượng tiếng vang tạo ra cảm giác về không gian, nó rất quan trọng trong
quá trình mô phỏng âm thanh. Ví dụ, nếu việc mô phỏng âm thanh không thu được
tiếng vang (trường hợp máy thu đặt gần, hoặc thậm chí đặt máy thu ngay tại nguồn
âm), âm thanh sẽ trở thành âm “chết”. Điều kiện này có thể khắc phục bằng cách
đưa vào những tiếng vang nhân tạo (thường xử lý bằng kỹ thuật số). Các chương
trình truyền hình gốc (chưa được biên tập) thường được thực hiện ở những điều
kiện âm “chết” này với mục đích là tiếng vang nhân tạo sẽ được đưa vào trong quá
trình biên tập, điều này giúp cho biên tập viên có thể kiểm soát được âm thanh.
Tiếng vang được lượng tử hoá trong khoảng thời gian đủ để nó phá huỷ 1/1000
âm gốc. Đối với phòng thiết kế riêng cho phòng hội thảo, thời gian vang của âm
thích hợp nhất là 1 giây. Với một phòng hòa nhạc, thời gian dài hơn một chút, lên
đến khoảng 2 giây.
Việc đo âm bằng các thiết bị như micro hay loa cần phải được thực hiện trong
một môi trường hoàn toàn cách âm để tách các đặc tính của chúng ra khỏi các đặc
tính của môi trường. Một loại phòng đặc biệt được gọi là phòng cách âm được thiết
kế cho mục đích này. Loại phòng này hấp thụ tất cả các âm thanh nhập vào chu vi

của nó, vì vậy hiện tượng phản xạ không xảy ra. Về cơ bản đây là một không gian
“chết”. Khi nói trong căn phòng này, người ta hầu như không thể nghe được giọng
nói của chính mình .
1.4. TÁI TẠO ÂM THANH ĐIỆN TỬ
Âm thanh điện tử được gọi chung là audio. Hình 1.2 minh họa một hệ thống
audio điển hình. Âm được thu từ nguồn nhờ một hoặc nhiều micro và những tín
hiệu audio thu được truyền qua hệ thống cho đến khi tới loa phát (bộ phận chuyển
các tín hiệu điện thành sóng âm).

Nguồn
âm
Thu audio
Lưu trữ hay
truyền dẫn
Máy thu


Hình 1.2. Hệ thống tái tạo âm thanh điện tử
Mục đích tái tạo âm thanh điện tử là để tải các sóng âm thanh đến những
khoảng cách xa cả về không gian và thời gian, để người nghe có thể tiếp nhận như
thể họ đang nghe âm trực tiếp từ nguồn. Một mục đích khác nữa là để chau chuốt

4
Chương 1: Đại cương về tín hiệu audio và video
âm thanh mới không có trong tự nhiên, làm cho âm thanh điện tử hay hơn âm gốc,
hoặc tạo ra những âm thanh mới không có trong tự nhiên.
1.5. THỊ GIÁC CON NGƯỜI
Mắt người là một thiết bị rất đặc biệt bao gồm trên 100.000.000 (10
8
) phần tử

cảm biến cùng một hệ thống điều khiển độ sáng cho phép nhìn rõ ở một phạm vi độ
sáng hơn 10 triệu tới 1. Hai mắt kết hợp với não tạo ra khả năng nhận biết các vật
trong không gian ba chiều. Mặc dù hầu hết các hệ thống tái tạo điện tử không có các
tính năng này nhưng bằng cánh thiết kế như các đặc điểm của mắt trong bộ não điện
tử, hệ thống có khả năng đáp ứng nhiều mục đích ứng dụng.
1.5.1. Độ phân giải
Thị lực trung bình của mắt là 20/20, vùng trung tâm thị lực là một cung có góc
khoảng 1/60 độ. Đây là độ phân giải của mắt, tất nhiên chỉ áp dụng đối với những
ảnh của các vật thể trên thang xám. Còn đối với ảnh màu, độ phân giải của mắt sẽ
giảm đi (xem phần 1.8.1). Độ phân giải ở đây có nghĩa là mắt người có thể nhìn rõ
các vật thể có kích thước khoảng 1cm khi nhìn khoảng cách là 3m, trường nhìn của
mắt gần bằng 180
0
, một người có thể phân biệt được tổng cộng 180×60 =10.800 vật
thể ngang qua trường nhìn. Tuy nhiên, độ phân giải của mắt giảm dần từ trung tâm
của thị giác, vì vậy tổng số vật thể trong thực tế là ít hơn nhiều .
Hệ thống ảnh điện tử phân biệt được một số lượng lớn các vật thể trong ảnh
đơn thực tế là rất hiếm. Vì vậy, nó thường được thiết kế sao cho màn hình hiển thị
có kích thước nhỏ hơn tổng trường nhìn của mắt. Do đó, hầu hết hình ảnh đều được
quan sát bởi phần có độ phân giải đầy đủ nhất của mắt, và độ phân giải đầy đủ cũng
là yếu tố quan trọng cần được sử dụng trong các thao tác tính toán hình ảnh điện tử.
Một đặc điểm khác cũng yêu cầu sử dụng độ phân giải đầy đủ nhất là khả năng
chuyển động của mắt để mang vật thể cần nhìn vào trung tâm thị giác. Một màn
hình hiển thị ở một góc rộng, khi nhìn gần sẽ gặp một số vấn đề đó là người xem sẽ
nhìn trực tiếp vào bất cứ phần nào trên màn hình thu hút họ trước nhất. Ở một thời
gian đặc biệt nào đó nó có thể là một điểm bất kỳ trên màn hình. Do vậy toàn bộ
màn hình đều cần phải có độ phân giải cao.
Ta biết rằng, ảnh trong các hệ thống số được miêu tả là một chuỗi các pixel.
Hệ thống hiển thị cần phải thiết kế sao cho các pixel không bị lộ diện nếu như
không có sẽ gây ảnh hưởng xấu tới chất lượng ảnh. Người ta thường hạn chế số

lượng pixel trong ảnh để đủ cho người xem ở khoảng cách nhìn quy định hoặc lớn
hơn, không thể phân tích được. Một thông số quan trọng cần tính đến ở đây là tỉ lệ
nhìn, được xác định bằng tỉ lệ giữa khoảng cách người xem (tính từ màn hình) với
độ cao nhất của ảnh.

5
Chương 1: Đại cương về tín hiệu audio và video
VR= d/PH (1.2)
Trong đó: VR = tỉ lệ nhìn.
d: khoảng cách từ mắt tới màn hình.
PH: độ cao của ảnh (lấy theo cùng đơn vị d)
Khi sử dụng hình ảnh theo độ phân giải trên đây, số lượng tối đa của các điểm
ảnh có thể nhìn thấy được ở một tỉ lệ nhất định là:
Số điểm ảnh = 3440/VR (1.3)
Lưu ý, đối với một bức ảnh có số pixel xác định, nếu ở khoảng cách cho trước
mà mắt chưa phân biệt được các điểm ảnh thì đây là kích cỡ lớn nhất của ảnh, điều
đó tương đương với tỉ lệ nhìn là nhỏ nhất (bảng 1.1). Điều này đúng cho cả hệ thống
video số và video tương tự. Hệ thống video tương tự quan tâm đến số dònd quét
hơn là số pixel trên một ảnh. Trong khi đó, các dòng quét lại ngây nhiễu cho khả
năng nhìn hơn pixel, đây chính là nhược điểm của hệ thống video analog. Các máy
tính thường hoạt động với các thông số thấp hơn.






Hệ thống Dòng hoặc pixel/ph Tỉ lệ nhìn
Hệ NTSC 483 7.2
HDTV 1080 3.2

Màn hình máy tính 768 4.5*
Bảng 1.1. Các tỉ lệ nhìn nhỏ nhất
1.5.2. Tạo mức xám
Để tạo ra hình ảnh rõ nét, ánh sáng phát ra ở màn hình phải tỉ lệ với độ sáng
phát ra từ cảnh ở một điểm. Điều này có nghĩa là các tín hiệu video phải là một hàm
tuyến tính với độ chói của ảnh. Tuy nhiên, thiết bị hiển thị tiêu biểu (CRT) lại có
cường độ hàm phi tuyến, ngược với hàm tín hiệu, rất nhiều các tiêu chuẩn của hệ
thống đã đưa vào các phần sửa lỗi phi tuyến trong tín hiệu video, bởi vì nếu sửa lỗi
phi tuyến tại các máy thu thì giá thành rất cao .
Hầu hết các bộ cảm biến trong camera truyền hình có đặc tuyến ánh sáng
tuyến tính, vì vậy camera thường được lắp đặt hệ thống sửa méo gamma để đưa vào
tín hiệu có đặc tính biên độ phi tuyến cần thiết. Gamma là một đường đặc tuyến của
hàm mũ xấp xỉ bằng biên độ phi tuyến chuyển giao. Ví dụ, gamma của một CRT
điển hình là 2,2. Như vậy một camera phải đưa phần sửa lỗi với số mũ là 1/2,2 hoặc
0,45. Đặc tính này được thể hiện bằng đường cong trên hình 1.3.

6
Chương 1: Đại cương về tín hiệu audio và video

0.5 1.0 0.0
0.5
1.0
Đầu ra tương đối
Ү= 45









Hình 1.3. Đường cong sửa lỗi
45.0
=
γ

Tuy nhiên, đa phần máy tính áp dụng tiêu chuẩn sửa lỗi gamma chứ không
phải truyền hình, vì vậy đôi khi việc gây lỗi là cần thiết khi chuyển đổi giữa các tín
hiệu truyền hình và tín hiệu trong máy tính.
1.5.3. Rung hình và tỷ lệ phục hồi
Người ta không nhận thấy sự nhấp nháy của màn hình bởi vì mắt có khả năng
lưu hình. Có nghĩa là, hệ thống thị giác phản ứng rất chậm với sự thay đổi nhanh
của ánh sáng trên màn hình. Tuy nhiên, sự chiếu sáng thay đổi theo chu kỳ với tần
số thấp (khi được chiếu sáng bởi đèn điện có tần số thấp), gây ra hiệu ứng mà ta gọi
là hiện tượng rung hình. Hiện tượng rung hình phụ thuộc vào số lượng của độ chiếu
sáng (rung hình dễ nhận thấy hơn khi hình ảnh có độ chói cao) và cũng dễ nhìn hơn
khi nhìn ở ngoại vi tầm nhìn. Hiệu ứng vừa rồi giúp chúng ta nhạy cảm hơn với
những vật chuyển động nhanh (có thể là nguy hiểm) xuất hiện đầu tiên ở ngoại vi
tầm nhìn. Vấn đề điều khiển rung hình khá quan trọng, bởi vì nếu ánh sáng ở màn
hình bị rung kéo dài sẽ gây ra chứng mổi mắt người xem.
Hệ thống Tỷ lệ phục hồi Môi trường VR
NTSC 60 (59,94) Phòng khách 7
PAL 50 Phòng khách 7
Màn hình máy tính 72 Phòng sáng 1-2
Rạp chiếu phim 48 Phòng tối 5-10

Bảng 1.2. Các tỉ lệ phục hồi tiêu biểu

7

Chương 1: Đại cương về tín hiệu audio và video
Thiết bị điện tử lại có hiệu ứng lưu hình ngược lại, ánh sáng phát ra sẽ bị hủy
sau một thời gian ngắn. Vì vậy, ảnh điện tử phải được phục hồi thường xuyên để
duy trì hiệu ứng chiếu sáng ổn định. Tỉ lệ phục hồi phải đủ để tránh tình trạng rung
hình ở các điều kiện xem mong muốn. Tỉ lệ phục hồi tiêu biểu được trình bày trong
bảng 1.2. Ở điện ảnh, tỉ lệ phục hồi có thể thấp bởi vì các rạp chiếu phim thường
phải tối và ảnh không được quá sáng. Riêng máy tính lại ở trong tình trạng ngược
lại, thường hiển thị trong một phòng sáng, màn hình cũng phải sáng, và như vậy tỉ
lệ nhìn thấp có nghĩa là những phần màn hình này xuất hiện ở ngoại vi tầm nhìn.
Hiện tượng rung hình với một số lượng thích nghi nhất định, điều này xảy ra
khi cùng một kiểu nhìn đều đặn diễn ra. Ví dụ, tỉ lệ phục hồi 50 Hz được sử dụng ở
một số quốc gia được đánh giá là hoàn toàn hợp lí với người bản địa. Song, một số
quốc gia khác tỉ lệ 60 Hz cũng được áp dụng.
1.5.4. Tái tạo ảnh chuyển động
Sự chuyển động của ảnh được tạo ra trong hệ thống video nhờ vào cập nhật
nội dung trên màn hình với tỉ lệ vừa đủ để người xem có thể nhận biết được một
quá trình chuyển động liên tục. Trong một hệ thống truyền hình, nó được thực hiện
ở camera và tỉ lệ quét của màn hình.
Trong những trường hợp đơn giản nhất, camera video sẽ tạo ra mành riêng biệt
cho mỗi chu kỳ phục hồi của màn hình. Đây chính là cách hoạt động thông thường
của tryuền hình số, tỉ lệ mành của camera và màn hình như nhau. Thực chất, tỉ lệ ở
hai bộ phận này đã được đồng bộ hoá. Trong phương thức vận hành này, tín hiệu
phát ra từ camera không ngừng đi tới màn hình mà không cần sự can thiệp của quá
trình xử lý hay lưu trữ nào. Khi đề ra các tiêu chuẩn màn hình, vấn đề xử lý hay lưu
trữ vẫn chưa được bàn đến, do vậy hệ thống thiết kế cho màn hình được phục hồi
bằng cách liên tục phát ra các tín hiệu mới từ camera, thậm chí ngay cả khi hình ảnh
đã dừng.
Hiện nay với công nghệ kỹ thuật số, lưu trữ và xử lý là hai quá trình tồn tại
thường xuyên trong hệ thống, và camera cũng như màn hình không cần thiết phải có
tỉ lệ mành như nhau thậm chí không cần phải đồng bộ. Camera có thể hoạt động ở

một tỉ lệ mành vừa đủ để tạo lại chuyển động, còn màn hình có thể vận hành ở một
tỉ lệ cao hơn, đáp ứng chỉ tiêu rung hình cần thiết. Thậm chí có thể ngừng hẳn việc
truyền theo chu kỳ của những hình ảnh đã dùng, để giảm yêu cầu mà quá trình
truyền dữ liệu đặt ra.
Như đề cập ở trên, để giảm độ rung hình, tần số mành ở 50 Hz hoặc cao hơn
nữa và màn hình cũng có thể quét ở tần số này. Nhưng quá trình tái tạo chuyển
động thường tốt nhất với tần số mành 30Hz, hoặc thậm chí có thể thấp hơn. Do vậy
quá trình quét ảnh của camera càng phải diễn ra nhanh, để đủ hỗ trợ quá trình tạo

8
Chương 1: Đại cương về tín hiệu audio và video
chuyển động. Các hệ thống số có thể đáp ứng cả những tiêu chí này. Khi theo dõi
một vật chuyển động nhanh, người ta có cảm giác như sự chuyển động này rất rõ
nét. Tuy nhiên, thực chất hình ảnh chuyển động lại rất mờ do hiệu ứng lưu hình của
mắt đã nêu ở trên. Tuy nhiên, nếu mắt di chuyển theo chuyển động của vật, sự mờ
ảo của chính vật đó sẽ giảm xuống nhưng phong hình lại trở lên mờ ảo. Một hệ
thống mô phỏng không thể đồng thời giải quyết tình trạng này do camera thu ảnh
điện tử đều có lưu hình như nhau. Đây được gọi là sự kéo vết của chuyển động xảy
ra do camera có thời gian lộ sáng xác định.
Vấn đề đặt ra không khó khăn lắm với hệ thống truyền hình bình thường hoạt
động ở tỉ lệ nhìn thiết kế sẵn vì hình ảnh ở đó không rộng đến mức người xem có
thể di chuyển theo chiều chuyển động của vật. Camera thường di chuyển theo
chuyển động của vật, người xem không cần thiết phải làm việc này. Tuy nhiên, với
màn hình có độ phân giải cao và rộng hơn, người xem có thể phải di chuyển mắt
theo những phần khác nhau của cảnh để đáp ứng đầy đủ trường nhìn của mình. Sau
nữa, camera cũng không nên di chuyển theo vật và phải có thời gian lộ sáng ngắn để
vật chuyển động sắc nét hơn.
1.6. THÍNH GIÁC CỦA CON NGƯỜI
Độ nhạy của tai con người không hề thua kém mắt. Kết hợp với não, tai có thể
tiếp nhận sóng âm ở phạm vi biên độ lớn và trong chốc lát nó có thể xác định

phương hướng tần số, đặc tính của âm nguồn thông tin (trong trường hợp đây là lời
nói). Hiểu được khả năng và hạn chế của hệ thống sinh học tuyệt vời này là một
điều quan trọng đối với công việc tái tạo hệ thống âm thanh diện tử. Nghiên cứu quá
trình thích giác của con người được gọi là khoa học tâm lý âm thanh.
1.6.1. Tiếng ồn
Tiếng ồn là phản ứng của con người với biên độ sóng âm thanh, nó nằm trong
ngưõng có thể nghe được ở mức độ âm thanh thấp đến ngưỡng của sự chói tai của
những âm cao nằm trong phạm vi từ 10
12
(1000.000.000.000:1) hoặc nhiều hơn ở
những âm thanh có cường độ cao. Âm thanh có cường độ cao được biểu thị bằng
W/m×m. Do phạm vi rộng, thông thường âm thanh được tính theo dB. Ở mức độ
âm chuẩn (0 dB) thường được sử dụng như là ngưỡng nghe và 120dB (ví dụ như
mức độ âm ở khoảng cách 457,2m phát ra từ một động cơ máy bay phản lực khi cất
cánh) gần như được coi là ngưỡng của âm chói, ở mức độ này tiếng ồn trở nên khó
chịu. Nếu như ở mức độ cao hơn thính giác của con người có thể bị tổn thương.
Con người cũng không thể nghe được nhiều âm thanh ở các mức độ khác nhau
trên toàn bộ phạm vi ở bất kỳ thời điểm nào, bởi vì các âm thanh lớn có xu hướng
lấn áp những âm thanh yếu. Tuy nhiên, khi những âm thanh hữu ích (như lời nói,

9
Chương 1: Đại cương về tín hiệu audio và video
âm nhạc) có xu hướng xuất hiện những khoảng lặng và tai con người nhanh chóng
phản ứng với sự thay đổi mức độ âm thanh đó. Vì vậy, việc đưa ra tỉ lệ tín hiệu trên
tạp âm S/N ở 80 hoặc 90dB, nếu như tiếng ồn hoàn toàn không thể nghe được, là rất
quan trọng đối với quá trình tái tạo âm thanh điện tử chất lượng cao. Mặc khác, nếu
chỉ tính đến khả năng nghe rõ, tai có thể hiểu được lời nói S/N bằng 30dB hoặc
thậm chí còn thấp hơn.
1.6.2. Đặc tuyến tần số
Đặc tuyến tần số của thính giác con người nằm trong phạm vi từ 30 đến

15000Hz. Tuy nhiên, con số này thay đổi một cách đáng kể tùy theo từng người và
từng loại tiếng ồn. Các đường cong ở hình 1.4 biểu diễn một số cấp độ âm thanh tạo
ra cảm giác tiếng ồn như nhau ở những tần số và các cấp độ âm thanh khác nhau.










120
100
80
60
40
20
0
0 20 40 60 80 100 120
20 50 100 500 1000 5000 10000
Tần số
(
MHz
)
Biên đ


(

dB
)

Hình 1.4. Đường cong biên độ tín hiệu duy trì độ ổn định âm lượng
Những đường cong này dựa trên cơ sở nghiên cứu tâm lý do Fletcher và
Munson tiến hành. Đường cong thấp hơn biểu thị chệch khỏi phạm vi tần số khoảng
40dB, khi âm thanh lớn hơn có sự thay đổi cảm giác đối với tần số. Ở 120dB, mọi
tần số âm thanh đều lớn như nhau.
Do phụ thuộc vào mục đích của hệ thống nên không biết lúc nào phải tái tạo
đủ phạm vi tần số. Ví dụ như điện thoại, loại máy được thiết kế dùng cho đàm thoại
chỉ có độ rộng band tần từ 300 đến 3000Hz. Mặc khác, đối với các loại máy nghe
nhạc HI-FI lại cần toàn bộ band tần từ 30 đến 15000Hz. Rất nhiều hệ thống audio
lại yêu cầu độ rộng band tần ở mức cao hơn thế, từ 20 dến 20000Hz.
1.7. QUÉT ẢNH

10
Chương 1: Đại cương về tín hiệu audio và video
Một cảnh tự nhiên phản chiếu ánh sáng đồng thời từ tất cả các điểm, trong khi
mắt người có thể cảm thụ được tất cả các điểm này tương đương 10
8
bộ cảm biến
của mắt. Việc cảm nhận dòng dữ liệu này song song phụ thuộc vào não. Tuy nhiên
cấu trúc song song như vậy không thông dụng trong điện tử, vì vậy hệ thống ảnh
điện tử gặp phải những vấn đề khó khăn khác, nó phải chuyển dữ liệu song thành
một hoặc vài tín hiệu điện tử thay đổi theo thời gian, phương tiện để thực hiện việc
này chính là quá trình quét ảnh.
Quét ảnh cũng giống như đọc một quyển sách, bắt đầu ở bên góc trái trên cùng
của cuốn sách, mắt người đọc sẽ di chuyển theo chiều ngang từ trái sang phải bắt
đầu dòng đầu tiên của văn bản, ở cuối dòng này mắt lại quay ngược trở lại bên trái
và di chuyển xuống dòng tiếp theo, đây được coi là quá trình quét dòng.


Hướng quét ngang
Hướng quét dọc









Xung quét
dòng
Xung quét
mành



Hình 1.5. Quét liên dòng: a) mành quét, b) dạng xung quét.
Do vậy, quét ảnh là một quá trình di chuyển các phần tử cảm biến lên mọi
điểm của một ảnh đến khi toàn bộ ảnh được quét hết, tất nhiên điều này có thể được
thực hiện trong mô hình quét như rada, theo hình soắn ốc hoặc thậm chí là ngẫu
nhiên. Trong truyền hình người ta đã lựa chọn kiểu quét hình chữ nhật (được gọi là
mành) bao gồm các chuyển động theo hàng dọc hàng ngang tách rời nhau. Điều này
đã được chứng tỏ ưu thế ở chỗ toàn bộ cảnh do một phần tử chuyển động đồng bộ
với tốc độ đồng nhất quét và thiết bị lắp đặt phần cứng cũng đơn giản.
1.7.1. Quét ảnh điện tử

11

Chương 1: Đại cương về tín hiệu audio và video
Để có mô hình quét ảnh ổn định, tần số quét ảnh hàng dọc (quét mành) và
hàng ngang (quét dòng) phải được đồng bộ hoá trong mối quan hệ thống nhất. Nếu
một hệ thống có N dòng, tần số quét dòng phải ở mức cao nhất và tỉ lệ với tần số
quét dọc theo công thức:
f
h

= N × f
v

Tần số quét dòng cũng là tần số quét ảnh trong hệ thống. Ví dụ nếu tần số quét
ảnh là 60Hz thì tần số quét dọc cũng là 60 Hz. Đối với hệ thống 525 dòng, tần số
quét dòng là 525× 60 = 31500Hz.
Các tín hiệu quét phải được thiết kế để tạo ra quá trình quét tuyến tính, có
nghĩa là tốc độ quét phải đồng nhất trên mọi vị trí của ảnh. Điều này khá quan trọng
đối với camera và máy thu nhằm đảm bảo sự đồng bộ của ảnh trên màn hình máy
thu. Bất cứ độ phi tuyến trong quá trình quét ảnh cũng sẽ gây ra sự biến dạng vị trí
trên một vài phần ảnh. Mặc dù, trên lí thuyết có thể sử dụng mô hình quét ảnh phi
tuyến, nhưng mô hình này rất khó di trì, và tốc độ quét không đồng bộ nên sẽ gây ra
một số vấn đề như: sự thay đổi độ phân giải, độ nhạy cảm và độ chói. Chính vì vậy
các tiêu chuẩn quét ảnh của video đều sử dụng quét tuyến tính.
1.7.2. Xoá khoảng trống
Vị trí của các phần tử quét phải chuyển động tuyến tính trên một đường thẳng
theo thời gian. Điều này được áp dụng trong quá trình quét ảnh từ trái qua phải trên
một dòng của màn hình (đây là thời gian quét tích cực), nhưng không cần thiết
trong quá trình quét ngược lại. Giai đoạn này thời gian quét càng ngắn càng tốt.
Trước đây, quét ngược trong các hệ thống truyền hình bị giới hạn bởi các mạch
quét, do vậy thời gian quét ngược chiếm gần 18% tổng thời gian quét một dòng.
Điều này gây ra lãng phí, bởi vì trong thời gian này không có một thông tin nào

được tuyền. Thực tế trong thời gian này tín hiệu bị xoá do bị đẩy tới điện áp của
mức đen. Do vậy, chu kỳ quét ngược thường được gọi là khoảng xoá dòng và quét
ảnh tuyến tính phải có dạng hình răng cưa. Hình 1.5(b) quét mành cũng là một quá
trình tuyến tính, khoảng xóa mành (VBI) là 8 % đối với truyền hình.
1.7.3. Độ phân giải theo chiều ngang và dải thông tín hiệu
Như trong khi đọc một cuốn sách, mắt phải nhận biết từ kí tự này đến kí tự
khác, quá trình quét ảnh ở một camera video di chuyển rất hiệu quả các phần tử cảm
biến nên ảnh. Điện áp lấy tại đầu ra thay đổi tỉ lệ với cường độ ánh sáng ở mỗi điểm
mà bộ cảm biến quét qua, (trong thực tế không có phần tử chuyển động nào, nhưng
kết quả lại giống như chuyển động này vẫn tồn tại).
Một phần tử cảm biến có kích cỡ xác định, bộ cảm biến lấy trung bình ánh
sáng mà nó cảm nhận được thông qua góc mở. Lấy trung bình như vậy đã làm mất

12
Chương 1: Đại cương về tín hiệu audio và video
các chi tiết nhỏ hoặc gây ra độ dốc của tuyến tính ở tần số cao khi chúng ta quan sát
tín hiệu điện này, hiệu ứng gây ra bởi góc mở, gọi là đặc tưyến góc mở, được minh
họa trong hình 1.6. Hình này đưa ra một góc mở tròn, tuy nhiên góc mở có thể là
bất cứ hình gì và độ nhạy không được phân bổ đồng đều. Điều này đã biến quá trình
lấy trung bình thành một quá trình gộp toàn bộ diện tích góc mở. Kết quả như đã chỉ
trong hình vẽ, là làm tròn các biên trên các quá trình chuyển tiếp và số biên độ bị
mất khi khoảng cách giữa các hình nhỏ hơn kích thước của góc mở.

Góc mở trong
quá trình quét
Đầu ra tín
hiệu video






Hình 1.6. Đặc tuyến góc mở trong quá trình quét
Về hình thức bên ngoài các tần số video tạo bởi quá trình quét ảnh phụ thuộc
vào những chi tiết nhỏ của cảnh và tốc độ quét. Việc quan sát các chi tiết nhỏ để
biết hệ thống tạo ra mô hình có dòng đen và trắng cân bằng là rất hữu ích trong các
hình theo chiều dọc kiểm tra độ phân giải theo chiều ngang của hệ thống và ngược
lại, các hình theo chiều ngang kiểm tra độ phân giải theo chiều dọc.
Đối với độ phân giải theo chiều ngang tần số video f
v
tạo bởi một hình của các
dòng đen và trắng theo chiều đứng ở khoảng cách đồng nhất được cho tính bằng
biểu thức:
f
V
= (f
H
× N
p
× AR)/ 2(1-HB) (1.3)
f
H
: tần số quét dòng
N
p
: số dòng đen trắng ở khoảng cách cân bằng với độ cao của ảnh
AR: cỡ ảnh là tỷ lệ của chiều rộng và chiều cao của màn hình (NTSC là 1,33).
HB: thời gian xóa dòng (0,18 đối với hệ NTSC)
1.7.4. Quét cách dòng
Phương pháp quét mô tả trong những phần trên được gọi là quá trình quét liên

dòng bởi vì tất cả các dòng hoặc mỗi ảnh đều được quét liên tục. Công thức (1.5)
chỉ rõ tần số video lớn nhất được tạo bởi quá trình quét ảnh tỉ lệ với tần số quét
dòng, và tất nhiên sẽ bằng tần số quét dọc nhân với số dòng quét. Do tần số quét
dọc phải đủ lớn để không gây ra hiện tượng rung hình, nên người ta có thể nhận

13
Chương 1: Đại cương về tín hiệu audio và video
thấy độ rộng band tần video cần thiết là một hàm số dòng trực tiếp trong ảnh và giá
trị của tần số quét theo hàng dọc. Tuy nhiên, tần số video có thể hạ thấp mà không
gây ra hiện tượng rung hình bằng phương pháp quét cách dòng.
Quét cách dòng được thực hiện bằng cách chỉ quét từng phần của dòng quét
trong mỗi lần quét dọc. Ví dụ, một lần quét dọc thứ nhất có thể quét tất cả các dòng
lẻ, và lần quét dọc thứ hai quét tất cả các dòng chẵn. Đây chính là quét cách dòng tỉ
lệ 2:1, và tần số video giảm theo hệ số 2:1 so với quá trình quét liên dòng ở cùng
tần số quét dọc. Do tần số quét dọc không đổi, nên hiện tượng rung hình hầu như
không xảy ra.

Hướng quét ngang
Hướng quét dọc









Xung quét
dòng

Xung quét
mành




Hình 1.7. Quét cách dòng: a) mành quét b) dạng xung quét
Quá trình quét dòng được hoàn thành khi tổng số dòng quét phải là số lẻ (525
hoặc 625) và tần số quét dòng bằng 1,5 lần tích của số dòng và tần số quét dọc. Từ
mối quan hệ tần số này sẽ cho ra kết quả của quá trình quét cách dòng như trong
hình 1.7. Trong hình này, điểm cuối của lượt quét dọc thứ nhất nằm ở trung tâm của
dòng, vì vậy điểm xuất phát của dòng quét dọc thứ hai cũng nằm ở trung tâm của
một dòng (chính xác là diểm giữa của dòng đầu tiên). Phải mất hai lượt quét mới
quét hết một ảnh gồm hai mành: mành 1 bao gồm tất cả các dòng lẻ và mành 2 bao
gồm tất cả các dòng chẵn.
1.7.5. Độ phân giải đứng

14
Chương 1: Đại cương về tín hiệu audio và video
Không giống như độ phân giải ngang thường bị giới hạn bởi độ rộng band tần
của hệ thống, độ phân giải đứng lại bị giới hạn bởi số lượng các dòng quét trên
hình. Các hình ngang hoặc gần kề, ở những chi tiết nhỏ được lấy mẫu bằng tần số
không gian của số dòng quét thể hiện qua số dòng quét tích cực. Tiêu chuẩn
Nyquist đã chỉ ra rằng các tần số vượt quá 1,5 chu kỳ lấy mẫu sẽ không lấy được
mẫu chính xác nên người ta có thể kết luận giới hạn độ phân giải theo hàng dọc đo
ở TVL là 1.5 số dòng tích cực. Tuy nhiên, trong thực tế giớn hạn này có thể cao hơn
bởi vì hiện tượng méo do chồng phổ, không hoàn toàn che khuất tín hiệu. Trước
đây, trong hệ thống truyền hình, người ta đã đặt tên cho tỷ lệ giữa độ phân giải giới
hạn biểu kiến và số dòng tích cực là hệ số Kell. Nó nằm trong phạm vi từ 0.5 đến
0.9 và thường lấy ở 0.7.

Kết hợp quét cách dòng và chồng phổ theo chiều dọc ở các biên ngang sẽ gây
ra hiệu ứng giả trong quá trình tái tạo lại ảnh tự nhiên, đó chính là hiện tượng rung
hình ở các biên ngang gần kề và hiện tượng rung hình theo hình chữ chi ở một phần
của ảnh có hướng tập trung theo chiều ngang.
Hiệu ứng lấy mẫu theo chiều dọc xảy ra ở bất cứ hệ thống nào có sử dụng quét
dòng, vì vậy nó tồn tại trong các hệ thống video số cũng như truyền hình. Để loại
trừ hoàn toàn hiện ứng này, tần số đầu vào trên giới hạn Nyquist phải được lọc ra
trước quá trình lấy mẫu. Điều này có nghĩa là, quá trình lọc phải được thực hiện ở
phần quang học của camera trước khi quá trình quét xảy ra ở bộ cảm biến ảnh.
1.8. BIỂU DIỄN MÀU SẮC
1.8.1. Đặc trưng màu sắc của ánh sáng
Ánh sáng tự nhiên là một nguồn sáng tổng hợp các sóng điện từ nằm trong giải
phổ có bước sóng từ 400 đến 700nm (10
-9
m) mà mắt người có thể quan sát được. Sự
phân bố phổ biến của ánh sáng trắng tương đối đồng đều trên toàn bộ dải ánh sáng
quan sát được mặc dù có rất nhiều loại ánh sáng trắng. Ngược lại, sự phân bố của
ánh sáng màu không đồng đều, thường có từ hai vùng phổ trở lên. Quá trình phản
chiếu ánh sáng trắng từ bề mặt của những vật tự nhiên có thể có sự chọn lọc bước
sóng, điều này tạo ra đặc tính màu sắc của vật. Sóng của ánh sáng ở bước sóng của
màu sắc được phản chiếu, bước sóng khác ít nhiều bị hấp thụ thay bằng bị phản
chiếu
Mắt người nhận biết được màu sắc bằng ba loại tế bào hình nón khác nhau
trong bộ thụ cảm của võng mạc. Chúng phản ứng khác nhau với những màu sắc
khác nhau và phát tín hiệu ba chiều tới não, tại đây màu sắc sẽ được nhận biết.
Chính vì quá trình nhận biết này mà mắt người cảm nhận màu sắc không giống với
màu sắc vật lý. Một hệ thống tái tạo màu sắc thường quan tâm tới các thông tin về

15
Chương 1: Đại cương về tín hiệu audio và video

màu sắc vật lý (phân bố phổ), tuy nhiên nó vẫn phải tái tạo lại được cảm giác màu
sắc mà người xem cảm nhận được.
Từ thế kỷ thứ 17, Isaac Newton đã chỉ ra rằng tất cả các màu sắc đều có thể
cảm nhận chỉ bởi từ ba màu tương đương với ba thành phần cảm thụ màu sắc trong
mắt và điều này được trình bày thông qua thuyết ba màu. Đây là cơ sở cho ảnh màu,
in màu, sơn màu và các hệ thống truyền hình màu.
1.8.2. Các màu cơ bản
Thuyết ba màu cho rằng bất kỳ màu sắc nào cũng được tạo ra bởi sự kết hợp
của ba màu, được gọi là các màu cơ bản (hình 1.10). Ba màu cơ bản sử dụng trong
hệ thống truyền hình này: đỏ, lục, lam. (gọi tắt là RGB). Khi trộn ba màu theo tỷ lệ
bằng nhau thì sẽ thu được màu trắng .
Mỗi màu cơ bản có một màu phụ tương ứng, mà khi trộn với màu cơ bản của
nó sẽ tạo ra nàu trắng. Màu phụ của màu đỏ là màu lơ, của màu lục là màu mận chín
và của màu lam là màu vàng như biễu diễn ở hình 1.8. Như vậy trong sử lý ảnh màu
cũng như trong kỹ thuật truyền hình màu người ta chỉ dùng ba màu cơ bản để biểu
diễn cho vô số các màu sắc của ảnh bằng cách pha trộn những màu sắc cơ bản này
theo những tỷ lệ màu nhất định.

Đỏ tươi Đỏ
Vàng
Lục Lơ
Lam
Các màu cơ bản
Phụ của
màu lục
Phụ của
màu lam
Phụ của
màu đỏ









Hình 1.8. Các màu cộng và trừ cơ bản
1.8.3. Hệ thống truyền hình thành phần
Trong hệ thống truyền hình màu, camera phải phát đi ba thành phần màu sắc
điều khiển các nguồn ánh sáng đỏ, lục, lam của màn hình. Camera video chuyên
nghiệp thực hiện việc này bằng cách sử dụng ba bộ thụ cảm hình ảnh được quét
đồng thời và ba bộ này có bộ phận lọc màu sắc phù hợp để đạt được đặc tuyến phổ
tương ứng. Đầu ra của bộ thụ cảm sẽ truyền tín hiệu để điều khiển ba súng điện tử

16
Chương 1: Đại cương về tín hiệu audio và video
của máy thu. Các camera giá thấp hơn chỉ sử dụng một bộ thụ cảm có bộ lọc màu
sửa sai để thu ba màu từ khu vực lân cận trên bề mặt thụ cảm. Quá trình xử lý điện
tử của các tín hiệu ở camera này cho phép lấy ra các thành phần màu sắc RGB.
Khi hệ thống lớn, việc xử lý các tín hiệu thành phần màu sắc trên ba mạch
song song trở nên phức tạp, có nhiều tín hiệu video mắc nối tiếp và không thể thực
hiện được khi các tín hiệu màu analog được truyền hoặc phát quảng bá trên một
kênh đơn. Vì vậy, cần thiết phải có một hệ thống màu tổng hợp kết hợp ba thành
phần màu sắc thành một tín hiệu đơn .
Chú ý rằng, trong hệ thống số mà các thành phần RGB được số hoá, việc kết
hợp các kênh số cho một trong ba thành phần, một kênh đơn giản chỉ là quá trình
chuyển đổi song song-nối tiếp. Tuy nhiên, tạo ra một tín hiệu tổng hợp ở một hệ
thống analog không phải là một công việc đơn giản và thường có liên quan đến các
quy ước về chỉ tiêu kỹ thuật. Do đó, bất cứ một hệ thống nào được thiết kế theo tiêu

chuẩn kỹ thuật số đều không nên sử dụng các tín hiệu tổng hợp analog. Dù vậy, rất
nhiều hệ thống sẽ đổi từ analog sang số và việc số hoá các tín hiệu tổng hợp analog
được miêu tả dưới đây là rất có ích trong giai đoạn chuyển tiếp .
Một số thao tác kĩ thuật giúp hệ thống màu tổng hợp analog có thể sử dụng vào
hệ thống số cũng rất hữu ích với các hệ thống số. Phần bàn luận dưới đây sẽ chỉ ra
điều đó. Tuy nhiên, phần bàn luận hệ thống tổng hợp này mới chỉ dừng lại ở việc
khái quát.
1.8.4. Hệ thống màu tổng hợp
Mắt người còn có một đặc tính nữa góp một phần khá quan trọng cho hệ thống
truyền hình màu. Từ cách thu thập thông tin trong não, có thể nhận thấy là mắt có
độ phân giải kém với các vật thể có màu sắc hơn là với các vật đen trắng. Vì vậy,
một hệ thống video cũng phải giảm độ phân giải, để khai thác đặc tính này của mắt,
các tín hiệu màu cơ bản của một hệ thống video tạo bởi camera cần phải được cấu
trúc lại thành các màu sắc riêng biệt và đơn sắc giống như cách mà mắt thực hiện.
Thuyết ba màu cho rằng, bất cứ một tín hiệu ba màu nào xuất hiện, đều có thể
thực hiện phép chuyển đổi ma trận tuyến tính của các tín hiệu thành phần R,G,B
thành một tín hiệu đơn sắc (độ chói) và hai tín hiệu hiệu màu. Các tín hiệu màu là
các khác nhau về màu sắc, có nghĩa là khi không có màu ta có kết quả bằng 0. Đây
là kết quả của phép trừ tín hiệu chói cho các tín hiệu màu thành phần.
1.8.4.1. Độ chói và các thành phần tín hiệu màu
Tín hiệu chói có đặc tuyến phổ tương ứng với đường chói (hình 1.9), nó thể
hiện độ chói tương đối mà mắt người thu được ở những phổ màu khác nhau. Tín
hiệu chói Y được tổng hợp bằng cách kết hợp các tín hiệu R, G, B theo công thức:

17
Chương 1: Đại cương về tín hiệu audio và video
Y = 0,59G + 0.30R + 0,11B (1.6)
Chú ý là trọng số của màu sắc ở công thức chói là thích hợp với sự cảm nhận
của thị giác về độ chói của màu sắc. Màu lục xuất hiện chói nhất, màu đỏ tối hơn và
màu lam là tối nhất. Các tín hiệu màu nhận được bằng cách trừ Y với R và B để tạo

ra tín hiệu R-Y và B-Y. Những tín hiệu này có thể truyền đi với dải band tần có độ
rộng một nữa do sự phân giải của mắt kém hơn. Độ chói các tín hiệu màu được sử
dụng rộng rãi trong hệ thống tương tự và số.

210 x f
H
211 x f
H
212 x f
H
0 1.0 2.0 3.0 4.0
Biên đ

Tần số MHz







1.0
0.5
400 440 480 520 560 600 640 680
Hình 1.9. Đường cong độ chói
1.8.4.2. Tần số quét cách dòng
Một đặc tính khác của tín hiệu video là có thể kết hợp các thành phần tín hiệu
chói và các thành phần tín hiệu màu thành một kênh đơn. Điều này được lý giải là
các thành phần tần số tạo bởi tín hiệu video được quét hầu hết đều tập trung xung
quanh hài của tần số quét dòng.











Hình 1.10. Phổ của tín hiệu video đơn sắc

18
Chương 1: Đại cương về tín hiệu audio và video
Về mặt toán học, điều này có thể được chứng minh bằng phép phân tích
Fourier các tín hiệu video tiêu biểu, song nó có thể được chứng minh theo trực giác
bằng cách quan sát và thấy rằng, các thành phần có ý nghĩa nhất của sóng video là
tín hiệu xoá dòng, đó là một chuỗi xung của tần số quét dòng. Tất nhiên, phổ của
xung này có thể bao gồm tần số quét dòng và hài của nó, như hình 1.10.
Bản chất này là phổ năng lượng tín hiệu tập trung vào gần hài của tần số dòng.
Có nghĩa là, có thể quét các dòng v
ới tín hiệu mà các thành phần tần số của nó hầu
hết có thể bị giảm ở giữa các hài của dòng. Nếu điều này được thực hiện một cách
chính xác sẽ giảm thiếu được nhiễu giữa hai tín hiệu.
1.8.4.3. Hệ thống truyền hình màu tổng hợp NTSC
Hệ thống truyền dẫn màu tổng hợp đầu tiên là công nghệ truyền hình màu
NTSC xuất hiện tại Mỹ vào những năm 50. Hệ thống này kết hợp các tín hiệu thành
phần ba màu thành một tín hiệu tổng hợp phù hợp với kênh 6MHz, kênh này sử
dụng cho truyền hình quảng bá đen trắng. Hơn nữa, tín hiệu này có thể đáp ứng
được tính tương hợp giữa truyền hình màu và truyền hình đen trắng, tức là tín hiệu

màu đen trắng có thể thu được tín hiệu màu và cả đen trắng nữa. Hệ NTSC hiện nay
vẫn được sử dụng hơn 50 năm sau khi ra đời.

210 x f
H
211 x f
H
212 x f
H
0 1.0 2.0 3.0 4.0
Biên đ


Tần số MHz
Sóng mang màu
Dải tín
hiệu sắc
Dải biên tín
hiệu chói
Phổ tín
hiệu chói
Phổ tín sắc
được chèn











Hình 1.11. Phổ của tín hiệu video màu tổng hợp minh họa quá trình chèn tần số
Ở hệ truyền hình màu NTSC hoặc PAL, hai tín hiệu màu được điều biên nén
vuông góc đặc điểm của phương pháp điều chế này là sóng mang phụ sẽ bằng 0 khi
không có tín hiệu, nó xảy ra khi truyền ảnh đen trắng. Vì vậy, tín hiệu sóng mang
màu sẽ biến mất ở ảnh đen trắng hoặc các vùng đơn sắc của ảnh màu. Bởi vì các tín

19
Chương 1: Đại cương về tín hiệu audio và video
Sóng mang màu được chọn ở miền tần số cao của phổ tín hiệu chói, bởi vì đặc
tính của tín hiệu video là các thành phần tần số cao thường nhỏ và sự nhiễu tần số
cao thì khó nhìn thấy hơn tần số thấp. Cả hai vấn đề này điều làm giảm khả năng
nhìn các sự xuyên âm giữa các thành phần quét dòng.
Một đặc điểm cuối cùng góp phần làm giảm thiểu sự xuyên âm giữa các thành
phần của tín hiệu NTSC là độ phân giải của mắt tuỳ theo màu. Vì vậy, bằng cách
chọn các thành phần màu phù hợp, nó sẽ giảm dải tần số tín hiệu màu R-Y và B-Y
có thể đến hơn một nữa, điều này yêu cầu thay đổi tín hiệu màu R-Y và B-Y thành
hai tín hiệu Y (cùng pha) và Q (cầu phương). Biểu thức ma trận của tín hiệu này là:
I = 0.6R - 0.28G - 0.32B
Q = 0.21R - 0.51R + 0.30B
Trong tiêu chẩn NTSC, tín hiệu I được truyền với dải thông là 1,3MHz, tín
hiệu Q có dải thông là 0,5MHz, và tín hiệu Y được sử dụng toàn bộ dải thông
4,2MHz. Bảng 1.3 đưa ra các thông số thực tế cho ba hệ truyền hình.
Danh mục NTSC PAL SECAM
Tần số quét dòng 525 625 625
Tỷ lệ quét cách dòng 2:1 2:1 2:1
Tần số quét mành (Hz) 59,94 50,0 50,0
f

H
(Hz) 15.734.26 15.625 15.625
Dải thông tín hiệu chói (Mhz) 4,2 5,0 hoặc 5,5 50 hặc 5,5
f
SC
(Hz) 3.579.545 4.433.619
4.250.000
4.406.250
Dải thông tín hiệu sắc (Mhz)
I = 1,3
Q=0,5
U = 1,3
V = 1,3
D
R
= 1,3
D
B
= 1,3
Bảng 1.3. Các thông số hệ thống của các hệ thống màu tổng hợp
Tần số mành 59,94 Hz của hệ NTSC có sự khác biệt rất nhỏ so với tần số 60Hz
vì một lý do rất quan trọng. Nhằm giảm thiểu hiện t
ượng nhiễu điều biến xuyên có
thể xảy ra giữa tần số mang âm thanh 4,5MHz và tần số mang này thì tần số quét

20
Chương 1: Đại cương về tín hiệu audio và video
dòng phải là ước số nguyên của 4,5MHz. Tần số gần nhất tần số dòng 15.725Hz của
tiêu chuẩn màn hình trắng đen là
ước số thứ 286 của 4,5MHz là 15.7345,26Hz con

số này chia cho 525 và nhân với 2 sẽ cho tần số mành 59,94 Hz.
1.8.4.4. Hệ thống truyền hình màu tổng hợp PAL
Vài năm khi hệ NTSC đưa vào sử dụng, hệ truyền hình màu PAL của châu Âu
cũng đ
ược phát triển và đã thừa hưởng thành quả của hệ thống NTSC, nó có dải
thông lớn h
ơn hệ NTSC và nó được dùng quảng bá châu Âu. Cũng giống như
NTSC hệ PAL cũng đáp ứng đ
ược tính tương hợp đối với hệ thống truyền hình đen
trắng ở châu lục này.
ư
Hầu hết các n
ớc châu Âu có hệ thống đen trắng 625 dòng và có tầng số quét
mành là 50Hz. Với độ rộng band tần là 5,5MHz, hệ PAL sử dụng tần số quét màu
cao h
ơn hệ NTSC và có dải thông của 2 tín hiệu màu là như nhau cho mỗi kênh. Từ
đó hệ PAL dùng trực tiếp các thành phần B-Y và G-Y. Các thành phần này đ
ược
gọi là U và V. Các biểu thức của nó là:
U = 0.493(B-Y)
V = ± 0.877(R-Y)
Tuy nhiên có sự khác biệt quan trọng ở hệ PAL chính là tên gọi của hệ này
“đảo pha theo từng dòng” đ
ược đánh dấu bằng kí hiệu ± trong biểu thức. Pha của
sóng mang màu tín hiệu V sẽ bị đảo ng
ược từ dòng này đến dòng khác. Mục đích
của nó là sửa méo pha, méo này có thể gây nên sự méo sắc độ của màu, đây chính là
nh
ược điểm của hệ NTSC, mặc dù nó có thể giảm bớt khi các hệ thống và thành
phần đ

ược thiết kế một cách cẩn thận. Các thông số của hệ PAL cũng được cho
trong bảng 1.3.
1.8.4.5 Hệ thống truyền hình màu SECAM
Một hệ thống truyền hình màu khác được phát triển tại Pháp có tên là SECAM
và nó đ
ược sử dụng hai sóng mang điều tần để mang hai tín hiệu hiệu màu B-Y và
R-Y. Hệ thống này đã loại bỏ các thông số biên độ và pha bởi vì các thông số này
không quan trọng với điều tần. Tuy nhiên nó chỉ đ
ược sử dụng ở Pháp và Liên Xô
cũ. Các thông số của SECAM cũng được cho trong bảng 1.3
1.8.4.6 Các vấn đề nảy sinh với màu tổng hợp
Mặc dù hiện nay có khoảng 10.000 trạm phát hình tới hàng trăm triệu máy thu
trên toàn thế giới, tất cả đều sử dụng màu tổng hợp, song những hệ thống này vẫn
còn rất nhiều vấn đề cần giải quyết. Kết quả của quá trình điều chế màu và quét
cách dòng không hoàn hảo, độ phân giải tín hiệu đen trắng bị tiêu hao, độ phân giải
màu bị giảm quá nhiều không thể tái tạo đ
ược truyền đi từ máy tính. Quét cách

21
Chương 1: Đại cương về tín hiệu audio và video
dòng tạo ra một hiệu ứng giả và các tín hiệu lại không chấp nhận hiện tượng nhiễu
hoặc méo do việc truyền hay ghi hình gây nên. Nhìn chung, ng
ười xem truyền hình
đều hài lòng với hệ thống hiện có, song đó là do ch
ưa có hệ thống nào để họ chọn
lựa.
Tuy nhiên, cần nói thêm là các tiêu chuẩn truyền hình hiện nay còn nhiều hạn
chế. Đây là mục tiêu của những ng
ười đang nghiên cứu phát triển tiêu chuẩn HDTV
mới. Sử dụng kỹ thuật số, những hạn chế của truyền hình tổng hợp sẽ đ

ược loại bỏ
và bằng cách áp dụng công nghệ nén hình số, các tín hiệu có độ phân giải cao h
ơn
nhiều sẽ đ
ược truyền đi trên cùng các kênh có tần số 6MHz đang được sử dụng cho
hệ thống NTSC.
Tất nhiên, mỗi hệ thống đều có hạn chế riêng, song các tiêu chuẩn HDTV có
sự cải thiện chất l
ượng đáng kể hơn cả so với các hệ thống khác. Tuy nhiên quá
trình chuyển đổi từ t
ương tự sang số sẽ rất khó khăn đối với hệ thống này. Trong thế
giới của kỹ thuật số không có không gian giành riêng cho màu tổng hợp
1.9. CÁC TÍN HIỆU VIDEO T
ƯƠNG TỰ
ư
Các tín hiệu do quá trình quét ảnh tạo nên đ
ợc xử lý trong camera và định
dạng theo tiêu chuẩn của camera. Cùng với việc xác định các tần số quát ảnh tiêu
chuẩn video t
ương tự cũng xác định rõ dạng sóng của tín hiệu video.
1.9.1 Dạng sóng tín hiệu video
Các dạng sóng video t
ương tự có thể nhìn thấy trên màn hiển thị dạng sóng
hoặc trên OSC, nó đ
ược đồng bộ hoá với tín hiệu của cả ảnh, mành và tỉ lệ dòng. Ở
bất cứ các tỉ lệ này thông tin video th
ường là ngẫu nhiên và tất nhiên nó sẽ thay đổi
khi ảnh thay đổi. Tuy nhiên phần xoá dòng và đồng bộ hoá tín hiệu video không
thay đổi và lặp đi lặp lại vì vậy chúng xuất hiện rất nét. Hình 1.12 biểu diễn các
dạng sóng video của tiêu chuẩn truyển hình NTSC.

Như biểu diễn ở hình 1.12a. là dạng tín hiệu video trong một chu kì quét dòng,
nó minh họa chi tiết dữ liệu trong khoảng xoá dòng bao gồm xung đồng bộ dòng và
burst đồng bộ màu. Burst đồng bộ màu bao gồm ít nhất 8 chu kì tần tần số sóng
mang màu. Hìmh 1.12b minh hoạ chi tiết không xoá mành. Trong khoảng xoá mành
có chứa một xung lớn để đồng bộ quá trình quét mành, tuy nhiên trong khoảng rộng
xung này, các xung hẹp lại bị biến thành hình răng c
ưa để đồng bộ hoá quá trình
quét dòng. Bởi vì mối quan hệ giữa sự dịch các xung dòng và xung mành giữa mành
chẵn và mành lẻ do tỉ lệ tần số cần cần để quét các dòng nên các xung hình răng c
ưa
trong khoảng đồng bộ mành và các xung cân bằng ở xung quanh có tần số gấp đôi.
Nhờ đó xung mành và các xung quanh nó giống nhau cả ở mành chẵn và mành lẻ.

22
Chương 1: Đại cương về tín hiệu audio và video


Đỉnh mức
trắng
Mức đen
Xung đồng bộ
dòng
Tín hiệu hình
trên dòng
Bust màu
Khoảng
xóa dòng














VBI
Xung đồng bộ mành
Xung đồng bộ mành và cân bằng
Hình 1.12. Dạng sóng tín hiệu video NTSC
Hầu hết các hệ thống truyền hình đều có một vài bộ phận và tín hiệu video phải
đ
ược truyền giữa các bộ phận đó, vì vậy phải đề ra các tiêu chuẩn kết nối video để
xác định cáp, bộ kết nối, mức điện áp. Điều này giúp cho các bộ phận của các nhà
sản xuất khác nhau có thể kết nối cùng một hệ thống.
1.9.2. Các đặc điểm của truyền hình tương tự
Tín hiệu ở đầu vào và đầu ra của một hệ thống video luôn là tín hiệu tương tự
ngay cả khi hệ thống đó đã được số hoá toàn bộ, người ta vẫn sử dụng các thông số
video tương tự để đánh giá hệ thống số.
1.9.2.1. Thang xám
Đặc tuyến thang xám được kiểm tra bằng một ảnh có dạng bậc thang hoặc
bằng một tín hiệu có dạng bậc thang xám được biểu diễn trên hình 1.13. Hình (hoặc
tín hiệu) bao gồm các bậc thang xám cân bằng các bậc này có thể được tạo lại tuyến
tính bởi hệ thống. Bằng cách đưa ra 2 ảnh: 1đi lên và 1 đi xuống, chúng ta có thể so
sánh đặc tuyến của điểm giữa. Với hệ thống tuyến tính thật sự, điểm giữa sẽ gặp
nhau chính xác ở 50% thang xám. Nếu hệ thống kiểm tra có lỗi gamma thì các bậc

này sẽ gặp nhau ở điểm khác nhau như hình đã miêu tả.

23

×