Tải bản đầy đủ (.pdf) (119 trang)

Bài giảng truyền thông đa phương tiện - ảnh, video, audio, VoIP

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.48 MB, 119 trang )

MỤC LỤC
MỞ ĐẦU .........................................................................................................................3
CHƢƠNG 1: TỔNG QUAN VỀ TRUYỀN THÔNG ĐA PHƢƠNG TIỆN .................4
1.1. Giới thiệu chung về truyền thông đa phƣơng tiện .............................................4
1.1.1. Một số khái niệm cơ bản .............................................................................5
1.1.2. Các ứng dụng truyền thông đa phƣơng tiện ................................................6
1.2. Các thành phần của hệ thống truyền thông đa phƣơng tiện .............................11
1.3. Dữ liệu đa phƣơng tiện ....................................................................................13
1.4. Kỹ thuật nén dữ liệu .........................................................................................14
1.5. Truyền dữ liệu đa phƣơng tiện .........................................................................17
1.6. Các phƣơng pháp truyền dữ liệu đa phƣơng tiện .............................................18
1.6.1. Mô hình download ....................................................................................18
1.6.2. Mô hình Streaming ....................................................................................19
CHƢƠNG 2: CÁC PHƢƠNG PHÁP NÉN DỮ LIỆU ĐA PHƢƠNG TIỆN ..............21
2.1. Phƣơng pháp nén ảnh .......................................................................................21
2.1.1. Ảnh số và các định dạng file .....................................................................21
2.1.2. Phƣơng pháp nén ảnh JPEG ......................................................................26
2.1.3. Phƣơng pháp nén ảnh JPEG2000 ..............................................................44
2.2. Các chuẩn biểu diễn và nén video....................................................................47
2.2.1. Nguyên tắc cơ bản về nén Video ..............................................................47
2.2.2. Các chuẩn nén MPEG ...............................................................................48
2.2.3. Các chuẩn nén MPEG-1, MPEG-2, MPEG-4 ...........................................54
2.2.4. Chuẩn tổ chức Multimedia MPEG-21 ......................................................63
2.2.5. Các chuẩn nén video H.261, H.263 .............................................................63
2.2.6. Các chuẩn nén mới H.264/MPEG-4 Part 10 ................................................66
2.2.7. Các chuẩn hệ thống AudioVisual – H.3xx ...................................................67
2.3. Các chuẩn biểu diễn và nén âm thanh .................................................................67
2.3.1. Âm thanh ......................................................................................................67
2.3.2. Kỹ thuật âm thanh số ....................................................................................68
2.3.3. Nén âm thanh theo chuẩn MPEG .................................................................69
2.3.4. Các chuẩn nén âm thanh ...............................................................................69


2.3.5. Các chuẩn tái hiện (surround) âm thanh số ..................................................72
2.4. Các chuẩn biểu diễn và nén tiếng nói .................................................................73
2.4.1. Tổng quan về xử lý tiếng nói ........................................................................73
2.4.2. Các chuẩn nén tiếng nói ITU-T G7.xx ......... Error! Bookmark not defined.
CHƢƠNG 3: CÔNG NGHỆ TRUYỀN DỮ LIỆU ĐA PHƢƠNG TIỆN ....................74
1


3.1. Các mạng IP .....................................................................................................74
3.1.1. Tổng quan về internet, khái niệm và các giao thức ..................................74
3.1.2. Các hệ thống tên miền Internet và địa chỉ .................................................75
3.1.3. Các giao thức IPv4 và IPv6 .......................................................................75
3.2. Công nghệ mạng không dây ............................................................................78
3.2.1. Tổng quan về mạng không dây .................................................................78
3.2.2. Các mạng PAN (Bluetooth) ......................................................................80
3.2.3. Các mạng LAN .........................................................................................81
3.2.4. Các mạng di động Wireless Voice Network .............................................83
3.2.5. Đảm bảo chất lƣợng dịch vụ (Internet QoS) .............................................86
3.3. Dịch vụ VoIP ...................................................................................................89
3.4. Dịch vụ VPN ....................................................................................................93
3.5. Công nghệ truyền hình số ................................................................................94
CHƢƠNG 4: THIẾT BỊ TRUYỀN THÔNG ĐA PHƢƠNG TIỆN .............................96
4.1. Thiết bị kết nối ....................................................................................................96
4.2. Các thiết bị lƣu trữ ..............................................................................................97
4.2.1. Ðĩa từ tính .....................................................................................................98
4.2.2. Ðĩa từ quang................................................................................................101
4.2.3. Ðĩa quang học .............................................................................................102
4.2.4. Băng từ - Magnetic tape .............................................................................103
4.2.5. Thẻ SD – Secure Digital Card ....................................................................104
4.2.6. Ổ đĩa lai SSHD ...........................................................................................104

4.3. Các thiết bị vào/ra .............................................................................................105
4.3.1. Các thiết bị vào ...........................................................................................105
4.3.2. Các thiết bị ra ..............................................................................................111
4.4. Thiết bị đọc .......................................................................................................118
4.5. Thiết bị đầu cuối...............................................................................................119

2


MỞ ĐẦU
Học phần cung cấp cho sinh viên các kiến thức về:
- Các khái niệm cơ bản về truyền thông đa phƣơng tiện
- Các chuẩn mã hoá ảnh
- Các chuẩn mã hoá video
- Các chuẩn mã hoá âm thanh
- Các chuẩn mã hoá tiếng nói
- Các mạng IP, wireless
- Các giao thức truyền thông đa phƣơng tiện
- Các ứng dụng trong truyền thông đa phƣơng tiện.
Nhằm giúp sinh viên phát triển sự hiểu biết về các nguyên tắc cơ bản về các hệ
thống đa phƣơng tiện và chúng đƣợc ứng dụng và phát triển nhƣ thế nào trong thực tế.
Ngoài ra nhằm tạo cho sinh viên cơ hội tiếp cận thực sự chuyên sâu về môn học.
Nhƣng cũng tạo điều kiền cho sinh viên tự học, phát triển năng lực, điểm mạnh, điểm
yếu của mỗi cá nhân.

3


CHƢƠNG 1: TỔNG QUAN VỀ TRUYỀN THÔNG ĐA PHƢƠNG TIỆN
1.1. Giới thiệu chung về truyền thông đa phƣơng tiện

Khi công nghệ phát triển, ngƣời tiêu dùng ngày càng đòi hỏi khắt khe hơn.
Trong thời đại của thông tin tốc độ cao, chúng ta mong muốn nhận đƣợc các thông tin
ngay tức thì và đồng thời, thông qua nhiều cách thức khác nhau. Nhu cầu này giải
thích tại sao các kênh tin tức trên truyền hình thƣờng xuyên có các dòng chữ chạy
phía dƣới màn hình trong khi phát th ảnh viên nói và các hình ảnh đã thâu băng trƣớc
đó trôi qua. Nhu cầu đó giải thích tại sao các website ngày nay ngoài nội dung và các
siêu liên kết còn gồm thêm các hình ảnh đồ hoạ, hoạt ảnh và âm thanh.
Những nhu cầu này đã mở rộng cách chúng ta làm việc, học tập và giải trí. Nói
một cách đơn giản, các thông tin “một chiều” không còn phù hợp với hầu hết chúng ta
nữa. Thông tin, các bài học, trò chơi và mua sắm sẽ lôi cuốn hơn là khiến chúng ta chú
ý hơn nếu chúng ta có thể tiếp cận và sắp xếp chúng trong các cách thức khác nhau,
thậm chí theo một ý thích nào đó mà chúng ta chợt nảy ra. Những nhu cầu này và các
tiến bộ về công nghệ đã tƣơng quan mật thiết với nhau để đƣa nghệ thuật và khoa học
truyền thông đa phƣơng tiện lên một tầm cao mới, dẫn đến kết quả là các sản phẩm có
khả năng đan kết văn bản, hình ảnh đồ hoạ, hoạt ảnh, âm thanh và video.
Khi chúng ta sử dụng các sản phẩm này - cho dù là một bộ bách khoa toàn thƣ
trên web hay một trò chơi video trên CD - thì có nghĩa là chúng ta không đơn thuần
chỉ làm việc với một chƣơng trình máy tính. Chúng ta đã trải nghiệm qua một sự kiện
truyền thông đa phƣơng tiện. Các sản phẩm truyền thông đa phƣơng tiện ngày nay
đều thu hút nhiều giác quan cùng một lúc và đáp ứng với nhu cầu thay đổi của chúng
ta với tốc độ ngày càng gia tăng.
Cùng với sự phát triển rộng rãi của công nghệ thông tin, truyền thông đa
phƣơng tiện giống nhƣ một cơn bão tiến vào cuộc sống hiện đại của chúng ta, nó làm
thay đổi cách chúng ta nghĩ, cách chúng ta hành động, thậm chí cả cách chúng ta sống.
Truyền thông đa phương tiện là việc ứng dụng công nghệ thông tin trong việc
sáng tạo, thiết kế những sản phẩm mang tính đa phương tiện và tương tác ứng dụng
trong các lĩnh vực truyền thông, quảng cáo, giáo dục và giải trí...
Đó là việc thiết kế đồ họa, trò chơi điện tử, làm hoạt hình 3D, thiết kế web, biên
tập âm thanh, phim ảnh… tất cả đều thực hiện trên máy tính. Hầu hết các sản phẩm
truyền thông (quảng cáo, truyền hình, Internet,…) và giải trí hiện đại (game, điện ảnh,

hoạt hình,…) chúng ta sử dụng ngày nay đều là sản phẩm của ngành truyền thông đa
phƣơng tiện.
Có thể nói, truyền thông đa phƣơng tiện là sự kết hợp giữa công nghệ thông tin
và mỹ thuật, trong đó máy tính là công cụ chủ yếu cho việc sáng tạo, xây dựng các sản
4


phẩm truyền thông, giải trí,… và ứng dụng đồ họa cho tất cả các lĩnh vực khác của đời
sống xã hội.
Thực tiễn cho thấy các dịch vụ thông tin ngày nay không chỉ đơn thuần là cung
cấp dữ liệu, số liệu mà đòi hỏi sự trực quan và tƣơng tác cao. Do đó, các hình thức,
loại hình, cũng nhƣ yêu cầu về chất lƣợng dịch vụ truyền thông đa phƣơng tiện ngày
càng phong phú, đa dạng. Truyền thông đa phƣơng tiện cũng là nền tảng quan trọng
cho nhiều hoạt động kinh tế, xã hội nhƣ: báo chí, truyền hình, quảng cáo, PR, xây
dựng nhãn hiệu, tiếp thị, giải trí, giáo dục, mỹ thuật đa phƣơng tiện, đồ họa kiến trúc,...
và các hoạt động truyền thông khác.
Tại Việt Nam, truyền thông đa phƣơng tiện là một ngành nghề mới và đang phát
triển rất nhanh. Vào thời điểm này, số lƣợng chuyên gia cao cấp trong nƣớc có thể tạo ra
những sản phẩm truyền thông linh hoạt và đa văn hóa hiện còn rất khan hiếm.
Phần dƣới đây sẽ giới thiệu cho các bạn các khái niệm cơ bản về truyền
thông đa phƣơng tiện và giải thích cách hoạt động của các yếu tố truyền thông đa
phƣơng tiện.
1.1.1. Một số khái niệm cơ bản
a. Thế nào là phƣơng tiện?
Trong suốt chiều dài lịch sử, thông tin đã đƣợc chuyển tải thông qua một
phƣơng tiện duy nhất. Âm thanh, chẳng hạn nhƣ giọng nói của con ngƣời, chính là một
loại phƣơng tiện đó và qua nhiều thế kỉ trƣớc khi chữ viết đƣợc sử dụng rộng dãi thì
nói chuyện là một cách thức chủ yếu để trao đổi thông tin. Sau này con ngƣời bắt đầu
kể chuyện và để lại thông tin về cuộc sống của mình thông qua hình vẽ và các bức ảnh.
Sự ra đời của chữ viết đã cho con ngƣời một phƣơng tiện khác nữa để diễn đạt ý nghĩ

của mình. Ngày nay, con ngƣời thƣờng sử dụng lời nói, âm thanh, chữ viết, âm nhạc,
văn bản, hình ảnh, đồ họa, hoạt ảnh và video để truyền tải thông tin. Những thứ này là
tất cả các loại phƣơng tiện khác nhau và mỗi phƣơng tiện thƣờng đƣợc dùng để biểu
đạt các loại thông tin nhất định.
Nhƣ vậy trong ý nghĩa này, phương tiện chỉ đơn giản là một cách thức dễ
truyền đạt thông tin.
b. Thế nào là đa phƣơng tiện?
Dữ liệu đa phƣơng tiện gồm dữ liệu về: văn bản, hình ảnh, âm thanh, hình
động…
Đa phƣơng tiện có nhiều loại, những phƣơng tiện công cộng về đa phƣơng tiện:
Radio, vô tuyến, quảng cáo, phim, ảnh...
Ví dụ: Giáo viên sử dụng bảng đen trong lớp học để viết các lời giải thích cho
bài giảng của họ.
5


+ Multimedia là ứng dụng đƣợc kết hợp từ hai hay nhiều phƣơng tiện nhằm
mục đích tạo ra các sản phẩm một cách hiệu quả nhất cùng với sự hỗ trợ của cả âm
thanh và hình ảnh.
+ Là thông tin kết hợp từ nhiều dạng thông tin và đƣợc thể hiện một cách đồng
thời.
+ Multimedia là một hệ thống kỹ thuật dùng để trình diễn các dữ liệu và thông
tin, sử dụng đồng thời các hình thức chữ viết, âm thanh, hình ảnh, động hình qua hệ
thống Computer, trong đó tạo khả năng tƣơng tác giữa ngƣời sử dụng và hệ thống.
+ Thuật ngữ đa phƣơng tiện dùng để chỉ các thông tin nhƣ dữ liệu, tiếng nói, đồ
họa, hình ảnh tĩnh, âm thanh và phim ảnh đƣợc các mạng truyền đi cùng thời điểm
c. Thế nào là truyền thông đa phƣơng tiện?
Kể từ lâu con ngƣời đã khám phá ra rằng các thông điệp sẽ trở nên tác động hơn
(có nghĩa là ngƣời nghe sẽ hiểu và nhớ chúng dễ hơn) khi chúng đƣợc biểu đạt thông
qua một kết hợp của các phƣơng tiện khác nhau. Loại kết hợp này chính là ý nghĩa của

thuật ngữ truyền thông đa phƣơng tiện.
Truyền thông đa phương tiện: là sử dụng nhiều hơn một loại phƣơng tiện vào
cùng một thời điểm.
Sử dụng phim ảnh, truyền hình kết hợp nhiều loại phƣơng tiện (âm thanh,
video, hoạt ảnh, hình ảnh tĩnh và chữ) để tạo ra nhiều loại thông điệp khác nhau có khả
năng cung cấp thông tin.
Thuật ngữ truyền thông đa phƣơng tiện dùng để chỉ các thông tin nhƣ dữ liệu,
tiếng nói, đồ họa, hình ảnh tĩnh, âm thanh và phim ảnh đƣợc các mạng truyền đi cùng
thời điểm.
Hay: Truyền tải sản phẩm ĐPT dƣới dạng khác nhau.
1.1.2. Các ứng dụng truyền thông đa phƣơng tiện
1.1.2.1. Video streaming
+ Video Streaming thƣờng đƣợc sử dụng trong lĩnh vực giải trí hoặc dạy học,
dùng để lƣu trữ các file video hoặc các bài học, cung cấp cho ngƣời dùng các tiện ích
nhƣ tìm kiếm, liệt kê, và khả năng hiển thị hoặc hiển thị lại các dữ liệu video theo yêu
cầu. Video Streaming đƣợc thể hiện dƣới hai dạng: Video theo yêu cầu (on demand)
và Video thời gian thực (live event).
+ Video theo yêu cầu là các dữ liệu video đƣợc lƣu trữ trên multimedia server
và đƣợc truyền đến ngƣời dùng khi có yêu cầu, ngƣời dùng có toàn quyền để hiển thị
cũng nhƣ thực hiện các thao tác (tua, dừng, nhẩy qua …) với các đoạn dữ liệu này.
+Video thời gian thực là các dữ liệu video đƣợc convert trực tiếp từ các nguồn
cung cấp dữ liệu theo thời gian thực (máy camera, microphone, các thiết bị phát dữ liệu
6


video...). Các dữ liệu này sẽ đƣợc multimedia phát quảng bá thành các kênh ngƣời dùng
sẽ chỉ có quyền truy nhập bất kỳ kênh ƣa thích nào để hiển thị dữ liệu mà không đƣợc
thực hiện các thao tác tua, dừng... trên các dữ liệu đó (giống nhƣ TV truyền thống).
1.1.2.2. Hội nghị truyền hình
 Khái niệm hội nghị truyền hình

Hội nghị truyền hình (VideoConferencing) là hệ thống thiết bị (bao gồm cả
phần cứng và phần mềm) truyền tải hình ảnh và âm thanh giữa hai hoặc nhiều địa điểm
từ xa kết nối qua đƣờng truyền mạng Internet, WAN hay LAN, để đƣa tín hiệu âm
thanh và hình ảnh của các phòng họp đến với nhau nhƣ đang ngồi họp cùng một phòng
họp; Thiết bị này cho phép hai hoặc nhiều địa điểm cùng đồng thời liên lạc hai chiều
thông qua video và truyền âm thanh.
Là sự hoạt động tƣơng tác giữa tín hiệu audio, video trong thời gian thực. Nó
đƣợc ứng dụng trong hội họp từ xa giúp những ngƣời tham gia không tốn thời gian đi
lại mà vẫn có thể gặp mặt nhau, mà lại tiết kiệm nhiều chi phí khác.
 Lịch sử phát triển
Vào những năm 80 của thế kỷ XX, Hội nghị truyền hình đã mở ra một hƣớng
mới cho thế giới trong việc trao đổi thông tin khi các đối tƣợng cần giao lƣu ở các vị
trí khác nhau mà không có khái niệm về mặt địa lý. Khác với các phƣơng tiện trao đổi
thông tin khác nhƣ điện thoại, dữ liệu, Hội nghị truyền hình cho phép mọi ngƣời tiếp
xúc với nhau, nói chuyện với nhau thông qua tiếng nói và hình ảnh bằng hình ảnh trực
quan. Việc sử dụng công nghệ hội nghị truyền hình, cho thấy hiệu quả sử dụng của nó
đã đem lại lợi ích hiệu quả kinh tế rõ rệt, ứng dụng truyền hình cho việc giao lƣu, gặp
gỡ, hội nghị, hội thảo, đào tạo, chăm sóc sức khỏe từ xa trong ngành y tế, các lĩnh vực
khác trong nền kinh tế là sự hợp tác, nghiên cứu và phát triển không ngừng đã đem lại
lợi ích và hiệu quả kinh tế vô cùng to lớn cho xã hội.
1. Thế hệ đầu tiên của hệ thống thiết bị hội nghị truyền hình đƣợc thực hiện qua
mạng kỹ thuật số đa dịch vụ ISDN dựa trên tiêu chuẩn H.230 của Tổ chức ITU.
2. Thế hệ thứ hai của hệ thống thiết bị hội nghị truyền hình ứng dụng cho máy
tính cá nhân và công nghệ thông tin và vẫn dựa vào mạng ISDN và các thiết bị
mã hoá/giải mã, nén/giải nén - CODEC;
3. Thế hệ thứ ba của hệ thống thiết bị hội nghị truyền hình ra đời trên cơ sở
mạng cục bộ LAN phát triển rất nhanh và có mặt ở khắp mọi nơi trên thế giới.
Hiện nay, công nghệ truyền hình với chất lƣợng cao sử dụng chuẩn H.230 có
tính ƣu việt, đã và đang thay thế dần các phƣơng tiện thông tin khác và đã đƣợc ứng
dụng vào tất các các ngành kinh tế quốc dân từ quốc phòng, chăm sóc sức khỏe, đào

tạo, nghiên cứu khoa học, v.v... và cuối cùng là một công nghệ truyền thông không thể
thiếu đƣợc trong ngành kinh tế quốc dân.
7


Công nghệ hiện đại nhất hiện nay của hệ thống thiết bị hội nghị truyền hình là
sử dụng theo tiêu chuẩn công nghệ H.323 qua giao thức IP. Khi công nghệ HD (High
Definition) chính thức ra nhập thị trƣờng. Với chất lƣợng hình ảnh rõ nét gấp 10 lần so
với chuẩn SD (Standard Definition), độ phân giải hình ảnh đạt đến 720p, nén Video
chuẩn H.264, âm thanh AAC-LD, hội nghị truyền hình HD thực sự thoả mãn đƣợc nhu
cầu “giao tiếp ảo”. Công nghệ HD giúp các các tổ chức, doanh nghiệp thay thế các
cuộc họp dày đặc bằng những cuộc họp trực tuyến.
 Công nghệ sử dụng
Hệ thống thiết bị hội nghị truyền hình là một hệ thống thiết bị điện tử (bao gồm
cả phần cứng và phần mềm) sử dụng công nghệ kỹ thuật số, nén (coder/decoder) âm
thanh và video trong thời gian thực. Giải pháp hội nghị truyền hình dựa trên công nghệ
IP với sự hỗ trợ nhiều giao thức (H.320, H.323, SIP, SCCP) cho phép triển khai hệ
thống Hội nghị truyền hình tiên tiến nhƣng vẫn tận dụng đƣợc cơ sở hạ tầng có sẵn.
 Các thiết bị cần thiết cho một hệ thống hội nghị truyền hình bao gồm:
1. Video đầu vào: video camera hoặc webcam.
2. Video đầu ra: màn hình máy tính, truyền hình hoặc máy chiếu.
3. Âm thanh đầu vào: micro, CD/DVD, cassette player, hoặc bất kỳ nguồn nào của
ổ cắm âm thanh preamp.
4. Âm thanh đầu ra: loa phóng thanh đi kèm với các thiết bị hiển thị hoặc điện
thoại.
5. Truyền dữ liệu: số điện thoại mạng hoặc tƣơng tự, LAN hoặc Internet.
 Thiết bị cơ bản bao gồm:
- Camera: Thu tín hiệu hình ảnh.
- Micro: Thu tín hiệu âm thanh.
- DECODE: Xử lý mã hóa nhận và truyền tín hiệu âm thanh và hình ảnh và

truyền qua đƣờng truyền.
- Màn hình hiển thị: Hiển thị hình ảnh của các phòng họp từ xa.
- Loa: Phát tín hiệu âm thanh của các phòng họp từ xa.
- MCU: Thiết bị quản lý và xử lý đa điểm
- Lƣu Trữ: Ghi lại nội dung cuộc họp.
- Show Present: Thƣờng là phần mềm có chức năng trình chiếu tài liệu tại một
máy tính lên hình ảnh của hội nghị.
Tùy theo từng hãng sản xuất sử dụng công nghệ khác nhau nhƣng đều đi qua
một số chuẩn giao thức bắt tay nhau nhƣ H:323, H:264 nên các sản phẩm của các hãng
khác nhau vẫn bắt tay đƣợc với nhau.
 Một số tiêu chuẩn trong hội nghị truyền hình

8


Các hệ thống hội nghị truyền hình để làm việc đƣợc trong môi trƣờng mạng
phải tuân thủ các tiêu chuẩn chung (về truyền dẫn, mã hóa âm thanh, hình ảnh, điều
khiển dữ liệu, ...) do liên minh viễn thông quốc tế ITU-T qui định.
Dƣới đây là một số chuẩn:
 Chuẩn truyền thông:
- H.320: đƣợc khuyến nghị cho các mạng chuyển mạch kênh nhƣ ISDN hoặc
kênh riêng (leased-line). H.320 hỗ trợ cho cả liên lạc điểm-điểm và đa điểm.
- H.321: đƣợc khuyến nghị cho các mạng B-ISDN và ATM. H.321 hỗ trợ cho cả
liên lạc điểm - điểm và đa điểm.
- H.322: đƣợc khuyến nghị cho các mạng chuyển mạch gói nhƣ Frame Relay.
- H.323: đƣợc xây dựng dựa trên các đặc tả sẵn có của H.320, có bổ xung thêm
các đặc tính nhằm hỗ trợ cho truyền thông đa phƣơng tiện thời gian thực (Real
Time Multimedia) trên các mạng chuyển mạch gói nhƣ LAN, WAN, Internet…
- H.324: đƣợc khuyến nghị cho các mạng PSTN, POTs là các mạng điện thoại
thƣờng.

- SIP- Session Initiation Protocol là tiêu chuẩn đƣợc áp dụng phổ biến trong hoạt
động truyền thông VoiIP. Giao thức này chủ yếu dùng để thiết lập và phân tách
các cuộc gọi điện thoai.
 Mã hoá Video:
- H.261: Chuẩn mã hoá Video H.261 đƣợc ITU công bố vào năm 1990. Nó đƣợc
thiết kế cho dữ liệu ở các tốc độ bằng cấp số nhân của 64Kbit/s hay còn gọi là
p*64Kbit/s (trong đó p bằng 1 đến 30). Thuật toán mã hoá là sự lai ghép giữa
việc dự đoán trƣớc hình ảnh, biến đổi mã và bù lại các chuyển động. Dự đoán
trƣớc hình ảnh nhằm loại bỏ việc lặp lại thời gian. Biến đổi mã nhằm loại bỏ
việc lặp lại không gian. Hƣớng của các di chuyển đƣợc dùng để bù lại các
chuyển động. H.261: hỗ trợ cho hai độ phân giải, QCIF (Quarter Common
Intermediate Format) và CIF (Common Intermediate Format).
- H.263: là một tiêu chuẩn của ITU-T đƣợc công nhận vào những năm
1995/1996. Ban đầu nó đƣợc thiết kế cho nhu cầu truyền thông ở tốc độ thấp
(dƣới 64Kbit/s). Sau đó H.263 đƣợc sử dụng để thay thế cho H.261 ở hầu hết
các ứng dụng. Thuật toán mã hoá của H.263 cũng tƣơng tự nhƣ H.261, chỉ có
một vài bổ xung và thay đổi nhằm tăng cƣờng khả năng xử lý và sửa lỗi. H.263
hỗ trợ cho năm độ phân giải khác nhau:
+ QCIF (Quarter Common Intermediate Format).
+ CIF (Common Intermediate Format).
+ SQCIF (SQCIF = ½ QCIF)
+ 4CIF (4CIF = 4 x CIF)
9


-

+ 16CIF (16CIF = 16 x CIF)
H.264: là chuẩn nén video thế hệ 3 đƣợc đề ra bởi ITU-T. Nó còn có tên là
MPEG-4 Part 10 hoặc AVC (for Advanced Video Coding). Đây là chuẩn phát

triển bởi ITU-T Video Coding Experts Group (VCEG) và ISO/IEC Moving
Picture Experts Group (MPEG). Lợi ích chính của chuẩn mới này là nó cung
cấp hình ảnh video rất rõ nét ở băng thông thấp. H.264 là một tiêu chuẩn nén
video, và hiện đang là một trong các định dạng phổ biến nhất đƣợc sử dụng để
ghi âm nén phân phối và video độ nét cao.

 Mã hoá Audio:
- G.711: Điều biến mã Pulse các tần số thoại (PCM) trong đó tín hiệu audio 3.1
kHz analogue đƣợc mã thành các luồng 48, 56 hoặc 64 kbps stream. Chỉ đƣợc
dùng khi không có thể dùng đƣợc chuẩn nào khác.
- G.722: Mã hóa audio 7 kHz thành các luồng 48, 56 hoặc 64 kbps. Chất lƣợng
cao nhƣng chiếm nhiều băng thông.
- G.722.1: Mã hóa audio 7 kHz ở 24 và 32 kbps với tỉ lệ mất khung thấp.
- G.722.1: Annex C - Chuẩn ITU có nguồn gốc từ Siren 14 của Polycom - mã
hóa audio 14 kHz.
- G.722.2: Mã hóa lời nói ở khoảng 16 kbps sử dụng Adaptive Multi-Rate
Wideband, AMR-WB. Bao gồm 5 chế độ: 6.60, 8.85, 12.65, 15.85 và 23.85
kbps.
- G.723.1: Mã hóa 3.4 kHz cho viễn thông ở 5.3 kbps và 6.4 kbps.
- G.728: Mã hóa 3.4 kHz Low Delay Code Excited Linear Prediction (LDCELP) trong đó âm thanh 3.4 kHz analogue đƣợc mã thành luồng 16 kbps.
Chuẩn này cung cấp chất lƣợng tốt ở tốc độ thấp.
- G.729 A/B: Mã hóa 3.4 kHz với âm thanh gần bằng chất lƣợng điện thoại cố
ddịnh, âm thanh đƣợc mã thành luồng 8 kbps sử dụng phƣơng pháp AS-CELP.
Phụ lục A là mã giảm hóa bớt độ phức tạp, phụ lục B hỗ trợ triệt lặng và cung
cấp âm thanh nền dễ chịu. Ngoài ra mỗi nhà sản xuất còn có các chuẩn mã hoá
riêng cho chất lƣợng âm thanh rất cao nếu sử dụng thiết bị đồng nhất của một
hãng. Ví dụ: các chuẩn PT716plus, PT724, Siren14, Siren22 của Polycom.
 Các chuẩn điều khiển:
- H.221: định nghĩa cấu trúc khung truyền cho các ứng dụng âm thanh hình ảnh
trong các kênh từ 64 tới 1920 Kbps; đƣợc dùng trong H.320.

- H.223: xác dịnh giao thức phối kênh theo gói cho các giao dịch đa phƣơng tiện
tốc độ thấp; Annex A và B xử lý các lỗi kênh nhẹ và vừa của máy mobile giống
nhƣ đƣợc dùng trong 3G-324M.
10


-

-

H.224: xác định giao thức điều khiển thời gian thực cho các ứng dụng đơn công
sử dụng các kênh H.221 LSD, HSD và HLP.
H.225: xác định các dạng truyền phối kênh để đóng gói và đồng bộ luồng thông
tin trong mạng LAN không đƣợc đảm bảo QoS.
H.231: xác định thiết bị MCU sử dụng để kết nối nhiều hơn 3 hệ thống H.320
vào 1 hội nghị.
H.233: Các hệ thống đảm bảo bí mật cho các dịch vụ âm thanh hình ảnh, dùng
cho các thiết bị H.320.
H.234: Hệ thống xác thực và quản lý chìa khóa mã hóa cho các dịch vụ âm
thanh hình ảnh, dùng cho các thiết bị H.320.
H.235: An ninh và mã hóa cho cầu đầu cuối H.323 và H.245.
H.239: định nghĩa vai trò quản lý và các kênh cho các đầu cuối
H.300-Series: Làm sao để có thể dữ liệu và cộng tác qua web thực hiện đƣợc
đồng thời với hình ảnh video trong 1 hội nghị, cho phép các đầu cuối hỗ trợ
H.239 nhận và gửi nhiều luồng riêng rẽ thoại, video và cộng tác dữ liệu.
H.241:định nghĩa các thủ tục video mở rộng và các tín hiệu điều khiển các đầu
cuối H.300-Series multimedia.
H.242: định nghĩa các thủ tục điều khiển và giao thức để thiết lập liên lạc giữa
các đầu cuối trên các kênh digital tới 2 Mbps; dùng cho H.320.


 Lợi ích của hội nghị truyền hình
Hội nghị truyền hình là một bƣớc phát triển đột phá của công nghệ thông tin, nó
cho phép những ngƣời tham dự tại nhiều địa điểm từ những quốc gia khác nhau có thể
nhìn thấy và tao đổi trực tiếp với nhau qua màn hình tivi nhƣ đang họp trong cùng một
hội trƣờng. Công nghệ này đã đƣợc ứng dụng rộng rãi trong nhiều lĩnh vực, đặc biệt
trong hội họp và hội thảo. Ngoài ra, hội nghị truyền hình còn đƣợc ứng dụng rộng rãi
trong giáo dục đào tạo, an ninh quốc phòng, y tế và chăm sóc sức khỏe.
- Tiết kiệm thời gian di chuyển
- Tiết kiệm kinh phí
- Thực hiện cuộc họp trực tuyến giữa nhiều địa điểm khác nhau.
- Nhanh chóng tổ chức cuộc họp
- Lƣu trữ toàn bộ nội dung cuộc họp
- An toàn bảo mật
- Chất lƣợng hội nghị ổn định.
1.2. Các thành phần của hệ thống truyền thông đa phƣơng tiện
a. Thế nào là một hệ truyền thông đa phƣơng tiện?
Các hệ thống thông tin đa phƣơng tiện dùng nhiều phƣơng tiện giao tiếp khác
nhau (văn bản, dữ liệu ghi, dữ liệu số, đồ họa, hình ảnh, âm thanh …). Nhiều ứng dụng
11


là đa phƣơng tiện theo ý nghĩa là chúng dùng nhiều dạng trên. Tuy nhiên, thuật ngữ
“đa phƣơng tiện” thƣờng đƣợc dùng để mô tả các hệ thống phức tạp hơn nhất là các hệ
thống hỗ trợ hình ảnh và âm thanh. Các thông tin mới chủ yếu đƣợc tạo ra bên ngoài
máy tính. Lời nói, nhạc, hình ảnh, phim đƣợc chuyển từ dạng Analog (tƣơng tự) sang
dạng (digital) số trƣớc khi đƣợc dùng trong các ứng dụng trong máy tính. Ngƣợc lại,
với văn bản, đồ họa và thậm chí phim hoạt hình đều đƣợc tạo trên máy tính và vì vậy
nó chỉ đáp ứng những mục tiêu nhất định, không thể mở rộng ứng dụng đƣợc.
Một hệ nền máy tính, mạng thông tin hay dụng cụ mềm là một hệ đa phƣơng
tiện nếu nó hỗ trợ ứng dụng tƣơng tác cho ít nhất là một trong các dạng thông tin sau.

Không kể văn bản và đồ họa: âm thanh, hình ảnh tĩnh hoặc phim video chuyển động.

Hình 1.1: Hệ thống đa phương tiện
Hệ thống đa phƣơng tiện (Multimedia System) là hệ thống có khả năng xử lý dữ
liệu đa phƣơng tiện và các ứng dụng.
Hệ thống đa phƣơng tiện đƣợc đặc trƣng hóa bởi khả năng xử lý, lƣu trữ, xây
dựng, điều khiển và hiển thị các thông tin đa phƣơng tiện
b. Các thành phần của hệ thống truyền thông đa phƣơng tiện
Nhƣ đã nói ở trên, môn học này bàn về việc truyền dữ liệu đa phƣơng tiện trên hệ
thống mạng truyền thông (Internet, mạng diện rộng).
Hình 1.2 thể hiện mô hình client/server để truyền dữ liệu đa phƣơng tiện hai đầu.
Ở phía nguồn, dữ liệu đa phƣơng tiện đƣợc nén và lƣu trữ. Qua hệ thống điều khiển từ
phía server, các dữ liệu này sẽ đƣợc gửi đi qua mạng tùy theo yêu cầu của ngƣời dùng.
Giao thức ở tầng application/transport sẽ đƣợc dùng để truyền dữ liệu tới máy khách,
dữ liệu này sẽ đƣợc lƣu trong bộ đệm hoặc thiết bị lƣu trữ, từ đó đƣợc giải mã và đƣợc
hiển thị cho ngƣời dùng.

12


Hình 1.2: Sơ đồ khối cơ bản của 1 hệ thống đa phương tiện
Đặc trƣng duy nhất của mô hình hệ thống này là: Các thành phần của hệ thống sẽ
thực hiện công việc một cách tuần tự theo các bƣớc trong quá trình truyền dữ liệu. Do
đó, nếu 1 thành phần hoạt động không tốt sẽ ảnh hƣởng tới toàn bộ hệ thống.
Tóm lại, các thành phần của hệ thống truyền thông đa phƣơng tiện bao gồm:
 Dữ liệu đa phƣơng tiện
 Hệ thống lƣu trữ
 Bộ đệm
 Mạng truyền thông
 Thiết bị xử lý, hiển thị

 Các đặc trƣng của hệ thống đa phƣơng tiện:
- Hệ thống đa phƣơng tiện phải đƣợc điều khiển bởi máy tính.
- Hệ thống đa phƣơng tiện là tích hợp.
- Thông tin phải đƣợc thể hiện dưới dạng số.
- Giao diện của dạng hiển thị cuối là tương tác được.
1.3. Dữ liệu đa phƣơng tiện
Dữ liệu đa phƣơng tiện cần đƣợc hiểu là nhiều loại dữ liệu sẽ đƣợc thu thập, gửi
đi và hiển thị một cách đồng thời. Có rất nhiều loại dữ liệu: đơn giản nhất là dữ liệu
văn bản thô, văn bản đã định dạng, và các dạng dữ liệu khác nhƣ ảnh đồ họa, âm
thanh, video…
Ta có thể phân loại các loại dữ liệu trên ra thành 2 loại, theo ngữ cảnh của việc
truyền dữ liệu đa phƣơng tiện.
- Loại thứ nhất: dữ liệu rời rạc (discrete media) gồm các loại dữ liệu mà khi
hiển thị không bị bó buộc chặt chẽ về thời gian. Ví dụ ta có thể nhận 1 bức ảnh
13


từ web server để hiển thị trong web browser. Tùy theo thông lƣợng mạng mà
thời gian nhận bức ảnh có thể nhanh hay chậm trƣớc khi nó đƣợc giải mã và
hiển thị.
- Loại thứ 2: dữ liệu liên tục. Dữ liệu này có một yêu cầu chặt chẽ về thời gian
hiển thị và các thông tin này đƣợc nhúng bên trong dữ liệu. Ta có thể thấy ngay
ví dụ đó là dữ liệu video, audio. Dữ liệu video thƣờng đƣợc mã hóa theo các
frame đƣợc hiển thị tuần tự với một tần số nào đó, ví dụ 25 hình/giây (frame per
second fps). Do đó để hiển thị các đối tƣợng video một cách đúng đắn, thì
không chỉ cần nhận dữ liệu video một cách chính xác mà còn cần phải giải mã
và hiển thị chúng theo đúng trình tự và thời điểm. Nếu không làm đƣợc điều đó
thì video hiển thị sẽ bị hỏng, chất lƣợng thấp. Do đó lƣu lƣợng mạng dành cho
dữ liệu đa phƣơng tiện có thể coi là lƣu lƣợng cố định do sự cần thiết duy trì bộ
định thời chặt chẽ.

Từ đó ta thấy, thách thức trong truyền thông đa phƣơng tiện nói chung và đặc
biệt là truyền thông dữ liệu đa phƣơng tiện liên tục, đó là phải đảm bảo tính vẹn toàn
của cả dữ liệu và thời gian hiển thị (presentation timing). Hơn nữa, dữ liệu đa
phƣơng tiện thông thƣờng là sự kết hợp của nhiều dòng dữ liệu khác nhau và được
đồng bộ với nhau. Do đó, độ phức tạp sẽ đƣợc nhân lên nhiều lần và phải đồng bộ
giữa các dòng dữ liệu với nhau.
Các vấn đề chính trong truyền thông đa phƣơng tiện:
+ Dung lƣợng rất lớn
+ Băng thông giới hạn
+ Truyền liên tục
+ Kết hợp nhiều loại thông tin
+ Chi phí cho việc truyền tin lớn
1.4. Kỹ thuật nén dữ liệu
Nén dữ liệu (Data compression) là việc chuyển định dạng thông tin sử dụng ít
bit hơn cách thể hiện ở dữ liệu gốc.
Nén dữ liệu là cần thiết vì giảm đƣợc nguồn tài nguyên cũng nhƣ dung lƣợng
lƣu trữ hay băng thông đƣờng truyền. Tuy nhiên, vì dữ liệu nén cần đƣợc giải nén nên
sẽ đòi hỏi nhiều phần cứng và xử lý.
Mục đích của nén dữ liệu là để làm cho một tập tin nhỏ hơn bằng cách giảm
thiểu lƣợng dữ liệu hiện tại. Khi một tập tin đƣợc nén, nó có thể là giảm xuống ít nhất
là 25% so với kích thƣớc gốc, làm cho nó dễ dàng hơn để gửi đến những ngƣời khác
trên internet.
Tùy theo dữ liệu có bị thay đổi trƣớc và sau khi giải nén không, ngƣời ta chia
nén thành hai loại: Nguyên vẹn (lossless) và bị mất dữ liệu (lossy).
14


 Nén không mất dữ liệu (lossless compression)
Dữ liệu, đặc biệt là văn bản, đồ họa luôn chứa trong nó những chuỗi thông tin
giống hệt nhau lặp đi lặp lại. Việc nén dữ liệu đƣợc thực hiện bằng cách thay thế nhiều

ký tự thông tin lặp đi lặp lại bằng các ký tự khác, và tạo ra chỉ một bản sao của những
đoạn dữ liệu bị lặp lại này. Cũng có cách khác tỉ mỉ hơn dùng những mã có độ dài
khác nhau mã hóa cho các ký tự khác nhau giúp cho các ký tự này chiếm ít chỗ hơn.
Cách gì thì cách nhƣng phải làm sao vừa thu nhỏ đƣợc kích thƣớc file vừa giữ đƣợc sự
toàn vẹn của dữ liệu.
Các thuật toán nén không mất dữ liệu thƣờng dựa trên giả thuyết dƣ thừa trong
dữ liệu và thể hiện dữ liệu chính xác hơn mà không mất các thông tin. Nén mà không
làm mất dữ liệu là khả thi vì tất cả các dữ liệu thực tế đều có dƣ thừa. Ví dụ một hình
ảnh có thể có các vùng màu sắc không thay đổi trong nhiều pixel. Thay vì ghi nhận
từng pixel nhƣ đỏ, đỏ, đỏ... dữ liệu có thể đƣợc ghi là 279 điểm ảnh đỏ liên tiếp.
Dựa theo mức áp dụng thuật toán nén ngƣời ta chia nén thành các dạng sau:
- Nén tệp tin: Đây là dạng thức nén truyền thống và thuật toán nén đƣợc áp dụng
cho từng tệp tin riêng lẻ. Tuy vậy nếu 2 tệp tin giống nhau thì vẫn đƣợc nén 2
lần và đƣợc ghi 2 lần. Chỉ các byte trùng lắp trong 1 file đƣợc loại trừ để giảm
kích thƣớc. Tùy dữ liệu nhƣng thông thƣờng khả năng giảm sau khi nén chỉ từ
2-3 lần.
- Loại trừ trùng lắp file: Đây là dạng thức nén mà thuật toán nén đƣợc áp dụng
cho nhiều tập tin. Các file giống hệt nhau sẽ chỉ đƣợc lƣu một lần. Ví dụ một
thƣ điện tử có tệp tin đính kèm đƣợc gửi cho 1000 ngƣời. Chỉ có một bản đính
kèm đƣợc lƣu và vì vậy có thể giảm khá nhiều. Thông thƣờng có thể giảm từ 510 lần so với dữ liệu gốc.
 Sau khi giải nén khôi phục đƣợc chính xác ảnh gốc. Ví dụ một số thuật toán mã
hóa Huffman, Shannon - Fano, Mã hóa số học…
 Phƣơng pháp này đòi hỏi phải có thiết bị lƣu trữ và đƣờng truyền lớn. Cho phép
khôi phục lại hoàn toàn khối dữ liệu ban đầu qua các chu trình nén - giải nén.
 Nén có mất dữ liệu (lossy compression)
Hay gặp nhất trong công nghệ thông tin là nén hình ảnh và âm thanh. Chuẩn
nén tín hiệu số gồm có các chuẩn sau:
- Chuẩn MJPEG: Đây là một trong những chuẩn cổ nhất mà hiện nay vẫn sử
dụng. MJPEG (Morgan JPEG). Chuẩn này hiện chỉ sử dụng trong các thiết bị
DVR rẻ tiền, chất lƣợng thấp. Không những chất lƣợng hình ảnh kém, tốn tài

nguyên xử lí, cần nhiều dung lƣợng ổ chứa, và còn hay làm lỗi đƣờng truyền.

15


Chuẩn MPEG2: Chuẩn MPEG là một chuẩn thông dụng. Đã đƣợc sử dụng rộng
rãi trong hơn một thập kỉ qua. Tuy nhiên, kích thƣớc fle lớn so với những chuẩn
mới xuất hiện gần đây, và có thể gây khó khăn cho việc truyền dữ liệu.
Ví dụ nhƣ trong MPEG-2, nơi mà nội dung đƣợc tạo ra từ nhiều nguồn nhƣ
video ảnh động, đồ họa, văn bản… và đƣợc tổ hợp thành chuỗi các khung hình phẳng,
mỗi khung hình (bao gồm các đối tƣợng nhƣ ngƣời, đồ vật, âm thanh, nền khung
hình…) đƣợc chia thành các phần tử ảnh pixels và xử lý đồng thời, giống nhƣ cảm
nhận của con ngƣời thông qua các giác quan trong thực tế. Các pixels này đƣợc mã
hoá nhƣ thể tất cả chúng đều là các phần tử ảnh video ảnh động. Tại phía thu của
ngƣời sử dụng, quá trình giải mã diễn ra ngƣợc với quá trình mã hoá không khó khăn.
Vì vậy có thể coi MPEG-2 là một công cụ hiển thị tĩnh, và nếu một nhà truyền
thông truyền phát lại chƣơng trình của một nhà truyền thông khác về một sự kiện, thì
logo của nhà sản xuất chƣơng trình này không thể loại bỏ đƣợc. Với MPEG-2, bạn có
thể bổ sung thêm các phần tử đồ hoạ và văn bản vào chƣơng trình hiển thị cuối cùng
(theo phƣơng thức chồng lớp), nhƣng không thể xoá bớt các đồ hoạ và văn bản có
trong chƣơng trình gốc.
- Chuẩn MPEG-4: Mpeg-4 là chuẩn cho các ứng dụng MultiMedia. Mpeg-4 trở
thành một tiêu chuẩn cho nén ảnh kỹ thuật truyền hình số, các ứng dụng về đồ
hoạ và Video tƣơng tác hai chiều (Games, Videoconferencing) và các ứng dụng
Multimedia tƣơng tác hai chiều (World Wide Web hoặc các ứng dụng nhằm
phân phát dữ liệu Video nhƣ truyền hình cáp, Internet Video...). Mpeg-4 đã trở
thành một tiêu chuẩn công nghệ trong quá trình sản xuất, phân phối và truy cập
vào các hệ thống Video. Nó đã góp phần giải quyết vấn đề về dung lƣợng cho
các thiết bị lƣu trữ, giải quyết vấn đề về băng thông của đƣờng truyền tín hiệu
Video hoặc kết hợp cả hai vấn đề trên.

Với MPEG-4, các đối tƣợng khác nhau trong một khung hình có thể đƣợc mô
tả, mã hoá và truyền đi một cách riêng biệt đến bộ giải mã trong các dòng cơ bản ES
(Elementary Stream) khác nhau. Cũng nhờ xác định, tách và xử lý riêng các đối tƣợng
(nhƣ nhạc nền, âm thanh xa gần, đồ vật, đối tƣợng ảnh video nhƣ con ngƣời hay động
vật, nền khung hình …), nên ngƣời sử dụng có thể loại bỏ riêng từng đối tƣợng khỏi
khuôn hình. Sự tổ hợp lại thành khung hình chỉ đƣợc thực hiện sau khi giải mã các đối
tƣợng này.
- H.264 H.264 (MPEG-4 AVC hay MPEG-4 part 10), hiện đang là phƣơng thức
tiên tiến nhất trong lĩnh vực nén video. H.264 cho chất lƣợng hình ảnh tốt nhất
khi có cùng dung lƣợng so với các chuẩn nén khác. H.264 cũng đƣợc ứng dụng
nhƣ thuật nén chính trong video độ phân giải cao (HD)
 Các phƣơng pháp nén mất mát thông tin: Lƣợng tử hóa vô hƣớng PCM &
DPCM, Lƣợng tử hóa vecto, Mã hóa biến đổi (biến đổi côsin rời rạc, biến đổi
Furie), mã hóa băng con …
-

16


1.5. Truyền dữ liệu đa phƣơng tiện
Với 2 loại dữ liệu đa phƣơng tiện đã bàn ở trên, ta chỉ tập trung vào truyền dữ
liệu liên tục trong phần còn lại của môn học. Chúng ta có thể phân lớp việc truyền dữ
liệu đa phƣơng tiện liên tục thành 2 loại: truyền thời gian thực và truyền bán thời gian
thực (soft-real-time delivery)
Truyền thời gian thực: dữ liệu phải truyền từ nguồn và hiển thị tại đích với một
độ trễ cho trƣớc. Truyền thời gian thực thƣờng đƣợc sử dụng để ngƣời dùng tƣơng tác
với nhau nhƣ: Internet Phone, đàm thoại video từ xa. (Hình 1.3)

Hình 1.3: Truyền dữ liệu liên tục thời gian thực trong hội đàm video
Truyền dữ liệu bán thời gian thực: Không cho trƣớc thời gian trễ, thay vào đó, hệ

thống phải truyền sao cho đảm bảo tính toàn vẹn của dữ liệu và toàn vẹn thời gian hiển
thị, đồng thời giảm thời gian trễ ở mức tối đa. Ví dụ của việc truyền dữ liệu bán thời
gian thực là dịch vụ video theo yêu cầu (Video On Demand). Hệ thống này có thể có
độ trễ ban đầu lớn để đổi lấy chất lƣợng video mịn trong quá trình play. (Hình 1.4)

Hình 1.4: Truyền dữ liệu bán thời gian thực trong hệ thống VOD
17


1.6. Các phƣơng pháp truyền dữ liệu đa phƣơng tiện
Việc truyền dữ liệu trên mạng máy tính không đã đƣợc thực hiện từ lâu, và có
rất nhiều phƣơng pháp khác nhau để áp dụng. Trong đó phƣơng pháp download là
phƣơng pháp phổ biến nhất để truyền dữ liệu đa phƣơn tiện từ server tới client.
1.6.1. Mô hình download
Mô hình download đƣợc mô tả trong hình 1.5: Client gửi 1 yêu cầu tới server để
chỉ ra đối tƣợng dữ liệu cần download; server sẽ lấy đối tƣợng dữ liệu đó (có thể từ hệ
thống file nội bộ) và truyền nó tới client qua mạng dùng một số giao thức
application/transport. Có thể lấy ví dụ trong WWW.

Hình 1.5: Tương tác giữa client và server trong mô hình download
Đặc điểm của phƣơng pháp: Trƣớc tiên đối tƣợng dữ liệu phải đƣợc nhận về
toàn bộ và lƣu trong bộ đệm hoặc file trƣớc khi đƣợc giải mã và hiển thị. Khi đối
tƣợng dữ liệu đã đƣợc client nhận đầy đủ thì việc giải mã và trình diễn dữ liệu đó sẽ
đƣợc thực hiện nhƣ trên hệ thống file nội bộ của client. Mô hình này hoạt động tốt
trong một số ứng dụng nhƣng lại không phù hợp với dữ liệu liên tục.
Giả sử quá trình download nhƣ trong hình 1.6 , bỏ qua thời gian xử lý, thời gian
từ khi bắt đầu yêu cầu đến khi có thể hiển thị đƣợc dữ liệu đƣợc tính theo kích thƣớc
của đối tƣợng dữ liệu và tốc độ truyền. Với những ứng dụng nhƣ WWW thì dữ liệu
thƣờng là văn bản HTML, hoặc ảnh nhỏ thì độ trễ này tƣơng đối nhỏ.
Tuy nhiên, với đối tƣợng dữ liệu liên tục thì độ trễ có thể sẽ rất lớn, đến mức

không chấp nhận đƣợc. Ví dụ, một dữ liệu video thời lƣợng 2 giờ đƣợc nén MPEG2
với tần só bit trung bình 6Mbps sẽ có kích thƣớc khoảng 5.4GB. Và truyền đi trong
mạng với tốc độ 8Mbps thì ngƣời dùng sẽ phải chờ khoảng 1.5 giờ trƣớc khi có thể
xem video.

Hình 1.6: Thời gian bắt đầu trễ trong mô hình download
18


Nhƣợc điểm cơ bản của mô hình download (đƣợc thể hiện trên hình 1.7) là nó
yêu cầu phải download toàn bộ đối tƣợng video về thì mới bắt đầu xem đƣợc. Trong
khi đối với nhiều loại dữ liệu rời rạc thì yêu cầu này là cần thiết, thì dữ liệu liên tục
nhƣ video có đặc trƣng là một phần dữ liệu của nó có thể đƣợc giải mã (decoded) và
hiển thị (play back). Dữ liệu video đƣợc cấu thành từ các frame, và ta có thể xem khi
toàn bộ dữ liệu của 1 frame đƣợc client nhận về.

Hình 1.7: Thời gian trễ để download 5.4 GB video
Từ đặc điểm này mà ngƣời ta có thể cải tiến mô hình download thành mô hình
Streaming nhƣ sau:
1.6.2. Mô hình Streaming
Trong mô hình streaming, dữ liệu liên tục sẽ đƣợc phát lại trong khi quá trình
nhận dữ liệu về vẫn tiếp diễn (minh họa trong hình 1.8). Sau khi gửi yêu cầu tới server
để bắt đầu quá trình streaming client sẽ đợi gói dữ liệu đầu tiên tới và bắt đầu phát lại
(play), trong khi nhận gói dữ liệu thứ 2, và cứ nhƣ thế. Do đó, quá trình phát lại và quá
trình nhận dữ liệu đƣợc thực hiện theo dòng gần song song (pipeline).

19


Hình 1.8: Play từng phần dữ liệu trong mô hình streaming

So sánh với mô hình download thì cần phải đáp ứng thêm 2 yêu cầu sau để mô hình
streaming có thể hoạt động. Thứ nhất, dữ liệu đa phƣơng tiện phải có thể chia nhỏ thành
các đoạn độc lập, các đoạn này có thể đƣợc giải mã và phát lại. Hầu hết các dữ liệu liên
tục nhƣ audio, video đều có tính chất này. Thứ hai, để bảo toàn bộ định thời trong khi hiển
thị hay trình diễn (presenting) , ta cần đảm bảo các đoạn dữ liệu sẽ đƣợc nhận về trƣớc
thời điểm dự kiến sẽ hiển thị nó. Đây chính là yêu cầu về tính liên tục, một trong các
tham số chủ đạo trong thiết kế và đánh giá hệ thống đa phƣơng tiện liên tục.

20


CHƢƠNG 2: CÁC PHƢƠNG PHÁP NÉN DỮ LIỆU ĐA PHƢƠNG TIỆN
2.1. Phƣơng pháp nén ảnh
2.1.1. Ảnh số và các định dạng file
2.1.1.1. Ảnh số
a. Điểm ảnh
Gốc của ảnh (ảnh tự nhiên) là ảnh liên tục về không gian và độ sáng. Để xử lý
bằng máy tính (số), ảnh cần phải đƣợc số hoá. Số hoá ảnh là sự biến đổi gần đúng một
ảnh liên tục thành một tập điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng
(mức xám). Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời
không phân biệt đƣợc ranh giới giữa chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều, mỗi pixel
ứng với cặp tọa độ (x, y).
Định nghĩa:
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc
màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn thích hợp
sao cho mắt ngƣời cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của
ảnh số gần nhƣ ảnh thật. Mỗi phần tử trong ma trận đƣợc gọi là một phần tử ảnh.
Độ phân giải của ảnh: Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh
đƣợc ấn định trên một ảnh số đƣợc hiển thị.

b. Ảnh số và xử lý ảnh
Định nghĩa: Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp dùng để mô
tả ảnh gần với ảnh thật.
Các thành phần trong hệ thống xử lý ảnh:

Hình 2.1: Các thành phần trong hệ thống xử lý ảnh
Các giai đoạn trong quá trình xử lý ảnh:
- Thu nhận hình ảnh: Đây là giai đoạn đầu tiên và quan trọng nhất trong toàn bộ
quá trình xử lý ảnh. Ảnh nhận đƣợc tạ đây chính là ảnh gốc để đƣa vào xử lý tại
21


các giai đoạn sau, trƣờng hợp ảnh gốc có chất lƣợng kém hiệu quả của các bƣớc
xử lý tiếp theo sẽ bị giảm.
Thiết bị thu nhận: Có thể là các ống ghi hình chân không hoặc các thiết bị cảm
biến quang điện bán dẫn CCD.
- Tiền xử lý ảnh: Giai đoạn xử lý tƣơng đối đơn giản nhằm nâng cao chất lƣợng
ảnh để trợ giúp cho các quá trình xử lý nâng cao tiếp theo, Ví dụ: tăng độ tƣơng
phản, làm nổi đƣờng biên, khử nhiễu .v.v.
- Phân đoạn: Là quá trình tách hình ảnh thành các phần hoặc vật thế riêng biệt.
Đây là một trong những vấn đề khó giải quyết nhất trong lĩnh vực xử lý ảnh.
Nếu thực hiện tách quá chi tiết thì bài toán nhận dạng các thành phần đƣợc tách
ra trở nên phức tạp, còn ngƣợc lại nếu quá trình phân đoạn đƣợc thực hiện quá
thô hoặc phân đoạn sai thì kết quả nhận đƣợc cuối cùng sẽ không chính xác.
- Biểu diễn và mô tả: là quá trình xử lý tiếp sau khâu phân đoạn hình ảnh. Các
vật thể sau khi phân đọan có thể đƣợc mô tả dƣới dạng chuỗi các điểm ảnh tạo
nên ranh giới một vùng, hoặc tập hợp tất cả các điểm ảnh nằm trong vùng đó.
Phƣơng pháp mô tả thông qua ranh giới vùng thƣờng đƣợc sử dụng khi cần tập
trung sự chú ý vào hình dạng bên ngòai của chi tiết ảnh nhƣ độ cong, các góc
cạnh v.v. Biểu diễn vùng thƣờng đƣợc sử dụng khi chúng ta quan tâm tới đặc

tính bên trong của vùng ảnh nhƣ đƣờng vân (texture) hay hình dạng skeletal.
- Nén ảnh: Bao gồm các biện pháp giảm thiểu dung lƣợng bộ nhớ cần thiết để
lƣu trữ hình ảnh, hay giảm băng thông kênh truyền, cần thiết để truyền tín hiệu
hình ảnh số.
- Nhận dạng: Là quá trình phân loại vật thể dựa trên cơ sở các chi tiết mô tả vật
thể đó( ví dụ các phƣơng tiện giao thông có trong ảnh).
Các quá trình xử lý liệt kê ở trên đều đƣợc thực hiện dƣới sự giám sát và
điều khiển dựa trên cơ sở các kiến thức về lĩnh vực xử lý ảnh. Các kiến thức cơ
bản có thể đơn giản nhƣ vị trí vùng ảnh nơi có những thông tin cần quan tâm, nhƣ
vậy có thể thu nhỏ vùng tìm kiếm.
Trƣờng hợp phức tạp hơn, cơ sở kiến thức có thể chứa danh sách tất cả
những hƣ hỏng có thể gặp trong quá trình kiểm sóat chất lƣợng thành phẩm hoặc
các ảnh vệ tinh có độ chi tiết cao trong các hệ thống theo dõi sự thay đổi môi
trƣờng trong một vùng. Ngoài việc điều khiển họat động của từng modul xử lý
ảnh (hình 2.1.3), cơ sở kiến thức còn sử dụng để thực hiện việc điều khiển tƣơng
tác giữa các modules.
2.1.1.2. Các định dạng File Ảnh
Các định dạng file ảnh (JPEG, TIFF, GIF và PNG) khác nhau có ý nghĩa khác
nhau về chất lƣợng hình ảnh cũng nhƣ dung lƣợng ổ đĩa cần cho việc lƣu trữ.
22


JPEG, TIFF, GIF và PNG là 4 định dạng file dữ liệu chính trong lƣu trữ ảnh.
Các loại máy ảnh số và phần mềm xử lý ảnh hỗ trợ tƣơng thích với loại định dạng file
ảnh nào đều có liệt kê rõ trong phần thông số kỹ thuật đi kèm sản phẩm.
Tùy vào từng trƣờng hợp mà mỗi định dạng file ảnh có ƣu thế riêng hay bộc lộ
hạn chế. Chẳng hạn JPEG là định dạng phổ biến nhất với đa số ngƣời dùng máy ảnh
gia đình nhƣng định dạng này tuy là lựa chọn hoàn hảo khi trao đổi qua email nhƣng
lại là lựa chọn khá tệ hại cho việc lƣu làm tƣ liệu về lâu dài.
Lựa chọn sai định dạng cho mục đích sử dụng có thể dẫn đến việc làm mất dữ

liệu, sai lệch thông tin lƣu trữ... Ví dụ khi chọn đính kèm ảnh có định dạng dung lƣợng
quá lớn có thể khiến chƣơng trình email treo hàng giờ đồng hồ. Hoặc việc nén file có
thể bị lỗi khi chọn sai định dạng file ảnh.
Cho nên việc hiểu rõ về các định dạng file ảnh sẽ giúp việc lƣu trữ và sử dụng dữ liệu
thêm linh hoạt và tránh đƣợc những sự cố về giảm chất lƣợng ảnh hay treo máy, hao
dung lƣợng ổ đĩa...
a. Định dạng file JPEG
JPEG là viết tắt của Joint Photographic Experts Group. Đây là định dạng tập tin
hầu hết các loại máy ảnh số và phần mềm xử lý ảnh đều hỗ trợ tƣơng thích. File JPEG
cũng là định dạng file ảnh phổ biến nhất trên Internet.
Định dạng JPEG có dung lƣợng nhỏ, nhẹ

Ưu điểm: dung lƣợng nhỏ, nhẹ. Việc đính kèm file ảnh cho email hay upload
/download file JPEG trên các website luôn thuận tiện và nhanh chóng với định dạng
file này.
Sở dĩ file JPEG nhỏ gọn hơn hầu hết các định dạng file khác bởi vì cơ chế lƣu
trữ hình ảnh của dạng file này là nén dữ liệu theo tỉ lệ nhất định. File JPEG thông
thƣờng có thể chiếm dung lƣợng chỉ 1/10 so với tập tin dữ liệu gốc.
Khi email hay thao tác trên Internet, dung lƣợng tập tin là yếu tố quan trọng
hàng đầu, cho nên các file dữ liệu JPEG là lựa chọn tối ƣu nhằm giúp thao tác đƣợc
23


nhanh chóng, tránh các lỗi treo máy hay timeout (do máy chủ không hồi đáp các lệnh
xử lý quá lâu) hoặc làm quá tải hộp thƣ ngƣời nhận...
Nhược điểm: Cái giá cho tốc độ xử lý nhanh chóng của JPEG trên các ứng
dụng Internet khiến dân nhiếp ảnh rất miễn cƣỡng khi lựa chọn. Trong quá trình nén
dữ liệu của file JPEG, dữ liệu ảnh trên các pixel bị thay đổi, các vùng ảnh quá nhỏ
không thể nén đƣợc sẽ bị xóa vĩnh viễn. Việc này khiến cho màu sắc và các chi tiết
trên ảnh kém sắc nét chút đỉnh so với file gốc.

Mỗi lần một file JPEG đƣợc lƣu, quá trình nén dữ liệu làm cho chất lƣợng ảnh
giảm đi một chút. Không những thế, sự giảm chất lƣợng ảnh này đƣợc bảo lƣu liên
tục: Càng chỉnh sửa nhiều trên file JPEG càng khiến nó mau hỏng hoặc chất lƣợng
hình ảnh ngày càng xấu hơn.
Chất lƣợng ảnh giảm dần trong quá trình sử dụng khiến JPEG là định dạng file
“làm mất dữ liệu”. Khái niệm này tả rõ khuyết điểm của file JPEG: Chất lƣợng ảnh
mất dần sau mỗi lần lƣu. Do vậy, định dạng JPEG là lựa chọn tối ƣu trong việc email
hay tải lên Internet để chia sẻ hình ảnh, nhƣng tuyệt đối không phải là lựa chọn sáng
suốt cho mục đích lƣu trữ hình ảnh làm tƣ liệu về lâu dài.
Định dạng file TIFF
Tag Image File Format là tên đầy đủ của định dạng file TIFF. Đây là định dạng
tập tin “không làm mất dữ liệu” của hình ảnh trong quá trình lƣu trữ hay nén file.
b.

Uy tín trong việc bảo lƣu chất lƣợng hình ảnh giúp TIFF là định dạng mẫu mực
trong việc lƣu trữ tƣ liệu hình ảnh.
TIFF là lựa chọn mặc định của dân nhiếp ảnh chuyên nghiệp và giới thiết kế đồ
họa. Họ sử dụng chủ yếu định dạng file này trong số các loại định dạng file ảnh.
Tuy file TIFF đƣợc dân chuyên nghiệp ƣa chuộng nhƣng ngƣời dùng các loại máy
ảnh số tầm trung và các loại máy phổ thông sẽ không dám lựa chọn vì dung lƣợng thẻ nhớ
hay bộ nhớ trong của các dòng máy này không hỗ trợ nổi dung lƣợng của file TIFF.

24


Khuyết điểm duy nhất của file TIFF chính là dung lƣợng cồng kềnh. Do định
dạng tập tin này lƣu trữ toàn bộ thông tin của các pixel trong dữ liệu nén chung của
bức ảnh nên dung lƣợng của nó luôn lớn hơn rất nhiều nếu so với file JPEG. Điều này
khiến việc lƣu trữ file TIFF luôn tốn nhiều dung lƣợng bộ nhớ.
Với những ai quan tâm đến chất lƣợng hình ảnh và sợ file bị hỏng, TIFF luôn là

lựa chọn hàng đầu về độ tin cậy. Nhƣng luôn nhớ rằng file TIFF nén cũng không giảm
dung lƣợng bao nhiêu so với file TIFF không nén.
c. Định dạng file PNG
PNG (Portable Network Graphics) cũng là định dạng file bảo lƣu dữ liệu,
không làm mất chất lƣợng ảnh trong lƣu trữ và nén file. Tƣơng tự nhƣ file TIFF, hình
ảnh định dạng PNG thích hợp để lƣu trữ tƣ liệu lâu dài.

Định dạng PNG bảo lƣu chất lƣợng dữ liệu nén còn vƣợt trội hơn TIFF
Có thể ngƣời dùng thƣờng không để ý thấy sự khác biệt nhỏ về file PNG: Định
dạng file này thậm chí bảo lƣu chất lƣợng dữ liệu nén còn vƣợt trội hơn file TIFF (file
PNG nén cho ra dữ liệu với chất lƣợng cao hơn). PNG cũng là định dạng file đƣợc
nhiều chƣơng trình phần mềm xử lý ảnh hỗ trợ.
d. Định dạng file GIF
File GIF (Graphic Interface Format) là định dạng dữ liệu sử dụng rộng rãi trong
đồ họa và thế giới ảnh số nhƣng dạng file này tuyệt đối không phù hợp để lƣu trữ hình
ảnh. Tập tin định dạng GIF bị giới hạn ở bảng màu 256 màu nên không thể cho ra hình
ảnh chân thực của file dữ liệu gốc.

25


×