Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Mẫu 3. Trang phụ bìa luận văn (title page)
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
VŨ VĂN HÙNG
KỸ THUẬT TRUYỀN THÔNG ĐA PHƯƠNG
TIỆN VÀ ỨNG DỤNG TRONG GIẢNG DẠY
TRỰC TUYẾN
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
THÁI NGUYÊN - 2010
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Mẫu 4. Trang bìa 1 tóm tắt luận văn thạc sĩ (khổ 140 x 200 mm)
ĐẠI HỌC THÁI NGUYÊN
KHOA CÔNG NGHỆ THÔNG TIN
VŨ VĂN HÙNG
KỸ THUẬT TRUYỀN THÔNG ĐA PHƯƠNG
TIỆN VÀ ỨNG DỤNG TRONG GIẢNG DẠY
TRỰC TUYẾN
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. PHẠM VIỆT BÌNH
THÁI NGUYÊN - 2010
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn này do tôi tự nghiên cứu, tìm hiểu và tổng
hợp từ nhiều nguồn tài liệu khác nhau. Luận văn tốt nghiệp là kết quả của quá
trình học tập, nghiên cứu và thực hiện hoàn toàn nghiêm túc, trung thực của
bản thân. Tất cả các tài liệu tham khảo đều có xuất xứ rõ ràng và được trích
dẫn hợp pháp.
Tôi xin hoàn toàn chịu trách nhiệm về nội dung và sự trung thực trong
luận văn tốt nghiệp Thạc sĩ của mình.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
DANH MỤC HÌNH
Tên hình
Trang
Hình 1.1: Giao tiếp one-to-one qua cuộc gọi point-to-point
3
Hình 1.2: Giao tiếp one-many qua cuộc gọi point-to-point
3
Hình 1.3: Giao tiếp many-many qua cuộc gọi point-to-point
4
Hình 1.4: Video conference có nhiều bên tham gia qua cuộc gọi đa
điểm (multipoint call)
5
Hình 1.5: Nhiều giáo viên cùng giảng một lớp học sử dụng video
conference
6
Hình 1.6: Một giáo viên cùng giảng nhiều lớp học sử dụng video
conference
6
Hình 1.7: Các nhân tố tạo nên chất lượng dịch vụ.
9
Hình 2.1: Các thành phần trong hệ thống H323
22
Hình 2.2: H323 TE
23
Hình 2.3: H.323/PSTNGateway
24
Hình 2.4: Các chức năng của Gateway
25
Hình 2.5: Chức năng của Gatekeeper
27
Hình 2.6 Các vị trí của MC và MP trong hệ thống H.323
28
Hình 2.7 Sơ đồ cấu trúc phân lớp
29
Hình 2.8 Gatekeeper tìm đường báo hiệu
cuộc gọi
33
Hình 2.9 Báo hiệu cuộc gọi trực tiếp giữa
các Endpoint
33
Hình 2.10 Thiết lập kênh điều khiển H.245
trực tiếp giữa các Endpoint
34
Hình 2.11: Các loại socket
35
Hình 2.12: Sự phụ thuộc giữa tỉ lệ mất gói
tin với thời gian làm trễ việc chạy q.
47
Hình 2.13: Chèn thêm thông tin bổ xung là
các gói tin tốc độ bit thấp vào gói tin bình
thường
50
Hình 2.14: Cơ chế khôi phục gói tin bị mất
theo kiểu xen kẽ.
51
Hình 3.1 Sơ đồ thuật toán của mô hình
client-server
54
Hình 3.2 Mô hình mạng Peer to peer
55
Hình 3.3 Sơ đồ chi hệ thống
56
Hình 3.4 Biểu đồ usecase của tác nhân học
57
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
viên
Hình 3.5 Biểu đồ usecase của tác nhân
người dạy
57
Hình 3.6 Biểu đồ usecase cho tác nhân Server
58
Hình 3.7 Biều đồ trình tự module voice
service
59
Hình 3.8 Biểu đồ trình tự module video
service
60
Hình 3.9 Biểu đồ trình tự module desktop
service
61
Hình 3.10 Biểu đồ trình tự chương trình
chạy server
62
Hình 3.11 Cài đặt Silverlight
63
Hình 3.12 Cài đặt IIS
64
Hình 3.13 Ứng dụng server
64
Hình 3.14 Giao diện Module Voice Service
65
Hình 3.15 Giao diện truyền dẫn của module
Video Service
66
Hình 3.16 Giao diện nhận hình ảnh của
module Video Service
67
Hình 3.17 Giao diện chương trình truyền
hình ảnh của màn hình
67
Hình 3.18 hình ảnh được trình chiếu từ màn
hình của người truyền
68
Hình 3.20 Chọn lớp, phòng tương ứng với
mỗi người
69
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỤC LỤC
CHƢƠNG I: TỔNG QUAN TRUYỀN THÔNG ĐA PHƢƠNG TIỆN 3
1.1. Giới thiệu về truyền thông đa phƣơng tiện. 4
1.2. Phân loại ứng dụng truyền thông đa phƣơng tiện: 4
1.2.1. Truyền video và audio đã được lưu trữ trên server (streaming stored audio and
video) 4
1.2.2. Truyền trực tiếp audio/video (Streaming live audio/video) 5
1.2.3. Ứng dụng tương tác audio/video thời gian thực: 5
1.2.4. Ứng dụng video conference 5
1.2.4.1. Meetings (họp) 6
1.2.4.2. Classroom (giảng dạy) 9
1.2.4.3. Các cơ chế sử dụng trong video conference 11
1.2.5. Các thành phần chất lượng dịch vụ trong ứng dụng mạng đa phương tiện và video
conference nói riêng 11
1.2.5.1. Sự mất mát gói tin (packet loss) 11
1.2.5.2. Độ trễ end-to-end (end-to-end delay) 12
1.2.5.3. Jitter - Sự thăng giáng độ trễ 12
1.3. Nén dữ liệu audio/video 14
1.3.1. Một số kĩ thuật nén audio 14
1.3.2. Nén video 18
1.4. Những vấn đề ảnh hƣởng đến chất lƣợng dịch vụ (QoS) của Multimedia 19
1.4.1. Khái niệm về đảm bảo chất lượng dịch vụ (QoS): 19
1.4.2. Ứng dụng đa phương tiện qua mạng 21
1.4.3. Các ứng dụng đa phương tiện mạng : 21
1.4.4. Ví dụ về các ứng dụng đa phương tiện: 21
1.4.5. Rào cản đối với multimedia trên mạng Internet 22
1.4.5.1 Đặc điểm truyền dữ liệu trên Internet hiện nay 22
1.4.5.2 Cách khắc phục: 23
CHƢƠNG II: KỸ THUẬT TRUYỀN THÔNG ĐA PHƢƠNG TIỆN 26
2.1. Kỹ thuật H323 26
2.1.1. Giới thiệu H323: 26
2.1.2. Các thành phần cơ bản của kỹ thuật H.323: 26
2.1.2.1. Các ưu điểm của H.323: 26
2.1.2.2. Kiến trúc hệ thống của H.323: 28
2.1.3 Sơ đồ cấu trúc phân lớp: 35
2.1.3.1.Video Codec: 35
2.1.3.2 Audio Codec: 36
2.1.3.3. Data Channel (Kênh dữ liệu): 36
2.1.4 Điều khiển hệ thống 36
2.1.4.1. Chức năng điều khiển H.245: 36
2.1.4.2. Chức năng báo hiệu RAS H.225.0: 37
2.1.4.3. Chức năng báo hiệu cuộc gọi H.225.0: 38
2.2. Kỹ thuật lập trình socket và công nghệ Silverlight 41
2.2.1. Lập trình socket 41
2.2.2 Silverlight 45
2.2.2.1 Định nghĩa Silverlight 45
2.2.2.2 Đặc tính của Silverlight 45
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
2.2.2.3 Kiến trúc tổng thể và các mô hình lập trình của Silverlight 46
2.2.2.4 Khả năng hỗ trợ trình duyệt, hệ điều hành và các công nghệ liên quan 49
2.3. Kỹ thuật làm tăng chất lƣợng dịch vụ cho ứng dụng đa phƣơng tiện 50
2.3.1. Những nhược điểm của mạng IP với dịch vụ cố gắng tối đa (best effort) 50
2.3.2. Sử dụng giao thức UDP ở tầng giao vận 50
2.3.3. Cơ chế loại bỏ jitter ở phía nhận 51
2.3.3.1. Làm trễ việc chơi với thời gian cố định (fixed playout delay) 52
2.3.3.2. Làm trễ thời gian thích nghi (adaptive playout delay) 53
2.3.4. Khôi phục các gói tin bị mất tại phía nhận 55
2.3.4.1. FEC 55
2.3.4.2. Cơ chế xen kẽ (interleaving) 56
2.3.4.3. Cơ chế khôi phục gói tin bị mất chỉ dựa trên phía nhận (receiver- based) 57
CHƢƠNG III: XÂY DỰNG ỨNG DỤNG 59
3.1. Phân tích thiết kế chƣơng trình 59
3.1.1 Giới thiệu bài toán 59
3.1.2 Phân tích 59
3.1.2.1 Mô hình Client/Server 59
3.1.2.2 Mô hình Peer to Peer 60
3.1.3. Thiết kế 61
3.1.3.1. Sơ đồ hệ thống. 61
3.1.3.2 Biểu đồ Usecase 62
3.1.4 Biểu đồ trình tự 64
3.1.4.1 Biểu đồ trình tự của chức năng truyền nhận âm thanh 64
3.1.4.1 Biểu đồ trình tự của chức năng truyền nhận hình ảnh 65
3.1.4.3 Biểu đồ trình tự của chức năng truyền nhận desktop 66
3.1.4.4 Biểu đồ trình tự của server 67
3.2. Kết quả của chƣơng trình 68
3.2.1. Cài đặt chương trình 68
3.2.1.1. Cài đặt Silverlight 68
3.2.1.2Cài đặt IIS 69
3.2.2 Kết quả chương trình 70
3.2.2.1. Khởi tạo Server 70
3.2.2.2. Voice Service 71
3.2.2.3. Video Service 72
3.2.2.4. Desktop Service 73
3.2.2.5 Text Chat 74
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
MỞ ĐẦU
Ngày nay, truyền thông nói chung, và truyền thông đa phương tiện nói riêng đang
rất được quan tâm, bởi tính thực tiễn và kinh tế. Nhờ có truyền thông đa phương tiện
con người trao đổi thông tin từ xa thông qua văn bản, hình ảnh và âm thanh.
Bên cạnh đó, mạng máy tính đã và đang phổ biến trong cơ quan, doanh nghiệp,
nên ứng dụng mạng như chia sẻ dữ liệu, phần mềm trực tuyến ngày càng được ưa
chuộng và trở thành yếu tố không thể thiếu trong xã hội thông tin hiện đại.
Bởi vậy, việc nghiên cứu kỹ thuật truyền thông nói chung, truyền thông đa
phương tiện nói riêng nhằm làm chủ và tạo nền tảng phát triển ứng dụng truyền thông
mạng như dạy học trực tuyến đang trở thành chủ đề nghiên cứu của nhiều tổ chức
nghiên cứu trong và ngoài nước.
Luận văn gồm 3 chương:
Chƣơng I: Tổng quan về truyền thông đa phƣơng tiện
Chương này giới thiệu về truyền thông đa phương tiện, phân loại ứng dụng truyền
thông đa phương tiện và những vấn đề ảnh hưởng đến chất lượng dịch vụ truyền thông
đa phương tiện
Chƣơng II: Kỹ thuật truyền thông đa phƣơng tiện
Trong chương này nghiên cứu một số kỹ thuật trong truyền thông đa phương tiện như
H323, kỹ thuật lập trình Socket, công nghệ Silverlight
Chƣơng III: Xây dựng ứng dụng
Chương này trình bày về ứng dụng một số kỹ thuật đã nghiên cứu để thiết kế chương
trình và cài đặt và cấu hình hệ thống.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
CHƢƠNG I: TỔNG QUAN TRUYỀN THÔNG ĐA PHƢƠNG TIỆN
1.1. Giới thiệu về truyền thông đa phƣơng tiện.
1.1.1 Khái niệm
Hệ mang tin phương tiện là hệ thống cung cấp tích hợp các chức năng lưu trữ,
truyền dẫn và trình diễn các kiểu phương tiện mang tin rời rác (văn bản, đồ hoạ, ảnh…)
và liên tục (audio, video) trên máy tính.
Các kiểu media trong hệ thống đa phương tiện gồm:
- Media độc lập với thời gian: thông tin không liên quan gì đến việc định thời luồng dữ
liệu, ví dụ như văn bản, đồ hoạ, ảnh.
- Media phụ thuộc thời gian: thông tin có quan hệ chặt chẽ với thời gian, phải được
trình diễn tới người sử dụng vào những thời điểm xác định.ví dụ: animation, audio,
video, game online.
Hệ thống đa phương tiện cũng là hệ thống thời gian thực.
1.2. Phân loại ứng dụng truyền thông đa phƣơng tiện:
Chúng ta có thể chia các ứng dụng mạng đa phương tiện thành 3 lớp lớn.
1.2.1. Truyền video và audio đã đƣợc lƣu trữ trên server (streaming stored
audio and video)
Trong lớp ứng dụng này, client yêu cầu các file audio, video đã được nén và
được lưu trữ trên server. Các file audio có thể là: bài giảng, bài hát …. Các file
video có thể là: phim, clips…. Tại một thời điểm nào đó, client yêu cầu file audio,
video từ server. Trong hầu hết các ứng dụng loại này, sau một thời gian trễ vài giây,
client sẽ chạy file audio, video trong khi tiếp tục nhận file từ server. Đặc tính vừa
chạy file, trong khi tiếp tục nhận những phần sau của file gọi là streaming . Nhiều
ứng dụng còn cung cấp tính năng tương tác người dùng (user interactivity). Ví dụ:
pause, resume, jump, skip. Khoảng thời gian từ lúc người dùng đưa ra yêu cầu (play,
skip, forward, jump) tới khi bắt đầu nghe thấy trên máy client nên nằm trong khoảng
từ 1 – 10 giây để người dùng có thể chấp nhận được. Yêu cầu đối với độ trễ và thăng
giáng độ trễ - jitter của ứng dụng loại này không chặt chẽ bằng ở trong ứng dụng thời
gian thực như : điện thoại internet, video conference thời gian thực. Hiện nay có các
chương trình hỗ trợ streaming stored audio/video như: RealPlayer, Netshow ….
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1.2.2. Truyền trực tiếp audio/video (Streaming live audio/video)
Các ứng dụng loại này cũng tương tự như phát thanh và truyền hình quảng bá
(broadcast) truyền thống chỉ có điều nó được thực hiện trên internet. Nó cho
phép người dùng nhận được audio/video trực tiếp được phát ra từ bất kỳ nơi nào
trên thế giới. Trong lớp ứng dụng mạng đa phương tiện loại này, audio/video được
truyền trực tiếp, không được lưu trữ trên server như loại ứng dụng mạng đa phương
tiện đã nói ở trên, client không thể tương tác người dùng như: pause, forward, rewind,
… Tuy nhiên, nếu các file audio/video được lưu giữ cục bộ tại các client, một số ứng
dụng có thể pause, rewind…. Truyền hình, phát thanh trực tiếp thường được phát
broadcast tới nhiều client qua kĩ thuật multicast hoặc qua nhiều luồng unicast riêng.
Hạn chế về thời gian trễ (độ trễ) của truyền hình, phát thanh trực tiếp là khắt khe hơn
các ứng dụng truyền audio/video được lưu trữ; Độ trễ tới 10 giây là có thể chấp nhận
được.
1.2.3. Ứng dụng tƣơng tác audio/video thời gian thực:
Lớp ứng dụng này cho phép mọi người dùng audio, video để tương tác thời
gian thực với người dùng khác. Một ví dụ về audio tương tác thời gian thực là điện
thoại internet. Nó cung cấp dịch vụ điện thoại với giá rất rẻ so với dịch vụ điện thoại
truyền thống nhưng bù vào đó là chất lượng không được tốt và ổn định như điện thoại
truyền thống. Với tương tác video thời gian thực, còn gọi là video-conferenceing, mọi
người có thể giao tiếp với nhau một cách rất trực quan. Trong các ứng dụng tương tác
audio/video thời gian thực thì độ trễ nên nhỏ hơn vài trăm miligiây. Ví dụ với
âm thanh: độ trễ nên nhỏ hơn 400 ms.
1.2.4. Ứng dụng video conference
Như đã đề cập ở trên, video conference là ứng dụng mạng đa phương
tiện thuộc lớp thứ ba: ứng dụng tương tác thời gian thực. Đây là lớp ứng dụng đòi hỏi
chất lượng dịch vụ mạng (độ trễ, jitter, sự mất mát gói tin) cao nhất trong ba lớp ứng
dụng ở trên để thoả mãn nhu cầu của người dùng. Video conference hiện nay được sử
dụng rộng rãi trong rất nhiều lĩnh vực: trong cuộc họp của các công ty, các tổ chức;
trong giáo dục: đào tạo từ xa; trong y tế: khám chữa bệnh, phẫu thuật từ xa Sau
đây là một số ứng dụng tiêu biểu của video conference.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1.2.4.1. Meetings (họp)
Những người tham dự cuộc họp là trường hợp đơn giản nhất minh hoạ
cho việc sử dụng video conference. Với những cuộc họp diễn ra thường xuyên và cần
các bên tham gia giao tiếp với nhau (face-to-face communication), video conference
là sự thay thế hoàn hảo cho các cuộc họp bình thường mà các bên tham gia phải
cùng có mặt tại cùng một địa điểm. Các bên tham gia có thể ở xa nhau và sử dụng
video conference để tiến hành họp. Điều này sẽ giảm chi phí, thời gian giành cho việc
đi lại và việc tham dự cuộc họp sẽ vô cùng thuận tiện. Việc tổ chức các cuộc họp
cũng đơn giản hơn và hiệu quả hơn. Các cuộc họp sẽ diễn ra thường xuyên, không
cần phải lập lịch trước (để chuẩn bị chi phí, thời gian đi lại) và được tiến
hành qua video conference, qua đó nâng cao hiệu quả công việc giữa những người
cùng làm trong một dự án nhưng lại ở những địa diểm khác nhau. Sau đây là một số
minh hoạ của việc sử dụng video conference trong việc tổ chức các cuộc họp sử dụng
cuộc gọi điểm-điểm (point-to-point call) bao gồm các trường hợp giao tiếp: một-một
(one-to-one), một- nhiều (one-to-many) và nhiều-nhiều (many-to-many ).
Hình 1.1: Giao tiếp one-to-one qua cuộc gọi point-to-point
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình 1.2: Giao tiếp one-many qua cuộc gọi point-to-point
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình 1.3: Giao tiếp many-many qua cuộc gọi point-to-point
Trong mỗi trường hợp ở trên, chất lượng của audio/video đóng vai trò rất quan
trọng tới thành công của cuộc họp. Điều này sẽ khiến cho các bên tham gia họp cảm
thấy mình thật sự là phần quan trọng của cuộc họp hay không. Trong video conference,
audio có thể có vai trò quan trọng hơn video. Những ảnh hưởng nhỏ của video như: độ
phân giải, độ trễ thường được người sử dụng chấp nhận, nhưng đối với audio thì không.
Do đó việc cố gắng cải thiện chất lượng audio trong video conference sẽ đem lại sự
thoả mãn của các bên tham gia.
Một nhân tố khác ảnh hưởng tới chất lượng của video conference là băng
thông mà các bên tham gia kết nối vào. Băng thông càng cao thì chất lượng của video
conference càng tốt. Băng thông khoảng 384 Kbps là tốc độ kết nối được sử dụng
nhiều trong thực tế để tiến hành video conference. Băng thông như trên làm việc tốt
trong trường hợp cuộc họp là “tĩnh” nghĩa là các bên tham gia cuộc họp không di
chuyển nhiều, các hoạt động bị hạn chế. Nếu trong cuộc họp mà các bên tham gia di
chuyển nhiều (tiến hành các hoạt động, minh hoạ ) thì cần phải có băng thông kết nối
cao hơn để đảm bảo chất lượng của cuộc họp.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Trong các cuộc họp có nhiều bên tham gia sử dụng cuộc gọi đa điểm
(multipoint call) phải cần có một MCU (Multipoint Control Unit). Các bên tham
gia có thể kết nối với băng thông khác nhau. Ví dụ: một bên kết nối với tốc độ
384 Kbps chỉ nhận được 384 Kbps từ bên kết nối với tốc độ 1.5 Mbps. Trong
trường hợp cuộc họp nhiều bên tham gia (multi-point meeting), ta có minh hoạ
như hình dưới:
Hình 1.4: Video conference có nhiều bên tham gia qua cuộc gọi đa
điểm (multipoint call)
1.2.4.2. Classroom (giảng dạy)
Trong giảng dạy ở trường học, chúng ta có thể sử dụng video
conference. Khi đó sẽ có thay đổi so với lớp học truyền thống. Có 2 trường hợp
sử dụng phổ biến sau. Trường hợp đầu: phía tham gia thêm vào lớp học có thể là
một giảng viên nữa hoặc là đồng giảng viên. Trong trường hợp thứ hai, một
giảng viên có thể giảng thêm cho một lớp học từ xa.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Hình 1.5: Nhiều giáo viên cùng giảng một lớp học sử dụng video
conference
Hình 1.6: Một giáo viên cùng giảng nhiều lớp học sử dụng video
conference
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1.2.4.3. Các cơ chế sử dụng trong video conference
Các cơ chế điều khiển hiển thị video
•
Voice activated: hình ảnh của bên đang nói được hiển thị tại tất cả
các bên tham gia.
•
Continuous presence: một bên tham gia có thể thấy tất cả các bên còn
lại.
Các cơ chế điều khiển audio
•
Half duplex audio: các bên chỉ có thể nghe thấy một người nói tại
một thời điểm.
•
Full duplex audio: mọi bên có thể nghe thấy tất cả các bên nói tại
mọi thời điểm.
Các cơ chế điều khiển kết hợp có thể là
•
Không điều khiển (no control): sử dụng full duplex audio ở tất cả
các bên tham gia. Trong trường hợp này, người đứng đầu (lead speaker) được chọn
do các bên tham gia tự thoả thuận. Các bên tham gia có thể xem hình ảnh theo kiểu
voice- activated hoặc continuous presence.
•
Chair control: quyền điều khiển được truyền qua cơ chế nào đó, thí dụ
“biểu quyết bằng giơ tay” (electronic hand raising). Bên tham gia nắm quyền điều
khiển sẽ được nhìn và nghe thấy bởi các bên cho tới khi quyền điều khiển được
truyền cho người khác.
•
Lecture-style: Một biến thể của cơ chế chair control. Một bên được
gán quyền điều khiển và có thể kích hoạt hoặc không kích hoạt quyền chair control.
1.2.5. Các thành phần chất lƣợng dịch vụ trong ứng dụng mạng đa phƣơng tiện
nói chung và video conference nói riêng
1.2.5.1. Sự mất mát gói tin (packet loss)
Có nhiều nguyên nhân gây ra mất gói tin: do lỗi của đường truyền hoặc do
gói tin bị loại bỏ tại hàng đợi của chuyển mạch, router (khi hàng đợi đã đầy). Xét
một ví dụ với ứng dụng điện thoại Internet. Khi một udp datagram (gói tin của giao
thức udp) được tạo bởi ứng dụng điện thoại internet, nó được đóng gói trong một ip
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
datagram, ip datagram được chuyển tới phía nhận. Khi datagram truyền qua
mạng, nó tới bộ đệm tại hàng đợi trong router. Có thể bộ đệm của router đã đầy và
không thể nhận datagram. Trong trường hợp này, IP datagram bị loại bỏ và coi
như bị mất. Nó không tới được phía nhận.
Sự mất mát gói tin có thể được loại bỏ bằng cách gửi gói tin qua TCP. TCP
sẽ truyền lại gói tin. Tuy nhiên, cơ chế truyền lại là không thể chấp nhận được
đối với ứng dụng thời gian thực như là điện thoại internet bởi vì nó làm tăng độ trễ
lên quá lớn. Hơn nữa, theo cơ chế điều khiển tắc nghẽn trong TCP , sau khi mất
gói tin, tốc độ truyền tại phía gửi có thể giảm tới tốc độ thấp hơn tốc độ đọc phía
nhận. Điều này ảnh hưởng tới phía nhận. Vì thế, hầu hết các ứng dụng điện thoại
internet đều chạy trên udp và không quan tâm tới việc truyền lại gói tin bị mất.
Tỉ lệ mất gói tin từ 1% tới 20% có thể chấp nhận được, phụ thuộc vào các
cơ chế âm thanh được lập mã và truyền đi và phía nhận sử dụng cơ chế sửa lỗi hay
không. Ví dụ: cơ chế sửa lỗi tại phía nhận FEC (forward error correction) có thể
khắc phục việc mất gói tin. Với FEC, thông tin thêm vào được truyền cùng với
thông tin ban đầu để dữ liệu bị mất có thể được khôi phục từ chúng. Tuy nhiên,
nếu tắc nghẽn xảy ra, tỉ lệ mất gói tin vượt quá 20%, chất lượng âm thanh sẽ không
đạt yêu cầu.
1.2.5.2. Độ trễ end-to-end (end-to-end delay)
Là tổng hợp của : thời gian xử lý và chờ trong hàng đợi của router, thời
gian truyền gói tin lên đường truyền (transmission time), thời gian truyền gói tin tới
phía nhận (propagation time) và thời gian xử lý của phía nhận. Với các ứng dụng
tương tác thời gian thực như điện thoại internet, độ trễ end-to-end nhỏ hơn 150ms
là không gây ra vấn đề gì (giác quan con người không cảm nhận được độ trễ
này), độ trễ từ 150-
400ms có thể được chấp nhận nhưng chất lượng kém hơn. Độ trễ >400ms thì cực tệ
không chấp nhận được. Phía nhận của ứng dụng điện thoại internet sẽ không xem
xét tới bất kì gói tin nào đến trễ hơn một ngưỡng nào đó, ví dụ >400ms. Do đó, các
gói tin trễ hơn ngưỡng trên coi như là mất.
1.2.5.3. Jitter - Sự thăng giáng độ trễ
Một trong những thành phần tạo nên độ trễ end-to-end là thời gian đợi ở
hàng đợi của router (thời gian đợi là ngẫu nhiên). Do thời gian này là ngẫu nhiên,
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
luôn thay đổi nên thời gian từ khi gói tin được tạo tại phía gửi tới khi nó tới bên
nhận có thể thay đỗi giữa các gói tin. Sự biến đổi độ trễ như vậy gọi là jitter. Ví dụ:
xét 2 gói tin liên tiếp nhau trong một đoạn của ứng dụng điện thoại internet. Phía
gửi gửi gói tin thứ 2 sau gói tin đầu 20ms. Nhưng khoảng thời gian giữa 2 gói tin
được phía nhận nhận có
thể lớn hơn 20ms. Để rõ hơn, giả sử gói tin đầu tiên tới khi router có hàng đợi là
rỗng, nó sẽ được phục vụ (gửi đi) ngay, nhưng khi gói tin thứ hai tới thì hàng đợi lại
đầy, nó sẽ phải chờ đến lượt được phục vụ. Khoảng thời gian bên nhận nhận các
gói tin cũng có thể nhỏ hơn 20 ms. Ví dụ xét 2 gói tin liên tiếp nhau. giả sử gói
tin đầu tới cuối hàng đợi (hàng đợi này đang đầy), gói tin thứ 2 tới hàng đợi đó và
được “xếp hàng” ngay sau gói tin thứ nhất. Khi đó khoảng thời gian giữa lúc phía
nhận nhận gói tin thứ nhất và gói tin thứ hai sẽ < 20ms. Nếu phía nhận bỏ qua jitter
và chơi ngay đoạn âm thanh ngay khi nhận được, kết quả chất lượng âm thanh sẽ rất
kém.
Hình 1.7: Các nhân tố tạo nên chất lượng dịch vụ.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1.3. Nén dữ liệu audio/video
Trước khi audio, video được truyền, chúng được số hóa và nén lại. Việc số
hóa là hiển nhiên bởi vì: mạng máy tính truyền đi các bit, do đó phải số hóa. Trong khi
đó, nén dữ liệu cũng rất quan trọng bởi vì audio, video nếu không nén sẽ ngốn băng
thông đáng kể cũng như dung lượng lưu trữ. Ví dụ: một hình ảnh 1024*1024*24 bit
cần 3MB dung luợng bộ nhớ nếu không nén, nó cần đến 7 phút để truyền qua đường
truyền 64Kbps. Nếu nó được nén lại với tỉ lệ 10:1, thì bộ nhớ cần là 300KB và thời
gian truyền giảm xuống còn dưới 6 giây. Nén audio, video là lĩnh vực được nghiên cứu
hơn 50 năm. Hiện nay có hàng trăm kĩ thuật phổ biến và các chuẩn cho nén video,
audio.
1.3.1. Một số kĩ thuật nén audio
PCM (Pulse Code Modulation)
•
Tín hiệu tương tự được lấy mẫu ở tần số cố định, ví dụ: 8 000 mẫu/giây. Giá
trị của mỗi mẫu là một số thực.
•
Mỗi mẫu được làm tròn tới một số trong tập các giá trị định trước. Thao tác
này được gọi là lượng tử hóa. Số lượng các số trong tập các giá trị hữu hạn gọi là các
giá trị lượng tử, thường là lũy thừa của 2 ví dụ 256.
•
Mỗi giá trị lượng tử được biểu diễn bằng một số lượng cố định các bit. Mỗi
giá trị mẫu được chuyển thành dãy bít (1 byte nếu có 256 giá trị lượng tử). Các biểu
diễn bit này được chuyển thành dạng biểu diễn số của tín hiệu và được truyền đi.
•
Bình thường, quá trình lượng tử hoá gồm 2 bước: lượng tử hoá tuyến tính 13
hay 14 bít, rồi nén theo logarit xuống 8 bít.
•
Nén 13 bít xuống 8 bít là biến đổi A-Law được sử dụng ở Châu Âu, nén 14
bít xuống 8 bít là biến đổi M-Law được sử dụng ở Bắc Mỹ và Nhật Bản.
Tôi xin lấy một ví dụ: nếu một tín hiệu audio tương tự được lấy mẫu ở tần số
8000 mẫu/giây, mỗi mẫu được lượng tử và được biểu diễn bởi 8 bit. Khi đó tín hiệu số
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
sẽ có tốc độ bít là 64000 bit/giây. Tín hiệu số này có thể được chuyển trở lại thành tín
hiệu tương tự (decode) để chơi. Tuy nhiên, tín hiệu analog được decode thường khác
với tín hiệu ban đầu. Bằng cách tăng tần số lấy mẫu và số lượng các giá trị lượng tử,
tín hiệu được giải mã có thể tương tự như tín hiệu tương tự ban đầu (thậm chí giống
hệt - ở một mức nào đó). Do vậy, rõ ràng có một sự tương ứng giữa chất lượng của tín
hiệu được giải mã với yêu cầu bộ nhớ lưu trữ và băng thông của tín hiệu số. Mã hóa
tiếng nói thường dùng PCM, với tốc độ lấy mẫu khoảng 8000 mẫu/giây, và 8 bit/mẫu
cho ta tốc độ là 64Kbps. Đĩa CD audio cũng dùng phương pháp PCM với tốc độ lấy
mẫu là 44100 mẫu/giây và 16 bit/mẫu cho tốc độ 705,6 Kbps ứng với âm thanh mono
và 1,411 Mbps ứng với âm thanh stereo.
DPCM (Differential PCM)
•
So sánh các mẫu, sau đó không mã hoá toàn bộ mẫu mà chỉ mã hoá sự khác
nhau giữa các mẫu.
•
Sử dụng cơ chế đoán dựa trên các mẫu trước để giảm tốc độ bít (mã hoá sự
khác nhau giữa mẫu đoán và mẫu thực tế - 4 bít/mẫu).
•
Theo phương pháp này, khi thời gian tăng lên, tỉ lệ lỗi giữa tín hiệu giải mã
và tín hiệu mã hoá sẽ tăng, do đó theo định kì, một mẫu đầy đủ sẽ được mã hoá.
ADPCM (Adaptive DPCM)
•
Dùng chiến lược đoán sự khác nhau giữa các xung theo kiểu thích nghi.
•
Cung cấp chất lượng âm thanh như PCM, tốc độ bít là 32 Kbps.
LPC (Linear Predictive Coding)
•
Cho âm thanh chất lượng robot, tốc độ bit là 1.2 – 2.4 Kbps. LPC mô hình
hoá tiếng nói như một nguồn được truyền qua bộ lọc
CELP (Code Excited Linear Predictor)
•
Sử dụng mô hình như LPC, nhưng có thêm nhiều thông tin về nguồn âm
thanh.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
•
Một bảng mã các vector nguồn có tại phía gửi và phía nhận.
•
Nguồn phát sẽ tìm từ bảng mã trên phần phù hợp nhất với âm thanh vào và gửi đi.
•
Tốc độ bit thường là 4.8 Kbps, 9.6 Kbps.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
GSM
•
Sử dụng mô hình tương tự LPC, chi phí tính toán thấp hơn CELP và thích
hợp cho
hệ thống điện thoại di động.
•
Tốc độ bit là 13Kbps.
MP3
•
Tốc độ bít là 128 Kbps hoặc 112 Kbps
•
Cho âm thanh chất lượng CD (CD quality)
•
Chuẩn nén rất phức tạp, sử dụng cơ chế giảm thiểu sự dư thừa
Lƣợc đồ mã hoá
Băng thông (Kbps)
Chất lƣợng âm
thanh
PCM
64
Âm thanh chất lƣợng
điện thoại (telephone
quality speech)
ADPCM
32
Telephone quality
speech
GSM
13
Telephone quality
speech
CELP
4-9
Telephone quality
speech
LPC
2
Âm thanh chất lƣợng
rô bốt (Robotic
quality
speech)
MP3
128
Âm thanh chất lƣợng
CD (CD quality
audio)
Bảng 1: So sánh các lược đồ mã hoá âm thanh
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
1.3.2. Nén video
Video là một dãy tuần tự các hình ảnh (image), mỗi hình ảnh được
hiển thị với tốc độ không đổi ví dụ 24 hoặc 30 hình/giây. Một image không
được nén gồm một mảng các pixel, mỗi pixel được mã hóa (encode) thành
một số bít để biểu diễn màu và độ sáng. Có 2 kiểu của sự dư thừa thông tin
trong hình ảnh video, các cơ chế nén video đều dựa trên những điều này. Dư
thừa về mặt không gian (Spatial redundancy) là dư thừa trong một image cụ
thể. Ví dụ: một image gồm hầu hết khoảng trống có thể được nén một cách
hiệu quả. Dư thừa về mặt thời gian (Temporal redundancy) là sự lặp lại image
trong image tiếp theo. Ví dụ: một image và image tiếp theo là giống
nhau , không có lý do gì để mã hóa lại hình ảnh tiếp theo đó. Sau đây sẽ là
giới thiệu ngắn gọn về chuẩn nén video MPEG.
MPEG (Motion Picture Engineering Group) là một chuẩn công
nghiệp cho việc nén và truyền audio/video. Hiện tại có 3 chuẩn đã được công bố
liên quan tới nén video là : MPEG1, MPEG2, MPEG4. Chuẩn mới nhất là
MPEG4 đang ở phiên bản 2 và đang được tiếp tục phát triển. Có 2 chuẩn khác
là MPEG7 (mô tả nội dung đa phương tiện, metadata) và MPEG21 (mô tả
framework cho đa phương tiện) không đóng vai trò quan trọng trong ứng dụng
video conference. Bảng sau đây tổng kết các định dạng và đặc điểm của MPEG
MPEG1
MPEG2
MPEG4
Độ phân giải
352x240
720x480
720x480
Băng thông chuẩn
1.5Mbps
5Mbps
2Mbps
Băng thông cực đại
2.5Mbps
15Mbps
4Mbps
Bảng 2: Bảng so sánh các chuẩn MPEG
•
MPEG1 là một chuẩn ban đầu được thiết kế để nén khoảng 30 phút
audio/video vào trong một đĩa CD. Nó nén và giải nén khá nhanh nhưng chất
lượng video thì không ấn tượng lắm. Tốc độ mã hoá từ 1Mbps tới 1.5Mbps.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Chuẩn H263 được sử dụng trong các hệ thống H323 cung cấp chất lượng
hình ảnh tốt hơn với băng thông thấp hơn. MPEG1 không được sử dụng
trong các hệ thống video conference.
•
MPEG2 là lược đồ nén video được sử dụng phổ biến. Rất nhiều sản phẩm
sử dụng chuẩn này, cung cấp hình ảnh chất lượng tốt (gần như chất
lượng truyền hình quảng bá). Chuẩn này được phát triển cho ứng dụng
quảng bá đồng thời cũng được sử dụng trong các môi trường tương tác như
video conference. MPEG2 là chuẩn rất phức tạp gồm nhiều độ phân giải và
định dạng khác nhau: từ chất lượng TV chuẩn cho tới truyền hình chất
lượng cao.
•
MPEG4 là một chuẩn mới hơn (1999). Giống như MPEG2, nó cung cấp
một miền tốc độ từ tốc độ thấp (sử dụng trong truyền thông không dây)
cho tới tốc độ cao. Với tốc độ thấp nó có thể thay thế MPEG2 (nén tốt hơn
nhưng chất lượng không đổi). MPEG 1 cho chất lượng video CDROM (1.5
Mbps), MPEG 2 cho chất lượng video DVD (3-6 Mbps) và MPEG 4 cho
nén video hướng đối tượng (object- oriented video compression).
1.4. Những vấn đề ảnh hƣởng đến chất lƣợng dịch vụ (QoS) của
Multimedia
1.4.1. Khái niệm về đảm bảo chất lƣợng dịch vụ (QoS):
Các hệ thống đa phương tiện thường là phân tán, hoạt động trên mạng máy
tính, các yêu cầu tài nguyên thường là động (ví dụ trong Video conference thì yêu
cầu về tài nguyên phụ thuộc số người tham gia) do đó cần có các giải pháp để đảm
bảo chất lượng thoả mãn yêu cầu của người dùng. Yêu cầu của người dùng được
thoả mãn bởi việc đảm bảo chất lượng dịch vụ ( Quality of Service). Đảm bảo chất
lượng dựa trên cơ sở là quản lý tài nguyên vì QoS phụ thuộc vào tài nguyên khả
dụng của hệ thống, việc quản lý tài nguyên ở đây là:
- Tính toán hoặc ước lượng được hiệu suất sử dụng tài nguyên
- Dành tài nguyên cho dịch vụ
- Lập lịch truy cập tài nguyên
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên
Xác định các tham số QoS:
Các tham số chính QoS là:
- Độ trễ: là thời gian cực đại để truyền một gói tin, nó phụ thuộc vào tốc độ
truyền tin, tốc độ truyền tin càng lớn, trễ càng nhỏ và ngược lại.
- Thông lượng: thông lượng quyết định khả năng truyền tin, thông lượng được tính
là tổng số đơn vị dữ liệu cực đại được truyền trong 1 đơn vị thời gian, chẳng hạn số
gói tin, số byte dữ liệu truyền đi trong 1 s.
- Tỷ số mất tin: là số đơn vị dữ liệu bị mất cực đại trong một đơn vị thời gian.
Ngoài ra còn có khái niệm kích thước mất tin: đó là số gói tin bị mất liên tiếp cực
đại. Bên cạnh tỷ số mất tin ta có thể dùng khái niệm độ tin cậy: tỷ số mất tin tỷ lệ
nghịch với độ tin cậy.
- Jitter: là độ biến thiên của độ trễ.
Đối với một ứng dụng, có các mức chất lượng dịch vụ :
QoS yêu cầu: là QoS tối thiểu mà ứng dụng yêu cầu, nếu dưới giá trị này thì ứng
dụng là không chấp nhận được. QoS mong muốn là QoS cực đại mà ứng dụng yêu
cầu. Phải cân đối giữa chi phí QoS và giá thành.