Tải bản đầy đủ (.pdf) (39 trang)

GIAO THỨC TRUYỀN THÔNG ĐA PHƯƠNG TIỆN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.58 MB, 39 trang )

ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
----------

BÁO CÁO BÀI TẬP LỚN
Môn: Truyền thông đa phương tiện
Đề tài 10: GIAO THỨC TRUYỀN THÔNG ĐA PHƯƠNG TIỆN

Giảng viên:

PGS.TS. Nguyễn Thị Hoàng Lan

Nhóm sinh viên thực hiện:
Đỗ Bá Mạnh

20111830

Thân Xuân Quỳnh

20112004

Tống Viết Tuấn

20112450

Phạm Văn Tiến

20112320

Hà Nội, 12-2011



LỜI NÓI ĐẦU
Công nghệ thông tin đóng vai trò quan trọng trong sự phát triển của xã hội trong thời đại
ngày nay. Công nghệ thông tin trở thành nhân tố quan trọng, là cầu nối trao đổi giữa các
thành phần của toàn xã hội.Đi cùng với nó là sự phát triển không ngừng của các hệ thống
mạng trong đó có các giao thức truyền thông đa phương tiện. Vì vậy nhóm em đã chọn đề
tài:”Các giao thức truyền thông đa phương tiện” để tìm hiểu về sự phát triển này. Thực tiễn
cho thấy các dịch vụ thông tin ngày nay không chỉ đơn thuần là cung cấp dữ liệu số liệu
mà đòi hỏi sự trực quan tương tác cao. Do đó, các hình thức, loại hình, cũng như yêu cầu
về chất lượng dịch vụ truyền thông đa phương tiện ngày càng phong phú, đa dạng. Truyền
thông đa phương tiện là nền tảng quan trọng cho nhiều hoạt động kinh tế, xã hội, báo chí,
truyền hình, quảng cáo, ... và nhiều hoạt động truyền thông khác.
Nội dung báo cáo gồm:
 Tổng quan về các giao thức truyền thông đa phương tiện.
 Giới thiệu một số giao thức truyền thông đa phương tiện.
 Khung giao thức H.323 và SIP.
 Khảo sát ứng dụng dung H.323 và SIP. Phân tích một ứng dụng.

Để hoàn thành được bài tập lớn này, nhóm chúng em xin được gửi lời cảm ơn chân
thành đến cô Nguyễn Thị Hoàng Lan, Giảng viên Khoa Công nghệ Thông tin
Trường Đại học Bách Khoa Hà Nội - đã hết lòng giúp đỡ, hướng dẫn, chỉ dạy tận
tình để nhóm em hoàn thành được đề tài này.

Hà Nội, ngày 7 tháng 12 năm 2015

Nhóm sinh viên


Mục lục
LỜI NÓI ĐẦU.................................................................................................................................................. 2

1.

TỔNG QUAN VỀ GIAO THỨC TRUYỀN THÔNG ..................................................................... 4
1.1.

Giới thiệu chung .......................................................................................................................... 4

1.2.

Phân loại các giao thức truyền thông đa phương tiện ............................................................. 4

2. KHUNG GIAO THỨC TRUYỀN THÔNG ĐA PHƯƠNG TIỆN:.................................................. 10
2.1 Chồng giao thức H.323 ..................................................................................................................... 10
2.1.1 Các thành phần trong hệ thống H323......................................................................................... 10
2.1.2 Các giao thức trong bộ giao thức H323 ..................................................................................... 14
2.1.3 Phương thức hoạt động .............................................................................................................. 15
2.2 Giới thiệu về giao thức SIP ............................................................................................................... 18
2.2.1 Một số dịch vụ của SIP : ............................................................................................................ 18
2.2.2 Các thành phần chính trong SIP ................................................................................................. 19
2.2.2.1 SIP User agent (UA): .............................................................................................................. 19
2.2.2.2 SIP network server .................................................................................................................. 19
2.3 So sánh giữa SIP và H323................................................................................................................ 29
3. TÌM HIÉU ASTERISK ỨNG DỤNG VOIP ...................................................................................... 31
3.1 Khái niệm:......................................................................................................................................... 31
3.3 khung giao thức SIP và H323 ảnh hưởng đến chất lượng dịch vụ truyền thông như thế nào? ........ 36
3.3.1. SIP: ............................................................................................................................................ 36
3.3.2 H.323:......................................................................................................................................... 37
TÀI LIỆU THAM KHẢO .......................................................................................................................... 39



1. TỔNG QUAN VỀ GIAO THỨC TRUYỀN THÔNG
1.1. Giới thiệu chung
Giao thức truyền thông đa phương tiện là một tập hợp các quy tắc chuẩn dành cho việc
biểu diễn dữ liệu, phát tín hiệu, chứng thực và phát hiện lỗi dữ liệu - những việc cần thiết
để gửi tín hiệu đa phương tiện qua các kênh truyền thông, nhờ đó mà các thiết bị có thể
kết nối và trao đổi dữ liệu với nhau.
Yêu cầu và nhiệm vụ của các giao thức truyền thông đa phương tiện là phải đảm bảo tính
tương tác, trực tuyến , thời gian thực khi tương tác giữa các người dùng.
=> Đảm bảo sự tương tác, giao tiếp giữa các người dùng.
Trong truyền thông đa phương tiện, để truyền tải thành công dữ liệu đa phương tiện, cần
kết hợp nhiều giao thức, mỗi giao thức có những nhiệm vụ khác nhau, tạo nên chồng giao
thức.

1.2. Phân loại các giao thức truyền thông đa phương tiện


Có nhiều cách để phân loại các giao thức truyền thông đa phương tiện:
 Phân chia theo tầng :
- Tầng ứng dụng: RTP/RTCP, SIP...
- Tầng truyền tải: UDP, TCP
- Tầng mạng: IP

 Phân chia theo chức năng:
- Các giao thức truyền dữ liệu: RTP, RTSP...
- Các giao thức điều khiển: RTCP, SIP...

 Chồng giao thức và chuẩn:
- SIP
- H323


1.3. Giới thiệu một số giao thức truyền thông đa phương tiện
1.3.1. Giao thức truyền thông thời gian thực RTP/RTCP (Real-Time
transport Protocol / RTP control protocol)
Real-time Transport Protocol (RTP) là giao thức thực hiện vận chuyển các ứng dụng dữ
liệu thời gian thực như thoại và hội nghị truyền hình. Các ứng dụng này thường mang các
định dạng của âm thanh (PCM, GSM và MP3 và các định dạng độc quyền khác) và định
dạng của video (MPEG, H.263 và các định dạng video độc quyền khác). RTP được định
nghĩa trong RFC 1889, RFC 3550.
RTP được sử dụng kết hợp với RTCP (Realtime Transport Control Protocol). Trong khi
RTP được dùng để truyền dòng dữ liệu đa phương tiện truyền thông (âm thanh và video)
thì RTCP được dùng để giám sát QoS và thu thập các thông tin về những người tham gia
phiên truyền RTP đang thực hiện.
Giao thức RTP chạy trên nền UDP để sử dụng các chức năng ghép kênh và checksum.
Cả hai giao thức RTP và UDP tạo nên một phần chức năng của lớp giao vận. Tuy nhiên
RTP cũng có thể được sử dụng với những giao thức khác của lớp mạng và lớp giao vận
bên dưới miễn là các giao thức này cung cấp được các dịch vụ mà RTP đòi hỏi. Một điều
cần lưu ý là bản thân giao thức RTP không cung cấp một cơ chế nào đảm bảo việc phân
phát kịp thời dữ liệu tới các trạm, mà nó dựa trên các dịch vụ của lớp thấp hơn để thực
hiện điều này. RTP cũng không đảm bảo việc truyền các gói theo đúng thứ tự. Tuy nhiên


số thứ tự trong header cho phép bên thu điều chỉnh lại thứ tự dòng gói tin của bên phát
gữi đến.
RTP không chỉ hỗ trợ các dịch vụ phổ biến của hầu hết các ứng dụng truyền thông hội
nghị đa phương tiện mà còn có khả năng mở rộng cho phù hợp với dịch vụ mới. Khả
năng mở rộng, các mã tương ứng trong trường PT của header ứng với các loại payload
trong gói RTP được mô tả trong profile đi kèm.
Cấu trúc giao thức RTP:

Theo cấu trúc trên:

- Phần header cố định
Version: 2 bit. Trường vesion để chỉ phiên bản của giao thức. Có 3 phiên bản 0,1,2.
Phiên bản hiện tại được sử dụng là 2.
P (Padding): 1 bit. Nếu trường P được thiết lập thì gói tin sẽ có một hoặc nhều octets
P (những octets này không phải một phần của payload) được thêm vào cuối gói tin. Octet
P cuối cùng chỉ kích thước của tổng octect được thêm vào. Mục đích của việc thêm octect
P là để dùng cho thuật toán mã hóa cần kích thước gói cố định hoặc được dùng cho việc
cách ly các gói RTP trong trường hợp nhiều gói thông tin được mang trong cùng một đơn
vị dữ liệu của giao thức lớp dưới.
X (Extension): 1 bit. Nếu trường X được thiết lập thì phần header cố định phải được
liên kết với phần header mở rộng.
CC (CSRC count): 4 bits. Chứa các giá trị của trường CSRC ID trong header cố
định.
M (Marker): 1 bit. Được sử dụng ở lớp ứng dụng để xác định một profile.
PT (Payload type): 7 bits. Xác định và nêu ý nghĩa các dạng payload của RTP. RTP
có thể hỗ trợ đến 27 = 128 loại payload khác nhau. Với một luồng âm thanh hay video
trường PT được sử dụng để kí hiệu các mã âm thanh hay video. Ví dụ: mã PT của một số
định dạng âm thanh và video: PCM (0),GSM(3), LPC (7), G.722 (9), MPEG Audio(14),
G.728(15), JPEG(26), H.261(31), MPEG1(32), MPEG2(33) . Nếu máy phát quyết định


thay đổi mã ở phần giữa của một phiên làm việc, thì máy phátcó thể thông báo cho máy
thuvề sự thay đổi trường PT. Máy phát có thể thay đổi mã để tăng chất lượng âm thanh
hay video hoặc giảm tốc độ luồng RTP.
Sequence Number: 16 bits. Trường mang số thứ tự của các gói tin RTP. Số thứ tự
này được tăng lên 1 sau mỗi lần gói tin RTP được máy phát gửi đi và còn được dùng để
máy thu phát hiện mất gói và khôi phục lại trình tự chuỗi gói tin. Giá trí khởi đầu của
trường này là một giá trị ngẫu nhiên. Vd: máy phát nhận được luồng gói tin RTP có
khoảng trống giữa 2 hai số thứ tự 86, 89 thì máy phát sẽ biết rằng gói tin có số thự tự 87,
88 đã bị mất.

Timestamp: 32 bits. Trường xác định thời điểm lấy mẫu của octets đầu tiên trong gói
tin RTP. Thời điểm lấy mẫu phải được đo bằng một đồng hồ tăng đều đặn và tuyến tính
về mặt thời gian để cho phép việc đồng bộ và tính toán độ jitter. Tần số đồng hồ này là
không cố định mà phụ thuộc vào loại định dạng của payload. Giá trị khởi đầu trường
timestamp cũng được chọn một cách ngẫu nhiên. Một vài gói tin RTP có thể mang cùng
một giá trị của trường này nếu như chúng được phát đi cùng một lúc về mặt logic (ví dụ
như các gói của cùng một khung hình video). Trong trường hợp các gói dữ liệu được phát
ra sau những khoảng thời gian bằng thì giá trị timestamp được tăng một cách đều đặn.
Ngược lại, trong trường hợp khác giá trị timestamp sẽ tăng không đều đặn.
SSRC (Synchronization Source Identifier): 32 bits. Giá trị của trường SSRC chỉ ra
nguồn đồng bộ (nguồn phát gói tin RTP từ micro, camera hay RTP mixer) của gói tin
RTP, giá trị này được chọn ngẫu nhiên. Trong một phiên kết nối RTP thì có nhiều nguồn
đồng độ phát ra nhiều dòng gói tin RTP. Máy thu sẽ nhóm các dòng gói tin RTP cùng
nguồn để phát lại tín hiệu thời gian thực (real-time).
CSRC (Contributing Source List): từ 0 đến 15 items, 32 bits. Trường CSRC xác
định các nguồn đóng góp payload cho gói tin (CSRC cho phép xác định tối đa 15 nguồn
đóng góp tương ứng vớ 15 items). Giá trị của CSRC được cho bởi trường CC và giá trị
này được chèn vào mỗi items bằng các bộ trộn (mixer).
- Phần header mở rộng:
Cơ chế mở rộng của RTP cho phép những ứng dụng riêng lẻ của giao thức RTP thực hiện
được với những chức năng mới đòi hỏi những thông tin thêm vào phần header của gói
tin. Cơ chế này được thiết kế để một vài ứng dụng có thể bỏ qua một số ứng dụng khác
lại có thể sử dụng được phần nào đó. Nếu như trường X (bit X) trong phần header cố định
được đặt bằng 1 thì theo sau phần header cố định là phần header mở rộng có chiều dài
thay đổi. 16 bit đầu tiên của trong phần tiêu đề được sử dụng với mục đích riêng cho
từng ứng dụng được định nghĩa bởi profile (thường nó được sử dụng để phân biệt các loại
tiêu để mở rộng). 16 bits kế tiếp mang giá trị chiều dài của phần header mở rộng tính
theo đơn vị là 32 bits (Giá trị này không bao gồm 32 bit đầu tiên của phần header mở
rộng).
RTP được sử dụng kết hợp với RTCP (Realtime Transport Control Protocol). Trong

khi RTP được dùng để truyền dòng dữ liệu đa phương tiện truyền thông (âm thanh và


video) thì RTCP được dùng để giám sát QoS và thu thập các thông tin về những người
tham gia phiên truyền RTP đang thực hiện.
RTCP cung cấp thông tin về các gói tin nhận được,cung cấp thông tin phản hồi để
theo dõi về chất lượng dịch vụ hội nghị và thông tin về các thành viên tham gia hội nghị
để giúp kiểm soát phiên làm việc.
1.3.2. Giao thức thiết lập phiên SIP (Session Initiation Protocol )
SIP (Session Initiation Protocol) là một giao thức điều khiển và đã được chuẩn hóa bởi
IETF. Nhiệm vụ của nó là thiết lập, hiệu chỉnh và kết thúc các phiên làm việc giữa người
dùng. Các phiên làm việc cũng có thể là hội nghị đa phương tiên, cuộc gọi điện thoại
điểm-điểm,…
SIP được sử dụng kết hợp với các chuẩn giao thức IETF khác như là SAP, SDP và
MGCP (MEGACO) để cung cấp cho các dịch vụ VoIP.
Cấu trúc của SIP tương tự với cấu trúc của HTTP (giao thức client-server). Nó bao gồm
các yêu cầu được gởi đến từ người sử dụng SIP client đến SIP server. Server xử lý các
yêu cầu và đáp ứng đến client. Một thông điệp yêu cầu, cùng với các thông điệp đáp ứng
tạo nên sự thực thi SIP.

1.3.3. Chồng giao thức H323

H323 là bộ giao thức báo hiệu ( signaling ), có chức năng thiết lập, ngắt và thay đổi cuộc
gọi. H323 cung cấp nền tảng kỹ thuật cho việc truyền thoại, hình ảnh và số liệu đồng thời
qua mạng IP.


Khuyến nghị của ITU-T về chuẩn H.323 đã đưa ra tiêu chuẩn H.323 gồm các giao thức:
H.245


Giao thức báo hiệu điều khiển truyền thông multimedia.

H.225.0

Đóng gói và đòng bộ các dòng thông tin đa phương tiện
(thoại, truyền hình, số liệu).
Khuyến nghị này bao gồm giao thức RTP/RTCP và các thủ
tục điều khiển cuộc gọi Q.931(DSS 1).

G.711, G.722, G723,
G.728, G.729,…

Các chuẩn nén tín hiệu thoại.

H.261, H.263, H.264,…

Các chuẩn nén tín hiệu video.

T.120

Chuẩn cho các ứng dụng chia sẻ số liệu


2. KHUNG GIAO THỨC TRUYỀN THÔNG ĐA PHƯƠNG TIỆN:
Khung giao thức truyền thông đa phương tiện:

2.1 Chồng giao thức H.323
2.1.1 Các thành phần trong hệ thống H323
Các dòng thông tin trong hệ thống H323 được chia ra làm các loại:
 Audio ( thoại): là tín hiệu thoại được số hóa và mã hóa. Để giảm tốc độ trung bình của tín

hiệu thoại, cơ chế phát hiện tích cực thoại có thể được sử dụng. Tín hiệu thoại được đi kèm với
tín hiệu điều khiển thoại.
 Video( hình ảnh): là tín hiệu hình ảnh động cũng được số hóa và mã hóa. Tín hiệu video
cũng đi kèm với tín hiệu điều khiển video.
 Số liệu: bao gồm tín hiệu fax, tài liệu văn bản, ảnh tĩnh, file...
 Tín hiệu điều khiển truyền thông( Communication control signals): là các thông tin điều
khiển trao đổi giữa các thành phần chức năng trong hệ thống để thực hiện điều khiển truyền
thông giữa chúng như: trao đổi khả năng, đóng mở các kênh logic, các thông điệp điều khiển
luồng và các chức năng khác.
 Tín hiệu điều khiển cuộc gọi( Call control signals): được sử dụng cho các chức năng điều
khiển cuộc gọi như là thiết lập cuộc gọi, kết thúc cuộc gọi...


 Tín hiệu kênh RAS: được sử dụng để thực hiến các chức năng: đăng ký tham gia vào một
vùng H323, kết nạp/tháo gỡ một điểm cuối(endpoint) khỏi vùng, thay đổi băng thông và các
chức năng khác liên quan đến chức năng quản lý hoạt động của các điểm cuối trong một vùng
H323.
Về mặt logic, hệ thống H323 gồm 4 thành phần:
 Terminal: Là 1 trạm cuối trong mạng LAN, đảm nhận việc cung cấp truyền thông 2 chiều
theo thời gian thực.
 H323 Gateway: Là cầu nối giữa mạng H.323 với các mạng khác như SIP, PSTN,…
Gateway đóng vai trò chuyển đổi các giao thức trong việc thiết lập và chấm dứt các cuộc gọi,
chuyển đổi các media format giữa các mạng khác nhau, đảm bảo tính tương thích.
 H323 Gatekeeper: Là một thành phần không bắt buộc, đóng vai trò là điểm trung tâm trong
mô hình mạng H.323, quản lý hoạt động hệ thống, quyết định việc cung cấp địa
chỉ (addressing),phân phát băng thông (bandwidth), cung cấp tài khoản, thẩm định quyền
(authentication) cho các terminal và gateway…
 MCU ( Multipoint control unit): Thực hiện chức năng tạo kết nối đa điểm, hỗ trợ các ứng
dụng truyền thông nhiều bên.


Sơ đồ cấu trúc hệ thống H323

2.1.1.1 Thành phần đầu cuối H323


Các thành phần giao tiếp với người sử dụng:
 Các bộ codec ( Audio và video )
 Phần trao đổi dữ liệu từ xa ( telematic )
 Lớp đóng gói dữ liệu multimedia chuẩn H225.0.
 Thành phần chức năng điều khiển hệ thống ( system control )
 Giao diện giao tiếp mạng ( LAN interface )
Tất cả các thiết bị đầu cuối H323 đều phải có một đơn vị điều khiển hệ thống, lớp
đóng gói dữ liệu H225.0, giao diện mạng và bộ codec thoại. Bộ codec cho tín hiệu video
và các ứng dụng dữ liệu của người sử dụng là tùy chọn ( có thể có hoặc không ).
2.1.1.2 H323 Gateway
Gateway mang các tính năng phục vụ cho hoạt động tương tác của các thiết bị
trong hệ thống H323 với các thiết bị trong mạng chuyển mạch kênh như PSTN, ISDN,...
Gateway H323 được bố trí nằm giữa các thành phần trong hệ thống H323 với các thiết bị
nằm tỏng các hệ thống khác ( các mạng chuyển mạch kênh SCN). Nó phải cung cấp tính
năng chuyển đổi khuyên dạng dữ liệu truyền và chuyển đổi thủ tục một cách thích hợp
giữa mạng LAN các loại mạng mà gateway kết nối tới, cụ thể:
 Thực hiện chuyển đổi khuôn dạng dữ liệu thoại, video, số liệu nếu cần.
 Thực hiện chức năng thiết lập cuộc gọi, hủy cuộc gọi đối với cả 2 phía mạng LAN
và mạng chuyển mạch kênh SCN.


Các Gateway có thể liên kết với nhau thông qua mạng chuyển mạch kênh để cung
cấp khả năng truyền thông giữa các thiết bị đầu cuối H323 không nằm trong cùng 1 mạng
LAN.
Các thiết bị cuối H323 trong cùng 1 mạng LAN có thể thông tin trực tiếp với nhau

mà không phải thông qua Gateway. Do vậy khi hệ thống không có yêu cầu thông tin với
các terminal trong các mạng chuyển mạch kênh thì có thể bỏ qua vai trò của Gateway.
Cấu trúc của Gateway H323 bao gồm:
 Khối chức năng của thiết bị H323, khối chức năng này có thể là chức năng đầu cuối
để giao tiếp với một terminal trong hệ thống H323, hoặc chức năng MCU để giao tiếp với
nhiều terminal.
 Khối chức năng của thiết bị chuyển mạch kênh, mang chức năng giao tiếp với một
hay nhiều thiết bị đầu cuối trong mạng chuyển mạch kênh.
 Khối chức năng chuyển đổi, bao gồm chuyển đổi khuôn dạng dữ liệu và chuyển đổi
thủ tục.
 Gateway liên kết với máy điện thoại thông thường phải tạo và nhận biết được tín
hiệu DTMF( Dual Tone Multiple Frequency) tương ứng với các phím nhập từ bàn phím
điện thoại.

2.1.1.3 Gatekeeper
Khi có mặt trong hệ thống, gatekeeper phải cung cấp các chức năng sau:
 Dịch địa chỉ: dịch từ tên miền hoặc một số điện thoải ảo của một điểm cuối sang địa
chỉ IP tương ứng.
 Điều khiển két nạp ( Admission control): điều khiển việc cho phép hoạt động của
các điểm cuối.
 Điều khiển băng thông ( Bandwidth COntrol): Điều khiển cấp hoặc từ chối cấp một
phần băng thông cho các cuộc gọi của các thiết bị trong hệ thống.
 Quản lý vùng ( Zone Management) : Thực hiện các chức năng trên với các điểm
cuối H323 đã đăng ký với Gatekeeper, tạo thành một vùng H323.
Ngoài ra , Gatekeeper có thể cung cấp các chức năng tùy chọn sau:
 Báo hiệu điều khiển cuộc gọi ( Call Control Signalling)
 Điều khiển cho phép cuộc gọi ( CAall Signalling Channel)


 Quản lý băng thông ( Bandwidth Management)

 Quản lý cuộc gọi ( Call Management)
 Tính cước ( Billing)

2.1.1..4 Đơn vị điều khiển liên kết đa điểm (MCU)
MCU hỗ trợ việc thực hiện các cuộc đàm thoại hội nghị giữa nhiều thiết bị đầu
cuối. Trong chuẩn H323, MCU bắt buộc phải có một bộ điều khiển đa điểm MC
(Multipoint Controller) và có hoặc không một vài MP (Multipoint Processor).
- MC và MP là các thành phần của MCU nhưng chúng có thể không tồn tại trong một
thiết bị độc lập mà phân tán trong các thiết bị khác. Ví dụ : một Gateway có thể mang
trong nó một MC và một vài MP để thực hiện kết nối tới nhiều thiết bị đầu cuối, một thiết
bị đầu cuối có thể mang một MC để có thể thực hiện nhiều cuộc gọi cùng lúc.
- MC điều khiển việc liên kết giữa nhiều điểm cuối trong hệ thống bao gồm:
 Xử lý việc đàm phán giữa các thiết bị đầu cuối để quyết định một khả năng xử lý
dòng dữ liệu media chung giữa các thiết bị đầu cuối.
 Quyết định dòng dữ liệu nào sẽ là dòng dữ liệu multicast.
- MC không xử lý trực tiếp một dòng dữ liệu media nào. Việc xử lý các dòng dữ liệu
sẽ do các MP đảm nhiệm. MP sẽ thực hiện việc trộn, chuyển mạch, xử lý cho từng dòng
dữ liệu thời gian thực trong cuộc hội nghị.
- Việc truyền thông tin trong mạng IP tồn tại dưới 3 hình thức: Unicast, multicast và
broadcast.
- Trong hệ thoogns H323, cuộc hội nghị nhiều bên có thể có ba loại cấu hình hội nghị
sau:
 Cấu hình tập trung (Centralized Multipoint Conference).
 Cấu hình phân tán (Decentralized Multipoint Conference).
 Cấu hình lai (Hybrid Multipoint Conference).

2.1.2 Các giao thức trong bộ giao thức H323
H323 cung cấp nhiều loại hình dịch vụ từ thoại đến video và dữ liệu, thông tin đa
phương tiện.H323 có đặc điểm kỹ thuật giống như một chiếc dù chứa đựng một số lượng
lớn bộ máy có tác động qua lại với nhau bằng nhiều cách thức khác nhau dựa vào bộ

dạng, sự vắng mặt, mối quan hệ mô hình của những thực thể tham gia và loại session (ví
dụ như là audio và video). Có nhiều giao thức con bên trong đặc điểm của giao thức
H323:


 Với dịch vụ audio có giao thức lớp ứng dụng là các chuẩn G (G.711, G.722,
G.723.1, G.728, G.729). Với dịch vụ video có các giao thức chuẩn H( H261, H263) .
Chúng cùng với các giao thức RTCP, RAS, RTP dựa trên nền UDP ở lớp vận chuyển.
 Với dịch vụ truyền dữ liệu/fax: có chuẩn riêng, không dựa trên nền UDP, đó là
T120 cho truyền dữ liệu và T138 cho fax.
 RAS: quản lý việc đăng kí, chấp nhận và trạng thái dùng cho truyền thông giữa một
điểm cuối H323 với một Gatekeeper.
 Q931: Quản lý việc thiết lập và điều khiển/kết thúc cuộc gọi
 H225: Điều khiển cuộc gọi.
 H245: Các giao thức điều khiển truyền thông ( Medio Control)
 H235: Giao thức bảo mật và chứng thực.
 H450.x: Các dịch vụ bổ trợ như chuyển hướng cuộc gọi, giữ cuộc gọi, dừng cuộc
gọi, chỉ dẫn tin nhắn chờ...

Mô hình giao thức H323 tương quan với mô hình OSI

2.1.3 Phương thức hoạt động
- Khi 1 phiên kết nối được thực hiện, việc dịch địa chỉ (address translation) sẽ được 1
gateway đảm nhận. Khi địa chỉ IP của máy đích được xác nhận, 1 kết nối TCP sẽ được
thiết lập từ địa chỉ nguồn tới người nhận thông qua giao thức Q.931. Ở bước này, cả 2 nơi
đều tiến hành việc trao đổi các tham số bao gồm các tham số mã hoá (encoding
parameters) và các thành phần tham số liên quan khác. Các cổng kết nối và phân phát địa
chỉ cũng được cấu hình. 4 kênh RTCP và RTP được kết nối, mỗi kênh có 1 hướng duy



nhất. RTP là kênh truyền dữ liệu âm thanh (voice data) từ 1 thực thể sang 1 thực thể
khác. Khi các kênh đã được kết nối thì dữ liệu âm thanh sẽ được phát thông qua các kênh
truyền này thông qua các RTCP instructions.
- Kênh RAS dùng để truyền tải các bản tin sử dụng trogn quá trình đăng ký điểm cuối
và tìm kiếm Gatekeeper mà liên kết một địa chỉ định danh của điểm cuối với địa chỉ lớp
giao vận kênh báo hiệu cuộc gọi của nó. Kênh RAS là kênh không tin cậy, vì thế trong
khuyến nghị H225 đã khuyến nghị thời gian giới hạn định trước và số lần gửi yêu cầu cho
một vài loại bản tin:
1. Tìm kiếm Gatekeeper: Điểm cuối sẽ tìm kiếm Gatekeeper mà nó đăng ký, việc tìm
kiếm này có thể được thực hiện bằng thủ công hoặc tự động.
2. Đăng ký điểm cuối: là quá trình điểm cuối liên kết vào vùng dịch vụ và thông báo
cho Gatekeeper địa chỉ định danh cũng như địa chỉ lớp giao vận của nó. Sau khi tìm được
Gatekeeper, tất cả các điểm cuối sẽ đăng ký với Gatekeeper này. Việc đăng ký phải được
thực hiện trước khi một cuộc gọi nào đó bắt đầu. ĐIểm cuối sẽ gửi yêu cầu đăng ký RRQ
(Registration Request) tới Gatekeeper. Nếu chấp nhận sự đăng ký của điểm cuối,
Gatekeeper sẽ trả lời lại bằng xác nhận đăng ký RCF (Registration COnfirmation), ngược
lại nó sẽ trả lời bằng tín hiệu từ chối RRJ (Registration Reject).
3. Định vị điểm cuối: Điểm cuối hoặc Gatekeeper có địa chỉ đinh danh của một điểm
cuối khác và muốn liên lạc với nó, thì có thể dùng bản tin yêu cầu định vị LRQ. Bản tin
này được gửi tới bộ nhận dạng TSAP kênh RAS của Gatekeeper định trước. Gatekeeper
tương ứng sẽ gửi trả lời bản tin LCF chứa thông tin cần thiết của điểm cuối hoặc
Gatekeeper của điểm cuối. Thông tin này bao gồm địa chì kênh báo hiệu cuộc gọi và
kênh RAS.
4. Mã thông báo truy nhập: là một xâu đã được kiểm tra ở bản tin cài đặt và các bản tin
RAS.
Các thủ tục báo hiệu:
Người ta chia một cuộc gọi ra làm 5 giai đoạn gồm:
- Giai đoạn 1: thiết lập cuộc gọi
- Giai đoạn 2: thiết lập kênh điều khiển
- Giai đoạn 3: thiết lập kênh thoại ảo

- Giai đoạn 4: dịch vụ
- Giai đoạn 5: kết thúc cuộc gọi
 Thiết lập cuộc gọi: việc thiết lập cuộc gọi sử dụng các bản tin định nghĩa trong
khuyến nghị H225. Có thể xảy ra 6 trường hợp:
- Cuộc gọi cơ bản: cả 2 thiết bị đầu cuối đều không đăng ký
- Cả 2 thuê bao đều đăng ký tới một Gatekeeper.


- Chỉ thuê bao chủ gọi đăng ký với Gatekeeper.
- Chỉ thuê bao bị gọi đăng ký với Gatekeeper.
- Hai thuê bao đăng ký tới hai Gatekeeper khác nhau.
- Thiết lập cuộc gọi qua Gateway.
 Thiết lập kênh điều khiển: khi kết thúc giai đoạn 1 tức là cả bên gọi và bị gọi đã
hoàn thành việc trao đổi các bản tin thiết lập cuộc gọi, thì các đầu cuối sẽ thiết lập kênh
điều khiển h245. Bảm tin đầu tiên được trao đổi là terminalCapabilitySet để các bên
thông báo cho nhau khả năng làm việc của mình. Mỗi thiết bị đầu cuối đều có đặc tính
riêng nói lên khả năng chế độ mã hóa, truyền nhận và giải mã tín hiệu. Kênh điều khiển
này có thể do thuê bao bị gọi thiết lập sau khi nó nhận được bản tin Setup hoặc do thuê
bao chủ gọi thiết lập khi nó nhận được bản tin Connect hoặc một đầu cuối gửi Release
Complete, thì kênh điều khiển H245 được giải phóng.
 Thiết lập kênh truyền thông: Sau khi trao đổi khả năng và xác định mối quan hệ
master-slave ở giai đoạn 2, thủ tục điều khiển kênh H245 sẽ thực hiện việc mở kênh logic
để truyền số liệu. Các kênh này là kênh H225. Sau khi mở kênh logic để truyền tín hiệu là
âm thanh và hình ảnh thì mỗi đầu cuối sẽ truyền đi một bản tin H225.0
MaximumSkewIndication để xác định thông số truyền.
 Dịch vụ cuộc gọi: Có một số dịch vụ được thực hiện trên mạng H323 như: thay đổi
độ rộng băng tần, giám sát trạng thái hoạt động, hội nghị đặc biệt, các dịch vụ bổ sung...
 Kết thúc cuộc gọi: một thiết bị đầy cuối kết thúc cuộc gọi theo các bước:
Dừng truyền tín hiệu video khi kết thúc truyền ảnh, sau đó giải phóng tất cả các
kênh logic phục vụ truyền video.

Dừng truyền dữ liệu và đóng tất cả các kênh logic dùng để truyền dữ liệu.
Dừng truyền audio và đóng tất cả các kênh logic dùng để truyền audio.
Truyền bản tin H245 endSessionCommand trên kênh điều khiển H245 để báo cho
thuê bao đầu kia biết nó muốn kết thúc cuộc gọi. Sau đó nó dừng truyền các bản tin H245
và đóng kênh điều khiển H245.
Nó sẽ chờ nhận bản tin endSessionCommand từ thuê bao đầu kia và sẽ đóng kênh
điều khiển H245.
Nếu kênh báo hiệu cuộc gọi đang mở, thì nó sẽ truyền đi bản tin Release Complete
sau đó đóng kênh báo hiệu.
Trong cuộc gọi có sự tham gia của Gatekeeper cần có hoạt động giải phóng băng
tần. Mỗi đầu cuối sẽ truyền đi bản tin DRQ tới Gatekeeper, sau đó Gatekeeper trả lời
bằng bản tin DCF. Sau khi gửi DRQ, đầu cuối sẽ không gửi bản tin IRR tới Gatekeeper
nữa và khi đó cuộc gọi kết thúc.


2.2 Giới thiệu về giao thức SIP
SIP tạo ra sự giả định nhỏ nhất về cơ bản của giao thức truyền tải. Giao thức này
cung cấp độ tin cậy và không phụ thuộc vào độ tin cậy của TCP. Session Description
Protocol (SDP) là một giao thức mô tả thông điệp của SIP để xác minh bộ mã hóa . SIP
hỗ trợ việc mô tả các phiên mà cho phép các bên tham gia có thể đồng ý thiết lập các kiểu
phương tiện tương thích.

SIP là một phần của bộ giao thức gồm có : SDP,RTP và RTCP .
SDP-Session Description Protocol (giao thức mô tả phiên ) SDP được định nghĩa
bởi RFC 2327,được phát triển bởi IETF MMUSIC . SDP mô tả thông điệp của SIP . Sau
đó SIP sẽ nhận nhiệm vụ thiết lập các phiên để phục vụ cho việc truyền thông . Các giao
thức RTP RTCP RTSP sẽ đảm nhận việc truyền thông tin qua TCP hoặc UDP

2.2.1 Một số dịch vụ của SIP :
 User Location : Xác định hệ thống cuối cùng để sử dụng cho việc truyền thông..

 Call Setup : thiết lập các thông số cho cuộc gọi tại hai bên gọi và nghe.
 User Availability : Xác định tham số truyền tải dữ liệu.
 User Capabilities : Xác định phương tiện và các thông số của phương tiện được sử
dụng.
 Call handling : Tạo, chuyển giao và kết thúc cuộc gọi.
 Session management : quản lý phiên
 Session close : kết thúc phiên


2.2.2 Các thành phần chính trong SIP
2.2.2.1 SIP User agent (UA):
Mục đích của SIP là làm cho các phiên có thể thiết lập giữa các User Agent.Một
User Agent là một hệ thống cuối cùng hoạt động trên nhân danh của người dùng. Một
User Agent phải có khả năng thiết lập một phiên của phương tiện này với các User Agent
khác.
Một User Agent phải duy trì trạng thái trên các cuộc gọi mà nó khởi tạo hoặc tham
gia vào. Một trạng thái nhỏ nhất của các cuộc gọi được thiết lập bao gồm:các thẻ local và
remote,Call-ID, các trường local và remote cseq, cùng với việc thiết lập hướng và các
thông tin cần thiết của các phương tiện .User Agent duy trì trạng thái của một cuộc gọi
trong thời gian tối thiểu là 32 giây.
Một User Agent chứa một ứng dụng client và một ứng dụng server.Hai thành phần
trên là một User Agent Client(UAC)và một User Agent Server (UAS).
 User Agent Client bắt đầu các yêu cầu
 User Agent Server thì tạo ra các phản hồi.
Trong một phiên, User Agent thường điều khiển cả User Agent Client và User
Agent Server.
Một SIP User Agent cũng phải hỗ trợ SDP để mô tả thông tin .Một
User Agent phải hiểu rõ danh sách các trường nhu cầu mở rộng trong một yêu cầu . Nếu
không biết các trường này có thể bị lờ đi bởi một User Agent.
2.2.2.2 SIP network server

SIP servers là các ứng dụng mà nó chấp nhận các SIP yêu cầu và phản hồi đến
chúng . Không nên lẫn lộn SIP server với một User Agent Server . Một SIP server là một
kiểu khác biệt của thực thể. Bởi vì SIP server cung cấp các dịch vụ và chức năng với
User Agent, chúng sẽ hỗ trợ cả TCP,TLS và UDP để truyền tải.

Thể hiện các liên kết hoạt động của SIP server


1. Proxy Server sẽ liên lạc với Location server đưa cho Location Server một hay toàn
bộ ID của người dùng cần liên lạc ( UAS)
2. Location Server sẽ tìm ra cụ thể địa chỉ của người dùng cần liên lạc và gửi về Proxy
Server
3. Proxy Server do biết địa chỉ cụ thể của người dùng cần liên lạc nên sẽ gửi đến ( định
tuyến ) qua proxy server khác
 SIP server proxy:
Một SIP proxy server nhận một yêu cầu từ một User Agent hoặc một Proxy khác và
hành động trên nhân danh của User Agent để chuyển tiếp hoặc phản hồi lại yêu cầu.Một
Proxy cho phép chỉnh sửa các yêu cầu và chấp nhận các phản hồi để thiết lập các qui tắc
bên ngoài trong RFC 3261.Các qui tắc này thì duy trì theo khoảng cách end-to-end của
tín hiệu SIP trong khi đó vẫn còn cho phép các Proxy Server thực hiện các dịch vụ và
chức năng với User Agent.
Một Proxy Server phải có truy xuất đến cơ sở dữ liệu hoặc vị trí các dịch vụ để giúp
đỡ nó trong quá trình xử lý các yêu cầu . Giao thức SIP không xác định giao diện giữa
Proxy và vị trí dịch vụ . Proxy có thể sử dụng nhiều kiểu cơ sở dữ liệu trong quá trình xử
lý các yêu cầu.Cơ sở dữ liệu có thể có SIP registration,các thông tin hiện hữu,và nhiểu
kiểu khác của thông tin về nơi mà user được chỉ định.
Một proxy server khác biệt với một User Agent hoặc gateway ở ba điểm sau:
- Một Proxy Server không đưa ra các yêu cầu,nó chỉ đáp ứng các yêu cầu từ một User
Agent ( yêu cầu CANCEL là một ngoại lệ trong qui tắc này).
- Một proxy server không có khả năng truyền thông tin .

- Một proxy server thì không phân tích các thông điệp,mà chỉ dựa vào các header
field.Các bước cần thiết trong mô hình proxy để mang một cuộc gọi hai hướng.


Thiết lập phiên truyền thông trong SIP

- UAC gửi thông điệp INVITE đến Proxy Server
- Proxy Server sẽ xác định UAS sau đó sẽ chuyển tiếp thông điệp INVITE đến UAS
- UAS đang rung chuông phản hồi lại với thông điệp 180
- Sau khi xử lý xong thì UAS sẽ gửi thông điệp 200 với ý nghĩa là OK ( chấp nhận )
cuộc gọi
- UAC nhận được thông điệp 200 thì sẽ gửi thông điệp ACK để xác nhận được phản
hồi từ UAS
- Phiên truyền thông bắt đầu
- Sau đó , để kết thúc phiên truyền thông thì UA sẽ gửi thông điệp BYE và nếu UA
kia nhận được thì sẽ đồng ý và kết thúc phiên truyền thông
 Redirect Servers
Một redirect server là một máy chủ chuyển hướng thông điệp SIP và không chuyển
tiếp các yêu cầu.


Các bước của redirect server để mang đi một cuộc gọi 2 chiều

1.
2.
3.
4.

5.
6.

7.
8.

Redirect server chấp nhận INVITE yêu cầu từ UAC ( jz ) .
Redirect server liên hệ với Location server để lấy địa chỉ của UAS (salmon ) .
Location server trả về địa chỉ của UA đích.
Sau khi user được chỉ định, Redirect Server trả lại địa chỉ trực tiếp tới người gọi trong
một thông điệp 3xx , với danh sách có vị trí đầu tới đích mới. Không giống như proxy
server, redirect server không chuyển tiếp INVITE.
UAC gửi một ACK tới redirect server báo nhận phản hồi 3xx.
UAC gửi một yêu cầu INVITE trực tiếp tới địa chỉ trả lại bởi redirect.
UAS cung cấp một chỉ báo thành công(200 OK) tới UAC.
UAC gửi một ACK tới UAS báo đã nhận phản hồi 200 OK.Mô hình Redirect Server của
Operation.
 Registration Server
Một registration server ( máy chủ đăng ký ) được biết như là một registrar , chấp
nhận các yêu cầu của SIP REGISTER . Tất cả các yêu cầu nhận một phản hồi : 501 Not
Implemented .. Trong một yêu cầu đăng ký ,trường To header chứa tên của tài nguyên bắt
đầu đăng ký,và trường Contact header chứa địa chỉ khác . Registration server tạo ra một
liên kết tạm giữa Address Of Record (AOR) URI trong To và thiết bị URI trong Contact
Courier.
Registration server thường yêu cầu các User Agent đăng ký để xác thực,vì vậy các
cuộc gọi đi vào không bị chiếm đoạt bởi các user không được xác thực . Phụ thuộc vào sự


hiện diện của các trường REGISTER , yêu cầu có thể được sử dụng bởi một User Agent
để lấy lại một danh sách của các đăng ký hiện thời, làm sạch tất cả các đăng ký ,hoặc
thêm vào một đăng ký URI.
 Location server :
Cung cấp địa chỉ của các User Agent và địa chỉ của server đích


2.2.3 Thông điệp SIP
SIP messages có thể được phân chia thành hai loại đó là SIP yêu cầu và SIP phản
hồi,hơn nữa nó được xác định trong các phiên . Thông thường một địa chỉ SIP có dạng :
user@domain . User tên hoặc số điện thoại người dùng , domain tên miền hoặc địa chỉ IP.
Ví dụ : , v.v…
 SIP request ( yêu cầu )
Yêu cầu SIP là các thông điệp được gửi từ các máy client đến các server để hoạt
động một SIP . RFC 3261 xác định các yêu cầu SIP hoặc phương thức làm cho User
Agent và proxy có thể tới vị trí của các user và khởi đầu , sửa đổi các phiên .
-

-

-

-

-

INVITE : chỉ ra rằng các người nhân hoặc các dịch tham gia vào trong một phiên . Bạn
có thể sử dụng phương thức này để sửa đổi cấu thành của các phiên được thiết lập trước .
Thân của message INVITE phải bao gồm phần mô tả các phiên truyền được thiết lập
hoặc chỉnh sửa,mã hóa trên SDP . Với thông điệp INVITE ( phản hồi 200 OK) chỉ ra sự
sẵn sàng của các bên khi tham gia vào kết quả của một phiên truyền . Nó bắt đầu một
phiên .
ACK:xác nhận User Agent Client đã nhận được phản hồi cuối cùng đến một yêu cầu
INVITE. ACK được sử dụng chỉ với các yêu cầu INVITE . ACK gửi trả lại cho một phản
hồi 200 ( OK ) . Yêu cầu ACK có thể bao gồm một thông điệp với phần mô tả các phiên
cuối cùng nếu yêu cầu INVITE không chứa phần mô tả các phiên này

OPTION: User Agent sử dụng yêu cầu OPTION để truy vấn một User Agent Server về
khả năng của nó . Nếu User Agent Server có khả năng truyền các phiên tới các user,nó
đáp ứng khả năng thiết lập của User Agent Server.
BYE : sử dụng BYE để yêu kết thúc các phiên được thiết lập trước .
CANCEL: làm cho các User Agent Client và network server có thể hủy một yêu cầu tiến
trình bên trong,như INVITE . Điều này không ảnh hưởng đến việc hoàn thành các yêu
cầu mà User Agent Server đã gửi đi các phản hồi cuối cùng.
REGISTER : client sử dụng REGISTER để đăng ký với các thông tin tương ứng AOR
của người dùng và SIP servers.
PRACK:đảm bảo độ tin cậy tạm thời của các phản hồi lớp 1xx.
UPDATE:cập nhật tạm thời các phiên .


-

REFER:Chuyển giao cuộc gọi đến bên thứ ba sử dụng các thông tin liên quan được cung
cấp trong các yêu cầu .
SUBSCRIBE:báo cáo một sự kiện vừa diễn ra,ví dụ như cập nhật sự hiện của các user .
NOTIFY:sử dụng để thông báo sự kiện đã diễn ra.
MESSAGE:một phương thức để chỉ việc mang đi một thông điệp .
 SIP Respone:
Một server gửi SIP phản hồi tới một client để chỉ ra trạng thái của một SIP yêu cầu
mà client trước đó đã gửi tới server . User Agent Server hoặc proxy thì tạo ra các SIP
phản hồi đến một SIP yêu cầu mà User Agent Client khởi đầu . SIP phản hồi là các con
số từ 100 đến 699 . SIP phản hồi là một nhóm giống như 1xx,2xx đến 6xx . SIP phản hồi
được phân loại như phản hồi tạm thời và phản hồi cuối cùng .
Một phản hồi tạm thời chỉ ra tiến trình bởi server nhưng nó không chỉ ra các kết quả
cuối cùng giống như kết quả quá trình xử lý các SIP yêu cầu .
Phản hồi cuối cùng chỉ ra phần kết thúc và trạng thái cuối cùng của SIP yêu cầu.Tất
cả các lớp 2xx,3xx,4xx,5xx và 6xx đều là phản hồi cuối cùng


-

Lớp 1xx của SIP phản hồi chỉ ra trạng thái tạm thời . Lớp 1xx (Information) chỉ ra trạng
thái của các cuộc gọi trước khi hoàn thành.
Lớp 2xx (Success) chỉ ra quá trình xử lý thành công của SIP yêu cầu.
Lớp 3xx (Redirection) chỉ ra SIP yêu cầu cần phải gửi một lần nữa đến User Agent
Server khác để thực hiện tiến trình xử lý.
Lớp 4xx (Client-error) yêu cầu bị hỏng bởi client . Client có thể thực hiện lại yêu cầu.
Lớp 5xx (server failure) yêu cầu bị hỏng do server.Yêu cầu có thể thử lại tại các server
khác.
Lớp 6xx (Global failure) yêu cầu bị hỏng và không nên thử lại yêu cầu tại server này
hoặc server khác.
 SIP Message structure. ( cấu trúc thông điệp SIP )
Một thông điệp SIP gồm có các phần sau:
-

Một start-line.
Một hoặc nhiều header field.
Một dòng rỗng để chỉ ra kết thúc header field.
Một tùy chọn phần thân của thông điệp.

Start-line cho một SIP yêu cầu là một Request-line . Start-line cho một SIP phản hồi là
Status-line . Request-line chỉ rõ phương thức SIP . Request-URI và phiên bản của SIP .
Status-line thì mô tả phiên bản của SIP,mã của SIP phản hồi và một tùy chọn reason
phrase . Reason phrase là một nguyên văn mô tả của mã 3 ký từ SIP phản hồi.


Bảng thể hiện các thành phần của thông điệp yêu cầu SIP


Như ta thấy đây là 1 thông điệp yêu cầu vì star-line là request line bên cạnh đó có phiên
bản SIP là 2.0
Via : Xác định nơi cần gửi đi là ph1.company.com qua cổng 5060
From : nơi bắt đầu của yêu cầu SIP là Alice
To : người nhận là Bob và bên cạnh là địa chỉ
Call-ID : dãy serie của cuộc gọi
CSeq : Giá trị một số nguyên và tên phương thức
Contact : Nhận biết một SIP nơi mà User Agent nhận được yêu cầu SIP mới
Content-Length : bắt đầu độ dài của thân thông điệp

Bảng thể hiện cấu trúc của một SIP respone message

 SIP header .


×