Tải bản đầy đủ (.doc) (24 trang)

ĐỀ TÀI :XÂY DỰNG ỨNG DỤNG TRUYỀN ÂM THANH TRONG MẠNG LAN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (271.86 KB, 24 trang )

ĐẠI HỌC ĐÀ NẴNG

TRƯỜNG ĐẠI HỌC BÁCH KHOA

KHOA CÔNG NGHỆ THÔNG TIN

ĐỒ ÁN TỐT NGHIỆP
ĐỀ TÀI :
XÂY DỰNG ỨNG DỤNG TRUYỀN ÂM THANH TRONG MẠNG
LAN

SINH VIÊN : NGUYỄN TRUNG KHOA
LỚP
: 07T1
GVHD
: PGS.TS PHAN HUY KHÁNH

ĐÀ NẴNG 03/2012


MỤC LỤC
CHƯƠNG 1 :
CHƯƠNG 1......................................................................................................4
CƠ SỞ LÝ THUYẾT......................................................................................4
.I

Tổng quan về kỹ thuật VoIP và các yếu tố quan trọng đối với VoIP.........................4
.I.1. VoIP là gì?...........................................................................................................4
.I.1.1. Các lợi ích của VoIP........................................................................................5
.I.1.2. Các dịch vụ của VoIP......................................................................................5
.I.2. Các yếu tố quan trọng đối với VoIP....................................................................5


.I.2.1. Thời gian trễ (Time Delay)..............................................................................5
.I.2.2. Sự thay đổi thời điểm gói đến (Jitter)..............................................................6
.I.2.3. Điều chế xung theo mã PCM (Pulse Code Modulation).................................7
.I.2.4. Nén âm thanh...................................................................................................8
.I.2.5. Khoảng lặng.................................................................................................10
.I.2.6. Tiếng vọng (Echo).........................................................................................10
.I.2.7. Mất gói...........................................................................................................11
.I.2.8. Các giao thức vận chuyển..............................................................................11
.II Tìm hiểu giao thức SIP............................................................................................12
.II.1. Giới thiệu.........................................................................................................12
.II.1.1. Lược sử SIP..................................................................................................12
.II.1.2. Vai trò và vị trí của SIP trong VoIP.............................................................12
.II.1.3. Các ưu điểm của SIP....................................................................................14
.II.2. Các đặc điểm của giao thức SIP......................................................................15
.II.2.1. Thông điệp SIP (SIP messages)...................................................................15
.II.2.2. Các thành phần của giao thức SIP (SIP Elements)......................................17
.II.3. Cấu trúc của giao thức SIP...............................................................................18
.II.4. Các giao thức liên quan....................................................................................18
.II.4.1. Giao thức MGCP : ( Media Gateway Control Protocol – Giao thức điều
khiển cổng truyền thông ) .......................................................................................18
.II.4.2. Giao thức RTCP (Real-time Transport Control Protocol)..........................19
II.5 Hoạt động của VOIP sử dụng giao thức SIP..................................................20
[1] Voice over IP fundamentals, Jonathan Davison & James Perter, Cisco System....21
[2] Công nghệ mạng máy tính, TS Lê Thanh Dũng (dịch), NXB Bưu Điện, 6/2001. .22
[3] Trang web .......................................................................22
[4] Nguyễn Hồng Sơn. Kỹ thuật điện thoại qua IP và Internet. 2003..........................22
[5] Mạng máy tính và các hệ thống mở, Nguyễn Thúc Hải, NXB Giáo dục - 1999....22
[6] Meng-Chauug Peter Lee và Kwok-Cheong Thomas Pang. Session Initiation Protocol
User Agent Prototype. Simon Fraser University. 2001...................................................22
[7] Các tài liệu khác liên quan đến VoIP và giao thức SIP..........................................22

[8] VoIP Testing Tooks for Voice Data Network........................................................22


LỜI MỞ ĐẦU


Trong những năm gần đây, mạng máy tính ngày càng trở nên phổ biến. Việc
liên kết các máy tính trên môi trường mạng cũng như liên kết các mạng lại với nhau
đem lại cho chúng ta nhiều lợi ích trong công việc cũng như trong việc học tập
nghiên cứu, giải trí. Chúng ta có thể sử dụng các tài nguyên sẵn có được chia sẻ
như file server, printer, máy fax, ... môi trường mạng còn là một môi trường thông
tin nhanh chóng và tiện lợi nhờ vào các cơ chế truyền thông trên mạng như : e-mail,
www ...
Bên cạnh đó, tốc độ phát triển của máy tính PC cũng rất nhanh chóng. Các
kỹ thuật hiện đại đã giúp tạo ra các máy PC với tốc độ tính toán nhanh hơn, bộ nhớ
lớn hơn và khả năng xử lý của nó cũng ngày càng đa dạng hơn trong khi giá thành
ngày càng rẻ hơn. Một trong những khả năng ưu việt của máy PC hiện nay là hỗ trợ
multimedia. Các máy PC ngày nay giao tiếp với con người không chỉ bằng text mà
còn kết hợp tất cả các phương tiện khác như tiếng nói, hình ảnh.
Việc đưa kỹ thuật multimedia vào các ứng dụng truyền thông trên mạng giúp
chúng ta tạo ra nhiều ứng dụng phong phú hơn. Chẳng hạn hộp thư điện tử ngày
nay có thể không chỉ là văn bản mà còn bao gồm tiếng nói, hình ảnh. Các trang web
trở nên sinh động hơn hẳn khi kèm theo kỹ thuật multimedia. Bên cạnh đó, chúng ta
có thể thiết kế các ứng dụng tiện ích như Video conference, voice mail...
Thông qua chương trình này, người sử dụng có thể trao đổi thông tin với
nhau bằng tiếng nói. Chương trình này đã được hiện thực rất nhiều trong các lónh
vực thông tin như điện thoại, viễn thông, máy tính . . . Tuy nhiên nó chưa được áp
dụng và phát triển rọâng rãi như trên các lónh vực thông tin khác do sự hạn chế của
thiết bò. Ngày nay, khi công nghệ thông tin đã phát triển thì việc hiện thực chương
trình này là hoàn toàn có thể. Ứng dụng trong nhiều lónh vực khác nhau như :






•Việc dạy học từ xa.
•Việc chẩn đoán, chữa bệnh từ xa.
•Hội thảo, thảo luận theo nhóm.
•Công cụ trao đổi thông tin bằng hình ảnh và âm thanh.

Mục tiêu của đồ án tốt nghiệp là tìm hiểu các mô hình và công nghệ truyền âm thanh
trên mạng máy tính, trên cơ sở đó xây dựng ứng dụng truyền thông âm thanh thoại trên
mạng cục bộ. Đồ án sẽ xây dựng thử nghiệm một hệ thống cho phép trao đổi thông tin
bằng tiếng nói thoại, tương tác điểm – điểm trên mạng LAN.


CHƯƠNG 1
CƠ SỞ LÝ THUYẾT
.I
.I.1.

Tổng quan về kỹ thuật VoIP và các yếu tố quan trọng
đối với VoIP
VoIP là gì?

VoIP viết tắt bởi Voice over Internet Protocol, hay còn được gọi dưới các
tên khác như: Internet telephony, IP Telephony, Broadband telephony, Broadband
Phone và Voice over Broadband.
VoIP là 1 công nghệ cho phép truyền âm thanh thời gian thực qua băng
thông Internet và các kết nối IP. Trong đó tín hiệu âm thanh (voice signal) sẽ được

chuyển đổi thành các gói tệp ( data packets) thông qua môi trường mạng Internet trong
môi trường VoIP , sau lại được chuyển thành tín hiệu âm đến thiết bị người nhận.
VoIP sử dụng kỹ thuật số và yêu cầu kết nối băng thông tốc độ cao như
DSL hoặc cáp. Có rất nhiều nhà cung cấp khác nhau cung cấp VoIP và nhiều dịch vụ
khác. Ứng dụng chung nhất của VoIP cho sử dụng cá nhân hoặc gia đình là các dịch
vụ điện thoại dựa trên Internet có chuyển mạch điện thoại. Với ứng dụng này, bạn vẫn
cần có một số điện thoại, vẫn phải quay số để thực hiện cuộc gọi như sử dụng thông
thường.
VoIP dựa trên sự kết hợp của mạng chuyển mạch kênh và chuyển mạch gói
là mang IP. Mỗi loại mạng có những đặc điểm khác biệt nhau. Trong mạng chuyển
mạch kênh một kênh truyền dẫn dành riêng được thiết lập giữa 2 thiết bị đầu cuối
thông qua một hay nhiều nút chuyển mạch trung gian. Dòng thông tin trưyền trên
kênh này là dòng bit truyền liên tục theo thời gian. Băng thông của kênh dành riêng
đựoc đảm bảo và cố định trong quá trình liên lạc(64Kbps đối với mạng điện thoại
PSTN), và độ trễ thông tin là rất nhỏ chỉ cỡ thời gian truyền thông tin trên kênh. Khác
với mạng chuyển mạch kênh, mạng chuyển mạch gói sử dụng hệ thống lưu trữ rồi
truyền tại các nút mạng thông tin được chia làm các gói , mỗi gói được thêm các
thông tin điều khiểm cần thiết cho quá trình như là địa chỉ nơi gởi, địa chỉ nơi nhận….
Áp dụng VoIP có thể khai thác tính hiệu quả của các mạng truyền số liệu,
khai thác tính linh hoạt trong phát triển các ứng dụng mới của giao thức IP

4


.I.1.1.

Các lợi ích của VoIP

Giảm chi phí: Đây là ưu điểm nổi bật của điện thoại IP so với các dịch vụ điện
thoại khác. Đồng thời kỹ thuật nén thoại tiên tiến giảm tốc độ bit từ 64 kbps xuống

dưới 8 kbps.
Tích hợp mạng thoại, mạng số liệu và mạng báo hiệu : trong điện thoại IP 3
mạng trên có thể đi cùng trong mạng IP, điều này sẽ tiết kiệm chi phí đầu tư.
Quản lý băng thông: việc phân chia tài nguyên cho các cuộc thoại được
linh hoạt hơn. Khi cuộc thoại diễn ra nếu lưu lượng của mạng thấp băng thông
dành cho cuộc thoại sẽ cho chất lượng tốt nhất, nếu lưu lượng của mạng cao,
mạng sẽ hạn chế băng thông cho từng cuộc thoại ở mức duy trì chất lượng thoại
thấp để phục vụ nhiều người khác.
.I.1.2.

Các dịch vụ của VoIP

Giao tiếp thoại trực tiếp vẫn là một cách giao tiếp cơ bản của con người. Nhưng
với thu nhập hiện nay của người Việt Nam trung bình khoảng 1000USD/năm. Thì
việc đón nhận dịch vụ thoại như hiện nay là quá đắt. Nên khi công nghệ Voip ra đời
đã kéo theo nhiều dịch vụ đi theo nhằm đáp ứng nhu cầu con ngưòi phù hợp với thu
nhập của họ.
Điện thoại thông minh: Internet sẽ thay đổi điều này. Kể từ khi Internet được
triển khai, nó đã được sử dụng để tăng thêm tính thông minh cho mạng điện thoại toàn
cầu. Giữa mạng máy tính và mạng điện thoại tồn tại một mối liên hệ. Internet cung
cấp cách giám sát và điều khiển các cuộc thoại một cách tiện lợi hơn. Chúng ta có thể
thấy được khả năng kiểm soát và điều khiển các cuộc thoại thông qua mạng Internet.
Dịch vụ CallBack Web: "World Wide Web" đã làm cuộc cách mạng trong
cách giao dịch với khách hàng của các doanh nghiệp. Các nhà doanh nghiệp có thể
đưa thêm các phím bấn lên Web để liên lạc đến máy của họ.
Dịch vụ fax qua Call Center: Gateway call Center với công nghệ thoại qua
Internet cho phép các nhà kiểm duyệt trang Web với các PC trang bị multimedia kết
nối với bộ phận phân phối các cuộc gọi tự động (ACD). Một ưu điểm là kết hợp giữa
thoại và dữ liệu trong cùng một kênh.


.I.2.

Các yếu tố quan trọng đối với VoIP

.I.2.1.
Thời gian trễ (Time Delay)
Thời gian trễ là khoảng thời gian cần thiết để tiếng nói thoát ra khỏi
miệng người nói và đến được tai người nghe. Có 3 dạng trễ vốn có trong hệ thống
điện thoại ngày nay: trễ do lan truyền, trễ do nối tiếp hóa, trễ do xử lý.
Trễ lan truyền do tốc độ tín hiệu trong mạng các mạng truyền thông. Ánh sáng
chạy qua chân không với tốc độ 300.000 km/s, và các điện tử di chuyển trong cáp
5


đồng xấp xỉ 200.000 km/s. Một mạng cáp kéo dài liên tục qua nửa vòng trái đất một
chiều có trễ lan truyền khoảng 70ms. Lượng trễ này không đáng kể nhưng nếu cộng
thêm trễ xử lý có thể làm chất lượng thoại không đảm bảo đến mức không chấp nhận
được.
Trễ xử lý liên quan đến nhiều yếu tố, có thể do việc xử lý, việc truy cập đường
truyền, hoặc do định tuyến trên mạng như là: quá trình đóng gói, nén gói tin, chuyển
mạch…gây ra bởi các thiết bị chuyển tiếp qua mạng. Các trễ xử lý có thể ít tác động
đến các mạng điện thoại truyền thống nhưng nó trở nên là vấn đề lớn trong các mạng
chuyển mạch gói. Khi các gói được giữ trong một hàng đợi vì nghẽn trên giao tiếp ngõ
ra, từ đó dẫn đến trễ xếp hàng. Có một số hệ điều hành giải quyết rất tốt việc di
chuyển và xác định đích của gói. Chúng ta nên giữ giá trị trễ này nhỏ hơn 10ms bất cứ
khi nào có thể bằng các giải thuật xếp hàng tối ưu.
Chất lượng vệ tinh
Chất lượng cao
0


100

Fax Relay, Broadcast
200

300

400

500

600

700

800

Hình 1 – Thời gian trễ của một số truyền dẫn.
Một vài loại trễ là dài nhưng có thể chấp nhận được bởi không có sự lựa chọn
nào khác. Trong truyền dẫn vệ tinh, phải mất đến gần 250 ms để hoạt động truyền đến
được vệ tinh, và cần 250 ms để quay về mặt đất. Điều này làm tổng trễ lên đến trên
500 ms. Mặc dù như vậy là vượt quá cho phép nhưng vẫn có nhiều cuộc đàm thoại
diễn ra hằng ngày qua vệ tinh. Trong một mạng không quản lý được nghẽn, trễ hàng
đợi có thể lên đến 2s, kết quả là mất gói. Khoảng thời gian này là không thể chấp nhận
được trong bất kỳ mạng điện thoại nào. Một yếu tố khác cũng ảnh hưởng đến tổng
thời gian trễ là jitter.
.I.2.2.

Sự thay đổi thời điểm gói đến (Jitter)


Phát biểu đơn giản của jitter là sự thay đổi khoảng thời gian giữa các gói. Jitter
là vấn đề chỉ tồn tại trong mạng chuyển mạch gói. Người gởi mong đợi truyền các gói
thoại một cách tin cậy vào một khoảng thời gian không đổi, ví dụ một khung tin sau
mỗi 20 ms. Các gói thoại này có thể trì hoãn và không đến đích vào các thời điểm
cách đều nhau như đã gởi đi. Độ lệch giữa thời điểm mong đợi và thời điểm nhận
được gói thực sự là jitter.

6


A

B

C

A
D1

Sender

B
D2=D1

C

Recipient

D3≠D2


Hình 2 – Sự thay đổi thời điểm gói đến
Hình vẽ cho thấy rằng thời gian cần để gởi gói A và B là bằng nhau (D1=D2).
Gói C nhận được vào thời điểm trễ hơn so với dự định. Đây là lý do tồn tại bộ đệm
jitter, bộ đệm này che đi sự thay đổi thời gian trễ giữa các gói.
Cần lưu ý là jitter và trễ không phải là một, cho dù có nhiều jitter sẽ làm tăng
tổng thời gian trễ trong mạng. Bởi vì càng có nhiều jitter thì cần có nhiều bộ đệm jitter
để bù vào các khoảng thay đổi thời gian giữa các gói.
Nếu mạng được quản lý tốt thì jitter trong mạng không phải là trở ngại lớn và
bộ đệm jitter sẽ không làm tăng đáng kể tổng trễ. Bộ đệm jitter đôi khi còn được gọi là
hàng đợi động (dynamic queue). Hàng đợi có thể tăng lên hay giảm xuống theo hàm
mũ tùy vào thời gian giữa các gói. Mặc dù bộ đệm tĩnh vẫn được dùng, nhưng bộ đệm
jitter động là tốt nhất. Các bộ đệm jitter tĩnh thì sẽ quá lớn và quá nhỏ, từ đó khiến cho
chất lượng thoại giảm sút bởi nhiều gói bị mất hay thời gian trễ quá mức. Bộ đệm
động sẽ tăng hay giảm dựa vào sự thay đổi của vài gói sau cùng.
.I.2.3.
Điều chế xung theo mã PCM (Pulse Code Modulation)
Mặc dù truyền thông tín hiệu analog là lý tưởng cho thông tin con người,
nhưng truyền dẫn analog không bền vững và khó khôi phục lại thông tin từ đường dây
bị nhiễu. Trong mạng điện thoại thế hệ đầu, khi truyền dẫn analog được chuyển qua
các bộ khuếch đại để bơm tín hiệu lên, không chỉ có tiếng nói được phóng to lên mà
các tín hiệu nhiễu cũng được khuếch đại lên và làm ảnh hưởng đến cuộc gọi.
Đối với các mẫu digital, với các bit 0 và 1, việc kiểm soát lỗi và khôi phục tín
hiệu rất dễ dàng. Do đó, các tín hiệu analog được tái tạo từ các mẫu digital vẫn giữ
nguyên chất lượng trung thực. Điều này dẫn đến sự ra đời các kỹ thuật số hóa. Như đã
biết tiếng nói có tần số nằm trong dải âm tần nhỏ hơn 4kHz. Để chuyển đổi các tín
hiệu này sang dạng số, theo lý thuyết lấy mẫu của Nyquist thì biên độ của tín hiệu
phải được lấy mẫu là 8000 lần trong một giây.

7



Xung
lấy mẫu
Tín hiệu
thoại analog

Tín hiệu được
điều chế biên
độ xung PAM

Mạch lấy mẫu

Tín hiệu điều
chế xung theo
mã PCM

Lượng tử hóa
và nén/giải nén

Tín hiệu thoại
được số hóa

Hình 3 – Sơ đồ điều chế xung theo mã
Tín hiệu lấy mẫu trước hết được chuyển sang một dòng xung, biên độ mỗi
xung bằng với biên độ của tín hiệu analog tại thời điểm lấy mẫu. Các tín hiệu này
được gọi là tín hiệu được điều chế biên độ xung PAM (Pulse Amplitude Modulation).
Tín hiệu PAM vẫn còn là analog, chúng sẽ được chuyển sang dạng số hoàn toàn bằng
cách lượng tử hóa các tín hiệu PAM, trong đó có một bit chỉ dấu của tín hiệu (âm và
dương). Điều này có nghĩa là có 256 mức khác nhau được dùng. Tín hiệu sau cùng
được gọi là tín hiệu điều chế theo xung mã PCM và có tốc độ 64kbps (8000 mẫu/giây,

mỗi mẫu 8 bit), đây là tốc độ có sẵn của các kênh số (digital channel).
.I.2.4.

Nén âm thanh

Hai dạng cơ bản của nén 64kbps PCM được dùng phổ biến là a-law và µ-law.
Các phương pháp giống nhau trong đó cả hai đều dùng nén logarit để đạt được 12 đến
13 bit chất lượng PCM tuyến tính theo 8 bit, nhưng chúng khác nhau ở một số chi tiết
nhỏ. Hiện tại các nước vùng Bắc Mỹ dùng µ-law, các nước Châu Âu dùng a-law.
Một số tiêu chuẩn do Hiệp hội viễn thông quốc tế ITU (International Telecom
munication Union) cung cấp phổ biến nhất cho điện thoại và điện thoại số bao gồm
các chuẩn bắt đầu với ký tự G.
Chuẩn nén âm thanh G711
Chuẩn G.711 là một chuẩn nén âm thanh được sử dụng rộng rãi cho các hội
nghị âm thanh. Chuẩn này mô tả phương pháp mã hoá và giải mã âm thanh với tốc độ
64kbps. Mỗi mẫu âm thanh là một số nhị phân có tám bit được sử dụng cho phạm vi
toàn cầu. ITU đưa ra hai quy luật mã hóa là mã hóa theo quy luật a và mã hóa theo
quy luật µ. Khi sử dụng luật mã hóa µ trong mạng truyền thông thì việc chặn tất cả
các tín hiệu ký tự 0 là yêu cầu nhất thiết. Giá trị lượng tử hóa là kết quả của luật mã
hóa. Bất cứ sự chuyển đổi cần thiết giữa các quốc gia đều sử dụng quy luật µ.
Khi tín hiệu ký tự được truyền tuần tự trong một tầng vật lý, bit số 1 (bit dấu)
được truyền trước tiên và bit số 8 (bit ít có ý nghĩa nhất) được truyền cuối cùng.
Chuẩn nén âm thanh G723
Chuẩn G.723 giới thiệu một bộ nén có thể dùng để nén tín hiệu thoại hoặc
những tín hiệu âm thanh khác của các dịch vụ đa phương tiện ở tốc độ bit rất thấp.
Trong thiết kế của chuẩn này, nguyên lý ứng dụng làm việc ở tốc độ truyền bit rất
8


nhỏ. Bộ mã hóa này được tích hợp hai tốc độ khác nhau: 5.3 và 6.3kbps. Cả hai tốc độ

đều hỗ trợ bởi bộ mã hóa và giải mã. Chúng có thể chuyển đổi qua lại tại bất kì khung
truyền (30 ms) nào. Với tốc độ 6.3 kbps chất lượng âm thanh tốt hơn. Bộ mã hóa này
nén thoại với chất lượng cao ở cả hai tốc độ nhưng ít sử dụng kỹ thuật phức tạp. Các
tín hiệu âm thanh khác sau khi được nén cho âm thanh có chất lượng không thực lắm.
Về độ trễ, bộ mã hóa này mã hóa tín hiệu thoại và những tín hiệu âm thanh khác bằng
những khung 30 ms, thêm độ trễ của phần chuyển đổi giữa các khung 7.5 ms, thời
gian trễ tổng cộng là 37.5 ms.
Chuẩn nén âm thanh G729
Chuẩn nén âm thanh G729 là chuẩn nén mới nhất được ITU đưa ra. Những đặc
điểm của chuẩn : chuẩn này sử dụng thuật toán mã hoá 8 kbps. Một trong những
chuẩn dùng cho mọi ứng dụng bao gồm cả không dây. Các chuẩn cùng được phát triển
với chuẩn này là G729A, G729D, G729E. Các ưu điểm của chuẩn G729:
Chất lượng của dịch vụ : bởi vì độ trễ của chuẩn này là 10 ms, nên nó được
dùng trong truyền âm thanh. Chất lượng của âm thanh không phụ thuộc vào khoảng
cách giữa các máy điện thoại.
Tính tương thích : Bởi vì nâng cấp mạng để tăng khả năng băng thông là rất tốn
kém. Do vậy các nhà cung cấp sẽ sử dụng những chuẩn chung để tương thích với
những nhà phát triển khác.
Tính kinh tế : các công ty muốn tăng khả năng truyền âm thanh, dữ liệu, nâng
cao chất lượng và giảm giá thành nên áp dụng chuẩn này.
Ngoài ra còn các chuẩn khác như G.726, G.728…
Điểm đánh giá bình quân
Có thể kiểm thử chất lượng tiếng nói theo hai cách: chủ quan do con người
thực hiện hoặc khách quan do máy tính thực hiện.
Các loại mã được phát triển và hiệu chỉnh dựa vào các đo lường chất lượng
tiếng nói một cách chủ quan. Các đo lường khách quan chuẩn, như tổng méo của sóng
hài và tỉ số tín hiệu trên nhiễu SNR (signal to noise ratio) không phù hợp với cảm
nhận của con người. Cảm nhận của con người mới chính là mục tiêu của hầu hết các
kỹ thuật nén tiếng nói. Một thông số chủ quan được dùng để xác định chất lượng là
điểm đánh giá bình quân MOS (mean opinion score). MOS test cung cấp cho một

nhóm người nghe. Người nghe cho mỗi mẫu một điểm theo thang điểm từ 1 (xấu) đến
5 (rất tốt). Điểm đánh giá MOS cho một số chuẩn của ITU được liệt kê trong bảng sau

9


Bảng 1 – Điểm đánh giá MOS một số codec của ITU
Phương pháp nén

Tốc độ bit (Kbps)

Kích thước mẫu (ms)

G711

64

0.125

4.1

G723

6.3

30

3.9

G726


32

0.125

3.85

G729

8

10

3.92

.I.2.5.

Điểm MOS

Khoảng lặng

Trong các mạng PSTN ngày nay, một kênh song công 64Kbps được thiết lập
giữa người nghe và người nói. Một cuộc gọi thông thường có đến 50% tổng băng
thông bị lãng phí. Lượng băng thông lãng phí trong thực tế có thể nhiều hơn nếu ta
tiến hành lấy mẫu thống kê các khoảng lặng và tạm dừng trong các mẫu tiếng nói hội
thoại của con người. Khi dùng VoIP ta có thể sử dụng phần băng thông lãng phí này
cho các mục đích khác khi dùng sự phát hiện hoạt động thoại VAD (Voice Activity
Detection). VAD làm việc trên cơ sở phát hiện độ lớn tiếng nói theo decibel (dB) và
quyết định khi nào thì cắt bỏ tiếng nói ra khỏi hoạt động đóng khung tin.
Thông thường khi VAD phát hiện một sự suy giảm biên độ của tiếng nó, nó đợi

một khoảng thời gian cố định trước khi dừng việc cài đặt khung tin âm thanh vào các
gói. Khoảng thời gian cố định này được gọi là hangover thường là 200ms. Tuy nhiên
VAD cũng gặp khó khăn trong việc xác định khi tiếng nói bắt đầu và kết thúc, trong
việc phân biệt tiếng nói với nhiễu nền. Nếu chúng ta ở trong một căn phòng ồn ào thì
VAD không thể phân biệt đâu là tiếng nói đâu là tạp âm. Điều này còn được gọi là
SNR. Trong trường hợp này, VAD tự cấm ngay từ khi bắt đầu cuộc gọi. VAD cũng
không phát hiện được khi nào bắt đầu của tiếng nói. Bắt đầu của câu nói đầu tiên
thường bị xén gọi là front-end speech clipping. Bình thường người nghe không chú ý
đến khoảng bị xén này.
.I.2.6.

Tiếng vọng (Echo)

Echo trong cuộc đàm thoại là một hiện tượng có thể gây phiền phức không thể
chịu được. Trong mạng điện thoại truyền thống, echo thông thường bị gây ra bởi sự
không phù hợp trở kháng từ sự chuyển mạng bốn dây sang vòng cục bộ hai dây. Echo
trong mạng PSTN được kiểm soát bởi các bộ triệt echo và kiểm soát chặt chẽ sự
không phù hợp trở kháng tại các điểm phản hồi.
Echo có hai điều gây trở ngại: lớn và kéo dài. Echo càng lớn và càng kéo dài
thì làm cho người tham gia đàm thoại càng khó chịu. Các mạng điện thoại dùng tín
hiệu analog, người ta sử dụng các bộ triệt echo, các thiết bị này loại bỏ echo bằng
cách tăng trở kháng trên một mạch. Đây không phải là cách để loại bỏ echo tốt nhất và
10


thực tế đã gây ra trở ngại khác. Ví dụ chúng ta không thể dùng mạng số liên kết đa
dịch vụ ISDN (Integrated Services Digital Network) trên một đường dây có bộ triệt
echo vì nó sẽ cắt bỏ dải tần mà ISDN dùng.
.I.2.7.
Mất gói

Sự mất gói trong mạng số liệu là phổ biến.
Nguyên nhân mất gói tin:
Do lỗi truyền dẫn, khuôn dạng gói không được định nghĩa/checksum kiểm tra
hỏng gói sẽ bị loại bỏ.
Do tắc nghẽn (mạng quá tải). Tắc nghẽn ngõ vào khi router không xử lý các gói
đủ nhanh, tắc nghẽn ngõ ra khi kết nối ngõ ra quá bận rộn.
Do gói trải qua một thời gian trễ quá lớn trên mạng và đến quá trễ.
Các phương pháp hiệu chỉnh mất gói:
Khôi phục các gói bị mất dựa vào bên phát
Khôi phục gói bị mất dựa vào bên nhận
Sự mất gói trong mạng số liệu còn được lợi dụng, nhiều giao thức sử dụng số
liệu sự mất gói để nhận biết được điều kiện mạng và có thể giảm số gói đang gởi đi.
.I.2.8.

Các giao thức vận chuyển

Có hai loại giao thức vận chuyển quan trọng nhất trong hệ thống mạng IP là:
TCP (Transmission Control Protocol) và UDP (User Datagram Protocol).
Giao thức TCP: Về chức năng TCP tương đương với lớp giao thức đầy đủ nhất
của giao thức chuẩn Transport trong mô hình OSI (Open Systems Interconnection).
TCP sử dụng phương thức trao đổi các dòng dữ liệu (data stream) giữa người sử
dụng. Giao thức TCP đảm bảo độ tin cậy giữa nơi gởi và nơi nhận. Dòng dữ liệu có
chiều dài tùy ý được phân thành những đoạn không vượt quá 64 KB.
Giao thức UDP: cho phép người sử dụng gởi bản tin mà không cần thiết lập
liên kết, do đó không đảm bảo việc giao nhận chính xác hoặc thứ tự bản tin. Giao thức
này dùng cho dịch vụ không tin cậy. Thực tế trong các mạng 99% bản tin UDP được
giao nhận đúng đích. Do chức năng đơn giản nên UDP hoạt động nhanh hơn TCP.
Các ứng dụng VoIP trong thực tế thường lựa chọn giao thức UDP. Vì các ứng
dụng đòi hỏi thời gian thực, hỏi đáp mong muốn trả lời trong thời gian nhanh nhất,
việc truyền thông âm thanh và hình ảnh có thể chấp nhận một vài gói dữ liệu bị hỏng

hoặc thất lạc. VoIP chạy bên trên giao thức thời gian thực RTP (Realtime Transport
Protocol), RTP hoạt động trên UDP trong mạng IP nên thường được gọi chung
RTP/UDP/IP.

11


.II Tìm hiểu giao thức SIP
.II.1. Giới thiệu
Giao thức SIP (Session Initiation Protocol) là một giao thức điều khiển ở tầng
ứng dụng có thể khởi tạo, thay đổi và kết thúc một phiên truyền thông đa phương tiện
như là VoIP. SIP còn có thể “mời” nhiều thành phần tham gia vào phiên đã có như là
các hội thảo multicast. Các phương tiện có thể thêm vào hoặc loại bỏ khỏi phiên đang
tồn tại. SIP hỗ trợ dịch vụ ánh xạ tên và định hướng ngược lại một cách trong suốt mà
người sử dụng có thể bảo quản một định danh hiển thị bên ngoài mà không cần quan
tâm đến là họ có hiểu biết về mạng hay không.
SIP hỗ trợ năm vấn đề thiết lập và kết thúc truyền thông đa phương tiện
o Vị trí người sử dụng: xác định hệ thống cuối sử dụng cho truyền thông, các user
có thể di chuyển đến các vị trí khác nhau và truy cập vào hệ thống từ xa. Điều này
tương tự các dịch vụ được cung cấp bởi RAS trong H.323.
o Sự sẵn sàng của người sử dụng: xác định sự sẵn sàng của bên nhận tham gia vào
truyền thông.
o Năng lực người sử dụng: xác định phương tiện và các thông số để sử dụng SIP
dùng giao thức SDP để thống nhất tham số truyền thông.
o Thiết lập phiên: “gọi”, thiết lập các thông số phiên gọi ở cả bên gọi và bên nhận
theo báo hiệu trực tiếp hay thông qua proxy server.
o Quản lý phiên gọi: bao gồm chuyển và kết thúc phiên, thay đổi các thông số phiên
và gọi các dịch vụ.
.II.1.1. Lược sử SIP
Giao thức SIP (Secssion Initiation Protocol ) Là giao thức khởi tạo

phiên, là giao thức tín hiệu thoại IP dùng để khởi tạo, duy trì và kết thúc cuộc gọi
VoIP, SIP được phát triển bởi IETF và ban đầu được ban hành trong tài liệu RFC
3261.
SIP là giao thức cần thiết để thiết lập và duy trì một cuộc điện thoại .
Giao thức này gần giống như HTTP, nó dạng văn bản , rất công khai và linh hoạt ,
cùng với những ưu điểm của nó , SIP đã dần thay thế được H323 và chiếm lĩnh gần
như toàn bộ thế giới VoIP.
.II.1.2.

Vai trò và vị trí của SIP trong VoIP

Hai thành phần quan trọng trong ứng dụng điện thoại Internet đó là quá trình
điều khiển cuộc gọi và truyền âm thanh ở dạng gói. Ngày nay, nhiều giao thức mở
được phát triển để giải quyết cả hai vấn đề này tập hợp lại thành VoIP stack.

12


signaling

quality of service
media transport

MGCP/Megaco
SDP
SIP

H323

RTP


tra
ns
po
rt
ne
tw
or
k
lin
k
ph
ysi
ca
l

RTSP

reservation measurement Media encaps appli
H261, MPEG… catio
RTCP
RSVP
n

TCP

daem
on

UDP


IPv4, IPv6
PPP
Sonet

AAL3/4

AAL5
ATM

ke
rn
el

PPP
Ethernet

V.34

Hình 4 – VoIP stack
Các giao thức điều khiển cuộc gọi phổ biến được chia thành hai nhóm:

o Nhóm điều khiển cổng truyền thông: bao gồm SGCP, IDCP, MGCP (Media
Gateway Control Protocol), MEGACO (Media Gateway Control)
o Nhóm báo hiệu điểm-điểm: H. 323 và SIP.
H.323 được triển khai bởi ITU, và được kết hợp với nhiều giao thức khác nhau
tương ứng với mỗi giai đoạn của quá trình báo hiệu. Vì thế, các tiêu chuẩn của giao
thức này trở nên cồng kềnh, phức tạp và khó để phát triển và mở rộng trong tương lai.
SIP được IETF phát triển sau và chưa được chuẩn hóa tuy nhiên nó vẫn được
chú ý. Hiện tại SIP đã được 3GPP (Third Generation Partnership Project) và nhiều

nhà cung cấp chấp nhận. Yếu tố chính của sự thuận lợi là từ đặc điểm cơ bản: Ngay từ
ban đầu SIP được định hình để có thể mở rộng nhưng vẫn giữ lại tính đơn giản. Giao
thức này hỗ trợ dạng text UTF-8, được kế thừa từ hai giao thức Internet khác là HTTP
(Hypertext Transfer Protocol) và SMTP (Simple Mail Transfer Protocol), đem lại
nhiều thuận lợi và nâng cấp các khả năng tuyệt vời mà Internet mang lại.
13


SIP không phải là hệ thống truyền thông hợp nhất. SIP chỉ là một thành phần
có thể được sử dụng với các giao thức khác của IETF để tạo nên một kiến trúc đa
phương tiện hoàn chỉnh, như là giao thức RTP truyền các dữ liệu thời gian thực và
cung cấp các phản hồi QoS (Quality of Services), giao thức RTSP điều khiển việc
phân phát các dòng truyền thông, giao thức MEGACO điều khiển các gateway đến
mạng PSTN, và giao thức SDP mô tả các phiên truyền đa phương tiện. Vì thế, SIP
được kết hợp với các giao thức khác để cung cấp các dịch vụ hoàn thiện đến người sử
dụng. Tuy nhiên, các chức năng và hoạt động chính của SIP không bị phụ thuộc vào
các giao thức khác.
SIP không cung cấp dịch vụ. Đúng hơn, SIP cung cấp các cơ sở để có thể thực
hiện nhiều dịch vụ khác nhau. Ví dụ, SIP có thể xác định vị trí người sử dụng và gởi
một đối tượng dễ nhận biết đến vị trí hiện tại của anh ta. Nếu điều này được sử dụng
thì các điếm cuối có thể thỏa thuận về các thông số của phiên. Còn nếu nó được sử
dụng để gởi một hình ảnh của người gọi cũng như là các mô tả của phiên, dịch vụ
“caller ID” có thể dễ dàng được thực hiện. Như ví dụ này cho thấy, một điều cơ bản
thường được sử dụng cho nhiều dịch vụ khác nhau.
SIP không cung cấp các dịch vụ điền khiển hội nghị như điều khiển cuộc họp
hoặc biểu quyết và không quy định hội nghị được điều khiển như thế nào. SIP có thể
được dùng để khởi tạo một phiên sử dụng các giao thức điều khiển hội nghị khác. Một
khi SIP truyền thông điệp và phiên mà chúng tạo ra có thể xuyên qua các mạng khác
nhau, SIP không thể cung cấp bất kỳ khả năng dành riêng tài nguyên mạng.
SIP cung cấp một bộ các dịch vụ bảo mật, bao gồm bảo vệ, xác thực (cả user

với proxy và ngược lại), các dịch vụ bảo vệ toàn diện và mã hóa.
SIP làm việc với cả IPv4 và IPv6.
Vì thế giao thức SIP có thể ứng dụng cho nhiều hệ thống từ lớn đến nhỏ. Mặc
dù việc so sánh giữa SIP và H.323 phải xét đến từng trường hợp cụ thể và chúng ta
cũng không thể rút ra kết luận ngay được nhưng có thể dự đoán rằng SIP sẽ là giao
thức dành cho sự phát triển của thế hệ mạng trong tương lai. Chúng ta sẽ so sánh SIP
và H323 cụ thể trong phần sau.
.II.1.3.

Các ưu điểm của SIP

Đơn giản: giao thức SIP nhỏ và đơn giản nhất trong VoIP stack. SIP được xem
như là một công cụ đơn giản cho phép các đầu cuối thông minh, các gateway, các xử
lý và các client xây dựng nên và thực hiện.
Khả năng mở rộng: kiến trúc điểm – điểm (peer-to-peer) cho phép sự mở rộng
với chi phí không cao. So sánh với các giao thức khác, yêu cầu phần cứng và phần
mềm khi thêm một thành viên vào hệ thống giảm một cách đáng kể.
Sự phân tán chức năng: SIP cho phép nhiều chức năng trong mỗi thành phần.
Thay đổi trên một thành phần riêng biệt ít ảnh hưởng đến phần còn lại của hệ thống.
14


.II.2. Các đặc điểm của giao thức SIP
.II.2.1.

Thông điệp SIP (SIP messages)

Các thành phần tham gia vào một hệ thống dựa trên SIP sẽ báo hiệu cho nhau
bằng trao đổi các thông điệp SIP. Đây là tư tưởng cơ bản và dễ thấy nhất của giao
thức SIP. Bằng cách phân tích cấu trúc các thông điệp, chúng ta có thể quản lý các

cuộc gọi dễ dàng. Các thông điệp SIP là các thông điệp dựa trên text có cấu trúc
chung gồm 3 phần: request line, header, body. Mô tả ở hình 5.
Phần request line gồm các thành phần: phương thức yêu cầu, địa chỉ nguồn
URI (universal resource identifier) yêu cầu thiết lập phiên, phiên bản SIP.
Phần header gồm một hoặc nhiều header của các giao thức chỉ định như TCP
hoặc UDP, địa chỉ của nơi gởi, chiều dài của phần body.Một dòng trống theo sau là
phần body có thể tùy chọn chứa nội dung gởi. Phần thân của message chứa gói tin
SDP mô tả chi tiết phiên truyền thông
Request line
Message header

Method

Request URI

SIP Version

Header Fields

Empty line
Message body

Body Fields

Hình 5 – Cấu trúc một thông điệp SIP
SIP có 6 phương thức chính cho việc quản lý một phiên cơ bản:
INVITE: Đây là phương thức được gởi đi để khởi động báo hiệu cuộc gọi. Yêu
cầu được sử dụng để mời 1 user kết nối cuộc gọi. Thông điệp này chứa thông tin c bản
như định danh người gọiđịnh danh người được gọi….
ACK: Một phiên SIP ơn giản bắt đầu từ phương thức INVITE. Khi người được

gọi xác nhận rằng đã nhận được lời gọi INVITE, sẽ có một thông điệp trả lời với
phương thức ACK. Thông điệp này chứa đặc tả SDP về các thông số để thiết lập phiên
truyền thông.
BYE: Kết thúc cuộc gọi giữa
REGISTER: Cung cấp sự ánh xạ phân giải địa chỉ. Ví dụ để server biết vị trí
của người sử dụng khác.
CANCEL: Kết thúc một yêu cầu sắp xãy ra nhưng không kết thúc cuộc gọi.
15


INFO: Được sử dụng để mang thông tin giữa cuộc gọi. INFO không được dùng
để thay đổi trạng thái của một cuộc gọi đã ổn định.
Có hai loại thông điệp SIP: yêu cầu và đáp ứng, tương ứng với thông điệp UAC
(User Agent Client) gởi đến UAS (User Agent Server) và thông điệp UAS trả lời
UAC. Hai thông điệp này hoàn toàn khác nhau. Thông điệp yêu cầu được gởi để
thông tin cho thành phần nhận thực hiện các tác vụ cụ thể, thông điệp đáp ứng được
gởi trả để báo cáo về kết quả thực hiện các tác vụ đó.
Về cấu trúc hai thông điệp khác nhau ở dòng bắt đầu. Thông điệp yêu cầu cho
biết phương thức và URI mà yêu cầu được gởi đến. Thông điệp đáp ứng có dòng bắt
đầu chứa mã trả lời mà không có URI vì nó chỉ cần trả lại đúng địa chỉ của yêu cầu.
Các mã trả lời thông dụng nhất:
100 Trying. Yêu cầu đã được nhận tại một server ở chặng kế tiếp. Mã này được
trả về từ một proxy server hoặc server trung gian khác trên đường báo hiệu cuộc gọi.
180 Ringing.
181 Call Forwarding. Nếu một proxy server trả về mã này, cũng có thể nhận
diện nơi mà nó đang chuyển cuộc gọi trong phần thân của thông điệp này.
182 Queued for Service. Các ứng dụng có thể trì hoãn trả lời cuộc gọi cho đến
khi nó đã phục vụ các cuộc gọi đang xếp hàng.
183 Session Progress.
200 OK. Yêu cầu được thực thi thành công.

400 Bad request. Lỗi cú pháp thông điệp.
401 User yêu cầu xác thực trước khi thực hiện yêu cầu này.
403 Forbidden. Nhận được khi cố gắng gọi một số không được chấp nhận từ
thuê bao của chúng ta.
404 Không tìm thấy user.
408 Request time-out
500 Lỗi server.
600 Busy
603 Decline
604 Does not exist
Phần đầu header mang các thông tin cần thiết cho chuyển tiếp thông điệp cũng
như để xử lý thông điệp. Phần header chỉ hoặc xuất hiện ở thông điệp yêu cầu hoặc
yêu cầu đáp ứng.

16


Phần thân body của thông điệp có thể có hoặc không. Khi thông điệp có phần
thân thì phần này sẽ được mô tả trong phần header trường Content-Type. Phần thân
có ý nghĩa khác nhau phụ thuộc vào kiểu của nó. Với những ứng dụng khác nhau của
SIP, phần thân sẽ được xử lý khác nhau. Ví dụ, phần thân có thể chứa hình ảnh của
thành phần tham gia trong phiên hoặc các thông tin cần thiết của phiên.
Thông thường, trong quá trình xử lý thiết lập phiên, các thành phần có liên
quan sẽ trao đổi thông tin của phiên trong phần thân của thông điệp SIP. Các thông tin
này thường được mô tả bằng thông điệp SDP.
.II.2.2.

Các thành phần của giao thức SIP (SIP Elements)

Các thành phần chính tham gia vào hệ thống dựa trên SIP bao gồm hai loại:

Thành phần truy xuất mạng hay các thiết bị điểm cuối: đó là những thành phần
tương tác trực tiếp với người sử dụng để thiết lập các cuộc gọi, hay tương tác với
server cung cấp nội dung. Thành phần này thường được gọi là UA (User Agents)
Thành phần nhân của mạng SIP: đó là những thành phần trung gian tham gia
vào quá trình chuyển tiếp các thông điệp. Có ba loại là: proxy server, registration
server (registrar) và redirect server.
UA có thể là một ứng dụng PC (softphone) hoặc các thiết bị nhúng (SIP
phone). Các UA đóng 2 vai trò logic: khi nhận yêu cầu và gởi trả đáp ứng chúng có
vai trò như UAS, còn khi tạo các yêu cầu để gởi đi và khi xử lý các đáp ứng nhận
được thì như là UAC.
Proxy server là các thành phần chuyển các thông điệp SIP trực tiếp. Proxy
server thực hiện công việc này dựa trên một cơ sở dữ liệu được gọi là dịch vụ xác định
vị trí. Cơ sở dữ liệu này kết hợp với các địa chỉ host cụ thể mà người sử dụng đang
đăng nhập. Cơ sở dữ liệu này được xây dựng bởi registrar nhờ quá trình đăng ký.
Quá trình đăng ký được thực hiện bởi yêu cầu REGISTER. Khi UA muốn đăng
ký địa chỉ SIP của nó với registrar, nó tạo ra một yêu cầu REGISTER và gởi đến
registrar. Registrar nhận và xử lý yêu cầu, lưu các thông tin vào cơ sở dữ liệu gồm địa
chỉ SIP và địa chỉ host. Một người sử dụng có thể đăng nhập trên nhiều host. Các UA
sẽ cập nhật thông tin một cách định kỳ bằng cách gởi lại yêu cầu REGISTER. Nếu sau
các khoảng thời gian cụ thể, registrar không nhận được bất kỳ yêu cầu REGISTER
nào, nó sẽ xóa các mục tương ứng từ dịch vụ xác định vị trí.
Khi một hệ thống dựa trên SIP được mở rộng, nó sẽ cần sử dụng các redirect
server. Các chức năng của redirect server có thể được mô tả chung là redirect server
chỉ nhận các yêu cầu, tìm kiếm dịch vụ vị trí để tạo ra đáp ứng 3xx và gởi đáp ứng này
trở về nơi yêu cầu ban đầu. Nơi có yêu cầu sẽ gởi lại yêu cầu theo địa chỉ mới có chứa
trong thông điệp đáp ứng 3xx.

17



.II.3. Cấu trúc của giao thức SIP
Cấu trúc chung của giao thức SIP bao gồm ba lớp
o Lớp trên là lớp giao dịch người sử dụng TU (Transaction User layer). Đây là phần
xử lý cơ bản trong các thành phần của SIP như UA core, proxy core.
o Tiếp theo là lớp giao dịch Transaction layer. Lớp này làm nhiệm vụ gởi và nhận
các thông điệp SIP một cách tin cậy. Khi SIP chạy trên một giao thức chuyển vận
không tin cậy như UDP, lớp này sẽ phát lại các thông điệp tùy thuộc vào các trạng
thái hạn chế.
o Bên dưới là lớp giao vận Transport layer. Giao thức SIP có thể chạy trên nhiều
giao thức chuyển vận không tin cây (như UDP) hoặc tin cậy (TCP, SCTP), cũng
như các giao thức bảo mật (TLS trên TCP).
Một hội thoại biểu diễn một quan hệ giữa hai UA suốt một khoảng thời gian.
Các hội thoại bao gồm trong một phiên gọi. Các phiên nhiều thành phần, có thể có
nhiều hơn một hội thoại, một hội thoại cho hai thành phần.

.II.4. Các giao thức liên quan
.II.4.1.

Giao thức MGCP : ( Media Gateway Control Protocol – Giao
thức điều khiển cổng truyền thông )

o

Là một giao thức trong VOIP được đưa ra theo đề xuất của Cisco và
Telcordia để định nghĩa sự liên lạc giữa những phần điều khiển cuộc gọi
( Call Agents hoặc Media Gateway ) và những cổng Telephone . MGCP là
giao thức điều khiển , cho phép trung tầm điều khiển theo dõi những sự
kiện trong cuộc gọi IP và những Gateway và chỉ đạo chúng để gửi thông tin
tới những địa chỉ cụ thể
Trong cấu trúc MGCP , tin tức điều

khiển cuộc gọi nằm bên ngoài những Gateway và được điều khiển bởi phần
điều khiển cuộc gọi ( Call Agent ) . Call Agen sẽ đồng bộ với những phần
khác để gửi những lệnh liên kết tới những Gateway dưới sự điều khiển của
chúng .

o Giao thức MEGACO (Media Gateway Control Protocol)
o

Là kết quả của nỗ lực liên kết của IETF và ITU-T ( ITU-T sự khuyến
cáo của H.248 ) . MEGACO/H.248 để điều khiển những Gateway tách
Multimedia , nó cho phép tách điều khiển cuộc gọi từ Media . Những địa
chỉ MEGACO/H.248 liên quan tới tới Media Gateway ( MG ) , mà chuyển
đổi giọng nói thành những goi cơ bản để chuyển đi , và Bộ phận điều khiển
Media Gateway ( MGC ) , mà ra lệnh những Dịch vụ của truyền dẫn .
MEGACO/H.248 ra lệnh cho MG để nối tới luồng dữ liệu ra bên ngoài .
18


MEGACO/H.248 cũng tương tự như MGCP nhưng hỗ trợ được nhiều hơn
trong đó có cả ATM .
o

Trong vài năm qua , công nghiệp VOIP đang tiến triển và chú tâm vào
một số khía cạnh sau :

o

+ Chất lượng cuộc gọi : IP được thiết kế để mang dữ liệu do đó nó
không đảm bảo thời gian thực nhưng chỉ nỗ lực cung cấp dịch vụ tốt nhất .
Để truyền dẫn giọng nói lên IP được người dùng chấp nhận thì thời gian trễ

của gói dữ liệu phải ít hơn giá trị ngưỡng cho phép . Trường hợp khi giọng
nói của chúng ta nhiều khi bị chậm làm cho người nghe gây cảm giác khó
chịu .

o

+ Độ an toàn : Mã hoá ( như SSL ) và công nghệ Tunel phát triển để
bảo vệ tín hiệu VOIP trên đường truyền .

o

+ Tích hợp được với mạng điện thoại công cộng PSTN (Public
Switched Telephone Network ) : Trong khi giới thiệu điện thoại Internet ,
nó sẽ cần làm việc kết nối với PSTN trong tương lại gần . Công nghệ
Gateway cần phát triển để tạo thành cầu nối với hai mạng ( Tại Việt nam
dùng mạng 177 và 171 để kết nối với PSTN )

o

+ Khả năng mở rộng : Hệ thống VOIP cần mềm dẻo để phát triển cho
những dịch vụ màn tính cá nhân và tính đại chúng . Quản lí nhiều mạng ,
công nghệ quản lí người dùng và những sản phẩm cần phát triển tương ứng
.II.4.2.

Giao thức RTCP (Real-time Transport Control Protocol)

Giao thức điều khiển truyền thời gian thực RTCP ( Real-time Transport
Control Protocol) là giao thức hỗ trợ cho RTP cung cấp các thông tin phản hồi về chất
lượng truyền dữ liệu. Các dịch vụ mà RTCP cung cấp là:
o Giám sát chất lượng và điều khiển tắc nghẽn: Đây là chức năng cơ bản của RTCP.

Nó cung cấp thông tin phản hồi tới một ứng dụng về chất lượng phân phối dữ liệu.
Thông tin điều khiển này rất hữu ích cho các bộ phát, bộ thu và giám sát. Bộ phát
có thể điều chỉnh cách thức truyền dữ liệu dựa trên các thông báo phản hồi của bộ
thu. Bộ thu có thể xác định được tắc nghẽn là cục bộ, từng phần hay toàn bộ.
Người quản lý mạng có thể đánh giá được hiệu suất mạng.
Xác định nguồn: Trong các gói RTP, các nguồn được xác định bởi các số ngẫu nhiên
có độ dài 32 bít. Các số này không thuận tiện đối với người sử dụng RTCP cung cấp thông
tin nhận dạng nguồn cụ thể hơn ở dạng văn bản. Nó có thể bao gồm tên người sử dụng, số
điện thoại, địa chỉ e-mail và các thông tin khác.

o Điều chỉnh thông tin điều khiển: Các gói RTCP được gửi theo chu kỳ giữa những
người tham dự. Khi số lượng người tham dự tăng lên, cần phải cân bằng giữa việc
nhận thông tin điều khiển mới nhất và hạn chế lưu lượng điều khiển. Để hỗ trợ
19


một nhóm người sử dụng lớn, RTCP phải cấm lưu lượng điều khiển rất lớn đến từ
các tài nguyên khác của mạng. RTP chỉ cho phép tối đa 5% lưu lượng cho điều
khiển toàn bộ lưu lượng của phiên làm việc. Điều này được thực hiện bằng cách
điều chỉnh tốc độ phát của RTCP theo số lượng người tham dự.

II.5 Hoạt động của VOIP sử dụng giao thức SIP
Mô hình thực hiện việc gọi điện giữa 2 máy sử dụng một proxy server.

SIP UAC1

SIP Stateful Proxy

SIP UAC2


1.INVITE
2.TRYING

3.INVITE
4.TRYING

6.RINGING

5.RINGING

8.200(OK)
9.200(OK)
10.ACK

11.ACK
12.RTP Voice stream

13.BYE (Hang on)
16.200(OK)

14.BYE
15.200(OK)

Hình 6 – Mô hình thực hiện cuộc gọi giữa hai UAC thông qua Proxy Server
Bước 1 – User ở UAC1 muốn kết nối đến đối tượng gọi. Tại thời điểm này,
ứng dụng chạy trên UAC1 tạo ra một thông điệp INVITE và gởi đến proxy. Địa chỉ
proxy được cấu hình trước trong chương trình.
Bước 2 – Proxy nhận yêu cầu bằng cách lắng nghe trên cổng 20050/UDP. Nó
trả lời ngay lập tức một đáp ứng 100 (TRYING) yêu cầu client đợi kết nối. Sau đó
chuyển qua bước 3.

20


Bước 3 – Proxy kiểm tra yêu cầu INVITE, xác định máy nơi mà đối tượng gọi
đăng nhập vào và chuyển INVITE đến máy đó.
Bước 4 – UAC2 trả lời lại proxy với một đáp ứng 100 (TRYING).
Bước 5 – UAC2 gởi 1 đáp ứng 180 (RINGING) đến proxy cho biết tình trạng
đang đổ chuông.
Bước 6 – Proxy chuyển 180 (RINGING) đến UAC1.
Bước 7 – UAC1 nhận 180 (RINGING), lập tức phát ra tín hiệu chuông chờ.
Bước 8 – Đối tượng gọi ở UAC2 bắt máy . UAC2 báo proxy tín hiệu bắt máy
với 200 (OK).
Bước 9 – Proxy chuyển 200 (OK) đến UAC1.
Bước 10 – UAC1 gởi yêu cầu ACK đến proxy xác nhận rằng đã nhận 200 (OK)
Bước 11 – Proxy chuyển ACK đến UAC2
Bước 12 – UAC1 phát ra luồng RTP với UAC2 và bắt đầu truyền âm thanh.
Bước 13, 14 – Đối tượng gọi tại UAC1 cúp máy trước. UAC1 phát ra yêu cầu
BYE và gởi đến UAC2 thông qua proxy.
Bước 15, 16 – UAC2 nhân được yêu cầu BYE của UAC1, nó phản hồi bằng
200 (OK), kết thúc cuộc gọi.

TÀI LIỆU THAM KHẢO
[1] Voice over IP fundamentals, Jonathan Davison & James Perter, Cisco

System.
21


[2] Công nghệ mạng máy tính, TS Lê Thanh Dũng (dịch), NXB Bưu Điện,
[3]

[4]
[5]
[6]
[7]
[8]

6/2001
Trang web
Nguyễn Hồng Sơn. Kỹ thuật điện thoại qua IP và Internet. 2003
Mạng máy tính và các hệ thống mở, Nguyễn Thúc Hải, NXB Giáo dục - 1999
Meng-Chauug Peter Lee và Kwok-Cheong Thomas Pang. Session Initiation
Protocol User Agent Prototype. Simon Fraser University. 2001
Các tài liệu khác liên quan đến VoIP và giao thức SIP.
VoIP Testing Tooks for Voice Data Network.

22


23



×