Tải bản đầy đủ (.docx) (36 trang)

Ứng dụng công nghệ VoIP

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (662.13 KB, 36 trang )

LỜI MỞ ĐẦU
Với sự phát triển nhảy vọt của mạng chuyển mạch gói IP hiện nay cùng với sự
hội nhập mạnh mẽ vào nền kinh tế khu vực và thế giới, môi trường viễn thông Việt
Nam cũng có những bước chuyển lớn với hàng loạt các dịch vụ mới. Chẳng hạn như
sự ra đời của mảng điện thoại di động mới Sfone phá vỡ thế độc quyền của Vinafone,
Mobifone, tiếp theo là dịch vụ đường truyền Internet tốc độ cao ADSL với chi phí
thấp, rồi tiếp theo là sự ra đời của dịch vụ gọi điện thoại quốc tế giá rẻ Internet Phone.
Sự xuất hiện của VoIP đã gây nên một sự chú ý đặc biệt trong lĩnh vực viễn
thông thế giới, lợi ích mà nó mang lại là rất lớn. Đối với người tiêu dùng, lợi ích đầu
tiên mà họ đạt được là chi phí cuộc gọi sẽ rẻ hơn đáng kể. Còn đối với các nhà sản
xuất, cung cấp và khai thác mạng, truyền thoại qua mạng Internet mở ra những
thách thức mới nhưng cũng hứa hẹn khả năng lợi nhuận đáng kể. VoIP ngày càng đáp
ứng tốt hơn các yêu cầu đặt ra như chất lượng dịch vụ, giá thành, số lượng tích hợp
các dịch vụ thoại lẫn phi thoại. Mạng VoIP ra đời như là một cuộc các mạng của hệ
thống viễn thông và xã hội. Với những ưu điểm vượt trội, mạng VoIP đã chứng tỏ
được sức sống và tính thực tiễn cao của nó.
Tại Việt Nam, dịch vụ này cũng đã và đang triển khai các dịch vụ thoại trên nền
IP. Tuy nhiên, việc triển khai các dịch vụ này vẫn còn nhiều hạn chế do vấn đề kỹ thuật
và hạ tầng mạng chưa đáp ứng kịp.
Để thấy được những ưu nhược điểm cũng như những lợi ích mà VoIP đã mang
lại và những ứng dụng thực. Đề án gồm 3 chương:
Chương I: Tổng quan về VoIP
Chương II: Công nghệ VoIP
Chương III: Ứng dụng công nghệ VoIP
Do hạn chế về thời gian nghiên cứu, khuôn khổ của đề án cũng như kiến thức
và kinh nghiệm ứng dụng thực tiễn nên đề án của nhóm em không tránh khỏi những
thiếu sót. Rất mong nhận được sự cảm thông và đóng góp ý kiến của các thầy giáo,
bạn bè, để đề án của nhóm em được hoàn thiện hơn.
Chúng em xin chân thành cảm ơn!
Hà Nội, ngày 26, tháng 12, năm 2014
Nhóm sinh viên thực hiện


Nhóm 2


MỤC LỤC

Chương 1
TỔNG QUAN VỀ VOIP
1.1. Giới thiệu chung về VoIP
VoIP là chữ viết tắt của Voice over Internet Protocol (gọi điện qua giao thức
internet), cuộc cách mạng lớn tiếp theo của ngành công nghiệp viễn thông. Về cơ bản
công nghệ biến các tín hiệu điện thoại thành các dữ liệu kỹ thuật số từ đó gửi qua
internet thay vì thông qua các nhà cung cấp dịch vụ viễn thông. Sau đó lại chuyển đổi
thành âm thanh, hình ảnh có thể nghe trên điện thoại của người nhận. Phương pháp
truyền dữ liệu này tận dụng các thế mạnh sẵn có của hạ tầng cơ sở internet cho phép
bạn gọi tới bất kỳ đâu với chi phí rẻ hơn rất nhiều so với các cách gọi truyền thống.
VoIP cho phép tạo cuộc gọi đường dài qua mạng dữ liệu IP có sẵn thay vì phải
được truyền qua mạng PSTN (Public Switch Telephone Network). Ngày nay
nhiều công ty đã thực hiện giải pháp VoIP của họ để giảm chi phí cho những cuộc gọi
đường dài giữa nhiều chi nhánh xa nhau.
Cách đây nhiều năm chúng ta đã khám phá ra cách gửi tín hiệu đến một máy
đích ở xa bằng tín hiệu số bằng cách: trước khi gửi,chúng ta sẽ số hóa tín hiệu bằng
ADC (Analog to Digital Converter-Thiết bị chuyển đổi tín hiệu tương tự sang tín hiệu
số), sau đó truyền đi và tại đầu nhận sẽ chuyển đổi ngược lại với DAC (Digital to
Analog Converter - Thiết bị chuyển đổi tín hiệu số sang tín hiệu tương tự) để sử dụng.


VoIP cũng làm việc giống như vậy, số hóa âm thanh thành các gói dữ liệu,gửi dữ
liệu đi và chuyển đổi chúng lại thành dạng âm thanh tại đầu nhận. Khi nói vào ống
nghe hay microphone, giọng nói sẽ tạo ra tín hiệu điện từ,đó là tín hiệu tương tự. Tín
hiệu tương tự sẽ được chuyển đổi sang tín hiệu số nhờ vào một số thuật toán đặc biệt

để chuyển đổi. Những tín hiệu khác nhau sẽ có cách chuyển đổi khác nhau như VoIP
phone hay softphone, nếu dùng điện thoại analog thông thường thì cần một TA
(Telephone Adapter),sau đó giọng nói được số hóa sẽ được đóng thành gói tin,được
gửi qua mạng IP.

Hình 1.1: Mô hình chung của một kết nối VoIP
Định dạng số có thể được điều khiển tốt hơn:chúng ta có thể nén, định tuyến,
chuyển đổi nó sang định dạng mới và hơn nữa tín hiệu số thì ít nhiễu hơn tín hiệu
analog.
Mặc dù khái niệm về VoIP là đơn giản nhưng thực hiện và ứng dụng VoIP là
phức tạp. Để gửi voice,thông tin phải được tách biệt thành những gói(packet)giống
như dữ liệu. Gói là những phần thông tin được chia nhỏ để dễ dàng cho việc gửi gói
cũng như có thể dùng kỹ thuật nén gói để tiết kiệm băng thông thông qua những tiến
trình CODEC (COmpressor/DECompressor).
Nhìn chung VoIP có thể vừa thực hiện mọi cuộc gọi như trên mạng điện
thoại kênh truyền thống PSTN, vừa đồng thời truyền dữ trên cơ sở mạng truyền dữ
liệu. Như vậy, nó đã tận dụng được sức mạnh và sự phát triển vượt bậc của mạng IP
vốn chỉ được sử dụng để truyền dữ liệu thông thường.
Công nghệ này dựa trên chuyển mạch gói, nhằm thay thế công nghệ
truyền thoại cũ dùng chuyển mạch kênh. Nguyên tắc của VoIP bao gồm việc số hóa tín
hiệu tiếng nói, thực hiện việc nén tín hiệu số, chia nhỏ các gói nếu cần và truyền gói
tin này qua mạng, tới nơi nhận các gói tin này được ráp lại theo đúng thứ tự của bản
tin, giải mã tín hiệu tương tự phục hồi lại tiếng nói ban đầu.
Để gọi điện qua VoIP, người dùng cần có chương trình phần mềm điện thoại
SIP hoặc một điện thoại VoIP dạng phần cứng. Có thể gọi điện thoại đến bất cứ đâu,
cho bất kỳ ai đối với cả số điện thoại VoIP và những người dùng số điện thoại bình
thường.


1.2. Đặc tính của mạng VoIP

1.2.1. Ưu điểm
VoIP ra đời nhằm khai thác tính hiệu quả của các mạng truyền số liệu, khai thác
tính linh hoạt trong phát triển các ứng dụng mới của giao thức IP và nó được áp
dụngtrên một mạng toàn cầu là mạng Internet. Các tiến bộ của công nghệ đã mang đến
cho VoIP những ưu điểm sau:
- Giảm chi phí cuộc gọi: Ưu điểm nổi bật của điện thoại IP so với dịch vụ điện
thoại hiện tại là khả năng cung cấp những cuộc gọi đường dài giá rẻ với chất lượng
chấp nhận được. Nếu dịch vụ điện thoại IP được triển khaithì chi phí cho một cuộc gọi
đường dài sẽ chỉ tương đương với chi phí truy nhập Internet. Nguyên nhân dẫn đến chi
phí thấp như vậy là do tín hiệu thoại được truyền tải trong mạng IP có khả năng sử dụng
kênh hiệu quả cao. Đồng thời, kỹ thuật nén thoại tiên tiến giảm tốc độ bít từ 64Kbps
xuống thấp tới 8Kbps kết hợp với tốc độ xử lý nhanh của các bộ vi xử lý ngày nay cho
phép việc truyền tiếng nói theo thời gian thực là có thể thực hiện được với lượng tài
nguyên băng thông thấp hơn nhiều so với kỹ thuật cũ.
- Tích hợp mạng thoại, mạng số liệu và mạng báo hiệu: Trong điện thoại IP, tín
hiệu thoại, số liệu và ngay cả báo hiệu đều có thể đi trên cùng một mạngIP. Điều này sẽ
tiết kiệm được chi phí đầu tư để xây dựng những mạng riêng rẽ.
- Khả năng mở rộng: Nếu như các hệ tổng đài thường là những hệ thống kín,thì
rất khó để thêm vào đó những tính năng thì các thiết bị trong mạng Internet thường có
khả năng thêm vào những tính năng mới. Chính tính mềm dẻo đó mang lại cho dịch vụ
điện thoại IP khả năng Công nghệ VoIP và ứng dụng mở rộng dễ dàng hơn so với điện
thoại truyền thống.
- Không cần thông tin điều khiển để thiết lập kênh truyền vật lý: Gói thông tin
trong mạng IP truyền đến đích mà không cần một sự thiết lập kênh nào. Gói tin chỉ cần
mang địa chỉ của nơi nhận cuối cùng là thông tin đó có thể đếnđược đích. Do vậy, việc
điềukhiển cuộc gọi trong mạng IP chỉ cần tập trung vào chức năng cuộc gọi mà không
cần phải tập trung vào chức năng thiết lập kênh.
- Quản lý băng thông: Trong điệnthoại chuyển mạch kênh,tài nguyên băng thông
cung cấp cho một cuộc thoại là cố định (một kênh 64Kbps), nhưng trong điện thoại IP
việc phân chia tài nguyên cho các cuộc thoại linh hoạt hơn nhiều. Khi một cuộc liên lạc

diễn ra, nếu lưu lượng của mạng thấp thì băng thông dành cho liên lạc sẽ cho chất
lượng thoại tốt nhất có thể, nhưng khi lưu lượng của mạng cao thì mạng sẽ hạn chế
băng thông của từng cuộc gọi ở mức duy trì chất lượng thoại chấp nhận được nhằm
phục vụ cùng lúc được nhiều người nhất. Điểm này cũng là một yếu tố làm tăng hiệu
quả sử dụng của điệnthoại IP.Việc quản lý băng thông một cách tiết kiệm như vậy cho
phép người ta nghĩ tới những dịch vụ cao cấp hơn như điện thoại hội nghị, điều mà với
công nghệ chuyển mạch cũ thì không thực hiện vì chi phí quá cao.
- Nhiều tính năng dịch vụ: Tính linh hoạt của mạng IP cho phép tạo ra nhiềutính
năng mới trong dịch vụ thoại như: Cho biết thông tin về người gọi tới hay một thuê bao
điện thoại IP có thể có nhiều số liên lạc mà chỉ cần một thiết bị đầu cuối duy nhất.
- Khả năng multimedia: Trong một cuộc gọi người sử dụng có thể vừa nói
chuyện vừa sử dụng các dịch vụ khác như truyền file, chia sẻ dữ liệu, hay xem hình ảnh
của người nói chuyện bên kia.
- Sử dụng hiệu quả: Như đã biết VoIP truyền thoại qua mạng Internet và sử dụng
giao thức IP, ngày nay IP là giao thức mạng được sử dụng rộng rãi nhất và có rất nhiều


ứng dụng đang được khai thác trên cơ sở các giao thức của mạng IP, VoIP có thể kết
hợp sử dụng các ứng dụng này để nâng cao hiệu quả sử dụng mạng. Kỹ thuật VoIP
được sử dụng chủ yếu kết hợp với các mạng máy tính do đó có thể tận dụng được sự
phát triển của công nghệ thông tin để nâng cao hiệu quả sử dụng, các phần mềm sẽ hỗ
trợ rất nhiều cho việc khai thác các dịch vụ của mạng VoIP. Công nghệ thông tin càng
phát triển thì việc khai thác càng có hiệu quả, sẽ xuất hiện nhiều dịch vụ mới hỗ trợ
người sử dụng trong mọi lĩnh vực.
1.2.2. Nhược điểm
- Kỹ thuật phức tạp: Truyền tín hiệu theo thời gian thực trên mạng chuyển mạch
gói là rất khó thực hiện do mất gói trong mạng là không thể tránh và độ trễ không cố
định của các gói thông tin khi truyền trên mạng. Để có được một dịch vụ thoại chấp
nhận được cần phải có một kỹ thuật nén tín hiệu đạt được những yêu cầu khắt khe như:
Tỉ số nén lớn, có khả năng suy đoán và tạo lạithông tin của các gói bị thất lạc…Tốc độ

xử lý của các bộ Codec phải đủ nhanh để không làm cuộc đàm thoại bị gián đoạn. Đồng
thời cơ sở hạ tầng của mạng cũng cần được nâng cấp lên các công nghệ mới để có tốc
độ cao hơn và có cơ chế thực hiện chức năng QoS (Quality of Service).
- Vấn đề bảo mật: Mạng Internet là mạng có tính rộng khắp và hỗn hợp, trong đó
có rất nhiều loại máytính khác nhau, các dịch vụ khác nhau cùng sử dụng chung một cơ
sở hạtầng. Do vậy không có gì đảm bảo rằng thông tin liên quan đến cá nhân cũng như
số liên lạc truy nhập sử dụng dịch vụ của người dùng được giữ bí mật. Và nguy cơ nghe
lén cuộc gọi VoIP khá cao do các gói dữliệu phải chuyểntiếp qua nhiều trạm trung gian
trước khi đến người nghe hoặc vấnđề truy cập trái phép, hacker có thể lợi dụng các lỗ
hổng bảo mật để xâm nhập vào hệ thống mạng. Ngoài ra VoIP cóthể gặp những vấn đề
như khôngthể sử dụng được dịch vụ khi cúp điện, không thể kết nối đến các dịch vụ
khẩn như: cấp cứu, báo cháy...
1.3. Phát triển dịch vụ điện thoại IP
1.3.1. Khả năng triển khai dịch vụ điện thoại IP
Thoại qua IP hiện nay đã hình thành một dịch vụ phổ biến, cùng với sự phát
triển không ngừng của Internet. Bên cạnh đó ta cũng thấy thực tế rằng các nhà
cung cấp phần mềm hiện nay đều tích hợp trong sản phẩm của họ những tính
năng có thể hỗ trợ cho dịch vụ VoIP như Microsolf, IBM…, điều đó cho thấy VoIP
đang thực sự phát triển hiện tại và tương lai đang rất hứa hẹn.
Để VoIP phát triển thì cần phải có những điều kiện nhất định. Đó cũng chính là
lý do tại sao mặc dù hiện nay rất nhiều các nhà cung cấp quan tâm nhưng thực sự để
có thể dùng VoIP thay thế cho dịch vụ điện thoại truyền thống thì còn trong khoảng
thời gian dài và VoIP chỉ có thể là một dịch vụ chiếm thiểu số.
1.3.2. Các yêu cầu khi phát triển dịch vụ điện thoại IP
- Chất lượng thoại phải ổn định, độ trễ chấp nhận được và phải so sánh đựợc
với chất lượng thoại của mạng PSTN và các mạng có chất lượng phục vụ khác nhau.
- Mạng IP cơ bản phải đáp ứng được những tiêu chí hoạt động khắt khe bao
gồm giảm thiểu việc từ chối cuộc gọi, mất mát gói và mất liên lạc. Điều này đòi hỏi
ngay cả khi mạng bị nghẽn hoặc khi người sử dụng chung tài nguyên của mạng cùng
một lúc.



- Tín hiệu báo hiệu phải có khả năng tương tác được với báo hiệu của mạng
khác (PSTN) để không gây ra sự thay đổi khi chuyển giao giữa các mạng cũng như
không ảnh hưởng đến hoạt động của mạng.
- Liên kết các dịch vụ PSTN/VoIP bao gồm các Gateway giữa các mạng trường
thoại và mạng dữ liệu. Các mạng sẵn có cần được hỗ trợ QoS và các dịch vụ công
đồng toàn cầu được thiết lập.
1.3.3. Những khó khăn khi phát triển dịch vụ
- Vấn đề tiêu chuẩn: Do tiêu chuẩn quốc tế của điện thoại IP còn đang
không ngừng phát triển và hoàn thiện, đặc biệt là tiêu chuẩn thông tin giữa các miền
khác nhau, giữa các mạng khác nhau…còn đang trong thời gian tranh luận đã
ảnh hưởng trực tiếp đến sự tương thích giữa các sản phẩm điện thoại VoIP của
các nhà cung cấp khác nhau.
Ngoài ra vấn đề chuyển mạch của thuê bao ở các miền khác nhau, vấn đề lộ
trình và vấn đề tương thích dịch vụ, vấn đề thanh toán cước phí giữa các nhà cung
cấp dịch vụ khác nhau còn chưa được giải quyết.
- Vấn đề mạng truyền tải trong mạng Internet là không thể xác định trước
được và luôn thay đổi, vì vậy ảnh hưởng nghiêm trọng đến chất lượng thông thoại.
Căn cứ vào tình hình kỹ thuật hiện nay có thể nói Internet đối với thông tin điện
thoại thời gian thực yêu cầu chất lượng cao còn tồn tại nhiều khuyết điểm.
- Vấn đề dung lượng thiết bị: Các nhà sản xuất thiết bị tiếp nhận Internet và các
nhà sản xuất thiết bị cổng mạng đều đang cố gắng phát triển với quy mô lớn, từ vài
cửa ra E1 cho đến hơn 100 cửa ra E1. Tuy nhiên chất lượng của thiết bị hiện nay còn
cách xa so với sản phẩm viễn thông.
1.3.4. Xu hướng phát triển
Hiện nay đối tượng hứa hẹn cho VoIP là các mạng doanh nghiệp Intranet và
mạng Etranet thương mại. Cở sở hạ tầng dựa trên IP cho phép điều khiển quản lý việc
sử dụng các dịch vụ cho phép hay không cho phép truy cập các dịch vụ. Các sản phẩm
điện thoại trên mạng Internet chưa thể đáp ứng các yêu cầu chất lượng dịch vụ như

điện thoại thông thường. Bởi vậy, phát triển VoIP trên Intranet, Etranet là hướng phát
triển trước mắt.
Một xu thế phát triển khác hứa hẹn là xây dựng các cổng nối giữa mạng IP
và mạng thoại là các VoIP Gateway. Những Gateway này xây dựng từ nền tảng PC
trở thành các hệ thống mạnh có khả năng điều khiển hàng trăm cuộc gọi đồng thời.
Bởi vậy các doanh nghiệp sẽ phát triển lượng lớn các Gateway trong nỗ lực giảm chi
phí liên quan đến lưu lượng thoại, fax và video hội nghị.
Chương 2
CÔNG NGHỆ VOIP


2.1. Kiến trúc mạng VoIP
2.1.1. Mô hình kiến trúc phân tầng
Cấu trúc phân lớp của hệ thống VoIP phổ biến hiện nay được mô tả giống như
cấu trúc phân lớp của mô hình TCP/IP và được biểu diễn như sau:

Hình 2.1: Mô hình tham chiếu OSI so với mô hình mạng VoIP

2.1.1.1. Lớp giao tiếp mạng
Lớp giao tiếp mạng: Là lớp thấp nhất của mô hình TCP/IP, có trách nhiệm nhận
các IP datagram và truyền chúng trên một mạng nhất định. Người ta lại chia lớp giao
tiếp mạng thành 2 lớp con là:
- Lớp vật lý: Là lớp làm việc với các thiết bị vật lý với các chức năng như sau:
+ Định nghĩa các phần cứng đặc biệt, cung cấp môi trường truyền dẫn như:
Truyền trên môi trường có dây, môi trường không dây, truyền qua cáp quang hay cáp
đồng.
+ Mã hóa tín hiệu: Lớp vật lý có chức năng mã hóa tín hiệu sao cho phù hợp với
môi trường truyền.
- Lớp liên kết dữ liệu: Tương ứng với lớp thứ 2 trong mô hình OSI. Lớp liên kết
dữ liệu đảm bảo việc truyền dữ liệu tin cậy giữa các đầu cuối cục bộ (local). Lớp liên

kết lại được chia thành hai phân lớp con là: Điều khiển liên kết logic (LLC), và điều
khiển truy cập (MAC). Tại đây dữ liệu được tổ chức thành các khung (frame). Phần
đầu khung chứa địa chỉ và thông tin điều khiển, phần cuối khung dành cho việc phát
hiện lỗi. Truyền và thu tín hiệu tại các đầu cuối mạng.
2.1.1.2. Lớp mạng
Lớp mạng tương ứng với lớp thứ 3 trong mô hình tham chiếu OSI. Lớp mạng sử
dụng những giao thức nhằm đảm bảo truyền dữ liệu giữa các trạm không kề nhau sao
cho không có lỗi. Địa chỉ lớp mạng là địa chỉ logic, bao gồm địa chỉ IPv4 hoặc IPv6.
Địa chỉ IPv4 có 32 bit và địa chỉ IPv6 có 128 bit.
Giao thức mạng IP được thiết kế để liên kết các mạng máy tính sử dụng phương
pháp truyền thông và nhận dữ liệu dưới dạng gói. Giao thức IP cho phép truyền các


gói dữ liệu từ điểm nguồn tới điểm đích có địa chỉ cố định. Đơn vị dữ liệu được trao
đổi là các gói dữ liệu. Các chức năng được thực hiện ở IP là:
- Đánh địa chỉ: Tất cả các Host trong mạng và trong liên mạng đều được cung
cấp một địa chỉ IP duy nhất. Theo giao thức IPv4, mỗi địa chỉ IP gồm 32bit và được
chia làm 5 lớp A,B,C,D,E. Các lớp A,B,C được sử dụng để định danh các host trên các
mạng. Lớp D được sử dụng cho quá trình truyền đa điểm còn lớp E để dự phòng.
- Định tuyến: Giúp xác định đường đi (tuyến) cho gói tin khi được truyền trên
mạng. Nó giúp lựa chọn đường đi tối ưu cho các gói dữ liệu. Nếu hai host cần liên lạc
không nằm trên một Subnet thì bảng định tuyến sẽ được sử dụng để quyết định việc
chuyển dữ liệu và các bộ định tuyến thường xuyên trao đổi và cập nhật thông tin trong
bảng định tuyến tùy thuộc vào phương pháp định tuyến được sử dụng.
- Truyền đa điểm: Hiện nay có ba cách truyền các gói IP là:
+ Truyền một điểm đích (Unicast): Các gói tin được truyền từ host
nguồn đến host đích duy nhất.
+ Truyền quảng bá: Gói tin được truyền đến tất cả các host trong mạng.
+ Truyền đa điểm: Gói tin được gửi đến một số các host nhất định trong mạng.
Ngoài ra, giao thức IP còn cung cấp khả năng phân mảnh dữ liệu lớn thành các

gói có kích thước nhỏ hơn để truyền qua mạng.
2.1.1.3. Lớp giao vận
Lớp giao vận nằm trên lớp thứ 3 trong mô hình mạng VoIP tương ứng với lớp 4
của mô hình tham chiếu OSI. Cung cấp dịch vụ truyền thông giữa các chương trình
ứng dụng chạy trên các máy tính khác nhau. Tầng giao vận có 2 giao thức quan trọng
là TCP và UDP. Ngoài ra để phù hợp với các dịch vụ truyền thời gian thực trong lớp
giao vận còn có giao thức SCTP.
Lớp Transport có một số nhiệm vụ như sau:
- Cho phép nhiều ứng dụng truyền thông qua mạng tại cùng một thời điểm, trên
cùng một thiết bị.
- Đảm bảo dữ liệu được tin cậy khi sử dụng giao thức TCP, sắp xếp đúng gói tin
cho từng loại ứng dụng khác nhau.
- Cung cấp cơ chế truyền lại trong trường hợp gói tin bị mất hoặc lỗi trong quá
trình truyền từ nguồn tới đích.
Chức năng của lớp Transport:
- Đảm bảo duy trì các kết nối riêng biệt giữa các ứng dụng khác nhau trên host
nguồn và đích.
- Thực hiện phân mảnh tại nguồn và có cơ chế quản lý gói tin này.
- Ghép các mảnh dữ liệu tại đích để tạo thành luồng dữ liệu ứng dụng trước khi
đẩy lên lớp ứng dụng.
- Có khả năng nhận diện các ứng dụng khác nhau. Điều này giúp cho lớp
Transport có thể khởi tạo, duy trì, bảo dưỡng và kết thúc nhiều ứng dụng khác nhau
trên cùng một thiết bị.
2.1.1.4. Lớp ứng dụng
Lớp ứng dụng trong mạng VoIP tương ứng với 3 lớp trên cùng của OSI. Là lớp
liên quan trực tiếp đến người dùng. Lớp ứng dụng chứa một loạt các giao thức phục vụ
cho ứng dụng voice.
Các giao thức báo hiệu: H.323, SIP, MGCP, Megaco/ H.248.
Các giao thức truyền tin thời gian thực: RTP, RTCP, RSVP.



Các chuẩn nén thoại, video: G.711, G.722, G.723.1, G.728, G.729,
H.261, H.263.
2.1.2. Mô hình phân lớp chức năng
Về mặt chức năng, công nghệ VoIP có thể được chia làm ba lớp như sau:

Hình 2.2: Mô hình phân lớp chức năng của VoIP
Lớp cơ sở hạ tầng mạng gói thực hiện chức năng truyền tải lưu lượng thoại.
Trong VoIP, cơ sở hạ tầng là các mạng IP. Giao thức truyền tải thời gian thực RTP
(Realtime transport protocol) kết hợp với UDP và IP giúp truyền tải thông tin thoại qua
mạng IP, RTP chạy trên UDP, còn UDP hoạt động trên IP hình thành nên cơ chế truyền
RTP/UDP/IP trong VoIP.
Trong các mạng IP, hiện tượng các gói IP thất lạc hoặc đến không theo thứ tự
thường xuyên xảy ra. Cơ chế truyền TCP/IP khắc phục việc mất gói bằng cơ chế
truyền lại không phù hợp với các ứng dụng thời gian thực vốn rất nhạy cảm với trễ.
RTP với trường tem thời gian (timestamp) được dùng để bên thu nhận biết và xử lý các
vấn đề như trễ, sự thay đổi độ trễ (jitter) và sự mất gói.
Lớp điều khiển cuộc gọi thực hiện chức năng báo hiệu, định hướng cuộc gọi
trong VoIP. Sự phân tách giữa mặt phẳng báo hiệu và truyền tải đã được thực hiện ở
TSPN với báo hiệu kênh chung SS7. Ngoài ra lớp này còn cung cấp chức năng truy
nhập tới dịch vụ bên trên cũng như các giao diện lập trình mở để phát triển ứng dụng.
Lớp ứng dụng dịch vụ đảm nhiệm chức năng cung cấp dịch vụ trong mạng với
cả dịch vụ cũ tương tự như trong PSTN và dịch vụ mới thêm vào. Các giao diện mở
cho phép các nhà cung cấp phần mềm độc lập phát triển ra nhiều ứng dụng mới, đặc
biệt là các ứng dụng dựa trên Web, các ứng dụng kết hợp giữa thoại và dữ liệu, các
ứng dụng liên quan tới thương mại điện tử. Sự phân tách lớp dịch vụ làm cho các dịch
vụ mới được triển khai nhanh chóng.Ngoài ra các chức năng như quản lý, nhận thực
cuộc gọi và chuyển đổi địa chỉ cũng được thực hiện ở lớp này.
2.1.3. Các thành phần trong mạng VoIP
Các thành phần cốt lõi của 1 mạng VoIP bao gồm: Gateway, VoIP Server, IP

network, End User Equipments


Hình 2.3: Các thành phần trong mạng VoIP
- Gateway: là thành phần giúp chuyển đổi tín hiệu analog sang tín hiệu số (và
ngược lại).
- VoIP gateway : là các gateway có chức năng làm cầu nối giữa mạng điện thoại
thường ( PSTN ) và mạng VoIP.
- VoIP GSM Gateway: là các gateway có chức năng làm cầu nối cho các mạng
IP, GSM và cả mạng analog.
- VoIP server : là các máy chủ trung tâm có chức năng định tuyến và bảo mật
cho các cuộc gọi VoIP. Trong mạng H.323 chúng được gọi là gatekeeper. Trong mạng
SIP các server được gọi là SIP server.
Thiết bị đầu cuối (End user equipments ): Softphone và máy tính cá nhân (PC):
bao gồm một headphone, một phần mềm và một kết nối Internet. Các phần mềm miễn
phí phổ biến như Skype, Ekiga,...
- Điện thoại truyền thông với IP adapter: để sử dụng dịch vụ VoIP thì máy điện
thoại thông dụng phải gắn với một IP adapter để có thể kết nối với VoIP server.
Adapter là một thiết bị có ít nhất một cổng RJ11 (để gắn với điện thoại) , RJ45 (để gắn
với đường truyền Internet hay PSTN) và một cổng cắm nguồn.
- IP phone : là các điện thoại dùng riêng cho mạng VoIP. Các IP phone không
cần VoIP Adapter bởi chúng đã được tích hợp sẵn bên trong để có thể kết nối trực tiếp
với các VoIP server.
2.1.4. Các kiểu kết nối sử dụng VoIP
- Mô hình PC-PC

Hình 2.4: Mô hình PC-PC
Trong mô hình này, mỗi máy tính cần được trang bị một sound card, một
microphone, một speaker và được kết nối trực tiếp với mạng Internet thông



qua Modem hoặc Card mạng. Mỗi máy tính được cài đặt những phần mềm dùng
riêng cho việc truyền thoại, như vậy là 2 máy tính đã có thể trao đổi tín hiệu thoại
với nhau thông qua mạng Internet. Tất cả các thao tác như lấy mẫu tín hiệu âm
thanh, mã hóa và giải mã, nén và giải nén tín hiệu đều được máy tính thực hiện.
Mô hình này thường được áp dụng trong tổ chức hoặc công ty nhằm đáp ứng các
nhu cầu liên lạc mà không phải lắp đặt thêm hệ thống tổng đài nội bộ.
Hạn chế của mô hình này: Các thiết bị PC sẽ liên tục đựơc mở để có thể
nghe được các cuộc điện thoại.
- Mô hình PC – Phone

Hình 2.5: Mô hình PC-Phone
Mô hình PC to Phone là một mô hình được cái tiến hơn so với mô hình PC
to PC. Mô hình này cho phép người sử dụng máy tính có thể thực hiện cuộc gọi
đến mạng PSTN thông thường và ngược lại. Trong mô hình này mạng
Internet và mạng PSTN có thể giao tiếp với nhau nhờ một thiết bị đặc biệt đó là
Gateway. Đây là mô hình cơ sở để dẫn tới việc kết hợp giữa mạng Internet và mạng
PSTN cũng như các mạng GSM hay đa dịch vụ khác.
- Mô hình Phone – phone:

Hình 2.6: Mô hình: Phone-Phone
Đây là mô hình mở rộng của mô hình PC to Phone, sử dụng Internet làm
phương tiện liên lạc giữa các mạng PSTN. Tất cả các mạng PSTN đều kết nối với
mạng Internet thông qua các Gateway. Khi tiến hành cuộc gọi, mạng PSTN sẽ kết
nối đến Gateway gần nhất, tại đây địa chỉ sẽ được chuyển đổi từ địa chỉ PSTN sang
địa chỉ IP để có thể định tuyến các gói tin đến được mạng đích. Đồng thời
Gateway nguồn có nhiệm vụ chuyển đổi tín hiệu thoại tương tự thành dạng số sau
đó mã hóa, nén, đóng gói lại và gửi qua mạng. Mạng đích cũng được kết nối với
Gateway và tại đó địa chỉ lại được chuyển đổi trở thành địa chỉ PSTN và tín hiệu
được giải nén, giải mã, rồi chuyển đổi ngược lại thành tín hiệu tương tự gửi vào

mạng PSTN đến đích. Ngoài ra, thay vì dùng PC ta sử dụng các điện thoại
VoIP, iPhone, VoIP adapter... bạn có thể thực hiện cuộc gọi phone to phone đến


bất kỳ số điện thoại nào. Lúc này máy điện thoại trở thành một IP phone. Mô hình
này tương tự mô hình PC to PC, chỉ khác là ta thay máy tính bằng điện thoại IP.
2.2. Phương thức hoạt động của công nghệ VoIP
2.2.1. Tiến trình hoạt động
VoIP chuyển đổi tín hiệu giọng nói thông qua môi trường mạng. Do vậy,
trước hết giọng nói phải được chuyển đổi thành các dãy bit kỹ thuật số (digital bits)
và được đóng gói thành các packet để sau đó truyền tải qua mạng IP network và cuối
cùng được chuyển lại thành tín hiệu âm thanh đến người nghe.
Tiến trình hoạt động của VoIP thông qua hai bước:
Call setup: trong quá trình này, người gọi phải xác định vị trí (thông qua địa
chỉ của người nhận) và yêu cầu một kết nối để liên lạc với người nhận. Khi địa
chỉ người nhận được xác định là tồn tại trên các proxy server giữa hai người sẽ
thiết lập một cuộc kết nối cho quá trình trao đổi dữ liệu voice.
Voice data processing: tín hiệu giọng nói (analog) sẽ được chuyển đổi sang tín
hiệu số (digital) rồi được nén lại nhằm tiết kiệm đường truyền (bandwidth) sau
đó sẽ được mã hóa (tính năng bổ sung nhằm tránh các bộ phận tích mạng-sliffer).
Các voice samples sau đó sẽ được chèn vào các gói dữ liệu để vận chuyển trên mạng.
Giao thức dùng cho các gói voice này là RTP (real-time transport protocol). Một gói
tin RTP có các field chứa dữ liệu
2.2.2. Xử lý tín hiệu
Khi nói vào ống nghe hay Microphone, giọng nói sẽ tạo ra tín hiệu điện từ, đó là
những tín hiệu analog. Tín hiệu analog được chuyển sang tín hiệu số dùng thuật toán
đặc biệt để chuyển đổi. Những thiết bị khác nhau có cách chuyển đổi khác nhau như IP
phony hay Softphone, nếu dùng điện thoại Analog thông thường thì cần một Telephone
Adapter (TA). Sau đó giọng nói được số hóa sẽ được đóng vào gói tin và gửi trên
mạng IP. Trong suốt tiến trình một giao thức như SIP hay H323 sẽ được dùng để điểu

khiển cuộc gọi như là thiết lập, quay số, ngắt kết nối… và RTP thì được dùng cho tính
năng đảm bảo độ tin cậy và duy trì chất lượng dịch vụ trong quá trình truyền.
Quá trình số hóa tín hiệu analog
Biểu diễn tín hiệu analog thành dạng số (digital) là công việc khó khăn. Vì bản
thân dạng âm thanh như giọng nói con người ở dạng analog do đó phải cần một số
lượng lớn các giá trị digital để biểu diển biên độ (amplitude), tần số, và pha (phase),
chuyển đổi những giá trị đó thành dạng số nhị phân (0 & 1) là rất khó khăn. Vì vậy, để
thực hiện sự chuyển đổi này chúng ta cần phải dùng đến thiết bị được gọi là codec
(coder-decoder) hay là thiết bị mã hóa và giải mã. Tín hiệu analog được đặt vào đầu
vào của thiết bị này và được chuyển thành các chuỗi số nhị phân ở đầu ra. Sau đó quá
trình này thực hiện trở lại bằng cách chuyển đổi chuỗi số nhị phân thành dạng analog ở
đầu cuối.
Có 4 bước liên quan đến quá trình số hóa một tín hiệu analog:
Lấy mẫu (Sampling)
Lượng tử hóa (Quantization)


Mã hóa (Encoding)
Nén giọng nói (Voice Compression)
Các kỹ thuật được sử dụng trong quá trình số hóa:
- Multiplexing: ghép kênh là quy trình chuyển một số tín hiệu đồng thời qua
một phương tiện truyền dẫn
- PAM (Pulse-Amplitude Modulation): điều chế biên độ xung
- TDM (Time Division Multiplexing) : Ghép kênh phân chia theo thời gian:
Phân phối khoảng thời gian xác định vào mỗi kênh, mỗi kênh chiếm đường truyền cao
tốc trong suốt một khoảng thời gian theo định kì.
-FDM (Frequency Division Multiplexing) : Ghép kênh phân chia theo tần số :
Mỗi kênh được phân phối theo một băng tần xác định, thông thường có bề rộng 4 Khz
cho dịch vụ thoại.
- PCM(Pulse code modulation) : Điều chế theo mã : là phương pháp thông dụng

nhất chuyển đổi các tín hiệu analog sang dạng digital (và ngược lại) để có thể vận
chuyển qua một hệ thống truyền dẫn số hay các quá trình xử lý số. Sự biến đổi này bao
gổm 3 tiến trình chính: Lấy mẫu, lượng tử hoá, mã hoá. Tiến trình này hoạt động như
sau:
Giai đoạn đầu tiên của PCM là lấy mẫu các tín hiệu nhập (tín hiệu đi vào thiết bị
số hoá), nó tạo ra một tuần tự các mẫu Analog dưới dạng chuỗi PAM. Các mẫu PAM
có dải biên độ nối tiếp nhau, sau đó phân chia dải biên độ này thành một số giới hạn
các khoảng. Tất cả các mẫu với các biên độ nào đó nếu mẫu nào rơi vào một khoảng
đặc biệt nào thì được gán cùng mức giá trị của khoảng đó. Công việc này được gọi là
“lượng tử hoá”. Cuối cùng trong bộ mã hoá, độ lớn của các mẫu được lượng tử hoá
được biểu diễn bởi các mã nhị phân.
2.2.2.1. Quá trình lấy mẫu (Sampling)

Hình 2.7: Sampling
Tín hiệu âm thanh trên mạng điện thoại có phổ năng lượng đạt đến 10 Khz. Tuy
nhiên, hầu hết năng lượng đều tập trung ở phần thấp hơn trong dải này. Do đó để tiết
kiệm băng thông trong các hệ thống truyền được ghép kênh theo FDM và cả TDM.
Các kênh điện thoại thường giới hạn băng tần trong khoảng từ 300 đến 3400Hz. Tuy
nhiên trong thực tế sẽ có một ít năng lượng nhiễu được chuyển qua dưới dạng các tần
số cao hơn tần số hiệu dụng 3400Hz.
Do đó phổ tần số có thể được mở rộng đến 4KHz, theo lý thuyết Nyquist: khi
một tín hiệu thì được lấy mẫu đồng thời ở mỗi khoảng định kỳ và có tốc độ ít nhất
bằng hai lần phổ tần số cao nhất, sau đó những mẫu này sẽ mang đủ thông tin để cho
phép việc tái tạo lại chính xác tín hiệu ở thiết bị nhận. Với phổ tần số cao nhất cho


thoại là 4000Hz hay 8000 mẫu được lấy trong một giây, khoảng cách giữa mỗi mẫu là
125 micro giây.
2.2.2.2. Quá trình lượng tử hóa (Quantization)


Hình 2.8. Quantization
Tiến trình kế tiếp của số hóa tín hiệu tuần tự là biểu diễn giá trị chính xác cho
mỗi mẫu được lấy. Mỗi mẫu có thể được gán cho một giá trị số, tương ứng với biên độ
(theo chiều cao) của mẫu.
Sau khi thực hiện giới hạn đầu tiên đối với biên độ tương ứng với dải mẫu, đến
lượt mỗi mẫu sẽ được so sánh với một tập hợp các mức lượng tử và gán vào một mức
xấp xỉ với nó. Quy định rằng tất cả các mẫu trong cùng khoảng giữa hai mức lượng tử
được xem có cùng giá trị. Sau đó giá trị gán được dùng trong hệ thống truyền. Sự phục
hồi hình dạng tín hiệu ban đầu đòi hỏi thực hiện theo hướng ngược lại.

Hình 2.9: Pulse code modulation – analog to digital conversion
2.2.2.3. Mã hóa (Encoding)
Mỗi mức lượng tử được chỉ định một giá trị số 8bit, kết hợp 8bit có 256 mức
hay giá trị. Quy ước bit đầu tiên dùng để đánh dấu giá trị âm hoặc dương cho mẫu.
Bảy bit còn lại biểu diễn cho độ lớn; bit đầu tiên chỉ nửa trên hay nửa dưới của dãy, bit


thứ hai chỉ phần tư trên hay dưới, bit thứ 3 chỉ phần tám trên hay dưới và cứ thế tiếp
tục.
Ba bước tiến trình này sẽ lặp lại 8000 lần mỗi giây cho dịch vụ kênh điện thoại.
Dùng bước thứ tư là tùy chọn để nén hay tiết kiệm băng thông. Với tùy chọn này thì
một kênh có thể mang nhiều cuộc gọi đồng thời.
2.2.2.4. Nén giọng nói (Voice Compression)
Mặc dù kỹ thuật mã hóa PCM 64Kps hiện hành là phương pháp được chuẩn
hóa, nhưng có vài phương pháp mã hóa khác được sử dụng trong những ứng dụng đặc
biệt. Các phương pháp này thực hiện mã hóa tiếng nói với tốc độ nhỏ hơn tốc độ của
PCM, nhờ đó tận dụng được khả năng của hệ thống truyền dẫn số. Chắc hẳn, các mã
hóa tốc độ thấp này sẽ bị hạn chế về chất lượng, đặc biệt là nhiễu và méo tần số.
2.3. Các nhân tố ảnh hưởng đến chất lượng thoại trên VoIP
Chất lượng và độ tin cậy là hai điểm tối nhất trong vô số các đặc điểm vượt trội

của VoIP trong những năm qua. Đã có nhiều cải tiến. Nhưng hầu như ai cũng quan tâm
rất nhiều đến chất lượng âm thanh trong VoIP vì chúng ta đã luôn được sử dụng các
điện thoại cố định với chất lượng hoàn hảo trong nhiều năm qua. Dưới đây là những
yếu tố chính mà ảnh hưởng đến chất lượng âm thanh trong VoIP cũng như là các
hướng xử lý để làm tối đa hóa chất lượng âm thanh.
- Băng thông
Kết nối Internet luôn luôn đứng đầu trong danh sách các yếu tố ảnh hưởng đến
chất lượng âm thanh trong cuộc hội thoại VoIP. Băng thông có thể cung cấp cho VoIP
là chìa khóa cho chất lượng âm thanh tốt. Một kết nối băng thông rộng sẽ rất tốt, miễn
là nó không được chia sẻ với quá nhiều ứng dụng truyền thông khác. Phụ thuộc quá
nhiều vào băng thông là một trong những nhược điểm chính của VoIP.
- Thiết bị
Các thiết bị phần cứng VoIP rất có thể ảnh hưởng đến chất lượng thoại. Thiết bị kém
chất lượng thường là những thiết bị giá rẻ nhất (nhưng không phải luôn luôn). Cũng
có thể là phần cứng tốt, nhưng chúng ta lại không sử dụng phần cứng phù hợp với nhu
cầu của.
- ATA/Router
Đối với một thiết bị ATA/Router, chúng ta cần xem xét các vấn đề sau:
- Kỹ thuật nén được hỗ trợ
- Khả năng xử lý tiếng dội (Echo cancellation), để giảm tiếng dội trong cuộc gọi
- Hỗ trợ Firewall và Security
- Tần số hoạt động của điện thoại
Tần số của điện thoại IP có thể gây nhiễu với các thiết bị VoIP khác. Có rất
nhiều trường hợp người sử dụng điện thoại 5,8 GHz đã gặp các vấn đề chất lượng âm


thanh. Khi tất cả các cách chẩn đoán và khắc phục sự cố đều thất bại, thay đổi điện
thoại với một với một tần số thấp hơn (ví dụ 2,4 GHz) đã giải quyết được vấn đề.
2.4. Hệ thống thu phát điển hình trong VoIP
2.4.1. Phương thức hoạt động

Tín hiệu thoại từ phía phát đến phía thu trong hệ thống thoại IP trải qua các
bước như sau: Trước hết, ở bên phát tín hiệu thoại tương tự được số hoá bằng cách lấy
mẫu theo chu kỳ, sau đó được mã hoá. Tín hiệu số sau đó được xử lý ở bộ triệt tiếng
vọng. Sau đó tín hiệu thoại số đi qua bộ phát hiện khoảng lặng VAD và sau đó là qua
bộ chèn khoảng lặng. Trong suốt chu kỳ khoảng lặng này, các gói sẽ ko đc truyền đi
hoặc sẽ truyền đi các gói có kích thước nhỏ hơn mang các thông tin tạo nhiễu nền,
điều này sẽ làm giảm tốc độ bit và ko làm mất đi cảm giác bị gián đoạn cho bên thu
(so với việc không truyền đi gói thoại nào trong chu kỳ khoảng lặng sẽ tạo cảm giác bị
gián đoạn cuộc gọi ở bên thu). Cuối cùng là công việc đóng gói thoại để truyền qua
mạng. Gói giao thức truyền thời gian thực RTP được tạo ra bằng cách chèn 12byte
header vào gói thoại. Sau đó gói RTP đc đóng gói thành gói UDP ở lớp giao vận và
đóng thành gói IP ở lớp mạng.
Việc truyền gói trong mạng IP đơn nhiên phải tính đến việc bị mất gói hoặc trễ
gói trên mạng, vì vậy ở đầu thu bộ đệm được sử dụng để giảm độ trễ (jitter) và lưu các
gói cho đến thời điểm chúng đc đọc ra theo bộ lập trình đọc ra.Để cải thiện chất lượng
thoại, ở bộ thu có thể sử dụng kỹ thuật che dấu mất gói để người nghe có cảm giác tín
hiệu được truyền liên tục, ko bị vấp (sẽ đề cập về vấn đề này sau). Cuối cùng, các gói
thoại được mở và giải nén để chuyểnđổi thành tín hiệu tương tự như ở đầu phát.
2.4.2. Chi tiết về các thành phần trong bộ thu phát VoIP:
2.4.2.1. Mã hóa thoại:
Có thể chia mã hoá thoại làm 3 loại là: mã hoá dạng sóng (waveform), mã hoá
nguồn và mã hoá lai ghép là kết hợp của 2 loại trên.
Nguyên lý của mã hoá dạng sóng rất đơn giản mà đại diện nổi tiếng của phương
pháp này là PCM và ADPCM và tất cả chúng ta đã biết nên ko cần nói lại. Ưu điểm
của phương pháp này là không phức tạp, giá rẻ, độ trễ thấp... Tuy nhiên tại các tốc độ
bit thấp (< 64kbps) nó lại ko đảm bảo đc chất lượng. Bộ mã hoá nguồn sẽ khắc phục
điểm yếu này.
Nguyên lý của bộ mã hoá nguồn là mã hoá kiểu phát âm (tức là cách thức mà
bạn phát âm ra: âm vô thanh (unvoice) hay hữu thanh (voice). Ví dụ về bộ mã hoá này
là mã hoá dự báo tuyến tính LPC. Các bộ mã hoá kiểu này có thể mã hoá tín hiệu thoại

ở tốc độ rất thấp như 2kbps. Nguyên lý cụ thể như sau: giả thiết tín hiệu tiếng nói bao
gồm âm vô thanh và hữu thanh. Đối với âm hữu thanh, nguồn kích thích bộ máy phát
âm sẽ là một dãy các xung, còn đối với âm vô thanh thì nó sẽ là nguồn nhiễu ngẫu
nhiên. Các tham số này sẽ được đóng gói và gửi đến bên thu để phân tích và tái tạo lại
dạng của nguồn âm.
Mã hoá lai ghép là sự kết hợp của mã hoá dạng sóng và mã hoá nguồn. Tiêu
biểu là CELP- dự đoán tuyến tính kích thích mã. Hoặc ACELP- dự đoán tuyến tính
kích thích mã đại số.


Một số chuẩn mã hoá thoại thông dụng của ITU-T:
- G.711: kỹ thuật PCM thông thường trong mạng PSTN. Tốc độ 64kbps.
- G.728: mô tả kỹ thuật nén thoại CELP tại tốc độ 16kbps.
- G.723.1: nén thoại hay âm thanh ở tốc độ rất thấp là 5.3 hoặc 6.3 kbps.
Phương pháp để đánh giá chất lượng thoại phụ thuộc từng phương pháp mã hoá
là điểm đánh giá trung bình MOS. 1 thang điểm 5 được dùng để đánh giá chất lượng.
Cao nhất là phương pháp PCM với MOS 4.1, trễ chỉ có 0.125ms. và thấp nhất là
ACELP với tốc độ 5.3kbps trễ cao nhất là 30ms và MOS là 3.65.
2.4.2.2. Phát hiện khoảng lặng (VAD):
Như chúng ta đã biết trong thoại PSTN thông thường, 2 kênh đi và về luôn bị
chiếm trong cuộc đàm thoại giữa 2 người, ngay cả khi 1 trong 2 người không nói câu
nào. Điều này làm lãng phí băng thông một cách khủng khiếp (có thể tới hơn 50%) vì
khi 1 người nói thì người kia sẽ ngừng nói để nghe. Những khoảng ngừng nói đấy gọi
là khoảng lặng. Trong VoIP, VAD được sử dụng tại bộ phát để tách lời thoại và khoảng
lặng. Chỉ có lời thoại được mã hoá và truyền đi để tiết kiệm băng thông.
Cơ chế của bộ VAD là so sánh năng lượng tín hiệu với 1 ngưỡng nhiễu trong
mỗi khung thoại. Thoại được phát hiện nếu năng lượng tín hiệu lớn hơn ngưỡng nhiễu.
Khi VAD phát hiện năng lượng tín hiệu giảm dưới ngưỡng nhiễu nó sẽ quy đó là
khoảng lặng và cắt bỏ các xung thoại dưới khoảng đó và dừng việc chèn khung thoại
vào gói. 1 vấn đề nữa là tại các đoạn chuyển giao giữa thoại và khoảng lặng (mở đầu

hay kết thúc khoảng lăng) có thể có 1 đoạn nhỏ tín hiệu có thể bị xén mất và do đó
chất lượng thoại cũng bị ảnh hưởng. Thêm 1 vấn đề là việc phân biệt tín hiệu thoại và
tạp âm nền trong điều kiện người nói trong môi trường có nhiều tạp âm và VAD rất
khó để phân biệt được tín hiệu thoại với nhiễu nền đó.
2.4.2.3. Triệt khoảng lặng hay truyền gián đoạn:
Như trên đã phân tích, khi bộ VAD phát hiện ra khoảng lặng, sẽ không có gói
thoại nào được truyền đi trong khoảng thời gian đó. Điều này làm tiết kiệm băng thông
1 cách đáng kể, tuy nhiên lại nảy sinh vấn đề với người nghe là sẽ có cảm giác cuộc
gọi bị đứt đoạn và còn gặp khó khăn về vấn đề đồng bộ ở bên thu. Do đó thay vào ko
truyền gói, ta có thể truyền các gói tin với kích thước nhỏ hơn trong các khoảng thời
gian gián đoạn, các gói tin này sẽ mang các tham số của nhiễu nền để bên thu từ đó
đọc ra làm cho người nghe có cảm giác thực đang đàm thoại. Bộ thu tạo đc nhiễu nền
này dựa trên các tham số chứa trong các gói mô tả chèn khoảng lặng SID nhận được từ
bên phát.
2.4.2.4. Triệt tiếng vọng:
Tiếng vọng (echo) trên một cuộc đàm thoại có thể gây cảm giác khó chịu cho
người nghe nguyên nhân là do trễ, nó là sự phản xạ của tín hiệu qua mạng và với trễ đủ
lớn để người nghe có thể cảm nhận được. Trễ lên tới 32ms là có thể gây cảm giác khó
chịu cho người nghe. Do đó trong mạng IP khi không thể giảm trễ được nữa người ta
dùng bộ triệt tiếng vọng.


2.4.2.5. Chương trình đọc ra:
Do nhiều lý do dẫn đến các gói thoại ko đến đích theo các khoảng thời gian nhất
định và thứ tự các gói cũng không còn chính xác. Sự biến động của khoảng thời gian
giữa các gói đến đích được gọi là biến động trễ (jitter).
Vấn đề này được giải quyết bằng cách sử dụng bộ đệm ở đầu thu. Như vậy các
gói đến chưa được đọc ra ngay mà được lưu trong bộ đệm trong 1 khoảng thời gian và
sau đó được đọc ra cùng các gói đến sau. Các gói đến sau thời hạn yêu cầu coi như bị
mất. Như vậy nếu thời gian đọc ra lớn thì sẽ có nhiều gói đến sau đc đọc ra nhưng lại

nảy sinh vấn đề trễ đầu cuối- đầu cuối nên cần có sự xem xét cân bằng giữa các tiêu
chí. Các phương pháp cho cho chương trình đọc ra là đọc ra theo hạn định và đọc ra
thích nghi.
2.4.2.6. Che dấu mất gói:
Mất gói xảy ra trong thoại IP khi các gói đến đích sau thời hạn đọc ra hoặc
không đến đc đích. Thuật toán che dấu mất gói được sử dụng ở bộ thu để che dấu các
gói bị mất. Đơn giản nhất là sử dụng nhiễu nền để thay thế các gói đã mất. Kỹ thuật
cao hơn là sử dụng các gói trước và sau gói bị mất còn tốt để nội suy tái tạo lại gói đã
mất.
2.5. Các giao thức báo hiệu trong VoIP
2.5.1. Giao thức báo hiệu H.323
2.5.1.1. Tổng quan về giao thức H.323
H.323 là giao thức được phát triển bởi ITU-T. H.323 ban đầu được sử dụng cho
mục đích truyền các cuộc hội thoại đa phương tiện trên các mạng LAN, nhưng sau đó
H.323 đã phát triển thành 1 giao thức truyền tải VoIP trên thế giới.
H.323 là một tập giao thức, gồm các giao thức chính:
- H.225: Là giao thức báo hiệu thiết lập và giải tỏa cuộc gọi.
- H.235: Là công cụ bảo mật hỗ trợ cho H.323.
- H.245: Là giao thức điều khiển cho phép các đầu cuối thỏa hiệp kênh và trao
đổi khả năng của chúng.
2.5.1.2. Các thành phần chính trong mạng H.323
Tiêu chuẩn H.323 đề nghị một cấu trúc mà bao gồm 4 thành phần: đầu cuối,
Gateway, Gatekeeper, và đơn vị điều khiển đa điểm MCU (Multipoint Control Unit).
Cấu trúc này được mô tả như trong hình sau:


Hình 2.10: Cấu trúc của H.323
2.5.1.2.1. Đầu cuối (Terminal)
Đây là một điểm cuối khác của LAN cung cấp thông tin thời gian thực, hai
chiều. Tất cả các đầu cuối H.323 đều yêu cầu hỗ trợ H.245, H.225, Q.931, trạng thái

công nhận đăng kí RAS (Registration Admission Status) và các giao thức truyền thời
gian thực RTP (real-time transport protocol). H.245 được dùng để điều khiển việc sử
dụng kênh, trong khi H.225 hoặc Q.931 được dùng cho báo hiệu cuộc gọi, thiết lập và
xóa cuộc gọi.
RTP được dùng như là một giao thức truyền dẫn mang thông tin lưu thoại. RAS
được sử dụng bởi điểm cuối để tương tác với gatekeeper. Một đầu cuối H.323 có thể
truyền thông với một đầu cuối H.323 khác, một gateway H.323 hoặc một MCU.
2.5.1.2.2. Gateway
Là cầu nối giữa mạng H.323 với các mạng khác như SIP, PSTN,… Gateway
đóng vai trò chuyển đổi các giao thức trong việc thiết lập và kết thúc các cuộc gọi,
chuyển đổi các định dạng dữ liệu giữa các mạng khác nhau. Chức năng phần mềm của
gateway được chia làm 4 module như hình dưới:

Hình 2.11: Kiến trúc phần mềm trong GK
- Đóng gói thoại(voice packet module): thực hiện chức năng nhận ra tín hiệu
điện của thoại, loại bỏ tiếng vọng, loại bỏ jitter, nén thoại, đồng bộ đồng hồ và đóng
gói thoại.
- Báo hiệu điện thoại(telephony signaling module): giao tiếp với điện thoại,
chuyển các chỉ thị báo hiệu thành các thay đổi trạng thái mà giao thức mạng có thể
hiểu được
- Giao thức mạng(network protocol module): chuyển giao thức báo hiệu trong
mạng điện thoại thành các giao thức báo hiệu trong mạng gói.


- Quản lý mạng(network management module): quản lý mạng bằng SNMP
(Simple Network Management Protocol).
2.5.1.2.3. Gatekeeper
Đây là một thành phần quan trọng trong cấu trúc của H.323 và có chức năng
quản lý. Nó là điểm chung tâm cho tất cả các cuộc gọi trong vùng của nó và cung cấp
các dịch vụ tới các điểm cuối. Một vùng là sự tập hợp của gatekeeper và các điểm

cuối. Nếu mạng tồn tại nhiều GK thì sẽ được thiết lập thành nhiều vùng và mỗi vùng
sẽ do một GK quản lý. Việc thông tin giữa các GK sẽ được thực hiện thông qua các
bản tin giao tiếp xác định vị trí đầu cuối trong quá trình thiết lập cuộc gọi. Tuy nhiên
GK là một thành phần tùy chọn trong cấu trúc của H.323
Cấu trúc vùng được quản lý bởi gatekeeper được trình bày trong hình sau:

Hình 2.12: Vùng Geetkeeper
Nếu gatekeeper có mặt trong hệ thống H.323 thì nó thực hiện các nhiệm vụ sau:
Dịch địa chỉ: Cho phép dịch các quy ước, các ký hiệu, các địa chỉ “email” thành
địa chỉ IP để thiết lập liên lạc IP.
Điều chỉnh công nhận (AC): sự truy cập của các đầu cuối có thể được chấp nhận
hoặc từ chối dựa vào việc xác nhận địa chỉ nguồn hoặc địa chỉ đích thời gian hoặc bất
kỳ biến số nào mà gatekeeper quản lý.
Quản lý cuộc gọi: Gatekeeper hoạt động như một điểm liên lạc ban đầu cho
người gọi, cho hai Gateway hoặc cho hai điểm cuối báo hiệu trực tiếp cho nhau.
Quản lý băng thông: Gatekeeper có thể yêu cầu các đầu cuối và Gateway thay
đổi các thông số truyền thông cuộc gọi để quản lý sử dụng băng thong
Quản lý vùng: Gatekeeper có thể yêu cầu không quá một số lượng cuộc gọi nào
đó qua kết nối có dải tần thấp để tránh giảm sút về chất lượng.
Quản lý vùng: Gatekeeper có thể yêu cầu không quá một số lượng cuộc gọi nào
đó qua kết nối có dải tần thấp để tránh giảm sút về chất lượng.
2.5.1.2.4. Đơn vị điều khiển đa điểm MCU
MCU là thiết bị hỗ trợ việc hội thoại đa điểm cho ba hoặc nhiều hơn ba đầu cuối
trong mạng H.323. Một MCU gồm 2 phần: MC (Multipoint Controller) là thành phần
bắt buộc và MP (Multipoint Processor) là thành phần tùy chọn.
Chức năng của MC là quyết định dung lượng chung của các kết cuối, có thể
định vị đầu cuối, Gateway hoặc Gatekeeper.
MP nhận các luồng dữ liệu audio, video và phân phối chúng tới các điểm cuối
tham dự vào kết nối đa điểm. MP có thể không cần đến nhưng sự vắng mặt của nó là
một gánh nặng trên đầu cuối.

2.5.1.3. Giao thức H.323
Giao thức H.323 được chia làm 3 phần chính:


- Báo hiệu H.225 RAS (Registration, Admissions, and Status): Báo hiệu
giữathiết bị đầu cuối với H.323 Gatekeeper trước khi thiết lập cuộc gọi.
- Báo hiệu H.225 Q.931 sử dụng để kết nối, duy trì và hủy kết nối giữahai đầu
cuối.
- Báo hiệu H.245 sử dụng để thiếtlập phiên truyền Media sử dụng giaothức RTP.
2.5.1.3.1. H.225
H.225 bao gồm các bản tin RAS và Q.931. Các bản tin RAS liên quan đến việc
quản lý user, còn Q.931 mang phần báo hiệu cuộc gọi. Cả hai giao thức dùng kênh kết
nối riêng là kênh RAS và kênh báo hiệu cuộc gọi.
a, Bản tin RAS(Registration, Admission, Status)
Chức năng chính của các bản tin RAS:
- EP(endpoint) phát hiện ra GK mà chúng sẽ phải đăng ký.
- EP đăng ký với GK của nó.
- EP phải yêu cầu sự cho phép của GK khi khởi tạo một cuộc gọi.
- EP yêu cầu giải phóng cuộc gọi.
- Trước khi ngắt kết nối với GK, EP phải ngắt đăng ký.
Bản tin RAS được gửi đi bằng giao thức vận chuyển UDP. EP và GK trao đổi
thông tin trên kênh RAS theo dạng client-server.
Các bản tin RAS:
Bản tin RAS
GRQ
GCF
GRJ
RRQ
RCF
RRJ

ARQ
ACF
ARJ
DRQ
DCF
DRJ

Ý nghĩa
Gatekeeper Request
Gatekeeper Confirm
Gatekeeper Reject
Registration Request
Registration Confirm
Registration Reject
Admission Request
Admission Confirm
Admission Reject
Disengage Request
Disengage Confirm
Disengage Reject

b, Q.931
Q.931 là khuyến nghị của ITU-T cho báo hiệu cuộc gọi, làm chức năng thiết
lập, duy trì và kết thúc cuộc gọi. Bản tin Q.931 được vận chuyển bằng giao thức TCP.
EP sẽ thương lượng lắng nghe trên port nào. Quá trình thỏa thuận này được thực hiện
bằng các bản tin RAS (trong call Admission), port 1720 thường được chọn.
Bản tin Q.931
Ý nghĩa
Setup
Bản tin đầu tiên trong quá trình

khởi tạo cuộc gọi
CallProceeding
Không có thông tin thiết lập
cuộc gọi nào nữa.
Alerting
Người bị gọi rung chuông


Connect
Realease Complete
2.5.1.3.2. H.245

Kết thúc việc thiết lập cuộc gọi
Kết thúc cuộc gọi

H.245 là giao thức điều khiển báo hiệu cuộc gọi giữa các EP bao gồm năng lực
trao đổi, xác định master-slave, quản lý kênh luận lý. Giao thức này được vận chuyển
bằng TCP.
Xác định Master-slave: để tránh xung đột khi cả hai bên đều khởi tạo cùng một
cuộc gọi. Đầu cuối thỏa thuận vai trò này bằng cách áp dụng theo một cách nào đó. Vai
trò này sẽ giữ nguyên trong suốt cuộc gọi.
Trao đổi năng lực: mỗi đầu cuối phải biết được khả năng của nhau bao gồm khả
năng truyền và nhận, nếu không nó có thể không chấp nhận cuộc gọi.
Quản lý kênh luận lý: đảm bảo cho đầu cuối có khả năng nhận và đọc được dữ
liệu khi kênh luận lý mở. Bản tin OpenLogicalChannel sẽ mô tả loại dữ liệu sẽ truyền
2.5.2 Giao thức báo hiệu SIP
Tại Việt NAM, chuẩn SIP chỉ mới được đưa vào ứng dụng trong dịch vụ điện
thoại Internet quốc tế từ cuối năm 2005. Trước đây khi đề cập đến VoIP, tiêu chuẩn
quốc tế thường đề cập đến là H.323. Nhưng những năm gần đây thì giao thức SIP lại
chiếm ưu thế và dần sẽ thay thế hẵn H.323, vì VoIP là một trong những dịch vụ sẽ rất

phát triển trong tương lai. Bây giờ chúng ta sẽ đi tìm hiểu cụ thể về giao thức này:
2.5.2.1. Giới thiệu
SIP (Session Initiation Protocol) là giao thức báo hiệu điều khiển lớp ứng dụng
được dùng để tạo ra, sửa đổi hoặc kết thúc các phiên truyền thông đa phương tiện
(multimedia). Các phiên multimedia bao gồm thoại Internet, hội nghị và các ứng dụng
tương tự có liên quan đến các phương tiện truyền đạt (media) như âm thanh, hình ảnh
và dữ liệu.
SIP là một giao thức dạng văn bản, rất công khai và linh hoạt. Được thiết kế
tương thích tương thích với các giao thức khác như TCP, UDP, IP,…. để cung cấp một
lĩnh vực rộng hơn cho dịch vụ VoIP.
Ưu điểm chính của SIP so với các phương thức báo hiệu khác là cung cấp một
sự mềm dẻo. SIP có thể hoạt động kết hợp với các giao thức báo hiệu khác như H.323.
SIP là một giao thức theo thiết kế mở do đó nó có thể được mở rộngđểphát triển thêm
các chức năng mới. Sự linh hoạt của các bản tin SIP cũng cho phép đáp ứng các dịch
vụ thoại tiên tiến bao gồm cả các dịch vụ di động.
Có thể sử dụng năm chức năng của SIP để thiết lập và kết thúc truyền dẫn là:
- Định vị người sử dụng : Xác định hệ thống cuối.
- Khả năng người dùng : Xác định phương tiện và thông số của nó.
- Tính sẵn sàng của người dùng : Xác định sự sẵn sàng của phía bị gọi đã đăng
ký truyền tin.
- Thiết lập cuộc gọi : Thiết lập các thông số cuộc gọi cả phía chủ gọi lẫn bị gọi.
- Điều khiển cuộc gọi : Bao gồm việc truyền và hủy cuộc gọi.


2.5.2.2. Các thành phần trong mạng SIP

Hình 2.13: Các thành phần trong mạng SIP
Nói chung SIP gồm 2 thành phần lớn là SIP Client và SIP Server
- SIP Client: Là thiết bị hỗ trợ giao thức SIP như SIP phone, chương trìnhchat…
Đây chính là giao diện và dịch vụ của mạng SIP cho người dùng.

- SIP Server: Là thiết bị trong mạng xử lý các bản tin SIP. Trong SIPServer bao
gồm 4 thành phần quan trọng như: Proxy Server (máy chủuỷ quyền), Location Server
(máy chủ định vị), Redirect Server (máychủ chuyển tiếp), Register Server (máy chủ
đăng ký).
+ Proxy Server: Là thực thể trong mạng SIP làm nhiệm vụ chuyển tiếp các
SIPrequest tới thực thể khác trong mạng. Như vậy, chức năng chính của nó trongmạng
là định tuyến cho các bản tin đến đích. Proxy server cũng cung cấp cácchức năng xác
thực trước khi cho khai thác dịch vụ. Một proxy có thể lưu(stateful) hoặc không lưu
trạng thái (stateless) của bản tin trước đó. Thôngthường, Proxy có lưu trạng thái,
chúng duy trì trạng thái trong suốttransaction (khoảng 32 giây).
+ Redirect Server: Trả về bản tin lớp 300 để thông báo thiết bị là chuyểnhướng
bản tin tới địa chỉ khác – tự liên lạc thông qua địa chỉ trả về.
+ Registrar server: Là Server nhận bản tin SIP Register yêu cầu và cập
nhậtthông tin từ bản tin request vào “location database” nằm trong LocationServer.
+ Location Server: Lưu thông tin trạng thái hiện tại của người dùng trong
mạngSIP.
2.5.2.3. Bản tin của SIP
SIP bao gồm 2 loại bản tin: bản tin yêu cầu và bản tin đáp ứng.
Bản tin yêu cầu:
- INVITE: bắt đầu thiết lập cuộc gọi bằng cách gửi bản tin mời đầu cuối khác
tham gia
- ACK: bản tin này khẳng định máy trạm đã nhận được các bản tin trả lời bản tin
INVITE
- BYE: bắt đầu kết thúc cuội gọi
- CANCEL: hủy yêu cầu nằm trong hàng đợi
- REGISTER: thiết bị đầu cuối của SIP sử dụng bản tin này để đăng ký với máy
chủ đăng ký
- OPTION: sử dụng để xác định năng lực của máy chủ



- INFO: sử dụng để tải các thông tin như âm báo
- REQUEST: cho phép user agent và proxy có thể xác định người dùng, khởi
tạo, sửa đổi, hủy một phiên.
- RETURN: được gửi bởi user agent server hoặc SIP server để trả lời cho một
bản tin request trước đó.
Bản tin đáp ứng (Response): Server gửi bản tin SIP đáp ứng (SIP response) tới
Client để báo về trạng thái của SIP Request mà Client gửi trước đó. Các SIP Response
được đánh số từ 100 đến 699, được chia thành các lớp nghĩa khác nhau.
1xx = phản hồi thông tin
2xx = phản hồi thành công
3xx = phản hồi chuyển hướng
4xx = yêu cầu bị thất bại
5xx = lỗi máy chủ
6xx = thất bại toàn cục
2.5.2.4. Mô tả cuộc gọi SIP
2.5.2.4.1. Cuộc gọi được định tuyến qua Proxy Server

Hình 2.14: Cuộc gọi qua Proxy Server
1. Proxy server nhận được bản tin INVITE từ Client.
2. Proxy server liên lạc với Location server để xác định địa chỉ của người bị
gọi.
3. Location server xác định vị trí của người được gọi và cung cấp địa chỉ server
đích.
4. Bản tin INVITE được chuyển tiếp tới địa chỉ mà Location server trả về.
5. UAS của bên gọi gửi trả lời OK để báo sẵn sang tham gia đàm thoại.
6. Proxy Server gửi tới Client bên gọi trả lời OK để báo bên gọi sẵn sàng tham
gia đàm thoại.
7. Client bên gọi gửi tới Proxy Server yêu cầu ACK để phúc đáp lại.
8. Proxy Server chuyển hoặc phát trực tiếp yêu cầu ACK này tới UAS đại
diện bên gọi.

9. Cuộc gọi thoại được thiết lập.
2.5.2.4.2. Cuộc gọi được định tuyến qua Redirect Server


Hình 2.15: Cuộc gọi qua Redirect Server
1. Redirect server nhận được bản tin INVITE từ phía UAC bên gọi.
2. Redirect server liên lạc với Location server để lấy thông tin địa chỉ
của UA được gọi.
3. Location server trả lại địa chỉ của UA được gọi.
4. Redirect server gửi lại UAC bên gọi thông tin về vị trí bên bị gọi qua thông
điệp trả lời.
5. UAC bên gọi gửi thông điệp ACK tới Redirect server để phúc đáp giao
dịch đã hoàn thành.
6. Client bên gọi gửi thông điệp INVITE trực tiếp tới địa chỉ bên gọi
được Redirect server cung cấp.
7. Nếu bên bị gọi sẵn sàng thì UAS của nó gửi lại thông điệp trả lời OK.
8. Bên gọi gửi thông điệp ACK để hoàn tất kết nối.
2.5.2.4.3. Thiết lập cuộc gọi SIP giữa 2 điện thoại
Cần có 6 bước thiết lập một cuộc gọi sử dụng giao thức SIP:
- Đăng ký, khởi tạo, xác định vị trí của người dùng.
- Xác định phương tiện truyền thông được sử dụng rồi chuyển cácthông tin liên
quan tới người nhận cuộc gọi.
- Xác nhận sự chấp nhận truyền thông của bên được gọi, bênđược gọi phải gửi
gói tin trả lời để xác nhận việc chấp nhận hay từchối cuộc gọi.
- Thiết lập cuộc gọi.
- Điều chỉnh cuộc gọi; ví dụ: giữ máy, chuyển cuộc gọi.
- Kết thúc cuộc gọi.



×