Tải bản đầy đủ (.pdf) (27 trang)

Nghiên cứu cải thiện hiệu năng định tuyến mạng ngang hàng p2p (tt)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.08 MB, 27 trang )

BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

VŨ THỊ THÚY HÀ

NGHIÊN CỨU CẢI THIỆN HIỆU NĂNG ĐINH
̣
TUYẾN MẠNG NGANG HÀ NG P2P
MÃ SỐ: 62.52.02.08

TÓM TẮT LUẬN ÁN TIẾN SĨ KỸ THUẬT

Hà Nội - 2017


Công trình hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Người hướng dẫn khoa học:
1. PGS.TS. Lê Hữu Lập
2. PGS.TS. Lê Nhật Thăng

Phản biện 1:
………………………………………………
Phản biện 2:
………………………………………………
Phản biện 3:
………………………………………………

Luận án được bảo vệ trước hội đồng chấm luận án cấp Học viện tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG



Vào hồi: giờ, ngày……..tháng…….năm 2017
Có thể tìm hiểu luận án tại:
1.
2.

Thư viện Quốc Gia Việt Nam
Thư viện Học viện Công nghệ Bưu chính Viễn thông


i

MỞ ĐẦU
Mạng ngang hàng P2P là một mạng hỗn hợp, được ta ̣o lâ ̣p trên
diê ̣n rô ̣ng bao gồm cả những người dùng mạng Internet và các mạng
máy tính chuyên nghiệp. Các mạng chồng phủ, dưới dạng các mạng
P2P, đang trở nên rất phổ biến trong những năm gần đây, do các tính
năng làm cho chúng phù hợp với việc phát triển hay triển khai các
dịch vụ mới như truyền thông đa hướng, chia sẻ dữ liệu phạm vi rộng
và phân phối nội dung như Kazaa, Napster, Bittorrent, Skype,
Sopcast. Kiế n trúc của ma ̣ng viễn thông ngày nay đang chuyể n thành
hướng dich
̣ vu ̣ thay vì xu hướng ma ̣ng trước đây, nhằm cho phép mở
ha ̣ tầ ng viễn thông cho các nhà phát triể n ứng du ̣ng để ta ̣o ra các dich
̣
vu ̣ mới theo mô hin
̀ h của ma ̣ng Internet.
Mạng ngang hàng với các ưu điểm như: Khả năng mở rộng,
khả năng chịu đựng lỗi, dễ dàng triển khai,...Tuy nhiên chính cơ chế
truyền thông ngang hàng và các yêu cầu cung cấp chất lươ ̣ng dịch vụ

đã cho thấy một số thách thức mà ma ̣ng P2P cần phải giải quyế t.
Các tính chất đă ̣c thù của ma ̣ng ngang hàng chiń h là nguyên
nhân làm ảnh hưởng tới hiê ̣u năng của ma ̣ng như: Tiêu tố n băng
thông cho quá trình duy trì cấ u hình ma ̣ng, tỷ số trễ dãn cách trung
bình Tstretch tăng (tỷ số giữa đường đinh
̣ tuyế n lớp ma ̣ng chồ ng phủ
và đường đinh
̣ tuyế n lớp nề n), tỷ lệ tổn thất gói tin cao.
Mục tiêu chính mà luận án hướng tới là nghiên cứu tìm kiếm
các giải pháp cải thiện hiệu năng hệ thống mạng ngang hàng. Để đạt
được mục tiêu chính này,


ii

luận án đã nghiên cứu xây dựng cấu trúc mạng theo cấu trúc phân
cấp và cải thiện hiệu năng thuật toán định tuyến trong hệ thống này.
Phạm vi nghiên cứu giới hạn với các hệ thống mạng ngang hàng có
cấu trúc Chord-DHT. Tham số hiệu năng của hệ thống được đánh
giá, khảo sát trong luận án là: Băng thông tiêu tốn, trễ (latency), tỷ lệ
trễ dãn cách trung bình, tỷ lệ tổn thất gói tin, đô ̣ dài đường tim
̀ kiế m,
kích thước bảng đinh
̣ tuyế n, tỷ lệ tìm kiếm thành công, chi phí bầu
chọn siêu nút.
Để đạt được mục tiêu nghiên cứu nêu trên, các nhiệm vụ nghiên
cứu trong quá trình thực hiện luận án được xác định bao gồm: (1)
nghiên cứu tổng quan về mạng P2P, (2) đề xuất các giải pháp cải
thiện hiệu năng hệ thống mạng P2P và (3) kiểm chứng các giải
pháp đã đề xuất. Phương pháp nghiên cứu được sử dụng trong luận

án là nghiên cứu lý thuyết dựa trên mô hình giải tích với các công cụ
toán học kết hợp với mô phỏng.
Luận án bố cục thành bốn chương như sau:
Chương 1: Tổ ng quan về ma ̣ng ngang hàng (P2P)
Chương 2 : Đánh giá hiệu năng thuâ ̣t toán định tuyến DHTs
Chương 3 : Cải thiê ̣n hiê ̣u năng thuâ ̣t toán đinh
̣ tuyế n Chord
Chương 4 : Xây dựng ma ̣ng ngang hàng Chord_SL phân cấ p cải
thiê ̣n hiê ̣u năng
Kết luận và định hướng nghiên cứu tiếp theo.
Hà nội, tháng 2 năm 2017


-1-

CHƯƠNG 1: TỔNG QUAN VỀ MẠNG P2P

Tóm tắt: Chương một tập trung nghiên cứu các đặc tính kỹ thuật của
mạng ngang hàng cùng với các ứng dụng điển hình, các vấn đề ảnh
hưởng tới hiê ̣u năng mạng ngang hàng; tiếp cận giải quyết vấn đề cải
thiê ̣n hiê ̣u năng mạng ngang hàng và các điểm mấu chốt của thuật toán
định tuyến dựa trên bảng băm phân tán và tìm kiế m tố i ưu. Đặc biệt,
các giải pháp cải thiện hiệu năng thuật toán đi ̣nh tuyế n DHTs của các
nghiên cứu trong nước và trên thế giới cũng được phân tích nhằm sáng
tỏ cách thức tiếp cận mục tiêu của luận án.
1.1 Tổng quan về ma ̣ng ngang hàng
Mạng chồng phủ ngang hàng là mạng máy tính được xây dựng
trên nền của một mạng khác. Các nút trong mạng ngang hàng được
kết nối với nhau bằng liên kết logic, mỗi liên kết logic có thể bao
gồm rất nhiều các liên kết vật lý của mạng nề n tảng (Internet).

Overlay

IP

Hình 1-1. Mô hin
̀ h ma ̣ng chồ ng phủ ngang hàng


-2-

1.1.1

Kiến trúc ma ̣ng ngang hàng P2P

Chia sẻ file, tin nhắ n tức thời, luồ ng
video, phân tán, tính toán,…

Application Layer
( Lớp ứng du ̣ng)

Quản lý nút ma ̣ng phủ, quản lý
và tìm kiế m tài nguyên,…
TCP, UDP/IP

Overlay Network Layer
( Lớp ma ̣ng chồ ng phủ)
Underlying Network Layer
( Lớp ma ̣ng nề n )

Hình 1-2. Kiế n trúc phân lớp điể n hin

̀ h ma ̣ng ngang hàng P2P
Dựa trên cấ u trúc và thuâ ̣t toán đinh
̣ tuyế n trong lớp ma ̣ng chồ ng
phủ, kiế n trúc ma ̣ng chồ ng phủ P2P đươ ̣c chia thành mô hiǹ h tâ ̣p
trung, phân tán và lai ghép [48], [63]. Mô hình phân tán đươ ̣c chia
làm hai loa ̣i không cấu trúc, có cấ u trúc, phân cấp và không phân
cấp.
1.1.2

Thách thức khi nghiên cứu ma ̣ng ngang hàng P2P

Bên cạnh các ưu điểm về khả năng mở rộng, khả năng chịu đựng
lỗi, dễ dàng triển khai, chính cơ chế truyền thông ngang hàng và các
yêu cầu cung cấp chất lươ ̣ng dịch vụ, đã cho thấy một số thách thức
mà ma ̣ng P2P cần phải vươ ̣t qua về mặt hiệu năng: Tính động (Churn
rate); Không đồng nhất hiệu năng giữa mạng chồng phủ ngang hàng
và mạng nền (Topology Mismatch); Tính bảo mật; Đô ̣ tin câ ̣y ; Cân
bằng tải.
1.2 Tham số hiêụ năng ma ̣ng ngang hàng
-

Đô ̣ dài đường tìm kiế m (Query path length )

-

Tỷ lê ̣ tim
̀ kiế m thành công (Lookup Success Rate)

-


Đô ̣ dài đường tim
̀ kiế m trung bình (Mean Hop Count)

-

Trễ (Latency)


-3-

-

Tỷ lê ̣ trễ dãn cách trung biǹ h (Average stretch) Tstretch là tỷ
số giữa trễ trung bình tìm kiếm qua mạng chồ ng phủ P2P và
trễ trung bình tìm kiếm qua mạng nề n (IP).

Tstretch 
-

Tdelay overlay
Tdelay IP

(1.3)

Băng thông tiêu tố n (bandwidth consumption)

1.3 Các hướng tiế p câ ̣n nghiên cứu cải thiêṇ hiêụ năng ma ̣ng
ngang hàng
1.3.1


Các công trình nghiên cứu trong nước

Ở Việt Nam số lượng các kết quả nghiên cứu về các vấn đề liên
quan đến hệ thống P2P phân cấp còn rất hạn chế.
1.3.2

Các công trình nghiên cứu trên thếgiới

Để có thể triể n khai các dich
̣ vu ̣ trên quy mô lớn hầu hết nghiên
cứu đề u tâ ̣p trung vào ma ̣ng ngang hàng có cấu trúc. Qua khảo sát
hướng nghiên cứu cải thiê ̣n hiê ̣u năng của tác giả trước chủ yếu tập
trung vào hai hướng chính:
(i) Hướng nghiên cứu thứ nhấ t: Tố i ưu cấ u trúc ma ̣ng chồ ng phủ:
các tác giả trước đề u tâ ̣p trung giải quyế t hai vấ n đề : Mạng có có độ ổn
định thấp và hiệu năng không đồng nhất giữa mạng nền và ma ̣ng chồ ng
phủ. Mô hiǹ h phân cấ p có hiê ̣u năng đinh
̣ tuyế n tố t hơn so với mô hiǹ h
không phân cấ p [37], [14], [25], [2], [35], [61]. Viê ̣c tính toán kić h
thước của nhóm trong ma ̣ng phân cấ p cũng ảnh hưởng tới đô ̣ dài đường
tìm kiế m [37].
(ii) Hướng nghiên cứu thứ hai: Cải thiêṇ đinh
̣ tuyế n DHTs: Đinh
̣
tuyế n bao gồ m xây dựng cấ u trúc bảng đinh
̣ tuyế n (Routing Structure)
và kỹ thuật đinh
̣ tuyế n (Routing Scheme), đây là vấ n đề then chố t ảnh
hưởng tới hiê ̣u năng tổ ng thể ma ̣ng P2P [75]. Hiê ̣n nay với các cách



-4-

tiế p câ ̣n khác nhau nên DHTs có nhiề u kỹ thuâ ̣t đinh
̣ tuyế n đươ ̣c đề
xuấ t như Kademlia, Chord, Pastry, Tapestry, CAN,...Tuy nhiên DHTs
mới chỉ giải quyế t đươ ̣c vấ n đề mở rô ̣ng quy mô và hiê ̣u quả tim
̀ kiế m.
Nhưng khi triể n khai DHTs trong ma ̣ng không đồ ng nhấ t và đô ̣ ổ n đinh
̣
thấ p thì DHTs có nhiề u ha ̣n chế [43], [53], [63], [80], [36], [77], [27],
[54].
1.4 Hướng nghiên cứu của luận án
1.4.1 Nhận xét về công trình nghiên cứu của các tác giả khác
Từ những khảo sát và phân tích các nghiên cứu về cải thiê ̣n hiê ̣u năng
ma ̣ng ngang hàng đã được đề xuất trước đây, cho thấy các nghiên cứu
mới chỉ quan tâm giải quyết được một trong hai vấn đề tính ổn định và
tính không đồng nhất. Tuy nhiên cả hai vấn đề trên đều ảnh hưởng tới
hiệu năng của hệ thống, để cải thiện hiệu năng của P2P cần phải cân
bằng được hai yếu tố giảm chi phí để duy trì mạng và giảm trễ qua
mạng chổng phủ. Xuất phát từ các khảo sát và phân tích ở trên luận án
đề xuất cải thiện cấu trúc của mạng P2P và cải thiện thuật toán định
tuyến, đưa trễ qua mạng IP vào xem xét trong quá trình tìm đường để
cân bằng hai yếu tố phân tích ở trên. Trên cơ sở kết quả phân tích các
hạn chế của các nghiên cứu liên quan, hướng nghiên cứu được đề xuất
trong luận án này là:
Cải thiện hiệu năng thuâ ̣t toán định tuyến Chord trong quá
trình tìm đường .
(1)


Đề xuất mô hình mạng Chord_SL phân cấ p cải thiê ̣n hiê ̣u
năng định tuyến .
(2)
(3)

Đề xuất hàm giá bầu chọn siêu nút cải thiện hiệu năng trong

mô hình phần cấp .


-5-

1.5 Kết luận chương 1
Mô hiǹ h P2P dựa trên bảng băm phân tán DHT có khả năng mở
rộng, khả năng chịu lỗi, dễ dàng triển khai, đươ ̣c coi là giải pháp then
chố t của ma ̣ng ngang hàng thế hê ̣ thứ 3. Tuy nhiên DHTs mới chỉ
giải quyế t đươ ̣c vấ n đề quy mô và hiê ̣u quả tim
̀ kiế m. Các khó khăn
khi triể n khai các thuâ ̣t toán DHTs trên ma ̣ng P2P cũng đươ ̣c phân
tić h trong chương mô ̣t. Mu ̣c cuố i của chương 1 đề câ ̣p đế n các tham
số hiê ̣u năng của các DHTs và phân tić h hướng nghiên cứu cải thiê ̣n
hiê ̣u năng của P2P. Kế t quả nô ̣i dung của chương mô ̣t đươ ̣c thể hiê ̣n
trong bài báo khoa ho ̣c [V1].
CHƯƠNG 2: PHÂN TÍ CH ĐÁNH GIÁ HIỆU NĂNG
THUẬT TOÁN ĐINH
TUYẾN DHTs
̣

Tóm tắt:Các thuật toán đi ̣nh tuyế n DHTs đã được các nghiên cứu
chứng minh là có hiê ̣u năng tố t như: Cân bằng tải, tìm kiế m vị trí dữ

liệu dễ dàng, khả năng chịu đựng lỗi, khả năng mở rộng. Chương hai
phân tích hoạt động của ba thuật toán đi ̣nh tuyế n DHTs: Kademlia,
Tapestry và Chord. Việc mô phỏng được thực hiện bằng phần mềm mô
phỏng OverSim. Kết quả của việc nghiên cứu đã chỉ ra những điểm
mạnh và điểm yếu của các thuật toán DHTs, là tiền đề cho việc cải
thiện các thuật toán đi ̣nh tuyế n DHTs trong nghiên cứu tiế p theo.
2.1 Bảng băm phân tán – DHT
DHT sử du ̣ng hàm băm nhấ t quán SHA1 để cung cấp ánh xạ từ
khóa/giá tri ̣ (key/value). Nhưng không giống như bảng băm thông
thường, các giá trị trong một DHT được lưu trên các nút khác nhau
trong mạng chứ không phải lưu trong một cấu trúc dữ liệu cục bộ.


-6-

Hình 2-1. Tim
̀ kiế m và lưu trữ dữ liêụ trong DHT
2.2 Một số thuâ ̣t toán đinh
̣ tuyế n DHTs
Ba thuâ ̣t toán đinh
̣ tuyế n DHTs được lựa chọn nghiên cứu:
Kademlia, Tapestry và Chord. Cả ba thuâ ̣t toán đinh
̣ tuyế n này được
thiết kế nhằm cải thiện hiệu năng tìm kiếm dữ liệu [74], [34], [47]. Tuy
nhiên, những thuâ ̣t toán đinh
̣ tuyế n này lại sử dụng các cách tiếp cận
khác nhau. Sở dĩ các thuâ ̣t toán đinh
̣ tuyế n DHTs này được luận án
chọn để nghiên cứu bởi chúng có những đặc tính tiêu biểu để so sánh
với các thuâ ̣t toán DHTs khác.

Phân tích, đánh giá hiêụ năng mô ̣t số thuâ ̣t toán đinh
̣ tuyế n

2.3

DHTs
2.3.1

Lựa chọn công cụ mô phỏng mạng chồng phủ ngang hàng
Qua nghiên cứu và phân tích và khảo sát, luận án đã chọn

OverSim để thực hiện mô phỏng thử nghiệm cho các kịch bản trong
luận án.
2.3.2

Mô phỏng đánh giá hiệu năng các thuâ ̣t toán định tuyến
DHTs

2.3.2.1 Tham số hiệu năng
Tham số hiê ̣u năng đươ ̣c dùng để so sánh hiê ̣u năng của ba thuâ ̣t
toán đinh
̣ tuyế n DHTs là: tỷ lê ̣ tìm kiế m thành công, tỷ lệ trễ dãn cách
trung bình Tstretch và băng thông tiêu tố n, thời gian trễ, độ dài đường tìm
kiếm (Hop count).


-7-

2.3.2


Kết quả mô phỏng và thảo luâ ̣n
Dựa trên kết quả mô phỏng, có thể thấy Tapestry hoạt động tốt

khi số nút tăng, băng thông tiêu tốn tăng không đáng kể, tỷ lệ thành
công được duy trì trên 99%, Tstretch hầu như không thay đổi. Đối với
Kademlia, khi số nút tăng, tỷ lệ tìm kiếm thành công giảm xuống dưới
96%, Tstretch tăng, băng thông tiêu tốn giảm. Điều đó chỉ ra rằng,
Kademlia hoạt động tốt với số nút ít hơn nhưng tiêu tốn băng thông
nhiề u hơn. Đối với Chord, khi số nút tăng, băng thông tiêu tốn tăng
không đáng kể, tỷ lệ thành công được duy trì trên 96%. Tuy nhiên khi
mạng có độ ổn định thấp có nghĩa là khi thời gian hoạt động trung bình
của nút nhỏ thì tỷ lệ tìm kiếm thành công giảm đáng kể. Hơn nữa tỷ lệ
trễ dãn cách trung bình giữa đường định tuyến lớp chồng phủ và đường
định tuyến của lớp nền tảng quá lớn khoảng gấp ba lần. Điều này dẫn
tới trễ tìm kiếm tăng và dẫn tới giảm chất lượng dịch vụ khi triển khai
qua mạng P2P.
Qua kết quả phân tích và mô phỏng để phù hợp với mục tiêu của
luận án, thuật toán Chord sử dụng kỹ thuật tìm kiếm đệ quy đã được
chọn vì các tham số hiệu năng của Chord khá ổn định khi triển khai trên
mạng diện rộng, đặc biệt chi phí cho việc duy trì ổn định của mạng nhỏ
hơn so với các thuật toán khác. Chord tìm kiếm đệ quy còn cải thiện
50% thời gian trễ trung bình so với Chord tìm kiếm lặp. Tuy nhiên
Chord cũng còn một số vấn đề cần giải quyết như: đường định tuyến
lớp chồng phủ quá xa so với đường định tuyến lớp nền tảng, hiệu năng
thấp khi mạng không ổn định.
2.4 Kết luận chương 2
Chương hai phân tić h hoa ̣t đô ̣ng của ba thuâ ̣t toán DHTs, qua kế t
quả phân tić h lý thuyết và mô phỏng Chord phù hơ ̣p với các ứng du ̣ng



-8-

quy mô lớn triể n khai trên ma ̣ng ngang hàng, với rấ t nhiề u các đă ̣c tiń h
hấ p dẫn như: Đơn giản, phân tán, tự tổ chức, khả dụng, mở rộng, cân
bằ ng tải,…Bên ca ̣nh đó viê ̣c đánh giá hiệu năng của các thuâ ̣t toán định
tuyến DHTs cũng đươ ̣c thực hiê ̣n qua phầ n mề m mô phỏng OverSim,
qua kế t quả mô phỏng cho thấ y các tham số hiê ̣u năng của thuâ ̣t toán
Chord duy trì ổn định khi ma ̣ng có kích thước lớn và cấ u trúc ma ̣ng có
“Churn rate” cao. Nội dung của chương là kết quả nghiên cứu được
công bố ta ̣i [V2].
CHƯƠNG 3: CẢI THIỆN HIỆU NĂNG THUẬT TOÁN
ĐINH
TUYẾN CHORD
̣
Tóm tắt:Chord là một thuật toán đi ̣nh tuyế n DHT được đánh giá đơn
giản, dễ triển khai, hiê ̣u quả tìm kiế m phù hợp với mạng có kích thước
lớn. Chương ba phân tích hoạt động của thuật toán đi ̣nh tuyế n Chord,
qua đó thấ y được ưu nhược điể m của thuật toán; đồ ng thời phân tích
các hướng nghiên cứu cải thiện Chord của các tác giả trước để đưa ra
hướng nghiên cứu cải thiê ̣n. Chord đại diê ̣n tiêu biểu cho thuật toán
đi ̣nh tuyế n DHT, được phát triể n từ lâu và rấ t thích hợp để triể n khai
các di ̣ch vụ trên diê ̣n rộng. Nội dung chương phân tích lý do chọn thuật
toán Chord trong nghiên cứu; Các hướng cải thiê ̣n thuật toán Chord;
Cải thiê ̣n thuật toán đi ̣nh tuyế n Chord và phân tích đánh giá mô phỏng
so sánh với các nghiên cứu cải thiê ̣n trước đây.


-9-

3.1 Thuâ ̣t toán đinh

̣ tuyế n Chord

Hình 3-1. Biểu diễn vòng Chord (M= 6) gồm 10 nút
Thuâ ̣t toán Chord đã được IETF P2PSIP nhóm 79 lựa chọn như
mô ̣t tiêu chuẩn của bô ̣ giao thức P2PSIP [76], [77]. Như vậy, tấ t cả các
ứng du ̣ng thoa ̣i VoIP qua ma ̣ng P2P cho ̣n Chord như mô ̣t giao thức nề n
tảng [2], [25], [54], [77], [75], v.v. Do đó, việc cải thiê ̣n hiê ̣u năng thuâ ̣t
toán đinh
̣ tuyế n Chord góp phầ n cải thiê ̣n chấ t lươ ̣ng dich
̣ vu ̣ thoa ̣i qua
ma ̣ng ngang hàng (P2P VoIP).
3.2

Cải thiêṇ hiêụ năng thuâ ̣t toán Chord

3.2.1 Phân tích các điể m yế u của thuâ ̣t toán Chord
Chord có rấ t nhiề u ưu điể m, tuy nhiên khi triể n khai trên ma ̣ng có
đô ̣ ổ n đinh
̣ thấ p (các nút gia nhập/rời mạng liên tục trong thời gian
ngắn) thì Chord đã bộc lộ những những vấ n đề sau: Không có sự cập
nhập bảng định tuyến tức thời khi có sự thay đổi nút mạng; Chord thiếu
các cơ chế nhớ đệm (Cache memory); Trễ định tuyến qua mạng chồng
phủ lớn hơn rất nhiều so với trễ định tuyến qua lớp nền; dư thừa dữ liê ̣u
trong bảng finger và không gian tim
̀ kiế m chỉ giới ha ̣n trong mô ̣t nửa
vòng tròn Chord.


-10-


3.2.2

Hướng cải thiêṇ hiêụ năng của thuâ ̣t toán Chord
Để cải thiê ̣n hiê ̣u năng của Chord, chúng tôi đã đưa ra một

phương pháp cải thiện thuật toán định tuyến Chord gốc qua việc làm
bảng finger mở rộng phạm vi tìm kiếm mà không phải chiếm giữ thêm
bất cứ không gian phụ nào. Hơn nữa, để cải thiện trễ và tỷ lệ trễ dãn
cách trung bình , tham số đinh
̣ tuyế n kế t hơ ̣p cả khoảng cách định danh
ID của Chord truyền thống và trễ toàn tuyến RTT (Round Trip Time)
qua lớp nề n ( RTT được đo bằng lệnh ping). Chord cải thiê ̣n trong luâ ̣n
án đã cải thiê ̣n so với các công trình nghiên cứu của các tác giả [60],
[86], [11].
Cu ̣ thể bảng đinh
̣ tuyế n Chord luâ ̣n án đã mở rô ̣ng không gian
định tuyến ra cả vòng tròn Chord, đô ̣ dài trung bình đường định tuyến
đa ̣t đươ ̣c giố ng như nghiên cứu [86], [11], giảm một nửa so với Chord
truyền thống [60]. Thuâ ̣t toán Chord cải thiện đã giảm được

1
2

kích

thước bảng định tuyến so với [86], [11]. Để thẩ m định và kiểm tra thuâ ̣t
toán Chord cải thiê ̣n và đánh giá các đề xuất cải thiê ̣n hiệu năng, luâ ̣n
án sử dụng công cụ phân tích và mô phỏng OverSim [6]. Đây là công
cụ mô phỏng mạng P2P được sử dụng phổ biến trong các nghiên cứu về
P2P. Kết quả mô phỏng cho thấy rằng thuâ ̣t toán Chord cải thiện có

hiệu năng tốt hơn so với các nghiên cứu trước đây.


-11-

3.2.3

Cấu trúc mạng Chord cải thiêṇ trong luâ ̣n án

Hình 3-5. Cấ u trúc ma ̣ng Chord cải thiêṇ
Để giải quyế t vấ n đề “Topology mismatch” nghiên cứu trong
luâ ̣n án cải tiến bảng định tuyến và cài đă ̣t thêm 1 trường vào bảng định
tuyến để lưu thời gian trễ qua mạng vật lý, ký hiệu là delay[i]. Để duy
trì delay[i] là rất quan trọng, nó được dùng để giảm trễ tìm kiếm. Khi
chạy thủ tục ổ n đinh
̣ stabilize(), bảng định tuyến của các nút liên quan
sẽ được cập nhật và trường delay[i] cũng được cập nhật tại thời điểm
này. Vì vậy hoạt động cập nhật delay[i] được cài đă ̣t vào thuâ ̣t toán ổ n
đinh
̣ stabilize(). Đồng thời việc loại bỏ thông tin dư thừa trong bảng
finger được thực hiện mỗi khi cập nhật bảng finger (fix_fingers). Khi
cập nhật bảng finger, trước tiên sẽ kiểm tra xem có mục nào dư thừa
trong bảng finger không. Nếu có thông tin dư thừa sẽ thay đổi nội dung
của con trỏ tại các thực thể trong bảng định tuyến đó bằng địa chỉ của
các nút ở nửa còn lại của vòng Chord. Do đó không gian tìm kiếm sẽ
mở rộng sang nửa vòng Chord còn lại. ID nút mới được tính theo tỷ số
của A và B ( A  2 M  1  n  k ) và B= (count +1). A cho biết khoảng
cách giữa nút nguồn có định danh ID n và nút k có ID lớn nhất trong
bảng đinh
̣ tuyế n. Và B phản ánh mức độ dư thừa con trỏ trong các mục

của bảng finger. Biến đếm count cho biết số con trỏ dư thừa.


-12-

Bảng 3-4.So sánh hiêụ năng Chord cải thiêṇ
Tham số hiê ̣u năng

Chord gố c

Chord [86],[11]

[60]

Chord cải thiê ̣n
[V3]

1

Đô ̣ dài đường tìm kiế m

O(logN)

O( logN)

1
O( log 4 N)
2

Kích thước bảng đinh

̣ tuyế n

O(logN)

O(logN2)

O(logN)

O(log N ) 2

O(2 log N ) 2

O(log N ) 2

Số yêu cầu xử lý khi một

2

nút gia nhập / rời mạng

Chiến lược tim
̣
̀ kiế m của thuâ ̣t toán Chord cải thiên:
Quá triǹ h tìm kiế m của thuâ ̣t toán Chord cải thiê ̣n đươ ̣c thực hiê ̣n theo
các bước như sau:
Bước 1: Nút n yêu cầu tìm kiếm nguồn tài nguyên k nếu k nằm giữa n
và Successor. Việc tìm kiếm kết thúc và n trả kết quả tìm kiếm về cho
Successor. Nếu không chuyển đến bước 2.
Bước 2: Dựa vào quy tắc a và b chọn chặng kế tiếp n'. Gửi truy vấ n tìm
kiếm đến nút n' và lặp lại bước 1.

1
(a)Nếu (k  n  2 M ) mod 2 M  (0, N )
2

N  2 M thì chọn nút n' min{delay[i]}

1
(b) Nếu (k  n  2 M ) mod 2 M  ( N , N  1) N  2 M thì cho ̣n chă ̣ng kế tiế p n'
2

max  d clockwise ( finger[i ]  n)
3.2.4

Mô phỏng đánh giá hiêụ năng thuâ ̣t toán Chord cải thiêṇ
Để kiể m tra đánh giá hiê ̣u năng thuâ ̣t toán Chord cải thiê ̣n, luận

án sử du ̣ng phầ n mề m mô phỏng OverSim. Các bước đánh giá nhằ m so
sánh giữa thuâ ̣t toán đinh
̣ tuyế n Chord gố c [60] với Chord cải thiê ̣n.
Các tham số hiệu năng được dùng để đánh giá: trễ tìm kiếm, Tstretch, độ


-13-

dài trung bình đường tìm kiếm (Hop count), băng thông tiêu tốn. Kích
thước ma ̣ng với số các nút 500 đến 10.000 nút. Kết quả mô phỏng cho
thấy hiệu năng của Chord được cải thiện, tuy nhiên do phải tính toán trễ
nên độ phức tạp tính toán và chi phí băng thông cho các lệnh ping cũng
làm Chord cải tiến có băng thông tiêu tốn tăng so với các nghiên cứu
trước.


Hình 3-7. So sánh độ dài trung bin
̀ h đường tìm

Hình 3-6. So sánh thời gian trễ tìm

kiế m

kiếm trung bình và kích thước ma ̣ng

Hình 3-8. Tỷ lê ̣ trễ dãn cách trung bin
̀ h Tstretch

Hình 3-9. Băng thông tiêu tốn và thời

và số nút

gian hoạt động trung bình của nút

3.4

Kế t luâ ̣n chương 3
Nô ̣i dung chương ba đưa ra một phương pháp cải thiê ̣n hiê ̣u năng

của Chord. Mu ̣c tiêu của Chord cải thiê ̣n tố i ưu trễ tim
̀ kiế m và đô ̣ dài
trung biǹ h đường tim
̀ kiế m qua ma ̣ng chồ ng phủ ngang hàng. Chord cải
thiê ̣n đã cải tiến cấu trúc bảng finger và sửa đổ i thuâ ̣t toán stabilize và
fix_finger và cài đă ̣t trong OverSim. Qua phân tić h và mô phỏng cho



-14-

thấ y hiệu năng của thuâ ̣t toán Chord cải thiê ̣n tốt hơn thuâ ̣t toán Chord
gốc [60] và Chord của nghiên cứu [86], [11]. Cu ̣ thể Chord cải thiê ̣n đa ̣t
đươ ̣c hiê ̣u năng tim
̀ kiế m giố ng nghiên cứu [86], [11]. Kić h thước bảng
đinh
̣ tuyế n bằ ng nghiên cứu [60] và giảm mô ̣t nửa so với nghiên cứu
[86], [11]. Để giải quyế t vấ n đề “Topology mismatch”, luâ ̣n án đã đề
xuất đưa trễ mạng nền vào xem xét. Trong quá trình định tuyến, thuâ ̣t
toán Chord cải thiê ̣n đã dung hòa được giữa khoảng cách ID lớp chồ ng
phủ và trễ mạng nề n IP. Hơn nữa, nó không chỉ có thể nhận được các
nút tiếp theo gần đến đích, mà còn giải quyết vấn đề đồ ng nhấ t hiê ̣u
năng giữa lớp ứng dụng với lớp nề n . Kế t quả nô ̣i dung chương 3 đươ ̣c
thể hiê ̣n trong bài báo khoa ho ̣c [V3].
CHƯƠNG IV: XÂY DỰNG MẠNG CHORD_SL PHÂN
CẤP CẢI THIỆN HIỆU NĂNG
Tóm tắt : Cùng với sự phát triển nhanh chóng của số lượng người
dùng Internet, việc cải thiê ̣n hiê ̣u năng các dịch vụ triển khai trên nền
Internet là rất cầ n thiế t. Điển hình dịch vụ thoại IP truyền thống viê ̣c
tìm kiế m người dùng dựa trên máy chủ trung tâm, vì vậy luôn phải đối
mặt với nhiều vấn đề, ví dụ như: Tấn công từ chối dịch vụ, lỗi máy chủ
trung tâm và nghẽn máy chủ,…Gần đây, công nghệ mạng P2P được sử
dụng rộng rãi trong các ứng dụng chia sẻ file. Tuy nhiên, nó hỗ trợ khá
chậm việc tìm kiếm và lựa chọn các file nguồn, không phù hợp cho hệ
thống truyền thông thời gian thực.
Do đó, một mạng Chord_SL phân cấ p được đề xuất để đạt được
yêu cầ u tìm kiế m địa chỉ nhanh trong truyền thông thoại P2P. Mạng

Chord_SL được xây dựng dựa trên kiến trúc hai lớp và sử dụng thuật
toán Chord cải thiện. Các kết quả phân tích chỉ ra rằng mạng phân cấ p


-15-

Chord_SL cải thiê ̣n hiê ̣u năng hơn so với các mô hình di ̣ch vụ triển khai
trên mạng Chord truyề n thố ng và các cấ u hình Chord phân cấ p của
nghiên cứu gầ n đây.
4.1

Giới thiệu chung
Để cải thiện hiệu năng tìm kiếm và thích ứng với mạng không ổn

định, các nút không đồng nhất, việc phát triển một ma ̣ng Chord phân
cấp P2P là cần thiết [99], [37], [14], [25], [2], [35]. Tuy nhiên các
nghiên cứu đề u triển khai trên mạng Chord truyền thống, độ phức tạp
không gian lưu trữ của các siêu nút là O(𝑙𝑜𝑔2 𝐾 + 𝑁/𝐾). Mô hiǹ h
ma ̣ng phân cấ p Chord_SL trong luận án được triển khai trên thuâ ̣t toán
Chord cải thiện [V3]. Ngoài ra để giảm trễ, mô hình đã kết hợp với việc
phân cấp dựa trên vị trí, kỹ thuật này đã cải thiện tỷ lê ̣ trễ dãn cách qua
ma ̣ng P2P.
4.2 Mô hin
̀ h ma ̣ng Chord_SL phân cấ p cải thiện hiệu năng
4.2.1

Xây dựng mô hình

Mô hình thiết kế dựa trên 2 vòng tròn Chord cải thiê ̣n, hê ̣ thố ng quản lý
N nút ký hiệu Chord_SL. Cấ u trúc ma ̣ng được chia làm hai lớp: Lớp

liên miền (superlayer) quản lý K cụm nội miền và các lớp nội miền
(local layer) có N / K . Các nút tham gia vào ma ̣ng Chord của hai lớp
và định tuyến theo nguyên tắc đã cải thiện trong nghiên cứu [V3].


-16-

Hình 4-1. Mô hình ma ̣ng phân cấp Chord_SL
4.2.2

Gán định danh cho các nút dựa vào địa chỉ IP
Để giảm trễ, mô hình Chord_SL phân cấp định danh dựa trên

tên miền của định danh ngoài. Một nút muốn lấy thông tin ở một miền
khác, nó phải định tuyến truy vấn của mình tới SN trong cụm để từ đó
có thể tìm được SN của miền đích. Định danh ID bao gồm 2 phần : tiền
tố có chiều dài (D-d) bít và định danh hậu tố có độ dài d bít

Hình 4-2. Gán định danh cho nút SN và nút ON [25]


-17-

4.2.3

Xây dựng hàm giá bầu chọn siêu nút trong mạng Chord_SL

G3

t on(p)


.

P( p )

.

B( p )

(4.4)

t on(SN) P( SN ) B( SN )

Trong đó 𝑡𝑜𝑛(𝑝) , 𝑃(𝑝) , 𝐵(𝑝) lầ n lươ ̣t là thời gian hoạt động trung
bình của nút, khả năng xử lý CPU được tính bằng MIPS (Million
Instruction Per Second), băng thông của nút của một nút p bất kỳ;
𝑡𝑜𝑛(𝑆𝑁) , 𝑃(𝑆𝑁) , 𝐵(𝑆𝑁) lầ n lươ ̣t là các giá tri ̣ yêu cầ u tố i thiể u của các
tham số đố i với mô ̣t nút SN, giá tri ̣ tham số đươ ̣c cho ̣n tùy theo mu ̣c
tiêu của từng dich
̣ vu ̣ triể n khai.
4.2.4

Chiến lược tìm kiếm trong mạng Chord_SL

Bước 1: p chuyển tiếp truy vấn đến S (supernode) trong nhóm của
mình. Do trong mô hình Chord_SL tất cả các nút nội miền đều chứa
liên kế t đế n SN quản lý miền, nên viê ̣c kế t nố i đươ ̣c hoàn thành trong
mô ̣t bước nhảy, đô ̣ dài đường tìm kiế m O(1).
Bước 2: Sau khi tiếp nhận các truy vấn từ các nút nội miền, nút S
(supernode) thực hiện tìm kiếm trong vòng Chord liên miền superlayer

(C,E), miền đích là miền có ID tiề n tố của SN gần với khóa nhất, độ dài
đường tìm kiếm 𝑂(𝑙𝑜𝑔4 𝐾). Ký hiê ̣u 𝐹𝑠𝑢𝑝 (𝐶) là là đinh
̣ danh của mô ̣t
SN trong miề n C, đinh
̣ danh SN trong miền đích 𝐶𝑑𝑒𝑠𝑡 : 𝐶𝑑𝑒𝑠𝑡 = arg
min 𝑑𝑐𝑙𝑜𝑐𝑘𝑤𝑖𝑠𝑒 (𝐹𝑠𝑢𝑝 (𝐶), k ).
Bước 3: Cuối cùng, bằng cách sử dụng tìm kiếm trong nội miền 𝐶𝑑𝑒𝑠𝑡 ,
siêu nút có đinh
̣ danh 𝐹𝑠𝑢𝑝 (𝐶𝑑𝑒𝑠𝑡 ) chuyển truy vấn tim
̀ kiế m tới nút chịu
trách nhiệm với khóa k.
4.3 Phân tích, đánh giá hiêụ năng ma ̣ng Chord_SL
Để phân tích, đánh giá hiệu năng của ma ̣ng chord_SL, luận án so


-18-

sánh mô hình đề xuất với các mô hình Chord không phân cấp
Chord_flat , Chord phân cấp Chord_hiearchical. Các tham số hiệu năng
được chọn để phân tích: Độ dài đường tìm kiếm, thời gian tìm kiếm
trung bình, kích thước bảng định tuyến của nút và tổng chi phí duy trì
định tuyến . Qua việc phân tích giải tích cho thấy Chord_SL phân cấp
cải thiện hiệu năng hơn so với các mô hình phân cấp của nghiên cứu
trước. Cụ thể được thể hiện qua kết quả dưới đây:

Do mô hình phân cấp đề xuất trong luận án được triển khai trên thuật
toán Chord cải thiện. Bảng định tuyến của các nút ON trong mạng
Chord nội miền đều chứa con trỏ chỉ tới SN, vì vậy nút nội miền tìm
kiếm SN có độ dài tim
̀ kiế m hns  O(1) . Độ dài đường tìm kiếm SN

trong lớp liên miền là hss  O(log 4 K ) (theo bổ đề 3.1 ). Tỷ số giữa độ
dài đường tìm kiếm nội miền qua mô hình Chord_SL và mô hình Chord
không phân cấp:
hChord _ SL
h flat

N
)
K  100%  50%

O (log 2 N )
O (log 4


-19-

Nếu truyền thông nội miền thì độ dài đường tìm kiếm của mô hình
Chord_SL cải thiện hơn so với mô hình Chord_flat :
N
)  O (log 2 N )
K
 hChord _ SL h flat

O (log 4

(4.11)

Đối với các phiên tìm kiếm liên miền và K/N nhỏ (kích thước
của nhóm nội miền nhỏ) thì mô hình Chord_SL cải thiện hơn so với
các nghiên cứu trước:

N
)  O (log 4 K )  O (1)  O (log 2 K )  O (1) (4.12)
K
 O (log 2 N )  hChord _ SL  hhiearchical h flat

O (1)  O (log 4

Mô hình Chord_SL và Chord_hiearchical đều chọn các nút có
năng lực để làm siêu nút trong lớp liên miền, vì vậy Tss luôn nhỏ hơn

Tss của mô hình mạng ngang hàng phẳng. Vì các nút cùng tên miền
được sắp xếp trong cùng một lớp nội miền do siêu nút quản lý, nên Tns
thường rất nhỏ. Do đó khi K  N thì thời gian tìm kiếm trung bình
của Chord_SL được cải thiện đáng kể so với mô hình phẳng và mô hình
phân cấp :
N
)  Tns  O (1)  Tns 
K
(4.13)
O (log 2 K )  Tss  O (1)  Tns  O (log 2 N )  Tss
O (log 4 K )  Tss  O (1)  Tns  O (log 4
 TChord _ SL  Thiearchical T

flat

Theo giải thuật đề xuất trong luận án phần 4.2.3, để lựa chọn
được siêu nút phải tiêu tốn băng thông cho các bản tin trao đổi trong
các trường hợp : a) Mỗi nút phát quảng bá các tham số của nó tới các
nút hàng xóm; b) Các nút có năng lực thấp hơn ( băng thông, khả năng
xử lý,…) sẽ bầu chọn cho các nút có năng lực cao hơn, trong quá trình



-20-

này các nút có năng lực yếu sẽ gửi bản tin bầu chọn cho các nút có năng
lực cao hơn; c) Sau khi SN được lựa chọn sẽ phát quảng bá các bản tin
thông báo các tham số của nút đến các nút trong vùng mà nó quản lý.
Nếu triển khai thuật toán bầu chọn trên mạng Chord_flat với số
nút trong mạng N, chi phí để lựa chọn SN sẽ được tính:
AN2  C N2  N  1  N ( N  1) 


N ( N  1)
 ( N  1)
2

(3N  2)( N  1)
 ( N 2 )
2

(4.37)

Trong đó AN2 bản tin để phát quảng bá các tham số của nút tới
các nút hàng xóm. C n2 bản tin được dùng để các nút có năng lực yếu
bầu cho các nút có năng lực cao hơn. (N -1) bản tin được truyền từ nút
được chọn làm SN để thông báo các tham số của nó tới các nút trong
mạng.
Tương tự nếu triển khai trên mô hình phân cấp Chord_SL của
luận án, với số nút là N và mạng được chia làm K cụm. Chi phí để lựa
chọn siêu nút SN của thuật toán đề xuất là :

( AN2 / K  C N2 / K 

N
(3N  2 K )( N  K )
N 2 (4.38)
 1)  K 
 (
)
K
2K
K

Từ công thức (4.37) và (4.38) rõ ràng thuật toán bầu chọn SN khi triển
khai qua mô hình phân cấp được đề xuất có chi phí giảm K lần so với
mô hình Chord_flat .


-21-

Hình 4-5. Kích thước nhóm nội miền

Hình 4-6 . Không gian lưu trữ của siêu

và độ dài đường tìm kiếm

nút và kích thước mạng

Hình 4-7. Đô ̣ dài đường tim
̀ kiế m và


Hình 4-8. Đô ̣ dài đường tim
̀ kiế m và

kích thước nhóm nô ̣i miề n

xác suấ t tim
̀ kiế m nô ̣i miề n

4.4

Kết luâ ̣n chương 4
Trong chương 4 luâ ̣n án đề xuấ t mô hình Chord_SL phân cấ p.

Mô hình phân cấp đươ ̣c triển khai trên thuâ ̣t toán đinh
̣ tuyế n Chord cải
thiện. Để giảm trễ nghiên cứu đã kết hợp với việc phân cấp dựa trên vị
trí của các nghiên cứu [20-21]. Các kế t quả phân tích cho thấy mô hình
Chord_SL cải thiê ̣n hiê ̣u năng so với kế t quả của các nghiên cứu [2021] trên các khiá ca ̣nh như: độ dài đường tìm kiếm, thời gian tìm kiếm,
chi phí duy trì ổ n đinh
̣ của hệ thống,chi phí bầu chọn siêu nút SN. Các
kết quả chính đươ ̣c trình bày trong chương này đã đươ ̣c công bố trong
bài báo khoa học [V4], [V5].


×