Tải bản đầy đủ (.docx) (25 trang)

ĐỀ tài lên LỊCH tối ưu các ỨNG DỤNG TRUYỀN TRỰC TUYẾN TRONG các MẠNG KHÔNG có cấu TRÚC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (341.95 KB, 25 trang )

BỘ THÔNG TIN VÀ TRUYỀN THÔNG
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔN
-------------------------------------------------

BÀI TẬP NHÓM

ĐỀ TÀI: LÊN LỊCH TỐI ƯU CÁC ỨNG DỤNG TRUYỀN TRỰC TUYẾN TRONG
Chuyên ngành : Hệ thống thông tin
Giảng viên : T.S Vũ Văn Thỏa
Nhóm thực hiện: Nhóm I

Hà Nội, 2018

Hà Nội, Tháng 8 - 2016

LUẬNVĂNTHẠCSỸKỸTHUẬT


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Phần I: Dịch bài báo
LÊN LỊCH TỐI ƯU HÓA CÁC ỨNG DỤNG TRUYỀN TRỰC
TUYẾN TRONG CÁC MẠNG KHÔNG CÓ CẤU TRÚC
HÀNỘI-2013

Luca Abeni, Csaba Kiraly và Renato Lo Cigno
DISI - Đại học Trento, Ý
{abeni; kiraly; locigno} @ disi.unitn.it
Tóm tắt. Các hệ thống phát trực tuyến P2P (TV và Video) dựa trên cấu trúc


không được cấu trúc, đang trở nên phổ biến và là chủ để được nghiên cứu mạnh
mẽ. Chiến lược lựa chọn chunk và ngang hàng (hoặc lập kế hoạch) là một trong
những trình điều khiển chính của hiệu suất. Công việc này trình bày bằng chứng
chính thức rằng có tồn tại một chiến lược lập kế hoạch không được phân bổ có
khả năng phân phối tất cả các đoạn cho tất cả N peer trong chính xác bước =
⌈log2 (N) ⌉ + 1. Vì đây là số bước tối thiểu cần thiết để phân phối. Một chiến lược

như vậy là có thể thực hiện được và một lớp lịch trình dựa trên thời hạn hoàn
toàn nhận ra nó. Chúng tôi cho thấy rằng ít nhất một trong những lịch biểu dựa
trên thời hạn là khả năng phục hồi để giảm kích thước vùng lân cận xuống các
giá trị nhỏ như log2 (N). Kết quả mô phỏng được chọn làm nổi bật các thuộc tính
của các thuật toán trong các tình huống thực tế hoàn thành bài báo.
Từ khóa:
-

P2P: Peer – to – Peer : Mạng ngang hàng.
Streaming : Trực Tuyến.
Optimality: Tối ưu hóa.

Lớp: Hệ thống thông in

2

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa


1. Giới thiệu
P2P truyền trực tuyến và đặc biệt là P2P hỗ trợ cho IP-TV đang trở thành không
chỉ các chủ đề nghiên cứu nóng, mà còn có sẵn các hệ thống và dịch vụ như [1-5].
Nền tảng để hỗ trợ phát trực tiếp là đảm bảo sự chậm trễ phân phối thấp của thông
tin cho tất cả các peer. Điều này liên quan chặt chẽ đến các đặc điểm lớp phủ và lịch trình
phân phối các khối cho các peer.
Cộng đồng đã được chia thành các hệ thống có cấu trúc hay không, tức là lớp phủ
có các thuộc tính tôpô được biết đến và được kiểm soát như cây hoặc hypercube hoặc các
hệ thống không có cấu trúc dựa trên các mắt lưới chung là tốt hơn cho phạm vi này. Lợi
thế của các hệ thống có cấu trúc nằm trong khả năng tìm ra lịch trình xác định để đạt
được hiệu năng tối ưu, nhưng chúng thường yếu khi đối mặt với sự rời rạc (đến và rời
khỏi các nút), yêu cầu báo hiệu cho việc bảo trì lớp phủ và có thể phức tạp để quản lý .
Thay vào đó, các hệ thống không có cấu trúc mạnh mẽ và dễ quản lý. Việc bảo trì lớp phủ
chỉ yêu cầu kết nối: mỗi nút tự động tìm kiếm và liên hệ với các nút bên cạnh chính nó.
Bất lợi của chúng được cho là đến nay không thể tìm thấy một thuật toán lập kế hoạch
phân phối nào là tối ưu và mạnh mẽ trong điều kiện hoạt động bình thường.
Bài viết giải quyết vấn đề này, thể hiện sự tồn tại của toàn bộ lớp lịch trình tối ưu
theo giả định rằng lớp phủ được kết hợp hoàn toàn và cho thấy rằng ít nhất một trong các
bộ lập lịch này mạnh mẽ để chống lại việc giảm vùng lân cận xuống log2 (N ), trong đó
N là số lượng các peer.

* Công trình này được Ủy ban châu Âu hỗ trợ thông qua Dự án NAPA-WINE (Ứng dụng P2P-TV trên
mạng Wise Network - www.napa- wine.eu), ICT Call 1 FP7-ICT-2007-1, 1.5 Truyền thông được nối
mạng, cấp số 214412

Lớp: Hệ thống thông in

3

Nhóm I



Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

2. Trình bày vấn đề
Chúng tôi nghiên cứu lập kế hoạch (lựa chọn chunk và peer) để phổ biến tại mỗi
mạng ngang hàng trong các mạng lớp phủ không có cấu trúc. Nó cũng được biết rằng
giới hạn dưới về độ trễ phổ biến của bất kỳ mẩu thông tin nào, cho rằng các nút có chính
xác băng thông cần thiết cho bản thân luồng, là Slb = ⌈log2 (N) ⌉ + 1 )T. Trong đó T là thời
gian truyền 1. Nó cũng được biết đến [1] rằng các bộ lập lịch tập trung có thể phân phối
mọi đoạn của một luồng trong chính xác 5lb. Ngoài ra, trong [6] nó đã được chứng minh
rằng một ràng buộc giữ cho một số bộ lập lịch phân phối. Nếu và (Mc là số lượng khối).
Tuy nhiên, khi các hệ thống phân phối thời gian thực được coi là giới hạn tiệm cận không
tương đương với lb.
Bài viết này tập trung vào việc chứng minh một cách chính thức sự tồn tại của một
thuật toán tối ưu được phân phối, và trong việc tìm kiếm các trình lập lịch mạnh mẽ, khả
thi với các vùng lân cận bị hạn chế thực hiện trong một giới hạn hợp lý của tối ưu. Đây là
điểm khởi đầu (một tham chiếu tối ưu) để nghiên cứu thêm về các hệ thống không đồng
nhất, về sự tương tác của lớp phủ với mạng IP cơ bản, và trên tất cả những 'khiếm khuyết'
mà cấm tìm các giải pháp chính thức dạng đóng cho các vấn đề trong kịch bản mạng
thực.
2.1. Mô tả hệ thống
Chúng tôi xem xét một lớp phủ của các peer được kết nối với một cấu trúc liên kết
lưới chung. Tổng số peer là N. Mỗi peer được kết nối NN peers 2 khác tạo thành vùng lân
cận của nó. Một trường hợp đặc biệt là NN = N - 1, một mạng lưới được kết nối hoàn
toàn. Chúng tôi xem xét sự hiện diện của một “ peer đặc biệt” khác là nguồn gốc của
1


Ràng buộc xuất phát từ thực tế là mỗi nút có thể truyền thông tin chỉ sau khi nhận được, và số

lượng nút sở hữu đoạn tối đa gấp đôi mỗi T.
2

Vì mục đích đơn giản, chúng tôi hạn chế thảo luận với các cấu trúc liên kết n-thường xuyên:

các đồ thị ngẫu nhiên với kết nối đối xứng và n liên kết trên mỗi nút.

Lớp: Hệ thống thông in

4

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

video. Nguồn không bao giờ nhận được khối, vì vậy các liên kết của nó là một chiều một
cách hợp lý và nó không phải là một phần của bất kỳ vùng lân cận nào, tức là các liên kết
một chiều của nó là bổ sung cho các liên kết khác. Hình 1 báo cáo hai cấu trúc liên kết
mẫu.
Nguồn phân phối chương trình truyền hình hoặc video có thể (phát trực tiếp).
Video được chia thành các khối Mc có thời lượng bằng nhau phát ra định kỳ. Tất cả các
peer đều có băng thông đơn vị (nghĩa là, chúng có thể truyền một đoạn chính xác trong
thời gian tạo liên đoạn) trên đường lên và không có giới hạn trên đường xuống. Chúng tôi
không xem xét xáo động và chúng tôi tập trung, như tham số hiệu suất chính, về sự chậm
trễ khuếch tán của khối, đó là sự chậm trễ mà khối được nhận bởi tất cả các peer. Chính

thức, nếu ri là thời gian phát xạ của đoạn Ci, thì độ trễ khuếch tán của nó là fj = t - ri sao
cho tất cả N peer đã nhận được Ci. Mỗi peer có một kiến thức hoàn hảo về tình trạng lân
cận của nó.

Hình 1. (A) - Cấu trúc liên kết lưới chung với N = 8 và NN = 3; vùng bóng mờ (hồng) là vùng
lân cận của nút đen; nguồn là nút rô (màu vàng); (B) - Lưới đầy với N = 4

Các giả thiết trên có nghĩa là: i) không yêu cầu đặt hàng toàn cầu của các peer; ii)
hệ thống không được cấu trúc; iii) các quyết định của người lên lịch độc lập với nhau; vi)
các peer biết chính xác tập con của các khối đã nhận được hoặc đang được tất cả các peer
láng giềng nhận; và v) chậm trễ tín hiệu là không đáng kể.
Quyết định lên lịch đầu tiên là liệu một peer có đẩy thông tin đến các peer khác
hay không nếu nó kéo thông tin từ các peer khác ... hoặc kết hợp cả hai chính sách. Đôi
khi trong văn học, nó được tuyên bố rằng thông tin đẩy là một hành vi điển hình của các
hệ thống được xây dựng, và các phương pháp kéo được thích ứng nhiều hơn cho các lớp

Lớp: Hệ thống thông in

5

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

phủ không có cấu trúc. Các tài liệu gần đây như [6, 7] thay vào đó sử dụng lịch trình đẩy
trên các mắt lưới không có cấu trúc. Thật vậy, sự lựa chọn cho dù tốt hơn là đẩy hoặc kéo
thông tin không được tái cấu trúc (hoặc thiếu nó) của hệ thống, nhưng với tắc nghẽn băng

thông, có thể tạo ra xung đột trong việc quyết định lên lịch.
Các hệ thống dựa trên sự đẩy thích hợp cho các hệ thống nơi nút cổ chai là đường
lên, bởi vì điều này đảm bảo một ưu tiên rằng chỉ một đoạn sẽ được lên lịch để truyền
trên đường lên, và các xung đột lập lịch phát sinh từ bản chất phân tán của lịch trình sẽ
nhấn mạnh đường xuống của các peer khác.
Nếu tình hình bị đảo ngược (không phổ biến trong các mạng bị chi phối bởi truy
cập ADSL, nhưng về mặt kỹ thuật có thể), thì các trình lên lịch kéo theo sẽ giải quyết một
cuộc xung đột trên đường xuống và nhiều đường lên băng thông sẽ thích ứng với các
xung đột lịch biểu. Thật thú vị, một kịch bản với khả năng đối xứng lên và xuống của
đường xuống không đưa ra lựa chọn hợp lý dễ dàng về việc liệu việc đẩy hoặc kéo thông
tin có phải là lựa chọn tốt nhất hay không.
Chúng tôi xem xét lịch trình dựa trên sự đẩy, nhưng chúng tôi cho rằng việc đảo
ngược giả thuyết về nút cổ chai các lịch trình dựa trên sự kéo dài gấp đôi so với những
điều chúng tôi chứng minh là tối ưu trong phần tiếp theo có thể dễ dàng bắt nguồn.
2.2. Ký hiệu và định nghĩa chính thức
Một hệ thống được tạo thành bởi một tập hợp S = (P1, ... PN} của N các peer Pi,
cộng với một nút đặc biệt được gọi là nguồn. Mỗi peer Pi nhận các khối Cj từ các peer
khác, và gửi chúng tới các peer khác với tốc độ s(Pi) Nguồn sẽ gửi các khối với tốc độ
s(nguồn). Tập hợp các khối đã nhận được bởi Pj tại thời điểm t được chỉ định là C (Pj, t).
Nguồn, không được bao gồm trong S, tạo ra các khối theo thứ tự, với một tỷ lệ cố
định λ (Cj được tạo ra bởi nguồn tại thời điểm rj = j). Chúng tôi bình thường hóa hệ thống
w.r.t. λ, sao cho rj = j. Ngoài ra, chúng tôi đặt i, s (Pi) = s (nguồn) = λ = 1, đó là trường
hợp giới hạn để duy trì phát trực tuyến.
Lớp: Hệ thống thông in

6

Nhóm I



Môn học: Công cụ toán cho CNTT

Ký hiệu
S
N
Mc
Pi
Ch
rh
NN
fh
C (Pi, t)
C’(Pi, t)
Ni
s(Pi)

T.S. Vũ Văn Thỏa

Định nghĩa
Tập hợp tất cả các peer
Số lượng peer trong hệ thống
Tổng số đoạn
ith peer, máy số mấy
hth Chunk, đoạn số mấy
Thời gian khi nguồn tạo Ch
Kích thước vùng lân cận
Sự chậm trễ khuếch tán của Chunk Ch (thời gian cần
thiết bởi Ch để tiếp cận tất cả các peer)
Tập hợp các khối do Pi sở hữu tại thời điểm t
Tập hợp các khối do Pi sở hữu tại thời điểm t cần

thiết bởi một số vùng lân cận của Pi
Vùng lân cận của đồng đẳng Pi
Băng thông tải lên của peer Pi

Bảng 1. Các định nghĩa và ký hiệu được sử dụng trong bài báo.

Nếu Dj (t - rj) là tập hợp các nút sở hữu chunk Cj tại thời điểm t, trường hợp trễ
nhất fj của chunk Cj được định nghĩa là thời gian cần thiết bởi Cj để phân phối cho mọi
peer: fj = min { : Dj () = S}. Theo định nghĩa này, một peer Pj sẽ nhận chunk Cj tại thời
điểm t với rj + 1 t rj + fj. Xem xét một lớp phủ không có cấu trúc sẽ được phân phối ngẫu
nhiên trong khoảng thời gian đó. Do đó, trong một hệ thống không có cấu trúc Pi được
đảm bảo nhận Cj nhiều nhất tại thời điểm rj + fj. Để tái tạo chính xác toàn bộ luồng truyền
thông, một peer phải đệm các khối trong một thời gian ít nhất là

F = max 1 j

Mc (fj) trước khi bắt đầu phát. Vì lý do này, sự chậm trễ khuếch tán trường hợp xấu nhất
F là một số liệu hiệu suất cơ bản cho các hệ thống phát trực tuyến P2P và bài viết này sẽ
tập trung vào nó.
Khi ∀i, s (Pi) = λ = 1, tại thời điểm t, nguồn gửi một đoạn Cj (với rj = t) tới một
peer và mọi peer Pi gửi một đoạn Ch ∈ C (Pi, t) tới một peer Pk . Tất cả các khối này sẽ
được nhận tại thời điểm t + 1.
Như đã thảo luận ở trên, độ trễ khuếch tán tối thiểu fj có thể cho đoạn Cj là ⌈log2
(N) ⌉ + 1. Chunk khuếch tán được cho là tối ưu nếu ∀j, fj = ⌈log2 (N) ⌉ + 1 = F. Các ký hiệu

quan trọng nhất được sử dụng trong bài báo này được thu hồi trong Bảng 1.
Lớp: Hệ thống thông in

7


Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

3. Lập lịch peer và Chunk
Trong một hệ thống P2P dựa trên sự đẩy, khi một peer Pj gửi một đoạn, nó chịu
trách nhiệm cho việc chọn đoạn được gửi và peer đích. Đoạn Cj được gửi sẽ được chọn
bởi một bộ lập lịch ngang hàng, và Pk đích được chọn bởi một bộ lập lịch ngang hàng.
Bài viết này tập trung vào các thuật toán đầu tiên chọn Cj đoạn, và sau đó chọn một mục
tiêu ngang hàng Pk cần Cj, nhưng định nghĩa về tính tối ưu được trình bày trong bài báo
này là hợp lệ cho bất kỳ hệ thống luồng P2P dựa trên chunk.
Một số thuật toán lập kế hoạch chunk nổi tiếng là Chunk mới nhất, Chunk hữu ích
mới nhất, và Random Chunk (một lần nữa, mù hoặc hữu ích). Thuật toán mới nhất của
thuật toán Chunk Blind Chunk tại thời điểm t đoạn mới nhất: Cj ∈ C(Pi, t) : ∀Ch ∈ C(Pi,
t), rj ≥ rh (Cj được lên lịch ngay cả khi tất cả các peer khác đã có nó). Thuật toán Chunk
hữu ích mới nhất (LUc) chọn một đoạn cần thiết bởi ít nhất một peer: Cj ∈ C′(Pi, t) : ∀Ch
∈ C′(Pi, t), rj ≥ rh trong đó C′(Pi, t) là một tập hợp con của C (Pi, t), chỉ chứa các phần
chưa được nhận (hoặc hiện không được nhận bởi một số peer khác). Các thuật toán
Random Chunk chọn một đoạn ngẫu nhiên trong C (Pi, t) (Random Blind Chunk) hoặc
trong C '(Pi, t) (Random Useful Chunk - RUc).
Sau khi chọn đoạn Cj được gửi đi, các phép toán lập lịch ngang hàng sẽ chọn một
peer Pk cần Cj. Thuật toán lập lịch ngang hàng được sử dụng phổ biến nhất là Random
Useful Peer, ngẫu nhiên chọn một peer cần Cj. Về lý thuyết, thuật toán lập lịch trình
chunk có thể chọn Pk ∈ S, nhưng trong thực tế peer Pi sẽ chỉ biết một tập hợp con của tất
cả các peer khác, và sẽ chọn Pk từ một tập hợp con của S được gọi là vùng lân cận. Vùng
lân cận của Pi được chỉ định là Ni trong đó ∀i, Ni = S - Pi là đặc biệt và tương ứng với biểu
đồ được kết nối hoàn toàn.

3.1. Lên lịch Peer tối ưu
Lựa chọn peer ngẫu nhiên ngăn chặn việc đạt được sự tối ưu, vì peer được chọn có
thể không thể phân phối thêm đoạn đó. Lý do đằng sau lựa chọn peer tối ưu nên như sau:
điểm đến được chọn sẽ có thể ngay lập tức đảm nhận vai trò phân phối lại đoạn này.
Lớp: Hệ thống thông in

8

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Chúng tôi định nghĩa trình lập kế hoạch ngang hàng “sớm nhất-mới nhất” (ELp)
như sau: ELp chọn mục tiêu peer Pl; cần Ch và sở hữu đoạn Ck mới nhất với thời gian
phát sinh sớm nhất rk:
Ch ∈/ C(Pl, t) ∧ ∀Pj ∈ Nl, L(Pl, t) ≤ L(Pj, t)

(1)

Trong đó L (Pi, t) = maxk {rk: Ck ∈ C(Pi, t)} là đoạn mới nhất thuộc sở hữu của
hoặc khi đến Pi lúc b. Nếu tại thời điểm t Pi chưa nhận được bất kỳ đoạn nào, L (Pi, t) =
0. Nếu nhiều người khác tồn tại thỏa mãn (1) người ta được chọn ngẫu nhiên.
3.2 . Lập kế hoạch Chunk tối ưu
Chúng tôi hiển thị trong định luật 1 và 2 rằng một lịch trình LUc / ELp là tối ưu
trong trường hợp lưới đầy đủ; tuy nhiên, LUc / ELp cung cấp độ trễ khuếch tán trường
hợp xấu nhất lớn khi kích thước vùng lân cận bị giảm (như được trình bày trong Phần 5).
Một hành vi xấu như vậy là phổ biến đối với tất cả các lịch trình LUc, và được gây ra bởi

thực tế là các trình lập lịch như vậy luôn chọn đoạn hữu ích mới nhất. Do đó, nếu vì một
lý do nào đó (chẳng hạn như kích thước vùng lân cận bị hạn chế hoặc kiến thức giới hạn
của vùng lân cận) thì một đoạn Ck với rk> rh đến một đồng đẳng trước khi Ch hoàn toàn
khuếch tán, thì peer không thể khuếch tán Ch nữa và độ trễ khuếch tán tăng lên một lượng
lớn. Nói cách khác, mỗi khi giới hạn kiến thức về khu vực lân cận làm cho một đoạn sau
đó đến một peer trước một peer trước đó, sự khuếch tán của thứ hai này có thể bị dừng
lại.
Vì lý do này, một thuật toán lập lịch trình mới đã được phát triển để tương đương
với LUc / ELp trong trường hợp lưới đầy đủ và để thực hiện tốt khi biểu đồ không được
kết nối hoàn toàn. Thuật toán mới dựa trên thuật toán lập lịch trình dựa trên dòng thời
gian, có tên là Dl. Thuật toán lập lịch trình Dl hoạt động dựa trên thời hạn lập lịch biểu d k
liên quan đến mọi thể hiện của đoạn. Thời hạn lập kế hoạch được khởi tạo thành d k = rk +
2 khi nguồn gửi Ck tại thời điểm rk. Bộ lập lịch đoạn sau đó hoạt động bằng cách chọn Ck
đoạn với thời hạn lập lịch tối thiểu:

Lớp: Hệ thống thông in

9

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Ck: ∀Ch ∈ C’(Pi, t),dk ≤ dn ;

(2)


Trước khi gửi Ck, thời gian lên lịch của nó bị hoãn lại bởi 2 đơn vị thời gian: dk = dk + 2
(cả Pi và đồng đẳng đích sẽ thấy Ck với thời hạn lập kế hoạch mới của nó, trong khi các
trường hợp chunk hiện diện trong các peer khác rõ ràng là không bị ảnh hưởng).
Chiến lược lập kế hoạch dựa trên việc lựa chọn đoạn với thời hạn tối thiểu được
biết đến trong văn học là Hạn chót đầu tiên (EDF), và được nhắc đến như “Lập lịch trình
điều khiển hạn chót” trong một bài báo của Liu và Layland [8], nhưng theo hiểu biết tốt
nhất của chúng tôi, nó chưa bao giờ được áp dụng với thời hạn linh hoạt trong các hệ
thống phân tán.
Quan sát 1. Thời hạn lên lịch biểu Dk của một thể hiện chunk Ck tại Pi ngang bằng rk +
2d, trong đó d là số lần mà Ck đã được chọn bởi các bộ lập lịch Dl dọc theo đường dẫn
được lấy bởi đoạn cho đến Pi.
4. Phân tích với đầy đủ các mắt lưới
Trong phần này, một số thuộc tính quan trọng của thuật toán lập lịch LUc / ELp và
Dl / ELp được chứng minh cho trường hợp của một lớp phủ được kết nối hoàn toàn.
Trong Định lý 1 và 2, nó được chứng minh rằng LUc / ELp đạt được sự tối ưu, trong khi
trong Định lý 3, tính tối ưu của Dl / ELp được hiển thị.
Bổ đề 1. Khi sử dụng ELp
Bằng chứng. Trong thời gian ban đầu thoáng qua, tại thời điểm t hệ thống chứa 2 t - 1
đoạn (vì tại mọi thời điểm ngay lập tức nguồn phát ra một đoạn mới và tất cả các peer có
ít nhất một đoạn gửi một đoạn); do đó, có N - (2 t - 1) peer không có khối. Theo định
nghĩa, trình lập lịch biểu ELp chọn các peer như mục tiêu, do đó một P i ngang hàng chỉ
có thể có nhiều hơn 1 đoạn nếu 2t - 1> N
Bổ đề 2. Nếu i, s (Pi) =

Lớp: Hệ thống thông in

λ

=1






2t > N +1



t> 1og2 (N +1).

Ni = S - Pi, nếu sử dụng lịch biểu LUc / ELp, thì

10

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

, 0 < || Lj () || = -1
trong đó || Lj ()= {Pj: maxk{ rk ∈ C (Pj, rj + )} = rj} là tập hợp các peer
có Cj là đoạn mới nhất của họ tại thời điểm rj + .
Bằng chứng. Bổ đề được chứng minh bằng cảm ứng trên = t - rj, và bằng cách xem xét
đoạn mới nhất thuộc sở hữu của các peer tại thời điểm t = rj + , sao cho S được chia thành
ba tập con:
- X () = {Lj (i): i> } là tập hợp các đồng đẳng có đoạn mới nhất sau Cj;
- Y () = Lj () là tập hợp các peer có Cj là đoạn mới nhất của chúng;
- Z () = {Lj (i): i <} tập hợp các peer có đoạn mới nhất sớm hơn Cj.

Ở trên là một phân vùng thành các tập con tách rời, do đó || X () || + || Y () || + || Z () || = ||
S || = N. Bổ đề có thể được chứng minh bằng cảm ứng trên cơ sở cảm ứng .
Sau khi đoạn Cj được tạo ra bởi nguồn tại thời điểm rj, nó được gửi tới một Pj ngang
hàng, nó sẽ nhận nó tại thời điểm t = rj + 1
Dj (1) = {Pi}




= 1. Vì thế,
| | Dj (1) || = 1

Khi Cj là đoạn mới nhất trong hệ thống, X () trống và Cj trở thành đoạn mới nhất trên Pi
Ck ∈ C (Pi, rj + 1), rj> rk
Do đó, = 1



|| Lj () || = || Dj () || = 1 = , || X () || = 0 = - 1. Cũng lưu ý rằng || Z () || = N -

1> || X () || + || Y () ||.
Bước quy nạp: Trước hết, rất dễ nhận thấy rằng || X ( - 1) || - 1: trong thực tế, tại mỗi đơn
vị thời gian một đoạn mới Ck: rk> rj được tạo ra, và tất cả các peer Pi ∈ X (k - 1) có thể
gửi đoạn mới nhất của chúng đến một peer khác. Kết quả là, || X ( - 1) || sẽ tối đa bằng 2 ||
X( - 2) || + 1. Nhưng || X ( - 2) || - 1 (bằng cảm ứng), vì vậy
|| X ( - 1) || <2 (- 1) + 1 = - 1
Lớp: Hệ thống thông in

11


Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Bây giờ, nếu , thì
N



2 (+ )N

và kể từ || Lj ( - 1) || = , || X (- 1) || - 1 và || Z ( - 1) || = N - || X ( - 1) || - || Y ( - 1) ||,
phương trình trên có thể được viết lại thành
2 (|| X ( -1) || + 1 + || Y ( -1) ||) N



|| X ( -1) || + || Y ( -1) || || Z ( -1) || - 2

Kết quả là, tại - 1, || Z ( - 1) || là hơn một nửa số N, do đó có đủ peer với đoạn mới nhất
cũ hơn Cj để nhận các khối từ cả X ( - 1) và Y ( - 1), vì vậy || Lj () || = || Dj () || = , do đó
yêu cầu bồi thường.
Định lý 1. Nếu N = , thuật toán LUc / ELp là tối ưu.
Bằng chứng. Theo định nghĩa, một thuật toán là tối ưu nếu, fj = ⌈log2 (N) ⌉ + 1 Trong trường
hợp này nghĩa là fj = i + 1 Bổ đề 2
,


 log 2 (N ) 



|| Lj () || =

do đó, , || Lj (i) || = . Kết quả là, || Dj (i + 1) || = 2 || Lj (i) || = 2i = N và fj = i + 1.
Định lý 2. Thuật toán LUc / ELp cũng tối ưu nếu N ,
Bằng chứng. Nếu N = + n, với n < , bởi Bổ đề 2 nó đến , || Lj (i) || = . Do đó, đối với = i
chunk Cj được gửi lần và các khối với rk > rj được gửi - 1 lần. Kết quả là, || Dj (i +1) || = 2i,
|| X (i + 1) || = 2i - 1, || Z (i +1) || = 0, và || Lj (i + 1) || <|| Dj (i + 1) ||. Để tính giá trị chính xác

của || Lj (i + 1) ||, x là số lượng các khối được gửi bởi các peer trong X (i) cho các peer
trong Z (i) và cho y là số lượng các phần được gửi bởi các đồng đẳng trong Y (i) cho các
đồng đẳng trong Z (i). Theo quy tắc lập lịch ngang hàng,

x + y = || Z (i) || (bởi vì

các đoạn được gửi đến các peer có đoạn mới nhất sớm nhất). Hơn nữa, || L j (i + 1) || = y +
|| Lj (i) || - (|| X (i) || - x). Vì thế,
|| Lj (i + 1) || = || Z (i) || - x + - (- 1 - x) =
= (N - - (- 1)) - x + - + 1+ x = N - + 1 + 1 = N - + 2
Lớp: Hệ thống thông in

12

Nhóm I


Môn học: Công cụ toán cho CNTT


T.S. Vũ Văn Thỏa

Cuối cùng,
|| Dj (i + 2) || = min {N, || Dj (i + 1) || + || Lj (i + 1) || = + N - + 2} = N
Do đó, fj = i + 2 = ⌈log2 (N) ⌉ + 1.
Quan sát 2: Nếu sử dụng lập kế hoạch đoạn tối ưu, tất cả các bản sao của mỗi đoạn dữ
liệu Ck được chuyển tiếp từ thời gian rk đến thời gian rk + fk - 2.
Dựa trên sự tối ưu của LUc / ELp, bây giờ có thể chứng minh rằng Dl / ELp là một thuật
toán tối ưu. Điều này được thực hiện bằng cách hiển thị rằng trên một lưới đầy đủ nó tạo
ra cùng một lịch trình như LUc / ELp.
Định lý 3. Nếu , s (Pi =

λ

= 1, i, Ni = S - Pi, thì phân phối đoạn do Dl / ELp tạo ra giống

hệt với phân phối đoạn được sản xuất bởi LUc / ELp.
Bằng chứng. Theo mâu thuẫn: giả sử rằng bất cứ lúc nào t0 phân phối chunk được Dl /
ELp sản xuất bắt đầu khác với Ll / ELp, nghĩa là giả định rằng Dl ở ngang hàng Pj tại thời
điểm t0 chọn đoạn Cj trong khi LUc chọn chunk Ck (như vậy, rk> rj). Tuy nhiên, nó sẽ
được chỉ ra rằng việc chọn Cj với Dl hàm ý rj rk mâu thuẫn với giả thuyết rk> rj.

Nếu đến t0

 log 2 (N

+ 1) 

, thì bổ đề 1 đảm bảo rằng tất cả các bộ lập lịch đoạn giống hệt


nhau theo lịch trình ngang hàng ELp.

Nếu t0

 log 2 (N

+ 1) 

, chúng ta có những giả thuyết rằng t < t0 các lịch trình được tạo ra

bởi Dl / ELp và LUc / ELp là giống hệt nhau. Theo định nghĩa tại thời điểm t0 trong Pj
LUc / ELp
Ck ∈ C’(Pi, t0 ) : Ch ∈ C’(Pi, t0 ) rj rk
Vì nguồn chỉ tạo ra một đoạn duy nhất ở mọi đơn vị thời gian, rk và rh không thể có cùng
giá trị, do đó rk> rh. Để có được lịch biểu khác, Dl / ELp phải chọn Cj Ck.

Lớp: Hệ thống thông in

13

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Vì t và t0 - rk lần tương ứng (xem Quan sát 2); do đó, di = ri + 2 (t0 - ri) cho cả Cj và Ck.

Vì Dl / ELp chọn Cj ∈ C’(Pi, t0 ) : Ch ∈ C’(Pi, t0 ) dj dk chúng ta có
dj dk



rj + 2( t0 - rj) rk + 2( t0 - rk)



- rj - rk



rj rk

mâu thuẫn với giả thuyết rk> rj.
Quan sát 3: Lưu ý rằng bộ lập lịch Dl trì hoãn thời hạn lập lịch biểu bởi hai đơn vị thời
gian trên mỗi lần truyền như dk = dk + 2. Nếu một hằng số chung được sử dụng thay cho 2
và thời hạn lên lịch được hoãn lại là dk = dk + q, thì cuối cùng phương trình trong bằng
chứng của Định lý 3 sẽ trở thành
rj + q (t0 - rj) rk + q ( t0 - rk)



(q - 1) r j (q - 1) rk

mâu thuẫn với rk> rj nếu q> 1. Do đó, nếu hằng số chung q> 1 được sử dụng để trì hoãn
thời hạn lập biểu, thì Dl / ELp vẫn tương đương với LUc / ELp. Theo nghĩa này, Dl có
thể được xem như là một lớp toàn bộ các thuật toán dựa trên thời hạn.
5. Giới hạn khu vực và kết quả được chọn

Mặc dù cả hai LUc / ELp và Dl / ELp đã được chứng minh để cung cấp thiệu suất
tối ưu trong trường hợp của một đồ thị kết nối đầy đủ hiệu suất của họ trong nhiều tình
huống thực tế vẫn còn chưa rõ ràng. Bên cạnh hai thuật toán này, chúng tôi xem xét các
kết hợp khác nhau với thuật toán LUc, RUc và RUp để so sánh.
5.1. Mô phỏng hiệu suất truyền trực tuyến và đo lường P2P
Hành vi của các thuật toán lập lịch trình được giới thiệu trong Phần 3 được phân
tích bằng cách sử dụng trình mô phỏng SSSim [9], bằng cách thiết lập một lớp phủ của N
peer với đơn vị tải lên và băng thông tải xuống vô hạn. Nguồn phân phối khối Mc.

Lớp: Hệ thống thông in

14

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Như được giải thích trong Phần 2 chỉ số hiệu suất được xem xét trong bài báo này
là thời gian khuếch tán trường hợp xấu nhất F và (như đã nêu trong Phần 3), thuật toán
lập lịch là tối ưu nếu F = ⌈log2 (N) ⌉ + 1.
Trước hết, các thuật toán đã được mô phỏng trên một đồ thị được kết nối đầy đủ,
như trong Hình 2. Theo Định lý 2 và 3, LUc / ELp và Dl / ELp đạt được hiệu suất tối ưu,
vượt trội so với các thuật toán khác (cụ thể là RUc / ELp đạt được giá trị f gần gấp đôi tối
ưu, và tất cả các thuật toán khác đều đạt được hiệu suất kém hơn.
5.2. Hạn chế lớp phủ
Trong các tình huống thực tế, lớp phủ bị hạn chế được sử dụng thay cho biểu đồ
được kết nối hoàn toàn. Lớp phủ giới hạn như vậy được mô hình hóa giả định quan hệ hai

chiều và một số được xác định trước (NN = || Ni ||) của các nút lân cận. Biểu đồ kết quả là
một đồ thị ngẫu nhiên NN-regular. Trong các mô phỏng sau, các thuật toán được đánh giá
trên 10 trường hợp của biểu đồ ngẫu nhiên NN-regular. Chúng tôi đã xác minh rằng
khoảng tin cậy luôn nằm trong khoảng 5% giá trị trung bình được báo cáo với mức độ tin
cậy là 90%.

Hình 2. Lớp phủ lưới đầy đủ; độ trễ khuếch tán tối đa là hàm N; 500 khối
Phần bên trái của Hình 3 cho thấy hiệu năng của các thuật toán trực tuyến khác
nhau như một hàm của NN và cho thấy thuật toán LUc / ELp (tối ưu trên một mạng lưới
đầy đủ) rất nhạy cảm với các hạn chế vùng lân cận và thực hiện xấu khi NN < N - 1.
Dl / ELp, mặt khác, hoạt động tốt hơn tất cả các thuật toán khác và có thể đạt được các
Lớp: Hệ thống thông in

15

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

giá trị của F gần mức tối ưu (trong trường hợp này là 11). Phía bên phải của Hình 3 cho
thấy số lượng khối ảnh hưởng đến F cho NN = 11 như thế nào (lưu ý rằng log2 (N) =
9.9658). Dl / ELp giữ hiệu suất tốt ngay cả đối với luồng dài, trong khi đối với một số
thuật toán khác fi tăng với i (hiệu suất của thuật toán phụ thuộc vào độ dài luồng), do đó
các kết quả phân phối này không ổn định trong ngữ cảnh phát trực tuyến.
5.3. Giới hạn kích thước bộ đệm
Giải pháp duy nhất cho vấn đề không ổn định là xác định độ trễ phát D, và loại bỏ
các khối Cj tại thời điểm rj + D. Điều này gây ra một số mất mát (đối với các khối Cj có

fi > D), nhưng có thể làm cho hệ thống phân phối ổn định lần nữa. Hơn nữa, sự chậm trễ
diễn ra D có thể được sử dụng để kích thước bộ đệm chunk trong các peer (đặc biệt, mỗi
peer cần phải đệm nhiều nhất D)3.
Vì một số đoạn có thể bị mất, hiệu suất nên được đánh giá dựa trên cả tỷ lệ hao hụt
chunk và độ trễ tối đa. Hình 4 vẽ tỷ lệ mất chunk (trái) cho các thuật toán khác nhau như
một hàm của kích thước vùng lân cận với D = 32. Lưu ý rằng đối với NN > 14, tỷ lệ mất
chunk cho Dl / ELp là 0, cho thấy rằng nó có thể kích thước kích thước bộ đệm chunk để
nó không ảnh hưởng đến hiệu suất của thuật toán (theo kiến thức tốt nhất của tác giả, điều
này là không thể cho các thuật toán khác). Thời gian khuếch tán trường hợp xấu nhất F
(phải) nhanh chóng tiếp cận tối ưu với Dl / ELp, trong khi đó rõ ràng là 32 cho tất cả các
thuật toán khác.

3

Việc thực thi kích thước bộ đệm trong bộ mô phỏng có thể cho phép tối ưu hóa cho phép mô phỏng các

bộ tác vụ lớn hơn, do đó chúng ta chuyển sang N = 10000.

Lớp: Hệ thống thông in

16

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Hình 3. Sự chậm trễ khuếch tán trường hợp tồi tệ nhất của các thuật toán, với

1000 peer, như một hàm của: (bên trái) kích thước vùng lân cận, với 2000 khối; (phải) số
khối, với NN = 11.
5.4. Băng thông tải lên không đồng nhất
Cuối cùng, chúng tôi đánh giá hiệu suất của Dl / ELp trong các mạng không đồng
nhất. Chúng tôi sử dụng một kịch bản tương tự như của [6]. Hệ thống bao gồm N = 600
nút, được chia thành 3 lớp dựa trên băng thông tải lên của chúng: băng thông 2 cho (h / 3)
N nút4, băng thông 0,5 cho (2h / 3) N nút và băng thông đơn vị cho (1 - h) N nút, do đó
giữ băng thông trung bình tại 1. Chúng ta thay đổi h từ 0 (trường hợp đồng nhất) thành 1.

4

Để xác nhận kết quả của chúng tôi với băng thông không đồng nhất, chúng tôi đã triển khai các

thuật toán của chúng tôi trong trình mô phỏng P2PTVSim [10]. Vì lý do này, chúng tôi đã phải
sử dụng một số lượng nhỏ hơn của các đồng đẳng và khối

Lớp: Hệ thống thông in

17

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Hình 5, vẽ sự chậm trễ khuếch tán cho khối Mc = 600 và kích thước bộ đệm vô
hạn, cho thấy rằng Dl / ELp hoạt động tốt hơn trong cài đặt cụ thể này so với các thuật
toán khác đã nghiên cứu cho toàn bộ phạm vi h. Những nghiên cứu ban đầu này chỉ ra

rằng Dl / ELp có thể là một ứng cử viên mạnh mẽ trong các thiết lập không đồng nhất.
Chúng tôi để lại các nghiên cứu chi tiết hơn, bao gồm cả các nghiên cứu về ảnh hưởng
của tham số tăng lên của Dl về hiệu suất (xem quan sát 3), cho công việc trong tương lai.

Hình 4. Chunk mất và F là một hàm của kích thước vùng lân cận (N = 10000, D = 32)
6. Công việc liên quan và đóng góp
Tính tối ưu của lịch trình đã được nghiên cứu rộng rãi trong văn học. Đối với
trường hợp lớp phủ lưới đầy đủ và giới hạn băng thông tải lên đơn vị, giới hạn chung
(nghĩa là, hợp lệ đối với bất kỳ lịch trình nào) thấp hơn ⌈log2 (N) ⌉ + 1 )T được biết rõ. [1]
chứng minh rằng ràng buộc này là nghiêm ngặt trong một kịch bản streaming bằng cách
hiển thị sự tồn tại của một bộ lập lịch tập trung mà đạt được như vậy ràng buộc. Một
bằng chứng tương tự (mặc dù đối với trường hợp phổ biến tệp) có thể được tìm thấy
trong [11]. Công việc của chúng tôi cải thiện trên những kết quả này bằng cách chứng
Lớp: Hệ thống thông in

18

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

minh sự tồn tại của lịch trình phân tán (LUc / ELp và Dl / ELp) đạt được cùng một ràng
buộc nghiêm ngặt.
Giới hạn chung cũng như giới hạn trên về thời gian phân phối đạt được bởi các bộ
lập lịch phân phối khác nhau cũng có thể được tìm thấy trong văn học. Công trình cơ bản
của [12] nghiên cứu các tính chất tiệm cận của các thuật toán tán xạ phân tán trong một
thiết lập tương tự, cho thấy một giới hạn trên cho bất kỳ thuật toán dựa trên kéo nào của

tất cả các thông điệp trong thời gian O (Mc + log (N)) với xác suất cao ngay cả đối với
thuật toán mù . Các giới hạn tiệm cận chung cũng được hiển thị cho các thuật toán dựa
trên mù, mặc dù trong trường hợp này không thể đảm bảo phổ biến rộng rãi. Một thuật
toán mù phân phối các khối có xác suất cao trong (9 * Mc + 9 * log2 (N)) T cũng được
hiển thị. Lưu ý rằng điều này cho thấy sự chậm trễ phân phối cho đoạn riêng lẻ phát triển
với Mc.
Tác giả của [11] cũng đánh giá các chiến lược phân phối mù trong trường hợp
phân phối tệp, cho thấy sự chậm trễ phân phối phụ thuộc vào số lượng khối.
[6] nghiên cứu giới hạn trên cho các thuật toán nổi tiếng cụ thể, cho thấy rằng sự kết hợp
của lựa chọn ngẫu nhiên ngang hàng và LUc đạt được tốt tiệm cận sự chậm trễ, tuy nhiên
trình diễn này được cung cấp trong trường hợp băng thông tải lên cao hơn 1.

Hình 5. F là hàm của tính không đồng nhất băng thông (N = 600, Mc = 600)
Lớp: Hệ thống thông in

19

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Các bộ lập lịch LUc / ELp và Dl / ELp được phân phối được trình bày trong bài
báo của chúng tôi thực hiện tốt hơn so với các giới hạn chung được thể hiện trong [12] và
[11] ở chỗ nó đạt được sự khuếch tán hoàn toàn của tất cả các khối trong
(Mc + ⌈log2 (N) ⌉ + 1 )T , tức là một sự chậm trễ khuếch tán đoạn độc lập với Mc.
Nó cũng khác với thuật toán trực tuyến được nghiên cứu trong [6], vì LUc / ELp
và Dl / ELp độ trễ nghiêm ngặt này được giữ cho bất kỳ N (không chỉ là tiệm cận), và nó

hợp lệ ngay cả trong trường hợp biên của đơn vị băng thông tải lên, mà không dựa vào
mã nguồn dư thừa.
[6] sử dụng biểu đồ ER để mô hình vùng lân cận bị hạn chế. Với N = 600 và NN =
10, tác giả thấy rằng các thuật toán được nghiên cứu bị thiệt hại đáng kể. Những tổn thất
chunk được xác nhận bởi kết quả của chúng tôi (ngay cả khi mô hình đồ thị ngẫu nhiên
của chúng tôi là hơi khác nhau) cho các thuật toán được xem xét trong đó. Tuy nhiên,
chúng tôi cũng hiển thị (thông qua mô phỏng) rằng thuật toán Dl / ELp mới thực hiện gần
mức tối ưu với bất kỳ Mc và bất kỳ N nào, ngay cả với các hạn chế lớp phủ đáng kể. Cụ
thể là, giảm kích thước vùng lân cận thành bất kỳ NN > = ⌈log2 (N) ⌉, thuật toán của
chúng tôi tiếp tục phân phối tất cả các khối với độ trễ chỉ cao hơn một chút so với giới
hạn dưới và luôn luôn (trên tất cả các đồ thị ngẫu nhiên mô phỏng NN) dưới
2 * ⌈log2 (N) ⌉ + 1 )T . Lưu ý rằng vùng lân cận của ⌈log2 (N) ⌉ thực tế có nghĩa là ít hơn 30
trong bất kỳ thiết lập hợp lý nào.
7. Kết luận và công việc tương lai
Bài báo này trình bày bằng chứng chính thức rằng các thuật toán phân tán có thể
đạt được sự khuếch tán tối ưu cho các ứng dụng trực tuyến trong các mạng không có cấu
trúc. Tài liệu đã giới thiệu một lớp các thuật toán dựa trên thời hạn Dl / ELp tối ưu trong
các mắt lưới đầy đủ và duy trì các thuộc tính rất tốt cũng trong các tình huống thực tế với
các vùng lân cận nhỏ.
Công việc trong tương lai bao gồm một mặt mở rộng các kết quả lý thuyết cho các
kịch bản với các ràng buộc khác nhau, bao gồm băng thông lớn và các kịch bản không
đồng nhất, và mặt khác, khai thác các thuật toán này để triển khai thực hiện các hệ thống
phát trực tuyến P2P thực.
Lớp: Hệ thống thông in

20

Nhóm I



Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Tài liệu tham khảo
1. Liu, Y.: On the minimum delay peer-to-peer video streaming: how realtime can it be? In:
MULTIMEDIA ’07: Proceedings of the 15th international conference on Multimedia,
Augsburg, Germany, ACM (September 2007) 127-136

2. Hefeeda, M., Habib, A., Xu, D., Bhargava, B., Botev, B.: Collectcast: A peer-to- peer
service for media streaming. ACM Multimedia 2003 11 (2003) 68-81

3. Hei, X., Liang, C., Liang, J., Liu, Y., Ross, K.W.: Insights into pplive: A measurement
study of a large-scale p2p iptv system. In: Proceedings of the Workshop on Internet
Protocol TV (IPTV) services over World Wide Web in conjunction with WWW2006.
(2006)

4. Chu, Y., Ganjam, A., Ng, T.S.E., Rao, S.G., Sripanidkulchai, K., Zhan, J., Zhang, H.:
Early experience with an internet broadcast system based on overlay multicast. In: ATEC
’04: Proceedings of the annual conference on USENIX Annual Technical Conference,
Boston, MA, USENIX Association (June 2004)

5. Pianese, F., Keller, J., Biersack, E.W.: Pulse, a flexible p2p live streaming system. In:
INFOCOM, IEEE (2006)

6. Bonald, T., Massoulie, L., Mathieu, F., Perino, D., Twigg, A.:

Epidemic live

streaming: optimal performance trade-offs. In Liu, Z., Misra, V., Shenoy, P.J., eds.:

SIGMETRICS, Annapolis, Maryland, USA, ACM (June 2008) 325-336

7. Couto da Silva, A., Leonardi, E., Mellia, M., Meo, M.: A bandwidth-aware scheduling
strategy for p2p-tv systems. In: Proceedings of the 8th International Conference on Peerto-Peer Computing 2008 (P2P’08), Aachen (September 2008)

8. Liu, C.L., Layland, J.: Scheduling alghorithms for multiprogramming in a hard real-time
environment. Journal of the ACM 20(1) (1973)

9. Abeni,

L., Kiraly, C., Cigno, R.L.: TR-DISI-08-074: SSSim: Simple and Scalable
Simulator for P2P streaming systems. Technical report, University of Trento (2008)
/>
10.

The NAPA-WINE Project: P2PTVSim home page. />
11.

Mundinger, J., Weber, R., Weiss, G.: Optimal scheduling of peer-to-peer file dissemination. J. of Scheduling 11(2) (2008) 105-120

12.

Sanghavi, S., Hajek, B., Massoulie, L.: Gossiping with multiple messages. In:

Lớp: Hệ thống thông in

21

Nhóm I



Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Proceedings of IEEE INFOCOM 2007, Anchorage, Alaska, USA (May 2007) 21352143

Lớp: Hệ thống thông in

22

Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Phần II: Phân tích đánh giá
1. Phân tích bài toán
Xét mạng P2P hình lưới không cấu trúc kết nối hoàn toàn gồm N nút (peer),
không kể nút nguồn. Kí hiệu trễ toàn mạng cho tới khi tất cả các nút nhận được đầy đủ
dữ liệu cần thiết theo yêu cầu trong trường hợp xấu nhất là F. Theo công thức (2.1)
trong mục 2.1, thuật toán lập lịch là tối ưu nếu:

F = ⌈log2 (N) ⌉ + 1 ).
Trong mục này, ta sẽ mô phỏng đánh giá hiệu năng của hai thuật toán lập lịch kết
hợp LUc/ELp và DLc/ELp như là một hàm của số các nút mạng N:

F = f(N)

2.Thuật toán tác giả lựa chọn
Earliest latest scheduler ELp(DLc/LUc)
3. Cấu trúc dữ liệu thích hợp cho input và output

INPUT :
• Số peer: 501 peer (trong đó có 1 peer nguồn)
• Tổng số chunk:1000 chunk
• Băng thông upload trung bình:1 Mbps
• Kích thước chunk: 0,1 Mb
• Playout Delay: 50s(thời gian các chunk được giữ tại mỗi peer)
• Kích thước hàng xóm: 499 (mạng kết nối đầy đủ)
Công cụ mô phỏng:
Trong bài toán sử dụng công cụ mô phỏng P2PTVSim ([10])
Kịch bản mô phỏng:
Lớp: Hệ thống thông in

23

Nhóm I


Môn học: Công cụ toán cho CNTT

-

T.S. Vũ Văn Thỏa

Mô hình mạng: Mạng được tạo ngẫu nhiên theo số peer N (trừ peer

nguồn) như là một đồ thị đầy đủ. N sẽ nhận các giá trị khác nhau.

-

Băng thông Upload tại các Peer là như nhau.

-

Độ tin cậy thống kê các kết quả là 90% với ý nghĩa là tính trễ phân

bổ sau khi tất cả các peer đều đã nhận được 90% số lượng các chunk đã
gửi từ nguồn.
trên nền WindowXP.

OUPUT kết quả:

Kết quả mô phỏng chứng tỏ phương pháp đơn hình cho nghiệm tối ưu toàn
cục. Kết quả này tốt hơn kết quả tính nghiệm xấp xỉ trong [4].
Tuy nhiên, phương pháp đơn chạy chậm hơn phương pháp trong [4] và
không thể sử dụng khi số nút lớn và kết nối phức tạp.
4.Phân tích ưu nhược điểm của thuật toán
Ưu điểm:



Hệ thống mạng dễ xây dựng;
Tốc độ tìm kiếm dữ liệu nhanh, hiệu quả.

Lớp: Hệ thống thông in

24


Nhóm I


Môn học: Công cụ toán cho CNTT

T.S. Vũ Văn Thỏa

Nhược điểm:





Hệ thống mạng không có tính bảo mật cao, dễ bị tấn công;
cần có trung tâm quản trị
Không bảo vệ được bản quyền nội dung.
Có hiện tượng nút cổ chai tại máy chủ nên khả năng mở rộng mạng bị hạn
chế.

5. Nêu các lớp bài toán tương tự có thể áp dụng thuật toán trong bài báo để giải
quyết





Mạng chia sẻ file (file sharing)
Mạng điện thoại VoIP (telephony)
Mạng đa phương tiện media streaming (audio, video)
Diễn đàn thảo luận (Discussion forums)


Lớp: Hệ thống thông in

25

Nhóm I


×