Tải bản đầy đủ (.doc) (81 trang)

đồ án : ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ GIAO THỨC DHT TRONG MẠNG NGANG HÀNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.97 MB, 81 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA VIỄN THÔNG 1
***
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC
Đề tài:
ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ GIAO THỨC DHT
TRONG MẠNG NGANG HÀNG
Sinh viên thực hiện: Nguyễn Thế Tùng
Hà Nội, 11-2008











N
G
U
Y

N

T
H



T
Ù
N
G




















Đ
Á
N
H


G
I
Á

H
I

U

N
Ă
N
G

M

T

S


G
I
A
O

T
H

C


D
H
T

T
R
O
N
G

M

N
G

N
G
A
N
G

H
À
N
G





















D
0
4
V
T
1
HỌC VIỆN CÔNG NGHỆ
BƯU CHÍNH VIỄN THÔNG
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc
KHOA VIỄN THÔNG 1
***
***
ĐỀ TÀI ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC

Họ và tên: Nguyễn Thế Tùng
Lớp: D04VT1
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
KHOA VIỄN THÔNG 1
***
ĐỒ ÁN
TỐT NGHIỆP ĐẠI HỌC

Đề tài:
ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ GIAO THỨC DHT
TRONG MẠNG NGANG HÀNG
Sinh viên thực hiện: Nguyễn Thế Tùng
Lớp: D04VT1
Giáo viên hướng dẫn: TS. Lê Nhật Thăng

Hà Nội, 11-2008
HỌC VIỆN CÔNG NGHỆ
BƯU CHÍNH VIỄN THÔNG
CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập - Tự Do - Hạnh Phúc
KHOA VIỄN THÔNG 1
***
***
ĐỀ TÀI ĐỒ ÁN TỐT NGHIỆP ĐẠI HỌC
Họ và tên: Nguyễn Thế Tùng
Lớp: D04VT1
Khoá: 2004 – 2008
Ngành học: Điện Tử - Viễn Thông
Tên đề tài:
ĐÁNH GIÁ HIỆU NĂNG MỘT SỐ GIAO THỨC DHT TRONG MẠNG

NGANG HÀNG
Nội dung đồ án:
Đồ án nghiên cứu cơ chế hoạt động của một số giao thức DHT trong mạng
ngang hàng có cấu trúc. Từ đó sử dụng phần mềm mô phỏng P2PSim để phân tích,
đánh giá hiệu năng hoạt động của các DHT. Nội dung của đồ án được chia thành bốn
phần chính như sau:
 Lý thuyết chung về mạng ngang hàng
 Lý thuyết về Bảng băm phân tán DHT
 Phương pháp nghiên cứu mạng ngang hàng
 Đánh giá hiệu năng một số DHT
Ngày giao đồ án:……/ /2008
Ngày nộp đồ án: ……/11/2008
Ngày …. tháng 11 năm 2008
Giáo viên hướng dẫn
TS. Lê Nhật Thăng
NHẬN XÉT CỦA GIÁO VIÊN HƯỚNG DẪN
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….

………………………………………………………………………….
Điểm: (bằng chữ ……………… )
Ngày …. tháng 11 năm 2008
Giáo viên hướng dẫn
TS. Lê Nhật Thăng
NHẬN XÉT CỦA GIÁO VIÊN PHẢN BIỆN
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
………………………………………………………………………….
Điểm: (bằng chữ ……………… )
Ngày …. tháng 11 năm 2008
Giáo viên phản biện
Mục lục Đồ án tốt nghiệp
Mục lục
Mục lục 1
Mục lục Đồ án tốt nghiệp 1
Danh mục hình vẽ 2
Danh mục hình vẽ Đồ án tốt nghiệp 2

Thuật ngữ viết tắt 4
Thuật ngữ viết tắt Đồ án tốt nghiệp 4
Lời nói đầu 5
Lời nói đầu Đồ án tốt nghiệp 5
Chương 1: Lý thuyết chung về mạng ngang hàng 6
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp 8
Chương 2: Lý thuyết về Bảng băm phân tán DHT 24
Chương 2: Lý thuyết chung về bảng băm phân tán DHT Đồ án tốt nghiệp 24
Chương 3: Phương pháp nghiên cứu mạng ngang hàng 44
Chương 3: Phương pháp nghiên cứu mạng ngang hàng Đồ án tốt nghiệp 44
Chương 4: Đánh giá hiệu năng một số DHT 56
Chương 4: Đánh giá hiệu năng một số DHT Đồ án tốt nghiệp 56
Kết luận 75
Kết luận Đồ án tốt nghiệp 75
Tài liệu tham khảo 76
Tài liệu tham khảo Đồ án tốt nghiệp 76
Nguyễn Thế Tùng – Đ04VT1
1
Danh mục hình vẽ Đồ án tốt nghiệp
Danh mục hình vẽ
Hình 1-1: Hệ thống mạng 6
Hình 1-2: Hệ thống mạng chủ - khách 7
Hình 1-3: Mạng ngang hàng 8
Hình 1-4: Mạng ngang hàng hoàn toàn 11
Hình 1-5: Mạng lai ghép 12
Hình 1-6: Mạng lai ghép với chỉ số hoá tập trung 13
Hình 1-7: Mạng lai ghép với chỉ số hoá phân tán 13
Hình 1-8: Cơ chế danh mục tập trung 14
Hình 1-9: Cơ chế yêu cầu liên tục 15
Hình 1-10: Cơ chế bảng băm phân tán 15

Hình 1-11: Mạng Edonkey 20
Hình 1-12: Mạng Gnutella 21
Hình 1-13: Mạng Napster 22
Hình 1-14: Tìm kiếm trên mạng Napster 23
Hình 2-1: Chức năng chính của DHT 25
Hình 2-2: Không gian ID của mạng Chord (N=64) 27
Hình 2-3: Các item lưu trên mạng Chord 27
Hình 2-4: Quá trình node tham gia vào mạng Chord 33
Hình 2-5: Quá trình node rời khỏi mạng Chord 34
Hình 2-6: Không gian ID của mạng Kademlia (N=16) 35
Hình 2-7: Các k-bucket của một node 35
Hình 2-8: Bảng định tuyến của node 110 37
Hình 2-9: Quá trình node tham gia vào mạng Kelips 39
Hình 2-10: Bảng định tuyến của một node trong mạng Tapestry 40
Hình 2-11: Các mức liên kết của node 4227 41
Hình 2-12: Đường đi của một message từ node 5230 tới node 42AD 41
Hình 2-13: Các bản sao được định tuyến tới root (node 4377) 42
Hình 2-14: Các node truy vấn đến node lưu item gần nhất 42
Hình 3-1: Minh họa NS-2 47
Hình 3-2: Minh họa PeerSim 48
Hình 3-3: Minh họa PlanetSim 49
Hình 3-4: Minh họa OMNet++ 51
Hình 3-5: Minh họa OverSim 52
Hình 3-6: Minh họa GPS 53
Nguyễn Thế Tùng – Đ04VT1
2
Danh mục hình vẽ Đồ án tốt nghiệp
Hình 3-7: Minh họa P2PSim 55
Hình 4-1: Minh họa mô hình thực tế 57
Hình 4-2: Hoạt động của P2PSim 58

Hình 4-3: Lưu đồ xác định ngưỡng churn rate 62
Hình 4-4: Ngưỡng churn rate Chord hoạt động tốt 62
Hình 4-5: Ngưỡng churn rate Kademlia hoạt động tốt 63
Hình 4-6: Ngưỡng churn rate Kelips hoạt động tốt 63
Hình 4-7: Ngưỡng churn rate Tapestry hoạt động tốt 64
Hình 4-8: Hiệu năng Chord với churn rate rất cao 65
Hình 4-9: Hiệu năng Kademlia với churn rate rất cao 65
Hình 4-10: Hiệu năng Kelips với churn rate rất cao 66
Hình 4-11: Hiệu năng Tapestry với churn rate rất cao 66
Hình 4-12: So sánh các DHT với churn rate 60s 67
Hình 4-13: So sánh các DHT với churn rate 300s 67
Hình 4-14: Ảnh hưởng của base đối với Chord 68
Hình 4-15: Ảnh hưởng của pnstimer đối với Chord 68
Hình 4-16: Ảnh hưởng của alpha đối với Kademlia 69
Hình 4-17: Ảnh hưởng của stabilize_timer đối với Kademlia 69
Hình 4-18: Ảnh hưởng của round_interval đối với Kelips 70
Hình 4-19: Ảnh hưởng của n_contacts đối với Kelips 70
Hình 4-20: Ảnh hưởng của stabtimer đối với Tapestry 71
Hình 4-21: Ảnh hưởng của base đối với Tapestry 71
Hình 4-22: Tính khả mở của Chord 72
Hình 4-23: Tính khả mở của Kademlia 72
Hình 4-24: Tính khả mở của Kelips 73
Hình 4-25: Tính khả mở của Tapestry 73
Nguyễn Thế Tùng – Đ04VT1
3
Thuật ngữ viết tắt Đồ án tốt
nghiệp
Thuật ngữ viết tắt
Từ viết tắt Tiếng Anh Tiếng Việt
CLI Command Line Interface Giao diện dòng lệnh

DHT Distributed Hash Table Bảng băm phân tán
FAQ Frequently Asked Questions Các câu hỏi thường gặp
FTP File Transfer Protocol Giao thức truyền file
GUI Graphical User Interface Giao diện đồ họa
ICQ I seek you Chương trình máy tính nhắn tin tức
thời trên Internet
ID Identifier Số nhận dạng
IP Internet Protocol Giao thức mạng Internet
IPv6 Internet Protocol version 6 Giao thức IP phiên bản 6
JXTA Juxtapose Giao thức mạng ngang hàng mã
nguồn mở của Sun Microsystems
MAC Media-Access Control Điều khiển Truy nhập - Vật lý
MIT Massachusetts Institute of
Technology
Học viện kĩ thuật Masachuset Mĩ
OSPF Open Shortest Path First Đường đi ngắn nhất mở đầu tiên
P2P Peer-to-Peer Mạng ngang hàng
PDA Personal Digital Assistant Máy trợ lý cá nhân kỹ thuật số
PPP Point-to-Point Protocol Giao thức điểm nối điểm
PVC Performance versus Cost Hiệu năng đối với chi phí
RIP Routing Information Protocol Giao thức định tuyến thông tin
RTT Round Trip Time Thời gian đi hết một vòng
SHA Secure Hash Algorithm Thuật toán băm an toàn
SETI Search for Extraterrestrial
Intelligence
Dự án tìm kiếm nền văn minh
ngoài trái đất
TCL Tool Command Language Bộ công cụ lập trình dòng lệnh
TCP Transmission Control Protocol Giao thức điều khiển truyền dẫn
UDP User Datagram Protocol Giao thức gói dữ liệu người dùng

VoD Video on Demand Video theo yêu cầu
Nguyễn Thế Tùng – Đ04VT1
4
Lời nói đầu Đồ án tốt
nghiệp
Lời nói đầu
Khoảng mười năm trở lại đây, thế giới đã chứng kiến sự bùng nổ của Internet
băng thông rộng, cùng với nó là sự phát triển mạnh mẽ của các ứng dụng peer-to-
peer. Với nhiều ưu điểm hứa hẹn như tính hiệu quả, linh hoạt và khả năng mở rộng
cao, các mạng peer-to-peer đã và đang thu hút được nhiều sự quan tâm từ cộng đồng
nghiên cứu. Mạng peer-to-peer đã phát triển qua nhiều thế hệ, thế hệ hiện nay là
mạng có cấu trúc dựa trên khả năng lưu trữ và tìm kiếm dữ liệu hiệu quả theo cơ chế
Bảng băm phân tán (DHT).
Các DHT được thiết kế để hoạt động trong môi trường tương đối ổn định với
các peer là máy tính. Tuy nhiên vài năm gần đây, các thiết bị nối mạng ngày càng
phong phú và đa dạng, từ điện thoại, PDA, … cho đến tivi. Các thiết bị này kết nối và
rời khỏi mạng trong thời gian ngắn khiến cho độ ổn định của mạng rất thấp dẫn đến
hiệu năng của các DHT giảm sút rõ rệt. Phân tích, đánh giá hiệu năng của các DHT
trong môi trường mới là vấn đề đang rất được quan tâm hiện nay.
Nội dung của đồ án bao gồm bốn phần chính như sau:
Chương 1: Lý thuyết chung về mạng ngang hàng
Chương 2: Lý thuyết về Bảng băm phân tán DHT
Chương 3: Phương pháp nghiên cứu mạng ngang hàng
Chương 4: Đánh giá hiệu năng một số DHT
Em xin gửi lời cám ơn đến các thầy giáo cô giáo đã dạy dỗ em tận tình trong
suốt quá trình học tập tại Học Viện. Xin chân thành cám ơn TS. Nguyễn Chấn Hùng
và ThS. Ngô Hoàng Giang đã cung cấp những thông tin tài liệu qúy báu giúp đỡ em
trong thời gian vừa qua. Đặc biệt em vô cùng biết ơn thầy giáo TS. Lê Nhật Thăng đã
dành nhiều thời gian tận tình hướng dẫn, tạo điều kiện thuận lợi để em hoàn thành đồ
án này.

Hà Nội, tháng 11 năm 2008
Sinh viên
Nguyễn Thế Tùng
Nguyễn Thế Tùng – Đ04VT1
5
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
Chương 1: Lý thuyết chung về mạng ngang hàng
1.1 Phân loại các hệ thống mạng máy tính
Ban đầu khi mạng máy tính mới ra đời, tốc độ máy còn thấp, số lượng máy
tham gia trong mạng chưa cao, nhu cầu trao đổi thông tin mới chỉ dừng lại ở những
tập tin có kích thước bé nên việc quản lý mạng còn rất đơn giản, cấu trúc của mạng chỉ
gồm một vài máy. Các máy trong mạng được nối trực tiếp với nhau thông qua cổng
com hay cổng máy in LPT… Đó là mô hình mạng ngang hàng sơ khai nhưng lại là cơ
sở để phát triển mạng ngang hàng sau này trên một hệ thống máy tính rộng lớn.
Sự phát triển vượt bậc của công nghệ làm cho các máy tính ngày càng nhanh
hơn, lượng tài nguyên lưu trữ là rất lớn và nhu cầu trao đổi của con người ngày càng
tăng lên. Lúc này các máy tính được kết nối khắp toàn cầu đòi hỏi phải có sự ra đời
của phương thức quản lý mới với những giao thức, giao diện mới. Các mô hình hệ
thống mạng ra đời, Hình 1-1 thể hiện sự phát triển của hệ thống mạng máy tính.
Hình 1-1: Hệ thống mạng
Sự tính toán xử lí dữ liệu đầu vào hoặc tài nguyên tại các node trên mạng có thể
chia thành hệ thống xử lí tập trung và xử lí phân tán. Giải pháp tập trung dựa vào một
node được chỉ định là computer node sẽ xử lí tất cả các ứng dụng cục bộ. Hệ thống tập
trung thường được triển khai tại một cơ quan, tổ chức khi các máy tính được liên kết
với nhau trong một không gian kín, không có sự liên kết với mạng bên ngoài. Với hệ
Nguyễn Thế Tùng – Đ04VT1
6
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
thống phân tán, các bước xử lí một ứng dụng được chia đều giữa các node tham gia
với mục đích giảm thiểu chi phí tính toán và truyền thông. Mọi thông tin, tài nguyên

trong mạng được phân tán khắp nơi.
Hệ thống phân tán có thể được chia nhỏ hơn thành mô hình mạng chủ-khách và
mô hình ngang hàng. Trong hệ thống mạng chủ-khách có sự phân biệt giữa các máy
tính trong mạng, một số ít các máy gọi là máy chủ (server), đây là những máy có khả
năng tính toán rất mạnh, tốc độ xử lý nhanh. Tại những máy này có lưu trữ tài nguyên
mạng và các dịch vụ, nó đóng vai trò là người phục vụ cho các yêu cầu của máy tính
khác trong mạng về tài nguyên và dịch vụ. Phần lớn các máy còn lại gọi là máy khách
(client), nó chỉ đưa ra các yêu cầu và sử dụng tài nguyên trên mạng mà không thể chia
sẻ các tài nguyên hay dịch vụ của chính nó. Trong hệ thống chủ-khách các máy khách
khi vào hệ thống được nối với máy chủ, nhận quyền truy nhập và tài nguyên mạng từ
máy chủ. Các máy khách được sắp xếp tổ chức theo một quy luật nhất định và đặt
dưới sự quản lý của máy chủ. Mô hình hệ thống chủ-khách được minh họa như Hình
1-2.
Hình 1-2: Hệ thống mạng chủ - khách
Trong hệ thống chủ-khách có thể phân loại ra thành hệ thống phẳng (flat) và hệ
thống có trật tự phân cấp (hierachical). Việc phân loại này dựa trên cấu trúc của hệ
thống. Trong hệ thống phẳng tất cả các máy khách chỉ kết nối với duy nhất một máy
chủ phục vụ, còn trong hệ thống có phân cấp thì các máy được phân theo thứ bậc về
vai trò trong mạng làm cải thiện tính linh hoạt của hệ thống.
Nguyễn Thế Tùng – Đ04VT1
7
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
Ưu điểm chính của hệ thống này là sự đơn giản của nó. Vì tất cả dữ liệu đều
được tập trung tại một vị trí nên việc quản lý hệ thống là khá dễ dàng và cũng tương
đối dễ bảo mật. Tuy nhiên, trở ngại của hệ thống này cũng chính bởi mọi thông tin đều
tập trung tại máy chủ. Do đó, nó là một điểm có thể gây lỗi trầm trọng cho hệ thống vì
nếu gặp trục trặc, toàn bộ các ứng dụng client nối với server cũng sẽ gặp trục trặc theo.
Server cũng là nơi làm đình trệ hiệu năng của hệ thống. Mặc dù kiến trúc
Client/Server được chấp nhận rộng rãi tại các Web-server hay các database-server
nhưng nhược điểm về tính mở rộng và tỉ lệ gặp lỗi làm cho hệ thống này không thích

hợp với việc triển khai các ứng dụng phân tán đa năng.
1.2 Khái niệm về mạng ngang hàng
Peer-to-Peer (hay P2P - mạng ngang hàng), là mạng mà trong đó hai hay nhiều
máy tính chia sẻ các tập tin và truy nhập các thiết bị như máy in mà không cần đến
máy chủ hay các phần mềm máy chủ. Ở dạng đơn giản nhất mạng ngang hàng được
tạo ra bởi hai hay nhiều máy tính kết nối với nhau và chia sẻ tài nguyên mà không phải
thông qua một máy chủ dành riêng. Mạng ngang hàng dựa vào khả năng và băng tần
của các máy tính tham gia vào mạng hơn là tập trung vào một số các máy tính gọi là
server. Nó được sử dụng cho kết nối các node thông qua các kết nối đặc biệt và được
dùng cho nhiều mục đích như chia sẻ tài liệu, chia sẻ âm nhạc, hình ảnh, dữ liệu, lưu
lượng điện thoại… Mô hình của mạng ngang hàng được thể hiện trên Hình 1-3.
Hình 1-3: Mạng ngang hàng
Nguyễn Thế Tùng – Đ04VT1
8
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
Khái niệm P2P như người ta hiểu bao gồm bốn hoạt động khác nhau: sự hợp tác
giữa những người sử dụng, sự tương tác giữa những ứng dụng phần mềm, việc sử
dụng hiệu quả các tài nguyên mạng và các siêu tính toán.
Nổi bật nhất là các hệ thống hợp tác đang được phát triển bởi các công ty mới
như Groove Networks, Endeavors Technology. Các hệ thống này kết hợp khả nǎng
chia sẻ tài nguyên với khả nǎng truyền tin tức thời của ICQ, tất cả trong một môi
trường an toàn. Sự hấp dẫn chính là ở sự khuyến khích chia sẻ file và truyền thông
giữa các nhóm làm việc.
Với Groove, ví dụ, người sử dụng có thể kết nối với các đồng sự trong các môi
trường ảo để cùng hợp tác trong công việc, giải quyết các vấn đề phức tạp và thậm chí
lập kế hoạch chia sẻ tài liệu và cùng lướt Web trên Internet. Cũng như các hệ thống
khác, hệ thống của Groove cung cấp tin cho mỗi người sử dụng khi có đồng sự đang ở
trên mạng, nhận ra họ và cho phép một người sử dụng kết nối tới họ từ bất cứ nơi đâu.
Quan trọng hơn cả đối với giới doanh nghiệp là dịch vụ tạo ra một không gian an toàn
cho người dùng cho dù họ ở trên Internet hay trong Intranet sau tường lửa. Không cần

phải có các kỹ sư của công ty; không cần phải thiết lập hình thức tổ chức trung tâm; và
không phải lo đến những vị khách lạ truy nhập vào mạng công ty.
Mặc dù mọi sự chú ý đều tập trung vào vấn đề cộng tác, các hệ thống P2P cho
phép các ứng dụng phần mềm tương tác với nhau đem lại nhiều hứa hẹn nhất cho các
ứng dụng kết hợp các dữ liệu phân tán cho thương mại điện tử, thiêt kế sản phẩm hoặc
quản lý tri thức. Các chương trình đó dùng P2P như một phương thức gửi dữ liệu vào
và ra từ trình ứng dụng này tới trình ứng dụng khác hoặc liên kết một số lượng vô hạn
các máy tính thành một cơ sở dữ liệu khổng lồ. Công nghệ tương tác phần mềm cho
phép các công ty chia nhỏ các vấn đề phức tạp cho dễ quản lý hơn. Các hệ thống cho
phép đối chiếu dữ liệu và đảm bảo rằng chúng đang được điều khiển bởi chính những
người tạo ra chúng, đảm bảo rằng hoạt động chính xác và kịp thời rất lý tưởng cho các
ứng dụng trực tuyến và kinh doanh chứng khoán.
Một loạt các hãng mới thành lập đang tạo ra những chương trình tận dụng tài
nguyên triển khai khả nǎng của P2P để lưu trữ các file, phân phối nội dung và chia sẻ
sức mạnh xử lý của các máy khác. Mục đích ở đây một phần là cắt giảm giá thành
phần cứng chẳng hạn như thiết bị lưu trữ, server và các thiết bị khác, nhưng cũng giúp
cho việc quản lý giao thông trên mạng. Mặc dù có tiềm nǎng dịch vụ lớn, nhưng đây là
một vấn đề khó khǎn nhất của P2P. Có quá nhiều vấn đề liên quan đến an toàn bảo
Nguyễn Thế Tùng – Đ04VT1
9
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
mật và sự phức tạp - không đề cập đến giá của các thiết bị lưu trữ và các server giảm
xuống - khiến cho các dịch vụ P2P trở nên không thiết thực.
Cuối cùng, công nghệ P2P có thể áp dụng cho các dịch vụ tính toán phân tán có
khả nǎng đạt được siêu xử lý cho các công ty cần khả nǎng xử lý lớn nhưng không
muốn bỏ hàng triệu đôla cho nó. Công nghệ này đã chia việc xử lý lớn ra thành những
xử lý nhỏ có thể phân tán giữa các máy tính trong một mạng. Mỗi một PC đồng thời
xử lý các dữ liệu và trả về kết quả cho máy tính trung tâm ráp nối các phần này lại. Ví
dụ, tiến trình này có thể được sử dụng để chia ra từng ảnh nhỏ riêng biệt để tạo hình
ảnh động cho những máy PC khác nhau thực hiện đồng thời và sau đó kết hợp những

hình đã được xử lý đó thành một chuỗi các hình liên tục. Khi có hàng ngàn, hay hàng
triệu máy tính được nối lại với nhau thì có thể liên kết tính toán siêu xử lý song song
với tốc độ nhiều triệu phép tính / giây, với giá thành nhỏ hơn nhiều so với các siêu
máy tính như máy đánh cờ Deep Blue hay Blue Gene của IBM. Các ứng dụng siêu xử
lý này có thể bán các dịch vụ kiểu này cho các công ty thiết kế công nghệ, nghiên cứu
y dược và tính toán mô hình tài chính kinh tế.
Thập kỷ trước đã chứng kiến những thay đổi lớn về cung cách làm việc. Biên
giới của các công ty đã trở lên rộng lớn hơn và mối quan hệ giữa khách hàng và nhà
cung cấp đã trở lên gần gũi hơn đồng thời sự tin tưởng của công ty vào những người
lao động tạm thời và các chuyên gia tǎng lên, trong khi đó các tổ chức lại dựa nhiều
hơn vào các nhóm làm việc đặc biệt. Những nơi làm việc như vậy sẽ không có một
cấu trúc làm việc cố định và một vai trò nghề nghiệp được xác định rõ ràng. P2P rất
phù hợp với cách thức hợp tác này.
Việc sử dụng các hệ thống mạng đã làm thay đổi một cách đáng kể lực lượng
lao động trong những nǎm gần đây. Những nhóm làm việc tự phát qua mạng là sự phát
triển có ý nghĩa quan trọng về cách thức làm việc của các công ty. Lần lượt các hệ
thống nhắn tin như ICQ và các công cụ P2P khác dùng để giao tiếp sẽ trở thành trung
tâm của các mạng như thế và cho phép người sử dụng liên kết với nhau một cách tự do
và dễ dàng.
Những bước nghiên cứu ban đầu về các ứng dụng P2P đã công nhận những xu
hướng như vậy trong thế giới kinh doanh. Các hệ thống giao tiếp tương tác liên kết các
hệ thống lập trình và thiết kế lại với nhau, tích hợp các kho dữ liệu khổng lồ và cho
phép những nhóm phát triển và thiết kế độc lập liên kết với nhau tốt hơn. Khả nǎng
liên kết các thông tin giữa các ứng dụng và hệ thống đã giúp các công ty như Ford
Nguyễn Thế Tùng – Đ04VT1
10
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
thực hiện nhanh hơn nhiều những chu kì thiết kế tuần hoàn của mình, vì vậy đã tiết
kiệm khoảng 15 triệu USD cho mỗi chương trình thiết kế bánh xe.
Liệu tất cả những điều này đang đánh dấu ngày tàn của server công ty? Các nhà

tin học cho rằng trong thương mại, P2P chỉ thích hợp cho những ứng dụng có trao đổi
thông tin trực tiếp. Như vậy, server sẽ tiếp tục duy trì vị trí của mình trong việc quản
lý nhân sự và chi tiêu, kế hoạch kinh doanh và nhiều ứng dụng khác. Tuy nhiên, trong
tương lai, server sẽ cung cấp các dịch vụ cao cấp hơn thay vì những việc lặt vặt đơn
giản như lưu trữ và phân phát các tệp. P2P là một kiểu kiến trúc máy tính mới có nhiều
hứa hẹn. Tuy vậy để có thể có các ứng dụng tin cậy như thực tế đòi hỏi, không ít công
sức và thời gian sẽ phải bỏ ra.
1.3 Phân loại mạng ngang hàng
1.3.1 Phân loại theo mức độ phân quyền
Phân quyền là một trong những khái niệm chính của hệ thống mạng ngang
hàng. Điều này bao gồm phân phối tài nguyên lưu trữ, sự xử lý, thông tin chia sẻ cũng
như thông tin điều khiển. Dựa trên cơ sở mức độ phân quyền và cách thức trao đổi, thu
nhận tài nguyên của các máy tính trong mạng ngang hàng người ta chia mạng ngang
hàng ra làm hai loại kiến trúc chính:
a, Mạng P2P thuần nhất
Hình 1-4: Mạng ngang hàng hoàn toàn
Trong hệ thống này, tất cả các máy đều được nối với nhau, đây là mô hình thể
hiện chính xác nhất bản chất của mạng ngang hàng. Trong mạng ngang hàng hoàn
Nguyễn Thế Tùng – Đ04VT1
11
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
toàn không có máy chủ trung tâm quản lý mạng, mọi máy tính trong mạng có vai trò
vừa là máy chủ vừa là máy khách. Trong mạng không có các máy định tuyến hay
trung tâm định tuyến, các máy trong mạng tự định tuyến cho chính nó. Trong hệ thống
như vậy tất cả các máy là cân bằng về chức năng, các máy là các node và được gọi là
“serv-ent”.
Ưu điểm của loại mạng này là khả năng mở rộng nhanh, khả năng chịu lỗi của
hệ thống lớn, các máy trong mạng có tính tự chủ cao. Khi trong mạng có một vài node
lỗi thì không gây ra lỗi toàn mạng và dễ dàng khắc phục. Các node có vai trò lớn hơn
đối với dữ liệu và tài nguyên của nó. Nhược điểm chính của mạng là tốc độ phát hiện

thông tin chậm, không đảm bảo chất lượng dịch vụ, khó đoán biết hành vi của hệ
thống.
Các mạng ngang hàng thuần tuý có thể kể như: Gnutella, Freenet
b, Mạng P2P lai ghép
Hình 1-5: Mạng lai ghép
Mạng P2P lai ghép có một máy chủ trung tâm dùng để lưu trữ thông tin của các
máy khách và trả lời các truy vấn thông tin của chúng. Máy chủ này điều khiển hoạt
động của mạng như một phần tử có thể kiểm soát toàn bộ các máy khác, đảm bảo tính
chặt chẽ của thông tin trên mạng. Các máy khách có vai trò lưu trữ thông tin, tài
nguyên được chia sẻ và cung cấp các thông tin của nó cho máy chủ. Tất cả các luồng
dữ liệu thông thường đều được truyền trực tiếp giữa các peer, chỉ các luồng thông tin
điều khiển mới được truyền qua Server trung tâm. Có hai kiểu mạng lai ghép: mạng lai
ghép với chỉ số hoá tập trung và mạng lai ghép chỉ số hoá phân tán.
Nguyễn Thế Tùng – Đ04VT1
12
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
Hình 1-6: Mạng lai ghép với chỉ số hoá tập trung
Trong mạng lai ghép chỉ số hoá tập trung có một máy chủ trung tâm bảo trì các
chỉ số của dữ liệu hoặc tài nguyên hiện tại đang được chia sẻ bởi các máy khách tích
cực, mỗi máy khách giữ gìn một kết nối tới máy chủ trung tâm để gửi các yêu cầu. Hệ
thống này với một server trung tâm đơn giản nhưng xử lí nhanh, có thể tìm kiếm phát
hiện thông tin hiệu quả đảm bảo trên toàn bộ hệ thống. Tuy vậy khả năng mở rộng
không cao mô hình này rất dễ bị lỗi và sụp đổ khi máy chủ trung tâm bị lỗi hoặc bị tấn
công, kích thước cơ sở dữ liệu và khả năng đáp ứng yêu cầu của nó là có giới hạn.
Kiến trúc này được sử dụng trong mạng Napster.
Hình 1-7: Mạng lai ghép với chỉ số hoá phân tán
Trong hệ thống này tồn tại một số siêu node lưu chỉ mục thông tin về các peer
cục bộ. Truy vấn thông tin được gửi tới siêu node, nó là proxy cho các peer cục bộ. Do
đó truy vấn thông tin nhanh hơn và lưu lượng trao đổi thông tin giữa các node ít hơn
so với hệ thống P2P thuần nhất. So với hệ thống chỉ số tập trung nó có ưu điểm là

Nguyễn Thế Tùng – Đ04VT1
13
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
giảm tải đáng kể cho server tránh lỗi cho toàn hệ thống nhưng phát hiện thông tin
chậm hơn. Ví dụ: mạng Kazaa, Morpheus.
1.3.2 Phân loại theo cơ chế tìm kiếm
Cơ chế định vị thông tin trong hệ thống là đặc điểm căn bản trong hệ thống P2P.
Cơ chế tìm kiếm trong mạng ngang hàng được phát triển từ thế hệ thứ nhất với cấu
trúc danh mục tập trung tới thế hệ thứ hai với cơ chế yêu cầu liên tục và thế hệ thứ ba
dựa vào bảng băm phân tán.
a, Cơ chế danh mục tập trung
Hình 1-8: Cơ chế danh mục tập trung
Cơ chế này được sử dụng trong mạng lai ghép, các máy khách kết nối tới máy
chủ chứa trung tâm thư mục, là nơi lưu trữ tất cả các thông tin về vị trí và cách sử
dụng tài nguyên. Dựa trên yêu cầu từ máy khách trung tâm chỉ số sẽ đưa yêu cầu tới
máy khách tốt nhất mà có thư mục phù hợp với yêu cầu. Máy khách tốt nhất có thể là
rẻ nhất, nhanh nhất, gần nhất, hoặc sẵn sàng nhất, phụ thuộc vào người sử dụng cần.
Sau đó dữ liệu sẽ được trực tiếp trao đổi giữa hai máy khách. Mạng Napster sử dụng
phương pháp này, một máy chủ trung tâm sẽ giữ gìn chỉ số của dữ liệu với các trường
tiêu đề của tất cả các file trên mạng, một bảng các thông tin đăng kí kết nối của người
dùng như địa chỉ IP, tốc độ kết nối…, một bảng danh sách các file mà người sử dụng
giữ và chia sẻ trong mạng. Khi bắt đầu, máy khách sẽ tiếp xúc với máy chủ trung tâm
và đưa ra một danh sách với các file mà nó giữ. Khi máy chủ thu được một yêu cầu từ
người dùng. Nó sẽ tìm kiếm cho chỉ số phù hợp file cần tìm, trả lại danh sách những
người dùng đang giữ file phù hợp. Người dùng sẽ thiết lập một kết nối trực tiếp tới
máy đang giữ file và lấy nó về.
Mô hình này có nhược điểm là khả năng mở rộng không cao, dễ bị lỗi toàn hệ
thống.
Nguyễn Thế Tùng – Đ04VT1
14

Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
b, Cơ chế yêu cầu liên tục
Hình 1-9: Cơ chế yêu cầu liên tục
Đây là mô hình mạng ngang hàng hoàn toàn trong đó mỗi điểm (peer) không
lưu giữ bất kỳ trung tâm thư mục nào và mỗi điểm sẽ công bố thông tin về nội dung
chia sẻ trong mạng ngang hàng. Vì vậy không một điểm đơn nào biết về tất cả các tài
nguyên, một điểm khi cần tìm kiếm tài nguyên nó sẽ gửi yêu cầu tới tất cả các điểm
đang kết nối với nó, cứ như thế yêu cầu được gửi đi cho tới khi được trả lời hoặc khi
số bước gửi yêu cầu là cực đại. Khi số điểm trên mạng lớn thì lưu lượng trên mạng sẽ
rất lớn, đây là nhược điểm của mô hình tìm kiếm này. Hệ thống này chỉ làm việc hiệu
quả với mạng nhỏ như Gnutella. Mô hình cải tiến đưa vào khái niệm super peer giảm
tiêu thụ băng thông và cho khả năng mở rộng cao hơn ví dụ Kazaa.
c, Cơ chế bảng băm phân tán
Hình 1-10: Cơ chế bảng băm phân tán
Đây là là mô hình tiên tiến nhất và được sử dụng trong mạng ngang hàng hoàn
toàn. Mô hình định tuyến thêm vào cấu trúc thông tin về những tài nguyên được lưu
Nguyễn Thế Tùng – Đ04VT1
15
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
trữ sử dụng bảng băm phân tán. Giao thức này cung cấp một ánh xạ giữa số nhận dạng
của tài nguyên (ID) và vị trí lưu trữ. Trong cấu trúc của bảng định tuyến một truy vấn
có thể được định tuyến hiệu quả tới node có tài nguyên mong muốn. Giao thức này
làm giảm bớt số bước mà node trong mạng cần thiết để định vị tài nguyên tìm kiếm.
Mỗi node được gắn một giá trị ID và nó biết một vài các node khác. Khi một node
muốn chia sẻ tài liệu, tên và nội dung của tài liệu đó được băm tạo ra một ID gắn với
tài liệu đó. Tài liệu được định tuyến tới node có ID gần với ID của tài liệu nhất. Khi
một node muốn lấy một tài liệu nào đó nó gửi yêu cầu chứa ID của tài liệu. Yêu cầu
được chuyển tới node có ID gần với ID của tài liệu nhất, sau đó tài liệu được chuyển
tới node yêu cầu. Các mạng ngang hàng thế hệ mới đều sử dụng phương pháp tìm
kiếm này như: Freenet, Chord, Kademlia… Mô hình này được chứng minh là có hiệu

quả với mạng có số peer lớn. Tuy vậy nó vẫn tồn tại các nhược điểm đó là khó cài đặt
tính năng tìm kiếm do phải biết trước ID của file trước khi gửi yêu cầu. Băm tên file
hoặc nội dung khác nhau tạo ra ID khác dẫn đến không tìm thấy file. Các node khi
chia vào các nhóm khác nhau không có sự liên hệ dẫn đến vấn đề ‘’islanding’’(cô lập).
1.3.3 Phân loại theo cấu trúc
Cấu trúc mạng ngang hàng bao gồm tất cả các nút mạng đại diện cho các máy
tham gia và các liên kết giữa các nút mạng này. Một liên kết tồn tại giữa hai nút mạng
khi một nút mạng biết vị trí của nút mạng kia. Dựa vào cấu trúc liên kết giữa các nút
mạng ta có thể phân loại mạng ngang hàng thành 2 loại: có cấu trúc hay không cấu
trúc.
Một mạng ngang hàng không cấu trúc khi các liên kết giữa các nút mạng trong
mạng phủ được thiết lập ngẫu nhiên (tức là không theo qui luật nào). Những mạng như
thế này dễ dàng được xây dựng vì một máy mới khi muốn tham gia mạng có thể lấy
các liên kết có sẵn của một máy khác đang ở trong mạng và sau đó dần dần tự bản
thân nó sẽ thêm vào các liên kết mới của riêng mình. Khi một máy muốn tìm một dữ
liệu trong mạng ngang hàng không cấu trúc, yêu cầu tìm kiếm sẽ được truyền trên cả
mạng để tìm ra càng nhiều máy chia sẻ càng tốt. Hệ thống này thể hiện rõ nhược điểm:
tỉ lệ tìm kiếm thành công thấp. Đối với tìm kiếm các dữ liệu phổ biến được chia sẻ trên
nhiều máy, tỉ lệ thành công là khá cao, ngược lại, nếu dữ liệu chỉ được chia sẻ trên một
vài máy thì xác suất tìm thấy là khá nhỏ. Tính chất này là hiển nhiên vì trong mạng
ngang hàng không cấu trúc, không có bất kì mối tương quan nào giữa một máy và dữ
liệu nó quản lý trong mạng, do đó yêu cầu tìm kiếm được chuyển một cách ngẫu nhiên
đến một số máy trong mạng. Số lượng máy trong mạng càng lớn thì khả năng tìm thấy
Nguyễn Thế Tùng – Đ04VT1
16
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
thông tin càng nhỏ. Một nhược điểm khác của hệ thống này là do không có định
hướng, một yêu cầu tìm kiếm thường được chuyển cho một số lượng lớn máy trong
mạng làm tiêu tốn một lượng lớn băng thông của mạng, dẫn đến hiệu quả tìm kiếm
chung của mạng thấp.

Hầu hết các mạng ngang hàng không cấu trúc phổ biến như Napster, Gnutella,
Fasttrack và eDonkey2000.
Mạng ngang hàng có cấu trúc khắc phục nhược điểm của mạng không cấu trúc
bằng cách sử dụng hệ thống DHT (Bảng Băm Phân Tán: Distributed Hash Table). Hệ
thống này định nghĩa liên kết giữa các nút mạng trong mạng phủ theo một thuật toán
cụ thể, đồng thời xác định chặt chẽ mỗi nút mạng sẽ chịu trách nhiệm đối với một
phần dữ liệu chia sẻ trong mạng. Với cấu trúc này, khi một máy cần tìm một dữ liệu,
nó chỉ cần áp dụng một giao thức chung để xác định nút mạng nào chịu trách nhiệm
cho dữ liệu đó và sau đó liên lạc trực tiếp đến nút mạng đó để lấy kết quả. Mô hình
này đem lại hiệu quả tìm kiếm cao nhưng lại tăng chi phí duy trì khi các peer tham gia
hay rời khỏi mạng.
Một số mạng ngang hàng có cấu trúc nổi tiếng bao gồm Chord, CAN,
Kademlia, Pastry và Tapestry.
1.4 Ứng dụng của mạng ngang hàng
Có thể chia các ứng dụng của P2P thành bốn loại:
1.4.1 Chia sẻ tài liệu
Lưu trữ và trao đổi tài nguyên là một trong những mặt thành công nhất của công
nghệ mạng ngang hàng. Ứng dụng chia sẻ tài liệu tập trung vào sự lưu trữ thông tin và
khôi phục thông tin từ nhiều máy khác trên mạng. Một trong những ví dụ tốt nhất của
mạng ngang hàng là Napster, nó trở thành hệ thống chia sẻ ca nhạc nổi tiếng .
1.4.2 Phân tán tính toán
Ứng dụng này sử dụng tài nguyên từ một số các máy tính trên mạng (năng lực
xử lí của các máy tính rỗi trên mạng). Ý tưởng đằng sau ứng dụng này là bất kỳ máy
tính nào kết nối vào mạng có thể được sử dụng để giải quyết vấn đề của những máy
khác đang yêu cầu tính toán thêm. Ví dụ dự án SETI (Search for Extraterrestrial
Intelligence: Tìm kiếm nền văn minh ngoài trái đất).
Nguyễn Thế Tùng – Đ04VT1
17
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
1.4.3 Hợp tác

Mục đích của ứng dụng hợp tác trong mạng ngang hàng là cho phép cộng tác ở
mức ứng dụng giữa các người dùng ví dụ như chat, instant messaging, online game
đến các ứng dụng chia sẻ có thể sử dụng trong kinh doanh, giáo dục …
1.4.4 Lớp nền
P2P platform cung cấp hạ tầng cho các ứng dụng phân tán sử dụng cơ chế P2P.
Các phần tử P2P sử dụng ngữ cảnh để phát hiện, kết nối, bảo mật, tập hợp tài
nguyên…Ví dụ JXTA là một P2P platform cung cấp một nền cơ bản cho việc lập trình
và xử lí trên mạng.
1.5 Các vấn đề đối với mạng ngang hàng
Hệ thống P2P có một số ưu điểm hơn so với hệ thống client-server truyền thống
như khả năng mở rộng, khả năng chịu lỗi, hiệu năng cao. Tuy nhiên còn nhiều vấn đề
mà các hệ thống P2P hiện nay đang phải giải quyết:
1.5.1 Tính bảo mật
Bảo mật cho hệ thống P2P khó khăn hơn các hệ thống khác, các node trong hệ
thống là động, phân tán khắp nơi, các node không chứng thực lẫn nhau. Các cơ chế
bảo mật truyền thống như tường lửa, xác thực… không thể bảo vệ hệ thống P2P ngược
lại có thể ngăn cản quá trình truyền thông trong hệ thống. Bởi vậy những khái niệm
bảo mật mới được đặt ra đối với hệ thống P2P.
1.5.2 Độ tin cậy
Một hệ thống đáng tin cậy là hệ thống có thể phục hồi khi lỗi xảy ra. Những
nhân tố cần phải quan tâm khi tính toán cho sự tin cậy là: nhân bản dữ liệu, phát hiện
node lỗi, phục hồi… đảm bảo cho thông tin định vị tránh lỗi đơn và khả năng sẵn sàng
nhiều đường dẫn tới dữ liệu. Nhân bản dữ liệu tăng sự tin cậy bằng việc tăng sự dư
thừa và định vị. Có hai chiến lược cho nhân bản: nhân bản nguyên gốc và nhân bản
đường dẫn. Trong nhân bản nguyên gốc, khi tìm kiếm thành công dữ liệu được lưu trữ
chỉ tại node yêu cầu. Trong nhân bản đường dẫn khi tìm kiếm thành công dữ liệu được
lưu trữ tại tất cả các node dọc theo đường dẫn từ node yêu cầu tới node cung cấp.
Nguyễn Thế Tùng – Đ04VT1
18
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp

1.5.3 Độ linh động
Chính là khả năng tự chủ của các node trong việc gia nhập hoặc rời bỏ hệ thống.
Để giải quyết vấn đề quy mô lớn, phân tán và linh động của các hệ thống P2P, khi xây
dựng các hệ thống P2P cần chú ý đến khả năng điều chỉnh và tự tổ chức.
1.5.4 Cân bằng tải
Phân phối dữ liệu để lưu trữ hoặc tính toán trên các node là vấn đề rất quan
trọng trong các hệ thống mạng ngang hàng, một giải pháp đặc biệt cho sự phân phối
này là Bảng băm phân tán (DHT). Trong cách tiếp cận này, cân bằng tải được xem xét
trên hai khía cạnh: cân bằng không gian địa chỉ tức là cân bằng phân phối của không
gian key address trên các node và cân bằng item trong trường hợp phân phối của các
item trong không gian địa chỉ không thể là ngẫu nhiên. Cân bằng tải giữa các node tính
toán trong hệ thống P2P cũng có thể được cài đặt sử dụng mô hình tự tổ chức dựa trên
agent.
1.6 Một số ví dụ về mạng ngang hàng
1.6.1 Mạng Edonkey
Hay còn gọi là mạng Edonkey2000 là một chương trình chia sẻ tệp trên mạng
ngang hàng, được phát triển bởi MetaMachine, sử dụng giao thức truyền tệp đa nguồn
(tiếng Anh: Multisource File Transfer Protocol). Chương trình eDonkey hỗ trợ cả hai
mạng eDonkey và mạng Overnet.
Người dùng eDonkey2000 chủ yếu chia sẻ những tệp rất lớn, hàng trăm
mêgabyte, như đĩa CD, phim, trò chơi, và phần mềm. Không như các phần mềm chia
sẻ tệp ngang hàng khác, tệp chia sẻ trong mạng eDonkey được cung cấp dưới dạng
một liên kết ed2k, chương trình eDonkey2000 sẽ tự khởi động và tải tệp khi liên kết
ed2k được kích hoạt.
Nguyễn Thế Tùng – Đ04VT1
19
Chương 1: Lý thuyết chung về mạng ngang hàng Đồ án tốt nghiệp
Hình 1-11: Mạng Edonkey
Edonkey là mạng ngang hàng phân quyền, tài nguyên không được lưu trữ ở một
máy chủ trung tâm mà được chia sẻ trực tiếp giữa những người sử dụng. Phần mềm

của mạng Edonkey cài đặt trên máy khách kết nối vào mạng để chia sẻ tài nguyên.
Các máy chủ đóng vai trò như những hub truyền thông cho các khách hàng, cho phép
người sử dụng định vị tài liệu trong mạng. Bằng việc chạy phần mềm máy chủ
Edonkey trên một máy tính kết nối vào Internet, bất kỳ người sử dụng nào cũng có thể
kết nối tới máy chủ để vào mạng. Số máy chủ và địa chỉ của nó thường xuyên thay
đổi, chương trình chạy trên các máy khách sẽ thường xuyên cập nhật danh sách các
server.
Đặc tính của mạng Edonkey là các tài liệu được nhận dạng duy nhất bằng cách
sử dụng thuật toán băm MD4, nó là hàm duy nhất của nội dung tài liệu. Điều này có
nghĩa là khi tên file giống nhau nhưng nội dung khác nhau thì số nhận dạng sẽ khác
nhau. Hơn nữa những tài liệu mà có kích thước lớn hơn 9.28MB sẽ được chia ra thành
các khối và việc kiểm tra của thuật toán MD4 sẽ tính toán cho các khối đó. Bằng việc
tính giá trị theo MD4 cho các khối, khối bị lỗi của một file lớn sẽ được nhận dạng và
được tải về lại sau đó chứ không yêu cầu phải tải lại toàn bộ file. Hơn nữa những khối
không bị lỗi sau khi được tải xuống có thể lập tức được chia sẻ thậm chí trước khi
phần còn lại của tài liệu được tải xuống, tăng tốc độ phân phối của những tài liệu lớn
khắp mạng. Để tính giá trị tổng của một tài liệu, MD4 cộng tất cả các giá trị của các
phần ra được kết quả băm của file, đây là giá trị ID gắn với file.
Trong mạng Edonkey các máy chủ phục vụ xuất hiện để kiểm duyệt những nội
dung chia sẻ và thông tin về các file bằng cách kiểm tra kiểu của file. Các máy này là
Nguyễn Thế Tùng – Đ04VT1
20

×