Tải bản đầy đủ (.doc) (76 trang)

Internet và các dịch vụ trên internet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (795.79 KB, 76 trang )

chơng I
interneT và các dịch vụ
trên internet
Lịch sử ra đời của INTernet:
Internet, mạng của các mạng, là một liên mạng toàn cầu ra đời từ những
năm 70 và phát triển với một tốc độ rất nhanh. Tiền thân của nó là mạng
ARPANet (viết tắt của từ Advanced Research Project Agency Network có nghĩa
là mạng của trung tâm phát triển dự án nghiên cứu thuộc Bộ Quốc phòng Mỹ) đợc
thành lập từ năm 1969. Mục đích ban đầu của mạng này là phát triển một mạng
thông tin có khả năng hoạt động đợc ngay cả khi một bộ phận trong mạng bị tấn
công bởi bom nguyên tử. Càng ngày mạng ARPAnet ngày càng mở rộng với rất
nhiều tổ chức Quốc tế kết nối vào nó nhằm mục đích truy nhập thông tin hàng
ngày. Đến năm 1975, mạng ARPANet đợc chuyển từ một mạng thí nghiệm sang
một mạng hoạt động chính thức. Cùng với sự ra đời của bộ giao thức TCP/IP (viết
tắt của từ Transmission Control Protocol/ Internet Protocol, có nghĩa là giao thức
truyền dữ liệu và giao thức Internet) thì sự phát triển của ARPANet ngày càng lớn
mạnh khắp thế giới. Cho đến khi các chuẩn TCP/IP đợc sử dụng rộng rãi thì thuật
ngữ INTERNET đã đợc mọi ngời công nhận nh là một từ chỉ tới mạng thông tin
toàn cầu lớn nhất và bao trùm tất cả các mạng khác trên thế giới.
Về cơ bản, INTERNET là một liên mạng máy tính giao tiếp dới cùng một bộ
giao thức TCP/IP. Giao thức này cho phép mọi máy tính trên mạng giao tiếp với
nhau một cách thống nhất giống nh một ngôn ngữ Quốc tế mà mọi ngời sử dụng
để giao tiếp với nhau hàng ngày. Các mạng cấu thành nên INTERNET đợc kết nối
với nhau thông qua nhiều hệ thống truyền tin khác nhau.

-1-
Các dịch vụ trên internet
Nh ta đã biết, INTERNET là một liên mạng Quốc tế bao gồm rất nhiều các
dịch vụ khác nhau, các nhà cung cấp dịch vụ INTERNET (ISP - viết tắt của từ
Internet Server Provider) phải cung cấp cho các thuê bao INTERNET tất cả các
dịch vụ trên mạng mà thuê bao yêu cầu. Tuy nhiên trong phần này chỉ giới thiệu


sơ lợc một số dịch vụ quan trọng trên INTERNET, đó là dịch vụ th điện tử, FTP,
Gopher, Wais, World Wide Web, NetNews và Veronica.
Các dịch vụ th điện tử:
Th điện tử (e-mail) là công cụ quan trọng nhất và đơn giản nhất để đa thông
tin tới mọi ngời dùng trên INTERNET. Ngoài ra dịch vụ th điện tử không chỉ nối
kết những ngời trên INTERNET mà còn cả với những ngời trên các mạng thơng
mại khác nh: Compuserve, American Online, Prodigy .v.v.v... với số lợng tổng
cộng tới gần 10 triệu ngời dùng trên thế giới.
Kể từ khi th điện tử trở thành một dịch vụ chiếm u thế trên INTERNET, thì
dịch vụ mailling-list là một cách tốt nhất để cung cấp các thông tin nóng hổi
tới tay nhiều ngời cùng một lúc.
Có hai dạng dịch vụ mở rộng dựa trên th điện tử, đó là dịch vụ mailling-list
hay còn gọi là danh sách điện th và dịch vụ Archive tức là dịch vụ tìm kiếm và
chuyển file.
Một mailling-list là một danh sách địa chỉ th điện tử của một nhóm ngời nào
đó, chỉ cần gửi một bức th tới một địa chỉ thì tất cả những ngời còn lại trong danh
sách đều nhận đợc th.
Một dịch vụ Archive làm nhiệm vụ truyền các file qua đờng điện th theo đòi
hỏi của ngời sử dụng.
Ta có thể dùng mailling-list cho nhiều mục đích đa dạng, từ những việc đơn
giản cho đến những việc phức tạp. Ngời ta có thể dùng mailling-list để tạo ra các
nhóm tranh luận về một đề tài nào đó trên INTERNET. Hiện nay có một số chơng

-2-
trình mailling-list thông dụng nh: Majordomo, Listserv, Listproc .v.v... để tự động
hoá công việc quản lý những danh sách mailling-list lớn.
Dịch vụ Archive có thể tự động thực hiện yêu cầu của ngời dùng truyền các
file qua đờng điện th. Mọi ngời có thể gửi th điện tử tới máy phục vụ còn gọi là
server, để yêu cầu một đề mục thông tin hoặc những file dữ liệu, server sẽ tìm
kiếm trong tài nguyên của nó có đáp ứng đợc không, sau đó nó sẽ chuyển về cho

chúng ta theo đờng điện th. Nếu một file quá lớn, thì server sẽ mã hoá file đó,
phân nó thành các phần nhỏ rồi chuyển tới tay ngời dùng; ở phía ngời nhận sẽ
phải ráp lại các phần nhỏ, giải mã lại các file rồi mới lấy đợc đúng tài liệu mình
cần.
Dịch vụ FTP (File Transfer Protocol)
Đây là dịch vụ mà mọi ngời dùng trên INTERNET đều sử dụng để truyền các
file, bởi vì đó là dịch vụ phổ biển nhất để truyền các file trên INTERNET. Dịch
vụ này cho phép ngời sử dụng đăng nhập vào các máy từ xa nhng chỉ giới hạn ở
mức chuyển giao các file. Những máy FTP server đợc thiết lập cho các dịch vụ
FTP công cộng thờng đợc gọi là FTP nặc danh, bởi vì mọi ngời đều có thể đăng
nhập vào mà không cần ghi rõ địa danh hoặc mật khẩu. Những FTP client thì có
ở tất cả các máy tính từ máy tính cá nhân tới máy tính mainframer. Dịch vụ FTP
là dịch vụ đợc sử dụng nhiều nhất sau th điện tử.
FTP cung cấp tất cả các dạng file, trên thực tế nó không quan tâm tới dạng
file cho dù đó là dạng file ASCH, file nhị phân .v.v.. Chỉ cần một ít cấu hình và
một máy FTP server, chúng ta có thể phân lớp ngời sử dụng nào có quyền đợc
truy nhập từng phần trong kho tài nguyên của mình, giới hạn số ngời sử dụng dịch
vụ cùng một thời điểm ...
Tuy nhiên FTP cũng có nhợc điểm. Điểm chính là việc truy nhập vào từng th
mục để tìm file là một quá trình chậm chạp. Kỹ thuật truyền thống mà một quản
trị mạng dùng để giúp ngời sử dụng tìm file là cung cấp một danh sách đệ qui các
file mà điều này không phải là không có rắc rối. Một vài ngời quản trị có thể tạo

-3-
ra các file README ở mỗi th mục để mô tả nội dung của nó, tuy nhiên điều này
lại dẫn tới việc các file này luôn lạc hậu so với nội dung thực.
Dịch vụ Telnet và Finger
Đây là hai dịch vụ có ở hầu hết các hệ điều hành Unix, vì vậy nó đợc sử dụng
rộng rãi dù nó có giao diện không mấy thân thiện.
Telnet là dịch vụ cho phép ta đăng nhập vào các máy trên mạng nh một thiết

bị đầu cuối (terminal). Nó thờng đợc dùng để cung cấp dịch vụ Internet tơng
tự nh khi bạn nối vào hệ thống bằng modem.
Dịch vụ Finger đợc thiết kế để cung cấp thông tin cho ngời sử dụng ở các hệ
thống từ xa. Nó có thể cung cấp một số dạng thông tin nh tin tức thời tiết .v.v...
Dịch vụ Gopher
Gopher là một dịch vụ cho phép ta định hớng qua các nguồn thông tin.
Các phần mềm Gopher Client hiển thị một thực đơn theo dạng chọn lựa trên
bảng, sau đó ngời dùng chọn một đề mục, đề mục này có thể hiện thị một số t liệu
hoặc đa ngời sử dụng đến một thực đơn khác. Ngoài ra ta cũng có thể trở lại đề
mục cũ một cách dễ dàng. Đi kèm với mỗi hệ thống thực đơn là các tài liệu, ngời
dùng có thể xem hoặc lu trữ nó, và một danh sách chỉ mục để tìm kiếm thông tin
nữa. Một vài đề mục trong thực đơn có thể kết nối với các server khác và một số
dịch vụ thông tin nh FTP. Cấu trúc thực đơn đơn giản nh vậy nhng thực ra lại rất
hữu ích và dễ dàng tổ chức cũng nh bảo trì nó. Đồng thời nó cũng rất dễ dàng
quản lý: việc cấu trúc thông tin trên một server chỉ đơn giản là tạo nên một th mục
để thiết lập server trên đó, các th mục nhỏ hơn sẽ là các đề mục của thực đơn và
các file trên th mục sẽ là các tài liệu thông tin. Vấn đề đặt ra ở đây là phải làm sao
cho thông tin dễ truy nhập và cập nhập thờng xuyên với các server khác.

-4-
Tuy nhiên, các hạn chế của dịch vụ Gopher chính là các dạng dự liệu mà nó
hỗ trợ và số dịch vụ mà nó có thể truy nhập đợc. Hiện nay Gopher mới chỉ hiển
thị dữ liệu dạng văn bản và chỉ truy nhập đợc một số dịch vụ nh FTP, Telnet,
Wais, .v.v... Mặc dù vậy, Gopher vẫn đợc a chuộng bởi nó là dịch vụ rẻ tiền và
truy nhập thông tin nhanh chóng. Ngày nay, Gopher đã bị thay thế dần bởi một
dịch vụ mạnh hơn, đó là dịch vụ World Wide Web.
Dịch vụ WAIS (Wide Area Information Server)
Trong khi Gopher và World Wide Web thờng dùng giao diện ngời dùng để
hiển thị thông tin và hỗ trợ rất ít khả năng tìm kiếm dữ liệu thì ngợc lại ở Wais
chức năng tìm kiếm dữ liệu lại quan trọng hơn cả. Đó là dịch vụ hỗ trợ tìm kiếm

thông tin rất hữu hiệu nhng lại hỗ trợ tối thiểu về giao diện ngời dùng. Về khía
cạnh nào đó, ngời ta coi Wais nh là một bổ sung rất tốt cho Gopher và World
Wide Web.
Dịch vụ này tìm kiếm thông tin trên một danh sách của server cho một hoặc
nhiều từ khoá và đa ra những báo cáo về kết quả tìm kiếm. Một cơ chế tìm kiếm
cho phép ta tìm đợc những tài liệu theo một từ khoá nào đó và nếu không tìm đợc
tài liệu này, nó sẽ cho ta những tài liệu gần với đòi hỏi nhất.
Wais làm việc dựa trên một chỉ mục đợc tạo bởi một số tiêu chí nào đó. Các
phần mềm đánh mục chỉ có thể xử lý đợc rất nhiều dạng dữ liệu khác nhau, bao
gồm các file văn bản, Latex, Poscript .v.v..., danh sách th điện tử. Có thể thêm vào
một cách dễ dàng các kiểu dữ liệu mới để tìm kiếm. Ngoài ra phần đánh chỉ mục
và cơ sở dữ liệu của Wais cho phép kết hợp nhiều dạng dữ liệu trong một chỉ mục
để tìm kiếm.
Một vấn đề nảy sinh là các chỉ mục dữ liệu thờng rất lớn so với chính bản
thân dữ liệu. Khi ta đánh chỉ mục các file tin văn bản thì có thể file chỉ mục sẽ rất
lớn. Nếu Wais bao gồm nhiều loại thông tin để tìm kiếm thì ta phải trả giá về

-5-
không gian đĩa để chạy. Vì vậy hiện nay ngời ta đang tìm biện pháp để giải quyết
vấn đề này.
Dịch vụ World Wide Web (W W W)
Đây là dịch vụ mới phát triển mạnh trên INTERNET. Nó bao gồm nhiều chức
năng, cộng thêm khả năng tích hợp đợc hầu hết các dịch vụ hiện có trên
INTERNET. World Wide Web cho phép ta truy cập đợc Gopher, Wais, FTP, sử
dụng Telnet, Finger.
Các tài liệu World Wide Web đợc viết bằng ngôn ngứ HTML, hay còn gọi là:
Hyper Text Markup Language. Nó cho phép ta mô tả các mối liên kết giữa các tài
liệu với nhau và các mối liên kết tới các dịch vụ INTERNET khác. Web truyền
các tài liệu HTML thông qua một giao thức gọi là HTTP (Hyper Text Transfer
Protocol).

Các tài liệu HTML bao gồm khả năng liên kết tới rất nhiều dạng thông tin
khác nhau nh văn bản, âm thanh .v.v...
Tuy nhiên do khả năng hỗ trợ multimedia nh vậy, chỉ những ngời có đờng kết
nối tốc độ cao vào mạng INTERNET mới có khả năng tận dụng hết các khía cạnh
u việt của dịch vụ World Wide Web.
Dịch vụ Netnews.
Dịch vụ mailling-list là một cách khả dĩ để chuyển th cho một nhóm nhỏ ngời
nhng tỏ ra không hiệu quả khi gửi cho nhiều ngời. Đơn giản là vì, việc duy trì
danh sách lớn hàng ngàn ngời cũng đã mất rất nhiều công sức ngay cả khi tự động
hoá gần hết danh sách bằng một chơng trình nh LISTSERV chẳng hạn. Một điều
nữa là việc chuyển th tới hàng ngàn địa chỉ là một gánh nặng cho hệ thống chuyển
th đi.

-6-
Dịch vụ USENET News (hay còn gọi là Netnews hay ngắn gọn hơn là News)
giải quyết đợc vấn đề đó, USENET có thể coi là một hệ thống bản tin điện tử
(Bulltin Board System) rất lớn, đợc xây dựng nh là một mạng logic ở phía trên các
mạng và các kết nối khác. Các chơng trình đọc tin (newsreader) cho phép ngời
dùng có thể chọn các tin mà họ quan tâm, do đó tránh đợc hiện tợng lãng phí ổ
đĩa khi phải lu trữ những thông tin không cần thiết ở nhiều nơi. Ngoài ra còn có
các chỉ mục, các liên kết chéo và việc loại bỏ các tin cũ.
Các tin trên mạng đợc chia thành các nhóm tin theo các chủ đề khác nhau,
chúng ta có thể nghĩ đến nhóm tin nh một bảng thông báo điện tử hay một cuộc
thảo luận dành cho một chủ đề. Tồn tại hàng trăm nhóm tin trên mạng phục vụ
cho mọi nhu cầu trong cuộc sống: từ các nhóm tin về chủ đề kỹ thuật nh trí tuệ
nhân tạo, chuẩn ngôn ngữ lập trình hay các hệ thống máy tính đặc biệt cho tới các
chủ đề về nhà vờn hay rợu vang .v.v...
Hiện nay USENET có trên 30 nghìn địa điểm trên toàn thế giới. Rất nhiều
địa điểm USENET dùng UUCP nh là một giao thức mạng cơ bản. Tuy nhiên
USENET đợc nối qua nhiều hệ thống gateway đến nhiều mạng máy tính lớn trên

thế giới chẳng hạn nh BITNET, và EASYnet dùng một số giao thức khác nh
NNTP hay Notes thay cho UUCP.
Dịch vụ Veronica
Đối với dịch vụ Gopher việc tìm kiếm nguồn thông tin t liệu nhiều khi không
kết quả (nghĩa là không tìm thấy nơi chứa thông tin cần tìm). Trong trờng hợp đó
ngời sử dụng có thể muốn tìm các Gopher server để nhằm tìm nguồn thông tin
cần có, dịch vụ này gọi là dịch vụ Veronica.
Để dùng dịch vụ này ngời sử dụg phải kết nối máy tính của mình với một
Gopher server nào đó trên INTERNET (mà ngời sử dụng đã có đăng ký Account
Gopher Server đó) và Gopher Server đó cho phép truy nhập tới một Veronica

-7-
Server nµo ®ã. C¬ së dù liÖu vÒ Veronica ®îc t¹o nªn b»ng viÖc quÐt c¸c thùc ®¬n
trªn c¸c Gopher Server trªn m¹ng INTERNET, ®ång thêi còng cã t×m ®îc th«ng
qua c¸c kh«ng gian Gopher cã sö dông Veronica.

-8-
Chơng II
Bộ giao thức trên Internet
Hiện nay có rất nhiều họ giao thức đang đợc thực hiện trên mạng truyền
thông nh: IEE802.X dùng cho mạng cục bộ; CCITT X25 dùng cho mạng tầm
rộng và đặc biệt là họ giao thức chuẩn của ISO (viết tắt của từ International
Standard Organization - Tổ chức chuẩn hoá Quốc tế), dựa trên mô hình tham
chiếu bảy tầng cho việc kết nối các hệ thống mở. Gần đây do sự xâm nhập của
mạng INTERNET vào Việt Nam chúng ta đợc làm quen với họ giao thức mới là:
TCP/IP mặc dù chúng đã xuất hiện từ hơn 20 năm trớc đây.
Nh đã đề cập ở trên đây, mạng INTERNET đợc xây dựng trên cơ sở giao thức
TCP/IP. Thực chất đây là một bộ gồm nhiều giao thức làm những nhiệm vụ khác
nhau; tên của bộ giao thức đợc đặt theo tên hai giao thức quan trọng nhất, đó là :
TCP (Transmission Control Protocol) và (Internet Protocol). Bên cạnh hai giao

thức này còn có rất nhiều giao thức khác nh:
- FTP (File Transfer Protocol): Giao thức truyền tập tin trên mạng.
- SNMP (Simple Network Management Protocol): Giao thức quản lý mạng
đơn giản.
- SMTP (Simple Mail Transfer Protocol): Giao thức truyền th đơn giản.
- HTTP (Hyper Text Transport Protocol): Giao thức truyền các siêu văn bản.
- Nhiều giao thức khác....
Đây là bộ giao thức đợc dùng rộng rãi vì tính mở của nó. Có nghĩa là bất cứ
máy nào dùng bộ giao thức TCP/IP đều có khả năng nối đợc vào mạng
INTERNET. Để hiểu về bộ giao thức TCP/IP chúng ta hãy tìm hiểu qua về mô
hình OSI đã đợc coi là một chuẩn trên toàn thế giới.
I. Mô hình bộ giao thức OSI (Open System Interconnection)

-9-
Cấu trúc của mô hình OSI đợc biểu diễn trong hình sau:
Các lớp trên thực hiện các chức năng sau:
Lớp nối vật lý (Physical Link Leyer):
Lớp này bảo đảm các công việc sau:
- Lập, cắt cuộc nối.
- Truyền tin dạng bit qua kênh vật lý.
- Có thể có nhiều kênh.
Lớp nối số liệu (Data Link Leyer):

-10-
Lớp ứng dụng
(application)
Lớp THể HIệN
(PRESENTATION)
Lớp PHIÊN
(SESSION)

Lớp điều vận
(Trans Post layer)
Lớp MạNG
(NETWORK)
Lớp LIÊN KếT Dữ LIệU
(DATA LINK)
Lớp VậT Lý
(PHYSICAL LINK)
Lớp này đảm bảo việc biến đổi các tin dạng bit nhận đợc từ lớp dới (vật lý)
sang dạng khung số liệu, thông báo cho hệ phát kết quả thu đợc sao cho các thông
tin truyền lên cho mức 3 không có lỗi.
Các thông tin truyền ở mức 1 có thể làm hỏng các thông tin khung số liệu
(Framer Error). Phần mềm mức hai sẽ thông báo cho mức một truyền lại các
thông tin bị mất/lỗi.
Đồng bộ hay các hệ số có tốc độ xử lý tính khác nhau, một trong những ph-
ơng pháp hay sử dụng là dùng bộ đệm trung gian để lu giữ số liệu nhận đợc. Độ
lớn của bộ đệm này phụ thuộc vào tơng quan xử lý của các hệ thu và phát.
Trong trờng hợp đờng truyền song công toàn phần, lớp datalink phải đảm
bảo việc quản lý các thông tin số liệu và các thông tin trạng thái.
Lớp mạng (Network Leyer):
Lớp mạng có thể gọi một cách khác là lớp liên lạc mạng (Comunication
Subnet Layer) theo dõi toàn bộ hoạt động của Subnet, các thông tin số liệu ở lớp
này đợc tổ chức thành gói dữ liệu (packets) chứa đầy đủ địa chỉ gốc (Source) và
địa chỉ đích (Destination).
Số lợng các gói dữ liệu truyền trên các kênh khác nhau của mạng thông tin
máy tính phụ thuộc vào lu lợng thông tin trên các đờng truyền. Lớp mạng đảm
bảo tìm đờng tối u cho các gói dữ liệu bằng các giao thức chọn đờng dựa trên các
thiết bị chọn đờng (Route).
Lớp mạng kiểm soát thông tin trong mạng để quyết định số lợng gói vận
chuyển, tránh trờng hợp có quá nhiều gói dữ liệu trên Subnet gây ra tắc nghẽn.

Lớp điều vận (Transpost Leyer):
Lớp này thực hiện các chức năng sau:

-11-
Nhận thông tin từ lớp phiên (Session) chia thành các gói nhỏ hơn và truyền
xuống lớp dới, hoặc nhận thông tin từ lớp dới chuyển lên phục hồi theo cách chia
của hệ phát.
Yêu cầu nối xuất phát từ lớp 5 (Session), trong trờng hợp hệ thống yêu cầu
chuyển nhanh thông tin, lớp điều vận sẽ thiết lập nhiều cuộc nối để tăng lu lợng
thông tin trên mạng (phí thuê bao tăng). Hoặc hệ thống có thể dùng chung cuộc
nối cho các thông tin khác nhau (giảm phí thuê bao).
Có cơ chế để kiểm soát dòng thông tin để đồng bộ tốc độ xử lý giữa các hệ
(giữa hệ nhanh và hệ chậm).
Lớp phiên (Session)
Cuộc nối giữa 2 ngời dùng gọi là phiên.
Giao diện giữa mạng và ngời sử dụng, ngời sử duọng thiết lập, quản lý, đối
thoại, kết thúc cuộc nối.
Cho phép ngời sử dụng thâm nhập vào hệ xa, truyền file giữa các hệ. Trong
trờng hợp các đờng truyền thông không hoặc cha vận chuyển hết thông tin cho hệ
ở xa đợc, lớp phiên sẽ đảm bảo không hoặc cha chuyển giao các thông tin đó cho
hệ xa (thí dụ trong khi truyền file dữ liệu lớp phiên sẽ đợi nhận đủ file mới
chuyển cho ngời sử dụng dùng hệ xa).
Lớp thể hiện (Presentation Lever):
- Th viện các yêu cầu của ngời dùng.
- Chứa các th viện tiện ích.
- Thí dụ thay đổi dạng thể hiện của các tệp, nén file...
Lớp ứng dụng (Application Leyer):

-12-
Lớp ứng dụng cho phép ngời sử dụng khai thác các tài nguyên trong mạng t-

ơng tự nh tài nguyên tại chỗ (hệ thống mạng thông suốt đối với ngời sử dụng -
USER Transparent).
* TCP/IP với mô hình OSI
hình dung vị trí của TCP/IP trong một kiến trúc mạng ta so sánh chức năng
của nó với mô hình mạng của CCITT và OSI qua hình dới đây:
Nh vậy TCP tơng ứng với 4 lớp cộng thêm 1 số chức năng của lớp thứ 5 trong
họ giao thức chuẩn OSI. Còn IP tơng ứng với 3 lớp của mô hình OSI.
II. bộ giao thức tcp/ip:
Khái niệm giao thức (Protocol) là một khái niệm cơ bản của mạng truyền
thông. Có thể hiểu một cách khái quát rằng đó chính là tập hợp tất cả các qui tắc
cần thiết (các thủ tục, các khuôn dạng dữ liệu, các cơ chế phụ trợ...) cho phép các
thao tác trao đổi thông tin trên mạng đợc thực hiện một cách chính xác và an toàn.

-13-
X400
Telnet
FTP
ISO
Application
Presentation
Session
Transport
TCP
CCITT
Netword
IP
Data Link
Physical Link
ISDN
X25

Có rất nhiều họ giao thức đang đợc thực hiện trên mạng truyền thông hiện nay nh
IEE802.X dùng trong mạng cục bộ, CCITT dùng cho mạng diện rộng và đặc biệt
là họ giao thức chuẩn của ISO (các tổ chức tiêu chuẩn hoá quốc tế) dựa trên mô
hình tham chiếu bảy tầng cho việc kết nối các hệ thống mở. Trên INTERNET họ
giao thức đợc sử dụng là bộ giao thức TCP/IP. Gần đây do sự xâm nhập của mạng
INTERNET vào Việt Nam chúng ta mới đợc làm quen với họ giao thức này mặc
dù chúng đã xuất hiện từ hơn 20 năm trớc đây.
Sự ra đời của họ giao thức TCP/IP gắn liền với sự ra đời của mạng
INTERNET mà tiền thân là mạng ARPANet do Bộ Quốc phòng Mỹ tạo ra. Hai
giao thức đợc dùng chủ yếu ở đây là TCP (Transmission Control Protocol) và IP
(Internet Protocol).
TCP/IP có một số đặc tính quan trọng sau:
- Là bộ giao thức mở chuẩn, sẵn có và phát triển độc lập với phần cứng nên
nó đợc sử dụng rộng rãi trong việc kết nối trên INTERNET.
- TCP/IP độc lập với phần cứng mạng vật lý, điều này cho phép TCP/IP thích
ứng đợc với nhiều mạng khác nhau. Nó có thể đợc dùng trên Ethernet, Token-
ring, X25...
- TCP/Ip yêu cầu phải đánh địa chỉ cho các trạm (Host) trên mạng, mục đích
của việc đánh địa chỉ là đảm bảo tính duy nhất cho các trạm hoà mạng.
- Các giao thức bậc cao đợc tiêu chuẩn hoá để thích hợp và sẵn có với ngời
dùng.
Sau khi ra đời, TCP/IP đã nhanh chóng đợc đón nhận và phát triển bởi nhiều
nhà nghiên cứu và các hãng công nghiệp máy tính với mục đích xây dựng và phát
triển một mạng truyền thông mở rộng khắp thế giới mà ngày nay chúng ta gọi là
INTERNET.
Phạm vi phục vụ của INTERNET không còn dành riêng cho quân sự nh
ARPAnet nữa mà nó đã mở rộng lĩnh vực cho mọi loại đối tợng sử dụng, trong đó

-14-
tỷ lệ quan trọng nhất vẫn thuộc về giới nghiên cứu khoa học, giáo dục và thơng

mại.
1. Cấu trúc phân lớp của họ giao thức TCP/IP:
Bộ giao thức TCP/IP trong mô hình INTERNET bốn lớp đợc mô tả nh hình vẽ
sau đây:
(4) Application Layer
Bao gồm các ứng dụng và các tiến trình trên mạng
(3) Host to Host Transport Layer
Cung cấp các dịch vụ truyền dữ liệu liên tục
(2) Internet Layer
Định nghĩa đơn vị truyền và có nhiệm vụ tìm đờng
(1) Network Access Layer
Bao gồm các công việc cần thiết để truy nhập tới mạng vật lý
Trong cấu trúc bốn lớp của INTERNET khi dữ liệu truyền từ lớp ứng dụng
(Application) cho đến lớp truy nhập mạng (Network Access) thì mỗi lớp đều cộng
thêm vào dữ liệu phần điều khiển của mình để đảm bảo cho việc truyền đợc chính
xác. Mỗi thông tin điều khiển này đợc gọi là một header và đợc đặt ở trớc phần
dữ liệu đợc truyền. Mỗi lớp xem tất cả các thông tin mà nó nhận đợc từ lớp trên là
dữ liệu, và đặt phần thông tin điều khiển header của nó vào phần trớc phần thông
tin này. Việc cộng thêm vào các header ở mỗi lớp trong quá trình truyền tin đợc
gọi là bao bọc (Encapsulation). Quá trình nhận dữ liệu diễn ra theo chiều ngợc
lại, mỗi lớp sẽ tách ra phần header trớc khi truyền dữ liệu lên lớp trên.
Hình vẽ sau mô tả qúa trình truyền dữ liệu trong mô hình INTERNET:
Application Layer

-15-
Data
Transport Layer
Intenet Layer
Netwrk Access Layer
Send Receive

Mỗi lớp có một cấu trúc dữ liệu độc lập, và mỗi lớp không hẳn biết đến cấu
trúc dữ liêu đợc dùng ở lớp trên hay lớp dới của nó. Trong thực tế, cấu trúc dữ liệu
ở các lớp ngay cạnh để cho việc truyền dữ liệu đợc hiệu quả hơn. Tuy nhiên ở mỗi
lớp vẫn có một cấu trúc dữ liệu riêng và có một thuật toán riêng để mô tả cấu trúc
đó.
Các ứng dụng dùng TCP gọi dữ liệu đợc truyền là một dòng dữ liệu (Stream)
trong khi các ứng dụng dùng UDP (User Datagram Protocol) gọi dữ liệu đợc
truyền là các thông báo (Message). Lớp TCP gọi tên dữ liệu đợc truyền là
Segment còn UDP định nghĩa cấu trúc dữ liệu của nó là Packet. Lớp INTERNET
xem tất cả các dữ liệu nh là các khối và gọi là Datagram. Bộ giao thức TCP/IP có
thể dùng nhiều kiểu khác nhau của lớp mạng vật lý (Ethernet, Token-ring, FĐI,
X25...), mỗi loại có thể có một phơng thức khác nhau để truyền dữ liệu. Phần lớn
các mạng kết cấu phần dữ liệu truyền đi dới dạng các packets hay là các frames,

-16-
Data
Data
Header
HeaderHeader
HeaderHeaderHeader
Data
ở đây ta thừa nhận mẫu dữ liệu mà lớp mạng vật lý dới cùng truyền đi gọi là
frames.
Hình vẽ sau đây mô tả cấu trúc dữ liệu dùng trong bộ giao thức TCP/IP:
(4) Application
Stream
(3) Transport
Segment/Datagram
(2) Internet
Datagram

(1) Network Access
Frame
a. Lớp truy nhập mạng (Network Access Layer):
Network Access Layer là lớp thấp nhất trong cấu trúc phân bậc của TCP/IP.
Những giao thức ở lớp này cung cấp cho hệ thống phơng thức để truyền dữ liệu
trên các tầng vật lý khác nhau của mạng. Nó định nghĩa cách thức truyền các khối
dữ liệu (Datagram) IP. Các giao thức ở lớp này phải biết chi tiết các phần cấu trúc
vật lý mạng ở dới nó (bao gồm cấu trúc gói của nó, địa chỉ .v.v.v..) để định dạng
đợc chính xác các dữ liệu sẽ đợc truyền tuỳ thuộc vào từng loại mạng cụ thể.
So sánh với cấu trúc OSI thì lớp này của TCP/IP tơng đơng với ba lớp
Network, Datalink, và Physical trong cấu trúc OSI.
Chức năng định dạng dữ liệu sẽ đợc truyền ở lớp này bao gồm việc đóng gói
các gói dữ liệu IP vào các frame sẽ đợc truyền trên mạng và việc ánh xạ các địa
chỉ IP vào địa chỉ vật lý đợc dùng cho mạng trớc khi truyền xuống kênh vật lý.
b. Lớp liên mạng (Internet Layer):
Internet Layer là lớp ở ngay trên lớp Network Access trong cấu trúc phân lớp
của TCP/IP. Internet Protocol (IP) là giao thức trung tâm của TCP/IP và là phần
quan trọng nhất của lớp liên mạng (Internet) này. IP cung cấp dịch vụ lu truyền
các gói IP trên mạng. Tất cả các giao thức ở lớp trên và lớp dới của IP đều dùng IP

-17-
để truyền dữ liệu, và tất cả các dữ liệu lu truyền qua IP, vào và ra, đều không quan
tâm đến đích cuối cùng của nó.
* IP bao gồm một số chức năng sau:
Nó định nghĩa các khối dữ liệu (Datagram), đây là khối cơ bản của việc
truyền tin.
Định nghĩa hệ thống địa chỉ INTERNET (IP Address).
Truyền dữ liệu giữa lớp Transport và lớp Network Access.
Định tuyến đờng để gửi các gói dữ liệu đến các trạm ở xa.
Thực hiện việc phân mảnh và hợp nhất (Fragmentation - reassembly) các

khối dữ liệu.
Cấu trúc dữ liệu đợc truyền ở lớp IP đợc định nghĩa là các Datagram. Mỗi
Datagram có một header chứa các thông tin cần thiết để truyền dữ liệu đi. Trong
phần header này có chứa địa chỉ đích, và IP sẽ truyền dữ liệu bằng cách kiểm tra
địa chỉ đích này. Địa chỉ đích bao gồm 32 bit địa chỉ IP dùng để xác định mạng
đích và trạm ở trên mạng đích đó. Nếu địa chỉ đích là địa chỉ của một trạm nằm
trên cùng một mạng với máy nguồn thì các gói dữ liêụ sẽ đợc truyền thẳng tới
đích, còn nếu địa chỉ đích không nằm trên cùng một mạng với máy nguồn thì các
gói dữ liệu phải đợc gửi đến một cổng truyền (gateway) để truyền đi. (Trong đó
gateway lu truyền các gói dữ liệu nằm giữa hai mạng vật lý khác nhau).
Hình vẽ sau đây minh hoạ khuôn dạng của một gói dữ liệu lu truyền ở lớp IP:
| 0 | 4 | 8 | 16 | 20 | 24 | 28 | 31
Version | IHL | Type of service | Total length
Identification | Flags | Fragment Offset
Time to live | Protocol | Header Checksum
Source Address
Destination Address

-18-
Options | Padding
Data begin here...
- Trờng Version dùng để chỉ Version của IP đợc dùng.
- Trờng IHL chỉ độ dài của header, độ dài của header đợc đánh giá bởi các từ
32 bit. Nếu không có trờng này thì độ dài ngầm định của header là 5 từ. Trờng
này gồm có 8 bit.
- Trờng Total Length: trờng Total Length chứa độ dài của các gói, đợc đo dới
dạng các octet, bao gồm cả phần header lẫn phần dữ liệu của mỗi gói dữ liệu.
- Trờng Identification dùng để xác định một fragment thuộc vào gói nào.
Để tìm hiểu thêm về IP, ta hãy xem cấu trúc địa chỉ mà nó sử dụng (thờng gọi
là IP Address). Để đảm bảo cho tất cả các trạm trên mạng đợc định danh một

cách duy nhất, IP sử dụng 32 bit cho mỗi địa chỉ. Để tiện cho việc quản lý ngời ta
chia địa chỉ IP thành các lớp (Class), mỗi lớp địa chỉ tơng ứng với một kích thớc
mạng khác nhau và số lợng các trạm làm việc nối vào.
- Nếu nh bit đầu tiên của địa chỉ là 0 thì nó là địa chỉ thuộc lớp A.
Bit đầu tiên của địa chỉ lớp A xác định địa chỉ, bảy bit tiếp theo xác định địa
chỉ mạng, và 24 bit cuối cùng xác định địa chỉ của các trạm. Nh vậy với điạ chỉ ở
lớp A thì chỉ đánh địa chỉ cho 128 mạng, nhng mỗi mạng có thể bao gồm hàng
triệu trạm.
- Nếu hai bit đầu tiên của địa chỉ là 1 0, thì địa chỉ này là thuộc vào lớp B.
Trong lớp B, hai bit đầu tiên đợc dùng để xác định lớp địa chỉ, 14 bit tiếp theo xác
định địa chỉ mạng, và 16 bit cuối cùng xác định địa chỉ của trạm. Nh vậy, nếu
dùng địa chỉ lớp B thì có thể đánh địa chỉ đợc cho hàng ngàn mạng, mỗi mạng có
hàng ngàn trạm.
- Nếu ba bit đầu tiên của địa chỉ là 1 1 0. thì địa chỉ này thuộc vào lớp địa chỉ
C. Trong địa chỉ lớp C thì ba bit đầu tiên đợc dùng để xác định lớp địa chỉ, 21 bit

-19-
tiếp theo dùng để xác định địa chỉ mạng, và ba bit tiếp theo dùng để xác định địa
chỉ mạng, và tám bit cuối cùng dùng để xác định địa chỉ cho các trạm. Dùng địa
chỉ lớp C ta có thể đánh địa chỉ cho hàng triệu mạng, nhng mỗi mạng chỉ có thể
bao gồm ít hơn 254 trạm.
- Nếu ba bit đầu của địa chỉ là 1 1 1, thì nó là một địa chỉ dự trữ đặc biệt. Các
địa chỉ này đôi lúc còn đợc gọi là địa chỉ lớp D. Phần địa chỉ này đợc dùng để dự
trữ cho một số mục đích đặc biệt, chẳng hạn nh dùng để đánh địa chỉ cho một
nhóm các máy tính, mà các máy tính này có phần giao thức dùng chung, do đó ta
có thể không cần quan tâm nhiều tới lớp địa chỉ này.
Hình sau sẽ cho thấy cấu trúc của ba lớp địa chỉ A B C đợc sử dụng trong IP:

Trong thực tế, địa chỉ IP thờng đợc viết dới dạng bốn chữ số ở dạng cơ số 10,
các số này phân cách nhau bởi dấu .. Mỗi một số là nằm trong khoảng từ 0 cho

đến 255. Vì vậy, dựa vào chữ số đầu tiên ta có thể nói rằng:

-20-
26 104 0 19
128 66 12 1
192
178 16 1
24 host bits
16 host bits
8 host bits
24 network bits
16 network bits
8network bits
1 1 0
1 0
0
Class C
Class B
Class A
- Nhỏ hơn 128 là địa chỉ lớp A. Byte đầu tiên là địa chỉ mạng, ba byte còn lại
là địa chỉ của trạm.
- Từ 128 cho đến 191 là địa chỉ lớp B. Hai byte đầu xác định địa chỉ mạng,
hai byte tiếp theo xác định địa chỉ trạm.
- Từ 192 cho đến 233 là địa chỉ thuộc lớp C. Ba byte đầu xác định địa chỉ
mạng, một byte cuối cùng xác định địa chỉ của các trạm.
- Lớn hơn 233 là các địa chỉ đợc dự trữ cho các mục đích đặc biệt và ta có thể
không cần quan tâm đến.
Ví dụ:
00001010000000000000000000001000 = 1.0.0.0.8
Địa chỉ này thuộc lớp A với : địa chỉ mạng = 10

địa chỉ trạm = 0.0.8
Để tiện cho việc thực hiện các phơng cách tìm đờng trên mạng và đánh địa
chỉ cho các mạng nhỏ hơn nữa (đặc biệt là trong công nghệ Intranet), ngời ta đa ra
khái niệm Subnet Mask. Subnet Mask cũng giống nh địa chỉ IP bao gồm 32 bit.
Mục đích của địa chỉ Subnet Mask là để có thể chia nhỏ một địa chỉ IP thành các
mạng nhỏ hơn và theo dõi vùng nào trên địa chỉ IP dùng để làm địa chỉ cho mạng
con (còn đợc gọi là các Subnet) đó, vùng nào dùng làm địa chỉ cho các trạm làm
việc.
Nội dung của một Subnet Mask đợc quy định nh sau:
Các bit 1: dùng để chỉ định địa chỉ mạng trên địa chỉ IP.
Các bit 0: dùng để chỉ định địa chỉ trạm làm việc trên địa chỉ IP.
Từ địa chỉ IP ta thực hiện phép toán logic AND với địa chỉ Subnet Mask kết
quả tạo ra sẽ đợc địa chỉ mạng nơi đến. Kết quả này đợc sử dụng để tìm bớc tiếp
theo trong thuật toán tìm đờng trên mạng. Nếu kết quả này trùng với địa chỉ mạng
tại trạm đang làm việc thì sẽ xét tiếp địa chỉ trạm làm việc để truyền đi. Theo cấu

-21-
trúc của Subnet Mask ta nhận thấy rằng tất cả các trạm làm việc trong cùng một
mạng con sẽ có cùng giá trị Subnet Mask.
Với phơng pháp này số bit dùng để đánh địa chỉ host có thể nhỏ hơn 8 bit (lớp
C) tức là 1 địa chỉ lớp C có thể đợc phân nhỏ hơn nữa và khi đó các mạng con này
thờng đợc xác định bởi các địa chỉ có thêm phần chú thích số bit dành cho địa chỉ
mạng, ví dụ 203.160.0.0/25 mô tả subnet 203.160.0.0 (thuộc lớp C) nhng có 25
bit dùng cho địa chỉ mạng và 7 bit dùng cho địa chỉ host tức là subnet này chỉ có
tối đa là 128 host chứ không phải là 256 nữa.
Trong hệ thống địa chỉ Subnet này nh sau:
11001011101000000000000000000000 tơng ứng với
203 . 160 . 0 . 0 nhng Subnet Mask của nó sẽ là
11111111111111111111111110000000 tơng ứng với
255 . 255 . 255 . 128

Hình vẽ sau sẽ mô tả tổng quát việc chia nhỏ một địa chỉ thành các Subnet
bằng cách sử dụng Subnet Mask.

-22-
203.160.0.0/24
203.160.0.0/24 203.160.0.0/24
0/26 64/26
32/270/27
0/28 16/28 32/28 48/27
64/27 96/27
64/26 ... ... ...
...
128/27
... ...
160/28
128/27
Trong tất cả các lớp địa chỉ mạng cũng nh các Subnet, các địa chỉ đầu và cuối
của mạng đợc dùng vào mục đích riêng. Một địa chỉ IP cùng với tất cả các bit địa
chỉ trạm có giá trị là 0 (địa chỉ đầu mạng) đợc dùng để chỉ chính mạng đó (hay
địa chỉ xác định mạng). Ví dụ nh địa chỉ 203.160.1.0 đợc dùng để chỉ mạng
203.160.1.0. Còn nếu tấtcả các bit địa chỉ trong phần địa chỉ của trạm đều có giá
trị là 1 (địa chỉ cuối mạng) thì địa chỉ này đợc dùng làm địa chỉ quảng bá -
broadcast (Một địa chỉ broadcast đợc dùng để đánh địa chỉ cùng một lúc cho tất
cả các trạm trong một mạng, nó đợc dùng để cho phép thông báo cho nhiều trạm
cùng một lúc). Ví dụ nh địa chỉ broadcast của mạng 203.160.0.0 là
203.160.0.255. Một gói dữ liệu gửi đến địa chỉ này sẽ đợc truyền đến tất cả các
trạm trên mạng này.
IP là giao thức cung cấp dịch vụ truyền thông theo kiểu không liên kết
(Connectionless) hay còn gọi là dịch vụ Datagram (tên gọi của đơn vị dữ liệu sử
dụng giao thức IP). Phơng thức không liên kết cho phép cặp đối tác không cần

phải thực hiện việc thiết lập liên kết trớc khi truyền dữ liệu và do vậy cũng không
cần phải giải phóng liên kết khi không còn nhu cầu truyền dữ kiệu nữa. Điều đó
làm giảm nhẹ công sức cài đặt hệ thống nhng tăng độ phức tạp kiểm soát luồng dữ
liệu và tiếp nhận sự đúng đắn dữ liệu trong trờng hợp nhiều ngời sử dụng đồng
thời trên mạng.
Việc phân mảnh các gói dữ liệu:
Trong qua trình truyền dữ liệu, một gói dữ liệu (datagram) có thể đợc truyền
đi thông qua nhiều mạng khác nhau. Một gói dữ liệu nhận đợc từ một mạng nào
đó có thể quá lớn để truyền đi trong gói đơn ở trên một mạng khác, bởi mỗi loại
cấu trúc mạng là cho phép một đơn vị truyền cực đại (Maximum Transmission
Unix), hay còn gọi là MTU, khác nhau. Đây chính là kích thớc lớn nhất của một
gói mà chúng có thể truyền. Nếu nh một gói dữ liệu nhận đợc từ một mạng nào đó
mà lớn hơn MTU của một mạng khác thì nó cần phân mảnh ra thành các gói nhỏ
hơn, gọi là fragment, để truyền đi, quá trình này gọi là quá trình phân mảnh.

-23-
Dạng của một fragment cũng giống nh dạng của một gói dữ liệu thông thờng. Từ
thứ hai trong phần header chứa các thông tin để xác định mỗi fragment và cung
cấp các thông tin để hợp nhất các fragment này lại thành các gói nh ban đầu. Tr-
ờng Identification dùng để xác định fragment này là thuộc vào gói dữ liệu nào.
ICMP (Internet Control Message Protocol)
Đây là một giao thức của lớp IP, nó dùng các gói dữ liệu IP để gửi đi các
thông điệp của nó. ICMP gửi các thông điệp nh điều khiển dòng truyền, báo lỗi...
- Điều khiển dòng truyền (Flow Control): Khi các gói dữ liệu đến quá nhanh,
trạm đích hoặc một gateway ở giữa sẽ gửi một thông điệp ICMP trở lại nơi gửi,
thông điệp này nói với nơi gửi tạm thời ngừng việc gửi dữ liệu lại.
- Thông báo lỗi: Trong trờng hợp địa chỉ đích là không với tới đợc thì hệ
thống sẽ gửi một thông báo lỗi Destination Unreachable. Nếu địa chỉ đích
không thể với đến là một mạng hay một trạm thì thông điệp này sẽ đợc gửi bởi
một gateway ở giữa. Nhng nếu địa chỉ đích là một cổng không thể với đến thì

chính trạm đích sẽ gửi thông điệp báo lỗi này.
- Đổi hớng các tuiyến đờng: một gateway sẽ gửi một thông điệp ICMP
Redirect Router để nói với một trạm là nên dùng gateway khác bởi vì dùng
gateway này là một lựa chọn tốt hơn. Thông điệp này có thể chỉ đợc dùg khi mà
trạm nguồn là ở trên cùng một mạng với cả hai gateway.
- Kiểm tra các trạm ở xa: một trạm có thể gửi một thông điệp ICMP Echo
đi để biết đợc liệu một trạm ở xa có đang mở và hoạt động hay không. Khi một hệ
thống nhận đợc một thông điệp Echo, nó gửi trả lại một gói tơng tự quay trở lại
trạm nguồn.
c. Lớp vận chuyển (Transport Layer)
Lớp giao thức nằm ngay trên lớp IP là Transport (lớp truyền tin). hai giao thức
quan trọng nhất trong lớp này là TCP (Transmission Control Protocol) và UDP

-24-
(User Datagram Protocol). TCP cung cấp dịch vụ truyền dữ liệu đwocj tin tởng
với khả năng phát hiện lỗi và sửa lỗi theo kiểu end-to-end. Còn UDP cung cấp các
chơng trình ứng dụng thâm nhập trực tiếp đến các dịch vụ lu truyền datagram,
điều này cho phép trao đổi các thông điệp ra ngoài mạng với một số lợng nhỏ các
giao thức. Cả hai giao thức này đều truyền dữ liệu giữa lớp ứng dụng và lớp
Internet.
Dạng thông điệp của TCP:
Các thông điệp của TCP đều có dạng nh sau:
0 15 16 31
Source port Destination
Sequence
Acknowkedgement Number
Offset Reserved
U
R
G

a
c
K
p
s
h
r
s
t
s
y
n
f
i
n
Window
Checksum
Urgent
Options Padding
Data begins here...
Trong đó:
* Source port và Destination port: xác định các cổng nguồn và đích của các
dịch vụ.

-25-

×