Chương 1
GIỚI THIỆU VỀ MẠNG INTERNET
& CÁC DỊCH VỤ CỦA MẠNG INTERNET
I. SƠ LƯỢC VỀ MẠNG INTERNET
I.1. Lịch sử mạng Internet
Mạng Internet là mạng máy tính lớn nhất trên toàn cầu. Internet hay gọi tắt là
NET được xem là mạng của các mạng (network of networks) dùng để trao đổi thông
tin trên toàn thế giới, còn gọi là Siêu xa lộ thông tin (Information Superhighway).
Ngày nay mạng Internet là một mạng công cộng kết nối hàng trăm triệu máy
tính trên toàn thế giới. Về mặt vật lý, mạng Internet sử dụng một phần của toàn bộ
các tài nguyên của mạng viễn thông công cộng; về mặt kỹ thuật, mạng Internet sử
dụng tập các giao thức TCP/IP do Vinton Gray Cerf và Robert Kahn xây dựng từ
năm 1973 tại Trường Đại học Stanford. Hai mô phỏng của công nghệ mạng Internet
là Intranet và Extranet.
Từ năm 1969, Bộ Quốc phòng Mỹ đã xây dựng mạng ARPANET, (ARPA là
từ viết tắt của Advanced Research Projects Agency), ý tưởng ban đầu của mạng
Arpanet là dùng để trao đổi thông tin giữa các cơ quan chính phủ và các trung tâm
nghiên cứu của các trường đại học Mỹ. Điều đặc biệt ở mạng này là mạng vẫn hoạt
động khi một phần của nó bị phá hủy trong các trường hợp chiến tranh hoặc thiên tai.
Sau đó mạng ARPANET chia làm hai mạng:
MILINET chỉ dùng cho các mục đích quân sự
Một mạng mới gọi là ARPANET dùng cho các mục đích phi quân sự
Đến năm 1972, một mạng khác là CSNET (Computer Science Research
Network) được nối với ARPANET. CSNET được tạo ra để liên kết các mạng độc lập
khác. Tại thời điểm này được xem là ngày khai sinh ra mạng INTERNET. Vào năm
1980, tổ chức National Science Foundation đã xây dựng mạng NSFNET để liên kết
đến các mạng chính, đây là mạng có tốc độ cao, dùng để kết nối các siêu máy tính
trung tâm của NSF.
Công nghệ mạng ngày càng phát triển, nhiều mạng mới được hình thành và
kết nối với mạng ARPANET, CSNET và NSFNET. Tất cả mạng này kết nối với
nhau và trở thành một mạng có tên gọi là INTERNET. Cuối cùng hai mạng Arpanet
và Csnet ngưng họat động, mạng Nsfnet trở thành mạng chính nối kết các mạng khác
trên Internet.
(Có thể tham khảo về lịch sử Internet tại các địa chỉ : , tài
liệu bằng Tiếng Việt; đây là web site của tổ
chức Internet Society do V.Cerf sáng lập từ năm 1992, có nhiều thông tin phong phú
về Internet)
1
Vint Cerf , nhà phát minh giao thức TCP/IP
Vint Cerf được xem như là một trong những nhà khoa học lỗi lạc cuối thế
kỷ XX. Năm 1973, trong khi làm việc tại DARPA với Bob Kahn, Cerf đã
phát triển giao thức TCP/IP, đây là giao thức chuẩn trên mạng máy
tính để truyền/nhân thông tin trên Internet, Ông được xem như là cha
đẻ của mạng Internet. Hiện nay ông là Chủ tịch ICANN (Internet
Corporation For Assigned Names and Numbers,Tổ chức mã số và tên
miền quốc tế) một pháp nhân phi lợi nhuận có trụ sở ở Marina Del
Ray, California (Mỹ)
Nguồn:
Mô hình mạng Internet (Nguồn ; 27.11.2004)
I.2. Một số khái niệm liên quan đến mạng Internet
I.2.1 Kiến trúc Client-Server
Khái niệm Client-Server đề cập đến mối quan hệ logic giữa các máy tính trên
mạng. Trong mạng client-server các máy tính được chia thành các máy server và các
2
INTERNET
IAP
Nhà cung cấp khả
năng truy cập
Internet
IAP
Nhà cung cấp khả
năng truy cập
Internet
ISP
Nhà cung cấp dịch
vụ Internet
ISP
Nhà cung cấp dịch
vụ Internet
Database
Server
Modem kết nối qua đường
dây điện thoại
Người sử dụng Internet
máy client, các quá trình xử lý được phân bổ cho cả máy server lẫn máy client, với
mỗi máy có một vai trò chuyên biệt.
Server là máy tính chuyên dụng, có khả năng xử lý mạnh, lưu trữ lớn. Chức
năng chủ yếu của server là quản lý và lưu giữ các nguồn tài nguyên mà một máy tính
khác trên mạng có thể truy cập, ngoài ra server có nhiệm vụ kiểm sóat sự truy cập và
bảo mật dữ liệu. Tùy theo chức năng xử lý , ta có các loại : file server, web file
server, database server, mail server, .... Server chạy trình chủ (server program).
Client là máy tính truy cập dữ liệu từ server, client chạy trình khách (client
program) chịu trách nhiệm về giao diện người sử dụng, và một số quá trình xử lý.
Client là các máy tính thông thường được kết nối với Server qua mạng. Client gởi các
yêu cầu của người sử dụng đến server, server xử lý yêu cầu và gởi kết quả về cho
client. Mạng Internet là một mạng có kiến trúc client-server.
Mô hình kiến trúc client-server
Kiến trúc client-server có nhiều ưu điểm, nhất là tính bảo mật và an toàn thông
tin nhờ vào các tính năng:
Các tài nguyên mạng được quản lý tập trung
Có thể tạo ra các cấp kiểm soát chặt chẽ trong việc truy cập file dữ liệu
Giảm nhẹ việc quản lý trên các máy client
Bảo mật và backup dữ liệu
Có thể mở rộng hệ thống khi cần.
Tuy nhiên mô hình này cũng có nhược điểm: giá thành cao, server trở thành
điểm tối yếu của hệ thống, có nghĩa là khi server bị hư hỏng thì toàn bộ hệ thống
không thể họat động
I.2.2 Địa chỉ IP
Các máy tính trong mạng Internet/ Intranet trao đổi thông tin với nhau theo
chuẩn truyền thông gọi là giao thức TCP/IP. Đây là giao thức cung cấp dịch vụ
truyền các gói dữ liệu (IP datagrams) theo địa chỉ IP bằng cách chọn đường (routing)
trong mạng thông qua cổng kết nối (geteway). Để việc trao đổi thông tin trong mạng
Internet thực hiện được, mỗi máy tính trong mạng cần phải được cấp một định danh
(Identify) để phân biệt các máy với nhau, mỗi máy được gán cho một nhóm số gọi là
địa chỉ IP (IP Address) hay nói cách khác địa chỉ IP dùng xác định đối tượng nhận và
3
Applications
Run on server
User input sent to server
Virtual display sent to
User PC
SERVER
CLIENT
Database
Database
gởi thông tin trên Internet. Địa chỉ IP gồm 4 nhóm số thập phân có giá trị từ 0 đến
255, phân các nhau bằng dấu chấm (.)
Ví dụ : 203.162.115.53 là địa chỉ IP của Web server của Đại học Đà Nẵng.
Trên thực tế, địa chỉ IP hiện tại (IP version 4) có 32 bit chia thành 4 octet (mỗi
octet có 8 bit), các octet tách biệt nhau bằng dấu chấm (.)
Ví dụ : 11001011. 01100010. 01010011.00110101
Để tiện việc quản lý và phân phối địa chỉ, người ta chia các địa chỉ IP thành 3
phần :
31 0 Thứ tự các bit
Class ID Network ID Host ID
Các địa chỉ IP được chia thành 5 lớp tùy theo giá trị của 3 byte đầu tiên:
A,B,C,D,E. Riêng lớp D và E, Tổ chức Internet đang để dành cho các mục đích khác,
không phân phối. Địa chỉ IP tự nó không chứa thông tin về mô tả mạng, subnet đi
kèm với mỗi địa chỉ cung cấp thông tin này.
Class Vùng địa chỉ lý thuyết Số mạng sử
dụng tối đa
Số máy chủ
trên từng mạng
Subnet
A 0.0.0.0 đến 127.0.0.0 126 16.777.214 255.0.0.0
B 128.0.0.0 đến 191.255.0.0 16.382 65.534 255.255.0.0
C 192.0.0.0 đến 223.255.255.0 2.097.150 254 255.255.255.0
Địa chỉ IP trên Internet do ICANN chịu trách nhiệm phân bổ. Địa chỉ IP
thường được các ISP (Internet Service Provider) quản lý. Trung tâm mạng Internet
vùng Châu Á - Thái bình dương (APNIC) phân phối cho VDC 8 địa chỉ ở lớp C, có
thể phân phối cho 8 mạng từ 203.162.0.0 đến 203.162.7.0. Ở Việt Nam, cơ quan
VNNIC (Vietnam Internet Network Inforrmation Center) thuộc Bộ Bưu chính-Viễn
thông chịu trách nhiệm quản lý tên miền, địa chỉ IP (xem )
Do sự cạn kiệt địa chỉ IP theo IPv4(sử dụng 32 bit); hiện nay tại nhiều nước đã
dùng IPv6 (sử dụng 128 bit) để cấp phát địa chỉ IP.
I.2.3 Tên miền (Domain name)
Do địa chỉ IP là một dãy số, không có tính gợi nhớ, trong mạng Internet người
ta thường sử dụng Dịch vụ tên miền (Domain Name Service) cho các máy trong
mạng. Mỗi tên miền có dạng :
Trong đó : Host là tên máy, Domain là tên của một tổ chức mạng lớn, như các
Cty đa quốc gia, các quốc gia, Subdomain là tên một tổ chức nhỏ hơn trong domain.
Ví dụ : các tên miền www.ud.edu.vn, www.yahoo.com, www.google.com.
4
Host.Subdomain.Domain
Tên miền cấp 1 bao gồm các mã quốc gia của các nước tham gia Internet được
quy định bằng 2 chữ cái theo tiêu chuẩn ISO-3166, ví dụ Việt Nam là vn, Nhật bản là
jp, Pháp là fr, Anh quốc là uk, CHLB Nga là ru... và 5 lĩnh vực dùng chung toàn cầu:
.com : (commercial) công ty thương mại
.edu : (education) các trường học, tổ chức giáo dục
.net : (network) các mạng
.int : (international organizations) các tổ chức quốc tế
.org : (other organizations) các tổ chức khác.
II. CÁC DỊCH VỤ CƠ BẢN CỦA MẠNG INTERNET
II.1. World Wide Web
II.1.1 Lịch sử
World Wide Web (gọi tắt là Web) là hệ thống các server trên Internet hỗ trợ
riêng cho những tư liệu được định dạng bằng ngôn ngữ đánh dấu gọi là HTML
(HyperText Markup Language) Những tư liệu này cho phép liên kết đến các tư liệu
khác như các tệp tin đồ họa, âm thanh, video. Chú ý rằng không phải tất cả các server
trên Internet là World Wide Web, do vậy Web không đồng nghĩa với Internet, tuy
rằng Web là một tập con của Internet, là một ứng dụng quan trọng nhất trên Internet.
(Theo )
Web ra đời từ một dự án nghiên cứu tại Trung tâm nghiên cứu hạt nhân Châu
Âu (CERN, Thụy Sĩ) vào năm 1989 do Berners-Lee lãnh đạo. Dự án này phát triển
giao thức truyền và nhận các tệp tin siêu văn bản theo mô hình client-server gọi tắt là
HTTP (HyperText Transfer Protocol), sau đó công bố thư viện chương trình nguồn
của giao thức này cho các nhà phát triển khác để xây dựng các phần mềm duyệt Web.
Web dựa trên ba cơ chế để có thể cho phép người sử dụng truy cập đến các
nguồn tài nguyên trên web, đó là:
Giao thức (Protocols) HTTP.
Địa chỉ (Address) còn gọi là URL (Uniform Resourse Locators), được sử
dụng để định danh (identify) các trang web và các nguồn tài nguyên trên web.
Một URL cơ bản gồm một scheme (chỉ đến giao thức được sử dụng), tên máy
chủ, đường dẫn và tên tệp tin như sau:
Scheme Tên Web server Đường dẫn Tên tệp tin
Trong trường hợp URL kết thúc với dấu gạch xéo tới (slash, /) mà không có
tên tệp tin nằm sau, sẽ chỉ đến tệp tin mặc định trong thư mục cuối cùng (trong ví dụ
này là web). Một số tệp tin mặc định là index.htm hay default.htm.
Các scheme (sơ đồ) khác như: ftp để truyền tệp tin trên mạng, gopher dùng để tìm
thông tin, news để gởi và nhận tin trong nhóm, mailto để gởi email, file để dẫn đến
một tệp tin trong đĩa cứng cục bộ. Ví dụ:
• />• news:sos.culture.catalan
5