Tải bản đầy đủ (.pdf) (21 trang)

Giáo trình quản lý mạng - Phần 2 potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (608.71 KB, 21 trang )


Giới thiệu bộ giao thức tcp/ip TATA Jsc. - CIC
Trang 33
Phần 2
Giới thiệu bộ giao thức TCP/IP
Mục lục:
I. Nhìn lại một số công nghệ mạng 35
II. Khái niệm và mô hình mạng Internet 38
III. Sự thành công của Internet: giao thức IP và TCP 42
IV. World Wide Web (WWW) và siêu văn bản HyperText 49

Nhìn lại một số công nghệ mạng TATA Jsc. - CIC
Trang 35
Giới thiệu bộ giao thức TCP/IP

i. Nhìn lại một số công nghệ mạng
Việc kết nối mạng có thể phân chia thành hai lớp: circuit-switched
(chuyển mạch), và packet - switched(chuyển gói). Một ví du địa chỉển hình về
mạng chuyển mạch là mạng điện thoại hay các tổng đài con. Nói về chuyển
mạch ta lai còn nghe về chuyển mạch số để phân biệt với chuyển mạch tơng tự.
(ví dụ, tổng đài con của viện là tổng đài tơng tự gồm ba trung kế.)







Các mạng chuyển gói thờng dùng để nối các máy tính với nhau và có một cách
tiếp cận hoàn toàn khác. Thông tin thờng đợc chia thành các gói nhỏ (khoảng
vài trăm byte). Các gói này, ngoài thành phần thông tin ra, còn có phần địa chỉ


đến. Qua đó, các máy tính nằm trên đờng mà gói thông tin qua sẽ nhân biết là
có phải gửi cho mình hay không.
Tính lợi hại của phơng án ?
Hay: Các máy tính có thể tận dụng một đờng truyền nào đó mà gửi các gói
thông tin(không cần một trật tự nào vì các gói đều có địa chỉ).
Dở: Nếu đờng truyền quá tải thì các máy tính phải chờ.
Thực ra điểm dở này sẽ không còn là một vấn đề nếu vận tốc đờng truyền cực lớn.
Bây giờ ta xét qua hai kỹ nghệ thờng dùng trong mạng cục bộ, đó là Ethernet và
ProNET Token Ring.
1.
Kỹ nghệ Ethernet

Nhìn lại một số công nghệ mạng TATA Jsc. - CIC
Trang 36
Kỹ nghệ này đợc công ty Xerox PARC sáng tạo ra vào đầu những năm
1970 các máy tính đợc kết nối vào một đờng truyền đơn tuyến, đờng này
đợc gọi là Bus.









Vận tốc truyền trên bus thờng là 10 Mbps. đờng truyền này có thể là
cáp đồng trục (loại 10base5 - loại dây to, 10Base2 - loại nhỏ) và có thể là loại
dây nh dây điện thoại (10BaseT).
Để gửi một gói thông tin, đầu tiên máy tính phải " nghe" xem đờng

truyền có rỗi hay không. Nếu rỗi thì máy tính đó bắt đầu truyền gói thông tin của
mình. Cách truyền này có tên gọi là Carries Sense Multiple Access with
Collision Detect (CSMA/CD).
Độ dài của thông tin có một giới hạn trên và một giới hạn dới. Nh vậy,
thời gian truyền của một gói thông tin bị giới hạn. Do đó, các máy tính khác có
cơ hội để gửi gói thông tin của mình.
Khi hai hay nhiều máy tính cùng gửi thông tin lên đờng truyền thì có thể
xảy ra đụng độ (collision). Lúc này thông tin bị nhiễu, các gói thông tin không
còn giá trị gì. Vì vậy các máy gửi bắt buộc phải gửi lại. Rõ ràng là rất có khả
năng lại bị đụng độ. Ethernet xử lý đụng độ rất thông minh, ngời ta gọi là thuật
toán exponential backoff. Đầu tiên, khi gặp đụng độ ta chờ một khoảng thời gian
ngẫu nhiên. Sau đó, nếu vẫn gặp đụng độ, tăng gấp đôi khoảng thời gian chờ.
Cấu trúc của một gói thông tin Ethernet:
Preamble
Destination
Address
Source
Address
FameType Fame Data CRC
64 bits 48 bits 48 bits 16 bits 368-12000 bits 32 bits

Nhìn lại một số công nghệ mạng TATA Jsc. - CIC
Trang 37
Cấu trúc này có hai điểm u việt nổi bật:
1) với 48 bit địa chỉ, tất cả các card Ethernet đều có địa chỉ phân biệt trên
toàn cầu (IEEE phân chia địa chỉ). Hơn nữa, nó còn có thêm hai chế độ:
broadcast, multicast. Đây là những ý tởng rất độc đáo mà Internet sau này
sử dụng triệt để.
2) Các gói thông tin kiểu này có tính seft-identifying. Tính chất này rất hữ
ích khi có nhiều giao thức trong một môi trờng.

2.
Kỹ nghệ ProNET Token Ring






Dựa trên kết quả nghiên cứu của các trờng đại học, công ty proteon
Incorporated đã đa ra kết cấu vòng nh trên. Vận tốc truyền cũng là 10 Mbps.
Các gói thông tin đợc truyền từ máy nọ sang máy kia theo một chiều nhất định
và có tên là token passing. Chú ý là cấu trúc vòng trên không phải là một đờng
liên tục mà dây đợc nối theo từng cặp máy. Giao diện của mỗi máy làm việc
theo chế độ: copy mode, transmit mode và recovery mode.
- Copy mode: nhận một gói thông tin và gửi sang máy tiếp theo ( các điểm 11,
12, và 14).
- Transmit mode: giữ token, gửi một gói thông tin và kiểm tra xem đã gửi đợc
cha (điểm 13).
- Recovery mode: Để kiểm tra việc mất gói thông tin, ngời ta dùng hai đồng hồ,
một dùng cho gói tin và một dùng cho token. Nếu quá giờ một trong hai đồng hồ
trên thì điểm đó chuyển sang chế độ này. Chú ý là khi một điểm rơi vào recovery
mode thì một điểm thứ hai cũng có thể rơi vào recovery mode. Ngời ta áp dụng
thuật toán exponetial backoff để thoát ra khỏi tình trạng này.
IBM token passing dùng kiểu hình vòng ở trong và hình sao ở ngoài.


Khái niệm v mô hình mạng internet TATA Jsc. - CIC
Trang 38








Dạng thức của một gói thông tin ProNET:
Start of
Msg
Dest
Address
Src
Address
Fame
Type
Fame
Data
End of
Msg
Parlty Refuse
10 bits 8 bits 8 bits 24 bits 0-16352 bits 9 bits 1 bits 1 bits

Sự khác biệt cơ bản của dạng thức này so với Ethernet là địa chỉ. Địa chỉ của
ProNET là địa chỉ mềm, đi liền với máy chứ không địa chỉ liền với card và cao
nhất cũng chỉ có 256 máy trong một mạng.
ii. Khái niệm v mô hình mạng Internet








Chúng ta vừa đề cập đến 2 kỹ nghệ trong các mạng cục bộ. Đơng nhiên ngời
ta dùng rất nhiều các kỹ nghệ khác nhau, kể cả những biến hoá của hai kỹ nghệ
trên. Đủ thấy tính phức tạp khi nối các mạng với nhau. Mục tiêu của Internet là
giấu các chi tiết kỹ thuật, mà thật ra các chi tiết này không cần thiết đối với
ngời sử dụng.
Giao diện
của một
đặt ở đây

Khái niệm v mô hình mạng internet TATA Jsc. - CIC
Trang 39
Vấn đề thứ hai là phải đa ra một địa chỉ, sao cho mỗi máy trên toàn cầu đợc
định vị một cách duy nhất.
Các máy tính nối hai mạng với nhau đợc gọi là Internet Gateway hay Router
(xem hình vẽ trên). Trách nhiệm của các Gateway là gửi một gói thông tin từ
mạng này sang mạng khác. Gateway không để ý đến các máy lẻ.
Và tất cả các mạng đều bình đẳng.
IP Addresses 8 16 24 31
Class A 0 netid hostid
Class B 10 netid hostid
Class C 110 netid hostid
Class D 1110 multicast address
Class E 11110 reserver for future use
Chú ý cách lập địa chỉ này: vừa có thể chỉ định một máy nào đó, vừa cxó thể
chỉ định một mạng nào đó.
Địa chỉ mạng: hostid = 0s
Broadcast: hostid=ls
Multicast: lớp địa chỉ D.

Hai loại địa chỉ này có ý nghĩa rất cao trong thông tin. Với điạ chỉ broadcast, ta
có thể gửi một gói thông tin đến tất cả các thành viên trong mạng nào đó (điều
này cũng có thể gây ra nguy hiểm).
Một trong những ứng dụng quan trọng của multicast là thành lập các nhóm tin và
nhóm thảo luận chuyên đề, các nhóm làm việc ảo. Một thành viên có thể tham
gia nhiếu nhóm và mỗi một nhóm có thể có thể có một số lợng tuỳ ý các thành
viên.
Việc cung cấp địa chỉ mạng đợc thực hiện bởi một uỷ ban có tên là
The Internet
Assigned Numbers Authority (IANA).

Một số địa chỉ IP đặc biệt :
127.0.0.0 là địa chỉ cho chính một máy(localhost).
Thông thừng một máy chỉ sử dụng 1 địa chỉ IP. Tuy nhiên, có một số máy
có nhiều địa chỉ IP nh các gateways.
Nếu dùng DHCP thì một máy có thể có địa chỉ IP thay đổi theo phiên làm
việc: đây là trờng hợp khá phổ biến đối với các ISP.
Các địa chỉ dùng cho Proxy:

Khái niệm v mô hình mạng internet TATA Jsc. - CIC
Trang 40
ắ Class A: 10.0.0.0 10.255.255.255
ắ Class B: 172.16.0.0 172.31.255.255
ắ Class C: 192.168.0.0 192.168.255.255
IP subnet và mặt nạ mạng (mask)
Do sự phát triển không ngừng, một số mạng, sau một thời gian phát triển
có thể có nhu cầu chia nhỏ hơn (đặc biệt nh lớp A và lớp B)
Hình thức chia: (neitid, hostid) => (neitid, subneitid, hostid);
Hình thc thay đổi này chỉ có ý nghĩa cuc bộ, đối với bên ngoài thì vẫn coi
nh chỉ có một mạng;

Ngời ta dùng mặt nạ để tách phần địa chỉ mạng ra khỏi một địa chỉ IP:
A=>0xFF000000, B=>0xFFFF0000, C=> 0xFFFFFF00;
Tổng quát hoá các trờng hợp trên: có thể đa ra một mặt nạ bất kỳ, các bit 1 sẽ
ứng với địa chỉ mạng và các bit 0 ứng với địa chỉ hostid. Chú ý: chuẩn Internet
không yêu cầu là các bit 1 phải nằm liên tục với nhau. Tuy nhiên, trên thực tế
chúng ta nên chọn các bit 1 nằm liên tục với nhau.
ánh xạ địa chỉ IP sang địa chỉ vật lý(ARP)
Địa chỉ IP là địa chỉ logic, còn khi truyền tin thì phải dùng địa chỉ vật lý:
vì vậy, câng phải có phơng thức lập chuyển đổi 1-1 giữa địa chỉ vật lý và địa
chỉ IP;
Chú ý rằng trong mạng Internet, các máy có vai trò bình đẳng nh nhau
nên không có một máy nào phải chịu trách nhiệm chung cả: phải có một
phơng thức nào đó để các máy không phụ thuộc lẫn nhau.
Address Resolution Protocol(ARP) dùng để giải địa chỉ IP sang địa chỉ vật
lý;
Phơng thức: A dùng broascasst hỏi ai có địa chỉ IP x; máy B có địa chỉ IP
x sẽ trả lời A;
Để tránh dùng quá nhiều broadcast, các máy thờng dùng cache để lu
tạm bảng trong phiên làm việc.
ánh xạ địa chỉ vật lý sang địa chỉ IP (RARP)
Đây là vấn đề ngợc với ARP: cho địa chỉ vật lý, tìm địa chỉ IP tơng ứng;

Khái niệm v mô hình mạng internet TATA Jsc. - CIC
Trang 41
Cách làm tơng tự nh ARP: máy broadcast địa chỉ vật lý xx mà máy
Server(chứa bảng IP) sẽ trả lời máy A địa chỉ IP tơng ứng).
Cấu hình mạng nào cần đến RARP: các máy không có đĩa; khi khởi động
máy, máy A cần biết địa chỉ IP của mình là gì.
BOOTP thờng đợc dùng cho lúc khởi động của các máy không có đĩa
cứng

Các máy không có đĩa thờng phải dựa vào một máy chủ để tại chơng
trình khởi động máy về máy chính mình.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 42

iii. Sự thnh công của Internet: giao thức IP v
TCP
Đối với ngời sử dụng thì Internet giống nh một mạng ảo, nối tất cả các máy
tính trên toàn cầu, giống nh chỉ là chỉ trong một mạng thôi, chứ không phải là
liên kết của nhiều mạng khác nhau.
Cách tiếp cận của vấn đề của những ngời tạo ra Internet nh trong hình vẽ dới
đây, (ngoài lề: phần lớn họ là những ngời làm việc trên Unix)

Application Service
Reliable Transport Service
Connectionless Packet Deliver Service

Nếu ta đem so sánh OSI 7 lớp thì triết lý ở đây hoàn toàn khác. Đối với ISO thì
truyền dẫn giữa hai điểm bất kỳ đều phải đợc kiểm tra kỹ càng và chắc chắn
(reliable). Chính cái điểm tởng nh đáng tin cậy này lại là điểm cản trở chính
cho việc phát triển mạng ( không có một mạng máy tính toàn cầu nào theo chuẩn
ISO).
Internet protocol (IP)
Ngợc lại, IP, giao thức thấp nhất của Internet, thì:
Unreliable(không tin cậy): vì việc chuyển một gói thông tin từ điểm A đến điểm
B không có gì đảm bảo là đến nơi.
Conectionless(bút liên quan): giả sử có một bản tin X gồm ba gói thông tin A,
B, C. Ba gói này khi gửi qua IP thì chúng đợc xử lý hoàn toàn độc lập với nhau,
không có một sự ràng buộc nào giữa chúng.

Best effort deliver( với cố gắng cao nhất): đơng nhiên phần mềm của mạng
phải cố gắng cao nhất để đa cá gói thông tin đi đến nơi về đến chốn ( trong
Internet còn các giao thức kiểm tra phần mềm).
Việc gửi gói thông tin qua IP giống nh việc gửi th qua đờng bu điện.
Không ai dám đảm bảo th không bị thất lạc. Nếu hôm nay ta gửi lá th A, rồi
ngày mai ta gửi lá th B đến cùng một địa chỉ cũng không ai dám đảm bảo rằng
là th A sẽ đến trớc lá th B. Và tất nhiên ngành bu điện họ vẫn hứa là họ đem
hết sức mình ra để phục vụ nhân dân !.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 43
Một gói thông tin còn có điểm tệ hại hơn là nó có thể bị lặp nhiều lần. Tại
sao lại giảm độ tin cậy xuống nh vậy, điểm lợi của nó ở đâu ? Đó là: giải phóng
gánh nặng cho phần mềm. Sau khi một gói IP đã ra khỏi một điểm nào đó, phần
mềm của điểm này không cần quan tâm đến nó nữa. Nếu chúng ta đã từng viết
phần mềm cho truyền tin thì đây là một lợi thế không nhỏ. Chúng hãy tởng
tợng là để gửi một byte từ một nút nọ sang một nút kia đều chạy một chơng
trình kiểm tra khổng lồ thì tốc độ truyền sẽ bị giảm xuống một cách thảm hại.
Packet header Data Area
Header có nhiều thành phần, nhng có bốn thành phần quan trọng:
3) Indentification
4) Fragment Offset
5) Source IP Address
6) Destination IP Address
Cấu trúc trên đây cho phép khôi phục lại bản gốc của thông tin từ các gói nhỏ và
cho phép nhiều chơng trình trên một máy có thể liên lạc vói Internet cùng một lúc.
Transmission Control Protocol (TCP)
Mức IP có thể chấp nhận thông tin bị mất, có thể đến không theo thứ tự và có thể
bị lặp nhiều lần.
Một trong những phơng án để giảm lỗi là giao trách nhiệm đó cho mức

ứng dụng. Tuy nhiên, nh vậy sẽ dẫn đến là tất cả ứng dụng trên mạng đều phải
có các đơn thể khử lỗi.
Internet cung cấp một dịch vụ trao hàng có đản bảo. Điều đó có nghĩa là
bên gửi và bên nhận sẽ đợc thông báo là hàng đến nơi an toàn hay không. Đây
là cơ sở cho việc xây dựng giao thức truyền có điều khiển (TCP). Quan điểm của
Internet là cung cấp một giao thức tchồng lên giao thúc IP với 5 đặc trng:
7) Truyền theo dòng dữ liệu(stream orientation): nghĩa là hết byte này đến
byte khác, không cần quan tâm đến sự phân chia gói ở mức IP.
8) Tạo mạch nối đo(victual circuit conection): ở múc IP, các gói thông tin có thể
đi theo nhiều con đờng khác nhau để đến đích. Tỵa mức TCP, ngời sử dụng có
thể hình dung nh là cá dòng dữ liệu liên tục và nối trực tiếp.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 44
9) Truyền có đệm (buffer transfer): các phần mềm TCP sẽ chuyển nhập từng
byte vào vùng đệm, rồi số byte đủ lớn mới truyền lên mạng. Việc này sẽ giảm
lu lợng trên đờng truyền.
10) các dòng dũ liệu không tuan theo một cấu trúc nào (unstructure stream):
điều này có nghĩa không cần quan tâm đến dạng thức của dữ liệu.
Định tuyến các gói tin IP
Router: bộ định tuyên, chuyển gói tin đến địa chỉ cần đến.
Chuyển trực tiếp: A và B vào cùng một mạng.
Chuyển gián tiếp: A và B trên ha mạng khác nhau;
Thuờng các máy sử dụng bảng định tuyên IP qua đó phần mêm TCP/IP sẽ xác
định là gửi trực tiếp hay gián tiếp.
ICMP
Chúng ta đã tháy là các gói tin IP đi tù gateway này đén các gateway khác
trớc khi đến địa chỉ cuối cùng, Nếu gói tin không đến đợc địa chỉ cần gửi
thì phải có cơ chế báo lỗi.
Internet Control Message Protocol (ICMP) là một gói tin IP đặc biệt để kiểm

soát các gói tin và báo lỗi cho máy gửi (thờng báo lỗi không gửi đợc).
Chơng trình ping gửi một loạt ICMP đến một địa chỉ IP nào đó và chờ
nhận lại kết quả. Nếu mọi việc êm đẹp máy gửi sẽ nhận lại các goi tin đã
gửi đi. Nếu chờ một khoảng thời gian nào đó mà không nhận lại đợc thì
ping sẽ báo time out. Khi nhận lại time out thì phần cứng hoặc phần mềm
trên máy gửi đến cha hoạt động. Nếu máy ở xa thì có khả năng đờng
truyền cha tốt.
IGMP
Broadcast(1
st
): gửi đến tất cả các máy:
Multicast: các máy tham gia một nhóm nào đó chọn một địa chỉ chung, sau đó
bất kỳ gói tin nào gửi đến địa chỉ chung đó sẽ đợc guỉ đến tất cả các máy trong
nhóm, địa chỉ chung thuộc vào lớp D.
Internet Group Manangement Protocol: (IGMP) dùng để xác định thành viên và
để gateway gửi các gói tin đến các thành viên.
SLIP

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 45
Serial Line Internet Protocol(SLIP) : là giap thức cho phép cho phép hai máy
tính nối với nhau qua đờng tuần tự (RS 232), có thể dùng giao thức này để
truy cập từ xa hoặc trao đổi thông tin giữa hai mạng.
Tuy nhiên, SLIP có một số nhợc điểm:
ắ Chỉ truyền đợc gói IP, Không truyền đợc các giao thức khác.
ắ Không có khả năng tự xác định đợc IP máy đối diện.
ắ Không có cơ chế tự sửa lỗi, truyền không tốt khi đờng truyền bị nhiễu.
ắ SLIP không phải là giao thức chuẩn của TCP/IP. Tuy nhiên giao thức này
đợc dùng khá phổ biến để truy cập từ xa.
PPP

Point to - point(PPP): là giao thức đợc thiết lập để khắc phục các nhợc
điểm của SLIP.
Dùng PPP, hai bên có thể thơng lợng để thống nhất địa chỉ IP.
Ngoài việc có cơ chế sửa lỗi, PPP còn có chế độ nén dữ liệu nếu cả hai đầu
có cùng cơ chế nén và nh vậy có thể tăng tốc độ đờng truyền.
Ngoài ra PPP còn cho phép đa liên kết (multilink) trên cùng một đờng
truyền để tận dụng băng thông.
Cổng
Trong các hệ điều hành đa nhiệm, có nhiều qúa trình cùng chạy, có thể có
nhiều quá trình nh vậy có nhu cầu truyền tin, khi các gói tin đợc gửi đến thì
phải có cơ chế nào đó để phân biệt các gói tin thuộc quá trình nào.
Nh vậy, trên cùng một máy, có có nhiều đầu điểm kết nối và các gói tin phải
có địa chỉ của quá trình nhận.
Tuy nhiên, trên máy này không thể biết đợc máy kia đàn chạy quá trình nào.
Rõ ràng, phải có cách sao cho tất cả các máy đều hiểu biết bất kể chạy hệ
điều hành(HĐH) nào.
Ngời ta đi đến khái niệm về cổng giao thức, thực chất cổng là một số
nguyên dơng, HĐH có trách nhiệm cài đặt cơ chế truy xuất qua cổng.
Thông thờng, để tránh mất dữ liệu, các cổng có vùng nhớ đệm.
Một kết nối đợc định nghĩa bằng (IPa, Pa)-(IP-Pb).
IPa đợc gọi là địa chỉ IP nguồn, Pa đợc gọi là cổng nguồn.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 46
IPb đợc gọi là IP đích, Pb đợc gọi là cổng đích.
Chúng ta l ý rằng cổng không hề quan hệ gì với quá trình.
Cổng TCP/IP
Trên thực tế, mỗi một gioa thức chuẩn của TCP/IP đều đợc gán một hoặc vài
cổng, các cổng này đợc gọi là cổng nổi tiếng (well-known ports), các cổng
này có giá trị nhỏ hơn 1024, chún là các công TCP/IP.

Chúng ta lu ý rằng có thể có nhiều quá trình cùng truyền tin thông qau một
cổng (nh cổng 80: HTTP). Nh vậy, cổng TCP/IP cũng cha đủ đẻ phân biệt
giữa các quá trình.
Hình thức trao đổi thông tin của TCP
Mỗi một gói tin đợc TCP đánh số (sequence number) để bên nhận sắp xếp
cho đúng thứ tự.
Ngợc lại, bên nhận sẽ gửi trả một gói tin (Acknowledge) báo là đã nhận
đợc.
Với hình thức trên, ngời ta có thể cắt nhỏ gói tin, gửi đi và khôi phục lại.
Khái niệm cửa sổ trợt (Sliding Windows)
Với hình thức trao đổi thông tin nh đã trình bày, bên gửi và bên nhận đều
phải đợi nhau, không tận dụng đợc băng thông đờng truyền.
Ngời ta cho phép bên gửi gửi đi n gói tin trớc khi nhận trả lời, n đợc gọi là
chiều rộng của cửa sổ.
Truyền tin với cửa sổ trợt
Với sự tham gia của cửa sổ trợt, TCP trao đổi hiệu quả hơn.
Tuy nhiên, cửa sổ cần đợc chọn một cách tối u, không bé quá, không lớn
quá. Bé quá hiệu suất sẽ thấp, lớn quá gây tắc ngẽn trên mạng.

Đầu cuối mạch ảo
TCP dựa vào khái niệm đầu cuối (end point) là cặp (địa chỉ IP, cổng)
Trên cùng một máy có thể có nhiều điểm kết nối (giá trị cổng khác nhau).
TCP truyền dữ liệu theo dòng (stream) và nh vậy, thứ tự các byte gửi đi cần
đợc tôn trọng ( nhờ vào sequence number)
Socket

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 47
Socket là khái niệm trên Unix, về sau vẫn đợc đa vào Windows dới tên
gọi là Winsock.

Socket là giao diẹn giống nh các file pointer, nhng là dùng để truyền tin
qua các cổng TCP/IP.
Ví dụ: result=socket(af, type, protocol) cho kết quả là một số nguyên và dùng nó
nh một handle để đọc hoặc ghi lên các cổng nh khi ta thao tác với file.
Truy cập từ xa bằng Talnet
Telnet( Teletypewriter) là giao cho phép truy cập từ xa và tạo ra màn hình/
bàn phím ảo.
Dịch vu này đặc biệt có ý nghĩa cho phép ta làm việc và quản trị máy từ xa.
Trong các phiên bản của windows đều có telnet (start>run>telnet), đối với
Unix/Linux thì telnet là một lệnh của hệ điều hành.
Câu lệnh: telnet địa chỉ IP (telenet) 192.168.0.1)
telnet tên-máy (telnet linus.doma)
File Transfer Protocol (FTP)
FTP là giao thức đợc dùng một cách phổ thông để truyền file, đặc biệt đối
với các máy ở xa.
Trong các phiên bản của windows đều có FTP (Start -> Run -> ftp)
WS FTP Pro là chơng trình ftp có giao diện đồ hoạ vì vậy rất rễ sử dụng.
Domain Name System (DNS)
Vì địa chỉ chỉ IP là những con số nên khó nhớ, ngời đặt tên máy bằng hệ
thống tên miền nh yahoo.com, home.vnn.vn;
Chú ý rằng để truy cập các máy, chúng ta cần địa chỉ IP chứ không phải tên,
do đó cần thiết phải có cơ chế chuyển đổi tên sang điạc chỉ IP.
Internet giải quyết vấn đề này bằng cách sử dụng một máy chủ có tên là
Domain Name Server, máy chủ náy nhận các yêu cầu từ máy khác gửi đến để
giải các tên và trả lại địc chỉ IP hoặc gửi đến IP và hỏi đến tên là gì (reserve
mapping) ?
Các yêu cầu đợc gửi đến một dạng thức nhất định (DNS format), chúng ta
không xét chi tiết dạng thức này.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC

Trang 48
Nếu tên để phẳng nh cách làm của WINS thì chỉ thích hợp với số lợng
nhỏ các máy, (thực chất là ánh xạ giữa địa chỉ IP và tên).
Máy làm quản trị sẽ trở nên rất nặng nề khi số lợng máy tăng lên.
Trớc đây toàn bộ tên đợc quản lý bởi InterNIC, có một file tên host.txt. Các
máy khác muốn lấy danh sách thì dùng FTP lấy file đó về máy tính của mình
để kiểm tra.
Sau đó việc quản trị tên đợc giao cho DNS serverr phân tán theo cơ chế
phân cấp, phân cấp cả về trách nhiệm lẫn quyền hạn.
Các domain đợc chia thành các domain nhỏ và có các DNS Server chịu trách
nhiệm giải tên, nếu tên không nằm trong miền của mình thì gửi tiếp yêu cầu lên
cấp trên, tại cấp trên cùng, các server sẽ gửi xuống cấp dới căn cứ vào tên miền.
Reserver mapping: hỏi thông qua IP đặc biệt.
In-addr.arp ( cho địa chỉ IP, tìm tên miền )
Dynamic Domain Name System (DDNS)
DDNS là mở rộng của DNS, thêm chức năng cập nhật tên miền (nghĩa là các
máy khác có thể guỉ đến các yêu cầu thên tên miền, sửa đỏi hay huỷ bỏ).
DDNS có hai dạng: dạng không có bảo mật sử dụng phơng pháp chìa khoá công
cộng và chữ ký điện tử để xét xem yêu cầu gửi đến có đợc phép hay không
Chúng ta lu ý rằng, nếu không có bảo mật thì rất rễ xảy ra mạo danh và huỷ
bỏ CSDL đang có trên miền.
Th điện tử
Cũng giông nh FTP, th điện tử là hình thức cho phép trao đổi thông tin từ
máy này sang máy khác thông qua Intertnet nhng bắt trớc hình thức gửi
thông thờng.
Ngời ta tổ chức thành các hộp th điện tử và trong đó có tên của từng ngòi,
hộp th (mailbox) vừa làm công việc nhận th và vừa làm công việc gửi th.
Địa chỉ th có dạng: Local-part@domain-name
Ví dụ:
Các giao thức phục vụ Email

Simple Mail Transfer Protocol (STMP) vừa làm việc nhận th và gửi th giữa
các hộp th.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 49
Post Office Protocol (POP) là giao thức cho phép chuyển th đến hộp th
hoặc nhận th từ hộp th về.
Thông thờng, sau khi nhận th về thì th đó sẽ bị xoá đi trên hộp th, tiết
kiệm dung lợng trên máy chủ Mail;
Internet Message Access Protocol Version 4 (IMAP4) cũng tơng tự nh pop
nhng có nhiều chức năng hơn nh cho phép tải th từ nhiều hộp th, không
xoá th trên hộp th,
Dynamic Host Configuration Protocol (DHCP)
DHCP là giao thức cho phép một máy chủ DHCP phân tự động đc IP cho các
máy ở trong mạng; DHCP hỗ trợ các chức năng sau:
Cấp phát tự động: mỗi máy sẽ đợc gán thờng trực một địa chỉ IP
Cấp phát mềm dẻo: cấp đc IP trong một khoảng thời gian nhất định; cơ chế
này cho phép sử dụng lại các đc IP đã đợc cấp phát nhng không dùng nữa
Cấp phát thủ công: do quản trị viên chịu trách nhiệm
Có thể có nhiều DHCP server trên cùng một mạng; mỗi một server quản lý
một vùng đc IP riêng biệt; tuy nhiên, các server này không đợc quản lý các
vùng đc chồng chéo lên nhau;
Với DHCP, việc quản trị đc IP đợc giảm đáng kể;
iv. wide web (WWW) v siêu văn bản Hypertext
Trong một văn bản ta thờng thấy có tham chiếu đến các loại tài liệu khác.
Ví dụ: Chi tiết xin xem thêm Nghệ thuật lập trình của Knuth, chơng 3, tập II.
Để xem thêm, cách thông thờng là ta đi tìm quyển đó và tra chơng 3. Tuy
nhiên, cách này tốn thời gian và không phải lúc nào ta cũng tìm đợc phần tài
liệu mong muốn.
Tìm Berners Lee (ngời Anh, làm việc ở viện hạt nhân Châu Âu) là ngời

đầu tiên đa ra khái niệm về siêu văn bản. Giả thiết là văn bản trên đợc lu trên
một file của VIELIN và ta đã biết đến địa chỉ lu của cuốn Nghệ thuật lập trình
đang đợc lu trong một máy tính th viện trờng đại học Berkeley ở Mỹ thì ta
chỉ việc trỏ lên địa chỉ trên.
Bằng cách đó, khi ta duyệt văn bản của cuốn Nghệ thuật lập trình lại thấy
Knuth có tham chiếu đến một công trình toán học của Fibonaci đợc lu ở th
viện hoàng gia của Thuỵ Điển thì ta lại có dịp đọc văn bản đó bằng cách nháy
lên phần tham chiếu. Cứ nh thế ta có thể ngao du trên khắp thế giới hành tính
bằng phơng tiện siêu văn bản.

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 50
Trên đây chỉ bớc khởi thuỷ của siêu văn bản. Hiện nay, với bộ trình
duyệt Netscape Navigator hoặc Internet Explorer, chúng ta có thể xem đợc ảnh,
nghe nhạc và thậm chí xem đợc phim. Ngoài ra, nó còn tích hợp đợc các dịch
vụ khác nh E-mail, FTP, Remote Login, lập trình Java Trong tơng lai gần bộ
này sẽ còn đợc cải tiến và nâng cấp.










World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 51
Đối với chúng ta, câu hỏi sẽ là: làm sao mà thực hiện đợc điều đó?

Có mấy thành phần cơ bản sau đây để cấu thành:
Mạng Internet - để liên kết tất cả các điểm trên thế giới lại với nhau.
Bộ duyệt chẳng hạn nh Netscape Navigator hoặc Internet Explorer.
Một ngôn ngữ cho siêu văn bản, nh HTML (Hyper Text Markup Language).
Các Web Servers
HTML là một ngôn ngữ cho siêu văn bản, trong đó có một phần dùng để mô tả
liên kết từ một văn bản từ một văn bản trên máy này đến một máy khác.
Ta hãy bắt đầu từ bộ duyệt. Đầu tiên nó đọc một file có một địa chỉ xác
định bởi một URL (Universal Resource Locator - điểm xác định trang Web).
Thờng File này đợc viết trong ngôn ngữ HTML và bộ duyệt đầu tiên sử lý file
này nh là một file văn bản bình thờng. Khi nó gặp một tham chiếu (là một
URL) thì nó gửi một request (một yêu cầu cung cấp tin) đến địa chỉ tơng ứng.
Tại địa điểm đấy đã có một Web Server đợi sẵn (tam dịch là trình quản lý các
trang Web). Sau khi nhận đợc yêu cầu cấp tin, Web Server tìm thông tin trong
các trang mà mình quản lý rồi gửi thông tin quay trở lại nơi yêu cầu.







Ví dụ về cách viết một địa chỉ URL:
Một cách tổng quát: scheme://hostdomain[:port]/path/filename
Một URL gồm nhiều thành phần trong đó phần đầu có tên gọi là lợc đồ, ở đây
http là viết tắt của HyperText Tranfer Protocol, là lợc đồ của các trang Web.
Ngoài ra, còn có các lợc đồ khác nh: file, gopher, wais, news, telnet, mail.
Phần tiếp theo là phần tên máy. Đối với Việt Nam, phần kết của tên sẽ là: .vn.
Chú ý cách đặt tên theo quy ớc của ISO.
Web

Server
Trang Web
Trang Web

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 52
Phần cuối cùng là phần đờng dẫn đến một file nào đó.
Trình Web Server là trình thờng trú bộ nhớ trong, dới UNIX thờng đợc gọi
là daemon (ma xó), là các Server đa nhiệm. Đa nhiệm ở đây có nghĩa là có thể
thoả mãn việc tìm tin cho nhiều yêu cầu cùng một lúc (thờng là mô hình
Client/Server computing đối với mỗi yêu cầu của Cilent, trình Web Server sẽ
cho phát sinh một thread qui trình mới. Sau khi kết thúc thread này sẽ tự khử).
Các trình Web Server trớc đây đợc xây dựng trên UNIX, nay cũng có trên
PCs. Thông thờng thờng một Web Server quản lý nhiều th mục gồm nhiều
trang Web. Bản thân mỗi một cá nhân hay công ty có nối với máy Internet
thờng có một Home Page (Trang cá nhân). Trang này tự giới thiệu công ty của
mình và đặc biệt là các sản phẩm mà công ty có thể cung cấp.Thông qua đó, nếu
khách hàng muốn có thể đặt hàng qua Email. Hiện việc tiếp nhận, credit card
qua E-mail cha đợc đảm bảo, tuy ngời ta có thể mã hoá theo các phơng
pháp RSA hoặc PGP ( phơng pháp chìa khoá công cộng).
Ngôn ngữ HLML
HTML (Hyber Text Language) là một ngôn ngữ định dạng. HTNL không mô tả
trang tài liệu theo các ngôn ngữ thông thờng khác. HTML không đa ra bất cứ
mô tả nào về font, hình ảnh đồ hoạ hay chỗ để chỗ để dặt chúng. Đơn thuần nó
chỉ gán thẻ cho nội dung của một đoạn văn bản nào đó. Ví dụ: chỗ này in
đậm, chỗ này in nghiêng, chỗ này xuống dòng:. Soạn một văn bản HTML
rất đơn giản, có thể soạn bằng bất kỳ một text editor nào.
u điểm của tính chất trên là gì ?
Trả lời: cùng một văn bản có thể hiển thị trên nhiều màn hình khác nhau và tên
nhiều loại máy tính khác nhau. Điều này rất phù hợp khi đăng tải văn bản trên

phạm vi toàn cầu.
Java
Java tuy không phải là một giao thức internet nhng lại có ảnh hởng sâu sắc
đến Internet và đặc biệt là các trang Web;

Ngôn ngữ Java là ngôn ngữ hớng đối tợng, phân tán, có thể chạy trên bất
cứ hđh nào;
Java Virtual Machine (JVM) là máy Java ảo (nằm phía trên hđh) có thể chạy
các chơng trình Java;
Nếu một chơng trình Java đợc tải về từ một trang Web và chạy trên máy
Client thì chơng trình đó có tên gọi là Java Applet;
Nếu applet chạy trên server thì có tên gọi serverlet;
HotJava là tên gọi bộ duyệt có khả năng xử lý applet;

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 53
Java Beans là các đơn thể Java có thể sử dụng lại (giống nh COM của
Microsoft);
JavaScript có thể đợc coi nh là phần mở rộng của html, là ngôn ngữ kịch
bản dựa trên Java;
Extensible Markup Language (XML)
Vấn đề của Internet còn thiếu cho đến thời điểm xuất hiện html là làm sao có
thể chuyển một tài liệu có cấu trúc trên Internet.
Dữ liệu có cấu trúc ảnh: véc tơ, giao dịch thơng mại điện tử, các phơng
trình toán học, cấu trúc giao diện,
Thế HTML có truyền tải đợc dạng thông tin đó không ? câu trả lời: nhìn
chung là không.
Do đó, ngời ta cần đến một ngôn ngữ khác có thể tải đợc thông tin có cấu
trúc, còn cấu trúc cấu trúc đó nh thế nào còn tuỳ thuộc vào bên giao và bên
nhận. Ngời ta không định nghĩa trớc cấu trúc nh html;

Hiện nay Microsoft cũng nh các công ty khác phát triển rất mạnh mẽ các
server trao đổi với nhau thông qua XML;
Một số dịch vụ thông dụng
Dịch vụ đợc sử dụng rất hiệu quả: e-mail (th điện tử);
Dịch vụ truyền file: cho phép tải xuống (down load) hoặc tải lên (upload) khi
ta làm việc ở xa;
Dịch vụ truy cập từ xa: telnet là dịch vụ rất cần đối với những ngời làm việc
chuyên nghiệp;
ftp cùng với telnet cho phép ngời làm việc chuyên nghiệp làm việc từ xa
hoặc quản trị từ xa;
Dịch vụ Web là dich vụ đợc sử dụng nhất vào thời điểm hiện nay;
Xml đang đ
ợc phát triển mạnh mẽ là giao thức cho phép các cơ quan khác
nhau trên internet cùng phối hợp hoạt động về một vấn đề gì đó;
Trong tơng lai, ngời ta tích hợp các dịch vụ thông thờng trớc đây vào
Internet: điện thoại, phát thanh, truyền hình,

World wide web (www) v siêu văn bản hypertext TATA Jsc. - CIC
Trang 54
Ngời quản trị cần biết?
Đây là câu hỏi không có câu trả lời chung nhất. Không ai dễ dàng gì nắm bắt
tất cả các vấn đề liên quan đế Internet;
Theo quan điểm của tôi, chúng ta nên nắm các kỹ năng cơ bản:
ắ Tích hợp TCP/IP vào mạng riêng của cơ quan;
ắ Có khả năng giúp đỡ ngời dùng khi một dịch vụ TCP/IP nào đó không hoạt
động;
ắ Giúp ngời dùng biết sử dụng Internet;
Xuất phát từ yêu cầu trên, tôi đề nghị học viên thực hành cụ thể các vấn đề
sau:
ắ Cài đặt TCP/IP cho các máy trạm;

ắ Biết quản trị DHCP server
ắ Biết quản trị WINS;
Biết quản trị DNS kết hợp với WINS;

×