Tải bản đầy đủ (.pdf) (45 trang)

Bài giảng tóm tắt internet và dịch vụ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.67 MB, 45 trang )

TRƯỜNG ĐẠI HỌC ĐÀ LẠT
KHOA CÔNG NGHỆ THÔNG TIN





HỌ VÀ TÊN: PHAN THỊ THANH NGA







BÀI GIẢNG TÓM TẮT
INTERNET VÀ DỊCH VỤ
Dành cho sinh viên ngành Công nghệ thông tin.
(Lưu hành nội bộ)













Đà Lạt 2008
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 2 -


MỞ ĐẦU
Ngày nay, Internet phát triển vô cùng mạnh mẽ và đã trở thành một nhu cầu
không thể thiếu đối với cuộc sống của mỗi người nhất là những sinh viên chuyên
ngành Công nghệ thông tin. Chính vì vậy, chúng tôi đưa học phần Internet và dịch vụ
vào giảng dạy cho sinh viên năm thứ nhất nhằm giúp sinh viên tiếp cận một số kiến
thức cơ bản về Internet và sử dụng một số dịch vụ trên Internet.
Giáo trình giới thiệu sơ lược về mạng máy tính, phân loại mạng máy tính, và giới
thiệu vai trò của mạng máy tính nhằm giúp sinh viên hình thành một số khái niệm ban
đầu về mạng máy tính và mạng Internet. Giáo trình cung cấp một số khái niệm về
Internet, lịch sử phát triển của Internet và xu hướng phát triển của Internet trong những
năm sắp tới. Sau khi hình thành một số khái niệm cơ bản về Internet, sinh viên sẽ được
tiếp cận với một số dịch vụ trên Internet và tìm hiểu một số kỹ thuật kết nối trên
Internet.
Tuy có nhiều cố gắng trong quá trình biên soạn nhưng giáo trình này vẫn còn
nhiều thiếu sót. Chúng tôi rất mong nhận được các ý kiến đóng góp của các bạn sinh
viên và các bạn đồng nghiệp để chúng tôi có thể hoàn thiện giáo trình này.
TRƯỜNG ĐẠI HỌC ĐÀ LẠT
KHOA CÔNG NGHỆ THÔNG TIN
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 3 -

MỤC LỤC
CHƯƠNG I - TỔNG QUAN VỀ INTERNET 4

I. 1. Sơ lược về mạng máy tính 4
1. Mạng máy tính là gì? 4
2. Vai trò của mạng máy tính 4
3. Phân loại mạng máy tính 4
I.2. Tổng quan về Internet 7
I.2. 1. Lịch sử phát triển của Internet 9
I.2. 2. Kiến trúc hạ tầng Internet 9
I.2. 3. Xu hướng phát triển của Internet 11
CHƯƠNG II - MỘT SỐ DỊCH VỤ TRÊN INTERNET 13
II.1. Dịch vụ mạng thông tin toàn cầu WWW (World Wide Web) 13
II.2. Dịch vụ thư điện tử - Electronic Mail (E-mail) 13
II.3. Dịch vụ truyền file - FTP (File Transfer Protocol) 13
II.4. Dịch vụ Messenger 13
II.5. Dịch vụ Blog 13
II.6. Dịch vụ tên miền - Domain Name System (DNS) 15
II.7. Mailing List 17
II.8. Distribution List 17
II.9. Dịch vụ Remote Login - Telnet 18
II.10. Dịch vụ nhóm thông tin News (USENET) 18
II.11. Dịch vụ Gopher 20
II.12. Dịch vụ tìm kiếm thông tin diện rộng - WAIS (Wide Area Information Server) 20
II.13. Dịch vụ hội thoại trên Internet - IRC 21
II.14. Truy cập Internet 21
CHƯƠNG 3 - TÌM KIẾM VÀ KHAI THÁC THÔNG TIN TRÊN INTERNET 23
III.1 Kỹ thuật tìm kiếm thông tin trên Internet 23
III.2 Một số ví dụ tìm kiếm thông tin trên Internet Error! Bookmark not defined.
CHƯƠNG 4 – KỸ THUẬT KẾT NỐI INTERNET 29
IV.1 Đánh giá và tìm hiểu nhu cầu 29
IV.2 Thủ tục và kỹ thuật kết nối 30


Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 4 -


CHƯƠNG I - TỔNG QUAN VỀ INTERNET
Chương này giới thiệu sơ lược về mạng máy tính, phân loại mạng máy tính, và
vai trò của mạng máy tính giúp sinh viên có một số kiến thức tổng quan về mạng máy
tính và Internet. Đồng thời sinh viên còn được trang bị kiến thức về Internet, lịch sử,
kiến trúc Internet và xu hướng phát triển của Internet trong một số năm tiếp theo.

I. 1. Sơ lược về mạng máy tính
1. Mạng máy tính là gì?
Mạng máy tính là một tập hợp các máy tính được kết nối với nhau bởi đường truyền
vật lý theo một cấu trúc nào đó để đáp ứng một số yêu cầu của người dùng
2. Vai trò của mạng máy tính
Ngày nay với một lượng lớn về thông tin, nhu cầu xử lý thông tin ngày càng cao.
Mạng máy tính hiện nay trở nên quá quen thuộc đối với chúng ta, trong mọi lĩnh vực
như khoa học, quân sự, quốc phòng, thương mại, dịch vụ, giáo dục Hiện nay ở nhiều
nơi mạng đã trở thành một nhu cầu không thể thiếu được. Người ta thấy được việc kết
nối các máy tính thành mạng cho chúng ta những khả năng mới to lớn như:
• Sử dụng chung tài nguyên: những tài nguyên của mạng (như thiết bị, chương
trình, dữ liệu) khi được trở thành các tài nguyên chung thì mọi thành viên của
mạng đều có thể tiếp cận được mà không quan tâm tới những tài nguyên đó ở
đâu.
• Tăng độ tin cậy của hệ thống: người ta có thể dễ dàng bảo trì máy móc và lưu
trữ (backup) các dữ liệu chung và khi có trục trặc trong hệ thống thì chúng có
thể được khôi phục nhanh chóng. Trong trường hợp có trục trặc trên một trạm
làm việc thì người ta cũng có thể sử dụng những trạm khác thay thế.
• Nâng cao chất lượng và hiệu quả khai thác thông tin: khi thông tin có thể

được sử dụng chung thì nó mang lại cho người sử dụng khả năng tổ chức lại các
công việc với những thay đổi về chất như:
o Ðáp ứng những nhu cầu của hệ thống ứng dụng kinh doanh hiện đại.
o Cung cấp sự thống nhất giữa các dữ liệu.
o Tăng cường năng lực xử lý nhờ kết hợp các bộ phận phân tán.
o Tăng cường truy nhập tới các dịch vụ mạng khác nhau đang được cung cấp
trên thế giới.
3. Phân loại mạng máy tính
a. Dựa trên khoảng cách địa lý:
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
• Mạng cục bộ (Local Area Network - LAN): có phạm vi hẹp, bán kính khoảng
vài chục km
• Mạng đô thị
(Metropolitan Area Network - MAN): phạm vi rộng hơn, với bán
kính nhỏ hơn 100km
• Mạng diện rộng
(Wide Area Network - WAN): phạm vi mạng có thể vượt biên
giới quốc gia, lục địa.
• Mạng toàn cầu(Global Area Network - GAN): phạm vi trải rộng trên toàn thế
giới.
Đường kính mạng Vị trí của máy tính Loại mạng
1 m Trong một mét vuông Mạng khu vực cá nhân
10 m Trong một phòng
100 m Trong một tòa nhà
1 km Trong một khu vực
Mạng cục bộ (LAN)
10 km Trong một thành phố Mạng đô thị (MAN)
100 km Trong một quốc gia
1000 km Trong một châu lục

Mạng diện rộng (WAN)
10000 km Cả hành tinh Mạng toàn cầu (GAN)

Dựa trên kiến trúc mạng
b.
Mạng kiểu Bus (Bus Topology)

Các máy tính đều được nối vào một đường dây
truyền chính (bus). Đường truyền chính này được
giới hạn hai đầu bởi một loại đầu nối đặc biệt gọi là
terminator

Mạng hình Sao (Star Topology)

Đây là mô hình mạng thông dụng nhất. Là dạng đơn
giản nhất. Mạng này bao gồm một thiết bị trung tâm là
switch hay hub, hoạt động giống như một tổng đài cho
phép thực hiện việc nhận và truyền dữ liệu từ trạm này tới
các trạm khác.

Mạng Vòng tròn (Ring Topology)

- 5 -

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 6 -

Là mô hình mạng mà một node được kết nối chính xác với 2 node khác tạo thành
một vòng tròn tín hiệu: một vòng tròn (ring).

Mỗi gói dữ liệu đều có mang địa chỉ trạm đích, mỗi trạm khi nhận được một gói
dữ liệu nó kiểm tra nếu đúng với địa chỉ của mình thì nó nhận lấy còn nếu không phải
thì nó sẽ phát lại cho trạm kế tiếp, cứ như vậy gói dữ liệu đi được đến đích
I. 2. Tổng quan về Internet
Internet là một hệ thống thông tin toàn cầu có thể được truy nhập công cộng gồm
các mạng máy tính được liên kết với nhau. Hệ thống này truyền thông tin theo kiểu nối
chuyển gói dữ liệu (packet switching) dựa trên một giao thức liên mạng đã được chuẩn
hóa (giao thức IP). Hệ thống này bao gồm hàng ngàn mạng máy tính nhỏ hơn của các
doanh nghiệp, của các viện nghiên cứu và các trường đại học, của người dùng cá nhân,
và các chính phủ trên toàn cầu. Chúng cung cấp một khối lượng thông tin và dịch vụ
khổng lồ trên Internet. Mạng Internet mang lại rất nhiều tiện ích hữu dụng cho người
sử dụng, một trong các tiện ích phổ thông của Internet là hệ thống thư điện tử (email),
trò chuyện trực tuyến (chat), máy truy tìm dữ liệu (search engine), các dịch vụ thương
mại và chuyển ngân, và các dịch vụ về y tế giáo dục như là chữa bệnh từ xa hoặc tổ
chức các lớp học ảo.
Nguồn thông tin khổng lồ kèm theo các dịch vụ tương ứng chính là hệ thống các
trang Web liên kết với nhau và các tài liệu khác trong WWW (World Wide Web). Trái
với một số cách sử dụng thường ngày, Internet và WWW không đồng nghĩa. Internet
là một tập hợp các mạng máy tính kết nối với nhau bằng dây đồng, cáp quang, v.v
.;
còn WWW, hay Web, là một tập hợp các tài liệu liên kết với nhau bằng các siêu liên
kết (hyperlink) và các địa chỉ URL, và nó có thể được truy nhập bằng cách sử dụng
Internet. Trong tiếng Anh, sự nhầm lẫn của đa số dân chúng về hai từ này thường được
châm biếm bằng những từ như "the intarweb".
Các cách thức thông thường để truy cập internet là quay số, băng rộng, không
dây, vệ tinh và qua điện thoại cầm tay.
Một số chương trình duyệt Web thông dụng là:
• Internet Explorer có sẵn trong Microsoft Windows, của Microsoft
• Mozilla và Mozilla Firefox của Tập đoàn Mozilla
• Netscape Navigator của Netscape

• Opera của Opera Software
• Safari trong Mac OS X, của Apple Computer
• Maxthon của MySoft Technology
• Avant Browser của Avant Force (Ý).
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 7 -

Ở Việt Nam, Internet chính thức xuất hiện năm 1996, khi đó đặt dưới sự quản lý
duy nhất của một
nhà cung cấp dịch vụ là Tổng công ty Bưu chính Viễn thông Việt
Nam: VNPT
I.2. 1. Lịch sử phát triển của Internet
Nền tảng cho sự ra đời khái niệm Internet được phát triển bởi 3 cá nhân và một
hội thảo nghiên cứu, mỗi tác nhân trên đã thay đổi cách suy nghĩ về công nghệ qua sự
phán đoán chính xác tương lai của nó.
• Vannevar Bush viết bản mô tả tưởng tượng đầu tiên về những công dụng tiềm
tàng của công nghệ thông tin với sự mô tả của hệ thống thư viện tự động
“memex”.
• Norbert Wiener đã phát minh ra ngành Điều khiển học, truyền cảm hứng cho
các nhà nghiên cứu sau này tập trung vào việc sử dụng công nghệ để mở rộng
khả năng của con người.
• Hội thảo về trí tuệ nhân tạo năm 1956 ở Dartmouth đã đúc kết được khái niệm:
công nghệ đã cải tiến với tốc độ cấp số mũ, và đã đưa ra sự cân nhắc nghiêm
túc đầu tiên về hậu quả.
• Marshall McLuhan đưa ra ý tưởng một làng toàn cầu liên kết với nhau bởi một
phần hệ thống thần kinh điện tử của nền văn minh nhân loại.
Năm 1957, Liên Xô phóng thành công vệ tinh đầu tiên, Sputnik I, khiến Tổng
thống Mỹ thành lập cơ quan ARPA (Defense / Advanced Research Project Agency)
nhằm giành lại vị trí dẫn đầu về công nghệ trong cuộc chạy đua vũ trang. ARPA chỉ

định J.C.R. Licklider điều hành tổ chức IPTO (Information Processing Techniques
Office) với một sự ủy nhiệm nghiên cứu xa hơn chương trình SAGE (Semi-Automatic
Ground Environment) và giúp bảo vệ nước Mỹ khỏi các cuộc tấn công hạt nhân từ
không gian. Licklider đã thuyết phục được IPTO về lợi ích tiềm tàng của một hệ thống
mạng thông tin liên lạc khắp quốc gia, tác động đến người kế nhiệm thuê
Lawrence
Roberts
để thực hiện viễn cảnh đó.
Roberts lãnh đạo phát triển mạng, dựa vào ý tưởng mới của chuyển mạch gói
phát hiện bởi Paul Baran ở RAND, và vài năm sau bởi Donal Davis ở UK National
Physical Laboratory. Một máy tính đặc biệt được gọi là một Máy xử lý Giao tiếp
Thông Điệp được chế tạo để hiện thực thiết kế, và APRANET ra đời đầu Tháng 10,
năm 1969. Kết nối đầu tiên được thực hiện giữa Trung tâm nghiên cứu ĐH California,
LA và Trung tâm Viện nghiên cứu Stanford.
Giao thức mạng đầu tiên được sử dụng trong APRANET là Network Control
Program, chương trình điều khiển mạng. Năm 1983, nó được thay thế bởi giao thức
TCP/IP, phát triển bởi Robert Kahn, Vinton Ceft và một số nhà nghiên cứu khác.
TCP/IP nhanh chóng trở thành giao thức phổ biến và được sử dụng rộng rãi khắp thế
giới.
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 8 -

Năm 1990, APRANET được ngưng lại và chuyển cho NSFNET (National
Science Foundation Network). NSFNET nhanh chóng kết nối với CSNET (Computer
Science Network), nơi đã được kết nối với các trường đại học Bắc Mỹ, và sau đó kết
nối với EUnet (European Network), nơi kết nối các thiết bị nghiên cứu ở Châu Âu.
Nhờ sự giải thoát của NSF, và kích động bởi sự thông dụng của web, mục đích ban
đầu của Internet bị tiêu tan sau năm 1990 khiến cho Chính phủ Mỹ chuyển quyền quản
lý cho các tổ chức phi chính phủ.

Mạng Internet ngày nay là một mạng toàn cầu, bao gồm hàng chục triệu người
sử dụng. Mạng Internet được hình thành từ cuối thập kỷ 60 từ một thí nghiệm của Bộ
quốc phòng Mỹ (DARPA - Defense Advanced Research Projects Agency). Tại thời
điểm ban đầu nó là mạng ARPAnet (Advanced Research Projects Agency Network)
của Ban quản lý dự án nghiên cứu Quốc phòng. ARPAnet là một mạng thử nghiệm
phục vụ các nghiên cứu quốc phòng, một trong những mục đích của nó là xây dựng
một mạng máy tính có khả năng chịu đựng các sự cố (ví dụ một số nút mạng bị tấn
công và phá huỷ nhưng mạng vẫn tiếp tục hoạt động). Mạng cho phép một máy tính
bất kỳ trên mạng liên lạc với mọi máy tính khác.
Khả năng kết nối các hệ thống máy tính khác nhau đã hấp dẫn mọi người, vả lại
đây cũng là phương pháp thực tế duy nhất để kết nối các máy tính của các hãng khác
nhau. Kết quả là các nhà phát triển phần mềm ở Mỹ, Anh và Châu Âu bắt đầu phát
triển các phần mềm trên bộ giao thức TCP/IP (giao thức được sử dụng trong việc
truyền thông trên Internet) cho tất cả các loại máy. Điều này cũng hấp dẫn các trường
đại học, các trung tâm nghiên cứu lớn và các cơ quan chính phủ, những nơi mong
muốn mua máy tính từ các nhà sản xuất, không bị phụ thuộc vào một hãng cố định
nào.
Bên cạnh đó các hệ thống cục bộ LAN bắt đầu phát triển cùng với sự xuất hiện
các máy để bàn (Desktop Workstations) - 1983. Phần lớn các máy để bàn sử dụng
Berkeley UNIX, phần mềm cho kết nối TCP/IP đã được coi là một phần của hệ điều
hành này. Một điều rõ ràng là các mạng này có thể kết nối với nhau dễ dàng.
Trong quá trình hình thành mạng Internet, NSFNET (được sự tài trợ của Hội
khoa học Quốc gia Mỹ) đóng một vai trò tương đối quan trọng. Vào cuối những năm
80, NFS thiết lập 5 trung tâm siêu máy tính. Trước đó, những máy tính nhanh nhất thế
giới được sử dụng cho công việc phát triển vũ khí mới và một vài hãng lớn. Với các
trung tâm mới này, NFS đã cho phép mọi người hoạt động trong lĩnh vực khoa học
được sử dụng. Ban đầu, NFS định sử dụng ARPAnet để nối 5 trung tâm máy tính này,
nhưng ý đồ này đã bị thói quan liêu và bộ máy hành chính làm thất bại. Vì vậy, NFS
đã quyết định xây dựng mạng riêng của mình, vẫn dựa trên thủ tục TCP/IP, đường
truyền tốc độ 56kbps. Các trường đại học được nối thành các mạng vùng, và các mạng

vùng được nối với các trung tâm siêu máy tính.
Đến cuối năm 1987, khi lượng thông tin truyền tải làm các máy tính kiểm soát
đường truyền và bản thân mạng điện thoại nối các trung tâm siêu máy tính bị quá tải,
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
một hợp đồng về nâng cấp mạng NSFNET đã được ký với công ty Merit Network Inc,
công ty đang cùng với IBM và MCI quản lý mạng giáo dục ở Michigan. Mạng cũ đã
được nâng cấp bằng đường điện thoại nhanh nhất lúc bấy giờ, cho phép nâng tốc độ
lên gấp 20 lần. Các máy tính kiểm soát mạng cũng được nâng cấp. Việc nâng cấp
mạng vẫn liên tục được tiến hành, đặc biệt trong những năm cuối cùng do số lượng
người sử dụng Internet tăng nhanh chóng.
Điểm quan trọng của NSFNET là nó cho phép mọi người cùng sử dụng. Trước
NSFNET, chỉ có các nhà khoa học, chuyên gia máy tính và nhân viên các cơ quan
chính phủ có được kết nối Internet. NSF chỉ tài trợ cho các trường đại học để nối
mạng, do đó mỗi sinh viên đại học đều có khả năng làm việc trên Internet.
Ngày nay mạng Internet đã được phát triển nhanh chóng trong giới khoa học và
giáo dục của Mỹ, sau đó phát triển rộng toàn cầu, phục vụ một cách đắc lực cho việc
trao đổi thông tin trước hết trong các lĩnh vực nghiên cứu, giáo dục và gần đây cho
thương mại.
I.2. 2. Kiến trúc hạ tầng Internet
Internet là một liên mạng, tức là mạng của các mạng con. Vậy đầu tiên là vấn đề
kết nối hai mạng con. Để kết nối hai mạng con với nhau, có hai vấn đề cần giải quyết.
Về mặt vật lý, hai mạng con chỉ có thể kết nối với nhau khi có một máy tính có thể kết
nối với cả hai mạng này. Việc kết nối đơn thuần về vậy lý chưa thể làm cho hai mạng
con có thể trao đổi thông tin với nhau. Vậy vấn đề thứ hai là máy kết nối được về mặt
vật lý với hai mạng con phải hiểu được cả hai giao thức truyền tin được sử dụng trên
hai mạng con này và các gói thông tin của hai mạng con sẽ được gửi qua nhau thông
qua đó. Máy tính này được gọi là internet gateway hay router.



Hình 1.1: Hai mạng Net 1 và Net 2 kết nối thông qua router R.
Khi kết nối đã trở nên phức tạp hơn, các máy gateway cần phải biết về sơ đồ kiến trúc
của các mạng kết nối. Ví dụ trong hình sau đây cho thấy nhiều mạng được kết nối
bằng 2 router.

Hình 1.2: 3 mạng kết nối với nhau thông qua 2 router
Như vậy, router R1 phải chuyển tất cả các gói thông tin đến một máy nằm ở mạng Net
- 9 -

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
2 hoặc Net 3. Với kích thước lớn như mạng Internet, việc các routers làm sao có thể
quyết định về việc chuyển các gói thông tin cho các máy trong các mạng sẽ trở nên
phức tạp hơn.
Để các routers có thể thực hiện được công việc chuyển một số lớn các gói thông
tin thuộc các mạng khác nhau người ta đề ra quy tắc là:
Các routers chuyển các gói thông tin dựa trên địa chỉ mạng của nơi đến, chứ
không phải dựa trên địa chỉ của máy máy nhận.
Như vậy, dựa trên địa chỉ mạng nên tổng số thông tin mà router phải lưu giữ về
sơ đồ kiến trúc mạng sẽ tuân theo số mạng trên Internet chứ không phải là số máy trên
Internet.
Trên Internet, tất cả các mạng đều có quyền bình đẳng cho dù chúng có tổ chức
hay số lượng máy là rất chênh lệch nhau. Giao thức TCP/IP của Internet hoạt động
tuân theo quan điểm sau:
Tất các các mạng con trong Internet như là Ethernet, một mạng diện rộng như
NSFNET back bone hay một liên kết điểm-điểm giữa hai máy duy nhất đều
được coi như là một mạng.
Điều này xuất phát từ quan điểm đầu tiên khi thiết kế giao thức TCP/IP là để có
thể liên kết giữa các mạng có kiến trúc hoàn toàn khác nhau, khái niệm "mạng" đối với
TCP/IP bị ẩn đi phần kiến trúc vật lý của mạng. Đây chính là điểm giúp cho TCP/IP tỏ

ra rất mạnh.
Như vậy, người dùng trong Internet hình dung Internet làm một mạng thống nhất
và bất kỳ hai máy nào trên Internet đều được nối với nhau thông qua một mạng duy
nhất. Hình vẽ sau mô tả kiến trúc tổng thể của Internet.

- 10 -

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008

Hình 1.3: (a) - Mạng Internet dưới con mắt người sử dụng. Các máy được nối với
nhau thông qua một mạng duy nhất. (b) - Kiến trúc tổng quát của mạng Internet. Các
routers cung cấp các kết nối giữa các mạng.
I.2. 3. Xu hướng phát triển của Internet
Số liệu năm 2007 cho thấy trung bình một người châu Á dành 28% thời gian
trong ngày cho Internet, chỉ sau TV (34%). Tỷ lệ này vẫn đang tiếp tục tăng, vì
Internet ngày càng chứng minh những tiện ích vượt trội đem lại. Một công chức bận
rộn không cần rời mắt khỏi màn hình máy vi tính vẫn có thể thỏa mãn tất cả các nhu
cầu ăn uống, giải trí, mua sắm, tra cứu thông tin, đọc sách báo, xem TV, gọi điện
thoại, viết nhật ký.
Với các cỗ máy tìm kiếm ngày càng hoàn thiện, hệ thống email, website tích hợp
nhiều tiện ích, công nghệ mới và nhiều dịch vụ hấp dẫn ra đời, Internet đang thuyết
phục hàng triệu người trở thành một phần của mạng lưới đầy quyền lực này mỗi ngày.
Internet và các dịch vụ kèm theo phát triển nhanh đến nỗi từng khiến các chuyên
gia lo ngại cơ sở hạ tầng “đuối sức” sẽ gây sập hệ thống mạng toàn cầu. Nhưng đó là
vấn đề của những chuyên viên kỹ thuật. Dưới góc nhìn của nhà quảng cáo, điều này
chỉ mang một ý nghĩa hấp dẫn duy nhất: Internet đang phủ sóng một lượng khách hàng
đáng mơ ước có thể không bao giờ xem tivi, nhưng dành đến 16 tiếng mỗi ngày để
online.
Internet ngày nay đã trở thành một nhu cầu không thể thiếu trong cuộc sống của

con người.Internet càng ngày càng phát triển, số lượng máy tính kết nối vào mạng
Internet ngày càng nhiều. Kèm theo đó các dịch vụ trên Internet càng ngày càng gia
tăng và phát triển mạnh. Khối lượng thông tin và dữ liệu trên Internet tăng lên một
cách đáng kể khiến cho Internet trở thành một kho tàng thông tin khổng lồ mà không
có bất kì thư viện nào có thể chứa hết. Tuy nhiên, cùng với sự phát triển đó là các mối
- 11 -

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 12 -

đe dọa lớn đối với thông tin và dữ liệu trên Internet xuất hiện ngày càng nhiều.
Theo kết quả thăm dò, 66% các chuyên gia kỹ thuật, học giả, các chuyên gia trong
nhiều ngành công nghiệp đều dự đoán rằng sẽ có các cuộc tấn công vào hệ thống điều
khiển mạng lưới cung cấp điện của các quốc gia thông qua mạng Internet trong
vòng 10 năm nữa. Dự đoán trên không phải là không có cơ sở. Chúng ta cần biết rằng
hệ thống máy tính của một số nhà cung cấp điện hạt nhân của Mỹ, vốn được bảo vệ
cực kỳ nghiêm ngặt, vẫn bị tin tặc tấn công và đột nhập. Qua đó có thể thấy nguy cơ
tấn công qua mạng Internet là rất lớn, và có thể ảnh hưởng tới tính mạng con người.
Các cuộc tấn công của tin tặc từ trước tới nay chỉ đơn thuần gây thiệt hại về mặt vật
chất và tiền bạc.
Khả năng xảy ra các cuộc tấn công khủng bố qua mạng cũng không nằm ngoài
dự đoán của các chuyên gia. Người ta cho rằng, những kẻ khủng bố đang tiến hành
nghiên cứu sơ hở của mạng Internet để tấn công vào các hệ thống máy tính quốc gia,
dự kiến sẽ xảy ra vào năm 2014.
Ngoài ra, cũng theo đự đoán của các chuyên gia, việc tổ chức bầu cử qua mạng
tại Mỹ vào năm 2014 chỉ là viễn tưởng, do mạng Internet vẫn chưa thể đáp ứng
được các yêu cầu về bảo mật, sự ổn định và khả năng đáp ứng của phần cứng.
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008

- 13 -


CHƯƠNG II - MỘT SỐ DỊCH VỤ TRÊN INTERNET
Chương này giới thiệu một số dịch vụ trên Internet như dịch vụ phân giải tên
miền, dịch vụ truyền file, dịch vụ web và một số dịch vụ khác của Internet. Kết thúc
chương này sinh viên sẽ có được các khái niệm về một số dịch vụ Internet và biết khai
thác, sử dụng các dịch này.

II.1. Dịch vụ mạng thông tin toàn cầu WWW (World Wide Web)
World Wide Web được tạo ra năm 1989 bởi Sir Tim Berners-Lee, làm việc tại
CERN, Thuỵ Sỹ. Từ World Wide Web thường được gọi tắt là Web, là một hệ thống
các trang văn bản được liên kết với nhau thông qua Internet.
Với một trình duyệt Web, người dùng có thể xem trang Web chứa văn bản, hình ảnh,
video và các loại hình đa phương tiện khác. Người dùng có thể di chuyển qua lại giữa
các trang web thông qua các siêu liên kết (hyperlink).
II.2. Dịch vụ thư điện tử - Electronic Mail (E-mail)
Thư điện tử, hay thường gọi e-mail, là một trong những tính năng quan trọng
nhất của Internet. Mặc dù ban đầu được thiết kế như một phương thức truyền các
thông điệp riêng giữa những người dùng Internet, Internet e-mail là phương pháp
truyền văn bản rẻ tiền nhất có ở mọi nơi. Chỉ tốn khoảng vài cent để gửi e-mail đi bất
kỳ đâu trên thế giới, rẻ hơn nhiều so với cước bưu điện loại thấp nhất. Một trong
những lợi ích chính của e-mail là tốc độ lưu chuyển. Tuy không tức thời như fax, thời
gian truyền e-mail thường được tính bằng phút, ngay cả khi người gửi và người nhận ở
tận hai đầu của trái đất.
Hệ thống địa chỉ e-mail: Một vấn đề vô cùng quan trọng trong quá trình gửi hay
nhận thư là cách xác định chính xác địa chỉ của thư cần gửi đến. Để thực hiện điều này
người ta sử dụng dịch vụ đánh tên vùng (Domain Name Service - DNS). Dựa trên dịch
vụ đánh tên vùng, việc đánh địa chỉ e-mail cho người sử dụng sẽ rất đơn giản như sau:
Tên_người_sử_dụng@Tên_đầy_đủ_của_domain

Ví dụ người dùng Nguyễn Văn A thuộc domain là hn.vnn.vn sẽ có thể có địa chỉ e-
mail là

II.3. Dịch vụ truyền file - FTP (File Transfer Protocol)
Dịch vụ FTP dùng để truyền tải các file dữ liệu giữa các host trên Internet. Công
cụ để thực hiện dịch vụ truyền file là chương trình ftp, nó sử dụng một giao thức của
Internet là giao thức FTP (File Transfer Protocol). Như tên của giao thức đã nói, công
việc của giao thức này là thực hiện chuyển các file từ một máy tính này sang một máy
tính khác. Giao thức này cho phép truyền file không phụ thuộc vào vấn đề vị trí địa lý
hay môi trường hệ điều hành của hai máy. Điều duy nhất cần thiết là cả hai máy đều
có phần mềm hiểu được giao thức FTP.
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 14 -

Muốn sử dụng dịch vụ này trước hết bạn phải có một đăng ký người dùng ở máy
remote và phải có một password tương ứng. Việc này sẽ giảm số người được phép truy
cập và cập nhập các file trên hệ thống ở xa. Một số máy chủ trên Internet cho phép bạn
login với một account là anonymous, và password là địa chỉ e-mail của bạn, nhưng tất
nhiên, khi đó bạn chỉ có một số quyền hạn chế với hệ thông file ở máy remote.
Để phiên làm việc FTP thực hiện được, ta cũng cần 2 phần mềm. Một là ứng
dụng FTP client chạy trên máy của người dùng, cho phép ta gửi các lệnh tới FTP host.
Hai là FTP server chạy trên máy chủ ở xa, dùng để xử lý các lệnh FTP của người dùng
và tương tác với hệ thống file trên host mà nó đang chạy.
FTP cho phép bạn tìm kiếm thông tin trên server bằng các lệnh thông dụng như
ls hay dir. Khi người dùng đánh các lệnh này, ftp sẽ chuyển lên cho server, tại server
sẽ thực hiện lệnh này và gửi về thông tin danh sách các file tìm được. Người sử dụng
sau khi nhận được các thông tin này sẽ gửi yêu cầu về một file nào đó bằng lệnh:
get source_file_name destination_file_name.
Còn khi muốn truyền một file lên máy ở xa, người sử dụng dùng lệnh:

put source_file_name destination_file_name
Để một lúc có thể tải về hoặc truyền lên máy ở xa nhiều file, người ta có thể
dùng các lệnh mget và mput và sử dụng các ký tự wild cast như trong môi trường
DOS. Ví dụ sau sẽ tải các file có tên là *.dat:
mget *.dat
Sau đây là một ví dụ về một giao dịch truyền file:
# ftp ftp.vnd.net (kết nối với máy chủ )
Connected to ftp.vnd.net
220 FTP Server ready.
name: anonymous (gõ user name để login)
331 send your e-mail as password
Password: (password không hiển thị )
230 User guest logged in. Access restricted is apply
ftp>dir (lệnh hiển thị danh sách các file)
sendmail-7.5 tcp-wrapper innd w project.dat
ftp>get project.dat (tải file về local )
ftp>quit (thoát ra khỏi dịch vụ )
221 Goodbye.
Để sử dụng dịch vụ FTP, người sử dụng có thể chạy phần mềm FTP client ví dụ
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 15 -

như: WS_FTP hay CuteFTP đây là các chương trình có giao diện đồ hoạ khá thân
thiện với người sử dụng. Bạn có thể download các phần mềm này từ Internet để cài lên
máy tính của bạn.
II.4. Dịch vụ Messenger
Chat (tán gẫu) hay nhắn tin đa phương tiện (IM) không còn là điều xa lạ với đại
đa số người dùng Internet ngày nay.Những dịch vụ nhắn tin (IM) trực tuyến đem lại
nhiều tiện lợi hơn các ứng dụng cài đặt trên máy tính về khả năng linh hoạt, hỗ trợ

nhiều dịch vụ chat trên cùng 1 tài khoản phục vụ chat mọi lúc mọi nơi, chỉ cần một
kết nối.Khi sử dụng các máy tính lạ, không có cài đặt các ứng dụng tin nhắn phù hợp
như: AOL Messenger, Windows Live Messenger, Yahoo Messenger thì bạn sẽ gặp
rắc rối khi muốn liên hệ gấp với bạn bè. Giải pháp tương ứng sẽ là những dịch vụ chat
trực tuyến, cung cấp cho người dùng khả năng nối kết đến nhiều dịch vụ tin nhắn mà
không cần cài đặt bất cứ ứng dụng nào, chỉ cần có một kết nối internet là bạn đã thoải
mái mà tán gẫu cùng bạn bè.
II.5. Dịch vụ Blog
Blog, gọi tắt của weblog (tiếng Anh, "nhật ký web"), là một dạng nhật ký trực
tuyến, bùng nổ từ cuối thập niên 1990. Các blogger (người viết blog), có thể là cá nhân
hoặc nhóm, đưa thông tin lên mạng với mọi chủ đề, thông thường có liên quan tới kinh
nghiệm hoặc ý kiến cá nhân, chủ yếu cung cấp thông tin đề cập tới những chủ đề chọn
lọc, không giống như các báo truyền thống. Được phần mềm hỗ trợ, dễ sử dụng, blog
phổ biến rất nhanh và ai cũng có thể dễ dàng tạo ra một blog cho mình.
Một trang blog có thể chứa các siêu liên kết, hình ảnh và liên kết (tới các trang
chứa phim và âm nhạc). Văn bản blog dùng phong cách thảo luận. Một blog thường
chỉ liên quan đến một chủ đề yêu thích.
Blog hiện nay phát triển từ nhật ký trực tuyến, nơi mọi người ghi lại một phần của
cuộc sống riêng tư. Hầu hết những người viết tự gọi mình là người viết nhật ký hoặc
nhà báo.
II.6. Dịch vụ tên miền - Domain Name System (DNS)
Địa chỉ IP dù được biểu diễn dưới dạng một số nguyên 32 bits hay dạng chấm
thập phân đều rất khó nhớ đối với người sử dụng, do đó trên mạng Internet người ta đã
xây dựng một dịch vụ dùng để đổi tên của một host sang địa chỉ IP. Dịch vụ đó là dịch
vụ đánh tên vùng (Domain Name Service DNS). DNS cho phép người sử dụng
Internet có thể truy nhập tới một máy tính bằng tên của nó thay vì bằng địa chỉ IP.
Việc đánh tên vùng được tổ chức dạng cây. Tên của một host sẽ được đặt bằng
cách đi từ nút biểu diễn host lên tận gốc.
Việc đánh tên vùng không chỉ có lợi là không bắt người sử dụng nhớ địa chỉ IP
của các host mà nó còn làm dễ dàng hơn trong việc tổ chức mạng.

Hình vẽ sau cho thấy cấu trúc hình cây của dịch vụ tên vùng. Trong đó
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008


Hình 2.1: Cấu trúc hình cây của dịch vụ tên vùng.
Arpa là một domain đặc biệt dùng để ánh xạ địa chỉ IP dạng chấm thập phân sang biểu
diễn tên vùng.
Bảng sau cho thấy 7 lớp cơ bản của hệ thống phân vùng:
Domain Mô tả
com Các tổ chức thương mại, doanh nghiệp
edu Các tổ chức giáo dục
gov Các tổ chức chính phủ
int Các tổ chức Quốc tế
mil Các tổ chức quân sự
net Một mạng không thuộc các loại phân vùng khác
org Các tổ chức không thuộc một trong các loại trên
Bảng sau là các ký hiệu tên vùng của một số nước trên thế giới:
- 16 -

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 17 -

Domain Quốc gia tương ứng
au Úc
at Áo
be Bỉ
ca Canada
fi Phần Lan

fr Pháp
de CHLB Đức
il Israel
it Ý
jp Nhật
vn Việt Nam

II.7. Mailing List
Mailing list (danh sách gửi email) là một trong các dịch vụ của Internet, liên
quan đến các nhóm thảo luận và toàn bộ dữ liệu được chuyển thông qua thư tín điện
tử.
Mọi người có thể tự đăng ký hoặc tự huỷ đăng ký vào Mailing list có chủ đề
mình quan tâm.
Trước đây Mailing List thường được sử dụng như là một phương pháp thảo luận,
trao đổi thông tin qua lại. Nhưng từ khi thảo luận nhóm (Group) và Forum ra đời thì
hình thức này cũng không còn phổ biến nữa. Nó thường được kết hợp vào Forum hay
Group để thông báo khi có thảo luận mới được gửi lên.
II.8.
Distribution List
Distribution List là một danh sách các email được tập hợp lại, khi cần gửi đến
mọi người trong danh sách chỉ việc gửi đến địa chỉ của danh sách này. Distribution
List khác Mailing List ở chỗ nó mang tính một chiều
không nhằm mục đích thảo luận.
Và chỉ có các thành viên trong danh sách mới có thể Distribution List.

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 18 -

II.9. Dịch vụ Remote Login - Telnet

Dịch vụ này cho phép bạn ngồi tại máy tính của mình thực hiện kết nối tới một
máy chủ ở xa (remote host) và sau đó thực hiện các lệnh trên máy chủ ở xa này. Khi
bạn đã kết nối tới máy remote và thực hiện xong việc login, những gì bạn gõ vào bàn
phím sẽ được chuyển tới máy remote và có tác dụng như việc gõ bàn phím ở chính
máy remote đó. Bạn có thể truy nhập bất cứ dịch vụ gì mà máy remote cho phép các
trạm cục bộ của mình truy nhập.
Để thực hiện dịch vụ Telnet, tại máy của mình bạn gõ:
# telnet remote-host-name
Ví dụ sau đây mô tả người dùng hoalt login vào một máy chủ UNIX tại VDC:
# telnet www.vnd.net
Trying
Connected to www.vnd.net
Escape character '^]'.
login: hoalt (login vào máy remote)
Password: pasword (không được hiển thị)
Last login: Sat Sep 7 17:16:35 from localhost
$ ls (Lệnh thực hiện trên máy remote)
sendmail-7.5 tcp-wrapper innd www
$ pwd (Lệnh thực hiện trên máy remote)
/home/hoalt
$ logout (logout khỏi máy remote)
#
Như vậy, telnet là một công cụ giúp bạn login vào một máy ở xa. Nhưng muốn
vậy máy ở xa phải cho phép bạn sử dụng dịch vụ này. Cụ thể là trong ví dụ trên bạn
phải có một định danh người sử dụng tại máy ở xa là hoalt với một password nào đó.
II.10. Dịch vụ nhóm thông tin News (USENET)
Đây là dịch vụ cho phép người sử dụng có thể trao đổi thông tin về một chủ đề
mà họ cùng quan tâm. Người dùng cần đăng ký (subcribed) vào một số nhóm thông tin
nào đó và sau đó có thể kết nối lên server để xem các thông tin trong nhóm và tải
(load) về trạm làm việc để xem chi tiết, anh ta cũng có thể gửi các ý kiến của anh ta

lên các nhóm thông tin đó.
Tổ chức đánh tên các News groups:
Các nhóm thông tin được đánh địa chỉ là một dãy các tên của các News Groups xếp
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 19 -

theo thứ tự cha-con. Mỗi tên một News groups được phân cách với tên của News
Group "cha" bằng một dấu chấm (.). News Group qui định một số tên gọi như sau:
comp Group chứa các thông tin về computer và các vấn đề liên quan. News Group
này bao gồm cả các thông tin về kỹ thuật máy tính, phần mềm, các thông tin
liên quan tới mạng
news Group đề cập tới các thông tin về Network News và các phần mềm News. Nó
bao gồm một số News Groups con rất cần thiết cho người dùng là
news.newsusers.questions (các câu hỏi của người dùng) và
news.announce.newsusers (các thông tin quan trọng cho người dùng). Nếu bạn
là một người mới tham gia vào dịch vụ News Groups, bạn hãy đọc các thông
tin này đầu tiên.
rec Group chứa các thông tin về vấn đề giải trí, các hoạt động văn hoá nghệ thuật.
sci Group chứa các thông tin về nghiên cứu khoa học, các vấn đề mới hay các ứng
dụng khoa học (rộng hơn lĩnh vực computer trong group comp). News Groups
này bao gồm rất nhiều các News Group con về từng lĩnh vực khoa học riêng.
soc Group chứa các thông tin về các tổ chức xã hội hay chính trị cũng như các
thông tin có liên quan.
misc Group chứa các thông tin khác, không thuộc các News Groups bên trên. Trong
News Group này có chứa News Group khá có ích là misc.jobs (yêu cầu tìm
việc và nhận việc).
Như vậy News Group về nhạc đồng quê sẽ có tên là: rec.music.folk
Tổ chức hệ thống News Groups:
Dịch vụ nhóm thông tin sử dụng một giao thức của Internet là giao thức NNTP

(Network News Transfer Protocol). Cũng giống như hai giao thức Telnet và FTP, giao
thức NNTP cũng hoạt động theo mô hình client/server. Client và Server sẽ liên kết với
nhau qua cổng TCP 119.
Hệ thống News group mà người dùng nhìn thấy (client) có một bộ phận gọi là
News Reader làm nhiệm vụ kết nối giữa chương trình trên trạm làm việc với server.
Thông qua News Reader, người dùng nhận được từ server danh sách các bài thông tin
và cũng qua đó, người dùng chuyển yêu cầu của mình lên server yêu cầu tải bài thông
tin đó về.
Người quản trị News Server có thể tự tạo ra các News Groups trên Server tuỳ
theo nhu cầu của người dùng. Đây là các News Groups cục bộ trên mỗi Server. Mặc
dù là các News Groups cục bộ xong chúng vẫn có thể được trao đổi với các server
khác nếu người quản trị cho phép. Việc cập nhập thông tin từ các News server khác
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 20 -

trên Internet có thể được thực hiện tự động theo một lịch do người quản trị mạng đề ra.
Người dùng chỉ biết đến một News Server duy nhất là server mà mình connect vào.
Việc thông tin giữa các server cũng như các News Groups là trong suốt đối với người
dùng. Người dùng không cần biết thông tin về News Groups hiện mình đang đọc là
News Group cục bộ của server nào.
Như vậy, với dịch vụ News Group, người dùng có thể nhận được các thông tin
mà mình quan tâm của nhiều người từ khắp nơi sau đó laị gửi thông tin của mình đi
cho những người có cùng mối quan tâm này.
II.11. Dịch vụ Gopher
Gopher là một dịch vụ tra cứu thông tin trên mạng theo chủ đề và sử dụng các
menu. Khi một client nối vào một server, màn hình của client sẽ xuất hiện như sau:
Internet Gropher Infermation Client v2.0.16
Home Gopher server: wildlife.ora.com
1. Introduce and Cover

2. Foreword
3. Country and Account/
4. Search Country Data <?>
5. Wildfile FTP Site/
Press ? for Help, q to Quit
Người dùng có thể chọn đề mục mà mình quan tâm hoặc gõ các lệnh tương ứng
(thông thường các lệnh rất đơn giản, chỉ 1 hay 2 ký tự), trên màn hình sẽ lại xuất hiện
ra một menu kế tiếp theo hoặc hiển thị những văn bản cần thiết khi đến tận cùng.
Người dùng có thể tải văn bản đó về máy tính của mình để xem xét hay xử lý.
Một hạn chế của Gopher là thông tin hiển thị cho người dùng dưới các dạng
menu cho nên rất tóm tắt, hơn nữa Gopher cung cấp rất hạn chế khả năng tìm kiếm
thông tin. Khi dịch vụ World Wide Web ra đời và phát triển thì người dùng không
dùng Gopher như một dịch vụ tra cứu thông dụng nữa.
II.12. Dịch vụ tìm kiếm thông tin diện rộng - WAIS (Wide Area
Information Server)
WAIS là công cụ tìm kiếm thông tin trên Internet, khác với dịch vụ Gopher là
dịch vụ cho phép người dùng tìm kiếm và lấy thông tin qua một chuỗi các đề mục lựa
chọn (menu), dịch vụ WAIS cho phép người sử dụng tìm kiếm các tệp dữ liệu trong đó
có các xâu xác định trước. Người sử dụng có thể đưa ra yêu cầu dạng như: "hãy tìm
cho tôi các tệp có chứa từ music và Beethoven". Khi đó, WAIS server sẽ tìm trong cơ
sở dữ liệu của nó các tệp thoả mãn yêu cầu trên và gửi trả về client danh sách các tệp
đó. WAIS server còn thực hiện đếm số lần xuất hiện của từ trong tệp để tính điểm và
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
gửi về cho client giúp người sử dụng dễ dàng lựa chọn tệp mình cần. Mỗi danh sách
gửi về thường có khoảng 15-50 tệp với số điểm cao nhất, người dùng có thể chọn một
hay nhiều tệp để tải về trạm của mình.
Hình vẽ sau đây mô tả cấu trúc của hệ thống WAIS:

Hình 2.2: Cấu trúc của hệ thống WAIS.

Về mặt cấu trúc, WAIS bao gồm ba bộ phận chính là: client, server và indexer.
Bộ phận indexer thực hiện cập nhập các dữ liệu mới, sắp xếp chúng theo một phương
pháp thích hợp cho việc tìm kiếm. Server nhận câu hỏi từ client, tìm kiếm trong cơ sở
dữ liệu (do indexer tạo ra) những tệp phù hợp, đánh giá điểm các tệp và gửi về cho
client. Nó không những cho phép hiển thị các tệp dữ liệu TEXT mà còn có thể hiển thị
các tệp dữ liệu đồ hoạ.
II.13. Dịch vụ hội thoại trên Internet - IRC
Internet Relay Chat (IRC - Nói chuyện qua Internet) là phương tiện "thời gian
thực", nghĩa là những từ bạn gõ vào sẽ xuất hiện gần như tức thời trên màn hình của
người nhận và trả lời của họ của xuất hiện trên màn hình của bạn như vậy. Thay vì
phải chờ vài phút hay vài ngày đối với thông điệp, bạn có thể trao đổi tức thời với tốc
độ gõ chữ của bạn. IRC có thể mang tính cá nhân như e-mail, người lạ không khám
phá được nội dung trao đổi của bạn, hoặc bạn có thể tạo "kênh mở" cho những ai bạn
muốn cùng tham gia. Cũng không hiếm các kênh IRC có từ 10 người trở lên tham gia
hội thoại. Ngoài việc trao đổi lời, người dùng IRC còn có thể gửi file cho nhau như
hình ảnh, chương trình, tài liệu hay những thứ khác.
Cũng như các dịch vụ khác của Internet, phạm vi hội thoại trên các kênh IRC là
rất rộng, có thể bao gồm cả những chủ đề không phù hợp với trẻ em, vì vậy cần có
biện pháp giám sát những trẻ em muốn sử dụng dịch vụ này.
Ngoài những dịch vụ đã nêu ở trên còn có các dịch vụ khác như Voice Over IP,
IP FAX, Video Conference
II.14. Truy cập Internet
Có nhiều cách để truy cập vào Internet: truy cập gián tiếp thông qua mạng điện
thoại công cộng; truy cập trực tiếp thông qua đường dành riêng (Leased Line); truy
- 21 -

Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 22 -


cập qua mạng không dây, vệ tinh, mạng điện thoại di động.
Việc đăng ký một đường thuê bao dành riêng chỉ dành cho những cơ quan, đơn
vị với mục đích truy cập mạng Internet không chỉ khai thác các tài nguyên, dịch vụ sẵn
có trên mạng Internet mà còn sử dụng mạng Internet như là một môi trường kết nối từ
xa tới các tài nguyên trên mạng LAN của đơn vị mình. Khi đó người sử dụng có thể
xây dựng máy chủ Mail, máy chủ FTP, xây dựng mạng riêng ảo (VPN - Virtual
Private Network) Tất nhiên việc này đòi hỏi tốn kém tiền bạc và công sức. Còn nếu
bạn chỉ truy cập mạng Internet để khai thác các dịch vụ sẵn có trên mạng thì bạn có thể
truy cập thông qua mạng điện thoại công cộng, không dây, hay điện thoại di động.
Một số cách truy cập:
• Có dây: Dial-up (dạng quay số 1260, 1269 của VNN), ISDN (Integrated
Services Digital Network – tốc độ cao vài Mbps, T1, E1), DSL (Digital
Subscriber Line, SDSL, ADSL – ADSL2+ có tốc độ 24 Mbps), Cable (Cáp
TV), Fiber optic (Cáp quang), Power-line internet (Đường cung cấp điện)
• Không dây: Wi-Fi, WiBro (Wireless Broadband - Hàn Quốc), WiMAX
(Worldwide Interoperability for Microwave Access), UMTS-TDD (),
HSDPA (High-Speed Downlink Packet Access – Một giao thức của mạng
điện thoại 3G, hỗ trợ đến 14.4Mbp, tương lai là 42 Mbps), EV-DO
(Evolution-Data Optimized – Một chuẩn thuộc mạng CDMA), Satellite
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 23 -


CHƯƠNG 3 - TÌM KIẾM VÀ KHAI THÁC THÔNG TIN TRÊN
INTERNET

Chương này tập trung giới thiệu một số kỹ thuật tìm kiếm và khai thác thông tin
trên Internet. Sau khi hoàn thành chương này, sinh viên sẽ có được một số kỹ năng tìm
kiếm và khai thác thông tin trên Internet sao cho hiệu quả nhất.

III.1 Kỹ thuật tìm kiếm thông tin trên Internet
Internet là một kho thông tin vô tận, được cung cấp từ hàng triệu Web Site trên
khắp thế giới. Do có quá nhiều thông tin nên việc tìm kiếm được đúng thông tin cần
thiết cũng không phải là chuyện dễ dàng.
Trong tất cả các lĩnh vực chúng ta thường xuyên phải tìm kiếm tài liệu sử dụng
trong công việc. Thông tin trên Internet là rất đa dạng, phức tạp nên tìm kiếm thông tin
trên internet là kỹ năng quan trọng trong tất cả các lĩnh vực.
Tuy nhiên với sự xuất hiện của các Web Site, các công cụ tìm kiếm đã giúp cho
người dùng Internet rất nhiều trong việc tìm kiếm thông tin.
III.1.1 Xác định thông tin và phạm vi cần tìm kiếm
Để tìm kiếm thông tin, trước tiên cần phải xác định từ khóa (Key Words) của
thông tin muốn tìm kiếm, đây là phần rất quan trọng, từ khóa là từ đại diện cho thông
tin cần tìm. Nếu từ khóa không rõ ràng và chính xác thì sẽ cho ra kết quả tìm kiếm rất
nhiều, rất khó phân biệt và chọn được thông tin như mong muốn, còn nếu từ khóa quá
dài kết quả tìm kiếm có thể không có.
Ví dụ:
Muốn tìm thông tin về cách sử dụng máy vi tính:
• Nếu nhập từ khóa vi tính thì kết quả sẽ có rất nhiều bao gồm cả thông tin mua
bán, lắp ráp, sửa chữa, máy vi tính
.
• Nếu nhập từ khóa cách sử dụng máy vi tính thì sẽ có rất ít hoặc không có kết
quả thông tin về từ khóa này.
• Trong trường hợp này dùng từ khóa sử dụng vi tính có thể sẽ cho kết quả tối
ưu hơn.
Thông thường chỉ cần nhập
từ khóa muốn tìm và nhấn Tìm kiếm (Search)
hoặc nhấn phím
Enter thì sẽ cho ra nhiều kết quả tìm kiếm bao gồm địa chỉ liên kết
đến trang Web có từ khóa và vài
dòng mô tả bên dưới, chỉ cần nhấn trái chuột vào địa

chỉ liên kết
sẽ mở được trang Web có thông tin muốn tìm.
III.1.2 Sử dụng các từ khóa và phép toán hỗ trợ tìm kiếm
Để mở rộng các chức năng tìm kiếm, cũng như tạo thêm nhiều tiện dụng cho
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 24 -

người dùng, các Search Engine cũng đã hỗ trợ thêm nhiều phép toán và từ khóa. Dĩ
nhiên mỗi Search Engine có thể sẽ hỗ trợ những phép toán và từ khóa khác nhau. Ở
đây chỉ nêu ra một số phép toán và từ khóa cơ bản được hỗ trợ bởi hầu hết các Search
Engine.
• Dùng phép + : Để tìm các trang có mặt tất cả các chữ của từ khóa mà không
theo thứ tự nào hết thì viết nối các chữ này với nhau bằng dấu
+. Thí dụ: Tìm trang
nói về cách thức viết
Linux scripts có thể dùng bộ từ khóa: +Linux +script +tutor
• Dùng phép - : Trong số các trang Web tìm được do quy định của từ khóa thì
Search Engine sẽ loại bỏ các trang mà nội dung của chúng có chứa chữ (hay cụm
từ) đứng ngay sau dấu trừ. Thí dụ: Khi tìm tin tức về các loại xe dùng kỹ thuật lai
mới chưa có bán trên thị trường nhưng không muốn các trang bán xe hay các trang
nói về hai kiểu xe
Prius (của Toyota) và kiểu xe Insight (của Honda) lọt vào danh
cách truy tìm thì có thể thử từ khóa:
+car +hibrid -sale -Prius -Insight
• Dùng dấu ngoặc kép " " : Khi muốn chỉ thị Search Engine nguyên văn của cụm
từ, có thể dùng dấu ngoặc kép. Thí dụ: Để tìm lại nguyên tác và nội dung bài thơ
có câu
nước non nặng một lời thề thì có thể thử dùng từ khoá với ngoặc kép:
"Nước non nặng một lời thề"

Từ khoá mặc định
Nhiều Search Engine còn hỗ trợ thêm các từ khoá mặc định. Khi dùng các từ
khoá mặc định như một thành phần của bộ từ khoá thì các trang Web được trả về sẽ
thoả mãn các đặc tính chuyên biệt hoá theo ý nghĩa mà các từ khoá mặc định này biểu
tượng. Các hỗ trợ này cho phép kiểm soát được các loại trang nào muốn truy tìm.
Các từ khoá mặc định kết thúc bằng dấu hai chấm
: và chữ (hay cụm từ trong
ngoặc kép) của bộ từ khoá nào đứng ngay sau dấu này sẽ bị chi phối bởi điều kiện của
từ khoá mặc định, còn các thành phần khác trong từ khoá sẽ không thay đổi ý nghĩa.
Các từ khoá mặc định giới hạn Search Engine trả về các trang nằm trong một tên
miền, hay một miền con. Tuỳ theo Search Engine mà các từ khoá mặc định được sử
dụng.
a. Altavista hỗ trợ chức năng này bằng từ khoá
host: Thí dụ:
host:mars.jpl.nasa.gov mars saturn chỉ tìm trong mars.jpl.nasa.gov tất cả các
trang có chứa chữ
mars và chữ saturn.
b. Excite, Google, Yahoo hỗ trợ chức năng này bằng từ khoá
site:, khi kết hợp với
các lệnh khác có thể tìm theo cách chuyên biệt. Thí dụ: "carbon nanotech"
-
site:
www.technologyreview.com cho phép tìm tất cả các trang nào có chứa cụm
từ
carbon nanotech ngoại trừ các trang xuất xứ từ
www.technologyreview.com
Trường Đại học Đà Lạt
Khoa Công nghệ Thông tin 2008
- 25 -


c. Tất cả Search Engine hỗ trợ các từ khoá domain, url, site: cho chức năng này.
Thí dụ: để tìm các trang về
deutch từ các trang trong nước Đức có thể dùng
deutch
domain:.de
Các từ khoá mặc định dùng để tìm trang có tựa đề chứa một từ (hay cụm từ) đặc
biệt:
d. AltaVista, AllTheWeb, Inktomi (MSN và HotBot) dùng từ khoá
title: Thí dụ:
title: Mars Landing sẽ giúp truy tìm các trang có đề tựa về Mars Landing.
e. Google và Teoma hỗ trợ các từ khoá intitle: và allintitle: (allintitle: sẽ ảnh
hưởng đến tất cả các chữ đứng sau dấu
:).
Các từ khoá dùng để tìm các địa chỉ Web nào có chứa từ (hay cụm từ) của bộ từ
khoá:
f. Google hỗ trợ từ khoá
inurl: và allinurl:
 Muốn tìm địa chỉ các trang Web có một chữ đặc biệt thì dùng inurl. Thí
dụ,
inurl:nasa sẽ giúp tìm tất cả các địa chỉ Web nào có chứa chữ nasa.
 Nếu cần truy tìm một điạ chỉ có nhiều hơn một chữ thì dùng allinurl:
Thí dụ,
allinurl:vietnam thetholucbat sẽ giúp tìm tất cả các trang nào mà
nội dung địa chỉ của nó chứa chữ
vietnam hay là chữ thetholucbat.
g. Inktomi, AOL, GoTo, HotBot cung cấp từ khoá
originurl: cho việc này.
h. Yahoo thì dùng từ khoá u:
i. Ex
cite dùng url: Các từ khoá mặc định giúp tìm các trang có cài đặt các liên

kết tới địa chỉ trang được ghi trong từ khoá:
j. Google, Yahoo sẽ cung cấp từ khoá
link: Tuy nhiên, Yahoo yêu cầu địa chỉ
trong từ khoá phải có đủ tiếp đầu ngữ http:// thì mới hoạt động hữu hiệu. Thí
dụ: bộ từ khoá
link:vi.wikipedia.org sẽ giúp truy ra tất cả các trang Web nào có
liên kết tới trang
vi.wikipedia.org.
k. MSN hỗ trợ chức năng này bằng từ khoá linkdomain:
Ngoài ra, để truy tìm các loại tệp có định dạng (format) đặc biệt thì có thể dùng
từ khoá
filetype:đuôi của tập tin
l. Google: sẽ hỗ trợ truy tìm các kiểu tập tin: PDF, Word (.doc), Excel (.xls),
PowerPoint (.ppt) và Rich Text Format (.rtf) cũng như PostScript (.ps), Text
(.txt), HTML (.htm hay .html), WordPerfect (.wpd) và các đuôi khác Thí dụ:
laser
filetype:pdf sẽ giúp tìm các trang là các tập tin dạng .pdf (.pdf là loại tập
tin đưọc dùng trong cá hồ sơ văn bản của phần mềm Adobe Arcobat).
m. Yahoo cho phép tìm HTML (htm hay html), PDF, Excel (.xls), PowerPoint
(.ppt), Word (.doc), RSS/XML (.xml) và tập tin văn bản dạng (.txt).

×