mở đầu
Sự phát triển nhanh chóng của Internet đã làm cho máy tính ngày càng trở
thành một công cụ không thể thiếu trong mọi lĩnh vực của đời sống. Việc áp
dụng máy tính để tự động hoỏ cỏc hoạt động của thư viện đã đưa ngành thông
tin thư viện lên đỉnh cao của quản lý thông tin.
Được sự hướng dẫn của TS Cao Kim Ánh em đã thực hiện đề tài “Thiết kế
WebSite thư viện sách của Trung Tâm Thông Tin Tư Liệu Dầu Khí”. Mục
đích của đề tài là cải tiến một số chức năng trên khía cạnh “thư viện sỏch” của
WebSite này. Luận văn được trình bày như sau:
-Chương I : Tổng quan về Internet và các dịch vụ của Internet
-Chương II : Dịch vụ World Wide Web
-Chương III : Phương pháp tạo dựng WebSite
-Chương IV : Công cụ Microsoft Visual Interdev trong việc phát
triển trang Web động
-Chương V : Thiết kế WebSite thư viện sách của Trung Tâm
Thông Tin Tư Liệu Dầu Khí
Qua đây, em xin chân thành cám ơn TS Cao Kim Ánh, người đã tận tình
chỉ bảo và định hướng cho em trong suốt quá trình làm luận văn. Em xin cám ơn
toàn thể thầy cô giáo trong khoa Công Nghệ Thông Tin Trường ĐHDL Phương
Đông và các cán bộ phòng máy tính thuộc Trung Tâm Thông Tin Tư Liệu Dầu
Khí đã tạo mọi điều kiện thuận để em hoàn thành luận văn này.
Hà Nội ngày 16 tháng 5 năm 2002
Sinh viên
Bùi Thị Tâm
1
Chương I
Tổng quan về internet
1.1.Internet là gì ?
Tháng 7 năm 1968 cơ quan quản lý dự án phát triển của bộ quốc phòng Mỹ
(ARPA) đã đề nghị liên kết các mạng mỏy tớnh để trong trường hợp có chiến
tranh, dù một vài địa điểm có bị phỏ, thỡ cỏc địa điểm còn lại vẫn có thể còn lại
liên hệ với nhau.Năm 1969 liên mạng đuợc hình thành, có tên gọi là ARPANET.
Giao thức cơ sở liên mạng là TCP/IP.
Thuật ngữ Internet xuất hiện vào khoảng năm 1974. Đến thời điểm này đã
có nhiều điểm kết nối vào ARPANET.Tuy nhiên, do tốc độ đường truyền còn
hạn chế, quan điểm liên mạng còn thuần túy mang tính tăng cường khả năng liên
mạng giữa các máy tính, chưa hướng tới người sử dụng, nên Internet vẫn chưa
được phổ tiến và thực sự phát triển.
Phải đến những năm 1990 khi mà máy tính xuất hiện ngày càng nhiều, ở bất
cứ đõu trờn thế giới cũng có khả năng kết nối Internet thuận tiện và tự do, các
dịch vụ thông tin trên Internet đã hình thành, mang lại lợi Ých cho một số lượng
người không hạn chế thì Internet mới thực sự phát triển.
Vậy, Internet là liên mạng máy tính có phạm vi toàn cầu, sử dụng giao thức
cơ sở TCP/IP, có khả năng cung cấp cho người sử dụng những dịch vụ thông tin
cơ bản sau:
- E-mail (Thư điện tử)
- News (Tin)
- FTP (Truyền tệp)
- Telnet (Kết nối từ xa)
2
1.2.Kết nối Internet
Ngày nay, hầu hết các quốc gia đều cú cỏc máy tính đặc biệt kết nối với
nhau trên phạm vi toàn cầu thông qua các đường cáp quang tốc độ cao hoặc qua
vệ tinh. Các máy tính này gọi là các cổng Internet. Các công ty quản lý các cổng
Internet được gọi là các nhà cung cấp truy cập Internet. Những máy tính kết nối
với các cổng Internet, có khả năng đáp ứng yêu cầu dịch vụ thông tin Internet
của các máy tính hoặc cỏc mỏy tớnh khác được gọi là máy chủ hoặc máy dịch
vụ Internet.
Người sử dụng kết nối với dịch vụ Internet bằng cách kết nối máy tính của
mình với máy chủ Internet qua đường điện thoại hoặc đường thuê bao. Thông
thường, người sử dụng đơn lẻ dùng đường điện thoại để kết nối Internet, doanh
nghiệp/tổ chức kết nối máy tính của mình thành mạng LAN, sau đó kết nối một
hoặc một vài máy tính của mạng Lan đó với Internet thông qua đường thuê bao.
1.3. Giao thức TCP/IP
(Transmission Control protocol/Internet Protocol)
Giao thức (protocol) là một tập hợp các quy tắc, mô tả bằng các thuật ngữ kỹ
thuật một việc cần phải làm như thế nào. Để các máy tính nối mạng có thể
“hiểu” được nhau, chúng phải tuân theo một tập hợp các giao thức nhất định.
Tập hợp các giao thức được chọn cho Internet có tên là TCP/IP, là tên của hai
giao thức quan trọng nhất : TCP (Transmission Control Protocol – giao thức
kiểm tra truyền tải) và IP (Internet Protocol – Giao thức Internet).
Như vậy, TCP/IP thực chất là một họ các giao thức cùng làm việc với nhau
để cung cấp phương tiện truyền thông liên mạng. TCP/IP là bộ giao thức chuẩn
mở, không có tổ chức nào độc quyền kiểm soát, nó được thiết lập bởi tổ chức
3
IETF (Internet Engineering Task Force) và được chấp nhận bởi cộng đồng mạng
trên thế giới
1.3.1. Giao thức TCP
Giao thức TCP được thực hiện ở líp vận chuyển dữ liệu và là một giao thức
hướng kết nối. TCP cho phép hai chương trình máy tính trao đổi thông tin trên
mạng hoặc một nhúm cỏc mạng khác nhau một cách tin cậy. Khi một máy tính
có yêu cầu thiết lập một cuộc hội thoại với hệ thống mạng khỏc trờn Internet, nó
sẽ mở ra một kết nối logic đến hệ thống đó. Kết nối TCP cung cấp giữa hai máy
tính cho phép dữ liệu di chuyển đồng thời cả hai chiều và điều khiển cỏc dũng
dữ liệu đến các giao thức ở mức cao hơn.
1.3.2. Giao thức liên mạng (IP)
Giao thức xác định dịch vụ mạng này gọi là giao thức liên mạng. Giao thức
này có thể xem như một giao thức phi kết nối, nó cung cấp 3 định nghĩa quan
trọng sau :
- IP sẽ xác định một đơn vị cơ sở cho việc truyền dữ liệu, nó sẽ xác định
khuôn dạng chính xác của tất cả các dữ liệu khi lưu thông trên mạng theo
mô hình TCP/IP.
- IP sẽ thực hiện chức năng định hướng để chọn ra mét con đường tối ưu
mà dữ liệu sẽ được gửi đi trên đó.
- IP có bao hàm một tập hợp các quy tắc để mô tả quá trình xử lý cỏc gúi
dữ liệu
1.4. Phương pháp địa chỉ hoỏ trờn Internet và dịch vụ tên miền
1.4.1. Phương pháp địa chỉ hoỏ trờn mạng
Trong mạng Internet mỗi máy tính phải có một tên và một địa chỉ riêng biệt.
Địa chỉ này được dùng để định doanh một cách duy nhất vị trí của các máy tính
4
chủ trên mạng Internet dựa trờn cơ cở giao thức IP. Nên địa chỉ này còn được
gọi là địa chỉ IP.
Mỗi địa chỉ IP có độ dài 32 bit được chia làm 4 vùng . Mỗi vùng 8 bits được
biểu diễn dưới dạng thập phân, bỏt phõn, thập lục phân hoặc nhị phõn.Cỏch viết
phổ biến nhất là dùng ký pháp thập phân có dấu chấm để tỏch cỏc vựng.
Vớ dô: 192.168.124.231
Mỗi địa chỉ IP bao gồm 2 phần là: địa chỉ mạng (netid) và địa chỉ của một
mỏy trờn mạng (hostid). Do cách tổ chức và độ lớn của các mạng con trong
mạng Internet có thể khác nhau nên địa chỉ IP được phân thành 5 líp: A, B, C,
D, E. Cỏc lớp này được mô tả như sau.
a. Líp A: Dành cho mạng cực lớn (mỗi mạng có thể lên đến trên 16 triệu
máy).
Bit đầu tiên của trường đầu là 0 thì 7 bớts còn lại là địa chỉ mạng và 24 bits
còn lại của 3 trường tiếp theo là địa chỉ của máy tính. Như vậy líp A cho phép
mó hoỏ 126 mạng (từ 1 đến 127)
b. Líp B : Cho phép định danh đến 16384 mạng mỗi mạng có thể có trên
65 nghỡn mỏy
Hai bits đầu là 10 trong byte đầu tiên thì địa chỉ mạng bắt đầu từ 128 đến
191
c. Líp C: Cho phép định danh tới 2 triệu mạng, với tối đa 254 máy cho
mỗi mạng. Líp này được dùng cho các mạng có Ýt máy.
5
Netid Hostid
0 8 16 24 31
Netid Hostid
0 8 16 24 31
Ba bits đầu tiên của líp này là 110 trong byte đầu tiên, thì địa chỉ mạng bắt
đầu từ 192 đến 223.
d. Líp D: Dùng để gửi IP datagram tới một nhúm cỏc mỏy trờn một
mạng
Bèn bits đầu của byte đầu tiên là 1110, như vậy trong byte đầu tiên thì địa
chỉ mạng bắt đầu từ 224 đến 239. Phần còn lại gồm 24 bits của trường tiếp theo
tạo ra một số xác nhận mạng đặc trưng cùng làm việc. Một địa chỉ IP loại này là
địa chỉ gửi đến cho 1 hoặc nhiều máy tính, trong khi cỏc lớp A, líp B, líp C thì
mỗi IP xác định địa chỉ cho một máy.
e. Líp E: Dùng để dự phòng cho tương lai
1.4.2. Dịch vụ tên miền (DNS - Domain Name Server)
Việc định doanh các phần tử của liên mạng bằng các con số như trong địa
chỉ IP rõ ràng không làm cho người sử dụng hài lòng bởi chỳng khú nhớ và dễ
nhầm lẫn. Vì thế người ta xây dựng hệ thống đặt tên cho các phần tử của
Internet, cho phép người sử dụng chỉ cần nhớ tên chứ không cần nhớ địa chỉ IP
nữa.
6
Netid Hostid
0 8 16 24 31
§Þa chØ Multicast
0 8 16 24 31
Reserved for future use
0 8 16 24 31
Tất nhiên việc định danh bằng tên cũng có những vấn đề của nó. Chẳng hạn,
tên phải duy nhất, có nghĩa là không để 2 máy tính trên mạng lại có cùng một
tên. Ngoài ra cần phải cú cỏch để chuyển đổi tương ứng giữa cỏc tờn và các địa
chỉ số. Đối với một liên mạng tầm cỡ toàn cầu với hàng chục triệu người dùng
như Internet đòi hỏi phải có một hệ thống đặt tên phân tán và trực tuyến thích
hợp. Hệ thống này được gọi là DNS. Đây là một phương pháp quản lý cỏc tờn
(name) bằng cách giao trách nhiệm phân cấp cho một nhúm tờn. Mỗi một hệ
thống được gọi là một miền (domain), các miền được tách nhau bởi dấu chấm.
Số lượng miền trong một tên thay đổi nhưng thường có nhiều nhất là 5 miền.
Domain name có dạng tổng quát là local-past@ domainname, trong đó local-
past thường là tên của người sử dụng hay một nhóm người sử dụng do người
quản trị mạng nội bộ quy định, còn domain name được gán bởi các trung tâm
thông tin mạng các cấp.
Domain cấp cao nhất là cấp quốc gia, mỗi quốc gia được gán một tên miền
riêng gồm 2 chữ cái
Vớ dô: us (Mỹ), vn (Việt Nam)
Domain tiếp theo thể hiện lĩnh vực hoạt động của tổ chức
Vớ dô: com (công ty), gov (cơ quan chính phủ)
Domain tiếp theo là tên viết tắt của các tổ chức
Vớ dô: fpt (Cụnt ty FPT), vaec (Viện năng lượng nguyên tử Việt
Nam)
1.5. Các dịch vụ của Internet
1.5.1 E-mail (Electronic mail - Thư điện tử)
Có thể xem thư điện tử là dịch vụ quan trọng và phổ biến nhất của Internet.
Giao thức sử dụng để gửi - nhận thư điện tử gồm có: SMTP (Simple Mail
Transfer Protocol) và POP (Post Office Protocol). Để có dịch vụ thư điện tử ta
cần đăng ký với máy chủ thư điện tử, để có hộp thư.
7
Hộp thư điện tử thực chất là một thư mục trờn máy chủ mà chỉ cần người
sử dụng có account và mật khẩu tương ứng mới có thể truy nhập được. Khi sử
dụng máy tính khách cần có phần mềm tương ứng để truy nhập thư điện tử.
Vớ dô : phần mềm Outlook Express, trên máy tính khách sẽ tự động phát
sinh thư mục thư điện tử được chia thành các mục nhỏ hơn : inbox để chứa thư
gửi đến, outbox để chứa thư sẽ được gửi đi, sent để chứa thư đã được gửi đi
1.5.2. News (Tin điện tử)
Trong thực tế cuộc sống, người ta sử dụng bảng tin để thể hiện ý kiến của
mình, đọc ý kiến của người khác, để thảo luận những vấn đề một nhóm người
cùng quan tâm. Mục đích sử dụng tin điện tử cũng tương tự như vậy. Sự hình
thành cỏc nhúm thảo luận trên Internet tạo thành một hệ thống được gọi là
Usenet. Hiện nay có hàng chục nghỡn nhúm thảo luận khác nhau trên Usenet.
Người ta có thể thảo luận mọi vấn đề thuộc mọi lĩnh vực khác nhau trên Internet
như những chuyện vui, nấu ăn, triết học, toán học, vật lý, tin học
“Bảng tin điện tử ” của một nhóm tin là một máy chủ Internet làm dịch vụ
tin (News Server), được gọi là Usenet Site (News Server trung tâm), nhưng
đồng thời nó cũng tự động gửi từ News Server này đến News Server khác. Nhờ
đó mà mọi thành viên trong nhóm có thể nhanh chóng tiếp cận bảng tin mới.
Sự hình thành nhóm tin bắt đầu từ những thông điệp đặc biệt, được gọi là
những thông điệp điều khiển (Control Message). Thông điệp này được tự động
gửi cho tất cả các News Admin. Những người quan tâm có thể bỏ phiếu bằng
cách gửi một thông điệp thích hợp đến một địa chỉ xác định. Một danh sách
những người tham gia bỏ phiếu sẽ được thiết lập. Kết quả được chọn nếu có 2/3
số người tham gia bỏ phiếu, hoặc có sự ủng hộ của quá bán cộng thêm 100
người. Thông thường thì những việc thảo luận về việc hình thành nhóm tin mới
được gửi đến nhóm news.announce.newsgroup và người quản trị nhóm tin này
có trách nhiệm tổng hợp ý kiến của người quan tâm.
8
Tờn nhóm tin được đặt theo phương pháp “phõn cấp”. Nhờ đó, người ta
có thể dễ dàng tìm ra cỏc nhúm tin có quan hệ với nhau.
9
Vớ dô:
Comp.ai : trí tuệ nhân tạo
Comp.ai.edu : ứng dụng trí tuệ nhân tạo trong giáo dục
1.5.3. FTP
Dịch vô FPT là một dịch vụ chuyển và nhận tệp trên Internet cho phép
người dùng truy cập tới một hệ thống để truyền hay nhận các tệp từ các FPT
Server trong hệ thống về mỏy mỡnh hay chuyển một tệp từ trạm này đến trạm
khác bất kể trạm đó ở đâu và dùng hệ điều hành gì, không phải thiết lập phiên
liên lạc ở xa mà chỉ cần chúng được nối với Internet và FPT. Chủ yếu theo mét
trong hai cách
- Lấy các File ASCII: Text File được truyền theo bộ mã NVT ASCII. Bên
truyền phải Convert File ra dạng mã và bên nhận phải Convert trở lại
- Lấy các File kiểu nhị phân: Dữ liệu được gửi thành một dũng cỏc bit liên
tục trên đường truyền.
Trờn cỏc mỏy phục vụ FPT Server cú cỏc dữ liệu bao gồm hệ thống tệp
và các phần mềm phục vụ cho cỏc mỏy yêu cầu (FPT Client) để đảm bảo tính an
toàn của hệ thống thông thường người dùng chỉ được quyền thâm nhập vào một
số thư mục nhất định nào đó, dịch vụ này có nhược điểm là việc truy xuất, tìm
kiếm thông tin trong Cơ sở dữ liệu khó khăn .
FPT là một chương trình phức tạp vì có nhiều cách khác nhau để sử dụng
tệp, cấu trúc tệp và nhiều cách lưu trữ khác nhau (Binary ASCII, nén hay không
nén) để khởi động FPT từ trạm làm việc người dùng gõ : FPT <Domain Name
Or IP Address> FPT sẽ thiết lập với các trạm xa và lúc đó người sử dụng phải
làm các thao tác quen thuộc và đăng nhập bảo vệ vào hệ thống.
1.5.4. Telnet
10
Để truy nhập được từ xa vào một máy tính nào đó, ta phải chạy chương
trình Telnet. Máy tính được sử dụng để khởi chạy Telnet được gọi là máy cục bộ
(local computer), máy tính kia được gọi là máy ở xa (remote computer). Thông
thường máy ở xa là máy chủ Internet.
Vớ dô : Kết nối vào máy chủ www.vaec.gov.vn bằng lệnh:
Telnet www.vaec.gov.vn
Ta có thể sử dụng trực tiếp địa chỉ IP của máy từ xa:
Telnet 192.168.5.80
Trong trường hợp máy chủ từ xa có nhiều dịch vụ thông tin, tương ứng với
các cổng (Port) khác nhau, ta cần khai báo cụ thể.
Vớ dô: Telnel cuchi.vaec.gov.vn 80
1.5.5.WWW
WWW (World Wide Web hay còn gọi là Web) là một dịch vụ thông tin mới
nhất và hấp dẫn nhất trên Internet. Web được mô tả là “hệ thống truy xuất thông
tin toàn cầu”, nhưng nói một cách chính thức thì WWW không phải là một hệ
thống cụ thể với tên gọi như thế, mà thực chất là một tập hợp các công cụ tiện
Ých và cỏc siờu giao diện giúp người sử dụng có thể tạo ra các siêu văn bản và
cung cấp cho người dùng khỏc trờn Internet. Công nghệ này có thể gọi là công
nghệ Web
Công nghệ Web một công nghệ cho phép truy cập và xử lý các trang dữ liệu
đa phương tiện (như văn bản , âm thanh, đồ hoạ, ảnh, phim ) trên Internet. Để
xây dựng các trang thông tin đa phương tiện như vậy, Web phải sử dụng ngôn
ngữ có tên là HTML (HyperText Markup Language). HTML cho phép người
đọc liên kết các kiểu dữ liệu khác nhau trên cùng một trang thông tin. WWW
truyền các tài liệu HTML thông qua giao thức HTTP.
11
Để thực hiện việc truy cập, liên kết các tài nguyên khác theo kỹ thuật siêu
văn bản, WWW sử dụng khái niệm URL (Uniform Resource Locator). Đõy
chớnh là một dạng tên để định danh duy nhất cho một tài liệu hoặc một dịch vụ
trong Web.
Hoạt động của Web dựa trờn mô hình Client/Server. Tại máy Client, người
sử dụng sẽ dùng Web browser để gửi yêu cầu tìm kiếm các tệp tin HTML đến
Web Server nhờ địa chỉ URL. Web Server nhận các yêu cầu đó và thực hiện rồi
gửi kết quả về cho Web Client. ở đây Web Brower sẽ biên dịch các thẻ HTML
và hiện thị nội dung các trang tài liệu được yêu cầu.
12
Chương 2
Dịch vô World Wide Web
2.1.Các khái niệm cơ bản
2.1.1. Trang Web (Web page)
Trang Web là một đơn vị thông tin, thường gọi là tài liệu, có thể hiện thị
thông qua Web, được tạo bởi ngôn ngữ đánh dấu siêu văn bản (HTML). Thông
tin được biểu diễn trên trang Web có thể dưới dạng văn bản, âm thanh, hình ảnh,
đoạn phim. Trang Web được lưu trữ dưới dạng file có phần mở rộng là htm hoặc
html. Trên một trang Web có thể chứa các điểm liên kết (hyperlink) tới các trang
Web khác, điều này giúp người dùng có thể truy cập được thông tin ở nhiều
trang Web khác.
2.1.2.Trang chủ (Homepage)
Trang chủ là một trang Web đặc biệt, là điểm vào của một WebSite. Nó tạo
ra Ên tượng đầu tiên cho người sử dụng khi vào một WebSite.Thụng thường nó
là trang giới thiệu về WebSite đó và chỉ ra cỏc liờn kết đến các trang thứ 2 có
trong WebSite này.
2.1.3.WebSite
Mét WebSite là một tập hợp các trang Web có liên hệ với nhau và các tập tin
khác được liên hệ với nhau. WebSite thông thường có mục đích riêng, hoặc liên
quan đến cá nhân hoặc liên quan đến công việc. Trên mỗi một WebSite có một
trang Web được gọi là trang chủ. Đây là trang Web mà người dùng sẽ nhìn thấy
đầu tiên khi họ truy cập đến một WebSite. Từ trang chủ, người dùng có thể nhấp
vào các liên kết để mở các trang Web khác trong cùng một WebSite hay các
13
trang Web của các WebSite khỏc. Cỏc liên kết có thể là các WebSite trên cùng
một máy tính hoặc cũng có thể nằm trên máy tính khác.
2.1.4.Phân loại trang Web
a. Web tĩnh
Các trang Web tĩnh chỉ đơn thuần là các trang Web có khuôn dạng
HTML chuẩn, không có tương tác với người sử dụng.
- Nhược điểm: Do thông tin là cố định cho nên không đáp ứng được nhu
cầu thông tin mang tính chất thời gian thực.
- Ưu điểm: Thông tin bên trong trang Web là cố định cho nên thời gian
Download nhanh hơn.
b. Web động
Các trang Web động là các trang Web hỗ trợ thêm khả năng tương tác với
người sử dụng. Với trang Web động, mọi số liệu đều mang tính chất thời gian
thực và được cập nhật thường xuyên do đó người sử dụng có thể xem kết quả
ngay tức thời tại một thời điểm hiện tại. Điều này Web tĩnh không thể đáp ứng
được.
2.1.5 Điểm siêu liên kết (HyperLink) :
Là những điểm ảnh, những bức tranh hay những chữ, dòng đặc biệt mà khi
được tương tác bằng cách kích chuột lờn thỡ từ HyperLink này có thể nhẩy tới
một điểm khác trong trang Web, mở ra mét trang Web mới hay truy nhập đến
một vài kiểu tài nguyên trên mạng.
2.1.5. Địa chỉ của Web
Điạ chỉ của Web được biết đến nhờ các URL (Uniform Resource Location -
Bé định vị tài nguyên thống nhất). Nếu các trang Web được ghi lồng vào sâu hết
14
mục này đến mục khỏc thỡ địa chỉ của Web sẽ hết sức dài. Một URL thường có
cấu trúc như sau:
Protocol://host.domain/directory/file.name
+ Protocol: Nghi thức TCP/IP sử dụng để tìm tài nguyờn(HTTP hay FTP)
+ Host.domain: Tên máy chủ nơi trang Web đó tồn tại
+ Directory: Tên thư mục ảo chứa trang Web. Thư mục ảo ở đây được
định nghĩa sẵn trên Web Server nã tham chiếu đến một thư mục vật lý nằm trên
máy chủ hoặc một máy mạng nào đó.
+ File.name: Tên của trang Web. Trang Web này thường mặc định là có
phần mở rộng là HTM, HTML nhưng cũng có thể có phần mở rộng như ASP,
CGI, DLL, EXE, PL
URL được sử dụng ở tất cả các dịch vụ thông tin trên mạng. Mỗi một
trang Web có một URL duy nhất để xác định trang Web đó. Qua phân tích cấu
trúc của một URL, thấy rằng thông qua URL có thể truy cập tới bất cứ một tài
nguyên thông tin dữ liệu của bất kỳ một dịch vụ thuộc bất kỳ một máy tính nào
trên mạng.
2.2. Hoạt động của World Wide Web
2.2.1. Mô hình kiến trúc Client/ Server
Client/ Server là kiến trúc phần mềm trong đó hai quá trình tác động qua lại
với tư cách là mỏy khỏch và máy chủ, qỳa trỡnh đưa ra yêu cầu và đáp ứng yêu
cầu.
Mô hình Client/ Server là phương cách theo đó ứng dụng được chia làm hai
phần:
- Phần xử lý mặt trước chạy tại máy trạm: đảm nhận giao diện với người sử
dụng.
15
- Phần xử lý mặt sau: đảm nhận quá trình xử lý cơ sở dữ liệu và quá trình tính
toán chính xác. Nó là một nền tảng linh hoạt dựa trờn cơ sở xử lý theo thông
điệp và có tính modul, nó được dùng để tăng hiệu suất sử dụng, khả năng linh
hoạt động, có tính mở.
Mô hình Client/Server dùa vào hướng của yêu cầu được khởi tạo để phân
biệt một ứng dụng là ứng dụng Client hay ứng dông Server. Ứng dụng thực
hiện khởi tạo việc liên lạc gọi là ứng dụng Client. Rất nhiều các ứng dụng
chương trình hiện nay là ứng dụng Client. Mỗi lần ứng dụng Client thực hiện, nó
liên lạc với một máy chủ(Server) để gửi các yêu cầu và đợi sự trả lời, ứng dụng
Client tiếp tục quá trình thực hiện. Các ứng dụng Client thường dễ xây dựng
hơn so với các ứng dụng Server, và thường khụng đũi hỏi những đặc quyền ưu
tiên (privileges) đặc biệt của hệ thống để có thể chạy được.
So với ứng dụng Client, các ứng dụng Server là các ứng dụng chờ đợi các
yêu cầu liên lạc, trao đổi từ phớa cỏc ứng dụng Client, thực hiện những công
việc cần thiết, sau đó trả lại các kết quả của công việc đó về cho ứng dụng
Client.
Việc xử lý đồng thời trên Server rất quan trọng, nó thể hiện thông qua tính
hiệu quả trong việc thực hiện các yêu cầu. Các thao tác trên Server đòi hỏi đến
các tính toán và liên lạc, trao đổi có tính chất lượng yếu. Ví dụ như dịch vụ đăng
ký (login) từ xa. Nờỳ như không xử lý đồng thời, tại mỗi thời điểm, chỉ có thể
thực hiện được duy nhất một dịch vụ login từ xa. Mỗi khi có một Client liên lạc
với Server, Server phải “ lê qua ” hoặc từ chối các yêu cầu tiếp theo, cho tới khi
ứng dụng Client đó kết thúc. Điều này hạn chế khả năng của Server, ngăn cản
việc những người sử dụng từ xa truy nhập tới một máy tính cùng một lúc.
Tóm lại quá trình xử lý Client/ Server gồm các bước:
- Mỏy khách yêu cầu dữ liệu.
- Yêu cầu được dịch sang một dạng mã và được gửi qua mạng tới máy chủ.
16
- Máy chủ cơ sở dữ liệu tiến hành tìm kiếm thông tin.
- Các kết quả theo yêu cầu được gửi trả lại cho mỏy khỏch.
- Dữ liệu được trình bày tới người sử dụng.
Web là một môi trường Client/ Server, trong đó Client là các trình duyệt
Web còn Server là các WebServer hoặc các Database Server, trong đó cơ sở dữ
liệu (CSDL) có thể phân tán trên nhiều Server hoặc tập trung tại một Server.
Client và Server là hai thực thể hoàn toàn chia tách, không phụ thuộc vào nhau
trừ khi Client cần những thông tin từ Server. Nhiệm vụ chính của Client là phục
vụ như một giao diện người dùng, cho phép khởi đầu tác vụ nhập, yêu cầu xử lý.
Về phía Server, nhận yêu cầu qua mạng, phân tích nó và thường phải tra cứu hay
cập nhật CSDL. Kết quả của thao tác trên CSDL được gửi ngược cho Client
khởi đầu qua mạng, Client sẽ trình bày thông tin đú trờn giao diện màn hình
máy tính hoặc là trên máy in và quá trình kết thúc.
2.2.2.Trình duyệt Web( browser )
Web Browser (trình duyệt Web) là phần mềm được sử dụng từ phía người
sử dụng nhiệm vụ của nó là khởi tạo các con trỏ địa chỉ URL để gửi tới các Web
Browser sẽ diễn dịch các nội dung dưới dạng ngôn ngữ HTML. Hai trình duyệt
Web phổ biến nhất hiện nay là Micorosoft Internet explorer và Netscape
Navigator.
Các trình duyệt Web đều hoạt động theo cùng một cách như sau:
Trình duyệt trờn mỏy của người dùng đọc văn bản được viết trên HTML và
hiển thị nó, dịch tất cả cỏc mó đánh dấu trong văn bản.
Khi bấm chuột vào hyperlink trình duyệt sẽ sử dụng HTTP ( Hypertext
Tranfer Protocol) để gửi một yêu cầu lờn mỏy Web Server, truy nhập vào văn
bản hay dịch vụ nào đó được chỉ ra trong hyperlink.
17
Web Brower
H×nh 2.2.1: M« h×nh kiÕn tróc Client/Server
M¹ng
truyÒn
th«ng
Data
Base
Web Server
Web Server sẽ dùng HTTP để trả lời với các văn bản hay dữ liệu được yêu
cầu. Trình duyệt trờn mỏy của người dùng lại đọc, dịch rồi hiển thị theo đúng
khuôn dạng.
2.2.3. Web Server
Web Server là một phần mềm đóng vai trò phục vụ. Khi khởi động, nó
được nạp vào bộ nhớ và đợi các yêu cầu từ nơi khác đến. Các yêu cầu có thể đến
từ một người đang dùng phần mềm Web Browser hoặc đến từ Web Server
khác. Trong cả hai trường hợp trên đối tượng đưa ra yêu cầu gọi là khách (Client
). Các yêu cầu đối với Web Server thường là đòi hỏi về một tư liệu hay thông tin
nào đó. Server được yêu cầu sẽ xử lý, tìm kiếm cỏc thụng tin phục vụ các yêu
cầu đó và gửi lại kết quả của các yêu cầu đó thông qua giao thức HTTP, Client
sẽ nhận và xử lý các kết quả này rồi hiện thị chúng cho người dùng.
2.3. Giao thức HTTP( Hyper text transfer protocol)
Trong môi trường Client/ Server truyền thống, truyền thông được thực hiện
qua giao thức mạng cho phép các Client luôn duy trì kết nối tới Server hay Ýt
nhất còng có khả năng thiết lập một kết nối ngay lập tức. Môi trường Web
không cung cấp những kết nối cố định tới các Server, mà thay vào đó là kết nối
qua giao thức HTTP.
HTTP là giao thức truyền thông mà Client sử dụng để liên lạc với Server.
Mọi giao thức truyền thông đều phải yêu cầu có một chương trình tương ứng
trên Server để “ nghe “ các yêu cầu trên mạng do các Client truyền đến.
Với giao thức HTTP, trỡnh khỏch có thể gửi và yêu cầu trình chủ (Web
Server) xử lý những lệnh sau:
- GET - Yờu cầu trỡnh chủ trả về nội dung một tài nguyên theo địa chỉ định
vị URL.
18
- POST - Chuyển dữ liệu từ trỡnh khỏch lờn trỡnh chủ. Trình chủ tiếp nhận
dữ liệu, tính toán và trả về kết quả cho trỡnh khỏch.
- HEAD - Yờu cầu trỡnh chủ trả về thông tin mô tả một tài nguyên (tập tin).
- PUT - Đưa một tài nguyên (tập tin) lờn trỡnh chủ.
- DELETE - Yờu cầu trỡnh chủ xoá một tài nguyên (tập tin) nào đó.
Cú mét sự khác biệt khá quan trọng giữa HTTP và các giao thức khác đó là
HTTP không duy trì sự kết nối cố định. Sau khi Server hoàn thành việc phục vụ
yêu cầu lấy thông tin của Client, nó chấm dứt kết nối với Client. Khi Web
Browser từ Client yêu cầu thông tin mới thì một kết nối mới sẽ được thiết lập.
19
2.4.Một sè giao diện chuẩn
Khác với ứng dụng chạy trên máy tính đơn lẻ khi mà việc xử lý được thực
hiện trên mỗi máy tính, ứng dụng Web tập chung xử lý trên Server gồm có một
hay nhiều Server vì Web Brower chỉ đưa ra giao diện người sử dụng, toàn bộ
ứng dụng được đặt trên Server.
Vậy phía Client chỉ còn mỗi User Interface. Đối với Web Server thay vì
User Interface ta có Web Interface. Đây là líp chương trình tương tác với Web
Server nhằm mục đích giao tiếp với Client, Web Interface đóng vai trò kết nối
giữa những đối tượng và trang HTML được gửi tới Web Brower của Client.
Web Interface cung cấp HTML cho Web Brower thông qua Web Server và
nhận những yêu cầu thông qua Web Brower và Web Server.
Có nhiều công nghệ được dùng để xây dựng Web Interface như CGI,
ISAPI,
2.4.1. CGI (Common Gateway Interface)
Khi nhận được lệnh GET hay POST từ trỡnh khỏch, trỡnh chủ có thể cho
thực thi một chương trình và chương trình này sẽ tự động sản sinh ra nội dung
của tập tin trả về cho trỡnh khách. Như vậy tập tin trả cho trỡnh khỏch sẽ không
tồn tại trên đĩa cứng của trình chủ, nó được tạo ra từ một chương trình. Chương
trình này thường được gọi là CGI.
CGI là chuẩn để kết nối chương trình ứng dụng với Web Server. Các yêu
cầu của người sử dụng được chuyển đến cho ứng dụng CGI, ứng dụng này sau
đó sẽ gửi trả kết quả được tạo ra theo yêu cầu ngược về trình duyệt Web của
người dùng để tạo ra những trang Web có khả năng tác động qua lại với các
trang Web khác cũng như tạo khả năng tương tác giữa Server và Client.
20
Vớ dô: Client có thể đệ trình một form cho Server và nhận lại những thông
tin theo yêu cầu hoặc có thể xử lý những thông tin phức tạp, thì Server sẽ không
trực tiếp xử lý những công việc này mà thay vào đó sẽ chuyển những công việc
này cho những chương trình khác xử lý. Những chương trình này gọi là chương
trình Gateway.
Một chương trình của trình chủ có thể sản sinh ra hàng ngàn trang Web
theo yêu cầu của trỡnh khỏch.
CGI thực ra chỉ là một chương trình .EXE (trên Windows) hoặc chương
trình thực thi (trên UNIX) bình thường. Có thể xây dựng chương trình CGI từ
nhiều ngôn ngữ C, C
++
, Pascal, Visual Basic
Ých lợi của chương trình CGI là tạo được những trang Web tuỳ biến. Bên
trong chương trình CGI có thể tính toán, kết nối truy vấn CSDL, lưu các thông
tin do trỡnh khỏch gửi đến, Nội dung dữ liệu do trình CGI trả về cho mỏy
khỏch do đó sẽ phong phú và đa dạng hơn.
Cơ chế làm việc của các chương trình CGI tá ra rất hiệu quả trong các ứng
dụng truy xuất Web trên Internet. CGI sau này được Java cải tiến thành công
nghệ Servlet.
Tuy nhiên bên cạnh những ưu điểm như: thực hiện đơn giản, cơ động, có
thể chạy đa môi trường dễ sửa lỗi thì CGI cũn cú một số nhược điểm như tiêu
tốn tài nguyên và giới hạn về tốc độ do mỗi lần trình CGI thực thi là mỗi lần
Web Server phải nạp và giải phóng khỏi bộ nhớ.
Để khắc phục những nhược điểm của CGI, các nhà phát triển dịch vụ
Web đã thiết lập một giao diện chuẩn mới có thể mở rộng khả năng của Web
Server đó là ISAPI (Internet Server Application Program Interface - Giao diện
lập trình ứng dụng Internet Server).
2.4.2. ISAPI
21
ISAPI có chức năng giống như CGI, ưu điểm của chương trình ISAPI là
chỉ phải nạp một lần vào bộ nhớ khi lần đầu tiên Web Server triệu gọi ứng dụng.
Do đó vấn đề tốc độ mà chương trình CGI gặp phải được giải quyết triệt để, và
rất hiệu quả, tốn Ýt tài nguyên của hệ thống.
Với ngôn ngữ kịch bản, Microsoft đề xuất phương án thiết kế trang Web
ASP (Active Server Page). ASP là các trang Web chứa mã lệnh viết bằng ngôn
ngữ Visual Basic kết hợp với các thẻ định dạng của ngôn ngữ HTML.
Tương tự như ISAPI có Servlet, Servlet là các chương trình Java chỉ cần
nạp một lần vào máy ảo. Servlet sẽ phục vụ mọi yêu cầu từ mỏy khỏch gửi đến
tương tự chức năng của một chương trình CGI hay ISAPI. Sun đưa ra một khái
niệm tương tự JSP là Java Server Page (JSP). Thay vì viết bằng ngôn ngữ Visual
Basic như ASP, các trang JSP viết bằng ngôn ngữ Java.
Tuy nhiên ứng dụng của ISAPI và CGI chạy rất khác nhau trên Windows
NT. ISAPI cung cấp một tập hợp những giao diện cho phép ta tạo ra những
ISAPI Extensions và ISAPI Filters.
a. ISAPI Extensions
Đây là một file liên kết động được nạp và gọi bởi một Web Server. Nã cung
cấp những chức năng tương tự như ứng dụng CGI. Tuy nhiên ISAPI Extensions
được tạo ra để chạy như những DLL chứ không phải như một file thực thi,
ISAPI Extensions chạy như một luồng trong cùng không gian của Processor
hoặc bộ nhớ của Web Server. Kết quả là đoạn mã chỉ được nạp vào một lần cho
dù có bao nhiêu Instance (tình huống) đang làm việc tại một thời điểm. Vì
ISAPI Extensions chạy như một luồng của Web Server nờn nú có thể truy xuất
dữ liệu trực tiếp tới không gian điạ chỉ của Web Server do đó thông tin được
chuyển đi từ Web Server tới ứng dụng và ngược lại một cách nhanh chóng và dễ
dàng.
22
b. ISAPI Filters
ISAPI Filters thực chất cũng là một DLL được nạp vào mỗi lần Web Server
khởi động và được gọi mỗi lần Web Server nhận được yêu cầu. Điều này cho
phép ta có thể tuỳ biến dòng dữ liệu đi vào hoặc đi ra Web Server. ISAPI Filters
có thể nhận mọi loại yêu cầu của Web Server, khả năng ghi nhận được những
yêu cầu về Web và xử lý những yêu cầu này trước hoặc sau khi Web Server truy
xuất chúng. Đây là điểm mạnh của ISAPI Filters.
ISAPI Filters được sử dụng để kiểm soát những yêu cầu của HTTP, là một
công cụ hữu hiệu để tuỳ biến về mặt chức năng cho Web Server .
23
Chương 3
Phương pháp tạo dựng WebSite
3.1. Cấu trúc của một WebSite
3.1.1. Cấu trúc một trang Web
Cấu trúc của một trang Web không tuân theo một chuẩn cố định nào cả mà
ta có thể định ra được nó. Nói chung các trang Web thường có cấu trúc như sau:
a. Phần Header của trang Web
Thường đặt các thông tin như tiêu đề của trang Web.
b. Phần mục đích của trang Web
Đặt thông tin về mục đích của trang này, phần này khá quan trọng vì khi một
người nào đó vào một trang Web thì đầu tiên người ta quan tâm đến mục đích
của trang Web họ đang xem.
c. Phần nội dung của trang Web
Đây là phần chính của một trang Web, phần này chứa thông tin mà ta muốn
trình bầy. Cách tổ chức phần nội dung này sao cho khoa học, dễ nhìn, là hết
sức quan trọng.
d. Phần Footer của trang Web
Đây là phần thông tin kết thúc của một trang Web. Thông thường phần này
chứa những thông tin về địa chỉ, số điện thoại, của đơn vị có trang Web.
3.1.2. Cấu trúc một WebSite
Để có một WebSite hoàn chỉnh không chỉ đơn thuần là công việc của người
làm tin học mà nó là kết hợp công việc của người lập trình, người trang trí,
người phân tích hệ thống, người quản trị cơ sở dữ liệu. Tuy nhiên tư tưởng thiết
kế ở đây nhằm đưa ra những nguyên tắc chung nhất, để trên cơ sở đó tạo ra được
một hệ thống hoàn chỉnh có tính khoa học.
WebSite có thể được cấu trúc theo cỏc cỏch sau:
24
- Cấu trúc nối tiếp: Đây là cách để hệ thống thông tin theo dãy, hiển thị thông
tin một cách tuần tự. Thông tin sẽ nối tiếp nhau như một bản tường thuật,
theo thời gian hoặc trong sự sắp xếp logic nó là ý tưởng cho sự bàn luận nối
tiếp, các chủ đề được phát triển từ tổng quát tới cụ thể.
- Cấu trúc không cấp bậc: Điều này có nghĩa là các trang Web có cấp bậc như
nhau và từ một trang Web bất kỳ nào đó ta cũng có thể nhẩy đến một trang
nào đó trong WebSite, phương pháp này làm việc khá tốt đối với các
WebSite nhá.
- Cấu trúc liên kết có thứ bậc trong và có một trang mục lục được nối với tất cả
các trang trong WebSite. Tạo một điểm tập trung thông tin cho toàn bộ
WebSite điều này giúp Ých rất nhiều trong việc tìm kiếm các trang.
a. Hệ thống phân cấp:
Mọi thông tin đều được sắp xếp theo mức quan trọng và được hệ thống theo
mức độ quan hệ giữa các thành phần trong chương trình. Hệ thống được phân
thành các cấp:
- Cấp 1: Trang chủ là trang chứa menu chương trình, trong trang
này có chứa các liên kết động và tĩnh đến các trang Web khác trong
WebSite.
- Cấp 2: Trong cấp này có chứa các trang Web tĩnh chứa thông tin
và hướng dẫn sử dụng ngoài ra cũn cú cỏc trang Web động được sinh ra khi
chạy chương trình.
- Cấp 3: Gồm các Form Cập nhật và Tra cứu dữ liệu.
- Cấp 4: Gồm các trang Web kết quả của chương trình và các
trang Web chứa thông báo.
b. Các quan hệ và chức năng:
Khi thiết kế một hệ thống cần xác định các thực thể và tìm hiểu các chức
năng liên quan để từ đó xác định các mối liên hệ giữa chúng.
25