Tải bản đầy đủ (.pdf) (72 trang)

Tìm hiểu phần mềm thư viện số và ứng dụng xây dựng thư viện số ở Thư viện Tạ Quang Bửu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (981.83 KB, 72 trang )

Header Page 1 of 126.

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC XÃ HỘI & NHÂN VĂN
KHOA THÔNG TIN – THƯ VIỆN
-----o0o-----

ĐỖ THỊ THANH HUYỀN
TÌM HIỂU PHẦN MỀM THƯ VIỆN SỐ VÀ ỨNG DỤNG
XÂY DỰNG THƯ VIỆN SỐ Ở THƯ VIỆN TẠ QUANG BỬU

KHÓA LUẬN TỐT NGHIỆP
NGÀNH: THÔNG TIN – THƯ VIỆN
Hệ đào tạo: Chính quy
Khóa: QH-2007-X
Giảng viên hướng dẫn: Th.S. Nguyễn Thị Thúy Hạnh
Hà Nội - 05/2011

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 1Bàn
of 126.

1


Header Page 2 of 126.

LỜI NÓI ĐẦU ................................................................................................4
1. Tính cấp thiết của đề tài.................................................................................... 5
2. Mục đích nghiên cứu ........................................................................................ 6
3. Đối tƣợng nghiên cứu ....................................................................................... 6


4. Phạm vi nghiên cứu .......................................................................................... 7

CHƯƠNG I. THƯ VIỆN SỐ VÀ NHỮNG VẤN ĐỀ VỀ THƯ VIỆN SỐ7
1.1 Thƣ viện và các mô hình thƣ viện .................................................................. 7
1.1.1 Khái niệm thƣ viện .................................................................................. 7
1.1.2 Chức năng của thƣ viện ........................................................................... 8
1.1.3 Các mô hình thƣ viện ngày nay. .............................................................. 9
1.2 Công nghệ thƣ viện số và các vấn đề liên quan ........................................... 12
1.2.1 Đặc điểm của thƣ viện số ....................................................................... 12
1.2.2 Lợi ích của thƣ viện số .......................................................................... 13
1.2.3 Kiến trúc và Kiến trúc thông tin của thƣ viện số. .................................. 14
1.2.4 Nền tảng thƣ viện số .............................................................................. 18
1.2.5 Các dịch vụ Thƣ viện số. ....................................................................... 27
1.2.6 Web Services ......................................................................................... 29
1.2.7 Bài toán tích hợp thƣ viện số. ............................................................... 30

CHƯƠNG II: PHẦN MỀM THƯ VIỆN SỐ ............................................32
2.1 Các yêu cầu về quản lý thƣ viện số .............................................................. 32
2.1.1 Yêu cầu chung ....................................................................................... 32
2.1.2 Yêu cầu về công nghệ nền tảng ............................................................ 33
2.1.3 Yêu cầu về chuẩn thƣ viện ..................................................................... 35
2.1.4 Yêu cầu về chuẩn nghiệp vụ thƣ viện .................................................... 35
2.2 Các phần mềm thƣ viện số ........................................................................... 39
2.2.1 Giới thiệu chung .................................................................................... 39
2.2.2 Phần mềm Greenstone .......................................................................... 40
2.2.3 Phần mềm Dspace.................................................................................. 41
2.2.4 Phần mềm Feroda .................................................................................. 43
Thị Năm K52 Thông tin – Thƣ viện
Footer Page 2Bàn
of 126.


2


Header Page 3 of 126.

2.2.5. So sánh các phần mềm và phản hồi của ngƣời dùng ............................ 44
2.3 Đặc điểm của Dspace ................................................................................... 47
2.3.1 Mô hình đối tƣợng trong Dspace ........................................................... 47
2.3.2 Kiến trúc của Dspace ............................................................................. 48
2.3.3 Tiến trình của Dspace ............................................................................ 48
2.3.4 Dspace Workflow .................................................................................. 49
2.3.5 Quản lí ngƣời dùng trong DSpace ......................................................... 51
2.3.6 Quản lí tài liệu trong DSpace................................................................ 52
2.3.7 Manakin cho Dspace.............................................................................. 52

CHƯƠNG III: ỨNG DỤNG XÂY DỰNG THƯ VIỆN SỐ Ở THƯ VIỆN
ĐẠI HỌC BÁCH KHOA HÀ NỘI ............................................................55
3.1 Vài nét về thƣ viện Tạ Quang Bửu ............................................................... 55
3.1.1 Lịch sử hình thành và phát triển ............................................................ 55

3.1.2. Chức năng, nhiêm
̣ vu ̣ của Thư viêṇ Ta ̣ Quang Bửu.......................57
3.1.3 Khảo sát trực trạng thƣ viện Tạ Quang Bửu .......................................... 60
3.2 Mục tiêu xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu ........................... 62
3.3 Tiến hành xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu ........................ 63

KẾT LUẬN...................................................................................................65
DANH MỤC HÌNH VẼ ...............................................................................66
DANH MỤC TÀI LIỆU THAM KHẢO ...................................................71


Thị Năm K52 Thông tin – Thƣ viện
Footer Page 3Bàn
of 126.

3


Header Page 4 of 126.

LỜI NÓI ĐẦU
Thƣ viện là kho tri thức của xã hội; có ngƣời còn cho rằng thƣ viện là đền
đài của văn hoá và sự uyên thâm. Đƣợc hình thành trong thời kỳ nông nghiệp
thống trị trong tƣ duy của nhân loại, thƣ viện đã trải nghiệm qua một cuộc hồi
sinh với việc phát minh ngành in trong thời kỳ Phục hƣng, và thực sự bắt đầu
khởi sắc khi cuộc cách mạng công nghiệp bùng phát với hàng loạt những phát
minh cơ giới hoá quy trình in ấn.
Lịch sử thƣ viện đã trãi qua hơn 25 thế kỷ. Hình ảnh thƣ viện của thời xa
xƣa đƣợc hình dung nhƣ là một cơ sở vững chắc trong đó chứa hàng ngàn phiến

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 4Bàn
of 126.

4


Header Page 5 of 126.

đá khổng lồ đƣợc khắc chữ - thƣờng đƣợc gọi là "rừng bia". Qua nhiều năm cùng

với sự tiến hoá của nhân loại, con ngƣời càng tiến bộ trong nhận thức và thƣ viện
ngày càng đƣợc phát triển. Giai đoạn Quản lý tƣ liệu đã trải qua một thời gian
dài theo sự phát triển đó. Cho đến một lúc, cũng xuất phát từ ý định ban đầu là
làm tốt công việc lƣu trữ và bảo quản, thƣ viện đã chú trọng đến việc xem ngƣời
sử dụng là trung tâm, với sự nhấn mạnh đến việc trao đổi thông tin. Điều này
cũng đồng thời để đáp ứng yêu cầu thông tin ngày càng gia tăng. Giai đoạn Quản
lý thông tin đƣợc xem nhƣ bắt đầu. Và chúng ta sẽ nhận thức đƣợc rằng để xây
dựng thƣ viện số là ta đã bắt đầu bƣớc qua một giai đoạn phát triển mới của thƣ
viện: Giai đoạn Quản lý tri thức.
Cùng với sự phát triển của mạng lƣới truyền thông và công nghệ thông tin
(CNTT), hiện nay trên thế giới nhiều thƣ viện số (TVS) đã ra đời và ngày càng
phát triển mạnh mẽ. Sự ra đời của TVS là một tất yếu của cuộc cách mạng khoa
học kỹ thuật trong giai đoạn bùng nổ thông tin hiện nay.
1. Tính cấp thiết của đề tài
Thƣ viện số đã hình thành và phát triển hơn mƣời năm nay trên thế giới.
Đó là một hình thức phục vụ tài liệu điện tử và liên thông trên phạm vi toàn cầu
mang đến hiệu quả cao nhất trong việc đáp ứng nhu cầu thông tin cho ngƣời sử
dụng khắp nơi trên thế giới. Tại hội nghị quốc tế lần thứ năm về Thƣ viện số
Châu Á (ICADL 2002) tại Singapore từ 11-14/12/2002 cho thấy rằng thƣ viện số
Châu Á đã đạt đến một mức độ phát triển cao trong đó có nhiều nƣớc trong khu
vực Đông Nam Á.
Hiện nay các thƣ viện trên thế giới và trong khu vực đã đạt đến một mức
độ hiện đại cao về hạ tầng cơ sở và công nghệ để phát triển và khai thác thƣ viện
số. Giá trị thƣ viện ngày nay là chỗ thƣ viện sử dụng công nghệ nhƣ thế nào để

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 5Bàn
of 126.

5



Header Page 6 of 126.

đáp ứng mọi nhu cầu của độc giả từ mọi nguồn thông tin khắp nơi trên thế giới
thông qua thƣ viện số.
Thƣ viện Việt Nam có đủ khả năng về hiện đại hóa hạ tầng cơ sở nhƣng
hiện nay do thiếu trình độ quản lý, thiếu nhận thức và thông tin về hiện đại hóa,
lúng túng và không biết sử dụng công nghệ nên khắp nơi đang lãng phí thời gian
và ngân sách từ nhiều nguồn kể cả nguồn vay nƣớc ngoài trong hoạt động thƣ
viện một cách nghiêm trọng. Trong khi hoàn toàn có thể đi tắt đón đầu, sử dụng
công nghệ mới để hội nhập với hệ thống thƣ viện trên thế giới. Trong đó việc
ứng dụng phần mềm các phần mềm thƣ viện số để xây dựng thƣ viện số ở các
thƣ viện nƣớc ta hiện nay là một điển hình. Xây dựng thành công thƣ viện số
mang ý nghĩa đặc biệt nhƣ một bƣớc ngoặt trên con đƣờng hiện đại hóa ngành
thông tin thƣ viện – con đƣờng của sự phối hợp giữa công nghệ thông tin và thƣ
viện. Từ đấy, mọi nghiên cứu khoa học thông tin thƣ viện chính là nghiên cứu
công nghệ thông tin.
Xuất phát từ thực tế trên, em đã đi đến lựa chọn tìm hiểu và nghiên cứu đề
tài: “Tìm hiểu phần mềm thƣ viện số và ứng dụng xây dựng thƣ viện số ở Thƣ
viện Tạ Quang Bửu”, nhằm lựa chọn những phần mềm thƣ viện số ƣu việt, và
hình mẫu ứng dụng xây dựng thƣ viện số ở thƣ viện Tạ Quang Bửu – một trong
những thƣ viện Đại học đi đầu trong ứng dụng CNTT, để từ có đó đƣợc những
định hƣớng tốt nhất trong việc xây dựng thƣ viện số ở nƣớc ta.
2. Mục đích nghiên cứu
Mục đích nghiên cứu của khóa luận là nhằm nghiên cứu các phần mềm
thƣ viện số đang đƣợc sử dụng rộng rãi hiện nay, có nhiều ƣu điểm và phù hợp
với đặc điểm của các thƣ viện nƣớc ta. Bên cạnh đó, khóa luận đi vào tìm hiểu
việc ứng dụng xậy dựng thƣ viện số ở Thƣ viện Tạ Quang Bửu để có đƣợc cái
nhìn khái quát hơn trong việc việc định hƣớng xây dựng thƣ viện số ở nƣớc ta.

3. Đối tượng nghiên cứu

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 6Bàn
of 126.

6


Header Page 7 of 126.

Nghiên cứu các phần mềm thƣ viện số và việc ứng dụng xây dựng thƣ
viện số ở thƣ viện Tạ Quang Bửu.
4. Phạm vi nghiên cứu
Nghiên cứu các phần mềm thƣ viện số đang đƣợc ứng dụng rộng rãi và
xây dựng thƣ viện số tại Thƣ viện Tạ Quang Bửu trong thời gian hiện nay.

CHƢƠNG I. THƢ VIỆN SỐ VÀ NHỮNG VẤN ĐỀ VỀ THƢ VIỆN SỐ
1.1 Thư viện và các mô hình thư viện
1.1.1 Khái niệm thư viện
Thuật ngữ “thƣ viện” xuất phát từ chũ Hy Lạp bibliotheca. “Biblio” nghĩa
là sách, “theca” là nơi bảo quản. Hiểu theo nghĩa đen, thƣ viện là nơi bảo quản
sách, nơi tàng trữ sách báo. Ngày nay, thƣ viện đƣợc định nghĩa nhƣ sau:
“TV là cơ quan TT, văn hoá giáo dục có VTL nhân bản đƣợc tổ chức và
đƣa ra cho các pháp nhân, cá nhân ngƣời sử dụng có thời hạn” (Liên Bang Nga)
“TV- một sƣu tập những TL đã đƣợc tổ chức để đáp ứng nhu cầu của một
nhóm ngƣời mà TV có bổn phận phục vụ, để cho họ có thể sử dụng cơ sở của
TV, truy dụng thƣ tịch cũng nhƣ trau dồi kiến thức của họ”. (Các nhà Thƣ viện
học Mỹ)
“TV là một bộ sƣu tập sách nhằm mục đích để đọc, để nghiên cứu hoặc tra

cứu” (Bách khoa toàn thƣ Anh)
“TV không phục thuộc vào tên gọi, là bất cứ bộ sƣu tập có tổ chức nào của
sách, ấn phẩm định kỳ hoặc các TL khác nhau, kể cả đồ họa, nghe nhìn và nhân

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 7Bàn
of 126.

7


Header Page 8 of 126.

viên phục vụ có trách nhiệm tổ chức cho bạn đọc sử dụng các TL đó nhằm mục
đích TT, NCKH, GD hoặc giải trí” (Tuyên ngôn 1994 của UNESCO về thƣ viện
công cộng)
Nhƣ vậy trên thế giới tồn tại rất nhiều quan điểm khác nhau về thƣ viện.
Tuy nhiên trong các định nghĩa trên, định nghĩa của UNESCO đƣợc các nhà thƣ
viện học trên thế giới đánh giá là định nghĩa đầy đủ nhất về thƣ viện vì định
nghĩa này nêu lên đƣợc những thành phần cấu tạo nên thƣ viện và các chức năng
nhiệm vụ chủ yếu của nó.
Thƣ viện đƣợc cấu thành từ 4 yếu tố: vốn tài liệu, cán bộ thƣ viện, ngƣời
sử dụng, cơ sở vật chất kỹ thuật. Các yếu tố này có mối quan hệ qua lại, tác động
chặt chẽ với nhau.
1.1.2 Chức năng của thư viện
Thƣ viện có vai trò quan trọng trong công tác phục vụ nhu cầu đọc, tìm
hiểu thông tin, nâng cao tri thức cho con ngƣời. Thƣ viện có một số chức năng
chính nhƣ sau:
Chức năng văn hóa:
Thƣ viện thu thập, tàng trữ, bảo quản và truyền bá di sản văn hóa của nhân

loại cũng nhƣ của đất nƣớc đƣợc lƣu giữ trong các tài liệu. Thƣ viện là trung tâm
sinh hoạt văn hóa, trung tâm mở mang dân trí, tuyên truyền, phổ biến kiến thức
về các loại hình nghệ thuật và lôi cuốn quảng đại quần chúng tham gia và hoạt
động sáng tạo.
Chức năng giáo dục:
Ngay từ thời cổ đại, thƣ viện đã là một tổ chức giáo dục quan trọng. Chức
năng giáo dục của thƣ viện đƣợc các thƣ viện công cộng thực hiện từ thế kỷ
XVI, thể hiện ở các điểm chính sau:
- Tham gia vào việc xóa mù chữ cho nhân dân

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 8Bàn
of 126.

8


Header Page 9 of 126.

- Nâng cao trình độ dân trí, chuyên môn cho các tầng lớp dân cƣ trong
vùng.
Cho đến nay, các thƣ viện hiện đại vẫn thực hiện chức năng giáo dục của
mình.
Chức năng thông tin:
Thƣ viện với tƣ cách là cơ quan cung cấp thông tin thực hiện chức năng
thông tin bằng cách:
- Phục vụ thông tin – thƣ mục theo phƣơng thức cổ truyền cũng nhƣ hiện đại
ngay tại thƣ viện: hệ thống mục lục, thƣ mục, cơ sở dữ liệu, phổ biến thông tin
chọn lọc, bản tin điện tử…
- Tiếp cận qua mạng để với tới nguồn lực của các thƣ viện khác và đảm bảo sự

tiếp cận đó tới các nguồn thông tin điện tử cho bạn đọc không có điều kiện nhận
đƣợc ngay từ nhà hoặc nơi làm việc của họ.
Chức năng giải trí:
Ngoài các kiến thức chuyên ngành, thƣ viện còn tham gia vào việc tổ chức
sử dụng thời gian nhàn rỗi cho nhân dân bằng cách cung cấp sách báo và các
phƣơng tiện nghe – nhìn khác để đáp ứng nhu cầu giải trí, góp phần giảm bớt
mệt nhọc trong quá trình học tập và làm việc.
1.1.3 Các mô hình thư viện ngày nay.
Cùng với sự phát triển của CNTT và khoa học công nghệ, thƣ viện không
đơn thuần là nơi lƣu giữ sách, báo, tạp chí, nơi yêu tĩnh cho độc giả đến nghiên
cứu, học tập mà thƣ viện còn trở thành một trung tâm thông tin đƣợc ứng dụng
công nghệ cao. Từ đó, nhiều mô hình thƣ viện hiện đại cũng ra đời.
Theo Barker (1997), có 4 dạng thƣ viện khả dĩ:
- Thƣ viện đa phƣơng tiện;
- Thƣ viện điện tử;
- Thƣ viện số;

Thị Năm K52 Thông tin – Thƣ viện
Footer Page 9Bàn
of 126.

9


Header Page 10 of 126.

- Thƣ viện ảo
1.1.3.1 Thư viện đa phương tiện.
Là thƣ viện sử dụng hỗn hợp sách báo và nhiều phƣơng tiện lƣu trữ thông
tin và tri thức khác nhau nhƣ băng đĩa video, vi phim, CD - ROM, phần mềm máy

tính, vv. Quy trình và quá trình tổ chức và quản lí TVĐPT giống nhƣ thƣ viện
truyền thống: việc tìm tài liệu cũng bằng tay, sử dụng bộ máy tra cứu bằng phiếu
hoặc vi phim, vi phiếu... Cán bộ thƣ viện vẫn đóng vai trò quan trọng trong
TVĐPT, mặc dù sử dụng máy tính nhƣng chƣa thể tự động hoá hoàn toàn các thao
tác. Tại Việt Nam, một số cơ quan thông tin tƣ liệu và thƣ viện lớn đã và đang tổ
chức một số phòng đọc đa phƣơng tiện phục vụ ngƣời sử dụng.
1.1.3.2 Thư viện điện tử
Là thƣ viện mà các quá trình cơ bản về nghiệp vụ dựa trên cơ sở máy tính
và các phƣơng tiện hỗ trợ khác. Dấu hiệu đặc trƣng của TVĐT là sử dụng phổ
biến các phƣơng tiện điện tử trong lƣu giữ, tìm kiếm và cung cấp thông tin. Tuy
nhiên, trong TVĐT, sách truyền thống vẫn tiếp tục tồn tại cùng với các ấn phẩm
điện tử nên vẫn cần sự trợ giúp của cán bộ thƣ viện trong mọi hoạt động chuyên
môn.
 Đặc điểm của thƣ viện điện tử:
- Thƣ viện phải có vốn tài liệu điện tử (là những tƣ liệu đƣợc lƣu giữ dƣới dạng
số sao cho có thể truy nhập đƣợc bằng các thiết bị xử lý dữ liệu)
- Phải đƣợc tin học hóa, phải có một hệ quản trị thƣ viện điện tử tích hợp, phải
nối mạng.
- Phải cung cấp và tạo điều kiện cho ngƣời sử dụng các dịch vụ điện tử (timg tin
trong các cơ sở dữ liệu, yêu cầu và gia hạn mƣợn qua mạng..)
Tóm tại, TVĐT phải sử dụng các phƣơng tiện điện tử trong việc thu thập, xử lý,
tìm kiếm và phổ biến thông tin.
Bàn
Footer Page 10
ofThị
126.Năm K52 Thông tin – Thƣ viện

10



Header Page 11 of 126.

1.1.3.3 Thư viện số
Nhiều định nghĩa đã đƣợc công bố trong giới học giả toàn cầu về thƣ viện
nhằm định nghĩa rõ ràng một thƣ viện số. Dƣới đây là một số định nghĩa tiêu
biểu về thƣ viện số:
Một số thành viên Hiệp hội Thƣ Viện Số Hoa kỳ (Digital Library
Federation) đã đƣa ra một định nghĩa, “Thƣ viện số là các tổ chức cung cấp tài
nguyên, gồm các nhân viên chuyên biệt giúp lựa chọn, tổ chức, cung cấp khả
năng truy cập thông minh, chỉ dẫn, phân phối, bảo quản tính toàn vẹn và sự
thống nhất của các bộ sƣu tập số theo thời gian để đảm bảo làm sao chúng luôn
sẵn có để truy xuất một cách dễ dàng và kinh tế nhất đối với một cộng đồng
ngƣời dùng hoặc một nhóm cộng đồng ngƣời dùng” (Raitt, 1999).
Hai học giả ngƣời Nga là Sokolova và Liyabev cho rằng thƣ viện số là
một hệ thống phân tán có khả năng lƣu trữ và tận dụng hiệu quả các loại tài liệu
điện tử khác nhau, mà giúp ngƣời dùng có thể truy cập và đƣợc chuyển giao
thông tin dễ dàng qua mạng máy tính (Xiao, 2003).
Nhiều học giả Trung Quốc lại có cùng quan điểm rằng “Một thƣ viện số
trên thực tế không phải là một thƣ viện ở góc độ mở rộng không gian của nó;
thay vào đó nó là trung tâm tài nguyên thông tin số chứa đựng tài nguyên thông
tin đa phƣơng tiện. Một thƣ viện số tồn tại bằng việc số hóa thông tin, chẳng hạn
nhƣ văn bản, ký tự, chữ viết, hình ảnh, video và âm thanh, đồng thời cung cấp
cho ngƣời dùng các dịch vụ thông tin nhanh chóng và thuận tiện thông qua
Internet, nhằm chuyển giao một hệ thống thông tin số mà trong đó việc chia sẻ
nguồn tài nguyên luôn sẵn sàng” (Wang, 2003).

Bàn
Footer Page 11
ofThị
126.Năm K52 Thông tin – Thƣ viện


11


Header Page 12 of 126.

Nhƣ vậy thƣ viện số đƣợc hiểu là: “một thƣ viện điện tử cao cấp, trong đó
toàn bộ các tài liệu của thƣ viện đó đƣợc số hoá và đƣợc quản lý bằng một phần
mềm chuyên nghiệp có tổ chức để ngƣời dùng tin dễ dàng truy cập, tìm kiếm và
xem đƣợc nội dung toàn văn của chúng từ xa thông qua hệ thống mạng thông tin
và các phƣơng tiện truyền thông”
1.1.3.4 Thư viện ảo
Một loại thƣ viện số khác cung cấp một cổng thông tin nhằm vào thông tin
điện tử ở nơi khác ngoài thƣ viện. Loại này đôi khi đƣợc gọi là thƣ viện ảo để
nhấn mạnh rằng đây là thƣ viện mà bản thân không chứa nội dung. Những quản
thủ thƣ viện đã dùng thuật ngữ này cách đây hơn mƣời năm để chỉ một loại thƣ
viện chuyên cung cấp việc truy cập thông tin điện tử thông qua những chỉ điểm –
pointers.
Thƣ viện ảo đƣợc xác định theo kho tin của nó. Thƣ viện không có kho
riêng, mà phụ thuộc vào kho của các thƣ viện khác. Thƣ viện ảo còn gọi là thƣ
viện không tƣờng.
Thƣ viện ảo cũng đƣợc định nghĩa theo dịch vụ của nó. Thƣ viện ảo không
phải quản trị kho tin, mà tiến hành lựa chọn, thu thập, tổ chức thông tin cho yêu
cầu của ngƣời dùng riêng biệt. Thƣ viện là một trung tâm tra cứu tới các tài liệu
hƣớng dẫn, bảng tra, tài liệu tóm tắt và các công cụ khác để nâng cao việc truy
cập các nguồn tin.
1.2 Công nghệ thư viện số và các vấn đề liên quan
1.2.1 Đặc điểm của thư viện số
Mặc dù có sự khác nhau về lý giải trong nhiều định nghĩa về thƣ viện số,
nhƣng những đĩnh nghĩa này lại tƣơng tự nhau về mặt bản chất cốt yếu. Vì vậy,

từ những định nghĩa trên chúng ta có thể rút ra những đặc điểm khác biệt của thƣ
viện số bao gồm:
Bàn
Footer Page 12
ofThị
126.Năm K52 Thông tin – Thƣ viện

12


Header Page 13 of 126.

- Khả năng lƣu trữ khối lƣợng lớn tài nguyên thông tin khác nhau;
- Khả năng lƣu trữ và chuyển giao tài nguyên thông tin bằng nhiều phƣơng
tiện khác nhau;
- Khả năng chuyển giao tài nguyên thông tin qua mạng;
- Khả năng quản lý tài nguyên thông tin phân tán;
- Khả năng chia sẻ thông tin ở cấp độ chuyên biệt cao;
- Có công nghệ tìm kiếm và truy xuất thông minh;
- Cung cấp dịch vụ thông tin không giới hạn thời gian và không gian.
1.2.2 Lợi ích của thư viện số
- Mang lại thông tin cho NDT: TVS có thể sử dụng ở khắp mọi nơi, NDT có thể
truy cập và tìm kiếm thông tin mọi lúc, mọi nơi theo cơ chế quản trị quyền truy
cập.
- Tăng cƣờng khả năng tìm kiếm thông tin: Thông qua các tiện ích phức tạp và
đa dạng, đặc biệt là các dịch vụ tìm kiếm CSDL và các trang Web, máy tìm…
- Tăng cƣờng việc chia sẻ thông tin: Các tổ chức, công ty, trƣờng đại học, viện
nghiên cứu..đã và đang sử dụng và chia sẻ các nguồn tài nguyên thông tin trên
Internet và TVS.
- Giúp NDT truy cập thông tin kịp thời: Khoảng cách giữa việc sáng tạo thông

tin và truy cập tới thông tin này là rất lớn trong thƣ viện truyền thống. TVS giảm
thiểu tối đa khoảng cách này bằng cách xuất bản số và nhanh chóng tích hợp bổ
sung thông tin vào các bộ sƣu tập và dịch vụ của TVS. Thông qua các tiện ích
tìm kiếm cũng giúp NDT cập nhật thông tin nhanh chóng với khoảng thời gian
nhanh nhất.

Bàn
Footer Page 13
ofThị
126.Năm K52 Thông tin – Thƣ viện

13


Header Page 14 of 126.

- Giúp tăng cƣờng việc sử dụng thông tin: TVS phá vỡ hàng rào thời gian, không
gian, ngôn ngữ và văn hóa. Thông tin đƣợc tạo ra từ nhiều nơi trên thế giới,
nhiều nền văn hóa và các ngôn ngữ khác nhau đều có thể đƣợc NDT truy cập dễ
dàng. Thông tin đƣợc đóng gói, chế biến để phục vụ mọi đối tƣợng.
- Tăng cƣờng khả năng cộng tác: Chu trình giao lƣu, sử dụng và truyền bá thông
tin của các học giả và nhà nghiên cứu đƣợc tăng cƣờng.
- Giảm khoảng cách số: Ngày nay, CNTT và truyền thông, đặc biệt là Internet đã
làm giảm khoảng cách giữa mọi ngƣời trên thế giới nhƣng giữa các quốc gia vẫn
còn :khoảng cách số”, đó là khoảng cách về hạ tầng công nghệ, các tiện ích và
các tài nguyên thông tin…Đó cũng là khoảng cách giữa các cá nhân, tổ chức ở
các mức độ kinh tế - xã hội khác nhau,…(cơ hội tiếp cận CNTT & Internet, khả
năng sử dụng trong các hoạt động khác nhau).
1.2.3 Kiến trúc và Kiến trúc thông tin của thư viện số.
1.2.3.1 Kiến trúc của thư viện số

Một thƣ viện số thƣờng là một tập tích hợp các dịch vụ khác nhau nhƣ thu
thập, phân loại, biên mục, lƣu trữ, tìm kiếm, bảo vệ và duy trì thông tin, hệ thống
này tạo thành một tổ chức chặt chẽ, thuận tiện, cho việc truy cập và xử lý một số
lƣợng lớn tài nguyên số. Các thƣ viện số là các việc thực thi kiến trúc của hạ
tầng mạng, hệ thống máy tính, các phần mềm, phần cứng nhất định để tăng
cƣờng tổ chức, thu thập, bảo trì và tận dụng thông tin.
Thƣ viện số là một hệ thống phức tạp. Một thƣ viện số có thể là một hệ
thống có kiến trúc đa tầng với nhiều chức năng khác nhau và các thƣ viện số có
khác nhau thƣờng có mô hình và kiến trúc khác nhau. Tuy nhiên, kiến trúc chung

Bàn
Footer Page 14
ofThị
126.Năm K52 Thông tin – Thƣ viện

14


Header Page 15 of 126.

cho một thƣ viện thƣờng gồm 4 thành phần cơ bản: giao diện ngƣời dùng, kho
thông tin, hệ thống định danh và hệ thống tìm kiếm.
Giao diện ngƣời dùng (User Interface):
Thƣờng có 2 giao diện ngƣời dùng:
- Giao diện dành cho ngƣời dùng tin thƣ viện
- Giao diện cho cán bộ thƣ viện và ngƣời quản trị hệ thống
Giao diện ngƣời dùng tin có hai phần: một là trình duyệt Internet tiêu
chuẩn cho ngƣời sử dụng tƣơng tác thực với máy tính. Trình duyệt này nối với
dịch vụ máy khách, đóng vai trò trung gian giữa trình duyệt và các thành phần
khác của hệ thống. Dịch vụ máy khách cho phép ngƣời dùng xác định vị trí cũng

nhƣ nội dung tìm kiếm, chúng diễn giải thông tin đƣợc cấu trúc từ những đối
tƣợng số. Chúng thƣơng lƣợng các điều khoản và điều kiện, quản lý các điều
kiện giữa các đối tƣợng số, ghi nhớ lại tình trạng của quá trình giao tiếp của các
hệ thống khác nhau.
Kho thông tin:
Các kho thông tin lƣu trữ và quản lý các đối tƣợng số và các loại thông tin
khác. Một thƣ viện số quy mô lớn có rất nhiều kho thông tin với nhiều loại hình,
bao gồm các kho thông tin hiện có và các cơ sở dữ liệu hồi cố, tƣơng tác với kho
này phải thông qua giao thức truy cập kho. Giao thức này nhận diện quyền và sự
cho phép một khách hàng có thể truy cập vào kho, hỗ trợ trên quy mô lớn sự
phân phối thông tin và tao ra một kiến trúc mờ đối với các giao diện đã đƣợc xác
định rõ ràng.
Hệ thống định danh:

Bàn
Footer Page 15
ofThị
126.Năm K52 Thông tin – Thƣ viện

15


Header Page 16 of 126.

Đây là những yếu tố định danh có mục đích tổng quát đƣợc dùng để xác
định các nguồn tin trên Internet trong một thời gian dài và để quản lý các tài liệu
có trong kho hay trong cơ sở dữ liệu. Hệ thống định danh là một hệ thống máy
tính nhằm cung cấp dịch vụ chỉ dẫn phân tán cho các định danh cho các nguồn
tin trên Internet. Khi tƣơng tác với kho thông tin, hệ thống định danh tiếp nhận
thông tin định danh của đối tƣợng số và gửi nó về kho thông tin nơi mà đối

tƣợng số đƣợc lƣu trữ.
Hệ thống tìm kiếm:
Hệ thống tìm kiếm phải thiết kế để có những chỉ mục (Index) và mục lục
(Catalog) để phát hiện ra thông tin cần tìm trƣớc khi truy xuất nó từ kho thông
tin. Các Index này phải đƣợc quản lý độc lập và có rất nhiều giao thức.
1.2.3.2 Kiến trúc thông tin của thư viện số
Trong thƣ viện số, thông tin đƣợc lƣu trữ dƣới dạng những đơn vị thông
tin số cơ bản nhƣ bản đồ số hóa, một đoạn văn bản, một trang web hay một bức
ảnh quét … Các tài liệu số thƣờng liên hệ với các tài liệu khác theo quan hệ bộ
phận – toàn thể hay theo quan hệ trật tự. Chẳng hạn, một văn bản đƣợc số hóa có
thể bao gồm các trang, chƣơng, bảng mục lục, ví dụ minh họa, … Trong hệ
thống mạng toàn cầu (www), một văn bản tƣơng tự có thể bao gồm nhiều trang
văn bản với hình đi kèm và đƣờng dẫn tới các thông tin khác. Theo phƣơng thức
này, tài liệu đƣợc chia thành những tập hợp. Đó có thể là những tập hợp thông
tin theo nghĩa đen, những nhóm thông tin do các nhà xuất bản cung cấp hay có
thể là những trang tin đƣợc ngƣời chủ trang web đƣa lên.
Những thông tin cùng loại đƣợc lƣu dƣới nhiều dạng khác nhau. Đôi lúc
những định dạng này hoàn toàn tƣơng thích và có thể chuyển đổi dễ dàng từ

Bàn
Footer Page 16
ofThị
126.Năm K52 Thông tin – Thƣ viện

16


Header Page 17 of 126.

dạng này sang dạng khác, nhƣng cũng có khi một loại thông tin lại đƣợc chứa

trong những định dạng khác hẳn nhau.
Do tính năng dễ thay đổi nên các sản phẩm số thƣờng xuyên phải thay
phiên bản (chúng ta có thể thấy rõ điều này qua các trang web của một số tổ
chức - họ thay đổi trang chủ của mình nhiều lần trong một tháng). Khi một tài
liệu đƣợc chuyển đổi sang dạng số thì các định dạng của nó cũng đƣợc chuyển
đổi nhiều lần. Ví dụ nhƣ một bức ảnh quét có thể có 3 phiên bản: bản lƣu trữ có
độ phân giải cao, một phiên bản chất lƣợng trung bình, và một hình ảnh dạng
phác thảo (thumbnail).
Mỗi một yếu tố của thông tin số có chức năng và quyền truy cập khác
nhau, phụ thuộc vào kích cỡ tài liệu và đặc điểm của hệ thống máy tính và mạng.
Kiến trúc thông tin đƣợc mô tả ở đây cung cấp cách tiếp cận chung để tổ
chức thông tin trong thƣ viện số theo cách hiệu quả, giúp cho các chƣơng trình
máy tính có thể hiểu đƣợc cấu trúc của tài liệu và tiến hành các tƣơng tác theo
mong muốn của ngƣời sử dụng.
* Các nguyên tắc cơ bản:
Kiến trúc thông tin đƣợc tổ chức theo các nguyên tắc cơ bản sau:
Ngƣời sử dụng và các chƣơng trình ứng dụng của họ cần phải linh hoạt.
Do ngƣời sử dụng có thể khai thác thông tin theo những cách thức khác nhau nên
thông tin cần đƣợc tổ chức linh hoạt, không lệ thuộc quá nhiều vào cách thức
truy cập, trình độ chuyên môn hay trình tự truy cập của họ.
Bộ sƣu tập tài liệu cần đƣợc quản lý theo cách đơn giản. Cũng giống nhƣ
các thƣ viện khác, một số cán bộ làm việc trong thƣ viện số mặc dù có chuyên
môn tƣơng đối thấp vẫn phải quản lý một bộ sƣu tập tài liệu rất lớn. Do vậy,

Bàn
Footer Page 17
ofThị
126.Năm K52 Thông tin – Thƣ viện

17



Header Page 18 of 126.

thông tin cần phải đƣợc kiến trúc theo cách thức đơn giản, cho phép các cán bộ
thƣ viện tập trung vào những lĩnh vực họ cần phụ trách chứ không ôm đồm quá
nhiều việc cùng lúc.
Kiến trúc thông tin phải phản ánh đƣợc cơ cấu kinh tế xã hội và pháp lý
của sự phát triển hạ tầng thông tin. Cụ thể những đặc tính đó là: có giá trị, phụ
thuộc vào thời gian và các điều kiện khách quan, đƣợc truyền đạt thông qua các
hệ thống mạng không bảo mật của các quốc gia.
* Loại dữ liệu, siêu dữ liệu cấu trúc và siêu đối tƣợng
Thông tin đƣợc cấu trúc dựa trên ba khái niệm cơ bản: Loại dữ liệu, siêu dữ liệu
có cấu trúc và siêu đối tƣợng.
- Loại dữ liệu mô tả những đặc tính của thông tin nhƣ loại định dạng hay
phƣơng thức xử lý thông tin.
- Siêu dữ liệu có cấu trúc là loại siêu dữ liệu mô tả phiên bản, các mối quan
hệ và các đặc tính khác của tài liệu số.
- Siêu đối tượng là đối tƣợng cho phép tham chiếu đến một tập hợp các đối
tƣợng số. Theo cách hiểu đơn giản thì siêu đối tƣợng là danh mục liệt kê các
nhóm đối tƣợng khác. Chẳng hạn nhƣ trong một tuyển tập thơ, mỗi một bài thơ
là một đối tƣợng số và tuyển tập thơ đó đƣợc gọi là một siêu đối tƣợng. Cũng có
lúc một siêu đối tƣợng chính là đối tƣợng số liệt kê các phiên bản đã đƣợc
chuyển đổi của cùng một dữ kiện cụ thể.
1.2.4 Nền tảng thư viện số
1.2.4.1 Metadata

Bàn
Footer Page 18
ofThị

126.Năm K52 Thông tin – Thƣ viện

18


Header Page 19 of 126.

Siêu dữ liệu (metadata) dùng để mô tả tài nguyên thông tin. Thuật ngữ
“meta” xuất xứ là một từ Hy Lạp đùng để chỉ một cái gì đó có bản chất cơ bản
hơn hoặc cao hơn. Vì vậy metadata là dữ liệu về dữ liệu.
Theo tiến sĩ Warwick Cathro (Thƣ viện Quốc gia Úc) thì “siêu dữ liệu là
những thành phần mô tả tài nguyên thông tin hoặc hỗ trợ thông tin truy cập đến
tài nguyên thông tin”. Cụ thể trong tài liệu thì siêu dữ liệu đƣợc xác định là “dữ
liệu mô tả các thuộc tính của đối tƣợng thông tin và trao cho các thuộc tính này ý
nghĩa, khung cảnh và tổ chức. Siêu dữ liệu còn có thể đƣợc định nghĩa là dữ liệu
có cấu trúc về dữ liệu”.
Theo Gail Hodge siêu dữ liệu là “thông tin có cấu trúc mà nó mô tả, giải
thích, định vị, hoặc làm cho nguồn tin trở nên dễ tìm kiếm, sử dụng và quản lý
hơn. Siêu dữ liệu đƣợc hiểu là dữ liệu về dữ liệu hoặc thông tin về thông tin”Nói
tóm lại thì siêu dữ liệu là thông tin mô tả tài nguyên thông tin.
Mục đích đầu tiên và yêu cầu cốt lỗi nhất của siêu dữ liệu (metadata) là
góp phần mô tả và tìm lại các tài liệu điện tử trên mạng Internet. Sự phát triển
mạnh mẽ của Internet đã tạo ra sự bùng nổ của các loại dữ liệu đa dạng ở dạng
số, văn bản, âm thanh, hình ảnh, tài liệu đa phƣơng tiện. Những tài liệu này có
thể truy cập đƣợc trên mạng Internet song việc tìm kiếm chúng một cách hiệu
quả và khoa học nhƣ với các hệ thống thông tin trực tuyến là hết sức khó khăn.
Để góp phần tăng cƣờng chất lƣợng tìm kiếm các tài liệu số trên mạng Internet,
ngƣời ta đã đƣa ra giải pháp sử dụng siêu dữ liệu.
Thực ra trong hoạt động thông tin – thƣ viện truyền thống, từ lâu đã có
những khái niệm liên quan đến siêu dữ liệu. Các bản thƣ mục chứa các dữ liệu

mô tả đối tƣợng nhƣ cho sách , cho tạp chí thì chúng cũng đƣợc coi nhƣ là một
dạng siêu dữ liệu. Với việc tự động hóa công tác biên mục, phiếu thƣ mục đƣợc
thay thế bằng biểu ghi thƣ mục. Nhƣ vậy thành phần siêu dữ liệu còn có thể
Bàn
Footer Page 19
ofThị
126.Năm K52 Thông tin – Thƣ viện

19


Header Page 20 of 126.

đƣợc trình bày trong biểu ghi, vì vậy biểu ghi này đƣợc coi là biểu ghi siêu dữ
liệu (metadata record) của đối tƣợng đƣợc cơ sở dữ liệu quản lý. Với tài nguyên
truyền thống trên giấy, thông tin mô tả đƣợc bố trí nằm ngoài đối tƣợng mà nó
mô tả (Ví dụ, trên phiếu thƣ mục của mục lục thƣ viện, trong biểu ghi của
CSDL). Nhờ những yếu tố mô tả nhƣ vậy, ngƣời ta có thể xác định và tìm kiếm
lại đƣợc tài liệu một cách chính xác theo một vài yếu tố.
Ngày nay, nguồn tài liệu điện tử phát triển nhanh chóng và sự phân tán
trên mạng nhiều đến mức không thể xử lý đƣợc một cách thủ công nhƣ đã và
đang áp dụng đối với tài liệu xuất bản trên giấy. Để xử lý đƣợc hết tài liệu điện
tử phân tán, ngƣời ta phải áp dụng các phƣơng pháp tự động – sử dụng các
chƣơng trình đặc biệt (đƣợc gọi theo nhiều cách khác nhau nhƣ: robots, crawlers,
spiders,...). Do tài liệu điện tử đƣợc tạo ra, thông thƣờng không tuân thủ những
quy định xuất bản truyền thống, không có những quy tắc nhất định giúp cho
phép nhận dạng tự động đƣợc các yếu tố mô tả thông thƣờng nhƣ tác giả, địa chỉ
về xuất bản, thông tin về khối lƣợng... nên cần thiết phải có những quy định
thống nhất để các chƣơng trình tự động nhận dạng và xử lý chúng theo các yêu
cầu nghiệp vụ. Những quy định nhƣ vậy đƣợc gọi là những quy định về siêu dữ

liệu. Có thể thấy hiện nay, do nhiều chƣơng trình máy tính chỉ định chỉ số dựa
vào một số thành phần hạn chế nhƣ nhan đề hoặc toàn văn nên không hỗ trợ
những tìm kiếm đặc thù (ví dụ theo tác giả, theo chủ đề, theo lĩnh vực...). Vì thế
để tạo điều kiện cho các chƣơng trình có thể đinh chỉ số tự động theo một số yếu
tố xác định, ngƣời ta phải đƣa thêm vào tài liệu điện tử những thuộc tính bổ sung
để tăng cƣờng mô tả tài nguyên thông tin. Các công cụ định chỉ số tự động sẽ
đƣợc lập trình để nhận dạng các thuộc tính này và định chỉ số chúng, từ đó hỗ trợ
tìm kiếm những thuộc tính đặc thù.
Nhƣ vậy một bản ghi metadata bao gồm một tập hợp những thuộc tính
hoặc tập hợp những phần tử cần thiết để mô tả các tài nguyên thông tin theo yêu
Bàn
Footer Page 20
ofThị
126.Năm K52 Thông tin – Thƣ viện

20


Header Page 21 of 126.

cầu nghiệp vụ. Thông thƣờng trong hoạt động nghiệp vụ thông tin – thƣ viện bao
gồm các yếu tố nhƣ: Nhan đề tài liệu, tác giả, thông tin về xuất bản, nơi/vị trí lƣu
giữ, kiểu/dạng tài liệu....
Mối liên hệ giữa siêu dữ liệu và tài nguyên thông tin mà nó mô tả có thể
đƣợc thể hiện ở một trong hai cách sau:
+ Các phần tử metadata đƣợc chứa trong một biểu ghi tách biệt bên ngoài
đối tƣợng mô tả.
+ Các phần tử metadata có thể đƣợc nhúng (gắn) vào bên trong tài nguyên
mà nó mô tả.
Trƣớc đây với tài liệu truyền thống, các mô tả dữ liệu nằm ngoài đối tƣợng

mô tả (đƣợc đƣa vào phiếu thƣ viện hoặc biểu ghi CSDL), nhƣ vậy siêu dữ liệu
đƣợc lƣu trữ một cách tách biệt bên ngoài đối tƣơng mô tả.
Với tài liệu điện tử, siêu dữ liệu của chúng đƣợc nhúng (gắn) trong bản
thân tài nguyên hoặc liên kết với tài nguyên mà nó mô tả nhƣ trong trƣờng hợp
các thẻ meta của tài liệu HTML hoặc các tiêu đề TEI (Text Encoding Initiative)
Trong thực tế có nhiều chuẩn mô tả biên mục mang tính chất metadata khá
thông dụng đang đƣợc áp dụng nhƣ: MARC21/UNIMARC, ISO-2709, Dublin
Core Metadata... các dữ liệu metadata này thƣờng đƣợc gắn vào phần đầu cho
mỗi tài liệu điện tử đƣợc đƣa vào máy chủ hoặc trên mạng internet nhằm hỗ trợ
các công cụ tìm kiếm lọc ra các thông tin metadata để tổ chức thành các kho dữ
liệu mà không cần dùng đến hệ quản trị cơ sở dữ liệu truyền thống. Thực tế thì
ngay bản thân ngôn ngữ XML tự nó đã hỗ trợ việc hình thành một cơ sở dữ liệu
toàn văn, phi cấu trúc và rất thuận lợi cho việc tìm kiếm và trao đổi thông tin.
Các loại metadata chính:

Bàn
Footer Page 21
ofThị
126.Năm K52 Thông tin – Thƣ viện

21


Header Page 22 of 126.

Metadata mô tả: (Descriptive metadata): Mô tả nguồn tài nguyên cho các mục
đích khám phá và định nghĩa. Dạng thức này có thể mô tả và xác định tài nguyên
ở các mức khác nhau nhƣ:
- Ở mức cực bộ, cho phép tìm và tìm lại đối tƣợng
- Ở cấp mạng Web, cho phép phát hiện tài nguyên

- Các định danh tài nguyên (URL, URN, PURL,...)
- Các thuộc tính vật lý: vật mang, kích cỡ, điều kiện truy cập,..)
- Các thuộc tính thƣ mục; nhan đề, tác giả, ngôn ngữ, từ khóa..
- MARC
- Dublin Core
Metadata cấu trúc (Structural metadata): xác định cách các đối tƣợng kết hợp
với nhau nhƣ thế nào, nhƣ cách thức các trang đƣợc sắp xếp theo các chƣơng. Hỗ
trợ tin và trình bày tài nguyên điện tử. Cung cấp thông tin về cấu trúc bên trong
của tài nguyên nhƣ định trang, chƣơng, mục,..Mô tả quan hệ giữa các tài liệu:
ảnh B đƣợc nhúng vào tài liệu A, liên kết các tập..
Metadata quản trị (Administrative metadata): Quản lý thông tin về nguồn tài
nguyên, nhƣ các thông tin đó đƣợc tạo ra khi nào, nhƣ thế nào, các dạng file,
thông tin kỹ thuật và cho biết ai có quyền truy cập.
Metadata có khả năng mô tả dữ liệu của các nguồn tài nguyên ở các mức
khác nhau. Nó có thể mô tả một bộ sƣu tập, một nguồn tài nguyên đơn lẻ hoặc
một phần của một tài nguyên lớn. Chỉ khi ngƣời biên mục tạo ra các quyết định
về một bản ghi biên mục đƣợc tạo ra cho cả tập tài nguyên hay cho mỗi tài
nguyên đặc trƣng cho cả tập hợp ngƣời tạo metadat mới đƣợc tạo các quyết định
tƣơng tự nhƣ vậy.
Bàn
Footer Page 22
ofThị
126.Năm K52 Thông tin – Thƣ viện

22


Header Page 23 of 126.

Các ứng dụng của metadata:

Khai phá tài nguyên:
Metadata cung cấp các chức năng trong khai phá tài nguyên hiệu quả nhƣ
việc biên mục (catologing) bằng cách:
- Cho phép các nuồn tài nguyên có thể đƣợc tìm kiếm thông qua các điều kiện
liên quan;
- Xác định các nguồn tài nguyên
- Đƣa ra các nguồn tài nguyên tƣơng tự nhau
- Phân loại các nguồn tài nguyên không tƣơng xứng.
- Trả về vị trí thông tin
Tổ chức các tài nguyên điện tử:
Khi các nguồn tài nguyên điện tử dựa trên web phát triển một cách nhanh
chóng, các website tích hợp và các cổng thông tin cần tổ chức thông tin các
nguồn tài nguyên dựa trên chủ đề và đối tƣợng ngƣời dùng một cách hiệu quả.
Các cổng thông tin này có thể đƣợc xây dựng nhƣ hệ thống các trang tĩnh. Tuy
nhiên sẽ hiệu quả hơn và tăng cƣờng tính phổ dụng hơn là xây dựng các trang
web động bằng cách metadata đƣợc lƣu trong SCDL. Các công cụ phần mềm
khác nhau có thể tự động trích chọn và định dạng lại thông tin cho các ứng dụng
web.
Xử lý tương tác:
Việc mô tả tài nguyên bằng metadata cho phép con ngƣời và máy tính có
thế hiểu đƣợc về tài nguyên đó, thông qua đó có thể trao đổi tƣơng tác với nhau.
Tƣơng tác là khả năng các hệ thống với các nền phần mềm và phần cứng cấu

Bàn
Footer Page 23
ofThị
126.Năm K52 Thông tin – Thƣ viện

23



Header Page 24 of 126.

trúc dữ liệu và các giao diện khác nhau có thể chuyển đổi dữ liệu cho nhau một
cách tối ƣu nhất mà không mất thông tin. Việc sử dụng các lƣợc đồ metadata
đƣợc định nghĩa, các giao thức chuyển đổi chia sẻ và các mối liên hệ giữa các
lƣợc đồ làm cho việc tìm kiếm các nguồn tài nguyên qua mạng thông suốt, liền
mạch hơn. Có 2 hƣớng để xử lý kết hợp và tìm kiếm xuyên suốt hệ thống và thu
hoạch metadata. Giao thức Z29.50 là giao thức phổ dụng cho việc tìm kiếm
xuyên suốt hệ thống. Các bộ thực thi Z39.50 không chia se metadata nhƣng ánh
xạ khả năng tìm kiếm của nó tới tập các thuộc tính tìm kiếm thông thƣờng. Sáng
kiến lƣu trữ mở đƣa ra một hƣớng trái ngƣợc là cho phép tất cả nhà cung cấp dữ
liệu dịch metadata nguyên gốc của họ sang một tập các thành phần cốt lõi chung
và phát tán chúng cho các bộ thu hoạch. Sau đó, một nhà cung cấp dịch vụ tìm
kiếm gom nhóm metadata trong một số chỉ số trung tâm thích hợp để cho phép
tìm kiếm thông qua các kho lƣu trữ mà không cần quan tâm đến các định dạng
metadata đƣợc sử dụng trên các kho lƣu trữ đó.
Định nghĩa số:
Hầu hết các lƣợc đồ metadata bao gồm nhiều yếu tố mô tả nhƣ là các nhân
tố tiêu chuẩn để xác định duy nhất đối tƣợng hoặc công việc mà metadata mô tả.
Việc xác định một đối tƣợng có thể thông qua tên file, URL, PURL, DOI....Các
bộ xác định liên tục đƣợc ƣa chuộng hơn vì vị trí các đối tƣợng thƣờng xuyên
đƣợc thay đổi, việc tạo ra tiêu chuẩn URL không hợp lệ. Ngoài các yếu tố thực
sự xác định cho đối tƣợng ra, metadata đƣợc đóng vai trò nhƣ một tập dữ liệu
định nghĩa để phân biệt đối tƣợng này với đối tƣợng kia trong các mục đích khác
nhau.
Lưu trữ và bảo trì:
Hầu hết các tác động metadata hiện thời là xoay quanh việc khai phá tài
nguyên đƣợc tạo ra. Tuy nhiên định dạng của các tài nguyên số thƣợng bị thay
Bàn

Footer Page 24
ofThị
126.Năm K52 Thông tin – Thƣ viện

24


Header Page 25 of 126.

đổi theo thời gian. Thông tin số có thể bị thay đổi, chỉnh sửa, chuyển từ định
dạng này sang định dạng khác. Nó cũng có thể trở nên vô dụng nhƣ khi các công
nghệ phƣơng tiện lƣu trữ, phần cứng, phần mềm thay đổi. Vì vậy việc đánh giá
phần cứng, phần mềm, chuyển đổi định dạng là các chiến lƣợc nhằm khắc phục
các thay đổi đó. Metadata là nhân tố quan trọng đảm bảo sự tồn tại và tiếp tục có
khả năng truy cập trong tƣơng lai của tài nguyên. Việc lƣu trữ và bảo trì nhằm
lƣu các vết đối tƣợng số (nó từ đâu đến, nó đƣợc thay đổi theo thời gian nhƣ thế
nào), để chi tiết hóa các đặc điểm vật lý và để mô tả các hoạt động của nó với
mục đích đánh giá vai trò của nó trong công nghệ tƣơng lai.
1.2.4.2 XML
XML (eXtensible Markup Language): là ngôn ngữ tạo cấu trúc dữ liệu
văn bản đƣợc phát triển từ đầu năm 1996 dựa theo và tận dụng những điểm
mạnh của chuẩn SGML (Standard Generalized Markup Language: đƣợc coi nhƣ
là siêu ngôn ngữ có khả năng sinh ngôn ngữ khác), cùng những kinh nghiệm có
đƣợc từ ngôn ngữ HTML (HyperText Markup Language). SGML phát triển cho
việc định cấu trúc và nội dung tài liệu điện tử do tổ chức ISO (International
Organization for Standardization) chuẩn hóa năm 1986.
SGML là do IBM đƣa ra nhƣng đƣợc phát triển bởi W3C (World Wide
Web Consortium: tổ chức độc lập định ra tiêu chuẩn cho định dạng Web, máy
chủ và ngôn ngữ), nhƣng đặc tả XML lại do Netscape, Microsoft và các thành
viên dự án Text Encoding Intiative (TEI) xây dựng. Tổ chức W3C XML Special

Interest Group có đại diện từ hơn 100 công ty cùng nhiều chuyên gia đƣợc mời
khác. W3C chính thức thông qua chuẩn XML vào tháng 2/1998.
XML là một hệ thống có luật dùng cho việc thiết kế các khổ mẫu (format)
cho văn bản giúp tạo cấu trúc cho dữ liệu. Trong thực tế XML không phải là một

Bàn
Footer Page 25
ofThị
126.Năm K52 Thông tin – Thƣ viện

25


×