Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
100
DSPACE – Giải pháp tạo lập, lưu trữ và phổ biến tài
nguyên điện tử cho các thư viện ở Việt am
guyễn Huy Chương
10
, guyễn Tiến Hùng
11
Tóm tắt:
Bài viết giới thiệu tổng quan về phần mềm thư viện số Dspace, mô tả các
chức năng và thiết kế của hệ thống thư viện số mã nguồn mở Dspace, và cách tiếp cận
các vấn đề khác nhau trong thư viện số và thiết kế lưu trữ.
I. GIỚI THIỆU
Tháng 3 năm 2000, Công ty Hewlett-Packard (HP) đã trao tặng 1.800.000 USD
cho Thư viện MIT (Massachusetts Institute of Technology) trong khuôn khổ một
chương trình hợp tác 18 tháng để xây dựng thư viện số Dspace, một kho lưu trữ năng
động các định dạng kỹ thuật số các tài nguyên tri thức của các tổ chức nghiên cứu đa
ngành. Một tháng sau khi giới thiệu, ngày 4/11/2000, HP Labs và Thư viện MIT đã
phát hành trên toàn thế giới hệ thống Dspace theo các điều khoản của giấy phép mã
nguồn mở BSD[1] như là một dịch vụ mới của thư viện MIT. Là một hệ thống mã
nguồn mở, Dspace miễn phí cho các tổ chức khác để sử dụng, sửa đổi và mở rộng theo
các yêu cầu của họ để đáp ứng nhu cầu của từng tổ chức.
Dspace ra đời là một nỗ lực để giải quyết một số vấn đề mà giảng viên của MIT đã
gặp phải trong những năm qua. Khi giảng viên và các nhà nghiên cứu khác phát triển
các tài liệu nghiên cứu và các ấn phNm học thuật trong các định dạng kỹ thuật số ngày
càng phức tạp, có một nhu cầu để thu thập, bảo quản và phân phối chúng: một công
việc tốn thời gian và tốn kém cho các giảng viên cá nhân và các phòng ban của họ,
phòng thí nghiệm, và các trung tâm. Dspace cung cấp một cách để quản lý các tài liệu
nghiên cứu và các ấn phNm trong một kho lưu trữ chuyên nghiệp để duy trì, cung cấp
cho họ khả năng hiển thị lớn hơn và khả năng tiếp cận theo thời gian.
Đầu tiên Dspace được xây dựng theo hướng tiếp cận bề rộng: nó hỗ trợ tất cả các
chức năng mà một tổ chức nghiên cứu cần có: một dịch vụ tạo lập tài nguyên số, kho
10
Tiến sĩ, Giám đốc Trung tâm Thông tin – Thư viện, Đại học Quốc gia Hà Ni
11
K sư tin hc, Giám c Công ty Phn mm & Truyn thông VIC
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
101
lưu tr tài nguyên s bng mt cách ơn gin nht có th vi mc tiêu s ưc ngay
lp tc hu ích ti MIT, dn dn có th ưc m rng và ci thin theo thi gian, và có
th phc v như mt nn tng cho các nghiên cu trong tương lai.
II. TỔG QUA VỀ HỆ THỐG DSPACE
1. Mô hình thông tin của hệ thống
Dspace ưc thit k to thun li cho các cá nhân có th óng góp các tài
nguyên s vào h thng mt cách d dàng. Mô hình thông tin ca h thng ưc xây
dng xung quanh ý tưng “Communities” t chc các ơn v trc thuc ca mt t
chc nghiên cu, mt trưng i hc có nhu cu qun lý thông tin c bit. Trong
trưng hp ca MIT (mt trưng i hc nghiên cu ln), “Communities” ưc nh
nghĩa là các trưng thành viên, các khoa, phòng thí nghim, và các trung tâm ca MIT.
Mi “communicaties” có th thích ng vi h thng áp ng các nhu cu c th ca
ơn v và qun lý quá trình np các xut bn phNm in t.
Hình 1: Mô hình t chc thông tin trong Dspace
2. Kiến trúc hệ thống
Kin trúc h thng ca Dspace là mt kin trúc ba lp:
- Lp lưu tr
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
102
- Lp nghip v
- Lp ng dng
Các lp lưu tr ưc thc hin bng cách s dng h thng tp tin, qun lý bi các
bng trong cơ s d liu PostgreSQL. Lp nghip v là lp các chc năng c th ca
Dspace, bao gm c các module lung công vic, qun lý ni dung, qun tr, tìm kim
và duyt tài liu. Mi module có mt API cho phép Dspace tùy chnh, nâng cp các
chc năng phù hp vi tng i tưng. Cui cùng, lp ng dng bao gm các giao
din cho h thng giao din ngưi dùng web và b x lý theo lô, c bit còn h tr
OAI (Open Archives Initiative: Sáng kiến lưu trữ mở) và x lý máy ch gii quyt
nh danh liên tc (Handle) n các biu ghi trong Dspace.
Hình 2: Kin trúc h thng Dspace
3. Metadata (siêu dữ liệu)
Dspace s dng siêu d liu chuNn Dublin core mô t các thông tin v tài
nguyên in t cn lưu tr, phân phi. Trong ó có 3 yu t (thông tin) bt buc phi
mô t: Nhan , ngôn ng, ngày ăng, tt các yu t còn li là tùy chn. Ngoài ra, có
mt s các yu t b sung cho tài liu: tóm tt, t khóa, siêu d liu k thut và siêu
d liu quyn. Các siêu d liu này ưc hin th trong biu ghi ca tài liu trong h
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
103
thng Dspace và ưc lp ch mc h tr tìm kim, duyt thông tin trong h thng
(duyt theo B sưu tp, theo ch , theo các ơn v thành viên ca t chc…). H
thng h tr kt xut siêu d liu và tài liu in t trong kho lưu tr theo dng chuNn
XML, và hin ang phát trin h tr chuNn METS i vi các siêu d liu k thut
và siêu d liu quyn cho các nh dng k thut s tùy ý.
4. Giao diện người dùng
Dspace s dng giao din ngưi dùng dng web-based. Có 3 giao din ngưi dùng
trong h thng Dspace: giao din ngưi dùng cho nhng ngưi tham giam trong quá
trình ăng xut bn phNm in t; giao din cho ngưi dùng tin: tìm kim, duyt thông
tin trong kho lưu tr; giao din ngưi dùng cho ngưi qun tr
Giao din cho ngưi dùng tin h tr tìm kim và nhn thông tin tr v bng cách
duyt hoc tìm kim siêu d liu. Mt biu ghi tha mãn các iu kin tìm kim trong
kho lưu tr s ưc tr v, ngưi dùng tin có th ti tài liu in t gn vi biu ghi
thông qua các siêu liên kt, ngưi dùng tin có th xem trc tip ni dung tài liu trên
web bng cách cài t các plug-in cho trình duyt web hoc ti v máy tính ca mình
xem thông qua các ng dng h tr c các nh dng in t khác nhau như:
Microsoft Office, Acrobat, Windows Media Player , CAD/CAM
5. Luồng công việc trong Dspace
Bng cách áp dng mô hình lung công vic, Dspace là mt kho lưu tr tài liu
in t mã ngun m u tiên ã gii quyt nhng vn phc tp ca mt thư vin
khoa hc tng hp tnh. Nói cách khác, mi thư vin qun, huyn trong tnh s có
nhng quy nh rt khác nhau v các tài nguyên in t phi np cho “thư vin s”:
loi tài liu in t phi np là gì? Ai là ngưi gi tài liu? Ai là ngưi duyt? Ai ưc
xem và ai là ngưi b hn ch xem các tài liu này… Tt c nhng vn này u
ưc gii quyt bi các i din ca các thư vin qun, huyn và các cán b thư vin
tnh. Sau ó ưc mô phng bng lung công vic cho mi b sưu tp thc thi các
quyt nh. Mi thành viên trong Dspace u ưc gán các quyn thích hp vi vai trò
ca mình: vai trò ngưi ăng tài liu in t, vai trò ngưi biên tp siêu d liu, vai trò
qun tr các b sưu tp, vai trò qun tr h thng …
Có 2 cách to lp, qun tr b sưu tp s. Cách th nht, thư vin có th quy
nh tt c mi bn c u có quyn ăng tài liu in t, và bt kỳ ngưi dùng nào
(trong ni b và bên ngoài) u có quyn xem các tài liu ã ưc ăng ti. Cách th
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
104
hai, thư vin có th t chc mô hình lưu tr và phân phi tài liu cht ch hơn: các tác
gi np các tài liu in t do mình to lp, sau ó s có mt b phn chu trách nhim
biên tp siêu d liu và ngưi có quyn cao nht s quyt nh có xut bn tài liu ó
không. Như vy mi bưc trong quá trình ăng tài liu in t s ưc xem xét, phê
duyt trưc khi tài liu ó ưc ưa vào b sưu tp, các tài liu in t không ưc
thông qua trong quá trình này s không ưc phép lưu tr trong h thng Dspace.
6. ền tảng công nghệ
Dspace ưc thit k chy trên nn tng UNIX, hin nay ã có phiên bn chy
trên nn tng h iu hành Windows. Các mã ban u ưc lp trình bng ngôn ng
Java. Các thành phn khác: H qun tr CSDL s dng PostgreSQL; máy ch web và
Java Servlet s dng Apache và Tomcat; Jena - mt b công c RDF ưc phát trin
t HP Labs, OAICat t OCLC
III. MỘT SỐ TÍH ĂG ỔI BẬT CỦA DSPACE SO VỚI GREESTOE
Hin Vit Nam có 2 phn mm thư vin s ưc s dng khá ph bin là Dspace
và GreenStone, dưi ây bài vit ch cp nhng tính năng ni bt ca Dspace vi
GreenStone bn c so sánh và có nhng la chn phù hp cho thư vin ca mình.
Kh năng tùy chnh giao din cao: Giao din thng nht chung cho tt c các b
sưu tp. Tt c các thao tác u thông qua web: Biên mc (ây ng thi cũng là
nhưc im ca Dspace vì vic biên mc trên web s ph thuc vào s n nh ca
ưng truyn, băng thông, thi gian x lý …), truy cp thông tin Khi cn b sung tài
liu vào các b sưu tp không cn phi xây dng li t u như Greenstone
Cu trúc B sưu tp trong Dspace khoa hc hơn Greenstone. Dspace có cu trúc
các B sưu tp theo nhiu cp
S dng h qun tr CSDL (PostgreSQL) c lp nên áp ng tt vi Thư vin có
s lưng tài liu ln
Kh năng phân quyn mnh. Có th phân quyn n tng tài khon ngưi dùng,
n tng B sưu tp hoc thm chí n tng tài liu. Các quyn ưc cu hình khá chi
tit như: Quyn xem biu ghi thư mc, Quyn xem toàn văn Phn mm Greenstone
không làm ưc iu này
H tr nhiu kiu báo cáo: Lưt truy cp, lưt xem biu ghi thư mc, lưt
download
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
105
ưc Google Scholar h tr ch mc tài liu
IV. MỘT SỐ HÌH ẢH TRIỂ KHAI DSPACE TẠI TRUG TÂM TT-TV,
ĐHQGH
Hình 3: Minh ha màn hình t chc ơn v thành viên và B sưu tp
Hình 4: Minh ha màn hình duyt tài liu theo Nhan
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
106
Hình 5: Minh ha màn hình duyt tài liu theo Tác gi
Hình 6: Minh ha màn hình duyt tài liu theo thi gian
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
107
V. KẾT LUẬ
Xây dng thư vin s là xây dng phương thc mi, công ngh mi trong vic x
lý thông tin - tri thc. ó là bo qun, sưu tm, t chc, qung bá, và truy cp thông
tin hay nói chính xác hơn là tri thc, tc là thông tin có ý nghĩa và hu ích. Do ó, mt
thư vin s ưc xem như là nơi qun tr và cung cp nhng b sưu tp thông tin có t
chc. Vi ngun kinh phí hn hp dành cho hot ng thư vin hin nay, chúng tôi
cho rng phn mm ngun m Dspace là mt gii pháp tt gii quyt nhng khó
khăn và thách thc cho công tác to lp và qun lý các tài nguyên in t ni sinh
không ch trong các thư vin i hc mà ti tt c các h thng thư vin Vit Nam.
Danh mục tài liệu tham khảo
[1] Berkeley Standard Distribution License,
<
[2] DSpace, <>.
[3] Open Archives Initiative Protocol for Metadata Harvesting (OAI-PMH),
<
[4] OAICat, <
[5] Handle System®, <>.