Tải bản đầy đủ (.pdf) (14 trang)

Một số kinh nghiệm trong việc tạo lập và chia sẻ thông tin trên mạng internet bằng phần mềm mã nguồn mở Greenstone – Giải pháp lựa chọn cho các thư viện vừa và nhỏ hạn chế về tài chính

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (747.16 KB, 14 trang )


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

128

MỘT SỐ KIH GHIỆM TROG VIỆC TẠO LẬP VÀ CHIA SẺ THÔG TI
TRÊ MẠG ITERET BẰG PHẦ MỀM MÃ GUỒ MỞ GREESTOE -
GIẢI PHÁP LỰA CHỌ CHO CÁC THƯ VIỆ VỪA VÀ HỎ HẠ CHẾ VỀ TÀI CHÍH

Chu Tuyết Lan
Thư viện Trường Thương mại Anh Quốc

Trong môi trường INTERNET hiện nay, số hóa được coi là mục tiêu chiến lược
trong việc phát triển hoạt động thông tin thư viện, bởi lẽ ngoài việc tăng cường khả
năng tiếp cận thông tin cho độc giả, thực hiện một cách hiệu quả nhất việc phân phối
thông tin, thì số hóa còn là một chiến lược hữu hiệu để bảo quản vốn tài liệu hiện có,
đặc biệt là tài liệu quý hiếm. Để thực hiện tốt công tác số hóa, các cơ quan thông tin
thư viện cần phải xây dựng lộ trình, lên kế hoạch phù hợp và đặc biệt chú trọng đến
việc lựa chọn giải pháp công nghệ để đảm bảo khả năng sử dụng lâu dài các kết quả số
hóa, trong đó cần quan tâm đến 3 chức năng cơ bản của phần mềm quản lý dữ liệu số
là hiển thị, xử lý và tìm kiếm thông tin.
Nhiều năm làm việc trong một thư viện chuyên ngành, nguồn kinh phí được cấp
hàng năm khá eo hẹp, nhưng lại có chức năng lưu giữ vốn tài liệu quý hiếm của dân
tộc, nên chúng tôi đã triển khai công tác số hóa từ khá sớm, tranh thủ sự giúp đỡ cả về
tài chính và kỹ thuật của các tổ chức quốc tế. Một trong những bài học kinh nghiệm
thu nhận được trong thời gian học tập tại nước ngoài mà chúng tôi thấy cần chia sẻ đó
là khi tiến hành bất cứ một hoạt động gì cũng cần xem xét những vấn đề sau: (1)
Answering the needs; (2) Getting started; (3) Reaping the benefits. Có thể hiểu một
cách nôm na là: trước hết bạn phải xác định thật rõ ràng tiềm năng, quy mô của thư
viện nơi mình công tác, cần và có thể đáp ứng được những nhu cầu nào của độc giả.
Từ đó lên phương án, xây dựng lộ trình và kế hoạch triển khai công việc sao cho phù


hợp với hoàn cảnh và điều kiện thực tế của thư viện. Sau đó cần quan tâm giải quyết
bài toán kinh tế: việc đầu tư triển khai công việc này sẽ đáp ứng những mục tiêu gì,
phục vụ đối tượng nào và sẽ đem lại những lợi ích gì về kinh tế, văn hóa và khoa học
xã hội trong bối cảnh đất nước còn nhiều khó khăn như hiện nay.

I/ KIH GHIỆM TROG LĨH VỰC SƯU TẦM & BẢO QUẢ TÀI
LIỆU
1. Công tác sưu tầm
Để đảm bảo độ chính xác cũng như chất lượng của nguồn tài liệu sưu tầm,
Viện chúng tôi đã bước đầu ứng dụng những tiến bộ của khoa học công nghệ vào việc

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

129

điều tra điền dã và thu thập tư liệu ở các địa phương. Các nhóm sưu tầm đã sử dụng
máy ảnh số và máy ghi âm, để ghi hình các tài liệu cần thu thập, (điều này tránh được
các lỗi không nên có trong các sn phNm sưu tm thc hin bng phương pháp th
công trưc ây, chng hn vic thiu t trong các v i: có câu i có v 9 t, v kia
li ch có 7; hay vic ch tc ánh ch t, rt khó khc phc khi x lý, ); vic ghi
ting khi phng vn các v túc N ho  các a phương v truyn thng làng ngh, lch
s tư liu và di tích cũng rt hu ích. Hiu qu ca vic s dng máy nh k thut s
và máy ghi âm  ghi li hình nh tư liu gc và âm thanh v ngun gc tư liu, s
giúp chúng ta có tư liu toàn văn v c âm thanh và hình nh  kt ni vi CSDL thư
mc bên cnh phn phiên âm và dch nghĩa ca chúng, tin ti xây dng ngân hàng d
liu tng hp v vn tài liu iu tra in dã ã ưc tin hành trong nhiu năm qua.
iu này to iu kin m bo quyn li ca ngưi dùng tin  mi nơi, mi lúc thông
qua vic phát trin ngun tin, các công c giúp kim soát, khai thác, tìm kim thông tin
và các dch v mà h ưc th hưng.
 công tác sưu tm tư liu nói chung và tư liu Hán N ôm nói riêng ngày mt

hiu qu hơn, cũng cn quan tâm n vic kho sát và thng kê chi tit s tài liu ã
mua ưc  các a phương, s chưa mua ưc (tìm lý do  lên k hoch b sung
trong tương lai) và ánh giá giá tr ca ngun tài liu này trong thc t. Vì th v cơ
bn ã tránh ưc tình trng mua tài liu trùng và mua nhng tài liu ít giá tr, vì công
bi vá và bo qun tip sau ó là rt ln. iu quan trng na cn lưu ý là sau khi sưu
tm v, tư liu cn ưc ánh giá, phân loi và lên danh mc các tài liu thuc dng
c bn c bit quý him,  có quy ch bo qun và khai thác hiu qu và hp lý
nht.

2) Công tác số hóa và bảo quản tư liệu Hán ôm
 công tác bo qun t hiu qu cao, ngoài vic năng ng phát huy ni lc,
cn ch ng tranh th khai thác các ngun tài tr bên ngoài b sung nhng trang thit
b & các loi vt liu có  chuNn cn thit phc v cho công tác bo qun và phc
ch. Tranh th các iu kin  c cán b i hc tp và trao i kinh nghim vi các
nưc có truyn thng v s hoá và bo qun như: M, Trung Quc, N ht và ài Loan,
Chú ý t chc các workshop mi chuyên gia nưc ngoài n  ging dy v k
thut s hoá và bo qun, nhm trang b nhng kin thc cn thit cho nhng cán b
làm công tác này, giúp h ch ng và t tin hơn trong công vic mình làm.
Hin 100% tài liu Hán N ôm bn gc ã ưc sao chp và phn ln tài liu quý
him ã ưc s hóa  phc v bn c, bn gc ch ưc phc v trong nhng
trưng hp c bit nhm i chiu so sánh,  gim thiu n mc ti a c gi làm
tn thương n tài liu gc. Cn tranh th s u tư ca nhà nưc và các t chc quc
t  tng bưc trang b nhng thit b hin i cho công tác bo qun và s hoá tài
liu.

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

130

 Bảo quản bằng hệ thống điều hoà trung tâm, kt hp vi vic dùng phn

mm Data-loger  kim soát nhit  và  Nm trong kho. ây là công ngh
mi cho phép kim soát nhit  và  Nm mt cách chuNn xác nht qua h
thng máy vi tính. iu quan trng là phi tuân th cht ch nhng thông s
chuNn v h thng nhit , và  Nm, tránh tình trng h thng iu hoà trung
tâm ch hot ng vào nhng ngày làm vic trong tun. N u như vy thì vic
dao ng v nhit  và  Nm trong kho s rt ln, nht là vào nhng ngày
ngh cui tun, và ngày l, lúc ó ch s chênh lch v nhit  và  Nm s 
mc báo ng. iu này cn phi ưc quán trit mt cách trit , nu không
giá tr bo qun ca h thng iu hoà trung tâm s i ngưc li vi nhng
mong mun trong thc t. Các công trình nghiên cu trong khu vc và th gii
v lĩnh vc bo qun cũng ã ch rõ: to ra môi trưng thích hp và n nh v
nhit  và  Nm là phương pháp bo qun ti ưu nht cho ngun tài liu. Bi
vì s dao ng quá ln v nhit  và  Nm là yu t nguy hi ln nht i vi
các loi hình tài liu. S dao ng này s thúc Ny các phn ng hoá hc tăng
nhanh, phân hu các loi vt liu hu cơ, làm gim tui th ca tài liu mt
cách áng k. Mc  ca các phn ng này gia tăng cùng vi iu kin nhit
,  Nm và các hp cht acid hin có, s to iu kin lý tưng cho nm mc
và côn trùng phát trin, gây nguy hi cho tài liu nói chung và tài liu s nói
riêng.
 Bảo quản bằng Microfilm, cho n nay, Microfilm vn ưc xem là phương
tin chính yu trong công tác bo qun ni dung ngun tài liu k c ca thư
vin và các cơ quan lưu tr, vi iu kin là quá trình sn xut và ch  kho
tàng phi thc hin theo úng chuNn quc t. Kt qu nghiên cu ã chng
minh rng: nu ưc bo qun trong iu kin nhit  và  Nm lý tưng thì
tui th ca Microfilm có th kéo dài ti 500 năm.

 Bảo quản bằng phương pháp số hóa, ây là phương pháp mi, h tr rt c
lc cho vic khai thác và bo qun tư liu, ưc hai trưng i hc ni ting
ca M là Yale và Cornell nghiên cu ưa vào s dng t tháng 11/92. Công
ngh này rt áng quan tâm, vì ưu th ca nó là cùng mt lúc có th kt hp

ưc c hai chc năng bo qun và khai thác, thông qua mng máy tính bn
c có th truy cp trc tuyn nhng tài liu mà h có nhu cu  mi lúc, mi
nơi, và ng thi cho nhiu ngưi s dng, giúp ích rt nhiu cho ngưi
nghiên cu nói riêng và bn c nói chung. Ti nhiu Hi tho quc t, các
chuyên gia hàng u ca th gii v công tác bo qun ã khng nh s hoá là
công ngh mi có nhiu tin b, rt hu ích cho vic tìm kim thông tin, ng
thi cũng là phương tin bo qun gián tip, giúp bn c thun tin trong vic
tra cu, hn ch n mc ti a vic s dng trc tip bn gc, do vy giúp kéo
dài tui th ca ngun tài liu gc.

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

131

N gay t u nhng năm 1998, kho tư liu Hán N ôm ã ưc s hoá tuân th
nguyên tc: ưu tiên những tài liệu đặc biệt có giá trị hoặc ở trong tình trạng rách nát
mà có nhu cầu khai thác cao.
- Mt CSDL ơn l ã ưc xây dng vi các hình nh s hoá ngun tài liu Hán
N ôm có kt ni thông tin ting Vit và phn mm c duyt tài liu. Tt c u ưc
ghi trên ĩa CD-ROM. Tuỳ theo  dày ca sách mà trên mt ĩa CD-ROM có th có
1 hoc nhiu cun sách, song dung lưng không vưt quá 500 Mb d liu. Các nh s
ưc to bi máy Scanner loi cht lưng cao,  phân gii 300 DPI,  sâu màu 24
bit, dng JPG (có  nén khá cao), kích c nh trung bình 20 cm x 30 cm, dung lưng
trung bình 500 Kb.
- CSDL tp trung ưc thc hin t năm 2004 tr li ây, CSDL này tích hp
toàn b thông tin hin có trong b Di sn Hán N ôm Vit N am thư mc  yu vi các
tài liu Hán N ôm ã ưc s hoá cha trong các ĩa CD. c gi có th trc tip tìm
tài liu trên máy tính mà không cn phi tra cu th công như trưc ây, và cũng có
th c nhng sách mình cn (nhng tài liu ã s hoá) trên mng LAN .
Hin chúng tôi ang dùng h iu hành qun lý mng

Window Server 2003, (h
iu hành ca Microsoft có kh năng qun lý mng vi  bo mt cao), và h qun tr
CSDL MS SQL Server 2000
. Phn mm này có kh năng qun lý d liu ln, c bit
vi d liu nh s, phù hp vi CSDL Hán N ôm ã s hoá, vic qun lý ngưi dùng
và thông tin khá hoàn thin, tính bo mt cao, d s dng, có kh năng m rng và kt
xut vi mng IN TERN ET.  khai thác các d liu Hán N ôm ã s hoá, chúng tôi
phi hp cùng công ty tin hc eK xây dng chương trình Qun lý c duyt thư tch
Hán N ôm. Phn mm này hot ng trên nn h qun tr CSDL ca hãng Microsoft
SQL Server 2000, giúp bn c có th c trc tip các tài liu Hán N ôm và tìm thông
tin trên máy tính cá nhân có ni mng LAN ca vin. Cũng ging như các phn mm
khác, phn mm này giúp ngưi c tìm kim thông tin theo nhiu tiêu chí khác nhau,
như: nhan  sách, tên tác gi, ký hiu sách và các t khoá a danh, nhân vt, niên i
và ch . N goài ra c gi còn có th tìm n trang bn gc ca tài liu thông qua
vic tìm t hoc cm t bt kỳ nào t bn dch ca mt hoc toàn b s sách có trong
CSDL
 Số hoá kho thác bản văn khắc Hán ôm, trong mi quan h hp tác vi các t
chc khoa hc nưc ngoài, Vin ã phi hp vi Hc vin Vin ông bác c
(E.F.E.O. ) và trưng Cao ng thc hành Pháp thc hin chp nh k thut s
các thác bn văn khc, ngoài vic ghi lưu trên  cng, còn sao lưu trên các ĩa
CD-ROM cht lưng cao, nhm bo qun lâu dài và khai thác có hiu qu kho
tư liu văn khc vô giá này ca Vit N am. Do các thác bn văn khc có kích c
rt a dng và có nhng thác bn thuc din ngoi c (t 24 n 32 các t giy
dó ghép li), nên không th dùng máy quét scanner thông thưng ưc. Gii
pháp công ngh ưc la chn  ây là dùng máy nh k thut s N IKON Cool
Pix 5.000, và mt h thng các thit b ph kèm theo như h thng hút gió (t

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

132


thit k theo cách th công)  làm phng các thác bn trưc khi chp, mt Tivi
ni trc tip vi máy nh s, giúp ngưi chp có th t quan sát và iu chnh
 nét ca nh, mc ích to ra nhng hình nh có cht lưng cao nht như có
th. Cho n thi im này công trình phi hp ba bên (gia Vin N ghiên cu
Hán N ôm vi E.F.E.O. và trưng Cao ng thc hành Pháp) ã chp xong kho
thác bn văn khc Hán N ôm vi trên 56.000 ơn v thác bn.
 phc v cho vic khai thác ngun tin s hoá kho thác bn văn khc, chúng
tôi ã và ang xây dng CSDL các thác bn văn khc Hán N ôm, cung cp cho bn
c nhng ni dung cơ bn v các ơn v văn khc hin ang lưu gi ti Vin. Hy
vng ngoài vic tra cu thông tin trong b Thư mc Văn khc Hán N ôm Vit N am,
bn c có th khai thác kho thác bn văn khc Hán N ôm này thông qua mng
IN TERN ET hoc mng LAN ca Vin, ch không c trc tip trên bn gc, ây
cũng là cách bo qun gián tip i vi ngun tài liu quý him này.
 Xây dựng CSDL toàn văn Tạp chí Hán ôm trên mạng ITERET: 
qung bá các thành qu nghiên cu Hán N ôm trên mng Internet, phc v ngày
mt tt hơn nhu cu nghiên cu và khai thác ca gii nghiên cu Hán N ôm và
nhng ngưi có quan tâm n văn hóa Vit N am  trong nưc, khu vc và trên
th gii. Trong chương trình hp tác gia Vin N ghiên cu Hán N ôm và Vin
Harvard-Yenching (Hoa Kỳ), Vin ã ưc tài tr mt khon kinh phí  xây
dng Website ca Vin và CSDL toàn văn Tp chí Hán N ôm trc tuyn. Thư
vin Vin N ghiên cu Hán N ôm ã phi hp vi b phn tr s ca Tp chí
Hán N ôm trong vic xây dng CSDL toàn văn Tp chí Hán N ôm trc tuyn.
Vi CSDL này, ngưi c có th tip xúc trc tip vi Tp chí Hán N ôm toàn
văn (t lúc bt u xut bn năm 1984 n nay)  mi lúc mi nơi, thông qua
các giao din v năm xut bn tp chí, s ca tp chí, tng mc lc tên tác gi,
tng mc lc nhan  bài vit bng c ting Vit và ting Anh. ây là mt trong
nhng tp chí nghiên cu u tiên ưa ưc y  ni dung toàn văn trên
mng IN TERN ET, thành công này ã ưc ghi nhn là một trong những sự
kiện nhất của báo chí Việt am năm 2006.

3) Kinh nghiệm bảo quản, lưu trữ dữ liệu phục vụ bạn đọc: Qua kinh nghim
thc t, chúng tôi thy rng không nên dùng mt gii pháp chung cho c vic bo
qun, lưu tr d liu và d liu phc v bn c. Vì mi công vic u có nhng
yêu cu và kh năng áp ng khác nhau. Do vy cn có 2 gii pháp riêng bit:
a. Bảo quản, lưu trữ dữ liệu: D liu cn ưc lưu tr trên 3 phương tin và  
các v trí khác nhau.
1a. Lưu trên các ĩa CD-ROM hoc DVD cht lưng cao, c sau 2 n 3 năm li
sao lưu thêm mt bn khác.
2a. Lưu trên mt  cng riêng bit có dung lưng ln,   nơi an toàn có cp nht
d liu hàng tháng.

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

133

3a. Lưu trong  cng ca máy ch (dung lưng ln, chia làm nhiu  riêng bit),
d liu s chim mt khong trng nht nh trong  cng ca máy ch, vic này
s kém an toàn khi máy ch ã có tui th cao, nhưng li thun tin cho vic cp
nht d liu trên mng.
b. Dữ liệu phục vụ bạn đọc trên mạng: D liu trong h qun tr CSDL SQL
Server ã ưc mã hoá và truyn ti trên mng. Quá trình mã hoá, tìm kim và hin
th d liu là mt quá trình phc tp và tiêu tn thi gian. Do vy  d liu ưc
tìm kim, hin th nhanh, d liu cn ưc ti ưu hoá. i vi d liu Hán N ôm s
hoá có dung lưng ln, s lưng nhiu. Gii pháp ca Vin là thu nh nh sao cho
dung lưng nh ưc mã hoá và truyn ti trên mng t khong 100 – 200 kb. D
liu trong CSDL SQL Server thc cht ã ưc lưu tr úp, Card iu khin luôn
to mt khong trng trên tt c các ĩa cng  lưu d liu vào khu vc ó. N gưi
qun tr mng còn phi thưng xuyên backup d liu sau mi ln cp nht hoc sa
cha CSDL. Vic backup t SQL Server rt thun tin, có th backup toàn b hoc
backup tng phn. Do vy d liu  ây thc cht cũng ưc nhân 3:

1b. D liu ưc mã hoá trong SQL Server.
2b. Card iu khin t ng lưu tr d liu trên nhiu vùng ca  cng.
3b. D liu backup ưc copy sang mt phương tin lưu tr khác ct gi bên ngoài
máy ch (lưu vào  cng có dung lưng ln).
Trong nhiu năm qua chúng tôi ã và ang làm công vic to tin  cho vic
xây dng mt thư vin s các tài liu Hán N ôm  phc v gii nghiên cu Hán
N ôm  c trong và ngoài nưc. Hy vng trong mt tương lai không xa, s phn u
xây dng thành công Thư vin s các tài liu Hán N ôm, vi nhng nhim v c th
sau ây:
1) T chc mc lc liên hp bao quát y  các tài liu Hán N ôm theo mt
format chuNn thng nht, gii thiu toàn din các tài liu Hán N ôm  c trong và
ngoài nưc;
2) Thưng xuyên cp nht và bo trì mng lưi thông tin thư mc các tài liu Hán
N ôm, m bo vic tìm kim d dàng qua các yu t tác gi, nhan , t khoá và
ch  cho ngưi dùng tin trên toàn th gii;
3) Tng bưc ph bin các kt qu và công trình nghiên cu, to iu kin thun
li cho vic trao i thông tin v lĩnh vc Hán N ôm và các ngành khoa hc có liên
quan;
4) Duy trì vic gii thiu toàn văn Tp chí Hán N ôm trên mng IN TERN ET, chú ý
cp nht ni dung mi và b sung thêm phn tóm tt ni dung các bài vit bng
ting Anh;

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

134

5) Cung cp tài liu Hán N ôm nguyên ng và bn dch ting Vit m bo tho
mãn nhu cu ging dy và hc tp Hán N ôm trên mng IN TERN ET.
6) Tng bưc ci tin trang Web, chú ý c hai mt ni dung thông tin và công
ngh, áp ng nhu cu thông tin ngày mt cao ca gii nghiên cu Hán N ôm  c

trong nưc và nưc ngoài. Các CSDL thư mc và tài liu Hán N ôm s hoá s là ni
dung quan trng ca trang Web  ph bin thông tin Hán N ôm ti ngưi dùng tin
 khp mi nơi trên th gii.

II/ GIẢI PHÁP LỰA CHỌ PHẦ MỀM VÀ XÂY DỰG CHƯƠG TRÌH
CHUYỂ ĐỔI DỮ LIỆU
Do kinh phí hn hp, nên phn ln các CSDL mà chúng tôi thc hin u ưc
xây dng da trên phn mm ISIS vi ch Vit là font ABC, ch Hán là font
TwinBridge ã phn nào áp ng ưc yêu cu m bo thông tin và to các sn phNm
thông tin hin có. Tuy nhiên  qung bá rng rãi vn tài liu nói trên cho các nhà
nghiên cu trong và ngoài nưc s dng, thì cn phi tìm gii pháp  ưa lên mng
IN TERN ET. Hin nay phn mm ISIS ã có mt s bn dành cho CSDL trên mng
nhưng không h tr các font ch Vit, k c Unicode còn các phn mm khác ang
ưc thương mi hóa  Vit N am thì còn khá nhiu li và quá t i vi mt thư vin
chuyên ngành vi vn tài liu không ln như Thư vin Vin N ghiên cu Hán N ôm,
y là chưa k  chy các phn mm này Vin phi trang b máy ch  mnh vi
khon kinh phí không nh. Vi s biu ghi như ca Vin chúng tôi và giá các phn
mm ang chào hàng (30 ngàn USD) thì tính ra chi phí cho vic qun lý mt biu ghi
là quá cao, không tit kim, hơn na iu kin tài chính ca mt thư vin chuyên
ngành như chúng tôi không th áp ng ưc.  gii quyt mâu thun gia nhu cu
công vic và ngun kinh phí ưc cp, chúng tôi ã quyt nh s dng phần mềm
mã nguồn mở Greenstone.
úng như li t gii thiu “Greenstone là mt b phn mm dùng  xây dng
và phân phi các b sưu tp thư vin s. Phn mm này cung cp mt phương pháp
mi  t chc và xut bn thông tin trên IN TERN ET hoc trên CD-ROM. Greenstone
là sn phNm ca d án N ew Zealand Digital Library ca trưng i hc University of
Waikato, ưc phát trin và phân phi vi s tham gia ca UN ESCO và Human Info
N GO. ây là phn mm mã ngun m ưc cung cp trên
theo
tho thun ăng kí GN U General Public License. Mc tiêu ca phn mm là cung cp

cho ngưi s dng, c bit là các trưng i hc, các thư vin hoc trong các tr s
công cng xây dng các thư vin s riêng ca h. Các thư vin s làm thay i nhanh
chóng cách thc thông tin ưc thu thp và ph bin trong các thành viên ca
UN ESCO và các cơ quan trong lĩnh vc giáo dc, khoa hc và văn hóa trên toàn th
gii, c bit là  các quc gia ang phát trin.”

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

135

Cũng như phn mm ISIS, phn mm Greenstrone là phn mm mã ngun m
nên vic s dng không lo vi phm bn quyn. Tuy nhiên vic chuyn i biu ghi t
CSDL ISIS sang biu ghi CSDL Greenstone là không ơn gin vì hai CSDL này khác
nhau c v cu trúc và font ch: v cơ bn, CSDL ISIS dùng cu trúc MARC và font
ch ABC cho ting Vit và TwinBridge cho Hán N ôm còn CSDL Greenstone dùng
cu trúc Dublin Core và font ch Unicode. N hư vy nu mun chuyn i thì trưc ht
phi chuyn i c cu trúc và font ch, sau ó mi tính ti vic nhp vào biu ghi
Greenstone.
 làm ưc iu này, chúng tôi ã xây dng mt chương trình chuyn i và
ã chuyn i thành công. Chương trình ưc thit k theo ch  t ng, nên có th
chuyn i d liu 24/24 gi mà không cn có ngưi trc. iu này rt hu ích, c
bit là vi các CSDL ln vì có th s dng gi ngh  chuyn i d liu. Quy trình
chuyn i ưc tin hành như sau: dùng ngôn ng format ca ISIS  i cu trúc
biu ghi sau ó chương trình s chuyn i font ch và t ng nhp biu ghi vào
CSDL Greenstone. i vi biu ghi ting Vit, công vic ơn gin hơn vì ch phi
chuyn i 1 ln font ch t ABC sang Unicode. Còn i vi biu ghi ch Hán N ôm
và Trung Quc thì phc tp hơn nhiu, vì phi tách riêng phn ch Vit và phn ch
Hán N ôm hoc ch Trung Quc, sau ó i font ch Vit t ABC sang Unicode, tip
ó i ch Hán N ôm hoc ch Trung Quc t TwinBridge sang Unicode, cui cùng
ghép hai phn li vi nhau và nhp vào biu ghi Greenstone. Hin ti các CSDL thư

mc ISIS do chúng tôi thc hin, ã ưc chuyn sang CSDL Greenstone  ưa lên
mng IN TERN ET như sau:

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

136


Dưi ây là ví d v biu ghi ã ưc chuyn i:
Biu ghi ISIS:


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

137

Biu ghi Greenstone tương
ng:

Còn ây là phn minh ho biu ghi Greenstone ch Hán:
- Kt qu tìm kim thông tin như sau:


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

138

Xin xem chi tit mt biu ghi::

Trong xu th phát trin hin nay ca hot ng thông tin – thư vin, vic ưa d

liu lên IN TERN ET  chia s thông tin là vic làm cn thit và hu ích. a s các thư
vin nh hin ang dùng phn mm ISIS  qun tr d liu, nhưng nu mun ưa d
liu lên IN TERN ET mà dùng wwwisis hoc webisis u vưng vn  font ch vì
ISIS và các d bn ca nó chưa h tr Unicode, nu mua các phn mm tích hp hin
bán trên th trưng thì rt t gây lãng phí i vi 1 thư vin có s biu ghi không ln.
Theo kinh nghim ca chúng tôi, thì s dng phn mm Greenstone là mt gii pháp
tt nhưng do s khác nhau ca hai CSDL nên không th dùng chung ưc, vy cn
phi chuyn i. Giải pháp xây dựng chương trình chuyển đổi biểu ghi là giải pháp tối
ưu, vì nu không vic phi nhp li biu ghi s tn rt nhiu công sc và khó m bo
chính xác. S dng Greenstone còn có li ích khác na là nu mun xây dng CSDL
toàn văn, ta ch vic tích hp phn toàn văn vào biu ghi ca CSDL nêu trên. D liu
toàn văn có th  dng HTML hoc tp PDF.

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

139

Dưi ây là ví d v 1 biu ghi có liên kt toàn văn HTML:

N u nháy vào liên kt “Toàn văn”, ta s c ưc toàn văn như trang minh ha dưi
ây:


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

140

Hin chúng tôi ã chuyn sang làm vic trong mt môi trưng mi, công vic
ch yu là áp ng nhu cu thông tin và tài liu tham kho cho ngưi dùng tin. Khác
vi trưc ây ch yu tip xúc và x lý tài liu trên giy, thì nay phn ln thi gian

chúng tôi làm vic vi các CSDL trc tuyn tim năng như: ProQuest, ebrary và
EBSCO, …  làm tt công vic ca mình, hàng ngày chúng tôi phi download d liu
toàn văn trên các CSDL nói trên, to lp thành các CSDL theo ngành và môn hc 
d dàng phc v i ngũ hc viên và ging viên ca trưng. D liu toàn văn
download ưc chúng tôi cũng ưa vào GREEN STON E  d dàng phc v ngưi
dùng tin theo yêu cu và nguyn vng ca h.
Dưi ây là hình nh minh ho 2 CSDL thư mc (CSDL thư mc v sách và
CSDL toàn văn các lun án, lun văn liên quan n ni dung ging dy ca trưng)
ca Trưng Thương mi Anh quc (BSC British School of Commerce) ưc ưa vào
GREEN STON E, c gi có th tra cu bng c 2 hình thc offline và online.


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

141


Theo kinh nghim ca chúng tôi thì vic chuyn i d liu t phn mm ISIS
sang phn mm mã ngun m GREEN STON E và chia s thông tin s hóa trên mng
IN TERN ET là gii pháp la chn hp lý và kinh t cho các thư vin va và nh có
ngun tài chính khiêm tn. N ên chăng cn xây dng các T hp thư vin  vic chia
s thông tin và s dng kinh phí trong vic mua sm trang thit b, máy móc và phn
mm hiu qu hơn. Gii pháp này giúp cho các ơn v nói trên d dàng to dng và
phc v thông tin cho c gi, cũng như có cơ hi qung bá và chia s tim năng
thông tin cho nhng ngưi có quan tâm n văn hóa, t nưc và con ngưi Vit N am
 khp mi nơi trên th gii.
Tháng 11/2011
TÀI LIỆU THAM KHẢO
Chu Tuyết Lan. Gii pháp chuyn i d liu t ISIS sang Greenstone  chia s
ngun thông tin trên mng Internet ca Thư vin Vin N ghiên cu Hán N ôm // Tp chí

Thư vin. – 2010. - S 2

×