Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
128
MỘT SỐ KIH GHIỆM TROG VIỆC TẠO LẬP VÀ CHIA SẺ THÔG TI
TRÊ MẠG ITERET BẰG PHẦ MỀM MÃ GUỒ MỞ GREESTOE -
GIẢI PHÁP LỰA CHỌ CHO CÁC THƯ VIỆ VỪA VÀ HỎ HẠ CHẾ VỀ TÀI CHÍH
Chu Tuyết Lan
Thư viện Trường Thương mại Anh Quốc
Trong môi trường INTERNET hiện nay, số hóa được coi là mục tiêu chiến lược
trong việc phát triển hoạt động thông tin thư viện, bởi lẽ ngoài việc tăng cường khả
năng tiếp cận thông tin cho độc giả, thực hiện một cách hiệu quả nhất việc phân phối
thông tin, thì số hóa còn là một chiến lược hữu hiệu để bảo quản vốn tài liệu hiện có,
đặc biệt là tài liệu quý hiếm. Để thực hiện tốt công tác số hóa, các cơ quan thông tin
thư viện cần phải xây dựng lộ trình, lên kế hoạch phù hợp và đặc biệt chú trọng đến
việc lựa chọn giải pháp công nghệ để đảm bảo khả năng sử dụng lâu dài các kết quả số
hóa, trong đó cần quan tâm đến 3 chức năng cơ bản của phần mềm quản lý dữ liệu số
là hiển thị, xử lý và tìm kiếm thông tin.
Nhiều năm làm việc trong một thư viện chuyên ngành, nguồn kinh phí được cấp
hàng năm khá eo hẹp, nhưng lại có chức năng lưu giữ vốn tài liệu quý hiếm của dân
tộc, nên chúng tôi đã triển khai công tác số hóa từ khá sớm, tranh thủ sự giúp đỡ cả về
tài chính và kỹ thuật của các tổ chức quốc tế. Một trong những bài học kinh nghiệm
thu nhận được trong thời gian học tập tại nước ngoài mà chúng tôi thấy cần chia sẻ đó
là khi tiến hành bất cứ một hoạt động gì cũng cần xem xét những vấn đề sau: (1)
Answering the needs; (2) Getting started; (3) Reaping the benefits. Có thể hiểu một
cách nôm na là: trước hết bạn phải xác định thật rõ ràng tiềm năng, quy mô của thư
viện nơi mình công tác, cần và có thể đáp ứng được những nhu cầu nào của độc giả.
Từ đó lên phương án, xây dựng lộ trình và kế hoạch triển khai công việc sao cho phù
hợp với hoàn cảnh và điều kiện thực tế của thư viện. Sau đó cần quan tâm giải quyết
bài toán kinh tế: việc đầu tư triển khai công việc này sẽ đáp ứng những mục tiêu gì,
phục vụ đối tượng nào và sẽ đem lại những lợi ích gì về kinh tế, văn hóa và khoa học
xã hội trong bối cảnh đất nước còn nhiều khó khăn như hiện nay.
I/ KIH GHIỆM TROG LĨH VỰC SƯU TẦM & BẢO QUẢ TÀI
LIỆU
1. Công tác sưu tầm
Để đảm bảo độ chính xác cũng như chất lượng của nguồn tài liệu sưu tầm,
Viện chúng tôi đã bước đầu ứng dụng những tiến bộ của khoa học công nghệ vào việc
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
129
điều tra điền dã và thu thập tư liệu ở các địa phương. Các nhóm sưu tầm đã sử dụng
máy ảnh số và máy ghi âm, để ghi hình các tài liệu cần thu thập, (điều này tránh được
các lỗi không nên có trong các sn phNm sưu tm thc hin bng phương pháp th
công trưc ây, chng hn vic thiu t trong các v i: có câu i có v 9 t, v kia
li ch có 7; hay vic ch tc ánh ch t, rt khó khc phc khi x lý, ); vic ghi
ting khi phng vn các v túc N ho các a phương v truyn thng làng ngh, lch
s tư liu và di tích cũng rt hu ích. Hiu qu ca vic s dng máy nh k thut s
và máy ghi âm ghi li hình nh tư liu gc và âm thanh v ngun gc tư liu, s
giúp chúng ta có tư liu toàn văn v c âm thanh và hình nh kt ni vi CSDL thư
mc bên cnh phn phiên âm và dch nghĩa ca chúng, tin ti xây dng ngân hàng d
liu tng hp v vn tài liu iu tra in dã ã ưc tin hành trong nhiu năm qua.
iu này to iu kin m bo quyn li ca ngưi dùng tin mi nơi, mi lúc thông
qua vic phát trin ngun tin, các công c giúp kim soát, khai thác, tìm kim thông tin
và các dch v mà h ưc th hưng.
công tác sưu tm tư liu nói chung và tư liu Hán N ôm nói riêng ngày mt
hiu qu hơn, cũng cn quan tâm n vic kho sát và thng kê chi tit s tài liu ã
mua ưc các a phương, s chưa mua ưc (tìm lý do lên k hoch b sung
trong tương lai) và ánh giá giá tr ca ngun tài liu này trong thc t. Vì th v cơ
bn ã tránh ưc tình trng mua tài liu trùng và mua nhng tài liu ít giá tr, vì công
bi vá và bo qun tip sau ó là rt ln. iu quan trng na cn lưu ý là sau khi sưu
tm v, tư liu cn ưc ánh giá, phân loi và lên danh mc các tài liu thuc dng
c bn c bit quý him, có quy ch bo qun và khai thác hiu qu và hp lý
nht.
2) Công tác số hóa và bảo quản tư liệu Hán ôm
công tác bo qun t hiu qu cao, ngoài vic năng ng phát huy ni lc,
cn ch ng tranh th khai thác các ngun tài tr bên ngoài b sung nhng trang thit
b & các loi vt liu có chuNn cn thit phc v cho công tác bo qun và phc
ch. Tranh th các iu kin c cán b i hc tp và trao i kinh nghim vi các
nưc có truyn thng v s hoá và bo qun như: M, Trung Quc, N ht và ài Loan,
Chú ý t chc các workshop mi chuyên gia nưc ngoài n ging dy v k
thut s hoá và bo qun, nhm trang b nhng kin thc cn thit cho nhng cán b
làm công tác này, giúp h ch ng và t tin hơn trong công vic mình làm.
Hin 100% tài liu Hán N ôm bn gc ã ưc sao chp và phn ln tài liu quý
him ã ưc s hóa phc v bn c, bn gc ch ưc phc v trong nhng
trưng hp c bit nhm i chiu so sánh, gim thiu n mc ti a c gi làm
tn thương n tài liu gc. Cn tranh th s u tư ca nhà nưc và các t chc quc
t tng bưc trang b nhng thit b hin i cho công tác bo qun và s hoá tài
liu.
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
130
Bảo quản bằng hệ thống điều hoà trung tâm, kt hp vi vic dùng phn
mm Data-loger kim soát nhit và Nm trong kho. ây là công ngh
mi cho phép kim soát nhit và Nm mt cách chuNn xác nht qua h
thng máy vi tính. iu quan trng là phi tuân th cht ch nhng thông s
chuNn v h thng nhit , và Nm, tránh tình trng h thng iu hoà trung
tâm ch hot ng vào nhng ngày làm vic trong tun. N u như vy thì vic
dao ng v nhit và Nm trong kho s rt ln, nht là vào nhng ngày
ngh cui tun, và ngày l, lúc ó ch s chênh lch v nhit và Nm s
mc báo ng. iu này cn phi ưc quán trit mt cách trit , nu không
giá tr bo qun ca h thng iu hoà trung tâm s i ngưc li vi nhng
mong mun trong thc t. Các công trình nghiên cu trong khu vc và th gii
v lĩnh vc bo qun cũng ã ch rõ: to ra môi trưng thích hp và n nh v
nhit và Nm là phương pháp bo qun ti ưu nht cho ngun tài liu. Bi
vì s dao ng quá ln v nhit và Nm là yu t nguy hi ln nht i vi
các loi hình tài liu. S dao ng này s thúc Ny các phn ng hoá hc tăng
nhanh, phân hu các loi vt liu hu cơ, làm gim tui th ca tài liu mt
cách áng k. Mc ca các phn ng này gia tăng cùng vi iu kin nhit
, Nm và các hp cht acid hin có, s to iu kin lý tưng cho nm mc
và côn trùng phát trin, gây nguy hi cho tài liu nói chung và tài liu s nói
riêng.
Bảo quản bằng Microfilm, cho n nay, Microfilm vn ưc xem là phương
tin chính yu trong công tác bo qun ni dung ngun tài liu k c ca thư
vin và các cơ quan lưu tr, vi iu kin là quá trình sn xut và ch kho
tàng phi thc hin theo úng chuNn quc t. Kt qu nghiên cu ã chng
minh rng: nu ưc bo qun trong iu kin nhit và Nm lý tưng thì
tui th ca Microfilm có th kéo dài ti 500 năm.
Bảo quản bằng phương pháp số hóa, ây là phương pháp mi, h tr rt c
lc cho vic khai thác và bo qun tư liu, ưc hai trưng i hc ni ting
ca M là Yale và Cornell nghiên cu ưa vào s dng t tháng 11/92. Công
ngh này rt áng quan tâm, vì ưu th ca nó là cùng mt lúc có th kt hp
ưc c hai chc năng bo qun và khai thác, thông qua mng máy tính bn
c có th truy cp trc tuyn nhng tài liu mà h có nhu cu mi lúc, mi
nơi, và ng thi cho nhiu ngưi s dng, giúp ích rt nhiu cho ngưi
nghiên cu nói riêng và bn c nói chung. Ti nhiu Hi tho quc t, các
chuyên gia hàng u ca th gii v công tác bo qun ã khng nh s hoá là
công ngh mi có nhiu tin b, rt hu ích cho vic tìm kim thông tin, ng
thi cũng là phương tin bo qun gián tip, giúp bn c thun tin trong vic
tra cu, hn ch n mc ti a vic s dng trc tip bn gc, do vy giúp kéo
dài tui th ca ngun tài liu gc.
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
131
N gay t u nhng năm 1998, kho tư liu Hán N ôm ã ưc s hoá tuân th
nguyên tc: ưu tiên những tài liệu đặc biệt có giá trị hoặc ở trong tình trạng rách nát
mà có nhu cầu khai thác cao.
- Mt CSDL ơn l ã ưc xây dng vi các hình nh s hoá ngun tài liu Hán
N ôm có kt ni thông tin ting Vit và phn mm c duyt tài liu. Tt c u ưc
ghi trên ĩa CD-ROM. Tuỳ theo dày ca sách mà trên mt ĩa CD-ROM có th có
1 hoc nhiu cun sách, song dung lưng không vưt quá 500 Mb d liu. Các nh s
ưc to bi máy Scanner loi cht lưng cao, phân gii 300 DPI, sâu màu 24
bit, dng JPG (có nén khá cao), kích c nh trung bình 20 cm x 30 cm, dung lưng
trung bình 500 Kb.
- CSDL tp trung ưc thc hin t năm 2004 tr li ây, CSDL này tích hp
toàn b thông tin hin có trong b Di sn Hán N ôm Vit N am thư mc yu vi các
tài liu Hán N ôm ã ưc s hoá cha trong các ĩa CD. c gi có th trc tip tìm
tài liu trên máy tính mà không cn phi tra cu th công như trưc ây, và cũng có
th c nhng sách mình cn (nhng tài liu ã s hoá) trên mng LAN .
Hin chúng tôi ang dùng h iu hành qun lý mng
Window Server 2003, (h
iu hành ca Microsoft có kh năng qun lý mng vi bo mt cao), và h qun tr
CSDL MS SQL Server 2000
. Phn mm này có kh năng qun lý d liu ln, c bit
vi d liu nh s, phù hp vi CSDL Hán N ôm ã s hoá, vic qun lý ngưi dùng
và thông tin khá hoàn thin, tính bo mt cao, d s dng, có kh năng m rng và kt
xut vi mng IN TERN ET. khai thác các d liu Hán N ôm ã s hoá, chúng tôi
phi hp cùng công ty tin hc eK xây dng chương trình Qun lý c duyt thư tch
Hán N ôm. Phn mm này hot ng trên nn h qun tr CSDL ca hãng Microsoft
SQL Server 2000, giúp bn c có th c trc tip các tài liu Hán N ôm và tìm thông
tin trên máy tính cá nhân có ni mng LAN ca vin. Cũng ging như các phn mm
khác, phn mm này giúp ngưi c tìm kim thông tin theo nhiu tiêu chí khác nhau,
như: nhan sách, tên tác gi, ký hiu sách và các t khoá a danh, nhân vt, niên i
và ch . N goài ra c gi còn có th tìm n trang bn gc ca tài liu thông qua
vic tìm t hoc cm t bt kỳ nào t bn dch ca mt hoc toàn b s sách có trong
CSDL
Số hoá kho thác bản văn khắc Hán ôm, trong mi quan h hp tác vi các t
chc khoa hc nưc ngoài, Vin ã phi hp vi Hc vin Vin ông bác c
(E.F.E.O. ) và trưng Cao ng thc hành Pháp thc hin chp nh k thut s
các thác bn văn khc, ngoài vic ghi lưu trên cng, còn sao lưu trên các ĩa
CD-ROM cht lưng cao, nhm bo qun lâu dài và khai thác có hiu qu kho
tư liu văn khc vô giá này ca Vit N am. Do các thác bn văn khc có kích c
rt a dng và có nhng thác bn thuc din ngoi c (t 24 n 32 các t giy
dó ghép li), nên không th dùng máy quét scanner thông thưng ưc. Gii
pháp công ngh ưc la chn ây là dùng máy nh k thut s N IKON Cool
Pix 5.000, và mt h thng các thit b ph kèm theo như h thng hút gió (t
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
132
thit k theo cách th công) làm phng các thác bn trưc khi chp, mt Tivi
ni trc tip vi máy nh s, giúp ngưi chp có th t quan sát và iu chnh
nét ca nh, mc ích to ra nhng hình nh có cht lưng cao nht như có
th. Cho n thi im này công trình phi hp ba bên (gia Vin N ghiên cu
Hán N ôm vi E.F.E.O. và trưng Cao ng thc hành Pháp) ã chp xong kho
thác bn văn khc Hán N ôm vi trên 56.000 ơn v thác bn.
phc v cho vic khai thác ngun tin s hoá kho thác bn văn khc, chúng
tôi ã và ang xây dng CSDL các thác bn văn khc Hán N ôm, cung cp cho bn
c nhng ni dung cơ bn v các ơn v văn khc hin ang lưu gi ti Vin. Hy
vng ngoài vic tra cu thông tin trong b Thư mc Văn khc Hán N ôm Vit N am,
bn c có th khai thác kho thác bn văn khc Hán N ôm này thông qua mng
IN TERN ET hoc mng LAN ca Vin, ch không c trc tip trên bn gc, ây
cũng là cách bo qun gián tip i vi ngun tài liu quý him này.
Xây dựng CSDL toàn văn Tạp chí Hán ôm trên mạng ITERET:
qung bá các thành qu nghiên cu Hán N ôm trên mng Internet, phc v ngày
mt tt hơn nhu cu nghiên cu và khai thác ca gii nghiên cu Hán N ôm và
nhng ngưi có quan tâm n văn hóa Vit N am trong nưc, khu vc và trên
th gii. Trong chương trình hp tác gia Vin N ghiên cu Hán N ôm và Vin
Harvard-Yenching (Hoa Kỳ), Vin ã ưc tài tr mt khon kinh phí xây
dng Website ca Vin và CSDL toàn văn Tp chí Hán N ôm trc tuyn. Thư
vin Vin N ghiên cu Hán N ôm ã phi hp vi b phn tr s ca Tp chí
Hán N ôm trong vic xây dng CSDL toàn văn Tp chí Hán N ôm trc tuyn.
Vi CSDL này, ngưi c có th tip xúc trc tip vi Tp chí Hán N ôm toàn
văn (t lúc bt u xut bn năm 1984 n nay) mi lúc mi nơi, thông qua
các giao din v năm xut bn tp chí, s ca tp chí, tng mc lc tên tác gi,
tng mc lc nhan bài vit bng c ting Vit và ting Anh. ây là mt trong
nhng tp chí nghiên cu u tiên ưa ưc y ni dung toàn văn trên
mng IN TERN ET, thành công này ã ưc ghi nhn là một trong những sự
kiện nhất của báo chí Việt am năm 2006.
3) Kinh nghiệm bảo quản, lưu trữ dữ liệu phục vụ bạn đọc: Qua kinh nghim
thc t, chúng tôi thy rng không nên dùng mt gii pháp chung cho c vic bo
qun, lưu tr d liu và d liu phc v bn c. Vì mi công vic u có nhng
yêu cu và kh năng áp ng khác nhau. Do vy cn có 2 gii pháp riêng bit:
a. Bảo quản, lưu trữ dữ liệu: D liu cn ưc lưu tr trên 3 phương tin và
các v trí khác nhau.
1a. Lưu trên các ĩa CD-ROM hoc DVD cht lưng cao, c sau 2 n 3 năm li
sao lưu thêm mt bn khác.
2a. Lưu trên mt cng riêng bit có dung lưng ln, nơi an toàn có cp nht
d liu hàng tháng.
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
133
3a. Lưu trong cng ca máy ch (dung lưng ln, chia làm nhiu riêng bit),
d liu s chim mt khong trng nht nh trong cng ca máy ch, vic này
s kém an toàn khi máy ch ã có tui th cao, nhưng li thun tin cho vic cp
nht d liu trên mng.
b. Dữ liệu phục vụ bạn đọc trên mạng: D liu trong h qun tr CSDL SQL
Server ã ưc mã hoá và truyn ti trên mng. Quá trình mã hoá, tìm kim và hin
th d liu là mt quá trình phc tp và tiêu tn thi gian. Do vy d liu ưc
tìm kim, hin th nhanh, d liu cn ưc ti ưu hoá. i vi d liu Hán N ôm s
hoá có dung lưng ln, s lưng nhiu. Gii pháp ca Vin là thu nh nh sao cho
dung lưng nh ưc mã hoá và truyn ti trên mng t khong 100 – 200 kb. D
liu trong CSDL SQL Server thc cht ã ưc lưu tr úp, Card iu khin luôn
to mt khong trng trên tt c các ĩa cng lưu d liu vào khu vc ó. N gưi
qun tr mng còn phi thưng xuyên backup d liu sau mi ln cp nht hoc sa
cha CSDL. Vic backup t SQL Server rt thun tin, có th backup toàn b hoc
backup tng phn. Do vy d liu ây thc cht cũng ưc nhân 3:
1b. D liu ưc mã hoá trong SQL Server.
2b. Card iu khin t ng lưu tr d liu trên nhiu vùng ca cng.
3b. D liu backup ưc copy sang mt phương tin lưu tr khác ct gi bên ngoài
máy ch (lưu vào cng có dung lưng ln).
Trong nhiu năm qua chúng tôi ã và ang làm công vic to tin cho vic
xây dng mt thư vin s các tài liu Hán N ôm phc v gii nghiên cu Hán
N ôm c trong và ngoài nưc. Hy vng trong mt tương lai không xa, s phn u
xây dng thành công Thư vin s các tài liu Hán N ôm, vi nhng nhim v c th
sau ây:
1) T chc mc lc liên hp bao quát y các tài liu Hán N ôm theo mt
format chuNn thng nht, gii thiu toàn din các tài liu Hán N ôm c trong và
ngoài nưc;
2) Thưng xuyên cp nht và bo trì mng lưi thông tin thư mc các tài liu Hán
N ôm, m bo vic tìm kim d dàng qua các yu t tác gi, nhan , t khoá và
ch cho ngưi dùng tin trên toàn th gii;
3) Tng bưc ph bin các kt qu và công trình nghiên cu, to iu kin thun
li cho vic trao i thông tin v lĩnh vc Hán N ôm và các ngành khoa hc có liên
quan;
4) Duy trì vic gii thiu toàn văn Tp chí Hán N ôm trên mng IN TERN ET, chú ý
cp nht ni dung mi và b sung thêm phn tóm tt ni dung các bài vit bng
ting Anh;
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
134
5) Cung cp tài liu Hán N ôm nguyên ng và bn dch ting Vit m bo tho
mãn nhu cu ging dy và hc tp Hán N ôm trên mng IN TERN ET.
6) Tng bưc ci tin trang Web, chú ý c hai mt ni dung thông tin và công
ngh, áp ng nhu cu thông tin ngày mt cao ca gii nghiên cu Hán N ôm c
trong nưc và nưc ngoài. Các CSDL thư mc và tài liu Hán N ôm s hoá s là ni
dung quan trng ca trang Web ph bin thông tin Hán N ôm ti ngưi dùng tin
khp mi nơi trên th gii.
II/ GIẢI PHÁP LỰA CHỌ PHẦ MỀM VÀ XÂY DỰG CHƯƠG TRÌH
CHUYỂ ĐỔI DỮ LIỆU
Do kinh phí hn hp, nên phn ln các CSDL mà chúng tôi thc hin u ưc
xây dng da trên phn mm ISIS vi ch Vit là font ABC, ch Hán là font
TwinBridge ã phn nào áp ng ưc yêu cu m bo thông tin và to các sn phNm
thông tin hin có. Tuy nhiên qung bá rng rãi vn tài liu nói trên cho các nhà
nghiên cu trong và ngoài nưc s dng, thì cn phi tìm gii pháp ưa lên mng
IN TERN ET. Hin nay phn mm ISIS ã có mt s bn dành cho CSDL trên mng
nhưng không h tr các font ch Vit, k c Unicode còn các phn mm khác ang
ưc thương mi hóa Vit N am thì còn khá nhiu li và quá t i vi mt thư vin
chuyên ngành vi vn tài liu không ln như Thư vin Vin N ghiên cu Hán N ôm,
y là chưa k chy các phn mm này Vin phi trang b máy ch mnh vi
khon kinh phí không nh. Vi s biu ghi như ca Vin chúng tôi và giá các phn
mm ang chào hàng (30 ngàn USD) thì tính ra chi phí cho vic qun lý mt biu ghi
là quá cao, không tit kim, hơn na iu kin tài chính ca mt thư vin chuyên
ngành như chúng tôi không th áp ng ưc. gii quyt mâu thun gia nhu cu
công vic và ngun kinh phí ưc cp, chúng tôi ã quyt nh s dng phần mềm
mã nguồn mở Greenstone.
úng như li t gii thiu “Greenstone là mt b phn mm dùng xây dng
và phân phi các b sưu tp thư vin s. Phn mm này cung cp mt phương pháp
mi t chc và xut bn thông tin trên IN TERN ET hoc trên CD-ROM. Greenstone
là sn phNm ca d án N ew Zealand Digital Library ca trưng i hc University of
Waikato, ưc phát trin và phân phi vi s tham gia ca UN ESCO và Human Info
N GO. ây là phn mm mã ngun m ưc cung cp trên
theo
tho thun ăng kí GN U General Public License. Mc tiêu ca phn mm là cung cp
cho ngưi s dng, c bit là các trưng i hc, các thư vin hoc trong các tr s
công cng xây dng các thư vin s riêng ca h. Các thư vin s làm thay i nhanh
chóng cách thc thông tin ưc thu thp và ph bin trong các thành viên ca
UN ESCO và các cơ quan trong lĩnh vc giáo dc, khoa hc và văn hóa trên toàn th
gii, c bit là các quc gia ang phát trin.”
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
135
Cũng như phn mm ISIS, phn mm Greenstrone là phn mm mã ngun m
nên vic s dng không lo vi phm bn quyn. Tuy nhiên vic chuyn i biu ghi t
CSDL ISIS sang biu ghi CSDL Greenstone là không ơn gin vì hai CSDL này khác
nhau c v cu trúc và font ch: v cơ bn, CSDL ISIS dùng cu trúc MARC và font
ch ABC cho ting Vit và TwinBridge cho Hán N ôm còn CSDL Greenstone dùng
cu trúc Dublin Core và font ch Unicode. N hư vy nu mun chuyn i thì trưc ht
phi chuyn i c cu trúc và font ch, sau ó mi tính ti vic nhp vào biu ghi
Greenstone.
làm ưc iu này, chúng tôi ã xây dng mt chương trình chuyn i và
ã chuyn i thành công. Chương trình ưc thit k theo ch t ng, nên có th
chuyn i d liu 24/24 gi mà không cn có ngưi trc. iu này rt hu ích, c
bit là vi các CSDL ln vì có th s dng gi ngh chuyn i d liu. Quy trình
chuyn i ưc tin hành như sau: dùng ngôn ng format ca ISIS i cu trúc
biu ghi sau ó chương trình s chuyn i font ch và t ng nhp biu ghi vào
CSDL Greenstone. i vi biu ghi ting Vit, công vic ơn gin hơn vì ch phi
chuyn i 1 ln font ch t ABC sang Unicode. Còn i vi biu ghi ch Hán N ôm
và Trung Quc thì phc tp hơn nhiu, vì phi tách riêng phn ch Vit và phn ch
Hán N ôm hoc ch Trung Quc, sau ó i font ch Vit t ABC sang Unicode, tip
ó i ch Hán N ôm hoc ch Trung Quc t TwinBridge sang Unicode, cui cùng
ghép hai phn li vi nhau và nhp vào biu ghi Greenstone. Hin ti các CSDL thư
mc ISIS do chúng tôi thc hin, ã ưc chuyn sang CSDL Greenstone ưa lên
mng IN TERN ET như sau:
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
136
Dưi ây là ví d v biu ghi ã ưc chuyn i:
Biu ghi ISIS:
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
137
Biu ghi Greenstone tương
ng:
Còn ây là phn minh ho biu ghi Greenstone ch Hán:
- Kt qu tìm kim thông tin như sau:
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
138
Xin xem chi tit mt biu ghi::
Trong xu th phát trin hin nay ca hot ng thông tin – thư vin, vic ưa d
liu lên IN TERN ET chia s thông tin là vic làm cn thit và hu ích. a s các thư
vin nh hin ang dùng phn mm ISIS qun tr d liu, nhưng nu mun ưa d
liu lên IN TERN ET mà dùng wwwisis hoc webisis u vưng vn font ch vì
ISIS và các d bn ca nó chưa h tr Unicode, nu mua các phn mm tích hp hin
bán trên th trưng thì rt t gây lãng phí i vi 1 thư vin có s biu ghi không ln.
Theo kinh nghim ca chúng tôi, thì s dng phn mm Greenstone là mt gii pháp
tt nhưng do s khác nhau ca hai CSDL nên không th dùng chung ưc, vy cn
phi chuyn i. Giải pháp xây dựng chương trình chuyển đổi biểu ghi là giải pháp tối
ưu, vì nu không vic phi nhp li biu ghi s tn rt nhiu công sc và khó m bo
chính xác. S dng Greenstone còn có li ích khác na là nu mun xây dng CSDL
toàn văn, ta ch vic tích hp phn toàn văn vào biu ghi ca CSDL nêu trên. D liu
toàn văn có th dng HTML hoc tp PDF.
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
139
Dưi ây là ví d v 1 biu ghi có liên kt toàn văn HTML:
N u nháy vào liên kt “Toàn văn”, ta s c ưc toàn văn như trang minh ha dưi
ây:
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
140
Hin chúng tôi ã chuyn sang làm vic trong mt môi trưng mi, công vic
ch yu là áp ng nhu cu thông tin và tài liu tham kho cho ngưi dùng tin. Khác
vi trưc ây ch yu tip xúc và x lý tài liu trên giy, thì nay phn ln thi gian
chúng tôi làm vic vi các CSDL trc tuyn tim năng như: ProQuest, ebrary và
EBSCO, … làm tt công vic ca mình, hàng ngày chúng tôi phi download d liu
toàn văn trên các CSDL nói trên, to lp thành các CSDL theo ngành và môn hc
d dàng phc v i ngũ hc viên và ging viên ca trưng. D liu toàn văn
download ưc chúng tôi cũng ưa vào GREEN STON E d dàng phc v ngưi
dùng tin theo yêu cu và nguyn vng ca h.
Dưi ây là hình nh minh ho 2 CSDL thư mc (CSDL thư mc v sách và
CSDL toàn văn các lun án, lun văn liên quan n ni dung ging dy ca trưng)
ca Trưng Thương mi Anh quc (BSC British School of Commerce) ưc ưa vào
GREEN STON E, c gi có th tra cu bng c 2 hình thc offline và online.
Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội
141
Theo kinh nghim ca chúng tôi thì vic chuyn i d liu t phn mm ISIS
sang phn mm mã ngun m GREEN STON E và chia s thông tin s hóa trên mng
IN TERN ET là gii pháp la chn hp lý và kinh t cho các thư vin va và nh có
ngun tài chính khiêm tn. N ên chăng cn xây dng các T hp thư vin vic chia
s thông tin và s dng kinh phí trong vic mua sm trang thit b, máy móc và phn
mm hiu qu hơn. Gii pháp này giúp cho các ơn v nói trên d dàng to dng và
phc v thông tin cho c gi, cũng như có cơ hi qung bá và chia s tim năng
thông tin cho nhng ngưi có quan tâm n văn hóa, t nưc và con ngưi Vit N am
khp mi nơi trên th gii.
Tháng 11/2011
TÀI LIỆU THAM KHẢO
Chu Tuyết Lan. Gii pháp chuyn i d liu t ISIS sang Greenstone chia s
ngun thông tin trên mng Internet ca Thư vin Vin N ghiên cu Hán N ôm // Tp chí
Thư vin. – 2010. - S 2