Tải bản đầy đủ (.pdf) (11 trang)

Xây dựng kho báo cáo kết quả nghiên cứu số hóa ở Cục Thông tin Khoa học và Công nghệ Quốc gia

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (489.47 KB, 11 trang )


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

84

XÂY DỰG KHO BÁO CÁO KẾT QUẢ GHIÊ
CỨU SỐ HOÁ Ở CỤC THÔG TI KHOA HỌC VÀ
CÔG GHỆ QUỐC GIA
8


Cao Minh Kiểm - Phó Cục trưởng,
Cục Thông tin Khoa học và Công nghệ Quốc gia

Số hoá (tiếng Anh là Digitization) là quá trình chuyển đổi những thông tin trên
những đối tượng thực sang dạng điện tử hay còn gọi là dạng số. Những đối tượng thực
chứa thông tin có thể là các tài liệu dạng văn bản, hình ảnh, bản đồ, băng ghi âm, ghi
hình, trên các vật mang tin vật lý (trên giấy, trên phim, giấy ảnh, vi hình, băng ghi
âm băng ghi hình, v.v ). Kết quả của số hoá là những đối tượng thực được chuyển
sang đối tượng số dưới hình thức tệp tin. Những tệp tin này có thể được sử dụng rất
nhiều trong xây dựng những cơ sở dữ liệu có liên kết với tệp toàn văn. Mục đích của
số hoá có thể là: Tăng cường sự truy cập đến tài nguyên thông tin; Cải thiện chất
lượng dịch vụ cho những người dùng tin thông qua khả năng truy cập được cải thiện;
Giảm việc tiếp xúc trực tiếp đến những tài nguyên quý, hiếm, cổ hoặc được sử dụng
nhiều; Tạo ra bản sao lưu trữ; cho phép cơ quan, đơn vị phát triển hạ tầng kỹ thuật và
kỹ năng của nhân viên; Phát triển khả năng chia sẻ tài nguyên thông tin [IFLA, 2002].
Nhằm tăng cường khả năng truy cập đến tài nguyên thông tin, nâng cao chất
lượng dịch vụ, tăng cường chia sẻ tài nguyên thông tin, Cục thông tin đã xác định xây
dựng cơ sở dữ liệu (CSDL) toàn văn là một trong những hướng công tác quan trọng
của Cục Thông tin Khoa học và Công nghệ từ những năm đầu tiên của thế kỷ 21. Số
hoá tài liệu là một hoạt động rất quan trọng trong việc xây dựng những CSDL toàn văn


và đã được Cục Thông tin KH&CN Quốc gia triển khai từ năm 2004 [Phan Huy Quế
2004, 2006; Nguyễn Đức Trị, 2005]. Báo cáo kết quả nghiên cứu (KQNC) là một dạng
tài liệu xám rất có giá trị. Số hoá các báo cáo KQNC gắn liền với việc phát triển những
CSDL thư mục về báo cáo KQNC trở thành CSDL toàn văn với biểu ghi thư mục
được đính kèm với tệp toàn văn, cũng như tạo ra kho báo cáo KQNC dạng số hoá để
phục vụ lưu giữ, phổ biến, sử dụng hiệu quả hơn. Năm 2011, Cục Thông tin KH&CN
Quốc gia được Bộ Khoa học và Công nghệ giao nhiệm vụ chủ trì triển khai xây dựng
hệ thống thông tin nghiên cứu và phát triển (NC&PT) trong đó có việc số hoá các báo
cáo KQNC của các đề tài NC&PT cấp tỉnh và thành phố trực thuộc Trung ương, hình
thành kho báo cáo số hoá tập trung, xây dựng CSDL thư mục về các báo cáo KQNC.

8
Báo cáo tại Hội thảo "Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di
sản và phát triển kinh tế-xã hội", tổ chức tại Hà Nội, ngày 24/11/2011.

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

85

Hiện nay, để triển khai công tác số hoá tài liệu, Cục Thông tin KH&CN Quốc gia xây
dựng được một dây truyền số hoá hiện đại với hệ thống thiết bị số hoá Kirtas dựa trên công
nghệ hiện đại [Đỗ Như Thơ, 2011]. Báo cáo này trình bày một số nét về công tác số hoá và
xây dựng CSDL toàn văn về KQNC của Cục Thông tin KH&CN Quốc gia.
I. CƠ SỞ DỮ LIỆU KQC VÀ VIỆC HÌH THÀH KHO BÁO CÁO
KQC SỐ HOÁ
1. Cơ sở dữ liệu KQC
Theo quy định của pháp luật, kết quả nghiên cứu khoa học và phát triển công
nghệ (thường gọi tắt là nghiên cứu và phát triển
9
) (gọi tắt là KQNC) có sử dụng ngân

sách nhà nước, sau khi kết thúc, phải đăng ký, giao nộp và lưu giữ tại cơ quan nhà
nưc có thNm quyn [UBKHKTN N , 1980, B KH&CN , 2007]. Theo các quy nh
hin hành v ăng ký và giao np KQN C, Cc Thông tin KH&CN Quc gia là cơ
quan nhà nưc có thNm quyn cp ăng ký KQN C ca các nhim v KH&CN cp nhà
nưc và cp B. Các S KH&CN ca tnh, thành ph trc thuc Trung ương là cơ
quan nhà nưc có thNm quyn cp ăng ký KQN C ca các nhim v KH&CN cp tnh
và cp cơ s ti a phương.
Trên cơ s thc hin chc năng cơ quan nhà nưc có thNm quyn v ăng ký,
lưu gi báo cáo KQN C, Cc Thông tin KH&CN Quc gia ã thu nhn, lưu gi trên
trên 10.000 báo cáo KQN C ca các  tài N C&PT các cp. Cc ã CSDL c bit v
các báo cáo này và gi là CSDL KQN C. ây là CSDL quý, quy mô quc gia v mt
dng tài liu xám.  ph bin thông tin v ngun tài liu quý nàu t nhng cui
nhng 80's ca th k trưc, Vin Thông tin KHKT Trung ương (nay là Cc Thông tin
KH&CN Quc gia) ã tin hành xây dng CSDL thư mc v báo cáo KQN C. n ht
năm 2010, CSDL KQN C ã có trên 10.000 biu ghi thư mc.
T năm 2004, Cc Thông tin KH&CN Quc gia ã tin hành s hoá các báo
cáo KQN C và th nghim liên kt tp toàn văn báo cáo KQN C vi cơ s d liu
KQN C. D liu s lúc u ưc lưu trên ĩa CDROM và bn c sau khi tra cu
thông tin thư mc, căn c thông tin v ĩa CDROM cha tp tin toàn văn, bn c có
th yêu cu t ĩa CDROM cha d liu vào và c tp tin ó. N hư vy bn c có
th không cn yêu cu tìm tài liu gc dng giy trong kho báo cáo KQN C.
Gn ây, các tp tin báo cáo kt qu nghiên cu ưc t trên  cng máy tính
và ngưi dùng tin có th truy cp ngay tp tin báo cáo KQN C mà không cn yêu cu
mưn ĩa CDROM. Tuy nhiên, do quy nh không ưc ưa báo cáo KQN C lên mng
máy tính, Cc Thông tin KH&CN Quc gia mi to lp CSDL thư mc v báo cáo
KQN C và ưa lên mng VISTA  ngưi dùng tin tra cu thông tin thư mc. N hng
báo cáo KQN C s hoá ưc lưu gi tách bit, không ưa lên mng Internet. N gưi
dùng tin có th yêu cu cung cp báo cáo s hoá theo quy nh. Vi vic s hoá báo

9

Ting Anh là Research and Development (thưng vit tt R&D)

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

86

cáo KQN C, Cc Thông tin KH&CN Quc gia ã to lp ưc mt kho báo cáo KQN C
s hoá vi trên 10.000 tp báo cáo KQN C.
2. Cơ sở dữ liệu ghiên cứu và Phát triển
Theo quy nh, Cc Thông tin KH&CN Quc gia ch thc hin ăng ký và lưu
gi nhng báo cáo KQN C thuc các nhim v KH&CN cp nhà nưc và cp b có s
dng ngân sách nhà nưc. Báo cáo KQN C ca nhng nhim v KH&CN cp tnh có
s dng ngân sách nhà nưc ưc ăng ký và giao np ti các S KH&CN các tnh và
thành ph trc thuc Trung ương [B KH&CN , 2011]. Vic này dn n s phân tán
trong lưu gi báo cáo KQN C  các a phương.  to iu kin cho ngưi dùng tin
có th tra cu thông tin v nhim v KH&CN cp a phương cũng như khai thác
thông tin ca các báo cáo KQN C ca các nhim v KH&CN cp tnh nói trên, năm
2011, B KH&CN giao Cc Thông tin KH&CN Quc gia trin khai nhim v xây
dng h thng thông tin nghiên cu và phát trin, mà ni dung chính là xây dng
CSDL thư mc v  tài và báo cáo KQN C ca các nhim v KH&CN cp tnh, s
hoá báo cáo KQN C và hình thành kho lưu gi tp trung các báo cáo s hoá.
 thc hin nhim v này, Cc ã xây dng ưc phn mm qun lý thông tin
v  tài và báo cáo KQN C  cung cp cho các a phương s dng, t chc tp hun
s dng phn mm, x lý thông tin, trao i thông tin, v.v
Theo k hoch ưc giao, n ht năm 2011, Cc phi thu thp và s hoá
khong 6.000  cương  tài và báo cáo KQN C ca các a phương. Trên cơ s s
hoá s xây dng ưc sưu tp báo cáo KQN C ưc s hoá ti Cc Thông tin KH&CN
Quc gia, m bo bo qun lâu dài và phc v hiu qu theo nhng quy nh c th.
II. SỐ HOÁ BÁO CÁO KQC TẠI CỤC THÔG TI KHOA HỌC VÀ
CÔG GHỆ QUỐC GIA

Công tác s hoá tài liu KH&CN  Cc Thông tin KH&CN Quc gia có th
ưc chia thành hai thi kỳ:
- Thi kỳ 2004-2009: S hoá phân tán, s dng máy quét thông thưng
(scanner)
- Thi kỳ 2010-n nay: S hoá tp trung, s dng h thng s hoá KIRTAS
1. Công tác số hoá báo cáo KQC thời kỳ 2004-2009
Trong giai on này, công tác s hoá tài liu ưc giao trc tip cho nhng ơn
v chu trách nhim xây dng CSDL KQN C, ó là B phn ăng ký KQN C, ng thi
là nơi lưu gi các báo cáo KQN C ca các nhim v KH&CN .
Thit b s hoá là máy quét văn phòng, ch yu là máy quét ca HP.
Mc dù có s khác nhau nht nh v i tưng cn s hoá (bài báo hoc c
quyn báo cáo KQN C), nhưng nhng vn  la chn kh mu tài liu s là cơ bn
như nhau

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

87

a) Lựa chọn khổ mẫu dữ liệu số và phần mềm số hoá
Trên cơ s nhng tìm hiu v kh mu d liu trong lưu tr và trao i thông
tin, Cc Thông tin KH&CN Quc gia ã  xut la chn kh mu d liu s PDF –
Portable Document Format [Cao Minh Kim và Lê Xuân nh, 2002; Cao Minh
Kim, 2005]. Kh mu d liu PDF do Hãng Adobe phát trin và s dng cùng vi
chương trình quét Adobe Acrobat.
Lý do chn kh mu PDF là:
- PDF ưc s dng rt rng rãi như mt kh mu không ph thuc nn
(platform-independent) trong vic ph bin tài liu theo trang. Phn mm Adobe
Reader  c tp PDF ưc cung cp min phí và có trong hu ht các máy tính.
- Có th to liên kt gia các tài liu và bên trong tài liu;
- Có chú gii và mã ánh du (bookmark) làm mc lc (cho phép chuyn n

trang cn c d dàng);
- Có nh nh (thumbnail)  xem tng th;
- Có tin ích ánh ch s và tìm kim;
- PDF có kh năng lng vào trong tài liu nhng siêu d liu  phc v qun lý;
- Kh mu PDF có mt s dng bo v k thut, bao gm c mã hoá và vic
này có th hn ch ngưi bo qun tp m bo s truy cp lâu dài trong tương lai khi
có nhng thay i môi trưng công ngh.
- Kh mu PDF cho phép ngưi to d liu theo kh mu PDF quyt nh hn
ch vic rút d liu (copy-paste) ra  s dng cho mc ích khác.
Phn mm ADOBE ACROBAT ưc s dng  to lp tp PDF cho CSDL
STD và KQN C. Lý do la chn phn mm ADOPE ACROBAT là:
- Adobe Acrobat ưc s dng rt ph bin  Vit N am; d s dng ;
- Phn mm x lý nh quét nên nhng thông tin ưc s hoá s m bo tuyt
i trung thành vi bn gc;
- Có kh năng nhn dng ng thi nhiu trang tài liu trong cùng mt thi im;
- Có kh năng to Bookmark, link, header, footer, …;
- So vi các phn mm cùng chc năng x lý nh quét khác như: Photoshop,
PaintshopPro, FineReader, Fireworks thì các tp Acrobat (phn m rng là.pdf) có
dung lưng nh hơn, thao tác x lý nhanh hơn. ng thi, Acrobat cũng thích hp vi
nhiu loi máy quét hơn;
- Phn mm c tài liu theo kh mu PDF là Acrobat Reader là min phí, có
sn trên hu ht tt c máy tính.
b) Yêu cầu kỹ thuật đối với file số hoá
 m bo cht lưng tài liu s hoá nhưng ng thi duy trì kích thưc tp
tin hp lý, Cc Thông tin KH&CN Quc gia lúc ã quy nh như sau:

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

88


- Mt  im nh ti a 300 dpi và ti thiu 200 dpi.
- Mi tài liu trên giy s tương ng vi 1 tp tin.
Vi CSDL KQN C, i tưng cn s hoá là các tp báo cáo KQN C. Trên thc t
các tài liu này có  ln khác nhau, có th t mt vài chc trang n vài trăm trang.
Do báo báo cáo KQN C khá dày nên khi quét phi tháo bìa  có th quét tng trang.
c) Xử lý tệp tin sau khi quét
Tp tin sau khi quét ưc x lý li bng phn mm Adobe Acrobat. Các thao
tác gm:
- Kim tra s trang;
- Ct rim (Cropping);
- Làm Bookmark.
- t li tên tp.
Do báo cáo KQN C là tài liu dày, khó khăn cho ngưi dùng tin tìm c phn tài
liu mà h quan tâm nên Cc Thông tin KH&CN Quc gia ã thc hin vic làm
Bookmark cho tp tin toàn văn. BOOKMARK chính là vic lp mt trang mc lc cho
phép chuyn n mc ưc ánh du mt cách d dàng và tin li
d) Đặt tên tệp
Mt nguyên tc ưc  ra khi t tên tp tin là làm sao d xác nh ưc tài
liu gc ca tp tin s hoá, d nhn bit, d tìm li khi cn. Trên cơ s nguyên tc ó,
chúng tôi ã  xut cách t tên tp tin s hoá.
Đối với báo cáo kết quả nghiên cứu, tên tp tin s trùng vi s ăng ký cá bit
(ký hiu kho) ca báo cáo gc. Phn m rng là PDF. Thí d:
7000.pdf ; 7001.pdf
trong ó: 7000 và 7001 là s ăng ký cá bit/ký hiu kho ca báo cáo.
N u mt  tài có nhiu tp báo cáo (chuyên , báo cáo  tài nhánh, ) ưc
giao np, thì s ăng ký cá bit ca báo cáo i kèm s có thêm mt hu t, thí d:
7000-1, 7001-2. Phn u ca tên tp tin trưc phn m rng (pdf) ca báo cáo i kèm
vn s ưc t úng như ca nhưng s ăng ký cá bit: 7000-1.pdf, 7000-2.pdf,
2. Giai đoạn số hoá tập trung bằng hệ thống KIRTAS
Giai on này ưc t trưng vi vic hình thành b phn chuyên trách s hoá tài liu

ca Cc trên cơ s h thng thit b s hoá ca hãng KIRTAS. Hin nay Cc Thông
tin KH&CN Quc gia ưc trang b hai máy s hoá chuyên nghip: Kirtas APT1600
và Kabis (Hình 1).

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

89

a) Giới thiệu sơ bộ hệ thống số hoá KIRTAS

Hình 1. Thiết bị Kirtas APT1600 và Kabis

ây là nhng thit b ưc thit k phù hp vt nhng òi hi v s hóa tài liu
óng tp. V cơ bn, h thng vn hành và công sut thit b ca Kirtas APT1600 và
Kabis không khác nhau nhiu. Toàn b h thng s hóa ca hãng Kirtas u s dng
máy nh k thut s cht lưng cao, khác vi công ngh máy quét phng truyn thng
 sao chp hình nh. Mt máy nh k thut s Canon EOS-1Ds Mark II, 16,7 triu
im nh, cho phép chp liên tc mi trang trái và trang phi ca cun sách nh s
dng mt gương phn chiu qua ng kính camera EF tiêu c 24-70 mm.  phân gii
có th cài t  mc 300 ppi (pixel per inch) và có kh năng tăng n 600 ppi.
H thng s dng công ngh lt trang t ng SureTurn™ giúp gim bt thao
tác lt trang bng tay. Vi cánh tay rôbt ưc iu khin bng máy tính s dng mt
h thng hút chân không (h thng page luffers) cho phép nh nhàng lt ch mt trang
duy nht ti mt thi im. Cùng thi im ó, cun sách nh b phn nâng sách ưc
thit k theo công ngh SmartCradle ưc nh nhàng nâng lên, t ng dch chuyn 
bù vào vic gim s lưng trang sách bên phi khi chúng ưc lt gi và sao chp.
Công ngh SmartCradle gi sách m mt góc úng bng 110  trong sut quá trình
vn hành, to ra mt môi trưng áp sut thp  x lý nhng sách quý him và d
hng rách.  m bo vic ch lt duy nht mt trang, thit b s hóa ưc thit k
vi b cm bin Page Edge Sensor và thit b chia tách trang Page Separator. Thit b

Page Separator giúp chia tách trang khi b cm bin Page Edge Sensor giám sát vic
vn hành máy vi  chính xác cao và iu chnh u trang sách khi cn. ng thi,
nó liên tc kim tra nhm m bo cánh tay rôbt ch lt mt trang duy nht ti mt
thi im, và kim soát t xa khi có trang b b sót, khi ó, b cm bin Page Edge
Sensor s tm ngng vn hành máy  con ngưi thc hin thao tác iu chnh. Kirtas
APT 1600 và Kabis có th sao chp n 1600 trang mt gi.
Thông s k thut ca thit b Kirtas và KABIS cơ bn như sau:

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

90

- Tc  quét: 1600 trang/gi
- Hình nh: màu, en/trng
- nh dng u ra: TIFF, JPEG, RAW,…
- Sao chp: máy nh k tht s 16.7 triu im nh,  sâu 24 bit RGB, 4.992 x
3.228 im nh
-  phân gii 300 ppi có th tăng lên n 600 ppi
- Kích c trang giy: 11,4 cm x 17,8 cm n 27,9 cm x 35,5 cm
-  dày trang giy: 20 g/m2 n 300 g/m2
-  dày óng tp: 10,16 cm
- Kích c máy (Rng x Dài x Cao): 84 cm x 76 cm x 122 cm
- Tính chính xác: B cm bin Page Edge Sensor
- Thit b chia tách trang Page Seperator
- Trng lưng: 73 Kg
- N gun in: 110-240 VAC, 50/60 Hz, 15 A
- Trm x lý: Máy ch Kirtas Image Server.
N goài ra, h thng s hóa Kirtas còn tích hp phn mm BookScan Editor cho
phép căn chnh trang t ng theo khi d liu vi năng sut cao và phn mm nhn
dng ký t quang hc (OCR) cho 189 ngôn ng.

b) Khổ mẫu dữ liệu số và phần mềm xử lý
Khác vi vic quét bng máy quét văn phòng, nh dng d liu s mà h thng
Kirtas to ra gm 2 loi:
- Dữ liệu gốc: dng tp nh (TIFF, JPEG, RAW,…): do máy nh s to ra; mi
trang ưc quét tương ng vi 1 nh.
- Dữ liệu đầu ra: Do phn mm BookScan Editor x lý các tp nh gc và to
ra sau khi x lý.
Toàn b d liu gc ưc lưu trên Máy ch Kirtas Image Server và ưc x lý
bng phn mm BookScan Editor. Có th nói, h thng s hóa Kirtas thc s là lý
tưng cho nhng n phNm t tiêu chuNn thông thưng. i vi mt s tài liu in trên
giy quá mng như giy Pơluya, thì vic s hóa s ưc tin hành thông qua chc
năng chp bng tay cho tng trang và vic căn chnh sau ó s ưc thc hin như
thông thưng bng phn mm BookScan Editor (như ã nói  trên). H thng s hóa
này cho phép phc hi phn nào nhng tài liu s dng giy quá mng hay quá ng
màu theo thi gian (Hình 2).


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

91



Hình 2. Trang tài liệu gốc trước số hoá và trang tài liệu đã được số
hoá

Cc tip tc chn d liu u ra cui cùng là nh dng PDF.
c) Xử lý tệp tin đầu ra cuối cùng
i vi báo cáo KQN C, u ra cui cùng vn là mt tp tin cho mt báo cáo.
Tp tin này ưc sao và chuyn v b phn qun lý kho báo cáo s hoá. ơn v này có

trách nhim thc hin các bưc x lý tip theo gm:
- Làm Bookmark
- t/i tên tp cho phù hp.
d). Đặt tên tệp tin
Vic t tên tp ưc quy nh c th i vi báo cáo KQN C do Cc Thông tin
KH&CN Quc gia lưu gi (theo quy nh ca pháp lut) và vi tp tin báo cáo KQN C
do các S KH&CN ưa Cc s hoá (theo nhim v xây dng CSDL N ghiên cu và
phát trin). i vi các báo cáo KQN C do Cc cp ăng ký và lưu gi, vic t tên
vn gi như quy nh ã nêu  trên.
i vi báo cáo KQN C do các S KH&CN cp ăng ký và lưu gi,  m bo
không b trùng lp, tên tp tin ưc quy nh gm nhng yu t sau như sau:
Mã tỉnh-KQ + 4 số năm hoàn thành báo cáo-5 chữ của số thứ tự

trong ó Mã tỉnh là mã 3 ký t tên tnh theo tiêu chuNn TCVN 7587-2007.
Thí d, tp tin là ca báo cáo KQN C lưu ti S KH&CN Hà N i, báo cáo vit
năm 2005, s th t là 3, tên tp tin s là:
HNI-KQ2005-00003.pdf
trong ó:


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

92

HN I : Mã a phương cho Hà N i
KQ : Tp tin v KQN C
2005: N ăm 2005
00003: Báo cáo có s th t 3

Thí d, tp tin là ca báo cáo KQN C ca Tp H Chí Minh, năm vit báo cáo

2010, s th t là 201.
HCM-KQ2010-00201.pdf

đ) Một số nhận xét và kinh nghiệm khi sử dụng hệ thống số hoá tập trung
T khi chuyn i sang s dng h thng s hoá tp trung, có th thy nhng
ưu im quan trng như sau:
- Ưu im u tiên i vi s hoá KQN C bng h thng này là các báo cáo
KQN C không phi tháo bìa m bo s nguyên vn ca tài liu gc (trong giai on
trưc, các báo cáo KQN C phi tháo bìa và s hoá tng trang, có nguy cơ gây hng ti
liu gc);
- Kh năng x lý tp tin s hoá rt tt, thm chí giúp làm tăng cht lưng trang
d so vi bn gc (Hình 2);
- Cht lưng s hoá ng u;
- Tc  s hoá nhanh;
- D liu gc (dng JPEG, TIFF, hoc SAW) có th ưc s dng như u vào
vic xây dng nhng h thng qun lý tài liu s trong tương lai (có th qun lý n
tng trang tài liu).
Sau mt s năm s dng thit b Kirtas  s hóa tài liu ti Cc Thông tin
KH&CN Quc gia (N ASATI), chúng tôi rút ra mt s kinh nghim sau ây ( N hư
Thơ và Trn c Trung, 2011):
- Kirtas ưc thit k vi  rng ca gáy sách hay  dày óng tp  mc tiêu
chuNn  phù hp và tương ng vi h thng hơi thi t phía thành máy,  trong quá
trình s hóa, tng trang sách ưc thi tơi giúp cho cánh tay lt trang hot ng d
dàng. Do ó, nu sách cn s hóa quá mng thì nó phi ưc t trên mt quyn sách
khác  bên phi trang sách  tăng  dày óng tp n mc cho phép h thng hơi
thi và cánh tay lt trang hot ng;.
- Trong quá trình s hóa, ngưi vn hành cn quan sát và theo dõi s liên tc
theo trt t ca s trang (tránh b úp trang). Khi thy trang sách quá phng, cn dùng
tay vut nh  hai trang sách tri u sang hai phía, như vy vic s hóa s t cht
lưng tt nht.


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

93

- i vi sách có  dày gáy ln, sau khong 50 - 60 trang sách, cn dng máy
 ch  tm thi  máy t ng căn chnh tâm ca gáy sách vào chính gia hai khe
 giá sách.
- Cn quan tâm n  rng ca tài liu s hóa  iu chnh máy cho hp lý và
chính xác. Vic này nên ưc làm ngay t u cho các tài liu có cùng  rng trong
cùng mt thi gian máy hot ng  tit kim thi gian căn chnh máy.
KẾT LUẬ
Xây dng thư vin in t/thư vin s là mt trong nhng xu th quan trng
trong hot ng thông tin-thư vin. S hoá là mt hot ng không th thiu  to lp
ra ngun tài nguyên thông tin s hoá.
Báo cáo KQN C ca các nhim v KH&CN các cp là mt dng tài nguyên
thông tin rt có giá tr, cn ưc lưu gi, s dng hiu qu. S hoá các báo cáo KQN C
góp phn tăng cưng kh năng lưu gi, ph bin và s dng ngun tài nguyên giá tr
này. Cc Thông tin KH&CN Quc gia hin nay ang trin khai hot ng s hoá các
báo cáo KQN C bng h thng s hoá hin i ca hãng Kirtas.
Công tác s ã to ra mt kho lưu gi báo cáo KQN C vi gn 16.000 báo cáo
KQN C. ây là mt tài nguyên thông tin giá tr, phc v cho công tác qun lý nhà nưc
v KH&CN cũng như m bo thông tin cho hot ng nghiên cu và phát trin.

TÀI LIỆU THAM KHẢO

1. B KH&CN , 2007. Quyt nh s 03/2007/Q-BKHCN ngày 16/3/2007 ca B
trưng B KH&CN v vic ban hành Quy ch ăng ký, lưu gi và s dng kt qu
thc hin nhim v KH&CN .
2. B KH&CN , 2011. Thông tư s 04/2011/TT-BKHCN ngày 20/4/2011 ca B

trưng B KH&CN v vic sa i, b sung mt s iu ca Quy ch ăng ký, lưu
gi và s dng kt qu nhim v KH&CN ban hành kèm theo Quyt nh s
03/2007/Q-BKHCN .
3. Cao Minh Kim (2005). V kh mu d liu văn bn trong xây dng và phát
trin thư vin in t. Báo cáo trình bày ti Hi ngh Thư vin in t, t
chc ti Trung tâm thông tin Khoa hc và Công ngh Quc gia, Hà N i, ngày
4/3//2005
4. Cao Minh Kim (2006). Tìm hiu mt s vn  v chuNn kh mu d liu cho
thư vin in t. K yu hi tho Tăng cưng công tác tiêu chuNn hóa trong
hot ng Thông tin - tư liu. Hà N i: Trung tâm Thông tin KH&CN Quc gia,
2006. tr. 27-40.
5. Cao Minh Kim (2008). Mt s vn  phát trin sn phNm và dch v ca
Trung tâm Thông tin Khoa hc và Công ngh Quc gia. Báo cáo trình bày ti
Hi tho "N âng cao cht lưng sn phNm và dch v thông tin phc v công tác

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

94

nghiên cu và ào to ti Hc vin Chính tr-Hành chính Quc gia H Chí
Minh" t chc ti Hc vin Chính tr-Hành chính Quc gia H Chí Minh, Hà
N i, ngày 10/6/2008.
6. Cao Minh Kim (2010). Mt s sn phNm và dch v thông tin phân tích ca
Cc Thông tin Khoa hc và Công ngh Quc gia. Báo cáo trình bày ti Hi
tho "Tăng cưng các sn phNm thông tin thư vin phc v phá trin và hi
nhp", do Cc Thông tin KH&CN Quc gia t chc ti Hà N i, t ngày 12-
13/10/2010
7. Cao Minh Kim và Lê Xuân nh (2002). Mt s suy nghĩ v chuNn d liu trong
liên kt mng. Tp chí Thông tin và Tư liu, s 3/2002. tr. 7-13
8.  N hư Thơ và Trn c Trung (2011). S hóa vi h thng Kirtas. Tp chí

Thông tin và Tư liu, s 2, 2011.
9. IFLA (2002). Guidelines for digitization projects for collections and holdings in the
public domain, particularly those held by libraries and archives. March 2002.
10. N guyn c Tr (2005). Xây dng cơ s d liu toàn văn tài liu khoa hc và công
ngh Vit N am ti Trung tâm Thông tin Khoa hc và Công ngh Quc gia. K yu
Hi ngh ngành Thông tin Khoa hc và công ngh - Ln th V. Hà N i : Trung tâm
Thông tin KH&CN Quc gia, 2005. -tr.131-135.
11. Phan Huy Qu (2004). Th nghim ưa báo cáo kt qu nghiên cu vào cơ s d
liu thư mc ti Trung tâm Thông tin KHCN Quc gia. Tp chí Thông tin và Tư
liu, s 2/2004. Tr. 11-16.
12. Phan Huy Qu (2006). S hoá báo cáo kt qu nghiên cu ti Trung tâm Thông tin
KHCN Quc gia – N hng kinh nghim thc tin. Tp chí Thông tin và Tư liu, s
1/2006. Tr. 24-28.
13. U ban Khoa hc K thut N hà nưc (1980). Quyt nh s 271/Q ngày 6/6/1980
ca Ch nhim U ban KHKT N hà nưc;

×