Tải bản đầy đủ (.pdf) (5 trang)

Một số vấn đề về số hóa tài liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (167.4 KB, 5 trang )


Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

49

MỘT SỐ VẤ ĐỀ VỀ SỐ HÓA TÀI LIỆU

Dương Duy Tiến – Cán bộ Thư viện tỉnh ghệ An

I. ĐẶT VẤ ĐỀ
Hiện nay, sự phát triển nhanh chóng của kĩ thuật công nghệ thông tin đã hỗ trợ đắc
lực cho nhu cầu truyền tin và khai thác thông tin dữ liệu của nhân loại. Trong đó, hệ
thống thông tin điện tử Intenet được mọi người quan tâm sử dụng nhiều nhất nhờ tính
thông dụng trong việc giao tiếp, tìm kiếm và đọc thông tin bằng tính năng ưu việt của
các phần mềm ứng dụng về quản lý, số hóa tài liệu.
Trên hệ thống thông tin điện tử Intenet không chỉ diễn ra sự giao tiếp, phổ cập
thông tin mà còn hình thành nên một thị trường thông tin hàng hóa rộng lớn, nhiều
tiềm năng. Bên cạnh đó, do yêu cầu của quá trình hội nhập đang diễn ra mạnh mẽ, việc
công khai minh bạch các văn bản, chính sách của nhà nước đến mọi đối tượng trở
thành vấn đề bắt buộc; Đặc biệt việc nâng cao chất lượng thông tin phục vụ nhu cầu
nghiên cứu quyết định đầu tư, sản xuất cho các nhà đầu tư trong và ngoài nước trên
lĩnh vực quản lý nhà nước, kinh tế, văn hóa, xã hội, lịch sử truyền thống cần phải được
chú trọng; Một trong những nguồn thông tin được các nhà đầu tư quan tâm nhiều nhất
là thông tin từ tài liệu lưu trữ.
Mặt khác dưới góc độ quản lý nhà nước, việc bảo quản và sử dụng có hiệu quả giá
trị tài liệu lưu trữ có ý nghĩa cực kỳ quan trọng đối với kinh tế, xã hội, lịch sử của mỗi
quốc gia và địa phương. Vì vậy, song song với chương trình cung cấp thông tin không
thụ động thông qua hệ thống thông tin điện tử Intenet (Trang Web điện tử) và hệ thống
thông tin viễn thông thì việc ứng dụng các công nghệ, kĩ thuật hiện đại vào bảo quản
lâu dài các tài liệu có giá trị (dần thay cho phương pháp bảo quản truyền thống) trở
thành một nhiệm vụ cấp bách của công tác lưu trữ.


Hiện nay, một số Thư viện lớn trong nước như Thư viện Quốc gia, Thư viện tổng
hợp Hồ Chí Minh, các Trung tâm lưu trữ đã ứng dụng việc lưu trữ tài liệu dưới dạng
số hóa thông qua các phần mềm xử lý chuyên. Với hệ thống lưu trữ điện tử, tài liệu lưu
trữ đã phát huy tối đa hiệu quả trong việc phục vụ vào lợi ích phát triển kinh tế, văn
hóa và giáo dục truyền thống lịch sử cho thế hệ trẻ.
Nghệ An là tỉnh có diện tích lớn nhất Việt Nam thuộc vùng Bắc Trung Bộ, phía
bắc giáp tỉnh Thanh Hóa, phía nam giáp tỉnh Hà Tĩnh, phía tây giáp Lào, phía đông
giáp biển Đông. Nghệ An là mảnh đất có truyền thống hiếu học, có nhiều dòng họ,
nhiều làng học nổi tiếng, là cái nôi sản sinh ra cho đất nước nhiều danh tướng, lương
thần, nhiều nhà khoa học, nhà văn hóa có tầm cỡ quốc gia và quốc tế. Là nơi hội tụ và
tích lũy các giá trị vật chất và tinh thần tạo nên một không gian văn hóa, một số di sản
tài liệu quý hiếm, nhất là tài liệu Hán Nôm phong phú và đặc sắc của Việt Nam. Tuy
nhiên, nhiều di sản tài liệu quý hiếm đó đang bị hủy hoại dần và có nguy cơ bị mất đi

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

50

theo thời gian. Khá nhiều tài liệu trên địa bàn tỉnh bị thất thoát và tiêu hủy trong thời
kỳ chiến tranh, một số hư hỏng do thiên tai, lũ lụt và do khí hậu khắc nghiệt của miền
Trung. Kho sách địa chí Thư viện Nghệ An có 10.000 bản trong đó có hàng trăm cuốn
sách quý như Hán Nôm, sách báo xuất bản trong Kháng chiến chống Pháp… cũng khó
bảo quản do thiếu phương tiện bảo quản hiện đại.
Vì vậy, trong bài viết này tôi mạnh dạn xin trao đổi một số vấn đề quan tâm hiện
nay đối với công tác số hóa tài liệu trên địa bàn tỉnh Nghệ An vì mục đích bảo quản và
phục vụ rộng rãi trong cộng đồng.
II. MỘT SỐ KHÁI IỆM CƠ BẢ
Số hóa là gì? vì sao phải số hóa tài liệu?
Theo khái niệm của công nghệ thông tin thì số hóa là việc biến đổi các loại hình
thông tin sang thông tin số (các bit thông tin dữ liệu). Các loại hình tài liệu (giấy, ảnh,

phim…) sau khi qua công đoạn xử lý bằng các thiết bị chuyên ngành và phần mềm
ứng dụng sẽ được số hóa thành các bit mang thông tin dữ liệu trên đường truyền
Intenet, tạo nên những cơ sở dữ liệu mở, dễ dàng tìm kiếm, trao đổi và chia sẻ kiếm
thức một cách thuận tiện nhất.
Hiện nay, khối kiến thức khổng lồ của nhân loại hình thành trong hàng trăm năm
nay, trong đó có cả tài liệu lưu trữ đang tồn tại dưới dạng tài liệu giấy như: Văn bản,
sách, hình ảnh… trở thành một sự cản trở rất lớn cho người khai thác sử dụng bởi tính
hữu dụng, khả năng tiếp cận xã hội rất hạn chế. Mặt khác, các tài liệu ở dạng này phải
chịu tác động cơ học của con người, môi trường nên việc lưu giữ, kéo dài thời gian
tuổi thọ của tài liệu đòi hỏi rất công phu, tốn kém. Và như đã nói ở trên, các dữ liệu
được đưa lên hệ thống thông tin điện tử dưới dạng hàng hóa thông tin cũng phải tuân
theo những quy luật cạnh tranh nhất định.
Tuy nhiên, chúng ta cũng dễ dàng nhận thấy, việc quản lý và cung cấp thông tin tài
liệu lưu trữ điện tử chứa đựng những rủi ro như: Cơ sở dữ liệu bị xóa, thông tin bị
chỉnh sửa…Chính vì vậy cần thiết kế một hệ thống lưu giữ tránh tình trạng xâm nhập
trái phép, thực hiện chế độ quản lý tài liệu điện tử như là một bộ phận tổng thể các hồ
sơ tài liệu, thông tin của cơ quan và cần có khuôn khổ chiến lược đối với tài liệu lưu
trữ điện tử. Theo khái niệm của các chuyên gia, hệ thống lưu giữ tài liệu điện tử là một
quy trình khép kín giúp các tài liệu được an toàn và được quản lý để tài liệu đó cùng
với các thông tin, hoàn cảnh và cấu trúc của nó sẽ được giữ lại (Tính xác thực, độ tin
cậy, tính an toàn, mối quan hệ với các đối tượng dữ liệu có liên quan, tính hữu dụng và
khả năng tiếp cận). Tổ chức tiêu chuNn quc t (ISO) ã chính thc ban hành tiêu
chuNn quc t v công tác văn thư ISO 15489, trong tiêu chuNn này cũng ã ưa ra mt
chuNn mc  các cơ quan, t chc có th s dng nhm ánh giá thc tin và h
thng lưu tr tài liu in t.
N hư chúng ta ã bit, công tác s hóa tài liu ã và ang t ra nhim v cp bách
trưc nhng nguy cơ hư hng, xung cp trm trng do nhiu tác ng trong ó có

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội


51

môi trưng. Vy làm th nào  bo qun ưc vn tài liu này, ó là nhim v ca
chúng tôi và ca tt c các bn nht là nhng ngưi làm công tác Thư vin.
Trưc ht,  công vic này có hiu qu, cn có s quan tâm ca lãnh o các a
phương, ban ngành và chú ý nâng cao ý thc ca cán b, nhân viên v qun lý, bo v
tài liu lưu tr in t (Trong h thng qun lý cht lưng ISO  cơ quan hành chính
N hà nưc rt chú trng n vn  này) bng cách xây dng quy ch v qun lý tài
liu in t trong ơn v, phân cp mt cách c th trách nhim và quyn hn x lý,
tip cn h sơ, tài liu in t. Các tài liu in t ca mi cá nhân phi ưc lp h sơ
công vic mt cách rõ ràng dưi s h tr ca phn mm ng dng (Ví d phn mm
h sơ công vic). Mt yu t na quyt nh cht lưng, hiu qu ca vic ng dng
công ngh thông tin vào bo qun, khai thác s dng tài liu lưu tr in t là s h
tr c lc và phi hp cht ch ca cán b tin hc.
 xây dng tài liu s phc v lâu dài, n nh và hp lý nht thì ta phi s dng
mt gii pháp qun lý tài liu s trên cng giao tip in t mà sn phNm ca nó là các
b sưu tp s, các cơ s d liu in t.
Vậy như thế nào là Bộ sưu tập số?
B sưu tp s là mt tp hp có t chc nhiu tài liu ã ưc s hóa dưi nhiu
hình thc khác nhau (dng text, hình nh, audio…) v mt ch  nào ó.
N hư vy, mt thư vin s có th bao gm nhiu b sưu tp theo các ch  khác
nhau, có th do tp th hoc cá nhân t xây dng hoc trao i, mua bán; có th nm
trong lưu tr ca ơn v hoc nm ngoài ơn v (thông qua mt kênh cung cp khác).
III. QUY TRÌH THỰC HIỆ
 công tác bo qun, khai thác s dng tài liu lưu tr in t ít tn kém, công
vic u tiên chúng ta cn phi làm là h sơ, tài liu hình thành trong x lý công vic
ca tng cá nhân phi ưc phân loi và qun lý thng nht trong h thng cơ s d
liu. Tuyt i không t ý xóa hoc thay i thông tin ca tài liu, hàng năm tin hành
ánh giá, x lý cht lưng và chng xâm nhp ca tác nhân gây hi. Các h sơ, tài liu
in t n hn np lưu s ưc chuyên giao y  cho cơ quan ph trách lưu tr

phân loi, lp mã s in t bo qun trong h thng lưu tr in t; N hư vy chúng ta
s gim i công on tn kém s hóa t tài liu giy sang tài liu in t.
1. Lựa chọn tài liệu
i vi Thư vin, vic s hóa toàn b kho sách là iu khó thc hin, ó là mt
thc t không th ph nhn. Do ó, chúng ta cn phi ưa ra các tiêu chí làm căn c
la chn tài liu cn thit s hóa, c th có nhng tiêu chí mà ta cn quan tâm:
* Các loại tài liệu đặc biệt
Là nhng loi tài liu c bn, tài liu quý him, tài liu có thi gian xut bn ã
lâu như: Tài liu Hán N ôm, a chí, Tài liu xut bn trong kháng chin chng Pháp

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

52

* ội dung tài liệu
La chn các ch  theo ni dung tài liu như: Khoa hc xã hi, Khoa hc t
nhiên, N ông nghip, Khoa hc kĩ thut, tài liu có tn sut s dng cao
* Điều kiện bảo quản
Tùy vào tình hình c th ca tng thư vin mà quyt nh la chn tài liu ưa vào
như ưu tiên các loi tài liu trên giy d rách nát
* Tình trạng bản quyền
Vn  bn quyn thc s ang là rào cn làm nhng ngưi có tâm huyt vi vic
s hóa nn lòng. iu ó xy ra vì chúng ta chưa nm vng nhng quy nh c th v
vic bo h quyn tác gi a phương. Chúng ta có th tham kho Khon a,  iu 25
Lut s hu trí tu năm 2005
* hóm người dùng
Cũng tùy vào tng thư vin mà chúng ta xác nh mc  ưu tiên phc v như: Cán
b lãnh o, cán b nghiên cu, Cán b kĩ thut, Sinh viên, Giáo viên và các i tưng
khác
2. Lựa chọn công nghệ

Vic la chn công ngh phi áp ng ưc các yêu cu:
-  tin cy
- Thun tin, d s dng
- áp ng y  các yêu cu v chuNn nghip v Thư vin
- Phân quyn, bo mt
- Trao i d liu
Cơ s h tng: H thng Internet, h thng máy ch, cng giao tip in t, phn
mm thư vin.
3. Số hóa nguồn tài nguyên
ây là công on òi hi s cNn thn, t m qua nhiu giai on và phi u tư
nhiu công sc, kinh phí. Hin nay thit b s hóa ã có nhng bưc tin rõ rt, nu
trưc ây  s hóa mt cun sách dày 2000 trang thì phi mt gn 1 tun  scan tng
trang nhưng hin nay cũng vi cun sách ó ch mt vài gi là cho ra mt sn phNm s
m bo cht lưng tt, sc nét, hình nh p, ging 100% bn gc và c bit còn cho
phép t ng to các siêu d liu mô t và siêu d liu cu trúc ca tài liu  nh
dng XML. Hin nay  Vit nam ã có các thit b s hóa tài liu ca công ngh
KIRTAS APT 1200, công ngh này cùng vi thit b BookScan APT 1200 có th giúp
các thư vin có th s hóa ngun tài liu vi s lưng ln, giá c hp lý và m bo
cht lưng, thit b nhn dng quang hc OCR. c bit là công ngh KIRTAS APT

Xây dựng và chia sẻ nguồn lực thông tin địa phương dạng số phục vụ bảo tồn di sản và phát triển kinh tế - xã hội

53

1200 có mt phn mm biên tp BookScan Editor cho phép t ng biên tp, to siêu
d liu theo yêu cu; BookScan APT 1200 không làm hư hng tài liu gc do không
phi tháo gáy tài liu i vi tài liu có  dày trang khi thc hin Scan.
4. Biên mục và thiết lập các siêu dữ liệu liên kết
* Tạo siêu dữ liệu
Có 3 dng siêu d liu: Siêu d liu mô t (mô t các thông tin v tài liu); Siêu d

liu cu trúc (mô t liên kt gia các i tưng thông tin như mc lc, chương,
phn…) và Siêu d liu qun tr (kích c tp tin, nh dng tài liu)
* Mô tả dữ liệu
Có th mô t tài liu theo mt trong các chuNn: MARC, Dublin Core
Vi s phát trin mnh m ca khoa hc và công ngh, cùng vi xu th hi nhp là
nhng òi hi và thách thc cho ngành Thông tin thư vin, nó òi hi phi có nhng
i mi hot ng, bt kp nhng tin b ca thi i, phc v c lc cho s nghip
công nghip hóa, hin i hóa t nưc.
IV. KẾT LUẬ
 công tác bo qun, khai thác s dng tài liu lưu tr in t ít tn kém, công
vic u tiên chúng ta cn phi làm là lp và x lý h sơ, tài liu hình thành trong x
lý công vic ca tng cá nhân phi ưc phân loi và qun lý thng nht trong h
thng cơ s d liu. Tuyt i không t ý xóa hoc thay i thông tin ca tài liu, hàng
năm tin hành ánh giá, x lý cht lưng và chng xâm nhp ca tác nhân gây hi.
Các h sơ, tài liu in t n hn np lưu s ưc chuyên giao y  cho cơ quan
ph trách lưu tr phân loi, lp mã s in t bo qun trong h thng lưu tr in t;
N hư vy chúng ta s gim i công on tn kém s hóa t tài liu giy sang tài liu
in t.
Xây dng h thng bo qun, khai thác s dng tài liu in t song song vi bo
qun tài liu giy hin nay tr thành vn  rt ưc quan tâm ca các quc gia tiên
tin. i vi chúng ta,  công tác này i vào n np, cn có s ch o thng nht, s
n lc ca các a phương, ban ngành và ý thc trách nhim ca tng cán b công
chc i vi tài liu in t nhm tng bưc ưa công tác này theo hưng hin i./.

×