Tải bản đầy đủ (.pdf) (10 trang)

Tiến trình phát triển lý thuyết khoa học về hệ thống tìm tin một tiền đề cho sự hình thành và phát triển thư viện điện tử

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (332.12 KB, 10 trang )

TIẾN TRÌNH PHÁT TRIỂN LÝ THUYẾT KHOA HỌC VỀ HỆ THỐNG TÌM TIN
– MỘT TIỀN ĐỀ CHO SỰ HÌNH THÀNH VÀ PHÁT TRIỂN THƯ VIỆN ĐIỆN TỬ
N

t*

Tóm tắt: Bài viết đề cập khái quát ba giai đoạn phát triển lý thuyết khoa học hệ thống tìm
tin: Giai đoạn phát triển cơ giới hóa các q trình tìm tin; Giai đoạn phát triển ngơn ngữ
- logic hệ thống tìm tin và giai đoạn phát triển hệ thống tìm tin tích hợp tự động hóa.Trong
mỗi giai đoạn có những đặc điểm và thành tựu nổi bật riêng biệt làm nền tảng lý luận
khoa học và cơ sở thực tiễn quan trọng cho việc hình thành và phát triển thư viện điện tử
hiện nay. Bài viết này còn nêu ra một số thành tựu nổi bật trong lĩnh vực xây dựng và phát
triển hệ thống thơng tin-thư viện tích hợp tự động hóa và thư viện điện tử trong mấy năm
gần đây của một số quốc gia tiêu biểu trên thế giới.
Tiến trình phát triển lý thuyết khoa học hệ thống tìm tin có thể phân chia thành ba giai
đoạn:
1. Giai đoạn cơ giới hóa các q trình tìm tin
1.1. N ữ g đặc diểm c í
Giai đoạn này diễn ra trên thế giới vào khoảng những năm thứ 50 của thế kỷ XX và nó
có những nét đặc điểm sau đây:
- Tuyệt đối hóa mặt kỹ thuật của vấn đề tìm tin: Nhiệm vụ xây dựng các hệ thống tìm
tin cơ giói hóa là tiến hành nghiên cứu tạo ra các thiết bị kỹ thuật kiểu “ Thư viện điện tử”,
“Cán bộ thơng tin - thư viện tự động hóa” vv…
- Phương pháp tiếp cận giản đơn với các vấn đề tìm tin: Các chun gia thơng tin cho
rằng hệ thống tìm tin cơ giới hóa là một hệ thống bao gồm nhiều thành tố khác nhau, chỉ
như là một cỗ máy lưu trữ, bảo quản và cung cấp thông tin.
- Đánh giá thiếu khách quan và không công bằng đối với các phương tiện thư viện thư mục truyền thống, nhiều khi phê phán kịch liệt chúng (Theo lối phủ định hồn tồn,
trịch thượng và bất cơng đối với các phương tiện thư viện - thư mục thủ công truyền
thống)
- Các cơng trình nghiên cứu cơ giới hóa q trình tìm tin của hệ thống tìm tin chỉ hạn
chế trong từng cơ quan, khơng được mở rộng, các nhóm nghiên cứu về vấn đề này cũng


không được liên kết với nhau. Thực chất hệ thống tìm tin cơ giới hóa ở giai đoạn này là
mang tính “Kinh tế tự nhiên tự phát”, khơng có sự liên quan với nhau giữa các cơ quan
hoặc nhóm nghiên cứu vấn đề này
Tóm lại, đặc điểm của giai đoạn này là thuần túy kỹ thuật, cách hiểu giản đơn về thực
chất vấn đề tìm tin. Có thể đặt tên cho giai đoạn này là “Giai đoạn phát triển lý thuyết hệ
thống tìm tin cơ giới hóa”
Để cơ giới hóa q trình nào đó, đương nhiên là phải sử dụng các phương tiện kỹ thuật
(các công cụ kỹ thuật). Các công cụ kỹ thuật tiên tiến và hiện đại nhất của giai đoạn phát
*

Khoa Thông tin – Thư viện, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia
Hà Nội


triển lịch sử nhân loại ở thời kỳ này đã được vận dụng một cách mạnh mẽ vào các quá
trình tìm tin. [7]
Kỹ thuật phíếu lỗ đã được sử dụng để cơ giới hóa các thao tác thống kê vào cuối thế kỷ
XIX: Từ những năm 80 của thế kỷ XX, kỹ sư Mỹ,G. Khollerit đã sử dụng các phiếu lỗ
chọn bằng máy và Ông đã chế tạo thiết bị xử lý các kết quả điều tra dân số ở Mỹ. Vào năm
1904 đã công bố phát minh sáng chế đầu tiên của Mỹ về phiếu lỗ mép. 1915 nhà bác học
Mỹ G. Taylor đã nhận bằng sáng chế phát mnh về phương pháp tìm tin với sự hỗ trợ của
phiếu lỗ soi.Lần đầu tiên xuất hiện việc ứng dụng phiếu lỗ trong các thư viện vào cuối
những năm thứ 30 của thế kỷ XX. Người đầu tiên sử dụng phiếu lỗ soi để cơ giớí hóa các
q trình tìm tin thư viện - thư mục là nhà thư mục học Anh U. Batest vào năm 1939. Vào
những năm thứ 30 của Thế kỷ XX cũng đã xuất hiện các ý tưởng về kỹ thuật sao chụp vi
phim để giảm nhẹ việc tìm tin trong các cơ quan thơng tin - thư viện. Từ năm 1938-1939 ở
Trường Đại học Công nghệ Massatruset, dưới sự chỉ đạo của nhà bác học Mỹ V. Bus đã
chế tạo được máy vi phim để tìm các hình ảnh trên các cuốn vi phim với sự hỗ trợ của máy
quang học.
Giai đoạn trước những năm 50 của thế kỷ XX có thể gọi là giai đoạn tiền lý thuyết hệ

thống tìm tin hoặc gọi là giai đoạn nảy sinh các ý tưởng nghiên cứu các vấn đề lý thuyết
tìm tin cơ giới hóa.
Các tư tưởng mới và phương pháp tìm tin mới đã được xã hội đặc biệt quan tâm vào
cuối thế kỷ XX, khi mà có sự nảy sinh “Khủng hoảng thơng tin” với sự kéo theo gia tăng
khối lượng tài liệu được xuất bản trên phạm vi toàn thế giới. Các phương tiện kỹ thuật tìm
tin thủ cơng truyền thống khơng đáp ứng được yêu cầu tìm tin hiện tại, yêu cầu thực tiễn
phải chuyển từ “Các thư viện truyền thống” sang “ Các kho lưu trữ thông tin không truyền
thống” cơ giới hóa và tự động hóa. Chỉ có như vậy lồi người mới có thể thốt khỏi được
sự bế tắc trong lĩnh vực tìm tin. Sau chiến tranh thế giới lần thứ hai, nhiều nước tư bản
phát triển đã xây dựng các cơ quan thơng tin, trong đó sử dụng khá rộng rãi các phương
tiện kỹ thuật phiếu lỗ ( đặc biệt là ở Mỹ, CHLB Đức, Anh, Pháp, Nga, Trung quốc…)
Trong thời gian này các hãng tư vấn đã làm nhiệm vụ phổ cập hóa tư tưởng cơ giới hóa
các quá trình tìm tin và hướng dẫn phương pháp nghiệp vụ tìm tin cơ giới hóa. Những việc
làm đó có ý nghĩa cực kỳ quan trọng đối với việc phát triển lý thuyết tìm tin cơ giới hóa ở
giai đoạn này. Chính vì vậy giai đoạn từ những năm 40-50 của thế kỷ XX đã bắt đầu hình
thành lý thuyết khoa học tìm tin. Các nhà tư liệu học Mỹ: K, Moors, nhà lãnh đạo Hãng
Tư vấn Ztor Ko - thành lập năm 1948 và M. Taub, chủ tịch Hãng Tư vấn Tư liệu - thành
lập năm 1952, là những nhà khoa học đi tiên phong và đặt nền móng cho vấn đề lý thuyết
tìm tin cơ giới hóa.
1.2. N ữ g t à

tựu điể

ì

* Hệ t ố g tìm ti từ c uẩ
- Hệ thống tìm tin từ chuẩn của K. Moors
Tên tuổi của nhà khoa học K . Moors gắn liiền với các khái niệm của lý thuyết hệ
thống tìm tin: Tìm tin và từ chuẩn. Theo cách hiểu của Ơng: tìm tin là q trình tìm và
cung cấp thông tin theo một chủ đề nhất định. Như vậy quan điểm này của K. Moors rất

gần với quan niệm tìm tài liệu trong các hệ thống mục lục thư viện và trong kho sách thư
viện.
K. Moors đã chia hệ thống tìm tin thành ba thành tố cơ bản: 1- Các phương tiện kỹ
thuật đảm bảo cho quá trình tìm tin ( chính Ơng đã sử dụng phiếu lỗ mép và các thiết bị


chọn tìm tin phiếu lỗ mép vào những năm 50 của thế kỷ XX ). 2- Phương pháp mã hóa các
thông tin trên phiếu lỗ mép. 3- Từ điển từ chuẩn tìm tin. Thành tố thứ ba này K. Moors đã
gọi là “ Thành tố trí tuệ của hệ thống tìm tin “ và đã được Ơng dành nhiều cơng sức để
nghiên cứu. Các từ điển từ chuẩn tìm tin (TĐTCTT) được coi như là cơng cụ tìm tin đặc
biệt quan trọng để tìm tin .Về TĐTCTT, chúng ta có thể tham khảo thêm trong đề tài
nghiên cứu khoa học cấp ĐHQGHN, Mã số: QX. 08.2000 của PGS.TS Vũ Văn Nhật:
Nghiên cứu xây dựng bộ từ chuẩn tìm tin cho các CSDL tư liệu chuyên ngành thông tin
thư viện. [1]
Theo quan điểm của K. Moors và các đồng nghiệp của Ông: TĐTCTT dùng để phản ánh
nội dung các khái niệm (thuật ngữ); Các từ chuẩn được coi như là “Những anh em máu
thịt” của các đề mục chủ đề được sử dụng trong công tác thư viện - thư mục. Chính vì vậy
các đề mục chủ đề có thể dễ dàng chuyển sang thành các từ chuẩn tìm tin và ngựợc lại. Thí
dụ: “ Mỡ nhầy nhớt - ảnh hưởng nhiệt độ” có thể thay thế bằng các từ chuẩn tìm tin:
“Mỡ”, “Nhầy nhớt”, “Nhiệt độ”. Tổ hợp của các từ này phản ánh nội dung của các đề mục
chủ đề. K. Moors đã xây dựng ngôn ngữ từ chuẩn dưới dạng các TĐTCTT chuyên dụng
mà trong nó vốn từ vựng được kiểm sốt nghiêm ngặt (ngơn ngữ tìm tin kiểm soát)
Định ký hiệu tài liệu bằng cách lựa chọn từ TĐTCTT các từ chuẩn phản ánh nội dung
tài liệu. Sau đó các từ chuẩn của mẫu tìm tin được thể hiện dưới dạng đoạn cắt của các
phiếu lỗ mép. Khi trả lời các yêu cầu tin, người ta lấy ra các từ chuẩn từ TĐTCTT phản
ánh các yêu cầu tin. Phương pháp tìm tin của K. Moors đơn giản và rất dễ tìm tin Hệ
thống tìm tin UNITERM của M. Taub
M.Taub đóng vai trị quan trọng trong việc xây dựng phương pháp định ký hiệu phối
hợp. Nguyên tắc định ký hiệu phối hợp do ông M.Taub đề ra trong
các thuật toán logic dưới dạng như sau: Định ký hiệu phối hợp là phương pháp phân tích

nội dung thơng tin của tài liệu bằng cách : Tìm các tài liệu đó bằng các thao tác
logic:Tốn tử giao (phép nhân, logical product ) thường được ký hiệu là * hoặc AND;
Toán tử cộng logic ( phép cộng, logic sum ), thường ký hiệu là + hoặc OR và Toán tử trừ
logic (phép trừ, logical difference ), thường được ký hiệu là – hoặc NOT. chúng được tiến
hành dưới các mã (ký hiệu) đã được đưa vào kho lưu trữ bảo quản tài liệu
Để thực hiện tư tuởng định ký hiệu phối hợp, vào năm 1952, M.Taub đã nghiên cứu
xây dựng hệ thống tìm tin UNITERM (Từ đơn ). Tuy nhiên khái niệm UNITERM khơng
đồng nhất với khái niệm “từ khóa” mà ta đang sử dụng hiện nay để phản ánh các từ của
văn bản. Từ khóa cịn có thể là các cụm từ, từ kép, thậm chí có thể là một câu văn hồn
chỉnh - mệnh đề. [6]
Đưa thơng tin vào hệ thống tìm tin UNITERM:
+ Các tài liệu nhập vào được đánh ký hiệu bằng số:1,2,3,4,……11,12,13, 14, 15,…….,
các số này là địa chỉ của tài liệu trong kho lưu trữ tài liệu.
+ Nội dung tài liệu được mô tả bằng các UNITERM (các từ khóa) lấy ra từ các tiêu đề,
bài chú giải, bài tóm tắt hoặc bản tài liệu. Thí dụ: Bài báo về các trung tâm thơng tin - thư
viện ở Việt Nam, sẽ được mô tả bằng các UNITERM
+ Mỗi UNITERM ghi trên một tờ phiếu gọi là phiếu UNITERM
Thư viện


0

1

2

11

52


21

92

31

102

3

4

5

6

7

8

9

471 112
Trên mỗi phiếu chia thành 10 cột được ghi từ 0-9. Phần trên cùng ghi UNITERM. Trên
mỗi phiếu ghi số của tất cả các tài liệu mang cùng một UNITERM. Các ô dược sắp xếp
sao cho cuối cùng trùng với số của cột. Thí dụ: Trong cột 1 ghi các số: 11,21,31,4 71,..
+ Các phiếu UNITERM được sắp xếp theo vần chữ cái của UNITERM, còn tài liệu
được sắp xếp theo trật tự các số của chúng
Tìm tin trong hệ thống tìm tin UNITERM:
+ Nội dung của yêu cầu tin được mô tả dưới dạng danh mục của UNITERM

+ Từ bộ phiếu UNITERM lấy ra các phiếu có UNITERM tương ứng với yêu cầu tin
+ Bằng phương pháp nhìn so sánh để phát hiện các số trùng với các phiếu UNITERM.
Các số này tương ứng với mẫu tìm tài liệu để cung cấp cho u cầu tin.
Thí dụ tìm theo yêu cầu: “Thư viện Việt Nam”, các tờ phiếu có ghi : “ Thư viện” và
“Việt Nam”. Tiến hành so sánh các số ghi trên hai tờ phiếu đó, Chúng ta sẽ tìm thấy số tài
liệu về Thư viện ở Việt Nam.
+ Bằng việc so sánh các số, chúng ta có thể tìm đựoc các tài liệu phù hợp với yêu cầu
tin của người dùng tin.
Các thao tác logic nhân , cộng và trừ được thực hiện theo cách đọc lần lượt các số. Thủ
pháp tìm tin trên tương ứng với phép nhân logic các khái niệm:
“ Thư viện” và “Việt Nam” mà cịn cả các phiếu có ghi khái niệm: “Nga”. Như vậy phép
cộng logic các khái niệm “Việt Nam” và “Nga” cùng với phép nhân chúng với khái niệm
“Thư viện”. Phép trừ lôgic đựơc tiến hành như sau, thí dụ: Yêu cầu tin về các thư viện
nước ngoài, cần phải so sánh các số ghi trên tờ phiếu: “Thư viện” và “Việt Nam”, và đưa
ra các số không trùng với các khái niệm trên.
Các phiếu UNITERM của M. Taub được xem như là các đề mục chủ đề phản ánh những
khái niệm riêng biệt. Chúng ta cần lưu ý rằng các UNITERM đều có một đẳng cấp ngang
nhau.
Ơng K. Moors nhấn mạnh vào từ chuẩn, cịn ơng M. Taub lại nhấn mạnh vào
UNITERM, Tuy nhiên, về thực chất hai khái niệm này lại có thể trùng hợp nhau. Vào cuối
những năm thứ 50 của thể kỷ XX, hai nhà bác học này lại phủ định các phương tiện cơ
giới hóa và đã đặc biệt chú ý đến vấn đề kỹ thuật cao áp dụng vào quá trình tìm tin, nhưng
những nguyên tắc xử lý và tìm tin vẫn trong tình trạng như cũ (Thời kỳ phát triển lý luận
về cơ giới hóa q trình tìm tin của trước những năm thứ 50 thế kỷ XX )
Năm 1950, Dự án INTREX của trườngMIT đã xây dựnghệ thống tra cứu tự động trực
tuyến về các tài liệu vi phim. Năm 1954, dự án MEMEX đã có ý tưởng xây dựng hệ thống
tự động lưu trữ và quản lý dữ liệu. Vào những năm 1970-1980, Hệ thống và lưu trữ và tra


cứu thông tin ( Storage and Information Retrieval Sistems – STAIRS ) của Hãng IBM làm

chức năng lưu trữ thông tin điện tử và tra cứu trực tuyến tài liệu điện tử.
Ở Việt Nam vào những năm từ 60 – 80 của thé kỷ XX, đã có nhiều thư viện bắt đầu
nghiên cứu áp dụng những tư tưởng tìm tin cơ giới hóa, nhưng việc làm này cũng khơng
được mở rộng ở tất cả các thư viện; chỉ thấy ở các thư viện lớn trung ương áp dụng vấn đề
này.
Hệ thống tìm tin chọn lọc và hệ thống tìm tin nhân bản vi hình cũng là những thành tựu
nổi bật của giai đoạn phát triển này
Ngoài các thành tựu đã đề cập ở trên, trong lĩnh vực cơ giới hóa các q trình tìm tin,
các nhà khoa học cịn chú ý đến việc nghiên cứu xây dựng các hệ thống tìm tin với sự ứng
dụng của kỹ thuật phiếu lỗ mép , lỗ soi, nghiên cứu vấn đề cơ giới hóa các bảng phân loại
thư viện - thư mục - UDC, UDK… [2, 8, 9] và nghiên cứu thiết kế chế tạo các thiết bị máy
móc thơng tin logic với dung lượng bộ nhớ lớn và tốc độ tìm tin nhanh – Vấn đề này còn
được tiếp tục nghiên cứu phát triển hoàn thiện ở giai đoạn sau.
2. Giai đoạn ngôn ngữ - logic phát triển lý thuyết hệ thống tìm tin
2 1 N ữ g đặc điểm
- Những cơng trình nghiên cứu về các vấn đề ngơn ngữ - logic phát triển lý thuyết hệ
thống tìm tin đã bắt đầu thực hiện ngay từ trước những năm thứ 60 của thế kỷ XX. Phần
lớn các cơng trình đó đều tập trung vào nghiên cứu hệ thống tìm tin, phương pháp định ký
hiệu và tìm tin. Thực chất là các cơng trình đó tập trung vào các vấn đề ngữ nghĩa.
- Hệ thống tìm tin được hiểu khơng phải là như là: “Bộ máy điều khiển học”, mà nó là
hệ thống ngữ nghĩa bao gồm các thành tố: ngôn ngữ tìm tin, các quy tắc logic xử lý và tìm
tin.
- Nghiên cứu phát hiện các quy luật tìm tin (chủ yếu là các quy luật ngữ nghĩa)
- Công tác cơ giới hóa các q trình tìm tin đã vượt ra khỏi phạm vi từng cơ quan
thông tin khoa học công nghệ,trở thành một hoạt động rộng rãi ở hầu hết các cơ quan
thông tin khoa học công nghệ và các cơ quan thư viện - thư mục, trong đó có sự tham gia
của nhiều nhà khoa học của các nước phát triển và có sự hợp tác của nhiều quốc gia trong
lĩnh vực này
22 N ữ g t à


tựu điể

ì

* Mã gữ g ĩa của erri-Kent:
Hoạt động của các nhà tư liệu học hàng đầu của Mỹ Giems Perri và Alan Kent đã bắt
đầu từ những năm thứ 50 của thế kỷ XX – Thời kỳ phát triển rực rỡ của phương hướng cơ
giới hóa các q trình tìm tin và bắt đầu chuyển sang phương hướng ngôn ngữ - logic tìm
tin. Dưới sự lãnh đạo của hai nhà bác học này, người ta đã tiến hành nghiên cứu xây dựng
và đưa vào sử dụng hệ thống tìm tin tự động hóa về luyện kim (sau được gọi là Hệ thống
Tìm tin Perri- Kent) . Trong hệ thống này nổi bật nhát là vấn đề ngơn ngữ tìm tin - mã ngữ
nghĩa. Khi nghiên cứu ngơn ngữ tìm tin, các Ông đã hiểu rất rõ sự mâu thuẫn giữa từ và
khái niệm, nó có ý nghĩa rất cơ bản đối với ngơn ngữ học - logic học; Mâu thuẩn đó thể
hiện ở chỗ, cùng một khái niệm có thể diễn đạt bằng nhiều từ khác nhau. Vận dụng các tư
tưởng của các nhà logic học và ngôn ngữ học, G. Perri và A. Kent đã sử dụng biện pháp
xây dựng các mã ngữ nghĩa như sau:


- Xác định số lượng các khái niệm sơ đẳng - các yếu tố ngữ nghĩa; tất cả các khái niệm
còn lại tạo nên bằng phép nhân ngữ nghĩa chúng (sử dụng toán tử boole: Toán tử giao phép nhân, logical product, thường dược ký hiệu là * hoặc AND; Toán tử cộng logic- phép
cộng, logical sum, thường được ký hiệu là + hoặc OR; Toán tử trừ logic - phép trừ, logical
difference thường được ký hiệu là - hoặc NOT)
Thí dụ: Khái niệm: “lị cảm ứng” biểu đạt sự kết hợp (phép nhân ngữ nghĩa): “Máy
móc” , “Sự đốt” và “Điện năng”
- Xác định số lượng cuối cùng của các mối quan hệ phân tích (các quan hệ đối vị) )
nhằm phản ánh các mối quan hệ logic giữa các khái niệm và các nhân số ngữ nghĩa
Thí dụ: giữa khái niệm “Lò cảm ứng” và các nhân số ngữ nghĩa của nó tồn tại mối
quan hệ phân tích sau: Hình thức - giống lồi (Lị phản ứng -Thiết bị máy) ; Đối tượng -Y
nghĩa (lò cảm ứng - Sự đốt cháy); Đối tượng - Cơng cụ (Lị cảm ứng - Điện năng)
- Các mối quan hệ tổng hợp (quan hệ ngữ đoạn) – Cú pháp của mã ngữ nghĩa cho phép

xây dựng các mệnh đề từ các từ vựng riêng biệt. Phương tiện phản ánh các mối quan hệ
ngữ đoạn là các từ vựng được sử dụng làm mã ngữ nghĩa . Thí dụ: “Vật liệu đang xử lý”, “
Sản phẩm đã hồn thành”, “Bộ phận máy móc”
Nếu như M. Taub và K. Moors mô tả nội dung tài liệu bằng các UNITERM và các từ
chuẩn riêng biệt Thí dụ như: “dầu”, “ Mỡ” , “ Nhiệt độ”, Thì bộ máy phân tích tổng hợp
của mã ngữ nghĩa tạo điều kiện phản ánh các mối quan hệ ngữ pháp giữa các từ của ngơn
ngữ tìm tin. Đưa các khái niệm logic học, ngôn ngữ học và lý thuyết hệ thống (Trong đó
có các khái niệm: “Quan hệ tổng hợp” và “ Quan hệ phân tích”) là một đóng góp to lớn
của các nhà khoa học sáng lập ra mã ngữ nghĩa. [10]
* Bộ từ c uẩ tìm ti :
Vào cuối những năm thứ 50 của thế kỷ XX, những người học trị của ơng K.Moors và
M. Taub bắt đầu nghiên cứu xây dựng ngơn ngữ tìm tin từ chuẩn. Đây là đặc điểm nổi bật
của giai đoạn ngôn ngữ - logic của sự phát triển lý thuyết về hệ thống tìm tin. Các bộ từ
chuẩn lần đầu tiên được xây dựng trong ngơn ngữ học. Có hai cách sắp xếp từ trong các
từ điển ngôn ngữ:
- Các từ được sắp xếp theo sự giống nhau về cách viết của chúng.
- Các từ được sắp xếp theo sự giống nhau về nghĩa của chúng
Cách sắp xếp thứ nhất được dùng để tìm các từ theo vần chữ cái căn cứ vào cách viết
của chúng, Còn cách sắp xếp thứ hai được dùng để xây dựng các bộ từ chuẩn. Các từ điển
vần chữ cái và các bộ từ điển từ chuẩn bổ sung lẫn cho nhau. Các từ điển vần chữ cái
dùng để tra cứu ý nghĩa của các từ hoặc khái niệm mà từ đó biểu đạt; cịn các bộ từ điển từ
chuẩn dùng để tra cứu trực tiếp ý nghĩa của các khái niệm. Hay nói cách khác, khi sử dụng
các từ điển vần chữ cái, chúng ta đi từ từ sang ý nghĩa, còn khi sử dụng từ điển từ chuẩn,
thì ngược lại, chúng ta đi từ ý nghĩa sang từ. Thí dụ: điển hình là bộ từ chuẩn ngôn ngữ
học: “Bộ từ chuẩn các từ tiếng Anh” do nhà bác học M. P. Pơgiơ biên soạn vào năm 1852
Vào đầu những năm 60 của thế kỷ XX, các bộ từ điển từ chuẩn đầu tiên đã được biên
soạn. Ý nghĩa và cấu trúc các bộ từ điển từ chuẩn này khác hẳn so với các bộ từ điển ngơn
ngữ học và chính vì vậy mà chúng được gọi là các bộ từ chuẩn tìm tin. [1]
Bộ từ chuẩn tìm tin ( BTCTT) thực hiện các chức năng sau đây:



- Đảm bảo dịch từ ngôn ngữ tự nhiên sang ngôn ngữ từ chuẩn, dùng để định ký hiệu tài
liệu và yêu cầu tin
- Phản ánh mối quan hệ đối vị mà chúng được sử dụng trong quá trình định ký hiệu bổ
sung và xây dựng các chiến lược tìm tin
- Sử dụng làm bảng tra cứu thuật ngữ trong các lĩnh vực khác nhau của hoạt động
thơng tin
Nhìn chung, các bảng phân loại thư viện thư mục và các bảng đề mục chủ đề cũng
được xem là các bộ từ chuẩn tìm tin [2]. Tuy nhiên, trong thực tiễn, thuật ngữ: “Bộ từ
chuẩn tìm tin” chỉ được sử dụng rộng rãi trong lĩnh vực tìm tin với sự hỗ trợ của hệ thống
tìm tin từ chuẩn
3. Giai đoạn phát triển hệ thống tìm tín tích hợp tự động hóa
3 1 Các đặc điểm
Sự phát triển của thông tin học, trước hết là các vấn dề nghiên cứu nhu cầu tin và các
nguồn tin, các kinh nghiệm cơ giới hóa các thao tác lao động trí tuệ (điều khiển tự động
hóa) và các u cầu phục vụ thơng tin đã thúc đẩy giai đoạn thứ ba này phát triển. Sau đây
là các đặc điểm nổi bật của gíai đoạn này:
- Các hệ thống tìm tin được xem là các hệ thống độc lập mà mỗi hệ thống là một tiểu
hệ thống của hệ thống lớn hơn. Hệ thống tìm tin trở thành một thành tố nằm trong hệ
thống thông tin khoa học cơng nghệ tự động hóa và là một hệ thống quan trọng nằm trong
hệ thống quản lý tự động hóa. Thời kỳ này địi hỏi xã hội phải xây dựng được một hệ
thống phục vụ thơng tin tích hợp tự động hóa
- Các hệ thống tìm tin được xem như là các hệ thống kiểu “ Người – Máy”, trong đó
con người giữ vai trị chủ đạo chính. Chính vì vậy, các nhà khoa học ở thời kỳ này tập
trung chú ý nghiên cứu các vấn đề tâm lý học, xã hội học, sự tiện ích của việc tìm tin, mở
rộng các vấn đề lý thuyết tìm tin.
- Mở rộng nghiên cứu khái quát các vấn đề lý thuyết mà ở các giai đoạn trước đây
chưa được đề cập đến một cách mạnh mẽ. Thí dụ như vấn đề: Ngơn ngữ tìm tin, đảm bảo
các phương tiện ngữ nghĩa của hệ thống tìm tin, tiêu chuẩn hóa các giải pháp thông tin
- Xây dựng các hệ thống thông tin tự động hóa lớn quốc gia và quốc tế, chuyển mạnh

mẽ từ phục vụ thông tin thủ công truyền thống sang sử dụng các hệ thống thơng tin tích
hợp tự động hóa, mở rộng việc người dùng tin khai thác thông tin dựa vào các thiết bị tin
học do cuộc cách mạng công nghệ thông tin ngày nay đem lại cho loài người
3 2 Một số t à

tựu ổi b t

- Bên cạnh việc tiếp tục nghiên cứu sâu các vấn đề cơ giới hóa, tự động hóa các q
trình tìm tin và ngơn ngữ tìm tin, giai đoạn này bắt đầu mở rộng việc tiến hành xây dựng
các hệ thống thơng tin tích hợp tự động hóa quốc gia, khu vực quốc tế và tồn cầu
Nhiệm vụ chính của hệ thống thơng tin tích hợp tư động hóa là: 1) Phục vụ thông tin
chọn lọc; 2) Phục vụ tìm tin hồi cố; 3) Biên soạn và phát hành các ấn phẩm thơng tin.[3]
Mơ hình cấu trúc chung của các hệ thống thơng thơng tin tích hợp tự động hóa bao
gồm hai bộ phận chính:
Bộ p

c ức

g gồm các bộ p

ỏ:

+ Bộ phận lựa chọn, xử lý và nhập thông tin


+ Bộ phận phục vụ thông tin chọn lọc (phục vụ thơng tin theo địa chỉ), và tìm tin
hồi cố
+ Bộ phận biên soạn và phát hành các ấn phẩm thông tin
+ Bộ phận sao chụp và nhân bản các tài liệu thông tin
+ Bộ phận tổ chức và quản lý các nguồn lực con người, cơ sở vật chất – kỹ thuật

và tài chính
Bộ p

ỗ trợ cơ g tác t ô g ti bao gồm các bộ p

ỏ:

+ Bộ phận nguồn lực thông tin / Nguồn tin điện tử
+ Bộ phận các phương tiện kỹ thuật đảm bảo thông tin / Hạ tầng cơ sở công nghệ
thông tin
+ Bộ phận đảm bảo các phương tiện ngữ nghĩa và toán học (tính tốn và lập trình)
/ Các phần mềm chun dụng
Trên thế giới hiện nay đã có những hệ thống thơng tin tích hợp tự động hóa lớn như: Hệ
thống thông tin của Thư viện Y học Quốc gia Mỹ; Hệ thống Thơng tin của Viện Thơng tin
Tóm tắt Hóa học Mỹ( Chemical Abstracts Service); Viện Thông tin Khoa học Hóa học và
Cơng nghệ Mỹ; Hệ thống Thơng tin của Cơ quan Năng lượng Nguyên tử Quốc tế; Hệ
thống Thông tin của Cơ quan Hàng không và Vũ trụ Mỹ; Hệ thống Thông tin của Viện Kỹ
thuật Điện Anh; Hệ thống Thông tin của Trung tâm Thông tin Nghiên cứu khoa học Pháp,
Trung tâm Thông tin Khoa học và Kỹ thuật Nhật Bản; Trung tâm Thông tin Khoa học và
Kỹ thuật Liên bang Nga và các trung tâm thông tin khoa học kỹ thuật chuyên ngành và
liên ngành Nga;
Các hệ thống thơng tin tích hợp tự động hóa hiện nay trên thế giới được xây dựng trên
nền tảng của các thành tựu của cuộc cách mạng khoa học công nghệ hiện đại, đặc biệt là
công nghệ thông tin. Những thành tựu lý thuyết khoa học và thực tiễn đã đạt được trong
lĩnh vực thơng tin xã hội nói chung và trong lĩnh vực thông tin khoa học và công nghệ nói
riêng là hết sức to lớn, sâu rộng và rất phức tạp.
Từ những năm thứ chín mươi của thế kỷ trước trở lại đây, Sự phát triển của
INTERNET và công nghệ WEB tạo khả năng lưu trữ và tra cứu tự động khối lượng thông
tin lớn và đa dạng đặt nền tảng và mở ra cơ hội phát triển thư viện điện tử của nhiều nước
trên thế giới, điển hình là ở các nước như:

-

-

-

Mỹ: Dự án thư viện điện tử quốc gia được Quốc hội Mỹ thông qua năm 1994 đã
được thực hiện ở Thư viện Quốc hội Mỹ và ở 4 trường đại học lớn của Mỹ
Anh: Năm 1995, Ủy ban về Thư viện và Thông tin được thành lập với nhiệm vụ
tăng cường và thúc đẩy ứng dụng công nghệ thông tin nhằm xây dựng và phát triển
hệ thống thư viện điện tử ở quốc gia này
áp:Từ năm 1995 trở lại đây, nước này đã tăng cường xây dựng thư viện điện tử
tại Thư viện Quốc gia Pháp và triển khai rộng rãi việc số hóa các kho tài liệu tại các
thư viện công cộng, các thư viện trường đại và các thư viện khoa học chuyên ngành
của nước này
Nga: Ngay từ năm 1999 trở lại đây nước này đã đặc biệt quan tâm đến phát triển hệ
thống thư viện điện tử trên phạm vi toàn bộ lãnh thổ Liên bang Nga: Dự án “ Thư
viện điện tử Nga – E- Library Rusia” với sự tham gia của 11 bộ, ngành có hiệu quả
cao. Mạng máy tính thơng tin – thư viện tồn Liên bang Nga – LBNET đã được xây
dựng và triển khai hoạt động có hiệu quả cao,…


-

-

-

ru g quốc: Nước này rất quan tâm đến vấn đề tự động hóa và tin học hóa các q
trình thông tin - thư viện ngay từ những năm cuối thế kỷ XX. Điển hình là năm

1997, nước này đã xây dựng dự án: “ Xây dựng thư viện số thử nghiệm của Trung
quốc” và dự án “Xây dựng thư viện điện tử quốc gia Trung quốc”. Viện Hàn lâm
KHXH Trung quốc, Trường Đại học Tổng hợp Bắc Kinh, Thư viện Thành phố
Thượng Hải đã tiến hành xây dựng các thư viện điện tử của họ rất có hiệu quả trong
mấy năm gần đây.
Hệ thống tự động BIBSYS của Na Uy, Thư viện điện tử Quốc gia
ầ La –
FINLib, Thư viện Điện tử Quốc gia Đa Mạc (Trong dự án DEF) cũng là những
thí dụ điển hình về các hệ thống thơng tin tích hợp tự động hóa và thư viện điện tử
được xây dựng trong những năm cuối thế kỷ XIX đầu thế kỷ XX
iệt Nam: Từ cuối thế kỷ trước và hiện nay, nhiều thư viện Việt Nam đã xây dựng
hoặc có định hướng phát triển thành các hệ thống thơng tin tích hợp tự động hóa
hoặc thư viện điện tử. Thí dụ như :Trung tâm thơng tin-Thư viện Đà Nẵng; Thư
viện Tạ Quang Bửu; Thư viện điện tử Viện KHXH Việt Nam; VISTA- Mạng thông
tin KHCN Việt Nam; Mạng Cộng đồng Thư viện Trực tuyến- OLICON (Online
Library Mommunity Network) của đại học KHTN thành phố Hồ Chí Minh; Thư
viện âm nhạc điện tử của Nhạc viện Hà Nội; Thư viện điện tử về khuyết tật và
nhiều trung tâm thông tin – thư viện đang chuẩn bị các dự án phát triển thành thư
viện điện tử hoặc thành các trung tâm thông tin-thư viện điện tử , tin học hóa.

Như vậy, xét về mặt lịch sử cũng như về mặt lý thuyết và cả về mặt thực tiễn, thư viện
điện tử đã được“Thai nghén” ngay trong lòng củahai giai đoạn đầu phát triển hệ thống tìm
tin. Nó sinh ra, lớn lên và phát triển mạnh mẽ ở giai đoạn thứ ba vào những năm cuối thế
kỷ XX đầu thế kỷ XXI, như một sự phát triển biện chứng, tất yếu, khách quan và thống
nhất trong môi trường cách mạng khoa học công nghệ hiện đại, xã hội thông tin và nền
kinh tế trí thức ngày nay trên thế giới. Theo quan điểm của chúng tôi: Thực chất thư viện
điện tử là một thiết chế hệ thống thông tin tích hợp tự độn g hóa cao trên cơ sở ứng dụng
cơng nghệ thơng tin hiện đại, hoặc nó tồn tại độc lập, hoặc nó thống nhất nằm trong thiết
chế hệ thống thông tin – thư viện điện tử của một cơ quan, một ngành chuyên môn, của
một quốc gia, hoặc củavùng lãnh thổ và quốc tế.

TÀI LIỆU THAM KHẢO
1. Vũ Văn Nhật, Nghiên cứu xây dựng Bộ từ chuẩn tìm tin cho các cơ sở dữ liệu chuyên
ngành khoa học thông tin - thư viện ( Từ điẻn từ chuẩn tìm tin tư liệu thơng tin - thư viện )
- Đề tài NCKH cấp Đại học Quốc gia Hà Nội. Mã số: QX.2000.08).
2. Tại Thị Thịnh, Phân loại tài liệu (Giáo trình), TTTL KH&CNQG,Hà Nội, 1998,221tr.
3. Đồn Phan Tân, Tin học trong hoạt động thông tin - thư viện, NXB Văn hóa – Thơng
tin, Hà Nội, 1996, 242tr.
4. Trần Mạnh Tuấn, Sản phẩm và dịch vụ thông tin, thư viện, TTTL KH&CNQG, Hà Nội,
1998, 234tr.
5. Hướng dẫn biên soạn Thesaurus, TTTL KH&CNQG, Hà Nội, 1993, 47tr.
6. Hướng dẫn mô tả nội dung tài liệu bằng từ khóa (Định từ khóa), TTTL KH&CNQG, Hà
Nội, 1973,126tr.
7. Trần Thị Bích Hồng, Cao Minh Kiểm, Tra cứu thông tin trong hoạt động thư viện
thông tin, ĐHVHHN, Hà Nội, 2004, 310 tr.


8. Library classification evolution of dinamic theory, Delhi, 1972, 222tr.
9. Buchanan Brian, Theory of library classification, London, 1979,141tr.
10. Maxcơvic V.A. Các ngôn ngữ thông tin, NXB “Khoa học” , M., 1971, 144tr. (Bản tiếng
Nga)
11.What
are
digital
libraries?/Donald
J.
Waters//
CLIR,
No
4,
July/August 1999.URL: />12.Digital libraries: Definitions, issues and challenges/GaryCleveland // UDTOccasional

paper#8.URL:



×