Tải bản đầy đủ (.ppt) (22 trang)

Bài giảng tra cứu thông tin

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (604.86 KB, 22 trang )

2.2. Bộ máy tra cứu hiện đại.
Ngày nay, với việc ứng dụng của CNTT cho nên các tài
liệu tra cứu ngoài dạng truyền thống còn xuất hiện các
tài liệu tra cứu dạng điện tử, nghĩa là lưu trữ thông tin
bằng kỹ thuật số. NDT ngày nay có thể tra cứu thông
tin bằng rất nhiều phương thức khác nhau : Bộ máy tra
cứu truyền thống hoặc bộ máy tra cứu hiện đại.
- Các cơ sở dữ liệu (CSDL)
- Tra tìm trên đĩa quang CD-ROM
- Mục lục công cộng truy cập trực tuyến (OPAC)
- Tra tìm trực tuyến


2.2.1. Cơ sở dữ liệu (CSDL).

- CSDL thư mục
- CSDL toàn văn (fulltext).
Thực chất của việc xây dựng CSDL là sử dụng các
phần mềm quản trị CSDL tư liệu để nhập các thông
tin về tài liệu vào máy tính.
Mỗi tài liệu là một thực thể quản lý của các hệ quản
trị CSDL, thực thể tài liệu bao gồm các thuộc tính
khác nhau (Tên tác giả, tên tài liệu, Nơi XB, ...).






giá trị của một thuộc tính của tài liệu được lưu
vào một trường (field) và tập hợp các trường (lưu


giá trị các thuộc tính) của một tài liệu sẽ tạo
thành một biểu ghi (record) của tài liệu đó. Tập
hợp tất cả các biểu ghi của các tài liệu sẽ tạo
thành CSDL.
Nguyên tắc máy tính làm việc với các trường và
biểu ghi dữ liệu theo một khuôn mẫu, định dạng
rất chặt chẽ, nên để máy tính có thể nhận biết, xử
lý chính xác các dữ liệu về tài liệu người ta đưa ra
quy tắc về khổ mẫu MARC (Machine Readable
Cataloging).


Khổ mẫu MARC chính là cách người ta sử dụng để
cấu trúc hoá các dữ liệu thư mục của đối tượng
cần quản lý.
 Trong biểu ghi MARC, có một số các thành phần
như sau:
- Trường:
Một số trường hay sử dụng trong MARC21
- Trường con:
Là đơn vị thông tin chi tiết hơn của trường. Ví dụ
trường xuất bản bao gồm các trường con: Nơi
xuất bản, nhà xuất bản, năm xuất bản. Để nhận
biết trường con, ta phân biệt thông qua mã
trường con, mã này gồm có dấu ngăn cách ($) và
một chữ cái in thường sau dấu ngăn cách.
Ví dụ:










Tp hp cỏc biu ghi v cỏc i tng cn qun lý
to thnh mt file lu tr trong mỏy tớnh (file
ch), ngoi vic lu tr cỏc thụng tin ca cỏc i
tng cn qun lý (c th l ti liu) thỡ mc ớch
t ra l khai thỏc v s dng chỳng, thc
hin mc ớch ú, ngoi file ch cũn phi kốm
theo cỏc file khỏc. Tp hp cỏc file nh vy to
thnh mt c s d liu.
Hin ti, phn ln cỏc th vin nc ta ang s
dng phn mm CDS/ISIS for Windows (gi tt l
WinISIS).

Thành phần cơ bản của CDS/ISIS là hệ thống
các menu. Đó là một dãy các chức năng hay
các lệnh để ngời sử dụng lựa chọn. C th:


* Menu chính
* Từ menu chính lại có thể vào các menu con
(cũn gi l menu s xung popup menu)
Tất cả các chơng trình đều làm việc trong chế
độ hội thoại. Đó là chế độ hỏi - trả lời trong thời
gian thực (real time)
WinISIS sử dụng các loại cửa sổ khác nhau cho

các mục đích khác nhau. Có:
* Cửa sổ trình bày biểu ghi
* Cửa sổ nhập dữ liệu
* Của sổ tìm tin
v.v...


* Để chy một chức năng, kích chuột vào menu con t
ơng ứng. Khi đó một danh sách các lệnh đợc hiện ra
dới dạng một menu thả xuống, ta nháy đúp chuột
vào lệnh hoặc gõ phớm tt lệnh tơng ứng trên bàn
phím.
* Trong một số trờng hợp WinISIS sử dụng hộp thoại để
hỗ trợ cho việc thực hiện một lệnh.
* Tìm tin trong WinISIS là tìm các biểu ghi th mục của
CSDL đợc quản lý bởi phần mềm WINISIS.


Tìm tin trong WinISIS
Nguyên tắc tìm tin theo tệp đảo
Để tìm tin trên các trờng theo tệp đảo, ta cần đ
a vào một biểu thức tìm (phơng trình tìm). Đó
là một biểu thức logic bao gồm các thuật ngữ
tìm (từ khoá) đợc liên kết bởi các toán tử của
ngôn ngữ tìm tin do chơng trình cung cấp.
Các toán tử tìm sẽ liên kết các thuật ngữ tìm để
tạo thành biểu thức tìm. Các thuật ngữ tìm đợc
lu trong từ điển. Ta có thể đa vào :
- Hoặc một thuật ngữ chính xác, ví dụ: Phân loại
tài liệu, thông tin học,...

- Hoặc một thuật ngữ bị chặt phải bằng toán tử
chặt cụt(dấu $)
Ví dụ:


* Ngôn ngữ tìm tin WinISIS
Ngôn ngữ tìm tin WinISIS đợc xây dựng trên cơ
sở của logic Boolean, nó cung cấp một phơng
tiện thuận lợi để trình bày các phép toán logic
giữa các lớp toán hạng.
Mỗi thuật ngữ tìm liên quan tới một biểu ghi, thực
chất có thể xem nh là đại diện của một lớp các
biểu ghi có liên quan đến thuật ngữ đó. Do đó
bằng cách sử dụng các phép toán logic liên kết
các thuật ngữ tìm, tạo thành một biểu thức tìm,
ta có thể xác định một cách chính xác lớp các
biểu ghi thoả mãn yêu cầu tìm tin đặt ra.


Ngôn ngữ tìm tin WinISIS bao gồm các
toán tử locgic và một số toán tử khác.
Ba toán tử logic cơ bản là:
AND
ký hiệu là *
OR
ký hiệu là +
NOT
ký hiệu là ^
A*B là các tài liệu đợc đánh chỉ mục đồng
thời bằng các thuật ngữ A và thuật ngữ B.

A+B là các tài liệu đợc đánh chỉ mục
bằng thuật ngữ A hoặc thuật ngữ B, hoặc cả
hai.
A^B là các tài liệu đợc đánh chỉ mục chỉ
bằng thuật ngữ A, nhng không đợc đánh
bằng thuật ngữ B.


Cú pháp của biểu thức tìm
Ta có thể kết hợp hai hoặc nhiều thuật ngữ tìm
với nhau bằng các toán tử. Khi trong biểu thức
tìm có nhiều loại toán tử khác nhau thì ta có thể
dùng dấu ngoặc đơn để thiết lập thứ tự thực
hiện các phép toán (toán tử).
Ví dụ: Câu hỏi Tìm các tập thơ của Xuân Diệu
hoặc Tế Hanh và tiểu thuyết của Nguyễn Đình
Thi thì biểu thức tìm là:
Thơ*(Xuân
Diệu+Tế
Hanh)+Tiểu
thuyết*Nguyễn Đình Thi




* Phơng tiện tìm tin trong WinISIS

WinISIS cho phép tìm tin theo hai chế độ: Tìm tin
trình độ cao và tìm tin có trợ giúp.
a- Tìm tin trình độ cao (Expert Search)

Kích chuột vào mục Tìm tin trình độ cao trong
Menu tìm tin sẽ xuất hiện cửa sổ:
Toán tử: Nhấn chuột vào một trong các nút này
ta sẽ chèn toán tử tơng ứng vào hộp câu hỏi.
Câu hỏi: Hộp này chứa biểu thức tìm hiện tại.
Ngời sử dụng có kinh nghiệm có thể gõ trực
tiếp biểu thức tìm vào trong hộp. Số lợng ký tự
tối đa trong biểu thức tìm là 1000.












Từ điển: Mở cửa sổ từ điển.
Thực hiện: Thực hiện yêu cầu tìm.
Xoá: Xoá biểu thức tìm hiện tại.
Trợ giúp: Đa ra thông báo trợ giúp.
Danh sách câu hỏi: Liệt kê danh sách các biểu thức
tìm đã đợc thực hiện, bao gồm số hiệu biểu thức tìm,
tên CSDL, kết quả tìm và nội dung của biểu thức tìm.
Kích đúp chuột vào một trong những dòng của danh
sách này, WinISIS sẽ đa ra kết quả tơng ứng trong
cửa sổ CSDL.

Nếu nháy chuột đơn vào một dòng của danh sách thì
số hiệu của biểu thức tìm sẽ đợc đa vào hộp câu hỏi.
Ta có thể thực hiện tìm lại theo câu hỏi đó, với điều
kiện đó là câu hỏi của CSDL đang mở.











b- Tìm tin có trợ giúp (Guided Search)
Kích chuột vào mục Tìm tin có trợ giúp trong Menu
tìm tin sẽ xuất hiện cửa sổ:
Thành phần tìm tin: Bốn hộp đợc đa ra để ta gõ vào
thuật ngữ tìm. Bạn có thể kích chuột vào nút Từ điển
để hiện ra cửa sổ từ điển, rồi từ đó bạn có thể chọn
một thuật ngữ tìm thích hợp bằng cách kích đúp vào
từ đó hoặc rê chuột để đa thuật ngữ vào hộp tơng
ứng.
Trờng tìm tin: Bằng cách chọn trờng thích hợp trong
danh sách các trờng tìm tin, ta sẽ lấy ra đợc thuật
ngữ tìm thuộc trờng tơng ứng.
Toán tử: Có thể chọn một trong ba toán tử AND, OR,
NOT









Câu hỏi trớc: Khi một hay nhiều biểu thức tìm trớc đó
đã đợc thực hiện, bạn có thể chọn một trong số đó
từ danh sách các câu hỏi trớc, rồi nối với các yếu tố
tìm mới.
Các nút bấm: Để thực hiện một lệnh tìm ta bấm nút
Thực hiện. Dòng văn bản của biểu thức tìm do
WinISIS tạo ra sẽ hiện ra trong hộp Câu hỏi. Khi việc
tìm kiếm đã hoàn thành, số hiệu của biểu thức tìm sẽ
hiện ra trong hộp Số câu hỏi và tổng số các biểu ghi
tìm đợc sẽ hiện ra trong hộp Số biểu tìm đợc.
Để hiện ra kết quả tìm, bạn bấm nút Xem kết quả tìm.
Bấm nút Xoá, sẽ xoá các yếu tố tìm. Bấm nút Thoát
ra, sẽ trở về cửa sổ CSDL, bỏ qua việc tìm kiếm.


Tìm tự do
Kỹ thuật tìm tự do cho phép xác định yêu cầu tìm
theo các trờng không đợc đánh chỉ mục hoặc xác
định những điều kiện mà ta không thể mô tả thông
qua biểu thức tìm, nh trờng hợp so sánh các giá trị
bằng số của các trờng.
Tìm tự do thực hiện theo phơng thức tìm tin trình độ
cao.

Cú pháp tìm tự do:
? Biểu thức tìm
hay
? #n Biểu thức tìm



? Chỉ ra rằng cần tìm tự do
#n
Hạn chế việc tìm tự do trong kết quả của lệnh tìm trớc
đó, đợc thực hiện bởi câu hỏi có số hiệu là #n. Nếu không
chỉ ra giới hạn này thì việc tìm tự do đợc thực hiện trong
toàn bộ CSDL.
Biểu thức tìm: là biểu thức logic đã mô tả trong phần ngôn
ngữ tìm của WinISIS.
Ví dụ:
? v1=Xuân Diệu and val(v3^c)>1970
sẽ tìm các tập thơ của tác giả Xuân Diệu (trờng 1) với năm
xuất bản (V3^c) là sau năm 1970.
Một ví dụ khác, biểu thức tìm:
? val(v3^c)>1970
sẽ cho tất cả các tài liệu có trong CSDL xuất bản sau năm
1970.



2.2.2. Tra tìm trên đĩa quang CD-ROM.
Loại đĩa nµy ra đời vµo những năm 80 của thế kỷ trước.
Đã lµ thiết bị nhớ cã khả năng chứa đựng lượng th«ng
tin rất lớn với kÝch thước nhỏ, độ bền cao vµ cã phần

mềm khai th¸c ngay trªn đĩa, th«ng tin được lưu tr ữ
dưới nhiều dạng thức kh¸c nhau (th«ng tin văn b ản vµ
đa phương tiện).
Ngµy nay đ· xuất hiện nhiều dạng kh¸c nhau của đĩa
CD-ROM với c«ng nghệ mới được ¸p dụng, vÝ dụ đĩa
DVD-ROM dung lượng 4.7GB, đĩa DVD ¸p dông c«ng
nghệ tia laser xanh với dung lượng lªn đến 24GB/đĩa với
kÝch thước như đÜa CD-ROM th«ng thường. Nhờ những
c«ng nghệ lưu trữ mới người ta đã xuất bản c¸c tµi liệu
tra cứu cã gi¸ trị trªn đĩa CD-ROM như : B¸ch khoa toµn
thư, từ điển,...


Mục lục công cộng truy nhập trực tuyến (OPAC)

Đ©y chÝnh lµ cơ sở dữ liệu thư mục đượ c lưu trữ
trªn c¸c m¸y chủ trªn mạng gióp ngườ i sử dụng
cã thể truy nhập c¸c th«ng tin thư mục trực tiếp ở
bất cứ nơi nµo, vµo thời điểm nµo mµ kh«ng cần
th«ng qua sự hỗ trợ của nh©n viªn thư viện.

Mục lục trực tuyến cung cấp cho NDT c¸c
phươ ng thức tra cứu linh hoạt hơn, mềm dẻo
hơn như cã thể t×m theo t¸c giả, nhan đề, từ
kho¸, chủ đề,… Ngoµi ra, NDT cßn cã thể giới
hạn phạm vi t×m theo ng«n ngữ, theo loại h×nh tµi
liệu,…





Tra tìm tin trực tuyến (Online)

Ngµy nay, với sự bïng nổ th«ng tin, đặc biệt th«ng tin
khoa học kỹ thuật cho nªn trªn thế giới h×nh thµnh
một số c¸c trung t©m th«ng tin khoa học kỹ thuật lµm
nhiệm vụ thu thập, xử lý, phổ biến c¸c kết quả nghiªn
cứu trªn toµn thế giới như Viện Th«ng tin Khoa học
Kỹ thuật Quốc gia Ph¸p tại Nancy (INIST – Institut de
l’Information Scientifique et Technique) trực thuộc
Trung t©m nghiªn cứu khoa học Quốc gia Ph¸p
(CNRS); Trung t©m thư viện m¸y tÝnh trực tuyến
(OCLC – Online Computer Library Center) tại Dublin
(Mỹ).




Các trung tâm này đã xây dựng các CSDL thư mục đa
ngành, đa ngôn ngữ như PASCAL, FRANCIS, DIALOG.
Sản phẩm thông tin trên các CSDL này rất phong phú
về loại hình và nội dung: các bài báo, tạp chí, báo cáo
khoa học, tổng kết các hội nghị quốc tế, luận án khoa
học bao quát các ngành khoa học khác nhau. Các thông
tin trên các CSDL này còn được cập nhật một cách
thường xuyên để đảm bảo tính khoa học và tính giá trị.
Để tìm tin qua các CSDL này cần phải ký hợp đồng với
cơ quan dịch vụ quản lý các CSDL để có một tài khoản
(account), tài khoản để truy cập các CSDL bao gồm :
Tên tài khoản (User name) và mật khẩu (Password).

Hình thức tra cứu tin khi sử dụng các CSDL này cũng
rất phong phú như tìm theo chủ đề, từ khoá, tên tác
giả,… Tuy nhiên để khai thác tốt, NDT cần biết sử dụng
ngôn ngữ để hỏi riêng của từng cơ quan cung cấp dịch
vụ.






Hình thức này được sử dụng rộng rãi trong các trung
tâm, viện nghiên cứu khoa học, các trường Đại học,

Ngày nay, hình thức tra cứu tin tức trên mạng toàn
cầu Internet đã trở thành phổ biến trên toàn thế
giới. Internet đã tác động lớn đến cuộc sống hiện đại
của chúng ta, làm thay đổi rất lớn cách thức chúng
ta trao đổi và tìm kiếm thông tin. Có thể nói, trong
cuộc sống thường nhật ngày nay, thế hệ chúng ta
đều sử dụng đến Internet. Các dịch vụ trên Internet
mang lại rất nhiều lợi ích cho chúng ta như dịch vụ
thư điện tử (E-mail), dịch vụ web (www),...Cũng
nhờ Internet, chúng ta có công cụ tra tìm danh mục
dữ liệu, tìm kiếm các CSDL không phải quan tâm đến
khoảng cách địa lý và thời gian.




×