bµi gi¶ng th«ng tin häc
bµi gi¶ng th«ng tin häc
ch¬ng 3
ch¬ng 3
xö lý th«ng tin & c¸c s¶n phÈm
xö lý th«ng tin & c¸c s¶n phÈm
th«ng tin
th«ng tin
PGS.TS. §oµn Phan T©n
Th¸ng 2 - 2004
1. mô tả thư mục, các chuẩn và format
1. mô tả thư mục, các chuẩn và format
1.1. Khái niệm chung về mô tả thư mục
1.1. Khái niệm chung về mô tả thư mục
Mô tả thư mục là gì?
Mô tả thư mục vừa là một công đoạn (công tác biên
mục) vừa là một sản phẩm (chỉ dẫn thư mục).
Mục đích của mô tả thư mục
Cung cấp cho tài liệu một mô tả duy nhất,
Giúp ta cùng một lúc có thể xác định được tài liệu, sắp
xếp chúng, đưa chúng vào các bộ phiếu và tìm kiếm
các tài liệu đó.
Các vùng dữ liệu
Mô tả thư mục bao gồm các vùng dữ liệu. Đó là các
yếu tố dữ liệu mô tả các đặc trưng hình thức của tài
liệu.
Các vùng dữ liệu này khác nhau đối với các loại hình
tài liệu khác nhau. Ví dụ với sách và ấn phẩm định kỳ.
(GT trang 135)
các vùng dữ liệu theo ISBD đối cới sách và
các vùng dữ liệu theo ISBD đối cới sách và
ấn phẩm định kỳ
ấn phẩm định kỳ
Sách
Tên sách và tác giả
Xuất bản
Địa chỉ
Đặc trưng số lượng
Tùng thư
Phụ chú
ISBN, bìa và giá
tạp chí
Tên tạp chí và tác giả
Xuất bản
Số thứ tự
Địa chỉ
Đặc trưng số lượng
Tùng thư
Phụ chú
ISSN, khoá tiêu đề và
giá
1.2. Các chuẩn và format
1.2. Các chuẩn và format
Vấn đề tiêu chuẩn hoá kỹ thuật xử lý thông tin
Để thiết lập sự tương hợp giữa các hệ thống thông
tin cần phải tiêu chuẩn hoá các kỹ thuật xử lý thông
tin.
Tiêu chuẩn hoá là hoạt động tập thể ở đó người ta
lập ra các tiêu chuẩn về kỹ thuật, phương pháp
hoặc chất lượng mà mọi người phải tuân theo.
Vai trò của tiêu chuẩn hoá:
Nâng cao hiệu quả của hoạt động xử lý, khai thác và chuyển
giao thông tin
Mở rộng sự hợp tác giữa các đơn vị thông tin trên phạm vị quốc
gia và quốc tế.
Cơ quan tiêu chuẩn quốc tế ISO và ủy ban
ISO/TC46.
Quy tắc mô tả thư mục quốc tế ISBD
Quy tắc mô tả thư mục quốc tế ISBD
ISBD là gì?
ISBD là tập hợp các quy tắc trình bày dữ liệu thư mục theo
một quy định chặt chẽ, cùng với các dấu hiệu để xác định
chúng.
ISBD ra đời năm 1960 với sự hợp tác của ISO/TC46 và
IFLA.
Chức năng của ISBD.
Đặc trưng hoá các yếu tố mô tả dùng để xác định tài liệu,
gán một thứ tự cho các yếu tố ấy và quy định các dấu ký
hiệu.
Mục đích của ISBD.
Tạo thuận lợi cho việc trao đổi quốc tế các ấn phẩm thông
tin thư mục, vượt qua rào cản của ngôn ngữ.
Các yếu tố cấu thành ISBD.
Các vùng dữ liệu (8 vùng)
Các dấu ký hiệu
Khổ mẫu biên mục đọc máy MARC
Khổ mẫu biên mục đọc máy MARC
MARC là gì?
MARC = Machine Readable Cataloging.
Là một mô tả có cấu trúc, dành riêng cho các dữ liệu thư
mục được đưa vào máy tính điện tử.
MARC là chuẩn để trình bày và trao đổi các dữ liệu thư mục
và các dữ liệu liên quan dưới dạng máy tính đọc được.
Tác dụng của MARC
Cho phép người dùng dễ dàng truy cập tới các biểu ghi.
In ra các thông báo sách mới, các ấn phẩm thư mục, các
mục lục dưới các dạng khác nhau, các nhãn dán trên gáy
sách.
Trao đổi dữ liệu thư mục trên quy mô lớn, giảm chi phí biên
mục nhờ sao chép và tải về những biểu ghi từ nhiều nguồn
quốc gia và quốc tế
cấu trúc của khổ mẫu marc
cấu trúc của khổ mẫu marc
Cấu trúc của khổ mẫu MARC là cấu trúc biểu ghi,
trong đó các dữ liệu được sắp xếp trong các trường, có
độ dài thay đổi hoặc cố định, được mã hoá và được
trình bày theo một quy định chặt chẽ, bảo đảm khả
năng lưu giữ và truy xuất thông tin.
Khổ mẫu MARC sử dụng một hệ thống mã gồm các
chữ số, chữ cái, các ký hiệu ngắn gọn, đặt ngay trong
biểu ghi thư mục để các DBMS có thể đánh dấu và
nhận biết các loại thông tin khác nhau trong mỗi biểu
ghi. Từ đó có thể sắp xếp và trình bày chúng.
MARC sử dụng ngay một số trường làm điểm truy
nhập thông tin, giúp cho DBMS thực hiện việc tìm tin
được dễ dàng.
2. mô tả nội dung tài liệu và cấu trúc của ngôn
2. mô tả nội dung tài liệu và cấu trúc của ngôn
ngữ tư liệu
ngữ tư liệu
2.1. Khái niệm chung về mô tả nội dung tài liệu
2.1. Khái niệm chung về mô tả nội dung tài liệu
Mô tả nội dung là gì?
Mô tả nội dung tài liệu là một tập hợp các công đoạn, ở đó ngư
ời ta mô tả nội dung tài liệu cùng với những sản phẩm của
chúng
Đó là phân loại, đánh chỉ số, tóm tắt và phân tích tài liệu.
Mục đích của mô tả nội dung:
Nắm bắt nội dung tài liệu
Xác định cách thức và mức độ xử lý tài liệu
Giúp cho việc sắp xếp, lưu trữ thông tin và tìm kiếm tài liệu
Các mức độ xử lý nội dung tài liệu:
Phân loại
Đánh chỉ số
Làm tóm tắt
Mô tả nội dung tài liệu bằng gì?
Bằng ngôn ngữ tư liệu.
2.2. Cấu trúc của ngôn ngữ tư liệu
2.2. Cấu trúc của ngôn ngữ tư liệu
Ngôn ngữ tư liệu là gì?
Hai yếu tố cơ bản tạo thành ngôn ngữ tư liệu:
Vốn từ vựng của ngôn ngữ
Các yếu tố cú pháp
Phân loại ngôn ngữ tư liệu theo cấu trúc
Ngôn ngũ kết hợp trước: ngôn ngữ có cấu trúc cấp
bậc một cách hệ thống (Các hệ thống phân loại
DDC, UDC, BBK,...)
Ngôn ngữ kết hợp sau: ngôn ngữ có cấu trúc tổ hợp
(Từ điển từ chuẩn, danh mục các từ khoá,...)
Cấu trúc toán học của các khung phân loại
cấu trúc toán học của các hệ thống phân loại
cấu trúc toán học của các hệ thống phân loại
Giới thiệu quan hệ tương đương
Quan hệ tương đương là gì?
Quan hệ tương đương trên tập hợp X chia tập X
thành các lớp tương đương X
1
, X
2
, ..., X
n
sao cho:
X
i
X
j
=
X
1
X
2
... X
n
= X
Tính chất của các lớp tương đương bảo đảm hai
yêu cầu của phân loại:
Mỗi đối tượng đều thuộc một lớp
Không có đối tượng nào thuộc hai lớp khác nhau.
Ví dụ: quan hệ cùng tổ, quan hệ đồng hương,...