BỘ THÔNG TIN VÀ TRUYỀN THÔNG
ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN
THUYẾT MINH TIÊU CHUẨN
TIÊU CHUẨN KỸ THUẬT TẠO LẬP CHỈ MỤC
(DÙNG CHO METADATA VÀ TÀI LIỆU TOÀN VĂN)
HÀ NỘI - THÁNG 1/2017
Mục lục
1 Giới thiệu...............................................................................................................................4
1.1 Tên gọi của tiêu chuẩn Việt Nam.....................................................................................4
1.2 Mục đích của việc xây dựng tiêu chuẩn.........................................................................4
1.3 Các nội dung nghiên cứu................................................................................................4
2 Tình hình trong và ngoài nước về tiêu chuẩn lập chỉ mục và tài liệu toàn văn............5
3 Cơ sơ xây dựng các yêu cầu kỹ thuật.............................................................................10
3.1 Phân tích tình hình đối tượng tiêu chuẩn...................................................................10
3.2 TCVN 4743:1989..............................................................................................................11
3.3 TCVN 7539:2005..............................................................................................................11
3.4 Tài liệu toàn văn theo tiêu chuẩn ISO...........................................................................14
3.5 Tiêu chuẩn ISO 15836:2003............................................................................................17
3.6 Tiêu chuẩn ISO 999:1996................................................................................................21
3.7 TCVN 10669:2014 (ISO 5963:1985)...............................................................................29
3.8 NISO TR02-1997, Guidelines for Indexes and Related Information Retrieval
Devices.....................................................................................................................................31
4 Xây dựng tiêu chuẩn...........................................................................................................33
4.1 Sở cứ xây dựng tiêu chuẩn.............................................................................................33
4.2 Hình thức xây dựng tiêu chuẩn......................................................................................35
4.3 Cấu trúc tiêu chuẩn..........................................................................................................35
4.4 Nội dung tiêu chuẩn.........................................................................................................36
Tài liệu tham khảo....................................................................................................................40
THUYẾT MINH TIÊU CHUẨN
TIÊU CHUẨN KỸ THUẬT TẠO LẬP CHỈ MỤC
(DÙNG CHO METADATA VÀ TÀI LIỆU TOÀN VĂN)
1 Giới thiệu
1.1 Tên gọi của tiêu chuẩn Việt Nam
Tiêu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài liệu toàn văn)
1.2 Mục đích của việc xây dựng tiêu chuẩn
Tiêu chuẩn này cung cấp hướng dẫn về nội dung, tổ chức và trình bày chỉ mục sử
dụng cho việc tìm kiếm tài liệu và các phần của tài liệu. Tiêu chuẩn đề xuất các quy tắc
lập chỉ mục, các phương pháp được sử dụng (phân tích bằng trí tuệ, thuật toán máy
tính hoặc cả hai), phương tiện lập chỉ mục và các phương pháp trình bày chỉ mục cho
tìm kiếm. Nó nhấn mạnh ba quy trình cần thiết cho tất cả các chỉ mục: thiết kế toàn
diện, quản lý vốn từ vựng và cung cấp các cú pháp. Nó bao gồm các định nghĩa về chỉ
mục và các thành phần, thuộc tính và các khía cạnh; từ vựng thống nhất; mô tả bản
chất và sự đa dạng của các chỉ mục; các khuyến nghị liên quan đến việc thiết kế, tổ
chức và trình bày các chỉ mục.
Tiêu chuẩn này liên quan đến việc chuẩn bị tất cả các loại chỉ mục cho tìm kiếm thông
tin, bất kể chúng được tạo lập trên cơ sở phân tích bằng trí tuệ, bằng các phương pháp
tự động hoặc được máy tính hỗ trợ, cho dù chúng được tìm kiếm bằng mắt thường
hoặc bằng thuật toán điện tử và được biên soạn bởi một người lập chỉ mục hoặc một
nhóm người lập chỉ mục.
1.3 Các nội dung nghiên cứu
Bộ Thông tin và Truyền thông đã giao Viện Công nghệ thông tin - Đại học Quốc gia Hà
Nội xây dựng "Tiêu chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài liệu toàn
văn) – Phần 2: Lập chỉ mục cho tài liệu toàn văn ", đây là bộ dự thảo trong khuôn khổ
dự án "Xây dựng 04 chuẩn từ vựng về dữ liệu nội dung số và trao đổi thông tin; 58
chuẩn tạo lập, lưu trữ, trao đổi và quản lý dữ liệu và nội dung số". Nhóm thực hiện
nghiên cứu đã có những kết quả nghiên cứu tập hợp tóm tắt ở phần dưới đây.
2 Tình hình trong và ngoài nước về tiêu chuẩn lập chỉ mục và tài liệu toàn văn.
Thuật ngữ tạo lập chỉ mục trong ngôn ngữ của ngành Thông tin Tư liệu được gọi là
định chỉ mục. Định chỉ mục là một quy trình xử lý nội dung tài liệu được áp dụng rộng
rãi trong các thư viện và cơ quan thông tin nhằm tạo ra các bảng chỉ mục cho phép
người dùng có thể truy cập thông tin và có thể tìm kiếm và thu thập thông tin có
nghĩa theo chủ đề và từ khóa.
Trong cuốn NIST's Dictionary of Algorithms and Data Structures (Từ điển thuật toán
và cấu trúc dữ liệu của Viện Tiêu chuẩn và Kỹ thuật Quốc gia Mỹ) có định nghĩa về
các loại chỉ mục trong đó có định nghĩa về chỉ mục ngược (inverted indexing) là cấu
trúc dữ liệu chỉ mục lưu giữ các ánh xạ từ nội dung (từ hoặc số) đến vị trí của nó
trong một tệp tin cơ sở dữ liệu hoặc trong một tài liệu hoặc trong một tập tài liệu. Có
2 loại chỉ mục ngược: chỉ mục ngược mức tài liệu và chỉ mục ngược mức từ.
Trong hoạt động tiêu chuẩn hóa sản xuất, các lĩnh vực của đời sống xã hội, việc
chuẩn hóa các quy trình luôn là một vấn đề luôn được quan tâm, các quy trình hoạt
động thư viện, trao đổi thông tin là một phần trong các quy trình đó.
Hiện nay, Tổ chức Tiêu chuẩn hóa Quốc tế đã ban hành các Tiêu chuẩn quốc tế ISO
liên quan đến lập chỉ mục và tài liệu toàn văn sau:
- ISO 5963:1985 Documentation - Method for examining documents, determining
their subject and selecting indexing terms
- ISO 999:1996 Information and documentation - Guidelines for the content,
organization and presentation of indexes
- ISO 23950:1998 Information and documentation -- Information retrieval (Z39.50) -Application service definition and protocol specification.
- ISO/IEC 26300:2006 Information technology -- Open Document Format for Office
Applications (OpenDocument) v1.0
- ISO/IEC 29500-1:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 1: Fundamentals and
Markup Language Reference
- ISO/IEC 29500-2:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 2: Open Packaging
Conventions
- ISO/IEC 29500-3:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 3: Markup
Compatibility and Extensibility
- ISO/IEC 29500-4:2012 Information technology -- Document description and
processing languages -- Office Open XML File Formats -- Part 4: Transitional
Migration Features
- ISO/IEC TS 30135-1:2014 Information technology -- Digital publishing -- EPUB3 -Part 1: EPUB3 Overview
- ISO/IEC TS 30135-2:2014 Information technology -- Digital publishing -- EPUB3 -Part 2: Publications
- ISO/IEC TS 30135-3:2014 Information technology -- Digital publishing -- EPUB3 -Part 3: Content Documents
- ISO/IEC TS 30135-4:2014 Information technology -- Digital publishing -- EPUB3 -Part 4: Open Container Format
- ISO/IEC TS 30135-5:2014 Information technology -- Digital publishing -- EPUB3 -Part 5: Media Overlay
- ISO/IEC TS 30135-6:2014 Information technology -- Digital publishing -- EPUB3 -Part 6: EPUB Canonical Fragment Identifier
- ISO/IEC TS 30135-7:2014 Information technology -- Digital publishing -- EPUB3 -Part 7: EPUB3 Fixed-Layout Documents
- ISO 14739-1:2014 Document management -- 3D use of Product Representation
Compact (PRC) format -- Part 1: PRC 10001
- ISO 14289-1:2012 Document management applications -- Electronic document file
format enhancement for accessibility -- Part 1: Use of ISO 32000-1 (PDF/UA-1)
- ISO 19005-1:2005 Document management -- Electronic document file format for
long-term preservation -- Part 1: Use of PDF 1.4 (PDF/A-1)
- ISO 19005-2:2011 Document management -- Electronic document file format for
long-term preservation -- Part 2: Use of ISO 32000-1 (PDF/A-2)
- ISO 19005-3:2012 Document management -- Electronic document file format for
long-term preservation -- Part 3: Use of ISO 32000-1 with support for embedded files
(PDF/A-3)
- ISO 24517-1:2008 Document management -- Engineering document format using
PDF -- Part 1: Use of PDF 1.6 (PDF/E-1)
- ISO 32000-1:2008 Document management -- Portable document format -- Part 1:
PDF 1.7
Tiêu chuẩn do các nước ban hành:
- Tính đến năm 2001, có 8 nước đã chấp nhận ISO 5963: 1985 làm tiêu chuẩn quốc
gia. Một số nước chấp nhận ISO 5963: 1985 làm tiêu chuẩn quốc gia không có bổ
sung hiệu chỉnh: Anh, Tây Ban Nha, Thụy Điển, Đức, Bungari, Cộng hòa Séc, Nam
Phi... Một số nước chấp nhận ISO 5963: 1985 làm tiêu chuẩn quốc gia có bổ sung,
hiệu chỉnh: Ý, Nga…
- Tổ chức tiêu chuẩn hóa Công hòa Liên bang Nga đã xây dựng và ban hành hai tiêu
chuẩn quốc gia liên quan đến định chỉ mục tài liệu, bao gồm: GOST 7.59-2003 "Định
chỉ mục tài liệu. Yêu cầu chung cho tổ chức và lập chỉ mục” và GOST 7.66-92 "Định
chỉ mục tài liệu. Yêu cầu chung để phối hợp định chỉ mục.
- Mỹ: Guidelines for Indexes and Related Information Retrieval Devices (Hướng dẫn
lập chỉ mục và các công cụ tìm kiếm thông tin có liên quan) ban hành năm 1997.
Các tiêu chuẩn Việt nam về thông tin và tư liệu
Ở nước ta, ngày 14 tháng 7 năm 2004, Tổng cục trưởng Tổng cục Tiêu chuẩn-Đo
lường-Chất lượng ra Quyết định số 414/TĐC-QĐ về việc thành lập Ban Kỹ thuật tiêu
chuẩn TCVN/TC 46: Thông tin Tư liệu.
Ban Kỹ thuật tiêu chuẩn TCVN/TC 46 ra đời góp phần đẩy mạnh hoạt động tiêu
chuẩn hóa trong lĩnh vực thông tin-thư viện, lưu trữ và xuất bản theo mô hình và
phương hướng của Tổ chức Tiêu chuẩn hoá quốc tế (ISO). Trong mảng thông tinthư viện, TCVN/TC 46 phần lớn tập trung vào việc nghiên cứu và biên soạn tiêu
chuẩn thuộc ba lĩnh vực chủ đề : 1) các tiêu chuẩn dùng cho mô tả thư mục và dữ
liệu thư mục; 2) các tiêu chuẩn dùng cho mô tả chủ đề và dữ liệu chủ đề và 3)
Các tiêu chuẩn trình bày tư liệu.
Thời gian qua, TCVN/TC 46 đã xem xét, sửa đổi và cập nhật các tiêu chuẩn trước
đây do Trung tâm Tiêu chuẩn Chất lượng phối hợp với Viện Thông tin KHKT Trung
ương (nay là Trung tâm Thông tin KH&CN Quốc gia) hoặc Cục xuất bản biên soạn
dựa trên các tiêu chuẩn của Liên Xô cũ hoặc Khối SEV và trình Bộ KH&CN phê
duyệt và ban hành. Đó là: TCVN 2243 – 77: Chuyển chữ cái Nga sang chữ cái Việt,
TCVN 4523-88: Ấn phẩm thông tin, phân loại, cấu trúc và trình bày; TCVN 4524-88:
Xử lý thông tin, bài tóm tắt và bài chú giải; TCVN 4743-89: Mô tả thư mục tài liệu,
yêu cầu chung và quy tắc biên soạn; TCVN 5453-1991: Hoạt động thông tin khoa
học và tư liệu. Thuật ngữ và khái niệm cơ bản; TCVN 5697-1992: Hoạt động thông
tin tư liệu. Từ và cụm từ tiếng Việt viết tắt dùng trong mô tả thư mục; TCVN 56981992 Hoạt động thông tin tư liệu. Từ và cụm từ tiếng nước ngoài viết tắt dùng trong
mô tả thư mục; và một số tiêu chuẩn dựa trên ISO như TCVN 6380: 1998 về Thông
tin và tư liệu – Mã số tiêu chuẩn quốc tế cho sách (ISBN) VN 6381: 1998 về Thông
tin và tư liệu – Mã số tiêu chuẩn quốc tế cho xuất bản phẩm nhiều kỳ (ISSN). TCVN
6909:2001 (Phông chữ Unicode) dùng chung cho nhiều ngành,…
Từ khi thành lập, TCVN/TC 46 chủ trương biên soạn các TCVN (một vài tiêu chuẩn
trong số đó dựa trên ISO):
- TCVN 7420-1:2004 và TCVN 7420-2 :2004 (tương đương với ISO 15489 –1 và ISO
15489 –2): Thông tin và Tư liệu – Quản lý hồ sơ. Phần 1 : Yêu cầu chung và Thông
tin và Tư liệu – Quản lý hồ sơ. Phần 2 : Hướng dẫn;
- TCVN 7539: 2005 Thông tin và Tư liệu– Khổ mẫu MARC 21 cho dữ liệu thư mục;
- TCVN 7587: 2007 Thông tin và Tư liệu — Tên và mã địa danh Việt Nam dùng trong
lưu trữ và trao đổi thông tin KHCN;
- TCVN 7588: 2007 Thông tin và Tư liệu – Tên và mã tổ chức dịch vụ thông tin
KH&CN Việt Nam dùng trong lưu trữ và trao đổi thông tin KH&CN;
- TCVN 5453: 2009 Thông tin và Tư liệu: Từ vựng, v.v…
- TCVN 10669:2014 (ISO 5963:1985) Thông tin và tư liệu – Phương pháp phân tích
tài liệu, xác định chủ đề và lựa chọn các thuật ngữ định chỉ mục.
- TCVN 10846:2015 (ISO 999:1996) Thông tin và tư liệu – Hướng dẫn về nội dung,
tổ chức và trình bày các bảng chỉ mục.
Muốn bám sát chương trình tiêu chuẩn hóa của ISO trong lĩnh vực thông tin và tư
liệu (Xem phụ lục), trên con đường hội nhập và hiện đại hóa, TCVN/TC 46 còn rất
nhiều việc phải làm, mặc dầu kinh phí hiện nay được cấp chỉ đủ để tổ chức biên
soạn và ban hành 2 hoặc 3 tiêu chuẩn mỗi năm. Vì vậy, chúng ta phải không ngừng
cải tiến hoạt động của TCVN/TC 46 nói chung và cân bằng việc biên soạn giữa các
tiêu chuẩn về các công đoạn, công cụ xử lý, lưu trữ và phổ biến thông tin truyền
thống với các tiêu chuẩn cần thiết trong thời đại áp dụng công nghệ thông tin mới để
theo kịp với đà phát triển của hoạt động tiêu chuẩn hóa trong khu vực và trên thế
giới.
Ngày 20/09/2011, Bộ Thông tin và Truyền thông ban hành Thông tư số 24/2011/TTBTTTT về "Quy định về việc tạo lập, sử dụng và lưu trữ dữ liệu đặc tả trên trang
thông tin điện tử hoặc cổng thông tin điện tử của cơ quan nhà nước".
Theo Thông tư số 24/2011/TT-BTTTT, Dữ liệu đặc tả là những thông tin mô tả các
đặc tính của dữ liệu như nội dung, định dạng, chất lượng, điều kiện và các đặc tính
khác nhằm tạo thuận lợi cho quá trình tìm kiếm, truy cập, quản lý và lưu trữ dữ liệu.
Và nhằm tạo thuận lợi cho quá trình tìm kiếm, truy cập, quản lý và lưu trữ dữ liệu,
thông tin đăng tải trên cổng thông tin điện tử, cổng thông tin điện tử của cơ quan nhà
nước phải sử dụng dữ liệu đặc tả theo chuẩn Dublin Core với 15 yếu tố dữ liệu đặc
tả. Trong đó, quy định 6 yếu tố dữ liệu đặc tả bắt buộc gồm: Tiêu đề, người tạo, thời
gian, mô tả, cơ quan ban hành và yếu tố định danh; Các yếu tố được khuyến nghị
nên sử dụng là: Ngôn ngữ, nguồn, người cộng tác và chủ đề; Còn các yếu tố tùy
chọn bao gồm: Phạm vi, dạng, định dạng, quan hệ và các quyền.
Nhận xét: Thông tư số 24/2011/TT-BTTTT, Quy định về việc tạo lập, sử dụng và lưu
trữ dữ liệu đặc tả trên trang thông tin điện tử hoặc cổng thông tin điện tử của cơ
quan nhà nước theo chuẩn Dublin Core. Như vậy khi xem xét phạm vi đối tượng áp
dụng của dự án chung và kết hợp với mục đích xây dựng dự thảo này, các đối tượng
áp dụng khác (ngoài cơ quan nhà nước) cũng có thể áp dụng chuẩn Dublin Core vào
trong hoạt động tạo lập, sử dụng và lưu trữ dữ liệu đặc tả của họ.
Việc này tạo ra sự thống nhất trong trao đổi và lưu trữ thông tin, dữ liệu và giảm bớt
khó khăn kỹ thuật không đáng có. Cụ thể trong dự thảo này, nhóm biên soạn nhất trí
khuyến nghị sử dụng chuẩn Dublin Core trong quá trình tạo lập chỉ mục ngược cho
metadata.
Các tiêu chuẩn TCVN 7980:2008 hoàn toàn tương đương ISO 15836:2003, TCVN
10669:2014 hoàn toàn tương đương với ISO 5963:1985. Các tiêu chuẩn TCVN khác
khi xét các yếu tố ràng buộc có liên quan như đã phân tích bên trên thì nhóm biên
soạn thống nhất không cần phải xem xét đến.
Như vậy các tài liệu, tiêu chuẩn kỹ thuật mà nhóm biên soạn sử dụng để xây dựng
quyển thuyết minh này từ đó có thể xem xét sở cứ xây dựng dự thảo phục vụ cho
mục đích dự án bao gồm:
- TCVN 4743:1989: Xử lý thông tin - Mô tả thư mục tài liệu;
- TCVN 5453: 2009, Thông tin và Tư liệu – Từ vựng;
- TCVN 7539:2005: Khổ mẫu MARC 21 cho dữ liệu thư mục;
- TCVN 5697:2009: Từ và cụm từ tiếng Việt viết tắt trong mô tả thư mục;
- TCVN 10669:2014 (ISO 5963:1985) Thông tin và tư liệu – Phương pháp phân
tích tài liệu, xác định chủ đề và lựa chọn các thuật ngữ định chỉ mục;
- TCVN 7980:2008 (ISO 15836:2003) Thông tin và tài liệu – Bộ phần tử dự liệu
đặc tả Dublin Core;
- ISO 999:1996, Information and documentation – Guidelines for the content,
organization and presentation of indexes;
- ISO 15836:2003, Information and documentation -- The Dublin Core metadata
element set;
- NISO TR02-1997, Guidelines for Indexes and Related Information Retrieval
Devices;
- NISO TR03-1999, Guidelines for Alphabetical Arrangement of Letters and
Sorting of Numerals and Other Symbols;
3 Cơ sơ xây dựng các yêu cầu kỹ thuật.
3.1 Phân tích tình hình đối tượng tiêu chuẩn
Khi đề cập đến ngành thư viện, quy trình tạo lập chỉ mục đã được hình thành và phát
triển gần như song hành cùng ngành thư viện. Từ hồi mở đầu trên tài liệu giấy, quy
trình tạo lập chỉ mục được tiến hành thủ công, người định chỉ mục tiến hành tỉ mỉ và
tốn nhiều thời gian để lập được bảng chỉ mục cho một tài liệu giấy. Tuy nhiên khi
khoa học công nghệ phát triển, số lượng sách, các dạng xuất bản phẩm ở dạng giấy
và không ở dạng giấy được xuất bản, phát hành ngày một nhiều, quy trình tạo lập chỉ
mục thủ công đã không còn phù hợp nữa. Bảng chỉ mục trong hiện tại đã có nhiều
thay đổi, ứng dụng bảng chỉ mục góp phần để giới thiệu cho người đọc về tài liệu,
cách đọc, cách khai thác, cách tra cứu như thế nào để thấy được “Ngọc trong sách”.
Với nhiều phong cách khác nhau, các nhà văn muốn bạn đọc của mình tiếp cận với
những từ, những câu “đắt nhất” đó một cách tự nhiên hoặc bất ngờ, vào thời điểm
cao trào hay trầm lắng.
Đối với một nhà nghiên cứu, trong công trình nghiên cứu khoa học của mình thường
sử dụng nhiều thuật ngữ chuyên môn, thuật ngữ khoa học, cách tiếp cận mới được
thể hiện. Và đó cũng chính là những ý tưởng, tư tưởng, tính mới trong nghiên cứu…
được tác giả mong muốn thể hiện, chia sẻ với giới chuyên môn, với người đọc tham
khảo và với người học.
Vậy làm sao để bạn đọc sớm phát hiện ra những ý “đắt nhất” đó? Cách thức nào để
bạn đọc kiểm soát nội dung cuốn sách, hệ thống các vấn đề, các nội dung trùng lặp
nhau để thuận tiện cho việc đối chiếu, so sánh và suy ngẫm về một vấn đề? Việc làm
này chỉ có tác giả và các cán bộ là chuyên gia trong công tác biên tập đúng nghĩa
của nhà xuất bản mới có thể thực hiện được. Đó chính là tạo “bảng chỉ mục” cho tài
liệu sách, đặc biệt là sách tham khảo và nghiên cứu chuyên ngành. Việc tạo “bảng
chỉ mục” cho tài liệu sách sẽ giúp người đọc lựa chọn phạm vi nội dung, định hướng
việc đọc sách và kiểm soát việc đọc sách của chính mình. "Bảng chỉ mục" được
người định chỉ mục dày công chỉ ra, đánh dấu những thuật ngữ, từ chuyên môn, các
từ khóa… hay còn được hiểu là những từ, ý, câu “đắt nhất” của công trình nghiên
cứu khoa học.
3.2 TCVN 4743:1989
Quy định những yêu cầu đặt ra với công tác mô tả thư mục một tài liệu. Khái niệm tài
liệu ở đây bao gồm các tài liệu công bố hoặc không công bố với các loại hình khác
nhau: sách, ấn phẩm tiếp tục, các tài liệu định mức kỹ thuật, các tài liệu kỹ thuật, các
báo cáo nghiên cứu khoa học, các tài liệu dịch và luận án.
Tiêu chuẩn đã đưa ra các quy tắc để mô tả tài liệu với thành phần các yếu tố mô tả,
trình tự sắp xếp các yếu tố, cách điền và phương pháp trình bày các yếu tố mô tả,
sử dụng các dấu phân cách giữa các yếu tố và các vùng mô tả.
3.3 TCVN 7539:2005
Tiêu chuẩn này quy định về cách trình bày các dữ liệu thư mục cho biên mục đọc
máy. Đây là một tiêu chuẩn mới được ban hành và là tiêu chuẩn duy nhất trong số
bốn tiêu chuẩn vừa đề cập được xây dựng trên cơ sở một chuẩn biên mục của Hoa
Kỳ.
TCVN 7539:2005: Khổ mẫu MARC 21 cho dữ liệu thư mục, được áp dụng nhiều
nhất. Tuy nhiên, một số thư viện đại học cho biết: hiện thư viện có biên mục theo
MARC 21 nhưng lại không biết có TCVN 7539:2005. Kết quả cụ thể về việc áp dụng
TCVN trong xử lý tài liệu tại thư viện công cộng.
Tiêu chuẩn TCVN 7539:2005 dày 100 trang, khổ A4, gồm 17 điều:
—
Các điều 1-3 là các điều khoản chung liên quan tới: Phạm vi áp dụng, Thuật
ngữ và Quy định chung về biểu ghi thư mục;
—
Các điều từ 4-17 quy định các trường trong biểu ghi MARC21 được lựa chọn
vào tiêu chuẩn là những trường được sử dụng thường xuyên với mục đích đảm bảo
sự bao quát ở mức hợp lý trên cơ sở nghiên cứu thực tiễn biên mục ở Việt Nam.
Mỗi trường được cấu trúc thành 3 phần:
—
Định nghĩa và phạm vi trường;
—
Cấu trúc trường;
—
Quy ước nhập dữ liệu.
Cuối tiêu chuẩn có 2 phụ lục có thể dùng để tham khảo, bao gồm: Danh mục các từ
viết tắt (sử dụng trong tiêu chuẩn) và Danh mục một số mã thường gặp. Với cách
trình bày ngắn gọn, rõ ràng, tuân thủ các quy định trình bày TCVN, TCVN 7539:2005
có thể là cẩm nang cho các cán bộ trực tiếp biên mục cũng như cán bộ nghiên cứu
và giảng dạy biên mục đọc máy tại Việt Nam.
Định danh của xuất bản phẩm nhiều kỳ có thể là một loạt chữ số và ngày tháng,
nhưng chỉ có một số yếu tố đáp ứng tiêu chuẩn nhất định mới được coi là định danh
số và thời gian.
Định danh số. Một chữ số hoặc kết hợp các chữ số, ngày tháng, chữ cái hoặc từ để
nhận dạng một xuất bản phẩm nhiều kỳ.
Định danh thời gian. Một ngày tháng hoặc kết hợp của ngày tháng, chữ số, hoặc các
từ để nhận dạng một xuất bản phẩm nhiều kỳ.
Một số xuất bản phẩm nhiều kỳ có nhiều định danh số hoặc ngày tháng. Trong bài
viết này, thuật ngữ “định danh” đề cập đến dạng định danh số hoặc ngày tháng hoặc
kết hợp cả hai khi được mô tả ở trường 362 hoặc 500.
Định danh phải “nhận dạng” một số cụ thể. Ở đây, khía cạnh nhận dạng là chủ yếu.
Ví dụ, nếu xuất bản phẩm nhiều kỳ được xuất bản hàng tháng và chỉ có 1 định danh
ngày tháng, thì phải chứa ít nhất tên tháng, năm để phân biệt mỗi số của từng tháng
với các số khác. Nếu một xuất bản phẩm nhiều kỳ mang cả định danh số và thời
gian, ít nhất một loại định danh phải nhận dạng được số đó, trong trường hợp này,
cần mô tả cả hai loại định danh.
Nguồn mô tả. Nguồn lấy thông tin để mô tả định danh là toàn bộ xuất bản phẩm
nhiều kỳ (AACR2 12.0B1). Điều này có nghĩa là thông tin được lấy từ bất cứ vị trí
nào của tài liệu mà không cần dùng các dấu ngoặc. Định danh có thể hoặc không
xuất hiện trên nguồn lấy thông tin chính. Trong nhiều xuất bản phẩm nhiều kỳ, một
phần định danh có trên bìa trong khi định danh đầy đủ lại ở trang biên tập hay tiêu đề
chạy. AACR2 liệt kê nguồn lấy thông tin mô tả là trang nhan đề, phần mở đầu, dẫn
nhập và lời ghi cuối sách.
Nguồn ưu tiên. Định danh có thể được lấy từ bất kỳ nguồn nào khi cần thiết, nhưng
thường ưu tiên hơn với định danh được giới thiệu một cách đầy đủ nhất, dễ dàng tìm
thấy nhất. Định danh xuất hiện cùng với nhan đề hoặc bất cứ vị trí nào ở nguồn lấy
thông tin chính thường là định danh được ưu tiên.
Nguồn định danh có chứa một định danh số và một định danh thời gian. Khi xuất bản
phẩm nhiều kỳ có cả hai loại định danh số và thời gian, mỗi phần của định danh có
thể được lấy từ các nguồn khác nhau. Tạp chí thường chỉ có ngày tháng trên bìa,
còn số thứ tự các tập thì có ở trang thông tin biên tập. Mỗi phần định danh được lựa
chọn như thực thể riêng rẽ thì được hợp lại với dấu phân cách thích hợp.
Hợp nhất định danh số và thời gian. Định danh số có thể được lấy từ một nguồn và
định danh thời gian từ một nguồn khác. Định danh số có thể nhóm lại từ nhiều nguồn
khác nhau khi thấy rõ ràng là nhà xuất bản dự định dùng hai phần định danh này
thay cho định danh số. Khi không rõ thì không hợp nhất định danh số từ nhiều
nguồn. Nếu cũng có trong tay số mới nhất ghi là volume 1, issue 2, thì ý định của
nhà xuất bản là rõ ràng và cả hai định danh số và thời gian có thể được mô tả như
định danh số.
Định danh thời gian cũng có thể được hợp lại với nhau từ nhiều nguồn và thường
không khó hiểu như với định danh số.
Lấy định danh từ một nguồn không chính thức hoặc không được trình bày nổi bật.
Mô tả một định danh từ một nguồn không chính thức, như tìm thấy trong lời nói đầu,
nếu đó không phải là số thứ tự hoặc thời gian khác được coi là định danh và phải
chắc chắn đó là một xuất bản phẩm nhiều kỳ.
3.4 Tài liệu toàn văn theo tiêu chuẩn ISO.
a. Tài liệu PDF.
PDF (viết tắt từ tên tiếng Anh Portable Document Format, Định dạng Tài liệu Di
động) là một định dạng tập tin văn bản khá phổ biển của hãng Adobe Systems.
Tương tự như định dạng Word (.doc), PDF hỗ trợ văn bản thô (text) cùng với phông
chữ, hình ảnh đồ họa, âm thanh và nhiều hiệu ứng khác. Tuy nhiên, việc hiển thị văn
bản PDF không phụ thuộc vào môi trường làm việc của người sử dụng (cấu hình
máy, phần mềm và hệ điều hành). Không như văn bản Word, một văn bản PDF,
trong hầu hết các trường hợp, sẽ được hiển thị giống nhau trên những môi trường
làm việc khác nhau. Chính vì ưu điểm này, định dạng PDF đã trở nên phổ biển cho
việc phát hành sách, báo hay các tài liệu khác qua mạng Internet.
Việc phổ biến định dạng PDF trong thời gian đầu tương đối chậm. Những phiên bản
đầu tiên của PDF không hỗ trợ siêu liên kết bên ngoài, làm giảm tính hữu dụng của
nó trên web. Kích thước tập tin tăng lên so với văn bản thuần cũng có nghĩa là thời
gian để tải xuống một tài liệu PDF sẽ lâu hơn, đây cũng là một vấn đề với những
modem chậm thời đó.
Kể từ năm 1995, Adobe đã tham gia vào một số các nhóm làm việc để tạo ra thông
số kỹ thuật cho các ấn phẩm của ISO và hợp tác trong quá trình ISO trên một phần
nhỏ của các tiêu chuẩn chuyên ngành cho các ngành công nghiệp PDF và các mục
đích cụ thể (ví dụ như PDF / X hoặc PDF / A).
Các chuẩn ISO cho các dạng PDF:
- PDF/X (theo chuẩn ISO 15929 và 15930 – Công nghệ đồ họa – Trạo đổi dữ liệu
số): dạng “PDF trao đổi” dựa trên PDF 1.3, PDF 1.4 và PDF 1.6.
- PDF/A (theo chuẩn ISO 19005 – Quản lý tài liệu - Định dạng tập tin tài liệu điện tử
để bảo quản lâu dài): dạng “PDF lưu trữ” dựa trên PDF 1.4 và PDF 1.7.
- PDF/E (theo chuẩn ISO 24517 – Quản lý tài liệu - Định dạng tài liệu kỹ thuật sử
dụng PDF): dạng “PDF kỹ thuật” dựa trên PDF 1.6.
- Tiêu chuẩn ISO cho "PDF đầy đủ chức năng" được xuất bản dưới hình thức tiêu
chuẩn ISO 32000. Đặc tả chức năng đầy đủ của không chỉ là một tập hợp con của
đặc điểm kỹ thuật Adobe PDF, trong khuyến nghị của ISO 32000-1 các chức năng
PDF đầy đủ bao gồm tất cả mọi thứ được định nghĩa trong PDF 1.7.
ISO 32000-1: 2008 quy định cụ thể một dạng kỹ thuật số cho đại diện cho tài liệu
điện tử cho phép người dùng trao đổi và xem các tài liệu điện tử độc lập với môi
trường mà họ đã tạo ra trong hoặc môi trường mà họ đang xem hoặc in trong này
dành cho các nhà phát triển phần mềm đó. tạo ra các tập tin PDF (phù hợp với các
nhà văn), phần mềm đọc file PDF hiện có và giải thích nội dung của họ để hiển thị và
tương tác (phù hợp với độc giả) và các sản phẩm PDF có thể đọc và / hoặc viết các
tập tin PDF cho nhiều mục đích khác (phù hợp với sản phẩm).
b. Tài liệu EPUB.
EPUB (short for electronic publication) là tiêu chuẩn e-book mở và miễn phí do Diễn
đàn xuất bản quốc tế (IDPF) đề xuất có đuôi file là .epub.
EPUB được thiết kế cho nội dung ngược, có nghĩa là một người đọc EPUB thể tối
ưu hóa văn bản cho một thiết bị hiển thị cụ thể. EPUB cũng hỗ trợ nội dung cố định.
Định dạng này được dự định như là một định dạng duy nhất mà các nhà xuất bản và
nhà ở chuyển đổi có thể sử dụng trong nhà, cũng như để phân phối và bán hàng. Nó
thay thế các tiêu chuẩn mở eBook.
Các chuẩn ISO cho EPUB.
- Part 1
ISO/IEC TS 30135-1
2014-11-05 EPUB3 Overview
- Part 2
ISO/IEC TS 30135-2
2014-11-05 Publications
- Part 3
ISO/IEC TS 30135-3
2014-11-05 Content Documents
- Part 4
ISO/IEC TS 30135-4
2014-11-05 Open Container Format
- Part 5
ISO/IEC TS 30135-5
2014-11-05 Media Overlay
- Part 6
ISO/IEC TS 30135-6
2014-11-05 EPUB
ISO/IEC TS 30135-7
2014-11-05 EPUB3
Canonical
Fragment
Identifier
- Part 7
Documents
Fixed-Layout
c. Tài liệu PRC.
PRC là một định dạng ebook khá phổ biến tại Việt Nam. Đây là một dạng file nén
được tối ưu hóa để lưu trữ, tải và hiển thị các loại dữ liệu 3D, đặc biệt là dữ liệu đại
diện cho sản phẩm sản xuất. Định dạng cho phép lưu trữ các file CAD lớn trong một
hình thức nén cao so với bản gốc. Cấu trúc hoàn chỉnh của PRC được xác định bởi
hệ thống CAD chứa trong một file PRC nhằm đáp ứng nhu cầu tài liệu 3D của sản
phẩm sản xuất và các ngành công nghiệp liên quan.
Tiêu chuẩn ISO cho PRC:
- ISO 14739-1: 2014 Document management -- 3D use of Product Representation
Compact (PRC) format -- Part 1: PRC 10001
d. Tài liệu mở (.odt).
Tài liệu mở (hay còn gọi là OpenDocument trong tiếng Anh) là một định dạng tập tin
thuộc họ XML dùng để lưu những tài liệu điện tử như bức thư, văn bản, bảng tính,
biểu đồ, và bản thuyết trình.
Tiêu chuẩn này được phát triển bởi Organization for the Advancement of Structured
Information Standards (OASIS). Các thông số kỹ thuật của tiêu chuẩn đã được phát
triển bởi Sun Microsystems cho các định dạng XML ban đầu được tạo ra và thực
hiện bởi OpenOffice.org.
Đinh dạng OpenDocument được sử dụng trong các phần mềm tự do và cả ở phần
mềm độc quyền. Nó bao gồm bộ phần mềm văn phòng (cả dạng phần mềm truyền
thống lẫn phần mềm trên nền web) và các ứng dụng cá nhân như phần mềm xử lý
văn bản, bảng tính, bản thuyết trình, và ứng dụng quản lý dữ liệu.
Ngoài việc là một tiêu chuẩn OASIS, phiên bản 1.0 được công bố như là một tiêu
chuẩn quốc tế ISO/IEC.
Tiêu chuẩn ISO cho .odt:
- ISO/IEC 26300:2006 Open Document Format for Office Applications
e. Tài liệu mở XML (.docx)
Tài liệu mở XML (cũng chính thức được gọi là OOXML hoặc OpenXML) là định dạng
tập tin XML được phát triển bởi Microsoft cho đại diện cho bảng tính, biểu đồ, trình
diễn và văn bản.
Bộ chương trình Microsoft Office 2007 mặc định lưu tập tin dùng định dạng này.
Office Open XML bao gồm nhiều ngôn ngữ đánh dấu đặc biệt thuộc họ XML và gói
lại những tập tin XML trong lưu trữ Open Packaging Convention (hợp với định dạng
ZIP). Bản đặc tả định dạng bao gồm các giản đồ XML (XML schema) dùng để kiểm
chứng cú pháp XML trong một tập tin.
Microsoft phát triển bản đặc tả về Office Open XML để thay thế các định dạng nhị
phân cũ của Office và nó được Ecma International xuất bản là tiêu chuẩn Ecma 376
vào tháng 12 năm 2006 và ISO/IEC chuẩn hóa (ISO/IEC 29500).
Tiêu chuẩn ISO cho .docx:
- ISO/IEC 29500-1:2012 Information technology - Document description and
processing languages - Office Open XML File Formats - Part 1: Fundamentals and
Markup Language Reference.
- ISO/IEC 29500-2:2012 Information technology - Document description and
processing languages - Office Open XML File Formats - Part 2: Open Packaging
Conventions.
- ISO/IEC 29500-3:2012 Information technology - Document description and
processing languages - Office Open XML File Formats - Part 3: Markup Compatibility
and Extensibility.
- ISO/IEC 29500-4:2012 Information technology - Document description and
processing languages -- Office Open XML File Formats - Part 4: Transitional
Migration Features
3.5 Tiêu chuẩn ISO 15836:2003.
Bộ phần tử dự liệu đặc tả Dublin Core là một chuẩn đề cập đến việc mô tả tài
nguyên thông tin liên lĩnh vực. Ở đây, tài nguyên thông tin được định nghĩa là các
thông tin được định danh. Đây là định nghĩa được sử dụng trong chuẩn Internet RFC
2396, “các thẻ định danh tài nguyên thống nhất (URI): Cú pháp chung” do Tim
Berners-Lee và cộng sự phát triển. Đối với các ứng dụng Dublin Core, tài nguyên
thông tin là một tài liệu điện tử.
Tiêu chuẩn này chỉ áp dụng cho bộ phần tử được sử dụng chung trong các ứng
dụng hoặc dự án cụ thể. Các chính sách, yêu cầu của cộng đồng và địa phương
khác nhau có thể áp đặt thêm một số giới hạn, quy tắc và cách thông dịch. Tiêu
chuẩn này không định nghĩa chi tiết tiêu chí mà bộ phần tử được sử dụng trong các
ứng dụng và dự án cụ thể. Tiêu chuẩn này thay thế cho chuẩn RFC 2413, đây là
phiên bản phát hành đầu tiên về Dublin Core.
Trong các mô tả phần tử, mỗi phần tử có một nhãn mô tả nhằm truyền đạt sự am
hiểu ngữ nghĩa về phần tử và mỗi phần tử còn có một tên duy nhất, gồm một từ mà
máy có thể hiểu được, dùng để tạo ra đặc tả cú pháp của các phần tử đơn giản hơn
trong lược đồ mã hóa.
Tuy nhiên trong một vài môi trường, như HTML, không phân biệt dạng chữ hoa và
chữ thường thì việc tuân thủ các quy ước về tên các phần tử là cách tốt nhất nhằm
tránh xung đột khi dự liệu đặc tả được trích dẫn hoặc chuyển đổi sang các môi
trường có sự phân biệt chữ hoa, chữ thường, như XML (Ngôn ngữ đánh dấu mở
rộng).
Mỗi phần tử là tùy chọn và có thể lặp lại. Các phần tử dự liệu đặc tả có thể xuất hiện
ở mọi thứ tự. Việc sắp xếp theo thứ tự số lần xuất hiện của một phần tử (ví dụ: tác
giả) có ý nghĩa đối với nhà cung cấp, nhưng không đảm bảo các phần tử được duy
trì trong mỗi hệ thống.
Để thúc đẩy tính tương tác toàn cầu, một số mô tả phần tử nên có một từ điển đối
với các giá trị phần tử tương ứng. Điều này được giả định rằng các từ vựng được
kiểm soát khác sẽ được phát triển về tính tương tác trong các miền cục bộ nào đó.
Các phần tử gồm có:
1. Tiêu đề: Tên được đặt cho một tài nguyên. Thông thường, Tiêu đề được hiểu là
tên chính thức của một tài nguyên.
2. Tác giả: Một thực thể trách nhiệm chính là tạo ra nội dung cho tài nguyên. Thông
thường, tên của tác giả nên được sử dụng để định danh thực thể này.
3. Chủ đề: Một chủ điểm nội dung của tài nguyên. Thông thường, Chủ đề được thể
hiện là các từ khóa, cụm từ khóa, hoặc các mã phân loại mô tả chủ điểm của tài
nguyên. Cách tốt nhất được khuyến cáo là lựa chọn một giá trị từ một từ vựng được
kiểm soát hay từ một lược đồ phân loại chính thức.
4. Mô tả: Mô tả nội dung của tài nguyên. Các ví dụ về mô tả bao gồm, nhưng không
chỉ như vậy, một tóm tắt, mục lục, tham chiếu đến nội dung của tài liệu bằng đồ họa,
văn bản.
5. Nhà phát hành: Thực thể có trách nhiệm tạo ra tài nguyên thông tin sẵn sàng để
sử dụng. Thông thường, tên của nhà phát hành nên được sử dụng để chỉ ra thực thể
đó.
6. Người đóng góp: Thực thể có trách nhiệm đóng góp vào nội dung của tài nguyên
thông tin đó. Thông thường, tên của người đóng góp nên được sử dụng để chỉ ra
thực thể đó.
7. Ngày tháng: Ngày tháng của sự kiện trong vòng đời của tài nguyên. Thông
thường, Ngày tháng là ngày tạo ra tài nguyên hoặc ngày tài nguyên sẵn sàng sử
dụng. Cách tốt nhất được khuyến cáo đối với việc mã hóa giá trị ngày tháng được
xác định trong một hồ sơ theo TCVN ISO 8601:2004 [W3CDTF] và bao gồm ngày
tháng theo dạng YYYY-MM-DD.
8. Kiểu: Bản chất hoặc dạng nội dung của tài nguyên. Kiểu bao gồm các thuật ngữ
mô tả các danh mục phân loại chung, các chức năng, các dạng hoặc các mức kết
hợp nội dung. Cách tốt nhất được khuyến cáo để chọn một giá trị từ một từ vựng
được kiểm soát (ví dụ, từ vựng kiểu DCMI [DCT]). Để mô tả biểu thị dạng vật lý hoặc
dạng số của tài nguyên, sử dụng phần tử định dạng.
9. Định dạng: Biểu thị dạng vật lý hoặc số của tài nguyên. Thông thường, định dạng
bao gồm kiểu phương tiện hoặc các kích cỡ của tài nguyên. Định dạng được sử
dụng để định danh phần mềm, phần cứng, hoặc thiết bị cần thiết khác dùng cho việc
điều hành hoặc hiển thị. Các ví dụ về kích thước bao gồm kích cỡ và khoảng thời
gian. Cách tốt nhất được khuyến cáo là lựa chọn giá trị từ một từ vựng được kiểm
soát (ví dụ, danh sách các kiểu phương tiện Internet (Internet Media Types [MIME])
định nghĩa các định dạng môi trường máy tính).
10. Thẻ định danh: Tham chiếu đến tài nguyên thông tin trong ngữ cảnh cụ thể. Cách
tốt nhất được khuyến cáo là định danh tài nguyên bằng một chuỗi hoặc số phù hợp
với hệ thống định danh chính thức. Hệ thống định danh chính thức bao gồm nhưng
không hạn chế đối với thẻ định danh tài nguyên thông tin thống nhất (URI) (gồm
người quy định tài nguyên thống nhất (URL), thẻ định danh đối tượng dạng số (DOI),
và mã số sách tiêu chuẩn quốc tế ( (ISBN)).
11. Nguồn: Tham chiếu đến một tài nguyên ở đó tài nguyên hiện tại được tạo. Tài
nguyên hiện tại có thể được lấy từ toàn bộ hoặc một phần tài nguyên gốc. Cách tốt
nhất được khuyến cáo là định danh tài nguyên được tham chiếu bởi chuỗi hoặc bởi
số phù hợp với hệ thống định danh chính thức.
12. Ngôn ngữ: Ngôn ngữ mô tả nội dung tri thức của tài nguyên. Cách tốt nhất là sử
dụng RFC 3066 kết hợp với ISO 639 [ISO639], định nghĩa các thẻ ngôn ngữ chính
gồm hai và ba chữ cái cùng với các thẻ nhỏ tùy chọn.
13. Quan hệ: Tham chiếu đến tài nguyên có liên quan. Cách tốt nhất được khuyến
cáo là định danh tài nguyên được tham chiếu bằng chuỗi hoặc số phù hợp với hệ
thống định danh chính thức.
14. Phạm vi: Phạm vi về nội dung của tài nguyên. Thông thường, phạm vi bao gồm
vị trí về không gian (tên địa điểm hoặc tọa độ địa lý), khoảng thời gian (nhãn, ngày
tháng, hoặc dãy ngày tháng), hoặc pháp nhân (như thực thể quản trị được đặt tên).
Cách tốt nhất được khuyến cáo là lựa chọn một giá trị từ một từ vựng được kiểm
soát.
15. Quyền: Thông tin về các quyền đối với tài nguyên. Thông thường, quyền bao
gồm tuyên bố quản lý các quyền đối với tài nguyên, hoặc tham chiếu một dịch vụ cấp
thông tin. Thông tin về các quyền thường bao gồm Quyền sở hữu trí tuệ (IPR), bản
quyền, và các quyền sở hữu khác. Nếu có mặt phần tử quyền, thì không có giả định
nào được tạo ra về các quyền trong tài nguyên đó.
3.6 Tiêu chuẩn ISO 999:1996.
Tiêu chuẩn này cung cấp hướng dẫn về nội dung, tổ chức và trình bày các chỉ mục,
áp dụng cho việc lập chỉ mục cho các dữ liệu toán văn và tài liệu điện tử.
Tiêu chuẩn này liên quan đến các nguyên tắc lập chỉ mục cơ bản và thực hành chứ
không phải là các thủ tục chi tiết về lập chỉ mục tùy theo loại tài liệu được lập chỉ mục
và người dùng được chỉ mục nhắc đến.
Tiêu chuẩn này bao gồm các lựa chọn, hình thức và sự sắp xếp của các Tiêu đề và
Tiêu đề phụ được sử dụng trong mục nhập chỉ mục khi các đối tượng lập chỉ mục
được xác định.
Mặc dù tiêu chuẩn này không đưa ra bất cứ hướng dẫn cho việc tạo ra chỉ mục tự
động trên máy tính, nó có liên quan đến việc tạo ta tất cả các loại chỉ mục, bất kể
chúng được thực hiện thủ công hoặc bằng các phương pháp có máy tính hỗ trợ, và
được biên soạn bởi một người lập chỉ mục hoặc một nhóm người lập chỉ mục.
Tiêu chuẩn này không bao gồm việc trích xuất bằng máy các từ khóa để tạo ra chỉ
mục, cũng không bao gồm các hệ thống lập chỉ mục đặc biệt như PRECIS, hệ thống
lập chỉ mục chuỗi, lập chỉ mục trích dẫn hoặc lập chỉ mục kết hợp, mặc dù các
khuyến nghị có thể tương ứng với một trong các hệ thống đó.
Chức năng của một chỉ mục là cung cấp cho người dùng một phương tiện hiệu quả
để theo dõi thông tin. Do đó, một chỉ mục nên:
-
Xác định và xác định vị trí thông tin quan trọng trong các tài liệu được lập chỉ
mục;
-
Phân biệt giữa thông tin về một chủ đề và đề cập thoáng qua về một chủ đề;
-
Phân tích các khái niệm được đề cập trong tài liệu mà một số tiều đề thể hiện;
-
Đảm bảo các từ được sử dụng trong chỉ mục là phù hợp với người dùng chỉ
mục để họ có thể
nhanh chóng thiết lập sự có mặt hay vắng mặt của thông tin về
một chủ đề cụ thể trong một công việc không quen thuộc;
nhanh chóng phục hồi
thông tin được nhớ trong một phần hoặc toàn bộ công việc;
nhanh chóng xác
định các tài liệu trong bộ sưu tập.
-
Chỉ ra mối quan hệ giữa các khái niệm;
-
Nhóm các thông tin nằm rải rác trong các tài liệu hoặc bộ sưu tập;
-
Tổng hợp các tiêu đề và tiêu đề phụ vào trong các mục; sự tổng hợp này có
thể đặt vào một tệp chuẩn;
-
Hướng dẫn cho người dùng tìm kiếm thông tin theo các từ không được chọn
làm tiêu đề đến các từ chỉ mục được chọn là tiêu đề chỉ mục hoặc tham chiếu chéo;
-
Sắp xếp các dẫn mục theo thứ tự có hệ thống và dễ sử dụng.
Chỉ mục có thể được tạo lập cùng hoặc riêng biệt với tài liệu. Chỉ mục có thể bao
gồm thẻ cho các loại khác nhau bao gồm tên (người, nhóm, địa danh), từ kỹ thuật,
các vấn đề, chức danh công việc, dòng đầu tiên của bài thơ, trích dẫn, chữ viết tắt,
từ viết tắt, số, ngày tháng, v.v… Chỉ mục tổng quát kết hợp các mục nhập cho một
phần hoặc tất cả các loại nêu trên trong một chuỗi. Khi tài liệu và bộ sưu tập thích
hợp cho việc lập chỉ mục, chúng có thể tách dòng cho các loại đầu vào khác nhau.
Phổ biến nhất trong các loại này là:
-
Chỉ mục theo chủ đề: cung cấp truy cập vào nội dung của tài liệu theo
chủ đề. Các tiêu đề được sắp xếp theo thứ tự bảng chữ cái và thứ tự có hệ thống.
-
Chỉ mục theo tác giả: cung cấp truy cập vào thông tin về các tài liệu được trích
dẫn bởi tên của tác giả trong các tài liệu được lập chỉ mục hoặc
một
danh
sách
các tài liệu phân biệt bởi tên của tác giả trong bộ sưu tập được lập chỉ mục. Chỉ mục
theo tác giả có thể bao gồm tác giả là cá nhân hoặc tập thể.
-
Chỉ mục theo tên: cung cấp truy cập theo tên nằm trong tài liệu, có thể là tên
của cá nhân, tổ chức hoặc đối tượng. Các tên như vậy có thể kết hợp vào một chỉ
mục.
-
Chỉ mục địa lý: cung cấp truy cập đến thông tin hoặc tài liệu thông qua
địa danh. Những địa điểm này có thể rất rộng, chẳng hạn như châu lục hoặc quốc
gia, hoặc rất cụ thể, chẳng hạn như các thành phố và thị trấn hoặc các tòa nhà cụ
thể trong khu dân cư.
-
Chỉ mục theo tiêu đề: cung cấp truy cập theo tiêu đề hoặc trích dẫn của tài liệu
được thể hiện trong một chuỗi các tiêu đề.
-
Chỉ mục theo số hiệu và mã hiệu: cung cấp truy cập theo định danh của
tài liệu ví dụ số hiệu bằng sáng chế, ISBN, ngày tạo, ngày công bố hoặc cả hai.
Một chỉ mục hiệu quả đáp ứng được nhu cầu của người tìm kiếm thông tin trong các
tài liệu được lập chỉ mục. Người lập chỉ mục nên công bằng và khách quan trong
việc lựa chọn chủ đề và thuật ngữ. Kiến thức của người lập chỉ mục có được thông
qua nghiên cứu và kinh nghiệm, xác định chất lượng của chỉ mục. Các yếu tố quan
trọng khác bao gồm kiến thức của người lập chỉ mục về ngôn ngữ và chủ đề của tài
liệu, chất lượng của các công cụ lập chỉ mục
Chỉ mục nên có đầy đủ chi tiết để đáp ứng nhu cầu dự kiến của người sử dụng, đưa
ra số lượng chi tiết và số lượng tài liệu được lập chỉ mục bao trùm các chủ đề. Các
yếu tố ảnh hưởng đến độ dài của chỉ mục bao gồm:
-
Bản chất và mục đích của các tài liệu được lập chỉ mục; ví dụ, có thể là tài liệu
kỹ thuật hoặc khoa học đòi hỏi xử lý chi tiết hơn các tài liệu phổ thông;
-
Mục đích lập chỉ mục; ví dụ, một cá nhân cụ thể có thể hứng thú với chỉ một
khía cạnh của tài liệu phức tạp. Trường hợp có sự hứng thú đặc biệt đến lập chỉ
mục, điều này nên được nêu rõ trong một lưu ý mang tính giới thiệu đến tiêu đề hoặc
các thẻ khác.
Các chi tiết, kiểu cách và bố cục của một chỉ mục phải nhất quán. Chỉ mục cần được
xây dựng phù hợp với một mô hình hợp lý, cân bằng, nhất quán và dễ dàng nhận
biết. Tính nhất quán là số lượng chi tiết được đưa ra, sử dụng các thuật ngữ, phân
khu, tham chiếu chéo, kiểu cách và thiết kế chung. Tính nhất quán có thể có được
nếu
-
Thiết lập và thực hiện theo các chính sách lập chỉ mục và các tệp chuẩn;
-
Các tài nguyên chỉ mục đáng tin cậy được sử dụng, chẳng hạn như, từ điển,
từ vựng kiểm soát, sự tư vấn của các chuyên gia;
-
Quyết định lập chỉ mục được ghi lại một cách có hệ thống;
-
Làm việc trên cùng chỉ mục được tạo thành từ hai hay nhiều chỉ mục được
phối hợp một cách cẩn thận.
Chất lượng và tính nhất quán của một chỉ mục sẽ được tăng cường nếu người lập
chỉ mục có thể thảo luận về tài liệu với tác giả để biết các yêu cầu của nhà xuất bản
và hoàn toàn hiểu các yêu cầu của người sử dụng tiềm năng về chỉ mục. Thông tin
này sẽ giúp người lập chỉ mục đưa ra quyết định đúng trong việc lựa chọn thêm vào
hoặc loại trừ các mục nhập chỉ mục và sự cần thiết cho các chỉ mục đặc biệt.
Người lập chỉ mục nên truy cập
-
Tài liệu toàn văn, ví dụ, dữ liệu toàn văn bao gồm thuyết minh và những tài
liệu bên ngoài văn bản như hình minh họa, bản đồ và biểu đồ.
-
Các tài liệu ở dạng cuối cùng, ví dụ, bằng chứng của các trang được đánh
dấu kết hợp với các thay đổi về văn bản và việc đánh số trang.
Thông thường chỉ mục bao gồm tất cả các thứ trong các loại ấn bản phẩm. Sự loại
trừ đưa đến sự chú ý của người sử dụng trong một lưu ý giới thiệu. Đối với tài liệu in,
lập chỉ mục bao gồm giới thiệu, ghi chú, bổ sung, minh họa và phụ lục. Trang tiêu đề,
lời đề tặng, mục lục, tóm tắt hoặc trích ở đầu bài báo hoặc chương, quảng cáo, và
các chủ đề tương tự thường không được lập chỉ mục, nhưng phải được kiểm tra để
đưa vào trong chỉ mục.
Các trường hợp sau đây có thể ảnh hưởng đến quyết định cung cấp nhiều hơn một
chỉ mục:
-
Quan tâm đặc biệt trong các phần cụ thể của tài liệu, chẳng hạn như quảng
cáo hoặc đánh giá;
-
Quan tâm đặc biệt trong các chủ đề cụ thể của các tài liệu được lập chỉ mục,
ví dụ, tác giả hoặc trích dẫn pháp lý;
-
Khó khăn trong việc đồng hóa các nhóm phi ngôn ngữ, ví dụ, số bằng sáng
chế hoặc công thức hóa học, trong một danh sách chủ yếu bằng lời nói.
Trình diễn tiêu đề và tiêu đề phụ:
-
Việc lựa chọn các khái niệm được đưa vào chỉ mục phụ thuộc vào yêu cầu dự
kiến sử dụng và bản chất của các tài liệu được lập chỉ mục. Mục đích của tài liệu ảnh
hưởng đến sự biểu hiện của tiêu đề.
-
Các tiêu đề nên được lựa chọn thuật ngữ được sử dụng trong tài liệu, đặc biệt
là trong trường hợp lập chỉ mục một tài liệu duy nhất; hoặc trong trường hợp lập chỉ
mục cho bộ sưu tập của tệp chuẩn.
-
Các tiêu đề nên đại diện cho các khái niệm tìm thấy trong các tài liệu. Trình
bày các tiêu đề trong chỉ mục nên phù hợp với việc sử dụng ngôn ngữ và thuật ngữ
của các tài liệu. Nói chung, các tiêu đề nên bao gồm tên, nếu cần thiết có thể thay
bằng tính từ hoặc danh từ hay động từ được sử dụng như là thuộc ngữ.
- Việc thể hiện các dẫn mục thay cho việc bố trí theo cấp bậc các tiêu đề và
tiêu đề phụ nhờ việc lặp lại các từ lặp cho từ ghép hoặc sử dụng có hệ thống dấu
chấm câu để xác định vai trò của các từ ngữ. Việc sử dụng này có thể thích hợp
trong chỉ số tờ báo, các thư mục và tóm tắt.
-
Chỉ mục có thể tham khảo các quy tắc biên mục được sử dụng trong các thư
viện của nước sở tại để được hướng dẫn chi tiết về việc xây dựng các tiêu đề cho
tên người, địa điểm và các cơ quan doanh nghiệp.
-
Tiêu đề tài liệu bình thường được in nghiêng hoặc gạch chân. Nếu cần thiết
để xác định tên của tác giả, nơi xuất bản, ngày tháng hoặc các từ hạn định khác có
thể được thêm vào trong dấu ngoặc đơn.
Định vị (locator):
-
Mục đích của định vị là để dẫn người dùng đến thẳng một phần của tài liệu bộ
sưu tập có chứa thông tin mà chỉ mục đề cập đến. Các loại định vị được sử dụng
trong các chỉ mục và sử dụng in ấn đặc biệt nên được ghi rõ trong một lưu ý giới
thiệu. Bản chất của định vị phụ thuộc vào lài liệu được lập chỉ mục.
-
Tài liệu in: Nếu các trang của một tài liệu in được chia theo một cách nào đó,
ví dụ, theo các cột, người lập chỉ mục có thể làm chỉ định tham chiếu đến đến trang
và cột. Nếu văn bản được đánh số đoạn văn, người lập chỉ mục có thể sử dụng
những con số chỉ đoạn như định vị.
-
Tài liệu không in và tài liệu đa phương tiện: Các phương tiện truyền thông
không in, cho các mục đích của lập chỉ mục, có thể được chia thành ba loại.
Những tài liệu trong đó bao gồm các yếu tố hình thành một hoặc nhiều chuỗi có thể
được liên tục đánh số và được người sử dụng nắm bắt. Ví dụ như một bộ sưu tập
của các slide, một cuộn phim, đĩa âm thanh, một máy cơ sở dữ liệu có thể đọc được.
Định vị sẽ được cho số lượng các slide, số khung, số bên và bên và nhận dạng hồ
sơ.
Những tài liệu bao gồm một hoặc nhiều chuỗi theo trình tự các yếu tố không
thể phân biệt được số hiệu, ví dụ được thực hiện tuần tự các tài liệu như phim ảnh,
âm thanh và băng video. Trong những trường hợp người lập chỉ mục cần phải đưa
ra những vị trí có liên quan, chẳng hạn như thời gian hoạt động từ một điểm cụ thể.
Những tài liệu không bao gồm các trình tự như bản đồ, biểu đồ, sơ đồ, biểu
đồ, v.v Trong một số trường hợp có những quy ước cụ thể, ví dụ, bản đồ tham chiếu
tọa độ. Trong trường hợp khác, người lập chỉ mục nên thiết kế định vị.
Nếu một tài liệu là một chủ đề liên tục đánh số liên tiếp theo thứ tự, cần tham chiếu
các mục số đầu tiên và cuối cùng, ví dụ 3-11. Thông thường, những con số không
nên bị xóa, bởi vì nó trình rõ ràng bày các số đầu tiên và cuối cùng đầy đủ, ví dụ như
78- 79, 123- 125. Đặc biệt, khi không gian cần thiết hoặc trong trường hợp định vị rất
dài, ví dụ, 100026- 100027, con số này có thể được loại bỏ để chỉ các chữ số trong
việc thay đổi định vị thứ hai được đưa ra, ví dụ 100026- 7. Dù hình thức trình bày
được sử dụng, phải được áp dụng nhất quán trong chỉ mục.
Nếu một chủ đề được xử lý nhiều lần nhưng không liên tục trên một chuỗi số liên
tiếp, nên tham chiếu cho từng hạng mục trong trình tự, ví dụ như, 3, 4, 5 (không 35).
Tham chiếu chéo:
-
Một chỉ mục bao gồm các tiêu đề thích hợp và từ đồng nghĩa thay thế và tham
chiếu chéo giữa các tiêu đề có liên quan, trừ trường hợp nhiều mục được sử dụng.
-
Tham chiếu chéo “xem” được tạo từ từ đồng nghĩa không ưu tiên với dạng ưu
tiên của tiêu đề. Trường hợp hướng của các tham chiếu chéo là nhiều tiêu đề, chúng
phải được liệt kê theo thứ tự bảng chữ cái, cách nhau bằng dấu chấm phẩy.
-
Tham chiếu chéo “xem thêm” được thực hiện giữa các tiêu đề và tiêu đề phụ
trong chỉ mục. Thông thường tham chiếu chéo này theo sau các định vị liên quan
đến tiêu đề và tiêu đề phụ mà chúng có liên quan. Trường hợp hướng của các tham
chiếu chéo là cho nhiều tiêu đề, chúng phải được liệt kê theo thứ tự bảng chữ cái,
cách nhau bằng dấu chấm phẩy.
Để phần loại bằng tay hoặc bằng máy, các biểu tượng và ký tự phải được đăng ký.
Những giá trị đăng ký được bắt nguồn từ một hệ thống được thiết lập như ISO 646,
nhưng hệ thống này được thiết kế để thể hiện ký tự chứ không phải để phân loại,
thường là ghi lại tất cả chữ hoa trước tất cả các chữ thường và các ký hiệu không
phải chữ cái xen kẽ.
Vì vậy, cho mục đích phân loại, với các chữ thường và chữ hoa của một chữ được
cho giá trị giống hệt nhau để một chuỗi chữ cái duy nhất thu được. Biểu tượng dấu
chấm câu dùng để phân biệt các loại giá trị chỉ mục tiêu đề để phân loại các tiêu đề
theo thứ tự yêu cầu.
Đăng ký tiêu đề chỉ mục
-
Hệ thống để ghi tiêu đề nên rõ ràng (có nghĩa là, vị trí của tiêu đề chỉ mục hồ
sơ phải rõ ràng) và có thể dự đoán.
-
Việc sắp xếp theo chữ và số là thực tế nhất, do đó là phương pháp trình bày
chỉ mục phổ biến nhất. Các quy định khác có thể thích hợp hơn cho một chỉ mục cụ
thể.
-
Trong một chỉ mục, các tiêu đề phụ có thể thỉnh thoảng vẫn phải chuẩn bị
thuận tiện hơn bằng một phương pháp khác theo chữ cái.
-
Nếu sắp xếp không phải là ngay lập tức rõ ràng cho người sử dụng, có thể
được giải thích trong một lưu ý giới thiệu đến các chỉ mục.
Đăng ký tiêu đề phụ.
-
Tiêu đề phụ nằm trong chỉ mục theo cùng một cách với tiêu đề. Tuy nhiên, sự
sắp xếp của các tiêu đề phụ có thể được sửa đổi một cách hữu ích bởi một số sắp
xếp theo số, thời gian hay mang tính hệ thống, đặc biệt là nếu sắp xếp như vậy là rõ
ràng hay ngụ ý trong văn bản, hoặc giới thiệu để phân biệt số lượng lớn các từ đồng
âm.
-
Trong trường hợp các tiêu đề phụ bắt đầu bằng giới từ hoặc liên từ, nó có thể
đưa ra quyết định để loại trừ giới từ hoặc liên từ cho mục đích đăng nhập. Một quyết
định như vậy nên được áp dụng cho chỉ mục và ghi lại trong một lưu ý giới thiệu.