Tải bản đầy đủ (.doc) (69 trang)

Ứng dụng phần mềm Dspace tại Trung tâm Thông tin - Thư viện Học viện Công nghệ Bưu chính Viễn thông

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.27 MB, 69 trang )

Khóa luận tốt nghiệp

Bùi Thị Hương Giang

LỜI CẢM ƠN
Lời đầu tiên em xin cảm ơn chân thành tới ThS. Nguyễn Văn Hành người đã tận tình hướng dẫn và giúp đỡ em trong suốt quá trình hoàn thành
khóa luận này.
Em xin chân thành cảm ơn các thầy cô trong Khoa Thông tin - Thư viện
trường Đại học Khoa học Xã hội và Nhân văn - Đại học Quốc gia Hà Nội đã
trực tiếp giảng dạy, truyền đạt kiến thức cho em trong suốt bốn năm qua.
Em cũng xin được cảm ơn tới các anh chị cán bộ của Trung tâm Thông
tin - Thư viện Học viện Công nghệ Bưu chính Viễn thông đã tạo mọi điều
kiện thuận lợi cho em trong suốt quá trình thực tập và tìm hiểu thực tế tại
Trung tâm.
Do trình độ kiến thức còn hạn hẹp nên khóa luận không tránh khỏi những
hạn chế. Em rất mong nhận được sự đóng góp của thầy để khóa luận được
hoàn thiện hơn.
Một lần nữa em xin được chân thành cảm ơn!

Hà Nội, ngày 24 tháng 2 năm 2014
Sinh viên thực hiện

Bùi Thị Hương Giang

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang


LỜI CAM ĐOAN
Tôi xin cam đoan đề tài “Ứng dụng phần mềm Dspace tại Trung tâm Thông
tin - Thư viện Học viện Công nghệ Bưu chính Viễn thông” của tôi hoàn toàn
mới. Đây là đề tài tôi thực hiện dưới sự hướng dẫn của Thạc sĩ Nguyễn Văn
Hành

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

BẢNG VIẾT TẮT TRONG KHÓA LUẬN
Từ viết tắt
AACR2
CNBCVT
DDC
CNTT
CSDL
MARC21

Tên đầy đủ
Quy tắc biên mục Anh - Mỹ
Công nghệ Bưu chính Viễn thông
Khung phân loại thập phân Dewey
Công nghệ thông tin
Cơ sở dữ liệu
Machine Readable Cataloging


TT - TV
TVĐT
TVS

Khổ mẫu biên mục đọc máy
Thông tin - Thư viện
Thư viện điện tử
Thư viện số

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

MỤC LỤC
LỜI CAM ĐOAN..................................................................................................................ii
MỤC LỤC.............................................................................................................................iv
LỜI MỞ ĐẦU........................................................................................................................v
1.Tính cấp thiết của đề tài................................................................................................v
2. Mục đích nghiên cứu của đề tài.................................................................................vii
3. Đối tượng và phạm vi nghiên cứu.............................................................................vii
4. Phương pháp nghiên cứu...........................................................................................vii
5. Bố cục của đề tài........................................................................................................vii
CHƯƠNG 1. TỔNG QUAN CHUẨN BIÊN MỤC DUBLIN CORE VÀ PHẦN MỀM
MÃ NGUỒN MỞ THƯ VIỆN SỐ DSPACE................................................................ix
1.1. Khái quát về thư viện số và chuẩn biên mục Dublin Core......................................ix
1.1.1. Khái quát về thư viện số.......................................................................................ix
1.1.1.1. Khái niệm về thư viện điện tử...........................................................................ix

1.1.1.2. Khái niệm về thư viện số....................................................................................x
1.1.2. Khái quát về siêu dữ liệu Metadata và Dublin Core..........................................xiii
1.1.2.1. Khái quát về siêu dữ liệu Metadata.................................................................xiii
1.1.2.2. Chuẩn biên mục Dublin Core...........................................................................xv
1.2. Giới thiệu về phần mềm Dspace............................................................................xxi
1.2.1. Sự ra đời và phát triển của Dspace.....................................................................xxi
1.2.2. Vai trò của Dspace.............................................................................................xxii
1.2.3. Đặc điểm cấu trúc của Dspace...........................................................................xxii
Mô hình thông tin của hệ thống...................................................................................xxii
1.2.4. Ưu điểm của phần mềm Dspace.......................................................................xxiii
CHƯƠNG 2. THỰC TRẠNG ÁP DỤNG DSPACE TẠI TRUNG TÂM THÔNG TIN THƯ VIỆN HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG....................xxvi
2.1. Các tiền đề áp dụng phần mềm Dspace tại Trung tâm Thông tin Thư viện Học viện
Công nghệ Bưu chính Viễn thông..............................................................................xxvi
2.1.1. Khái quát về Trung tâm Thông tin Thư viện Học viện Công nghệ Bưu chính Viễn
thông...........................................................................................................................xxvi
2.1.1.1. Quá trình hình thành......................................................................................xxvi
2.1.1.2. Chức năng và nhiệm vụ.................................................................................xxvi

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

2.1.1.3. Đặc điểm người dùng tin và nhu cầu tin ở Học viện....................................xxvii
2.1.2. Hệ thống cơ sở hạ tầng Công nghệ thông tin.....................................................xxx
2.1.3. Các phần mềm quản trị thư viện Trung tâm đã áp dụng..................................xxxi
2.2. Quá trình áp dụng phần mềm Dspace tại Trung tâm Thông tin Thư viện Học viện
Công nghệ Bưu chính Viễn thông............................................................................xxxiii

2.2.1. Biên mục tài liệu theo chuẩn Dublin Core trên phần mềm Dspace...............xxxiii
2.2.2. So sánh đối chiếu các yếu tố mô tả Dublin Core với MARC 21.......................xlvi
2.3. Cấu trúc bộ sưu tập số tại Trung tâm Thông tin - Thư viện Học viện Công nghệ Bưu
chính Viễn thông.......................................................................................................xlviii
2.4. Kết quả phục vụ tài nguyên số tại Trung tâm Thông tin – Thư viện Học viện Công
nghệ Bưu chính Viễn thông..............................................................................................l
3.1. Nhận xét....................................................................................................................li
3.1.1. Ưu điểm.................................................................................................................li
3.1.2. Nhược điểm..........................................................................................................lii
3.2. Kiến nghị................................................................................................................liii
3.2.1. Về xây dựng kế hoạch phát triển nguồn tài liệu số............................................liv
3.2.2. Cơ sở vật chất kỹ thuật.........................................................................................lv
3.2.3. Đội ngũ cán bộ......................................................................................................lv
3.2.4. Đào tạo người dùng tin........................................................................................lvi
KẾT LUẬN..................................................................................................................lvii

LỜI MỞ ĐẦU
1.Tính cấp thiết của đề tài
Ngày nay, khoa học công nghệ & đặc biệt là công nghệ thông tin
(CNTT) và viễn thông phát triển mạnh mẽ đã và đang làm biến đổi sâu sắc
mọi lĩnh vực hoạt động của đời sống xã hội trong đó có lĩnh vực thông tin thư viện (TT-TV). Sự biến đổi này đang đưa thế giới hiện đại chuyển từ thời
đại công nghiệp sang thời đại thông tin. TK XXI mở ra với sự bùng nổ của
internet cùng với sự phát triển của các phương tiện tương tác như các mạng
xã hội, các trang web, diễn đàn… đã đưa con người bước vào kỷ nguyên mới:
kỷ nguyên số cùng với sự phát triển không ngừng nghỉ của các sản phẩm
thông tin thư viện.
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp


Bùi Thị Hương Giang

Trong đó công tác phát triển tài nguyên số cũng được các Trung tâm
Thông tin - Thư viện hết sức quan tâm.
Nếu chúng ta gọi Thư viện truyền thống là một một cơ sở lưu trữ và phục
vụ tài liệu in ấn thì Thư viện điện tử phục vụ thêm tài liệu điện tử, là các dạng
tài liệu được đọc trên máy vi tính và chuyển tải trên mạng vi tính. Với các
tính năng nổi trội này các thư viện số đang được xây dựng ngày một tăng về
số lượng và chất lượng.
Hiện nay, một số phần mềm mã nguồn mở thư viện số được áp dụng tại
thư viện các trường đại học và các viện nghiên cứu ở Việt Nam. Tiêu biểu là
phần mềm Zope, Greenstone, Dspace. Sử dụng công nghệ cao để nhanh
chóng tạo lập những bộ sưu tập thông tin có tổ chức và làm tăng năng lực truy
tìm và tìm lướt của người dùng tin. Các phần mềm nguồn mở này cung cấp
phương cách xây dựng những bộ sưu tập thông tin trên Internet mang đến một
nguồn tài liệu điện tử phong phú và đa dạng. Đó là những tài nguyên thông tin
miễn phí trên mạng toàn cầu Internet và bất kỳ ai cũng có thể đóng góp vào
nguồn tài nguyên thông tin ngày càng trở nên đồ sộ này.
Nắm bắt được xu thế hội nhập này ngay từ năm 2009 Trung tâm Thông
tin - Thư viện Học viện Công nghệ Bưu chính Viễn thông đã định hướng xây
dựng theo mô hình thư viện số bắt đầu từ sử dụng phần mềm Greenstone và
phát triển đến Dspace. Qua quá trình tìm hiểu và thực hành về phần mềm
Dspace tại Trung tâm Thông tin - Thư viện Học viện Công nghệ Bưu chính
Viễn thông tôi nhận thấy đây là một phần mềm mã nguồn mở thư viện số có
tính năng ưu việt và tương đối phù hợp với với môi trường số ở Học viện Bưu
chính Viễn thông. Từ đó tôi mong muốn được chia sẻ những hiểu biết của
mình với các bạn đồng nghiệp. Vì vậy, tôi đã lựa chọn đề tài: “Ứng dụng
phần mềm Dspace tại Trung tâm Thông tin - Thư viện Học viện Công nghệ
Bưu chính Viễn thông”.


K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

2. Mục đích nghiên cứu của đề tài
Nghiên cứu thực trạng áp dụng phần mềm Dspace tại Trung tâm Thông
tin - Thư viện Học viện Công nghệ Bưu chính Viễn thông. Đề xuất những giải
pháp nhằm hoàn thiện và phát triển hơn nữa phần mềm Dspace tại Trung tâm.
3. Đối tượng và phạm vi nghiên cứu
- Nghiên cứu về phần mềm Dspace nói riêng và Thư viện số nói chung
một cách khái quát
- Nghiên cứu thực trạng công tác áp dụng phần mềm Dspace tại Trung
tâm Thông tin - Thư viện Học viện Công nghệ Bưu chính Viễn thông hai năm
gần đây.
4. Phương pháp nghiên cứu
- Thu thập khảo sát tài liệu
- Nghiên cứu tài liệu
- Phương pháp phân tích, tổng hợp tài liệu.
- Phương pháp thống kê, so sánh.
5. Bố cục của đề tài
Ngoài phần mở đầu, kết luận, danh mục các tài liệu tham khảo và phụ
lục, bài nghiên cứu khoa học bao gồm ba chương sau đây:
Chương 1. Tổng quan chuẩn biên mục Dublin Core và Phần mềm mã
nguồn mở thư viện số Dspace.
Chương 2. Thực trạng áp dụng Dspace tại Trung tâm Thông tin - Thư
viện Học viện Công nghệ Bưu chính Viễn thông.

Chương 3. Một số nhận xét và đề xuất kiến nghị nhằm phát triển thư viện
số tại Trung tâm Thông tin - Thư viện Học viện Công nghệ Bưu chính Viễn
thông.

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

K55 – Thông tin – Thư viện

Bùi Thị Hương Giang


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

CHƯƠNG 1. TỔNG QUAN CHUẨN BIÊN MỤC DUBLIN CORE VÀ
PHẦN MỀM MÃ NGUỒN MỞ THƯ VIỆN SỐ DSPACE
1.1. Khái quát về thư viện số và chuẩn biên mục Dublin Core
1.1.1. Khái quát về thư viện số
1.1.1.1. Khái niệm về thư viện điện tử
Thư viện điện tử (TVĐT) là một khái niệm chưa được định nghĩa thống
nhất và còn nhiều tranh luận. Đôi khi việc sử dụng còn lẫn lộn và đồng nghĩa
với các khái niệm “Thư viện không biên giới”, “Thư viện được nối mạng”,
“Thư viện số”, “Thư viện ảo”, “Thư viện tin học hóa”, “Thư viện đa phương
tiện”, “Thư viện logic”, “Thư viện văn phòng”,…
Thuật ngữ Thư viện điện tử (Electronic Library) có thể được sử dụng
theo ý nghĩa tổng quát nhất cho mọi loại hình thư viện đã được tin học hóa

toàn bộ hoặc một số dịch vụ. Thư viện điện tử có thể được coi như là địa điểm
để người sử dụng có thể thực hiện công việc mà họ vẫn thường làm với thư
viện truyền thống, nhưng đã được điện tử hóa.
Khái niệm về Thư viện điện tử có thể được định nghĩa như sau: “Đó là
một hệ thống thông tin trong đó các nguồn thông tin đều có sẵn dưới dạng có
thể xử lý được bằng máy tính với tất cả các chức năng bổ sung, lưu trữ, bảo
quản, tìm kiếm, truy cập và hiển thị đều sử dụng kỹ thuật số” [5]. Mặt khác,
thư viện điện tử cũng có thể hiểu một cách tổng quát, đó là: “Một loại hình
thư viện đã tin học hóa gồm toàn bộ hoặc một số dịch vụ thư viện. Đó còn là
nơi người sử dụng có thể tới để tra cứu, sử dụng các dịch vụ thường làm như
với một thư viện truyền thống, nhưng đã được tin học hóa. Và nguồn lực của
thư viện điện tử bao gồm cả tài liệu in giấy và tài liệu đã được số hóa” [5]
Theo Roy Tennant (1999): “Một thư viện phải có một kho thông tin với
các loại hình tài liệu (sách, báo, băng Video, CD - ROM…) được tổ chức và
kèm theo các dịch vụ cần có để đảm bảo cho người dùng tin sử dụng chúng”.
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

“Một thư viện điện tử phải bao gồm các tài liệu điện tử và các dịch vụ
kèm theo. Các tài liệu điện tử có thể bao gồm tất cả các tài liệu số cũng như
các loại hình thông tin điện tử dạng Analog mà cần có các thiết bị để sử dụng.
Ví dụ như băng Video, cassette…
Còn theo Nguyễn Minh Hiệp (2006): “TVĐT là một thư viện phục vụ
thông tin bằng điện tử với nguồn lực thông tin điện tử được truy cập từ những
tư liệu điện tử bao gồm CD-ROM, tạp chí điện tử, cơ sở dữ liệu trực tuyến,…
thông qua máy tính và mạng máy tính”.

Tóm lại, TVĐT là thư viện chỉ sử dụng các phương tiện điện tử trong thu
thập, xử lý, lưu trữ, tìm kiếm và phổ biến thông tin. Và như vậy, có thể hiểu
một cách nôm na rằng, TVĐT là một loại thư viện mà khi hoạt động thì việc
phục vụ bạn đọc thông qua hệ thống máy tính đã được nối mạng…
Thư viện điện tử ra đời là kết quả của sự hợp tác giữa các chuyên gia thư
viện, xuất bản, các nhà khoa học và công nghệ hướng về mục tiêu tiếp cận tới
đầy đủ thông tin, ở mọi lúc, mọi nơi.
1.1.1.2. Khái niệm về thư viện số
Có thể nói thư viện số là bước tiến xa hơn của thư viện điện tử hay có
thể nói cách khác, là thư viện điện tử cao cấp, cho phép đọc được thông tin
toàn văn sau khi đã số hóa hầu hết các tư liệu, đặc biệt là các tư liệu dưới
dạng đồ họa (như tranh ảnh, bản đồ,…) và đa phương tiện (multimedia) nói
chung.
Philip Barker cũng phân biệt thư viện điện tử và thư viện số theo một kiểu
khác. Ông cho rằng thư viện điện tử lưu trữ và phục vụ cả ấn phẩm lẫn tư liệu
điện tử (tư liệu số hóa), trong khi đó thư viện số chỉ lưu trữ các tư liệu điện tử
mà thôi.
Thư viện số là hình thức kết hợp giữa thiết bị tính toán, lưu trữ và truyền
thông số với nội dung và phần mềm cần thiết để tái tạo, thúc đẩy và mở rộng

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

các dịch vụ của các thư viện truyền thống vốn dựa trên các biện pháp thu
thập, biên mục và phổ biến thông tin trên giấy và các tư liệu khác.
Theo Bùi Loan Thùy và Lê Văn Viết (2001): “Thư viện số là thư viện

chứa đựng các thông tin và tri thức được lưu trữ dưới dạng điện tử số trên các
phương tiện khác nhau: bộ nhớ điện tử, đĩa quang, đĩa từ”.
Theo Ian H. Witten (2006): “Thư viện số là tập hợp những bộ sưu tập
thông tin của các đối tượng số hoặc đã được số hóa có tổ chức và tập trung.
Tập trung theo đề tài hay chủ đề và có tổ chức để thông tin dễ truy cập và lưu
trữ theo những tiêu chuẩn chuyên biệt.
“Thư viện số (TVS) là một Thư viện điện tử cao cấp trong đó toàn bộ các
tài liệu của thư viện đã được số hóa và được quản lý bằng một phần mềm
chuyên nghiệp có tổ chức giúp người dùng dễ dàng truy cập, tìm kiếm và xem
được nội dung toàn văn của chúng từ xa thông qua hệ thống mạng thông tin
và các phương tiện truyền thông” [4].
Nghiên cứu về thư viện số bao gồm các vấn đề về kỹ thuật, xã hội và
chính trị đan xen vào nhau. Khái niệm thư viện số không chỉ tương đương với
một sưu tập số hóa và công cụ quản trị thông tin. Là một môi trường tập hợp
các sưu tập, dịch vụ và con người để hỗ trợ cho một chu trình hoàn chỉnh của
việc sáng lập, phổ biến sử dụng và bảo quản dữ liệu, thông tin, tri thức (Hội
thảo Santa Fe về môi trường làm việc phổ biến tri thức) và có hàm ý về một
môi trường mạng cung cấp nội dung.
Hiện nay quá trình nghiên cứu thế hệ tiếp theo của các thư viện số nhằm
thúc đẩy việc sử dụng và nâng cao tính khả dụng của các nguồn tin được nối
mạng và phổ biến trên phạm vi toàn cầu, đồng thời cũng động viên khuyến
khích các dự án phát triển các công cụ phát hiện, quản trị tìm và phân tích
thông tin hướng về các lĩnh vực ứng dụng và cải tiến đổi mới.
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang


Trong tương lai không xa, thư viện số cần phải liên kết cả ấn phẩm và tư
liệu số và vấn đề chủ yếu là cho phép bao quát được cả kho tin cực lớn. Với
mục tiêu hiện tại là phát triển được các kho tư liệu được số hóa ngày một
nhiều và khai thác được đầy đủ các cơ hội do các tư liệu dưới dạng số tạo ra.
Như vậy, tính chất đầy đủ và giá trị của vốn tư liệu có thể gia tăng do khả
năng tích hợp tư liệu dưới dạng số và phương pháp truy cập dễ dàng.
Khái niệm “thư viện số” và “thư viện điện tử” tương đối giống nhau,
song hành cùng nhau, tuy nhiên vẫn có những điểm khác biệt và đặc trưng
riêng không thể trộn lẫn.
1.1.1.3. Khái niệm tài liệu số
Bộ phận cốt yếu khi xây dựng thư viện số chính là nguồn tài liệu số. Xây
dựng nguồn tài nguyên số là một xu thế tất yếu vì mục đích sao lưu, bảo quản
tài liệu, mở rộng đối tượng phục vụ và chia sẻ tài nguyên, tận dụng tối đa và
có hiệu quả hệ thống cơ sở vật chất và trang thiết bị thông tin như hiện nay,
việc xây dựng và bảo quản nguồn tài nguyên số của các thư viện đã góp phần
đáp ứng một số lượng lớn nhu cầu của người dùng tin.
“Tài liệu số” là những tài liệu được lưu trữ bằng máy tính. Tài liệu số có
thể được tạo lập bằng máy tính như việc xử lý các file văn bản, các bảng biểu
hoặc chúng có thể được chuyển đổi sang dạng số từ những tài liệu khác. Tài
liệu số cũng được đề cập đến như tài liệu điện tử.
Tài liệu số được sử dụng thông qua các hình thức:
- Tạo lập tài liệu gốc bằng máy tính thông qua việc xử lý các file văn
bản, hình ảnh bảng biểu…
- Tạo lập tài liệu số thông qua hình thức chuyển đổi định dạng các tài
liệu được tạo lập ở các dạng khác.
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp


Bùi Thị Hương Giang

Chung quy, có thể hiểu tài liệu số là thông tin được tổ chức dưới dạng số,
được lưu trữ, xử lý và được truyền đi thông qua thiết bị số và mạng
1.1.2. Khái quát về siêu dữ liệu Metadata và Dublin Core
1.1.2.1. Khái quát về siêu dữ liệu Metadata
Khái niệm: Là dữ liệu về dữ liệu (data about data) hay dữ liệu có cấu trúc về
dữ liệu, bao gồm những yếu tố mô tả về đối tượng thông tin (sách, trang web,
bản nhạc...)
Có thể định nghĩa: “Siêu dữ liệu là dữ liệu đi kèm với đối tượng thông
tin và nó cho phép những người sử dụng tiềm năng có thể biết trước sự tồn tại
cũng như đặc điểm của đối tượng thông tin này” (Dempsey và Heery, 1997).
Mục đích của siêu dữ liệu:
- Hỗ trợ phát triển nguồn tin
- Hỗ trợ người dùng tin, đánh giá thông tin mà không phải truy cập trực
tiếp đến thông tin
- Giúp kiểm tra sự tồn tại của đối tượng thông tin
- Mô tả ngôn ngữ, vị trí... của thông tin
Một biểu ghi trong Metadata (siêu dữ liệu) bao gồm một hệ thống các
thành tố hay còn gọi là các yếu tố cần thiết để mô tả nguồn tin.
Phân loại siêu dữ liệu
- Trong thư viện truyền thống, siêu dữ liệu chủ yếu là các dạng mô tả
hình thức và nội dung của tài liệu có trong kho thư viện, chính là các phiếu
mô tả trong hộp phích, trong các cơ sở dữ liệu thư mục - nằm tách rời với đối
tượng thông tin
- Trong thư viện điện tử, siêu dữ liệu đã phát triển ở mức độ cao hơn với
khái niệm rộng hơn, phát triển thành 5 loại siêu dữ liệu
1. Siêu dữ liệu hành chính (Administrative)
2. Siêu dữ liệu mô tả (Desriptive)
3. Siêu dữ liệu bảo quản (Preservation)

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

4. Siêu dữ liệu sử dụng (Use)
5. Siêu dữ liệu kỹ thuật (Technical)
Các loại

Định nghĩa

Ví dụ

CSDL
1. CSDL

Được dùng để quản

- Thông tin bổ sung

hành chính

lý và quản trị các tài

- Bản quyền và thông tin tái bản

nguyên thông tin


- Tài liệu về yêu cầu truy cập hợp pháp
- Thông tin định vị
- Các tiêu trí số hóa
- Thông tin kiểm tra của hệ thống quản

- Các biểu ghi thư mục

2. CSDL

Được dùng để mô tả

mô tả

hay nhận dạng các tài - Các hỗ trợ tìm kiếm
nguyên thông tin

- Định chỉ số chuyên biệt

3. CSDL

Các thông tin liên

- Chú giải của người sử dụng
- Các tài liệu về tình trạng, điều kiện

bảo quản

quan đến quản lý việc vật lý của tài nguyên thông tin
bảo quản các tài


- Các tài liệu về công tác bảo quản các

nguyên thông tin

phiên bản thông tin dưới dạng vật lý và
số

4. CSDL

Các thông tin liên

VD: làm mới dữ liệu; Di trú dữ liệu
- Thông tin về phần cứng và phần mềm

Kỹ thuật

quan đến cách thức

- Thông tin số hóa

hoạt động của hệ

VD: khổ mẫu; tỷ lệ nén; độ nén; quy

thống cũng như siêu

trình phân bổ thông tin.

dữ liệu


- Thông tin về thời gian phản hồi của
hệ thống

5. CSDL

Các thông tin liên

- Dữ liệu về tính xác thực
- Các biểu ghi trình bày

Sử dụng

quan đến mức độ và

- Các thông tin liên quan đến người sử

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

loại hình sử dựng tài

dụng và việc sử dụng

nguyên thông tin

- Thông tin về tái sử dụng nội dung và

các phiên bản đa phương tiện
Tài liệu hướng dẫn sử dụng Dublin Core

1.1.2.2. Chuẩn biên mục Dublin Core
Lịch sử ra đời
Sở dĩ được đặt tên là chuẩn biên mục Dublin Core là vì tại hội thảo đầu
tiên bàn về thiết kế siêu dữ liệu tại Dublin bang Ohio, Hoa Kỳ năm 1992
nhằm tăng cường khả năng phát hiện nguồn tin trên www, đặc biệt đối tượng
thông tin dạng mã hóa HTML.
Chuẩn Dublin Core là chuẩn dùng để mô tả dữ liệu trong các Metadata
(siêu dữ liệu) với MARC 21, chuẩn Dublin Core được thiết kế đơn giản hơn,
với 15 yếu tố mô tả (15 metadata elements) nhằm không những mô tả loại
hình đối tượng thông tin trong thư viện mà cả trong viện bảo tàng, triển lãm
nghệ thuật, tin học, mã hóa văn bản và các lĩnh vực khác có liên quan,... Ngôn
ngữ ban đầu là Tiếng Anh.
Tháng 9/2001 chuẩn Dublin Core được công nhận là tiêu chuẩn của Mỹ
có mã số ANSI/NISO Z39.50-2001
Đặc điểm của Dublin Core
- Đơn giản trong tạo lập và bảo trì: được thiết kế nhằm phục vụ với
người không chuyên, dễ sử dụng và rẻ nhưng hiệu quả mang lại lớn.
- Ngữ nghĩa thông dụng, dễ hiểu và phổ biến: Khắc phục những khó
khăn trong việc hiển thị các thuật ngữ
VD: Yếu tố “Tác giả” (Creator) được gán cho người tạo lập, nhà soạn
nhạc, đạo diễn trong vai trò là tác giả chính. Điều này giúp cho khi người tìm
tin muốn tìm thông tin theo một tác giả cụ thể nào đó, nếu đồng ý chọn yếu tố
“Tác giả - Creator” là yếu tố mô tả hợp lý. Với diện bao quát rộng như vậy,
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp


Bùi Thị Hương Giang

nếu càng khái quát, tập hợp yếu tố mô tả này sẽ tăng cường được sự có mặt và
truy cập của mọi loại hình nguồn tin, cả theo quy tắc và bất quy tắc.
- Phạm vi quốc tế: Phiên bản đầu tiên bằng Tiếng Anh (11/1999), đã có
phiên bản của 20 thứ tiếng khác như: Phần Lan, Nauy, Thái Lan, Nhật Bản,
Pháp, Đức, Bồ Đào Nha, Hy Lạp, Indonesia, Tây Ban Nha. Tổ chức W3C
(World Wide Web Cosontium) phát triển chuẩn Dublin Core trên nền tảng kết
hợp đa ngôn ngữ, sử dụng công nghệ (RDF: Resource Descreption Frame
Work): Khung mô tả tài nguyên thông tin, phục vụ cho môi trường tài nguyên
thông tin điện tử mang tính chất đa văn hóa và đa ngôn ngữ.
- Khả năng phát triển rộng: Với cơ chế mở, chuẩn Dublin Core có thể
được mở rộng bởi các chuyên gia bằng việc gắn kết thêm các yếu tố mở rộng.
Khả năng này còn được thực hiện một cách đơn giản thông qua việc kết nối
nhiều CSDL khác nhau thông qua mạng Internet
Thuộc tính của Dublin Core
Mỗi một phần tử (yếu tố mô tả) của Dublin Core được xác định bởi 10
thuộc tính theo tiêu chuẩn mô tả yếu tố dữ liệu điện tử ISO/IEC 11179 như
sau:
- Name (Tên): Tên xác định thống nhất gắn cho yếu tố mô tả
- Identifier (Định danh): Tên xác định thống nhất gắn cho yếu tố mô tả
- Version (Phiên bản): Phiên bản của yếu tố mô tả
- Registration Authority (Thẩm quyền đăng ký): Thực thể có thẩm quyền
đăng ký các phần tử mô tả
- Language (Ngôn ngữ): Ngôn ngữ yếu tố mô tả được sử dụng
- Definition (Định nghĩa): Trình bày rõ ràng khái niệm và bản chất của
phần tử
- Obligation (Bắt buộc): Chỉ ra khả năng có hay không thường xuyên
xuất hiện phần tử.

- Datatype (Kiểu dữ kiệu): Chỉ ra loại dữ liệu trình bày giá trị của phần
tử
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

- Maximum Occurrence (Tần xuất xuất hiện tối đa): Chỉ ra những tần
xuất lặp lại của phần tử
- Comment (Chú thích): Lưu ý về ứng dụng của phần tử
Ý nghĩa của Dublin Core trong thư viện số
- Là một phương pháp mô tả nguồn thông tin, đặc biệt là nguồn tin điện
tử một cách hiệu quả. Dublin Core càng đặc biệt phát huy tác dụng khi được
sử dụng để mô tả tài liệu điện tử vốn khó xác định được loại hình và nội dung
các yếu tố cần thể hiện
- Thay thế cho các dạng thức trình bày thông tin trước đây như MARC
do sự đơn giản trong cấu trúc mà người sử dụng có thể thiết kế theo yêu cầu
của riêng mình
- Cung cấp cho người sử dụng một phương án tiếp cận thông dụng thông
qua các giao diện quen thuộc như web
- Tạo cho người cán bộ thư viện sự thuận tiện trong công tác khi không
còn phải gò bó trong các trường, các yếu tố vốn dĩ đã rất đa dạng và phức tạp.

Các yếu tố của Dublin Core
Dublin Core gồm có 15 yếu tố, trong từng trường hợp cụ thể các yếu tố
của chuẩn siêu dữ liệu Dublin Core đều không nhất thiết bắt buộc phải có đầy
đủ và có thể lặp.
Phân loại các yếu tố:

NỘI DUNG
Nhan đề (Title)

SỞ HỮU TRÍ TUỆ
Tác giả

THUYẾT MINH
Ngày tháng

Chủ đề (Subject)

(Creator)
Tác giả phụ

(Date)
Mô tả vật lý

Mô tả (Description)

(Contributor)
Xuất bản

(Description)
Định danh

Loại hình (Type)

(Publisher)
Bản quyền


(Identifier)
Ngôn ngữ

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

(Right)

(Language)

Nguồn (Source)
Liên kết (Relation)
Nơi chứa (Coverage)
- Các yếu tố cơ bản
Các yếu tố cơ bản của Dublin Core đều mang thuộc tính lựa chọn có thể
lặp. Mỗi yếu tố cũng có một giới hạn như hạn định, thuộc tính nhằm diễn giải
chính xác ý nghĩa của các yếu tố.
Các yếu tố

Trường

Ý nghĩa sử dụng

Ví dụ

con

1. Title

Tên của nguồn thông tin Báo cáo kết quả
thường do tác giả hoặc Nxb công tác Quý

2. Creator

đặt cho tài liệu
1/2007
Người hoặc cơ quan chịu Đoàn Văn Cương
trách nhiệm chính về nội

3. Subject

dung trí tuệ của nguồn tin
Chủ đề của nguồn thông tin Công tác Ban
và được thể hiện bằng từ quản lý dự án
vựng có kiểm soát gồm tiêu

4. Description

đề đề mục, số phân loại,...
Phần thể hiện nội dung của
nguồn thông tin bao gồm cả
tóm tắt của tư liệu văn hóa
gốc hoặc nội dung của tư liệu

5. Publisher

nghe nhìn

Cơ quan tổ chức chịu trách Trung tâm Khoa
nhiệm tạo lập, xuất bản hay học và Công

6. Contributor

ban hành, công bố tư liệu
nghệ Quốc gia
Cá nhân hay tổ chức có
những đóng góp về mặt trí
tuệ cho tư liệu nhưng không

K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

phải là tác giả chính
Reviewer Người nhập văn bản
Người sửa văn bản

Phạm Quỳnh
Trang
Đào Quốc Hùng

7. Date

Ngày tháng có liên quan đến
việc tạo lập, xuất bản hay

công bố tư liệu
- Ngày nhập văn bản
Published - Ngày ban hành văn bản
Updated

25/05/2008
20/12/2007

- Ngày cập nhật văn bản

8. Type

Kiểu văn bản, hình thức chứa Báo cáo

9. Format

nội dung tư liệu
Định dạng vật lý và kích
thước của tư liệu như kích cỡ,
thời lượng,… Định dạng
cũng được dùng để chỉ rõ
phần mềm và phần cứng cần
Size
Mime

10. Identifier

thiết để sử dụng tư liệu
Kích thước toàn văn
254 KB

Định dạng (doc, pdf, gib,…) Text/pdf
Là một dãy kí tự hoặc số URLs và URNs,
nhằm thể hiện tính đơn nhất DOI,

11. Source

ISBD,

của tư liệu
ISSN
Nguồn gốc mà tư liệu được 24/BQLDA
tạo thành (số hiệu của văn KHCNQG-BC
bản), yếu tố này có thể bao
gồm siêu dữ liệu về nguồn
thông tin thứ hai nhằm khai

12. Language

thác tư liệu hiện hành
Ngôn ngữ của nội dung tư ‘Vie’: Việt Nam
liệu

K55 – Thông tin – Thư viện

‘En’: Tiếng Anh


Khóa luận tốt nghiệp

Bùi Thị Hương Giang


‘Fr’ : Tiếng Pháp
Một định danh cho nguồn thứ UBKH Sở Khoa

13. Relation

hai và những mối quan hệ học Công nghệ
của nó với tư liệu hiện hành.
Yếu tố này thể hiện những
kết nối giữa những nguồn dữ
liệu có liên quan
Những đặc tính về không Toanvan.pdf

14.Coverage

gian (Tên định danh hoặc
tương đương với địa lý)
và/hoặc thời gian của tư liệu
(ngày, tháng hoặc khoảng
thời gian), quy mô, phạm vi
quyền hạn của nguồn dữ liệu
Thông tin về quyền lưu trữ và Văn bản đã được

15. Right

Read
Write
Delete

hoàn trả nguồn tài nguyên


ký nhận, có thể

(Nhóm) có quyền đọc
(Nhóm) có quyền sửa
(Nhóm) có quyền xoa

ban hành
Tất cả mọi người
Nhân viên
Người quản lý

- Các yếu tố mở rộng
Thực tế sử dụng Dublin Core cho thấy mỗi yếu tố cơ bản còn gộp chứa
trong nó một vài thành tố phụ nhằm diễn đạt chi tiết hơn nội dung chính yếu
tố đó. Các thành tố phụ được coi là yếu tố mở rộng và được thể hiện thông
qua những khung mã hóa cụ thể.
Ví dụ: Khi thể hiện nội dung một tài liệu, người ta cung cấp một số cách
tiếp cận như qua ký hiệu phân loại, tiêu đề đề mục, từ khóa.
YẾU TỐ
Nhan đề
Tác giả

YẾU TỐ MỞ RỘNG
Nhan đề thay thế

K55 – Thông tin – Thư viện

KHUNG MÃ HÓA



Khóa luận tốt nghiệp

Chủ đề

Bùi Thị Hương Giang

LCSH, MeSH, DDC,
UDC, LCC

Mô tả

Mục lục (Table of Contents)
Tóm tắt (Abstract)

Nhà xuất
bản
Tác giả phụ
Thời gian

Tạo lập (Created)

Bảng thời kỳ của DDC

Có giá trị (Valid)

Định dạng ngày tháng

Có hiệu lực (Available)


của W3C

Xuất bản (Issued)
Hiệu đính (Modified)
Loại tài liệu

Thuật ngữ về loại hình

Khổ mẫu

của Dublin Core
IMT loại tư liệu

Kích thước và thời lượng
(Extent)
Vật mang tin (Medium)

Định danh

URI Uniform Resource

Nguồn

Identifier
URI Uniform Resource

Ngôn ngữ

Identifier
ISO 639-2

RFC 1766

Liên kết
Bao quát
Quyền
1.2. Giới thiệu về phần mềm Dspace
1.2.1. Sự ra đời và phát triển của Dspace
Dspace là một bộ phần mềm mã nguồn mở hỗ trợ giải pháp xây dựng và
phân phối các bộ sưu tập số hóa trên Internet, cho phép các thư viện, các cơ
quan nghiên cứu phát triển và mở rộng. Nó cung cấp một phương thức mới
trong việc tổ chức và xuất bản thông tin trên Internet.
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

Dspace do HP và The MIT Libraries phát triển vào năm 2002, hiện nay
có hơn 1000 trường đại học và các tổ chức văn hóa sử dụng phần mềm số
Dspace để quản lý và chia sẻ nguồn tài nguyên: sách, tạp chí, luận văn và các
sưu tập hình ảnh, âm thanh và phim...
1.2.2. Vai trò của Dspace
Dspace được sử dụng cơ bản như một phầm mềm lưu trữ và phân phối
tài liệu số với ba vai trò chính:
- Tạo điều kiện thu thập và quản lý tài liệu được dễ dàng, bao gồm siêu
dữ liệu của tài liệu
- Tạo điều kiện cho việc truy cập tài liệu được dễ dàng, bằng việc liệt kê
và tìm kiếm
- Tạo điều kiện để việc bảo quản tài liệu lâu dài

1.2.3. Đặc điểm cấu trúc của Dspace
Mô hình thông tin của hệ thống
Dspace được thiết kế để tạo thuận lợi cho các cá nhân có thể đóng góp
các tài nguyên số vào hệ thống một cách dễ dàng. Mô hình thông tin của hệ
thống được xây dựng xung quanh ý tưởng “Communities” tổ chức các đơn vị
trực thuộc của một tổ chức nghiên cứu, một trường đại học có nhu cầu quản lý
thông tin đặc biệt.
Dspace có cấu trúc phân cấp theo dạng cây thư mục với các Đơn vị và
Bộ sưu tập. Đơn vị dùng để quản lý các đơn vị con và các bộ sưu tập còn bộ
sưu tập để quản lý tài liệu. Đồng thời với việc phân cấp các đơn vị và các bộ
sưu tập, Dspace còn cho phép phân cấp quản lý đối với các đơn vị và các bộ
sưu tập này.
Kiến trúc của hệ thống
Kiến trúc hệ thống của Dspace là một kiến trúc gồm 3 lớp:
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

- Lớp lưu trữ
- Lớp nghiệp vụ
- Lớp ứng dụng
Các lớp lưu trữ được thực hiện bằng cách sử dụng hệ thống tập tin, quản
lý bởi các bảng trong cơ sở dữ liệu PostgreSQL… Lớp nghiệp vụ là lớp các
chức năng cụ thể Dspace, bao gồm các Module luồng công việc, quản lý nội
dung, quản trị, tìm kiếm và duyệt tài liệu. Mỗi Module có một API để cho
phép Dspace tùy chỉnh, nâng cấp các chức năng phù hợp với từng đối tượng.
Cuối cùng, lớp ứng dụng bao gồm các giao diện cho hệ thống giao diện người

dùng web và bộ xử lý máy chủ để giải quyết định danh liên tục (Handle) đến
các biểu ghi trong Dspace.
Nền tảng Công nghệ Thông tin
Dspace được thiết kế trên nền tảng UNIX. Hiện nay đã có phiên bản trên
nền tảng hệ điều hành Window. Các mã ban đầu được lập trình bằng ngôn
ngữ Java.
Các thành phần khác: Hệ quản trị CSDL sử dụng PostgreSQL; máy chủ
web và Java Servlet sử dụng Apache và Tomcat; Jena – một bộ công cụ RDF
được phát triển từ HP Labs, OAICat từ OCLC
1.2.4. Ưu điểm của phần mềm Dspace.
Ưu điểm nổi bật
- Có cộng đồng người sử dụng lớn và phát triển rộng rãi trên khắp thế
giới.
- Phần mềm mã nguồn mở, miễn phí
- Được sử dụng cho các tổ chức giáo dục, chính phủ, tư nhân và thương mại
- Giao diện dạng web dễ dàng cho việc sử dụng
- Tùy chỉnh theo nhu cầu của người dùng
- Cài đặt dễ dàng, sử dụng trên nhiều hệ điều hành như Window, Linux,
Unix…Sử dụng hệ quản trị cơ sở dữ liệu PostgresSQL hoặc Oracle.
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp

Bùi Thị Hương Giang

- Quản lý và lưu trữ các dạng tài nguyên số.
- Tài liệu được biên mục theo chuẩn Dublin Core đơn giản, phổ biến và
thông dụng.
- Khả năng tìm kiếm tài liệu toàn văn

- Phân quyền và bảo mật cao. Có thể phân quyền đến từng tài khoản cho
người dùng, đến từng bộ sưu tập hoặc thậm chí đến từng tài liệu. Các quyền
được cấu hình khá chi tiết như: Quyền xem biểu ghi thư mục, Quyền xem
toàn văn…
- Hỗ trợ đa ngôn ngữ trong đó có Tiếng Việt
- Hỗ trợ việc chuyển đổi dữ liệu từ Phần mềm Greenstone sang Dspace
Những tính năng vượt trội hơn so với Phần mềm Greenstone
- Khả năng tùy chỉnh giao diện cao. Giao diện thống nhất chung cho toàn
bộ bộ sưu tập
- Phần mềm Dspace như một website. Tất cả thao tác đều được thông
qua web: Biên mục, Truy cập thông tin… Khi cần bổ sung tài liệu cho các bộ
sưu tập không cần phải xây dựng lại từ đầu như Greenstone. Dspace có cấu
trúc các bộ sưu tập theo nhiều cấp
- Sử dụng hệ quản trị cơ sở dữ liệu độc lập đáp ứng tốt với Thư viện có
số lượng tài liệu lớn
- Khả năng phân quyền mạnh. Có thể phân quyền từng tài khoản người
dùng đến từng bộ sưu tập hoặc thậm chí đến từng tài liệu. Các quyền được
cấu hình khá chi tiết như quyền: Quyền xem biểu ghi thư mục, Quyền xem
toàn văn…
- Có nhiều kiểu báo cáo: Lượt truy cập, lượt xem biểu ghi thư mục, lượt
download…
Với những ưu điểm vượt trội so với Phần mềm Greenstone mà tại Việt
Nam đã và đang có rất nhiều Trung tâm Thông tin - Thư viện tại các trường
đại học áp dụng phần mềm mã nguồn mở Dspace như: Thư viện Đại học
Quốc gia Thành phố Hồ Chí Minh, Trung tâm Thông tin - Thư viện Đại học
K55 – Thông tin – Thư viện


Khóa luận tốt nghiệp


Bùi Thị Hương Giang

Quốc gia Hà Nội, Trung tâm Thông tin - Thư viện Học viện CNBCVT, Thư
viện Đại học Thái Nguyên, Trung tâm Thông tin – Thư viện Đại học Đà
Lạt…
Qua quá trình thực tập tại Trung tâm TT-TV HVCNBCVT, được thực
hành và sử dụng phần mềm Dspace. Sau đây tôi xin giới thiệu thực trạng quá
trình áp dụng Dspace tại Trung tâm TT-TV HVCNBCVT.

K55 – Thông tin – Thư viện


×