MỤC LỤC
DANH MỤC CÁC HÌNH VẼ
LỜI CẢM ƠN
Em xin bày tỏ lòng biết ơn sâu sắc nhất tới thầy giáo TS. Lê Đắc Nhường, thầy
đã tận tình hướng dẫn và giúp đỡ em trong suốt quá trình làm đề tài. Với sự chỉ bảo của
thầy, em đã có những định hướng tốt trong việc triển khai và thực hiện các yêu cầu trong
quá trình làm đề tài.
Em xin chân thành cảm ơn sự dạy bảo và giúp đỡ của các thầy giáo, cô giáo Khoa
Công nghệ thông tin - Trường Đại học Hải Phòng đã trang bị cho em những kiến thức cơ
bản nhất để em có thể hoàn thành tốt báo cáo này.
Xin cảm ơn tới những người thân trong gia đình quan tâm, động viên trong suốt
quá trình học tập và làm đề tài. Xin gửi lời cảm ơn tất cả bạn bè, đặc biệt là các bạn trong
lớp CNTT K12 đã giúp đỡ và đóng góp ý kiến để mình hoàn thành chương trình. Tuy
nhiên do thời gian hạn hẹp, mặc dù đã nổ lực hết sức mình nhưng đề tài của em khó tránh
khỏi những thiếu sót.
Em rất mong nhận được sự thông cảm và sự chỉ bảo tận tình của quý thầy cô và
các bạn để thực hiện tốt đề tài này.
Em xin chân thành cảm ơn !
Hải Phòng, ngày 19 tháng 4 năm 2015
Sinhviên thực hiện
Lê Thị Huệ Anh
MỞ ĐẦU
Ở bất cứ một trường đại học nào cũng đều có hai nhiệm vụ chính và quan trọng
nhất là: đào tạo và NCKH. Đây là hai hoạt động có mối quan hệ hữu cơ, hai nhiệm vụ cơ
bản chiến lược của nhà trường, trong đó việc giảng viên, sinh viên trong nhà trường tích
cực tham gia các hoạt động NCKH là một trong những biện pháp thiết yếu để hướng đến
nâng cao chất lượng đào tạo, đáp ứng tốt hơn nhu cầu ngày càng cao của xã hội. Chúng ta
đều biết rằng, NCKH và giảng dạy có mối quan hệ hữu cơ với nhau, gắn kết chặt chẽ và
hỗ trợ cho nhau. NCKH tạo cơ sở, điều kiện, tiền đề nhằm thực hiện tốt nhiệm vụ giảng
dạy ở trên lớp. Ngược lại, công tác giảng dạy phản ánh kết quả của hoạt động NCKH.
Trong bối cảnh giao lưu và hội nhập của nước ta hiện nay, để khẳng định được
vai trò của NCKH, các trường đại học nói chung và trường Đại học Hải Phòng nói riêng
luôn hướng tới mục tiêu "Mỗi trường đại học là một viện nghiên cứu". Bởi vì, nghiên cứu
khoa học có tầm quan trọng đặc biệt trong giáo dục đại học và đó là con đường hiệu quả
nhất để nâng cao chất lượng đào tạo và phát triển năng lực sư phạm của mỗi người làm
công tác giảng dạy và giáo dục. Là một trường đại học trực thuộc thành phố Hải Phòng,
nên việc đẩy mạnh hoạt động NCKH không chỉ nhằm mục tiêu nâng cao chất lượng đào
tạo, phát triển đội ngũ của nhà trường, mà còn nhằm góp phần phát triển các mục tiêu
kinh tế - xã hội của thành phố. Cũng như các trường đại học địa phương trên cả nước nói
chung, trường Đại học Hải Phòng luôn phát huy vai trò để trở thành trung tâm văn hóa,
giáo dục, khoa học - công nghệ của thành phố và khu vực miền duyên hải.
Với mục tiêu đẩy mạnh hoạt động hội nhập về phát triển khoa học và công nghệ
đáp ứng yêu cầu phát triển kinh tế xã hội của thành phố, nâng cao vị thế khoa học và
công nghệ của Trường Đại học Hải Phòng. Tạo ra một môi trường tương tác qua mạng
Internet cho các tác giả gửi tài liệu, các công trình khoa học một cách dễ dàng thuận lợi,
cho phép biên tập viên nhận nhiệm vụ trực tuyến, có thể làm việc mọi lúc mọi nơi. Đồng
thời tiết kiệm chi phí cho việc quản lý, lưu trữ các công trình khoa học, tạo sự thuận lợi
dễ dàng tìm kiếm các công trình khoa học, thông tin tác giả…để trao đổi và liên hệ. Xuất
phát từ những phân tích trên, để đáp ứng nhu cầu phát triển và xây dựng trường Đại học
Hải Phòng theo định hướng trường học điện tử, nhóm tác giả đã lựa chọn đề tài: “Nghiên
cứu, phát triển hệ thống quản lý cơ sở dữ liệu khoa học trên nền tảng mã nguồn mở
tại trường ĐH Hải Phòng”.
CHƯƠNG 1. CƠ SỞ DỮ LIỆU KHOA HỌC - NHỮNG VẤN ĐỀ
LÝ LUẬN VÀ THỰC TIỄN
1.1. Các yếu tố cấu thành cơ sở khoa học điện tử
1.1.1. Khái niệm
"Cơ sở dữ liệu về khoa học và công nghệ" là tập hợp thông tin về tiềm
lực và kết quả hoạt động khoa học và công nghệ, được xây dựng, duy trì và
phát triển nhằm cung cấp dữ liệu và thông tin đầy đủ, chính xác và kịp thời
về khoa học và công nghệ.
1.1.2. Chức năng nhiệm vụ và mô hình cơ sở dữ liệu khoa học
Cơ sở dữ liệu thành phần của Cơ sở dữ liệu về khoa học và công nghệ bao gồm
các phân hệ chính sau:
1) Cơ sở dữ liệu Tổ chức khoa học và công nghệ: tập hợp thông tin, dữ liệu về tổ
chức khoa học và công nghệ. Cơ sở dữ liệu Tổ chức khoa học và công nghệ được xây
dựng và quản lý tập trung tại Cục Thông tin khoa học và công nghệ quốc gia, các tổ chức
đầu mối thông tin khoa học và công nghệ tại các bộ, ngành và địa phương có trách nhiệm
cập nhật thông tin về các tổ chức khoa học và công nghệ thuộc bộ, ngành và địa phương.
2) Cơ sở dữ liệu Cán bộ nghiên cứu khoa học và phát triển công nghệ là tập hợp
thông tin về các cán bộ tham gia hoạt động nghiên cứu khoa học và phát triển công nghệ,
bao gồm:
a) Thông tin chung về cán bộ;
b) Thông tin về tổ chức của cán bộ;
c) Thông tin về trình độ chuyên môn, lĩnh vực nghiên cứu chính;
d) Thông tin về các nhiệm vụ khoa học và công nghệ do cán bộ nghiên cứu
chủ trì và tham gia;
e) Thông tin về các công bố khoa học và công nghệ, chỉ số trích dẫn
3) Cơ sở dữ liệu Nhiệm vụ khoa học và công nghệ là tập hợp thông tin về nhiệm
vụ khoa học và công nghệ được ký hợp đồng triển khai, kết quả thực hiện và kết quả ứng
dụng, bao gồm:
a) Thông tin về tên nhiệm vụ khoa học và công nghệ;
b) Thông tin về tổ chức chủ trì, tổ chức phối hợp thực hiện nhiệm vụ khoa
học và công nghệ;
c) Thông tin về cá nhân chủ nhiệm nhiệm vụ, cá nhân tham gia thực hiện
nhiệm vụ khoa học và công nghệ;
d) Thông tin về thời gian, thời hạn thực hiện, thời gian nghiệm thu đánh giá
chính thức;
e) Thông tin về mục tiêu, nội dung nghiên cứu;
f) Thông tin về kết quả, sản phẩm thực hiện của nhiệm vụ;
g) Thông tin về kinh phí thực hiện nhiệm vụ;
h) Thông tin tóm tắt về kết quả thực hiện nhiệm vụ;
i) Thông tin về ứng dụng kết quả;
j) Thông tin thư mục khác.
4) Cơ sở dữ liệu Công bố khoa học và trích dẫn khoa học là tập hợp thông tin về
các công bố đăng tải trên các tạp chí khoa học và công nghệ, xuất bản phẩm nhiều kỳ, kỷ
yếu hội nghị, hội thảo khoa học và công nghệ, các tuyển tập báo cáo khoa học và công
nghệ của Việt Nam được xuất bản trong nước. Thông tin được xử lý và cập nhật vào cơ sở dữ
liệu là thông tin thư mục và toàn văn công bố, bao gồm:
a) Thông tin nhan đề;
b) Thông tin về tác giả và cơ quan tác giả;
c) Thông tin về cơ quan chủ trì và tài trợ;
d) Thông tin mô tả nội dung, chủ đề;
e) đ) Thông tin về tài liệu tham khảo;
f) Thông tin phục vụ xác định chỉ số trích dẫn khoa học;
g) Toàn văn công bố khoa học;
h) Thông tin khác.
5) Cơ sở dữ liệu Thống kê khoa học và công nghệ là tập hợp thông tin, dữ liệu
tổng hợp từ kết quả chính thức của các cuộc điều tra và chế độ báo cáo thống kê về khoa
học và công nghệ trên quy mô toàn quốc, bao gồm:
a) Thông tin thống kê về tổ chức hoạt động khoa học và công nghệ;
b) Thông tin thống kê về nhân lực khoa học và công nghệ;
c) Thông tin thống kê về kinh phí dành cho khoa học và công nghệ;
d) Thông tin thống kê về các đề tài/dự án nghiên cứu khoa học và
phát triển công nghệ;
e) Thông tin thống kê về nhận thức công chúng về khoa học và công nghệ;
f) Thông tin thống kê về hợp tác và hội nhập quốc tế về khoa học và công
nghệ;
g) Thông tin thống kê về đổi mới sáng tạo.
1.1.3. Các nguyên tắc xây dựng và phát triển cơ sở dữ liệu khoa học
1. Việc xây dựng, cập nhật, quản lý, khai thác và sử dụng Cơ sở dữ liệu về khoa
học và công nghệ được thực hiện tập trung thống nhất trên cơ sở phân định quyền
hạn, trách nhiệm rõ ràng theo nhiệm vụ, chức trách của các tổ chức, cá nhân có liên quan.
2. Cơ sở dữ liệu về khoa học và công nghệ được khai thác và sử dụng nhằm phục
vụ hoạch định chính sách, lãnh đạo, quản lý, nghiên cứu khoa học và phát triển công
nghệ, giáo dục và đào tạo, sản xuất, kinh doanh.
3. Việc xây dựng, cập nhật, quản lý, khai thác và sử dụng Cơ sở dữ liệu về khoa
học và công nghệ phải đảm bảo tính đầy đủ, chính xác, khoa học, khách quan, kịp thời,
thống nhất, bảo đảm an toàn, an ninh thông tin và lưu trữ lâu dài, đúng mục đích, bảo
đảm tôn trọng thông tin của cá nhân nhà khoa học, tạo thuận lợi cho cơ quan, tổ chức, cá
nhân có yêu cầu cung cấp thông tin từ cơ sở dữ liệu.
4. Việc xây dựng, cập nhật, quản lý, khai thác và sử dụng Cơ sở dữ liệu về khoa
học và công nghệ phải áp dụng các tiêu chuẩn, quy chuẩn kỹ thuật theo quy định tại
Thông tư số 22/2013/TT-BTTTT ngày 23 tháng 12 năm 2013 về ban hành danh mục tiêu
chuẩn kỹ thuật về ứng dụng công nghệ thông tin trong cơ quan nhà nước.
Trong quá trình xây dựng, xử lý, cập nhật Cơ sở dữ liệu quốc gia về khoa học và
công nghệ nhằm xác định lĩnh vực nghiên cứu khoa học và phát triển công nghệ, mục
tiêu kinh tế - xã hội, nội dung nghiên cứu của nhiệm vụ khoa học và công nghệ của
nhiệm vụ khoa học và công nghệ và phân loại trong lĩnh vực sở hữu công nghiệp, các tổ
chức, cá nhân có liên quan phải sử dụng các bảng phân loại sau:
1) Bảng phân loại thống kê khoa học và công nghệ do Bộ trưởng Bộ Khoa
học và Công nghệ ban hành.
2) Bảng phân loại nội dung "Khung đề mục của hệ thống thông tin khoa học
và công nghệ quốc gia" do Cục Thông tin khoa học và công nghệ quốc gia
thuộc Bộ Khoa học và Công nghệ xây dựng và ban hành.
3) Bảng phân loại sáng chế quốc tế; Bảng Phân loại quốc tế về kiểu dáng
công nghiệp (Bảng phân loại Locarno); Bảng phân loại quốc tế các yếu tố
hình của nhãn hiệu trong đăng ký nhãn hiệu (Bảng phân loại Viên); Bảng
phân loại hàng hóa/dịch vụ trong đăng ký nhãn hiệu (Bảng phân loại Nixơ).
Các tổ chức, cá nhân tham gia xây dựng, cập nhật, khai thác và sử dụng Cơ sở dữ
liệu về khoa học và công nghệ không được phép cung cấp quyền truy cập của mình vào
Cơ sở dữ liệu quốc gia về khoa học và công nghệ cho bên thứ ba, trừ trường hợp được sự
cho phép của cơ quan quản lý Cơ sở dữ liệu về khoa học và công nghệ.
1.2 Tình hình xây dựng và phát triển cơ sở dữ liệu khoa học trên
thế giới và Việt Nam hiện nay
1.2.1. Tình hình xây dựng và phát triển cơ sở dữ liệu trên thế giới
Các cơ sở dữ liệu khoa học đã có từ rất lâu trên thế giới với những cơ sở dữ liệu
lớn uy tín được sử dụng trong nhiều lĩnh vực khác nhau. Chúng ta có thể kể đến các cơ sở
dữ liệu khoa học điển hình sau:
ISI Web of Knowledge là công cụ mạnh mẽ để tìm kiếm và đánh giá chất lượng
các công trình khoa học trên cơ sở dữ liệu trích dẫn khoa học từ hơn 12.000 tên tạp chí
hàng đầu thế giới được cập nhật hàng tuần, trong đó có: 8.060 tạp chí thuộc lĩnh vực khoa
học tự nhiên, khoa học công nghệ, 2.697 tạp chí thuộc lĩnh vực khoa học xã hội, 1.497
tạp chí thuộc lĩnh vực nghệ thuật và xã hội nhân văn và hơn 150.000 tài liệu hội nghị hội
thảo với bề dày hồi cố tới năm 1900. ISI là công cụ không thể thiếu trong việc đánh giá
chất lượng các công trình khoa học theo chuẩn mực quốc tế, cho phép xác định chính xác
các xu thế phát triển của các lĩnh vực khoa học và công nghệ trong quá khứ, hiện tại và
tương lai cũng như xác định vị trí của từng tổ chức nghiên cứu và của từng quốc gia trong
lĩnh vực KH&CN.
SpringerLink là một trong các nguồn tin điện tử hàng đầu thế giới, chứa các ấn
phẩm của nhà xuất bản Springer, bao gồm hơn 2.700 tên tạp chí khoa học và công nghệ
thuộc các lĩnh vực như: các ngành kỹ thuật, hóa học, khoa học vật liệu, khoa học máy
tính, y học...Các tạp chí được xếp theo các sưu tập chuyên đề, giúp tra cứu dễ dàng.
Ngoài ra bạn đọc có thể xem toàn văn trên 6.000 cuốn sách do nhà xuất bản Springer xuất
bản từ năm 2009 đến năm 2011. Springer Link là nguồn dữ liệu ưu tiên cho các nhà
nghiên cứu ở trường đại học các doanh nghiệp và các trung tâm nghiên cứu quan trọng
khác.
ScienceDirect là nguồn thông tin thiết yếu đối với công tác nghiên cứu và đào
tạo. Đây là bộ sưu tập toàn văn bao trùm các tài liệu khoa học nòng cốt với nhiều tạp chí
có chỉ số ảnh hưởng cao. Bộ cơ sở dữ liệu danh tiếng này là sản phẩm Elsevier, một công
ty lớn nhất thế giới về cung cấp thông tin khoa học, kỹ thuật và y tế... ScienceDirect hiện
nay có hơn 9 triệu bài viết toàn văn và mỗi năm tăng thêm ½ triệu bài, bao quát 24 lĩnh
vực khoa học và công nghệ. Số tạp chí được phản biện lên tới trên 2.500 đầu tên. Cục
Thông tin Khoa học và Công nghệ Quốc gia đã đặt mua thêm 13 gói tạp chí hồi cố thuộc
các chủ đề: Khoa học nông nghiệp và sinh học; Hoá sinh, Di truyền và sinh học phân tử;
Kỹ thuật hoá học; Khoa học máy tính; Năng lượng; Kỹ thuật và công nghệ; Khoa học
môi trường; Vật lý hạt nhân năng lượng cao và thiên văn học; Khoa học vật liệu; Hoá học
tổng hợp; Kinh tế kinh doanh; Quản lý và kế toán; Khoa học trái đất và hành tinh; Miễn
dịch và vi sinh vật học, giúp cho bạn đọc có thể truy cập tới cả các số tạp chí xuất bản
đầu tiên, trong đó có cả các tạp chí được lưu trữ từ năm 1823.
Thư viện điện tử IEEE Xplore Digital Library của IEEE (Viện các kỹ sư điện
và điện tử Hoa Kỳ) có thể cung cấp trên 3.000.000 tài liệu toàn văn chất lượng cao nhất
thế giới về các lĩnh vực khoa học và công nghệ mũi nhọn như công nghệ thông tin, điện
tử-viễn thông, tự động hóa, năng lượng, v.v. Các tài liệu này được đăng trên 160 tạp chí
của IEEE và 1.200 bộ kỷ yếu hội nghị, hội thảo do IEEE tổ chức. Thư viện được cập nhật
hàng tuần với hơn 20.000 tài liệu mới hàng tháng trong đó có cả các bài được phép cung
cấp trước khi xuất bản.
Cơ sở dữ liệu tạp chí hóa học của Hội Hóa học Hoa Kỳ (Americal Chemical
Society-ACS) hiện đang xuất bản 44 tạp chí khoa học chuyên ngành hàng đầu thế giới.
ACS đăng tải các nghiên cứu trong hóa học và các lĩnh vực liên quan từ hơn 130 năm
nay. Cơ sở dữ liệu còn cung cấp cả các bản tin hàng tuần về doanh nghiệp và các hoạt
động trong công nghệ hóa học.
Cơ sở dữ liệu của TAYLOR & FRANCIS: Được xây dựng trên nền tảng kinh
nghiệm của hơn hai thế kỷ, tập đoàn xuất bản TAYLOR & FRANCIS là một trong những
tập đoàn xuất bản hàng đầu trên thế giới chuyên về sách, tạp chí Khoa học xã hội, Khoa
học kỹ thuật và các loại tạp chí chuyên ngành thuộc mọi lĩnh vực khoa học. Taylor &
Francis cung cấp đến người dùng các thông tin và kiến thức chất lượng cao để người
dùng có thể ứng dụng hiệu quả vào công việc hàng ngày, phục vụ công tác nghiên cứu,
đào tạo và góp phần vào sự phát triển của thị trường khoa học và công nghệ. Khách hàng
của Taylor & Francis là các nhà nghiên cứu, sinh viên, giảng viên và các chuyên gia cao
cấp. Bạn đọc của NASATI có thể truy cập gói tạp chí điện tử “S&T Library” bao gồm
trên 400 tạp chí thuộc các chủ đề sau: Chemistry, Engineering Computing & Technology,
Environment & Agriculture, Mathematics & Statistics, Physic
Ebrary là cơ sử dữ liệu toàn văn sách điện tử về khoa học và công nghệ với hơn
36.000 tên sách điện tử toàn về các lĩnh vực như khoa học tự nhiên, công nghệ, khoa học
xã hội, nông nghiệp, y học; khoa học quân sự, khoa học thông tin - thư viện, giáo dục,
nghệ thuật, địa lý, nhân chủng học, văn học, ngôn ngữ, luật,...
Proquest Central là bộ cơ sở dữ liệu lớn bao gồm 25 cơ sở dữ liệu đa ngành, xử
lý trên 19.000 tạp chí, trong đó hơn 13.000 tạp chí toàn văn. Dữ liệu của Proquest Central
bao quát trên 160 lĩnh vực chủ đề khác nhau thuộc các ngành khoa học nòng cốt như:
Kinh tế - kinh doanh, Y học, Công nghệ, Khoa học xã hội…Ngoài ra, Proquest Central
còn cung cấp toàn văn của 56.000 luận văn trong các lĩnh vực tâm lý học, kinh doanh,
khoa học vật lý, y tế, giáo dục…và đưa ra các thông tin cô đọng về kinh tế, kinh doanh
thông qua các báo cáo từ hàng trăm ngành công nghiệp tại 90 quốc gia, cung cấp 43.000
hồ sơ doanh nghiệp, thu thập trên 1.000 tài liệu hội nghị và 1.300 tờ báo quốc tế, bao
gồm cả những tờ báo hàng đầu của Mỹ như The Wall Street Journal…
Cơ sở dữ liệu do IOP Publishing, một nhà xuất bản hàng đầu trong lĩnh vực vật
lý và các ngành khoa học liên quan cung cấp. Nhà xuất bản IOP là cơ quan trung tâm của
Viện Vật lý, một tổ chức xã hội phi lợi nhuận có trụ sở chính tại Bristol, Vương quốc
Anh. Ngoài những tạp chí truyền thống, IOP Publishing còn tạo ra các sản phẩm thông tin
khoa học có giá trị cao và dễ dàng truy cập qua web và các dịch vụ điện tử khác. Cơ sở
dữ liệu IOP Science chứa đựng trên 400.000 bài viết được xuất bản từ 1874 tới nay được
đăng trên 60 tạp chí được phản biện có chất lượng cao nhất bao trùm các lĩnh vực: Khoa
học vũ trụ, Vật lý học thiên thể, Sinh học, Hoá học, Tin học, Giáo dục, Đo lường, Công
nghệ nano, Y học, Các ngành kỹ thuật, Vật liệu, Toán học, Vật lý học.
Cơ sở dữ liệu Tạp chí trực tuyến Nature: Đây là bộ Cơ sở dữ liệu tạp chí khoa
học đa ngành số 1 thế giới do Nature Publishing Group, một công ty toàn cầu có mức độ
ảnh hưởng rất cao trong 31 lĩnh vực khoa học và công nghệ cung cấp. Tạp chí Nature
theo báo cáo của Thomson Reuter năm 2013 có chỉ số ảnh hưởng lên tới 38.597. Hàng
tháng có tới hơn 6 triệu lượt người truy cập vào cơ sở dữ liệu và sử dụng các dịch vụ của
Nature Publishing Group.
Credo Reference là CSDL tra cứu, tham khảo trực tuyến đa ngành, đa lĩnh vực
được tổng hợp từ nguồn dữ liệu của nhiều nhà xuất bản khác nhau, với hàng trăm bộ bách
khoa thư, từ điển, cẩm nang, sách tra cứu đa ngành và chuyên ngành, bao trùm tất cả các
lĩnh vực từ khoa học, công nghệ, y-dược học, kinh tế, ngoại giao, nông, lâm nghiệp, luật
học, tâm lý học đến lịch sử, văn học và nghệ thuật, v.v… Credo Reference cho phép truy
cập tới hơn 500 bộ dữ liệu toàn văn từ hơn 80 nhà xuất bản uy tín trên thế giới, với tính
chính xác và mức độ tin cậy cao. Bộ sưu tập Credo Reference hiện tại cho phép tra cứu
và sử dụng thông tin về trên 3 triệu đầu mục dữ liệu về các lĩnh vực khoa học và công
nghệ khác nhau; 200.000 tệp âm thanh số hóa; 40.000 tranh ảnh nghệ thuật, khoa học, y
học; và 90.000 tập bản đồ về các địa danh, đặc điểm địa lý trên toàn thế giới.
HINARI: Chương trình HINARI do Tổ chức Y tế Thế giới (WHO) và các nhà
xuất bản lớn trên thế giới bao gồm: Blackwell, Elsevier Science, the Harcourt Worldwide
STM Group, Wolters Kluwer International Health & Science, Springer Verlag vaf John
Wiley hợp tác hình thành từ năm 2002. HINARI hổ trợ các nước đang phát triển cơ hội
tiếp cận toàn văn của một trong các bộ sưu tập y sinh học và y tế lớn nhất của thế giới với
hơn 6.000 tạp chí.
ARDI (Truy cập các Nghiên cứu về Phát triển và Đổi mới) là chương trình được
xây dựng bởi Tổ chức Sở hữu Trí tuệ Thế giới (WIPO) và các đối tác xuất bản thuộc lĩnh
vực khoa học và công nghệ như American Association for the Advancement of Science;
American Institute of Physics; Elsevier; Institute of Physics; John Wiley & Sons; Oxford
University Press; National Academy of Sciences; Nature Publising Group; Royal Society
of Chemistry; Sage Publications; Springer Science... Cơ sở dữ liệu ARDI hỗ trợ người
dùng tại 107 nước đang phát triển truy cập miễn phí toàn văn hơn 10.000 tạp chí, sách và
tài liệu tham khảo.
1.2.2. Tình hình xây dựng và phát triển cơ sở dữ liệu tại Việt Nam
Ở nước ta hiện nay, các cơ sở dữ liệu khoa thông tin phục vụ nghiên cứu và đào
tạo đã được xây dựng rất nhiều và ngày càng hoàn thiện đáp ứng nhu cầu tra cứu thông
tin khoa học của các nhà nghiên cứu. Chúng ta có thể kể đến các cơ sở dữ liệu khoa học
điển hình sau:
Tài liệu khoa học và công nghệ Việt Nam (STD) là cơ sở dữ liệu toàn văn về
tài liệu khoa học và công nghệ Việt Nam, do Cục Thông tin Khoa học và Công nghệ quốc
gia (National Agency for Science and Technology Information) xây dựng và cập nhật từ
năm 1987. Hiện tại, STD có gần 150.000 biểu ghi, trong đó 85.000 biểu ghi có đính kèm
tài liệu gốc định dạng tệp PDF. Tài liệu khoa học và công nghệ Việt Nam được cập nhật
hàng tuần. Trung bình mỗi năm cập nhật mới trên 11.000 tài liệu.
Báo cáo kết quả đề tài nghiên cứu (KQNC) là cơ sở dữ liệu thư mục lớn nhất
Việt Nam vể các báo cáo kết quả của các đề tài nghiên cứu KH&CN các cấp đăng ký và
giao nộp tại Cục Thông tin KH&CN Quốc gia. CSDL bao gồm hơn 11.000 mô tả thư mục
và tóm tắt, được cập nhật khoảng 600 báo cáo/năm. Trong cơ sở dữ liệu này, bạn đọc có
thể nắm bắt được các thông tin chi tiết về chủ nhiệm và các cán bộ tham gia đề tài nghiên
cứu, cơ quan chủ trì và tóm tắt các kết quả chủ yếu của đề tài.
Bản tin điện tử của NASATI: cho phép truy cập và khai thác hệ thống các bản
tin điện tử và tạp chí điện tử do Cục Thông tin KH&CN Quốc gia xuất bản. Những bản
tin có thể truy cập gồm: BT Nông thôn đổi mới; Tổng luận Khoa học-Công nghệ-Kinh tế;
Ấn phẩm Khoa học-Công nghệ-Môi trường; BT Môi trường và Phát triển bền vững;
Vietnam Infoterra Newsletter (tiếng Anh), Tạp chí Thông tin và Tư liệu.
Thư viện Quốc gia Việt Nam và hệ thống các thư viện khoa học tổng hợp của
các tỉnh/thành phố. Các trung tâm thông tin chuyên dạng và hệ thống các trung tâm thông
tin khoa học trực thuộc Sở Khoa học và Công nghệ các tỉnh/thành phố;
Thư viện Khoa học xã hội và hệ thống trên 30 trung tâm thông tin-thư viện Khoa
học xã hội trực thuộc VKHXHVN. Trung tâm Thông tin khoa học và các thư viện trực
thuộc các Viện nghiên cứu thuộc Viện Khoa học và Công nghệ Việt Nam. Các trung tâm
thông tin - thư viện, thư viện, trung tâm học liệu tại các trường đại học, Viện nghiên
cứu…Các trung tâm học liệu của các trường Cao đẳng, Đại học trong cả nước.
Theo thống kê sơ bộ, số lượng các cơ quan trên ước khoảng từ 800 đến 900. Một
trong các nhiệm vụ thường xuyên và quan trọng của hầu hết các cơ quan trên là việc xây
dựng, cập nhật và tổ chức khai thác các loại cơ sở dữ liệu. Điều dễ nhận thấy là, nếu
không có một quy hoạch hợp lý thì việc trùng lặp, chồng chéo trong quá trình xây dựng
và phát triển các loại cơ sở dữ liệu sẽ xảy ra, và hơn nữa, hệ số trùng lặp (số biểu ghi ứng
với một tên tài liệu) trong các cơ sở dữ liệu là rất cao. Mặt khác, do việc xây dựng cơ sở
dữ liệu được triển khai một cách tự phát, ít nhất là giữa các phân hệ, thì rất dễ dẫn đến
những trở ngại khó có thể vượt qua trong quá trình tích hợp các cơ sở dữ liệu này để có
thể tạo nên một ngân hàng dữ liệu quốc gia bảo đảm sẵn sàng phục vụ người dùng tin.
Có thể dễ nhận thấy, trong phạm vi hệ thống các thư viện và cơ quan thông tin
khoa học của quốc gia, cũng như trong phạm vi hoạt động nghiên cứu và đào tạo, các vấn
đề như đã nêu không thể và không chỉ được xem là nhiệm vụ của bất kỳ một hay một số
ít cơ quan, mà cần được xem là nhiệm vụ lâu dài và chung của mọi thành viên của Hệ
thống. Các cơ quan thông tin thư viện khoa học xã hội cũng như các phân hệ khác của Hệ
thống cần đặc biệt quan tâm tới vấn đề này bởi nhiều lí do khác nhau. Trước hết là bởi vì
sự liên kết về mặt nhận thức và các hoạt động khoa học cụ thể giữa các phân hệ này với
nhau, giữa các thành viên của mỗi phân hệ nêu trên đều chưa trở thành một nền nếp, và
do đó, hiệu quả của điều đó còn rất hạn chế.
Trong khi đó, sự liên kết nghiên cứu và đào tạo giữa các trường đại học, Viện
nghiên cứu đang trở nên rất chặt chẽ - điều đó cho thấy nhu cầu kết nối giữa các chủ thể
trên từ phía người dùng là rất rõ rệt. Có nhiều hoạt động phản ánh sự liên kết phối hợp
giữa các phân hệ khác với các thành viên. Trong đó, phối hợp cùng nhau phát triển các
nguồn thông tin dạng số, phát triển hệ thống các loại CSDL thành phần theo mô hình của
dự án CORC là các nội dung có tác động và ý nghĩa rất đặc sắc.
1.3 Nhu cầu và sự cần thiết phải xây dựng cơ sở dữ liệu khoa
học tại Trường ĐH Hải Phòng
1.3.1 Vài nét khái quát về trường Đại học Hải Phòng
Theo Quyết định số 48/2000/QĐ -TTg, ngày 20 tháng 4 năm 2000, của Thủ tướng
Chính phủ, Trường đại học sư phạm Hải Phòng được thành lập trên cơ sở sát nhập bốn
đơn vị giáo dục - đào tạo lớn của thành phố Hải Phòng. Đến ngày 9 tháng 4 năm 2004,
theo Quyết định số 60/2004/QĐ-TTg của Thủ tướng Chính phủ, Trường đại học sư phạm
Hải Phòng được đổi tên thành Trường đại học Hải Phòng, đáp ứng yêu cầu đào tạo nguồn
nhân lực chất lượng cao đa ngành, đáp ứng yêu cầu của sự nghiệp công nghiệp hóa, hiện
đại hóa.
Sứ mạng của Trường Đại học Hải Phòng được xác định phù hợp với nhiệm vụ,
với các nguồn lực và định hướng phát triển của Nhà trường; phù hợp và gắn kết với chiến
lược phát triển kinh tế - xã hội của địa phương và của cả nước trong thời kì công nghiệp
hoá, hiện đại hoá. Sứ mạng của Trường Đại học Hải Phòng là: “Trường Đại Học Hải
Phòng là một trong những trung tâm đào tạo đại học đa ngành đa lĩnh vực; là cơ sở
nghiên cứu khoa học, ứng dụng và chuyển giao công nghệ, cung cấp nguồn nhân lực có
chất lượng theo tiêu chuẩn quốc gia và khu vực. phục vụ nhu cầu phát triển kinh tế - xã
hội của thành phố Hải Phòng và các tỉnh duyên hải Bắc bộ và cả nước”.
Trong những năm 2000 2004, mục tiêu của Trường được tập trung vào việc tăng
cường chất lượng đào tạo các ngành sư phạm, cung cấp nguồn nhân lực phục vụ ngành
giáo dục và đào tạo; đồng thời giữ vững chất lượng một số ngành ngoài sư phạm, chuẩn
bị phát triển đa ngành.
Từ năm 2004 đến năm 2007, sứ mạng và mục tiêu của trường xác định phát triển
đào tạo đa ngành cung cấp nguồn nhân lực phục vụ sự nghiệp công nghiệp hoá, hiện đại
hoá, bám sát các mục tiêu phát triển kinh tế xã hội của thành phố Hải Phòng và các tỉnh
đồng bằng duyên hải Bắc bộ.
Từ năm 2007 đến năm 2010, Trường ổn định và phát triển đào tạo đa ngành,
nghề; mở một số ngành đào tạo Sau đại học đồng thời tăng cường phát triển đội ngũ cán
bộ giảng dạy có trình độ Tiến sĩ, Phó Giáo sư, Giáo sư.
Từ năm 2010 đến 2015, trên cơ sở ổn định và phát triển đào tạo, Trường tăng
cường các hoạt động nghiên cứu khoa học, ứng dụng và chuyển giao công nghệ nhằm
nâng cao chất lượng đào tạo và góp phần phát triển kinh tế - xã hội; tiếp tục mở rộng đào
tạo Sau đại học và triển khai đào tạo NCS khi đủ điều kiện.
Mục tiêu phấn đấu của Nhà trường là xây dựng Trường Đại học Hải Phòng trở
thành Trung tâm Giáo dục - Đào tạo, Nghiên cứu khoa học và Chuyển giao công nghệ
vững mạnh vùng duyên hải Bắc bộ.
Thành tích đạt được: Trường Đại học Hải Phòng được Nhà nước trao tặng huân
chương độc lập hạng Ba (Năm 2008), Huân chương lao động hạng nhất (năm 2004); Cờ
thi đua xuất sắc của Chính phủ (Năm 2007). Hàng năm, Nhà trường, các đơn vị trực
thuộc và cá nhân được Nhà nước) Thủ tướng Chính phủ, các cơ quan tổ chức đoàn thể
Trung ương, cán Bộ, UBND Thành phố và các ngành tặng Cờ thi đua. Huân chương,
nhiều Bằng khen và danh hiệu cao quý.
1.3.2 Công tác quản lý dữ liệu khoa học
1.3.2.1 Quy trình nhập tài liệu
- Thời gian: Thực hiện mỗi khi phòng quản lý Khoa học nhập tài liệu mới. Tác giả
chuyển tài liệu của mình tới phòng quản lí Khoa học. Tài liệu chuyển về bao gồm:
Sách, báo, tạp chí, công trình nghiên cứu khoa học, tài liệu điện tử, luận văn,
đồ án, giáo trình, đề cương trong và ngoài trường.
- Tác nhân tham gia vào quá trình nhập tài liệu
Tác giả, Nhân viên quản lý
- Vai trò của quá trình nhập tài liệu:
+ Tăng số lượng tài liệu đáp ứng được nhu cầu của độc giả
+ Nguồn tài liệu phong phú
- Các bước tiến hành
Phân loại tài liệu. Nhân viên quản lý phân tài liệu thành các loại như:
+ Sách
+ Giáo trình
+ Báo, tạp chí
+ Công trình nghiên cứu khoa học
+ Tài liệu điện tử…..
Đánh mã tài liệu: Quản lý thực hiện đánh mã cho từng loại tài liệu bao gồm cả mã
số và mã chữ. Mã được sinh ra không bị trùng lặp. Sau khi đã sinh mã họ sẽ in
mã và gán mã cho từng loại tài liệu.
Đối với tài liệu điện tử: thực hiện phân thành các thư mục cụ thể theo chủ đề, mỗi
tài liệu được lưu trữ riêng biệt ứng với mỗi chủ đề.
1.3.2.2 Quy trình xử lý tài liệu
- Thời gian: Xảy ra khi mỗi khi nhập tài liệu mới, tiến hành kiểm tra vào mỗi
năm.Tài liệu cần xử lý gồm cả tài liệu mới và cũ.
- Tác nhân tham gia vào quá trình xử lý tài liệu
Nhân viên quản lý
- Vai trò của việc xử lý tài liệu
+ Đối với tài liệu mới: Giúp dễ dàng quản lý và tìm kiếm tàiliệu.
+ Đối với tài liệu cũ: Giảm bớt tài liệu không còn sử dụng.
- Các bước tiến hành
+ Đối với tài liệu mới: Thực hiện như quá trình nhập tài liệu
+ Đối với tài liệu cũ: Hàng năm nhân viên quản lý thống kê, kiểm tra sắp xếp
lại các tài liệu.
1.3.2.3 Quy trình tìm kiếm thông tin
- Thời gian: Xảy ra vào bất cứ khi nào có nhu cầu tìm kiếm tài liệu.
- Vai trò của việc tìm kiếm
+ Biết được đầy đủ thông tin về tiêu chí cần tìm
+ Tìm kiếm nhanh, chính xác.
+ Nâng cao hiệu quả làm việc
- Các bước thực hiện: Người dùng lựa chọn các tiêu chí tìm kiếm:
Người dùng lựa chọn tiêu chí tìm kiếm tài liệu.( Nhân viên quản lý, bạn đọc)
+ Tìm theo dạng tài liệu: Sách, giáo trình, báo - tạp chí, công trình
nghiên cứu khoa học, tài liệu điện tử,... Người dùng căn cứ vào danh sách quản lý tài liệu
lựa chọn dạng tài liệu cần tìm kiếm.
+ Tìm tài liệu theo ngành: Căn cứ vào danh sách tài liệu theo từng ngành, theo
từng chuyên ngành.
+ Người dùng tìm theo tên, tác giả, nhà xuất bản…Danh sách quản lý tài liệu cung
cấp các thông tin liên quan về tài liệu giúp người dùng trong quá trình tìm kiếm.
+ Người dùng có thể kết hợp nhiều tiêu chí tìm kiếm: Tìm theo dạng tài
liệu, theo ngành, theo tên…Quá trình tìm kiếm cho biết được đầy đủ thông tin của tài
liệu đó như: Tên, mã, nhà xuất bản, năm xuất bản, ngành… Ngoài ra còn cho biết số
lượng của tài liệu, số lượng còn và vị trí của tài liệu đó.
1.3.3 Đánh giá thực trạng và lựa chọn giải pháp
Ở bất cứ một trường đại học nào cũng đều có hai nhiệm vụ chính và quan trọng
nhất là: đào tạo và NCKH. Đây là hai hoạt động có mối quan hệ hữu cơ, hai nhiệm vụ cơ
bản chiến lược của nhà trường, trong đó việc giảng viên, sinh viên trong nhà trường tích
cực tham gia các hoạt động NCKH là một trong những biện pháp thiết yếu để hướng đến
nâng cao chất lượng đào tạo, đáp ứng tốt hơn nhu cầu ngày càng cao của xã hội. Chúng ta
đều biết rằng, NCKH và giảng dạy có mối quan hệ hữu cơ với nhau, gắn kết chặt chẽ và
hỗ trợ cho nhau. NCKH tạo cơ sở, điều kiện, tiền đề nhằm thực hiện tốt nhiệm vụ giảng
dạy ở trên lớp. Ngược lại, công tác giảng dạy phản ánh kết quả của hoạt động NCKH.
Trong bối cảnh giao lưu và hội nhập của nước ta hiện nay, để khẳng định được
vai trò của NCKH, các trường đại học nói chung và trường Đại học Hải Phòng nói riêng
luôn hướng tới mục tiêu "Mỗi trường đại học là một viện nghiên cứu". Bởi vì, nghiên cứu
khoa học có tầm quan trọng đặc biệt trong giáo dục đại học và đó là con đường hiệu quả
nhất để nâng cao chất lượng đào tạo và phát triển năng lực sư phạm của mỗi người làm
công tác giảng dạy và giáo dục. Là một trường đại học trực thuộc thành phố Hải Phòng,
nên việc đẩy mạnh hoạt động NCKH không chỉ nhằm mục tiêu nâng cao chất lượng đào
tạo, phát triển đội ngũ của nhà trường, mà còn nhằm góp phần phát triển các mục tiêu
kinh tế - xã hội của thành phố. Cũng như các trường đại học địa phương trên cả nước nói
chung, trường Đại học Hải Phòng luôn phát huy vai trò để trở thành trung tâm văn hóa,
giáo dục, khoa học - công nghệ của thành phố và khu vực miền duyên hải.
Với mục tiêu đẩy mạnh hoạt động hội nhập về phát triển khoa học và công nghệ
đáp ứng yêu cầu phát triển kinh tế xã hội của thành phố, nâng cao vị thế khoa học và
công nghệ của Trường Đại học Hải Phòng. Tạo ra một môi trường tương tác qua mạng
Internet cho các tác giả gửi tài liệu, các công trình khoa học một cách dễ dàng thuận lợi,
cho phép biên tập viên nhận nhiệm vụ trực tuyến, có thể làm việc mọi lúc mọi nơi. Đồng
thời tiết kiệm chi phí cho việc quản lý, lưu trữ các công trình khoa học, tạo sự thuận lợi
dễ dàng tìm kiếm các công trình khoa học, thông tin tác giả…để trao đổi và liên hệ. Xuất
phát từ những phân tích trên, để đáp ứng nhu cầu phát triển và xây dựng trường Đại học
Hải Phòng theo định hướng trường học điện tử, nhóm tác giả đã lựa chọn đề tài: “Nghiên
cứu, phát triển hệ thống quản lý cơ sở dữ liệu khoa học trên nền tảng mã nguồn mở
tại trường ĐH Hải Phòng”.
Trong những năm vừa qua, Trường Đại học Hải Phòng đã đạt được nhiều thành
tích đáng kể trong đó có những đóng góp không nhỏ từ hoạt động nghiên cứu khoa học
của đội ngũ cán bộ, giảng viên. Để hoàn thành tốt sứ mệnh của mình, song song với
giảng dạy, nhà trường đặc biệt quan tâm đến hoạt động NCKH, bởi lãnh đạo trường sớm
xác định được đây là hai yếu tố nòng cốt để đánh giá chất lượng của trường Đại học.
Nhằm khắc phục những hạn chế trong quy trình quản lý tài liệu, công trình khoa học thủ
công hiện nay, khắc phục giới hạn về không gian lưu trữ, khó khăn khi tìm kiếm, tra cứu
làm giảm các hoạt động trao đổi và quảng bá thông tin khoa học. Giải pháp được hướng
đến là xây dựng một hệ thống quản lý điện tử để phục vụ tốt cho công tác xử lý và lưu trữ
tài liệu, phục vụ tốt cho hoạt động nghiên cứu và trao đổi học thuật.
1.4 Giới thiệu một số phần mềm mã nguồn mở tiêu biểu
1.4.1 Phần mềm DSpace
DSpace là một bộ phần mềm mã nguồn mở, hỗ trợ giải pháp xây dựng và phân
phối các bộ sưu tập số hóa trên internet, cho phép các thư viện, các cơ quan nghiên cứu
phát triển và mở rộng. Nó cung cấp một phương thức mới trong việc tổ chức và xuất bản
thông tin trên internet.
DSpace do HP và The MIT Libraries phát triển vào năm 2002, hiện nay có hơn
1000 trường đại học và các tổ chức văn hoá sử dụng phần mềm số DSpace để quản lý và
chia sẻ nguồn tài nguyên: sách, tạp chí, luận văn và các sưu tập hình ảnh, âm thanh và
phim...
Hình 1. : Phần mềm mã nguồn mở Dspace
DSpace được sử dụng cơ bản như một phần mềm lưu trữ và phân phối tài liệu số
với ba vai trò chính:
-
Giúp cho việc thu nhận và quản lý tài liệu được dễ dàng, bao gồm siêu dữ
liệu của tài liệu.
-
Giúp cho việc truy cập tài liệu được dễ dàng, bằng cả việc liệt kê và tìm
kiếm.
-
Giúp cho việc bảo quản tài liệu lâu dài.
Một số tính năng nổi bật của DSpace có thể tóm lược như sau:
-
Có cộng đồng người sử dụng và phát triển phần mềm lớn nhất trên toàn thế
giới.
-
Dễ dàng cài đặt trên nhiều hệ điều hành như Windows, Linux/Unix, Mac
OSX (xem hướng dẫn cài đặt trên Windows, Linux/Unix, và Mac OS X.
-
Dễ dàng tùy chỉnh, phát triển và mở rộng để phù hợp với nhu cầu sử dụng.
Giao diện thống nhất chung cho tất cả các bộ sưu tập.
-
Toàn bộ các thao tác (biên mục, tìm kiếm tài liệu, truy cập thông tin, quản trị
v.v.) đều được thực hiện trên nền web. Khi cần bổ sung tài liệu vào các bộ
sưu tập không cần phải xây dựng lại từ đầu như Greenstone.
-
DSpace cho phép xây dựng các bộ sưu tập theo cấu trúc nhiều cấp giúp việc
tổ chức các bộ sưu tập khoa học hơn Greenstone và Omeka.
-
Sử dụng Hệ quản trị cơ sở dữ liệu độc lập (PostgreSQL hoặc Oracle) nên rất
thuận lợi với những đơn vị có số lượng nguồn tài liệu lớn.
-
Khả năng phân quyền mạnh. DSpace cho phép phân quyền đến từng tài
khoản người dùng, từng bộ sưu tập và từng tài liệu. Các quyền được cấu
hình khá chi tiết như quyền xem biểu ghi thư mục, quyền xem toàn văn v.v.
Phần mềm Greenstone và Omeka không cho phép thực hiện các thao tác này.
-
Cho phép thực hiện nhiều thống kê như thống kê lượt truy cập, lượt xem
biểu ghi thư mục, lượt tải tập tin v.v.
-
Hỗ trợ đa ngôn ngữ.
1.4.2 Phần mềm Greenstone
Greenstone là sự tập hợp của nhiều phần mềm thư viện số chúng được xây dựng
và cung cấp cho các trường đại học, các tổ chức trên thế giới hiện nay. Phần mềm cung
cấp và xuất bản thông tin dựa nhiều phương thức mới trên internet hoặc trên dĩa
CDROM. Greenstone là sản phẩm từ dự án của New Zealand Digital Library Project
trường đại học Waikato, và được phát triển và phân phối với từ sự hợp tác của UNESCO
& Human Info NGO, là bộ sản phẩm mã nguồn mở, đa ngôn ngữ, về bản quyền thì tuân
thủ theo GNU General Public.
Hình 1. : Phần mềm mã nguồn mở Greenstone
Greenstone đáp ứng yêu cầu của các thư viện số:
-
Xây dựng các bộ sưu tập tài liệu điện tử từ Internet và các CSDL trực tuyến
dạng đa phương tiện: Sưu tập âm thanh, tranh ảnh, hình ảnh động, hoạt hình,
đồ hình, toàn văn.
-
Xây dựng các sưu tập về các chuyên ngành, bằng cách số hóa các tài liệu
hiện có tại thư viện: Sách, tạp chí, luận văn, báo cáo khoa học, đề tài nghiên
cứu khoa học, bài giảng, giáo trình, vv… với Sưu tập toàn văn.
-
Xây dựng CSDL Sưu tập dạng thư tịch biên mục theo Dublin Core hay
MARC 21.
-
Hỗ trợ thực hành xây dựng sưu tập và biên mục Dublin Core và MARC 21
của Greenstone bằng công cụ Librarian Interface.
-
Greenstone có thể tích hợp vào phần mềm quản lý thư viện có sẵn.
-
Greenstone có thể được phát triển thành một phần mềm quản lý thư viện
hoàn chỉnh theo yêu cầu của từng thư viện.
1.4.3 Phần mềm Omeka
Omeka là một dự án của Trung tâm Lịch sử và Truyền thông Mới Roy
Rosenzweig (Roy Rosenzweig Center for History and New Media) tại Đại học George
Mason. Đây là phần mềm mã nguồn mở trên nền web, linh hoạt cho việc hiển thị các bộ
sưu tập hoặc triển lãm của thư viện, bảo tàng và các cơ quan lưu trữ.
Với mục tiêu hướng đến người dùng không phải là chuyên gia công nghệ thông
tin, Omeka được đánh giá có thiết kế đơn giản, dễ sử dụng, mang tính ổn định và bền
vững, người dùng tập trung vào nội dung và cách hiển thị tài liệu hơn là lập trình. Omeka
có nhiều tính năng hỗ trợ tích cực cho công tác của cán bộ thư viện, chuyên gia lưu trữ,
chuyên viên bảo tàng hoặc các học giả.
Hình 1. : Phần mềm mã nguồn mở Omeka
Một số tính năng của Omeka như sau:
-
Mã nguồn mở, miễn phí, thích hợp cho việc xuất bản các bộ sưu tập số của
thư viện, bảo tàng, các cuộc triễn lãm, hoặc tài liệu giảng dạy
-
Tích hợp công nghệ Web 2.0 tạo điều kiện thuân lợi cho việc tương tác và
tham gia của người dùng.
-
Hỗ trợ Unicode (UTF-8) cho phép hiển thị đúng các ký tự khoa học trên
trình duyệt web.
-
Cho phép xây dựng bộ sưu tập trên 100.000 mục tài liệu trong giới hạn dung
lượng của server lưu trữ.
-
Dễ dàng tùy chỉnh Web, hỗ trợ tương tác để trao đỗi dữ liệu giữa các trang
Web của Omeka.
-
Dùng chuẩn mô tả Dublin Core và cho phép thêm vào các trường mô tả phù
hợp với dữ liệu của bộ sưu tập của từng đơn vị.
-
Cho phép lưu trữ tất cả các dạng file như hình ảnh, file video, audio, tài liệu
nhiều trang, file PDF, Power Point…
-
Cài đặt trên hệ điều hành mã nguồn mở Linux.
1.4.4 Phần mềm Koha
Koha là Hệ quản trị thư viện tích hợp – Integrated Library System (ILS) mã
nguồn mở đầu tiên trên thế giới, phát triển ban đầu tại New Zealand bởi Katipo
Communications Ltd và được triển khai vào tháng Giêng năm 2000 cho thư viện
Horowhenua Trust. Koha hiện nay được phát triển bởi cộng đồng những người làm công
nghệ thông tin và thư viện trên toàn thế giới, vì vậy các tính năng của Koha liên tục hoàn
thiện và phát triển mở rộng để đáp ứng nhu cầu của người dùng.
Hình 1. : Phần mềm mã nguồn mở Koha
Về mặt nghiệp vụ, Koha được xây dựng dựa trên các chuẩn chung của hệ thống
thư viện thế giới và sử dụng giao diện web nên đảm bảo khả năng tương tác, tương thích
giữa Koha và các hệ thống khác một cách dễ dàng. Koha bao gồm các phân hệ OPAC,
Lưu thông, Biên mục, Bổ sung, Ấn phẩm định kỳ, Bạn đọc, Thiết lập hệ thống, các mối
quan hệ chi nhánh và đặc biệt chức năng thống kê, báo cáo hết sức mềm dẻo, tùy biến dễ
dàng đã đưa Koha trở thành Hệ quản trị thư viện tích hợp mã mở nổi tiếng, được nhiều
thư
viện
lớn
nhỏ
trên
thế
giới
sử
dụng.
Koha tự động hóa hoàn toàn các chức năng và quy trình nghiệp vụ trong thư viện...
Các tính năng chính:
-
Đầy đủ tính năng của một Hệ quản trị thư viện tích hợp (ILS) gồm OPAC,
Bổ sung, Biên mục, ÂPĐK, Bạn đọc, Lưu Thông, Thống kê báo cáo, Quản
trị.
-
Giao diện Web được hỗ trợ miễn phí hoàn toàn về cài đặt và bảo quản dữ
liệu.
-
Khổ mẫu nghiệp vụ thư viện chuẩn MARC21, UNIMARC.
-
Đa ngôn ngữ.
-
Không giới hạn người sử dụng.
-
Có giao thức tải bản ghi tự động Z39.50.
-
Tùy biến giao diện OPAC.
-
Đặt mượn và gia hạn trực tuyến.
-
Hệ quản trị cơ sở dữ liệu MYSQL.
-
Xuất nhập bản ghi theo định dạng chuẩn ISO2709
-
Tích hợp nguồn cấp dữ liệu RSS.
-
Gửi e-mail cho độc giả quá hạn và các thông báo đính kèm.
-
Tra cứu mục lục trực tuyến OPAC Web dựa trên hệ thống
-
Tìm kiếm đơn giản, rõ ràng cho tất cả các giao diện người dùng.
1.5 Mục tiêu khoa học của đề tài
1.5.1 Cơ sở phương pháp luận
- Các quan điểm triết học Mác-Lênin là cơ sở chủ yếu.
- Chỉ thị số 296/CT-TTg ngày 27/02/2010 của Thủ tướng Chính phủ về Đổi mới
quản lý Giáo dục đại học giai đoạn 2010-2012.
- Chương trình hành động triển khai thực hiện Nghị quyết số 05-NQ/BCSĐ ngày
06/01/2010 của Ban Cán sự Đảng Bộ Giáo dục và Đào tạo về Đổi mới quản lý Giáo dục
đại học giai đoạn 2010-2012 (phê duyệt kèm theo Quyết định số 179/QĐ-BGDĐT ngày
11/01/2010 của Bộ trưởng Bộ Giáo dục và Đào tạo).
- Chỉ thị số 7823/CT-BGDĐT ngày 27/10/2009 của Bộ trưởng Bộ Giáo dục và
Đào tạo về Nhiệm vụ trọng tâm của Giáo dục đại học năm học 2009-2010
- Lý thuyết phương pháp phân tích thiết kế hệ thống thông tin quản lý và ứng
dụng công nghệ thông tin trong đổi mới phương pháp quản lý.
1.5.2 Các phương pháp nghiên cứu cụ thể
Phương pháp đọc sách và nghiên cứu tài liệu (các tài liệu có liên quan đến đề tài)
để tìm hiểu cơ sở lý luận.
Phương pháp trò chuyện, phỏng vấn: tìm hiểu qui trình nghiệp vụ, yêu cầu của
sinh viên, giảng viên trong quá trình thực hiện các hoạt động về khoa học từ đó đưa ra
giải pháp giải quyết những khó khăn mà các chuyên viên thực hiện gặp phải.
Phương pháp nghiên cứu sản phẩm hoạt động: quan sát, trải nghiệm, đánh giá các
hệ thống cơ sở dữ liệu khoa học của các trường Cao đẳng và Đại học ở trong và ngoài
nước, các hoạt động của các cơ sở dữ liệu khoa học lớn trên thế giới.
1.5.3 Giả thiết khoa học
Đổi mới Giáo dục Đại học trong những năm gần đây đặt ra yêu cầu bức thiết phải
đổi mới phương pháp giảng dạy và học tập. Trung tâm của hoạt động dạy và học không
còn là những người thầy. Vị trí đó được chuyển giao cho sinh viên, học viên. Để hoạt
động giảng dạy và học tập đạt chất lượng cao mỗi giảng viên và sinh viên phải hoàn
thành tốt nhiệm vụ của mình. Trong phương pháp giảng dạy và học tập mới,
nhiệm vụ của giảng viên là cung cấp phạm vi kiến thức, các khái niệm cơ bản, xác định
nội dung tự học và cách học cho sinh viên (nêu ra các vấn đề, câu hỏi, bài tập, các loại tài
liệu sinh viên phải đọc, phải tìm kiếm, bổ sung…). Nhiệm vụ của sinh viên là nhận nội
dung bài tập mà giáo viên giao sau đó tiến hành tự học, tự nghiên cứu theo phạm vi vấn
đề, định hướng câu hỏi của giáo viên. Kết quả của phương pháp giáo dục như vậy sẽ hình
thành cho người học kỹ năng chọn lựa thông tin, phân tích, so sánh, đánh giá tổng hợp
những kiến thức thu thập được để đưa ra những kết luận cần thiết.
Với phương pháp giảng dạy và học tập như thế người học luôn phải chủ động
trong việc chiếm lĩnh các tri thức. Ở mỗi trường đại học, cơ sở dữ liệu khoa học đã đang
và sẽ trở thành một trong những nơi cung cấp tri thức hiệu quả nhất cho sinh viên, giảng
viên trong nghiên cứu khoa học.
1.5.4 Mục tiêu khoa học
Khảo sát qui trình quản lý các công trình khoa học được thực hiện tại Trường Đại
học Hải Phòng. Đánh giá thực trạng qui trình nghiệp vụ và đề ra giải pháp ứng dụng công
nghệ thông tin trong công tác quản lý góp phần đẩy mạnh hoạt động hội nhập về phát
triển khoa học và công nghệ đáp ứng yêu cầu phát triển kinh tế xã hội của thành phố,
nâng cao vị thế khoa học và công nghệ của Trường Đại học Hải Phòng.
Xây dựng và phát triển thành công cơ sở dữ liệu khoa học và công nghệ trường
Đại học Hải Phòng trên nền tảng mã nguồn mở DSPACE. Góp phần nâng cao năng lực
chủ động hội nhập bình đẳng của cộng đồng khoa học và công nghệ nhà trường với cộng
đồng khoa học công nghệ trong nước và quốc tế, đảm bảo nâng cao hiệu quả hoạt động
nghiên cứu khoa học và phát triển công nghệ của Nhà trường trong khu vực và cả nước
trong một số lĩnh vực ưu tiên, trọng điểm.
CHƯƠNG 2: PHÂN TÍCH, THIẾT KẾ HỆ THỐNG QUẢN LÝ
CƠ SỞ DỮ LIỆU KHOA HỌC
2.1 Mô tả bài toán nghiệp vụ
2.1.1 Mô tả bài toán nghiệp vụ
Khi tác giả chuyển tài liệu mới tới phòng quản lý Khoa học nhân viên phòng quản
lý Khoa học có nhiệm vụ kiểm tra lại tài liệu. Đối chiếu số lượng, thông tin về tài liệu.
Biên tập viên tiến hành xét duyệt, thông qua các tài liệu đủ tiêu chuẩn. Quản lý lập danh
sách tài liệu đạt tiêu chuẩn theo danh mục; phân loại các tài liệu theo từng chủ đề; Sau
khi được phân loại hợp lý, tài liệu sẽ được đưa đến nơi cất giữ và bảo quản theo danh
sách. Đối với tài liệu điện tử được thực hiện lưu trữ trên máy theo mục lục.
Khi có nhu cầu tìm kiếm tài liệu, người quản lý và độc giả căn cứ vào danh sách tài
liệu đã có để thực hiện tìm kiếm. Lập báo cáo, thống kê số lượng độc giả và tài liệu theo
từng thể loại trong năm.
2.1.2 Các nhóm chức năng của hệ thống
Các nhóm chức năng của hệ thống có thể chia làm các nhóm chức năng chính như
sau:
a) Nhóm chức năng quản lí hệ thống: Đăng ký; Cập nhật user
b) Nhóm chức năng quản lý tài liệu: Cập nhật tài liệu; Tìm kiếm tài liệu
c) Nhóm chức năng phục vụ độc giả: Đăng nhập; Tra cứu
d) Nhóm chức năng thống kê: Thống kê độc giả; Thống kê tài liệu
2.1.3 Xác định tác nhân nghiệp vụ
Các tác nhân trong hệ thống quản lý cơ sở dữ liệu Khoa học gồm:
-
Quản trị website: Đóng vai trò cài đặt, cấu hình và quản lý người dùng trong
hệ thống. Thiết lập cơ sở dữ liệu, phân loại và lưu trữ các tài liệu theo từng
chủ đề.
-
Quản lý: Chịu trách nhiệm quản lý từng Đơn vị/Bộ sưu tập được quyền chỉnh
sửa các thông tin về Đơn vị/Bộ sưa tập. Thêm, xóa, sửa các tài liệu thuộc về
Đơn vị/Bộ sưu tập đó.
-
Tác giả: Gửi tài liệu lên website, cung cấp các thông tin liên quan về tài liệu.
-
Biên tập: Kiểm tra, đối chiếu thông tin về tài liệu. Xét duyệt tài liệu được gửi
lên hệ thống.
-
Bạn đọc: Khai thác thông tin dữ liệu và sử dụng website
2.2 Phân tích thiết kế theo quy trình nghiệp vụ
2.2.1 Sơ đồ Usecase nghiệp vụ
Hình 2. : Sơ đồ Usecase nghiệp vụ
2.2.2 Đặc tả Usecase nghiệp vụ
3.2.2.1 Usecase nghiệp vụ “Gửi bài”.
Hình 2. : Usecase nghiệp vụ gửi bài
a) Đăng nhập hệ thống: Tác giả đăng nhập vào hệ thống, sau đó truy nhập tới
trang cá nhân, bắt đầu việc tải tài liệu mới lên website.
b) Gửi bài: Tác giả thực hiện các bước và các yêu cầu để hoàn thành thao tác nộp.
Các bước không bắt buộc phải hoàn thành và tác giả có thể quay trở lại để tiếp tục sau.
3.2.2.2 Usecase nghiệp vụ “Xét duyệt”.
Hình 2. : Usecase nghiệp vụ xét duyệt
a) Email thông báo của hệ thống: Hệ thống gửi email thông báo nhiệm vụ cho
biên tập viên kèm theo thông tin về tài liệu.
b) Thực hiện nhiệm vụ xét duyệt: Biên tập viên sau khi đăng nhập vào hệ thống
tới trang cá nhân, thực hiện nhiệm vụ xét duyệt tài liệu được giao.
3.2.2.3 Usecase nghiệp vụ “Lưu trữ”.
Hình 2. : Usecase nghiệp vụ lưu trữ
a) Sắp xếp mục lục: Quản lý sau khi đăng nhập, tới trang bộ sưu tập. Quản lý có
quyền chỉ định người tải tài liệu lên, bỏ tài liệu, quy định chính sách siêu dữ liệu, sắp xếp
mục lục các tài liệu trong bộ sưu tập. Quản lý có thể sắp xếp tài liệu từ những bộ sưu tập
khác vào bộ sưu tập.
b) Lưu trữ bộ sưu tập: Quản lý sau khi hoàn thành việc chỉnh sửa, sắp xếp mục
lục, sẽ tiến hành cập nhật bộ sưu tập để lưu trữ trên hệ thống.
2.2.3 Hiện thực hóa các Usecase nghiệp vụ
2.2.3.1 Trình gửi bài
a) Biểu đồ hoạt động (Activity Diagram).
Hình 2. : Biểu đồ hoạt động gửi bài
b) Biểu đồ tuần tự (Sequence Diagram)
Hình 2. : Biểu đồ tuần tự gửi bài