Tải bản đầy đủ (.pdf) (4 trang)

Đề xuất mô hình tổ chức quản lý kho dữ liệu công trình khoa học và công nghệ tại trường đại học giao thông vận tải thành phố Hồ Chí Minh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (743.72 KB, 4 trang )

TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016

3

ĐỀ XUẤT MÔ HÌNH TỔ CHỨC QUẢN LÝ KHO DỮ LIỆU CÔNG
TRÌNH KHOA HỌC VÀ CÔNG NGHỆ TẠI TRƯỜNG ĐẠI HỌC
GIAO THÔNG VẬN TẢI THÀNH PHỐ HỒ CHÍ MINH
PROPOSED ORGANIZATIONAL MODEL DATA STORAGE MANAGEMENT
PROJECTS THE SCIENCE AND TECHNOLOGY IN HO CHI MINH CITY
UNIVERSITY OF TRANSPORT
Vũ Ngọc Bích(1), Đặng Nhân Cách(2), Hồ Hải Vinh(3)
Phòng Khoa học công nghệ - Nghiên cứu và Phát triển
(2)
Trung tâm Dữ liệu và Công nghệ thông tin

(1), (3)

Tóm tắt: Trong những năm qua, công tác nghiên cứu khoa học, xuất bản tạp chí, viết giáo giáo
trình của Trường Đại học Giao thông vận tải Thành phố Hồ Chí Minh đã có những đóng góp đáng kể
vào giải quyết các nhu cầu thực tiễn của Nhà trường, địa phương cũng như Bộ - Ngành. Tuy nhiên,
việc tổ chức quản lý và vận hành chưa hiệu quả. Chúng ta đang lưu trữ bằng file và rải rác ở các đơn
vị khác nhau. Bài viết đề xuất một giải pháp đề xây dựng kho dữ liệu tập trung về quản lý khoa học và
đề xuất một hệ thống để quản lý và vận hành công tác quản lý khoa học công nghệ. Tác giả cũng đề
xuất một số giải pháp để phân tích khai phá kho dữ liệu đề xuất ở trên để nhằm nâng cao chất lượng
công tác nghiên cứu khoa học trong Nhà trường phù hợp với nhu cầu thực tiễn.
Từ khóa: Kho dữ liệu, khai phá dữ liệu, hệ hỗ trợ ra quyết định, hệ tư vấn.
Abstract: Scientific research in universities is among the criteria for assessing the quality of
higher education, especially in the current context. Over the years, the scientific research activity of
Ho Chi Minh City University of Transport has made a significant contribution to solving the practical
needs of The university, locality as well as ministries - sectors. However, the quantity of research
works hasn’t been corresponding to the potential of our teaching staff, students, and graduate


students. Also, the quality of the studies doesn’t satisfy our desire. The paper outlines the current
status of the scientific research activity at Ho Chi Minh City University of Transport, analyze the
causes, and propose some solutions in order to improve the quality of the scientific research activity at
the university in accordance with practical needs.
Keywords: Data warehouse, data mining, making a decision system, recommender system.

1. Giới thiệu
Trong những năm qua, công tác nghiên
cứu khoa học, xuất bản tạp chí, viết giáo
trình của Trường Đại học Giao thông vận tải
Thành phố Hồ Chí Minh đã có những đóng
góp đáng kể vào giải quyết các nhu cầu thực
tiễn của Nhà trường, địa phương cũng như
Bộ - Ngành. Chiến lược phát triển dài hạn
(2010 - 2020) và tầm nhìn đến năm 2030 [1]
và bài báo [2] cũng đã xác định Nhà trường
cần tăng cường công tác nghiên cứu khoa
học (NCKH) và quản lý khoa học. Tuy
nhiên, hiện này, việc tổ chức quản lý và vận
hành là chưa hiệu quả.
Bài viết đề xuất một giải pháp để xây
dựng kho dữ liệu tập trung về quản lý khoa
học và đề xuất một hệ thống để quản lý - vận
hành công tác quản lý khoa học công nghệ.
Tác giả cũng đề xuất một số giải pháp để
phân tích khai phá kho dữ liệu đề xuất ở trên

để nhằm nâng cao chất lượng công tác
nghiên cứu khoa học trong Nhà trường phù
hợp với nhu cầu thực tiễn.

2. Cơ sở lý thuyết và các vấn đề liên
quan
2.1. Kho dữ liệu
Kho dữ liệu (Data Warehouse - DW) là
hệ thống cơ sở dữ liệu (kho dữ liệu) máy tính
được thiết kế, sắp xếp có mục đích và định
hướng rõ ràng của một tổ chức nhằm mục
đích quản lý, cung cấp thông tin một cách kịp
thời, chính xác, đồng thời là nền tảng cho
việc xây dựng các ứng dụng phân tích dữ
liệu, hỗ trợ ra quyết định [3].
Theo John Ladley [4], Công nghệ kho
dữ liệu (Data Warehouse Technology) là tập
các phương pháp, kỹ thuật và các công cụ có
thể kết hợp, hỗ trợ nhau để cung cấp thông
tin cho người sử dụng trên cơ sở tích hợp từ


4

Journal of Transportation Science and Technology, Vol 20, Aug 2016

nhiều nguồn dữ liệu, nhiều môi trường khác
nhau.
Trong những năm qua, đặc biệt trong
giai đoạn 2011 - 2015, công tác NCKH của
Nhà trường đã đạt được những kết quả đáng
khích lệ cả về số lượng và chất lượng (bảng

1, 2, 3, 4 và 5), phần nào đáp ứng được nhu

cầu của ngành giao thông vận tải, mặt khác
đã góp phần giải quyết một số vấn đề trong
công tác giảng dạy và học tập cũng như hợp
tác, liên kết quốc tế trong đào tạo của Nhà
trường.

Bảng 1. Số lượng đề tài NCKH giai đoạn 2011-2015.
Năm

Cấp Bộ
07
07
08
06
05

2011
2012
2013
2014
2015

Loại đề tài NCKH/Dự án
Cấp Cơ sở
14
15
24
12
39


Sinh viên
14
16
17
24
16

Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.
Bảng 2. Số cán bộ giảng viên, người học tham gia NCKH giai đoạn 2011-2015.
Năm

Cấp Bộ
85
80
96
76
68

2011
2012
2013
2014
2015

Loại đề tài NCKH/Dự án
Cấp Cơ sở
70
75
120
36

103

Sinh viên
56
62
66
70
58

Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.
Bảng 3. Số bài báo khoa học công bố trên các Tạp chí/Hội nghị, hội thảo khoa học giai đoạn 2011-2015.
Số bài báo khoa học đăng trên tạp chí
khoa học chuyên ngành

Năm

2011
2012
2013
2014
2015

Số bài báo khoa học đăng trong kỷ
yếu hội nghị, hội thảo

Quốc tế

Quốc gia

Quốc tế


Quốc gia

08
08
13
17
23

46
51
89
102
91

14
8
18
13
15

05
13
68
79
105

Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.
Bảng 4. Số giáo trình, bài giảng đăng ký biên soạn giai đoạn 2011-2015.
Loại giáo trình/bài giảng

Năm
2011
2012
2013
2014
2015

Giáo trình

Bài giảng

10
08
04
14
13

02
05
07
28
18

Tài liệu tham khảo/bài
tập
01
01
01

Nguồn: Báo cáo thống kê - phòng KHCN-NC&PT.



TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 20 - 08/2016

5

Bảng 5. Số lượng bài báo đăng trên tạp chí, ấn phẩm xuất bản có chỉ số, giai đoạn 2011-2015.
Loại ấn phẩm
Năm
2011
2012
2013
2014
2015

Tạp chí

Kỷ yếu hội nghị có chỉ số Kỷ yếu hội nghị không có
ISBN
chỉ số ISBN

19
101
118
106
76

45

81

-

Nguồn: Báo cáo thống kế - phòng KHCN-NC&PT.

Việc quản lý các đề tài, bài báo, giáo
trình, tài liệu tham khảo hiện nay chủ yếu là
trên bản cứng, các thông tin đăng tải trên
mạng nội bộ mới chỉ dừng lại ở mức thống
kê. Với tốc độ phát triển ngày càng nhiều đề
tài, công trình nghiên cứu,… thì việc quản lý
và triển khai, khai thác như hiện tại là không
đáp ứng được nhu cầu thực tiễn, mặt khác
việc truy xuất dữ liệu phục vụ báo cáo về
khoa học công nghệ là tốn khá nhiều thời
gian, bất tiện, không khoa học. Vì vậy, việc
xây dựng kho dữ liệu tập trung về quản lý
KHCN là nhu cầu tất yếu để khắc phục
những hạn chế ở trên.
2.2. Khai phá dữ liệu
Khai phá dữ liệu (Data mining) [5] là
quá trình khám phá các tri thức mới và các tri
thức có ích ở dạng tiềm năng trong nguồn dữ
liệu đã có. Khai phá dữ liệu là một bước của
quá trình khai thác tri thức (Knowledge
Discovery Process), bao gồm:
- Xác định vấn đề và không gian dữ liệu
để giải quyết vấn đề (Problem understanding
and data understanding).
- Chuẩn bị dữ liệu (Data preparation),
bao gồm các quá trình làm sạch dữ liệu (data

cleaning), tích hợp dữ liệu (Data integration),
chọn dữ liệu (Data selection), biến đổi dữ
liệu (Data transformation).
- Khai thác dữ liệu (Data mining): Xác
định nhiệm vụ khai thác dữ liệu và lựa chọn
kỹ thuật khai thác dữ liệu. Kết quả cho ta một
nguồn tri thức thô.
- Đánh giá (Evaluation): Dựa trên một số
tiêu chí tiến hành kiểm tra và lọc nguồn tri
thức thu được.
- Triển khai (Deployment).

Quá trình khai thác tri thức không chỉ là
một quá trình tuần tự từ bước đầu tiên đến
bước cuối cùng mà là một quá trình lặp và có
quay trở lại các bước đã qua.
3. Mô hình quản lý khoa học công
nghệ
3.1. Kho dữ liệu Kho dữ liệu
Chúng tôi đã thiết kế mô hình kho dữ
liệu KHCN có cấu trúc, dựa trên những dữ
liệu đang có sẵn của Nhà trường và đưa tất cả
tập trung vào kho dữ liệu này. Tất cả những
yêu cầu truy xuất đến dữ liệu của kho dữ liệu
sẽ cho kết nối theo chuẩn quy định. Ngoài
bốn mô đun chức năng đã được thiết kế để
luôn phục vụ cho công tác quản lý khoa học
chúng tôi còn tạo ra những cổng giao tiếp
riêng cho phép những ứng dụng khác có thể
kết nối vào để truy vấn dữ liệu.


Hình 1. Mô hình kho dữ liệu KHCN.

3.2. Hệ thống quản lý KHCN
- Quản lý đề tài: Cho phép quản lý tất
cả các loại đề tài của CB - CNV trong trường
như: Đề tại cấp sơ cở; đề tại cấp bộ; đề tài
cấp nhà nước….Chức năng này hỗ trợ rất tốt


6

Journal of Transportation Science and Technology, Vol 20, Aug 2016

cho phép chọn lọc những đề tài đã nghiệm
thu, hay chưa nghiệm thu…
- Quản lý tạp chí: Tất cả các bài báo
trong các số tạp chí đều được tổ chức quản lý
theo từng số xuất bản của tạp chí theo định
kỳ. Từ đó, dễ dàng tìm kiếm các bài báo cho
những lúc cần thiết.
- Quản lý bài báo: Tất cả các bài báo
hội nghị, bài báo tạp chí trong nước hay quốc
đề đều được tổ chức cập nhật thường xuyên
thông qua chức năng này.
- Quản lý giáo trình: Quản lý tất cả bài
giảng chi tiết hay giáo trình của Nhà trường
nhằm phục vụ sinh viên…
3.3. Phân tích dữ liệu
Trên cơ sở các mô đun được thiết kế ở

trên cho phép chúng ta tương tác qua kho dữ
liệu như: Thêm, xóa sửa, cập nhật thông tin.
Với dữ liệu ngày càng được cập nhật và thêm
vào, trên cơ sở đó, chúng ta có thể trích xuất
và khai phá, phân tích dữ liệu để hỗ trợ ra
quyết định hay đưa ra tư vấn cho những vấn
đề liên quan đến công tác KHCN. Có thể dựa
trên những thuật toán và đưa ra những thống
kê phân tích tự động nhanh chóng. Hoặc
cũng có thể trích xuất ra và xử dụng những
công cụ hỗ trợ phân tích như Weka [6] để
phân tích.
4. Kết luận
Trong bài báo này, tác giả đã giới thiệu
được mô hình tổng quan trong việc quản lý
và hoạt động KHCN của Nhà trường. Như:
Xây dựng được kho dữ liệu KHCN tập trung;
giới thiệu được hệ thống kết nối đến kho dữ
liệu tập trung này và đưa ra một số giải pháp
để phân tích khai phá dữ liệu khoa học nhằm
phục vụ trong công tác của Nhà trường.

Nếu chúng ta thực hiện đồng bộ các giải
pháp như đã nêu thì chắc chắn, bức tranh
KHCN của Trường ta sẽ ngày càng sáng nét
hơn; những kết quả mà NCKH và chuyển
giao công nghệ tạo ra sẽ chắc chắn có chất
lượng cao, đủ khả năng ứng dụng, góp phần
giải quyết các vấn đề quan trọng của địa
phương, ngành, của quốc gia, mà trước mắt

là góp phần đắc lực nâng cao công tác quản
lý KH CN của Nhà trường
Tài liệu tham khảo
[1] Kế hoạch chiến lược phát triển dài hạn (2010-2020) và
tầm nhìn đến năm 2030, Trường Đại học Giao thông
vận tải Thành phố Hồ Chí Minh.
[2] Vũ Ngọc Bích, Hồ Hải Vinh, Nguyễn Hải Dương,
.Nâng cao chất lượng công tác nghiên cứu khoa học
trong trường đại học Giao thông vận tải Tp. Hồ Chí
Minh, Tạp chí khoa học công nghệ giao thông vận tải,
số 13, tháng 11/2014, trang 03-06.
[3] Nguyễn Vân Anh, Lê Vũ Toàn (2012), Tạp chí hoạt
động khoa học –Bộ KH&CN, số ISSN 1859-4794, số
635, tháng 4/2012, trang 57-60.
[4] Bischoff, J. and T. Alexander, Data warehouse:
practical advice from the experts1997: Prentice-Hall,
Inc.
[5] />[6] />
rning).

Ngày nhận bài: 25/07/2016
Ngày chuyển phản biện: 29/07/2016
Ngày hoàn thành sửa bài: 16/08/2016
Ngày chấp nhận đăng: 23/08/2016



×