Tải bản đầy đủ (.pdf) (3 trang)

Làm giàu thông tin kho dữ liệu tài sản thông qua dữ liệu tri thức trực tuyến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (835.08 KB, 3 trang )

8

Journal of Transportation Science and Technology, Vol 21, Nov 2016

LÀM GIÀU THÔNG TIN KHO DỮ LIỆU TÀI SẢN THÔNG QUA
DỮ LIỆU TRI THỨC TRỰC TUYẾN
ENRICHING PROPERTY DATA WAREHOUSE BY MEANS OF ONLINE
KNOWLEDGE DATA
Lê Quốc Tuấn1, Bùi Dương Thế2
Khoa Công nghệ thông tin – Đại học Giao thông vận tải Tp. Hồ Chí Minh
2
Trung tâm Dữ liệu và CNTT – Đại học Giao thông vận tải Tp. Hồ Chí Minh
1

Tóm tắt: Hiện nay, việc quản lý danh mục tài sản tại Trường Đại học Giao thông vận tải Thành
phố Hồ Chí Minh (ĐH GTVT TP.HCM) vẫn dùng dưới dạng thủ công thông qua sổ sách và lưu dữ
liệu dạng bảng Excel, do vậy rất khó khăn cho việc tra cứu thông tin, chuyển thiết bị từ nơi này qua
nơi khác, theo dõi để thanh lý, nhất là các danh mục thiết bị có nhiều thành phần cấu thành như máy
tính. Bài báo này đề xuất một mô hình để xây dựng một hệ thống và kết nối đến kho dữ liệu tri thức
trực tuyến để làm giàu thêm thông tin về tài sản nhằm nâng cao công tác quản lý và vận hành các tài
sản trong Trường cho hiệu quả.
Từ khóa: Kho dữ liệu tri thức, dữ liệu liên kết, hệ hỗ trợ ra quyết định, hệ tư vấn.
Abstract:. Property portfolio at University of Transport in Ho Chi Minh city is currently being
managed by means of books and Excel, which makes it difficult to look up property-related
information, to transfer property from one place to another or to follow the property up for
liquidation. It is even more difficult if the property is multi - component equipment like computers.
This paper is meant to propose a model that can link to knowlegde database to enrich information
which is specially made to improve the efficiency of the property management and operation at the
university.
Keywords: Knowlegde database, linked data, making a decision system, recommender system.


1. Giới thiệu
Ngày nay, Internet đã phát triển rộng
khắp và mang tính toàn cầu. Nó mang lại các
lợi ích lớn về mọi mặt. Nên dần dần các ứng
dụng chạy trên nền web ngày càng thay thế
dần các ứng dụng chạy tại máy tính cá nhân,
đáp ứng được nhu cầu sử dụng mọi lúc mọi
nơi thông qua môi trường Internet. Trong bài
báo này, chúng tôi đề xuất một mô hình cho
quản lý tài sản và xây dựng hệ thống quản lý
tài sản cho Trường ĐH GTVT TP.HCM. Hệ
thống này được kết nối trực tiếp đến kho tri
thức [1, 2] nhằm làm giàu thêm thông tin cho
kho dữ liệu tài sản giúp cho việc tổ chức,
quản lý và tra cứu tài sản tiện lợi.
2. Cơ sở lý thuyết và các vấn đề liên
quan
2.1. Kho dữ liệu tri thức DBpedia
DBpedia [3] là một dự án nhắm đến việc
trích xuất dữ liệu cấu trúc từ các thông tin
được tạo nên từ một phần của dự án
Wikipedia. Cấu trúc thông tin này được xây
dựng sẵn có trên World Wide Web [4].
DBpedia cho phép người dùng truy vấn các

quan hệ và thuộc tính liên quan đến tài
nguyên Wikipedia, bao gồm các liên kết tới
dữ liệu liên kết. DBpedia được mô tả bởi Tim
Berners - Lee là một phần nổi tiếng của dự
án dữ liệu liên kết.

2.2. Ngôn ngữ truy vấn SPARQL
SPARQL [5] là ngôn ngữ truy vấn có
tính chất đồ thị giúp chia sẻ thông tin dữ liệu
theo hướng thông minh. Đây là ngôn ngữ
được Wikipedia đang sử dụng. Khi nghiên
cứu web ở tầm cao, vấn đề gặp phải là làm
sao để các hệ thống web hiểu được ngôn ngữ
cấu trúc thông tin để đưa ra kết quả cuối
cùng.

Hình 1. Thể hiện truy vấn về tên và email của một
người trong tập dữ liệu.


TẠP CHÍ KHOA HỌC CÔNG NGHỆ GIAO THÔNG VẬN TẢI, SỐ 21-11/2016

Như vậy thông thường chúng ta có cơ sở
dữ liệu SQL, MySQL. Nên người ta chuyển
về dạng XML, JSON, JSONP nhằm giúp các
web khác có thể lấy thông tin, từ đó xây
dựng nên các dòng ngôn ngữ truy vấn lấy tin
ở các server khác. Có nhiều phương pháp
khác nhau để lấy dữ liệu này như Web
Service, RSS, bóc tách HTML, 3 phương
pháp này vẫn chưa đủ tầm để chia sẻ dữ liệu
thông minh. Sau đó người ta phát triển rất
nhiều phương pháp như: JSON/JSONP,
AJAX Cross-domain, SPARQL, Web
Semantic, ... để đảm bảo chia sẻ dữ liệu với
nhau với dạng tối ưu nhất.

Ví dụ như khi tìm kiếm cụm từ Việt
Nam trên wikipedia thì sẽ trỏ về các cơ sở dữ
liệu đặt tại server khác nhau như: Địa lý Việt
Nam, con người Việt Nam, ngôn ngữ Việt
Nam và từ đó thu thập thành thông tin là bài
viết về Việt Nam.
2.3. Dữ liệu liên kết
Dữ liệu liên kết (linked data) [6] mô tả
một phương thức tạo ra dữ liệu có cấu trúc để
liên kết được với nhau và trở nên có ích. Dữ
liệu liên kết được xây dựng dựa trên các tiêu
chuẩn công nghệ Web như HTTP và URI để
mở rộng khả năng chia sẻ thông tin theo cách
có thể được đọc tự động từ các máy. Điều
này cho phép các nguồn tài nguyên khác
nhau được kết nối và truy vấn.

9

viện [7] cho phép các bệnh viện quản lý tài
sản thiết bị một cách dễ dàng. Với nhiều
chức năng hữu dụng và tiện lợi trong việc
quản lý và vận hành như: nhật ký luân
chuyển tài sản, theo dõi tình trạng tài sản.
Phần mềm quản lý tài sản thiết bị
CNS.IMS [8] và (ATS.NET) [9] được thiết
kế nhằm tăng hiệu quả khai thác tài sản của
tổ chức, doanh nghiệp giúp nâng cao hiệu
quả hoạt động sản xuất kinh doanh, giảm chi
phí, bảo vệ đầu tư và tăng khả năng cạnh

tranh của tổ chức, doanh nghiệp.
Các hệ thống này đều đáp ứng tốt nhu
cầu quản lý theo từng đơn vị nhưng chỉ hoạt
động độc lập của mỗi đơn vị. Hệ thống quản
lý tài sản mà chúng tôi phát triển sẽ kết nối
đến kho dữ liệu tri thức trực tuyến để làm
giàu thêm thông tin các tài sản mà Nhà
trường quản lý.
3. Mô hình quản lý tài sản
Hệ thống quản lý tài sản là hệ thống
thông tin chạy trên nền Web. Với hệ thống
này, Nhà trường có thể quản lý tất cả các loại
tài sản thiết bị trong Trường.

Hình 3. Mô hình tổng quan về hệ thống.

Hình 2. Thể hiện mối liên kết trong tập dữ liệu liên
kết.

2.4. Các vấn đề liên quan
Trong phần này, chúng tôi sẽ trình bày
các hệ thống liên quan đến hệ thống mà các
nhóm đang phát triển để có sự so sánh với
mô hình hiện tại của Trường ĐH GTVT
TP.HCM. Phần mềm quản lý tài sản bệnh

Quản lý đơn vị cung cấp: Các đơn vị
cung cấp tài sản cho nhà trường đều được hệ
thống lưu lại. Việc này sẽ rất hữu ích cho
phân tích thống kê, đánh giá năng lực, uy tín

cũng như các dịch vụ chăm sóc khách hàng.
Quản lý hãng sản xuất: Mỗi tài sản đều
có thương hiêu của các nhà sản xuất. Thông
tin dữ liệu này cũng được đưa vào hệ thống
để phân tích đánh giá.
Quản lý tài sản: Các loại danh mục tài
sản được định nghĩa và tổ chức quản lý. Các
tài sản phải được phân nhóm để thuận tiện
trong quản lý và thống kê báo cáo sau này.


10

Journal of Transportation Science and Technology, Vol 21, Nov 2016

Quản lý các đơn vị sử dụng tài sản: Mỗi
tài sản sẽ được gán cho một đơn vị sử dụng
trong nhà trường.
Phân tích thống kê báo cáo: Cung cấp
một số mẫu báo cáo giúp cho việc quản lý
nhanh chóng có số liệu để đưa ra các quyết
định đầu tư, mua sắm, thay thế.
3.1. Quản lý dữ liệu tài sản

Hình 4. Một truy vấn đến thiết bị Dell Vostro.

Chúng tôi đã nhập tất cả những thông tin
liên quan vào hệ thống để xây dựng kho dữ
liệu. Tất cả các tài sản được đưa vào hệ thống
này (trừ tài sản cố định).

Khi mỗi tài sản được đưa vào hệ thống,
chúng tôi xác định những thành phần chính
của tài sản này. Những thành phần này sẽ
được kết nối đến các kho dữ liệu tri thức như
Yago3 hay BDPedia để có thêm thông tin về
tài sản này khi cần thiết.
3.2. Phân tích và đánh giá
Chúng tôi đã dùng dữ liệu thật của
Trường ĐH GTVT TP.HCM tính đến thời
điểm hiện nay. Tất cả những dữ liệu này
đang được quản lý bằng file excel nên chúng
tôi đã thực hiện việc nhập liều bằng tay để
đưa vào hệ thống.
Dữ liệu này đã được phân thành nhiều
nhóm chức năng khác nhau như: Máy chiếu;
máy tính để bàn; máy tính sách tay; bàn làm
việc; ghế làm việc; máy lạnh... Nếu việc phân
nhóm này càng chi tiết và càng đúng tính
chất của công việc thì hệ thống càng phát huy
được những ưu điểm của nó.

Hệ thống đã hoạt động tốt và sử dụng rất
tiện lợi. Muốn biết thông tin tài sản của đơn
vị nào là có được thống kê nhanh chóng. Đặc
biệt thông tin lưu lại lịch sử của tài sản giúp
các đơn vị sử dụng cũng như đơn vị quản lý
hiểu rất rõ về những tài sản đó.
4. Kết luận
Bài báo đã đề xuất được mô hình và xây
dựng được một hệ thống quản lý tài sản thiết

bị cho Trường ĐH GTVT TP.HCM. Hệ
thống đáp ứng được tính đặc thù của Trường
và sẽ được xây dựng dựa trên những nhu cầu
của Nhà trường và xã hội. Về cơ bản, hệ
thống có thể đưa vào sử dụng chính thức.
Tuy nhiên, hệ thống quản lý tài sản này
vẫn còn nhiều hướng có thể được mở rộng
và phát triển thêm nhằm đáp ứng nhu cầu
hiện tại tốt nhất. Dưới đây là một vài đề xuất
để có thể mở rộng cho hệ thống:
- Quản lý thiết bị theo mã vạch.
- Phân cấp quản lý xuống từng đơn vị cơ
sở trực thuộc trong Nhà trường. Cho phép
báo hư báo hỏng trên hệ thống này.
- Bổ sung thêm quản lý tài sản cố định.
Bài báo là kết quả của đề tài “Xây dựng
phần mềm quản lý tài sản cho Trường ĐH
GTVT TP.HCM” mã số KH14202
Tài liệu tham khảo
[1] Mahdisoltani, F., J. Biega, and F. Suchanek. Yago3: A
knowledge base from multilingual wikipedias. in 7th
Biennial Conference on Innovative Data Systems
Research. 2014. CIDR Conference.
[2] />[3] "Dbpedia.org on Alexa". Alexa Internet. Amazon.com.
Retrieved 7 September 2016.
[4] Bizer, C., et al., DBpedia-A crystallization point for the
Web of Data. Web Semantics: science, services and
agents on the world wide web, 2009. 7: p. 154-165.
[5] />[6] Bizer, C., T. Heath, and T. Berners-Lee, Linked datathe story so far. Semantic Services, Interoperability and
Web Applications: Emerging Concepts, 2009: p. 205227.

[7] />[8] .
[9] />
Ngày nhận bài: 3/10/2016
Ngày chuyển phản biện: 6/10/2016
Ngày hoàn thành sửa bài: 27/10/2016
Ngày chấp nhận đăng: 3/11/2016



×