ĐÀ NẴNG, 10/2014
ĐỀ TÀI
NGHIÊN CỨU WEB NGỮ NGHĨA VÀ ỨNG
DỤNG TRONG TRỢ GIÚP TÌM KIẾM VĂN BẢN
NGHIỆP VỤ HÀNH CHÍNH
GVHD: TS PHẠM ANH PHƯƠNG
HỌC VIÊN: NGUYỄN ĐOÀN ANH VŨ
BÁO CÁO LUẬN VĂN
NỘI DUNG BÁO CÁO
1
TỔNG QUAN VỀ SEMANTIC WEB
2
GIẢI PHÁP XÂY DỰNG HỆ THỐNG TÌM
KIẾM VĂN BẢN
3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN KHAI
ỨNG DỤNG
Vai trò của semantic web.
Lợi ích của semantic web mang lại.
Tính cấp thiết của đề tài.
MỞ ĐẦU
1
TỔNG QUAN VỀ SEMANTIC WEB
Semantic web
Theo Tim Berners-Lee, Semantic web là sự mở rộng
của web hiện tại…. Kiến trúc của Semantic web có 7 lớp:
- Lớp URI, Unicode
- Lớp XML
- Lớp RDF
- Lớp Ontology
- Lớp Logic
- Lớp Proof
- Lớp Trust
Lớp URI, Unicode: đây là lớp cơ bản định dạng xử lý…
Lớp XML: là ngôn ngữ đánh dấu mở rộng, dùng để lưu trữ
dữ liệu.
Lớp RDF: Là cấu trúc dữ liệu biểu diễn ngữ nghĩa.
Lớp Ontology: Là cấu trúc dữ liệu biểu diễn ngữ nghĩa
nâng cao.
Lớp logic: biểu diễn tài nguyên dưới dạng từ vựng.
Lớp Proof: đưa ra các luật để suy luận.
Lớp Trust: Đảm bảo tính tin cậy của các ứng dụng.
1
TỔNG QUAN VỀ SEMANTIC WEB
Lý thuyết về Search Engine
-
Các bộ phận cấu thành hệ thống:
•
Robot – Bộ thu thập thông tin
•
Index – Bộ lập chỉ mục
•
Search engine – Bộ tìm kiếm thông tin
1
TỔNG QUAN VỀ SEMANTIC WEB
Lý thuyết về hệ hỏi - đáp
- Hệ thống hỏi đáp tự động (QA) liên quan đến 3 vấn
đề:
•
Xử lý ngôn ngữ tự nhiên (Natural Language
Processing-NLP)
•
Tìm kiếm thông tin (Information Retrieval-IR)
•
Rút trích thông tin (Information Extraction-IE)
1
TỔNG QUAN VỀ SEMANTIC WEB
1
TỔNG QUAN VỀ SEMANTIC WEB
Lý thuyết về hệ hỏi - đáp
- Kiến trúc
Giới thiệu về hệ thống tìm kiếm văn bản trong ngành giáo
dục
Có 4 phong cách thiết kế website
-
Phong cách cổ điển
-
Phong cách bán cổ điển
-
Phong cách hiện đại
-
Phong cách semantic web
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN
Ý tưởng về hệ thống tìm kiếm văn bản
Các ngôn ngữ xây dựng ontology tìm kiếm văn bản
RDF (Resource Description Framework)
RDFS (RDF-Schema)
OWL (Ontology Web Language)
DAML + OIL (DARPA Agent Markup Lanquage +
Ontology Inference Layer)
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN
Phương pháp thu thập, trích rút thuộc tính tự động
Công cụ, môi trường, thư viện và ngôn ngữ
-
Công cụ xây dựng ontology – Protégé
-
Thư viện SemWeb
-
Giao diện lập trình ứng dụng OwlDotNetApi
-
Hệ truy vấn SPARQL
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN
Mô hình hệ thống tìm kiếm văn bản trong ngành
giáo dục
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN
3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG
Phân tích hệ thống tìm kiếm.
Phân tích chức năng tìm kiếm của hệ thống
-
Duyệt theo ngữ nghĩa
-
Tìm kiếm theo từ khóa
-
Tìm kiếm nâng cao
3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG
Các quyền của hệ thống tìm kiếm
3
STT Đối tượng Mô tả
1 Admin
Có thể import và chỉnh sửa thông tin văn bản
(yêu cầu phải đăng nhập vào phần quản trị).
2 User Tìm kiếm thông tin văn bản giáo dục
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG
Thiết kế Ontology
Xác định miền quan tâm và phạm vi của ontology
Xem xét việc kế thừa các ontology có sẵn
Liệt kê các thuật ngữ quan trọng trong ontology
Xây dựng các lớp và cấu trúc lớp phân cấp
Định nghĩa các thuộc tính và quan hệ cho lớp
Định nghĩa các ràng buộc về thuộc tính và quan hệ của lớp
Tạo các thực thể cho lớp
3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG
Thiết kế mô hình dữ liệu Ontology
3
Van_ban
Ten_loai_van_ban
Ten_linh_vuc
Trich_luoc_noi_dung
Ten_ca_nhan
Ten_co_quan
Loai_thoi_gian
Loai_van_ban
Co_quan
Linh_vuc
Noi_dung
Ca_nhan
Thoi_gian
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG
Trang chủ của hệ thống
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH
Màn hình hiển thị tất cả kết quả tìm kiếm.
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH
Màn hình hiển thị văn bản chính xác
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH
Màn hình hiển thị thông tin tác giả
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH
Đánh giá mô hình
-
Website đã có thể cho phép người dùng tìm kiếm văn bản
giáo dục chính xác hơn
-
Việc truy vấn này không tìm theo dữ liệu thuần túy
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH
Kết luận.
Hướng phát triển
- Xây dựng hệ thống tự động dò tìm các trang web và
thực hiện bóc tách thông tin tự động
- Mở rộng quy mô Ontology ra cả nước
- Tiếp tục hoàn thiện các chức năng dự kiến
- Phát triển website thành một hệ thống đầy đủ nhất, có
tính tương tác với người dùng cao nhất trong lĩnh vực giáo
dục.
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
KẾT THÚC BÁO CÁO
XIN CẢM ƠN THẦY VÀ CÁC BẠN