Tải bản đầy đủ (.ppt) (24 trang)

Báo cáo luận văn NGHIÊN CỨU WEB NGỮ NGHĨA VÀ ỨNG DỤNG TRONG TRỢ GIÚP TÌM KIẾM VĂN BẢN NGHIỆP VỤ HÀNH CHÍNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (652.74 KB, 24 trang )

ĐÀ NẴNG, 10/2014
ĐỀ TÀI
NGHIÊN CỨU WEB NGỮ NGHĨA VÀ ỨNG
DỤNG TRONG TRỢ GIÚP TÌM KIẾM VĂN BẢN
NGHIỆP VỤ HÀNH CHÍNH
GVHD: TS PHẠM ANH PHƯƠNG
HỌC VIÊN: NGUYỄN ĐOÀN ANH VŨ
BÁO CÁO LUẬN VĂN
NỘI DUNG BÁO CÁO
1
TỔNG QUAN VỀ SEMANTIC WEB
2
GIẢI PHÁP XÂY DỰNG HỆ THỐNG TÌM
KIẾM VĂN BẢN
3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN KHAI
ỨNG DỤNG

Vai trò của semantic web.

Lợi ích của semantic web mang lại.

Tính cấp thiết của đề tài.
MỞ ĐẦU
1
TỔNG QUAN VỀ SEMANTIC WEB

Semantic web
Theo Tim Berners-Lee, Semantic web là sự mở rộng
của web hiện tại…. Kiến trúc của Semantic web có 7 lớp:
- Lớp URI, Unicode


- Lớp XML
- Lớp RDF
- Lớp Ontology
- Lớp Logic
- Lớp Proof
- Lớp Trust

Lớp URI, Unicode: đây là lớp cơ bản định dạng xử lý…

Lớp XML: là ngôn ngữ đánh dấu mở rộng, dùng để lưu trữ
dữ liệu.

Lớp RDF: Là cấu trúc dữ liệu biểu diễn ngữ nghĩa.

Lớp Ontology: Là cấu trúc dữ liệu biểu diễn ngữ nghĩa
nâng cao.

Lớp logic: biểu diễn tài nguyên dưới dạng từ vựng.

Lớp Proof: đưa ra các luật để suy luận.

Lớp Trust: Đảm bảo tính tin cậy của các ứng dụng.
1
TỔNG QUAN VỀ SEMANTIC WEB

Lý thuyết về Search Engine
-
Các bộ phận cấu thành hệ thống:

Robot – Bộ thu thập thông tin


Index – Bộ lập chỉ mục

Search engine – Bộ tìm kiếm thông tin
1
TỔNG QUAN VỀ SEMANTIC WEB

Lý thuyết về hệ hỏi - đáp
- Hệ thống hỏi đáp tự động (QA) liên quan đến 3 vấn
đề:

Xử lý ngôn ngữ tự nhiên (Natural Language
Processing-NLP)

Tìm kiếm thông tin (Information Retrieval-IR)

Rút trích thông tin (Information Extraction-IE)
1
TỔNG QUAN VỀ SEMANTIC WEB
1
TỔNG QUAN VỀ SEMANTIC WEB

Lý thuyết về hệ hỏi - đáp
- Kiến trúc

Giới thiệu về hệ thống tìm kiếm văn bản trong ngành giáo
dục

Có 4 phong cách thiết kế website
-

Phong cách cổ điển
-
Phong cách bán cổ điển
-
Phong cách hiện đại
-
Phong cách semantic web
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN

Ý tưởng về hệ thống tìm kiếm văn bản

Các ngôn ngữ xây dựng ontology tìm kiếm văn bản

RDF (Resource Description Framework)

RDFS (RDF-Schema)

OWL (Ontology Web Language)

DAML + OIL (DARPA Agent Markup Lanquage +
Ontology Inference Layer)
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN

Phương pháp thu thập, trích rút thuộc tính tự động

Công cụ, môi trường, thư viện và ngôn ngữ

-
Công cụ xây dựng ontology – Protégé
-
Thư viện SemWeb
-
Giao diện lập trình ứng dụng OwlDotNetApi
-
Hệ truy vấn SPARQL
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN

Mô hình hệ thống tìm kiếm văn bản trong ngành
giáo dục
2
GIẢI PHÁP XÂY DỰNG HỆ
THỐNG TÌM KIẾM VĂN BẢN
3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG

Phân tích hệ thống tìm kiếm.

Phân tích chức năng tìm kiếm của hệ thống
-
Duyệt theo ngữ nghĩa
-
Tìm kiếm theo từ khóa
-
Tìm kiếm nâng cao

3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG

Các quyền của hệ thống tìm kiếm
3
STT Đối tượng Mô tả
1 Admin
Có thể import và chỉnh sửa thông tin văn bản
(yêu cầu phải đăng nhập vào phần quản trị).
2 User Tìm kiếm thông tin văn bản giáo dục
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG

Thiết kế Ontology

Xác định miền quan tâm và phạm vi của ontology

Xem xét việc kế thừa các ontology có sẵn

Liệt kê các thuật ngữ quan trọng trong ontology

Xây dựng các lớp và cấu trúc lớp phân cấp

Định nghĩa các thuộc tính và quan hệ cho lớp

Định nghĩa các ràng buộc về thuộc tính và quan hệ của lớp

Tạo các thực thể cho lớp


3
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG

Thiết kế mô hình dữ liệu Ontology
3
Van_ban
Ten_loai_van_ban
Ten_linh_vuc
Trich_luoc_noi_dung
Ten_ca_nhan
Ten_co_quan
Loai_thoi_gian
Loai_van_ban
Co_quan
Linh_vuc
Noi_dung
Ca_nhan
Thoi_gian
THIẾT KẾ HỆ THỐNG VÀ TRIỄN
KHAI ỨNG DỤNG

Trang chủ của hệ thống
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH

Màn hình hiển thị tất cả kết quả tìm kiếm.
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH


Màn hình hiển thị văn bản chính xác
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH

Màn hình hiển thị thông tin tác giả
3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH

Đánh giá mô hình
-
Website đã có thể cho phép người dùng tìm kiếm văn bản
giáo dục chính xác hơn
-
Việc truy vấn này không tìm theo dữ liệu thuần túy

3
THỬ NGHIỆM VÀ ĐÁNH GIÁ MÔ HÌNH

Kết luận.

Hướng phát triển
- Xây dựng hệ thống tự động dò tìm các trang web và
thực hiện bóc tách thông tin tự động
- Mở rộng quy mô Ontology ra cả nước
- Tiếp tục hoàn thiện các chức năng dự kiến
- Phát triển website thành một hệ thống đầy đủ nhất, có
tính tương tác với người dùng cao nhất trong lĩnh vực giáo
dục.
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
KẾT THÚC BÁO CÁO

XIN CẢM ƠN THẦY VÀ CÁC BẠN

×