Tải bản đầy đủ (.pdf) (17 trang)

TÌM HIỂU ONTOLOGY XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (880.83 KB, 17 trang )

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐÀO TẠO SAU ĐẠI HỌC
oOo











TIỂU LUẬN
HỌC PHẦN: WEB VÀ CÁC DỊCH VỤ THẾ HỆ MỚI (IT6210)

ĐỀ TÀI: TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY
TRONG LĨNH VỰC Y TẾ







GVHD: TS. Phạm Huy Hoàng
Nhóm thực hiện: Nguyễn Xuân Thịnh. MS: CB120150
Hoàng Văn Hải. MS: CB120133
Lớp: 12BMTT
Hệ: Thạc sỹ kỹ thuật












Hà Nội, 02/2013
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
1
MỤC LỤC

MỤC LỤC 1
LỜI NÓI ĐẦU 2
CHƯƠNG 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA 3
1.1 Công nghệ Web hiện tại và những hạn chế 3
1.2 Web có ngữ nghĩa 3
1.3 Kiến trúc của Web ngữ nghĩa 4
1.4 Vai trò của các tầng trong Web ngữ nghĩa 4
1.4.1 Tầng định danh tài nguyên-URI 4
1.4.2 Tầng XML và XML Schema 4
1.4.3 Tầng RDF - RDF Schema 4
1.4.4 Tầng Ontology 5
1.4.5 Tầng logic 5
1.4.6 Tầng Proof 5
1.4.7 Tầng Trust 5
CHƯƠNG 2: ONTOLOGY VÀ PHƯƠNG PHÁP XÂY DỰNG ONTOLOGY 6

2.1 Giới thiệu Ontology 6
2.1.1 Khái niệm Ontology 6
2.1.2 Các thành phần của Ontology 6
2.1.3 Vòng đời của Ontology 7
2.2 Phương pháp xây dựng Ontology 8
2.2.1 Xây dựng Ontology 8
2.2.2 Ngôn ngữ xây dựng Ontology 8
2.2.3 Công cụ xây dựng Ontology 9
CHƯƠNG 3: XÂY DỰNG ONTOLOGY VỀ LĨNH VỰC Y TẾ.THIẾT KẾ DỰA TRÊN PROTÉGÉ. 10
3.1 Tìm hiểu yêu cầu 10
3.2 Xây dựng Ontology 10
3.3 Kết quả thiết kế Ontology dựa trên protégé 12
KẾT LUẬN 15
TÀI LIỆU THAM KHẢO 16


TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
2
LỜI NÓI ĐẦU

World Wide Web (WWW) có thể được coi là một trong những phát minh quý báu
của nhân loại, www cho phép con người có thể dễ dàng tiếp xúc được với nền tri thức của
nhân loại, nó giống như một kho dữ liệu mở để con người có thể khai thác.Thực tế mà xét
thì lượng dữ liệu trên web là vô cùng lớn, con người muốn khai thác được thông tin từ
lượng dữ liệu đó cũng không phải là việc dễ dàng.Với mong muốn xây dựng một thế hệ
web mới tổ chức W3C đã đề xuất một thế hệ web mới, web ngữ nghĩa.Web ngữ nghĩa là
một thế hệ web cải tiến so với web hiện tại , trong đó dữ liệu trên web được tổ chức để
không chỉ con người mới có thể tìm thấy được thông tin mà ngay cả máy móc cũng có
thể hiểu được về chúng.Trong ý tưởng về web ngữ nghĩa thì các thực thể trên web được
định nghĩa, các ràng buộc giữa chúng được cấu trúc lại dựa trên mô hình biểu diễn ngữ

nghĩa.
Trong hệ thống Web ngữ nghĩa thì ontology là trái tim của hệ thống, một
ontologylà một mô hình dữ liệu biểu diễn một lĩnh vực và được sử dụng để suy luận về
các đối tượng trong lĩnh vực đó và mối quan hệ giữa chúng.Ontology cung cấp một bộ từ
vựng
chung bao gồm các khái niệm, các thuộc tính quan trọng và các định nghĩa về các khái
niệm và các thuộc tính này. Ngoài bộ từ vựng, ontology còn cung cấp các ràng buôc, đôi
khi các ràng buộc này được coi như các giả định cơ sở về ý nghĩa mong muốn của bộ từ
vựng, nó được sử dụng trong một miền mà có thể được giao tiếp giữa người và các hệ
thống ứng dụng phân tán hỗn tạp khác.
Chính vì tầm quan trọng của ontology trong Web ngữ nghĩa, Trong tiểu luận này
em xin trình bày một vài đặc điểm của ontology. Tiểu luận gồm các phần sau:
Chương 1:
“Tổng quan về Web ngữ nghĩa”.
Chương 2: “Ontology và phương pháp xây dựng Ontology”.
Chương 3: “Ví dụ xây dựng Ontology về lĩnh vực y tế.Thiết kế dựa trên Protégé.”





TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
3
CHƯƠNG 1: TỔNG QUAN VỀ WEB NGỮ NGHĨA
1.1 Công nghệ Web hiện tại và những hạn chế
Khối lượng khổng lồ các tài nguyên trên Web làm nảy sinh vấn đề nghiêm
trọng là làm thế nào để tìm kiếm chính xác tài nguyên mình mong muốn. Dữ liệu
trong các file HTML – ngôn ngữ trình bày dữ liệu của công nghệ Web hiện tại-
hữu ích trong một vài ngữ cảnh nhưng vô nghĩa đối với những ngữ cảnh khác.
Thêm vào đó HTML không thể mô tả về dữ liệu đóng gói trong nó. Hiện nay, hầu

hết các công cụ tìm kiếm tài liệu trên Web được coi là tìm kiếm hiệu quả cũng chủ
yếu tìm kiếm được trên bề nổi của Web.Trong khi ở tầng sâu của Web chứa một
khối lượng thông tin khổng lồ và thường rất có giá trị cho các nhà nghiên cứu, các
học giả hay đơn thuần là những người thích tìm hiểu. Bên cạch đó, các trang Web
hiện nay có rất ít đường liên kết với các trang Web khác nên việc tìm kiếm là khó
khăn. Ngoài ra, thông tin tìm kiếm được không theo chủ đề mà chỉ là vấn đề tìm
theo từ khoá đơn thuần, kết quả tìm kiếm phải do con người chọn lại theo chủ đề
mong muốn.
Ví dụ, khi chúng ta biết tên một quốc gia và muốn tìm tên thủ đô của quốc
gia đó. Vì mỗi quốc gia có một thủ đô khác nhau và Web không biểu diễn được
mối liên hệ này, nên chúng ta không nhận được điều chúng ta mong đợi. Trái lại,
đối với Semantic Web, chúng ta có thể chỉ ra kiểu của mối liên hệ này; ví dụ, tên
quốc gia có tên thủ đô tương ứng.
Vì vậy, nếu như các thành phần chính yếu của dữ liệu trong Web trình bày
theo dạng thức thông thường, thì rất khó sử dụng dữ liệu này một cách phổ biến để
có thể mô tả được mối quan hệ như tương tự trên. Một thiếu sót của Web hiện nay
là thiếu cơ cấu hiệu quả để chia sẻ dữ liệu khi ứng dụng được phát triển một cách
độc lập. Do dó cần phải mở rộng Web để máy có thể hiểu, tích hợp dữ liệu, cũng
như tái sử dụng dữ liệu thông qua các ứng dụng khác nhau.
1.2 Web có ngữ nghĩa
Từ những hạn chế, vấn đề về mặt khai thác dữ liệu của công nghệ Web hiện
tại đã thúc đẩy sự ra đời của ý tưởng Web ngữ nghĩa(Semantic Web), một thế hệ
mới của Web, mà chính cha đẻ của World Wide Web là Tim Berners-Lee đề xuất
vào năm 1998. Web ngữ nghĩa là sự mở rộng của Web hiện tại mà trong đó thông
tin được định nghĩa rõ ràng sao cho con người và máy tính có thể cùng làm việc
với nhau một cách hiệu quả hơn. Mục tiêu của Web có ngữ nghĩa là để phát triển
các chuẩn chung và công nghệ cho phép máy tính có thể hiểu được nhiều hơn
thông tin trên Web, sao cho chúng có th
ể hỗ trợ tốt hơn việc khám phá thông tin
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ

4
(thông tin được tìm kiếm nhanh chóng và chính xác hơn), tích hợp dữ liệu (dữ liệu
liên kết động), và tự động hóa các công việc.
1.3 Kiến trúc của Web ngữ nghĩa
Web ngữ nghĩa là một tập hợp các ngôn ngữ. Tất cả các lớp của Web ngữ
nghĩa được sử dụng để đảm bảo độ an toàn và khai thác thông tin một cách tốt
nhất.
Web ngữ nghĩa được xây dựng trên nền hệ thống web hiện tại. Web ngữ
nghĩa được coi là sự mở rộng của Web hiện tại có bổ sung thêm ngữ nghĩa vào dữ
liệu trên web. Hình 1 chỉ ra sơ đồ kiến trúc của Web ngữ nghĩa.

Hình 1: Kiến trúc của web ngữ nghĩa
1.4 Vai trò của các tầng trong Web ngữ nghĩa
1.4.1 Tầng định danh tài nguyên-URI
URI - Uniform Resource Identifier, URI đơn giản chỉ là một định danh Web
giống như các chuỗi bắt đầu bằng “http” hay “ftp” mà bạn thường xuyên thấy trên
mạng. Bất kỳ ai cũng có thể tạo một URI, và có quyền sở hữu chúng.
1.4.2 Tầng XML và XML Schema
XML là một mở rộng của ngôn ngữ đánh dấu cho các các cấu trúc tài liệu
bất kỳ.
1.4.3 Tầng RDF - RDF Schema
RDF (Resource Description Framework) là nền tảng của Web ngữ nghĩa và
xử lý metadata, được định nghĩa bởi tổ chức W3C. RDF cho phép trao đổi thông
tin giữa các ứng dụng trên Web mà máy có thể hiểu được.
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
5
1.4.4 Tầng Ontology
Ontology là một tập các khái niệm và quan hệ giữa các khái niệm được định
nghĩa cho một lĩnh vực nào đó nhằm vào việc biểu diễn và trao đổi thông tin.
1.4.5 Tầng logic

Khai báo các nguyên tắc logic và cho phép máy tính suy diễn (bằng cách suy
luận) bằng cách dùng những nguyên tắc này.
1.4.6 Tầng Proof
Chúng ta sẽ xây dựng các hệ hiểu logic và dùng chúng để chứng minh. Mọi
người trên thế giới có thể viết các khai báo logic.Sau đó máy tính có thể theo
những liên kết ngữ nghĩa này để kiểm chứng.
1.4.7 Tầng Trust
Tầng này nhằm đảm bảo tính tin cậy của các ứng dụng trên Web ngữ nghĩa.


TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
6
CHƯƠNG 2: ONTOLOGY VÀ PHƯƠNG PHÁP XÂY DỰNG ONTOLOGY
2.1 Giới thiệu Ontology
2.1.1 Khái niệm Ontology
Trong những năm gần đây, thuật ngữ “Ontology” không chỉ được sử dụng ở
trong các phòng thì nghiệm trên lĩnh vực trí tuệ nhân tạo mà đã trở nên phổ biến
đối với nhiều miền lĩnh vực trong đời sống . Đứng trên quan điểm của ngành trí
tuệ nhân tạo, một Ontology là sự mô tả về những khái niệm và những quan hệ của
các khái niệm đó nhằm mục đích thể hiện một góc nhìn về thế giới. Trên miền ứng
dụng khác của khoa học, một Ontology bao gồm tập các từ vựng cơ bản hay một
tài nguyên trên một miền lĩnh vực cụ thể, nhờ đó những nhà nghiên cứu có thể lưu
trữ, quản lý và trao đổi tri thức cho nhau theo một cách tiện lợi nhất.
Hiện nay tồn tại nhiều khái niệm về Ontology, trong đó có nhiều khái niệm
mâu thuẫn với các khác niệm khác, khóa luận này chỉ giới thiệu một định nghĩa
mang tính khái quát và được sử dụng khá phổ biến được Kincho H.Law đưa ra:
“Ontology là biểu hiện một tập các khái niệm (đối tượng), trong một miền cụ thể
và những mối quan hệ giữa các khái niệm này”.Ontology chính là sự tổng hợp của
một tập từ vựng chia sẻ và các miêu tả ý nghĩa của từ đó theo cách mà máy tính
hiểu được.

2.1.2 Các thành phần của Ontology
Lớp (class) là một bộ những thực thể, các thực thể được mô tả logic đề định
nghĩa các đối tượng của lớp; lớp được xây dựng theo cấu trúc phân cấp cha con
như là một sự phân loại các đối tượng.
Thực thể được xem là thể hiện của một lớp, làm rõ hơn về lớp đó và có thể
được hiểu là một đối tương nào đó trong tự nhiên (England, Manchester United,
bệnh sởi, thủy đậu…).
Các mối quan hệ (Relations): Một trong những ứng dụng quan trọng của
việc sử dụng các thuộc tính là để mô tả mối liên hệ giữa các đối tượng trong
ontology. Một mối quan hệ là một thuộc tính có giá trị là một đối tượng nào đó
trong ontology.
Thuộc tính (Property) thể hiện quan hệ nhị phân của các thực thể (quan hệ
giữa hai thực thể) như liên kết hai thực thể với nhau.Ví dụ thuộc tính “làm cho”
liên kết hai thực thể “người” và “công ty” với nhau.
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
7
Thuộc tính (property) có 4 loại (1) Functional: Một thực thể chỉ liên quan
nhiều nhất đến một thực thể khác, ví dụ thuộc tính “có hương vị” đối với các thực
thể lớp “thức_ăn”; (2) Inverse Functional: Thuộc tính đảo ngược của Functional,
thuộc tính “là hương vị của”; (3) Transitive: Thực thể a quan hệ với thực thể b,
thực thể b quan hệ với thực thể c thì thực thể a quan hệ với thực thể c; (4)
Symmetric: Thực thể a quan hệ với thực thể b thì thực thể b quan hệ với thực thể a.
Thuộc tính có 3 kiểu thể hiện:
- Object Property: Liên kết thực thể này với thực thể khác
- DataType Property: Liên kết thực thể với kiểu dữ liệu XML Schema, RDF literal
- Annotation Property: Thêm thông tin metadata về lớp, thuộc tính, thực thể.
2.1.3 Vòng đời của Ontology
Vòng đời của Ontology được mô tả trong hình vẽ 2 [Paul, 2004].

Hình 2: Vòng đời của Ontology

Từ các tài liệu chuyên môn (chủ yếu tồn tại dưới dạng văn bản), các lớp, các
quan hệ giữa các lớp và thuộc tính của các lớp được định nghĩa, cấu trúc hóa và
biểu diễn trong Ontology. Các lớp mới được thêm vào phải được định vị vị trí của
lớp trong Ontology đã xây dựng trước, và xác thực tính hợp lệ của các thông tin
mới trích rút được. Trong quá trình tìm kiếm, khai thác ontology, các tri thức mới
được suy diễn từ CSTT sinh ra thông tin có ích mới, phục vụ nhu cầu của hệ thống
khai thác. Nhờ đó, ontology được nâng cấp dần dần.
CSTT

Ontology
Tài li

u

Các l

p, các quan

h




thu

c tính

Các thực thể

Kh


i
tạo
Xác th

c
tính hợp lệ
Đ

nh v


Nâng cấp
Bảo trì
Khai
thác
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
8
2.2 Phương pháp xây dựng Ontology
2.2.1 Xây dựng Ontology
Ngày nay, việc nghiên cứu quá trình xây dựng ontology ngày càng được
quan tâm nhiều hơn. Có rất nhiều nhóm sau quá trình nghiên cứu đã đưa ra các
phương pháp khác nhau nhằm xây dựng Ontology.
Nội dung chương này sẽ đề cập đến một số nguyên tắc cơ bản của việc xây
dựng Ontology qua các các công đoạn cụ thể sau đây:
Các bước như sau, chi tiết các bước chúng tôi xin phép không nhắc lại:
- Bước 1, xác định miền quan tâm và phạm vi của Ontology
- Bước 2, xem xét việc kế thừa các Ontology có sẵn
- Bước 3, liệt kê các thuật ngữ quan trọng trong Ontology
- Bước 4, xây dựng các lớp và cấu trúc phân cấp lớp

- Bước 5, định nghĩa các thuộc tính và quan hệ cho lớp
- Bước 6, định nghĩa các ràng buộc của các thuộc tính
- Bước 7, tạo các thực thể cho lớp
2.2.2 Ngôn ngữ xây dựng Ontology
Hiện tại, các ngôn ngữ xây dựng ontology (ngôn ngữ ontology) điển hình
gồm LOOM, LISP, Ontolingua, XML, SHOE, OIL, RDF, DAML+OIL và OWL.
2.2.2.1 RDFS (RDF-Schema)
RDFS là ngôn ngữ Ontology cơ bản. Nó được phát triển ở tầng trên của
RDF nên bản thân RDF-Schema chính là RDF, được mở rộng từ RDF và bổ sung
thêm các tập từ vựng hỗ trợ cho việc xây dựng các Ontology được dễ dàng.
2.2.2.2 OWL (Ontology Web Language)
OWL là ngôn ngữ ontology khá mạnh, ra đời sau RDFS nên biết kế thừa
những lợi thế của ngôn ngữ này đồng thời bổ sung nhiều yếu tố giúp khắc phục
những hạn chế của RDFS. Giúp tăng yếu tố logic thông tin và khả năng phân loại.
2.2.2.3 DAML + OIL
DAML+ OIL ra đời nhằm khắc phục những hạn chế về kiểu dữ liệu trong
các ngôn ngữ Ontology trước đó là RDF, RDFS. DAML + OIL (gọi tắt là DAML)
là ngôn ngữ đánh dấu cho các tài nguyên trên Web, có hỗ trợ suy luận.
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
9
2.2.3 Công cụ xây dựng Ontology
Về mặt lý thuyết, người xây dựng và quản trị Ontology có thể không cần các
công cụ hỗ trợ, thay vào đó có thể thực hiện trực tiếp bằng các ngôn ngữ.Tuy
nhiên, cách thứ hai sẽ không khả thi khi Ontology có kích thước lớn và cấu trúc
phức tạp.Thêm vào đó, việc xây dựng và quản trị Ontology không chỉ đòi hỏi việc
tạo cấu trúc lớp phân cấp, định nghĩa các thuộc tính, ràng buộc , mà còn bao hàm
việc giải quyết các bài toán liên quan trên nó. Có rất nhiều bài toán liên quan đến
một hệ thống Ontology như:
- Trộn hai hay nhiều Ontology.
- Chuẩn đoán và phát hiện lỗi.

- Kiểm tra tính đúng đắn và đầy đủ.
- Ánh xạ qua lại giữa các Ontology.
- Suy luận trên Ontology.
- Sao lưu và phục hồi một Ontology.
- Xóa, sửa và tinh chỉnh các thành bên trong Ontology.
- Tách biệt Ontology với ngôn ngữ sử dụng (DAML, OWL, ).
Những khó khăn trên đã khiến các công cụ trở thành một thành phần không
thể thiếu, quyết định đến chất lượng của một hệ thống Ontology. Hiện có rất
nhiều công cụ có khả năng hỗ trợ người thiết kế giải quyết những bài toán liên
quan. Có thể kể ra một số như: Sesame, Protégé, Ontolingua, Chimaera, OntoEdit,
Oid.
Công cụ chính tạo ontology sử dụng trong tiểu luận này là Protégé.
2.2.3.1 Protégé
Protégé là bộ phần mềm mã nguồn mở Java nổi tiếng. Protégé được nghiên
cứu và phát triển từ năm 1998 bởi nhóm nghiên cứu của Mark Musen, ĐH
Stanford nhằm quản lý các thông tin trong lĩnh vực sinh y học. Đây là dự án nhận
được sự quan tâm và tài trợ từ rất nhiều tổ chức, trong đó có Bộ Quốc Phòng Mỹ.
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
10
CHƯƠNG 3: XÂY DỰNG ONTOLOGY VỀ LĨNH VỰC Y TẾ.THIẾT KẾ
DỰA TRÊN PROTÉGÉ.
3.1 Tìm hiểu yêu cầu
Bài toán của chúng ta là xây dựng hệ thống tìm kiếm có ngữ nghĩa thông tin
về Y tế. Miền thông tin được quan tâm ở đây là các thông tin về Y tế bao gồm:
• Thông tin về Bệnh viện
• Thông tin về Bác sĩ
• Thông tin về Bệnh án
• Thông tin về Bệnh nhân
• Thông tin về Hồ sơ bệnh án
Người dùng tham gia vào hệ thống gồm:

• Người dùng, người cần tìm kiếm thông tin
• Người cung cấp thông tin, người hiểu biết về Y tế
Yêu cầu về chức năng:
• Chức năng tìm kiếm, dẫn dắt tìm kiếm cho người dùng
• Chức năng thêm thông tin vào Ontology
Yêu cầu đối với bài toán đặt ra là
• Xây dựng Ontology
• Lưu trữ, quản lý Ontology
3.2 Xây dựng Ontology
Như đã trình bày ở trên thì quy trình xây dựng ontology gồm có 7 bước, các bước
này được áp dụng cho việc
xây dựng hệ thống tìm kiếm ngữ nghĩa thông tin về Y tế.

• Tìm hiểu về miền thông tin
Miền thông tin mà chúng ta quan tâm ở đây là thông tin về lĩnh vực Y tế,
Thông tin về Y tế rất nhiều có thể kể đến như: thông tin về cơ sở y tế, thông tin về
bệnh viện, thông tin về bác sĩ, thông tin về bệnh án, thông tin về bệnh nhân, hay có
thể là thông tin về bệnh…
Giới hạn về miền thông tin: Thông tin mà người dùng quan tâm ở đây với mục
đích là tìm kiếm hay tham khảo, không với mục đích dựa vào đó để nghiên cứu.
• Tìm hiểu về người dùng
Người dùng ở đây ta chỉ quan tâm đến người sử dụng hệ thống để tìm kiếm
thông tin về y tế. Người dùng quan tâm về lĩnh vực y tế có thể là: Bệnh nhân, Bác
sĩ, Quản lý bệnh viện.
Ứng với mỗi người dùng có thể có yêu cầu về thông tin khác nhau, qua tìm
hiểu ta có thể mô tả chi tiết như sau:
Ứng với người dùng là bệnh nhân: Khi người bệnh bị mắc bệnh thì họ sẽ tìm
đến bệnh viện hay một cơ sở y tế, họ sẽ cần thông tin về các cơ sở đó.Thông tin về
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
11

một cơ sở y tế để họ có thể tìm đến có thể là: địa chỉ đường phố, địa chỉ email, số
điện thoại… đó là những thông tin để người dùng có thể tìm đến được cơ sở y tế.
Cơ sở y tế cũng cần có thông tin về các lĩnh vực y tế, dịch vụ cung cấp để
người bệnh có thể quan tâm tới. Người bệnh trong quá trình điều trị có thể cần
những hướng dẫn cụ thể về điều trị, bác sĩ là điểm hướng tới để người bệnh có thể
tìm được các hướng dẫn. Để tìm được thông tin về bác sĩ thì bác sĩ cũng cần có
các thông tin cơ bản để người bệnh có thể tìm đến, thông tin về bác sĩ có thể gồm:
địa chỉ email, số điện thoại, lĩnh vực y tế quan tâm, địa chỉ nhà….Khi người bệnh
đến cơ sở y tế có nhiều thủ tục mà người bệnh có thể chưa biết, vậy thông tin về
các thủ tục cần được làm rõ, các thủ tục có thể có như: thủ tục vào viện, thủ tục ra
viện, thủ tục bảo hiểm…
Ứng với người dùng là bác sĩ: Bác sĩ có thể quan tâm đến các bệnh án của
người bệnh để đưa ra các quyết định cho việc điều trị, thông tin về bệnh án của
người bệnh có thể gồm: thông tin về người bệnh, thông tin về bệnh, thông tin về
biểu hiện bệnh.Bác sĩ có thể quan tâm đến kiến thức chuyên môn, các nghiên cứu
đã có để học hỏi, thông tin về các nghiên cứu có thể là: lĩnh vực y tế, địa chỉ bài
báo, tên đề tài cùng tác giả…
Ứng với người dùng là quản lý bệnh viện: người quản lý có thể cần đến
thông tin về bệnh viện, các hồ sơ bệnh án của bệnh viện, thông tin về bác sĩ trong
bệnh viện, các thủ tục bệnh viện, các khoa điều trị trong viện, các lĩnh vực y tế của
viện
• Xác định các khái niệm, quan hệ
Dựa trên những tìm hiểu trên về lĩnh vực Y tế ta có thể rút ra một vài khái
niệm như:
- Cơ sở y tế, bệnh viện: Có Thông tin liên lạc, Có Thông tin về lĩnh vực, Có
Thông tin các thủ tục.
- Bác sĩ: Có Thông tin liên lạc, Có Thông tin về lĩnh vực, Có Thông tin về
bằng cấp.
- Bệnh nhân: Có Thông tin liên lạc, Có Thông tin về bệnh.
- Hồ sơ bệnh án, các hồ sơ bệnh án về một bệnh: Có Thông tin về bệnh nhân,

Có Thông tin về bác sĩ điều trị. Có Thông tin về bệnh án.
- Địa chỉ liên lạc của bệnh viện, địa chỉ liên lạc của bác sĩ: Có Địa chỉ đường
phố, Có Địa chỉ email, Có Số điện thoại, Có hình ảnh.
- Các nghiên cứu: Có địa chỉ bài báo, Có tác giả, Chuyên về lĩnh vực y tế,
Có kết quả đánh giá.
- Các chuyên khoa: Có Lĩnh vực y tế, Có địa chỉ.
- Thủ tục nhập viện, thủ tục bảo hiểm, thủ tục ra viện: Có mô tả, Có yêu cầu.
• Xây dựng các Lớp, phân cấp các Lớp
- Address: Các DataTypeProperty, Các ObjectProperty.
- Contact: Các DataTypeProperty, Các ObjectProperty, Cácsubclass (gồm:
Hospital_contact, Doctor_contact, Department_hospital_contact ).
- Medicine_Class: Các DataTypeProperty, Các ObjectProperty
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
12
- Patient_record: Các DataTypeProperty, Các ObjectProperty, Các subclass
(Burn_patient_record, Cutaneous_patient_record, Gynecology patient_record).
- Procedure: Các DataTypeProperty, Các ObjectProperty, Các subclass(
Input_procedure, Insurance_procedure, Output_procedure).
• Xác định giá trị Literal tương ứng với DataTypeProperty:
- Địa chỉ
- Contact: has_name – String, has_number_phone – String, has_picture –
String .
- Contact_doctor: Doctor_has_education – String,
Doctor_has_experience_years – integer
,
Doctor_has_gender – String,
Doctor_study_at – String.
- Hospital_contact: Hospital_with_type – String.
- Procedure_info: Procedure_has_name – String
- Insurance_procedure_info: Insurance_procedure_has_des – String,

Insurance_procedure_has_imageurl – String.
- Record_with_info: Record_has_id –String, Record_has_bed_number –
integer, Record_has_come_in_date – date, record_has_room_number – integer,
Record_with_disease – String,
Record_with_expresssion_of_patient – String, Patient_has_gender – String,
Patient_has_job – String, Patient_has_name – String.
- Research_info: Research_has_artical_url -String, Research_has_name –
String, Research_with_council – String, Research_with_level-String
.

- Medicine_class_info: Medicine_class_has_des String,
Medicine_class_has_disease – String, Medicine_class_has_name – String
3.3 Kết quả thiết kế Ontology dựa trên protégé
• Các Class mức đỉnh: gồm các chủ đề được xét đến trong miền y tế, bao
gồm các class như: Contact, Research, medicine_class, address, procedure,
patient_record.

TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
13
Đặc tả chi tiết cho các lớp
o Procedure

o Address

o Patient_record

o
Medicine_class

TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ

14
o
Contact


o
Research


o
Phân cấp các ObjectProperty


o
Phân cấp các DataTypeProperty:


TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
15
KẾT LUẬN

Web ngữ nghĩa là sự mở rộng của web hiện tại, nhằm mục đích đưa đến một cách
thức biểu diễn chung thông tin trên WWW để máy tính có thể hiểu được về thông tin
đó.Web ngữ nghĩa vẫn đang trong giai đoạn phát triển, tuy chưa được triển khai hoàn
toàn trên Web nhưng bản thân nó vẫn mang tính ứng dụng lớn trong những hệ thống nhỏ,
tìm kiếm có ngữ nghĩa thông tin về y tế là một ví dụ.Tìm kiếm thông tin về y tế là bài
toán ứng dụng web ngữ nghĩa. Mục đích của bài toán là xây dựng được hệ thống cho
pháp biểu diễn thông tin về y tế ở dạng có ngữ nghĩa để máy tính có thể hiểu và tự suy
luận được. Dựa trên tính chất đó hệ thống cho phép máy tính có thể tự động tìm đúng
thông tin mà người dùng cần.

Tuy nhiên, trong tiểu luận này nhóm chúng em chỉ nghiên cứu về Ontology trong
ứng dụng này. Đề hoàn thành mục đích đề ra là hệ thống đáp ứng được các yêu cầu tìm
kiếm như trên và đưa vào hoạt động thực tế thì chúng em cần phải có các biểu đồ chức
năng, biểu đồ luồng, lưu trữ model trên cơ sở dữ liệu, xây dựng bộ truy vấn, xây dựng
lược đồ XML, xây dựng giao diện…
Để hoàn thành tiểu luận này, nhóm chúng em xin gửi lời cảm ơn chân thành tới
những kiến thức cơ bản mà TS.Phạm Huy Hoàng đã truyền đạt trong những bài giảng ở
trên giảng đường.
TÌM HIỂU ONTOLOGY - XÂY DỰNG ONTOLOGY TRONG LĨNH VỰC Y TẾ
16
TÀI LIỆU THAM KHẢO
1. Giáo trình giảng dạy môn Web và các dịch vụ thế hệ mới của TS. Nguyễn
Huy Hùng.
2. Các bài viết trên Internet về:
• Ngôn ngữ Ontology:
o XML (eXtensible Markup Language)
o RDF (Resource Description Framework)
o RDFS
o DTD (Document Type Definition)
o
OWL (Web Ontology Language )

o XML schema
o DAML+OIL
• Công cụ phát triển Ontology:
o
SparQL (SPARQL Query Language for RDF)

o Protégé
o KAON

o Chimaera
3. Natalya F. Noy and Deborah L. McGuinness. Ontology Development 101: A
Guide to Creating Your First Ontology. Stanford University, Stanford, CA, 94305
4. Sean Bechhofer, Ian Horrocks, Daniele Turi. The OWL Instance Store: System
Description. Information Management Group, School of Computer Science, The
University of Manchester
5.
Thomas R.Gruber. Toward Principles for the Design of Ontologies Used for
Knowledge Sharing. Stanford Knowledge Systems Laboratory, 701 Welch Road, Building
C Palo Alto, CA 94304,

6. Bijan Parsia and Evren Sirin. Pellet: An OWL DL Reasoner. MINDSWAP Research
Group, University of Maryland, College Park, MD

×