Tải bản đầy đủ (.doc) (26 trang)

Tiểu luận môn cơ sở dữ liệu nâng cao Biểu diễn các phát biểu bằng đồ thị RDF

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.34 MB, 26 trang )

Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
MỤC LỤC
I. Tổng quan về cơ sở dữ liệu đồ thị 2
II.Tổng quan về RDF 4
III.Kết luận 25
Tài liệu tham khảo 26
MỞ ĐẦU
Ngày nay, cơ sở dữ liệu đồ thị đã trở thành thế mạnh trong nhiều lĩnh vực, bởi hầu hết
các ứng dụng đều có một lượng dữ liệu khổng lồ và đòi hỏi phải có tính linh hoạt mềm dẻo
để thay đổi cấu trúc dữ liệu theo thời gian cho phù hợp với nhu cầu thực tế.
Và Dữ liệu đồ thị đã đáp ứng được nhu cầu này bằng cách thức lưu trữ thông tin ở dạng
đồ thị những đỉnh và cạnh.
Bài báo cáo này trình bày khái quát và cách tiếp cận RDF bằng cơ sở dữ liệu đồ thị.
Cài đặt RDF với giao diện đơn giản, cho phép người dùng tìm kiếm thông tin trong cấu
trúc RDF.
Em xin chân thành cảm ơn PGS.TS. Đỗ Phúc đã tận tình giảng dạy, truyền đạt những
kiến thức quý báu và hướng dẫn về nguồn tài liệu tham khảo để em có thể hoàn thành môn
học này.
Em xin chân thành cám ơn!
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 1
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
I. Tổng quan về cơ sở dữ liệu đồ thị
1. Lý thuyết về đồ thị:
Một đồ thị G là một bộ gồm ba thành phần <N,E,W> trong đó N={ni} là một tập các
nút, là tập các cạnh, mỗi cạnh gồm cặp các nút <ni,nj> và W là một ánh xạ E->R
n
tương ứng với một trọng số hay giá trị của mỗi cạnh.
Trọng số được định nghĩa như là một vector số thực bởi vì trong thực tế giá trị thuộc tính
của các cạnh là khá phức tạp.
Một đồ thị có các cạnh có hướng, hướng từ đỉnh nguồn đến đỉnh đích thì gọi là đồ thị có


hướng. Một độ thị mà có nhiều cạnh nối giữa hai nút gọi là đa đồ thị. Một cạnh mà nối với
chính bản thân của nút đó thì gọi là cạnh lặp.
Trong đề tài này chủ yếu ta sử dụng đồ thị có hướng với trọng số của các cạnh là các
predicate.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 2
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 1: Đồ thị có hướng
2. Cơ sở dữ liệu đồ thị:
Cơ sở dữ liệu là một kiểu cơ sở dữ liệu NoSQL sử dụng cấu trúc đồ thị với những cạnh,
nút và những thuộc tính để biểu diễn và lưu trữ thông tin.
Một cơ sở dữ liệu đồ thị là một tập hợp các đồ thị thành viên G = {G1, G2,
G3,…, Gn} trong đó mỗi đồ thị Gi là một đồ thị có nhãn.
Hình 2: Cơ sở dữ liệu đồ thị
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 3
1
2 3
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
II. Tổng quan về RDF
RDF (The Resource Description Framework) là một gia đình của World Wide Web
Consortium (W3C) chi tiết kỹ thuật ban đầu được thiết kế như là một mô hình dữ liệu siêu
dữ liệu. Nó đã được sử dụng như một phương pháp chung để mô tả khái niệm hoặc mô hình
hóa các thông tin được thực hiện trong nguồn tài nguyên web, bằng cách sử dụng một loạt
các định dạng cú pháp.
1. Định nghĩa:
• RDF được viết dưới định dạng XML. Bằng cách sử dụng XML, RDF dễ dàng
chuyển đổi giữa các máy tính sử dụng những hệ điều hành khác nhau.
• RDF(Resource Description Framework) là nền tảng cho việc biểu diễn dữ liệu trong
web ngữ nghĩa. RDF được thiết kế để cung cấp 1 chuẩn cho việc mô hình hóa, miêu

tả và trao đổi thông tin.
• Để làm được điều này thì RDF sử dụng 1 mô hình dữ liệu đơn giản, trong đó gồm :
các tài nguyên (resources) và các phát biểu (statements).
• Một phát biểu liên kết hai tài nguyên với nhau. Một phát biểu giống như 1 câu đơn
giản có dạng: chủ ngữ(subject)-động từ(verb)-vị ngữ(object) .VD : "I love you" thì "
I " là chủ ngữ, " love " là động từ, " you " là vị ngữ.
• Trong RDF, một phát biểu được gọi là một bộ ba, vì nó gồm 3 phần :
o Chủ ngữ của phát biểu được gọi là subject
o Động từ được gọi là predicate hoặc property
o Vị ngữ thì được gọi là object hoặc value
2. RDF và các cơ sở dữ liệu truyền thống
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 4
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
• Trong cơ sở dữ liệu truyền thống, dữ liệu được lưu dưới dạng bảng. Trong đó mỗi bộ
dữ liệu (tuple) không giới hạn về số lượng thành phần.
• Ví dụ :
PersonID Name Phone Email City State
person-1 William Sparks 435 555-6789 Springfield MA
person-2 Constance Sim 312 555-2238 Chicago IL
• Do RDF chỉ gồm các tài nguyên và các bộ ba, nên để đưa dữ liệu về dạng các bộ ba,
cần tách cơ sở dữ liệu truyền thống thành các bảng nhỏ nhất có thể. Một hàng của
một bảng gồm hai cột có thể coi là 1 bộ ba nên ta có thể tách bảng cũ thành tập các
bảng 2 cột như sau :
PersonID Name
person-1 William Sparks
person-2 Constance Sim
Ta có bộ ba : (person-1, name, William Sparks)
Name Phone
William Sparks 435 555-6789

Constance Sim 312 555-2238
Ta có bộ ba : (William Sparks, phone, 435 555-6789)
• Sau đó, ta có thể biểu diễn khóa chính trong các bảng bằng một tham chiếu URI,
hoặc trong một số trường hợp có thể dùng các nút vô danh(anonymous node) để biểu
diễn các hàng.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 5
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
3. Biểu diễn các phát biểu bằng đồ thị RDF :
Một đồ thị biểu diễn RDF bao gồm các nút (đỉnh) và các cung. Mỗi nút có thể là một tài
nguyên (resource) hoặc giá trị nguyên thủy (literal), trong khi đó các cung tượng trưng cho
một predicate/property. Ta có thể ánh xạ một bộ ba sang lược đồ như sau:
Hình 3 : Ví dụ về đồ thị RDF
• Trong các đồ thị RDF :
o Hình tròn hoặc oval biểu diễn cho một tài nguyên
o Hình chữ nhật biểu diễn cho giá trị nguyên thủy ví dụ như 1 chuỗi kí tự
Tài nguyên có nhiều phát biểu :
Hình dưới biểu diễn khi có một vài phát biểu về cùng 1 tài nguyên :
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 6
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 4 : Một tài nguyên có nhiều thuộc tính, các thuộc tính thuộc các phát biểu khác nhau
Ở ví dụ trên, ta không thấy city và state có mối quan hệ với nhau. Nhưng trên thực tế thì
ngược lại, một người sống ở một nơi nào đó trong thành phố thì tương ứng phải ở một quận
nào đó. Để khắc phục điều này, ta thêm vào đồ thị một nút nữa, nút vô danh(anonymous
node), có hai thuộc tính city, state.
Hình 5 : Nút vô danh hay nút trống
Nút vô danh(anonymous node) :
Kể cả khi 1 tài nguyên không được định danh, nó vẫn có thể có kiểu riêng và là chủ
ngữ(subject) của các phát biểu khác. Ở hình trên, person-1 có adrress là một tài nguyên

không định danh(nút vô danh), tài nguyên này lại là chủ ngữ của hai phát biểu khác. Bây
giờ ta sẽ thêm một thuộc tính nữa cho nút trống này để xác định kiểu cho tài nguyên đó.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 7
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 6 : Tạo kiểu cho nút vô danh
Tài nguyên là vị ngữ của phát biểu
• Ví dụ, ta muốn tạo một phát biểu về tài khoản email của person-1. Giả sử, nó được
mở tạo vào August 1, 2001. Ta muốn tạo một bộ ba với địa chỉ email là chủ ngữ
(subject) nhưng không thể vì chủ ngữ phải là tài nguyên chứ không phải là kí tự.
• Tùy từng trường hợp ta có thể sử dụng một nút vô danh hoặc tạo 1 nút mới. Hình
dưới dùng cách tạo một nút mới. Việc này có vẻ đơn giản nhưng nó đã đưa ra một
hướng xử lý mới trong RDF.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 8
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 7 : Thêm một nút mới để email có thể là chủ ngữ của các phát biểu khác
Một số nút đặc biệt
• Có nhiều trường hợp chúng ta muốn nói về một tài nguyên mà bản thân nó là một tập
hợp gồm nhiều tài nguyên khác. Mô hình RDF có định nghĩa ba kiểu tài nguyên đặc
biệt để hỗ trợ những trường hợp này :
o Bag: chứa đựng tập tài nguyên không cần thứ tự
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 9
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 8 : Một tập hợp của phương tiện giao thông
• Sequence : chứa đựng tập tài nguyên có thứ tự.
• Alternative : chứa đựng các lựa chọn cho một tài nguyên.
Hình 9 : Nút alternative - biểu diễn các lựa chọn - đèn có thể tắt hoặc mở
4. Chia sẻ dữ liệu

Để dữ liệu có thể được sử dụng trên khắp mạng thì cần có 1 cách để trao đổi thông tin giữa
các máy tính. Ở đây RDF chi đóng vai trò biểu diễn thông tin, vậy thì cần phải có 1 định
dạng chuẩn để trao đổi các bộ RDF trên mạng Internet và các mạng khác. Điều này có thể
thực hiện được với 1 ngôn ngữ dựa trên XML gọi là RDF/XML
4.1. Các luật của RDF:
RDF sử dụng các URI để nhận biết thông tin về tài nguyên. RDF mô tả thông tin tài nguyên
bằng các thuộc tính và giá trị thuộc tính
Tài nguyên(Resource) có một URI cụ thể ví dụ : />Thuộc tính là một tài nguyên có tên như author, hompage…
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 10
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Giá trị thuộc tính là giá trị cụ thể cho thuộc tính đó như giá trị thuộc tính cho author là “Jan
Egil Refsnes” hay gía trị thuộc tính cho homepage là
4.2. RDF Statements
RDF statement là một sự kết nối của tài nguyên, thuộc tính và giá trị thuộc tính hay còn gọi là
subject,predicate và object. Ví dụ:
Statement: “Tác giả của là Jan Egil Refsnes”
• Subject của statement trên là: />• Predicate : tác giả
• Object : Jan Egil Refsnes
Statement: “homepage của là "
Subject: />Predicate: homepage
Object:
4.3 . Những thành phần chính RDF
Những thành phần chính của một tài liệu RDF là <RDF> và <Description>. Những
thành phần này chủ yếu để nhận biết về tài nguyên.
4.3.1 Thành phần <rdf:RDF>
<rdf:RDF> là một thành phần gốc của một tài liệu RDF. Thành phần này để cho biết văn
bản XML là một RDF. Trong thành phần này sẽ chứa một tham chiếu đến namspace RDF
Ví dụ:
<?xml version="1.0"?>

HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 11
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
<rdf:RDF
xmlns:rdf=" /> Mô tả các tài nguyên ở đây
</rdf:RDF>
4.3.2 Thành phần <rdf:Description>
Thành phần <rdf:Description> nhận biết tài nguyên bằng một thuộc tính about. Thành
phần này chứa những thành phần mô tả về tài nguyên
Ví dụ:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">
<rdf:Description
rdf:about="e/cd/Empire Burlesque">
<cd:artist>Bob Dylan</cd:artist>
<cd:country>USA</cd:country>
<cd:company>Columbia</cd:company>
<cd:price>10.90</cd:price>
<cd:year>1985</cd:year>
</rdf:Description>
</rdf:RDF>
* Những thành phần artist, country, company, price, and year được định nghĩa trong
namespace
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 12
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
• Khai báo namespace :
Việc sử dụng namespace giúp cho tài liệu RDF ngắn gọn và dễ đọc hơn đối với người thiết
kế. Chẳng hạn như ta có một địa chỉ là "

Nếu ta gán nó cho một namespace ví dụ như xmlns:rdf, thì từ nay về sau ta chỉ việc dùng
rdf:phone thay cho
4.3.3 Thuộc tính là giá trị
Thay vì sử dụng từng thành phần để mô tả thuộc tính ta có thể mô tả thuộc tính bằng giá
trị cụ thể
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">
<rdf:Description
rdf:about="e/cd/Empire Burlesque"
cd:artist="Bob Dylan" cd:country="USA"
cd:company="Columbia" cd:price="10.90"
cd:year="1985" />
</rdf:RDF>
4.3.4 Thuộc tính là tài nguyên
Thuộc tính có thể định nghĩa như là những tài nguyên.
<?xml version="1.0"?>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 13
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">
<rdf:Description
rdf:about="e/cd/Empire Burlesque">
<cd:artist rdf:resource="e/cd/dylan" />


</rdf:Description>
</rdf:RDF>
4.4. Thành phần RDF Container

RDF Container được sử dụng để mô tả một nhóm các tài nguyên.
4.4.1 Thành phần <rdf:Bag>
Thành phần <rdf:Bag> chứa danh sách những giá trị không có thứ tự cụ thể và có thể
chứa những giá trị trùng nhau.
Ví dụ:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">
<rdf:Description
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 14
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
rdf:about="e/cd/Beatles">
<cd:artist>
<rdf:Bag>
<rdf:li>John</rdf:li>
<rdf:li>Paul</rdf:li>
<rdf:li>George</rdf:li>
<rdf:li>Ringo</rdf:li>
</rdf:Bag>
</cd:artist>
</rdf:Description>
</rdf:RDF>
4.4.2 Thành phần <rdf:Seq>
Thành phần <rdf:Seq> mô tả danh sách những giá trị có thứ tự và cũng có thể chứa
những giá trị trùng nhau.
VD:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">

<rdf:Description
rdf:about="e/cd/Beatles">
<cd:artist>
<rdf:Seq>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 15
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
<rdf:li>George</rdf:li>
<rdf:li>John</rdf:li>
<rdf:li>Paul</rdf:li>
<rdf:li>Ringo</rdf:li>
</rdf:Seq>
</cd:artist>
</rdf:Description>
</rdf:RDF>
4.4.3 Thành phần <rdf:Alt>
Chứa danh sách những giá trị có thể thay đổi
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">
<rdf:Description
rdf:about="e/cd/Beatles">
<cd:format>
<rdf:Alt>
<rdf:li>CD</rdf:li>
<rdf:li>Record</rdf:li>
<rdf:li>Tape</rdf:li>
</rdf:Alt>
</cd:format>
HVTH: Vương Thị Ngọc Ẩn- CH1101063

Trang: 16
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
</rdf:Description>
</rdf:RDF>
4.5 RDF Collections
Những giá trị chứa trong container còn được gọi là các member.
RDF Collection mô tả các nhóm mà chỉ chứa các member cụ thể.
Một collection có thể được mô tả bởi thuộc tính rdf:parseType="Collection".
Ví dụ về RDF Collection:
<?xml version="1.0"?>
<rdf:RDF
xmlns:rdf=" />xmlns:cd="e/cd#">
<rdf:Description
rdf:about="e/cd/Beatles">
<cd:artist rdf:parseType="Collection">
<rdf:Description rdf:about="e/cd/Beatles/George"/>
<rdf:Description rdf:about="e/cd/Beatles/John"/>
<rdf:Description rdf:about="e/cd/Beatles/Paul"/>
<rdf:Description rdf:about="e/cd/Beatles/Ringo"/>
</cd:artist>
</rdf:Description>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 17
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
</rdf:RDF>
5. Xây dựng cơ sở đồ thị RDF
Như ta đã biết một tài liệu RDF là một tập hợp các statement. Một statement trong tài
liệu RDF được biểu diễn bằng một cung nối từ Subject sang Object với nhãn của cung này
là Predicate
Các subject và object sẽ tạo thành các node trong trong đồ thị. Nhãn của subject sẽ chứa

thông tin về tài nguyên còn nhãn của object sẽ chứa giá trị tài nguyên tương ứng với
subject.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 18
Subject Object
Predicate
Tài nguyên Giá trị
Thuộc tính / Giá trị
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Vấn đề được đặt ra là từ một tài liệu RDF làm sao để sinh ra các statement hợp lý. Ta xét
một ví dụ cụ thể cho tài liệu RDF sau:
<?xml version="1.0" encoding="utf-8"?>
<rdf:RDF xmlns:rdf="
xmlns:rdfs="
xmlns:doap=" xmlns:foaf="
xmlns:admin=" xml:lang="en">
<doap:Project rdf:about="o/code/semweb">
<doap:name>SemWeb RDF Library for C#/.NET</doap:name>
<doap:shortname>SemWeb Library for .NET</doap:shortname>
<doap:homepage rdf:resource="o/code/semweb"/>
<doap:created>2005-04-20</doap:created>
<doap:description>A library for semantic web and RDF data manipulation written in
C# for .NET applications.</doap:description>
<doap:maintainer>
<foaf:Person>
<foaf:name>Joshua Tauberer</foaf:name>
</foaf:Person>
</doap:maintainer>
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 19

Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
<doap:release>
<doap:Version>
<doap:revision>1.01</doap:revision>
</doap:Version>
</doap:release>
</doap:Project>
</rdf:RDF>
Đây là một tài liệu RDF về dự án có tên là SemWeb RDF Library for C#/.NET.
RDF này bao gồm nhiều thành phần, mỗi thành phần tạo nên một statement.
Đối với các thành phần <doap:name>, <doap:shortname>, <doap:homepage>,
<doap:created>, <doap:description> ta có các phát biểu về statement như sau:
Dự án semweb có name là SemWeb RDF Library for C#/.NET
có shortname là SemWeb Library for .NET
có homepage là o/code/semweb
Được tạo vào ngày 2005-04-20
Dự án semweb có description là A library for semantic web and RDF data manipulation
written in C# for .NET applications.
Đối với thành phần <doap:maintainer> và <doap:release> chứa một nhóm các thành
phần khác nên ta sẽ sinh ra một subject của nó là thành phần chứa nó, predicate là tên thành
phần và object là giá trị ngẫu nhiên.
Ta có phát biểu về statement cho thành phần <doap:maintainer> như sau:
Dự án semweb có maintainer là A.
Phát biểu statement cho thành phần <doap:release> như sau:
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 20
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Dự án semweb có release là B.
Những thành phần con chứa trong <doap:maintainer> và <doap:release> sẽ tạo ra các
statement có subject là các giá trị ngẫu nhiên của thành phần chứa nó.

Đối với các thành phần chứa trong <doap:maintainer> có các statement sau:
A có name là Joshua Tauberer.
Phát biểu statement cho thành phần <doap:revision> chứa trong <doap:release> là:
B có revision là 1.01.
Ngoài ra còn có một statement mà predicate của nó có tên là type để cho biết kiểu của
subject. Statement được sinh ra cho những thành phần mà chứa các thành phần có chứa các
giá trị thuộc tính cụ thể.
Đối với RDF trên ta có phát biểu statement về type như sau:
Dự án semweb có type là Project
A có type là Person.
B có type là Verson.
Để lưu trữ cơ sở dữ liệu đồ thị RDF trong hệ quản trị cở sở dữ liệu, ta sẽ tạo ra 2 bảng là
Vertex và Edge. Bảng Vertex sẽ có hai cột là id và label là nhãn của các nút. Bảng Edge sẽ
có ba cột là head, tail và label. Head là đỉnh đầu của nút, tail là đỉnh cuối của nút, label là
nhãn của cạnh.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 21
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Hình 10: Table Vertex và Edge
Hình 11: RelationShip
6. Cài đặt và Demo
* Chương trình demo được thực hiện qua 4 giai đoạn:
Đọc nội dung tài liệu RDF
Chuyển nội dung tài liệu RDF qua bộ parser để tạo ra các statement
Từ các statement tạo ra các nút và cạnh đồ thị
Lưu các nút và cạnh đồ thị vào database.
• Hướng dẫn cài đặt và sử dụng chương trình
Để cài đặt và sử dụng chương trình demo thì người dùng cần cài hệ quản trị cơ sở dữ
liệu Microsoft SQL Server 2005 hoặc mới hơn
HVTH: Vương Thị Ngọc Ẩn- CH1101063

Trang: 22
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
- Sau đây là một số lưu ý khi cài đặt MS SQL Server 2005.
Ở màn hình Registration Information bỏ chọn Hide advanced configuration options nếu
ta muốn cài đặt các chức năng nâng cao của SQL Server 2005.
Chỉ định tên server cho MS SQL Server 2005 ở màn hình Instance Name. Lưu ý tên server này
sẽ được sử dụng khi đăng nhập vào chương trình.
Chọn Use a domain User Account và chỉ định user name, password ở màn hình Service
Account.
Chương trình chạy trên nền .Net Framework 3.5 nên người dùng cần phải cài đặt .Net
Framework 3.5.
• Cài đặt và sử dụng chương trình
Chương trình được đóng gói thành tập tin exe.
Người dùng có thể click setup và theo hướng dẫn cài đặt cho đến khi hoàn tất.
Sau khi kết thúc cài đặt, ta khởi động chương trình bằng cách double click vào biểu tượng
chương trình trên desktop. Người dùng sẽ được yêu cầu đăng nhập để kết nối với máy chủ SQL
Server. Ta điền thông tin tên máy chủ SQL Server, User name và Password mà ta đã nhập vào lúc
cài đặt MS SQL Server.
Tên server phải theo hình thức tên domain. Tức là gồm tên hoặc ip máy chủ + “\” + tên SQL
server. Nếu SQL server được cài trên cùng một máy có thể dùng localhost thay cho tên máy chủ.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 23
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Sau khi hoàn tất đăng nhập, màn hình giao diện chính sẽ hiển thị:
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 24
Báo cáo chuyên đề - Cơ Sở Dữ Liệu Nâng Cao GVHD: PGS.TS.Đỗ Phúc
Chọn File>Open để tiến hành import một tài liệu RDF. Sau khi kết thúc import, một giao diện
trực quan về đồ thị RDF sẽ được hiển thị.
Để tìm kiếm ta nhập thông tin cần tìm vào ô tìm kiếm, rồi click search.

III. Kết luận
1. Kết quả đạt được
Trình bày khái quát và cách tiếp cận RDF bằng cơ sở dữ liệu đồ thị.
Cài đặt RDF với giao diện đơn giản, cho phép người dùng tìm kiếm thông tin trong
cấu trúc RDF.
2. Cần cải thiện
Cải tiến tính năng tìm kiếm để có thể thực hiện tìm kiếm trên dữ liệu lớn.
Cải tiến giao diện trực quan, dễ nhìn.
HVTH: Vương Thị Ngọc Ẩn- CH1101063
Trang: 25

×