Tải bản đầy đủ (.doc) (43 trang)

KỸ THUẬT BIỂU DIỄN TRI THỨC & ỨNG DỤNG MẠNG NGỮ NGHĨA VÀO ĐIỀU CHẾ HÓA CHẤT

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (487.84 KB, 43 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN

Bài thu hoạch mơn học
CƠNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
Đề tài

KỸ THUẬT BIỂU DIỄN TRI THỨC
& ỨNG DỤNG MẠNG NGỮ NGHĨA
VÀO ĐIỀU CHẾ HÓA CHẤT

GIÁO VIÊN HƯỚNG DẪN: GS. HOÀNG VĂN KIẾM
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA
LỚP: CAO HỌC CNTTQM KHÓA 6.
MÃ SỐ HỌC VIÊN: CH1101016.
TPHCM tháng 06/2012


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

LỜI NĨI ĐẦU
Cơng nghệ tri thức có thể xem là một nhánh nghiên cứu của trí tuệ nhân tạo,
phân tích tri thức lĩnh vực và chuyển nó thành những mơ hình tính tốn đưa vào
máy tính để phục vụ những nhu cầu cần thiết. Trong công nghệ tri thức, biểu diễn
tri thức là một trong những kỹ thuật quan trọng để hiện thực hóa tri thức trong
đời sống. Biểu diễn tri thức là phương pháp mã hoá tri thức, nhằm thành lập cơ
sở tri thức cho các hệ thống dựa trên tri thức. Từ đó, chúng ta rút ra nhiều thơng
tin, tri thức có lợi từ hệ tri thức này.
Trong khuôn khổ bài thu hoạch nhỏ này, tơi xin trình về cơng nghệ tri thức nói
chung, sau đó tơi sẽ triển khai chi tiết về các kỹ thuật biểu diễn tri thức, đặc biệt,
tôi sẽ chú trọng đến kỹ thuật biểu diễn tri thức bằng mạng ngữ nghĩa. Cuối cùng,


tơi xin trình bày về một ứng dụng nhỏ, sử dụng mạng ngữ nghĩa để giải quyết
vấn đề về điều chế hóa chất trong các trường phổ thơng trung học.
Qua đây, tôi xin được gửi lời cảm ơn đến GS - TSKH Hoàng Văn Kiếm,
người đã tận tâm truyền đạt những kiến thức nền tảng cơ bản về môn học “Công
nghệ tri thức và ứng dụng”, để tôi có cơ sở kiến thức để có thể viết được bài thu
hoạch này.
Do kiến thức còn hạn hẹp, bài thu hoạch có thể có những sai sót nhất định,
mong thầy và các bạn góp ý để bài thu hoạch ngày càng hồn thiện hơn.
Tơi xin tỏ lịng biết ơn sâu xa!
Học viên thực hiện đề tài
Nguyễn Văn Khoa

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 2


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

MỤC LỤC
LỜI NĨI ĐẦU............................................................................................... 2
MỤC LỤC..................................................................................................... 3
1. TÌM HIỂU VỀ CƠ SỞ TRI THỨC................................................................................5

Cơng nghệ tri thức...................................................................................... 5
Vai trị của công nghệ tri thức.....................................................................5
Quản lý tri thức........................................................................................... 6
Các hệ cơ sở tri thức...................................................................................6
2. CÁC KỸ THUẬT BIỂU DIỄN TRI THỨC....................................................................9


1.1.Logic mệnh đề & logic vị từ...................................................................9
1.2. Hệ luật dẫn (luật sinh)........................................................................11
Đối tượng-thuộc tính-giá trị......................................................................16
2.3 Mạng ngữ nghĩa.................................................................................. 17
2.4 Frame - khung.....................................................................................20
2.5 Script................................................................................................... 27
3. TÌM HIỂU VỀ MẠNG NGỮ NGHĨA...........................................................................30

Tìm hiểu mạng ngữ nghĩa .........................................................................30
Ưu và nhược điểm của mạng ngữ nghĩa....................................................32
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 3


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Một số ví dụ tiêu biểu...............................................................................33
4. ỨNG DỤNG VÀO ĐIỀU CHẾ HĨA CHẤT................................................................37

Mơ tả chương trình................................................................................... 37
Mơ tả giải thuật........................................................................................39
5. KẾT LUẬN..................................................................................................................... 42
6. TÀI LIỆU THAM KHẢO.............................................................................................. 43

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 4



BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

1. TÌM HIỂU VỀ CƠ SỞ TRI THỨC
Cơng nghệ tri thức
Cơng nghệ tri thức (Knowledge Engineering) có thể xem là một nhánh nghiên
cứu của trí tuệ nhân tạo, phân tích tri thức lĩnh vực và chuyển nó thành những mơ
hình tính tốn đưa vào máy tính để phục vụ những nhu cầu cần thiết. Công nghệ
tri thức là các phương pháp, kỹ thuật được những kỹ sư tri thức dùng để xây
dựng những hệ thống thông minh như: hệ chuyên gia, hệ cơ sở tri thức, hệ hổ trợ
quyết định.
Công nghệ tri thức là những phương pháp, kỹ thuật dùng để:
• Tiếp nhận, biểu diễn tri thức.
• Xây dựng các hệ cơ sở tri thức
• Khám phá tri thức

Vai trị của cơng nghệ tri thức
Cơng nghệ tri thức đóng vai trò cực kỳ quan trọng trong sự phát triển tri thức
nhân loại. Cùng với sự phát triển nhanh chóng, vượt bậc của ngành cơng nghiệp
máy tính, nhu cầu của người dùng đối với máy tính ngày một cao hơn: khơng chỉ
giải quyết những cơng việc lưu trữ, tính tốn bình thường, người dùng cịn mong
đợi máy tính có khả năng thơng minh hơn, có thể giải quyết vấn đề như con
người. Và từ đó trí tuệ nhân tạo nói chung và đặc biệt là công nghệ tri thức ra đời
và phát triển
Cơng nghệ tri thức đóng vai trị hết sức quan trọng trong việc phát triển Công
nghệ thông tin, nâng cao sự hữu dụng của máy tính, giúp con người gần gũi với
máy tính hơn.
Cơng nghệ tri thức cịn góp phần thúc đẩy nhiều ngành khoa học khác phát
triển, khả năng phát triển khoa học dựa trên tri thức liên ngành. Điển hình nhất
hiện nay là có sự kết hợp tri thức giữa y tế với khoa học tâm linh.


HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 5


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Quản lý tri thức
Tiếp nhận tri thức
Có thể chia thành 2 cách để tiếp nhận tri thức như sau:
Thụ động, bao gồm:
• Gián tiếp: những tri thức kinh điển.
• Trực tiếp: những tri thức kinh nghiệm (khơng kinh điển) do “chuyên gia lĩnh
vực” đưa ra.
Chủ động: Đối với những tri thức tiềm ẩn, không rõ ràng hệ thống phải tự
phân tích, suy diễn, khám phá để có thêm tri thức mới
Biểu diễn tri thức
Biểu diễn tri thức là phương pháp mã hoá tri thức, nhằm thành lập cơ sở tri
thức cho các hệ thống dựa trên tri thức. Các phương pháp biểu diễn tri thức bao
gồm:
• Logic mệnh đề & logic vị từ
• Hệ luật dẫn
• Đối tượng-thuộc tính-giá trị
• Mạng ngữ nghĩa
• Frame
• Script
Chúng ta sẽ đi tìm hiểu lần lượt các phương pháp này ở các mục sau.

Các hệ cơ sở tri thức
Hệ đóng, mở, kết hợp

• Hệ cơ sở tri thức đóng: là những hệ cơ sở tri thức được xây dựng với một số “tri
thức lĩnh vực” ban đầu, và chỉ những tri thức đó mà thơi trong suốt q trình hoạt
động hay suốt thời gian sống của nó. Ví dụ: những hệ cơ sở tri thức về kinh dịch,
những hệ giải toán, thường là những hệ cơ sở tri thức giải quyết vấn đề.
• Hệ cơ sở tri thức mở: là những hệ cơ sở tri thức tiên tiến hơn, nó có khả năng bổ
sung tri thức trong quá trình hoạt động, khám phá. Ví dụ: Những hệ giải tốn cho
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 6


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

phép bổ sung tri thức trong quá trình suy luận (tri thức ban đầu là những tiên đề
và một số định lý, tri thức bổ sung là những định lý mới, những tri thức heurictis,
…); những hệ cơ sở tri thức chẩn đoán, dự báo chẳng hạn: hệ chẩn đoán y khoa
MYCIN và EMYCIN, những hệ dự báo thời tiết, khí hậu, động đất …vv….
• Hệ cơ sở tri thức kết hợp: bao gồm sự kết hợp giữa hệ đóng và hệ mở, hệ kết hợp
giữa CSTT và CSDL, hệ kết hợp giữa hệ CSTT này với một hệ CSTT khác.
Những hệ cơ sở tri thức kết hợp thường phát triển mạnh dựa trên tri thức liên
ngành. Ví dụ: những hệ hỗ trợ ra quyết định trong đời sống, kinh tế và khoa học;
(kinh dịch, tử vi áp dụng với đời sống; kinh dịch, tử vi áp dụng với y học; …);
những hệ chẩn đốn, dự báo dịi hỏi tri thức liên ngành.
Phân loại hệ tri thức theo phương pháp biểu diễn tri thức
Tùy thuộc vào phương pháp biểu diễn tri thức mà chúng ta có thể phân loại
các hệ cơ sở tri thức
• Hệ cơ sở tri thức dựa trên logic mệnh đề và logic vị từ
• Hệ cơ sở tri thức dựa trên luật dẫn
• Hệ cơ sở tri thức dựa trên đối tượng
• Hệ cơ sở tri thức dựa trên Frame

• Hệ cơ sở tri thức dựa trên mạng ngữ nghĩa
• Hệ CSTT kết hợp một số phương pháp biểu diễn đã nêu trên
Phân loại theo ứng dụng
Theo ứng dụng của từng hệ tri thức, thì hệ tri thức được chia theo các dạng
sau:
• Hệ giải quyết vấn đề: thường là hệ có tính chất đóng, nhưng đơi khi cũng có hệ
mang tính mở. Ví dụ: Những hệ giải toán, thuật giải Vương Hạo, thuật giải
Robinson, …


Hệ hỗ trợ quyết định: thường là các hệ mang tính kết hợp (CSDL + tri thức
ngành + hàm tốn học + ..), đối tượng sử dụng là các nhà lãnh đạo. Ví dụ: những
hệ thống đánh giá doanh nghiệp (tình hình tài chính, kết quả kinh doanh, qui

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 7


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

trình nghiệp vụ, qui trình sản xuất, tính chuyên nghiệp trong quản lý, …), những
hệ thống lập kế hoạch (planning), …
• Hệ dự báo, chẩn đốn: thường cũng giống như những hệ hỗ trợ ra quyết định với
tính ngoại suy cao hơn. Ví dụ: Bài tốn chẩn đốn hỏng hóc xe, chẩn đốn y
khoa, dự báo thị trường chứng khốn, thời tiết …
• Hệ điều khiển: là những hệ điều khiển có gắn với CSTT. Những hệ thống này
thường ứng dụng trong công nghiệp, trong điều khiển tự động hóa, thường là
những hệ thống thời gian thực (real-time systems). Một số hệ thống này có sử
dụng kết hợp lý thuyết mờ để xử lý. Ví dụ: Máy giặt, Máy bơm nước với bộ điều

khiển mờ, …

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 8


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

2. CÁC KỸ THUẬT BIỂU DIỄN TRI THỨC
1.1. Logic mệnh đề & logic vị từ
Dạng biểu diễn tri thức cổ điển nhất trong máy tính là logic, với hai dạng phổ
biến là logic mệnh đề và logic vị từ. Cả hai kỹ thuật này đều dùng ký hiệu để thể
hiện tri thức và các toán tử áp lên các ký hiệu để suy luận logic. Logic đã cung
cấp cho các nhà nghiên cứu một cơng cụ hình thức để biểu diễn và suy luận tri
thức.
Phép tốn
Kí hiệu

AND
∧,&,∩

OR
∨,∪,+

NOT
¬,∼

Kéo theo
⊃,→


Tương đương


Bảng 2.1. Các phép toán logic và các ký hiệu sử dụng

Logic mệnh đề
Logic mệnh đề biểu diễn và lập luận với các mệnh đề toán học. Mệnh đề là
một câu nhận giá trị hoặc đúng hoặc sai. Giá trị này gọi là chân trị của mệnh đề.
Logic mệnh đề gán một biến ký hiệu vào một mệnh đề, ví dụ A = "Xe sẽ khởi
động".
Khi cần kiểm tra trị chân trị của câu trên trong bài toán sử dụng logic mệnh đề,
người ta kiểm tra giá trị của A. Nhiều bài toán sử dụng logic mệnh đề để thể hiện
tri thức và giải vấn đề. Bài toán loại này được đưa về bài toán xử lý các luật, mỗi
phần giả thiết và kết luận của luất có thể có nhiều mệnh đề.
Ví dụ:
IF Xe khơng khởi động được  A
AND Khoảng cách từ nhà đến chỗ làm là xa  B
THEN Sẽ trễ giờ làm  C
Luật trên có thể biểu diễn lại như sau: A∧ B→ C
Các phép toán quen thuộc trên các mệnh đề được cho trong bảng 2.2.
A
T
F
T
F

B
T
T

F
F

¬A
F
T
F
T

A∧ B
T
F
F
F

A∨ B
T
T
T
F

A→ B
T
T
F
T

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

A≡ B

T
F
F
T
Page 9


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Bảng 2.2. Bảng chân trị, với các giá trị Đúng (T), Sai (F)

Logic vị từ
Logic vị từ là sự mở rộng của logic mệnh đề nhằm cung cấp một cách biểu
diễn rõ hơn về tri thức. Logic vị từ dùng ký hiệu để biểu diễn tri thức.
Logic vị từ, cũng giống như logic mệnh đề, dùng các ký hiệu để thể hiện tri
thức. Những ký hiệu này gồm hằng số, vị từ, biến và hàm.
Hằng số: Các hằng số dùng để đặt tên các đối tượng đặc biệt hay thuộc tính.
Nhìn chung, các hằng số được ký hiệu bằng chữ viết thường, chẳng hạn an,
bình, nhiệt độ. Hằng số an có thể được dùng để thể hiện đối tượng An, một
người đang xét.
Vị từ: Một mệnh đề hay sự kiện trong logic vị từ được chia thành 2 phần là vị
từ và tham số. Tham số thể hiện một hay nhiều đối tượng của mệnh đề; còn mệnh
đề dùng để khẳng định về đối tượng. Chẳng hạn mệnh đề "Nam thích Mai" viết
theo vị từ sẽ có dạng:
thích(nam, mai)
Với cách thể hiện này, người ta dùng từ đầu tiên, tức "thích", làm vị từ. Vị từ
cho biết quan hệ giữa các đối số đặt trong ngoặc. Đối số là các ký hiệu thay cho
các đối tượng của bài toán. Theo quy ước chuẩn, người ta dùng các chữ thường
để thể hiện các đối số.
Biến: Các biến dùng để thể hiện các lớp tổng quát của các đối tượng hay

thuộc tính. Biến được viết bằng các ký hiệu bắt đầu là chữ in hoa. Như vậy, có
thể dùng vị từ có biến để thể hiện nhiều vị từ tương tự.
Ví dụ:
Có hai mệnh đề tương tự "Nam thích Mai" và "Bắc thích Cúc". Hai biến X, Y
dùng trong mệnh đề thích(X, Y).
Các biến nhận giá trị sẽ được thể hiện qua X=Nam, Bắc; Y=Mai, Cúc. Trong
phép toán vị từ người ta dùng biến như đối số của biểu thức vị từ hay của hàm.
Hàm: Logic vị từ cũng cho phép dùng ký hiệu để biểu diễn hàm. Hàm mô tả
một ánh xạ từ các thực thể hay một tập hợp đến một phần tử duy nhất của tập

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 10


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

hợp khác. Ví dụ, các hàm sau đây được định nghĩa nhằm trả về một giá trị xác
định:
cha(sơn) = Nam
mẹ(sơn) = Mai
Phép toán: Logic vị từ cũng dùng các phép tốn như logic mệnh đề.
Ví dụ: thích(X,Y) AND thích(Z,Y) ->  thích(X,Z)..
Việc lập luận theo cách khơng hình thức đòi hỏi một khả năng rút ra được kết
luận từ các sự kiện đã có. Việc lấy ra thơng tin mới từ các thông tin đã biết và các
luật là trọng tâm của lập luận trong các hệ chuyên gia. Q trình lập luận được
hình thức hố trong bài tốn suy luận.

1.2.


Hệ luật dẫn (luật sinh)

Phương pháp biểu diễn tri thức bằng luật sinh được phát minh bởi Newell và
Simon trong lúc hai ông đang cố gắng xây dựng một hệ giải bài toán tổng quát.
Đây là một kiểu biểu diễn tri thức có cấu trúc. Ý tưởng cơ bản là tri thức có thể
được cấu trúc bằng một cặp điều kiện – hành động : "NẾU điều kiện xảy ra THÌ
hành động sẽ được thi hành". Chẳng hạn : NẾU đèn giao thơng là đỏ THÌ bạn
khơng được đi thẳng, NẾU máy tính đã mở mà khơng khởi động được THÌ kiểm
tra nguồn điện, …
Ngày nay, các luật sinh đã trở nên phổ biến và được áp dụng rộng rãi trong
nhiều hệ thống trí tuệ nhân tạo khác nhau. Luật sinh có thể là một cơng cụ mơ tả
để giải quyết các vấn đề thực tế thay cho các kiểu phân tích vấn đề truyền thống.
Trong trường hợp này, các luật được dùng như là những chỉ dẫn (tuy có thể
khơng hồn chỉnh) nhưng rất hữu ích để trợ giúp cho các quyết định trong quá
trình tìm kiếm, từ đó làm giảm khơng gian tìm kiếm. Một ví dụ khác là luật sinh
có thể được dùng để bắt chước hành vi của những chuyên gia. Theo cách này,
luật sinh không chỉ đơn thuần là một kiểu biểu diễn tri thức trong máy tính mà là
một kiểu biễu diễn các hành vi của con người.

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 11


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Luật là cấu trúc tri thức dùng để liên kết thông tin đã biết với các thông tin
khác giúp đưa ra các suy luận, kết luận từ những thông tin đã biết.
Trong hệ thống dựa trên các luật, người ta thu thập các tri thức lĩnh vực trong
một tập và lưu chúng trong cơ sở tri thức của hệ thống. Hệ thống dùng các luật

này cùng với các thơng tin trong bộ nhớ để giải bài tốn. Việc xử lý các luật
trong hệ thống dựa trên các luật được quản lý bằng một module gọi là bộ suy
diễn.
Các dạng luật cơ bản
Các luật thể hiện tri thức có thể được phân loại theo loại tri thức. Và như vậy,
có các lớp luật tương ứng với dạng tri thức như quan hệ, khuyến cáo, hướng dẫn,
chiến lược, và heuristic. Các ví dụ sau minh họa cho các loại luật.
Quan hệ
IF Nguồn điện hỏng
THEN Máy tính sẽ khơng khởi động được
Lời khun
IF Máy tính khơng khởi động được
THEN khơng thể lấy bất kỳ thơng tin trong đó
Hướng dẫn
IF Máy tính khơng khởi động được
AND các linh kiện trong CPU tốt
THEN Kiểm tra hệ thống nguồn điện
Chiến lược
IF Máy không khởi động được
THEN Đầu tiên hãy kiểm tra hệ thống điện, sau đó kiểm tra các
linh kiện trong CPU
Các luật cũng có thể được phân loại theo cách thức giải quyết vấn đề. Điển
hình theo phân loại này các luật theo cách thức diễn giải, chẩn đoán, và thiết kế.
Diễn giải
IF Cao 1m65
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 12



BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

AND Nặng 65 kg
AND Giới tính Nam
THEN Phát triển bình thường
Chẩn đốn
IF Sốt cao
AND hay ho
AND Họng đỏ
THEN Viêm họng
Thiết kế
IF Cao 1m75
AND Da sẫm
THEN Chọn áo vải sáng
AND Chọn tấm vải khổ 1m40
Mở rộng cho các luật
Trong một số áp dụng cần thực hiện cùng một phép toán trên một tập hay các
đối tượng giống nhau. Lúc đó cần các luật có biến.
Ví dụ:
IF X là nhân viên
AND Tuổi của X > 65
THEN X xó thể nghỉ hưu
Khi mệnh đề phát biểu về sự kiện, hay bản thân sự kiện có thể khơng chắc
chắn, người ta dùng hệ số chắc chắn CF. Luật thiết lập quan hệ không chính xác
giữa các sự kiện giả thiết và kết luận được gọi là luật khơng chắc chắn.
Ví dụ:
IF Lạm phát CAO
THEN Hầu như chắc chắn lãi suất sẽ CAO
Luật này được viết lại với giá trị CF có thể như sau:
IF Lạm phát cao

THEN Lãi suất cao, CF = 0.8
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 13


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Dạng luật tiếp theo là siêu luật - một luật với chức năng mô tả cách thức dùng
các luật khác. Siêu luật sẽ đưa ra chiến lược sử dụng các luật theo lĩnh vực
chuyên dụng, thay vì đưa ra thơng tin mới.
Ví dụ:
IF Xe khơng khởi động
AND Hệ thống điện làm việc bình thường
THEN Có thể sử dụng các luật liên quan đến hệ thống điện
Qua kinh nghiệm, các chuyên gia sẽ đề ra một tập các luật áp dụng cho một
bài tốn cho trước. Ví dụ tập luật trong hệ thống chẩn đốn hỏng hóc xe ô tô.
Điều này giúp giải quyết các trường hợp mà khi chỉ với các luật riêng, ta không
thể lập luận và giải quyết cho một vấn đề.

Hình 2.2. Tập các luật liên quan đến việc hỏng xe

Một nhu cầu đặt ra trong các hệ thống tri thức là sự hợp tác giữa các chuyên
gia. Trên phương diện tổ chức hệ thống, ta có thể sử dụng một cấu trúc được gọi
là bảng đen, dùng để liên kết thông tin giữa các luật tách biệt, thông qua các
module với các nhiệm vụ tách biệt. Dạng hệ thống này được Erman đưa ra lần
đầu tiên vào năm 1980 áp dụng cho hệ chuyên gia hiểu biết tiếng nói
HEARSAY-II.
Vấn đề tối ưu luật
Tập các luật trong một cơ sở tri thức rất có khả năng thừa, trùng lắp hoặc mâu

thuẫn. Dĩ nhiên là hệ thống có thể đổ lỗi cho người dùng về việc đưa vào hệ
thống những tri thức như vậy. Tuy việc tối ưu một cơ sở tri thức về mặt tổng qt
là một thao tác khó (vì giữa các tri thức thường có quan hệ khơng tường minh),

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 14


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

nhưng trong giới hạn cơ sở tri thức dưới dạng luật, ta vẫn có một số thuật tốn
đơn giản để loại bỏ các vấn đề này.
Rút gọn bên phải
Luật sau hiển nhiên đúng :
A  B  A (1)
Do đó luật
ABAC
Là hồn tồn tương đương với
ABC
Quy tắc rút gọn : Có thể loại bỏ những sự kiện bên vế phải nếu những sự kiện
đó đã xuất hiện bên vế trái. Nếu sau khi rút gọn mà vế phải trở thành rỗng thì luật
đó là luật hiển nhiên. Ta có thể loại bỏ các luật hiển nhiên ra khỏi tri thức.
Rút gọn bên trái
Xét các luật :
(L1) A, B  C (L2) A  C (L3) C  X
Rõ ràng là luật A, B  C có thể được thay thế bằng luật A  C mà không làm
ảnh hưởng đến các kết luận trong mọi trường hợp. Ta nói rằng sự kiện B trong
luật (1) là dư thừa và có thể được loại bỏ khỏi luật dẫn trên.
Phân rã và kết hợp luật

Luật A  B  C
Tương đương với hai luật
AC
BC
Với quy tắc này, ta có thể loại bỏ hồn tồn các luật có phép nối HOẶC. Các
luật có phép nối này thường làm cho thao tác xử lý trở nên phức tạp.
Luật thừa
Một luật dẫn A  B được gọi là thừa nếu có thể suy ra luật này từ những luật
cịn lại.
Ví dụ: trong tập các luật gồm {A  B, B  C, A  C} thì luật thứ 3 là luật
thừa vì nó có thể được suy ra từ 2 luật còn lại.
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 15


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Ưu và nhược điểm
Ưu điểm
Biểu diễn tri thức bằng luật đặc biệt hữu hiệu trong những tình huống hệ thống
cần đưa ra những hành động dựa vào những sự kiện có thể quan sát được. Nó có
những ưu điểm chính yếu sau đây :



Các luật rất dễ hiểu nên có thể dễ dàng dùng để trao đổi với

người dùng (vì nó là một trong những dạng tự nhiên của ngơn ngữ).



Có thể dễ dàng xây dựng được cơ chế suy luận và giải thích

từ các luật.


Việc hiệu chỉnh và bảo trì hệ thống là tương đối dễ dàng.



Có thể cải tiến dễ dàng để tích hợp các luật mờ.



Các luật thường ít phụ thuộc vào nhau.

Nhược điểm
Các tri thức phức tạp đơi lúc địi hỏi q nhiều (hàng ngàn) luật sinh. Điều
này sẽ làm nảy sinh nhiều vấn đề liên quan đến tốc độ lẫn quản trị hệ thống.
Thống kê cho thấy, người xây dựng hệ thống trí tuệ nhân tạo thích sử dụng
luật sinh hơn tất cả phương pháp khác (dễ hiểu, dễ cài đặt) nên họ thường tìm
mọi cách để biểu diễn tri thức bằng luật sinh cho dù có phương pháp khác thích
hợp hơn! Đây là nhược điểm mang tính chủ quan của con người.
Cơ sở tri thức luật sinh lớn sẽ làm giới hạn khả năng tìm kiếm của chương
trình điều khiển. Nhiều hệ thống gặp khó khăn trong việc đánh giá các hệ dựa
trên luật sinh cũng như gặp khó khăn khi suy luận trên luật sinh.

Đối tượng-thuộc tính-giá trị
Cơ chế tổ chức nhận thức của con người thường được xây dựng dựa trên các
sự kiện (fact), xem như các đơn vị cơ bản nhất. Một sự kiện là một dạng tri thức

khai báo. Nó cung cấp một số hiểu biết về một biến cố hay một vấn đề nào đó.
Một sự kiện có thể được dùng để xác nhận giá trị của một thuộc tính xác định
của một vài đối tượng. Ví dụ, mệnh đề "quả bóng màu đỏ" xác nhận "đỏ" là giá
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 16


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

trị thuộc tính "màu" của đối tượng "quả bóng". Kiểu sự kiện này được gọi là bộ
ba Đối tượng-Thuộc tính-Giá trị (O-A-V – Object-Attribute-Value).

Hình 2.3: Biểu diễn tri thức theo bộ ba O-A-V

Một O-A-V là một loại mệnh đề phức tạp. Nó chia một phát biểu cho trước
thành ba phần riêng biệt: đối tượng, thuộc tính, giá trị thuộc tính. Hình 0.1 minh
họa cấu trúc bộ ba O-A-V.
Trong các sự kiện O-A-V, một đối tượng có thể có nhiều thuộc tính với các
kiểu giá trị khác nhau. Hơn nữa một thuộc tính cũng có thể có một hay nhiều giá
trị. Chúng được gọi là các sự kiện đơn trị (single-valued) hoặc đa trị (multivalued). Điều này cho phép các hệ tri thức linh động trong việc biểu diễn các tri
thức cần thiết.
Các sự kiện không phải lúc nào cũng bảo đảm là đúng hay sai với độ chắc
chắn hoàn tồn. Ví thế, khi xem xét các sự kiện, người ta còn sử dụng thêm một
khái niệm là độ tin cậy. Phương pháp truyền thống để quản lý thông tin không
chắc chắn là sử dụng nhân tố chắc chắn CF (certainly factor). Khái niệm này bắt
đầu từ hệ thống MYCIN (khoảng năm 1975), dùng để trả lời cho các thông tin
suy luận. Khi đó, trong sự kiện O-A-V sẽ có thêm một giá trị xác định độ tin cậy
của nó là CF.
Ngồi ra, khi các sự kiện mang tính "nhập nhằng", việc biểu diễn tri thức cần

dựa vào một kỹ thuật, gọi là logic mờ (do Zadeh đưa ra năm 1965). Các thuật
ngữ nhập nhằng được thể hiện, lượng hoá trong tập mờ.

2.3 Mạng ngữ nghĩa
Mạng ngữ nghĩa là một phương pháp biểu diễn tri thức dùng đồ thị trong
đó nút biểu diễn đối tượng và cung biểu diễn quan hệ giữa các đối tượng.
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 17


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Hình 2.4. "Sẻ là Chim" thể hiện trên mạng ngữ nghĩa

Người ta có thể nới rộng mạng ngữ nghĩa bằng cách thêm các nút và nối
chúng vào đồ thị. Các nút mới ứng với các đối tượng bổ sung. Thơng thường có
thể nới rộng mạng ngữ nghĩa theo ba cách:



Thêm một đối tượng tương tự.



Thêm một đối tượng đặc biệt hơn.



Thêm một đối tượng tổng quát hơn


Thứ nhất, thêm "Cánh cụt" thể hiện một loại chim mới. Thứ hai, thêm "Chip"
cũng có nghĩa nó là con "Sẻ" và đồng thời là "Chim". Thứ ba, có thể đưa ra đối
tượng tổng quát như "Con vật". Lúc này, không những có thể biết được rằng
"Chim là Con vật", mà cịn biết "Chip thở bằng khơng khí".

Hình 2.5. Phát triển mạng ngữ nghĩa

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 18


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

Tính chất quan trọng của mạng ngữ nghĩa là tính kế thừa. Nó cho phép các nút
được bổ sung sẽ nhận các thơng tin của các nút đã có trước, và cho phép mã hóa
tri thức một cách dễ dàng.
Để minh họa cho tính kế thừa của mạng ngữ nghĩa, hãy xét một câu hỏi trên
đồ thị. Chẳng hạn tại nút "Chim", người ta muốn hỏi con "Chip" hoạt động như
thế nào? Thông qua cung hoạt động người ta biết được nó bay.

Hình 2.6. Các bước thực hiện phép toán trên mạng ngữ nghĩa

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 19


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC


2.4 Frame - khung
Khái niệm
Một trong các kỹ thuật biểu diễn tri thức là dùng frame, phát triển từ khái
niệm lược đồ. Một lược đồ được coi là khối tri thức điển hình về khái niệm hay
đối tượng nào đó, và gồm cả tri thức thủ tục lẫn tri thức mô tả.
Frame là một cấu trúc dữ liệu chứa đựng tất cả những tri thức liên quan đến
một đối tượng cụ thể nào đó. Frames có liên hệ chặt chẽ đến khái niệm hướng đối
tượng (thực ra frame là nguồn gốc của lập trình hướng đối tượng). Ngược lại với
các phương pháp biểu diễn tri thức đã được đề cập đến, frame "đóng gói" tồn bộ
một đối tượng, tình huống hoặc cả một vấn đề phức tạp thành một thực thể duy
nhất có cấu trúc. Một frame bao hàm trong nó một khối lượng tương đối lớn tri
thức về một đối tượng, sự kiện, vị trí, tình huống hoặc những yếu tố khác. Do đó,
frame có thể giúp ta mô tả khá chi tiết một đối tượng.
Dưới một khía cạnh nào đó, người ta có thể xem phương pháp biểu diễn tri
thức bằng frame chính là nguồn gốc của ngơn ngữ lập trình hướng đối tượng. Ý
tưởng của phương pháp này là "thay vì bắt người dùng sử dụng các công cụ phụ
như dao mở để đồ hộp, ngày nay các hãng sản xuất đồ hộp thường gắn kèm các
nắp mở đồ hộp ngay bên trên vỏ lon. Như vậy, người dùng sẽ không bao giờ phải
lo lắng đến việc tìm một thiết bị để mở đồ hộp nữa!". Cũng vậy, ý tưởng chính
của frame (hay của phương pháp lập trình hướng đối tượng) là khi biểu diễn một
tri thức, ta sẽ "gắn kèm" những thao tác thường gặp trên tri thức này. Chẳng hạn
như khi mô tả khái niệm về hình chữ nhật, ta sẽ gắn kèm cách tính chu vi, diện
tích.
Frame thường được dùng để biểu diễn những tri thức "chuẩn" hoặc những tri
thức được xây dựng dựa trên những kinh nghiệm hoặc các đặc điểm đã được hiểu
biết cặn kẽ. Bộ não của con người chúng ta vẫn luôn "lưu trữ" rất nhiều các tri
thức chung mà khi cần, chúng ta có thể "lấy ra" để vận dụng nó trong những vấn

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016


Page 20


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

đề cần phải giải quyết. Frame là một công cụ thích hợp để biểu diễn những kiểu
tri thức này.
Cấu trúc của frame
Mỗi một frame mô tả một đối tượng (object). Một frame bao gồm 2 thành
phần cơ bản là slot và facet. Một slot là một thuộc tính đặc tả đối tượng được
biểu diễn bởi frame. Ví dụ : trong frame mơ tả xe hơi, có hai slot là trọng lượng
và loại máy.
Mỗi slot có thể chứa một hoặc nhiều facet. Các facet (đôi lúc được gọi là slot
"con") đặc tả một số thông tin hoặc thủ tục liên quan đến thuộc tính được mơ tả
bởi slot. Facet có nhiều loại khác nhau, sau đây là một số facet thường gặp.



Value (giá trị) : cho biết giá trị của thuộc tính đó (như xanh,

đỏ, tím vàng nếu slot là màu xe).


Default (giá trị mặc định) : hệ thống sẽ tự động sử dụng giá trị

trong facet này nếu slot là rỗng (nghĩa là chẳng có đặc tả nào!).
Chẳng hạn trong frame về xe, xét slot về số lượng bánh. Slot này sẽ
có giá trị 4. Nghĩa là, mặc định một chiếc xe hơi sẽ có 4 bánh!



Range (miền giá trị) : (tương tự như kiểu biến), cho biết giá

trị slot có thể nhận những loại giá trị gì (như số ngun, số thực, chữ
cái, ...)


If added : mơ tả một hành động sẽ được thi hành khi một giá

trị trong slot được thêm vào (hoặc được hiệu chỉnh). Thủ tục thường
được viết dưới dạng một script.


If needed : được sử dụng khi slot khơng có giá trị nào. Facet

mơ tả một hàm để tính ra giá trị của slot.
Theo định nghĩa của Minsky (1975), thì frame là cấu trúc dữ liệu để thể hiện
tri thức đa dạng về khái niệm hay đối tượng nào đó.

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 21


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Hình 2.7: Cấu trúc frame

Một frame có hình thức như bảng mẫu, như tờ khai cho phép người ta
điền các ô trống. Cấu trúc cơ bản của frame có tên đối tượng được thể hiện trong

frame, có các trường thuộc tính của đối tượng. Mỗi thuộc tính có một ngăn để
nhập dữ liệu riêng. Các thuộc tính và giá trị thuộc tính tạo nên danh sách các
mệnh đề O-A-V, cho phép thể hiện đầy đủ về đối tượng.
Một frame lớp thể hiện các tính chất tổng quát của tập các đối tượng
chung. Chẳng hạn người ta cần mơ tả các tính chất tổng qt như bay, có cánh,
sống tự do,… của cả lồi chim.
Để mơ tả một biểu diễn của frame lớp, ta dùng một dạng frame khác, gọi
là frame thể hiện. Khi tạo ra thể hiện của một lớp, frame này kế thừa tính chất và
giá trị của lớp. Có thể thay đổi giá trị để phù hợp với biễu diễn cụ thể. Thậm chí,
ta cũng có thể thêm các tính chất khác đối với frame thể hiện.
Cũng như tính chất kế thừa giữa các đối tượng trong mạng ngữ nghĩa,
frame thể hiện nhận giá trị kế thừa từ frame lớp. Khi tạo một frame thể hiện,
người ta khẳng định frame đó là thể hiện của một frame lớp. Khẳng định này cho
phép nó kế thừa các thơng tin từ frame lớp.

Hình 2.8. Nhiều mức của frame mô tả quan hệ phức tạp hơn
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 22


BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

Ngoài các frame lớp đơn giản và các thể hiện gắn với nó, người ta có thể tạo
ra cấu trúc frame phức tạp. Ví dụ, dùng cấu trúc phân cấp các frame để mơ tả thế
giới lồi chim. Cấu trúc này tổ chức khái niệm về chim theo các mức trừu tượng
khác nhau. Frame ở mức cao mang thông tin chung về tất cả lồi chim. Mức giữa
có frame lớp con, mang thơng tin đặc thù hơn của nhóm chim. Mức cuối cùng là
frame thể hiện, ứng với đối tượng cụ thể.
Frame : XE HƠI

Thuộc lớp : phương tiện vận chuyển.
Tên nhà sản xuất : Audi
Quốc gia của nhà sản xuất : Đức
Model

: 5000 Turbo

Loại xe : Sedan
Trọng lượng : 3300lb
Số lượng cửa : 4 (default)
Hộp số : 3 số tự động
Số lượng bánh : 4 (default)
Máy (tham chiếu đến frame Máy)

Frame MÁY
Xy-lanh : 3.19 inch
Tỷ lệ nén : 3.4 inche
Xăng : TurboCharger
Mã lực : 140 hp

Kiểu : In-line, overhead cam
Số xy-lanh : 5
Khả năng tăng tốc
0-60 : 10.4 giây
¼ dặm : 17.1 giây, 85 mph.

Tính kế thừa
Trong thực tế, một hệ thống trí tuệ nhân tạo thường sử dụng nhiều frame
được liên kết với nhau theo một cách nào đó. Một trong những điểm thú vị của
frame là tính phân cấp. Đặc tính này cho phép kế thừa các tính chất giữa các

frame.

HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 23


BÀI THU HOẠCH MÔN HỌC: PHƯƠNG PHÁP NGHIÊN CỨU KHOA HỌC TRONG TIN HỌC

Hình sau đây cho thấy cấu trúc phân cấp của các loại hình hình học cơ bản.
Gốc của cây ở trên cùng tương ứng với mức độ trừu tượng cao nhất. Các frame
nằm ở dưới cùng (không có frame con nào) gọi là lá. Những frame nằm ở mức
thấp hơn có thể thừa kế tất cả những tính chất của những frame cao hơn.
Các frame cha sẽ cung cấp những mô tả tổng quát về thực thể. Frame có cấp
càng cao thì mức độ tổng qt càng cao. Thông thường, frame cha sẽ bao gồm
các định nghĩa của các thuộc tính. Cịn các frame con sẽ chứa đựng giá trị thực
sự của các thuộc tính này.

Hình 2.8: Phân cấp cha con

Ví dụ tiêu biểu
Một ví dụ biểu diễn các đối tượng hình học bằng frame :
Các kiểu dữ liệu cơ bản :
Area : numeric; // diện tích
Height : numeric; //chiều cao
Perimeter : numberic; //chu vi
Side : numeric; //cạnh
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 24



BÀI THU HOẠCH MÔN HỌC: CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG

Diagonal : numeric; //đường chéo
Radius : numeric; //bán kính
Angle : numeric; //góc
Diameter : numeric; //đường kính
pi : (val:numeric = 3.14159)
Frame : CIRCLE (hình trịn)
r : radius;
s : area;
p : perimeter;
d : diameter;
d = 2  r;
s = pi  r2;
p = 2  pi  r;
Frame RECTANGLE (hình chữ nhật)
b1 : side;
b2 : side;
s : area;
p : perimeter;
s = b1  b2;
p = 2  (b1+b2);
d2 = b12 + b22;
Frame SQUARE (hình vng)
Là : RECTANGLE
b1 = b2;
Frame RHOMBUS (hình thoi)
b : side;

d1 : diagonal;
d2 : diagonal;
s : area;
p : perimeter;
HỌC VIÊN THỰC HIỆN: NGUYỄN VĂN KHOA – MSHV: CH1101016

Page 25


×