Tải bản đầy đủ (.doc) (31 trang)

XÂY DỰNG HỆ CHUYÊN GIA TƯ VẤN CHO NGƯỜI DÙNG HỌC TIẾNG ANH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (388.42 KB, 31 trang )

Biểu diễn tri thức và ứng dụng 2012
MỤC LỤC
L I CÁM NỜ Ơ 1
L I M UỜ Ở ĐẦ 2
GI I THI UỚ Ệ 4
PH N 1: C S LÝ LU NẦ Ơ Ở Ậ 5
1.2 H c s tri th c:ệ ơ ở ứ 11
1.2.1 Phân lo i tri th c:ạ ứ 11
1.2.3 Các k thu t bi u di n tri th c:ỹ ậ ể ễ ứ 13
1.2.3.1 Bi u di n tri th c b ng b ba OAV (Object – Attribute – Value):ể ễ ứ ằ ộ 13
1.2.3.2 Bi u di n tri th c b ng lu t s n xu t:ể ễ ứ ằ ậ ả ấ 13
1.2.3.3 Bi u di n tri th c b ng m ng ng ngh a:ể ễ ứ ằ ạ ữ ĩ 14
1.2.3.4 Bi u di n tri th c b ng Frame:ể ễ ứ ằ 14
1.2.3.5 Bi u di n tri th c b ng Logic:ể ễ ứ ằ 14
1.3 Khái ni m v h chuyên gia:ệ ề ệ 16
1.3.1 c tr ng c a h chuyên giaĐặ ư ủ ệ 17
1.3.2 Suy di n trong h chuyên gia:ễ ệ 20
1.3.2.1 Suy di n ti n:ễ ế 20
1.3.2.2 Suy di n lùi:ễ 21
1.3.2.3 Chi n l c gi i quy t đ ng đ trong quá trình suy di n:ế ượ ả ế ụ ộ ễ 21
1.3.2.4 H chuyên gia m (Fuzzy Expert System):ệ ờ 22
1.3.3 Bi u di n tri th c trong các h chuyên giaể ễ ứ ệ 23
1.3.3.1 Logic m nh đ :ệ ề 23
1.3.3.2 Logic v t :ị ừ 23
PH N 2: XÂY D NG H CHUYÊN GIA T V N CHO NG I DÙNG H C TI NGẦ Ự Ệ Ư Ấ ƯỜ Ọ Ế
ANH 26
2.1 Gi i thi u h th ng:ớ ệ ệ ố 26
2.2 Phân tích: 26
2.3 Ki n trúc h th ngế ệ ố 27
28
2.5 Mã ngu n h th ng t v n h c Anh v n:ồ ệ ố ư ấ ọ ă 29


K T LU NẾ Ậ 30
TÀI LI U THAM KH OỆ Ả 31
LỜI CÁM ƠN

1 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Trong thời gian thực hiện đề tài, em đã nhận được rất nhiều sự động viên,
khích lệ và hỗ trợ từ phía thầy cô, cha mẹ và bạn bè.
Con xin gửi tất cả lòng biết ơn và sự kính trọng của con đến cha mẹ cùng
toàn thể gia đình, những người đã sinh thành, dưỡng dục và luôn ở bên con, ủng
hộ và giúp đỡ con trong quá trình học tập.
Em cảm ơn khoa Công nghệ Thông tin, trường Đại học Công nghệ Thông tin
đã tạo điều kiện cho em thực hiện đề tài.
Em xin gửi lời cảm ơn tới các thầy cô trong khoa công nghệ thông tin nói
chung, bộ môn khoa học máy tính nói riêng đã tạo điều kiện giúp đỡ, truyền đạt
những kiến thức và kỹ năng cần thiết để em hoàn thành nhiệm vụ học tập của
mình.
Xin chân thành cảm ơn thầy PGS.TS. Đỗ Văn Nhơn đã tận tình giảng dạy và
hướng dẫn để em hoàn thành đề tài này. Em cũng xin chân thành cảm ơn các bạn
trong lớp đã động viên và chia sẻ kinh nghiệm trong học tập nghiên cứu và giúp
đỡ trong quá trình làm đề tài. Tuy nhiên vì thời gian cũng như tri thức còn hạn
chế, nên đề tài không tránh khỏi những thiếu sót nhất định. Rất mong nhận được
mọi sự đóng góp ý kiến từ quý thầy cô và bạn bè.
LỜI MỞ ĐẦU

2 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Chúng ta đang sống trong thời đại của thông tin nơi mà dữ liệu đa dạng và

phong phú. Chúng ta thường bị choáng ngợp bởi lượng thông tin vô cùng to lớn và
do đó không thể tiếp nhận tất cả những lợi ích mà thông tin mang tới. Khoa học
máy tính đã bị thách thức để khám phá ra những cách tiếp cận mà có thể sắp xếp
được núi dữ liệu hiện có và tìm ra những đặc trưng thiết yếu cần có để phục vụ
cho lợi ích của con người. Những cách tiếp cận này phải có thể xử lí những lượng
lớn dữ liệu trong thời gian nhanh và loại bỏ những dữ liệu không liên quan hay
không chính xác để trích xuất ra những thông tin, tri thức quý báu cho chúng ta.
Trong bối cảnh thông tin đang bùng nổ như hiện nay. Khai thác và ứng dụng
thông tin sao cho có hiểu quả là điều cần thiết. Các cơ quan, tổ chức đều mong
muốn có được càng nhiều thông tin về lĩnh vực mình hoạt động càng tốt: các
khách hàng tiềm năng, hoạt động cạnh tranh giữa các công ty, biến động của thị
trường…
Ngoài ra, thông tin cũng sẽ không giúp ích được nhiều nếu như người nắm giữ
thông tin không biết khai thác nó. Bản thân thông tin mang những hiện tượng và
xu hướng phổ biến. Nếu nắm được các hiện tượng, xu hướng phổ biến này, chúng
sẽ hoạt động hiệu quả nhất trong tất cả các lĩnh vực như kinh tế, xã hội, chính
trị…,vì ai có được thông tin và khai thác thông tin nhanh chính xác và hiệu quả
nhất sẽ là người chiến thắng.
Tuy nhiên, trong thời đại của công nghệ thông tin nơi mà dữ liệu đa dạng và
phong phú. Người dùng thường bị choáng ngợp bởi lượng thông tin vô cùng to lớn
và do đó không thể tiếp nhận tất cả những lợi ích mà thông tin mang tới. Khoa học
máy tính đã bị thách thức để khám phá ra những cách tiếp cận mà có thể sắp xếp,
biểu diễn được lượng dữ liệu vô tận hiện có và tìm ra những đặc trưng thiết yếu
cần có để phục vụ cho lợi ích của người dùng. Những cách tiếp cận này phải có
thể xử lí những lượng lớn dữ liệu trong thời gian nhanh và loại bỏ những dữ liệu
không liên quan hay không chính xác để trích xuất ra những thông tin, tri thức quý
báu cho chúng ta.
3 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012

Xin chân thành cảm ơn thầy PGS.TS. Đỗ Văn Nhơn đã tận tình giảng dạy và
hướng dẫn để em hoàn thành bài thu hoạch này. Em cũng xin chân thành cảm ơn
các bạn trong lớp đã động viên và chia sẻ kinh nghiệm trong học tập nghiên cứu
và giúp đỡ trong quá trình làm bài thu hoạch. Tuy nhiên vì thời gian cũng như tri
thức còn hạn chế, nên bài thu hoạch không tránh khỏi những thiếu sót nhất định.
Rất mong nhận được mọi sự đóng góp ý kiến từ quý thầy cô và bạn bè.
GIỚI THIỆU
4 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Sau hơn 20 năm thực hiện đường lối đổi mới kinh tế của Đảng và Nhà nước,
nền kinh tế nước ta đã đạt được nhiều thành tựu đáng kể, cơ cấu kinh tế đã có sự
chuyển dịch căn bản và tích cực theo hướng công nghiệp hoá, hiện đại hoá.Với
những tác động mạnh mẽ của các tiến bộ khoa học và công nghệ, đặc biệt là công
nghệ thông tin và truyền thông, thế giới đang biến chuyển tới một nền kinh tế và
xã hội mới mà thông tin và tri thức được xem là nguồn lực chủ yếu. Điều đó xuất
phát từ: Công cuộc đổi mới bắt đầu năm 1986 đã tác động tích cực đến nhiều
ngành kinh tế và do hội nhập kinh tế thế giới, đặc biệt năm 2006 nước ta gia nhập
tổ chức Thương mại thế giới – WTO đã mở cửa nền kinh tế tạo ra nhiều cơ hội
phát triển, đồng thời đặt nền kinh tế nước ta trước vô vàn thử thách.
Hòa nhập vào sự phát triển chung của nhân loại, Việt Nam đang bước vào một
thời kì phát triển mới – thời kì đẩy mạnh công nghiệp hóa - hiện đại hóa. Bên cạnh
thành tựu đã đạt được, chúng ta còn nhiều khó khăn, hạn chế cần khắc phục. Cụ
thể là trình độ công nghệ thông tin còn lạc hậu, tiềm lực khoa học công nghệ thông
tin yếu cả về nguồn nhân lực lẫn nguồn vốn cho hoạt động khoa học công nghệ
thông tin, cơ chế quản lý công nghệ thông tin còn yếu kém, ứng dụng vào thực tế
chưa cao. Chính vì vậy việc áp dụng công nghệ thông tin vào công cuộc đổi mới
nền kinh tế nước ta là tất yếu.
Để đáp ứng nhu cầu của người dùng đối với máy tính ngày một cao hơn và
biết áp dụng hữu hiệu vào đời sống thì biểu diễn tri thức đóng vai trò hết sức quan

trọng trong việc phát triển Công nghệ thông tin, nâng cao sự hữu dụng của máy
tính, giúp con người gần gũi với máy tính hơn. Ngoài ra, biểu diễn tri thức còn góp
phần thúc đẩy nhiều ngành khoa học khác phát triển, khả năng phát triển khoa học
dựa trên tri thức liên ngành.

PHẦN 1: CƠ SỞ LÝ LUẬN
5 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
1.1 Biểu diễn tri thức
1.1.1 Giới thiệu về biểu diễn tri thức
Biểu diễn tri thức (KR) là một lĩnh vực nghiên cứu trí tuệ nhân tạo nhằm mục đích
đại diện cho kiến thức trong các biểu tượng để tạo điều kiện suy ra từ những yếu
tố kiến thức, tạo ra những yếu tố mới của kiến thức. KR có thể được thực hiện cho
được độc lập của mô hình kiến thức cơ bản hoặc hệ thống cơ sở tri thức (KBS)
như một mạng lưới ngữ nghĩa.
Biểu diễn tri thức (KR) nghiên cứu liên quan đến phân tích làm thế nào để lý do
chính xác và hiệu quả và làm thế nào tốt nhất để sử dụng một tập hợp các biểu
tượng đại diện cho một tập hợp các sự kiện trong một lĩnh vực kiến thức. Vốn từ
vựng biểu tượng và một hệ thống logic được kết hợp để cho phép suy luận về các
yếu tố trong KR để tạo mới câu KR. Logic được sử dụng để cung cấp ngữ nghĩa
chính thức của chức năng có lý nên được áp dụng cho các biểu tượng trong hệ
thống KR. Logic là cũng được sử dụng để xác định các toán tử có thể xử lý như
thế nào và thay đổi hình dáng kiến thức. Ví dụ các toán tử bao gồm: phủ định, kết
hợp, trạng từ, tính từ, lượng hóa và phương thức khai thác. Logic là lý thuyết giải
thích. Những yếu tố-biểu tượng, các toán tử, và giải thích lý thuyết là những gì
cung cấp cho trình tự của các biểu tượng có nghĩa là trong một KR.
Trong việc áp dụng hệ thống KR vấn đề thực tế, sự phức tạp của vấn đề có thể
vượt quá hạn chế nguồn lực, khả năng của hệ thống KR. Phát triển gần đây trong
KR bao gồm các khái niệm về Semantic Web, phát triển dựa trên ngôn ngữ XML

biểu diễn tri thức và các tiêu chuẩn, Resource Description Framework (RDF),
RDF Schema, Maps Topic, DARPA Agent Markup Language (DAML), Layer
Suy diễn Ontology (OIL),và Web Ontology Language (OWL).
Có một số kỹ thuật KR như: khung (frames), quy định, gắn thẻ, và các mạng ngữ
nghĩa có nguồn gốc trong lĩnh vực khoa học nhận thức. Vì tri thức được sử dụng
để đạt được hành vi thông minh, mục tiêu cơ bản của biểu diễn tri thức là để tạo
6 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
điều kiện cho lý luận, suy luận hoặc kết luận bản vẽ. Một KR tốt phải có cả hai
kiến thức thủ tục và khai báo.
 Vai trò của biểu diễn tri thức (KR):
Một biểu diễn tri thức (KR) về cơ bản là một người đại diện, đại diện cho bản thân
sự vật, được sử dụng để cho phép một tổ chức để xác định hậu quả của suy nghĩ
hơn là hành động, theo lý luận về thế giới chứ không phải là hành động trong đó.
KR là một tập hợp các cam kết bản thể học, trả lời cho câu hỏi: Trong các quan hệ,
tôi nên suy nghĩ gì về thế giới?
KR là một lý thuyết rời rạc của lý luận thông minh, thể hiện về ba thành phần:
quan niệm cơ bản của biểu diễn của lý luận thông minh, tập hợp các suy luận của
các hình thức biểu diễn công nhận và thiết lập các kết luận có khuyến cáo.
KR là một phương tiện để tính toán thực dụng hiệu quả, môi trường tính toán được
thực hiện trong đó tư duy. Một trong những đóng góp hiệu quả này thực tế được
cung cấp bởi các hướng dẫn cơ quan đại diện cung cấp cho tổ chức thông tin để
tạo điều kiện thuận lợi cho việc đưa ra những kết luận đề nghị.
KR là một phương tiện biểu hiện của con người, một ngôn ngữ mà chúng ta nói
những điều về thế giới.
Trong lĩnh vực trí tuệ nhân tạo, giải quyết vấn đề có thể được đơn giản hóa bằng
một sự lựa chọn thích hợp của biểu diễn tri thức. Biểu diễn tri thức trong một số
cách làm cho một số vấn đề dễ dàng hơn để giải quyết. Ví dụ, nó được dễ dàng
hơn để phân chia số đại diện trong các chữ số Hindu-Arabic hơn số biểu diễn như

là chữ số La Mã.
1.1.2 Đặc điểm cơ bản về biểu diễn tri thức
7 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Bao phủ (coverage), KR bao gồm một bề rộng và chiều sâu của thông tin. Nếu
không có một phạm vi bao phủ rộng, KR không có thể xác định bất cứ điều gì
hoặc giải quyết không rõ ràng.
Dễ hiểu bởi con người. KR được xem như là một ngôn ngữ tự nhiên. Nó sẽ hỗ trợ
mô đun và phân cấp các lớp (gấu Bắc cực là gấu, là động vật).
Nhất quán. Nếu Linh mở cửa, nó cũng có thể được hiểu như là cánh cửa đã mở
cửa bởi Linh. Bằng cách phù hợp, KR có thể loại bỏ kiến thức dư thừa hoặc xung
đột.
Hiệu quả
Dễ sửa đổi và cập nhật.
Hỗ trợ các hoạt động thông minh sử dụng cơ sở tri thức.
1.1.3 Ảnh hưởng của Bản thể học (Ontology)
Bản thể học giúp xây dựng mô hình của một lĩnh vực và xác định các thuật
ngữ bên trong lĩnh vực và các mối liên hệ giữa chúng. Có nhiều kiểu khác nhau về
bản thể học bao gồm các bản thể học lĩnh vực, các bản thể học tổng quát, các bản
thể học ứng dụng, và các bản thể học tượng trưng.
Trong khi phân loại tri thức, lưu trữ, truy xuất và quản trị thông tin thì nó
không chỉ hữu ích cho việc giải quyết vấn đề không trực tiếp cần chuyên môn loài
người mà còn đưa đến các kết quả “Quản trị tri thức” cho phép một tổ chức thực
hiện chức năng một cách hiệu quả trong một thời gian dài.
1.1.4 Hướng tiếp cận biểu diễn tri thức để hiểu ngôn ngữ tự nhiên
Mô tả nghiên cứu sơ bộ hướng tiếp cận biểu diễn tri thức với việc hiểu Ngôn
ngữ tự nhiên (Natural Language Understanding - NLU). Một hệ thống máy tính
đang được phát triển để xử lý sự thu nhận, sự mô tả, và sử dụng ngôn ngữ tri thức.
8 GVHD: PGS.TS.Đỗ Văn Nhơn

Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Hệ thống máy tính được dựa trên nguyên tắc và sử dụng một mạng ngữ nghĩa cho
việc lưu trữ và mô tả tri thức. Để tạo điều kiện tương tác giữa người dùng và hệ
thống, đầu vào của ngôn ngữ học tri thức và các phản ứng máy tính nằm trong
ngôn ngữ tự nhiên. Nhiều loại tri thức khác nhau có thể được nhập và sử dụng: cú
pháp và ngữ nghĩa; các xác nhận và quy tắc. Sự dễ dàng truy vết suy luận cũng
đang được phát triển như là một phần của hệ thống dựa trên nguyên tắc với đầu ra
trong ngôn ngữ tự nhiên.
 Các hệ thống Ngôn ngữ tự nhiên (NL) bao gồm hai thành phần logic là:
Một cơ sở cho đầu vào của ngôn ngữ tri thức vào mạng ngữ nghĩa trong ngôn
ngữ tự nhiên. Ngôn ngữ tri thức này chủ yếu là bao gồm các quy tắc về NLU và
một từ vựng. Hệ thống NL chứa một quy tắc cốt lõi của mạng mà phân tích một
quy tắc ngôn ngữ tự nhiên của người sử dụng và xây dựng cấu trúc cú pháp tương
ứng dưới hình thức của một quy tắc mạng. Cơ sở hệ thống NL này cho phép người
dùng thao tác cả các khía cạnh cú pháp và ngữ nghĩa của các chuỗi bề mặt .
Một cơ sở cho cụm từ, câu tổng quát và câu trả lời thông qua các quy tắc
trong mạng. Người dùng có thể đặt ra một số giới hạn các loại truy vấn đến hệ
thống bằng ngôn ngữ tự nhiên và hệ thống sử dụng các quy tắc để phân tích truy
vấn và tạo ra một trả lời. Một truy vết suy luận cơ sở cũng đang được phát triển
trong đó sử dụng khả năng tạo cụm từ, câu. Điều này cho phép người sử dụng truy
vết quy trình suy luận mà kết quả từ kích hoạt các quy tắc của mình bằng ngôn
ngữ tự nhiên.
Khi một người sử dụng hệ thống NL này cho sự thử nghiệm, thì có hai miền
tác vụ thuộc về mạng ngữ nghĩa. Các miền này là: (1) Miền NLU bao gồm tập hợp
các mệnh đề và quy định liên quan đến sự hiểu ngôn ngữ tự nhiên, bao gồm cả các
quy tắc và các xác nhận cốt lõi của hệ thống NL, và các quy tắc và các xác nhận
cụ thể của người sử dụng; và (2) các miền tri thức mà người dùng nhập vào và
tương tác thông qua các miền NLU.
9 GVHD: PGS.TS.Đỗ Văn Nhơn

Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Cách tiếp cận KR đến một tác vụ trí tuệ nhân tạo bao gồm một liên kết chặt
chẽ với một chuyên gia trong phạm vi tác vụ. Điều này đòi hỏi phải làm cho nó dễ
dàng cho các chuyên gia để thêm tri thức mới vào hệ thống máy tính, để hiểu
những tri thức gì đang có trong hệ thống, và để hiểu làm thế nào hệ thống hoàn
thành được tác vụ, vì vậy những thay đổi cần thiết và các sửa chữa dễ dàng nhận
ra và thực hiện. Cần lưu ý rằng phạm vi tác vụ của chúng ta là NLU (Natural
Language Understanding). Điều đó là, các tri thức trong hệ thống là tri thức về
NLU và chuyên gia dự định là một chuyên gia trong NLU.
Hệ thống KR chúng ta đang sử dụng là hệ thống xử lý mạng ngữ nghĩa
SNePS. Hệ thống này là một hệ thống mạng ngữ nghĩa, trong đó tất cả tri thức,
bao gồm cả quy tắc, được đặc trưng là các nút trong một mạng lưới ngữ nghĩa,
một hệ thống suy luận thực hiện lập luận theo các quy định được lưu trữ trong
mạng và một gói truy xuất cho phép người dùng đi theo lập luận của hệ thống.
Một phần chủ yếu của nghiên cứu này bao gồm việc thiết kế và thực thi một
hệ thống dựa trên SNePS được gọi là các hệ thống NL, để cho phép các chuyên
gia NLU nhập ngôn ngữ học tri thức vào mạng trong ngôn ngữ tự nhiên và để sử
dụng tri thức này cho việc xử lý văn bản bao gồm cả bổ sung tri thức NLU.
Những tính năng này phân biệt hệ thống của chúng ta từ các hệ thống dựa trên
nguyên tắc xử lý ngôn ngữ tự nhiên khác như là của Pereira và Warren và
Robinson.
Một trong những mối quan tâm chính khác là tri thức thu được, gồm cả các
quy định và xác nhận thực tế của lập luận. Vì cả hai loại tri thức được lưu trữ dưới
hình thức tương tự trong mạng ngữ nghĩa, hệ thống NL của chúng ta đang được
phát triển với khả năng xử lý các đầu vào của cả hai loại tri thức và với tri thức
mới này ngay lập tức có sẵn để sử dụng.
10 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012

1.2 Hệ cơ sở tri thức:
Hệ cơ sở tri thức là chương trình được thiết kế để mô hình hóa giải quyết vấn
đề của chuyên gia con người.
Hệ cơ sở tri thức là hệ thống dựa trên tri thức, cho phép mô hình hóa các tri
thức của chuyên gia, dùng tri thức này để giải quyết vấn đề phức tạp thuộc cùng
lĩnh vực.
Hai yếu tố quan trọng trong hệ cơ sở tri thức là: tri thức chuyên gia và lập
luận, tương ứng với hệ thống có 2 khối chính là cơ sở tri thức và động cơ suy diễn.
Hệ chuyên gia là một loại cơ sở tri thức được thiết kế cho một lĩnh vực ứng dụng
cụ thể.
Hệ chuyên gia làm việc như một chuyên gia thực thụ và cung cấp các ý kiến
dựa trên kinh nghiệm của chuyên gia con người đã được đưa vào hệ chuyên gia.
Cơ sở tri thức: chứa các tri thức chuyên sâu về lĩnh vực như chuyên gia. Cơ sở tri
thức bao gồm: các sự kiện, các luật, các khái niệm và các quan hệ.
Động cơ suy diễn: bộ xử lý theo tri thức theo mô hình hóa theo cách lập luận
của chuyên gia. Động cơ hoạt động trên thông tin về vấn đề đang xét, so sánh với
tri thức lưu trong cơ sở tri thức rồi rút ra kết luận.
Hệ cơ sở tri thức đóng: là những hệ cơ sở tri thức được xây dựng với một số
“tri thức lĩnh vực” ban đầu, và chỉ những tri thức đó mà thôi trong suốt quá trình
hoạt động hay suốt thời gian sống của nó. Ví dụ: kinh dịch, những hệ giải toán…
Hệ cơ sở tri thức mở: là những hệ cơ sở tri thức tiên tiến hơn, nó có khả năng
bổ sung tri thức trong quá trình hoạt động, khám phá. Ví dụ: MYCIN, những hệ
dự báo thời tiết…
Hệ cơ sở tri thức kết hợp: bao gồm sự kết hợp giữa hệ đóng và hệ mở, hệ kết
hợp giữa cơ sở tri thức và cơ sở dữ liệu, hệ kết hợp giữa hệ cơ sở tri thức này với
một hệ cơ sở tri thức khác,…Những hệ cơ sở tri thức kết hợp thường phát triển
mạnh dựa trên tri thức liên ngành. Ví dụ: Kinh dịch, tử vi…
1.2.1 Phân loại tri thức:
11 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương

Biểu diễn tri thức và ứng dụng 2012
Tri thức được phân thành các loại sau:
 Tri thức thủ tục (Procedural knowledge): mô tả cách gì (How) để
giải quyết vấn đề, nó cung cấp định hướng cho cách thực hiện một cái
gì đó.
 Tri thức khai báo (Declarative knowledge): miêu tả cái gì (What)
được biết về vấn đề. Nó bao gồm các mệnh đề đơn giản đúng hoặc sai,
một dãy các mệnh đề mô tả chi tiết một đối tượng hay một khái niệm
nào đó.
 Siêu tri thức (Meta knowledge): là tri thức giúp hệ thống lấy ra các
tri thức thích hợp. Nó còn gọi là tri thức về tri thức (Knowledge about
knowledge).
 Tri thức Heuristic (Heuristic knowledge): dẫn đường cho tiến trình
lập luận. Tri thức này còn gọi là tri thức bóng (Shallow knowledge).
Nó dựa vào kinh nghiệm và tri thức có được nhờ giải quyết những vấn
đề trước đó.
 Tri thức cấu trúc (Structural knowledge): bao gồm các tập luật, đối
tượng và quan hệ giữa các đối tượng. Loại tri thức này mô tả mô hình
trí tuệ tổng quát của các chuyên gia con người.
1.2.2 Phương pháp tiếp nhận tri thức:
• Thụ động:
- Gián tiếp: Những tri thức kinh điển.
- Trực tiếp: Những tri thức kinh nghiệm (không kinh điển) do
“chuyên gia lĩnh vực” đưa ra.
• Chủ động:
- Đối với những tri thức tiềm ẩn, không rõ ràng hệ thống phải tự
phân tích, suy diễn, khám phá để có thêm tri thức mới.
12 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012

1.2.3 Các kỹ thuật biểu diễn tri thức:
Biểu diễn tri thức là phương pháp dùng để mã hoá tri thức trong cơ sở tri
thức của hệ thống. Các phương pháp biểu diễn tri thức phổ biến:
1.2.3.1 Biểu diễn tri thức bằng bộ ba OAV (Object – Attribute – Value):
Phương pháp biểu diễn này chỉ ra rằng “Đối tượng” với “Thuộc tính” đã
cho có một “Giá trị” nào đó. Ví dụ:
Với phát biểu “Cuốn tập dày 200 trang” thì bộ ba OAV có dạng:
(Cuốn tập, độ dày, 200 trang).
Để mô tả độ tin cậy hay độ chắc chắn của sự kiện thì bộ ba OAV được mở
rộng thành O – A – V – CF. Trong đó CF là chỉ số Độ chắc chắn (Certainty
Factor) có giá trị từ -1 đến 1. Ví dụ:
Với bộ: (Cuốn tập, độ dày, 200 trang, 0.5) thì phát biểu tương ứng sẽ là:
Cuốn tập gần như chắc chắn dày 200 trang.
1.2.3.2 Biểu diễn tri thức bằng luật sản xuất:
Luật là cấu trúc tri thức dùng để liên kết thông tin đã biết với các thông tin
khác giúp đưa ra các suy luận, kết luận từ những thông tin đã biết.
Trong hệ thống dựa trên các luật, người ta thu thập các tri thức lĩnh vực trong một
tập và lưu chúng trong cơ sở tri thức của hệ thống. Hệ thống dùng các luật này
cùng với các thông tin trong bộ nhớ để giải quyết bài toán. Việc xử lý các luật
trong hệ thống dựa trên các luật được quản lý bằng một module gọi là bộ suy diễn.
Trong phương pháp này, tri thức được biểu diễn dưới dạng các luật có
dạng:
IF {Tập các giả thiết} THEN {Tập các kết luận} CF.
Giá trị CF cho biết độ chính xác của quan hệ giữa các sự kiện trong tập giả
thiết và các sự kiện trong tập kết luận của luật.
13 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
1.2.3.3 Biểu diễn tri thức bằng mạng ngữ nghĩa:
Mạng ngữ nghĩa là một phương pháp biểu diễn tri thức dùng đồ thị trong đó

nút biểu diễn đối tượng và cung biểu diễn quan hệ giữa các đối tượng.
Phương pháp này biểu diễn tri thức sử dụng đồ thị gồm các nút và các cung.
Trong đó, các nút biểu diễn các đối tượng và các cung biểu diễn mối quan hệ giữa
chúng.
Ví dụ:
Hình 1. Mạng ngữ nghĩa cho xe wave S
1.2.3.4 Biểu diễn tri thức bằng Frame:
Đây là phương pháp biểu diễn kết hợp của biểu diễn mô tả và biểu diễn thủ
tục.
1.2.3.5 Biểu diễn tri thức bằng Logic:
Trong biểu diễn tri thức bằng Logic, dạng chuẩn phổ biến cho các luật suy
dẫn là Dạng chuẩn Horn:
Một luật suy dẫn ở dạng chuẩn Horn được biểu diễn như sau:
p1∩…∩pn → q1U…Uqn
Trường hợp 1: n = 0, m = 1; Luật có dạng:
ٱ → q = F(t1,…,tk)
14 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Wave
S
Xe
máy
17
triệu
VND
97 cm
khối

Dung tích
xi lanh

Giá thành
Biểu diễn tri thức và ứng dụng 2012
Ở đây F(.) có thể màn ngữ nghĩa khác nhau tuỳ thuộc vào các trường hợp
cụ thể. Trong trường hợp đơn giản nhất, F(t1,…,tk) biểu diễn một sự kiện là có
một đối tượng với các giá trị thuộc tính t1,…,tk trong cơ sở dữ liệu.
Ngược lại, nếu ti là biến thì biểu diễn F(t1,…,tk) tương ứng với một tập các
sự kiện.
Trường hợp 2: n ≥ 1, m = 0; Luật có dạng:
p1∩…∩pn → ٱ
D ạng biểu diễn này dùng để diễn đạt một khẳng định là các sự kiện p1,…,pn
dẫn tới mâu thuẫn.
Trường hợp 3: n ≥ 1, m = 1; Luật có dạng
p1∩…∩pn → q
Diễn giải như sau: Nếu như đã biết rằng các sự kiện p1,…,pn đúng (hay tồn
tại) thì sự kiện q cũng đúng (hay tồn tại).
Trường hợp 4: n ≥ 1, m > 1; Đây là dạng tổng quát nhất
p1∩…∩pn → q1U…Uqn
Luật ở dạng này tương đương với tập gồm m luật như sau:
p1∩…∩pn∩ ¬q2∩…∩¬qm → q1
p1∩…∩pn∩ ¬q1∩ ¬q3∩…∩¬qm → q2

p1∩…∩pn∩ ¬q1∩ … ∩¬qm-1→ qm
Như vậy, một luật với m kết luận ở Trường hợp 4 có thể chuyển thành m
luật ở Trường hợp 3.
Logic mệnh đề (Propositional logic): Cơ sở tri thức của Logic mệnh đề gồm
hai phần:
Các sự kiện (Facts)
Các luật (Rules)
Các sự kiện được cho bởi các luật đặc biệt dạng:
15 GVHD: PGS.TS.Đỗ Văn Nhơn

Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
ٱ → q1;
ٱ → q2;

ٱ → qk;
Tập F= F(q1,…,qk) tạo nên phần giả thiết cho quá trình suy diễn
Các luật ở dạng chuẩn Horn: p1∩…∩pn → q
Logic vị từ (Predicate calculus): Cũng như Logic mệnh đề, cơ sở tri thức
của Logic vị từ được cấu thành bởi hai phần:
Tập các sự kiện F
Tập các luật R
Các sự kiện được cho bởi ٱ → qi(x, y, z, …), i = 1,…,k ở đây qi(x,y,z,…) là
các hạng từ phụ thuộc vào các hạng thức x, y, z, …
Trường hợp x, y, z là các biến, nếu chúng gắn với lượng từ “Tồn tại” thì
phải thay chúng bởi một giá trị tượng trưng hoặc thực sự.
Các luật có dạng p1(.)∩…∩pn(.) → q(.) Điều cần lưu ý là các biến tham
gia trong pi và q đều phải gắn với lượng từ “Với mọi”.
1.3 Khái niệm về hệ chuyên gia:
Theo E. Feigenbaum : “Hệ chuyên gia (Expert System) là một chương trình
máy tính thông minh sử dụng tri thức (knowledge) và các thủ tục suy luận
(inference procedues) để giải những bài toán tương đối khó khăn đòi hỏi những
chuyên gia mới giải được”.
Hoạt động của một hệ chuyên gia:
Một hệ chuyên gia bao gồm ba thành phần chính là cơ sở tri thức (knowledge
base), máy suy diễn hay mô tơ suy diễn (inference engine), và hệ thống giao tiếp
với người sử dụng (user interface). Cơ sở tri thức chứa các tri thức để từ đó, máy
suy diễn tạo ra câu trả lời cho người sử dụng thông qua hệ thống giao tiếp.
16 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương

Biểu diễn tri thức và ứng dụng 2012
Người sử dụng cung cấp sự kiện (fact) là những gì đã biết, đã có thật hay
những thông tin có ích cho hệ chuyên gia, và nhận được những câu trả lời là
những lời khuyên hay những gợi ý đúng đắn (expertise).
Hoạt động của hệ chuyên gia dựa trên tri thức được minh họa như sau:
Hình 2. Hoạt động của hệ chuyên gia
Mỗi hệ chuyên gia chỉ đặc trưng cho một lĩnh vực vấn đề (problem domain)
nào đó, như y học, tài chính, khoa học hay công nghệ ,… mà không phải cho bất
cứ một lĩnh vực vấn đề nào.
Tri thức chuyên gia để giải quyết một vấn đề đặc trưng được gọi là lĩnh vực
tri thức.
Hình 3. Quan hệ giữa lĩnh vực vấn đề và lĩnh vực tri thức
1.3.1 Đặc trưng của hệ chuyên gia
Có 4 đặc trưng cơ bản của một hệ chuyên gia:
17 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Người sử dụng
(User)
Hệ thống
giao tiếp
(User
Interface)
Cơ sở tri thức
(Knowledge Base)
Máy suy diễn
(Interface Engine)
Lĩnh vực vấn đề
(Problem Domain)
Lĩnh vực tri thức
(Knowledge)

Domain)
Biểu diễn tri thức và ứng dụng 2012
- Hiệu quả cao (high performance): khả năng trả lời với mức độ tinh thông
bằng hoặc cao hơn so với chuyên gia (người) trong cùng lĩnh vực.
- Thời gian trả lời thoả đáng (adequate response time): thời gian trả lời hợp
lý, bằng hoặc nhanh hơn so với chuyên gia (người) để đi đến cùng một quyết định.
Hệ chuyên gia là một hệ thống thời gian thực (real time system).
- Độ tin cậy cao (good reliability): không thể xảy ra sự cố hoặc giảm sút độ
tin cậy khi sử dụng.
- Dễ hiểu (understanable): hệ chuyên gia giải thích các bước suy luận một
cách dễ hiểu và nhất quán, không giống như cách trả lời bí ẩn của các hộp đen
(black box).
Kiến trúc của hệ chuyên gia
Những thành phần cơ bản của một hệ chuyên gia:
Hình 4. Những thành phần cơ bản của một hệ chuyên gia
 Cơ sở tri thức (Knowledge base). Gồm các phần tử (hay đơn vị) tri thức
thông thường được gọi là luật (Rule), được tổ chức như một cơ sở dữ
liệu.
18 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Cơ sở tri thức
Các luật
Bộ nhớ làm việc
Máy suy diễn
Lịch công việc
Khả năng giải thích
Khả năng
thu nhận tri thức
Giao diện người sử dụng
Biểu diễn tri thức và ứng dụng 2012

 Máy suy diễn (Inference Egine). Công cụ (chương trình, hay bộ xử lý)
tạo ra sự suy luận bằng cách sẽ quyết định xem những luật nào sẽ làm
thỏa mãn các sự kiện, các đối tượng, chọn ưu tiên các luật có tính ưu
tiên cao nhất.
 Lịch công việc (agenda). Danh sách các luật ưu tiên do máy suy diễn
tạo ra thỏa mãn các sự kiện, các đối tượng có mặt trong bộ nhớ làm
việc.
 Bộ nhớ làm việc (working memory). Cơ sở dữ liệu toàn cục chứa các
sự kiện phục vụ cho các luật.
 Khả năng giải thích (explaination facility). Giải nghĩa cách lập luận của
hệ thống cho người sử dụng.
 Khả năng thu nhận tri thức (explaination facility). Cho phép người sử
dụng bổ sung các tri thức vào hệ thống một cách tự động thay vì tiếp
nhận tri thức vào hệ thống một cách tự động, tiếp nhận tri thức vào hệ
thống bằng cách mã hóa tri thức một cách tường minh. Khả năng thu
nhận tri thức là yếu tố mặc nhiên của nhiều hệ chuyên gia.
 Giao diện người sử dụng (User interface). Là nơi người sử dụng và hệ
chuyên gia trao đổi với nhau.
Cơ sở tri thức còn được gọi là bộ nhớ sản xuất (production memory) trong hệ
chuyên gia. Trong một cơ sở tri thức, người ta thường phân biệt hai loại tri thức là
tri thức phán đoán (assertion knowledge) và tri thức thực hành (operating
knowledge).
Các tri thức phán đoán mô tả các tình huống đã được thiết lập hoặc sẽ được
thiết lập. Các tri thức thực hành thể hiện những hậu quả rút ra hay những thao tác
cần phải hoàn thiện khi một tình huống đã được thiết lập hoặc sẽ được thiết lập
19 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
trong lĩnh vực đang xét. Các tri thức thực hành thường được thể hiện bởi các biểu
thức để dễ hiểu và dễ triển khai thao tác đối với người sử dụng.

Hình 5. Quan hệ giữa máy suy diễn và cơ sở tri thức
Từ việc phân biệt hai loại tri thức, người ta nói máy suy diễn là công cụ triển
khai các cơ chế (hay kỹ thuật) tổng quát để tổ hợp các tri thức phán đoán và các tri
thức thực hành. Hình trên đây mô tả quan hệ hữu cơ giữa máy suy diễn và cơ sở tri
thức.
1.3.2 Suy diễn trong hệ chuyên gia:
Hai cơ chế suy diễn được sử dụng trong các hệ chuyên gia là Suy diễn tiến và
Suy diễn lùi:
1.3.2.1 Suy diễn tiến:
Khái niệm: Suy diễn tiến là chiến lược suy diễn bắt đầu bằng tập hợp các
Fact đã biết, tìm ra các Fact mới bằng cách sử dụng các luật có các giả thiết phù
hợp với Fact. Quá trình này cứ tiếp diễn cho đến khi đạt được một trạng thái đích
hoặc không còn luật nào có các giả thiết phù hợp với Fact để suy ra Fact mới.

Ưu điểm của chiến lược suy diễn tiến:
Hoạt động hiệu quả với các bài toán bắt đầu từ việc thu tập thông tin sau đó tìm
ra các thông tin nào có thể suy diễn từ thông tin ban đầu này.
20 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Máy
suy diễn
Cơ sở tri thức
Tri thức phán đoán
Tri thức thực hành
Biểu diễn tri thức và ứng dụng 2012
Cung cấp lượng thông tin khổng lồ từ một số ít thông tin ban đầu.
Nhược điểm của chiến lược suy diễn tiến:
Không có cách nào để nhận biết một sự kiện quan trọng hơn các sự kiện khác.
Hệ thống có thể mất rất nhiều thời gian vào các thông tin không cần thiết.
Hệ thống có thể đưa ra kết luận không quan hệ nhiều đến vấn đề người dùng quan

tâm.
1.3.2.2 Suy diễn lùi:
Khái niệm: Suy diễn lùi là chiến lược suy diễn cố gắng chứng minh một
kết luận bằng cách thu thập các thông tin hỗ trợ.
Ưu điểm của chiến lược suy diễn lùi:
Hoạt động hiệu quả với các bài toán bắt đầu bằng cách đưa ra một kết luận, sau
đó tìm cách chứng minh kết luận này là đúng.
Suy diễn lùi chú trọng vào goal được đưa ra. Nó tạo ra hàng loạt các câu hỏi
liên quan đến chủ đề này.
Hệ thống chỉ tìm kiếm trong một phần bộ nhớ làm việc thích hợp với vấn đề
đang xem xét.
Suy diễn lùi thích hợp các bài toán chẩn đoán, gỡ rối.
Nhược điểm của chiến lược suy diễn lùi:
Hệ thống vẫn tiếp tục theo dòng suy diễn mặc dù nó có thể dừng lại hoặc
chuyển sang hướng suy diễn khác.
1.3.2.3 Chiến lược giải quyết đụng độ trong quá trình suy diễn:
Trong quá trình suy diễn gặp trường hợp có nhiều hơn một luật có thể sử
dụng để suy diễn thì hệ thống sẽ rơi vào tình trạng xung đột. Một số biện pháp giải
quyết:
Chọn luật đầu tiên phù hợp trong bộ nhớ làm việc.
Chọn luật có mức ưu tiên cao nhất.
Chọn luật có nhiều giả thiết nhất.
21 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Chọn luật có các giả thiết là các sự kiện mới thêm vào trong bộ nhớ làm việc.
1.3.2.4 Hệ chuyên gia mờ (Fuzzy Expert System):
Trong thực tế cuộc sống ta thường gặp các sự kiện mờ, ví dụ như phát biểu
sau: “Xe hơi chạy nhanh”. Phát biểu này không rõ ràng vì đã sử dụng từ “nhanh”.
Các mệnh đề mờ kết hợp với nhau tạo nên các luật mờ. Để máy tính có thể

xử lý các sự kiện và các luật mờ, Logic mờ ra đời nhằm cung cấp các phương
pháp cho việc biểu diễn và suy diễn các thuật ngữ không rõ ràng. Các thuật ngữ
không rõ ràng được biểu diễn trong các tập mờ. Ví dụ:
Hình 6. Hệ thống mờ cho tốc độ
Nếu chiếc xe chạy với tốc độ 40 km/h thì:
Với tập trung bình thì mức độ tin tưởng MV (Membership Value) = 1
Với hai tập Cao và Thấp thì MV = 0.25
Biểu diễn tri thức trong hệ chuyên gia
Có rất nhiều phương pháp biểu diễn tri thức trong máy
 Dùng luật sản xuất, hệ chuyên gia dựa trên các luật
 Mạng ngữ nghĩa
 Ngôn ngữ nhân tạo
22 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
1
0.5
0
10 20 30 50 60
Tốc độ
Thấp
Trung bình Cao
Biểu diễn tri thức và ứng dụng 2012
 Bộ OAV(Object Attributes Values)
 Khung (Frame)
1.3.3 Biểu diễn tri thức trong các hệ chuyên gia
1.3.3.1 Logic mệnh đề:
Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép toán logic tác
động lên các ký hiệu để thể hiện suy luận lôgic. Logic mệnh đề nghiên cứu cách
xử lý các phát biểu.
Một mệnh đề mô tả một sự kiện, quan hệ giữa các đối tượng của thế giới thực

trong một lĩnh vực hẹp nào đó. Sau khi diễn giải thì mệnh đề đúng hoặc sai.
Ví dụ:
- Hôm nay trời mưa.
- Eva là đàn bà.
1.3.3.2 Logic vị từ:
Khắc phục các hạn chế của logic mệnh đề: Logic vị từ không chỉ biểu diễn sự
kiện mà còn biểu diễn tính chất của các đối tượng. Logic vị từ là sự mở rộng của
logic mệnh đề.
Các vị từ thường chứa biến hằng hay hàm. Người ta gọi các vị từ không chứa
biến là mệnh đề. Mỗi vị từ có thể là một sự kiện hay một luật. Luật vị từ gồm hai
vế trái và phải được nối với nhau bằng dấu mũi tên (). Các vị từ không có chứa
mũi tên được gọi là sự kiện.
Ví dụ:
Boy(tom). : Tom là con trai.
Girl(mary). : Mary là con gái.
1.4 Ngôn ngữ lập trình Prolog
1.4.1 Một số khái niệm:
23 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Prolog là một ngôn ngữ lập trình kí hiệu (Symbolic Programming Language)
tương tự các ngôn ngữ lập trình hàm (Functional) hay phi số (non-nummerical).
Prolog rất thích hợp để giải quyết các bài toàn liên quan đến các đối tượng
(Object) và mối quan hệ (Relation) giữa chúng.
Chương trình Prolog = các đối tượng dữ liệu và quan hệ giữa các đối tượng dữ
liệu.
Hạng (Term) được xem là đối tượng dữ liệu.
Hạng và quan hệ giữa các hạng tạo thành mệnh đề.
Hạng gồm: Hạng sơ cấp, hạng phức hợp.
1.4.2 Các tính chất của Prolog:

 Ngôn ngữ thông dịch
 Ngôn ngữ biên dịch
 Không có phép gán
 Hợp nhất
 Không có biến toàn cục
 Không có vòng lặp
 Đệ quy
 Không có cấu trúc điều kiện
 Quay lui
 Nghĩa khai báo
 Nghĩa thủ tục
1.4.3 Sự kiện và luật:
24 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương
Biểu diễn tri thức và ứng dụng 2012
Chương trình Prolog và tập hợp các sự kiện (event) và luật (rule) xử lí và mô
tả quan hệ giữa các đối tượng.
1.4.4 Sự kiện:
Một sự kiện là một khẳng định một thực thể có một hoặc một vài tính chất.
Quy ước:
P(A1, ,An).
P: là tên của tính chất
A1, ,An là các đối:
 Nguyên tử (Atom)
 Số (number)
 Biến (variable)
 Cấu trúc phức hợp (cây, danh sách, chuỗi )
1.4.5 Luật:
 Phần bên trái chỉ kết luận, được gọi là đầu (head) của luật.
 Phần bên phải chỉ điều kiện, được gọi là thân của luật. Nếu có nhiều điều

kiện thì chúng cách nhau bởi dấu phẩy.
25 GVHD: PGS.TS.Đỗ Văn Nhơn
Học viên: Võ Hồng Phương

×