Tải bản đầy đủ (.pdf) (85 trang)

Ứng dụng hệ chuyên gia xây dựng hệ thống hỗ trợ tư vấn tuyển sinh cho rường đại học tài chính kế toán quảng ngãi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.96 MB, 85 trang )

Đ I H CăĐĨăN NG
TR
NGăĐ I H CăS ăPH M

T ăTH ăQUǵNHăNG C

NG D NG H CHUYÊN GIA
XÂY D NG H THỐNG H TR T ăV N TUY N SINH
CHOăTR
NGăĐ I H C TÀI CHÍNH - K TỐN
QU NG NGÃI

LU N VĔN TH C Sƾ
H ăTHỐNGăTHỌNGăTIN

ĐƠăN ng - Nĕmă2019


Đ I H CăĐĨăN NG
TR
NGăĐ I H CăS ăPH M

T ăTH ăQUǵNHăNG C

NG D NG H CHUYÊN GIA
XÂY D NG H THỐNG H TR T ăV N TUY N SINH
CHOăTR
NGăĐ I H C TÀI CHÍNH - K TỐN
QU NG NGÃI

C


ưă

năngƠn ăH ă
848.01.04

ngă

ngă n

LU N VĔN TH C Sƾ

NG

IăH
NGă Nă HO ăH C
PGS. TS. V ăTRUNGăH NG

ĐƠăN ng - Nĕmă2019





ii

CăL C
L IăC
ăĐO N ...........................................................................................................i
CăL C ..................................................................................................................... ii
NHă

CăCÁCăT ăVI TăT T .............................................................................iv
NHă
NHă

CăCÁCăB NG............................................................................................. v
CăCÁCăHỊNH ............................................................................................vi

ăĐ U ......................................................................................................................... 1
1. Tính cấp thiết c a đề tài ........................................................................................ 1
2. Mục tiêu nghiên c u .............................................................................................. 2
3. Đối t ợng và phạm vi nghiên c u .........................................................................2
4. Ph ơng pháp nghiên c u ....................................................................................... 3
5. Ý nghĩa khoa học và thực tiễn c a đề tài ............................................................... 3
6. Tổng quan tài liệu nghiên c u ...............................................................................3
CH
NGă1.ăC ăS ăLụăTHUY T .............................................................................4
1.1. Kho dữ liệu ...............................................................................................................4
1.1.1. Giới thiệu về kho dữ liệu ................................................................................4
1.1.2. Dữ liệu trong kho dữ liệu ................................................................................6
1.1.3. Tri th c ............................................................................................................7
1.2. Hệ chuyên gia ...........................................................................................................8
1.2.1. Khái niệm ........................................................................................................8
1.2.2. Đặc tr ng và u điểm c a hệ chuyên gia ...................................................... 10
1.2.3. Kiến trúc tổng quát c a hệ chuyên gia .......................................................... 12
1.2.4. Biểu diễn tri th c trong hệ chuyên gia .......................................................... 15
1.2.5. Hệ chuyên gia dựa trên luật ..........................................................................16
1.2.6. Biểu diễn tri th c nh mệnh đề logic ............................................................ 19
1.3. Kỹ thuật suy luận trong hệ chuyên gia ....................................................................19
1.3.1. Kỹ thuật suy diễn tiến ................................................................................... 19
1.3.2. Kỹ thuật suy diễn lùi ..................................................................................... 20

1.3.3. Thuật toán Robinson ..................................................................................... 21
1.3.4. Thuật toán V ơng Hạo .................................................................................22
1.4. Lý thuyết chọn nghề nghiệp ................................................................................... 23
1.4.1. Lý thuyết cây nghề nghiệp ............................................................................23
1.4.2. Lý thuyết mư Holland ................................................................................... 25
1.4.3. Trắc nghiệm MBTI ....................................................................................... 28
1.5. Tổng kết ch ơng .....................................................................................................30


iii
CH

NGă2. PHỂNăTÍCHăTHI T

ăH ăTHỐNG ..............................................31

2.1. Phân tích hiện trạng ................................................................................................ 31
2.2. Mô tả hệ thống hỗ trợ t vấn tuyển sinh.................................................................32
2.2.1. Các ngành tuyển sinh tại ĐH TCKT ............................................................ 32
2.2.2. Mô tả hệ thống hỗ trợ TVTS tại tr ng ĐH TCKT......................................33
2.2.3. Bài tốn TVTS .............................................................................................. 34
2.2.4. Mơ hình đề xuất ............................................................................................ 34
2.3. Phân tích thiết kế hệ thống ..................................................................................... 36
2.3.1. Phân tích lý thuyết nghề nghiệp ....................................................................36
2.3.2. Biểu đồ lớp ....................................................................................................40
2.3.3. Biểu đồ hoạt động ......................................................................................... 42
2.3.4. Biểu đồ ca sử dụng ........................................................................................ 43
2.3.5. Xây dựng tập luật cho hệ thống TVTS tại ĐH TCKT ..................................44
2.4. Tổng kết ch ơng .....................................................................................................51
CH

NGă3. XỂYă
NGăVĨăTH ăNGHI
ăH ăTHỐNG ................................ 53
3.1. Lựa chọn công cụ phát triển ................................................................................... 53
3.2. Xây dựng hệ thống .................................................................................................53
3.2.1. Cách xây dựng tập luật .................................................................................53
3.2.2. Cách xây dựng bộ máy suy diễn ..................................................................54
3.2.3. Xây dựng các ch c năng ...............................................................................56
3.3. Kết quả thử nghiệm ................................................................................................ 57
3.3.1. Thiết kế cơ s dữ liệu.................................................................................... 57
3.3.2. Xây dựng các luật dựa trên các th tục l u trữ nội c a SQL Server ............58
3.3.3. Thiết kế giao diện dựa trên phần mềm Visual Studio...................................59
3.4. Tổng kết ch ơng .....................................................................................................64
TăLU NăVĨăH
NGăPHÁTăTRI N .................................................................65
TĨIăLI UăTH

ă H O........................................................................................... 66

QUY TăĐ NHăGI OăĐ ăTĨIăLU NăVĔNă(B nă ao)


iv

NHă

CăCÁCăT ăVI TăT T

Ti ng Vi t



Cao đẳng

CSDL
CSTT
ĐH

Cơ s dữ liệu
Cơ s tri th c
Đại học

ĐH TCKT
GDHN
HCG

Đại học Tài chính - Kế toán
Giáo dục h ớng nghiệp
Hệ chuyên gia

HĐGDNPT

Hoạt động giáo dục nghề phổ thông

HLS

Hệ luật sinh

HS
KT


Học sinh
Kỹ thuật

LTCNN

Lý thuyết cây nghề nghiệp

NC
NPT
NV
QL
SV

Nghiên c u
Nghề phổ thông
Nghiệp vụ
Quản lý
Sinh viên

TC
TCCN
THCS
THPT
TVTS
XH

Trung cấp
Trung cấp chuyên nghiệp
Trung học cơ s
Trung học phổ thông

T vấn tuyển sinh
Xã hội

Ti ng Anh
DW

Data Warehourse

ES

Expert System

PHP

Personal Home Page (hay Hypertext PreProcessor)

RIASEC

Realistic-Investigate-Artistic-Social-EnterissingConventional


v

NHă
S ă

ă

CăCÁCăB NG
Tên b ng


b ng

Trang

1.1.

Bảng so sánh giữa chuyên gia con ng

1.2.

Biểu diễn bằng logic vị từ

19

1.3.

Giá trị phân nhóm trong trắc nghiệm MBTI

29

2.1.

Danh sách các ngành tuyển sinh bậc đại học tại ĐH TCKT

32

2.2.

Bảng tóm tắt 6 nhóm tính cách/mơi tr


37

i và HCG

ng làm việc

10


vi

NHă
S hi
n

ă

CăCÁCăHỊNH
Tên hình

Trang

1.1.

Cơ s dữ liệu và kho dữ liệu

4

1.2.


Mơ hình dữ liệu, thơng tin và tri th c

7

1.3.

Q trình khai phá tri th c trong kho dữ liệu

8

1.4.

Hoạt động c a hệ chuyên gia

9

1.5.

Những thành phần cơ bản c a một HCG

13

1.6.

Kiến trúc HCG theo J. L. Ermine

14

1.7.


Kiến trúc HCG theo C. Ernest

15

1.8.

Kiến trúc HCG theo E. V. Popov

15

1.9.

L ợc đồ biểu diễn tri th c

15

1.10.

Quy trình hoạt động c a Recognize-Action

17

1.11.

Kiến trúc HCG dựa trên luật

18

1.12.


Mơ hình LTCNN

24

1.13.

Mơ hình lục giác Holland

26

2.1.

Mơ hình tổng thể hệ thống

35

2.2.

Biểu đồ lớp cho hệ hỗ trợ TVTS tại ĐH TCKT

41

2.3.

Biểu đồ hoạt động - T vấn dựa trên điểm thi

42

2.4.


Biểu đồ hoạt động - T vấn dựa trên lý thuyết nghề

42

2.5.

Biểu đồ hoạt động - T vấn dựa trên điểm thi và lý thuyết nghề

43

2.6.

Biểu đồ ca sử dụng - m c tổng quát

43

2.7.

Biểu đồ ca sử dụng phân rã - dành cho thí sinh

43

2.8.

Biểu đồ ca sử dụng phân rã - dành cho học sinh

44

2.9.


Biểu đồ ca sử dụng phân rã - dành cho quản trị viên

44

3.1.

Bảng dữ liệu Co_Khoi_Thi

57

3.2.

Bảng dữ liệu câu hỏi

58

3.3.

Một số cửa sổ trong thiết kế cơ s dữ liệu

58

3.4.

Sử dụng các th tục l u trữ nội để xây dựng tập luật

59

3.5.


Giao diện ng dụng soạn thảo Visual Studio

59

3.6.

Giao diện hệ thống t vấn tuyển sinh

60

3.7.

Giao diện quản trị ng

60

3.8.

Giao diện thêm mới ngành nghề

61

3.9.

Giao diện cập nhật điểm chuẩn theo ngành

61

i dung



vii
S hi
n

ă

Tên hình

Trang

3.10.

Giao diện t vấn tuyển sinh dựa theo điểm

62

3.11.

Giới thiệu giao diện trắc nghiệm chọn ngành nghề

63

3.12.

Màn hình giao diện TNNN dựa trên Holland

63



1

ăĐ U
1. Tín ăc pă

ăc aăđ ă Ơi

Trong giai đoạn đất n ớc phát triển hiện nay, giáo dục luôn là vấn đề đ ợc quan
tâm hàng đầu c a xư hội. Đối với cơng tác tuyển sinh đư có rất nhiều ch ơng trình t
vấn tuyển sinh rộng khắp trên tất cả các tỉnh, thành trong cả n ớc với nhiều hình th c
phong phú. Tuy nhiên th i gian gần đây do cơng tác tuyển sinh có nhiều thay đổi cả về
nội dung lẫn hình th c nên rất nhiều thí sinh và cả gia đình khá bối rối, việc t vấn
tuyển sinh và chọn ngành học phù hợp là nhu cầu mà xư hội đang quan tâm. Mặc dù
hằng năm, phần lớn các tr

ng đều tổ ch c các đợt t vấn cho thí sinh, tuy nhiên việc

này còn phụ thuộc vào nhiều yếu tố nh địa điểm, th i gian, nhân sự,... Do vậy, vẫn
còn khá nhiều thí sinh cảm thấy thiếu thơng tin về các tr ng, các ngành mình quan
tâm. Bên cạnh đó, một số tr ng cũng đư thiết lập các trang web để nhận và trả l i câu
hỏi c a thí sinh nh ng các trang này đa phần là nhận câu hỏi c a thí sinh sau đó việc
giải đáp cũng khơng đ ợc trực tuyến.
Chúng ta có thể thấy rằng, đa phần việc chọn tr ng chuyên nghiệp c a học
sinh và gia đình vẫn cịn theo kiểu truyền thống đó là: theo ý ch quan c a gia đình,
theo hiệu ng đám đơng và theo một ý thích bộc phát từ cá nhân c a học sinh. Phụ
huynh ln muốn con em mình có đ ợc một t ơng lai vững chắc. Các tr ng đào tạo
luôn hy vọng các học sinh chọn đ ợc đúng ngành nghề mình theo đuổi để góp phần
nâng cao chất l ợng đào tạo và hạn chế tình trạng bỏ học hoặc chuyển ngành.
Hậu quả c a việc chọn tr ng này dẫn đến tình trạng: một số học sinh, sau khi học

một năm các tr ng đại học họ cảm thấy chán nản và tự ý bỏ học; một số vì theo sự lựa
chọn c a gia đình đư tạo ra một áp lực tâm lý - trầm cảm… Vì vậy, việc t vấn tuyển sinh
tốt sẽ khắc phục đ ợc tình trạng trên và nâng cao đ ợc chất l ợng đào tạo chuyên nghiệp
và góp phần cho việc bổ sung nguồn nhân lực có chất l ợng cao cho đất n ớc hiện nay.
Theo thống kê c a Tổng cục thống kê, lực l ợng lao động từ 15 tuổi tr lên c a
cả n ớc ớc tính trong quý 1 năm 2018 là 55,1 triệu ng i. Trong đó lao động 15 tuổi
tr lên có việc làm trong quý I năm 2018 ớc tính là 54,0 triệu ng i. Tỷ lệ thất
nghiệp trong độ tuổi là 2,2%; tỷ lệ thiếu việc làm trong độ tuổi là 1,4%. Nh vậy,
chúng ta thấy rằng vẫn còn sự mất cân đối trong việc định h ớng và lựa chọn ngành
nghề cho lực l ợng lao động trong cả n ớc (Tháng 10/2018).
Tr ng ĐH TCKT là tr ng thuộc Bộ tài chính, đóng trên địa bàn thành phố
Quảng Ngưi. Tr ng đ ợc nâng cấp thành tr ng đại học vào năm 2011, tiền thân là
Tr ng Trung học Tài chính - Kế toán 3 đ ợc thành lập năm 1976. Tr ng ĐH TCKT


2
đào tạo với các ngành: Quản trị kinh doanh, Tài chính - Ngân hàng, Kế tốn, Kiểm
tốn, Kinh doanh quốc tế, Luật kinh tế, Quản trị khách sạn và du lịch, Hệ thống thơng
tin kế tốn. Tổng số sinh viên toàn tr ng khoảng 5.000 sinh viên và mỗi năm tuyển
mới khoảng 1.500 tân sinh viên. Tuy nhiên, hàng năm đều có khơng ít tr ng hợp sinh
viên bỏ học, tỷ lệ sinh viên tốt nghiệp ra tr ng có việc làm khá cao - 89.5% năm
2017, nh ng sinh viên làm đúng ngành không cao. Mặc dù nhà tr ng luôn quan tâm
đẩy mạnh chất l ợng đào tạo, cải tiến ph ơng pháp giảng dạy, đổi mới ch ơng trình
theo nhu cầu xư hội. Nh ng vẫn ch a giải quyết triệt để vấn đề. Một phần là do công
tác t vấn tuyển sinh ch a đạt hiệu quả cao. Hiện tại, tr ng đư có website tuyển sinh
tại địa chỉ htttp://tuyensinh.tckt.edu.vn nh ng chỉ dừng lại m c là gửi email, nhắn
tin, để lại số điện thoại, hoặc câu hỏi rồi ch cán bộ chuyên trách trả l i, còn phần
t ơng tác trực tiếp, mọi lúc mọi nơi với phụ huynh và học sinh cũng nh phần t vấn
chọn ngành nghề phù hợp cho học sinh thì ch a đáp ng đ ợc. Đó là lý do để tôi chọn
đề tài “ ng dụng hệ chuyên gia xây dựng hệ thống hỗ trợ t vấn tuyển sinh cho r ng

Đại học Tài chính - Kế tốn Quảng Ngưi” để làm đề tài luận văn tốt nghiệp cao học.
Trong đề tài này, tôi đề xuất giải pháp ng dụng hệ chuyên gia để xây dựng hệ thống
t vấn tuyển sinh trực tuyến nhằm cải thiện tình trạng chọn sai ngành c a sinh viên
tr

ng ĐH TCKT Quảng Ngưi.
2. M c tiêu nghiên c u

Mục tiêu c a đề tài là nghiên c u một số lý thuyết về hệ chuyên gia và lý
thuyết chọn nghề nghiệp trợ giúp các thí sinh có thể chọn đúng ngành - nghề khi đăng
ký xét tuyển vào tr ng đại học và xây dựng hệ chuyên gia ng dụng trong lĩnh vực
t vấn tuyển sinh c a tr ng ĐH TCKT.
3. Đ

ng và ph m vi nghiên c u

3.1. Đối tượng nghiên cứu
Đối t ợng nghiên c u c a đề tài là cơ s lý thuyết về hệ chuyên gia, hoạt động
t vấn tuyển sinh c a tr ng đại học, lý thuyết chọn nghề nghiệp, ngơn ngữ lập
trình… và một số bài báo, luận văn tốt nghiệp khóa tr ớc.
3.2. Phạm vi nghiên cứu
Trong khuôn khổ c a luận văn này, tôi tập trung nghiên c u cách tạo tập luật; l u trữ
tri th c vào cơ s dữ liệu; cách biểu diễn cũng nh cơ chế suy diễn từ tri th c có sẵn để đ a
ra các t vấn phù hợp cho thí sinh. Bên cạnh đó, đề tài này tập trung tìm hiểu những bất cập
đang tồn tại trong công tác TVTS tại tr ng ĐH TCKT để từ đó xây dựng một hệ thống hỗ
trợ t vấn theo mơ hình kiến trúc c a hệ chuyên gia.


3
4. P


ng pháp nghiên c

Để đạt đ ợc những yêu cầu trên, tôi sử dụng ch yếu hai ph ơng pháp chính là
ph ơng pháp nghiên c u tài liệu và ph ơng pháp thực nghiệm.
Ph ơng pháp nghiên cứu tài liệu: Tôi sử dụng ph ơng pháp này trong nghiên
c u các tài liệu về cơ s lý thuyết: hệ chuyên gia, cách tạo tập luật; các tài liệu mô tả
một số hệ thống t vấn.
Ph ơng pháp thực nghiệm: Ph ơng pháp này đ ợc tôi sử dụng để khảo sát tình
hình TVTS tại tr ng ĐH TCKT. Từ kết quả khảo sát đó, tơi tiến hành phân tích
các yêu cầu và thiết kế giải pháp TVTS dựa trên hệ chuyên gia. Kết quả hệ thống
đ ợc xây dựng sẽ đ ợc thử nghiệm trên máy cục bộ và trên internet.
5. Ý ng ƿa khoa

c và

c ti n c a đ tài

Về khoa học: Hệ thống hóa các vấn đề lý luận về công tác tuyển sinh c a
Tr ng ĐH TCKT, từ đó nghiên c u các mơ hình kiến trúc hệ chun gia và đ a ra
giải pháp phù hợp trong lĩnh vực t vấn tuyển sinh.
Về thực tiễn: Đề tài sẽ là một ph ơng án khác cho công tác tuyển sinh c a đơn vị;
Kết quả nghiên c u c a đề tài sẽ góp phần cải thiện tình trạng chọn sai ngành học c a các
SV tại tr ng ĐH TCKT. Đồng th i, kết quả đề tài là hệ t vấn cũng sẽ tr thành một
kênh thơng tin tham khảo bổ ích cho các HS cuối cấp quyết định cho t ơng lai c a mình.
6. T ng quan tài li u nghiên c u
Báo cáo c a luận văn đ ợc tổ ch c thành 3 ch ơng chính:
C

ngă1.ăC ă ălýă

Trong ch ơng này, tôi trınh bay một cách tổng quan về hệ chuyên gia và một số

lý thuyết trong h ớng nghiệp.
C

ngă2.ăP ơnă íc ,ă

ăk ă

ă

ng

Trong ch ơng này, từ phân tích thực trạng TVTS tại tr

ng ĐH TCKT hằng

năm, tơi trình bày h ớng khắc phục những hạn chế trên bằng cách mô tả một hệ
thống để tin học hóa q trình TVTS. Đồng th i, nội dung ch ơng này cũng đề xuất
giải pháp xây dựng hệ thống theo mơ hình c a hệ chun gia (HCG). Bên cạnh đó,
nội dung ch ơng cũng trình bày phân tích các lý thuyết về h ớng nghiệp nh lý
thuyết cây nghề nghiệp, lý thuyết mư Holland để xây dựng các luật cho HCG.
C

ng 3. Xây d ng và t

ng




ng

Từ cơ s lý thuyết đư tìm hiểu ch ơng 1 và mơ hình hệ chun gia đ ợc lựa chọn
sau q trình phân tích hệ thống ch ơng 2, với ch ơng 3 này tôi tiếp tục lựa chọn ngôn
ngữ lập trình và mơi tr ng phát triển để xây dựng và thử nghiệm hệ thống.


4

CH
NGă1
C ăS ăLụăTHUY T
Trong ch ơng này, các nội dung đ ợc trình bày ch yếu liên quan đến các
vấn đề nh : hệ chuyên gia, t vấn tuyển sinh - h ớng nghiệp...
1.1.

oăd ăl

1.1.1. Giới thiệu về kho dữ liệu
a) Khái niệm
Kho dữ liệu (DW - Data Wasehouse) là tuyển tập các cơ s dữ liệu tích hợp,
h ớng ch đề, đ ợc thiết kế để hỗ trợ cho ch c năng trợ giúp quyết định.

Hình 1.1. Cơ sở dữ liệu và kho dữ liệu
Theo John Ladley [9], Công nghệ kho dữ liệu (Data Warehouse Technology) là
tập các ph ơng pháp, kỹ thuật và các cơng cụ có thể kết hợp, hỗ trợ nhau để cung cấp
thông tin cho ng i sử dụng trên cơ s tích hợp từ nhiều nguồn dữ liệu, nhiều môi
tr

ng khác nhau.

Kho dữ liệu th ng rất lớn tới hàng trăm GB hay thậm chí hàng Terabyte. Kho
dữ liệu đ ợc xây dựng để tiện lợi cho việc truy cập theo nhiều nguồn, nhiều kiểu dữ
liệu khác nhau sao cho có thể kết hợp đ ợc cả những ng dụng c a các công nghệ hiện
đại và kế thừa đ ợc từ những hệ thống đư có sẵn từ tr ớc.
DW ngồi cơ s dữ liệu, cịn có rất nhiều thành phần bổ sung để tạo nên một

cấu trúc hoàn chỉnh, gồm tập hợp các cơng cụ ETL (Extract, Transform and Load) có
nhiệm vụ xử lý, thu thập và cập nhật dữ liệu vào kho (qua OLAP Cude), công cụ tạo
báo cáo (Reporting), công cụ khai phá dữ liệu (Data mining), quan hệ khách hàng
(CRM), quan hệ doanh nghiệp (ERM)...
DW ngoài các ch c năng m rộng c a định nghĩa về cơ s dữ liệu, khái niệm


5
Hệ điều hành trong DW chỉ đ ợc hiểu nh quá trình quản lý giao dịch hàng ngày c a
một kho dữ liệu; điều này sẽ tách biệt với khái niệm về hệ điều hành tr ớc đây - OS.
b) Mục đích sử dụng kho dữ liệu
Mục tiêu chính c a kho dữ liệu là nhằm đáp ng các tiêu chuẩn cơ bản sau:

- Phải có khả năng đáp ng mọi yêu cầu về thông tin c a NSD
- Hỗ trợ để các nhân viên c a tổ ch c thực hiện tốt, hiệu quả cơng việc c a
mình, nh có những quyết định hợp lý, nhanh và bán đ ợc nhiều hàng hơn, năng
suất cao hơn, thu đ ợc lợi nhuận cao hơn...

- Giúp cho tổ ch c, xác định, quản lý và điều hành các dự án, các nghiệp vụ
một cách hiệu quả và chính xác

- Tích hợp dữ liệu và các siêu dữ liệu từ nhiều nguồn khác nhau
- Muốn đạt đ ợc những yêu cầu trên thì DW phải:
+ Nâng cao chất l ợng dữ liệu bằng các ph ơng pháp làm sạch và tinh lọc dữ

liệu theo những h ớng ch đề nhất định
+ Tổng hợp và kết nối dữ liệu
+ Đồng bộ hoá các nguồn dữ liệu với DW
+ Phân định và đồng nhất các hệ quản trị cơ s dữ liệu tác nghiệp nh là các
công cụ chuẩn để phục vụ cho DW
+ Quản lý siêu dữ liệu
+ Cung cấp thông tin đ ợc tích hợp, tóm tắt hoặc đ ợc liên kết, tổ ch c theo các
ch đề
+ Dùng trong các hệ thống hỗ trợ quyết định (Decision Support System - DSS),
các hệ thống thông tin tác nghiệp hoặc hỗ trợ cho các truy vấn đặc biệt
c) Các đặc điểm cơ bản
Những đặc điểm cơ bản c a Kho dữ liệu (DW) là một tập hợp dữ liệu có đặc
điểm sau:

- H ớng ch đề (Subject Oriented): DW đ ợc thiết kế để giúp phân tích dữ
liệu. Ví dụ, để hiểu rõ hơn về dữ liệu kinh doanh c a công ty, có thể xây dựng DW
l u trữ dữ liệu súc tích, cơ đọng nhất trong dữ liệu kinh doanh, từ đó có thể giúp
nhà quản lý trả l i đ ợc các câu hỏi nh “Ai là khách hàng tốt nhất vào năm
tr ớc?”, “Ai sẽ là khách hàng tiềm năng vào năm tiếp theo?”.

- Tính tích hợp (Integration): Là một đặc tính quan trọng nhất c a DW, dữ liệu
đ a vào data warehouse đ ợc tập hợp từ nhiều nguồn khác nhau, bao gồm các
RMDB, flat files, các bản ghi giao dịch trực tuyến.

- Dữ liệu gắn th i gian và có tính lịch sử (Time Series Data): DW tập trung vào


6
những thay đổi theo mốc th i gian, với l ợng dữ liệu lớn có tính lịch sử vậy có thể
tìm ra những thơng tin có tính xu h ớng trong dữ liệu.


- Dữ liệu có tính ổn định (Nonvolatility): Dữ liệu trong DW th

ng không thể
thay đổi. Điều này có thể gây ra một số khó khăn nh ng hợp lý so với mục đích
c a DW, phân tích những gì đư xảy ra.

- Dữ liệu khơng biến động (Durable): Thông tin trong DW đ ợc tải vào sau
khi dữ liệu trong hệ thống điều hành đ ợc cho là q cũ. Tính khơng biến động thể
hiện chỗ: Dữ liệu đ ợc l u trữ lâu dài trong kho dữ liệu. Mặc dù dữ liệu mới
đ ợc nhập vào nh ng dữ liệu cũ trong kho vẫn không bị xóa, điều đó cho phép
cung cấp thơng tin về một khoảng th i gian dài, cung cấp đ số liệu cần thiết cho
các mơ hình nghiệp vụ phân tích, dự báo, từ đó có đ ợc những quyết định hợp lý,
phù hợp với các quy luật tiến hóa c a tự nhiên.

- Dữ liệu tổng hợp (Summary data): dữ liệu tác nghiệp thuần túy không đ ợc
l u trữ trong kho dữ liệu, dữ liệu tổng hợp đ ợc tích lại qua nhiều giai đoạn khác
nhau theo các ch điểm đư nêu trên.
1.1.2. Dữ liệu trong kho dữ liệu
Dữ liệu trong kho dữ liệu ngoài 2 loại dữ liệu truyền thống OLTP là siêu dữ liệu và
dữ liệu thơ, cịn có một loại dữ liệu mới là dữ liệu tổng hợp. Dữ liệu tổng hợp rất quan
trọng trong kho dữ liệu b i vì nó tính tốn tr ớc các tốn hạng dài tr ớc. Lấy ví dụ, kiểu
dữ liệu đặc tr ng truy vấn trong kho dữ liệu sẽ trả về một số giá trị nh bán hàng trong
tháng 8. Kho dữ liệu không th ng sử dụng chuẩn hạng 3 trong cơ s dữ liệu.
Với cơ s dữ liệu, có mối quan hệ một - một với một ng dụng đơn lẻ làm
nguồn c a nó. Một ng dụng xử lý thẻ tín dụng là một ví dụ tuyệt v i về một nguồn dữ
liệu đơn lẻ có thể chạy trên cơ s dữ liệu OLTP. Loại cơ s dữ liệu này ch a dữ liệu
chi tiết cao cũng nh quan điểm chi tiết quan hệ. Bảng đ ợc chuẩn hóa để đạt đ ợc
l u trữ hiệu quả, xử lý giao dịch đồng th i, cũng nh trả về kết quả truy vấn nhanh.
Kho dữ liệu l u trữ dữ liệu lịch sử tóm tắt từ nhiều ng dụng khác nhau, có một

mối quan hệ một đến nhiều giữa một kho dữ liệu và các ng dụng phục vụ nh là
nguồn dữ liệu. Ví dụ về các nguồn dữ liệu bao gồm nh ng không giới hạn trong quản
lý quan hệ khách hàng (CRM), quản lý tài ngun doanh nghiệp (ERP) hoặc thậm chí
dữ liệu truyền thơng xư hội.
Cơ s dữ liệu h ớng giao dịch và kho dữ liệu đ ợc xây dựng để thực hiện phân
tích. Nếu cơng ty chúng ta xử lý các giao dịch kỹ thuật số hoặc thu thập dữ liệu, bạn sẽ
cần một cơ s dữ liệu. Tuy nhiên, nếu khi chúng ta cần thực hiện phân tích dữ liệu để
khám phá xu h ớng, cải thiện năng suất hoặc phát hiện ra các vấn đề, kho dữ liệu tr
thành tài nguyên vô giá.


7
1.1.3. Tri thức
Một vấn đề rất quan trọng để dẫn đến thành công là việc biết sử dụng thông tin
một cách có hiệu quả. Điều đó có nghĩa là từ các dữ liệu sẵn có phải tìm ra những
thơng tin tiềm ẩn có giá trị mà tr ớc đó ch a đ ợc phát hiện, phải tìm ra những xu
h ớng phát triển và những yếu tố tác động lên chúng. Thực hiện cơng việc đó chính là
thực hiện q trình phát hiện tri th c trong cơ s dữ liệu (Knowledge Discovery in
Database - KDD) mà trong đó kỹ thuật này cho phép ta lấy đ ợc các tri th c chính là
pha khai phá dữ liệu.
Tr ớc khi đi vào tìm hiểu các giai đoạn trong KDD ta đ a ra một số ví dụ để
phân biệt ba khái niệm: dữ liệu, thông tin và tri th c. Dữ liệu th ng đ ợc cho b i các
giá trị mô tả các sự kiện, hiện t ợng cụ thể. Cịn tri th c là gì? Có thể có những định
nghĩa rõ ràng để phân biệt các khái niệm dữ liệu, thông tin và tri th c hay không? Tri
th c là một khái niệm rất trừu t ợng. Do đó, chúng ta sẽ khơng cố gắng đ a ra một
định nghĩa hình th c chính xác đây. Thay vào đó, chúng ta hưy cùng nhau cảm nhận
khái niệm tri th c bằng cách so sánh nó với hai khái niệm khác là thông tin và dữ liệu.
Nhà bác học nổi tiếng Karan Sing đư từng nói rằng “Chúng ta đang ngập chìm
trong biển thơng tin nh ng lại đang đói tri th c” [2]. Câu nói này làm nổi bật sự khác
biệt về l ợng lẫn về chất giữa hai khái niệm thông tin và tri th c. Cũng có thể quan

niệm thơng tin là quan hệ giữa các dữ liệu. Các dữ liệu đ ợc sắp xếp theo một th tự
hoặc đ ợc tập hợp lại theo một quan hệ nào đó sẽ ch a đựng thơng tin. Nếu những
quan hệ này đ ợc chỉ ra một cách rõ ràng thì đó là các tri th c. Chẳng hạn trong toán
học: Bản thân từng con số riêng lẻ nh 1, 1, 3, 5, 2, 8, 13, ... là các dữ liệu. Tuy nhiên,
khi đặt chúng lại với nhau theo trật tự 1, 1, 2, 3, 5, 8, 13, 21, 34, ... thì giữa chúng đư
bắt đầu có một mối liên hệ. Mối liên hệ này có thể đ ợc biểu diễn bằng công th c U n =
Un-1 + Un-2 nếu n ≥ 3. Công th c nêu trên chính là tri th c.

Hình 1.2. Mơ hình dữ liệu, thông tin và tri thức


8
Các b ớc c a một quá trình khám phá tri th c:

Hình 1.3. Quá trình khai phá tri thức trong kho dữ liệu

- Chọn lọc dữ liệu (Data Selection): Đây là giai đoạn tập hợp các dữ liệu
đ ợc khai thác từ một CSDL, một kho dữ liệu, thậm chí từ các nguồn ng dụng
web vào một CSDL riêng. Chúng ta chỉ chọn ra những dữ liệu cần thiết cho các
giai đoạn sau. Tuy nhiên, công việc thu gom dữ liệu vào một CSDL lớn th ng rất
khó khăn vì dữ liệu nằm

khắp nơi và dạng tạo lập khác nhau.

- Tiền xử lý dữ liệu (Preprocessing): Phần lớn các CSDL đều ít nhiều mang
tính khơng nhất qn. Vì vậy khi gom dữ liệu rất có thể mắc một số lỗi nh dữ liệu
không đầy đ , chặt chẽ và không logic (bị trùng lặp, giá trị bị sai lệch...). Do đó
cần phải đ ợc “tiền xử lý” tr ớc khi khai phá dữ liệu nếu không sẽ gây nên những
kết quả sai lệch nghiêm trọng.


- Chuyển đổi dữ liệu (Data Transformation): Trong giai đoạn này dữ liệu sẽ
đ ợc chuyển đổi về dạng thuận tiện để tiến hành các thuật toán khám phá dữ liệu.

- Khai phá dữ liệu (Data Mining): Trong giai đoạn này ta sử dụng các kỹ
thuật nhằm phát hiện ra các tri th c tiềm ẩn trong dữ liệu. Một số kỹ thuật đ ợc sử
dụng đó là: phân lớp, gom cụm, luật kết hợp…

- Đánh giá kết quả mẫu: Đây là giai đoạn cuối cùng trong tiến trình KDD.
Trong giai đoạn này, các mẫu dữ liệu đ ợc chiết xuất b i các phần mềm khai phá
dữ liệu. Không phải bất c mẫu nào cũng đều có ích, thậm chí cịn bị sai lệch.
Chính vì vậy, cần phải xác định và lựa chọn những tiêu chuẩn đánh giá sao cho sẽ
chiết xuất ra các tri th c cần thiết.
1.2. H ăc

năg a

1.2.1. Khái niệm
Hệ chuyên gia còn gọi là hệ thống dựa trên tri th c, là một ch ơng trình máy


9
tính ch a một số tri th c đặc thù c a một hoặc nhiều chuyên gia con ng

i về một ch

đề cụ thể nào đó. Các ch ơng trình thuộc loại này đư đ ợc phát triển từ thập niên 1960
-1970 và tr thành ng dụng th ơng mại từ thập niên 1980. Dạng phổ biến nhất c a hệ
chuyên gia là một ch ơng trình gồm một tập luật phân tích thơng tin (th ng đ ợc
cung cấp b i ng i sử dụng hệ thống) về một lớp vấn đề cụ thể, cũng nh đ a ra các
phân tích về các vấn đề đó và tùy theo thiết kế ch ơng trình mà đ a l i khuyên về

trình tự các hành động cần thực hiện để giải quyết vấn đề. Đây là một hệ thống sử
dụng các khả năng lập luận để đạt tới các kết luận.
Theo E. Feigenbaum: “Hệ chuyên gia (Expert System) là một ch ơng trình máy
tính thơng minh sử dụng tri th c (knowledge) và các th tục suy luận (inference
procedures) để giải những bài tốn t ơng đối khó khăn địi hỏi những chuyên gia mới
giải đ ợc” [1].
HCG là một hệ thống tin học có thể mơ phỏng năng lực quyết đoán và hành
động c a một chuyên gia (con ng i). HCG là một trong những lĩnh vực ng
dụng c a trí tuệ nhân tạo (AI). HCG sử dụng tri th c c a những chuyên gia để giải
quyết các vấn đề khác nhau thuộc mọi lĩnh vực. Tri th c trong HCG phản ánh sự tinh
thông đ ợc tích tụ từ sách v , tạp chí, các chuyên gia hay các nhà khoa học. HCG
cịn có tên gọi khác là hệ thống dựa trên tri th c (knowledge - base system) hoặc HCG
dựa trên tri th c (Expert System Based Knowledge) [3].
Thông th ng, các nhà thiết kế HCG thu thập tri th c này, bao gồm lý thuyết
đến các kinh nghiệm, kỹ xảo, ph ơng pháp làm tắt, các luật dùng để chọn ra cách
để giải quyết vấn đề có nhiều khả năng đ ợc chấp nhận nhất (chiến l ợc heuristic)
đư tích lũy đ ợc c a các chuyên gia con ng i qua quá trình làm việc c a họ trong
một lĩnh vực chuyên môn. Từ tri th c này, ng i ta cố gắng cài đặt chúng vào hệ
thống để hệ thống có thể mô phỏng theo cách th c các chuyên gia làm việc. Tuy
nhiên, không giống với con ng i, các ch ơng trình hiện tại khơng tự học lấy kinh
nghiệm mà tri th c phải đ ợc lấy từ con ng i và mã hóa thành ngơn ngữ hình
th c. Đây chính là nhiệm vụ chính c a các nhà thiết kế HCG phải đ ơng đầu.

Hình 1.4. Hoạt động của hệ chuyên gia


10
Ngày nay, HCG đ ợc ng dụng trong nhiều lĩnh vực khác nhau nh y học,
tốn học, cơng nghệ, hóa học, địa chất, khoa học máy tính, kinh doanh, luật pháp,
quốc phòng và giáo dục.

Chuyên gia con ng i là tài nguyên quý giá cho nhiều tổ ch c. Họ có thể giải
quyết những vấn đề khó và hiệu quả. Vậy có giá trị khơng khi chúng ta cố gắng xây
dựng một HCG nhằm thay thế cho chuyên gia con ng i? Bảng so sánh 1.1 sau đây
sẽ phần nào trả l i đ ợc câu hỏi trên.
Bảng 1.1. Bảng so sánh giữa chuyên gia con người và HCG
Tiêu chí
Sẵn dùng
Vị trí
An tồn
Có thể chết
Hiệu suất
Tốc độ
Chi phí

Chun gia con ng i
Th i gian hành chính
Cục bộ
Khơng thể thay thế

Thay đổi
Thay đổi
Cao

H chun gia
Mọi lúc
Mọi nơi
Có thể thay thế
Khơng
Hằng số
Hằng số

Có thể cố gắng

Nh vậy, qua bảng so sánh 1.1, ta nhận thấy rằng việc phát triển một HCG thay
cho chuyên gia con ng i là hoàn toàn cần thiết. Khơng những thế việc phát triển
HCG cịn mang ý nghĩa lớn trong việc trợ giúp cho các chuyên gia con ng i. B i vì
trí nhớ c a con ng i thì có thể giảm sút theo th i gian dẫn đến hiệu quả làm việc kém
dần cịn máy tính thì khơng nh vậy.
1.2.2. Đặc trưng và ưu điểm của hệ chuyên gia
Một HCG th

ng có các đặc tr ng cơ bản sau [3]:

- Phân tách tri th c và điều khiển: Nh

trong hệ luật sinh/hệ sinh
(Production System), bộ điều khiển nhận dạng - hành động (Recognize Action control) hoạt động trong vòng lặp c a hệ sinh, còn các tri th c đ ợc mã
hóa vào trong các luật. u điểm c a sự tách biệt này là dễ thay đổi loại cơ s tri
th c (CSTT) mà không thay đổi việc điều khiển ch ơng trình và ng ợc lại.

- S hữu tri th c chuyên gia: HCG có ch a tri th c c a lĩnh vực trong cơ s
tri th c. Nh có tri th c mà nó có giá trị. Đặc biệt tri th c này có thể đ ợc nhân ra
thành nhiều bản, có thể cập nhật trong khi hệ thống đư đ ợc triển khai.

- Tính chuyên gia trong lĩnh vực hẹp: Cũng giống nh

chuyên gia con
ng i, HCG đ ợc phát triển nhằm vào một lĩnh vực hẹp vì trong lĩnh vực hẹp đó,
số l ợng tri th c cũng nhỏ hơn giúp cho ng i thiết kế dễ dàng quản lý hơn, dễ
dàng thử nghiệm chiến l ợc điều khiển trong động cơ suy diễn.



11

- Suy luận trên ký hiệu: Chúng ta có thể dùng ký hiệu để thể hiện tri th c cho
HCG. Chính vì vậy mà có thể tận dụng đ ợc các giải thuật trên ký hiệu nh phép
toán vị từ để suy luận tri th c.

- Suy luận có heuristic: Chuyên gia con ng

i có thể từ kinh nghiệm c a
mình để dẫn ra cách giải quyết vấn đề hiệu quả hơn. Để có thể hiện thực điều này
trong HCG, ng i thiết kế cần phải có cách đánh giá th tự u tiên c a các luật,
để từ một ngữ cảnh nào đó có thể chọn một luật có lý nhất để bắt đầu.

- Cho phép suy luận không chính xác: HCG có một khả năng rất mạnh, đó
là nó có thể làm việc với các vấn đề đang thiếu thơng tin, hay có những hỗn tạp,
khơng rõ ràng. Cũng giống nh tr

ng hợp: một đội ngũ bác sĩ đang phải c u một

bệnh nhân hấp hối, lúc đó họ khơng cịn kịp th i gian để làm tất cả các xét nghiệm
cần thiết. Khi thiếu thông tin nh vậy, họ đành tiến hành những cách có lý nhất
theo họ. Chúng ta cũng có thể hiện thực cho HCG có tính chất đó bằng cách đ a
vào những luật t ơng ng với tình huống thiếu thơng tin để động cơ suy diễn vận
dụng.

- Bị giới hạn vào vấn đề giải quyết: Khơng phải mọi vấn đề đều có thể giải
quyết b i HCG. Cụ thể, nếu lĩnh vực chúng ta muốn xây dựng HCG hiện tại ch a
có hoặc ch a cần một chuyên gia con ng i thì việc xây dựng HCG khó mà thành
cơng.


- Giải quyết các vấn đề có độ ph c tạp vừa phải: Nếu vấn đề quá khó, yêu
cầu chuyên gia con ng i đến vài gi , cần thiết nghĩ đến khả năng chia thành
nhiều bài toán con t ơng ng mỗi HCG con.

- Có khả năng bị lỗi: Giống nh chuyên gia con ng

i, HCG cũng có khả
năng bị lỗi. Chính vì vậy cần phải đ a vào khả năng phục hồi lại lỗi cho HCG t c
là HCG có khả năng l u vết q trình suy luận, nếu nó đ a ra một kết luận mà
ng i dùng kiểm nghiệm thực tế có sai và báo cho HCG, lúc đó nó phải có khả
năng ghi nhận và theo đuổi một h ớng suy luận khác. Đặc điểm này không có
trong các ch ơng trình truyền thống.
Những u điểm c a HCG:

- Phổ cập (increased availability): HCG là một sản phẩm c a chuyên gia,
đ ợc phát triển không ngừng và có hiệu quả sử dụng khơng thể ph nhận.

- Giảm chi phí (reduced cost): Việc sử dụng HCG để giải quyết một vấn đề
th ng có chi phí thấp hơn so với việc tìm một chuyên gia để giải quyết vấn đề
đó.

- Giảm r i ro (reduced risk): Sử dụng HCG sẽ giúp con ng

i tránh đ ợc


12
các mơi tr


ng r i ro, nguy hiểm.

- Tính th

ng trực (permanance): HCG có thể đ ợc triển khai sử dụng bất

kể lúc nào trong khi con ng

i có thể mệt mỏi, nghỉ ngơi hay vắng mặt.

- Đa lĩnh vực (multiple expertise): Hiện nay HCG đ ợc xây dựng phục vụ
cho rất nhiều lĩnh vực khác nhau và đ ợc khai thác đồng th i bất kể th i gian sử
dụng.

- Tăng độ tin cậy (increased reliability): Khi khai thác sử dụng một HCG
luôn đảm bảo đ ợc độ tin cậy đối với ng

i sử dụng hệ thống.

- Khả năng giảng giải (explanation): Câu trả l i với m c độ tinh thơng và
đ ợc giải thích rõ ràng chi tiết, dễ hiểu khi ng

i dùng yêu cầu.

- Khả năng trả l i nhanh (fast reponse): Các hệ thống chuyên gia th

ng có
câu trả l i theo th i gian thực, khách quan, nhanh bằng hoặc nhanh hơn một
chuyên gia là con ng i. Do trí nhớ con ng i thì giới hạn mà tốc độ truy xuất c a
máy tính thì ngày càng đ ợc cải thiện cao hơn.


- Tính ổn định, suy luận có lý và đầy đ

mọi lúc mọi nơi (steady,
unemotional, and complete response at all times): HCG th ng hoạt động ổn định,
đảm bảo các câu trả l i đều khách quan, khơng cảm tính nh chuyên gia là con
ng i.

- Trợ giúp thông minh nh

một ng i h ớng dẫn (intelligent-tutor):
HCG là một hệ thống thơng minh, có khả năng trả l i câu hỏi, giải thích, hỗ trợ
ng i dùng ra quyết định kịp th i, nhanh chóng. HCG đóng vai trị nh một
ng i bạn đồng hành thông minh và đáng tin cậy.

- Có thể truy cập nh

là một cơ s

dữ liệu thơng minh (Intelligent
Database): HCG đ ợc xây dựng b i các chuyên gia tri th c. Tri th c mà hệ
thống có đ ợc là các tri th c c a chun gia, rất có giá trị. Bên cạnh đó, HCG
cịn có khả năng tự học hỏi, tự tích lũy tri th c để ngày càng hoàn thiện.
1.2.3. Kiến trúc tổng quát của hệ chuyên gia
a) Những thành phần cơ bản của hệ chuyên gia
Một HCG kiểu mẫu gồm 7 thành phần cơ bản nh sau:


13


Hình 1.5. Những thành phần cơ bản của một HCG

- Cơ s

tri th c (Knowledge Base): Gồm các phần tử (hay đơn vị) tri

th c, thông th ng đ ợc gọi là luật (rule), đ ợc tổ ch c nh một CSDL. Cơ s tri
th c (CSTT) còn đ ợc gọi là bộ nhớ sản xuất (production memory) trong HCG.
Trong một CSTT, ng i ta th ng phân biệt hai loại tri th c là tri th c phán đoán
(assertion knowledge) và tri th c thực hành (operating knowledge). Các tri th c
phán đốn mơ tả các tình huống đư đ ợc thiết lập hoặc sẽ đ ợc thiết lập. Các tri
th c thực hành thể hiện những hậu quả rút ra hay những thao tác cần phải hoàn
thiện khi một tình huống đư đ ợc thiết lập hoặc sẽ đ ợc thiết lập trong lĩnh vực
đang xét. Các tri th c thực hành th ng đ ợc thể hiện b i các biểu th c dễ hiểu và
dễ triển khai thao tác đối với ng i sử dụng.

- Máy suy diễn (Inference Engine): Là cơng cụ/ch ơng trình hay bộ xử lý tạo
ra sự suy luận bằng cách quyết định xem những luật nào sẽ làm thỏa mãn các sự
kiện, các đối t ợng, chọn u tiên các luật thỏa mãn, thực hiện các luật có tính u
tiên cao nhất.

- Lịch cơng việc (Agenda): Hay cịn gọi là lịch thực hiện, ch a danh sách
các luật u tiên do máy suy diễn tạo ra thỏa mãn các sự kiện, các đối t ợng có mặt
trong bộ nhớ làm việc.

- Bộ nhớ làm việc (Working Memory): CSDL toàn cục ch a các sự kiện
(facts) phục vụ cho các luật. Các sự kiện này có thể do ng

i dùng nhập vào lúc


đầu hoặc do HCG sinh ra trong quá trình làm việc.

- Khả năng giải thích (Explanation Facility): Giải nghĩa cách lập luận c a hệ
thống cho ng i sử dụng. Đây là một trong các điểm nổi bật c a HCG. Khả
năng giải thích đ ợc xem nh là một tiện ích c a HCG. Với tiện ích này, HCG có
thể cung cấp cho ng i dùng các khả năng giải thích: Tại sao HCG lại hỏi câu hỏi


14
nào đó (WHY) và bằng cách nào HCG có thể suy ra đ ợc kết luận nào đó (HOW).
Khi chúng ta hỏi WHY, HCG th ng đáp trả bằng cách mơ tả cái mà nó có thể kết
luận từ câu trả l i; hầu hết các HCG th ng đáp trả bằng cách hiện luật mà nó đang
quan tâm. Cịn khả năng giải thích HOW c a HCG có thể thực hiện đ ợc bằng
cách cho phép nó theo vết các luật mà nó sử dụng trong q trình suy luận. Khả
năng giải thích vừa thuận tiện cho cả ng i phát triển HCG, vừa hữu ích cho
phía ng i dùng. Ng i phát triển có thể nh đó tìm ra các lỗi trong tri th c c a
HCG. Ng i dùng thì có thể n tâm hơn khi nhận đ ợc một kết luận nào đó.

- Khả năng thu nhận tri th c (Explanation Facility): Cho phép ng

i sử
dụng bổ sung các tri th c vào hệ thống một cách tự động thay vì tiếp nhận tri th c
bằng cách mã hoá tri th c một cách t
yếu tố mặc nhiên c a nhiều HCG.

ng minh. Khả năng thu nhận tri th c là

- Giao diện ng

i sử dụng (User Interface): Là nơi ng i sử dụng và

HCG trao đổi với nhau. Yêu cầu cao nhất cho giao diện là khả năng cung cấp cách
hỏi đáp t ơng tự nh giao tiếp giữa ng i với ng i. Tuy nhiên, khi thực hiện hệ
thống, vì những hạn chế c a những kỹ thuật hiện tại nên ng i thiết kế phải nghĩ
đến những hình th c giao tiếp sao cho tiện lợi, ch a thật sự giống hỏi đáp giữa
ng i với ng i nh các câu hỏi YES/NO, các câu hỏi cho phép lựa chọn từ hộp
chọn trả l i, hoặc chấp nhận những từ khóa trả l i đơn giản…
b) Một số mơ hình kiến trúc hệ chun gia
Có nhiều mơ hình kiến trúc HCG theo các tác giả khác nhau. Sau đây là một số
mơ hình:

- Mơ hình J. L. Ermine

Hình 1.6. Kiến trúc HCG theo J. L. Ermine


×