BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM
NGUYỂN THỊ THU HÀ
XÂY DỰNG HỆ THỐNG
TƯ VẤN NGHỀ TẠI TRƯỜNG
CAO ĐẲNG NGHỀ TỈNH GIA LAI
LUẬN VĂN THẠC SĨ KỸ THUẬT
Đà Nẵng - Năm 2017
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM
NGUYỂN THỊ THU HÀ
XÂY DỰNG HỆ THỐNG
TƯ VẤN NGHỀ TẠI TRƯỜNG
CAO ĐẲNG NGHỀ TỈNH GIA LAI
Chuyên ngành: Hệ thống thông tin
Mã số: 61.49.01.04
LUẬN VĂN THẠC SĨ KỸ THUẬT
Người hướng dẫn khoa học: PGS.TS. VÕ TRUNG HÙ NG
Đà Nẵng - Năm 2017
LỜI CAM ĐOAN
Tôi xin cam đoan:
Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn
trực tiếp của PGS.TS. Võ Trung Hùng.
Mọi tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên tác giả,
tên cơng trình, thời gian, địa điểm cơng bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin
chịu hồn tồn trách nhiệm.
Tác giả
l�
�
Nguyễn Thị Thu Hà
MỤC LỤC
MỞ ĐẦU .................................................................................................................... 1
1. Tính cấp thiết của đề tài ................................................................................... 1
2. Mục tiêu nghiên cứu ......................................................................................... 2
3. Đối tượng và phạm vi nghiên cứu .................................................................... 2
4. Phương pháp nghiên cứu .................................................................................. 3
5. Bố cục đề tài .................................................................................................... 3
6. Tổng quan tài liệu nghiên cứu ......................................................................... 4
CHƯƠNG 1. CƠ SỞ LÝ THUYẾT ......................................................................... 5
1.1. HỆ CHUYÊN GIA ...............................................................................................5
1.1.1. Khái niệm ................................................................................................... 5
1.1.2. Đặc trưng và ưu điểm của hệ chuyên gia ................................................... 6
1.1.3. Các lĩnh vực ứng dụng của hệ chuyên gia.................................................. 7
1.1.4. Kiến trúc của hệ chuyên gia ....................................................................... 8
1.1.5. Biểu diễn tri thức trong hệ chuyên gia ..................................................... 10
1.1.6. Kỹ thuật suy luận trong hệ chuyên gia ..................................................... 12
1.1.7. Hệ chuyên gia dựa trên luật ...................................................................... 14
1.2. NGHỀ NGHIỆP VÀ VAI TRÒ CỦA TƯ VẤN HƯỚNG NGHIỆP ................18
1.2.1. Khái niệm về nghề nghiệp ........................................................................ 18
1.2.2. Vai trò của tư vấn hướng nghiệp .............................................................. 19
1.3. MỘT SỐ LÝ THUYẾT CHỌN NGHỀ NGHIỆP .............................................20
1.3.1. Lý thuyết mật mã Holland ........................................................................ 20
1.3.2. Lý thuyết nghề nghiệp .............................................................................. 23
1.4. TỔNG KẾT CHƯƠNG......................................................................................25
CHƯƠNG 2. PHÂN TÍCH, THIẾT KẾ HỆ THỐNG ......................................... 26
2.1. PHÂN TÍCH HIỆN TRẠNG .............................................................................26
2.1.1. Tình hình cơng tác tuyển sinh .................................................................. 26
2.1.2. Đặc điểm tuyển sinh tại trường Cao đẳng Nghề Gia Lai ......................... 27
2.1.3. Tầm quan trọng của việc tư vấn tuyển sinh.............................................. 27
2.2. MÔ TẢ HỆ THỐNG TƯ VẤN NGHỀ NGHIỆP.............................................28
2.2.1. Danh sách các ngành tuyển sinh tại Trường Cao Đẳng Nghề Gia Lai .... 28
2.2.2. Mô tả hệ thống tư vấn nghề ...................................................................... 31
2.2.3. Bài toán tư vấn tuyển sinh ........................................................................ 32
2.2.4. Mơ hình đề xuất ........................................................................................ 32
2.3. PHÂN TÍCH, THIẾT KẾ HỆ THỐNG .............................................................34
2.3.1. Phân tích lý thuyết nghề nghiệp ............................................................... 34
2.3.2. Biểu đồ ca sử dụng ................................................................................... 40
2.3.3. Biểu đồ hoạt động..................................................................................... 41
2.3.4. Biểu đồ lớp ............................................................................................... 41
2.3.5. Xây dựng tập luật cho hệ thống tư vấn nghề tại trường Cao đẳng Nghề
Gia Lai …………………………………………………………………………...44
2.4. TỔNG KẾT CHƯƠNG......................................................................................60
CHƯƠNG 3. XÂY DỰNG VÀ THỬ NGHIỆM HỆ THỐNG ............................ 61
3.1. CÔNG CỤ PHÁT TRIỂN ..................................................................................61
3.2. XÂY DỰNG HỆ THỐNG .................................................................................61
3.2.1. Xây dựng tập luật ..................................................................................... 61
3.2.2. Xây dựng bộ máy suy diễn ....................................................................... 62
3.2.3. Xây dựng các chức năng .......................................................................... 62
3.3. KẾT QUẢ THỬ NGHIỆM ................................................................................64
3.3.1. Một số giao diện trang Cổng thông tin tuyển sinh ................................... 64
3.3.2. Một số chức năng dành cho quản trị viên ................................................ 74
3.3.3. Một số chức năng dành cho chuyên gia ................................................... 78
3.3.4. Đánh giá kết quả chương trình ................................................................. 82
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ............................................................. 84
TÀI LIỆU THAM KHẢO
QUYẾT ĐỊNH GIAO ĐỀ TÀI (BẢN SAO)
DANH MỤC CÁC TỪ VIẾT TẮT
CĐNGL
: Cao đẳng Nghề Gia Lai
CSTT
: Cơ sở tri thức
HCG
: Hệ chuyên gia
HS
: Học sinh
LTCNN
: Lý thuyết cây nghề nghiệp
LTMM
: Lý thuyết mật mã
MTSD
: Mô tơ suy diễn
SV
: Sinh viên
TVNN
: Tư vấn nghề nghiệp
TVTS
: Tư vấn tuyến sinh
XH
: Xã hội
DANH MỤC CÁC BẢNG
Số hiệu
Tên bảng
bảng
1.1.
2.1.
2.2.
2.3.
Bảng các lĩnh vực ứng dụng của hệ chuyên gia
Danh sách các ngành tuyển sinh bậc Cao đẳng tại
trường CĐNGL
Danh sách các ngành tuyển sinh bậc Trung cấp tại
trường CĐNGL
Bảng tóm tắt 6 nhóm tính cách/môi trường làm việc
Trang
8
29
30
38
DANH MỤC CÁC HÌNH VẼ
Số hiệu
Tên hình
hình
Trang
1.1.
Những thành phần cơ bản của một HCG
8
1.2.
Quy trình hoạt động của Recognize-Action
16
1.3.
Kiến trúc HCG dựa trên luật
17
1.4.
Quy trình hướng nghiệp
18
1.5.
Mơ hình nhóm sở thích nghề nghiệp của Lý thuyết
Holland
20
1.6.
Mơ hình lục giác Holland
21
1.7.
Mơ hình LTCNN
24
2.1.
Mơ hình tổng thể hệ thống
32
2.2.
Biểu đồ ca sử dụng – mức tổng quát
40
2.3.
Biểu đồ ca sử dụng phân rã – dành cho sinh viên
40
2.4.
Biểu đồ ca sử dụng phân rã – dành cho quản trị viên
41
2.5.
Biểu đồ hoạt động – Tư vấn dựa trên lý thuyết nghề
41
2.6.
Biểu đồ lớp cho hệ hỗ trợ TVNN tại trường CĐNGL
43
3.1.
Giao diện Trang Thông tin tuyển sinh
65
3.2.
Giao diện Trang Tư vấn chọn nghề dựa trên LTNN
66
3.3.
Giao diện kết quả Tư vấn chọn nghề dựa trên LTNN
67
3.4.
Giao diện giải thích ngành Cơng nghệ thông tin
68
3.5.
3.6.
Giao diện Trang Tư vấn chọn nghề dựa trên LTMM
Holland
Giao diện kết quả Tư vấn chọn nghề dựa trên LTMM
Holland
69
70
3.7.
Giao diện giải thích ngành Cơng nghệ sinh học
71
3.8.
Giao diện Ngành đào tạo
72
Số hiệu
Tên hình
hình
Trang
3.9.
Giao diện Cơ hội việc làm
73
3.10.
Giao diện Giới thiệu về trường CĐNGL
73
3.11.
Giao diện Liên hệ
74
3.12.
Giao diện Đăng nhập
74
3.13.
Giao diện Quản lý tài khoản người dùng
75
3.14.
Giao diện Tạo tài khoản mới
75
3.15.
Giao diện Cập nhật thông tin tài khoản
76
3.16.
Giao diện Quản lý nghành
76
3.17.
Giao diện Thêm ngành nghề mới
77
3.18.
Giao diện Cập nhật thông tin ngành nghề
78
3.19.
Giao diện Quản lý luật
79
3.20.
Giao diện Thêm luật mới
79
3.21.
Giao diện Cập nhật thông tin của luật
80
3.22.
Giao diện Quản lý điều kiện
80
3.23.
Giao diện Thêm mới điều kiện
81
3.24.
Giao diện Chức năng cập nhật điều kiện
82
1
MỞ ĐẦU
1. Tính cấp thiết của đề tài
Mỗi chúng ta khi bước vào đời đều có những ước mơ và khát vọng về nghề
nghiệp cho tương lai. Đặc biệt, nghề nghiệp càng quan trọng đối với thế hệ trẻ, bởi
họ chính là chủ nhân tương lai của đất nước. Nhân tố con người ln đóng một vai
trị quyết định cho sự phát triển, vì vậy một xã hội (XH) hiện đại rất cần những con
người có nghề nghiệp chun mơn vững vàng cho sự phát triển của đất nước.
Chính vì vậy tư vấn nghề nghiệp (TVNN) đã và đang được xem là một vấn đề
nóng hiện nay. Đây là một trong những vấn đề cấp bách đặt ra đối với nhà trường,
gia đình và xã hội (XH). Việc lựa chọn nghành học là quyết định quan trọng bởi nó
ảnh hưởng lớn đến tương lai mỗi người sau này. Khi được định hướng đúng đắn về
nghề nghiệp, sinh viên (SV) sẽ n tâm với nghề mình đã lựa chọn, có thái độ chủ
động, tích cực học tập, rèn luyện để có thể hoạt động tốt lĩnh vực nghề nghiệp trong
tương lai. Tuy nhiên, nhiều SV lựa chọn nghề không đúng đắn, ít tìm hiểu kỹ về
ngành học, cơng việc mà mình sẽ theo đuổi. Đó là sự lựa chọn chỉ dựa theo cảm
tính, lựa chọn những ngành nghề ưa chuộng trên thị trường mà thiếu đi suy nghĩ
xem nghành nghề đó có phù hợp với khả năng và năng lực của mình khơng, chính
vì sai lầm đó mà SV gặp khó khăn ngay trong quá trình nghiên cứu học tập .Từ đó
dẫn đến sự nản chí, học tập kém hăng say dễ dẫn đến bỏ học. Một số có điều kiện
thì chuyển ngành, số khác tiếp tục theo đuổi nhưng trong tâm thế buông trôi. Như
vậy lựa chọn nghề phù hợp với bản thân là rất quan trọng không chỉ tác động đến
bản thân mà cịn tác động đến tồn XH. Lực lượng lao động yếu kém kéo theo nền
kinh tế kém phát triển. Theo báo cáo của Tổng cục Thống kê cho thấy, trong 6
tháng đầu năm 2016 tổng số người thất nghiệp của Việt Nam là 1.12 triệu người,
chiếm khoảng 2.23%. Trong đó tỷ lệ thất nghiệp của lao động có trình độ đại học
trở lên của cả nước là 3.96% và số liệu này đặc biệt cao ở khu vực thành thị [11].
Trường Cao đẳng Nghề Gia Lai (CĐNGL) là một trong những trường đào tạo
nguồn nhân lực có kỹ năng nghề cao, nhằm phục vụ cho sự nghiệp cơng nghiệp hố,
2
hiện đại hóa tỉnh Gia Lai và cả nước. Trường được thành lập trên cơ sở nâng cấp
trường Trung cấp Nghề Gia Lai. Năm 1976, trường Công nhân Kỹ thuật Cơ Điện
Gia Lai và trường Công nhân Kỹ thuật Xây dựng Gia Lai được thành lập, sau đó
hợp nhất thành trường Trung cấp Nghề Gia Lai. Trường CĐNGL là một trường đào
tạo đa ngành, đa nghề, đào tạo thực hiện theo phương châm đa dạng hóa cơng tác
dạy nghề và gắn với nhu cầu của doanh nghiệp. Tuy nhiên, hàng năm đều có khơng
ít trường hợp SV vẫn bỏ học, tỷ lệ SV tốt nghiệp ra trường có việc làm và làm đúng
ngành không cao. Mặc dù nhà trường luôn quan tâm về chất lượng đào tạo, cải tiến
phương pháp giảng dạy, đổi mới chương trình theo nhu cầu XH. Ngồi ra trường
cịn xây dựng nhiều kênh tạo cầu nối giúp SV của nhà trường sau khi tốt nghiệp tìm
được việc làm nhưng vẫn chưa giải quyết triệt để vấn đề. Một phần là do công tác tư
vấn nghề trong quá trình tuyển sinh chưa đạt hiệu quả cao ảnh hưởng đến chất
lượng đầu vào. Chính vì vậy việc tư vấn hướng nghiệp là việc vô cùng quan trọng
giúp cho mỗi SV khi vào trường chọn nghề một cách có cơ sở, nhận thức đúng đắn
hơn về nghề nghiệp, phát huy tối đa năng lực sáng tạo, nâng cao chất lượng cuộc
sống, phù hợp với nền kinh tế vận hành theo cơ chế thị trường, đồng thời đáp ứng
được nhu cầu của XH, tránh lãng phí về đào tạo và sử dụng lao động hợp lý, góp
phần vào việc phát triển kinh tế, XH bền vững của đất nước. Xuất phát từ những lý
do trên tôi quyết định chọn nghiên cứu đề tài: “ Xây dựng hệ thống tư vấn nghề tại
Trường Cao đẳng nghề tỉnh Gia Lai ” nhằm cải thiện tình trạng chọn sai ngành
của SV khi theo học tại trường CĐNGL.
2. Mục tiêu nghiên cứu
Mục tiêu của đề tài là nghiên cứu xây dựng hệ chuyên gia (HCG) ứng dụng
trong lĩnh vực hỗ trợ TVNN cho SV, áp dụng để cải thiện tình trạng chọn sai ngành
trong SV hiện nay.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu
- Cơ sở lý thuyết về kho dữ liệu tri thức.
- Cơ sở lý thuyết về HCG.
3
- Các hoạt động liên quan đến tư vấn tuyển sinh.
- Ngơn ngữ lập trình mã nguồn mở PHP,…
- Một số bài báo và luận văn tốt nghiệp khóa trước.
3.2. Phạm vi nghiên cứu
- Nghiên cứu cách tạo các tập luật, cơ chế suy diễn.
- Công tác tư vấn tuyển sinh tại trường CĐNGL.
- Mơ hình kiến trúc của HCG.
4. Phương pháp nghiên cứu
Nghiên cứu dựa trên hai phương pháp chủ yếu là phương pháp nghiên cứu
tài liệu và phương pháp thực nghiệm.
4.1. Phương pháp nghiên cứu tài liệu
- Các tài liệu về cơ sở lý thuyết: HCG, kho dữ liệu tri thức, tạo sinh tập luật.
- Các tài liệu mô tả một số hệ thống tư vấn.
4.2. Phương pháp thực nghiệm
Phương pháp này được tôi sử dụng để khảo sát tình hình tư vấn tuyển sinh tại
trường CĐNGL. Từ kết quả khảo sát đó, tơi tiến hành phân tích các yêu cầu và thiết
kế giải pháp tư vấn tuyển sinh (TVTS) dựa trên HCG. Kết quả hệ thống được xây
dựng sẽ được kiểm thử trên máy cục bộ và trên Internet
5. Bố cục đề tài
Luâ ̣n văn đươ ̣c tổ chức thành 3 chương với nội dung như sau :
Chương 1. Cơ sở lý thuyết
Trong chương 1, tơi trình bày lý thuyết một cách tổng quan về hệ chuyên gia
và một số lý thuyết nghề nghiệp.
Chương 2. Phân tích, thiết kế hệ thống
Trong chương 2, từ phân tích thực trạng, tầm quan trọng của TVTS, các đặc
điểm TVTS tại trường CĐNGL. Từ đó tơi trình bày hướng khắc phục những hạn
chế trên bằng cách mô tả một hệ thống để tin học hóa q trình TVTS. Đồng thời,
nội dung chương này cũng đề xuất giải pháp xây dựng hệ thống theo mơ hình của
hệ chun gia (HCG). Bên cạnh đó, nội dung chương cũng trình bày sự phân tích
4
các lý thuyết về hướng nghiệp như lý thuyết cây nghề nghiệp, lý thuyết Holland để
xây dựng các luật cho HCG.
Chương 3. Xây dựng và kiểm thử hệ thống
Từ những cơ sở lý thuyết đã tìm hiểu ở chương 1 và mơ hình hệ chun gia
được lựa chọn qua q trình phân tích hệ thống ở chương 2, trong chương 3 này tơi
tiếp tục lựa chọn ngơn ngữ lập trình và môi trường phát triển để xây dựng và kiểm
thử hệ thống.
6. Tổng quan tài liệu nghiên cứu
Trong quá trình nghiên cứu, xây dựng hệ thống, tôi đi nghiên cứu về hệ
chuyên gia [2],[4], về lý thuyết nghề nghiệp [9][12]. Để xây dựng hệ thống tôi đã
nghiên cứu [1][3][7].
5
CHƯƠNG 1
CƠ SỞ LÝ THUYẾT
Trong chương này, các nội dung được trình bày chủ yếu liên quan đến các vấn
đề như: hệ chuyên gia, tư vấn định hướng nghề nghiệp.
1.1. HỆ CHUYÊN GIA
1.1.1. Khái niệm
HCG là một hệ thống tin học có thể mơ phỏng năng lực quyết định và hành
động của một chuyên gia (con người). HCG còn gọi là hệ thống dựa tri thức, là một
chương trình máy tính chứa một số tri thức đặc thù của một hoặc nhiều chuyên gia
con người về một chủ đề cụ thể nào đó. HCG là một trong những lĩnh vực ứng dụng
của trí tuệ nhân tạo (Artificial Intelligence). Các chương trình thuộc loại này đã
được phát triển từ các thập kỷ 1960 và 1970, và trở thành ứng dụng thương mại từ
thập kỷ 1980 [4].
Dạng phổ biến nhất của HCG là một chương trình gồm một tập luật phân tích
thơng tin (thường được cung cấp bởi người sử dụng hệ thống) HCG sử dụng tri thức
của những chuyên gia để giải quyết các vấn đề khác nhau thuộc mọi lĩnh vực. Tri
thức trong HCG phản ánh sự tinh thông được tích tụ từ sách vở, tạp chí, các chuyên
gia hay các nhà khoa học. Thông thường, các nhà thiết kế HCG thu thập tri thức
này, từ lý thuyết đến các kinh nghiệm, kỹ xảo, phương pháp làm tắt, các luật dùng
để chọn ra cách để giải quyết vấn đề có nhiều khả năng được chấp nhận nhất (chiến
lược heuristic) đã tích lũy được của các chuyên gia con người qua quá trình làm
việc của họ trong một lĩnh vực chuyên môn. Từ tri thức này, người ta cố gắng cài
đặt chúng vào hệ thống để hệ thống có thể mơ phỏng theo cách thức các chuyên gia
làm việc. Đây là một hệ thống sử dụng các khả năng lập luận để đạt tới các kết luận.
Tuy nhiên, không giống với con người, các chương trình hiện tại khơng tự học lấy
kinh nghiệm mà tri thức phải được lấy từ con người và mã hóa thành ngơn ngữ hình
thức. Đây chính là nhiệm vụ chính của các nhà thiết kế HCG phải đương đầu [6] .
6
Ta có sơ đồ mơ tả khái qt như sau:
Qua sơ đồ trên ta có thể thấy: Một hệ chuyên gia ứng dụng được xây dựng dựa
trên Cơ sở tri thức (CSTT) và Mơ tơ suy diễn (MTSD). Trong đó CSTT được lấy từ
nguồn tri thức. Có hai loại: 1. Xin ý kiến từ các chuyên gia trong lĩnh vực đó; 2.
Tổng hợp từ các tài liệu chun mơn. Cịn MTSD phụ thuộc vào người dùng và do
người dùng đưa ra [7].
Ngày nay, HCG được ứng dụng trong nhiều lĩnh vực khác nhau như y học,
tốn học, cơng nghệ, hóa học, địa chất, khoa học máy tính, kinh doanh, luật pháp,
quốc phòng và giáo dục.
1.1.2. Đặc trưng và ưu điểm của hệ chuyên gia
❖ Các đặc trưng cơ bản của một hệ chuyên gia
- Hiệu quả cao (high performance): Khả năng trả lời với mức độ tinh thông
bằng hoặc cao hơn so với chuyên gia (người) trong cùng lĩnh vực.
- Thời gian trả lời thoả đáng (adequate response time): Thời gian trả lời hợp
lý, bằng hoặc nhanh hơn so với chuyên gia (người) để đi đến cùng một quyết định.
HCG là một hệ thống thời gian thực (real time system).
- Độ tin cậy cao (good reliability): Không thể xảy ra sự cố hoặc giảm sút độ
tin cậy khi sử dụng.
- Dễ hiểu (understandable): HCG giải thích các bước suy luận một cách dễ
hiểu và nhất quán, không giống như cách trả lời bí ẩn của các hộp đen (black box)
[4].
❖ Những ưu điểm của HCG
7
- Phổ cập (increased availability): Là sản phẩm chuyên gia, được phát triển
không ngừng với hiệu quả sử dụng không thể phủ nhận.
- Giảm giá thành (reduced cost): Việc sử dụng HCG để giải quyết một vấn đề
thường có chi phí thấp hơn so với việc tìm một chun gia để giải quyết vấn đề đó.
- Giảm rủi ro (reduced dangers): Giúp con người tránh được trong các môi
trường rủi ro, nguy hiểm.
- Tính thường trực (Permanance): Bất kể lúc nào cũng có thể khai thác sử
dụng, trong khi con người có thể mệt mỏi, nghỉ ngơi hay vắng mặt.
- Đa lĩnh vực (multiple expertise): chuyên gia về nhiều lĩnh vực khác nhau và
được khai thác đồng thời bất kể thời gian sử dụng.
- Độ tin cậy (increased relialility): Luôn đảm bảo độ tin cậy khi khai thác.
- Khả năng giảng giải (explanation): Câu trả lời với mức độ tinh thông được
giảng giải rõ ràng chi tiết, dễ hiểu.
- Khả năng trả lời (fast reponse): Trả lời theo thời gian thực, khách quan.
- Tính ổn định, suy luận có lý và đầy đủ mọi lúc mọi nơi (steady, une
motional, and complete response at all times): HCG thường hoạt động ổn định, đảm
bảo các câu trả lời đều khách quan, không cảm tính như chuyên gia là con người.
- Trợ giúp thông minh như một người hướng dẫn (intelligent -tutor): là một hệ
thống, có khả năng trả lời câu hỏi, giải thích, hỗ trợ người dùng ra quyết định kịp
thời, nhanh chóng
- Có thể truy cập như là một cơ sở dữ liệu thông minh (intelligent database):
HCG được xây dựng bởi các chuyên gia tri thức. Tri thức mà hệ thống có được là
các tri thức của chuyên gia, rất có giá trị. Bên cạnh đó, HCG cịn có khả năng tự học
hỏi, tự tích lũy tri thức để ngày càng hoàn thiện.
- Các lĩnh vực ứng dụng của hệ chuyên gia:
Hiện nay HCG được ứng dụng trong nhiều lĩnh vực khác nhau ví dụ
như: cơng nghệp, nơng nghiệp, khoa học máy tính, thương mại khí tượng, y học,
qn sự, hố học.....Đặc biệt trong giai đoạn gần đây việc ứng dụng HCG vào lĩnh
vực giáo dục đào tạo đang được phát triển mạnh.
8
Bảng 1.1. Bảng các lĩnh vực ứng dụng của hệ chun gia
Lĩnh vực
Cấu hình
(Configuration)
Chẩn đốn (Diagnosis)
Ứng dụng diện rộng
Tập hợp thích đáng những thành phần của một hệ
thống theo cách riêng.
Lập luận dựa trên những chứng cứ quan sát được.
Truyền đạt (Instruction)
Phần mềm dạy học, có thể chuẩn đốn và sủa lỗi của
học sinh trong quá trình học tập: Multimedia, Internet.
Dạy học kiểu thơng minh sao cho SV có thể hỏi
(Instruction) vì sao (why?), như thế nào (how?) và cái
gì nếu (what if?) giống như hỏi một người thầy giáo .
Đưa ra mơ tả tình huống các dữ liệu thu thập được.
Giải thích
(Interpretation)
Kiểm tra (Monitoring)
So sánh dữ liệu thu lượm được với dữ liệu chuyên môn
để đánh giá hiệu quả.
Lập kế hoạch (Planning) Lập kế hoạch sản xuất theo yêu cầu.
Dự đốn (Prognosis)
Đưa ra hậu quả của một tình huống nào đó, như là dự
báo thời tiết, dự báo giá cả thị trường.
Chữa trị (Remedy)
Chỉ định cách thụ lý một vấn đề.
Điều khiển (Control)
Điều khiển một q trình, địi hỏi diễn giải, chẩn đoán,
kiểm tra, lập kế hoạch, dự đoán và chữa trị [4].
1.1.3. Kiến trúc của hệ chuyên gia
Một HCG kiểu mẫu gồm bảy thành phần cơ bản như sau:
Hình 1.1. Những thành phần cơ bản của một HCG
9
- CSTT (knowledge base): Gồm các phần tử (hay đơn vị) tri thức, thông
thường được gọi là luật (rule), được tổ chức như một cơ sở dữ liệu. Trong một
CSTT, người ta thường phân biệt hai loại tri thức là tri thức phán đoán (assertion
knowledge) và tri thức thực hành (operating knowledge). Các tri thức phán đốn mơ
tả các tình huống đã được thiết lập hoặc sẽ được thiết lập. Các tri thức thực hành thể
hiện những hậu quả rút ra hay những thao tác cần phải hoàn thiện khi một tình
huống đã được thiết lập hoặc sẽ được thiết lập trong lĩnh vực đang xét. Các tri thức
thực hành thường được thể hiện bởi các biểu thức dễ hiểu và dễ triển khai thao tác
đối với người sử dụng.
- Máy duy diễn (inference engine): là cơng cụ (chương trình, hay bộ xử lý)
tạo ra sự suy luận bằng cách quyết định xem những luật nào sẽ làm thỏa mãn các sự
kiện, các đối tượng, chọn ưu tiên các luật thỏa mãn, thực hiện các luật có tính ưu
tiên cao nhất.
- Lịch công việc (agenda): Danh sách các luật ưu tiên do máy suy diễn tạo ra
thoả mãn các sự kiện, các đối tượng có mặt trong bộ nhớ làm việc.
- Bộ nhớ làm việc (working memory): CSDL toàn cục chứa các sự kiện
(facts) phục vụ cho các luật. Các sự kiện này có thể do người dùng nhập vào lúc đầu
hoặc do HCG sinh ra trong quá trình làm việc.
- Khả năng giải thích (explanation facility): Giải nghĩa cách lập luận của hệ
thống cho người sử dụng. Đây là một trong các điểm nổi bật của HCG. Khả năng
giải thích được xem như là một tiện ích của HCG. Với tiện ích này, HCG có thể
cung cấp cho người dùng các khả năng giải thích: Tại sao HCG lại hỏi câu hỏi nào
đó (WHY) và bằng cách nào HCG có thể suy ra được kết luận nào đó (HOW). Khi
chúng ta hỏi WHY, HCG thường đáp trả bằng cách mơ tả cái mà nó có thể kết luận
từ câu trả lời; hầu hết các HCG thường đáp trả bằng cách hiện luật mà nó đang quan
tâm. Cịn khả năng giải thích HOW của HCG có thể thực hiện được bằng cách cho
phép nó theo vết các luật mà nó sử dụng trong q trình suy luận. Khả năng giải
thích vừa thuận tiện cho cả người phát triển HCG, vừa hữu ích cho phía người
10
dùng. Người phát triển có thể nhờ đó tìm ra các lỗi trong tri thức của HCG. Người
dùng thì có thể yên tâm hơn khi nhận được một kết luận nào đó.
- Khả năng thu nhận tri thức (explanation facility): Cho phép người sử dụng
bổ sung các tri thức vào hệ thống một cách tự động thay vì tiếp nhận tri thức bằng
cách mã hoá tri thức một cách tường minh. Khả năng thu nhận tri thức là yếu tố mặc
nhiên của nhiều HCG.
- Giao diện người sử dụng (user interface): Là nơi người sử dụng và HCG
trao đổi với nhau [4].
1.1.4. Biểu diễn tri thức trong hệ chuyên gia
Một thành phần vô cùng quan trọng của hệ chuyên gia đó là cơ sở tri thức.
Thơng qua các phiên thu nạp tri thức (trực tiếp hay gián tiếp) chúng ta đã xây dựng
được một CSTT cho HCG. Biểu diễn tri thức là phương pháp để mã hóa tri thức,
nhằm thành lập CSTT cho các HCG. Tri thức thực của lĩnh vực gồm các đối tượng
và quan hệ giữa chúng trong lĩnh vực.
HCSTT/ HCGƯD = CSTT + MTSD + Giao Diện
+ Giải thích + Thu nạp
(KDD)/Soạn thảo (Tri thức chuyên gia) [7]
Tri thức của một HCG có thể được biểu diễn theo nhiều cách khác nhau.
Thông thường người ta sử dụng các cách sau đây:
❖ Biểu diễn tri thức bởi các luật sản xuất :
Hiện nay, hầu hết các HCG đều là các hệ thống dựa trên luật, bới lý do như sau:
- Bản chất đơn thể (modular nature): Có thể đóng gói tri thức và mở rộng hệ
chuyên gia một cách dễ dàng.
- Khả năng diễn giải dễ dàng (explanation facilities): Dễ dàng dùng luật để
diễn giải vấn đề nhờ các tiền đề đặc tả chính xác các yếu tố vận dụng luật, từ đó rút
ra được kết quả.
- Tương tự quá trình nhận thức của con người: Dựa trên các cơng trình của
Newell và Simon, các luật được xây dựng từ cách con người giải quyết vấn đề.
Cách biểu diễn luật nhờ IF THEN đơn giản cho phép giải thích dễ dàng cấu trúc tri
thức cần trích lọc.
11
Luật là một kiểu sản xuất được nghiên cứu từ những năm 1940. Trong một hệ
thống dựa trên luật, công cụ suy luận sẽ xác định những luật nào là tiên đề thỏa mãn
các sự việc.
Các luật sản xuất thường được viết dưới dạng IF THEN. Có hai dạng:
IF < điều kiện > THEN < hành động >
hoặc
IF < điều kiện > THEN < kết luận > DO < hành động >
Tuỳ theo HCG cụ thể mà mỗi luật có thể được đặt tên. Chẳng hạn mỗi luật có
dạng Rule: tên, sau phần tên là phần IF của luật.
Phần giữa IF và THEN là phần trái luật (LHS: Left - Hand -Side), có nội dung
được gọi theo nhiều tên khác nhau, như tiền đề (antecedent), điều kiện (conditional
part), mẫu so khớp (pattern part).
Phần sau THEN là kết luận hay hậu quả (consequent). Một số HCG có thêm
phần hành động (action) được gọi là phần phải luật (RHS: Right - Hand -Side).
❖ Biểu diễn tri thức nhờ mệnh đề logic:
Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép tốn lơgic tác
động lên các ký hiệu để thể hiện suy luận lôgic. Kỹ thuật chủ yếu thường được sử
dụng là lôgic vị từ
Phát biểu
Tom là đàn ông
Tom là cha của Mary
Vị từ
MAN(tom)
FATHER(tom, mary)
Các vị từ thường có chứa hằng, biến hay hàm. Người ta gọi các vị từ khơng
chứa biến (có thể chứa hằng) là các mệnh đề (preposition). Mỗi vị từ có thể là một
sự kiện(fact) hay một luật. Luật là vị từ gồm hai vế trái và phải được nối nhau bởi
một dấu mũi tên (→).
Các ví dụ dưới đây minh hoạ cách thể hiện các phát biểu (cột bên trái) dưới
dạng vị từ (cột bên phải)
❖ Biểu diễn tri thức nhờ mạng ngữ nghĩa:
Trong phương pháp này, người ta sử dụng một đồ thị gồm các nút (node) và
12
các cung (arc) nối các nút để biểu diễn tri thức. Nút dùng để thể hiện các đối tượng,
thuộc tính của đối tượng và giá trị của thuộc tính. Cịn cung dùng để thể hiện các
quan hệ giữa các đối tượng. Các nút và các cung đều được gắn nhãn.
❖ Biểu diễn tri thức nhờ ngơn ngữ nhân tạo:
Nói chung, theo quan điểm của người sử dụng, ngôn ngữ tự nhiên sẽ là
phương cách thuận tiện nhất để giao tiếp với một HCG, không những đối với người
quản trị hệ thống (tư cách chuyên gia), mà còn đối với người sử dụng cuối. Hiện
nay đã có những HCG có khả năng đối thoại trên ngôn ngữ tự nhiên (thông thường
là tiếng Anh) nhưng chỉ hạn chế trong lĩnh vực ứng dụng chun mơn của HCG.
Ngồi ra, người ta cịn sử dụng cách biểu diễn tri thức nhờ các sự kiện khơng
chắc chắn, nhờ bộ ba : đối tượng, thuộc tính và giá trị (O-A-V: Object-AttributeValue), nhờ khung (frame), v.v... Tuỳ theo từng HCG, người ta có thể sử dụng một
cách hoặc đồng thời cả nhiều cách [4].
1.1.5. Kỹ thuật suy luận trong hệ chuyên gia
Suy luận hay suy diễn là quá trình làm việc với tri thức, sự kiện, chiến lược
giải tốn để dẫn ra kết luận.
Động cơ, mơ tơ hay máy suy diễn gồm 2 bộ phận chính:
- Kỹ thuật suy diễn (Processor) gồm:
Suy diễn tiến (forward-chaining)
Suy diễn lùi (backward-chaining)
a. Kỹ thuật suy diễn tiến
Suy diễn tiến là lập luận từ các sự kiện, sự việc để rút ra các kết luận. Ví dụ:
Nếu thấy trời mưa trước khi ra khỏi nhà (sự kiện) thì phải lấy áo mưa (kết luận).
Trong phương pháp này, người sử dụng cung cấp các sự kiện cho HCG để
máy suy diễn tìm cách rút ra các kết luận có thể. Kết luận được xem là các thuộc
13
tính có thể gán giá trị. Trong số những kết luận này, có thể có những kết luận làm
người sử dụng quan tâm, một số khác khơng nói lên điều gì, một số khác có thể
vắng mặt.
Các sự kiện thường có dạng: Attribute = value.
Lần lượt các sự kiện trong CSTT được chọn và hệ thống xem xét tất cả các
luật mà các sự kiện này xuất hiện như là tiền đề. Theo nguyên tắc lập luận trên, hệ
thống sẽ lấy ra những luật thỏa mãn. Sau khi gán giá trị cho các thuộc tính thuộc kết
luận tương ứng, người ta nói rằng các sự kiện đã được thỏa mãn. Các thuộc tính
được gán giá trị sẽ là một phần của kết quả chuyên gia. Sau khi mọi sự kiện đã được
xem xét, kết quả được xuất ra cho người sử dụng [4].
Ưu điểm: kỹ thuật suy diễn tiến là làm việc với bài tốn có bản chất gồm
thơng tin và sau đó tìm xem có thể suy ra được gì từ thơng tin đó. Cũng với kỹ thuật
này, có thể dẫn ra rất nhiều thông tin chỉ từ một ít sự kiện ban đầu.
Nhược điểm: kỹ thuật suy diễn tiến là khơng có cách để nhận thấy tính quan
trọng của từng sự kiện, hỏi nhiều câu hỏi thừa vì đôi lúc chỉ cần một vài sự kiện là
cho ra kết luận.
b. Phương pháp suy diễn lùi
Phương pháp suy diễn lùi tiến hành các lập luận theo chiều ngược lại (đối với
phương pháp suy diễn tiến). Từ một giả thuyết (như là một kết luận), hệ thống đưa
ra một tình huống trả lời gồm các sự kiện là cơ sở của giả thuyết đã cho này.
Ví dụ: nếu ai đó vào nhà mà cầm áo mưa và áo quần bị ướt thì giả thuyết này
là trời mưa.
Để củng cố giả thuyết này, ta sẽ hỏi người đó xem có phải trời mưa khơng?
Nếu người đó trả lời có thì giả thuyết trời mưa đúng và trở thành một sự kiện. Nghĩa
là trời mưa nên phải cầm áo mưa và áo quần bị ướt.
Suy diễn lùi là cho phép nhận được giá trị của một thuộc tính. Đó là câu trả lời
cho câu hỏi « giá trị của thuộc tính A là bao nhiêu ? » với A là một đích (goal). Để
xác định giá trị của A, cần có các nguồn thơng tin. Những nguồn này có thể là
những câu hỏi hoặc có thể là những luật. Căn cứ vào các câu hỏi, hệ thống nhận
14
được một cách trực tiếp từ người sử dụng những giá trị của thuộc tính liên quan.
Căn cứ vào các luật, hệ thống suy diễn có thể tìm ra giá trị sẽ là kết luận của một
trong số các kết luận có thể của thuộc tính liên quan, v.v...
Ý tưởng của thuật toán suy diễn lùi như sau. Với mỗi thuộc tính đã cho, người
ta định nghĩa nguồn của nó :
- Nếu thuộc tính xuất hiện như là tiền đề của một luật (phần đầu của luật), thì
nguồn sẽ thu gọn thành một câu hỏi.
- Nếu thuộc tính xuất hiện như là hậu quả của một luật (phần cuối của luật), thì
nguồn sẽ là các luật mà trong đó, thuộc tính là kết luận.
- Nếu thuộc tính là trung gian, xuất hiện đồng thời như là tiền đề và như là kết
luận, khi đó nguồn có thể là các luật, hoặc có thể là các câu hỏi mà chưa được nêu ra.
- Nếu mỗi lần với câu hỏi đã cho, người sử dụng trả lời hợp lệ, giá trị trả lời
này sẽ được gán cho thuộc tính và xem như thành công. Nếu nguồn là các luật, hệ
thống sẽ lấy lần lượt các luật mà thuộc tính đích xuất hiện như kết luận, để có thể
tìm giá trị các thuộc tính thuộc tiền đề. Nếu các luật thỗ mãn, thuộc tính kết luận sẽ
được ghi nhận [4].
Ưu điểm: kỹ thuật suy diễn lùi là làm việc tốt với bài toán có bản chất thành
lập giả thiết, sau đó tìm xem có th ể chứng minh được khơng. Vì kỹ thuật này
hướng đến một đích nên hỏi những câu hỏi liên quan nhau. Máy suy diễn áp dụng
kỹ thuật này chỉ khảo sát CSTT trên nhánh vấn đề đang quan tâm.
Nhược điểm: kỹ thuật này là ln hướng theo dịng suy luận định trước thậm
chí có thể dừng hoặc rẽ sang một đích khác.
1.1.6. Hệ chuyên gia dựa trên luật
HCG dựa trên luật là một chương trình máy tính, xử lý các thơng tin cụ thể
của bài tốn được chứa trong bộ nhớ làm việc và tập các luật được chứa trong
CSTT, sử dụng động cơ suy luận để suy ra thơng tin mới.
HCG dựa trên luật có nền tảng xây dựng là hệ luật sinh (Production System).
a. Hệ luật sinh
Hệ luật sinh (HLS) hay hệ sinh hay hệ thống sản xuất đều có cùng ý nghĩa.
15
HLS là một mơ hình tính tốn quan trọng trong các bài tốn tìm kiếm cũng như mơ
phỏng cách giải quyết vấn đề của con người trong lĩnh vực ứng dụng trí tuệ nhân
tạo. HLS cung cấp cơ chế điều khiển Pattern-directed trong quá trình giải quyết vấn
đề. Cấu trúc HLS gồm 3 thành phần: tập luật sản sinh (Production rules), bộ nhớ
làm việc (Working memory), bộ điều khiển nhận dạng và hành động (Recognizeaction control). Trong đó:
- Tập luật sản sinh được đặc tả dạng: Condition-Action (điều kiện –hành
động). Một luật là một mắt xích của kho tri thức giải quyết vấn đề. Kho tri thức là
một CSDL của các tập luật sản sinh. Thành phần Condition là một mẫu (pattern)
dùng xác định điều kiện áp dụng của luật cho một vấn đề tương ứng. Thành phần
Action được xem như là điều hướng (directed) dùng để đưa ra kết luận của luật
hoặc dẫn đến một luật kế tiếp nhằm tìm ra kết luận cuối cùng. Các luật sinh thường
được viết dưới dạng IF THEN.
- Có hai dạng:
- IF <điều kiện>THEN<hành động> hoặc IF <điều kiện> THEN <kết luận>
DO <hành động>.
- Bộ nhớ làm việc chứa những đặc tả trạng thái hiện tại của quá trình suy luận.
Chúng được lưu trữ như là tập các mẫu. Những đặc tả này là các mẫu để so trùng
với các điều kiện của tập luật sản sinh. Khi một luật trong tập luật sản sinh được so
trùng phần điều kiện thì phần hành động của nó có thể được áp dụng và phần hành
động này được xây dựng đặc thù để tác động trực tiếp lên bộ nhớ làm việc.
- Bộ điều khiển nhận dạng và hành động là cấu trúc điều khiển dùng trong
HLS. Tập các mẫu trong bộ nhớ làm việc lần lượt được đưa vào thành phần nhận
dạng (Recognize) để thực hiện so trùng mẫu. Kết quả của quá trình so khớp sẽ tạo
thành một tập các luật sản sinh đã so khớp. Tập kết quả này được đưa vào bộ điều
khiển quyết định chọn luật phù hợp, trong quá trình điều khiển có thể áp dụng các
chiến lược giải quyết xung đột đơn giản hoặc áp dụng các chiến lược lựa chọn
heuristic. Với luật được chọn, hệ thống sẽ thực hiện hành động tương ứng. Quy
trình hoạt động của bộ điều khiển nhận dạng và hành động là một quy trình khép
16
kín được lặp đi lặp lại nên trong q trình thực hiện nó sẽ tác động trở lại và làm
thay đổi các tập mẫu trong bộ nhớ làm việc. Đây chính là đặc trưng cơ bản của HLS
trong q trình cải thiện các tập mẫu của hệ thống [8].
Hình 1.2. Quy trình hoạt động của Recognize-Action
HLS là khung làm việc tổng quát để thực thi các giải thuật tìm kiếm. Với đặc
tính đơn giản, dễ sửa đổi và linh động, HLS được dùng như một công cụ quan trọng
để xây dựng các HCG và các ứng dụng trí tuệ nhân tạo khác. Các ưu điểm của HLS:
- Tách bạch giữa tri thức và điều khiển: Điều khiển nằm trong chu trình
Recognize-Action; tri thức được chứa đựng trong các luật sinh. Chính vì vậy, HLS
có khả năng cập nhật tri thức mà khơng cần điều chỉnh chương trình và ngược lại.
- Dễ dàng áp dụng trong tìm kiếm trên khơng gian trạng thái.
- Tính độc lập của các luật sinh.
- Khả năng áp dụng heuristic cho việc điều khiển quá trình hoạt động.
- Theo dõi và giải thích q trình hoạt động.
- Độc lập với ngơn ngữ và có thể dùng như kỹ thuật mô phỏng giải pháp của
con người.
b. Các đặc trưng và kiến trúc của HCG dựa trên luật
HCG dựa trên luật cũng có những đặc trưng cơ bản của HCG tổng quát, một
vài đặc điểm tiêu biểu: Có CSTT chứa các luật, có bộ nhớ làm việc tạm thời, có
động cơ suy luận, có giao diện để giao tiếp với người dùng và người phát triển, có
tiện ích giải thích và có khả năng giao tiếp với chương trình ngồi như các hệ
quản trị CSDL, xử lý bảng tính,…
HCG dựa trên luật có kiến trúc như sau: