Tải bản đầy đủ (.pdf) (83 trang)

Ứng dụng hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình tại Tiền Giang

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.32 MB, 83 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG

TRẦN NAM HÙNG

ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH
DỰ BÁO LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH
TẠI TIỀN GIANG

LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - Năm 2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
ĐẠI HỌC ĐÀ NẴNG

TRẦN NAM HÙNG

ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH
DỰ BÁO LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH
TẠI TIỀN GIANG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: PGS.TS. PHAN HUY KHÁNH

Đà Nẵng - Năm 2017



i

LỜI CAM ĐOAN

Tôi xin cam đoan:
Những nội dung trong luận văn này được thực hiện dưới sự hướng dẫn
trực tiếp của thầy PGS.TS Phan Huy Khánh.
Mọi tham khảo đều được trích dẫn rõ ràng và trung thực,bao gồm: tên
tác giả, tên công trình, thời gian, địa điểm công bố.
Mọi sao chép không hợp lệ, vi phạm quy chế đào tạo tôi xin chịu trách
nhiệm.
Tác giả

Trần Nam Hùng


ii

TÓM TẮT LUẬN VĂN
ỨNG DỤNG HỆ TRỢ GIÚP QUYẾT ĐỊNH
DỰ BÁO LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH
TẠI TIỀN GIANG
Trần Nam Hùng, học viên cao học khóa 31, chuyên ngành Khoa học máy tính
Tóm tắt – Truyền hình ngày nay phát triển vượt bậc, từ công nghệ sản xuất chương trình
đến các hạ tầng phát sóng nhằm đưa các chương trình truyền hình tiếp cận với khán giả
một cách dễ dàng. Tuy nhiên, việc thống kê và dự đoán lượng khán giả xem một chương
trình cụ thể và khung giờ nhất định luôn gặp khó khăn. Điều này đã cản trở việc tiếp cận
các nguồn tài trợ, quảng cáo đồng thời không xác định được khung giờ phát sóng hiệu quả
cho một chương trình nhất định. Hiện nay, có một vài công ty sử dụng phần cứng gắn trực

tiếp vào máy thu hình của hộ gia đình, nhược điểm chi phí lớn, số lượng thiết bị đo chỉ lắp
đặt tại các thành phố lớn với số lượng ít. Nghiên cứu này đề xuất ý tưởng việc đo lường
khán giả một cách ít tốn kém, dành cho các đài truyền hình địa phương bằng cách dựa trên
thói quen, sở thích và độ tuổi của khán giả. Hệ trợ giúp quyết định sẽ đưa ra các trợ giúp
bằng số liệu thực tế cho từng chương trình vào giờ phát cụ thể để đội ngũ biên tập quyết
định hợp lý. Tác giả khảo sát thực tế và ghi nhận các số liệu cần thiết để xây dựng hệ trợ
giúp quyết định và đã có kết quả khả quan. Tin rằng, đây là bước đầu xây dựng một hệ
thống trợ giúp cho đài truyền hình địa phương có lịch phát sóng tối ưu một cách tiết kiệm.
Từ khóa – dự đoán; hệ trợ giúp quyết định; khán giả; chương trình truyền hình; đo lường.

APPLICATION THE DECISION SUPPORT SYSTEM (DSS) TO
FORECAST THE NUMBER OF AUDIENCE WATCHING TELEVISION
IN TIEN GIANG PROVINCE
Summary: Today, Television is developing very fast, from Production technology
program to Broadcast. Infrastructure, which bring TV programs to audience watching
television easily. However, the Statistic and prediction of TV viewers of a program and a
fixed time lot are very difficult that have hindered the collection of funding sources,
Advertisement and not define the effective fixed time lot for a program. Nowadays, there
are many companies use the hardware fixing direct to the home TV to do that. But it costs
a lot of money. It’s just fixed in many big cities with a few. In this Essay, I propose ideas
for audience measurement in less expensive for local television stations base on habit,
hobby and age of the audience watching television. This system will give many help
methods base on the real number of the audience watching television with every program
that broadcast on the fixed time lot for the editor team making change for suitable. In
order to do that, I surveyed and recorded real numbers in my local to provide the decision
support system and I also received reliable results. I sure that this is the first step to build
the decision support system for local television stations which has the best schedule to
attractive the audience watching television.
Key words: forecast, decision support system, audience watching television, Television
program, measure.



iii

MỤC LỤC
LỜI CAM ĐOAN......................................................................................................... i
TÓM TẮT LUẬN VĂN .............................................................................................ii
MỤC LỤC ................................................................................................................. iii
DANH MỤC CÁC TỪ VIẾT TẮT............................................................................. v
DANH MỤC CÁC BẢNG ......................................................................................... vi
DANH MỤC CÁC HÌNH .........................................................................................vii
MỞ ĐẦU ..................................................................................................................... 1
1. Tính cấp thiết của đề tài ...................................................................................... 1
2. Mục tiêu nghiên cứu ........................................................................................... 2
3. Đối tượng và phạm vi nghiên cứu ...................................................................... 2
4. Phương pháp nghiên cứu .................................................................................... 2
5. Bố cụ luận văn .................................................................................................... 3
6. Tổng quan tài liệu nghiên cứu ............................................................................ 4
CHƯƠNG 1. TÌM HIỂU CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG HỆ HỖ
TRỢ QUYẾT ĐỊNH ................................................................................................... 5
1.1. Tìm hiểu tri thức và biểu diễn tri thức ............................................................. 5
1.1.1. Khái niệm về tri thức .............................................................................. 5
1.1.2. Tìm hiểu Hệ chuyên gia ......................................................................... 8
1.1.3. Biểu diễn tri thức trong hệ chuyên gia ................................................ 11
1.1.4. Các đặc trưng và ưu điểm của hệ chuyên gia ...................................... 16
1.2. Kho dữ liệu (Data warehouse) ....................................................................... 18
1.2.1. Khái niệm ............................................................................................. 18
1.2.2. Cấu trúc của một hệ thống kho dữ liệu ................................................ 18
1.2.3. Hệ thống cập nhật, quản lý kho dữ liệu ................................................ 19
1.3. Khai phá dữ liệu ............................................................................................. 19

1.3.1. Khái niệm ............................................................................................. 19
1.3.2. Ứng dụng của khai phá dữ liệu ............................................................ 21
1.3.3. Các chức năng chính của khai phá dữ liệu ........................................... 22
1.4. Hệ trợ giúp quyết định ................................................................................... 22
1.4.1. Ý nghĩa ................................................................................................. 22
1.4.2. Lý do dùng DSS ................................................................................... 23
1.4.3. Năng lực của DSS ................................................................................ 24
1.4.4. Các thành phần của DSS ...................................................................... 26
CHƯƠNG 2. PHÂN TÍCH HIỆN TRẠNG KHAI THÁC CHƯƠNG TRÌNH
TRUYỀN HÌNH ĐÀI TIỀN GIANG........................................................................ 28


iv

2.1. Phát biểu vấn đề ............................................................................................. 28
2.1.1. Một số khái niệm .................................................................................. 28
2.1.2. Nền tảng cho đề tài ............................................................................... 30
2.1.3. Các đài truyền hình có phủ sóng tại Tiền Giang .................................. 33
2.1.4. Giải pháp của Hệ trợ giúp quyết định................................................... 34
2.2. Nhu cầu và thói quen của khán giả truyền hình ............................................. 36
2.2.1. Đối tượng.............................................................................................. 36
2.2.2. Phân loại khán giả ................................................................................ 36
2.3. Đài PT-TH Tiền giang và các đài cạnh tranh ................................................ 38
2.3.1. Khảo sát khán giả Tiền Giang về thói quen xem truyền hình .............. 38
2.3.2. Đánh giá về khung giờ cho chương trình: ............................................ 39
2.4. Giải pháp suy luận bài toán ............................................................................ 40
2.5. Ví dụ về dự đoán một khung giờ .................................................................. 43
CHƯƠNG 3. CÀI ĐẶT THỬ NGHIỆM CHƯƠNG TRÌNH DỰ ĐOÁN LƯỢNG
KHÁN GIẢ TRUYỀN HÌNH TẠI TIỀN GIANG ................................................... 47
3.1. Dữ liệu cho bài toán ....................................................................................... 47

3.1.1. Nguồn dữ liệu tư vấn ............................................................................ 47
3.1.2. Nhu cầu cần trợ giúp của ban biên tập ................................................. 47
3.1.3. Nhu cầu cần trợ giúp của bộ phận kinh doanh ..................................... 47
3.1.4. Các nội dung đề xuất của bộ phận sản xuất chương trình .................... 48
3.1.5. Mô hình dữ liệu cho bài toán............................................................... 49
3.2. Xây dựng hệ thống ......................................................................................... 50
3.3. Cài đặt chương trình ...................................................................................... 53
3.3.1. Môi trường phát triển ........................................................................... 53
3.3.2. Cài đặt chương trình ............................................................................. 54
3.3.3. Chạy chương trình ................................................................................ 58
3.3.4. Kịch bản sử dụng .................................................................................. 60
3.4. ĐÁNH GIÁ KẾT QUẢ ................................................................................. 61
KẾT LUẬN ............................................................................................................... 64
TÀI LIỆU THAM KHẢO ......................................................................................... 65
PHỤ LỤC
QUYẾT ĐỊNH GIAO ĐỀ TÀI.
BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC
PHẢN BIỆN.


v

DANH MỤC CÁC TỪ VIẾT TẮT
Tiếng Việt
Chữ viết tắt

STT

Nghĩa từ viết tắt


1

HCG

Hệ chuyên gia

2

CSDL

Cơ sở dữ liệu

3

THTG

Truyển hình Tiền Giang

4

VTV

Truyền hình Việt Nam

5

HTV

Truyền hình TP.Hồ Chí Minh


6

THVL

Truyền hình Vĩnh Long

7

CTTH

Chương trình truyền hình

Tiếng Anh

STT

Chữ viết tắt

Chữ đầu đủ

Dịch nghĩa

1
2

KB
DW

Knowledge base
Data wasehouse


Cơ sở tri thức
Kho dữliệu

3

AI

Artifical intelligent

Trí tuệ nhân tạo

4

KDD

5

DSS

6
1

DM
KB

Knowlegde Discovery

Phát
hiện tri thức trong

in
Data
CSDL

Decision support system
Data mining
Knowledge base

Hệ thống trợ giúp quyết
định
Khai phá dữ liệu
Cơ sở tri thức


vi

DANH MỤC CÁC BẢNG
Số hiệu

Tên bảng

bảng
1.1.
1.2.
2.1.

Một số lĩnh vực ứng dụng diện rộng của các hệ chuyên gia
Đối sánh giữa DSS và EDP(electronic data processing)
(Alter 1980)
Số liệu về dân số và diện tích các huyện thị thành trên địa

bàn tỉnh Tiền Giang

Trang
10
23
30

3.1.

Vài chương trình có khán giả đặc trưng

48

3.2.

Bảng tập huấn luyện dữ liệu

49

3.3.

Bảng mô tả trường dữ liệu sau khi xử lý

50

3.4.

Dữ liệu lượng khán giả xem truyền hình khung giờ 18h3020h30

50


3.5.

Tập dữ liệu huấn luyện khung giờ 18h30-20h30

51

3.6.

Tri thức kết hợp khung giờ 18h30-20h30

52

3.7.

Lựa chọn thể loại phát của chuyên viên

62


vii

DANH MỤC CÁC HÌNH
Số
hiệu

Tên hình

Trang


hình
1.1.

Sơ đồ tổng quát hệ chuyên gia

6

1.2.

Thành phần hệ chuyên gia

8

1.3.

Hệ chuyên gia nhận dạng

9

1.4.

Nền tảng của công nghệ hệ chuyên gia dựa trên luật hiện đại

13

1.5.

Sai sót trong khi phát triển hệ chuyên gia

14


1.6.

Những thành phần cơ bản của một hệ chuyên gia

15

1.7.

Quan hệ giữa máy suy diễn và cơ sở tri thức

16

1.8.

Mô hình data warehouse 3 lớp

19

1.9.

Các bước trong Data Mining & KDD

21

1.10. Hệ trợ giúp quyết định

24

1.11. Thành phần hệ hỗ trợ giúp quyết định


26

2.1.
2.2.

Bản đồ hành chính tỉnh Tiền Giang
Mô hình cho bài toán Hệ trợ giúp quyết định Dự báo lượng
khán giả xem truyền hình

30
40

2.3.

Biểu độ đo lượng khán giả lý tưởng

43

2.4.

Biểu độ đo lượng khán giả thực tế

45

2.5.

Biểu độ đo thành phần khán giả

46


3.1.

Mô hình cas sử dụng hệ trợ giúp

47

3.2.

Hệ thống giao tiếp người dùng với hệ trợ giúp

53

3.3.

Nạp dữ liệu vào Weka

54

3.4.

Giao diện tư vấn THTG nếu VTV chiếu phim Trung quốc

59

3.5.
3.6.
3.7.

Giao diện tư vấn THTG nếu VTV chiếu cai lương; THVL

chiếu phim Trung quốc
Giao diện tư vấn THTG nếu VTV phim việt nam; THVL
chiếu phim Việt Nam
Giao diện tư vấn THTG nếu VTV chiếu cai lương; THVL
chiếu ca nhạc

59
60
60


1

MỞ ĐẦU
1. Tính cấp thiết của đề tài
Truyền hình đã trở thành phương tiện truyền thông không thể thiếu đối với hầu
hết các hộ gia đình (HGĐ) ở khu vực thành thị cho đến nông thôn. Tỉ lệ HGĐ sở
hữu ít nhất một máy truyền hình vẫn vượt xa các phương tiện truyền thông khác
như: máy radio, đầu chơi băng/đĩa, dàn nghe nhạc…
Tuy nhiên trong những năm gần đây, các Đài truyền hình trong khu vực nói
chung và đặt biệt là Đài truyền hình tỉnh Tiền Giang (THTG) nói riêng phải cạnh
tranh từ các Đài truyền hình xung quanh về chất lượng chương trình và nguồn thu từ
quảng cáo.
Đã có nhiều cuộc nghiên cứu và đo nhu cầu xem truyền hình bằng thiết bị phần
cứng từng hộ gia đình của cả nước đặc biệt ở các thành phố lớn như Hà Nội, Hồ Chí
Minh, Đà Nẵng hay Cần Thơ để cho ra cái nhìn tổng quát trong việc xây dựng các
chương trình truyền hình phù hợp. Các phương thức khảo sát này luôn tốn kém vì
vậy đối với các Đài địa phương cấp tỉnh đây là chi phí rất lớn. Đối với Đài phát
thanh và truyền hình Tiền Giang (THTG) cũng nằm trong tình trạng tương tự.
Với việc ngành công nghệ thông tin đã có nhiều ứng dụng rộng rãi trong tất cả

các ngành của xã hội. Việc ứng dụng công nghệ thông tin để phân tích, dự đoán
lượng người xem truyền hình đã trở nên dễ dàng và giảm chi phí hơn. Đây cũng là
một ứng dụng mới mà hiện nay chưa được chú trọng tại các đài phát thanh và truyền
hình ở Việt Nam.
Phương thức được tổng quát như sau, khảo sát bằng biểu mẫu dựa trên thói
quen, nhu cầu, vị trí, công việc và độ tuổi từ đó suy diễn các khung giờ cho các
chương trình truyền hình.


2

2. Mục tiêu nghiên cứu
- Đưa ra một hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình và
đưa ra chương trình phát sóng có lượng khán giả tốt nhất.
- Tìm hiểu các thể loại truyền hình, khung giờ phát sóng, cách thức sản xuất
chương trình truyền hình ...
- Tìm hiểu về nhu cầu, thói quen khán giả cho từng độ tuổi, vị trí địa lý, nghề
nghiệp.
- Nghiên cứu về Hệ trợ giúp quyết định, hệ thống dữ liệu, công cụ lập trình...
- Tìm hiểu giải pháp và xây dựng.
- Cài đặt thử nghiệm.
- Đánh giá, nhận xét.
3. Đối tượng và phạm vi nghiên cứu
3.1. Đối tượng nghiên cứu:
- Thu thập dữ liệu bằng biểu mẫu từ khán giả tại địa bàn Tiền Giang..
- Nghiên cứu thói quen, sở thích, vị trí địa lý, học vấn, nghề nghiệp khán giả
xem truyền hình.
- Thông tin cơ bản về các chương trình truyền hình (CTTH):
3.2. Phạm vi nghiên cứu
- Đề tài được nghiên cứu và xây dựng trên địa bàn Tiền Giang nhằm đáp ứng

nhu cầu của Đài PT-TH Tiền Giang.
- Nghiên cứu Hệ trợ giúp quyết định và công cụ lập trình.
4. Phương pháp nghiên cứu
4.1. Phương pháp nghiên cứu tài liệu
- Tham khảo và nghiên cứu tài liệu khai phá tri thức, trích rút thông tin, hỗ
trợ ra quyết định.
- Sử dụng hệ thống cơ sở dữ liệu của THTG.
- Tham khảo các công cụ: Weka, MS Exel, C#, MS SQL Server 2008 express …


3

4.2. Phương pháp thực nghiệm
- Khảo sát biểu mẫu, phân tích các phương pháp khảo sát và dự đoán lượng
khác giả.
- Lập biểu mẫu và khảo sát.
- Xây dựng giải pháp và thiết kế phần mềm.
5. Bố cụ luận văn
MỞ ĐẦU
CHƯƠNG 1. TÌM HIỂU HỆ TRỢ GIÚP QUYẾT ĐỊNH VÀ ỨNG DỤNG
- Tìm hiểu cơ sở tri thức và ứng dụng vào một số lĩnh vực
- Kho tri thức, quản lý và cập nhật kho tri thức, khai phá dữ liệu, hệ trợ giúp
ra quyết định
CHƯƠNG 2. TÌM HIỂU VÀ PHÂN TÍCH CÁC THÓI QUEN, SỞ
THÍCH KHÁN GIẢ VÀ CHƯƠNG TRÌNH TRUYỀN HÌNH ĐÀI TIỀN
GIANG
- Phát biểu bài toán.
- Tìm hiểu tri thức về nhu cầu khán giả
- Vận dụng công nghệ tri thức để giải quyết vấn đề
- Mô tả ứng dụng và mô hình dữ liệu hoạt động

- Xây dựng các luật và câu truy vấn
CHƯƠNG 3. CÀI ĐẶT VÀ THỬ NGHIỆM HỆ TRỢ GIÚP ỨNG
DỤNG DỰ ĐOÁN LƯỢNG KHÁN GIẢ XEM TRUYỀN HÌNH TẠI TIỀN
GIANG
- Phân tích thiết kế hệ trợ giúp
- Môi trường công cụ cài đặt
- Đánh giá kết quả chương trình
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN.
Tham khảo, đối chiếu và đưa ra các nhận xét về hệ thống. Giải quyết các vấn
đề còn tồn tại đồng thời đưa ra hướng phát triển của đề tài trong tương lai.


4

6. Tổng quan tài liệu nghiên cứu
Đề tài “Ứng dụng hệ trợ giúp quyết định dự báo lượng khán giả xem truyền hình
tại Tiền Giang” cần phải tìm hiểu về các thể loại chương trình truyền hình, độ thu
hút khán giả, các khung giờ phát, độ phủ sóng, cơ sở tri thức, cơ sở dữ liệu... Tuy
nhiên các tài liệu về đo lường khán giả truyền hình còn hạn chế vì đây là các tài liệu
được giữ kín trong kinh doanh của các nhà Đài nên yêu cầu phải trực tiếp khảo sát
và ghi chú lịch phát sóng của các Đài có phát sóng trong địa bàn. Các tài liệu về hệ
thống trợ giúp ra quyết định, kho dữ liệu, khai phá dữ liệu, ... sẽ được trích dẫn từ
giáo trình của các thầy trường đại học Đà Nẵng và tài liệu trên internet.


5

CHƯƠNG 1
TÌM HIỂU CÔNG NGHỆ TRI THỨC VÀ ỨNG DỤNG
HỆ HỖ TRỢ QUYẾT ĐỊNH

Chương này là cơ sở lý thuyết liên quan đến đề tài, ứng dụng cần được áp
dụng. Tìm hiểu về khái niệm công nghệ tri thức, hệ chuyên gia và hệ hỗ trợ quyết
định. Giới thiệu về một số ứng dụng để xây dựng hệ chuyên gia trong đó có các kỹ
thuật suy luận để biểu diễn tri thức và xây dựng luật.
1.1. Tìm hiểu tri thức và biểu diễn tri thức
1.1.1. Khái niệm về tri thức
Công nghệ tri thức (Knowledge Engineering): có thể xem là một nhánh nghiên
cứu của trí tuệ nhân tạo, phân tích tri thức lĩnh vực và chuyển nó thành những mô
hình tính toán đưa vào máy tính để phục vụ những nhu cầu cần thiết.
Công nghệ tri thức: là các phương pháp, kỹ thuật được những kỹ sư tri thức
(knowledge engineers) dùng để xây dựng những hệ thống thông minh như: hệ
chuyên gia, hệ cơ sở tri thức, hệ hỗ trợ quyết định, v.v
Công nghệ tri thức là những phương pháp, kỹ thuật dùng để:
 Tiếp nhận, biểu diễn tri thức.
 Xây dựng các hệ cơ sở tri thức
 Khám phá tri thức
Công nghệ tri thức đóng vai trò hết sức quan trọng trong việc phát triển Công
nghệ thông tin, nâng cao sự hữu dụng của máy tính, giúp con người gần gũi với máy
tính hơn.
Công nghệ tri thức còn góp phần thúc đẩy nhiều ngành khoa học khác phát
triển, khả năng phát triển khoa học dựa trên tri thức liên ngành.
Một hệ chuyên gia gồm ba thành phần chính là:
+ Cơ sở tri thức (knowledge base).
+ Máy suy diễn hay môtơ suy diễn (inference engine).
+ Hệ thống giao tiếp với người sử dụng (user - interface).


6

MÁY TÍNH


ĐẦU VÀO

TIẾP NHẬN, BIỂU DIỄN,
TỐI ƯU CƠ SỞ TRI THỨC

ĐẦU RA

CÁC HỆ

KHAI THÁC DỮ LIỆU,

CƠ SỞ TRI THỨC

KHÁM PHÁ TRI THỨC

Hình 1.1. Sơ đồ tổng quát hệ chuyên gia
 Quản lý tri thức (knowledge management): bao gồm tiếp nhận, biểu diễn và
tối ưu hóa cơ sở tri thức…
 Các hệ cơ sở tri thức (knowledge-based systems): tìm hiểu cấu trúc bên trong
của một hệ cơ sở tri thức, phân loại các hệ cơ sở tri thức, và một số hệ cơ sở
tri thức điển hình.
 Khai thác dữ liệu, khám phá tri thức (Data mining, knowledge discovery):
nghiên cứu về phương pháp, kỹ thuật để khai phá dữ liệu và khám phá tri
thức.
Khi tiếp nhận tri thức có thể chia làm 2 cách:
- Thụ động:
. Gián tiếp: những tri thức kinh điển.
. Trực tiếp: những tri thức kinh nghiệm (không kinh điển) do “chuyên
gia lĩnh vực” đưa ra.

- Chủ động:
Đối với những tri thức tiềm ẩn, không rõ ràng hệ thống phải tự phân tích, suy
diễn, khám phá để có thêm tri thức mới .
- Phân loại và quản lý tri thức
a. Tri thức thủ tục (producedural knowledge) là tri thức mô tả cách giải
quyết một vấn đề, quy trình xử lý các công việc, lịch trình tiến hành
các thao tác … Các dạng của tri thức thủ tục thường dùng là các luật,
chiến lược, lịch trình…


7

VD: - Các bước giải một phương trình bậc 2; cách sử dụng một chiếc
xe, cách mua 1 vé tàu …
b. Tri thức mô tả (Descriptive knowledge) là một khẳng địng về một sự
kiện, hiện tượng hay một khái niệm nào đó trong một hoàn cảnh không
gian hoặc thời gian nhất định.
Ví dụ: khẳng định về hiện tượng: ”Mặt trời lặn ở phương Tây”. Trà
Vinh là tỉnh ở khu vực miền Tây nam bộ, Đà Nẵng là thủ phủ của miền
Trung…
c. Tri thức hiện(Explicit knowledge) là những tri thức được giải thích và
mã hóa dưới dạng văn bản, tài liệu, âm thanh, phim, ảnh,… thông
qua ngôn ngữ Đây là những tri thức đã được thể hiện ra ngoài và dễ
dàng chuyển giao, thường được tiếp nhận qua hệ thống giáo dục và
đào tạo chính quy.
d. Tri thức ẩn( implicit knowledge) là những tri thức thu được từ sự trải
nghiệm thực tế, dạng tri thức này thường ẩn trong mỗi cá nhân và rất
khó “mã hóa” và chuyển giao, thường bao gồm: niềm tin, giá trị, kinh
nghiệm, bí quyết, kỹ năng...
VD: thông tin về biến động thị trường, độ cuốn hút khán giả về một bộ

phim, độ lôi cuốn về một chương trình truyền hình…
e. Tri thức chắc chắn (certain knowledge): là những tri thức chắc chắn
đúng.
VD: Nếu hết xăng thì xe máy không hoạt động được.
f. Tri thức không chắc chắn(uncertain knowledge): là những khẳng định,
luật suy diễn không chắc chắn đúng.
VD: Nếu phim không hay và phát vào giờ không hợp lý thì không có
quảng cáo. Nếu thực hiện quay phim ngoài trời mà trời mưa hoặc máy hỏng
thì phải dừng…
Quản lý và sử dụng tri thức là phương thức quản lý từ nền tảng quản lý thông
tin đã được tập hợp, xử lý, lưu trữ, chia sẻ và sử dụng.


8

1.1.2. Tìm hiểu Hệ chuyên gia
Khái niệm về hệ chuyên gia
Hệ chuyên gia, còn gọi là hệ thống dựa tri thức, là một chương trình máy
tính chứa một số tri thức đặc thù của một hoặc nhiều chuyên gia con người về một
chủ đề cụ thể nào đó.
Bộ xử lý ngôn
ngữ tự nhiên
Giải thích

Cơ sơ tri thức

Động cơ suy diễn
Tìm kiếm
Điều khiển


Vùng nhớ làm việc

Sự kiện
Tiếp nhận tri thức
Luật

Người chuyên gia

Hình 1.2. Thành phần hệ chuyên gia
Trong đó 2 thành phần quan trọng nhất là Cơ sở tri thức và động cơ suy diễn.
- Cơ sở tri thức là nơi lưu trữ biểu diễn các tri thức mà hệ đảm nhận, làm cơ
sở cho các hoạt động của hệ. Cơ sở tri thức bao gồm các sự kiện và các luật.
- Động cơ suy diễn: là quá trình trong hệ chuyên gia cho phép khớp các sự
kiện trong vùng nhớ làm việc với các tri thức về các lĩnh vực trong cơ sở tri thức, để
rút ra các kết luận về các vấn đề đang giải quyết.
Ngoài ra còn có các bộ xử lý ngôn ngữ tự nhiên, bộ giải thích WHY-HOW,
vùng nhớ làm việc, bộ tiếp nhận tri thức và người chuyên gia (kĩ sư tri thức).
 Một ví dụ về chuyên gia: nhân diện dạng động vật
Hệ nhận dạng một số động vật sử dụng cơ sở tri thức người dùng dựa trên các sự
kiện người dùng đưa vào thông qua các phiên hỏi đáp. Hệ chuyên gia sẽ sử dụng


9

một động cơ suy diễn thích hợp để kết hợp các sự kiện người dùng đưa vào đó với
các luật đã được xây dựng sẵn để tìm được mục tiêu thích hợp.
Có thể xây dựng một kiến trúc như sau:
Cơ sở tri thức

Máy suy

diễn

Bộ câu

UI

hỏi

Yêu cầu của người dùng
Hình 1.3. Hệ chuyên gia nhận dạng
Một cas làm việc gồm:
- Mục tiêu cần giải quyết
- Danh sách các câu hỏi cần được trả lời cho đến khi vấn đề được giải quyết.
- Phản hồi từ người dùng.
Phản hồi từ người dùng là sự lựa chọn câu trả lời có hoặc không có sự kiện
đó cho câu hỏi đang được hỏi
Mô hình suy diễn
Hệ nhận dạng động vật đưa ra kết luận đó là động vật gì dựa trên các đặc
điểm (thuộc tính) nổi bật của nó. (Các thuộc tính này được xây dựng sẵn trong phần
cơ sở tri thức).
Đối với mỗi thuộc tính, hệ sẽ ghi nhận giá trị có hay không có thuộc tính đó
thông qua câu trả lời của người dùng, và đưa ra kết luận về con vật đó dựa trên các
đặc tính mà nó có.
Hệ sử dụng suy diễn tiến dựa trên các luật để tìm được đáp án.
Biểu diễn tri thức:
Tri thức của hệ nhận dạng động vật gồm tập các sự kiện (gồm các đặc điểm của
động vật), tập luật và các câu hỏi cho người dùng.
Ví dụ cho các sự kiện:”Da nó không có vảy”; “Nó biết nhảy”; “Nó có vảy
tròn”; “Nó không có vảy tròn”…



10

Các luật được biểu diễn gồm 2 mệnh đề mỗi luật, dạng luật dẫn if….then.
Ví dụ, con vật đó là tê giác nếu nó thỏa mãn các sự kiện: nó là động vật
máu nóng , nó là động vật uống sữa, nó không ăn thịt, nó có móng guốc, nó không
có móng guốc và móng có lớp mạ bảo vệ .
Các câu hỏi cho người dùng để lấy các sự kiện được xây dựng sẵn dựa trên luật.
Cách thức suy diễn
Bằng cách chứng minh đó là con vật nào là dựa trên cơ sở tri thức và sự lựa
chọn có hay không thuộc tính mà thỏa mãn yêu cầu của người dùng.
Một số lĩnh vực ứng dụng của hệ chuyên gia
Cho đến nay, hàng trăm hệ chuyên gia đã được xây dựng và đã được báo cáo
thường xuyên trong các tạp chí, sách, báo và hội thảo khoa học. Ngoài ra còn các hệ
chuyên gia được sử dụng trong các công ty, các tổ chức quân sự mà không được
công bố vì lý do bảo mật.
Bảng 1.1. Một số lĩnh vực ứng dụng diện rộng của các hệ chuyên gia
Lĩnh vực

Ứng dụng diện rộng

Cấu

Tập hợp thích đáng những thành phần của một hệ thống

hình(Configuration)

theo cách riêng

Chẩn đoán (Diagnosis)


Lập luận dựa trên những chứng cứ quan sát được

Truyền đạt
(Instruction)
Giải
thích(Interpretation)
Kiểm tra (Monitoring)
Lập kế
hoạch(Planning)

Dạy học kiểu thông minh sao cho sinh viên có thể hỏi vì
sao (why?), như thế nào (how?) và cái gì nếu (what
if?) giống như hỏi một người thầy giáo
Giải thích những dữ liệu thu nhận được
So sánh dữ liệu thu lượm được với dữ liệu chuyên môn để
đánh giá hiệu quả
Lập kế hoạch sản xuất theo yêu cầu

Dự đoán (Prognosis)

Dự đoán hậu quả từ một tình huống xảy ra

Chữa trị (Remedy)

Chỉ định cách thụ lý một vấn đề

Điều khiển (Control)

Điều khiển một quá trình, đòi hỏi diễn giải, chẩn đoán,

kiểm tra,lập kế hoạch, dự đoán và chữa trị


11

1.1.3. Biểu diễn tri thức trong hệ chuyên gia
a. Biểu diễn tri thức bởi các luật
- Hầu hết các hệ chuyên gia đều là các hệ thống dựa trên luật.
- Luật là một kiểu sản xuất được nghiên cứu từ những năm 1940. Trong một hệ
thống dựa trên luật, công cụ suy luận sẽ xác định những luật nào là tiên đề
thỏa mãn các sự việc.
- Các luật sản xuất thường được viết dưới dạng IF THEN.
- Có hai dạng:
IF <điều kiện> THEN <hành động>
Hoặc
IF <điều kiện> THEN <kết luận> DO <hành động>
- Tùy theo hệ chuyên gia cụ thể mà mỗi luật có thể được đặt tên. Chẳng hạn
Rule: tên. Sau phần tên là phần IF của luật.
- Phần giữa IF và THEN là phần trái luật, được gọi theo nhiều tên như tiền đề,
điều kiện, mẫu so khớp.
- Phần sau THEN là kết luận hay hậu quả. Một số hệ chuyên gia có thêm phần
hành động gọi là phần phải luật.
Ví dụ: IF
. Phim phát giờ không hợp lý

OR

. Phim ít người xem,

AND


. Ít quảng cáo

THEN

- Không có doanh thu DO quảng bá chương trình và xem lại giờ phát sóng.
b. Biểu diễn tri thức nhờ mệnh đề logic
- Người ta sử dụng các ký hiệu để thể hiện tri thức và các phép toán logic tác
động lên các ký hiệu để thể hiện suy luận logic. Kỹ thuật chủ yếu thường
được sử dụng là logic vị từ.
Ví dụ: Phim truyện là thể loại giải trí.
Vị từ : GIAITRI(phim)
c. Biểu diễn tri thức nhờ mạng ngữ nghĩa


12

- Sử dụng một đồ thị gồm các nút và các cung nối các nút để biểu diễn tri thức.
- Có thể thêm vào đồ thị các nút mới và các cung mới để mở rộng mạng ngữ
nghĩa.
Ví dụ: “ Thời sự là thông tin phải đưa nhanh và cần chính xác”, ta có nút đồ thị sau:
Phải


Thời

nhanh

Thông
tin


sự

cần

Chính
xác

Ta có thêm nút trên đồ thị:
nhanh

Phải


Thời

Thông
tin

sự

cần

Chính
xác


Chuyên

Phóng

sự

cần

sâu

d. Biểu diễn tri thức nhờ ngôn ngữ nhân tạo
Ví dụ: Đánh giá dự đoán 1 chương trình ca nhạc phát sóng trên truyền hình
Nếu

1. Ca sĩ không nổi tiếng

Và nếu 2. Âm thanh không tốt
Và nếu 3. Biên tập bài hát kém
Thì tồn tại khả năng ít khán giả xem.
e. Biểu diễn tri thức nhờ các sự kiện không chắc chắn
Sự không chắc chắn: là trạng thái có hiểu biết hạn chế về những hiện tượng tự
nhiên, kinh tế -xã hội, không thể mô tả chính xác tình trạng hiện hành cũng như kết
quả trong tương lai của chúng.


13

Ví dụ: Truyền hình trực tiếp ca nhạc ngoài trời nếu trời không mưa thì diễn ra
bình thường còn không thì sẽ thay thế bằng một chương trình giải trí khác.
Kỹ thuật suy luận trong hệ chuyên gia
Có nhiều phương pháp để suy luật trong giải quyết vấn đề của hệ chuyên gia.
Những phương pháp hay gặp là suy diễn tiến (forward chaining), suy diễn lùi
(backward chaining) và phối hợp hai phương pháp này gọi là mixed chaining. Ngoài
ra còn có một số phương pháp khác như là phân tích phương tiện (means-end

analysis), rút gọn vấn đề (problem reduction), quay lui (backtracking), kiểm tra lập
kế hoạch (plan-generate-test), lập kế hoạch phân cấp (hierachical planning), cây
quyết định…
Dưới đây là nền tảng của công nghệ hệ chuyên gia hiện đại (foundation of
modern rele- based expert system).

Hệ chuyên gia dựa trên luật

Luật

Luật sản xuất

Máy suy diễn

So khớp hiệu quả

Post

Hợp giải xung
đột

Sự kiện

Suy diễn
bên phải
luật (RHS)

Thuật toán mạng lưới

Thuật toán Markov

Hình 1.4. Nền tảng của công nghệ hệ chuyên gia dựa trên luật hiện đại


14

Những sai sót thường gặp khi thiết kế hệ chuyên gia
Những sai sót trong khi phát triển hệ chuyên gia được phân ra thành nhiều
giai đoạn:

Chuyên gia
(expert)

Công nghệ tri thức

o Sai sót trong tri thức chuyên gia: Nếu tri thức
của chuyên gia không đúng và không đầy đủ,
hậu quả sai sót sẽ ảnh hưởng suốt quá trình
phát triển hệ thống.

o Sai sót ngữ nghĩa: Xảy ra do tri thức đưa vào
hệ chuyên gia.

(knowledge engineer)
o Suy luận không đầy đủ về tri thức từ chuyên
gia

Cơ sở tri thức
(knowledge base)

o Sai sót về mặt cú pháp

o Sai sót về tri thức trong các luật và các sự
kiện, tính không chắc chắn.

Máy suy diễn
(inference engine)

Phép suy diễn

o Lỗi của máy suy diễn, lỗi phần mềm công cụ
hệ chuyên gia
o Lỗi suy diễn do xác định sai độ ưu tiên của
các luật, tương tác giữa các luật, sai trong cơ
sở tri thức, suy luận không nhất quán….

(inference chain)
Hình 1.5. Sai sót trong khi phát triển hệ chuyên gia
Khi xây dựng một hệ chuyên gia thì việc xây dựng một kho dữ liệu tri thức là
thực sự quan trọng. Chúng ta không chỉ nắm thông tin về lĩnh vực chọn mà còn phải
hiểu rõ nó để từ đó có thể xây dựng được một kho tri thức mang tính logic và chính
xác nhất.


15

Thành phần cơ bản của một hệ chuyên gia
Một hệ chuyên gia kiểu mẫu gồm bảy thành phần cơ bản như sau :

Cơ sở tri thức
Các luật


Máy suy diễn

Bộ nhớ làm việc

Lịch công việc

Khả năng giải

Khả năng

thích

thu nhận tri thức

Giao diện người
sử dụng
Hình 1.6. Những thành phần cơ bản của một hệ chuyên gia
Cơ sở tri thức (knowledge base). Gồm các phần tử (hay đơn vị) tri thức,
thông thường được gọi là luật (rule), được tổ chức như một cơ sở dữ liệu.
Máy duy diễn (inference engine). Công cụ (chương trình, hay bộ xử lý) tạo ra
sự suy luận bằng cách quyết định xem những luật nào sẽ làm thỏa mãn các sự kiện,
các đối tượng. , chọn ưu tiên các luật thỏa mãn, thực hiện các luật có tính ưu tiên
cao nhất.
Lịch công việc (agenda). Danh sách các luật ưu tiên do máy suy diễn tạo ra
thoả mãn các sự kiện, các đối tượng có mặt trong bộ nhớ làm việc.
Bộ nhớ làm việc (working memory). Cơ sở dữ liệu toàn cục chứa các sự kiện
phục vụ cho các luật.
Khả năng giải thích (explanation facility). Giải nghĩa cách lập luận của hệ
thống cho người sử dụng.



16

Khả năng thu nhận tri thức (explanation facility). Cho phép người sử dụng
bổ sung các tri thức vào hệ thống một cách tự động thay vì tiếp nhận tri thức bằng
cách mã hoá tri thức một cách tường minh. Khả năng thu nhận tri thức là yếu tố mặc
nhiên của nhiều hệ chuyên gia.
Giao diện người sử dụng (user interface). Là nơi người sử dụng và hệ chuyên
gia trao đổi với nhau.
Cơ sở tri thức còn được gọi là bộ nhớ sản xuất (production memeory) trong
hệ chuyên gia. Trong một cơ sở tri thức, người ta thường phân biệt hai loại tri thức
là tri thức phán đoán (assertion knowledge) và tri thức thực hành (operating
knowledge).

Cơ sở tri thức
Tri thức phán đoán

Máy suy diễn
Tri thức thực hành

Hình 1.7. Quan hệ giữa máy suy diễn và cơ sở tri thức
1.1.4. Các đặc trưng và ưu điểm của hệ chuyên gia
Có bốn đặc trưng cơ bản của một hệ chuyên gia :
Hiệu quả cao (high performance). Khả năng trả lời với mức độ tinh thông
bằng hoặc cao hơn so với chuyên gia (người) trong cùng lĩnh vực.
Thời gian trả lời thoả đáng (adequate response time). Thời gian trả lời hợp
lý, bằng hoặc nhanh hơn so với chuyên gia (người) để đi đến cùng một quyết định.
Hệ chuyên gia là một hệ thống thời gian thực (real time system).



×