Giáo trình nhận dạng mẫu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.1 MB, 26 trang )

ĐẠI HỌC QUÓC GIA HÀ NỘI

TRƯ Ờ NG ĐẠI HỌC
CÔNG N G H Ệ
_____________________•_______
Ị_________________________ !_
HOÀNG XUÂN HUẤN

GIÁO TRÌNH
NHẬN DẠNG MAU

NHÀ XUẤT BẢN ĐẠI HỌC Q ư ố c GIA HÀ NỘI

MỤC LỤC
Lời nói đ ầu

9

Chương 1. GIỚI THIỆU

11

1.1. Nhận dạng mẫu là gì?

11

1.2. Các ví dụ

13

1.2.1. Bài toán phân loại

13

1.2.2. Bài toán hồi quy

15

1.2.3. Bài toán mô tả

17

1.3. Các hệ thông nhận dạng mẫu

18

1.4 Quá trình xây dựng hệ nhận dạng mẫu

22

1.5 Học máy và các cách tiếp cận

25

1.5.1 Học có giám sát

25

1.5.2 Học không có giám sát

25

1.5.3 Học tăng cường

26

1.5.4. Học thống kê

26

1.5.5. Mạng nơron nhân tạo

26

1.5.6. Nhận dạng mẫu có cấu trúc

27

Chương 2. PHÂN BIỆT MAU

29

2.1. Miền và hàm quyết định

29

2.1.1 Hàm quyết định

30

2.1.2 Tách được bỏi siêu phẳng

34

3

2.2. Các mêtric trong không gian đặc trưng.

39

2.3. Ma trận hiệp phương sai

41

2.4. Các thành phần chính

45

2.5. Đánh giá đặc trưng

46

2.5.1. Quan sát đồ thị

47

2.5.2. Đánh giá mô hình phân bô'

48

2.5.3. Kiểm định suy luận thống kê

48

2.6. Bài toán tỷ lệ chiều

49

Chương 3. PHÂN CỤM DỬ LIỆU

53

3.1. Phân lớp không giám sát

53

3.2. Vấn đề chuẩn hóa dữ liệu

55

3.3. Một số phương pháp chính

57

3.3.1. Phương pháp phân cấp

57

3.3.2. Phương pháp phân hoạch

60

3.3.3. Phương pháp dựa vào mật độ

66

3.3.4. Phương pháp phân cụm dựa trên lưới

69

3.3.5. Phân cụm nửa giám sát

71

3.4. Một 8ốchủ để liên quan

72

3.4.1. Trực quan hóa và giảm chiều dữ liệu

72

3.4.2. Đánh giố cụm

73

Chương 4. PHÂN LỚP THỐNG KẺ

75

4.1. Phân biệt tuyến tính

75

4.1.1. Phân lớp khoảng cách cực tiểu

75

4.1.2 Phân biệt tuyến tính Euclide

78

4.1.3. Phân biệt tuyến tính Mahalanobis

80

4.1.4, Phần biệt tuyến tính Ficher

81

4.2. Phân lốp Bayes

82

4.2.1. Phân lốp xác suất hậu nghiệm cực đại

83

4.2.2. Phân lóp cực tiểu rủi ro

86

4 .2 .3 . M iề n b á c bò (re je c t region)

88

4.2.4. Tỷ lệ chiều và ước lượng lỗi

90

4.3. Kỹ thuật phi tham 80'

91

4.3.1. Phương pháp cửa sổ Parzen

93

4.3.2. Phương pháp ưóc lượng k- láng giềng gần nhất

95

4.4. Quy tắc phân loại k- láng giềng gần nhất

96

4.5. Lựa chọn đặc trưng

97

4.6. Đánh giá các bộ phân lớp

98

4.6.1. Ưâc lượng lỗi của bộ phân lớp
4.6.2. So sánh các bộ phân lớp khác dữ liệu đào tạo

98
100

Chương 5. PHÂN LỚP BẢNG CÂY QUYẾT ĐỊNH

103

5.1. Biểu diễn cây quyết định

103

5.2. Học quy nạp và cây quyết định

105

5.3. Thuật toán học ID3

107

5.3.1. Mô tả thuật toán

108

5.3.2. Chọn thuộc tính phân loại tốt nhất

109

5.3.3. Ví dụ minh họa

112

5.3.4. N hận xét về ID3

114

5.4 Những hướng giải quyết các vấn đề khi học bằng cầy quyết định 116
5.4.1 Phòng tránh 8ự phù hợp trội

116

5.4.2. Kết hợp các thuộc tính có giá trị liên tục

120

5.4.3. Tiêu chuẩn để chọn thuộc tính

121

5.4.4. Xử lý mẫu huấn luyện vối giá trị thuộc tính bị mất

122

Chương 6. DỬ LIỆU TUÂN T ự

125

6.1. N hận dạng các xâu

125

6.1.1. Đối sánh xâu

126

6.1.2. Khoảng cách soạn thào

130

6.1.3. Đốì sánh xâu vối lỗi

132

6.1.4. Đối sánh với ký hiệu trung tính

132

6.2. Mô hình Markov ẩn

133

6.2.1. Mô hình Markov bậc nhất

133

6.2.2. Mô hình Markov ẩn và các bài toán cơ bản

135

6.2.3. Bài toán đánh giá

137

6.2.4. Bài toán giải mã

140

6.2.5. Bài toán học

141

Chương 7. MẠNG NƠRON NHÂN TẠO
7.1 Giỗi thiệu

145
145

7.1.1. Mạng Nơron sinh học

145

7.1.2. Mạng Nơron nhân tạo

146

7.1.3. Mô hình và kiến trúc mạng nơron

147

7.2. Perceptron

152

7.2.1. Kiến trúc Perceptron

152

7.2.2. Luật học Perceptron

154

7.3. Học Widrow-Hofĩ
7.3.1 Mạng ADALINE

157
157

7.3.2 Lọc thích nghi
7 4. MạngMLP

164
169

7.4.1. Kiến trúc mạng

169

7.4.2. Thuật toán BP

171

7.4.3. Bình luận vể thuật toán

178

7.5. Mạng RBF

178

7.5.1. Kiến trúc mạng RBF

179

7.5.2 Đào tạo mạng'RBF

179

7.6. Mạng Hammiog

185

7.6.1. Kiến trúc mạng Hamming

185

7.6.2. Cơ chế hoạt động

185

7.7. Bản đồ đặc trưng tự tổ chức

187

7.7.1. Quan hệ lân cận giũa các nơron

187

7.7.2. Kiến trúc và hoạt động của SOFM

188

Chương 8. KẾT HỢP CÁC BỘ PHÂN LỚP
8.1. Các phương pháp tập thể trong học máy

193
193

8.2. Phương pháp bỏ phiếu

195

8.3 Hai kỹ thuật thông dụng tạo bộ nhận dạng cơ sở

196

8.3.1. Nhặt theo gói

196

8.3.2. Nhặt định hưống

197

8.4. Kiến trúc bậc thang

200

Tài liệu tham khảo

203

7

LỜI NÓI ĐẦU
Giáo trìn h N h ậ n dạng mẫu vói thời lượng 2 đến 3 tín chỉ được
giảng dạy cho học viên cao học ngành Khoa học m áy tín h của
trưòng Đại học Công nghệ, cung cấp cho người học những kiến
thức cơ bản để xây dựng các hệ phân lớp và mô tả m ẫu trong các

ứng dụng. Ngoài ra giáo trình này cũng được dùng làm chủ đề lựa
chọn của môn học các chủ đề hiện đại của khoa học m áy tín h cho
sinh viên giai đoạn cuối của ngành này, nhằm hỗ trợ sinh viên làm
khóa luận và có nhu cầu nghiên cứu.
N hận dạng m ẫu có lịch sử phát triển khá sớm, nhưng trưóc
những năm 1960 nó đơn thuần là kết quả ứng dụng của các
nghiên cứu lý thu y ết trong lĩnh vực thống kê. Ngày nay nó phát
triển m ạnh mẽ, bao gồm một phạm vi rộng và có ứng dụng rộng
rãi, đặc biệt trong th iế t k ế các thiết bị nghe nhìn, xử lý tín hiệu tự
động và khám phá tri thức từ dữ liệu.
Vì lượng kiến thức r ấ t lón mà thòi lượng ít, hơn nữa để hiểu
th ấu đáo th ì đòi hỏi ngưòi học phải có nền tảng toán học tốt, đặc
biệt về xác suất thống kê, nên chúng tôi chú trọng giói thiệu các
th u ậ t toán và hưống dẫn sử dụng mà không đi sâu vào bản chất
toán học. M ột số kiến thức khó nhưng cần dùng, chẳng hạn như
mô hình Markov ẩn, th u ậ t toán độj sánh nhanh các xâu..., chúng
tôi giới thiệu những n é t chính để gợi mở cho những học viên muôn
tìm hiểu sâu hơn.
Chương đầu của giáo trìn h dành để giới thiệu khái niệm nhận
dạng m ẫu, phác họa bức tran h chung của một hệ nhận dạng mẫu
cùng vói quy trìn h th iế t kế. Chương 2 trìn h bày phương pháp
phân biệt m ẫu nhò hàm quyết định và các vấn để liên quan kh i xử
lý dữ liệu. Cốc phương pháp phân cụm dữ liệu được trìn h bày
trong chương 3. Chương 4 giới thiệu các phương pháp nhận dạng
m ẫu thống kê. Phương pháp phân lốp nhò cây quyết định được
9

trìn h bày trong chương 5. Chương 6 trìn h bày các bài toán và
th u ật toán thưòng gặp trong xử lý dữ liệu tu ần tự bao gồm các

th u ậ t toán đếi sánh xâu và các bài toán trong mô hình Markov ẩn.
Các m ạng nơron nhân tạo thông dụng n h ấ t được giới thiệu trong
chương 7. Chương cuối chúng tôi giối thiệu các phương pháp kết
hdp các bộ phân lóp để nâng cao chất lượng hệ nhận dạng, bao
gồm phương pháp học tập thể và tổ chức kiến trúc bậc thang.
Giáo trìn h này cũng có thể dùng làm tài liệu tham khảo cho
nghiên cứu sinh và sinh viên các ngành khác thuộc nhóm ngành
công nghệ thông tin. Để hiểu sâu hơn, chúng tôi giới thiệu một số
tài liệu tham khảo m à chúng tôi có thể cung cấp [1-5], bao gồm cả
các tiếp cận liên quan m ật th iế t như học máy [6-8] và m ạng nơron
[9-11].
Do lần đầu xuất bản nên chắc chốn giáo trình còn nhiều thiếu
sót, chúng tôi rấ t mong nhận được cốc ý kiến gốp ý để giáo trìn h
được hoàn thiện hơn.
T ác giả

10

Chương 1

GIỚI THIỆU
Trước khi đi sâu vào các phương pháp n h ận dạng mẫu,
chương này giới thiệu khái niệm mẫu và n h ận dạng m ẫu máy,
phác họa bức tra n h chung của một hệ nhận dạng m ẫu cùng với
quy trìn h th iết k ế nó.
1.1. N h ậ n d ạ n g m ẫ u là gì?
Ngày nay, m áy tính đã chửng tỏ khả năng nổi trội của nó
trong tín h toán và xử lý thông tin so vối con người. Tuy nhiên,
trong khi mỗi người bình thường đều dễ dàng cảm nhận, quan sát

được các sự vật, hiện tượng xung quanh như nhận ra một gương
m ặt quen, hiểu lòi nói đôi thoại, đọc các chữ viết tay và phân biệt
thức ăn từ mùi của nó..., thì ngưòi ta vẫn rấ t khó tạo ra được máy
tín h có các khả năng này như người.
N hu cầu tạo r a các máy móc được tran g bị các hệ thống thông
m inh, cạnh tran h được với con ngưòi trong quan sá t và cảm nhận
các sự vật, hiện tượng trong môi trường như vậy thúc đẩy r a đòi
lĩnh vực nghiên cứu "nhận dạng m ẫu má y” hay gọi gọn hơn là
nh ậ n dạng m ẫu (Pattern Recognition - PR).
Mẫu.
Các đối tượng được quan sát, nhận biết sẽ được gọi chung là
m ẫu (pattem ) và đôi khi vẫn được gọi là đối tượng. Tùy theo cốc
ứng dụng, m ẫu có th ể phân làm hai loại: m ẫu trừ u tượng và mẫu
cụ thể. Các ý tưỏng, lập luận và khái niệm là những ví dụ về mẫu
trừ u tượng, nhận dạng các m ẫu như vậy thuộc về lĩnh vực nhận
dạng khái niệm. Các m ẫu cụ th ể bao gồm cốc đốì tượng vật lý; chữ
ký; chữ viết; ký hiệu; ảnh; đoạn sóng âm thanh; điện não đồ hoặc
11

điện tâm đồ; chuỗi DNA, hàm số... là đối tượng nghiên cứu chính
trong giáo trìn h này.
N h ậ n dạng mẫu.
ở mức khái niệm, nhận dạng m ẫu là lĩnh vực khoa học
nghiên cứu các phương pháp mô tả, phân lớp hay gán nhãn cho
các m ẫu để tạo ra các hệ thống cạnh tra n h được vói khả năng này
của con người.
Từ th ế kỷ 16 Kepler đã sử dụng dữ liệu quan sá t thiên văn để
khám phá quỹ đạo chuyển động của các h àn h tinh, thúc đẩy sự
phát triển của cơ học cổ điển. Trước những năm 1960, các ứng

dụng PR chủ yếu vẫn chỉ là áp dụng các nghiên cứu trong lĩnh vực
thống kê. Ngày nay các hệ nhận dạng m ẫu có phạm vi ứng dụng
rấ t rộng, dưới đây là các ví dụ về hoạt động thành công trong một
số lĩnh vực
♦ điển hình.
Nông nghiệp.
• Dựa trên các dữ liệu về th ổ nhưỡng và đặc tín h cây trồng,
vật nuôi, ngưòi ta đánh giá phân loại đ ấ t để hỗ trợ cho các
quyết định canh tốc.
• P hân tích các số liệu quá khứ và biến đổi thời tiế t để phát
hiện, dự báo dịch bệnh và sản lượng m ùa vụ...
Thiên văn học.
• P hân tích tự động quang phổ.
• P h át hiện các vật th ể mới và thay đổi của vũ trụ dựa trên
ảnh thiên văn.
S in h học.
• Cốc ứng dụng PR trong tin-sinh học là công cụ hiệu quả để
nghiên cứu sinh học phân tử, phân tích cấu trú c nhiễm sắc
thể, xác định các đặc tín h di truyền và đưa ra các phương
pháp biến đểi gen trong công nghệ sinh học.
• P hân tích sự ph át triển của các quần thể
12

Y học.
• Chẩn đoán và đưa phác đồ điều trị bệnh dựa trê n các triệu
chứng, kết quả xét nghiệm và ảnh X-quang.
• P hân tích điện não đồ, tâm đồ và ảnh điện quang để phát
hiện bệnh và trạng thái sức khỏe...
Quản lý đô thị.

• P hân tích và điều khiển giao thông.
• Đ ánh giá và dự báo sự phát triển đô thị.
K inh tế-xã hội.
• P hân tích và dự báo về các thay đổi trên thị trường.
• P hân tích hoạt động doanh nghiệp, trợ giúp các quyết định
kinh doanh, thương mại điện tử.
• Khám phá tri thức trên cơ sở dữ liệu.
A n ninh, quăn đội.
• N hận dạng vân tay.
• Khám phá, phân tích các tín hiệu rada, âm th an h và ảnh
h àng không.
• Theo dõi các hệ thống báo động.
• Xác định mục tiêu tự động.
1.2. C á c v í d ụ
Để m inh họa rõ hơn cho khái niệm PR, trong mục này giới
th iệu ví dụ cho các bài toán điển hình: phân loại, hồi quy và mô tả.
1.2.1. B à i to á n p h â n lo ạ i
P h â n loại hay phân lớp có giám sá t là dạng bài toán thường
gặp n h ấ t trong nhận dạng mẫu. Trong bài toán này, dựa trê n các
tr i thức hoặc quan sát đã có, người ta phân các đốì tượng mới vào
một trong các lốp đã biết. Hệ nhận dạng tr á i cây là ví dụ cho bài
to án này.
13

Ta tưỏng tượng một hệ thống phân loại trái cây trê n băng
chuyển có mô hình như trong hình 1.1. Tín hiệu của trá i cây thu
được từ các bộ cảm biến (Sensor) có thể là màu sắc, hình dáng,
trọng lượng... Từ các tín hiệu th u được, ngưòi ta trích, chọn các đặc
trưng để biểu diển cho mỗi trái cây sao cho việc tính toán phân lóp

dễ dàng và chính xác.
Để đơn giản, ta xét hệ phân biệt hai loại trái cây: cam và táo,
các đặc trưng của chúng có th ể biểu diễn dưới dạng số hoặc định
danh. Chẳng hạn, đặc trưng m àu có thể là:
Dạng số: biểu diễn dưới dạng cường độ mức xám, là đại lượng
thuộc khoảng [0, a], 0 ứng với mức không có màu còn a là mức
xám cực
• đại.
T
Dạng định danh: đỏ/ xanh lá cây/ xanh....

Hlnh 1.1. Mô hlnh hệ thống phãn loại trái cAy trôn b ỉn g chuyển

Khi biểu diễn đặc trưng dạng số, mỗi quả sẽ ứng với một điểm
trong không gian đặc trưng. Bài toán nhận dạng trỏ th à n h bài
toán phân lớp cho mỗi vectơ (điểm) trong không gian đặc trưng, về
sau ta dùng ký hiệu bằng chữ in đậm để chi các vectơ. Xét đặc
trưng số của trọng lượng (xt) và m àu (xị) của trái cây, vectơ đặc
trưng X là vectơ hai chiều:

14

V

trọng lượng

*2.

màu

Qua quan sát thực nghiệm, các quả cam chín và táo xanh rơi
vào miền có tâm như trong hình 1.2-a. H ình 1.2-b cho thấy một
quả táo đỏ có thể bị nhầm là cam còn quả cam xanh thì ta không
phân biệt được. Để tăng độ chính xác, người ta có thể xét thêm đặc
trư ng vỏ là nhẵn hoặc thô, nếu bộ cảm biến xác định đặc trưng
này tốt thì cam sẽ có vỏ thô còn táo có vỏ nhẵn. Việc chọn đặc
trư ng có ý nghĩa quan trọng đối vối hệ phân loại và phụ thuộc vào
ch ất lượng của các bộ cảm biến.

Hlnh 1.2. a) Q u ỉ cam vá táo trong kh&ng gian đ ặc tnm g.
b) Quả táo đỏ giống cam còn cam xanh khó ph&n biệt

1.2.2. B à i to á n h ồ i q u y
Trong thực tế, ta thường phải xác định giá trị của hàm nhiều
biến tại các điểm mối thuộc miền nào đó dựa trê n những số liệu đo
được (quan sát) của hàm trên miền này. Bài toán này là bài toán
hồi quy nhiều biến và được phát biểu tổng qu át như sau.
Xét hàm f: D ( c R n) -*R và tập dữ liệu T={xk,y 1<}N],
xk e R" Vk đo được dưới dạng:
15

( 1. 1)

trong đó £t là nhiễu tráng (các đại lượng ngẫu nhiên độc lập cùng
phân bố có kỳ vọng bằng không). Ta cần tìm hàm (p: D ( c R ) —'R
có dạng nào đó sao cho:
(p (x ) * y k

( 1.2 )

đủ tốt theo nghĩa nào đó và dùng

Tập T sẽ gọi là tập m ẫu quan sá t (hay huấn luyện), cp gọi là hàm
hồi quy. Khi không quan tâm đến nhiễu thì ta gọi là bài toán xấp
xỉ, nếu đòi hỏi cp thỏa mãn chặt biểu thức (1.2) tức là:

(1.3)

thì gọi là bài toán nội suy. Cấc điểm xk sẽ được gọi là các mốc nội
suy còn hàm cp được gọi là hàm nội suy. Trong nhiều trường hợp,
giá trị của hàm hồi quy hay xấp xỉ tại các điểm chưa biết cũng
được gọi là giá trị nội suy nếu không gây nên nhầm lẫn nào.
Người ta thường tìm hàm hồi quy dưới dạng ọ = 0 (x ,c .... ,ck)
bằng cách xác định các tham sô" ct>...,ck, trong đó <I>(x,c......) là
hàm phụ thuộc tham sô' nào đó đã chọn. Thông thường các tham số
này được tìm nhò cực tiểu hàm mục tiêu nào đó, chẳng hạn sai số
trung bình phương:
(1.4)
H ình 1.3 minh họa các hàm hồi quy (đưòng đứt) và hàm nội
suy dạng đa thức cho hàm một biến có giá trị đo ỏ 8 điểm.

16

Hlnh 1.3. Đ ổ thị hàm hổi quy (đưòng đứt) và nộl su y (đưàng liổn)

1.2.3. B à i to á n m ô tả
Các kỹ th u ậ t mô tả được ứng dụng đa dạng trong phân tích

ảnh, đặc biệt là phân tích các tín hiệu lý-sinh. Để làm ví dụ, ta
x ét các biểu đồ của tốc độ nhịp tim thai trong một thời kỳ nào đó.
Các biểu đồ này ghi tầ n số tức thòi của nhịp đập tim th ai (sô"
lần/phút) và sự biến đổi nhịp tim trong biểu đồ được các chuyên
viên sản khoa dùng để phân tích, đánh giá th ể trạn g th ai nhi.
Hình 1.4a m inh họa một biểu đồ tốc độ nhịp tim th ai (gọi tắ t là
biểu đồ tim thai).

b) Mô t ỉ phẩn đẩu củ a biểu đổ b in

Một hệ mô tả sẽ xử lý các biểu đồ, ph át hiện và mô tả các thời
gian nhịp tim thai có biến đổi nhiều để giúp chuyên gia nhận định
th ể trạn g th ai nhi. Hệ này mô tả biểu đồ như là xâu-các-iỊiành tố
17

biến đổi sơ cấp trong các khoảng thòi gian bé để xấp xỉ biểu đồ, đặc
biệt là ỏ các giai đoạn có thay đổi nhiều. Chẳng hạn, phần đầu của
biểu đồ trong hình 1.4-a được mô tả như trong hình 1.4-b. Các
thay đổi của biểu đồ được phân lớp theo các thành tô" cho bởi bảng
1.1 dựa trên hệ số tăn g hay giảm của tầ n sô” trong khoảng biến
thiên được xét, trong đó À là ngưỡng được chọn trưổc.
Bảng 1.1 C ác thành tố mô tà nhịp tim thai.

Tèn thành tố

K ỷ hiệu

Mô tả

Ngang

n

Đoạn giá trị không đổi

Đi lên

t

Đoạn giá trị tăng vớí hệ số < À

Đi xuống

ỡ

Đoạn giá trị giảm với hệ số >- À

Lên mạnh

T

Đoạn giá trị tăng với hệ số > A

Xuống mạnh

G

Đoạn giá trị giảm với hệ số <- A

Hệ sẽ xử lý các xâu th àn h tố và quan tâm nhiều tói các thòi
gian chứa điểm nhọn ứng với có u và D liên tiếp hoặc ngược lại,
chẳng hạn, trong hình 1.4 đoạn biểu đồ được mô tả là xâu
‘tgtGTttg”. Việc phân tích và hiển thị các biểu đồ như vậy giúp cho
các chuyên gia r ấ t nhiều. Ngoài ra, dựa trên các kiến thức chuyên
gia, hệ thống có thể tự động đánh giá, phân loại biểu đồ tim th ai.
1.3. C ác h ệ th ố n g n h ậ n d ạ n g m ẫu
Mặc dù có r ấ t nhiều loại bài toán PR, tuy nhiên, để giải quyết
một bài toán PR thì thông thường một hệ thống n h ận dạng m ẫu
gồm có các th àn h phần cd bản theo sơ đồ trong hình 1.5.
Các bộ cảm biến th u nhận và chuyển đổi hình ảnh hoặc ẵm
thanh hoặc các đầu vào vật lý khác th àn h dữ liệu dạng tín hiệu.
Bộ phân đoạn tách các đốì tượng cảm biến khỏi hình nền hoặc các
đối tượng khác. Một bộ trích chọn đặc trư ng đo các thuộc tín h củ a
đốì tượng cần cho nhận dạng. Bộ nhận dạng phân tích những đặc
trưng này để gán một đốì tượng vào một lớp hoặc tín hiệu mô Ità.
Cuối cùng, bộ hậu xử lý để quyết định xử lý khi xét đến tác đỘỊng
khác theo ngữ cạnh và srị£Bhải tr ả cho lỗi.
18

Hlnh 1.5. C á c thành phẩn trong hệ nhận dạng mẫu đlẩn hlnh

Để hiểu được các vấn để khi thiết kế một hệ thống nhận dạng,
chúng ta cần hiểu từng thành phần của nó.
Các bộ cảm biến (sensor)
Nếu là hệ nhận dạng đối tượng vật lý, ở đầu vào của hệ thống
thường là một loại th iết bị chuyển đổi như m áy ghi hình hay ghi
âm. Các đặc trưng và hạn chế của các thiết bị này như băng thông,
độ phân giả, độ nhậy cảm ... có thể ảnh hưỏng tới hoạt động của hệ

thống và ta không đi sâu vào chi tiết chủ đề này. Một số hệ không
sử dụng các bộ cảm biến mà lấy tín hiệu từ một thiết bị hoặc đầu
ra cùa hệ thống khác.
Tiền xử lý tín hiệu (preprocessing)
Tín hiệu nhận được từ các bộ cảm biến hoặc các th iết bị khác
thường chứa nhiễu hoặc sai sót. Vì vậy ở công đoạn này, các tín
hiệu được lọc nhiễu và tăng cường chất lượng.
Phân đoạn (segmentation) và nhóm
Trong ví dụ về phân loại trái cây chúng ta đã ngầm giả sử
rằng các trá i cây tách biệt nhau và có thể dễ dàng phân biệt trên
báng chuyền. Trong thực tế, chúng có thể gần hoặc sát nhau và hệ
thống của chúng ta phải có khả năng xác định được từng quả riêng
biệt. Việc xác định, phân lập tín hiệu từng cá thể gọi là phân đoạn
(segmentation). Nếu chúng ta đã nhận dạng được các trá i cây thì
việc phân lập từng cá thể là tương đôì dễ dàng nhưng vấn đề là ta
phải thực hiện phân lập khi chưa biết chúng có những loại nào. Do
đó chúng ta cần phải có cách để biết được khi nào thì chuyển từ
19

một đốì tượng này sang một đối tượng khác hoặc biết được phần
nào chỉ là ảnh nền.
Phân đoạn là một trong những bài toán rấ t khó trong nhận
dạng m ẫu. Chẳng hạn, trong hệ thống tự động n h ận dạng tiếng
nói, chúng ta phải cô" gắng n h ận ra từng âm riêng biệt.
Liên quan chặt chẽ tới việc phân đoạn là bài toán nhận dạng
hoặc nhóm nhiều đối tượng liên quan lại với nhau. Chữ i hoặc ký
hiệu = có hai th àn h phần liên kết, nhưng ta thấy chúng như là
một ký hiệu. Đây là vấn để phức tạp về quan hệ giữa các th àn h tố
với đôl tượng, giữa tập hợp con và tập hợp cha, nó quyết định việc

nghiên cứu bộ phận hay toàn thể các mối quan hệ.
Trích chọn đặc trưng (feature extraction and selection)
Mục tiêu chung của bộ trích chọn đặc trưng là dựa trên tín
hiệu th u được, mô tả lại các đối tượng bằng các giá trị sô' hay định
danh (các đặc trưng) sao cho chúng gần nhau với các đối tượng
thuộc cùng loại và khác xa nhau nếu khác loại. Hơn nữa để tiện xừ
lý thì càng ít đặc trưng càng tốt. Điều này dẫn đến việc phải tìm
ra các đặc trưng khác nhau và chúng không phụ thuộc hoàn cảnh
ta th u tín hiệu về đốì tượng. Như trong ví dụ phân lớp trái cây thì
vị trí tuyệt đốì của mỗi trái cây trên băng chuyền là không liên
quan đến loại quả, do đó chúng ta không cần quan tâm đến vị trí
của các trá i cây cụ thể.
N hiều khi ta muốn các đặc trưng phải không th ay đổi cho dù
ta xoay ngang hay dọc hay tịn h tiến... và ta gọi đặc trư n g này có
tính bất biến với biến đổi tưdng ứng. Chẳng hạn, các đặc trư n g của
chữ viết tay b ấ t biến vói phép quay và tịn h tiến r ấ t th u ậ n lợi cho
việc n h ận dạng. Trong nhận dạng tiếng nói, chúng ta muôn các
đặc trưng không bị ảnh hưỏng theo thòi gian và tăn g hay giảm
toàn bộ biên độ. Chúng ta cũng muốn các đặc trư ng không nhạy
cảm vối độ dài của mỗi từ hay tốc độ lấy mẫu.
Đ ầu r a của giai đoạn này cho ta một vectd đặc trư ng ứng vói
mỗi đốì tượng được khảo sát, thích hợp n h ấ t là các vectơ thực.
20

Ranh giỏi khái niệm giữa việc trích chọn đặc trưng và phân
lớp ỏ mức độ nào đó có phần không rõ ràng; một bộ trích chọn đặc
trưng lý tưởng phải làm cho công việc còn lại của bộ phân lóp trở
nên dễ dàng. Ngược lại, một bộ phân lớp tố t đòi hỏi ít ở bộ trích
chọn đặc trưng.

N h ận dạng
Nhiệm vụ của th àn h phần này trong hệ thông là sử dụng các
véc tơ đặc trưng được cung cấp từ bước trước để gán nhãn cho các
đôi tượng (trong các bài toán phân lốp hoặc hồi quy) hay mô tả
chúng.
P h ân lóp là bài toán thường gặp nh ất trong PR và được chia
th àn h hai bài toán: phân loại (phân lớp có giám sát) và phân cụm
(phân lớp không giám sát). Trong phân lốp có giám sát, ta được
biết n h ãn lỏp của một tập đối tượng cho trưóc và trê n sơ sở đó sẽ
th iế t k ế bộ nhận dạng để gán nhãn cho các đối tượng mới.
Độ khó của bài toán nhận dạng phụ thuộc vào cõ và sự biến
thiên của vectơ đặc trưng trong từng bài toán, độ đo tương tự hay
khoảng cách được xét giữa các đốì tượng. Các độ đo này phụ thuộc
vào các đặc trưng được chọn, chúng cho phép ta xác định tính
tương đồng của các đối tượng trong cùng một lóp/cụm và sự khác
biệt giữa các đối tượng trong các lóp/cụm khác nhau. Với bài toán
n h ận dạng cam và táo, nếu ta chọn đặc trưng 8ố về m àu và dáng
rồi dùng khoảng cách ơ clit như minh họa trong hình 1.2 th ì sẽ có
nhiều trưòng hợp không phân biệt nổi là quả nào. Tuy nhiên, nếu
ta chọn đặc trưng là đặc điểm vỏ thô hay nhẵn th ì dễ dàng phân
biệt được cam hay táo.
H ậu xử lý
Một bộ nhận dạng hiếm khi chỉ để dùng đơn lẻ. K ết quả nhận
dạng thường dùng làm cơ sở để đưa ra thao tác tương ứng (đặt quả
này vào giỏ này, đặt quả khác vào giỏ kia), mỗi thao tác m ất một
chi p h í riêng. H ậu xử lý sẽ phân tích kết quả của bộ phân lớp để
quyết định chọn thao tác tương ứng.
21

Một cách tự nhiên nhất để đánh giá h o ạ t động của một bộ
nhận dạng là xét tỷ lệ nhận dạng sai với các m ẫu mới và chúng ta
cần có bộ nhận dạng với tỷ lệ lỗi th ấp nhất. Tuy nhiên, do chi phí
phải chịu cho mỗi thao tác thường là khác n h au nên ta hưâng tói
cực
• tiểu rủ i ro cho lựa
• chọn
i thao tác.
1.4 Q u á t r ì n h x ây d ự n g h ệ n h ậ n d ạ n g m ẫ u
Trên đây đã giới thiệu cấu trúc điển h ìn h của hệ nhận dạng
mẫu. Quá trìn h th iế t k ế một hệ thống nhận dạng m ẫu luôn là chu
trìn h lặp của các khâu (có liên hệ ngược) sau: th u th ập dữ liệu, lựa
chọn đặc trưng, lựa chọn mô hình, huấn luyện và đánh giá. Lược
đồ chung của chu trìn h thiết k ế được mô tả trong hình 1.6., dưới
đây nói rõ hơn về các khâu của chu trìn h này.
Thu thập d ữ liệu
K hâu đầu để xây dựng hệ thống là th u th ập dữ liệu để huấn
luyện bộ nhận dạng và kiểm th ử hệ thông. Việc th u th ập dữ liệu
này có thể chiếm một phần r ấ t lớn trong chi phí ph át triển hệ
n hận dạng mẫu. Thưòng thì có thể thực hiện bước nghiên cứu sơ
bộ với một tập nhỏ các mẫu điển hình, nhưng để hệ thống có thể
hoạt động tốt th ì phải cần r ấ t nhiều dữ liệu cho huấn luyện và
đánh giá. Một bài toốn cần lưu ý trong khâu này là “ làm sao
chúng ta có thể biết dữ liệu th u thập được là đủ cho việc huấn
luyện và kiểm tr a hệ thống?”
Chọn đặc trưng
Như đã trìn h bày ỏ mục trưỏc, việc lựa chọn các đặc trưng
khác nhau là bưóc thiết k ế th en chốt, nó phụ thuộc vào khả năng
của th iết bị th u và tín h chất của bài toán cụ thể. Thường thì có
nhiều đặc trưng có thể chọn, vấn đề là chọn đặc trư ng nào cho

thích hợp?. Để hệ nhận dạng tốt, các đặc trư n g cần có tín h độc lập
(hệ số tương quan bé). Hơn nữa, càng ít đặc trư ng thì càng tốt vì
nói chung sẽ giảm được độ phức tạp tín h toán nên tốn ít thòi gian
xử lý của hệ nhận dạng.
22

Lựa chọn mô hình
Trong khâu này, ta chọn mô hình biểu diễn đôi tượng và
th u ậ t toán huấn luyện bộ nhận dạng. Khi thực hiện, khâu này
thường có liên hệ ngược với khâu trước (chọn đặc trưng) và khâu
s a u (huấn luyện).
Khi biểu diễn trá i cây, nếu chúng ta không bằng lòng vổi hoạt
động của bộ nhận dạng với mô hình sử dụng các đặc trưng về hình
dáng, m àu sắc và kích thưác đang có thì ta cần xét đến mô hình
k h á c , c h ẳ n g h ạ n , m ô h ì n h d ự a trên b ể m ặ t v ỏ , t r ọ n g lư ợ n g , m ù i v ị,
v.v... Các phương pháp và thuật toán huấn luyện cơ bản thường có
sẵn , ta có thể lựa chọn một hoặc kết hợp khéo léo giữa chúng để
h u ấn luyện bộ nhận dạng.
Vấn đề đặt ra là làm sao biết được mô hình dự định của ta với
mô hình đang có là th ậ t sự khác nhau về chất và liệu có cần thay
đổi mô hình hay không?.
H uấn luyện
Quá trìn h sử dụng dữ liệu để xác định các tham số cho bộ
n h ậ n dạng được gọi là huấn luyện hay đào tạo bộ nhận dạng. Vối
mỗi mô hình được xem xét, cần phải đào tạo và đánh giá chất
lượng bộ phân lớp để chọn mô hình thích hợp. Quá trìn h huấn
luyện này còn gọi là quá trình học, còn nhận dạng mẫu là áp dụng
k ỹ th u ật học máy để n h ận dạng đối tượng.
Chúng ta cũng đã thấy rấ t nhiều bài toán nảy sinh khi thiết

k ế một bộ nhận dạng m ẫu và không có phương thức tểng quát để
giải quyết các bài toán này. Tuy nhiên, có nhiều kinh nghiệm có
th ể giúp th iế t k ế hiệu quả các bộ nhận dạng m ẫu có k h ả năng học
t ừ các m ẫu đã biết.

23

kếtmúc
Hinh 1.6. Chu trinh th iít k ế bộ n h ịn dạng

Kiểm tra và đánh giá
K hâu này có thể thực hiện để đánh giá riêng chất lượng từng
khâu chọn đặc trưng, chọn mô hình và huấn luyện hoặc toàn bộ
kết hợp của chúng nhờ 80 sá n h k ế t quả lựa chọn và thực hiện. Khi
chỉ th u ần tú y suy luận thì khó có thể biết đặc trưng nào tốt, một
bộ phân lớp với mô hình tuyến tín h có th ể đơn giản nhưng khi
chúng chuyển sang mô hình phi tuyến có thể kết quả lại tốt hơn
mà không tốn quá nhiều thời gian chạy... Việc đánh giá nhằm
tăng tốc độ hoạt động và cải tiến các th àn h phần để hệ n h ận dạng
có hiệu quả tốt là rấ t quan trọng và phải thực hiện bằng phân tích
thực nghiệm. Một hệ thống phức tạp có thể nhận dạng m ẫu rất tốt
khi h u ấn luyện nhưng lại không tố t khi gặp các mẫu mới. Một vấn
đề đ ặt ra là đánh g à chất lượng bộ phân lốp qua kiểm định trên
dữ liệu đã có như t h í nào?. Để tr ả lời câu hỏi này cần sử dụng các
kiến thức về thống kê toán.
24

1.5 H ọc m áy v à c á c c á c h tiếp c ậ n

Các bộ nhận dạng mẫu được thiết k ế và huấn luyện theo
phương thức học máy. Vì hầu hết các thực nghiệm trong bài toán
n h ận dạng m ẫu m ất nhiều thời gian và khó đánh giá độ chính xác
n ên ta cần tập tru n g thòi gian vào xem xét việc học m à không chú
trọng quá nhiều vào việc trích chọn đặc trư ng tối ưu. Thông
thường, ta xét một mô hình tổng quát cho một lốp bộ n h ận dạng
rồi sau đó sử dụng những mẫu huấn luyện để học hay ưốc lượng
các tham sô’ chưa biết của mô hình. Việc học liên quan đến một số
dạng th u ậ t toán để giảm lỗi nhờ áp dụng trê n tập hợp dữ liệu
h u ấn luyện. Ngươi ta hay dùng th u ậ t toán gradient và các biến
th ể của nó để thay đổi các tham sô' của bộ n h ận dạng nhằm giảm
lỗi theo cách tự thích nghi.
N hìn từ phướng diện học máy, ta phân biệt các cách học: có
giám sát, không giám sát và học tăng cưòng... Ngoài ra, người ta
cũng phân biệt theo cách tiếp cận theo công cụ học khác như:
thống kê, tấ t định, mạng nơron, dựa trê n cấu trúc...
2.5.1 H ọc có g iá m s á t
Với học có giám sát (supervised learning) hay học có thầy,
người ta tìm n h ãn cho các mẫu mới (giả thuyết) dựa vào một tập
m ẫu đã biết nhãn. Giả thuyết cần tìm là một xấp xỉ cho giả thuyết
đúng, nó được gọi là giả thuyết quy nạp. Phương pháp cực tiểu lỗi
h ay được dùng trong cách tiếp cận này.
Có những vấn đề đặt ra là: Làm th ế nào khẳng định được một
th u ậ t toán học cụ thể là đủ mạnh để học được cách giải một bài
to án đã cho và nó sẽ ổn định với sự biến thiên tham số? Vối thòi
gian có h ạ n và m ột lượng mẫu hợp lý, làm sao đảm bảo được th u ật
to án hội tụ?
I.5 J Ĩ H ọc k h ô n g có g iá m sá t
Trong học không có giám sát (unsupervised leam ing), hệ
tỉhổng dựa vào phân tích dữ liệu để phân cụm m à không có mẫu

25

hưống dẫn của “thầy” nên còn gọi là tiếp cận hưống dữ liệu (data
driven). Trong các bài toán phân cụm, thông thường người dùng
cần ưỏc lượng trưốc số lượng các cụm, nhưng không có giải th u ật
tôi ưu cho việc ưốc lượng này. Nếu trong tậ p dữ liệu có một tập
nhỏ đã được gán nhãn hoặc biết một số trong chúng cùng một
nhóm hoặc khác nhóm th ì ta gọi là học nửa giám sát
(semisupervised learning).
1.5.3 H ọc tă n g cường
Một cách thông dụng để huấn luyện một bộ phân loại là đưa
vào từng mẫu, tín h toán thử n h ãn cho nó và so vối n h ãn đã biết để
hiệu chỉnh, cải tiến bộ phân lốp. Trong học tăn g cường
(Reiníorcement learning), hay học có bình luận, không có kết quả
nhãn xác định trước cho mẫu, m à thay vào đó là phản hồi đúng/sai
để hiệu chỉnh. Chẳng hạn, trong nhận dạng ký tự quang học, dữ
liệu đầu vào có thể là một ảnh chứa một ký tự, kết quả đưa ra là
nhãn phân loại “G” nhưng kết quả phải là “C” th ì trong học tồng
cường có phản hồi là sai, t h ô n g tin này sẽ d ùng để hiệu chỉnh hệ
nhận dạng. Phương pháp này tương tự như có một người bình
luận, họ có th ể đánh giá đúng hay sai để giúp h u ấn luyện nhưng
không th ể nói là sai ở chỗ nào.

1.5.4. Học thống kê
Học thống kê (Statistical learning) là phương pháp thưòng
dùng để phân lớp có giám sát. Trong phương pháp này, dựa trên
các k ết quả thống kê ta ưóc lượng xác su ất thuộc vào các lớp của
mỗi đốì tượng và sử dụng chúng để quyết định n h ã n cho nó. Chủ
để này tu y là cổ điển và có cơ sỏ toán học khá' vững chắc của lý

thuyết xác su ất và thống kê nhưng vẫn còn nhiều vấn đề mở cần
nghiên cứu cho ứng dụng.

1.5.5. Mạng nơron nhân tạo
M ạng nơron (N eural netw ork) n h â n tạo mô phỏng kiến trúc
của bộ não, chúng được xây dựng nhò kết nô'i các đơn vị th àn h
26

Giáo trình nhận dạng mẫu

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về