BỘ GIÁO DỤC & ĐÀO TẠO
BỘ GIÁO DỤC & ĐÀO TẠO
ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN ĐÀO TẠO SAU ĐẠI HỌC
TIỂU LUẬN MÔN HỌC
Đề 13: Tìm hiểu ứng dụng phương pháp nhận dạng
cấu trúc văn phạm trong nhận dạng (nhận dạng
chữ,…) và so sánh chất lượng và hiệu năng với
phương pháp khác để nhận dạng chữ.
GVHD: PGS.TS. Nguyễn Thị Hoàng Lan
Học viên: Hoàng Văn Hải
Nguyễn Văn Dũng
Trần Đình Phương
Lớp: CH-12BMTT
Hà nội, 12/2012
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
MỞ ĐẦU
Được sự phân công của ban cán sự lớp, nhóm thực hiện đề tài: Tìm hiểu ứng
dụng phương pháp nhận dạng cấu trúc văn phạm trong nhận dạng (nhận dạng
chữ,…) và so sánh chất lượng và hiệu năng với phương pháp khác để nhận dạng
chữ. (Đề 13). Trong phạm vi của tiểu luận này, với những kiến thức đã được học
cũng như tự nghiên cứu thêm tài liệu từ các giáo trình, bài giảng và mạng Internet,
chúng tôi xin trình bày các nội dung sau:
Phần 1: Sơ lược về nhận dạng
Phần 2: Tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm
trong nhận dạng (nhận dạng chữ, hình học, ảnh nhị phân,…).
Phần 3: So sánh chất lượng và hiệu năng với phương pháp khác để nhận
dạng chữ (phương thức đồ thị, chuỗi).
Cho dù đã hết sức cố gắng, nhưng do điều kiện thời gian và khả năng còn
nhiều hạn chế, hơn nữa nội dung tiểu luận môn học này là một lĩnh vực tri thức
rộng lớn còn đang được nghiên cứu, đa dạng và rất phức tạp nên chắc chắn không
thể không tránh khỏi những sai sót và khiếm khuyết. Rất mong nhận được sự góp
ý, phê bình, đánh giá của PGS.TS và của các bạn trong lớp để nhóm chúng tôi rút
kinh nghiệm và hoàn thiện tốt hơn trong thời gian tới.
Chúng tôi xin gửi lời cảm ơn chân thành đến PGS.TS Nguyễn Thị Hoàng Lan
đã giảng dạy kiến thức, cung cấp tài liệu, định hướng và hướng dẫn chúng tôi trong
suốt thời gian qua để nhóm chúng tôi hoàn thành tiểu luận này.
Phân công công việc:
Phần 1: Hoàng Văn Hải
Phần 2: Hoàng Văn Hải
Phần 3: Nguyễn Văn Dũng (Phương thức đồ thị)
Phần 3: Trần Đình Phương (Phương thức xâu chuỗi)
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 2
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
PHẦN 1. SƠ LƯỢC VỀ NHẬN DẠNG
1.1. Không gian biểu diễn đối tượng, không gian diễn dịch
a) Không gian biểu diễn đối tượng
Các đối tượng khi quan sát hay thu thập được, thường được biểu diễn bởi tập các
đặc trưng hay đặc tính. Như trong trường hợp xử lý ảnh, ảnh sau khi được tăng
cường để nâng cao chất lượng, phân vùng và trích chọn đặc tính được biểu diễn
bởi các đặc trưng như biên, miền đồng nhất, Người ta thường phân các đặc trưng
này theo các loại như: đặc trưng tô pô, đặc trưng hình học và đặc trưng chức năng.
Việc biểu diễn ảnh theo đặc trưng nào là phụ thuộc vào ứng dụng tiếp theo.
Ở đây ta đưa ra một cách hình thức việc biểu diễn các đối tượng. Giả sử đối
tượng X (ảnh, chữ viết, dấu vân tay, …) được biểu diễn bởi n thành phần (n đặc
trưng): X = {x
1
, x
2
, , x
n
}; mỗi x
i
biểu diễn một đặc tính. Không gian biểu diễn đối
tượng thường gọi tắt là không gian đối tượng X được định nghĩa:
X = {X
1
, X
2
, , X
m
}
trong đó mỗi X
i
biểu diễn một đối tượng. Không gian này có thể là vô hạn. Để
tiện xem xét chúng ta chỉ xét tập X là hữu hạn.
b) Không gian diễn dịch
Không gian diễn dịch là tập các tên gọi của đối tượng. Kết thúc quá trình nhận
dạng ta xác định được tên gọi cho các đối tượng trong tập không gian đối tượng
hay nói là đã nhận dạng được đối tượng. Một cách hình thức gọi
Ω
là tập tên đối
tượng:
Ω
= {w
1
, w
2
, ,w
k
} với w
i
, i = 1, 2, , k là tên các đối tượng
Quá trình nhận dạng đối tượng f là một ánh xạ f: X >
Ω
với f là tập các quy
luật để định một phần tử trong X ứng với một phần tử trong
Ω
. Nếu tập các quy
luật và tập tên các đối tượng là biết trước như trong nhận dạng chữ viết (có 26 lớp
từ A đến Z), người ta gọi là nhận dạng có giám sát. Trường hợp thứ hai là nhận
dạng không có giám sát. Đương nhiên trong trường hợp này việc nhận dạng có khó
khăn hơn.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 3
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
1.2 Nhận dạng mẫu thống kê và nhận dạng cấu trúc
a) Nhận dạng mẫu thống kê
Nhận dạng mẫu thống kê phân loại các mô hình dựa trên một tập hợp các tính
năng trích xuất và một mô hình cơ bản thống kê.
Lý tưởng nhất, được thực hiện với một thủ tục khá đơn giản:
- Xác định vector tính năng,
- Huấn luyện hệ thống,
- Phân lớp.
Cũng có nhiều mô hình chứa thông tin cấu trúc và quan hệ khiến cho rất khó
hoặc không xác định được dạng vector tính năng.
b) Nhận dạng cấu trúc văn phạm
Cách tiếp cận của mô hình này dựa vào việc mô tả đối tượng bằng cách biểu thị
giả định đối tượng cơ sở để có thể đánh giá được trong ngôn ngữ tự nhiên.
Phương pháp này xây dựng mô tả thứ bậc các mô hình phức tạp từ các yếu tố
nguyên thủy đơn giản. Để mô tả đối tượng, người ta dùng một số dạng nguyên
thuỷ như đoạn thẳng, cung,…
Chẳng hạn một hình chữ nhật được định nghĩa gồm 4 đoạn thẳng vuông góc với
nhau từng đôi một. Trong mô hình này người ta sử dụng một bộ kí hiệu kết thúc
V
t
, một bộ kí hiệu không kết thúc gọi là V
n
. Ngoài ra có dùng một tập các luật sản
xuất để mô tả cách xây dựng các đối tượng phù hợp dựa trên các đối tượng đơn
giản hơn hoặc đối tượng nguyên thuỷ (tập V
t
). Trong cách tiếp cận này, ta chấp
nhận một khẳng đinh là: cấu trúc một dạng là kết quả của việc áp dụng luật sản
xuất theo theo những nguyên tắc xác định bắt đầu từ một dạng gốc bắt đầu. Một
cách hình thức, ta có thể coi mô hình này tương đương một văn phạm G = (V
t
, V
n
,
P, S) với:
- V
t
là bộ ký hiệu kết thúc,
- V
n
là bộ ký hiệu không kết thúc,
- P là luật sản xuất,
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 4
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
- S là ký hiệu, biểu tượng kết thúc.
Ví dụ, đối tượng nhà gồm mái và tường, mái là một tam giác gồm 3 cạnh là 3
đoạn thẳng, tường là một hình chữ nhật gồm 4 cạnh vuông góc với nhau từng đôi
một sẽ được mô tả thông qua cấu trúc mô tả dựa vào văn phạm sinh như chỉ ra
trong hình 1 dưới đây.
Hình 1. Mô hình cấu trúc của một đối tượng nhà.
Việc xác định số lượng và mô tả cấu trúc được thực hiện chủ yếu bằng cách sử
dụng:
- Ngôn ngữ hình thức
- Mô tả quan hệ (chủ yếu là đồ thị).
Bước tiếp theo, nhận dạng và phân loại được thực hiện bằng cách sử dụng:
- Phân tích cú pháp (đối với ngôn ngữ hình thức),
- Kết hợp đồ thị quan hệ (đối với mô tả quan hệ).
Trong tiểu luận này chúng tôi sẽ nghiên cứu phương pháp tiếp cận nhận dạng
cấu trúc văn phạm. So sánh nó với phương pháp nhận dạng chuỗi và đồ thị.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 5
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
PHẦN 2: TÌM HIỂU ỨNG DỤNG PHƯƠNG PHÁP NHẬN DẠNG
CẤU TRÚC VĂN PHẠM TRONG NHẬN DẠNG.
2.1 Phương thức cấu trúc văn phạm
Ngữ pháp cung cấp mô hình được chi tiết hóa làm nền tảng cho việc tạo ra tuần
tự ký tự trong chuỗi.
Ví dụ, chuỗi số điện thoại có một cấu trúc chặt chẽ.
Tương tự như vậy, hệ thống nhận dạng ký tự quang nhận dạng và biên dịch các
phương trình toán học có sử dụng quy tắc để sắp xếp các biểu tượng toán học.
Bài toán nhận dạng, chúng tôi đưa ra một câu (một chuỗi có quy tắc) và ngữ
pháp (các bộ quy tắc), và xác định xem câu có được tạo ra bởi văn phạm này
không.
Một ngữ pháp bao gồm bốn thành phần:
- Các ký tự: Mỗi câu bao gồm một chuỗi ký tự (hay biểu tượng nguyên thủy,
biểu tượng kết thúc) từ bảng chữ cái.
- Các biến: Là (ký hiệu) biểu tượng không kết thúc (hoặc biểu tượng trung
gian, biểu tượng nội bộ).
- Biểu tượng gốc: Là một biến đặc biệt, là gốc cho tất cả các chuỗi.
- Luật sinh: là các quy tắc sinh (hoặc viết lại quy tắc) để xác định chuyển đổi
một tập hợp các biến và biểu tượng vào các biến và biểu tượng khác.
Ví dụ, nếu A là biến và c là ký hiệu kết thúc, quy tắc cA -> cc nghĩa là bất kỳ
thời điểm nào phân khúc cA xuất hiện trong chuỗi có thể được thay thế bởi cc.
Ngôn ngữ L(G) được tạo ra bởi một văn phạm G là tập hợp tất cả các chuỗi (có
thể là số vô hạn) có thể được tạo ra bởi G.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 6
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Hình 2: Cây trên minh họa một câu tiếng Anh được tạo ra bởi văn phạm.
Một vài đặc điểm của phương thức nhận dạng theo cú pháp và cấu trúc như
sau:
+ Các mẫu được phân tách thành các mẫu nhỏ dựa trên mối quan hệ.
+ Các mẫu được hình thành bởi các mẫu nhỏ hơn được phân cấp.
+ Các lớp khác nhau có các mẫu nhỏ khác nhau, quy luật giữa các mẫu nhỏ
khác nhau có thể khác với các lớp khác nhau.
Ví dụ cho một mẫu nhận dạng:
Hình 3 – Phân tích nhận dạng cú pháp một khuông nhạc
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 7
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Như vậy, đối tượng cần nhận dạng X được miêu tả bởi xâu chuỗi, đồ thị hoặc
văn phạm. Ta có cấu trúc văn phạm G dựa trên bộ tứ G = (V
N
, V
T
, P, S), V
N
và V
T
(V
N
∩ V
T
= ∅)
- V
N
: tập các từ vựng
- V
T
: tập các từ vựng được coi là biến
- P là tập quy tắc sinh câu . Ví dụ: α → β, α và β là các tập con của V và α ∩ VN
= ∅.
- S ∈ V
N
là biểu tượng, dấu hiệu thư mục gốc (hoặc bắt đầu).
Một số ký hiệu:
• Σ * là tập hợp của tất cả các câu có chiều dài hữu hạn được hình thành từ biểu
tượng Σ. Chuỗi rỗng được ký hiệu là λ; Σ + = Σ * - {λ}
• x
n
biểu thị sự lặp lại của câu x n lần.
• | x | là độ dài của câu x.
• nghĩa là η trực tiếp tạo ra câu γ, nghĩa là η = ω
1
α ω
2
, γ = ω
1
β ω
2
, và
có tồn tại một quy tắc sinh α → β.
• có nghĩa là η gián tiếp tạo ra câu γ, tức là, có tồn tại một chuỗi các
câu ς
1
. . . , ς
n
để η = ς
1
, γ = ς
n
, và ς
i
⇒ ς
i
+1, i = 1,. . . , n - 1. Các câu ς
1
,. . . , ς
n
được
gọi là nguồn gốc của γ từ η.
Nếu G là một cấu trúc văn phạm, khi đó
là một cụm từ có cấu trúc được tạo ra bởi văn phạm.
Một ngôn ngữ có thể có nhiều cách đặc tả, do đó cũng có thể có nhiều văn
phạm khác nhau sinh ra cùng một ngôn ngữ. Hai văn phạm sinh ra cùng một ngôn
ngữ thì gọi là tương đương. G
1
tương đương G
2
<=> L(G
1
) = L(G
2
)
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 8
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Nếu một chuỗi x ∈ L(G) có thể được sinh bởi nhiều cách, văn phạm G là
không rõ ràng. Trong các ứng dụng nhận dạng, một văn phạm rõ ràng là điều mong
muốn, bởi nó có thể phân tích cú pháp.
Hình 4 – Minh họa một hệ thống nhận dạng theo cấu trúc văn phạm
2.2 Ngôn ngữ hình thức
Bằng cách áp đặt một số quy tắc hạn chế trên các luật sinh, Noam Chomsky đề
nghị một hệ thống phân loại các văn phạm dựa vào tính chất các luật sinh. Hệ
thống này cho phép xây dựng các bộ nhận dạng hiệu quả và tương thích với từng
loại văn phạm. Ta có 4 loại văn phạm như sau:
Loại 0: (Văn phạm phi ngữ cảnh hay không hạn chế): Văn phạm không cần
thỏa mãn bất kỳ ràng buộc trên các luật sinh hay quy tắc nào.
Loại 1:(văn phạm cảm ngữ cảnh CSG): Nếu văn phạm G có luật sinh dạng
αIβ → αxβ. Trong đó α,β là một chuỗi bất kỳ chứa biến trung gian hoặc biểu tượng
kết thúc, I là biến trung gian, x là biến trung gian hoặc biểu tượng kết thúc.
Loại 2: (văn phạm phi ngữ cảnh CFG): Nếu văn phạm G có luật sinh dạng A
→ α với A là một biến trung gian và α là một chuỗi ký hiệu kết thúc hoặc biến
trung gian ∈ V
T
.
Loại 3: (văn phạm chính quy RG): Nếu văn phạm G có luật sinh dạng tuyến
tính: α → zβ hoặc α → βz hoặc α → z với α,β là các biến trung gian và z là chuỗi
ký hiệu kết thúc (có thể là rỗng).
Lớp của văn phạm kiểu i bao gồm tất cả văn phạm kiểu i + 1.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 9
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
2.3 Nhận dạng sử dụng cấu trúc văn phạm
Giả sử có một câu x được tạo bởi ngôn ngữ c có các mẫu hoặc lớp khác nhau.
Câu x được phân loại theo ngữ pháp đã sinh nó, x là một thành viên của ngôn ngữ
L(G
i
).
Phân tích cú pháp là quá trinh xử lý ngược, cho x cụ thể, tìm một dẫn xuất
trong G, dẫn đến x.
Phân tích cú pháp từ dưới lên bắt đầu với câu x, và tìm cách đơn giản nó, coi
nó là biểu tượng gốc. Phương pháp tiếp cận cơ bản là sử dụng các luật sinh trở về
trước, tức là tìm viết lại quy tắc bên phải của chuỗi hiện tại, và thay thế nó với một
phân khúc.
Phân tích cú pháp từ trên xuống bắt đầu với nút gốc và liên tục áp dụng luật
sinh để tìm gốc của câu x. Từ đó xác định được quy tắc sinh.
2.4 Ngôn ngữ mô tả hình ảnh sử dụng nhận dạng cấu trúc văn phạm
Hình 5: Sử dụng ngôn ngữ mô tả hình ảnh (PDL) để nhận dạng cấu trúc văn phạm
Ngôn ngữ mô tả hình ảnh (PDL) là một cách thức đầu tiên để mô tả các mẫu
hình ảnh sử dụng ngôn ngữ hình thức.
Trong hình trên:
Các ký hiệu (biểu tượng) kết thúc: {t, b, u, o, s, *, - , +}; + đại diện cho 2 vector
nối đuôi nhau, * đại diện cho 2 vector cùng điểm bắt đầu, và - đại diện đảo ngược
vector. H đại diện cho cuối vector và T đại diện cho đầu vector.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 10
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Hình 6: Sử dụng PDL để mô tả ống trụ tròn
Hình 7: Sử dụng PDL hình (7b) để mô tả 4 ký tự A, C, P, F như hình (7a)
Trong hình trên ta sử dụng PDL để nhận dạng 4 ký tự trên tương ứng với các
luật sinh sau:
A = u + ((u + o + -u) * o) + -u
C = -o + u + u + o
P = u + ((u + o + -u) * o)
F = u + (o * u) + o
Ta có một cấu trúc văn phạm G được sắp xếp trong 2 khối stack như sau:
V
T
= {table, block, +, ©} (ký hiệu kết thúc)
V
N
= {DESC, LEFT_STACK, RIGHT_STACK} (biến, ký hiệu không kết thúc)
S = DESC thuộc V
N
(Ký hiệu gốc)
P = {DESC -> LEFT_STACK + RIGHT_STACK
DESC -> RIGHT_STACK + LEFT_STACK
LEFT_STACK -> block © block © table
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 11
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
RIGHT_STACK -> block © block © table} (Các luật sinh)
Hình 8: Cấu trúc văn phạm biểu diễn 4 khối được sắp xếp trong 2 khối stack. Hình
(8ii) biểu diễn (8i) và (8iv) biểu diễn (8iii)
Hình 9: Ví dụ cây cú pháp biểu diễn hình lập phương
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 12
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Hình 10: Ví dụ cây cú pháp biểu diễn 1 ảnh nhị phân
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 13
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
PHẦN 3: SO SÁNH CHẤT LƯỢNG VÀ HIỆU NĂNG NHẬN
DẠNG VỚI PHƯƠNG PHÁP KHÁC ĐỂ NHẬN DẠNG CHỮ.
3.1 Phương pháp suy luận
Trong nhiều ứng dụng, ngữ pháp được thiết kế bằng tay. Một phương pháp
khác là học ngữ pháp từ các mẫu có sẵn. Việc học này được gọi là phương pháp
suy luận.
Dữ liệu huấn luyện thiết lập H có thể bao gồm mẫu tích cực S+ và mẫu tiêu
cực S-, có nghĩa là, H = {S
+
, S
-
}. Mục đích là để học một ngũ pháp G
learn
ngữ pháp
để mẫu trong S
+
thuộc về ngôn ngữ được xác định bởi ngữ pháp, và các mẫu trong
S
-
thì không.
Ngoài ra, các mẫu huấn luyện có thể được "ngoại suy". Nếu:
S+={ab, aabb, aaabbb, aaaabbbb}
Có thể được phát biểu rằng:
L(Glearn) ={anbn|n≥1} và P={S→ab, S→aSb}.
Một văn phạm chính quy có thể được hình thành bằng cách sử dụng một dữ
liệu huấn luyện theo cách sau.
• S + và S- được cho là có sẵn.
• Khởi tạo ngữ pháp G
learn
(0)
= {V
N
(0)
, V
T
(0)
, P
(0)
, S
(0)
} và xây dựng và chỉnh sửa
quy tắc tạo ra các thành viên của P, V
N
, V
T
được giả thiết là đã biết.
• Mục đích là để xác định G
learn
để S
+
là một chuỗi thuộc ngôn ngữ L(G
learn
) và
S
-
không.
Tổng quan về các thủ tục học tập:
• Đặt i = 1
• Xem tập huấn luyện x
(i)
S∈
+
. Nếu có có thể được phân tích và chỉnh sửa
G
learn
để nó có thể phân tích được và không có x S∈
-
có thể được phân tích.
• Nếu i < |S
+
|, đặt i = i + 1 và quay lại bước trước đó, nếu không thì thoát.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 14
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Một điểm yếu rõ ràng về thủ tục là đặc điểm kỹ thuật của quy tắc chỉnh sửa
thích hợp cho P, V
N
, V
T
là khó khăn.Hơn nữa, nếu các quy định là không duy nhất,
số lượng G
learn
ngữ pháp có thể phát triển nhanh chóng.
3.2 Nhận dạng dựa vào đồ thị.
Một đồ thị có hướng có thể được sử dụng để đại diện cho phụ thuộc phức tạp
hơn giữa các nguyên thủy (biểu tượng) hơn bằng cách sử dụng các chuỗi biểu
tượng một chiều. Như vậy, so sánh các mẫu đại diện sử dụng đồ thị có thể được
nhìn thấy trong một cảm giác như là một sự tổng quát so sánh các chuỗi biểu
tượng.
Xem đỉnh N của một đồ thị G = {N, R} (khác nhau) biểu tượng và R cạnh
giữa chúng phản ánh (khác nhau) quan hệ giữa chúng (được gọi là thuộc tính đồ
thị).
Hình 11: Một ví dụ về mẫu được biểu diễn bằng đồ thị:
Nhận dạng dựa trên so sánh giữa một đồ thị và biểu đồ nguyên mẫu của các lớp
khác nhau bằng cách sử dụng thuật toán K-láng giềng gần nhất. Đồ thị đại diện của
một mô hình quan sát không nhất thiết phải hoàn toàn phù hợp với bất kỳ đồ thị
nguyên mẫu. Nó có thể chỉ là một đồ thị con của một số đồ thị nguyên mẫu. việc
so sánh giống nhau giữa đồ thị được dựa trên sự tương đồng giữa hai đỉnh và các
cạnh của đồ thị so sánh.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 15
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Đồ thị có thể được biểu diễn bằng cách sử dụng một ma trận kề M có kích
thước p × p, trong đó p là số đỉnh: M (i, j) != 0 nếu có một đỉnh giữa i và j, nếu
không M (i, j) =0.
Phép đồng cấu và đẳng cấu của đồ thị:
Đồ thị G1={N1, R1} và G2={N2, R2} được gọi là đồng cấu nếu tồn tại một
ánh xạ f : N
1
N
2
để nếu có một cạnh giữa đỉnh v
1
, w
1
∈ N
2.
Sao cho
(v1, w1)∈R1⇒(f(v1), f(w1))∈R2.
Đồ thị được gọi là đẳng cấu nếu nó là đồng cấu và có một ánh xạ f một – một
cho mỗi đỉnh của N2 tồn tại chính xác một đỉnh tương ứng trong N1 (song ánh),
sao cho (v1, w1)∈R1⇔(f(v1), f(w1))∈R2
Nói cách khác, G2 thu được từ G1 bằng cách đánh lại chỉ số các đỉnh.
Ví dụ về đồ thị đẳng cấu:
Hình 12: Một ví dụ về đẳng cấu của hai đồ thị vô hướng với p = 4
Trong thực tế đẳng cấu của đồ thị không phải là một biện pháp tốt tương tự
trong việc phân loại, bởi vì nó không cho phép bất kỳ sự khác biệt nào giữa đồ
thị.Vì thế, rất nhạy cảm với các sai sót trong giai đoạn khai thác tính năng. Ngoài
ra, phát hiện của phép đẳng cấu giữa đồ thị tính toán rất đòi hỏi:
• Xem xét so sánh các đồ thị G1 và G2 biểu diễn bằng cách sử dụng ma trận
kề M1 và M2.
• Nếu M1 = M2 đồ thị đẳng cấu. Sự so sánh này cần được thực hiện cho tất cả
các yếu tố của một ma trận p × p (O (| N1 | 2)).
• Nếu M1 != M2, có thể tất cả các cách khác để đánh chỉ số đỉnh M1 phải
được cố gắng thực hiện.
Thông thường, kiểm tra thất bại nếu đồ thị không đẳng cấu được sử dụng.Các
tính chất đồ thị dưới đây là bất biến để đẳng cấu:
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 16
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
• Số đỉnh (loại nhất định).
• Số cạnh (loại nhất định).
• Số cạnh (loại nhất định) kết nối với đỉnh (của một số loại).
Có tồn tại nhiều thuật toán để cho phép so sánh sự khác biệt giữa các đồ thị.
Hai cách tiếp cận điển hình là:
• Vectơ tính năng được xây dựng cho các biểu đồ và các vectơ được so sánh.
• Số lượng các phép toán tối thiểu cần thiết để sửa đổi một đồ thị khác được
sử dụng như một biện pháp thay thế.
o Chèn và loại bỏ các đỉnh.
o Kết hợp và chia tách các đỉnh
o Thay đổi loại của các đỉnh.
o Chèn và loại bỏ các cạnh
o Thay đổi các loại của cạnh
3.3 Nhận dạng dựa trên đối sánh cấu trúc xâu chuỗi
Phân tích cấu trúc của một chuỗi kí tự có nghĩa là kiểm tra cấu trúc đó có được
chấp nhận hay không, đó là, nếu nó có thể được tạo ra bằng cách sử dụng các quy
tắc ngữ pháp.
Cách xây dựng:
Hi
Hình 13: Bộ nhận dạng
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 17
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Ở đây x là một chuỗi kí hiệu và Gi là một văn phạm tương tương ứng với lớp ωi.
Giả sử rằng G là một văn phạm ngữ cảnh và x là một chuỗi kí tự.
Trong việc xây dựng, công nhận của một cây phân tích cú pháp tương ứng với
x sử dụng G là cố gắng. Nếu có thể xây dựng cây => x thuộc ngôn ngữ L (G), nếu
cây không thể xây dựng, x không thuộc ngôn ngữ L(G)
Ví dụ. Xem xét văn phạm G = (V
N
, V
T
, P, S), trong đó VN = {S, T},
V
T
= {I, +, *}, I ∈ {a, b, c}, và
P={S→T, T→T∗I, S→S+T, T→I}.
Một chuỗi biểu tượng x = a * b + c * a + b thuộc ngôn ngữ L (G). Vì có thể
được phân tích cú pháp theo cách sau đây
Hình 14: Cây cú pháp cho x
Việc cây được xây dựng thế nào không quan trọng. Tuy nhiên, thường là kí
hiệu được đưa từ trái sang phải trong thuật toán phân tích bất kỳ.
Trong quá trình phân tích cú pháp, các quy tắc được lựa chọn tại các nút
con.Tuy nhiên, lựa chọn của một số quy tắc có thể dẫn đến phân tích cú pháp
không thành công mặc dù chuỗi thuộc vào ngôn ngữ. Trong trường hợp đó, người
ta phải trở về điểm bị sai và chọn quy tắc khác. Điều này được gọi là quay lại.
Phân tích cú pháp có thể dung phương pháp top-down hoặc bottom-up
Phân tích kiểu top-down (từ trên xuống)
• Phân tích cú pháp bắt đầu từ những kí tự gốc.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 18
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
• S được phân rã thành một phần (subgoals): S → X1X2. . . Xn.
• Nếu X1 là một kí tự có thể phân rã, nó có phải là kí tự đầu tiên trong chuỗi x
được phân tích.
• Nếu X1 là một biểu tượng không thể phân rã, nó cần được đưa vào phần của
x tương ứng với nó.
• Nếu X1 có thể được phân tích thành công thì sẽ đến X2 và tiếp tục
• Nếu một số Xi không thể được phân tích cú pháp, phân tách mới ban đầu →
X1’X2’. . . Xn’ được thử.
• Các subgoals có thể được tiếp tục phân hủy thành subgoals.
• Nếu một số của subgoals không thể đạt được, phân tích cú pháp trả về với
mức độ cao hơn và một phân rã mới được thực hiện.
• Căn cứ từ trái sang phải cùng với quá trình đệ quy.
Một form → Aα có thể sinh ra vòng lặp vô hạn trong phân tích cú pháp. Cần
phải tránh điều này nếu có thể.
• Một cách kiểm tra hiệu quả lựa chọn của subgoals: hãy chắc chắn rằng khi
chưa xử lý, kí tự tận cùng bên trái không thể phân rã được thành subgoals.
Hình 15: Ví dụ phân tích kiểu top-down
Phân tích kiểu bottom – up
Phân tích cú pháp bắt đầu từ toàn bộ cấu trúc của x.
• Các quy tắc tính được áp dụng "ngược".
• Không có subgoals: chỉ có kết quả của phân tích
• phân tích cú pháp từ dưới lên là rất hiệu quả, bởi vì số lượng lựa chọn sai có
thể là rất lớn.
• Cách thử nghiệm hiệu quả để lựa chọn các quy tắc: phân tích biểu tượng
không thể phân rã có thể bắt đầu với một số biểu tượng phân rã khác.
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 19
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
• quy tắc sản xuất hình thức A → Aα không phải là một vấn đề.
• Nếu phân tích cú pháp kết thúc trong một kết thúc chết, phân tích trả về cấp
độ thấp hơn và quy tắc sản xuất thay thế được lựa chọn.
Hình 16: Ví dụ về bottom-up
So sánh giữa các phương pháp tiếp cận từ dưới lên và từ trên xuống là khó
khăn. Đối với một số trường hợp phương pháp từ dưới lên là hiệu quả hơn
So sánh các chuỗi kí tự
Cách đơn giản nhất để nhận ra các chuỗi biểu tượng là xây dựng một từ điển,
trong đó bao gồm các chuỗi biểu tượng (tất cả) của một ngôn ngữ. Nhận dạng dựa
trên so sánh của một chuỗi biểu tượng nhất định với mỗi chuỗi trong từ điển. Một
vấn đề của phương pháp này thường là
| L (G) | = ∞
Lựa chọn của biện pháp tự nhiên phụ thuộc vào các đại diện của các mô hình
(biểu tượng) và các tính chất đặc trưng của ứng dụng (ý nghĩa của cơ cấu nội bộ).
Ví dụ.Ký tự viết tay có thể được thể hiện như các chuỗi biểu tượng trong đó
các biểu tượng khác nhau tương ứng với đoạn đường thẳng dài bằng nhau nhưng
góc độ khác nhau (được gọi là chuỗi mã hóa).
Nếu một biểu tượng trong một chuỗi khác từ các biểu tượng tương ứng trong
một chuỗi, một số phần của nhân vật được viết trong một góc độ khác nhau; mất
tích hoặc biểu tượng thêm cho thấy rằng một số phần của nhân vật đã được viết lớn
hơn hoặc nhỏ hơn.
Hãy xem xét so sánh các chuỗi thời gian, mà là một vấn đề thường phải đối
mặt. Nếu có một biện pháp tương tự (chi phí) giữa các điểm duy nhất trong hai
chuỗi thời gian (ví dụ, khoảng cách Euclide),
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 20
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Dynamic Time Warping thuật toán (DTW) có thể được sử dụng.
DTW là thuật toán kết nối các điểm của hai chuỗi thời gian tổng hợp của các
chi phí trên tất cả các cặp điểm càng nhỏ càng tốt.
• Hãy xét r(i), i = 1,. . . , I, và t(j), j = 1,. . . , J thành hai chuỗi thời gian.
Thường I = J.
• Xác định một điểm lưới hai chiều (i, j) tương ứng để kết nối các điểm r (i) và
t (j) của chuỗi thời gian.
• Kết nối các điểm của hai chuỗi thời gian có thể được biểu bằng cách sử dụng
đường dẫn sau đây: (i0, j0), (i1, j1). . . , (if, jf).
Đối với mỗi con đường, có tồn tại một tổng chi phí
trong đó K là số lượng các kết nối (chiều dài của con đường), và d (ik, jk) (d
(ik, jk | ik-1, jk-1)) là chi phí kết nối các điểm r (ik) và t (jk) khi chi phí của các kết
nối trước đó được thực hiện.
Thuật toán DTW được dựa trên các nguyên tắc tối ưu Bellman
Ký hiệu đường đi tối ưu bằng cách
• Đi qua con đường tối ưu thông qua các điểm (i, j) được ký hiệu là
• Theo nguyên tắc tối ưu
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 21
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Với ⊕ biểu thị nối của đường dẫn.
• Như vậy, đường đi tối ưu có thể được tính đệ quy:
(Nếu tổng chi phí là sản phẩm của chi phí, thay thế tổng hợp theo sản phẩm.)
Thuật toán DTW đã được sử dụng rộng rãi trong công nhận bài phát biểu và
viết tay ký tự.
Hình 17: ví dụ của việc tìm kiếm đệ quy cho con đường tối ưu.
Một trong những biện pháp được sử dụng rộng rãi trong việc so sánh trình tự
biểu tượng là chỉnh sửa khoảng cách mà là dựa trên thuật toán DTW.
• Giả sử rằng các mô hình bao gồm các chuỗi biểu tượng.
• Đo lường sự giống nhau giữa hai chuỗi biểu tượng A (i), i = 1,. . . , I, và B (j),
j = 1, . . , sử dụng số lượng tối thiểu của chỉnh sửa operations (thay đổi biểu tượng
C, thêm vào tôi, và gỡ bỏ R) được yêu cầu để làm cho các chuỗi bằng nhau:
Mô tả j tất cả các hoạt động có thể được yêu cầu phải A từ B.
• Xác định hai chiều lưới điện trong thời điểm đó (i, j) tương ứng với biểu
tượng A (i) và B (j).
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 22
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
• Mục tiêu là để tìm đường đi tối ưu từ điểm (0,0) (I, J).
• Các chi phí tại điểm (0,0) là D (0,0) = 0.
• Các điểm (i, j) của con đường có thể được truy cập từ các điểm
(i-1, j), (i-1, j-1), và (i, j-1).
• Các chi phí sau đây có liên quan với các hoạt động sửa:
• Bây giờ đường đi tối ưu đệ quy có thể được giải quyết bằng cách sử dụng DTW
Một số ví dụ về việc sử dụng các khoảng cách chỉnh sửa
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 23
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
KẾT LUẬN
Qua tiểu luận, nhóm chúng tôi cơ bản đã hiểu được nhận dạng là gì, các khái
niệm, vấn đề cơ bản trong nhận dạng, ngôn ngữ hình thức, cấu trúc văn phạm,
phương pháp nhận dạng cấu trúc trong nhận dạng. Trên cơ sở tham khảo giáo
trình, hiểu và nắm được cơ bản vấn đề nhận dạng cấu trúc văn phạm, chúng tôi
cũng có so sánh các phương pháp nhận dạng chữ khác như phương pháp suy luận,
đồ thị, và chuỗi ký tự với phương pháp nhận dạng chữ dựa vào cấu trúc.
Mặc dù đã hết sức cố gắng, nhưng do điều kiện thời gian và khả năng kiến
thức còn nhiều hạn chế nên chắc chắn không thể không tránh khỏi những sai sót và
khiếm khuyết, tiểu luận mới chỉ mang tính chất mở rộng kiến thức về nhận dạng
cấu trúc văn phạm chứ chưa mang tính chất chuyên sâu.
Rất mong nhận được sự góp ý, phê bình, đánh giá của PGS.TS và của các bạn
trong lớp để nhóm chúng tôi rút kinh nghiệm và hoàn thiện tốt hơn, nghiên cứu
chuyên sâu hơn trong thời gian tới.
Chúng tôi xin gửi lời cảm ơn chân thành đến PGS.TS Nguyễn Thị Hoàng Lan
đã giảng dạy kiến thức, cung cấp tài liệu, định hướng và hướng dẫn chúng tôi trong
suốt thời gian qua để nhóm chúng tôi hoàn thành tiểu luận này.
Mọi sự đóng góp và phê bình xin gửi về:
1. Hoàng Văn Hải, Tổng cục An ninh I – Bộ Công an.
Địa chỉ: 44 Yết Kiêu, P.Trần Hưng Đạo, Q.Hoàn Kiếm, TP.Hà Nội
Điện thoại: 0916.286.256
Email:ithoanghai @ gmail.com
2. Nguyễn Văn Dũng.
Địa chỉ:
Điện thoại: 0948.128.086
Email:
3. Trần Đình Phương.
Địa chỉ:
Điện thoại: 0166.657.9501
Email:
Hà Nội, ngày 20 tháng 12 năm 2012
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 24
Tiểu luận môn học: Nhận dạng GVHD: PGS. TS. Nguyễn Thị Hoàng Lan
Thay mặt nhóm
Hoàng Văn Hải
TÀI LIỆU THAM KHẢO
[1] Slide giáo trình giảng dạy môn Nhận dạng, PGS-TS Nguyễn Thị Hoàng Lan,
ĐHBKHN
[2] Pattern recognition: Esa Alhoniemi, Spring 2003
[3] Richard O. Duda, Peter E. Hart, David G. Stork (2001) Pattern classification
(2nd edition), Wiley
[4] Structural and Syntactic Pattern Recognition. Selim Aksoy, Department of
Computer Engineering Bilkent University, 2008
Nhóm 13: Hoàng Văn Hải – Nguyễn Văn Dũng – Trần Đình Phương Trang 25