Tải bản đầy đủ (.ppt) (17 trang)

báo cáo tiểu luận môn nhận dạng tìm hiểu ứng dụng phương pháp nhận dạng cấu trúc văn phạm trong nhận dạng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.19 MB, 17 trang )

ĐẠI HỌC BÁCH KHOA
TÊN ĐỀ TÀI: (ĐỀ 13)
TÊN ĐỀ TÀI: (ĐỀ 13)
Hà Nội, tháng 12 năm 2012
GVHD: PGS.TS. Nguyễn Thị Hoàng Lan
Trình bày: Nhóm 13
Hoàng Văn Hải
Nguyễn Văn Dũng
Trần Đình Phương
Lớp: CH12BMTT
Tìm hiểu ứng dụng phương pháp nhận dạng
cấu trúc văn phạm trong nhận dạng
NỘI DUNG TRÌNH BÀY

TÌM HIỂU ỨNG DỤNG PHƯƠNG PHÁP NHẬN DẠNG
CẤU TRÚC VĂN PHẠM

PHƯƠNG THỨC NHẬN DẠNG ĐỒ THỊ VÀ NHẬN DẠNG
CHUỖI
GIỚI THIỆU

Được sự phân công, nhóm thực hiện đề tài: Tìm hiểu ứng
dụng phương pháp nhận dạng cấu trúc văn phạm trong
nhận dạng (nhận dạng chữ,…) và so sánh chất lượng và
hiệu năng với phương pháp khác để nhận dạng chữ. (Đề
13)

Điều kiện thời gian, khả năng còn nhiều hạn chế, nội dung
tiểu luận là một lĩnh vực tri thức rộng lớn, đa dạng và rất
phức tạp nên không tránh khỏi những sai sót và khiếm
khuyết. Rất mong nhận được sự góp ý, phê bình, đánh giá


để nhóm chúng tôi rút kinh nghiệm và hoàn thiện tốt hơn
trong thời gian tới.

Xin cảm ơn chân thành đến PGS.TS Nguyễn Thị Hoàng Lan
đã giảng dạy kiến thức, cung cấp tài liệu, định hướng và
hướng dẫn chúng tôi.
PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM

1 Phương thức cấu trúc văn phạm

2 Ngôn ngữ hình thức

3 Nhận dạng sử dụng cấu trúc văn phạm

4 Ngôn ngữ mô tả hình ảnh (PDL) sử dụng trong
nhận dạng cấu trúc văn phạm
PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM

Phương thức cấu trúc văn phạm


 !"#!$%

&'()*+,-+$./01
-2+./01)3435,267
/"%

8+292: ;
<
= "# !; 8$ , 2 9 + $ "# ! -/ 2> 

/?@/)2>"*1A2%
<
=2;B-"#12>""*-C2>
)2>+2+1%
<
&>:;B+2C2):$%
<
B' D;   ./ 0 D -C   ./ 01 > 3 4
/> E + '   2  2>   2 
2>"%
PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM

Ngôn ngữ hình thức
Bằng cách áp đặt một số quy tắc hạn chế trên các luật sinh, Noam
Chomsky đề nghị một hệ thống phân loại các văn phạm dựa vào tính chất
các luật sinh. Hệ thống này cho phép xây dựng các bộ nhận dạng hiệu
quả và tương thích với từng loại văn phạm. Ta có 4 loại văn phạm như
sau:

Loại 0: (Văn phạm phi ngữ cảnh hay không hạn chế): Văn phạm
không cần thỏa mãn bất kỳ ràng buộc trên các luật sinh hay quy tắc nào.

Loại 1:(văn phạm cảm ngữ cảnh CSG): Nếu văn phạm G có luật sinh
dạng αIβ → αxβ. Trong đó α,β là một chuỗi bất kỳ chứa biến trung gian
hoặc biểu tượng kết thúc, I là biến trung gian, x là biến trung gian hoặc
biểu tượng kết thúc.

Loại 2: (văn phạm phi ngữ cảnh CFG): Nếu văn phạm G có luật sinh
dạng A α với A là một biến trung gian và α là một chuỗi ký hiệu kết →
thúc hoặc biến trung gian V∈

T
.

Loại 3: (văn phạm chính quy RG): Nếu văn phạm G có luật sinh dạng
tuyến tính: α z→ β hoặc α → βz hoặc α z với → α,β là các biến trung gian
và z là chuỗi ký hiệu kết thúc (có thể là rỗng).
PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM

Nhận dạng sử dụng cấu trúc văn phạm

FDG+,326 cHCI
"%=,3,5JD)3+
?@L(G
i
)%

K,L*.3G#)3M>)+(H
3F)(H3%

K,L*A(I?20 I,3)N
)2>:%KN'N2DG(M
'D6I)O./02?@$
)/I+,"*%

K, L *  A ? 3: 20   I * :  ? M 
(M'D>:@,3%PA34./0D%
PHƯƠNG PHÁP NHẬN DẠNG CẤU TRÚC VĂN PHẠM
Ngôn ngữ mô tả hình ảnh sử dụng nhận dạng cấu trúc văn
phạm
Sử dụng ngôn ngữ mô tả hình ảnh (PDL) để nhận dạng cấu trúc văn

phạm

Ngôn ngữ mô tả hình ảnh (PDL) là một cách thức đầu tiên để mô
tả các mẫu hình ảnh sử dụng ngôn ngữ hình thức.

Các ký hiệu (biểu tượng) kết thúc: {t, b, u, o, s, *, - , +}; + đại
diện cho 2 vector nối đuôi nhau, * đại diện cho 2 vector cùng điểm
bắt đầu, và - đại diện đảo ngược vector. H đại diện cho cuối vector
và T đại diện cho đầu vector.
Phương pháp suy luận

- Là phương pháp học từ các mẫu có sẵn.

- Dữ liệu huấn luyện H có thể bao gồm mẫu tích cực S+ và
mẫu tiêu cực S-, có nghĩa là, H = {S
+
, S
-
}.Mục đích là để
học một ngữ pháp G-
learn
để mẫu trong S
+
thuộc về ngôn ngữ
được xác định bởi ngữ pháp, và các mẫu trong S
-
thì không.

F
5

-Q1
RST

-Q1
)T
P
-Q1
)K
-Q1
)UV
-Q1
W

- Một điểm yếu của phương pháp này là đặc điểm kỹ thuật
của quy tắc chỉnh sửa cho P, V
N
, V
T
là khó khăn.Hơn nữa,
nếu các quy định là không duy nhất, số lượng G
learn
ngữ pháp
có thể phát triển nhanh chóng
Nhận dạng dựa trên đối sánh
cấu trúc xâu chuỗi

Ví dụ. Xem xét văn phạm G = (VN, VT, P, S), trong đó VN = {S, T},




VT = {I, +, *}, I {a, b, c}, và∈

P={S T, T T I, S S+T, T I}.→ → ∗ → →



Một chuỗi biểu tượng x = a * b + c * a + b thuộc ngôn ngữ L (G)



Vì có thể được phân tích cú pháp theo cách sau đây
Phương pháp top-down

• Phân tích cú pháp bắt đầu từ những kí tự gốc.

• S được phân rã thành một phần (subgoals): S X1X2. . . Xn.→

• Nếu X1 là một kí tự có thể phân rã, nó có phải là kí tự đầu tiên trong
chuỗi x được phân tích.

• Nếu X1 là một biểu tượng không thể phân rã, nó cần được đưa vào phần
của x tương ứng với nó.

• Nếu X1 có thể được phân tích thành công thì sẽ đến X2 và tiếp tục

• Nếu một số Xi không thể được phân tích cú pháp, phân tách mới ban
đầu với X1’X2’. . . Xn’ mới

Các subgoals có thể được tiếp tục phân hủy thành subgoals.


• Nếu một số của subgoals không thể đạt được, phân tích cú pháp trả về
với mức độ cao hơn và một phân rã mới được thực hiện.
Phương pháp bottom-up

Các quy tắc tính được áp dụng "ngược".

• Không có subgoals: chỉ có kết quả của phân tích

• phân tích cú pháp từ dưới lên là rất hiệu quả, bởi vì số lượng lựa chọn sai
có thể là rất lớn.

• Cách thử nghiệm hiệu quả để lựa chọn các quy tắc: phân tích biểu tượng
không thể phân rã có thể bắt đầu với một số biểu tượng phân rã khác.

• Nếu phân tích cú pháp kết thúc trong một kết thúc chết, phân tích trả về
cấp độ thấp hơn và quy tắc sản xuất thay thế được lựa chọn
Nhận dạng dựa vào đồ thị

- Một đồ thị có hướng có thể được sử dụng để đại diện cho
phụ thuộc phức tạp hơn giữa các nguyên thủy (biểu tượng)
hơn bằng cách sử dụng các chuỗi biểu tượng một chiều.Như
vậy, so sánh các mẫu đại diện sử dụng đồ thị có thể được
nhìn thấy trong một cảm giác như là một sự tổng quát so
sánh các chuỗi biểu tượng.

- Xem đỉnh N của một đồ thị G = {N, R} (khác nhau) biểu
tượng và R cạnh giữa chúng phản ánh (khác nhau) quan hệ
giữa chúng (được gọi là thuộc tính đồ thị).

- Hai hướng tiếp cận để so sánh giữa các đồ thị:


T5NL73,/(!2>95N
DD

U:X:> >DGE+94
"DG(M+2/%
<
=Y2Z[%
<
\[
<
P/E@[%
<
=Y2Z
<
P/E@

- Những khó khăn trong trường hợp đầu là lựa chọn các
tính năng và số liệu phù hợp, cách tiếp cận thứ hai được
tính toán.

TÀI LIỆU THAM KHẢO:

[1] Slide giáo trình giảng dạy môn Nhận dạng, PGS-TS
Nguyễn Thị Hoàng Lan, ĐHBKHN

[2] Pattern recognition: Esa Alhoniemi, Spring 2003

[3] Richard O. Duda, Peter E. Hart, David G. Stork
(2001) Pattern classification (2nd edition), Wiley


[4] Structural and Syntactic Pattern Recognition. Selim
Aksoy, Department of Computer Engineering Bilkent
University, 2008

×