Tải bản đầy đủ (.ppt) (10 trang)

Tiểu luận môn cơ sở dữ liệu nâng cao CLUSTERING

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (328.61 KB, 10 trang )

GVHD: PGS-TS Đỗ Phúc
SVTH: Phạm Quang Diệu
MSSV: CH1101077

Trong Hội nghị quốc tế lần thứ 14 về nhận dạng mẫu
(Pattern Recognition), Connell và Jain đã sử dụng
phương pháp gom nhóm (Clustering) để nhận dạng
những từ vị (lexemes) trên văn bản viết tay với mục
đích nhận dạng chữ viết độc lập với người viết.

Hệ thống phụ thuộc người viết
Hệ thống phụ thuộc người viết cho độ chính xác nhận
dạng cao hơn so với
hệ thống độc lập người viết
hệ thống độc lập người viết,
nhưng nó cũng đòi hỏi một lượng lớn dữ liệu training
(training data).

Mặt khác, một
hệ thống độc lập người viết
hệ thống độc lập người viết phải có
khả năng nhận dạng nhiều phong cách viết.

Do sự thay đổi gia tăng của phong cách viết phải được
ghi lại bởi hệ thống, thật sự càng khó hơn để phân biệt
giữa những lớp khác nhau bởi số lượng trùng lặp
trong không gian đặc trưng.

Một giải pháp đối với vấn đề này là chia dữ liệu thành
các lớp.


Mỗi lớp chứa các phong cách viết khác hẳn nhau.
Những lớp này gọi là các
từ vị (lexemes).
từ vị (lexemes).

Trong hệ thống này, chữ viết tay được ghi lại bằng
cách lưu trữ vị trí (x, y) của viết và tình trạng của đầu
bút (lên hay xuống) với tốc độ lấy mẫu cố định.

Sau một số lần lấy mẫu lặp lại và làm trơn, mỗi nét
bút được biểu diễn như một chuỗi có chiều dài thay
đổi của các điểm.

Tính toán khoảng cách giữa hai nét bút, một ma trận
độ gần được xây dựng cho mỗi lớp chữ số (0 → 9).

Mỗi ma trận đo các khoảng cách bên trong lớp đối với
mỗi lớp chữ số cụ thể.

Những chữ số trong một lớp riêng biệt được gom
nhóm với nỗ lực tìm một lượng nhỏ các khuôn mẫu
(prototypes).

Việc gom nhóm được thực hiện dùng các thuật toán
clustering, trong đó vector đặc trưng cho một chữ số
là N độ gần của nó đến các chữ số trong cùng một lớp.

Khi biểu diễn một nhóm các chữ số bằng một khuôn
mẫu, kết quả nhận dạng tốt nhất đạt được bằng cách
dùng chữ số gần với tâm của nhóm đó.


Sử dụng mô hình này, tốc độ nhận dạng chính xác đạt
được là 99,33%.

Chương trình:
Chương trình: Nhận dạng các ký tự số.
Địa chỉ download:
/>e/loadFile.do?objectId=18901&objectType=file

Tính năng bổ sung: Dùng Microsoft speech API để
đọc các chữ số.

Input:
Input: Bộ mẫu các chữ số từ 0 → 9 và ảnh có các chữ
số cần nhận dạng.

Output:
Output: Nhận dạng các chữ số xuất hiện trên ảnh và
đọc chúng.

Ứng dụng:
Ứng dụng: Nếu được nâng cấp thì chương trình này
có thể dùng để đọc sách điện tử cho người mù.

Mẫu các chữ số từ 0 → 9

Ảnh có các chữ số cần nhận dạng

Các số xuất hiện trong ảnh sẽ được đánh dấu bằng các
khung đỏ bao quanh và sau đó sẽ được đọc lên.

×