Tải bản đầy đủ (.pdf) (36 trang)

NHẬN DẠNG CHỮ VIẾT TAY MÔ HÌNH MARKOV ẨN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (838.27 KB, 36 trang )

LOGO

NHẬN DẠNG CHỮ VIẾT TAY MÔ
HÌNH MARKOV ẨN

Học viên : NGUYỄN MINH TRIẾT
Giáo viên hướng dẫn : TS. VŨ ĐỨC LUNG


www.themegallery.com

NỘI DUNG

1

GiỚI THIỆU ĐỀ TÀI

2

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƢNG

3

MÔ HÌNH MARKOV ẨN

4

ỨNG DỤNG MÔ HÌNH MARKOV ẨN NHẬN DẠNG CHỮ VIẾT TAY

5


CHƢƠNG TRÌNH DEMO

COMPANY LOGO


www.themegallery.com

GiỚI THIỆU ĐỀ TÀI
- Các bài toán nhận dạng đang được ứng dụng trong thực tế, hiện

nay tập trung vào nhận dạng mẫu, nhận dạng tiếng nói và nhận
dạng chữ…
-Nhận dạng chữ viết tay là bài toán được quan tâm rất nhiều và
nhận dạng ký tự không dấu đã đạt được nhiều thành công lớn.
-Nhận dạng chữ viết tay tiếng Việt vẫn còn là vấn đề thách thức

lớn đối với các nhà nghiên cứu.
- Bài toàn này chưa thể giải quyết trọn vẹn được vì nó hoàn toàn
phụ thuộc vào người viết và sự biến đổi quá đa dạng trong cách
viết và trạng thái sức khỏe, tinh thần của từng người viết.
COMPANY LOGO


www.themegallery.com

GiỚI THIỆU ĐỀ TÀI
- Hiện nay có một số đề tài nghiên cứu nhận dạng chữ viết tay
tiếng Việt như mạng Nơron, máy Vector hổ trợ…., tuy nhiên kết
quả nhận dạng lại không cao .
Đó là lý do em chọn đề tài này với mong muốn nâng cao

kết quả nhận dạng đặc biệt là tiếng Việt.

Trong đề tài tập trung vào nghiên cứu nhận dạng các ký
tự viết tay tiếng Việt đơn lẽ bằng mô hình Markov ẩn.

COMPANY LOGO


www.themegallery.com

QUI TRÌNH THỰC HIỆN
Qui trình nhận dạng chữ viết tay đƣợc thực hiện
qua các bƣớc nhƣ sau :

COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG

1. Chuyển xám
- Mục đích : Chuyển ảnh màu về ảnh đa cấp xám.
Ví dụ :
Chuyển xám

Trước khi chuyển xám

Sau khi chuyển xám


COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
-Thuật toán trung bình cộng :

Ý tưởng của thuật toán như sau: Tính trung bình cộng
giá trị của 1pixel, sau đó gán lại giá trị trung bình cộng đó cho

RGB.
Ví dụ:Quá trình chuyển xám như sau :
TBC=(145+254+43)/3 = 147
Sau đó gán lại giá trị 147 cho R,G,B. Pixel mới được mô tả
như sau
Như vậy ảnh đã được chuyển về ảnh đa cấp xám
COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
2. Phân ngƣỡng

- Mục đích: Chuyển ảnh đầu vào thành ảnh đen trắng (là ảnh có
các pixel chỉ mang giá trị 0 hoặc 255)

- Thuật toán trung bình cộng:
Sau khi tính được giá trị TBC như phần 1 ta đem so sánh

với ngưỡng .

COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
Ngưỡng là một số nằm trong khoảng từ 0255. Trong
bài này đang đặt ngưỡng là 128
Thuật toán này cụ thể như sau:
 Nếu TBC < 0: Gán giá trị R,G,B = 0
 Nếu TBC > 255: Gán giá trị R,G,B = 255
 Nếu TBC < Ngưỡng: Gán giá trị RGB = 0
 Nếu TBC >= Ngưỡng: Gán giá trị RGB=255

COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
3. Lọc nhiễu

 Áp dụng bộ lọc Median
- Mục đích: Lọc nhiễu đốm, nhiễu muối tiêu sau khi đã phân

ngưỡng ảnh.
-Với những ảnh đầu vào là ảnh scan hoặc ảnh chụp từ điện
thoại hoặc máy ảnh, sau khi phân ngưỡng hay có các điểm đen

lốm đốm nằm rải rác trên toàn bộ vùng ảnh.
- Các điểm này gọi là nhiễu, mục đích của bộ lọc median là
loại bỏ các điểm nhiễu này.
COMPANY LOGO


Med 

n
2

www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
Kỹ thuật lọc trung vị
Giả sử ta có ảnh I, điểm ảnh P, cửa sổ w(p) và ngưỡng
Khi đó lọc trung vị gồm các bước sau :
Bước 1 : Tính trung vị



{I (q) / q  W ( p)} 
 Med ( p)

Bước 2 : Gán giá trị

I ( p) Neu / I ( p)  Med ( p) /  
I kq ( p)  
Med ( p) Neu / I ( p)  Med ( p) /  
COMPANY LOGO



Med2n2

www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
Ví dụ :Cho ảnh I, điểm ảnh W(3x3), ngưỡng   2



I 




1 0 1 4 1 2 

2 4 31 7 4 1 
2 1 4 2 2 7 

7 2 0 4 1 2 

Med 



I kq  





n 4
 2
2 2

1 0 1 4 1 2 

2 4 4 4 4 1 
2 1 4 2 2 2 

4 2 0 4 1 2 

COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
4.Phát hiện biên và tách chữ
Mục đích: Tách riêng phần ảnh chứa ký tự từ ảnh đầu vào, loại
bỏ phần dư thừa.
Ví dụ :1 ảnh đầu vào như sau:

Trước khi phát hiện biên

Sau khi phát hiện biên

COMPANY LOGO





www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
- Để làm được điều này ta phải đi tìm các điểm cận của ký tự bao gồm:
+ Cận trên (Top)
+ Cận dưới (Bottom)
+ Cận trái (Left)
+ Cận phải (Right)

- Vì ảnh sau khi đã qua tiền xử lý là ảnh chỉ bao gồm 2 giá trị :
+ 0: Biểu diễn bởi màu đen
+ 255: Biểu diễn bởi màu trắng
COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
Tìm cận trên (Top)

Ý tưởng: Quét ảnh theo chiều ngang từ trên xuống
dưới. Đến khi nào gặp điểm đen đầu tiên thì dừng lại đó là
điểm cận trên.
Tìm cận dƣới (Bottom)
Ý tưởng: Quét ảnh theo chiều ngang từ dưới lên trên.
Đến khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm
cận dưới.


COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
Tìm cận trái (Left)

Ý tưởng: Quét ảnh theo chiều dọc từ trái sang phải. Đến
khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm cận trái.

Tìm cận phải (Right)
Ý tưởng: Quét ảnh theo chiều dọc từ phải sang trái . Đến
khi nào gặp điểm đen đầu tiên thì dừng lại đó là điểm cận phải.
Sau khi tìm được 4 điểm cận. Ta cắt ảnh theo 4 tọa độ vừa
tìm được thì sẽ thu được vùng chỉ chứa ký tự.

COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
5.Chỉnh nghiên : Áp dụng phương pháp tia quay (project profile)
Ví dụ :

Cách tính góc nghiêng như sau:
- Xoay ảnh trong 1 khoảng từ góc a1a2
- Bước nhảy là 1 góc b

- Ảnh đầu vào từ vị trí 1 xoay đến vị trí 4 và mỗi bước xoay 1
góc là b, sau mỗi lần xoay tính toán lại trọng số của ảnh .
- Tính max của các trọng số.
- Ở bước xoay nào trọng số đạt giá trị max thì đó là góc xoay
cần tính của ảnh
COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
6. Trích chọn đặc trƣng
•Mục đích: Trích ra các đặc trƣng của ảnh để quá trình nhận
dạng chính xác.
- Đồng nhất các ảnh về cùng
kích thước (20*30)
- Chia ảnh thành các vùng mang những
đặc trưng của ảnh đó, ta chia chiều dọc
thành 3 đoạn chiều ngang thành 3 đoạn :
- Sau khi chia ký tự thành các đoạn ta tính lại pixel ảnh .
Mỗi vùng sẽ mang các vector đặc trưng riêng

COMPANY LOGO


www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG
Marketing Diagram
7)Lƣợng tử hóa

- Đọc toàn bộ pixel ảnh của ký tự. Tại những pixel mầu đen giá trị
lượng tử là 1.

- Tại những pixel mầu trắng giá trị lượng tử là 0. Lúc này dữ liệu
ảnh sẽ chỉ còn là 0 và 1.
- Trương trình sẽ tính toán và tiến hành nhận dạng trên giá trị nhị
phân này.

COMPANY LOGO


•Ví dụ kết quả của ảnh sau khi lượng tử

www.themegallery.com

TIỀN XỬ LÝ VÀ TRÍCH CHỌN ĐẶC TRƯNG

Ví dụ :Kết quả của ảnh sau khi lượng tử :

COMPANY LOGO


•Ví dụ kết quả của ảnh sau khi lượng tử

www.themegallery.com

MÔ HÌNH MARKOV ẨN
1. Định nghĩa
Mô hình Markov ẩn (Hidden Markov Model) là mô hình
thống kê trong đó hệ thống được mô hình hóa được cho là quá

trình Markov với các tham số không biết trước và nhiệm vụ là
xác định các tham số ẩn từ các tham số quan sát được dựa trên

sự thừa nhận này. Các tham số của mô hình được rút ra sau đó
có thể sử dụng được để thực hiện các phân tích kế tiếp .

COMPANY LOGO


•Ví dụ kết quả của ảnh sau khi lượng tử

www.themegallery.com

MÔ HÌNH MARKOV Ẩn
Ứng dụng của mô hình Markov ẩn :
Nhận dạng tiếng nói
Nhận dạng chữ viết tay
Xử lý ngôn ngữ thống kê
Dịch máy

Tin sinh học

COMPANY LOGO


www.themegallery.com

MÔ HÌNH MARKOV ẨN
2.Chuổi (Xích )Markov
Về bản chất, mô hình Markov là một phương pháp mô

hình tín hiệu như một chuỗi kết xuất có thể quan sát, được sinh
ra bởi một số tiến trình được gọi là nguồn (source).
Ví dụ :

Mô hình Markov 3 trạng thái
COMPANY LOGO


www.themegallery.com

MÔ HÌNH MARKOV ẨN

- qt là trạng thái đặt đến được thời điểm t
- aij là xác suất chuyển từ trạng thái Si sang trạng thái Sj :
Aij = P[qt+1 = j|qt = i],

a

ij

1

- S là trạng thái của hệ thống ở thời điểm t

COMPANY LOGO


www.themegallery.com

MÔ HÌNH MARKOV ẨN

Ví dụ : Mô hình biểu diễn thời tiết
-Mưa : Trạng thái 1
0.2

-Mây : Trạng thái 2
-Nắng : Trạng thái 3

0.1

0.2

-Ma trận xác suất
-Chuyển trạng thái:

 04 0.3 0.3 
A  0.2 06 0.2 
 0.1 0.1 0.8 

Hỏi : Xắc suất để thời tiết 4 ngày liên tiếp : Nắng, mưa, mây, nắng ?
Trả lời : Dãy quan sát o là (nắng , mưa, mây , nắng).

P(O) = P[3,1,2,3]
= P[3]*P[1,3]*P[2,1]*P[3,2]= 1 *a31 *a12 *a23
COMPANY LOGO


×