Tải bản đầy đủ (.pdf) (77 trang)

Nghiên cứu phương pháp nhận dạng chữ viết tay hạn chế bằng mô hình SVM (support vector machines) ( Luận án tiến sĩ)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (631.36 KB, 77 trang )

Đại học Thái Nguyên
tr-ờng đại học công nghệ thông tin và truyền thông

nguyễn quang huy

nghiên cứu ph-ơng pháp nhận dạng chữ viết
tay hạn chế bằng mô hình svm
(support vector machines)

LUN VN THC S KHOA HC MY TNH

Thỏi Nguyờn - 2014

S húa bi Trung tõm Hc liu

/>

Đại học Thái Nguyên
tr-ờng đại học công nghệ thông tin và truyền thông

nguyễn quang huy

nghiên cứu ph-ơng pháp nhận dạng chữ viết
tay hạn chế bằng mô hình svm
(support vector machines)
Chuyên ngành: KHOA HC MY TNH
Mã số: 60 48 01

LUN VN THC S KHOA HC MY TNH
Ng-ời h-ớng dẫn khoa học: PGS-TS. NGễ QUC TO


Thỏi Nguyờn - 2014

S húa bi Trung tõm Hc liu

/>

i

LỜI CÁM ƠN
Để đạt đƣợc những kết quả trong quá trình nghiên cứu luận văn, học viên
xin chân thành cảm ơn thầy PGS. TS Ngô Quốc Tạo luôn tận tình chỉ bảo,
hƣớng dẫn và giúp đỡ em trong suốt quá trình làm luận văn.
Học viên xin cảm ơn các thầy cô giáo trƣờng Đại học Công nghệ thông tin
và Truyền thông đã hƣớng dẫn và tạo điều kiện cho em trong suốt thời gian học
tập tại trƣờng.
Học viên xin chân thành cảm ơn các thầy giáo trong Hội đồng xét duyệt
luận văn tốt nghiệp lớp cao học CK11A năm 2014 - Đợt 1 đã nhận xét và góp ý
để bài luận văn của em đƣợc hoàn thiện hơn.

Số hóa bởi Trung tâm Học liệu

/>

ii

LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Nghiên cứu phương pháp nhận dạng chữ viết
tay hạn chế bằng mô hình SVM (Support Vector Machines)” là do tôi tự nghiên
cứu và hoàn thành dƣới sự hƣớng dẫn của PGS-TS. Ngô Quốc Tạo.
Các kết quả đạt đƣợc trong quá trình nghiên cứu là hoàn toàn trung thực và

khách quan.
Tôi xin chịu trách nhiệm về những lời cam đoan trên.
Thái Nguyên, ngày 05 tháng 05 năm 2014
Ngƣời cam đoan

Học viên Nguyễn Quang Huy

Số hóa bởi Trung tâm Học liệu

/>

iii

DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
Thuật ngữ,

Giải thích

chữ viết tắt
SVM

Support Vector Machine (Máy véc tơ hỗ trợ)

MMH

Maximum Marginal Hyperplane (Siêu phẳng có biên độ lớn nhất)

HMM

Markov Model (Mô hình Markov ẩn)


Kernel

Hàm nhân
Bộ mẫu chữ số viết tay NIST - Viện Công nghệ và Tiêu chuẩn Quốc

MNIST

gia Hoa Kỳ (National Institute of Standard and Technology of the
United States)

NN

Neuron Network (Mạng nơ ron)

OCR

Optical Character Recognition (nhận dạng chữ quang học)

QP

Quadratic Programing (quy hoạch toàn phƣơng)

USPS

United States Postal service

VC

Vapnik – Chervonenkis


Số hóa bởi Trung tâm Học liệu

/>

iv

DANH MỤC CÁC HÌNH
Hình 1.1. Các giai đoạn trong quá trình xử lý và nhận dạng ảnh ...................................... 7
Hình 1.2. Nhị phân hóa ảnh ............................................................................................... 8
Hình 1.3. Nhiễu đốm và nhiễu vệt ..................................................................................... 8
Hình 1.4. Chuẩn hóa kích thƣớc ảnh các ký tự “A” và “P” .............................................. 8
Hình 1.5. (a) Ảnh gốc, (b) Ảnh sau khi đƣợc làm trơn biên ............................................. 9
Hình 1.6. Làm mảnh chữ ................................................................................................... 9
Hình 1.7. Hiệu chỉnh độ nghiêng của văn bản ................................................................ 10
Hình 1.8. Tách dòng chữ dựa trên histogram theo chiều ngang của khối chữ ................ 10
Hình 1.9. Xác định khoảng cách giữa hai kí tự và giữa hai từ dựa trên histogram theo
chiều thẳng đứng của dòng chữ ....................................................................................... 11
Hình 1.10. Mô hình mạng nơron nhân tạo ...................................................................... 17
Hình 1.11. Mô hình mạng MLP 3 lớp ............................................................................. 17
Hình 1.12. Phân lớp bằng mạng nơron ............................................................................ 18
Hình 1.13. a) Các lớp phân tách tuyến tính b)Siêu phẳng tối ƣu và biên lề tƣơng ứng,
các vectơ hỗ trợ................................................................................................................ 19
Hình 1.14. Ánh xạ các điểm dữ liệu không thể phân tách tuyến tính vào không gian số
chiều lớn hơn có thể phân tách đƣợc tuyến tính .............................................................. 20
Hình 1.15. a) One-vs-One b) One-vs-All ........................................................................ 21
Hình 2.1. Với 3 điểm không thẳng hàng trong R2 thì luôn tách đƣợc bởi đƣờng thẳng . 25
Hình 2.2. Phân lớp bằng siêu phẳng ................................................................................ 26
Hình 2.3. Đƣờng phân chia đối với tập dữ liệu gồm hai thuộc tính ................................ 27
Hình 2.4. Một bộ dữ liệu hai chiều đƣợc phân chia tuyến tính. ...................................... 28

Hình 2.5. Hai siêu phẳng phân chia tuyến tính cùng với biên độ của nó. ....................... 29
Hình 2.6. Đƣờng biểu diễn H1 và H2. Đƣờng màu đỏ là khoảng cách Euclidean của
hai điểm 1 và 2, đƣờng màu xanh là khoảng cách Euclidean nhỏ nhất. ......................... 30
Hình 2.7. Các support vector trong SVM ........................................................................ 31
Hình 2.8. Trƣờng hợp trên không gian 2 chiều không thể vẽ một đƣờng thẳng phân
chia 2 lớp ......................................................................................................................... 35
Hình 2.9. Bƣớc 1- Học để xây dựng mô hình phân lớp .................................................. 37
Số hóa bởi Trung tâm Học liệu

/>

v

Hình 2.10. Bƣớc 2 - Kiểm tra và đánh giá ...................................................................... 38
Hình 2.11. Mô hình nhận dạng chữ viết tay rời rạc......................................................... 45
Hình 2.12. Trích chọn đặc trƣng trọng số vùng .............................................................. 45
Hình 2.13. Kiến trúc của hệ nhận dạng chữ viết tay tiếng Việt ...................................... 48
Hình 2.14. Chuẩn hóa ảnh: (a) Ảnh gốc, (b) Xác định các vùng liên thông và đánh thứ
tự các vùng liên thông ..................................................................................................... 49
Hình 2.15. Chuẩn hóa các vùng liên thông ..................................................................... 49
Hình 2.16. Quá trình trích chọn đặc trƣng....................................................................... 51
Hình 3.1. Các bƣớc cơ bản của quá trình nhận dạng văn bản bằng mô hình SVM ........ 55
Hình 3.2. Các mẫu chữ số viết tay trích từ tập các tập dữ liệu USPS và MNIST ........... 59
Hình 3.3. Giao diện chƣơng trình. ................................................................................... 61
Hình 3.4. Hộp thoại tiền xử lý. ........................................................................................ 61
Hình 3.5. Hộp thoại trích chọn đặc trƣng ........................................................................ 62
Hình 3.6. Hộp thoại lƣu file mô hình huấn luyện............................................................ 62
Hình 3.7. Hộp thoại chọn file ảnh cần nhận dạng. .......................................................... 63
Hình 3.8. Hộp thoại thông báo kết quả nhận dạng. ......................................................... 63


Số hóa bởi Trung tâm Học liệu

/>

1

MỞ ĐẦU
Biết sử dụng các phƣơng pháp nhận dạng đóng vai trò hết sức quan trọng
trong xử lý ảnh, phân tích tài liệu văn bản, đặc biệt là đối với các dạng văn bản
viết tay. Hiện nay, nhu cầu cần nhận dạng nội dung văn bản từ các ảnh là rất lớn
và thiết thực. Để nâng cao độ tin cậy của các phƣơng pháp phân tích nhận dạng
đã có những công trình nghiên cứu theo hƣớng ứng dụng lớp bài toán đánh giá
lựa chọn thông tin để lựa chọn những tổ hợp thông tin chất lƣợng cao trƣớc khi
tiến hành phân tích nhận dạng. Cũng từ đó đề xuất những cách tiếp cận mới giải
quyết bài toán nhận dạng trong xử lý số liệu văn bản và thu đƣợc kết quả tốt.
Nhận dạng chữ viết và đặc biệt nhận dạng chữ viết tay là bài toán có
nhiều ứng dụng thực tế. Máy tính xử lý, nhận dạng các biểu mẫu, phiếu điều tra
tự động, bằng cách này ta có thể tiết kiệm đƣợc nhiều chi phí về thời gian, công
sức cũng nhƣ các chi phí khác cho việc nhập dữ liệu.
Ngày nay cùng với sự phát triển về mặt lý thuyết, công nghệ, có rất nhiều
hƣớng đi cho việc giải quyết bài toán nhận dạng chữ viết dựa trên cấu trúc hay
cách tiếp cận khác nhƣ dùng: logic mờ, giải thuật di truyền, mô hình xác suất
thống kê, mô hình Markov ẩn HMM (Hidden Markov Models), mô hình mạng
nơron NN (Neural Network Model), mô hình SVM (Support Vector Machine).
Thuật toán phân lớp là yếu tố có vai trò quyết định đến chất lƣợng của
một hệ thống nhận dạng. Các phƣơng pháp nhận dạng truyền thống nhƣ đối sánh
mẫu, nhận dạng cấu trúc đã đƣợc ứng dụng khá phổ biến trong các hệ thống
nhận dạng và cũng đã thu đƣợc những thành công nhất định. Tuy vậy, với những
trƣờng hợp văn bản đầu vào có chất lƣợng không tốt (nhiễu, đứt nét, dính nét...)
thì các thuật toán này tỏ ra không hiệu quả. Để khắc phục điều này, trong những

năm gần đây nhiều nhóm nghiên cứu đã sử dụng các thuật toán phân lớp dựa
trên mô hình SVM cho các bài toán nhận dạng nói chung và nhận dạng chữ viết
Số hóa bởi Trung tâm Học liệu

/>

2

tay nói riêng. Trong luận văn này, học viên xin trình bày thuật toán SVM đối với
việc nhận dạng chữ viết tay hạn chế.
MỤC LỤC
LỜI CÁM ƠN................................................................................................................... i
LỜI CAM ĐOAN ............................................................................................................ii
DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT ................................................ iii
DANH MỤC CÁC HÌNH .............................................................................................. iv
MỞ ĐẦU ......................................................................................................................... 1
MỤC LỤC ....................................................................................................................... 2
Chƣơng 1. GIỚI THIỆU VỀ CHỮ VIẾT VÀ NHẬN DẠNG CHỮ VIẾT .................... 5
1.1. Trình bày về lịch sử của nhận dạng chữ viết tay ......................................................5
1.2. Giới thiệu các hƣớng tiếp cận trong việc nhận dạng chữ viết tay ............................5
1.2.1. Nhận dạng chữ in................................................................................................... 5
1.2.2. Nhận dạng chữ viết tay .......................................................................................... 6
1.3. Tiền xử lý..................................................................................................................7
1.3.1. Nhị phân hóa ảnh ................................................................................................... 7
1.3.2. Lọc nhiễu ............................................................................................................... 8
1.3.3. Chuẩn hóa kích thƣớc ảnh ..................................................................................... 8
1.3.4. Làm trơn biên chữ ................................................................................................. 9
1.3.5. Làm đầy chữ .......................................................................................................... 9
1.3.6. Làm mảnh chữ ....................................................................................................... 9
1.3.7. Điều chỉnh độ nghiêng của văn bản ...................................................................... 9

1.4. Khối tách chữ..........................................................................................................10
1.4.1. Tách chữ theo chiều nằm ngang và thẳng đứng .................................................. 10
1.4.2. Tách chữ dùng lƣợc đồ sáng................................................................................ 11
1.5. Trích chọn đặc trƣng...............................................................................................11
1.5.1. Biến đổi toàn cục và khai triển chuỗi .................................................................. 12
1.5.2. Đặc trƣng thống kê .............................................................................................. 13
1.5.3. Đặc trƣng hình học và hình thái .......................................................................... 14
Số hóa bởi Trung tâm Học liệu

/>

3

1.6. Huấn luyện và nhận dạng .......................................................................................15
1.7. Hậu xử lý ................................................................................................................15
1.8. Một số thuật toán phân lớp nhận dạng chữ viết tay ...............................................16
1.8.1. Giới thiệu ............................................................................................................. 16
1.8.2. Các mô hình nhận dạng chữ viết tay ................................................................... 16
1.8.3. Đánh giá, so sánh các phƣơng pháp nhận dạng chữ ............................................ 22
Chƣơng 2. MÔ HÌNH SVM VÀ ỨNG DỤNG TRONG NHẬN DẠNG CHỮ ........... 25
2.1. Giới thiệu chung .....................................................................................................25
2.2. Lý thuyết chiều VC (Vapnik Chervonenkis dimension) ........................................26
2.3. Hàm phân lớp .........................................................................................................27
2.4. Siêu phẳng phân cách .............................................................................................28
2.5. Support vector ........................................................................................................30
2.6. SVM với dữ liệu không nhiễu ................................................................................32
2.7. SVM với dữ liệu có nhiễu ......................................................................................34
2.8. Biên độ (Margin) ....................................................................................................34
2.9. Phân lớp dữ liệu tuyến tính và không tuyến tính....................................................35
2.10. Sự cần thiết của SVM nhận dạng chữ viết tay hạn chế ........................................37

2.10.1. Học máy có giám sát ......................................................................................... 37
2.10.2. Phân lớp dữ liệu ................................................................................................. 37
2.10.3. Nhận xét............................................................................................................. 40
2.10.4. Bài toán cho mô hình SVM ............................................................................... 40
2.10.5. Xây dựng mô hình học cho SVM ...................................................................... 43
................................................................46
2.11.1. Tiền xử lý........................................................................................................... 46
2.11.2. Trích chọn đặc trƣng.......................................................................................... 47
2.11.3. Lựa chọn thuật toán huấn luyện phân lớp ......................................................... 47
2.11.4. Thuật toán nhận dạng chữ viết tay rời rạc ......................................................... 47
2.12. Áp dụng SVM vào nhận dạng chữ Việt viết tay rời rạc .......................................49
2.12.1. Tiền xử lý........................................................................................................... 49
Số hóa bởi Trung tâm Học liệu

/>

4

2.12.2. Phân nhóm sơ bộ ............................................................................................... 52
2.12.3. Trích chọn đặc trƣng. ........................................................................................ 52
2.12.4. Xây dựng các máy phân lớp SVM .................................................................... 55
Chƣơng 3 – CHƢƠNG TRÌNH THỬ NGHIỆM .......................................................... 56
3.1. Giới thiệu về hệ nhận dạng dùng LIBSVM............................................................56
3.2. Các chức năng chính của hệ nhận dạng..................................................................57
3.3. Sử dụng libsvm-3.18...............................................................................................57
3.4. Kết quả chạy thử nghiệm trên tập dữ liệu libsvm ..................................................60
3.4.1. Kết quả thực nghiệm đƣợc tiến hành trên tập dữ liệu mnist ............................... 61
3.4.2. Kết quả thực nghiệm đƣợc tiến hành trên tập dữ liệu usps ................................. 62
3.5. Chƣơng trình nhận dạng. ........................................................................................64
3.5.1. Chức năng chƣơng trình ...................................................................................... 64

- Tiền xử lý (Convert Color Image to Black & white): Chuyển đổi ảnh từ ảnh màu
sang ảnh nhị phân và chuẩn hóa kích thƣớc ảnh với kích cỡ 16x16. ............................ 64
3.5.2. Chức năng Tiền xử lý: ......................................................................................... 64
3.5.3. Chức năng trích chọn đặc trƣng .......................................................................... 65
3.5.4. Huấn luyện........................................................................................................... 65
3.5.4. Nhận dạng ............................................................................................................ 66
KẾT LUẬN VÀ ĐỀ NGHỊ ........................................................................................... 68
TÀI LIỆU THAM KHẢO ............................................................................................. 69

Số hóa bởi Trung tâm Học liệu

/>

5

Chƣơng 1. GIỚI THIỆU VỀ CHỮ VIẾT VÀ NHẬN DẠNG CHỮ VIẾT
1.1. Trình bày về lịch sử của nhận dạng chữ viết tay
Ngày nay khoa học công nghệ phát triển mạnh cũng không ngoài mục đích khác
là để đáp ứng nhu cầu ngày càng cao của con ngƣời. Mỗi quốc gia đều phải có ít nhất
một ngôn ngữ, chữ viết để giao tiếp, từ năm 1922 khái niệm nhận dạng chữ đã đƣợc
hình thành cho đến năm 1950, khi máy tính lần đầu tiên đƣợc giới thiệu tính năng mới
về nhập và lƣu trữ dữ liệu hai chiều bằng cây bút viết trên một tấm bảng cảm ứng [4].
Công nghệ mới này cho phép các nhà nghiên cứu làm việc trên các bài toán nhận dạng
chữ viết tay online. Mô hình nhận dạng chữ viết đƣợc đề xuất từ năm 1951 do phát
minh của M.Sheppard đƣợc gọi là GISMO, một robot đọc-viết. Năm 1954, máy nhận
dạng chữ đầu tiên đã đƣợc phát triển bởi J.Rainbow dùng để đọc chữ in hoa nhƣng rất
chậm. Năm 1967, Công ty IBM đã thƣơng mại hóa hệ thống nhận dạng chữ. Từ năm
1980-1990, với sự phát triển của các thiết bị phần cứng máy tính và các thiết bị thu
nhận dữ liệu, các phƣơng pháp luận nhận dạng đƣợc phát triển trong giai đoạn trƣớc đã
có đƣợc môi trƣờng lý tƣởng để triển khai các ứng dụng nhận dạng chữ. Các hƣớng

tiếp cận theo cấu trúc và đối sánh đƣợc áp dụng trong nhiều hệ thống nhận dạng chữ.
Từ 1990 đến nay, các kỹ thuật nhận dạng kết hợp với các phƣơng pháp luận trong lĩnh
vực học máy (Machine Learning) đƣợc áp dụng rất hiệu quả, một số công cụ học máy
hiệu quả nhƣ mạng Nơ ron, mô hình Markov ẩn và SVM (Support Vector
Machines)…
1.2. Giới thiệu các hƣớng tiếp cận trong việc nhận dạng chữ viết tay
1.2.1. Nhận dạng chữ in
Phục vụ cho công việc tự động hóa đọc tài liệu, tăng tốc độ và chất lƣợng nhập
thông tin vào máy tính trực tiếp từ các nguồn tài liệu. Vấn đề này đã đƣợc giải quyết
gần nhƣ trọn vẹn (sản phẩm FineReader 9.0 của hãng ABBYY có thể nhận dạng chữ
in theo 192 ngôn ngữ khác nhau, phần mềm nhận dạng chữ Việt in VnDOCR 4.0 của
Viện Công Nghệ Thông tin Hà Nội có thể nhận dạng đƣợc các tài liệu chứa hình ảnh,
bảng và văn bản với độ chính xác trên 98%).

Số hóa bởi Trung tâm Học liệu

/>

Luận án đầy đủ ở file: Luận án Full















×