DSpace at VNU: Nghiên cứu ứng dụng mạng Nơron trong nhận dạng chữ Hán-Nôm

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (237.48 KB, 3 trang )

Nghiên cứu ứng dụng mạng Nơron trong nhận
dạng chữ Hán-Nôm
Trương Thị Hương
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Kỹ thuật phần mềm; Mã số: 60 48 01 03
Người hướng dẫn: PGS.TS. Nguyễn Ngọc Bình
Năm bảo vệ: 2014
Keywords. Mạng nơron; Nhận dạng ký tự; Chữ Hán Nôm; Công nghệ thông tin
Content
Chữ Nôm được hình thành và phát triển từ thế kỷ X tới thế kỷ XX. Là một di sản văn
hóa, có vai trò đặc biệt quan trọng trong việc tạo nên một nền văn học rực rỡ xuyên suốt nhiều
thế kỷ. Viện Nghiên cứu Hán Nôm Việt Nam hiện đang lưu giữ hàng trăm ngàn đơn vị tư liệu
chữ Nôm rất có giá trị trong việc nghiên cứu đời sống của người Việt thời xa xưa ở nhiều mảng
lĩnh vực: văn học, tư tưởng, triết học, ngôn ngữ, luật pháp, đạo đức… Tuy nhiên số người có thể
đọc và viết chữ Nôm ở nước ta hiện nay còn không nhiều, do đó việc đưa chữ Nôm vào máy
tính, xây dựng từ điển chữ Nôm, nhận dạng, đoán nhận và khôi phục chữ Nôm lỗi, thiếu là lĩnh
vực nghiên cứu có ý nghĩa thực tiễn quan trọng.
Mạng nơ-ron là một trong những công cụ nhận dạng tốt nhất vì các đặc trưng sau: Khả
năng học từ kinh nghiệm (khả năng được huấn luyện), khả năng xử lý song song với tốc độ xử lý
nhanh, khả năng học thích nghi, khả năng khái quát hoá cho các đầu vào không được huấn luyện,
ví dụ dựa vào cách học mạng có thể sẽ tiên đoán đầu ra từ đầu vào không biết trước [15, 16].
Tuy nhiên một nhược điểm khi dùng mạng nơ-ron là chưa có phương pháp luận chung
khi thiết kế cấu trúc mạng cho các bài toán nhận dạng và điều khiển mà phải cần tới kiến thức
của chuyên gia. Mặt khác khi xấp xỉ mạng nơ-ron với một hệ phi tuyến sẽ khó khăn khi luyện
mạng vì có thể không tìm được điểm tối ưu toàn cục... Vì vậy tồn tại lớn nhất gặp phải là tìm
nghiệm tối ưu toàn cục, đặc biệt áp dụng cho các bài toán lớn, các hệ thống điều khiển quá trình.
Trong luận văn tôi trình bày hoàn chỉnh một phương pháp ứng dụng mạng nơ-ron
trong nhận dạng chữ Hán-Nôm với mong muốn đưa ra một phương pháp nhận dạng tốt,
góp phần xây dựng một công cụ có thể nhận dạng, chuyển đổi các văn bản chữ HánNôm thành chữ Quốc ngữ nhằm làm sáng tỏ những giá trị văn hóa lưu trữ trong nó. Cấu
trúc luận văn gồm các phần như sau:
Chương 1. Tổng quan: Nội dung chương 1 trình bày tổng quan về chữ Nôm, lịch

sử hình thành và phát triển chữ Nôm, mô hình tổng quan của hệ thống nhận dạng chữ
Nôm.
Chương 2. Mạng Nơ-ron: Nội dung chương này trình bày tổng quan về mạng Nơron, cách xây dựng mạng, đánh giá các yếu tố trong quá trình huấn luyện mạng và tổng
hợp một số phương pháp nhận dạng chữ tượng hình dựa trên mạng Nơ-ron.

Chương 3. Giải thuật di truyền: Chương này giới thiệu về giải thuật di truyền, các
thành phần của giải thuật di truyền.
Chương 4. Nhận dạng chữ Hán-Nôm dựa trên mạng nơ-ron kết hơn GA:
Chương này đề xuất một phương pháp kết hợp giải thuật di truyền trong quá trình huấn
luyện mạng Nơ-ron nhằm tìm ra bộ trong số tối ưu cho mạng. Trình bày kết quả thực
nghiệm nhận dạng 2970 chữ Hán-Nôm.
Phần kết luận: Phần này trình bày những đóng góp của luận văn, những tồn tại,
hạn chế chưa được giải quyết và hướng giải quyết tiếp theo.

References
Tiếng Việt
[1] Nguyễn Tuấn Cường, “Thời điểm xuất hiện chữ Nôm và sơ đồ cấu trúc chữ Nôm”,
2009.
[2] Phạm Văn Hưởng, Trần Minh Tuấn, Nguyễn Thị Ngọc Hương, Bùi Thị Hồng Hạnh, Lê
Hồng Trang, Vũ Thanh Nhân, Trương Anh Hoàng, Vũ Quang Dũng, Nguyễn Ngọc Bình
(2008), “Một số phương pháp nhận dạng chữ Nôm”, Hội thảo Khoa học Quốc gia Lần thứ
IV về CNTT-TT (ICT.rda’2008), Hà Nội.
[3] GS.TSKH. Nguyễn Quang Hồng, Khái lược văn tự học chữ Nôm , Nhà xuất bản giáo dục ,
2008.
Tiếng Anh
[4] Mingrui Wu, Bo Zhang, Ling Zhang, “A Neural Network Based Classifier for Handwritten
Chinese Character Recognition”, ICPR'00 - Volume 2, 2000.
[5] Il-SeokOh, Ching Y. Suen, “A class-modular feedforward neural network for handwriting
recognition”, Pattern Recognition 35 (2002) 229-244

[6] Srinivasa Kumar Devireddy, Settipalliappa Rao(2009), “Hand written character recognition
using back propagation network”, Journal of Theoretical and Applied Information
Technology.
[7] Richard Romero, Robert Berger, Robert Thibadeau, and Dave Touretsky, “Neural Network
Classifiers for Optical Chinese Character Recognition”.
[8] Richard Romero, David Touretzky, and Robert Thibadeau, “Optical Chinese Character
Recognition using Probabilistic Neural Networks”.
[9] D.E. Rumelhart; G.E. Hinton and R.J. Williams (1986), “Learning internal representations
by error propagation”, Parallel distributed processing: Explorations in the microstructure of
cognition (Cambridge MA.: MIT Press), 318-362.
[10] Tadashi Horiuchi, Satoru Kato, “a study on japanese historical character recognition using
modular neural networks”, International Journal of InnovativeComputing, Information and
Control, Volume 7, Number 8, August 2011
[11] Geva, Shlomo, and Joaquin Sitte: “Adaptive Nearest Neighbor Pattern Classiﬁcation, IEEE
Transactions on Neural Networks”, 1991, Vol.2, No. 2.
[12] H.-H. Song, S.-W.Lee, “A self-organizing neural tree forlarge-set pattern classication”,
IEEE Trans. Neural Net-works 9 (3) (1998) 369}380.
[13] H.-M. Lee, C.-C.Lin, J.-M.Chen, “A preclassi"cationmethod for handwritten Chinese
character recognition viafuzzy rules and SEART neural net”, Int. J. Pattern Recogni-tion
Artif.Intell.12 (6) (1998) 743}761.
[14] Juan Diego Rodrıguez, Aritz Perez, Jose Antonio Lozano, Member, IEEE,
“Sensitivity Analysis of k-Fold Cross Validation in Prediction Error Estimation”,

IEEE Transactions on pattern analysis and machine intelligence, Vol. 32, No. 3,
March 2010.
[15] Jeffrey T. Spooner, Mangredi Maggiore, Raúl Ordónez, Kelvin M. Passino (2002),
“Stable Adaptive Control and Estimation for Nonlinear Systems: Neural and Fuzzy
Approximator Techniques”, Wiley Interscience, USA.].
[16] Jyh-Shing Roger Jang, Chuen-Tsai Sun, Eiji Mizutani (1996), “Neuro-Fuzzy and Soft

Computing: A Computational Approach to Learning and Machine Intelligence”,
Prentice Hall, USA.].
[17] L.F.A. Wessels, E. Barnard, “Avoiding false local minima by proper initialization of
connections”, IEEE Trans. Neural Networks 3 (1992) 899-905.
[18] R.Ashok Kumar Reddy, G. Venkata Narasimhulu, Dr. S. A. K. Jilani, Dr D.Seshappa,
“Genetic Algorithm based Gait Recognition”, International Journal of Electronics and
Computer Science Engineering ISSN- 2277-1956.
[19] David J. Montana, Lawrence Davis “Training feedforward neural networks using genetic
algorithms” IJCAI'89 Proceedings of the 11th international joint conference on Artificial
intelligence - Volume 1.
[20] Yas Abbas Alsultanny, Musbah M. Aqel, “Pattern recognition using multilayer neuralgenetic algorithm”, Neurocomputing 51 (2003) 237 – 247.

DSpace at VNU: Nghiên cứu ứng dụng mạng Nơron trong nhận dạng chữ Hán-Nôm

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về