Tải bản đầy đủ (.pdf) (13 trang)

Gán nhãn đối tượng dựa vào kỹ thuật nhận dạng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (380.42 KB, 13 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN

NGUYỄN VŨ QUANG

GÁN NHÃN ĐỐI TƯỢNG DỰA VÀO KỸ THUẬT
NHẬN DẠNG

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội – 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN CÔNG NGHỆ THÔNG TIN

NGUYỄN VŨ QUANG

GÁN NHÃN ĐỐI TƯỢNG DỰA VÀO KỸ THUẬT
NHẬN DẠNG

Ngành

: Công nghệ thông tin

Chuyên ngành

: Quản lý Hệ thống thông tin

Mã số


: Chuyên ngành đào tạo thí điểm

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS.TS. Đỗ Năng Toàn

Hà Nội - 2015


MỤC LỤC
LỜI CAM ĐOAN
MỤC LỤC
CÁC CHỮ VIẾT TẮT
DANH MỤC HÌNH VẼ
MỞ ĐẦU ....................................................................................................................0
CHƯƠNG 1: KHÁI QUÁT VỀ GÁN NHÃN VÀ BÀI TOÁN NHẬN DẠNG
ĐỐI TƯỢNG .............................................................................................................3
1.1. Khái quát về gán nhãn ..................................................................................3
1.1.1. Xử lý ảnh ...................................................................................................3
1.1.2. Gán nhãn trong xử lý ảnh ........................ Error! Bookmark not defined.
1.2. Bài toán nhận dạng đối tượng ..................... Error! Bookmark not defined.
1.2.1. Giới thiệu ................................................. Error! Bookmark not defined.
1.2.2. Các cách tiếp cận ..................................... Error! Bookmark not defined.
1.2.3. Một số hệ thống nhận dạng đối tượng hiện nay .... Error! Bookmark not
defined.
1.2.4. Quy trình hoạt động của một hệ thống nhận dạng đối tượng .......... Error!
Bookmark not defined.
CHƯƠNG 2: NHẬN DẠNG ĐỐI TƯỢNG SỬ DỤNG MẠNG NƠRON Error!
Bookmark not defined.


2.1. Kiến trúc một hệ thống nhận dạng đối tượng sử dụng mạng nơron nhân tạo
.................................................................................Error! Bookmark not defined.
2.1.1. Khái niệm mạng nơron nhân tạo.............. Error! Bookmark not defined.
2.1.2. Lịch sử phát triển của mạng nơron .......... Error! Bookmark not defined.
2.1.3. Mơ hình nơron ......................................... Error! Bookmark not defined.
2.1.4. Một số kiến trúc mạng nơron dùng nhận dạng đối tượng ............... Error!
Bookmark not defined.
2.1.5. Ứng dụng của mạng nơron nhân tạo ....... Error! Bookmark not defined.

2.2. Thiết kế mạng nơron nhân tạo ......................Error! Bookmark not defined.
2.2.1. Các bước thiết kế ..................................... Error! Bookmark not defined.


1

2.2.2. Chi tiết các bước thiết kế một mạng nơron............ Error! Bookmark not
defined.

2.3. Huấn luyện mạng ...........................................Error! Bookmark not defined.
2.3.1. Các phương pháp học .............................. Error! Bookmark not defined.
2.3.2. Học có giám sát trong các mạng nơron ... Error! Bookmark not defined.
2.3.3. Thuật toán lan truyền ngược Back-Propagation .... Error! Bookmark not
defined.


2.4. Nhận dạng sử dụng mạng nơron ..................Error! Bookmark not defined.
2.4.1. Khả năng sử dụng mạng nơron trong nhận dạng ... Error! Bookmark not
defined.
2.4.2. Mơ hình nhận dạng hệ thống sử dụng mạng nơron ..... Error! Bookmark
not defined.

2.4.3. Nhận dạng hệ thống sử dụng mạng nơron ............. Error! Bookmark not
defined.
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM............. Error! Bookmark not
defined.

3.1. Giới thiệu ........................................................Error! Bookmark not defined.
3.2. Các bước giải quyết bài toán.........................Error! Bookmark not defined.
3.2.1. Xây dựng mạng nơron ............................. Error! Bookmark not defined.
3.2.2. Xử lý dữ liệu ............................................ Error! Bookmark not defined.
3.2.3. Huấn luyện mạng ..................................... Error! Bookmark not defined.
3.2.4. Nhận dạng ảnh ......................................... Error! Bookmark not defined.
3.2.5. Lựa chọn công cụ ..................................... Error! Bookmark not defined.

3.3. Một số kết quả thử nghiê ̣m và đánh giá hệ thống nhận dạng ký.....
tự Error!
Bookmark not defined.
3.5.1. Thử nghiệm hệ thống nhận dạng ký tự .... Error! Bookmark not defined.
3.5.2. Ưu điểm và hạn chế ................................. Error! Bookmark not defined.
3.5.3. Hướng phát triển trong tương lai ............. Error! Bookmark not defined.
DANH MỤC TÀI LIỆU THAM KHẢO .................................................................7

MỞ ĐẦU
Cùng với sự phát triển ngày càng mạnh mẽ của khoa học kĩ thuật trong một
vài thập kỷ gần đây, xử lý ảnh tuy là một ngành khoa học còn tương đối mới mẻ so
với nhiều ngành khoa học khác nhưng hiện nay nó đang là một trong những lĩnh
vực phát triển rất nhanh và thu hút sự quan tâm đặc biệt từ các nhà khoa học, thúc
đẩy các trung tâm nghiên cứu, ứng dụng về lĩnh vực hấp dẫn này.
Nhận dạng và gán nhãn cho hình ảnh đóng vai trị quan trọng trong nhiều
ứng dụng thực tế về khoa học kĩ thuật cũng như trong cuộc sống thường ngày như:



1

sản xuất và kiểm tra chất lượng, sự di chuyển của Robot, các phương tiện đi lại tự
trị, công cụ hướng dẫn cho người mù, an ninh và giám sát, nhận dạng đối tượng,
nhận dạng mặt, các ứng dụng trong y học, sản xuất, hiệu chỉnh video,…
Một trong những ứng dụng quan trọng, là việc nhận dạng và gán nhãn cho
các loại hình ảnh …. Tự động nhận dạng ảnh và đặt vị trí nhãn là một lĩnh vực trong
trực quan hóa thơng tin. Nhãn là các đoạn văn bản nhằm truyền đạt thông tin, làm rõ
ý nghĩa của các cấu trúc phức tạp được biểu diễn ở dạng đồ họa.
Bài toán nhận dạng và gán nhãn đã được đề cập, nghiên cứu nhiều trên thế
giới. Tại Việt Nam bài toán này cũng đang rất được chú trọng và được ứng dụng
trong rất nhiều lĩnh vực. Vì vậy, đề tài này được xây dựng với các mục đích: Tìm
hiểu về bài tốn nhận dạng hình ảnh và gán nhãn, ứng dụng của nó trong các lĩnh
vực; Tìm hiểu một số vấn đề, các thuật toán liên quan; Đặt nền tảng cho cá nhân
nghiên cứu, tìm hiểu sâu hơn về vấn đề này. Từ đó thiết kế một chương trình thử
nghiệm nhận dạng và gán nhãn cho một ảnh cụ thể.
Luận văn bao gồm 3 chương, nội dung các chương như sau:
Chương 1: Khái quát về gán nhãn và bài toán nhận dạng đối tượng
Chương này khái quát lại cơ bản những kiến thức về bài toán gán nhãn gồm
xử lý ảnh và gán nhãn trong xử lý ảnh. Đồng thời nói về bài tốn nhận dạng đối
tượng, vai trị và tầm quan trọng của bài toán nhận dạng đối tượng, các phương
pháp nhận dạng đối tượng cũng như một số hệ thống nhận dạng đối tượng nổi tiếng
trên thế giới
Chương 2: Một số vấn đề trong nhận dạng đối tượng sử dụng mạng nơron
Chương 2 đề cập đến một số vấn đề trong nhận dạng đối tượng sử dụng
mạng nơron. Mô tả kiến trúc của một hệ thống nhận dạng đối tượng sử dụng mạng
nơron nhân tạo và cách thiết kế, huấn luyện mạng nơron nhân tạo cho việc nhận
dạng.
Chương 3: Chương trình thử nghiệm



2

Chương này áp dụng các kiến thức nghiên cứu trong chương 1 và chương 2,
sử dụng mạng nơron nhiều lớp lan truyền ngược và kỹ thuật gán nhãn để xây dựng
một chương trình nhận dạng ký tự.


3

CHƯƠNG 1: KHÁI QUÁT VỀ GÁN NHÃN VÀ BÀI TOÁN
NHẬN DẠNG ĐỐI TƯỢNG
Chương này khái quát lại cơ bản những kiến thức về bài toán gán nhãn gồm
xử lý ảnh và gán nhãn trong xử lý ảnh. Đồng thời nói về bài tốn nhận dạng đối
tượng, vai trị và tầm quan trọng của bài toán nhận dạng đối tượng, các phương
pháp nhận dạng đối tượng cũng như một số hệ thống nhận dạng đối tượng nổi tiếng
trên thế giới.

1.1. Khái qt về gán nhãn
1.1.1. Xử lý ảnh
Hình ảnh tĩnh có thể được biểu diễn bởi hàm hai chiều f(x,y), trong đó, x và
y là tọa độ khơng gian phẳng (2 chiều). Khi xét ảnh "đen-trắng", giá trị hàm f tại
một điểm được xác định bởi tọa độ (x,y) được gọi là độ chói (mức xám) của ảnh tại
điểm này. Nếu x,y,và f là một số hiện hữu các giá trị rời rạc, chúng ta có ảnh số.
Xử lý ảnh số là q trình biến đổi ảnh số trên máy tính (PC). Như vậy, ảnh số được
tạo ra bởi một số hữu hạn các điểm ảnh, mỗi điểm ảnh nằm tại một vị trí nhất định
và có 1 giá trị nhất định. Một điểm ảnh trong một ảnh còn được gọi là một pixel.
Thị giác có vai trị rất quan trọng với con người trong việc nhận biết thế giới
xung quanh. Chúng ta nhìn khơng chỉ để xác định và phân loại các vật thể, mà cịn

để tìm ra sự khác biệt và để có được một cảm nhận tổng thể, sơ bộ, cho một khung
cảnh. Thị giác con người rất chính xác: ta có thể nhận biết một khn mặt trong một
vài giây, ta có thể phân biệt màu sắc, có thể xử lý một lượng lớn thơng tin hình ảnh
rất nhanh. Cùng với ngôn ngữ, các thông tin dưới dạng hình ảnh đóng một vai trị
rất quan trọng trong việc trao đổi thơng tin. Chính vì vậy những năm gần đây đã có
sự kết hợp rất chặt chẽ giữa ảnh và đồ họa trong lĩnh vực xử lý thông tin. Trong
công nghệ thông tin, xử lý ảnh chiếm một vị trí rất quan trọng, bởi các ứng dụng đa
dạng và phong phú của nó trong nhiều lĩnh vực khoa học. Lĩnh vực xử lý ảnh luôn
thu hút được sự quan tâm của nhiều nhà khoa học bởi khả năng ứng dụng và lợi ích
to lớn của nó trong nhiều lĩnh vực của xã hội như quốc phịng, giải trí, y học, viễn


4

thám và giao thông. Như chúng ta biết, thông tin hình ảnh đóng vai trị rất quan
trọng trong trao đổi thông tin, bởi phần lớn thông tin mà con người thu được thông
qua thị giác. Do vậy, vấn đề nhận dạng trong xử lý ảnh, đặc biệt là so khớp, phân
loại, nhận dạng đối tượng ảnh chuyển động đang được quan tâm của nhiều nhà
nghiên cứu bởi tính khoa học và ứng dụng đa dạng. Đồng thời, với sự phát triển
không ngừng của khoa học và tốc độ xử lý của máy tính thì ứng dụng lĩnh vực thị
giác máy tính và xử lý ảnh đang ngày càng được phát triển và nghiên cứu mạnh mẽ.
Xử lý ảnh là một phần của lĩnh vực xử lý tín hiệu số. Tăng cường chất lượng
thơng tin hình ảnh đối với q trình tri giác của con người và biễu diễn trên máy
tính. Xử lý ảnh số bao gồm các phương pháp và kỹ thuật để biến đổi, để truyền tải
hoặc mã hóa các ảnh tự nhiên.
Xử lý ảnh liên quan đến việc thay đổi hình ảnh để đạt được một trong hai
mục đích:
Thứ nhất: biến đổi ảnh và làm đẹp ảnh.
Thứ hai: tự động phân tích nhận dạng ảnh hay đốn nhận ảnh và đánh giá
các nội dung của ảnh.

Lý do phải xử lý ảnh:
Ảnh có thể bị lỗi trong q trình thu ảnh, truyền dẫn và hiển thị (hồi phục,
nâng cao chất lượng ảnh, nội suy)
Ảnh có thể mang các nội dung nhạy cảm (vd, chống lại copy không hợp
pháp, giả mạo và lừa đảo)
Tạo các bức ảnh có hiệu ứng nghệ thuật
Có thể tạm phân biệt các hệ thống xử lý ảnh theo mức độ phức tạp của
thuật toán xử lý như sau:
Xử lý ảnh mức thấp: là các quá trình biến đổi đơn giản như thực hiện các bộ
lọc nhằm khử nhiễu trong ảnh, tăng cường độ tương phản hay độ nét của ảnh. Trong
trường hợp này, tín hiệu đưa vào hệ thống xử lý và tín hiệu đầu ra là ảnh quang học.


5

Xử lý ảnh mức trung: quá trình xử lý phức tạp hơn, thường được sử dụng để
phân lớp, phân đọan ảnh, xác định và dự đóan biên ảnh, nén anh để lưu trữ hoặc
truyền phát. Đặc điểm của các hệ thống xử lý ảnh mức trung là tín hiệu đầu vào là
hình ảnh, cịn tín hiệu đầu ra là các thành phần được tách ra từ hình ảnh gốc, hoặc
luồng dữ liệu nhận được sau khi nén ảnh.
Xử lý ảnh mức cao: là q trình phân tích và nhận dạng hình ảnh. Đây cũng
là quá trình xử lý được thực hiện trong hệ thống thì giác của con người
Các giai đoạn xử lý ảnh

Hình 1.1. Các giai đoạn xử lý ảnh

Thu nhận ảnh:
Ảnh được thu nhận từ thế giới thực qu a máy chụp hình,từ tranh ảnh qua máy
quét hoặc từ vệ tinh thông qua bộ cảm biến số hoặc tương tự. Nhìn chung các hệ
thống thu nhận ảnh thực hiện 1 quá trình Cảm biến: biến đổi năng lượng quang học

thành năng lượng điện (giai đoạn lấy đối tượng). Tổng hợp năng lượng điện thành
ảnh (giai đoạn lượng tử hóa).
Số hóa ảnh:
Số hóa các ảnh thu nhận được để lưu trữ vào máy tính. Biến đổi ảnh tương tự
thành ảnh rời rạc để xử lý bằng máy tính: Thơng qua q trình lấy đối tượng (rời rạc
về mặt khơng gian) và lượng tử hóa (rời rạc về mặt biên độ).


6

Xử lý số:
Là một tiến trình gồm nhiều cơng đoạn nhỏ: Tăng cường ảnh (Enhancement),
khôi phục ảnh (Restoration), phát hiện biên (Egde Detection), phân vùng ảnh
(Segmentation), trích chọn các đặc tính (Feature Extraction)...
+ Tăng cường ảnh (Image Enhancement): Làm nổi bật các đặc trưng đã chọn
để nâng cao chất lượng hình ảnh . Các kỹ thuật được chọn : lọc độ tương phản , khử
nhiễu, nổi màu, nổi biên, giãn độ tương phản.
+ Khôi phục ảnh (Image Restoration): Loại bỏ hay tối thiểu hóa các ảnh
hưởng của mơi trường bên ngoài hay hệ thống thu nhận ảnh gây ra

. Kế t quả thu

được là ảnh gần giống với ảnh gốc.
Do những nguyên nhân khác nhau: có thể do thiết bị thu nhận ảnh, do nguồn
sáng hay do nhiễu, ảnh có thể bị suy biến nên cần tăng cường và khôi phục ảnh để
làm nổi bật một số đặc tính chính của ảnh, hay làm cho ảnh gần giống với trạng thái
gốc (trạng thái trước khi ảnh bị biến dạng)
+ Phân vùng ảnh (Segmentation): Phân chia một ảnh thành các bộ phận cấu
thành, hoặc xác định một số thành phần trong ảnh như tìm đường thẳng, hình trịn,
hoặc hình dạng khác biệt trong ảnh.

+ Phương pháp phát hiện đường biên trực tiếp dựa trên các phân tích về sự
thay đổi độ chói của ảnh. Kỹ thuật chủ yếu dùng để phát hiện biên là dùng đạo hàm.
Khi lấy đạo hàm bậc nhất của ảnh ta có phương pháp gradient, khi lấy đạo hàm bậc
hai ta có kỹ thuật Laplace.
- Hệ quyết định
Tùy mục đích của ứng dụng mà chuyển sang giai đoạn khác là hiển thị, nhận
dạng, phân lớp, truyền thông…
+ Nhận dạng ảnh : Là quá trình phâ n loại đối tượng được biễu diễn theo một
mơ hình nào đó và gán chúng vào một lớp dựa theo những quy luật và các đối tượng
chuẩn.Nhận dạng áp dụng trong việc bảo mật, an ninh, nhận dạng chữ viế t , ...Các


7

DANH MỤC TÀI LIỆU THAM KHẢO
Tiếng việt
[1] Đỗ Năng Toàn (2010), Giáo trình xử lý ảnh, Học viện Công nghệ Bưu
chính Viễn thơng.

Tiếng Anh
[2] D. Heckenberg, B. C. Lovell (2000), “A Gesture Driven Computer
Interface”, Proceeding of Visual Communications and Image Processing, SPIE,
4067, 261-268.
[3] Journal on Graphics (2006), Vision and Image Processing, 6.
[4] J. Mathews (2002), “An Introduction to Edge Detection: The Sobel Edge
Detector”.
[5] Peter l. Rockett (2005), “An Improved Rotation-Invarient Thinning
Algorithm”, IEEE transaction on Pattern, Analysis and Machine Intelligence,
27, 10.
[6] Te-Hsiu Sun, Fang-Chih Tien (2008), Using Backpropagation Neural

Network for Face Recognition with 2D+ 3D Hybrid Information, Elsevier: Expert
System with Applications, 35,361-372.
[7] N.

Sakai, S. Yonekawa and A. Matsuzaki, Two-dimensional image

analysis of the shape of rice and its applications to separating varieties”, Journal of
Food Engineering, vol 27, 1996, pp. 397-407.
[8] A. J. M. Timmermans, and A. A. Hulzebosch, Computer vison system for
on-line sorting of pot plants using an artificial neural network classifier, Computers
and Electronics in Agriculture, vol. 15, 1996, pp. 41-55.
[9] S. Abbasi, F. Mokhtarian, and J. Kittler, Reliable classification of
chrysanthemum leaves through curvature scale space, Lecture Notes in Computer
Science, vol. 1252, 1997, pp. 284-295.


8

[10]

J. Camarero, S. Siso, and E.G-Pelegrin, Fractal dimension does not

adequately describe the complexity of leaf margin in seedlings of Quercus
species, Anales del Jardín Botánico de Madrid, vol. 60, no. 1, 2003, pp. 63-71.
[11]

C-L Lee, and S-Y Chen, Classification of leaf images, 16th IPPR

Conference on Computer Vision, Graphics and Image Processing (CVGIP),
2003, pp. 355-362.

[12]

S. G. Wu, F. S. Bao, E. Y. Xu, Y-X Wang, Y-F Chang, and Q-L

Xiang, A leaf recognition algorithm for plant classification using probabilistic
neural

network, The Computing Research Repository (CoRR),

vol.1, 2007,

pp. 11-16.
[13]

J. Pan and Y. He, Recognition of plants by leaves digital image

and neural network, International Conference on Computer Science and
Software Engineering, vol 4, 2008, pp. 906 – 910.

Các trang web tham khảo
[14]

/>
l#A%20simple%20neuron
[15]

/>
[16]

/>



×