ĐẠI HỌC HUẾ
ĐẠI HỌC KHOA HỌC
TIỂU LUẬN MÔN HỌC
LÝ THUYẾT NHẬN DẠNG
Đề tài: Nhận dạng đối tượng trên hình ảnh
Giáo viên HD: TS. Nguyễn Đăng Bình
HV thực hiện: Nguyễn Mạnh Cường
Lớp Cao học Khoa học Máy tính 2009-2011
Huế, 08/2010
MỤC LỤC
2
LỜI NÓI ĐẦU
Do những hạn chế về kiến thức môn học, Anh văn, trong tiểu luận “Nhận dạng đối
tượng trên hình ảnh” được tổng hợp từ hai bài báo: Exploring Features in a Bayesian
Framework for Material Recognition; Face Recognition with Learning-based Descriptor
không thể giới thiệu tất cả các kết quả đã nghiên cứu ở trên mà chỉ giới thiệu nội dung cơ
bản sau:
Cấu trúc tiểu luận như sau:
Phần 1: Tóm tắt
Phần 2: Giới thiệu lại vài khái niệm cơ bản cần trong bài báo, các thể hiện tổng thể
tối thiểu của nhận dạng hình ảnh, hoặc các phương pháp nhận dạng mới với kết quả qua
một số thực nghiệm cụ thể.
Phần 3: Trình bày một số kết luận dựa trên các kết quả thực nghiệm.
Tôi xin chân thành cảm ơn TS Nguyễn Đăng Bình đã giảng dạy và hướng dẫn tận
tình khi phụ trách môn học Lý thuyết nhận dạng. Dù đã cố gắng nhưng kiến thức có hạn
tiểu luận không thể tránh khỏi những sai sót, tôi mong nhận được ý kiến đóng góp của
Thầy và các anh chị học viên lớp cao học Khoa học Máy tính khóa 2009 để tôi có thể hoàn
chỉnh tiểu luận này, đồng thời định hướng nghiên cứu tiếp trong tương lai.
Học viên
Nguyễn Mạnh Cường
3
NỘI DUNG
Tóm tắt
Vấn đề nhận dạng hình ảnh con người hay hình ảnh các loại vật liệu, ví dụ: thủy
tinh, kim loại, vải, nhựa hay gỗ, từ một hình ảnh một chiều. Không giống như các nhiệm
vụ nhận dạng ở tầm nhìn máy tính, rất khó để tìm kiếm tốt, các tính năng đáng tin cậy mà
có thể cho biết loại vật chất. Đã có nhiều phương pháp được giới thiệu như chiến lược sử
dụng một bộ giàu thấp và mức trung bình tính năng nghi nhận khía cạnh khác nhau của vật
chất xuất hiện, mô hình Latent Dirichlet Allocation (aLDA) kết hợp các tính năng này theo
khuôn dạng Bayesian và tìm hiểu một sự kết hợp tối ưu các tính năng, phương pháp tiếp
cận của chúng tôi mã hóa các-cấu trúc vi mô của đối tượng theo phương pháp mã hóa mới.
Không giống như trước đây được thiết kế thủ công các phương pháp mã hóa (ví dụ, LBP
hoặc SIFT), chúng tôi sử dụng kỹ thuật học không có giám sát để tìm hiểu một bộ mã hóa
từ các ví dụ huấn luyện, tự động có thể đạt được sự cân bằng rất tốt giữa phân biệt và bất
biến phân biê
̣
t. Sau đó, chúng tôi áp dụng PCA để có được một mô tả đối tượng nhỏ gọn.
Kết quả thử nghiệm cho thấy hệ thống mới thực hiện sự nhận dạng vật chất khá tốt trên
một cơ sở dữ liệu vật liệu mẫu.
1. Giới thiệu
Nhận dạng chất liệu là một khía cạnh quan trọng của nhận dạng. Phải tương tác với
nhiều loại vật liệu cơ bản và liên tục đánh giá sự xuất hiện của chúng trong hình ảnh. Ví
dụ, khi tiếp xúc một hình ảnh hoặc chất lượng vật liệu ảnh hưởng quyết định cuối cùng. Vì
vậy, rất có giá trị để xây dựng một hệ thống nhận dạng hình ảnh có thể suy ra tính chất vật
liệu từ hình ảnh.
Vấn đề nhận dạng các tài liệu từ các bức ảnh đã được giải quyết chủ yếu là trong
bối cảnh dự toán phản xạ. Sự xuất hiện hình ảnh của một bề mặt phụ thuộc vào nhiều yếu
tố - những điều kiện chiếu sáng, cấu trúc hình học của các mẫu bề mặt tại một số quy mô
không gian, và các tính chất phản xạ bề mặt, thường đặc trưng bởi chức năng phân phối
hai hướng phản xạ (BRDF) [24] và các biến thể của nó [9, 16, 26]. Một số kỹ thuật đã
được phát triển mà có thể ước tính các thông số của một mô hình BRDF từ một bộ ảnh,
theo giả định hạn chế của ánh sáng, hình học và các thuộc tính vật chất [10, 11]. Chẳng
hạn, nhận dạng khuôn mặt đã thu hút nhiều nỗ lực nghiên cứu [1, 3, 4, 5, 6, 8, 12, 13, 14,
4
15] do sự tiến bộ của kí hiệu nhận dạng cục bộ [17, 21, 23, 25, 27, 29, 31, 32] và nhu cầu
ngày càng cao của thực tế ứng dụng, chẳng hạn như mặt gắn thẻ vào máy tính để bàn [33]
hay các Internet
1
.
Ở đây, tập trung vào nhận dạng mức cao hình ảnh loại vật liệu: như con người, thủy
tinh, kim loại, vải, nhựa hoặc gỗ. Các tính chất phản xạ của vật liệu thường được tương
quan với thể loại cao cấp của nó (ví dụ như thủy tinh thường là mờ và gỗ thường có màu
nâu), và trong công việc này, sẽ khai thác những đặc tính tương quan. Tuy nhiên, điều
quan trọng là chỉ ra rằng chỉ biết các tính chất phản xạ của một bề mặt không đủ để xác
định loại vật liệu. Ví dụ, một thực tế là một bề mặt mờ là không cho biết nếu nó được làm
bằng nhựa, sáp hoặc thủy tinh.
Hình 1a: Hình ảnh vật liệu cần nhận dạng
5