BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
_________________
NGUYỄN PHÁT LỘC
NGHIÊN CỨU CÁC ĐẶC TRƯNG
VỀ HÌNH THÁI VÀ MÀU SẮC TRONG
TRUY VẤN ẢNH
LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
ĐỒNG NAI - 2012
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC LẠC HỒNG
____________________
NGUYỄN PHÁT LỘC
NGHIÊN CỨU CÁC ĐẶC TRƯNG
VỀ HÌNH THÁI VÀ MÀU SẮC TRONG
TRUY VẤN ẢNH
Chuyên ngành: CÔNG NGHỆ THÔNG TIN
Mã số: 60.48.02.01
LUẬN VĂN THẠC SĨ NGÀNH CÔNG NGHỆ THÔNG TIN
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS ĐỖ NĂNG TOÀN
ĐỒNG NAI - 2012
LỜI CẢM ƠN
Đầu tiên tôi xin chân thành cảm ơn đến Ban Giám Hiệu và tập thể
Thầy Cô trong khoa Công Nghệ Thông Tin – Trường Đại Học Lạc Hồng đã
quan tâm tổ chức tận tình giảng dạy và tạo môi trường thuận lợi cho
chúng tôi được học tập và nghiên cứu chuyên sâu về lĩnh vực Công nghệ
Thông tin;
Xin chân thành cảm ơn các anh chị đồng nghiệp trong cơ quan công tác
đã tạo điều kiện thuận lợi, đóng góp những ý kiến quý báu ; Xin cảm ơn bạn
bè đã chỉ bảo tôi cùng cho tôi trong suốt quá trình học tập và hoàn thành luận
văn này;
Đặc biệt tôi xin gởi lời cảm ơn sâu sắc đến Thầy hướng dẫn khoa học -
PGS.TS. ĐỖ NĂNG TOÀN đã tận tình hướng dẫn, đôn đốc cho tôi trong
quá trình nghiên cứu và thực hiện luận văn này;
Cuối cùng, tôi xin biết ơn gia đình đã tạo điều kiện thuận lợi cho tôi
yên tâm trong suốt thời gian học tập cũng như thời gian nghiên cứu và hoàn
thành luận văn cao học. Mặc dù rất cố gắng, song luận văn này không thể
tránh khỏi những thiếu sót, kính mong được sự chỉ dẫn của các quý thầy cô
và các bạn.
Đồng Nai, ngày 20 tháng 10 năm 2012
Nguyễn Phát Lộc
LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của bản thân. Các số
liệu, kết quả trình bày trong luận văn này là trung thực. Những tư liệu được sử
dụng trong luận văn có nguồn gốc và trích dẫn rõ ràng, đầy đủ.
Tác giả luận văn
Nguyễn Phát Lộc
TÓM TẮT LUẬN VĂN
Tên đề tài luận văn: NGHIÊN CỨU CÁC ĐẶC TRƯNG VỀ HÌNH THÁI
VÀ MÀU SẮC TRONG TRUY VẤN ẢNH.
Học viên thực hiện: Nguyễn Phát Lộc sinh ngày: 01/4/1979
Người hướng dẫn khoa học: PGS.TS Đỗ Năng Toàn.
1. Mục tiêu của luận văn:
Hiểu rõ lý thuyết về xử lý ảnh và các kỹ thuật về màu sắc và hình thái
trong truy vấn ảnh . Xây dựng chương trình để ứng dụng các kỹ thuật trên trong
truy vấn ảnh.
2. Nội dung thực hiện:
- Tìm hiểu khái quát về xử lý ảnh và bài toán truy vấn ảnh bằng nội dung;
- Nghiên cứu một số kỹ thuật truy vấn ảnh truy vấn ảnh bằng màu sắc ;
- Nghiên cứu một số kỹ thuật truy vấn ảnh truy vấn ảnh bằng hình thái
- Nghiên cứu một số kỹ thuật truy vấn ảnh kết hợp
- Thiết kế, phát triển chương trình thử nghiệm;
3. Phương pháp thực hiện:
- Nghiên cứu nội dung lý thuyết về xử lý ảnh trong giáo trình “Xử lý ảnh” của
PGS. TS. Đỗ Năng Toàn và TS. Phạm Việt Bình, năm 2008; Nghiên cứu các tài
liệu trên mạng, sách và các luận văn thạc sĩ về kỹ thuật truy vấn ảnh bằng màu
sắc và hình thái.
4. Kết quả đạt được:
Trình bày khái quát về xử lý ảnh và bài toán truy vấn ảnh; Hệ thống hóa một số
vấn đề về ứng dụng kỹ thuật truy vấn ảnh bằng màu sắc và hình thái. Cài đặt thử
nghiệm chương trình truy vấn ảnh “ theo lược đồ màu (histogram )”
MỤC LỤC
Trang
TRANG PHỤ BÌA
LỜI CẢM ƠN
TÓM TẮT LUẬN VĂN
MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TẮT i
DANH MỤC BẢNG BIỂU VÀ HÌNH ẢNH ii
PHẦN MỞ ĐẦU 1
Chƣơng 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN TRUY VẤN
ẢNH 9
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH 9
1.1.1. Xử lý ảnh là gì? 9
1.1.2. Các vấn đề cơ bản trong xử lý ảnh 16
1.2. TRUY VẤN ẢNH 24
1.2.1. Giới thiệu 24
1.2.2. Các cách tiếp cận trong truy vấn ảnh 30
1.2.2.1. Truy vấn ảnh dựa vào chú thích ( annotation, key word) 30
1.2.2.2. Truy vấn ảnh dựa vào nội dung (CBIR) 30
1.2.2.3. Truy vấn ảnh theo ngữ nghĩa 33
1.2.3. Một số hệ thống truy vấn ảnh thông dụng 34
Chƣơng 2: TRUY VẤN ẢNH DỰA VÀO ĐẶC TRƢNG HÌNH THÁI
VÀ MÀU SẮC 37
2.1. CÁC ĐẶC TRƢNG ĐƢỢC SỬ DỤNG ĐỂ TRUY VẤN ẢNH 37
2.1.1. Các đặc trưng về màu sắc 37
2.1.1.1. Lược đồ màu (histogram) 44
2.1.1.2. Vector liên kết màu (Color Coherence Vector) 47
2.1.1.3. Đặc trưng tự tương quan màu (AutoCorrelogram) 50
2.1.2. Các đặc trưng về hình thái 54
2.1.2.1. Lược đồ hệ số góc (Edge Direction Histogram) 54
2.1.2.2. Vector liên kết hệ số góc (Edge Direction Coherence
Vector) 56
2.2. MỘT SỐ KỸ THUẬT TRUY VẤN ẢNH 59
2.1.1 Truy vấn theo màu sắc 59
2.1.1.1. Truy vấn theo lược đồ màu ( histogram) 59
2.1.1.2. Truy vấn theo vector liên kết màu 60
2.1.1.3. Truy vấn theo đặc trưng tương quan màu (Correlogram) 60
2.1.2 Truy vấn theo hình thái 61
2.1.2.1. Truy vấn theo lược đồ hệ số góc 61
2.1.2.2. Truy vấn theo vector liên kết hệ số góc 61
2.1.3. Truy vấn kết hợp 62
2.1.3.1 Truy vấn kết hợp các đặc trưng với nhau dùng toán tử BOOL62
2.1.3.2 Truy vấn kết hợp các đặc trưng với nhau dùng trọng số 63
Chƣơng 3: CHƢƠNG TRÌNH THỬ NGHIỆM 65
3.1. BÀI TOÁN 65
3.2. PHÂN TÍCH, THIẾT KẾ CHƢƠNG TRÌNH 65
3.2.1 Các đặc trưng sử dụng cho chương trình 65
3.2.2. Chức năng truy vấn ảnh 72
3.3. CHƢƠNG TRÌNH TRUY VẤN ẢNH CBIR_IMAGE 1.0 72
3.3.1. Truy vấn ảnh dựa theo lược đồ màu 74
PHẦN KẾT LUẬN 78
TÀI LIỆU THAM KHẢO
DANH MỤC CÁC TỪ VIẾT TẮT
STT
Từ viết tắt
Nội dung/Diễn giải
01
1-D
One-dimensional
02
2-D
Two-dimensional
03
3-D
Three-dimensional
04
ASCII
American Standard Code
for Information Interchange
05
CSDL
Cơ Sở Dữ Liệu
06
CBIR
Content Based Image Retrieval
07
CAD
Computer Aided Design
08
CGA
Color/Graphics Adapter
09
CIE
Comission International d’Eclairage
10
CMY
Cyan, Magenta, Yellow
11
DNA
Deoxyribonucleic acid
12
HSB
Hue- Saturation-Brightness
13
HCV
Mô hình màu HCV
14
HSB
Mô hình màu HSB
15
HSV
( H: Hue/ Vùng màu; S: Saturation / Độ
bão hòa màu V “hay B”: Bright hay Value/
Độ sáng
16
HTML
HyperText Markup Language
17
HSI
Hệ màu HSI: Hue-Saturation-Intensity
18
IBM
International Business Machines
19
JPG
Joint Photographic Group
20
L*u*v
Mô hình màu L*u*v
21
L*a*b
Mô hình màu L*a*b
22
L*C*h
Mô hình màu L*C*h
23
MTM
Mô hình màu MTM
24
MMM
Mediator Markov Model
25
MRI
Magnetic Resonance Imaging
26
NNFIR
Nơron Netwrok based Flexible Image
Retrieval
27
OBIR
Object Based Image Retrieval
28
PCX
Personal Computer Exchange
29
QBIC
query by image content
30
RGB
(red/ đỏ; green/xanh lá cây; Blue/xanh lam
blue
31
SQL
Structured Query Language
32
SVM
Support Vector Machine
33
TIF
Tape Image Format
34
URL
uniform resource locator
35
UFM
Unified feature matching
36
VGA
Video Graphics Array
37
YIQ
Mô hình màu YIQ
DANH MỤC HÌNH ẢNH
Hình 1.1 Hệ thống truy vấn ảnh của Google 3
Hình 1.1.1.1 Các bước cơ bản trong một hệ thống xử lý ảnh 9
Hình 1.1.1.2 hệ thống truy vấn ảnh QBIC của IBM 11
Hình 1.1.1.3 hệ thống truy vấn ảnh VISUALSEEK 12
Hình 1.1.1.4 hệ thống truy vấn ảnh WEBSEEK 13
Hình 1.1.1.5 hệ thống truy vấn ảnh BLOBWORLD 14
Hình 1.1.1.6 hệ thống truy vấn ảnh VIRAGE 15
Hình 1.1.2.1 Biểu diễn ảnh với độ phân giải khác nhau 17
Hình 1.1.2.2 Ví dụ về nắn chỉnh biến d
ạng
19
Hình 1.2.1 Hệ thống tìm kiếm thông tin trực quan thế hệ mới
27
Hình 1.2.2.2 Thống kê lựa chọn đặc trưng của một số hệ thống truy vấn ảnh 31
Hình 2.1.1 Hệ màu RGB 40
Hình 2.1.2 Hệ màu CMY 41
Hình 2.1.3 Hệ màu HSI 43
Hình 2.1.4 Không gian màu HSI 43
Hình 2.1.5 Minh họa sự thay đổi cường độ sáng trong hệ màu HSI 44
Hình 2.1.1.1.1a Ảnh minh họa lượt đồ màu RGB và HSI 45
Hình 2.1.1.1.1b Minh họa 2 lược đồ giống nhau 46
Hình 2.1.1.1.1c Lược đồ màu thể hiện phần giao của 2 lược đồ màu trên 46
Hình 2.1.1.1.1d Lược đồ màu thể hiện độ khác nhau giữa 2 lược đồ màu trên . 46
Hình 2.1.1.1.2a Ảnh theo hệ màu RGB 48
Hình 2.1.1.1.2b Ảnh theo hệ màu HSI 48
Hình 2.1.1.1.2c màu đỏ thể hiện liên kết màu trong ảnh 48
Hình 2.1.1.1.2d Lược đồ cector liên kết màu của ảnh sau khi được lượng hóa 48
Hình 2.1.1.1.2e Minh họa 2 ảnh có lược đồ màu giống nhau nhưng khác nhau
về ngữ nghĩa 49
Hình 2.1.1.1.2f Minh họa 2 ảnh có lược đồ màu khắc phục tính không duy
nhất của lược đồ màu 49
Hình 2.1.1.1.3 Minh họa 2 ảnh có đặc trưng tương quan màu giống ngau 80% 54
Hình 2.1.2.1a Ví dụ minh hoạ về lược đồ hệ số góc của ảnh
55
Hình 2.1.2.1b Ảnh minh họa lược đồ hệ số góc. Đường biên của ảnh
55
Hình 2.1.2.1c Lược đồ hệ số góc của ảnh 55
Hình 2.1.2.1d Minh họa 2 ảnh có lược đồ hệ số góc giống nhau 56
Hình 2.1.2.2a
Ảnh minh họa vector liên kết hệ số góc
57
Hình 2.1.2.2b
Ảnh minh họa sự liên kết giữa các biên cạnh 57
Hình 2.1.2.2c Lược đồ vector liên kết hệ số góc của ảnh 58
Hình 2.1.2.2d minh họa 2 ảnh có lược đồ màu giống nhau 80% 58
Hình 2.1.2.2e minh họa 2 ảnh có Vector liên kết hệ số góc giống nhau 59
Hình 2.1.3.1 Minh họa 2 ảnh giống nhau về lược đồ màu và lược đồ hệ số góc 63
Hình 3.2.1.1 Minh họa 2 ảnh có lược đồ màu giống nhau 89% 65
Hình 3.2.1.2 minh họa 2 ảnh có vector liên kết màu giống nhau 75% 66
Hình 3.2.1.3 minh họa 2 ảnh có đặc trưng Correlogram giống nhau 75% 66
Hình 3.2.1.4 minh họa 2 ảnh có lược đồ hệ số góc giống nhau 88% 67
Hình 3.2.1.5 minh họa 2 ảnh có Vector liên kết hệ số góc giống nhau 78% 67
Hình 3.2.1.6 Giải thuật và các bước trong modun truy vấn ảnh dựa vào lược
đồ màu 68
Hình 3.3a Giao diện chính của chương trình 72
Hình 3.3b Chọn thư mục chứa hình ảnh để truy vấn ảnh 73
Hình 3.3c Cập nhật đường dẫn thành công 74
Hình 3.3.1.1a Truy vấn ảnh theo màu xanh dương 74
Hình 3.3.1.1b Kết quả truy vấn ảnh theo màu xanh dương 75
Hình 3.3.1.1c Kết quả truy vấn ảnh theo màu vàng 75
Hình 3.3.1.2a Kết quả truy vấn ảnh theo lược đồ histogram với ngưởng 70% 76
Hình 3.3.1.2b Kết quả truy vấn ảnh theo lược đồ histogram với ngưởng 90% . 77
Hình 3.3.1.2c Kết quả truy vấn ảnh theo lược đồ histogram với ngưởng 100% 77
-1-
PHẦN MỞ ĐẦU
Việc sử dụng hình ảnh trong giao tiếp của con người là hầu như không mới
, tổ tiên của chúng ta sống trong hang động đã vẽ hình ảnh trên các bức tường
của hang động của họ, và việc sử dụng các bản đồ và kế hoạch xây dựng để
truyền tải thông tin đã có từ thời tiền La Mã. Nhưng thế kỷ XX đã chứng kiến
sự phát triển chưa từng có của khoa học kỹ thuật về nghiên cứu vũ trụ, chẩn
đoán y khoa, bảo mật hệ thống… Điều này đã nói lên tầm quan trọng của hình
ảnh trong tất cả các lĩnh vực của tầng lớp xã hội. Hình ảnh bây giờ đóng một
vai trò quan trọng trong các lĩnh vực khác nhau như y học, báo chí, quảng cáo,
giáo dục, thiết kế, giải trí và công nghệ truyền thông.
Các công nghệ mới được phát minh cho lĩnh vực nhiếp ảnh, truyền hình và
truyền thông đa phương tiện đã đóng một vai trò quan trọng trong việc tạo
điều kiện thuận lợi cho việc nắm bắt và thông tin liên lạc và truyền tải dữ liệu.
Nhưng động cơ thực sự của cuộc cách mạng hình ảnh đã được các máy tính
mang theo nó một loạt các kỹ thuật chụp ảnh kỹ thuật số, xử lý, lưu trữ và
truyền tải đã cho chúng ta phải bất ngờ. Sự tham gia của máy tính trong việc
lưu trữ hình ảnh có từ 1965 của thiên niên kỷ trước, với dự án Sketchpad Ivan
Sutherland, đã chứng minh tính khả thi của thao tác trên máy vi tính, tạo ra và
lưu trữ các hình ảnh, mặc dù chi phí cao và lúc bấy giờ phần cứng máy tính
còn giới hạn sử dụng cho đến giữa những năm 1980. Một khi máy tính hình
ảnh đã trở thành giá cả phải chăng (nhờ phần lớn vào sự phát triển của thị
trường các trò chơi máy tính mang tính đại chúng), nó nhanh chóng thâm
nhập vào các khu vực truyền thống phụ thuộc rất nhiều vào hình ảnh để giao
tiếp, chẳng hạn như kiến trúc, kỹ thuật và y học. Chụp hình thư viện, phòng
trưng bày nghệ thuật và viện bảo tàng, cũng bắt đầu nhìn thấy những ưu điểm
của việc lưu trữ và truy vấn ảnh trên máy tính. Việc tạo ra các World-Wide
Web vào đầu những năm 1990, cho phép người dùng truy cập dữ liệu từ bất
-2-
cứ nơi nào trên hành tinh từ các phương tiện truyền thông, nó đã cung cấp một
kích thích lớn hơn nữa để khai thác các hình ảnh kỹ thuật số. Số hình ảnh có
sẵn trên web gần đây đã được ước tính là từ 10 đến 30 triệu tetrabyte. Xử lý
ảnh là lĩnh vực nghiên cứu đang phát triển không ngừng bởi tính trực quan
sinh động cũng như khả năng áp dụng vào thực tế lớn. Hiện xử lý ảnh đang
giành được nhiều sự quan tâm của các nhà nghiên cứu trong và ngoài nước.
Trong xử lý ảnh, truy vấn ảnh có thể nói là lĩnh vực đòi hỏi sự nghiên cứu
tổng hợp như: nghiên cứu xử lý ảnh để rút trích các đặc trưng, áp dụng các
tính toán toán học cao cấp để xác định mức độ tương đồng giữa hai ảnh và sự
tổ chức sắp xếp chỉ mục cho cơ sở dữ liệu ảnh. Chính vì thế truy vấn ảnh là
lĩnh vực nghiên cứu đem lại nhiều thú vị. Hơn nữa, cùng với sự phát triển của
phần mềm và phần cứng, khối lượng ảnh phát triển không ngừng và ngày
càng lớn. Một số lượng lớn các ảnh đang được sử dụng ở trong thư viện ảnh
số và trên web. Vì vậy nhu cầu tìm kiếm ảnh là một nhu cầu tất yếu. Hiện tại,
truy vấn ảnh ứng dụng trong khá nhiều lĩnh vực như: quản lý nhãn hiệu logo,
truy bắt tội phạm, ứng dụng trong y khoa, quân sự… bởi vì nó mang tính trực
quan cao cho người sử dụng.
Vấn đề truy vấn ảnh trong Cơ Sở Dữ Liệu (CSDL) ảnh được đưa ra từ cuối
năm 1970 của thiên niên kỷ trước và có nhiều cách giải quyết khác nhau. Cho
đến ngày nay đã có rất nhiều hệ thống truy vấn ảnh (cả thương mại lẫn thực
nghiệm) đã và đang được phát triển. Hiệ nay có hai dạng CSDL ảnh để truy
vấn là: CSDL ảnh tĩnh và CSDL ảnh động (ảnh video…).
Trong nghiên
cứu này, tôi chỉ xin xem xét đến phạm vi ảnh tĩnh.
-3-
Hình 1.1: Hệ thống truy vấn ảnh của Google
Để mô tả quá trình lấy hình ảnh mong muốn từ một bộ sưu tập lớn trên cơ
sở các tính năng (chẳng hạn như kết cấu, màu sắc và hình dạng) có thể được
tự động chiết xuất từ những hình ảnh tương tự. Các tính năng được sử dụng để
thu hồi có thể là nguyên thủy hoặc ngữ nghĩa, nhưng quá trình khai thác phải
được chủ yếu là tự động. Thu hồi các hình ảnh bằng từ khóa hay truy vấn ảnh
dựa trên nội dung (Content-Based Image Retrieval viết tắt là CBIR ) . CBIR
khác tìm kiếm thông tin cổ điển trong đó cơ sở dữ liệu hình ảnh về cơ bản
không có cấu trúc, từ hình ảnh số hóa hoàn toàn bao gồm các mảng của các
cường độ điểm ảnh, không có ý nghĩa vốn có. Một trong những vấn đề quan
trọng với bất kỳ loại xử lý hình ảnh là cần thiết để trích xuất thông tin hữu ích
từ các dữ liệu thô (chẳng hạn như công nhận sự hiện diện của hình dạng cụ thể
hoặc kết cấu) trước khi bất kỳ loại lý luận về nội dung của hình ảnh có thể.
Cơ sở dữ liệu hình ảnh do đó khác nhau về cơ bản từ cơ sở dữ liệu văn bản,
các nguyên liệu thô (các từ được lưu trữ như các chuỗi ký tự ASCII) đã được
hợp lý cấu trúc. Không có tương đương với mức thu hồi 1 trong một cơ sở dữ
liệu văn bản. CBIR thu hút nhiều các phương pháp của nó từ lĩnh vực xử lý
hình ảnh và tương lai máy tính, và được xem bởi một số như là một tập hợp
con của lĩnh vực đó. Nó khác từ các lĩnh vực này chủ yếu thông qua sự nhấn
-4-
mạnh vào việc thu hồi các hình ảnh với các đặc tính mong muốn từ một bộ
sưu tập có kích thước đáng kể. Xử lý hình ảnh bao gồm một lĩnh vực rộng lớn
hơn nhiều, bao gồm cả nâng cao hình ảnh, nén, truyền tải, và giải thích.
Trong khi có những vùng màu xám (chẳng hạn như công nhận đối tượng bằng
cách phân tích tính năng), sự khác biệt giữa phân tích hình ảnh chủ đạo và
CBIR thường khá rõ ràng. Một ví dụ : Nhiều lực lượng cảnh sát trên thế giới
sử dụng hệ thống nhận dạng khuôn mặt tự động. Hệ thống như vậy có thể
được sử dụng trong một trong hai cách . Thứ nhất, hình ảnh ở phía trước của
máy ảnh có thể được so sánh với bản ghi cơ sở dữ liệu một cá nhân để xác
minh danh tính của mình . Trong trường hợp này, chỉ có hai hình ảnh phù
hợp, các nhà khoa học gọi đó là quá trình gọi CBIR . Thứ hai, toàn bộ cơ sở
dữ liệu có thể được tìm kiếm để tìm thấy những hình ảnh gần nhất phù hợp .
Đây là một ví dụ đích thực của CBIR . Các nghiên cứu và phát triển các vấn
đề trong CBIR bao gồm nhiều chủ đề, chia sẻ với xử lý hình ảnh chính thống
và phục hồi thông tin. Một số quan trọng nhất là:
- Nhu cầu của người sử dụng hình ảnh 'sự hiểu biết và hành vi tìm kiếm
thông tin.
- Xác định các cách thức thích hợp để mô tả nội dung hình ảnh.
- Chiết xuất các tính năng như vậy từ hình ảnh thô.
- Cung cấp lưu trữ nhỏ gọn cho các cơ sở dữ liệu hình ảnh lớn .
- Phù hợp với hình ảnh truy vấn và được lưu trữ trong một cách phản ánh
tương tự như con người bản án.
- Hiệu quả truy cập hình ảnh được lưu trữ theo nội dung.
- Cung cấp các giao diện có thể sử dụng con người để các hệ thống CBIR
Căn cứ tình hình nêu ra, cũng như nhu cầu thực tế để luận giải vì sao cần
phải thực hiện đề tài này
Trong lĩnh vực phòng chống tội phạm cảnh sát sử dụng thông tin trực
quan để xác định những người hoặc để ghi lại những cảnh của tội phạm để
-5-
làm bằng chứng trong quá trình thời gian, những hồ sơ này chụp ảnh trở thành
một kho lưu trữ có giá trị. Tại Anh, nó được phổ biến thực hành để chụp ảnh
tất cả những người bị bắt giữ và lấy dấu vân tay của họ . Bức ảnh này sẽ được
lưu với các hồ sơ chính cho người liên quan, mà trong một hệ thống hướng
dẫn sử dụng là một tập tin trên giấy. Trong một hệ thống dựa trên máy tính,
hình ảnh sẽ được số hóa và liên kết với các hồ sơ văn bản tương ứng. Cho
đến khi bị kết án và truy cập thông tin hình ảnh bị hạn chế, nếu bị cáo được
tuyên bố trắng án, tất cả các bức ảnh và dấu vân tay sẽ bị xóa. Nếu bị kết tội,
các dấu vân tay được thông qua Cục lưu trữ dấu vân tay. Hiện nay, có một
sáng kiến ở một quốc gia điều tra một hệ thống mạng công nhận vân tay tự
động. Các ứng dụng khác của hình ảnh trong thực thi pháp luật bao gồm nhận
diện khuôn mặt phù hợp với DNA và hệ thống giám sát phục vụ công tác điều
tra.
Trong lĩnh vực Y học. Các ngành nghề y tế và liên quan đến sử dụng và
lưu trữ thông tin hình ảnh với các hình thức của siêu âm, X-quang, Chụp cộng
hưởng từ hay MRI (Magnetic Resonance Imaging) hoặc các hình ảnh quét
khác, cho mục đích chẩn đoán và theo dõi. Có những quy tắc nghiêm ngặt về
bảo mật thông tin đó. Các hình ảnh được lưu giữ theo hồ sơ sức khỏe của
bệnh nhân, trong các tập tin chính dẫn sử dụng, được lưu trữ bằng định danh
duy nhất. Thông tin hình ảnh không có lưu theo tên của bệnh nhân, có thể
được sử dụng cho mục đích nghiên cứu và giảng dạy. Phần lớn các nỗ lực
nghiên cứu liên quan đến hình ảnh được thực hiện trong lĩnh vực vật lý y tế.
Các khía cạnh của mối quan tâm bao gồm xử lý hình ảnh hiệu quả (ví dụ như
ranh giới / tính năng phát hiện) các hệ thống hỗ trợ học viên trong việc phát
hiện và chẩn đoán tổn thương và các khối u và theo dõi tiến độ / tốc độ tăng
trưởng.
Trong lĩnh vực thời trang và thiết kế đồ họa hình ảnh là rất quan trọng
đối với thời trang, đồ họa và thiết kế công nghiệp . Hình dung hay mường
-6-
tượng như là một phần của quá trình sáng tạo. Trong khi có sự khác biệt cá
nhân trong cách thiết kế phương pháp tiếp cận công việc của họ, hình ảnh sử
dụng nhiều thiết kế trước đây trong các hình thức của hình ảnh, hình ảnh và
đồ họa, cũng như các đối tượng và thông tin hình ảnh khác từ thế giới thực, để
cung cấp nguồn cảm hứng và hình dung sản phẩm cuối cùng. Phác họa 2-D,
3-D mô hình hình học được sử dụng để trình bày ý tưởng cho các khách hàng
và các đồng nghiệp khác. Ngoài ra còn có một nhu cầu để đại diện cho các
hàng may mặc.
Các bức ảnh trong xuất bản và quảng cáo hình ảnh được sử dụng rộng
rãi trong ngành công nghiệp xuất bản, để minh họa cho cuốn sách và bài viết
trên các tờ báo và tạp chí. Nhiều nhà xuất bản tờ báo quốc gia và khu vực duy
trì thư viện ảnh của riêng mình, hoặc sẽ sử dụng những người có sẵn từ Hiệp
hội Báo chí, Reuters và các cơ quan khác. Các bộ sưu tập ảnh sẽ được lập chỉ
mục và nộp theo, thông thường, các nhóm chủ đề rộng (ví dụ như cảnh địa
phương, các tòa nhà hoặc tính cách cũng như hình ảnh bao gồm quốc gia và
quốc tế chủ đề). Ngày càng có nhiều, phương pháp lưu trữ và truy cập điện tử
xuất hiện, cùng với sự phát triển trong các phương pháp tự động sản xuất tờ
báo, giúp cải thiện tốc độ và tính chính xác của quá trình phục hồi. Quảng cáo
và chiến dịch quảng cáo phụ thuộc rất nhiều vào vẫn còn và di chuyển hình
ảnh để quảng bá các sản phẩm hoặc dịch vụ. Sự phát triển của thư viện ảnh
thương mại cổ phần, chẳng hạn như hình ảnh Getty và Corbis, phản ánh bản
chất sinh lợi của ngành công nghiệp.
Hình ảnh kiến trúc và thiết kế kỹ thuật được sử dụng trong kiến trúc để
ghi lại các dự án hoàn thành, bao gồm cả ảnh chụp nội thất và ngoại thất của
các tòa nhà cũng như các tính năng đặc biệt của thiết kế. Theo truyền thống,
những tấm ảnh này sẽ được lưu trữ như là bản in hoặc định dạng trượt, số dự
án và tên truy cập, có lẽ, và được sử dụng để tham khảo các kiến trúc sư trong
việc đưa ra các bài thuyết trình cho khách hàng và cho mục đích giảng dạy.
-7-
Thực hành với các kiến trúc sư lớn hơn 'hơn nguồn tài nguyên phong phú, đã
giới thiệu máy ảnh kỹ thuật số và lưu trữ điện tử của bức ảnh.
Các hình ảnh được sử dụng trong hầu hết các ngành kỹ thuật bao gồm các
bản vẽ, kế hoạch, các bộ phận máy, và như vậy. Computer Aided Design
(CAD) được sử dụng rộng rãi trong quá trình thiết kế. Cần chú trọng nhiều
ứng dụng là cần thiết để làm cho việc sử dụng có hiệu quả của bộ phận tiêu
chuẩn, để duy trì giá cả cạnh tranh do đó nhiều công ty kỹ thuật duy trì lưu trữ
thiết kế rộng. CAD và mô hình 2-D cũng được sử dụng rộng rãi trong thiết kế
kiến trúc, với 3-D mô hình và kỹ thuật các mô hình khác ngày càng được sử
dụng để giao tiếp với khách hàng . Thống trị của CAD (đặc biệt là 2-D) trong
quá trình thiết kế, mặc dù nó đã kết luận rằng dựa trên đối tượng, thông minh
hệ thống mô hình 3-D hoặc 4D sẽ trở nên quan trọng hơn trong tương lai .
Các nhà sử học nghiên cứu lịch sử từ nhiều ngành nghệ thuật, xã hội
học, y học… sử dụng các nguồn thông tin trực quan để hỗ trợ các hoạt động
nghiên cứu của họ. Các nhà khảo cổ cũng phụ thuộc rất nhiều vào hình ảnh.
Trong một số trường hợp (đặc biệt, nhưng không độc quyền, nghệ thuật), hồ
sơ hình ảnh có thể là bằng chứng duy nhất có sẵn . Trường hợp truy cập đến
tác phẩm gốc của nghệ thuật là hạn chế hoặc không thể, có lẽ do khoảng cách
địa lý hạn chế quyền sở hữu, hoặc các yếu tố để làm với điều kiện thể chất của
họ, các nhà nghiên cứu đã sử dụng người đại diện trong hình thức các bức
ảnh, slide hoặc hình ảnh khác của các đối tượng, có thể được thu thập trong
một thư viện đặc biệt, bảo tàng hay phòng trưng bày nghệ thuật . Bộ sưu tập
chụp ảnh và trượt được duy trì bởi một loạt các tổ chức, bao gồm các thư viện
đại học và công chúng.
Việc nghiên cứu các đặc trưng về hình thái và màu sắc trong truy vấn ảnh
là một việc làm không chỉ có ý nghĩa khoa học và còn mang đậm tính thực
tiễn nhất là trong hoàn cảnh Việt Nam chưa có nhiều hệ thống truy vấn ảnh
trong khi thực tế đang đặt ra những yêu cầu đòi hỏi.
-8-
Với mong muốn tìm hiểu và nghiên cứu về chủ đề này em đã mạnh dạn
lựa chọn đề tài: "Nghiên cứu các đặc trưng về hình thái và màu sắc trong
truy hồi ảnh ". Bố cục của luận văn bao gồm phần mở đầu, ba chương chính,
phần kết luận, tài liệu tham khảo và phụ lục. Nội dung các chương được tổ chức
như sau:
- Phần mở đầu gồm 03 chương:
+ Chương 1: Khát quát về xử lý ảnh và các bài toán truy vấn ảnh.
Chương này trình bày về truy vấn ảnh và các hướng tiếp cận. Tình hình
nghiên cứu trong và ngoài nước về lĩnh vực truy vấn ảnh cũng như các thuận
lợi, khó khăn và thách thức của việc giải bài toán truy vấn ảnh.
+ Chương 2: Nghiên cứu các đặc trưng truy vấn ảnh dựa vào đặc trưng
hình thái và màu sắc của ảnh. Chương này trình bày các đặc trưng về màu sắc
và các kỹ thuật như : Lược đồ màu (histogram); Vector liên kết màu (Color
Coherence Vector); Đặc trưng tự tương quan màu (AutoCorrelogram). Cùng
với các đặc trưng về hình thái như: Lược đồ hệ số góc (Edge Direction
Histogram); Vector liên kết hệ số góc (Edge Direction Coherence Vector);
truy vấn kết hợp các đặc trưng bằng đại số BOOl và trong số để truy vấn ảnh
cần tìm.
+ Chương 3: Phân tích thiết kế và giới thiệu chương trình ứng dụng
truy vấn ảnh dựa vào đặc trưng hình thái và màu sắc của ảnh.
-
Phần kết luận tóm lược các kết quả đã đạt được và nêu rõ đóng góp của
khóa luận, đồng thời định hướng một số hướng nghiên cứu tiếp theo trong thời
gian sắp tới và tài liệu tham khảo.
-9-
Chương 1: KHÁI QUÁT VỀ XỬ LÝ ẢNH VÀ BÀI TOÁN TRUY
VẤN ẢNH
1.1. KHÁI QUÁT VỀ XỬ LÝ ẢNH
1.1.1. Xử lý ảnh là gì?
Xử ký ảnh là một ngành khoa học còn tương đối mới mẽ so với các ngành
khoa học khác . Song trong xử lý ảnh đã bắt đầu xuất hiện trên những máy tính
chuyên dụng, để có thể hình dung cấu hình một hệ thống xử lý ảnh chuyên
dụng hay một hệ thống xử lý ảnh dùng trong nghiên cứu, đào tạo, trước hết
chúng ta sẽ xem xét các bước cần thiết trong xử lý ảnh.
Sơ đồ tổng quát của một hệ thống xử lý ảnh:
Hình 1.1.1.1 Các bước cơ bản trong một hệ thống xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác
đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của
phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ
và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai
trò quan trọng trong tương tác người máy. Quá trình xử lý ảnh được xem như
là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả
đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết
luận.
Thu nhận
Tiền xử lý
Trích chọn
đặc điểm
Hậu xử lý
Hệ quyết định
Đối sánh rút
ra kết luận
Lưu trữ
-10-
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào
đó của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c
1
,
c
2
, , c
n
). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.
Ngày nay ảnh có thể thu nhận từ các vệ tinh trinh thám, vệ tinh đánh giá
môi trường, các máy bay trinh thám qua các bộ cảm biến ( sensor ); từ ảnh,
tranh được quét trên máy scanner . Tiếp theo là giai đoạn tiền xử lý để biến
đổi tín hiệu tương tự sang tín hiệu rời rạc và trích chọn các đặc điểm của ảnh
trước khi chuyển sang giai đoạn hậu xử lý, phân tích hay lưu trữ lại.
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trước hết là tăng
cường ảnh để nâng cao chất lượng ảnh do những nguyên nhân khác nhau như
do chất lượng thiết bị thu nhận ảnh, do nguồn sáng hay bị nhiễu, ảnh bị suy
biến. Do đó cần phải tăng cường và khôi phục lại ảnh để làm nổi bật một số
đặc tính chính của ảnh, hoặc làm cho ảnh gần giống với trạng thái ban đầu tức
là trạng thái trước khi ảnh bị biến dạng. Tiếp theo là giai đoạn phát hiện các
đặc tính của ảnh như biên, phân vùng ành, trích chọn các đặc trưng khác
v.v…
Cuối cùng là tùy theo mục đích của ứng dụng sẽ là giai đoạn nhận dạng,
phân lớp hay các quyết định khác. Mỗi hệ thống sẽ truy vấn dựa trên một số
đặc trưng nhất định nào đó và có nhiều tùy chọn khác nhau để người dùng có
thể truy vấn ảnh theo màu sắc, kết cấu, hình dạng hay thậm chí là theo từ
khóa. Trên thế giới hiện nay có các hệ thống truy vấn ảnh như sau:
Hệ thống Query Based Image Content (QBIC) là hệ thống truy vấn dựa
trên sự phác thảo do IBM phát triển. Người sử dụng xây dựng một phác
thảo, vẽ ra và lựa chọn màu cùng kết cấu dựa theo ảnh truy vấn. Các đặc
trưng màu sử dụng là giá trị màu trung bình trong không gian RGB. Các đặc
trưng về hình dạng sử dụng là dạng tròn, độ lệch tâm và hướng của trục
chính. Hệ thống chỉ mục xây dựng dựa vào cấu trúc cây R
*
Tree. Độ đo
-11-
tương đồng về màu trung bình là:
d
2
avg
(x,y)=(x
avg
-
y
avg
)
t
(x
avg
-y
avg
)
còn về hình dạng thì sử dụng độ đo Euclide có trọng số.
Đây là hệ thống chuẩn cho truy vấn bởi nội dung ảnh, là hệ thống tra cứu
ảnh dựa vào nội dung được thương mại đầu tiên. QBIC hỗ trợ chính các truy
vấn dựa vào các ảnh mẫu, các phác thảo và các bản vẽ được người sử dụng
xây dựng, và các mẫu kết cấu và màu được lựa chọn. QBIC là kỹ thuật
flood-fill tăng cường. Một công cụ phác thảo để trợ giúp những người sử
dụng theo dõi các điểm biên đối tượng dựa trên khái niệm “snakes”
được phát triển trong nghiên cứu thị giác máy tính. Công cụ này nhận một
đường cong phác thảo của người sử dụng và căn lề tự động nó với các điểm
biên ảnh gần cạnh. Nó tìm đường cong cực đại hoá độ lớn gradient ảnh dọc
đường cong. Sau khi nhận biết đối tượng, QBIC sẽ tính toán các đặc trưng
của mỗi đối tượng và ảnh. Các đặc trưng như sau:Màu, Kết cấu, Hình, Phác
thảo.
Hình 1.1.1.2 hệ thống truy vấn ảnh QBIC của IBM
Ngay khi các đặc trưng được mô tả, các độ đo tương tự được sử dụng để
nhận các ảnh tương tự. Trong bước tìm kiếm, QBIC phân biệt giữa “các
-12-
ảnh” và “các đối tượng”. Một ảnh là một ảnh màu đầy đủ hoặc frame đơn
của video và một đối tượng là một phần của ảnh. QBIC tính toán các đặc
trưng sau: Các đối tượng, các ảnh. QBIC là một trong số ít các hệ thống nhận
vào bản miêu tả đánh chỉ số đặc trưng nhiều chiều.
Hệ thống VisualSeek là hệ thống truy vấn dựa vào các đặc trưng trực
quan của ảnh, sử dụng không gian 166 màu HSV. Sự tương đồng giữa hai
ảnh được xác định theo sự tương đồng của các vùng trong ảnh. Để tiến hành
truy vấn, trước tiên người dùng phải phác họa một số vùng trên ảnh.
Hình 1.1.1.3 hệ thống truy vấn ảnh VISUALSEEK
Sau đó chọn màu cho mỗi vùng, đồng thời xác định vị trí, độ lớn của
vùng. Hệ thống sẽ sử dụng hàm so khớp sau để tìm các hình giống với ảnh
truy vấn d(c
q
,c
t
)=(c
q
-c
t
)
t
A(c
q
-c
t
), trong đó c
q
,c
t
là hai tập màu của hai ảnh
và A=(a[i,j]) là ma trận độ tương đồng của các màu.
Hệ thống WebSeek là hệ thống truy vấn ảnh trên web theo danh mục ảnh
cho trước và sử dụng phép biến đổi wavelet: sưu tập ảnh sau đó phân lớp ảnh,
tạo chỉ mục và cuối cùng là tìm kiếm và hiển thị.
-13-
Hình 1.1.1.4 hệ thống truy vấn ảnh WEBSEEK
Người dùng phải chọn chủ đề trong danh
mục, hệ thống sẽ sử dụng hàm
so khớp sau:
d(h
q
,h
t
) =
+
2
để tìm kiếm trong chủ đề tương ứng ảnh giống nhất.
Hệ thống BlobWorld là hệ thống truy tìm theo ảnh mẫu dựa trên việc
rút trích các dữ liệu điểm nguyên thủy cùng các đặc tính giống nhau về
màu sắc, kết cấu và hình dạng. Màu sắc sẽ được biểu diễn dưới dạng
histogram 218 màu, kết cấu đặc trưng bởi sự tương phản và tính không thẳng
đứng; còn các đặc trưng hình dạng tính theo vùng với trọng tâm và hướng.
Ảnh truy vấn theo sự phác thảo của các vùng riêng biệt. Hàm đo sự
tương đồng là d(h
1
, h
2
)=(h
1
-h
2
)
T
A(h
1
-h
2
), vi A=(a
ij
) là ma trận đối xứng
thể hiện sự tương đồng giữa màu i và j.