Tải bản đầy đủ (.docx) (62 trang)

QUẢN Lý d6cntt epu dai

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.07 MB, 62 trang )

MUC LỤC


DANH MỤC HÌNH ẢNH
DANH MỤC BẢNG BIỂU


DANH MỤC KÝ HIỆU
PHẦN TỬ

KÝ HIỆU

Ý NGHĨA

Biểu đồ USE CASE

Tác nhân (Actor)

Use-case

Mối quan hệ giữa
các use case

Một người / nhóm người hoặc một
thiết bị hoặc hệ thống tác động hoặc
thao tác đến chương trình.

Biểu diễn một chức năng xác định
của hệ thống
Use case này sử dụng lại chức
năng của use case kia


Use case này kế thừa các chức
năng từ use case kia
Biểu đồ HOẠT ĐỘNG

Hoạt động

Mô tả hoạt động gồm tên hoạt
động và đặc tả của nó

Trạng thái khởi
đầu

Bắt đầu trạng thái hoặc hoạt động

Trạng thái kết
thúc

Kết thúc trạng thái hoặc hoạt động

Quyết định

Mô tả một lựa chọn điều kiện

Entity class

Mô hình hóa các thông tin lưu trữ
lâu dài trong hệ thống, nó thường độc
lập với các đối tượng khác ở xung
quanh



Procedure

Là một phương thức của một lớp
mà đối tượng lớp 2 gọi thực hiện


DANH MỤC CÁC CỤM TỪ VIẾT TẮT
STT

Từ viết tắt

Nội dung, diễn giải

1

CSDL

Cơ sở dữ liệu

2

CIE

Comission International d’Eclairage

3

GCH


Global Color Histogram Lược (đồ toàn cục)

4

HCV

Mô hình màu HCV

5

HSB

Hue- Saturation-Brightness (Mô hình màu HSB)

6

JPG

Joint Photographic Group

7

LCH

Local Color Histogram (Lược đồ cục bộ)

8

QBIC


Query Based Image Content (Tra cứu ảnh dựa vào nội
dung)

9

RGB

Red/ đỏ; Green/xanh lá cây; Blue/xanh lam

10

SQL

Structured Query Language

11

YIQ

Mô hình màu YIQ


LỜI NÓI ĐẦU
Ngày nay, cùng với sự phát triển của công nghệ thông tin, mạng internet toàn cầu là
sự gia tăng nhanh chóng của các dữ liệu đa phương tiện, khiến cho nhu cầu chia sẻ và tìm
kiếm những loại tài nguyên này cũng tăng theo một cách nhanh chóng. Một loại tài
nguyên trong đó là các dữ liệu kiểu hình ảnh. Mỗi người tìm kiếm hình ảnh đều có mục
đích khác nhau nhưng chung quy lại cái người dùng muốn tìm kiếm là những thông tin
kèm theo và hình ảnh họ đang cần hoặc một số khác lại tìm kiếm ảnh để xác nhận tính
chính xác của thông tin họ nhận được… Nó phục vụ cho nhiều lĩnh vực quan trọng trong

cuộc sống như các hệ thống bảo mật, an ninh, y tế. Vì thế việc nghiên cứu và phát triển
các hệ thống tra cứu ảnh ngày càng trở nên cấp thiết.
Có 2 kiểu tìm kiếm đó là tìm kiếm theo từ khóa và tìm kiếm theo nội dung hình ảnh,
tìm kiếm theo từ khóa dễ thỏa mãn được nhu cầu người dùng với các nhu cầu tìm kiếm
hình ảnh mới theo như mong muốn xuất hiện trong suy nghĩ của họ, tìm kiếm theo từ
khóa thì nhanh hơn tìm kiếm theo nội dung bởi vì nó hoạt động trên việc phân tích và so
sánh các từ hoặc cụm từ tương ứng với nhau để đưa ra kết quả, và không đòi hỏi người
dùng phải có ảnh mẫu. Phương pháp này có nhược điểm là hình ảnh kết quả không phải
lúc nào cũng chính xác, và nó phù hợp nhất với việc đáp ứng nhu cầu người dùng thông
qua các mô tả từ ngữ. Một phương pháp khác để tra cứu ảnh là tra cứu bằng hình ảnh.
Phương pháp này cho kết quả tốt hơn về tính đúng đắn bởi vì thông qua nội dung của bức
ảnh sẽ được biểu diễn và đưa ra những kết quả tương ứng với nội dung bức ảnh đầu vào.
Nó đáp ứng tốt hơn cho người dùng, tuy nhiên người dùng sẽ cần phải có một ảnh mẫu để
trích chọn và biểu diễn các đặc trưng trong bức ảnh đó trước khi tìm kiếm. Tra cứu ảnh
theo nội dung là một phương pháp phù hợp với những hệ thống máy tự động hoặc các hệ
thống an ninh nơi mà họ cần những kết quả hình ảnh tương tự với thông tin được lấy trực
tiếp từ nội dung hình ảnh.
Nói chung đối với hệ thống này người dùng sẽ cung cấp ảnh truy vấn và hệ thống sẽ
trả về kết quả là tập các ảnh tương tự. Do đó, làm thế nào để mô tả và mô hình một hình
ảnh để so sánh các ảnh khác nhau, để đánh chỉ số cho các ảnh trong cơ sở dữ liệu, và để
tìm kiếm ảnh một cách hiệu quả là một vấn đề hết sức quan trọng.
Một ảnh có thể được mô tả theo một hay nhiều đặc trưng. Các đặc trưng đó bao gồm:
hình dạng, màu sắc, kết cấu và mối liên hệ không gian, đó còn được gọi là nội dung của
ảnh. Bằng việc sử dụng các đặc trưng, chúng ta không chỉ mô tả và mô hình một ảnh, mà


còn dùng để so sánh các bức ảnh với nhau. Vì thế, một hệ thống tra cứu ảnh theo các đặc
trưng mức thấp còn gọi là hệ thống tra cứu ảnh theo nội dung (CBIR)
Ảnh dùng truy vấn được chia làm nhiều loại, mỗi loại, mỗi loại mang một đặc trưng
trội, chúng ta sẽ có các phương pháp khác nhau để phân tích và đạt được hệ thống tra cứu

có kết quả tốt nhất, cho thí dụ như ảnh vân gỗ, vân vải có đặc trưng riêng về kết cấu và
hướng, còn ảnh thiên nhiên lại mang nhiều đặc trưng màu sắc với sự bài trí phức tạp,
thường thì phương pháp này chúng ta sử dụng lược đồ màu sắc dựa trên màu trong vùng
hoặc toàn bộ ảnh để tìm kiếm thì sẽ đạt hiệu quả tốt đối với hình ảnh mang đối tượng và
bố cục phức tạp không cao nhưng đòi hỏi về sự thay đổi vị trí, thay đổi về kích thước theo
tỉ lệ, hay góc quay đối tượng thì lại cần tới phương pháp trích chọn và biểu diễn theo hình
dạng đối tượng. Đã có rất nhiều phương pháp được đề xuất để biểu diễn hình dạng, tuy
nhiên có những nhược điểm như khó có thể bảo toàn được tính bất biến khi quay, thu nhỏ
hay vị trí của đối tượng, thí dụ phương pháp dựa trên góc quay , phương pháp dựa trên
lưới…
Nội dung của đồ án được chia làm 3 chương:
Chương 1: Tổng quan về xử lý ảnh và tra cứu ảnh dựa vào nội dung.
Chương 2: Kỹ thuật tra cứu ảnh dựa vào nội dung và phương pháp sử dụng truy vấn
đa điểm.
Chương 3: Xây dựng hệ thống và kết quả đạt được.


CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ TRA CỨU ẢNH DỰA
VÀO NỘI DUNG
1.1 Khái quát về xử lý ảnh
1.1.1 Xử lý ảnh là gì?
Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với các ngành khoa học
khác. Xong trong xử lý ảnh đã bắt đầu xuất hiện trên những máy tính chuyên dụng, để có
thể hình dung cấu hình một hệ thống xử lý ảnh chuyên dụng hay một hệ thống xử lý ảnh
dùng trong nghiên cứu, đào tạo, trước hết chúng ta sẽ xem xét các bước cần thiết trong xử
lý ảnh.

Hình 1.1: Sơ đồ tổng quát của một hệ thống xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng vai trò quan
trọng nhất. Những năm trở lại đây với sự phát triển của phần cứng máy tính, xử lý ảnh và

đồ hoạ đó phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh
và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy. Quá trình xử lý ảnh
được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra kết quả mong muốn. Kết quả
đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như là đặc trưng
cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của đối tượng trong không
gian và nó có thể xem như một hàm n biến P(c 1, c2,..., cn). Do đó, ảnh trong xử lý ảnh có
thể xem như ảnh n chiều.
8


Ngày nay ảnh có thể thu nhận từ các vệ tinh trinh thám, vệ tinh đánh giá môi trường,
các máy bay trinh thám qua các bộ cảm biến (sensor); từ ảnh, tranh được quét trên máy
scanner. Tiếp theo là giai đoạn tiền xử lý để biến đổi tín hiệu tương tự sang tín hiệu rời
rạc và trích chọn các đặc điểm của ảnh trước khi chuyển sang giai đoạn hậu xử lý, phân
tích hay lưu trữ lại.
Quá trình phân tích ảnh bao gồm nhiều công đoạn nhỏ. Trước hết là tăng cường ảnh
để nâng cao chất lượng ảnh do những nguyên nhân khác nhau như do chất lượng thiết bị
thu nhận ảnh, do nguồn sáng hay bị nhiễu, ảnh bị suy biến. Do đó cần phải tăng cường và
khôi phục lại ảnh để làm nổi bật một số đặc tính chính của ảnh, hoặc làm cho ảnh gần
giống với trạng thái ban đầu tức là trạng thái trước khi ảnh bị biến dạng. Tiếp theo là giai
đoạn phát hiện các đặc tính của ảnh như biên, phân vùng ành, trích chọn các đặc trưng
khác v.v…
Cuối cùng là tùy theo mục đích của ứng dụng sẽ là giai đoạn nhận dạng, phân lớp hay
các quyết định khác. Mỗi hệ thống sẽ truy vấn dựa trên một số đặc trưng nhất định nào đó
và có nhiều tùy chọn khác nhau để người dùng có thể truy vấn ảnh theo màu sắc, kết cấu,
hình dạng hay thậm chí là theo từ khóa.
1.1.2 Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1 Một số khái niệm cơ bản
• Ảnh và điểm ảnh:

Điểm ảnh được xem như là dấu hiệu hay cường độ sáng tại 1 toạ độ trong không gian
của đối tượng và ảnh được xem như là 1 tập hợp các điểm ảnh. Ảnh trong thực tế là một
ảnh liên tục về không gian và giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính thì cần
phải tiến hành số hóa ảnh. Tức là biến đổi tín hiệu liên tục sang tín hiệu rời rạc (rời rạc
hóa về không gian) và lượng hóa thành phần giá trị mà đối với con người chúng ta không
thể nhìn thấy được hai điểm kề nhau. Trong quá trình này người ta dùng khái niệm là
Picture Element hay còn gọi là pixel – phần tử ảnh. Chúng ta cũng cần phân biệt khái
niệm pixel hay được nói đến trong đồ họa máy tính. Cho nên để tránh nhầm lẫn ta gọi
khái miện pixel trên là pixel thiết bị. Tức là khi ta quan sát màn hình trong chế độ đồ họa
màn hình không liên tục mà gồm nhiều điểm nhỏ. Mỗi điểm nhỏ đó gọi là pixel. Mỗi
pixel gồm một cặp tọa độ x, y và màu.

9


ảnh với độ phân giải 256x256

ảnh với độ phân giải 150x150

Hình 1.2: Biểu diễn ảnh với độ phân giải khác nhau
Cặp tọa độ x, y tạo nên độ phân giải (resolution). Như màn hình máy tính hay các loại
màn hình khác có độ phân giải khác nhau: Màn hình CGA có độ phân giải là 320x200.
Màn hình VGA có độ phân giải là 640x350. Vậy ảnh là tập hợp các điểm ảnh, khi được
số hóa thì ảnh được biểu diễn bởi bẳng hai chiều I(d,c): d dòng và c cột. Vậy ta nói ảnh có
d x c pixel. Người ta thường ký hiệu I(x,y) để chỉ 01 pixel trên ảnh. Thường giá trị của d
chọn bằng c và bằng 256. Một pixel có thể lưu trữ trên 1,4,8 hay 24 bit
• Mức xám, màu
Là số các giá trị có thể có của các pixel của ảnh. Mức xám là kết quả của sự mã hóa
tương ứng một cường độ sáng của mỗi điểm ảnh với một giá trị số (kết quả của quá trình
lượng hóa. Cách mã hóa kinh điển thường dùng 16, 32 hay 64 mức. Mã hóa 256 mức là

thông dụng nhất vì lý do kỹ thuật. Tức là 2 =256 (0,1…,255) nên với 256 mức mỗi pixel
được mã hóa 8 bit.
8

Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với mức xám ở
các điểm ảnh có thể khác nhau.
Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả 2 1 mức
khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có thể là 0 hoặc 1.
Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới
màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu: 2 8*3=224≈
16,7 triệu màu.
1.1.2.2. Khử nhiễu
10


Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
- Nhiễu hệ thống: là nhiễu có quy luật có thể khử bằng các phép biến đổi
- Nhiễu ngẫu nhiên: vết bẩn không rõ nguyên nhân => khắc phục bằng các phép lọc
1.1.2.3 Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường có 2 hướng
tiếp cận:
- Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau thành một
nhóm. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen trắng. Ứng dụng: In
ảnh màu ra máy in đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ thuật nội
suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.1.2.4 Trích chọn đặc trưng
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận dạng trong quá
trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn v.v..

Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc
vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask) thường
là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do vậy rất
hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng đối tượng.
Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la bàn, toán tử
Laplace, toán tử “chéo không” (zero crossing) v.v…Việc trích chọn hiệu quả các đặc
điểm giúp cho việc nhận dạng các đối tượng ảnh chính xác, với tốc độ tính toán cao và
dung lượng nhớ lưu trữ giảm xuống.
1.1.2.5 Nhận dạng
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân nhóm
các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành
khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì? Watanabe, một
trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại với hỗn loạn
11


(chaos), mẫu là một thực thể (entity), được xác định một cách ang áng (vaguely defined)
và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của
một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng
nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại mẫu đó có thể:
Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích phân biệt
(discriminant analyis), trong đó mẫu đầu vào được định danh như một thành phần của
một lớp đã xác định.
Hoặc phân loại không có mẫu (unsupervised classification hay clustering) trong đó
các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn đồng dạng nào đó. Các
lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa được định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ yếu sau
đây:
1. Thu nhận dữ liệu và tiền xử lý.

2. Biểu diễn dữ liệu.
3. Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
1. Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
2. Phân loại thống kê.
3. Đối sánh cấu trúc.
4. Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ để
phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận
khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và
nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai (hybrid system)
bao gồm nhiều mô hình kết hợp.
Việc giải quyết bài toán nhận dạng trong những ứng dụng mới, nảy sinh trong cuộc
sống không chỉ tạo ra những thách thức về thuật giải, mà còn đặt ra những yêu cầu về tốc
độ tính toán. Đặc điểm chung của tất cả những ứng dụng đó là những đặc điểm đặc trưng

12


cần thiết thường là nhiều, không thể do chuyên gia đề xuất, mà phải được trích chọn dựa
trên các thủ tục phân tích dữ liệu.
1.1.2.6 Nén ảnh
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả hai cách khuynh
hướng là nén có bảo toàn và không bảo toàn thông tin. Nén không bảo toàn thì thường có
khả năng nén cao hơn nhưng khả năng phục hồi thì kém hơn. Trên cơ sở hai khuynh
hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện của giá
trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp. Một ví dụ điển hình
cho kỹ thuật mã hóa này là *.TIF
- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh để

tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong các vùng gần
nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén không bảo
toàn và do vậy, kỹ thuật thường nén hiệu quả hơn. *.JPG chính là tiếp cận theo kỹ thuật
nén này.
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự lặp lại
của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc ảnh và quy luật sinh
ra ảnh theo nguyên lý Fractal.
1.2 Tra cứu ảnh dựa vào nội dung
Tra cứu ảnh là quá trình tìm kiếm trong một cơ sở dữ liệu ảnh những ảnh thỏa mãn
một yêu cầu nào đó. Ví dụ người sử dụng có thể tìm kiếm tất cả các ảnh về một chủ đề
nào đó như biển, trái đất hoặc người khác lại muốn phân loại cơ sở ảnh của mình thành
các bộ sưu tập có chủ đề khác nhau. Hoặc cũng có người muốn tìm tất cả các ảnh tương
tự với một bức ảnh có sẵn trong cơ sở dữ liệu.
Những kỹ thuật tra cứu ảnh số đã được nghiên cứu từ cuối những năm 1970. Từ đó
cho đến nay khả năng ứng dụng cao của các kỹ thuật quản lý cơ sở dữ liệu ảnh đã thu hút
sự quan tâm của các nhà nghiên cứu.
Các phương pháp tra cứu ảnh được sử dụng đầu tiên không dựa trên các đặc điểm trực
quan của ảnh mà dựa trên các chú thích bằng lời của các bức ảnh, đầu tiên người ta gán
13


cho mỗi ảnh một câu chú thích bằng lời (text) dựa trên một đặc điểm nào đó của ảnh, sau
đó sử dụng các kỹ thuật tìm kiếm văn bản thông thường để tìm kiếm ảnh.
Phương pháp tra cứu ảnh dựa trên văn bản như trên sử dụng các kỹ thuật cơ sở dữ liệu
để quản lý ảnh. Dựa vào các lời chú thích, người ta có thể tổ chức cơ sở dữ liệu ảnh bằng
các phân lớp theo chủ đề hay theo ngữ nghĩa và việc duyệt cơ sở dữ liệu ảnh chỉ dựa trên
các truy vấn kiểu Bool thông thường. Phương pháp tra cứu ảnh dựa trên chú thích như
trên còn được gọi là phương pháp tra cứu ảnh theo từ khóa. Do vậy việc xây dựng các
thuật toán có khả năng tự động sinh ra các chú thích cho một cơ sở dữ liệu ảnh có nhiều

chủ đề là hết sức khó khăn nên các hệ thống tra cứu ảnh kiểu này vẫn yêu cầu phải chú
thích ảnh một cách thủ công, tốn rất nhiều công sức và quan trọng hơn là nó mang tính
chủ quan, bị ảnh hưởng bởi hoàn cảnh và không đầy đủ.
Phương pháp tra cứu ảnh theo nội dung ra đời đã khắc phục được những nhược điểm
của phương pháp từ khóa. Nội dung chính của phương pháp này dựa trên sự tương tự của
những đặc điểm trực quan của ảnh như màu sắc, hình dạng, kết cấu hay không gian của
ảnh để phân loại sắp xếp các ảnh trong một cơ sở dữ liệu ảnh. Tuy nhiên những đặc điểm
mà phương pháp này trích chọn để tra cứu vẫn là những đặc điểm ở mức thấp, chưa phản
ánh được nội dung mang tính ngữ nghĩa của một đối tượng ảnh. Vì vậy người ta đã đưa ra
một số cách tiếp cận mới phát triển phương pháp tra cứu ảnh theo nội dung thành các
phương pháp tra cứu ảnh theo đồ thị hay theo bản thể.
• Tra cứu ảnh dựa vào nội dung
Hệ thống truy vấn ảnh dựa trên nội dung (Content-Based Image Retrieval viết tắt là
CBIR) là hệ thống truy vấn ảnh dựa trên việc tự động trích rút một số thông tin đặc trưng
trong ảnh như: màu sắc, kết cấu, vị trí, hình dạng. Phương pháp này đã được nhiều người
nghiên cứu với rất nhiều cách tiếp cận khác nhau; do đó rất nhiều hệ thống truy vấn ảnh
dựa trên nội dung đã ra đời như: QBIC, VisualSeek, WebSeek và BlobWorld...
Có hai cách tiếp cận chung đối với các giải pháp cho vấn đề tra cứu thông tin dựa trên
dạng thông tin trực quan đó là các phương pháp dựa trên đặc trưng và các phương pháp
dựa trên văn bản mô tả ảnh. Nhận thức chủ quan và chú thích thiếu chính xác là nguyên
nhân tra cứu không chính xác trong các quá trình tra cứu sau của phương pháp dựa trên
văn bản mô tả ảnh.

14


Các vấn đề đối với việc truy cập các ảnh và video dựa vào văn bản đã thúc đẩy nhanh
chóng sự quan tâm phát triển các giải pháp dựa vào nội dung. Với giải pháp này thay vì
được chú thích một cách thủ công bởi các từ khóa dựa vào văn bản, các ảnh có thể được
trích rút một số đặc trưng trực quan như màu, hình dạng, kết cấu và được đánh chỉ số dựa

trên các đặc trưng trực quan này. Cách tiếp cận này dựa chủ yếu vào các kết quả từ thị
giác máy. Tuy nhiên, không có đặc trưng riêng lẻ tốt nhất mà cho các kết quả chính xác.
Thông thường, một sự kết hợp các đặc trưng một cách tùy biến là cần thiết để cung cấp
các kết quả tra cứu thích hợp cho ứng dụng tra cứu ảnh dựa vào nội dung.
Một hệ thống tra cứu ảnh dựa vào nội dung (CBIR – Content Based Image Retrieval)
tiêu biểu không chỉ xử lý các nguồn thông tin khác nhau ở các khuôn dạng khác nhau
(văn bản, hình ảnh, video) mà còn giải quyết các nhu cầu của người sử dụng. Về cơ bản
hệ thống phân tích cả các nội dung của nguồn thông tin cũng như các truy vấn sử dụng và
sau đó so sánh các nội dung này để tra cứu các mục tin liên quan. Các chức năng chính
của hệ thống dựa vào nội dung như sau:
Phân tích các nội dung của nguồn thông tin, biểu diễn nội dung của các
nguồn được phân tích theo cách thích hợp cho so sánh các truy vấn được sử dụng.
Phân tích các truy vấn người sử dụng và biểu diễn chúng ở dạng thích
hợp cho so sánh với cơ sở dữ liệu nguồn. Bước này tương tự bước trước nhưng chỉ
áp dụng với ảnh truy vấn.
Định nghĩa một chiến lược để so sánh các truy vấn tìm kiếm với thông tin
trong cơ sở dữ liệu được lưu trữ. Tra cứu thông tin liên quan một cách hiệu quả.
Bước này được thực hiện trực tuyến và được yêu cầu rất nhanh. Các kỹ thuật đánh
chỉ số hiện đại có thể được sử dụng để tổ chức lại không gian đặc trưng để tăng tốc
quá trình đối sánh.
Thực hiện các điều chỉnh cần thiết trong hệ thống (thường bằng điều
chỉnh các tham số trong máy đối sánh) dựa trên phản hồi từ người sử dụng hoặc
các ảnh được tra cứu.
1. 3 Một số đặc trưng của ảnh
Tra cứu ảnh theo nội dung (Content Based Images Retrieval CBIR) hay truy vấn theo
nội dung ảnh (Query Based Image Content QBIC) là một ứng dụng của thị giác máy tính
đối với bài toán tra cứu ảnh. “Dựa vào nội dung ảnh (ContentBased)” nghĩa là việc tìm
kiếm sẽ phân tích nội dung thực sự của các bức ảnh. Nội dung ảnh ở đây được thể hiện
bằng màu sắc, hình dạng, kết cấu (texture), các đặc trưng cục bộ (local features),…hay bất
15



cứ thông tin nào có từ chính nội dung ảnh. Cụm từ CBIR được T.Kato đưa ra vào năm
1992 trong quá trình thu thập ảnh một cách tự động từ cơ sở dữ liệu dựa trên biểu diễn
màu sắc và hình dạng của ảnh. Tee Cheng Siew đã giới thiệu một số đặc trưng nội dung
ảnh
1.3.1 Đặc trưng màu sắc
Màu sắc là một đặc trưng nổi bật và được sử dụng phổ biến nhất trong tìm kiếm ảnh
theo nội dung. Mỗi một điểm ảnh (thông tin màu sắc) có thể được biểu diễn như một điểm
trong không gian màu sắc ba chiều. Các không gian màu sắc thường dùng là: RGB,
Munsell, CIE, HSV. Tìm kiếm ảnh theo màu sắc tiến hành tính toán biểu đồ màu cho mỗi
ảnh để xác định tỉ trọng các điểm ảnh của ảnh mà chứa các giá trị đặc biệt (màu sắc). Các
nghiên cứu gần đây đang cố gắng phân vùng ảnh theo các màu sắc khác nhau và tìm mối
quan hệ giữa các vùng này.
1.3.2 Đặc trưng kết cấu
Trích xuất nội dung ảnh theo kết cấu nhằm tìm ra mô hình trực quan của ảnh và cách
thức chúng được xác định trong không gian. Kết cấu được biểu diễn bởi các texel mà sau
đó được đặt vào một số các tập phụ thuộc vào số kết cấu được phát hiện trong ảnh. Các
tập này không chỉ xác định các kết cấu mà còn chỉ rõ vị trí các kết cấu trong ảnh. Việc xác
định các kết cấu đặc biệt trong ảnh đạt được chủ yếu bằng cách mô hình các kết cấu như
những biến thể cấp độ xám 2 chiều.

Hình 1.3: Ví dụ về một số loại kết cấu

16


1.3.3 Đặc trưng hình dạng
Hình dạng của một ảnh hay một vùng là một đặc trưng quan trọng trong việc xác định
và phân biệt ảnh trong nhận dạng mẫu. Mục tiêu chính của biểu diễn hình dạng trong

nhận dạng mẫu là đo thuộc tính hình học của một đối tượng được dùng trong phân lớp, so
sánh và nhận dạng đối tượng. Thực tế, đã có nhiều máy tìm kiếm cho phép tìm kiếm ảnh
theo nội dung ảnh, tuy nhiên, các máy tìm kiếm này thường chỉ khai thác vào một phần
nội dung của ảnh.
Có 2 kiểu tiếp cận được sử dụng:
-

Dựa trên vùng kín hình dạng
Dựa trên biên của đối tượng

Hình 1.4: Đặc trưng hình dạng
Liên hệ không gian: được dùng nhiều trong xử lý ảnh, để phân biệt các đối tượng
trong một ảnh. Có 2 cách biểu diễn là theo đối tượng và theo quan hệ.

Hình 1.5: Biểu diễn hình dạng qua mối liên hệ không gian

17


Những phương pháp dựa trên những đặc trưng mức thấp được phát triển hoàn thiện
trong thời gian gần đây. Tuy nhiên chúng chưa hẳn là tốt nhất. Để có được những hệ
thống tra cứu hiệu quả, đáp ứng tốt yêu cầu sử dụng thì phải kết hợp và đưa ra những cách
tiếp cận tốt hơn. Có những hệ thống tra cứu hiệu quả đối với đặc trưng màu sắc nhưng lại
không hiệu quả trong những bức hình kết cấu, có những bức hình đạt hiệu quả tra cứu tốt
trong tra cứu ảnh kết cấu nhưng đối với vài loại ảnh có bố cục đầy đủ lại phải sử dụng
phương pháp liên hệ không gian mới mong đạt hiệu quả tốt nhất, nhiều hệ thống đã kết
hợp các kỹ thuật khác nhau để đạt hiệu quả tra cứu tối ưu.
Ngày nay, một vài hệ thống CBIR đã được đưa vào sử dụng: cho ví dụ hệ thống
Google Search Image, hệ thống này được hỗ trợ màu sắc, hình dạng và đặc biệt là độ đo
tương tự cấu trúc.

Trong báo cáo này chúng ta chỉ tập trung tìm hiểu và trích chọn đặc trưng màu sắc của
chúng.
1.4 Cấu trúc của hệ thống tra cứu ảnh dựa vào nội dung.
Một hệ thống tra cứu ảnh có thể thực hiện qua nhiều công đoạn: nhập ảnh truy vấn,
nhập dữ liệu ảnh cho cơ sở dữ liệu, chuẩn hóa ảnh, trích chọn đặc trưng của ảnh truy vấn
và ảnh trong cơ sở dữ liệu, tính toán độ tương tự và cách hiển thị kết quả lên màn hình…
Tuy nhiên chúng ra có miêu tả khái quát một hệ thống tra cứu ảnh thông qua những công
đoạn chính sau:
Công đoạn 1: trích chọn đắc trưng cho ảnh truy vấn: ở công đoạn này ảnh truy vấn
ngay khi được nhập vào hệ thống sẽ xử lý để trích chọn đặc trưng theo đặc trưng nhất
định nào đó và phục vụ tính toán độ tương đồng sau đó đưa ra kết quả, có thể nói công
đoạn này sẽ được tính toán online.
Công đoạn 2: trích chọn đặc trưng: đây là công đoạn tính toán đặc trưng cho ảnh trong
cơ sở dữ liệu sinh ra cơ sở dữ liệu lưu trữ các đặc trưng, công đoạn này thường sẽ được
tính toán từ khi nhập ảnh vào cơ sở dữ liệu, hoặc tiến hành khi người dùng cho phép thực
hiện hay nói cách khác nó được tiến hành offline.
Công đoạn 3: đo độ tương đồng: công đoạn này là công đoạn so sánh các ảnh tồn tại
trong cơ sở dữ liệu và ảnh truy vấn thông qua đặc trưng đã trích chọn trước đó.

18


Công đoạn 4: tra cứu và hiển thị kết quả: hiển thị kết quả vừa thu được cho người
dùng theo một giá trị ngưỡng nào đó.

Hình 1.6: Cấu trúc hệ thống tra cứu ảnh theo nội dung
Các thành phần cơ bản của hệ thống CBIR:
- Cơ sở dữ liệu ảnh: Là cơ sở dữ liệu phục vụ lưu trữ ảnh. Có thể là trên ổ cứng
thường, cũng có thể là hệ quản trị cơ sở dữ liệu.
- Cơ sở dữ liệu đặc trưng: các đặc trưng đã được trích chọn offline sẽ được lưu trữ

trong cơ sở dữ liệu như tệp tin matlab, bảng tính excel,…
1.5 Một số hệ thống tra cứu ảnh dựa trên nội dung.
1.5.1 Hệ thống QBIC (Query By Image Content)
Hệ thống QBIC của hãng IBM là một hệ thống tra cứu ảnh thương mại đầu tiên và nổi
tiếng nhất trong số các hệ thống tra cứu ảnh dựa trên nội dung. Nó cho phép người sử
dụng tra cứu ảnh dựa trên màu sắc, hình dạng và kết cấu. QBIC cung cấp một số phương
pháp: Simple, Multi – feature, và Multi – pass. Trong phương pháp truy vấn Simple chỉ
sử dụng một đặc điểm. Truy vấn Multi – feature bao gồm nhiều hơn một đặc điểm và mọi
đặc điểm đều có trọng số như nhau trong suốt quá trình tìm kiếm. Truy vấn Multi – pass
sử dụng đầu ra của các truy vấn trước làm cơ sở cho bước tiếp theo. Người sử dụng có thể
vẽ ra và chỉ định màu, kết cấu mẫu của hình ảnh yêu cầu. Trong hệ thống QBIC màu
19


tương tự được tính toán bằng thước đo bình phương sử dụng như là bộ lọc để cải biến
hiệu quả truy vấn. Bản demo của QBIC tại địa chỉ: />
Hình 1.7: Giao diện trang chủ của QBIC
1.5.2 Hệ thống PhotoBook
Hệ thống này được phát triển ở Massachusetts Institute of Technology cho phép người
dùng tra cứu ảnh dựa trên màu sắc, hình dạng và kết cấu. Hệ thống này cung cấp một tập
các thuật toán đối sánh gồm: Euclidean, mahalanobis, vector space angle, histogram,
Fourier peak và wavelet tree distance như là những đơn vị đo khoảng cách. Trong hầu hết
các phiên bản đã có thể định nghĩa những thuật toán đối sánh của họ. Hệ thống như là một
công cụ bán tự động và có thể sinh ra một mẫu truy vấn dựa trên những hình ảnh mẫu
được cung cấp bởi người sử dụng. Điều này cho phép người sử dụng trực tiếp đưa những
yêu cầu truy vấn của họ với những lĩnh vực khác nhau, và mỗi lĩnh vực họ có thể thu
được những mẫu truy vấn tối ưu.
1.5.3 Hệ thống VisualSEEK và WebSEEK
Cả hai hệ thống này đều được phát triển tại trường đại học Colombia. VisualSEEK là
hệ thống cơ sở dữ liệu ảnh. Nó cho phép người sử dụng tra cứu ảnh dựa trên màu sắc,

không gian miền và đặc điểm kết cấu. Tập màu và chuyển đổi wavelet dựa trên kết cấu
được sử dụng để thực hiện những đặc điểm này. Thêm vào đó, VisualSEEK còn cho phép
20


người sử dụng tạo truy vấn bằng việc chỉ định vùng màu và những không gian vị trí của
chúng. WebSEEK là một catalog ảnh và là công cụ tìm kiếm cho web. Hệ thống này cung
cấp mẫu cho danh sách ảnh và video trên trang web sử dụng kết hợp xử lý dựa trên text và
phân tích dựa trên nội dung.
1.5.4 Hệ thống RetrievalWare
Hệ thống này được phát triển bởi tập đoàn công nghệ Excalibur cho phép người sử
dụng tra cứu ảnh bởi nội dung màu, hình dạng, kết cấu, độ sáng, kết cấu màu và hệ số co.
Người sử dụng có thể điều chỉnh tỷ trọng của những đặc điểm này trong suốt quá trình
tìm kiếm.
1.5.5 Hệ thống Imatch
Hệ thống này cho phép người dùng tra cứu ảnh bởi nội dung màu, hình dạng, kết cấu.
Nó cung cấp một số phương pháp để tra cứu ảnh tương tự: Màu tương tự, màu và hình
dạng (Quick), màu và hình dạng (Fuzzy) và sự phân bố màu. Màu tương tự truy vấn
những ảnh tương tự với ảnh mẫu dựa trên sự phân bố màu toàn cục. Màu và hình dạng
(Quick) tìm hình ảnh tương tự bởi việc kết hợp cả hình dạng, kết cấu, màu. Màu và hình
dạng (Fuzzy) thực hiện thêm những bước xác định đối tượng trong ảnh mẫu. Phân bố màu
cho phép người sử dụng vẽ ra sự phân bố màu hoặc xác định tỷ lệ phần trăm của một màu
trong hình ảnh mong muốn. Imatch cũng cung cấp những đặc điểm khác nội dung để xác
định ảnh: ảnh nhị phân, ảnh co kích thước, lưu trữ trong những định dạng khác và những
ảnh có tên tương tự.
1.6 Một số ứng dụng cơ bản của tra cứu ảnh.
Ứng dụng của tra cứu ảnh có rất nhiều trong đời sống xã hội, phục vụ nhiều mục đích
khác nhau, nhằm xác nhận, tra cứu thông tin. Giảm bớt công việc của con người nhằm
tăng hiệu suất làm việc: Album ảnh số của người dùng, ảnh y khoa, tìm kiếm nhãn hiệu,
mô tả nội dung,…

-

Trong lĩnh vực phòng chống tội phạm: cảnh sát sử dụng thông tin trực quan để xác
định những người hoặc để ghi lại những cảnh của tội phạm để làm bằng chứng
trong quá trình thời gian, những hồ sơ này chụp ảnh trở thành một kho lưu trữ có
giá trị. Tại Anh, nó được phổ biến thực hành để chụp ảnh tất cả những người bị bắt
giữ và lấy dấu vân tay của họ. Bức ảnh này sẽ được lưu với các hồ sơ chính cho
người liên quan, mà trong một hệ thống hướng dẫn sử dụng là một tập tin trên
21


-

-

-

giấy. Trong một hệ thống dựa trên máy tính, hình ảnh sẽ được số hóa và liên kết
với các hồ sơ văn bản tương ứng. Cho đến khi bị kết án và truy cập thông tin hình
ảnh bị hạn chế, nếu bị cáo được tuyên bố trắng án, tất cả các bức ảnh và dấu vân
tay sẽ bị xóa. Nếu bị kết tội, các dấu vân tay được thông qua Cục lưu trữ dấu vân
tay. Hiện nay, có một sáng kiến ở một quốc gia điều tra một hệ thống mạng công
nhận vân tay tự động. Các ứng dụng khác của hình ảnh trong thực thi pháp luật bao
gồm nhận diện khuôn mặt phù hợp với DNA và hệ thống giám sát phục vụ công
tác điều tra.
Trong lĩnh vực Y học: Các ngành nghề y tế và liên quan đến sử dụng và lưu trữ
thông tin hình ảnh với các hình thức của siêu âm, X-quang, Chụp cộng hưởng từ
hay MRI (Magnetic Resonance Imaging) hoặc các hình ảnh quét khác, cho mục
đích chẩn đoán và theo dõi. Có những quy tắc nghiêm ngặt về bảo mật thông tin
đó. Các hình ảnh được lưu giữ theo hồ sơ sức khỏe của bệnh nhân, trong các tập tin

chính dẫn sử dụng, được lưu trữ bằng định danh duy nhất. Thông tin hình ảnh
không có lưu theo tên của bệnh nhân, có thể được sử dụng cho mục đích nghiên
cứu và giảng dạy. Phần lớn các nỗ lực nghiên cứu liên quan đến hình ảnh được
thực hiện trong lĩnh vực vật lý, y tế. Các khía cạnh của mối quan tâm bao gồm xử
lý hình ảnh hiệu quả (ví dụ như ranh giới / tính năng phát hiện) các hệ thống hỗ trợ
học viên trong việc phát hiện và chẩn đoán tổn thương và các khối u và theo dõi
tiến độ / tốc độ tăng trưởng.
Trong lĩnh vực thời trang và thiết kế đồ họa hình ảnh là rất quan trọng đối với thời
trang, đồ họa và thiết kế công nghiệp. Hình dung hay mường tượng như là một
phần của quá trình sáng tạo. Trong khi có sự khác biệt cá nhân trong cách thiết kế
phương pháp tiếp cận công việc của họ, hình ảnh sử dụng nhiều thiết kế trước đây
trong các hình thức của hình ảnh, hình ảnh và đồ họa, cũng như các đối tượng và
thông tin hình ảnh khác từ thế giới thực, để cung cấp nguồn cảm hứng và hình
dung sản phẩm cuối cùng. Phác họa 2-D, 3-D mô hình hình học được sử dụng để
trình bày ý tưởng cho các khách hàng và các đồng nghiệp khác. Ngoài ra còn có
một nhu cầu để đại diện cho các hàng may mặc.
Các bức ảnh trong xuất bản và quảng cáo hình ảnh được sử dụng rộng rãi trong
ngành công nghiệp xuất bản, để minh họa cho cuốn sách và bài viết trên các tờ báo
và tạp chí. Nhiều nhà xuất bản tờ báo quốc gia và khu vực duy trì thư viện ảnh của
riêng mình, hoặc sẽ sử dụng những người có sẵn từ Hiệp hội Báo chí và các cơ
quan khác. Các bộ sưu tập ảnh sẽ được lập chỉ mục và nộp theo, thông thường, các
22


-

-

nhóm chủ đề rộng (ví dụ như cảnh địa phương, các tòa nhà hoặc tính cách cũng
như hình ảnh bao gồm quốc gia và quốc tế chủ đề). Ngày càng có nhiều, phương

pháp lưu trữ và truy cập điện tử xuất hiện, cùng với sự phát triển trong các phương
pháp tự động sản xuất tờ báo, giúp cải thiện tốc độ và tính chính xác của quá trình
phục hồi. Quảng cáo và chiến dịch quảng cáo phụ thuộc rất nhiều vào vẫn còn và
di chuyển hình ảnh để quảng bá các sản phẩm hoặc dịch vụ. Sự phát triển của thư
viện ảnh thương mại cổ phần, chẳng hạn như hình ảnh Getty và Corbis, phản ánh
bản chất sinh lợi của ngành công nghiệp.
Các nhà sử học nghiên cứu lịch sử từ nhiều ngành nghệ thuật, xã hội học, y học…
sử dụng các nguồn thông tin trực quan để hỗ trợ các hoạt động nghiên cứu của họ.
Các nhà khảo cổ cũng phụ thuộc rất nhiều vào hình ảnh. Trong một số trường hợp
(đặc biệt, nhưng không độc quyền, nghệ thuật), hồ sơ hình ảnh có thể là bằng
chứng duy nhất có sẵn. Trường hợp truy cập đến tác phẩm gốc của nghệ thuật là
hạn chế hoặc không thể, có lẽ do khoảng cách địa lý hạn chế quyền sở hữu, hoặc
các yếu tố để làm với điều kiện thể chất của họ, các nhà nghiên cứu đã sử dụng
người đại diện trong hình thức các bức ảnh, slide hoặc hình ảnh khác của các đối
tượng, có thể được thu thập trong một thư viện đặc biệt, bảo tàng hay phòng trưng
bày nghệ thuật. Bộ sưu tập chụp ảnh và trượt được duy trì bởi một loạt các tổ chức,
bao gồm các thư viện đại học và công chúng.
Tìm kiếm trang web
Giải trí
Hệ thống thông tin địa lý
Giáo dục đào tạo

1.7 Kết luận chương.
Trong chương này, e đã giới thiệu tổng quan về xử lý ảnh và tra cứu ảnh cụ thể là tra
cứu ảnh dựa vào nội dung, tìm hiểu về các đặc trưng của ảnh, cấu trúc của một hệ thống
CBIR, giới thiệu thêm một số hệ thống tra cứu ảnh dựa vào nội dung và một số ứng dụng
cơ bản của CBIR.
Tra cứu ảnh theo nội dung (CBIR) là một lĩnh vực khoa học được phát triển dựa trên
cơ sở lý thuyết và ứng dụng của xử lý ảnh. Hệ thống cho phép người dung tra cứu các ảnh
tương tự trong một cơ sở dữ liệu hình ảnh. Các hình ảnh này có thể được thu thập thông

qua các thiết bị chụp hình, cảm biến, và thiết bị quét hình ảnh, cũng có thể được chia sẻ
thông qua hệ thống mạng máy tính toàn cầu.
23


Tra cứu ảnh theo nội dung là việc tính độ tương tự giữa hai bức ảnh được biểu diễn
bởi một trong số các đặc trưng của ảnh như: Màu sắc, hình dạng, kết cấu… Kết quả là tập
các bức ảnh tương tự với ảnh truy vấn được sắp xếp theo thứ tự giảm dần độ tương tự.

24


CHƯƠNG 2: KỸ THUẬT TRA CỨU ẢNH DỰA VÀO NỘI DUNG VÀ SỬ
DỤNG PHƯƠNG PHÁP TRUY VẤN ĐA ĐIỂM.
Sự nhận thức về màu sắc là rất quan trọng trong đời sống của con người. Sự nhận thức
về màu sắc phụ thuộc vào cả tính chất vật lý của ánh sáng và quá trình xử lý của thị giác
với sự góp phần rất quan trọng của kinh nghiệm. Con người có thể dùng thông tin màu
sắc để phân biệt đối tượng, vật liệu, đồ ăn, vị trí, và ngay cả thời gian của ngày... Con
người chỉ có khả năng nhận thức được ánh sáng có bức xạ điện từ với bước sóng trong
khoảng 400 – 700 nanomet. Cơ quan thị giác cảm nhận được ánh sáng là do bề mặt đối
tượng phát ra ánh sáng, là kết quả của sự tương tác giữa năng lượng chiếu sáng và những
phân tử của bề mặt đối tượng. Một đối tượng màu xanh dương sẽ có bề mặt màu xanh
dương khi chiếu ánh sáng trắng vào. Nhưng đối tượng đó sẽ có màu tím khi chiếu ánh
sáng đỏ vào.
Với sự phát triển mạnh mẽ của các thiết bị máy tính, các máy xử lý màu sắc trở nên
thông dụng. Chúng ta có các thiết bị như máy quay phim màu, thiết bị chiếu màu và
những phần mềm xử lý ảnh màu. Máy móc có thể dùng màu sắc cho những mục đích của
con người. Đặc biệt, màu sắc rất thuận tiện bởi vì nó cung cấp phép đo lường đa dạng tại
mỗi điểm ảnh đơn, có thể phân lớp, phân loại mà không cần đến những sự xử lý không
gian phức tạp để đưa đến quyết định. Do đó, việc lựa chọn mô hình màu thích hợp và sử

dụng lược đồ lượng hoá màu thích hợp sẽ giảm bớt độ phân giải màu. Đây là các vấn đề
quan trọng trong việc truy vấn ảnh dựa trên màu sắc.
Trong những bài toán về tra cứu ảnh dựa vào nội dung thì sử dụng đặc trưng màu sắc
là dễ tra cứu và phổ biến. Vì vậy em đã chọn đặc trưng màu sắc để giải quyết bài toán
này. Em sử dụng lược đồ lượng hóa màu. Cụ thể là giảm ảnh từ 256 màu xuống còn 27
màu.
Phần dưới đây chúng ta sẽ đi tìm hiểu kỹ hơn về bài toán và những thuật toán mà em
sử dụng trong đồ án này.
2.1 Phát biểu bài toán
Trước hết chúng ta sẽ tìm hiểu về truy vấn đa điểm. Vậy truy vấn đa điểm là gì?

25


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×