Tải bản đầy đủ (.doc) (74 trang)

Nghiên cứu phương pháp phát hiện biên ảnh màu bằng wavelet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.04 MB, 74 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

PHẠM THỊ THÙY

NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN
BIÊN ẢNH MẦU BẰNG WAVELET

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH


ii
THÁI NGUYÊN - 2012


ĐẠI HỌC THÁI NGUYÊN
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG

PHẠM THỊ THÙY

NGHIÊN CỨU PHƯƠNG PHÁP PHÁT HIỆN
BIÊN ẢNH MẦU BẰNG WAVELET
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Người hướng dẫn khoa học: PGS.TS. NGÔ QUỐC TẠO


ii



THÁI NGUYÊN - 2012


i

BẢN CAM ĐOAN
Tên tôi là: Phạm Thị Thùy
Lớp: Cao học Công nghệ thông tin K9A
Khoá học: 2010 - 2012
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01
Cơ sở đào tạo: Trường Đại học Công nghệ thông tin và Truyền thông Thái
Nguyên
Giáo viên hướng dẫn: PGS.TS Ngô Quốc Tạo
Cơ quan công tác: Trường Đại học Sư phạm – Đại học Thái Nguyên.
Tôi xin cam đoan toàn bộ nội dung được trình bày trong bản luận văn
này là kết quả tìm hiểu và nghiên cứu của riêng tôi, trong quá trình nghiên
cứu luận văn “Nghiên cứu phương pháp phát hiện biên ảnh màu bằng
wavelet” các kết quả và dữ liệu được nêu ra là hoàn toàn trung thực. Mọi
thông tin trích dẫn đều được tuân theo luật sở hữu trí tuệ, có liệt kê rõ ràng
các tài liệu tham khảo.
Tôi xin chịu hoàn toàn trách nhiệm với những nội dung được viết trong
luận văn này.
Thái Nguyên, ngày 10 tháng 09 năm 2012
HỌC VIÊN

PHẠM THỊ THÙY



ii

LỜI CẢM ƠN
Luận văn được thực hiện tại Trường Đại học Công nghệ Thông tin và
Truyền Thông – Đại học Thái Nguyên dưới sự hướng dẫn của thầy PGS. TS
Ngô Quốc Tạo.
Trước hết em xin bày tỏ lòng biết ơn sâu sắc tới thầy PGS. TS Ngô
Quốc Tạo - Viện Công nghệ thông tin, người đã tận tình hướng dẫn giúp đỡ
để em hoàn thành tốt luận văn của mình.
Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo Trường Đại học
Công nghệ Thông tin và Truyền Thông - Đại học Thái Nguyên, cùng các thầy
cô giáo đã nhiệt tình giảng dạy, truyền đạt kiến thức cho em trong suốt quá
trình học tập tại trường cũng như quá trình làm luận văn này .
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, các đồng nghiệp
những người đã động viên, giúp đỡ và tạo điều kiện cho em trong quá trình
học tập và hoàn thành luận văn.

Thái Nguyên, ngày 10 tháng 9 năm 2012
HỌC VIÊN

PHẠM THỊ THÙY


iii

MỤC LỤC


iv


DANH MỤC CÁC CHỮ VIẾT TẮT
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14

CHỮ VIẾT TẮT
CMY
CMYK
CIE
DHT
D
DWT
DHT
GVDD
HSV
MVDD
STFT
RGB

VDD
VRD

TÊN TIẾNG ANH
Cyan magenta yellow
Cyan magenta yellow black
Commission international d’E clairage
Discrete Haar transform
Dimention
Discrete Wavelet Transform
Discrete Haar transform
Generalized vector dispersion detector
Hue, Saturation, Intensity
Minimin vector dispersion detector
Short time fourier Transform
Red green blue
Vector dispersion detectior
Vector range detector


v

DANH MỤC CÁC HÌNH VẼ
1. Lý do lựa chọn đề tài....................................................................................1
2. Mục tiêu nghiên cứu.....................................................................................1
3. Phạm vi nghiên cứu......................................................................................1
4. Phương pháp nghiên cứu..............................................................................2
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài.........................................2
6. Cấu trúc của luận văn...................................................................................2



1

MỞ ĐẦU
1. Lý do lựa chọn đề tài
Có thể khẳng định CNTT đang giữ một vai trò quan trọng trong sự phát
triển của loài người nói chung và sự phát triển kinh tế, chính trị xã hội của
một đất nước nói riêng, Việt Nam cũng không là một ngoại lệ. Với những
bước tiến như vũ bão những thập kỉ cuối của thế kỉ XX, CNTT đã tạo nên một
diện mạo mới cho cuộc sống con người và mở ra cho nhân loại một kỉ nguyên
mới – kỉ nguyên công nghệ thông tin.
Có nhiều tài liệu nói về phương pháp phát hiện biên ảnh. Mục đích của
việc dò biên sẽ đánh dấu những điểm trong một ảnh số mà có sự thay đổi đột
ngột về độ xám, tập hợp nhiều điểm biên tạo thành biên hay đường biên bao
quanh ảnh. Các phương pháp phát hiện biên ảnh như: Gradient, Laplace,
Canny, wavelet. Trong đó phương pháp phát hiện biên theo wavelet ngày
càng được sử dụng nhiều ở trong nước cũng như trên thế giới. Vì vậy, tôi thấy
cần phải đi sâu vào nghiên cứu phương pháp phát hiện biên ảnh bằng wavelet
nhằm hoàn thiện, nâng cao hiệu quả và chất lượng việc phát hiện biên cho ảnh
màu trong xử lý ảnh số.
Trong khuôn khổ luận văn thạc sĩ, tôi chọn đề tài nghiên cứu:
“Nghiên cứu phương pháp phát hiện biên ảnh màu bằng wavelet”
2. Mục tiêu nghiên cứu
Luận văn nghiên cứu hệ thống lý thuyết liên quan đến việc phát hiện
biên trong ảnh. Cụ thể trong luận văn là nghiên cứu về phát hiện biên cho ảnh
màu bằng wavelet.
3. Phạm vi nghiên cứu
- Giới thiệu tổng quan về xử lý ảnh và biên.
- Phương pháp phát hiện biên cho ảnh màu.
- Phương pháp phát hiện biên theo wavelet và thử nghiệm.



2

4. Phương pháp nghiên cứu
Trong luận văn sử dụng phương pháp nghiên cứu tài liệu liên quan đến
việc phát hiện biên ảnh và kế thừa kết quả nghiên cứu của một số luận văn, đề
tài nghiên cứu khoa học.
Trên cơ sở nghiên cứu lý thuyết cơ bản xử lý ảnh và các phương pháp
phát hiện biên ảnh, đặc biệt dùng phương pháp wavelet tiến hành cài đặt
chương trình.
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Xử lý ảnh được áp dụng trong nhiều lĩnh vực khác nhau như y học, vật
lý, hóa học, tìm kiếm tội phạm, trong quân sự và trong một số lĩnh vực
khác… Vì vậy việc nghiên cứu phương pháp wavelet để phát hiện biên cho
ảnh màu là rất cần thiết.
Dùng wavelet để phát hiện biên ảnh là phương pháp đã và đang được
nghiên cứu và ứng dụng rất mạnh mẽ ở nhiều nước trên thế giới.
6. Cấu trúc của luận văn
Ngoài phần mở đầu và phần kết luận, luận văn được trình bày thành
ba chương:
Chương 1: Tổng quan về xử lý ảnh và phương pháp phát hiện biên cho
ảnh màu.
Chương 2: Các phương pháp phát hiện biên theo wavelet
Chương 3: Chương trình phát hiện biên ảnh bằng phương pháp wavelet
và nhận xét đánh giá các phương pháp


3


CHƯƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHƯƠNG PHÁP PHÁT HIỆN
BIÊN CHO ẢNH MÀU
1.1. Tổng quan về xử lý ảnh
1.1.1. Khái niệm xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Trong những năm trở lại đây cùng với sự phát triển
của phần cứng máy tính, xử lý ảnh và đồ họa phát triển một cách mạnh mẽ,
ngày càng có nhiều ứng dụng trong cuộc sống và nó đóng một vai trò quan
trọng trong tương tác người máy [2].
Quá trình xử lý nhận dạng ảnh là một quá trình thao tác nhằm biến đổi
một ảnh đầu vào để cho ra một kết quả mong muốn. Kết quả đầu ra của một
quá trình xử lý ảnh có thể là một ảnh "tốt hơn" ảnh ban đầu hoặc một kết luận.
Như vậy mục tiêu của xử lý ảnh có thể chia làm ba hướng như sau:
- Xử lý ảnh ban đầu để cho ra một ảnh mới tốt hơn theo một mong muốn
của người dùng (ví dụ: ảnh mờ cần xử lý để được rõ hơn).
- Phân tích ảnh để thu được thông tin nào đó giúp cho việc phân loại và nhận
biết ảnh (ví dụ: phân tích ảnh vân tay để trích chọn các đặc trưng vân tay).
- Từ ảnh đầu vào mà có những nhận xét, kết luận ở mức cao hơn, sâu
hơn (ví dụ: ảnh một tai nạn giao thông phác họa hiện trường tai nạn).
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tượng trong không gian và nó có thể xem như một hàm n biến P(c 1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem như một ảnh n chiều.
1.1.2. Các giai đoạn trong quá trình xử lý ảnh
Quá trình xử lý một ảnh đầu vào nhằm thu được một ảnh đầu ra mong
muốn thường phải trải qua rất nhiều bước khác nhau. Các bước cơ bản của
một quá trình xử lý ảnh được thể hiện thông qua hình sau:



4

Hình1.1. Các giai đoạn chính trong xử lý ảnh
- Quá trình thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh. Ảnh có thể được thu
nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay tranh ảnh được quét trên
máy scan hay ảnh thu nhận được từ camera,… Gốc của ảnh là ảnh liên tục về
không gian và độ sáng. Để xử lý bằng máy tính, ảnh cần phải được số hoá.
Số hóa ảnh là quá trình rời rạc hoá về không gian và lượng tử hoá về giá
trị. Quá trình rời rạc hoá về không gian là quá trình thu nhận những điểm rời
rạc từ một ảnh liên tục. Quá trình này cũng chính là việc tìm cách biểu diễn cả
một ảnh lớn có vô số điểm, bởi một số hữu hạn điểm, sao cho không làm mất
đi hay thay đổi tính chất của ảnh, để việc lưu trữ và xử lý ảnh được dễ dàng.
Còn quá trình lượng tử hoá về giá trị là quá trình rời rạc hoá về mặt giá
trị để có thể đơn giản hoá việc tính toán và đưa vào máy để xử lý. Tuỳ theo
từng loại ảnh, độ chính xác yêu cầu và khả năng xử lý của máy tính mà ta có
các mức lượng tử thích hợp.
- Quá trình phân tích ảnh: thực chất bao gồm một số công đoạn cơ bản
sau đây:


5

Tăng cường chất lượng ảnh: việc này là cần thiết do một số nguyên nhân
nào đó (nguồn sáng kém, ảnh bị nhiễu,...) dẫn tới việc chất lượng thu nhận
ảnh kém. Việc tăng cường và khôi phục ảnh để làm nổi bật một số đặc trưng
chính của ảnh.
Phát hiện đặc tính như biên, phân vùng, trích chọn các đặc tính của
ảnh,...
- Cuối cùng, tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,

phân lớp hoặc hỗ trợ ra quyết định cho một hệ thống cụ thể nào đó.
1.1.3. Một số vấn đề cơ bản trong xử lý ảnh
1.1.3.1. Các khái niệm
- Điểm ảnh (Picture Element)
Ảnh trong thực tế là ảnh liên tục về không gian và về giá trị độ sáng [3].
Quá trình số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập
điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám).
Khoảng cách giữa các điểm ảnh đó được thiết lập sao cho mắt người không
phân biệt được ranh giới giữa chúng. Mỗi một điểm như vậy gọi là điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều,
mỗi pixel ứng với cặp tọa độ (x, y).
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được
chọn thích hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được
gọi là một phần tử ảnh.
- Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên
một ảnh số được hiển thị. Khoảng cách giữa các điểm ảnh phải được chọn sao
cho mắt người vẫn thấy được sự liên tục của ảnh. Khoảng cách đó, hay chính


6

là độ phân giải phân bố theo trục x và y trong không gian hai chiều.
- Mức xám của ảnh
Mức xám của điểm ảnh là kết quả sự mã hóa tương ứng cường độ sáng
của mỗi điểm ảnh bởi một giá trị số tại điểm đó. Đó là kết quả của quá trình
lượng tử hóa.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (mức 256

là mức phổ dụng). Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn
mức xám. Mức xám dùng 1 byte biểu diễn: 28=256 mức (tức là từ 0 đến 255).
- Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô
tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có
thể là 0 hoặc 1.
- Ảnh đen trắng: Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu
trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau.
Người ta phân mức đen trắng đó thành L mức, nếu sử dụng số bit B=8 bít để
mã hóa mức đen trắng (hay mức xám) thì L được xác định :
L = 2B (trong ví dụ của ta L = 28 = 256 mức)
Nếu L = 2, B = 1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh
nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn
hơn 2 ta có ảnh đa cấp xám.
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh được mã hóa trên 1 bit,
còn với ảnh 256 mức, mỗi điểm ảnh được mã hóa trên 8 bit. Như vậy, với ảnh
đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có
thể biểu diễn được là 256. Mỗi mức xám được biểu diễn dưới dạng là một số
nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cường
độ đen nhất và 255 biểu diễn cho mức cường độ sáng nhất.


7

Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi như các phần tử
logic. Ứng dụng chính của nó được dùng theo tính logic để phân biệt đối
tượng ảnh với nền hay để phân biệt điểm biên với điểm khác.
- Ảnh màu: Trong hệ màu RGB (Red, Green, Blue) để tạo nên thế giới
màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
28*3=224≈ 16,7 triệu màu.
Nếu bạn kiểm tra màn hình của một tivi khi nó được bật lên, bạn sẽ chú

ý thấy tại tất cả các điểm ảnh màu được tạo nên bằng ba vòng tròn nhỏ hoặc
tam giác có màu đỏ, lục, lam. Sự thay đổi độ sáng của ba phần tử màu này tạo
nên màu sắc của điểm ảnh. Trong ảnh số thì các điểm ảnh được biểu diễn
bằng một số từ có cùng một số bit cho các màu đỏ, lục, lam. Ví dụ như ảnh
màu được biểu diễn bằng 16 bit thì đều có 5 bit để biểu diễn cho mỗi màu, bit
cuối cùng dùng cho một vài chức năng đặc biệt như ngăn xếp. Trong một
khung số thì bit cuối cùng thông thường để chỉ ra điểm ảnh này được lấy từ
bộ đệm khung (bộ nhớ ngăn xếp) hay là từ tín hiệu video bên ngoài (ngăn xếp
trực tiếp). Trong hệ thống 16 bít 32,768 màu có thể được biểu diễn với ba
màu riêng có khả năng thể hiện 32 trạng thái.

G
Bóng

Độ chói
W




R

xám
Đen
B
Hình 1.2. Hình chóp màu


8


Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ
(R), lục (G), lơ (B) là thường thu nhận trên các dải băng tần khác nhau. Với
ảnh màu, cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ khác là các
số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red),
lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24 bit. 24
bit này được chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu
khác nhau (thường L = 256). Mỗi khoảng này biểu diễn cho cường độ sáng
của một trong các màu chính.
Do đó, để lưu trữ ảnh màu người ta có thể lưu trữ từng màu riêng biệt,
mỗi màu lưu trữ như một ảnh đa cấp xám. Do đó, không gian nhớ dành cho
một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ.
1.1.3.2. Biểu diễn ảnh
Sau quá trình số hoá sẽ thu được một ma trận tương ứng với ảnh cần xét,
mỗi phần tử của ma trận tương ứng với một điểm ảnh. Ảnh thường được biểu
diễn bởi một mảng hai chiều I(n,p) gồm n dòng và p cột. Như vậy, ảnh gồm n
x p pixels và người ta thường kí hiệu I(x,y) để chỉ một pixel cụ thể trong ảnh.
Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x,y là các
biến tọa độ. Giá trị số ở điểm (x,y) tương ứng với giá trị xám hoặc độ sáng
của ảnh (x là các cột còn y là các hàng). Giá trị của hàm ảnh f(x,y) được hạn
chế trong phạm vi của các số nguyên dương 0 ≤ f ( x, y) ≤ f max
Thông thường đối với ảnh xám, giá trị f max là 255 (28 =256) và mỗi phần
tử ảnh được mã hóa bởi một byte. Ảnh có thể được biểu diễn theo một trong
hai mô hình: mô hình Vector hoặc mô hình Raster.
Mô hình Raster: là mô hình biểu diễn ảnh thông dụng nhất hiện nay.
Ảnh được biểu diễn dưới dạng ma trận các điểm ảnh. Tùy theo nhu cầu
thực tế mà mỗi điểm ảnh có thể được biểu diễn bởi một hay nhiều bit. Mô
hình Raster thuận lợi cho việc thu nhận, hiển thị và in ấn.


9


Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lưu trữ, dễ
dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ưu điểm
cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm,…Theo những yêu
cầu này thì kỹ thuật biểu diễn vector tỏ ra ưu việt hơn.
Trong mô hình này, người ta sử dụng hướng vector của các điểm ảnh lân
cận để mã hóa và tái tạo lại hình ảnh ban đầu. Các ảnh vector được thu nhận
trực tiếp từ các thiết bị số hóa hoặc được chuyển đổi từ các ảnh Raster thông
qua các chương trình vector hóa.
Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ
trong vùng lân cận của các điểm ảnh. Có hai loại lân cận của điểm ảnh được
quan tâm nhiều nhất: điểm 4 láng giềng và 8 láng giềng.

Hình 1.3. Hai loại lân cận của điểm ảnh
1.1.3.3. Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lượng của một
ảnh để đưa ra một mô tả đầy đủ về ảnh. Các kỹ thuật được sử dụng ở đây
nhằm mục đích xác định biên của ảnh. Có nhiều kỹ thuật khác nhau như lọc
vi phân hay dò theo quy hoạch động.
Người ta cũng dùng các kỹ thuật phân tích ảnh để phân vùng ảnh. Từ
ảnh thu được, người ta tiến hành kỹ thuật tách (split) hay hợp (merge) dựa


10

theo các tiêu chuẩn đánh giá như: màu sắc, cường độ, v...v. Các phương pháp
được biết đến như Quad-Tree, mảnh hoá biên, nhị phân hoá đường biên và
các kỹ thuật phân lớp dựa theo cấu trúc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tượng mà người

ta muốn đặc tả nó. Quá trình nhận dạng thường đi sau quá trình trích chọn
các đặc tính chủ yếu của đối tượng. Có hai kiểu mô tả đối tượng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, người ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tượng khác nhau như: nhận dạng ảnh vân tay, nhận dạng chữ (chữ
cái, chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hoá quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lượng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v...v) phục vụ cho nhiều lĩnh vực.
Ngoài 2 kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơ ron đang được áp dụng và cho kết quả khả quan
trong nhận dạng ký tự.
1.1.3.5. Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi
trên mạng. Như đã nói ở trên, lượng thông tin để biểu diễn cho một ảnh là rất
lớn. Ví dụ, một ảnh đen trắng cỡ 512 x 512 với 256 mức xám chiếm 256K
bytes. Do đó làm giảm lượng thông tin hay nén dữ liệu là một nhu cầu cần
thiết. Nhiều phương pháp nén dữ liệu đã được nghiên cứu và áp dụng cho loại
dữ liệu đặc biệt này.
1.2. Biên ảnh và vai trò của biên trong phân tích ảnh


11

1.2.1. Vị trí của biên trong phân tích ảnh
Phân tích ảnh là một quá trình gồm nhiều giai đoạn [1]. Đầu tiên là giai
đoạn tiền xử lý ảnh. Sau giai đoạn này, ảnh được tăng cường hay được khôi
phục để làm nổi các đặc tính (feature extraction), tiếp theo là phân đoạn ảnh

(segmentation) thành các phần tử. Thí dụ, như phân đoạn dựa theo biên, dựa
theo vùng,… Và tuỳ theo các ứng dụng, giai đoạn tiếp theo có thể là nhận
dạng ảnh (phân thành các lớp có miêu tả) hay là giải thích và miêu tả ảnh.
Các đặc trưng của ảnh thường gồm: mật độ xám, phân bổ xác xuất, phân
bổ không gian, biên ảnh. Các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên.
Do đó, biên có tầm quan trọng đặc biệt trong quá trình phân tích ảnh.
1.2.2. Biên và các kiểu biên đơn giản
Biên là một vấn đề chủ yếu và rất quan trọng trong quá trình phân tích
ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên. Hiện nay cũng chưa
có một định nghĩa chính xác nào về biên của ảnh, mỗi định nghĩa được đưa ra
đều sử dụng trong một số trường hợp nhất định. Song ta có thể hiểu là:
Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột ngột
về mức xám. Tập hợp các điểm biên tạo thành biên hay đường bao ảnh của
ảnh (boundary).
Thí dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là
điểm đen và có ít nhất một điểm trắng là lân cận.
Để hình dung tầm quan trọng của biên ta xét ví dụ sau: Khi người họa
sĩ vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng như cái mặt bàn,
chân bàn mà không cần thêm các chi tiết khác, người xem đã có thể nhận ra
nó là một cái bàn. nếu ứng dụng của ta là phân lớp nhận diện đối tượng, thì
coi như nhiệm vụ đã hoàn thành. Tuy nhiên nếu đòi hỏi thêm về các chi tiết
khác như vân gỗ hay màu sắc,…thì với chừng ấy thông tin là chưa đủ.


12

Nhìn chung về mặt toán học người ta coi điểm biên của ảnh là điểm có
sự biến đổi đột ngột về độ xám. Như vậy phát hiện biên một cách lý tưởng là
xác định được tất cả các đường bao trong các đối tượng. Định nghĩa toán học
của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên. Điều quan trọng là sự

biến thiên mức xám giữa các ảnh trong một vùng thường là nhỏ, trong khi đó
biến thiên mức xám của điểm vùng giáp ranh (khi qua biên) lại khá lớn.
Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và được tính
toán từ những điểm lân cận nó. Đó là một biến Vector bao gồm hai thành phần:
- Độ lớn của Gadient.
- Hướng φ được quay đối với hướng Gradient ψ.
Như mô tả trong (hình 1.4) dưới đây, các đường biên khép kín là các đường
có cùng độ sáng; quy ước hướng 00 là chỉ hướng đông.

Hình 1.4. Biên khép kín
Biên thường được sử dụng trong phân tích ảnh để xác định đường bao
của các vùng trong ảnh. Đường bao và các thành phần của nó (các điểm biên)
vuông góc với hướng của Gradient.
1.2.2.1. Biên lý tưởng
Việc phát hiện biên một cách lý tưởng là việc xác định được tất cả các đường
bao trong đối tượng. Biên là sự thay đổi đột ngột về mức xám nên sự thay đổi cấp
xám giữa các vùng trong ảnh càng lớn thì càng dễ dàng nhận ra biên.


13

Một biên được coi đó là biên lý tưởng khi mà có sự thay đổi cấp xám lớn
giữa các vùng trong ảnh. Biên này thường chỉ xuất hiện khi có sự thay đổi cấp
xám qua một điểm ảnh.
Hình minh hoạ điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột:
u

x

Hình1.5. Đường biên lý tưởng

1.2.2.2. Biên dốc
Biên dốc xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều điểm
ảnh. Vị trí của cạnh được xem như vị trí chính giữa của đường dốc nối giữa
cấp xám thấp và cấp xám cao. Tuy nhiên đây chỉ là đường dốc trong toán học,
từ khi ảnh được kỹ thuật số hoá thì đường dốc không còn là đường thẳng mà
thành những đường lởm chởm, không trơn.
u

x

Hình 1.6. Biên dốc
1.2.2.3. Biên không trơn
Trên thực tế, ảnh thường có biên không lý tưởng, các điểm ảnh trên ảnh
thường có sự thay đổi mức xám đột ngột và không đồng nhất, đặc biệt là ảnh


14

nhiễu. Trong trường hợp không nhiễu (biên lý tưởng), bất cứ một sự thay đổi
cấp xám nào cũng thông báo sự tồn tại của một biên (trường hợp đó khó có khả
năng xảy ra). Ảnh thường là không lý tưởng có thể là do các nguyên nhân sau:
- Hình dạng không sắc nét.
- Nhiễu do một loạt các yếu tố như: kiểu thiết bị nhập ảnh, cường độ ánh
sáng, nhiệt độ, hiệu ứng áp suất, chuyển động, bụi,… chưa chắc rằng hai điểm
ảnh có cùng giá trị cấp xám khi được nhập lại có cùng cấp xám đó trong ảnh. Kết
quả của nhiễu trên ảnh gây ra một sự biến thiên ngẫu nhiên giữa các điểm ảnh. Sự
xuất hiện ngẫu nhiên của các điểm ảnh có mức xám chênh lệch cao làm cho các
đường biên dốc trở lên không trơn chu mà trở thành các đường biên gồ ghề, mấp
mô, không nhẵn, đây chính là đường biên trên thực tế.
Ngày nay, những phương pháp phát hiện biên hiện đại thường kết hợp

nhiễu vào trong mô hình của bài toán và trong quá trình phát hiện biên cũng
được tính đến. Còn khái niệm về biên nêu ở trên được sử dụng để xây dựng
các phương pháp phát hiện biên trong quá khứ, những mô hình về cách này
được coi là đơn giản và sơ sài.
u

x

Hình1.7. Biên không trơn
1.3. Các hệ màu và biểu diễn ảnh màu
1.3.1. Cơ sở của màu sắc


15

Ánh sáng là một dạng của năng lượng sóng điện từ có bước sóng vào
khoảng từ 400 nm (nanomet) cho ánh sáng tím và vào khoảng 700 nm cho
ánh sáng đỏ.

Hình1.8. Dải sóng của các ánh sáng nhìn thấy được
Tất cả các bước sóng này được cảm nhận bởi mắt người như là một sắc
màu. Tất cả các sắc màu này nằm trong ánh sáng trắng của mặt trời, với năng
lượng nằm trong khoảng từ hồng ngoại đến cực tím. Màu sắc của một vật thể
là một hàm của các bước sóng không bị hấp thụ phản chiếu từ vật thể. Đó là
lý do tại sao mà một vật thể có các màu sắc khác nhau phụ thuộc vào ánh sáng
mà nó được quan sát.
Để xác định một ánh sáng màu thì các yếu tố sau đây cần đề cập đến :
Độ sáng hay chói: Nó là tổng hợp của ánh sáng nhận được bởi mắt
không kể tới màu sắc. Nó nằm trong khoảng từ lờ mờ tối đến rất sáng hoặc
chói mắt .

Sắc màu: Chính là màu có phổ trội hơn trong ánh sáng.


16

Bão hoà màu: Nó tạo ra độ tinh khiết phổ của màu trong ánh sáng. Một
màu sẽ trở nên thuần khiết hơn hay độ bão hòa cao hơn khi nó có ít màu xám.
Trong thực tế điều này có nghĩa là có ít thành phần của tổng màu đối lập hơn
hiện diện trong một màu nào đó.
1.3.2. Các hệ màu
1.3.2.1. Biểu đồ màu CIE
Năm 1931: CIE (Commision Internationale de l’Eclairage) xây dựng
màu cơ sở chuẩn quốc tế:
• Cho phép các màu khác được định nghĩa như tổng trọng lượng của ba
màu cơ sở.
• Do không tồn tại 3 màu cơ sở chuẩn trong phổ nhìn thấy để tổng hợp
màu mới -> CIE sử dụng các màu tưởng tượng.
• Mỗi màu cơ sở trong CIE được xác định bằng đường cong phân bổ
năng lượng.
• Nếu A, B, C là tổng số các màu cơ sở chuẩn cần xác định màu cho
trước trong phổ nhìn thấy thì các thành phần của màu sẽ là:

(1.1)
• Nhưng x+y+z=1 cho nên chỉ cần 2 giá trị có thể xác định màu mới
• Cho khả năng biểu diễn mọi màu trên biểu đồ 2D -> Biểu đồ CIE
Các màu riêng RGB: đỏ (Red), lục (Green), lam (Blue) là các màu riêng
vật lý được dùng trong các thí nghiệm vật lý thực sự. Vào năm 1938, CIE đã
đưa ra một tập các màu riêng không vật lý, ký hiệu là X, Y, Z. Cải tiến chính
trong tập màu này là độ sáng được đưa ra trực tiếp như là một màu riêng (Y).
Y sẽ cho ta mức xám từ ảnh màu. Các màu riêng này được rút ra từ các màu

riêng vật lý theo biến đổi tuyến tính cho bởi:


×