Tải bản đầy đủ (.pdf) (73 trang)

Nghiên cứu phương pháp phát hiện biên ảnh mầu bằng Wavelet

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.69 MB, 73 trang )

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG




PHẠM THỊ THÙY




NGHIÊN CỨU PHƢƠNG PHÁP PHÁT HIỆN
BIÊN ẢNH MẦU BẰNG WAVELET





LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH







THÁI NGUYÊN - 2012
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG






PHẠM THỊ THÙY



NGHIÊN CỨU PHƢƠNG PHÁP PHÁT HIỆN
BIÊN ẢNH MẦU BẰNG WAVELET

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01


LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH



Ngƣời hƣớng dẫn khoa học: PGS.TS. NGÔ QUỐC TẠO



THÁI NGUYÊN - 2012

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

i
BẢN CAM ĐOAN

Tên tôi là: Phạm Thị Thùy

Lớp: Cao học Công nghệ thông tin K9A
Khoá học: 2010 - 2012
Chuyên ngành: Khoa học máy tính
Mã số chuyên ngành: 60 48 01
Cơ sở đào tạo: Trƣờng Đại học Công nghệ thông tin và Truyền thông Thái
Nguyên
Giáo viên hƣớng dẫn: PGS.TS Ngô Quốc Tạo
Cơ quan công tác: Trƣờng Đại học Sƣ phạm – Đại học Thái Nguyên.
Tôi xin cam đoan toàn bộ nội dung đƣợc trình bày trong bản luận văn
này là kết quả tìm hiểu và nghiên cứu của riêng tôi, trong quá trình nghiên
cứu luận văn “Nghiên cứu phương pháp phát hiện biên ảnh màu bằng
wavelet” các kết quả và dữ liệu đƣợc nêu ra là hoàn toàn trung thực. Mọi
thông tin trích dẫn đều đƣợc tuân theo luật sở hữu trí tuệ, có liệt kê rõ ràng
các tài liệu tham khảo.
Tôi xin chịu hoàn toàn trách nhiệm với những nội dung đƣợc viết trong
luận văn này.
Thái Nguyên, ngày 10 tháng 09 năm 2012
HỌC VIÊN



PHẠM THỊ THÙY



Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

ii
LỜI CẢM ƠN
Luận văn đƣợc thực hiện tại Trƣờng Đại học Công nghệ Thông tin và

Truyền Thông – Đại học Thái Nguyên dƣới sự hƣớng dẫn của thầy PGS. TS
Ngô Quốc Tạo.
Trƣớc hết em xin bày tỏ lòng biết ơn sâu sắc tới thầy PGS. TS Ngô
Quốc Tạo - Viện Công nghệ thông tin, ngƣời đã tận tình hƣớng dẫn giúp đỡ
để em hoàn thành tốt luận văn của mình.
Em xin gửi lời cảm ơn chân thành đến các thầy cô giáo Trƣờng Đại học
Công nghệ Thông tin và Truyền Thông - Đại học Thái Nguyên, cùng các thầy
cô giáo đã nhiệt tình giảng dạy, truyền đạt kiến thức cho em trong suốt quá
trình học tập tại trƣờng cũng nhƣ quá trình làm luận văn này .
Cuối cùng em xin gửi lời cảm ơn đến gia đình, bạn bè, các đồng nghiệp
những ngƣời đã động viên, giúp đỡ và tạo điều kiện cho em trong quá trình
học tập và hoàn thành luận văn.


Thái Nguyên, ngày 10 tháng 9 năm 2012
HỌC VIÊN


PHẠM THỊ THÙY



Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

iii
MỤC LỤC
Bản cam đoan i
Lời cảm ơn ii
Mục lục iii
Danh mục các chữ viết tắt vi

Danh mục các hình vẽ vii
MỞ ĐẦU 1
1. Lý do lựa chọn đề tài 1
2. Mục tiêu nghiên cứu 1
3. Phạm vi nghiên cứu 1
4. Phƣơng pháp nghiên cứu 2
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài 2
6. Cấu trúc của luận văn 2
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHƢƠNG PHÁP PHÁT
HIỆN BIÊN CHO ẢNH MÀU 3
1.1. Tổng quan về xử lý ảnh 3
1.1.1. Khái niệm xử lý ảnh 3
1.1.2. Các giai đoạn trong quá trình xử lý ảnh 3
1.1.3. Một số vấn đề cơ bản trong xử lý ảnh 5
1.1.3.1. Các khái niệm 5
1.1.3.2. Biểu diễn ảnh 8
1.1.3.3. Phân tích ảnh 9
1.1.3.4. Nhận dạng ảnh 10
1.1.3.5. Nén ảnh 10
1.2. Biên ảnh và vai trò của biên trong phân tích ảnh 11
1.2.1. Vị trí của biên trong phân tích ảnh 11
1.2.2. Biên và các kiểu biên đơn giản 11

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

iv
1.2.2.1. Biên lý tƣởng 12
1.2.2.2. Biên dốc 13
1.2.2.3. Biên không trơn 14
1.3. Các hệ màu và biểu diễn ảnh màu 15

1.3.1. Cơ sở của màu sắc 15
1.3.2. Các hệ màu 16
1.3.2.1. Biểu đồ màu CIE 16
1.3.2.2. Mô hình màu RGB 18
1.3.2.3. Mô hình màu CMY 19
1.3.2.4. Mô hình màu CMYK 20
1.3.2.5. Mô hình màu HSV 20
1.4. Các phƣơng pháp phát hiện biên ảnh màu 21
1.4.1. Tách biên ảnh màu dùng phƣơng pháp Gradient 21
1.4.2. Tách biên ảnh màu dùng phƣơng pháp trƣờng Vector Field 24
1.4.3. Tách biên ảnh màu dùng bộ dò biên Vector Order-Statistic 25
1.5. Kết luận chƣơng 1 26
CHƢƠNG 2: PHƢƠNG PHÁP PHÁT HIỆN BIÊN THEO WAVELET 27
2.1. Giới thiệu 27
2.2. Xây dựng một Wavelet 28
2.3. Biến đổi wavelet rời rạc (DWT – Discrete wavelet transform) 29
2.4. Phƣơng pháp phát hiện biên bởi biến đổi wavelet rời rạc (DWT) 32
2.5. Wavelet Haar 34
2.5.1. Hàm tỉ lệ Haar 34
2.5.2. Xây dựng Wavelet Haar 35
2.5.3. Biến đổi Haar rời rạc (DHT - Discrete Haar transform) 36
2.5.4. DHT hai chiều (2D – Dimention) 37
2.5.5. Phát hiện cạnh sử dụng wavelet Haar 39

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

v
2.6. Wavelet Daubechies 40
2.6.1. Xây dựng Daublets 40
2.6.2. Biến đổi Wavelet Daubechies 2-D (Dimention) 43

2.6.3. Phát hiện cạnh sử dụng Daublets 44
2.7. Wavelets Coifman 44
2.8. Wavelets biorthogonal 48
2.8.1. Xây dựng wavelets Biorthogonal 48
2.8.2. Tính chất của wavelets Biorthogonal 49
2.8.3. Phát hiện cạnh sử dụng Wavelets Biorthogonal 49
2.9. Kết luận chƣơng 2 50
CHƢƠNG 3: CHƢƠNG TRÌNH PHÁP HIỆN BIÊN ẢNH BẰNG PHƢƠNG
PHÁP WAVELET VÀ NHẬN XÉT ĐÁNH GIÁ CÁC PHƢƠNG PHÁP 51
3.1. Cài đặt thử nghiệm chƣơng trình Wavelet transform 51
3.2. So sánh các phƣơng pháp phát hiện biên 57
3.3. Kết luận chƣơng 3 59
KẾT LUẬN 60
TÀI LIỆU THAM KHẢO 61
PHỤ LỤC 62







Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

vi
DANH MỤC CÁC CHỮ VIẾT TẮT

STT
CHỮ VIẾT TẮT
TÊN TIẾNG ANH

1
CMY
Cyan magenta yellow
2
CMYK
Cyan magenta yellow black
3
CIE
Commission international d’E clairage
4
DHT
Discrete Haar transform
5
D
Dimention
6
DWT
Discrete Wavelet Transform
7
DHT
Discrete Haar transform
8
GVDD
Generalized vector dispersion detector
9
HSV
Hue, Saturation, Intensity
10
MVDD
Minimin vector dispersion detector

11
STFT
Short time fourier Transform
12
RGB
Red green blue
13
VDD
Vector dispersion detectior
14
VRD
Vector range detector


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

vii
DANH MỤC CÁC HÌNH VẼ
Hình1.1. Các giai đoạn chính trong xử lý ảnh 4
Hình 1.2. Hình chóp màu 7
Hình 1.3. Hai loại lân cận của điểm ảnh 9
Hình 1.4. Biên khép kín 12
Hình1.5. Đƣờng biên lý tƣởng 13
Hình 1.6. Biên dốc 13
Hình1.7. Biên không trơn 14
Hình1.8. Dải sóng của các ánh sáng nhìn thấy đƣợc 15
Hình 1.9. Biểu đồ màu CIE 17
Hình 1.10. Mô hình không gian màu RGB 18
Hình 1.11. Mô hình không gian màu CMY 19
Hình 1.12. Phƣơng pháp pha trộn màu trong cuộc sống 19

Hình 1.13. Mô hình màu HSV 20
Hình 2.1. Sơ đồ kim tự tháp Laplace phát triển bởi Burt và Adelson 30
Hình 2.2. DWT của hai chiều tín hiệu 31
Hình 2.3. Biểu đồ
()x

34
Hình 2.4. Wavelet Haar 36
Hình 2.5. Xấp xỉ của wavelet Daubechies lặp lại 1 đến 5 lần 42
Hình 2.6. Những xấp xỉ của wavelet Daubechies và hàm tỉ lệ 43
Hình 2.7. Các bộ lọc tách và tái tạo của Daubechies 44
Hình 2.8. Xấp xỉ của wavelet coiflets lặp lại 1 đến 5 lần 46
Hình 2.9. Các xấp xỉ wavelet coiflets và hàm tỉ lệ 47
Hình 2.10. Các bộ lọc tách và tái tạo của coiflets 47
Hình 2.11. Xấp xỉ của wavelet bior lặp lại 1 đến 5 lần 48
Hình 2.12. Các bộ lọc tách và tái tạo của biorthogonal 50
Hình 3.1. Biến đổi ảnh với tỉ lệ 1 và bộ lọc daub1. 51

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

viii
Hình 3.2. DWT hai chiều tín hiệu 52
Hình 3.3. Loại bỏ thành phần tần số thấp 52
Hình 3.4. Ảnh biến đổi sau khi xây dựng lại 54
Hình 3.5. Ảnh sau khi đƣợc làm nổi biên 55
Hình 3.6. Biên ảnh sau khi đƣợc khuếch đại 56
Hình 3.7. Biên ảnh theo Gadient, Laplace, Canny 57
Hình 3.8. Ảnh sau khi đƣợc làm nổi biên với wavelet 58






Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1
MỞ ĐẦU
1. Lý do lựa chọn đề tài
Có thể khẳng định CNTT đang giữ một vai trò quan trọng trong sự phát
triển của loài ngƣời nói chung và sự phát triển kinh tế, chính trị xã hội của
một đất nƣớc nói riêng, Việt Nam cũng không là một ngoại lệ. Với những
bƣớc tiến nhƣ vũ bão những thập kỉ cuối của thế kỉ XX, CNTT đã tạo nên một
diện mạo mới cho cuộc sống con ngƣời và mở ra cho nhân loại một kỉ nguyên
mới – kỉ nguyên công nghệ thông tin.
Có nhiều tài liệu nói về phƣơng pháp phát hiện biên ảnh. Mục đích của
việc dò biên sẽ đánh dấu những điểm trong một ảnh số mà có sự thay đổi đột
ngột về độ xám, tập hợp nhiều điểm biên tạo thành biên hay đƣờng biên bao
quanh ảnh. Các phƣơng pháp phát hiện biên ảnh nhƣ: Gradient, Laplace,
Canny, wavelet. Trong đó phƣơng pháp phát hiện biên theo wavelet ngày
càng đƣợc sử dụng nhiều ở trong nƣớc cũng nhƣ trên thế giới. Vì vậy, tôi thấy
cần phải đi sâu vào nghiên cứu phƣơng pháp phát hiện biên ảnh bằng wavelet
nhằm hoàn thiện, nâng cao hiệu quả và chất lƣợng việc phát hiện biên cho ảnh
màu trong xử lý ảnh số.
Trong khuôn khổ luận văn thạc sĩ, tôi chọn đề tài nghiên cứu:
“Nghiên cứu phương pháp phát hiện biên ảnh màu bằng wavelet”
2. Mục tiêu nghiên cứu
Luận văn nghiên cứu hệ thống lý thuyết liên quan đến việ c phá t hiệ n
biên trong ảnh. Cụ thể trong luận văn là nghiên cứu về phát hiện biên cho ảnh
màu bằng wavelet.
3. Phạm vi nghiên cứu

- Giới thiệu tổng quan về xử lý ảnh và biên.
- Phƣơng pháp phát hiện biên cho ảnh màu.
- Phƣơng pháp phát hiện biên theo wavelet và thử nghiệm.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2
4. Phƣơng pháp nghiên cứu
Trong luận văn sử dụng phƣơng pháp nghiên cứu tài liệu liên quan đến
việc phá t hiệ n biên ả nh và kế thừa kết quả nghiên cứu của một số luận văn, đề
tài nghiên cứu khoa học.
Trên cơ sở nghiên cứu lý thuyết cơ bản xƣ̉ lý ả nh và cá c phƣơng pháp
phát hiện biên ảnh , đặ c biệ t dù ng phƣơng phá p wavelet ti ến hành cài đặt
chƣơng trình.
5. Ý nghĩa khoa học và ý nghĩa thực tiễn của đề tài
Xử lý ảnh đƣợc áp dụng trong nhiều lĩnh vực khác nhau nhƣ y học, vật
lý, hóa học, tìm kiếm tội phạm, trong quân sự và trong một số lĩnh vực
khác… Vì vậy việc nghiên cứu phƣơng pháp wavelet để phát hiện biên cho
ảnh màu là rất cần thiết.
Dùng wavelet để phát hiện biên ảnh là phƣơng pháp đã và đang đƣ ợc
nghiên cứu và ứng dụng rất mạnh mẽ ở nhiều nƣớc trên thế giới.
6. Cấu trúc của luận văn
Ngoài phần mở đầu và phần kết luận, luận văn đƣợc trình bày thành
ba chƣơng:
Chƣơng 1: Tổng quan về xử lý ảnh và phƣơng pháp phát hiện biên cho
ảnh màu.
Chƣơng 2: Các phƣơng pháp phát hiện biên theo wavelet
Chƣơng 3: Chƣơng trình phát hiện biên ảnh bằng phƣơng pháp wavelet
và nhận xét đánh giá các phƣơng pháp








Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

3
CHƢƠNG 1
TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ PHƢƠNG PHÁP PHÁT HIỆN
BIÊN CHO ẢNH MÀU
1.1. Tổng quan về xử lý ảnh
1.1.1. Khái niệm xử lý ảnh
Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Trong những năm trở lại đây cùng với sự phát triển
của phần cứng máy tính, xử lý ảnh và đồ họa phát triển một cách mạnh mẽ,
ngày càng có nhiều ứng dụng trong cuộc sống và nó đóng một vai trò quan
trọng trong tƣơng tác ngƣời máy [2].
Quá trình xử lý nhận dạng ảnh là một quá trình thao tác nhằm biến đổi
một ảnh đầu vào để cho ra một kết quả mong muốn. Kết quả đầu ra của một
quá trình xử lý ảnh có thể là một ảnh "tốt hơn" ảnh ban đầu hoặc một kết luận.
Nhƣ vậy mục tiêu của xử lý ảnh có thể chia làm ba hƣớng nhƣ sau:
- Xử lý ảnh ban đầu để cho ra một ảnh mới tốt hơn theo một mong muốn
của ngƣời dùng (ví dụ: ảnh mờ cần xử lý để đƣợc rõ hơn).
- Phân tích ảnh để thu đƣợc thông tin nào đó giúp cho việc phân loại và nhận
biết ảnh (ví dụ: phân tích ảnh vân tay để trích chọn các đặc trƣng vân tay).
- Từ ảnh đầu vào mà có những nhận xét, kết luận ở mức cao hơn, sâu
hơn (ví dụ: ảnh một tai nạn giao thông phác họa hiện trƣờng tai nạn).
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh đƣợc xem nhƣ

là đặc trƣng cƣờng độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tƣợng trong không gian và nó có thể xem nhƣ một hàm n biến P(c
1
, c
2
, ,
c
n
). Do đó, ảnh trong xử lý ảnh có thể xem nhƣ một ảnh n chiều.
1.1.2. Các giai đoạn trong quá trình xử lý ảnh
Quá trình xử lý một ảnh đầu vào nhằm thu đƣợc một ảnh đầu ra mong
muốn thƣờng phải trải qua rất nhiều bƣớc khác nhau. Các bƣớc cơ bản của
một quá trình xử lý ảnh đƣợc thể hiện thông qua hình sau:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

4


Hình1.1. Các giai đoạn chính trong xử lý ảnh
- Quá trình thu nhận ảnh
Đây là bƣớc đầu tiên trong quá trình xử lý ảnh. Ảnh có thể đƣợc thu
nhận từ vệ tinh qua các bộ cảm ứng (sensor), hay tranh ảnh đƣợc quét trên
máy scan hay ảnh thu nhận đƣợc từ camera,… Gốc của ảnh là ảnh liên tục về
không gian và độ sáng. Để xử lý bằng máy tính, ảnh cần phải đƣợc số hoá.
Số hóa ảnh là quá trình rời rạc hoá về không gian và lƣợng tử hoá về giá
trị. Quá trình rời rạc hoá về không gian là quá trình thu nhận những điểm rời
rạc từ một ảnh liên tục. Quá trình này cũng chính là việc tìm cách biểu diễn cả
một ảnh lớn có vô số điểm, bởi một số hữu hạn điểm, sao cho không làm mất
đi hay thay đổi tính chất của ảnh, để việc lƣu trữ và xử lý ảnh đƣợc dễ dàng.

Còn quá trình lƣợng tử hoá về giá trị là quá trình rời rạc hoá về mặt giá
trị để có thể đơn giản hoá việc tính toán và đƣa vào máy để xử lý. Tuỳ theo
từng loại ảnh, độ chính xác yêu cầu và khả năng xử lý của máy tính mà ta có
các mức lƣợng tử thích hợp.
- Quá trình phân tích ảnh: thực chất bao gồm một số công đoạn cơ bản
sau đây:

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

5
Tăng cƣờng chất lƣợng ảnh: việc này là cần thiết do một số nguyên nhân
nào đó (nguồn sáng kém, ảnh bị nhiễu, ) dẫn tới việc chất lƣợng thu nhận
ảnh kém. Việc tăng cƣờng và khôi phục ảnh để làm nổi bật một số đặc trƣng
chính của ảnh.
Phát hiện đặc tính nhƣ biên, phân vùng, trích chọn các đặc tính của
ảnh,
- Cuối cùng, tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng,
phân lớp hoặc hỗ trợ ra quyết định cho một hệ thống cụ thể nào đó.
1.1.3. Một số vấn đề cơ bản trong xử lý ảnh
1.1.3.1. Các khái niệm
- Điểm ảnh (Picture Element)
Ảnh trong thực tế là ảnh liên tục về không gian và về giá trị độ sáng [3].
Quá trình số hoá ảnh là sự biến đổi gần đúng một ảnh liên tục thành một tập
điểm phù hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám).
Khoảng cách giữa các điểm ảnh đó đƣợc thiết lập sao cho mắt ngƣời không
phân biệt đƣợc ranh giới giữa chúng. Mỗi một điểm nhƣ vậy gọi là điểm ảnh
(PEL: Picture Element) hay gọi tắt là Pixel. Trong khuôn khổ ảnh hai chiều,
mỗi pixel ứng với cặp tọa độ (x, y).
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám
hoặc màu nhất định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc

chọn thích hợp sao cho mắt ngƣời cảm nhận sự liên tục về không gian và mức
xám (hoặc màu) của ảnh số gần nhƣ ảnh thật. Mỗi phần tử trong ma trận đƣợc
gọi là một phần tử ảnh.
- Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh đƣợc ấn định trên
một ảnh số đƣợc hiển thị. Khoảng cách giữa các điểm ảnh phải đƣợc chọn sao
cho mắt ngƣời vẫn thấy đƣợc sự liên tục của ảnh. Khoảng cách đó, hay chính

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

6
là độ phân giải phân bố theo trục x và y trong không gian hai chiều.
- Mức xám của ảnh
Mức xám của điểm ảnh là kết quả sự mã hóa tƣơng ứng cƣờng độ sáng
của mỗi điểm ảnh bởi một giá trị số tại điểm đó. Đó là kết quả của quá trình
lƣợng tử hóa.
Các thang giá trị mức xám thông thƣờng: 16, 32, 64, 128, 256 (mức 256
là mức phổ dụng). Lý do từ kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn
mức xám. Mức xám dùng 1 byte biểu diễn: 2
8
=256 mức (tức là từ 0 đến 255).
- Ảnh nhị phân: ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô
tả 2
1
mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ có
thể là 0 hoặc 1.
- Ảnh đen trắng: Ảnh đen trắng chỉ bao gồm 2 màu: màu đen và màu
trắng (không chứa màu khác) với mức xám ở các điểm ảnh có thể khác nhau.
Ngƣời ta phân mức đen trắng đó thành L mức, nếu sử dụng số bit B=8 bít để
mã hóa mức đen trắng (hay mức xám) thì L đƣợc xác định :

L = 2
B
(trong ví dụ của ta L = 2
8
= 256 mức)
Nếu L = 2, B = 1, nghĩa là chỉ có 2 mức: mức 0 và mức 1, còn gọi là ảnh
nhị phân. Mức 1 ứng với màu sáng, còn mức 0 ứng với màu tối. Nếu L lớn
hơn 2 ta có ảnh đa cấp xám.
Nói cách khác, với ảnh nhị phân mỗi điểm ảnh đƣợc mã hóa trên 1 bit,
còn với ảnh 256 mức, mỗi điểm ảnh đƣợc mã hóa trên 8 bit. Nhƣ vậy, với ảnh
đen trắng: nếu dùng 8 bit (1 byte) để biểu diễn mức xám, số các mức xám có
thể biểu diễn đƣợc là 256. Mỗi mức xám đƣợc biểu diễn dƣới dạng là một số
nguyên nằm trong khoảng từ 0 đến 255, với mức 0 biểu diễn cho mức cƣờng
độ đen nhất và 255 biểu diễn cho mức cƣờng độ sáng nhất.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

7
Ảnh nhị phân khá đơn giản, các phần tử ảnh có thể coi nhƣ các phần tử
logic. Ứng dụng chính của nó đƣợc dùng theo tính logic để phân biệt đối
tƣợng ảnh với nền hay để phân biệt điểm biên với điểm khác.
- Ảnh màu: Trong hệ màu RGB (Red, Green, Blue) để tạo nên thế giới
màu, ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các giá trị màu:
2
8*3
=2
24
≈ 16,7 triệu màu.
Nếu bạn kiểm tra màn hình của một tivi khi nó đƣợc bật lên, bạn sẽ chú
ý thấy tại tất cả các điểm ảnh màu đƣợc tạo nên bằng ba vòng tròn nhỏ hoặc

tam giác có màu đỏ, lục, lam. Sự thay đổi độ sáng của ba phần tử màu này tạo
nên màu sắc của điểm ảnh. Trong ảnh số thì các điểm ảnh đƣợc biểu diễn
bằng một số từ có cùng một số bit cho các màu đỏ, lục, lam. Ví dụ nhƣ ảnh
màu đƣợc biểu diễn bằng 16 bit thì đều có 5 bit để biểu diễn cho mỗi màu, bit
cuối cùng dùng cho một vài chức năng đặc biệt nhƣ ngăn xếp. Trong một
khung số thì bit cuối cùng thông thƣờng để chỉ ra điểm ảnh này đƣợc lấy từ
bộ đệm khung (bộ nhớ ngăn xếp) hay là từ tín hiệu video bên ngoài (ngăn xếp
trực tiếp). Trong hệ thống 16 bít 32,768 màu có thể đƣợc biểu diễn với ba
màu riêng có khả năng thể hiện 32 trạng thái.








Hình 1.2. Hình chóp màu
R
B
Đen
Độ chói
W


Bóng
xám
G

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


8
Ảnh màu theo lý thuyết của Thomas là ảnh tổ hợp từ 3 màu cơ bản: đỏ
(R), lục (G), lơ (B) là thƣờng thu nhận trên các dải băng tần khác nhau. Với
ảnh màu, cách biểu diễn cũng tƣơng tự nhƣ với ảnh đen trắng, chỉ khác là các
số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm: đỏ (red),
lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần 24 bit. 24
bit này đƣợc chia thành ba khoảng 8 bit. Mỗi màu cũng phân thành L cấp màu
khác nhau (thƣờng L = 256). Mỗi khoảng này biểu diễn cho cƣờng độ sáng
của một trong các màu chính.
Do đó, để lƣu trữ ảnh màu ngƣời ta có thể lƣu trữ từng màu riêng biệt,
mỗi màu lƣu trữ nhƣ một ảnh đa cấp xám. Do đó, không gian nhớ dành cho
một ảnh màu lớn gấp 3 lần một ảnh đa cấp xám cùng kích cỡ.
1.1.3.2. Biểu diễn ảnh
Sau quá trình số hoá sẽ thu đƣợc một ma trận tƣơng ứng với ảnh cần xét,
mỗi phần tử của ma trận tƣơng ứng với một điểm ảnh. Ảnh thƣờng đƣợc biểu
diễn bởi một mảng hai chiều I(n,p) gồm n dòng và p cột. Nhƣ vậy, ảnh gồm n
x p pixels và ngƣời ta thƣờng kí hiệu I(x,y) để chỉ một pixel cụ thể trong ảnh.
Về mặt toán học có thể xem ảnh là một hàm hai biến f(x,y) với x,y là các
biến tọa độ. Giá trị số ở điểm (x,y) tƣơng ứng với giá trị xám hoặc độ sáng
của ảnh (x là các cột còn y là các hàng). Giá trị của hàm ảnh f(x,y) đƣợc hạn
chế trong phạm vi của các số nguyên dƣơng
ax
0 ( , )
m
f x y f

Thông thƣờng đối với ảnh xám, giá trị f
max
là 255 (2

8
=256) và mỗi phần
tử ảnh đƣợc mã hóa bởi một byte. Ảnh có thể đƣợc biểu diễn theo một trong
hai mô hình: mô hình Vector hoặc mô hình Raster.
Mô hình Raster: là mô hình biểu diễn ảnh thông dụng nhất hiện nay.
Ảnh đƣợc biểu diễn dƣới dạng ma trận các điểm ảnh. Tùy theo nhu cầu
thực tế mà mỗi điểm ảnh có thể đƣợc biểu diễn bởi một hay nhiều bit. Mô
hình Raster thuận lợi cho việc thu nhận, hiển thị và in ấn.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

9
Mô hình Vector: Bên cạnh mục đích tiết kiệm không gian lƣu trữ, dễ
dàng hiển thị và in ấn, các ảnh biểu diễn theo mô hình vector còn có ƣu điểm
cho phép dễ dàng lựa chọn, sao chép, di chuyển, tìm kiếm,…Theo những yêu
cầu này thì kỹ thuật biểu diễn vector tỏ ra ƣu việt hơn.
Trong mô hình này, ngƣời ta sử dụng hƣớng vector của các điểm ảnh lân
cận để mã hóa và tái tạo lại hình ảnh ban đầu. Các ảnh vector đƣợc thu nhận
trực tiếp từ các thiết bị số hóa hoặc đƣợc chuyển đổi từ các ảnh Raster thông
qua các chƣơng trình vector hóa.
Khi xử lý các ảnh Raster chúng ta có thể quan tâm đến mối quan hệ
trong vùng lân cận của các điểm ảnh. Có hai loại lân cận của điểm ảnh đƣợc
quan tâm nhiều nhất: điểm 4 láng giềng và 8 láng giềng.

Hình 1.3. Hai loại lân cận của điểm ảnh
1.1.3.3. Phân tích ảnh
Phân tích ảnh liên quan đến việc xác định các độ đo định lƣợng của một
ảnh để đƣa ra một mô tả đầy đủ về ảnh. Các kỹ thuật đƣợc sử dụng ở đây
nhằm mục đích xác định biên của ảnh. Có nhiều kỹ thuật khác nhau nhƣ lọc
vi phân hay dò theo quy hoạch động.


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

10
Ngƣời ta cũng dùng các kỹ thuật phân tích ảnh để phân vùng ảnh. Từ
ảnh thu đƣợc, ngƣời ta tiến hành kỹ thuật tách (split) hay hợp (merge) dựa
theo các tiêu chuẩn đánh giá nhƣ: màu sắc, cƣờng độ, v v. Các phƣơng pháp
đƣợc biết đến nhƣ Quad-Tree, mảnh hoá biên, nhị phân hoá đƣờng biên và
các kỹ thuật phân lớp dựa theo cấu trúc.
1.1.3.4. Nhận dạng ảnh
Nhận dạng ảnh là quá trình liên quan đến các mô tả đối tƣợng mà ngƣời
ta muốn đặc tả nó. Quá trình nhận dạng thƣờng đi sau quá trình trích chọn
các đặc tính chủ yếu của đối tƣợng. Có hai kiểu mô tả đối tƣợng:
- Mô tả tham số (nhận dạng theo tham số).
- Mô tả theo cấu trúc (nhận dạng theo cấu trúc).
Trên thực tế, ngƣời ta đã áp dụng kỹ thuật nhận dạng khá thành công với
nhiều đối tƣợng khác nhau nhƣ: nhận dạng ảnh vân tay, nhận dạng chữ (chữ
cái, chữ số, chữ có dấu).
Nhận dạng chữ in hoặc đánh máy phục vụ cho việc tự động hoá quá trình
đọc tài liệu, tăng nhanh tốc độ và chất lƣợng thu nhận thông tin từ máy tính.
Nhận dạng chữ viết tay (với mức độ ràng buộc khác nhau về cách viết,
kiểu chữ, v v) phục vụ cho nhiều lĩnh vực.
Ngoài 2 kỹ thuật nhận dạng trên, hiện nay một kỹ thuật nhận dạng mới
dựa vào kỹ thuật mạng nơ ron đang đƣợc áp dụng và cho kết quả khả quan
trong nhận dạng ký tự.
1.1.3.5. Nén ảnh
Dữ liệu ảnh cũng nhƣ các dữ liệu khác cần phải lƣu trữ hay truyền đi
trên mạng. Nhƣ đã nói ở trên, lƣợng thông tin để biểu diễn cho một ảnh là rất
lớn. Ví dụ, một ảnh đen trắng cỡ 512 x 512 với 256 mức xám chiếm 256K
bytes. Do đó làm giảm lƣợng thông tin hay nén dữ liệu là một nhu cầu cần


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

11
thiết. Nhiều phƣơng pháp nén dữ liệu đã đƣợc nghiên cứu và áp dụng cho loại
dữ liệu đặc biệt này.
1.2. Biên ảnh và vai trò của biên trong phân tích ảnh
1.2.1. Vị trí của biên trong phân tích ảnh
Phân tích ảnh là một quá trình gồm nhiều giai đoạn [1]. Đầu tiên là giai
đoạn tiền xử lý ảnh. Sau giai đoạn này, ảnh đƣợc tăng cƣờng hay đƣợc khôi
phục để làm nổi các đặc tính (feature extraction), tiếp theo là phân đoạn ảnh
(segmentation) thành các phần tử. Thí dụ, nhƣ phân đoạn dựa theo biên, dựa
theo vùng,… Và tuỳ theo các ứng dụng, giai đoạn tiếp theo có thể là nhận
dạng ảnh (phân thành các lớp có miêu tả) hay là giải thích và miêu tả ảnh.
Các đặc trƣng của ảnh thƣờng gồm: mật độ xám, phân bổ xác xuất, phân
bổ không gian, biên ảnh. Các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên.
Do đó, biên có tầm quan trọng đặc biệt trong quá trình phân tích ảnh.
1.2.2. Biên và các kiểu biên đơn giản
Biên là một vấn đề chủ yếu và rất quan trọng trong quá trình phân tích
ảnh vì các kỹ thuật phân đoạn ảnh chủ yếu dựa vào biên. Hiện nay cũng chƣa
có một định nghĩa chính xác nào về biên của ảnh, mỗi định nghĩa đƣợc đƣa ra
đều sử dụng trong một số trƣờng hợp nhất định. Song ta có thể hiểu là:
Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột ngột
về mức xám. Tập hợp các điểm biên tạo thành biên hay đƣờng bao ảnh của
ảnh (boundary).
Thí dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là
điểm đen và có ít nhất một điểm trắng là lân cận.
Để hình dung tầm quan trọng của biên ta xét ví dụ sau: Khi ngƣời họa
sĩ vẽ một cái bàn gỗ, chỉ cần vài nét phác thảo về hình dáng nhƣ cái mặt bàn,
chân bàn mà không cần thêm các chi tiết khác, ngƣời xem đã có thể nhận ra

nó là một cái bàn. nếu ứng dụng của ta là phân lớp nhận diện đối tƣợng, thì

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

12
coi nhƣ nhiệm vụ đã hoàn thành. Tuy nhiên nếu đòi hỏi thêm về các chi tiết
khác nhƣ vân gỗ hay màu sắc,…thì với chừng ấy thông tin là chƣa đủ.
Nhìn chung về mặt toán học ngƣời ta coi điểm biên của ảnh là điểm có
sự biến đổi đột ngột về độ xám. Nhƣ vậy phát hiện biên một cách lý tƣởng là
xác định đƣợc tất cả các đƣờng bao trong các đối tƣợng. Định nghĩa toán học
của biên ở trên là cơ sở cho các kỹ thuật phát hiện biên. Điều quan trọng là sự
biến thiên mức xám giữa các ảnh trong một vùng thƣờng là nhỏ, trong khi đó
biến thiên mức xám của điểm vùng giáp ranh (khi qua biên) lại khá lớn.
Mỗi một biên là một thuộc tính gắn liền với một điểm riêng biệt và đƣợc tính
toán từ những điểm lân cận nó. Đó là một biến Vector bao gồm hai thành phần:
- Độ lớn của Gadient.
- Hƣớng φ đƣợc quay đối với hƣớng Gradient ψ.
Nhƣ mô tả trong (hình 1.4) dƣới đây, các đƣờng biên khép kín là các đƣờng
có cùng độ sáng; quy ƣớc hƣớng 0
0
là chỉ hƣớng đông.

Hình 1.4. Biên khép kín
Biên thƣờng đƣợc sử dụng trong phân tích ảnh để xác định đƣờng bao
của các vùng trong ảnh. Đƣờng bao và các thành phần của nó (các điểm biên)
vuông góc với hƣớng của Gradient.
1.2.2.1. Biên lý tưởng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


13
Việc phát hiện biên một cách lý tƣởng là việc xác định đƣợc tất cả các đƣờng
bao trong đối tƣợng. Biên là sự thay đổi đột ngột về mức xám nên sự thay đổi cấp
xám giữa các vùng trong ảnh càng lớn thì càng dễ dàng nhận ra biên.
Một biên đƣợc coi đó là biên lý tƣởng khi mà có sự thay đổi cấp xám lớn
giữa các vùng trong ảnh. Biên này thƣờng chỉ xuất hiện khi có sự thay đổi cấp
xám qua một điểm ảnh.
Hình minh hoạ điểm ảnh có sự biến đổi mức xám u(x) một cách đột ngột:






Hình1.5. Đƣờng biên lý tƣởng
1.2.2.2. Biên dốc
Biên dốc xuất hiện khi sự thay đổi cấp xám trải rộng qua nhiều điểm
ảnh. Vị trí của cạnh đƣợc xem nhƣ vị trí chính giữa của đƣờng dốc nối giữa
cấp xám thấp và cấp xám cao. Tuy nhiên đây chỉ là đƣờng dốc trong toán học,
từ khi ảnh đƣợc kỹ thuật số hoá thì đƣờng dốc không còn là đƣờng thẳng mà
thành những đƣờng lởm chởm, không trơn.






Hình 1.6. Biên dốc
u
x

u
x

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

14
1.2.2.3. Biên không trơn
Trên thực tế, ảnh thƣờng có biên không lý tƣởng, các điểm ảnh trên ảnh
thƣờng có sự thay đổi mức xám đột ngột và không đồng nhất, đặc biệt là ảnh
nhiễu. Trong trƣờng hợp không nhiễu (biên lý tƣởng), bất cứ một sự thay đổi
cấp xám nào cũng thông báo sự tồn tại của một biên (trƣờng hợp đó khó có khả
năng xảy ra). Ảnh thƣờng là không lý tƣởng có thể là do các nguyên nhân sau:
- Hình dạng không sắc nét.
- Nhiễu do một loạt các yếu tố nhƣ: kiểu thiết bị nhập ảnh, cƣờng độ ánh
sáng, nhiệt độ, hiệu ứng áp suất, chuyển động, bụi,… chƣa chắc rằng hai điểm
ảnh có cùng giá trị cấp xám khi đƣợc nhập lại có cùng cấp xám đó trong ảnh. Kết
quả của nhiễu trên ảnh gây ra một sự biến thiên ngẫu nhiên giữa các điểm ảnh. Sự
xuất hiện ngẫu nhiên của các điểm ảnh có mức xám chênh lệch cao làm cho các
đƣờng biên dốc trở lên không trơn chu mà trở thành các đƣờng biên gồ ghề, mấp
mô, không nhẵn, đây chính là đƣờng biên trên thực tế.
Ngày nay, những phƣơng pháp phát hiện biên hiện đại thƣờng kết hợp
nhiễu vào trong mô hình của bài toán và trong quá trình phát hiện biên cũng
đƣợc tính đến. Còn khái niệm về biên nêu ở trên đƣợc sử dụng để xây dựng
các phƣơng pháp phát hiện biên trong quá khứ, những mô hình về cách này
đƣợc coi là đơn giản và sơ sài.







Hình1.7. Biên không trơn
u
x

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

15
1.3. Các hệ màu và biểu diễn ảnh màu
1.3.1. Cơ sở của màu sắc
Ánh sáng là một dạng của năng lƣợng sóng điện từ có bƣớc sóng vào
khoảng từ 400 nm (nanomet) cho ánh sáng tím và vào khoảng 700 nm cho
ánh sáng đỏ.

Hình1.8. Dải sóng của các ánh sáng nhìn thấy đƣợc
Tất cả các bƣớc sóng này đƣợc cảm nhận bởi mắt ngƣời nhƣ là một sắc
màu. Tất cả các sắc màu này nằm trong ánh sáng trắng của mặt trời, với năng
lƣợng nằm trong khoảng từ hồng ngoại đến cực tím. Màu sắc của một vật thể
là một hàm của các bƣớc sóng không bị hấp thụ phản chiếu từ vật thể. Đó là
lý do tại sao mà một vật thể có các màu sắc khác nhau phụ thuộc vào ánh sáng
mà nó đƣợc quan sát.
Để xác định một ánh sáng màu thì các yếu tố sau đây cần đề cập đến :
Độ sáng hay chói: Nó là tổng hợp của ánh sáng nhận đƣợc bởi mắt
không kể tới màu sắc. Nó nằm trong khoảng từ lờ mờ tối đến rất sáng hoặc
chói mắt .

×