Tải bản đầy đủ (.pdf) (74 trang)

Phương pháp trích chọn dấu hiệu của ảnh dựa trên đặc trưng hình dạng (2014)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.49 MB, 74 trang )

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN

LÊ THỊ HƯƠNG

PHƯƠNG PHÁP TRÍCH CHỌN
DẤU HIỆU CỦA ẢNH DỰA TRÊN
ĐẶC TRƯNG HÌNH DẠNG

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học

HÀ NỘI, 2014


TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2
KHOA CÔNG NGHỆ THÔNG TIN

LÊ THỊ HƯƠNG

PHƯƠNG PHÁP TRÍCH CHỌN
DẤU HIỆU CỦA ẢNH DỰA TRÊN
ĐẶC TRƯNG HÌNH DẠNG

KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC
Chuyên ngành: Tin học
NGƯỜI HƯỚNG DẪN KHOA HỌC
PGS.TS. LÊ HUY THẬP

HÀ NỘI, 2014



LỜI CẢM ƠN
Lời đầu tiên em xin chân thành cảm ơn thầy giáo PGS.TS Lê Huy Thập Viện công nghệ thông tin đã tận tình hướng dẫn và chỉ bảo em trong quá trình
thực hiện khóa luận.
Em cũng xin chân thành cảm ơn các thầy, cô giáo trong khoa Công nghệ
thông tin cũng như các thầy, cô giáo trong trường đã giảng dạy và giúp đỡ em
trong 4 năm học vừa qua. Chính các thầy, cô giáo đã xây dựng cho chúng em
những kiến thức nền tảng và kiến thức chuyên môn để em có thể hoàn thành
khóa luận tốt nghiệp và chuẩn bị cho những công việc của mình sau này.
Cuối cùng em xin bày tỏ lòng biết ơn tới gia đình và bạn bè đã giúp đỡ
động viên em rất nhiều trong suốt quá trình học tập để em có thể thực hiện tốt
khóa luận này.
Tuy đã có những cố gắng nhất định nhưng do thời gian và trình độ có hạn
nên chắc chắn khóa luận này còn nhiều thiếu sót và hạn chế. Kính mong nhận
được sự góp ý của thầy, cô giáo và các bạn.

Hà Nội, tháng 05 năm 2014
Sinh viên

Lê Thị Hương


LỜI CAM ĐOAN
Tên em là: LÊ THỊ HƯƠNG
Sinh viên lớp: K36 – Tin học, khoa Công nghệ thông tin, trường Đại học
sư phạm Hà Nội 2.
Em xin cam đoan:
1. Đề tài “Phương pháp trích chọn dấu hiệu của ảnh dựa trên đặc trưng
hình dạng” là sự nghiên cứu của riêng em, dưới sự hướng dẫn của thầy giáo
PGS.TS Lê Huy Thập.

2. Khóa luận hoàn toàn không sao chép của tác giả nào khác.
Nếu sai em xin hoàn toàn chịu trách nhiệm.
Hà Nội, tháng 05 năm 2014
Người cam đoan

Lê Thị Hương


MỤC LỤC
LỜI CẢM ƠN ................................................................................................... 1
LỜI CAM ĐOAN.............................................................................................. 2
CÁC KÝ HIỆU VIẾT TẮT .............................................................................. 3
DANH MỤC HÌNH VẼ .................................................................................... 4
MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG 1: CƠ SỞ LÝ THUYẾT ................................................................. 4
1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh .......................................... 4
1.1.1 Xử lý ảnh .................................................................................................. 4
1.1.2 Các vấn đề cơ bản trong xử lý ảnh ........................................................... 5
1.1.3 Thu nhận và biểu diễn ảnh ......................................................................................... 8
1.2 Biên và các kỹ thuật tìm biên .................................................................... 11
1.3 Xương và các kỹ thuật tìm xương ............................................................. 16
CHƯƠNG 2: MỘT SỐ PHƯƠNG PHÁP TRÍCH CHỌN ĐẶC TRƯNG
DỰA VÀO HÌNH DẠNG ............................................................................... 22
2.1 Phân ngưỡng và trừ ảnh ............................................................................ 22
2.1.1 Phân ngưỡng........................................................................................... 22
2.1.2 Trừ ảnh ................................................................................................... 23
2.2 Đối sánh mẫu............................................................................................. 30
2.2.1 Định nghĩa .............................................................................................. 24
2.2.2 Biến đổi Fourier ..................................................................................... 25
2.3 Biến đổi Hough ......................................................................................... 28

2.3.1 Tổng quan............................................................................................... 28
2.3.2 Biến đổi Hough cho đường thẳng .......................................................... 29


2.3.3 Biến đổi Hough cho hình tròn ................................................................ 32
2.3.4 Biến đổi Hough cho elip ........................................................................ 36
2.3.5 Kỹ thuật biến đổi Hough tổng quát ........................................................ 39
2.3.6 Biến đổi Hough tổng quát bất biến ........................................................................45
2.4 Phương pháp trích chọn đặc trưng dựa trên vùng ..................................... 49
2.4.1 Phương pháp toàn cục .................................................................................................50
2.4.2 Phương pháp cấu trúc ............................................................................. 51
2.5 Phương pháp trích chọn đặc trưng dựa theo biên ..................................... 53
2.5.1 Phương pháp toàn cục ............................................................................ 53
2.5.2 Phương pháp cấu trúc ............................................................................. 55
CHƯƠNG 3: CHƯƠNG TRÌNH THỬ NGHIỆM ......................................... 59
3.1 Bài toán ..................................................................................................... 59
3.2 Thiết kế chương trình ................................................................................ 59
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ...................................................... 63
TÀI LIỆU THAM KHẢO ............................................................................... 70


CÁC KÝ HIỆU VIẾT TẮT
Kí hiệu

Viết đầy đủ

Ý nghĩa

HT


Hough Transform

Chuyển đổi Hough

GHT

Generalised Hough transform

Biến đổi Hough tổng quát


DANH MỤC HÌNH VẼ
Hình 1.1: Quá trình xử lý ảnh ....................................................................... 10
Hình 1.2: Các bước cơ bản trong một hệ thống xử lý ảnh ............................ 10
Hình 1.3a: Ảnh thu nhận ............................................................................... 11
Hình 1.3b: Ảnh mong muốn ......................................................................... 11
Hình 1.4: Sự chuyển đổi giữa các mô hình biểu diễn ảnh ............................ 16
Hình 1.5: Ví dụ về ảnh và xương ................................................................. 22
Hình 1.5a: Ảnh gốc ....................................................................................... 22
Hình 1.5b: Ảnh xương .................................................................................. 22
Hình 1.6: Minh họa thuật toán trộn hai sơ đồ Voronoi................................. 25
Hình 1.7: Minh họa thuật toán thêm một điểm biên vào sơ đồ Voronoi ...... 26
Hình 2.1: Trích chọn hình dạng của phép trừ và phân ngưỡng .................... 28
Hình 2.1a: Hình ảnh của đối tượng đi bộ...................................................... 28
Hình 2.1b: Ảnh sau khi trừ nền ..................................................................... 28
Hình 2.1c: Ảnh sau khi phân ngưỡng ........................................................... 28
Hình 2.2: Minh họa đối sánh mẫu ................................................................. 30
Hình 2.2a: Hình ảnh có chứa hình ................................................................ 30
Hình 2.2b: Mẫu hình dạng mục tiêu ............................................................. 30
Hình 2.3: Đối sánh mẫu bởi biến đổi Fourier ............................................... 33

Hình 2.3a: Lộn và mẫu đệm .......................................................................... 33
Hình 2.3b: Biến đổi Fourier của mẫu............................................................ 33
Hình 2.3c: Biến đổi Fourier của hình ảnh ..................................................... 33
Hình 2.3d: Nhân biến đổi .............................................................................. 33
Hình 2.3e: Kết quả ........................................................................................ 33
Hình 2.3f: Vị trí của mẫu .............................................................................. 33
Hình 2.4: Đường thẳng Hough trong tọa độc cực......................................... 36


Hình 2.5: Minh họa biến đổi Hough cho hình tròn ....................................... 38
Hình 2.5a: Hình ảnh có chứa một hình tròn.................................................. 38
Hình 2.5b: Không gian lưu trữ ...................................................................... 38
Hình 2.5c: Không gian lưu trữ 3D ................................................................ 38
Hình 2.6: Bằng cách sử dụng HT cho hình tròn ........................................... 39
Hình 2.6a: Hình ảnh của mắt ........................................................................ 39
Hình 2.6b: Cạnh Sobel .................................................................................. 39
Hình 2.6c: Cạnh với HT phát hiện hình tròn ................................................ 39
Hình 2.7: Sự xác định của trục Elip .............................................................. 41
Hình 2.8: Áp dụng biến đổi Hough cho Elip ................................................ 43
Hình 2.8a: Elip .............................................................................................. 43
Hình 2.8b: Cạnh quả bóng bầu dục............................................................... 43
Hình 2.8c: Tiếng ồn của cạnh quả bóng bầu dục .......................................... 43
Hình 2.8d: Mảng tích lũy cho (a) .................................................................. 43
Hình 2.8e: Mảng tích lũy cho (b) .................................................................. 43
Hình 2.8f: Mảng tích lũy cho (c) .................................................................. 43
Hình 2.9: Hình học của GHT ........................................................................ 47
Hình 2.10: Hình học của GHT bất biến ........................................................ 50
Hình 2.10a: Vector chuyển ........................................................................... 50
Hình 2.10b: Định nghĩa gốc .......................................................................... 50
Hình 2.10c: Bất biến bảng R ......................................................................... 50

Hình 2.11: Áp dụng các GHT bất biến ......................................................... 52
Hình 2.11a: Mẫu cạnh ................................................................................... 52
Hình 2.11b: Hình ảnh .................................................................................... 52
Hình 2.11c: Bộ lưu trữ .................................................................................. 52
Hình 2.12: Minh họa phương pháp bề mặt lồi .............................................. 55


Hình 2.12a: Bề mặt lồi và các thiếu hụt của nó ............................................ 55
Hình 2.12b: Cây lõm và biểu diễn bề mặt lồi ............................................... 55
Hình 2.13: Trục trung vị (xương) của hình chữ nhật .................................... 56
Hình 2.14: Minh họa độ lệch tâm và tuần hoàn của hình dạng .................... 58
Hình 3.1: Form giao diện chính .................................................................... 63
Hình 3.2: Ảnh đầu vào .................................................................................. 63
Hình 3.3: Form biến đổi ảnh màu thành ảnh mức xám ............................... 64
Hình 3.4: Form tìm biên của ảnh .................................................................. 64
Hình 3.5: Form biến đổi Hough cho đường thẳng ........................................ 65


MỞ ĐẦU
1. Lý do chọn đề tài
Cùng với sự bùng nổ thông tin trên web và sự phát triển của công nghệ kỹ
thuật số, lượng ảnh lưu trữ trên Web cũng tăng một cách nhanh chóng. Vì
vậy, việc xây dựng các hệ thống tìm kiếm và xếp hạng ảnh là rất cần thiết và
thực tế đã có nhiều công cụ tìm kiếm ảnh thương mại xuất hiện. Các công cụ
tìm kiếm ảnh thường dựa vào hai đặc trưng chính là văn bản đi kèm ảnh hoặc
nội dung ảnh. Một số công cụ tìm kiếm ảnh theo văn bản đi kèm như Google
Image Search, Yahoo!, MSN,…Một số công cụ tìm kiếm ảnh dựa vào nội
dung ảnh như Google Image Swirl, Bing, Tiltomo, Tineye,…Tuy nhiên, việc
tìm kiếm chỉ dựa vào văn bản đi kèm còn có nhiều nhập nhằng giữa nội dung
hiển thị ảnh và nội dung văn bản đi kèm ảnh trong quá tình tìm kiếm. Ví dụ,

với truy vấn “Apple”, máy tìm kiếm khó phân biệt được người dùng muốn
tìm hình ảnh quả táo hay logo của hãng Apple. Những công cụ tìm kiếm ảnh
theo nội dung của các bức ảnh ra đời tỏ ra ưu thế vì hạn chế được những nhập
nhằng trên.
Trích chọn dấu hiệu ảnh dựa trên hình dạng ảnh đã nhận được nhiều sự
quan tâm của các nhà khoa học. Các phương pháp xử lý ảnh bắt đầu từ các
ứng dụng chính là nâng cao chất lượng ảnh và phân tích ảnh. Các phương
pháp xử lý ảnh trong tìm kiếm hình dạng trong hình ảnh máy tính để có thể tự
động nhận dạng đối tượng đang được áp dụng phổ biến trong các lĩnh vực
được áp dụng trong những lĩnh vực khác nhau như: y học, toán học, tìm kiếm
tội phạm và nhiều lĩnh vực khoa học khác ....
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
trong những chuyên ngành quan trọng của công nghệ thông tin hiện nay. Để
có thể nhận biết được hình dạng thì phải trích trọn được các đặc trưng bất

1


biến của hình dạng. Chính vì vậy mà em lựa chọn đề tài “Phương pháp trích
chọn dấu hiệu của ảnh dựa vào đặc trưng hình dạng” để làm khóa luận tốt
nghiệp.
2. Mục đích, nhiệm vụ nghiên cứu
Khóa luận được xây dựng nhằm mục đích tìm hiểu các phương pháp kỹ
thuật trích chọn dấu hiệu của ảnh dựa trên đặc trưng hình dạng như tìm biên
của ảnh, tách xương của ảnh và cài đặt chương trình thử nghiệm.
3. Đối tượng và phạm vi nghiên cứu
- Đối tượng nghiên cứu: Ảnh và các vấn đề của ảnh.
- Phạm vi nghiên cứu của đề tài: Nghiên cứu về các vấn đề xử lý ảnh, các
phương pháp trích chọn dấu hiệu ảnh dựa vào hình dạng (biên, xương của
ảnh) dựa trên các kỹ thuật tìm biên, tìm xương, các thuật toán biến đổi, so

sánh.
4. Ý nghĩa khoa học và ý nghĩa thực tiễn
Ý nghĩa khoa học: Lý thuyết về trích chọn đặc trưng của ảnh ra đời, phát
triển góp phần chứng minh tính khả thi và khả năng ứng dụng kỹ thuật xử lý
ảnh trong lĩnh vực trích chọn và nhận dạng đối tượng; Đặt nền tảng nghiên
cứu sâu hơn nhằm phát triển các ứng dụng.
Ý nghĩa thực tiễn: Chương trình thử nghiệm nếu thành công sẽ góp một
phần nhỏ trong các lĩnh vực nhận dạng các đối tượng trong ảnh dựa trên các
đặc trưng riêng.
5. Phương pháp nghiên cứu
a. Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các
vấn đề của đề tài.
2


b. Phương pháp chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình phù
hợp với yêu cầu thực tiễn. Nội dung xử lý nhanh đáp ứng được yêu cầu ngày
càng cao của người sử dụng.
c. Phương pháp thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được nghiên
cứu và kết quả đạt được qua những phương pháp trên.
6. Cấu trúc của khóa luận
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, khóa luận có những
nội dung sau:
Chương 1: Trình bày tổng quan về xử lý ảnh và vấn đề cơ bản trong xử lý
ảnh.
Chương 2: Trình bày một số phương pháp trích chọn đặc trưng dựa vào

hình dạng như phân ngưỡng và trừ ảnh, đối sánh mẫu, biến đổi Hough, tách
biên, tách xương.
Chương 3: Trình bày thực nghiệm và một số kết quả đạt được.

3


CHƯƠNG 1: CƠ SỞ LÝ THUYẾT
1.1 Xử lý ảnh, các vấn đề cơ bản trong xử lý ảnh
1.1.1 Xử lý ảnh
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất. Những năm trở lại đây với sự phát triển của phần
cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một cách mạnh mẽ và có
nhiều ứng dụng trong cuộc sống. Xử lý ảnh và đồ hoạ đóng một vai trò quan
trọng trong tương tác người - máy.
Quá trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm
cho ra kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể
là một ảnh “tốt hơn” hoặc một kết luận.
Ảnh “tốt hơn”
Ảnh

hơn”

XỬ LÝ ẢNH

Kết Luận

Hình 1.1: Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của

đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều. Sơ đồ tổng quát
của một hệ thống xử lý ảnh.
Hệ quyết định
Thu nhận ảnh
(Scanner,
Camera, Sensor)

Tiền
Xử


Trích Chọn
Đặc Điểm

Đối sánh
rút ra kết
luận

Hậu
Xử Lý
Lưu trữ

Hình1.2: Các bước cơ bản trong một hệ thống xử lý ảnh
4


1.1.2 Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1 Một số khái niệm cơ bản
- Phần tử ảnh: Là một giá trị biểu diễn cho mức xám hay cường độ ảnh

tại một vị trí sau khi đã biến đổi ảnh thành một số hữu hạng các tín hiệu rời
rạc.
- Mức xám, màu: Là kết quả của sự biến đổi tương ứng giá trị độ sáng
của một điểm ảnh với một giá trị số nguyên dương, tùy thuộc vào số giá trị
biểu diễn mức xám mà mỗi điểm ảnh sẽ được biểu diễn trên 1-4-8-16 hay 32
bit. Số lượng bit biểu diễn mức xám càng lớn thì chất lượng ảnh càng cao
nhưng sẽ tốn dung lượng bộ nhớ nhiều hơn để lưu trữ và cần một hệ thống
mạnh hơn để xử lý.
- Ảnh: Là một tập hợp hữu hạn điểm ảnh kề nhau thường được biểu diễn
bằng một ma trận hai chiều. Mỗi phần tử của ma trận tương ứng với một điểm
ảnh. Có 3 loại ảnh cơ bản:
+ Ảnh đen trắng (ảnh nhị phân): Là ảnh có giá trị mức xám của
điểm ảnh được biều diễn bằng 1 bit.
+ Ảnh xám: Là ảnh có giá trị mức xám của các điểm ảnh được
biểu diễn bằng 8 bit (giá trị từ 0→255).
+ Ảnh màu: Thông thường ảnh màu được tạo nên từ 3 màu cơ
bản (đỏ, xanh lá cây, xanh lam).
1.1.2.2 Nắn chỉnh biến dạng ảnh
Ảnh thu nhận thường bị biến dạng do các thiết bị quang học và điện tử.

Hình 1.3: a) Ảnh thu nhận, b) Ảnh mong muốn
5


Để khắc phục người ta sử dụng các phép chiếu, các phép chiếu thường
được xây dựng trên tập các điểm điều khiển.
1.1.2.3 Khử nhiễu
Ảnh sau quá trình thu nhận ảnh thường không tránh khỏi nhiễu bởi các
thiết bị quang học, điện tử và đôi khi do bản thân đối tượng.
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:

• Nhiều hệ thống: Là loại nhiễu sinh ra có tính quy luật do lỗi thiết bị
hoặc ảnh hưởng của nguồn sáng ngoại lai. Nhiễu này dễ khử, một cách
thường dùng là sử dụng các phép biến đổi.
• Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân: Loại này khó khử
trong xử lý ảnh và tùy từng loại ảnh cụ thể mà người ta có thủ thuật phù hợp.
Một cách chung nhất là sử dụng các phép lọc.
1.1.2.4 Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông thường
có 2 hướng tiếp cận:
• Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen
trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
• Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng kỹ
thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.1.2.5 Phân tích ảnh
Quá trình phân tích ảnh dựa vào các đặc điểm trích chọn:
 Biên:

+ Các phương pháp phát hiện biên trực tiếp
+ Các phương pháp phát hiện biên gián tiếp
6


 Xương :

+ Các kĩ thuật tìm xương dựa trên làm mảnh
+ Các kĩ thuật tìm xương không dựa trên làm mảnh

1.1.2.6 Nhận dạng
Là quá trình liên quan đến đối tượng mà người ta muốn mô tả nó. Có 2

kiểu mô tả đối tượng:


Mô tả theo tham số (nhận dạng theo tham số)



Mô tả theo cấu trúc (nhận dạng theo cấu trúc)

Ứng dụng: Nhận dạng dấu vân tay, nhận dạng khuôn mặt, nhận dạng kí
tự, nhận dạng các hình cơ bản…
1.1.2.7 Nén ảnh
Nén ảnh nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành
theo cả hai khuynh hướng là nén có bảo toàn và không bảo toàn thông tin.
Nén không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng
phục hồi thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ
bản trong nén ảnh:
• Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất
hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích
hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF.
• Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX.
• Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là
tiếp cận theo kỹ thuật nén này.

7



• Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ
phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.2.2.7 Mô hình hóa ảnh
Biểu diễn ảnh: Ảnh có thể xem như là một hàm 2 biến chứa các thông tin
như biểu diễn của một ảnh, các mô hình biểu diễn ảnh cho ta một mô hình
logic hay định lượng của hàm này dựa vào phần tử đặc trưng của ảnh đó. Giá
trị của điểm ảnh có thể là một giá trị vô hướng hoặc là một vectơ.
Ta có thể biểu diễn ảnh bằng một hàm toán học hoặc các ma trận điểm:
 Đối với ảnh tương tự: Miền xác định và miền giá trị là liên tục.
 Đối với ảnh số: Miền xác định và miền giá trị là rời rạc được biểu diễn
là S(m,n). Trong đó S là ảnh còn m, n là tọa độ của điểm ảnh trong không
gian 2D, S(m,n) là độ xám hay mức xám của điểm ảnh (m, n).
Các mô hình biểu diễn ảnh:
 Mô hình cảm nhận ảnh: Là mô hình biểu diễn thông qua các thuộc tính
cảm nhận, các thuộc tính về không gian, các cảm nhận về bối cảnh, bố cục.
 Mô hình bố cục: Là mô hình biểu diễn thể hiện mối tương quan cục bộ
của các phần tử ảnh. Ứng dụng cho các bài toán xử lý ảnh và nâng cao chất
lượng ảnh.
 Mô hình tổng thể: Là mô hình biểu diễn ảnh, xem ảnh như là một tập
hợp các đối tượng và các đối tượng này có mối quan hệ không gian với nhau.
Ứng dụng cho các bài toán phân nhóm và nhận dạng ảnh.
1.1.3 Thu nhận và biểu diễn ảnh
1.1.3.1 Thu nhận, các thiết bị thu nhận ảnh
Các thiết bị thu nhận ảnh bao gồm camera, scanner các thiết bị thu nhận
này có thể cho ảnh đen trắng.
8


Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng

Raster, Vectơ.
Các thiết bị thu nhận ảnh thông thường Raster là camera các thiết bị thu
nhận ảnh thông thường Vectơ là sensor hoặc bàn số hoá Digitalizer hoặc được
chuyển đổi từ ảnh Raster. Nhìn chung các hệ thống thu nhận ảnh thực hiện
một quá trình:
• Cảm biến: Biến đổi năng lượng quang học thành năng lượng điện – đây
chính là giai đoạn lấy mẫu.
• Tổng hợp năng lượng điện thành ảnh – giai đoạn lượng tử hóa.
a, Giai đoạn lấy mẫu
Người ta sử dụng bộ cảm biến thành máy quét để biến tín hiệu quang của
ảnh thành tín hiệu liên tục. Phương pháp này sử dụng máy quét là phổ biến.
Máy quét sẽ quét theo chiều ngang để tạo tín hiệu điện của ảnh, kết quả
cho ra một tín hiệu điện hai chiều.
b, Lượng tử hóa
Quá trình biến đổi f(m,n) (với m, n là số nguyên) thành một số nguyên thích
hợp để lưu trữ gọi là lượng tử hóa. Đây là quá trình ánh xạ một biến lên tục U
vào biến rời rạc U’ thuộc tập hữu hạn U1, U2,…,Un với n là mức lượng tử hóa
được tạo ra.
1.1.3.2 Biểu diễn ảnh
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được
nhúng trong các thiết bị kỹ thuật khác nhau. Quá trình lưu trữ ảnh nhằm hai
mục đích:
• Tiết kiệm bộ nhớ
• Giảm thời gian xử lý
9


Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị,
in ấn và xử lý ảnh được xem như là một tập hợp các điểm với cùng kích thước
nếu sử dụng càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể

hiện rõ hơn chi tiết của ảnh người ta gọi đặc điểm này là độ phân giải.
Việc lựa chọn độ phân giải thích hợp tuỳ thuộc vào nhu cầu sử dụng và
đặc trưng của mỗi ảnh cụ thể, trên cơ sở đó các ảnh thường được biểu diễn
theo hai mô hình cơ bản là Raster và mô hình Vectơ.
a, Mô hình Raster
Đây là cách biểu diễn ảnh thông dụng nhất hiện nay, ảnh được biểu diễn
dưới dạng ma trận các điểm (điểm ảnh). Thường thu nhận qua các thiết bị như
camera, scanner. Tuỳ theo yêu cầu thực thế mà mỗi điểm ảnh được biểu diễn
qua 1 hay nhiều bít.
Mô hình Raster thuận lợi cho hiển thị và in ấn. Một trong những hướng
nghiên cứu trên mô hình này là kỹ thuật nén ảnh.
b, Mô hình Vectơ
Biểu diễn ảnh ngoài mục đích tiết kiệm không gian lưu trữ dễ dàng cho
hiển thị và in ấn còn đảm bảo dễ dàng trong lựa chọn sao chép di chuyển tìm
kiếm… Theo những yêu cầu này kỹ thuật biểu diễn vectơ tỏ ra ưu việt hơn.
Trong mô hình Vectơ người ta sử dụng hướng giữa các vectơ của điểm
ảnh lân cận để mã hoá và tái tạo hình ảnh ban đầu ảnh vectơ được thu nhận
trực tiếp từ các thiết bị số hoá như Digital hoặc được chuyển đổi từ ảnh Raster
thông qua các chương trình số hoá.
Công nghệ phần cứng cung cấp những thiết bị xử lý với tốc độ nhanh và
chất lượng cho cả đầu vào và ra nhưng lại chỉ hỗ trợ cho ảnh Raster.

10


Do vậy, những nghiên cứu về biểu diễn Vectơ đều tập trung từ chuyển đổi
từ ảnh Raster.
Vectơ hóa
RASTER


Raster hóa
VECTƠ

RASTER

Hình 1.4: Sự chuyển đổi giữa các mô hình biểu diễn ảnh
1.2 Biên và các kỹ thuật tìm biên
Biên là vấn đề quan trọng trong trích chọn đặc điểm nhằm tiến tới hiểu
ảnh. Cho đến nay chưa có định nghĩa chính xác về biên, trong mỗi ứng dụng
người ta đưa ra các độ đo khác nhau về biên, một trong các độ đo đó là độ đo
về sự thay đổi đột ngột về cấp xám. Ví dụ: Đối với ảnh đen trắng, một điểm
được gọi là điểm biên nếu nó là điểm đen có ít nhất một điểm trắng bên cạnh.
Tập hợp các điểm biên tạo nên biên hay đường bao của đối tượng. Xuất phát
từ cơ sở này người ta thường sử dụng hai phương pháp phát hiện biên cơ bản:
- Phát hiện biên trực tiếp
- Phát hiện biên gián tiếp
1.2.2 Phát hiện biên trực tiếp
Phương pháp này làm nổi biên dựa vào sự biến thiên mức xám của ảnh.
Kỹ thuật chủ yếu dùng để phát hiện biên ở đây là dựa vào sự biến đổi cấp xám
theo hướng. Cách tiếp cận theo đạo hàm bậc nhất của ảnh dựa trên kỹ thuật
Gradient, nếu lấy đạo hàm bậc hai của ảnh ta có kỹ thuật Laplace.
Phương pháp phát hiện biên trực tiếp gồm 3 kỹ thuật:
- Kỹ thuật phát hiện biên Gradient:
Theo định nghĩa, gradient là một vectơ có các thành phần biểu thị tốc độ
thay đổi giá trị của điểm ảnh, ta có:

11


f ( x  dx, y )  f ( x, y )

 f ( x, y )
 x  f ' x 
dx
 f ( x, y )
f ( x, y  dy )  f ( x, y )
 f'y 

 y
dy

Trong đó dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y.
- Kỹ thuật phát hiện biên Prewitt:
Kỹ thuật sử dụng 2 mặt nạ nhập chập xấp xỉ đạo hàm theo 2 hướng x và y
là:
1

1
Hx = 
1

0
0
0

1

1
1





  1  1  1


0
0
Hy =  0
1
1
1 


Các bước tính toán của kỹ thuật Prewitt:
Bước 1: Tính IHx và IHy
Bước 2: Tính IHx + I Hy
- Kỹ thuật Sobel:
Tương tự như kỹ thuật Prewitt, kỹ thuật Sobel sử dụng 2 mặt nạ nhân
chập theo 2 hướng x, y:
 1

Hx =   2
 2


0
0
0

1


2
1 



Các bước tính tương tự như Prewitt:
Bước 1: Tính IHx và IHy
Bước 2: Tính IHx + I Hy
- Kỹ thuật La bàn:

12

  1  2  1


Hy =  0 0 0 
1
2
1 



Kỹ thuật sử dụng 8 mặt nạ nhân chập theo 8 hướng 0o, 45o, 90o, 135o,
180o, 225o, 270o, 315o.
5  3
 5


H1 =  5 0  3 

  3  3  3



5
5 
 5


H2 =   3 0  3 
  3  3  3



5 
 3 5


H3 =   3 0 5 
  3  3  3



 3

H4 =   3
 3


  3  3  3



H5 =   3 0 5 
 3 5
5 


  3  3  3


H6 =   3 0  3 
 5
5
5 


  3  3  3


H7 =  5 0  3 
 5
5  3 


5

H8 =  5
5



3

5

5
5 

0
3

3
0
3

 3

 3
 3 

Các bước tính toán thuật toán La bàn:
+ Bước 1: Tính I ⊗ Hi ; i = 1,8
+ Bước 2:

Hi

- Kỹ thuật phát hiện biên Laplace:
Các phương pháp đánh giá Gradient ở trên làm việc khá tốt khi mà độ
sáng thay đổi rõ nét. Khi mức xám thay đổi chậm, miền chuyển tiếp trải rộng,
phương pháp cho hiệu quả hơn đó là phương pháp sử dụng đạo làm bậc hai
Laplace.

Trong thực tế người ta sử dụng nhiều kiểu mặt nạ khác nhau để xấp xỉ rời
rạc đạo hàm bậc 2 Laplace. Dưới đây là 3 kiểu mặt nạ thường dùng:

13


 0 1 0 


H1 =   1 4  1
 0 1 0 



1.2.3

  1  1  1


H2 =   1 8  1
  1  1  1



 1 2 1 


H3 =   2 4  2 
 1 2 1 




Phát hiện biên gián tiếp

Nếu bằng cách nào đó ta phân được ảnh thành các vùng thì ranh giới giữa
các vùng đó gọi là biên. Kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối
ngẫu nhau vì dò biên để thực hiện phân lớp đối tượng mà khi đã phân lớp
xong nghĩa là đã phân vùng được ảnh và ngược lại, khi đã phân vùng ảnh đã
được phân lớp thành các đối tượng, do đó có thể phát hiện được biên.
Biểu diễn đối tượng ảnh theo chu tuyến thường dựa trên các kỹ thuật dò
biên. Có hai kỹ thuật dò biên cơ bản. Kỹ thuật thứ nhất xét ảnh biên thu được
từ ảnh vùng sau một lần duyệt như một đồ thị, sau đó áp dụng các thuật toán
duyệt cạnh đồ thị. Kỹ thuật thứ hai dựa trên ảnh vùng, kết hợp đồng thời quá
trình dò biên và tách biên. Ở đây ta quan tâm cách tiếp cận thứ hai. Trước hết,
giả sử ảnh được xét chỉ bao gồm một vùng ảnh 8-liên thông ℑ, được bao bọc
bởi một vành đai các điểm nền. Dễ thấy ℑ là một vùng 4-liên thông chỉ là một
trường riêng của trường hợp trên. Về cơ bản, các thuật toán dò biên trên một
vùng đều bao gồm các bước sau:
• Xác định điểm biên xuất phát
• Dự báo và xác định điểm biên tiếp theo
• Lặp bước 2 cho đến khi gặp điểm xuất phát
Do xuất phát từ những tiêu chuẩn và định nghĩa khác nhau về điểm biên,
và quan hệ liên thông, các thuật toán dò biên cho ta các đường biên mang các
sắc thái rất khác nhau. Kết quả tác động của toán tử dò biên lên một điểm biên
ri là điểm biên ri+1 (8 – láng giềng của ri). Thông thường các toán tử này được

14


xây dựng như một hàm đại số Boolean trên các 8 – láng giềng của ri. Mỗi

cách xây dựng các toán tử đều phụ thuộc vào định nghĩa quan hệ liên thông
và điểm biên.
Do đó sẽ gây khó khăn cho việc khảo sát các tính chất của đường biên.
Ngoài ra, vì mỗi bước dò biên đều phải kiểm tra tất cả các 8 – láng giềng của
mỗi điểm nên thuật toán thường kém hiệu quả. Để khắc phục các hạn chế
trên, thay vì sử dụng một điểm biên ta sử dụng cặp điểm biên (một thuộc ℑ,
một thuộc  ), các cặp điểm này tạo nên tập nền vùng, kí hiệu là NV và phân
tích toán tử dò biên thành 2 bước:
• Xác định cặp điểm nền vùng tiếp theo
• Lựa chọn điểm biên
Trong đó bước thứ nhất thực hiện chức năng của một ánh xạ trên tập NV
lên NV và bước thứ hai thực hiện chức năng chọn điểm biên.
Thuật toán dò biên tổng quát:
Bước 1: Xác định cặp nền – vùng xuất phát
Bước 2: Xác định cặp nền – vùng tiếp theo
Bước 3: Lựa chọn điểm biên vùng
Bước 4: Nếu gặp lại cặp xuất phát thì dừng, nếu không quay lại bước 2
Việc xác định cặp nền – vùng xuất phát được thực hiện bằng cách duyệt
ảnh lần lượt từ trên xuống dưới và từ trái qua phải điểm đen đầu tiên gặp được
cùng với điểm trắng trước đó (theo hướng 4) để tạo nên cặp nền vùng xuất
phát.
Xác đinh cặp nền vùng tiếp theo dựa vào công thức:

15


×