Tải bản đầy đủ (.pdf) (69 trang)

Thuật toán phân vùng ảnh dựa trên sự phân chia và kết hợp miền kề

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.93 MB, 69 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

TRẦN QUỐC HÀ

THUẬT TOÁN PHÂN VÙNG ẢNH
DỰA TRÊN SỰ PHÂN CHIA
VÀ KẾT HỢP MIỀN KỀ

LUẬN VĂN THẠC SĨ MÁY TÍNH

HÀ NỘI - 2017


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI 2

TRẦN QUỐC HÀ

THUẬT TOÁN PHÂN VÙNG ẢNH
DỰA TRÊN SỰ PHÂN CHIA
VÀ KẾT HỢP MIỀN KỀ
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01 01

LUẬN VĂN THẠC SĨ MÁY TÍNH
Người hướng dẫn khoa học
TS. LƯU THỊ BÍCH HƯƠNG

HÀ NỘI, 2017



LỜI CẢM ƠN
Tôi xin trân trọng cảm ơn TS. Lưu Thị Bích Hương (hiện đang làm
việc tại trường Đại học Sư phạm Hà Nội 2) - người đã hướng dẫn trực tiếp và
tạo mọi điều kiện thuận lợi để tôi hoàn thành luận văn này.
Tôi xin trân trọng cảm ơn Trường Đại học Sư phạm Hà Nội 2, đã tạo
điều kiện tốt nhất để tôi hoàn thành khóa học và làm luận văn tốt nghiệp.
Tôi xin cảm ơn đến sự giúp đỡ, động viên của gia đình, bạn bè trong
suốt thời gian tôi học tập và nghiên cứu.
Một lần nữa, tôi xin trân trọng cảm ơn!
Hà Nội, ngày tháng năm 2017
Tác giả

Trần Quốc Hà


LỜI CAM ĐOAN
Để đảm bảo tính trung thực của Luận văn, tôi xin cam đoan:
Luận văn “Thuật toán Phân vùng ảnh dựa trên sự phân chia và kết
hợp miền kề” là công trình nghiên cứu của cá nhân tôi, được thực hiện dưới
sự hướng dẫn của TS. Lưu Thị Bích Hương (Khoa Công nghệ thông tin Trường đại học sư phạm Hà Nội II). Tôi xin cam đoan rằng kết quả nghiên
cứu trong luận văn này là trung thực và không trùng lặp với các đề tài khác.
Tôi cũng xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện luận văn này
đã được cảm ơn và các thông tin trích dẫn trong luận văn đã được chỉ rõ
nguồn gốc.
Các kết quả trình bày trong luận văn chưa được công bố trong bất kỳ
công trình nào trước đây.

Tác giả


Trần Quốc Hà


MỤC LỤC
LỜI CẢM ƠN
LỜI CAM ĐOAN
DANH MỤC HÌNH
MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH ............................................... 5
1.1. Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh ........................................ 5
1.1.1. Xử lý ảnh là gì? ................................................................................. 5
1.1.2. Các vấn đề cơ bản trong xử lý ảnh ................................................. 10
1.2. Khái quát về phân vùng ảnh ..................................................................... 18
1.2.1. Một số khái niệm ............................................................................ 18
1.2.2. Các hướng tiếp cận phân vùng ảnh ................................................. 20
1.2.3. Các công đoạn chính của phân vùng ảnh........................................ 21
1.3. Một số thuộc tính của điểm ảnh và phân vùng ảnh.................................. 22
1.3.1. Một số thuộc tính của điểm ảnh ...................................................... 22
1.3.2. Một số thuộc tính của vùng ảnh ...................................................... 22
1.3.3. Ứng dụng phân vùng ảnh ................................................................ 23
CHƯƠNG 2: MỘT SỐ THUẬT TOÁN PHÂN VÙNG ẢNH ...................... 25
2.1. Phân vùng ảnh dựa trên phương pháp phân lớp....................................... 25
2.1.1. Khái quát về phương pháp phân lớp ............................................... 25
2.1.2. Phân lớp các điểm ảnh trong không gian thuộc tính một chiều ..... 25
2.2. Phân vùng ảnh dựa trên sự phân chia miền kề ......................................... 31
2.2.1. Phương pháp tách cây tứ phân ........................................................ 31
2.2.2. Phương pháp cục bộ........................................................................ 36
2.2.3. Phương pháp tổng hợp .................................................................... 37
2.3. Phân vùng ảnh dựa theo đường biên ........................................................ 38
2.3.1. Làm mảnh biên ............................................................................... 38

2.3.2. Nhị phân hoá đường biên ................................................................ 40


2.3.3. Miêu tả đường biên ......................................................................... 41
2.3.4. Phân vùng ảnh dựa trên kết cấu bề mặt .......................................... 43
CHƯƠNG 3: XÂY DỰNG CHƯƠNG TRÌNH PHÂN VÙNG ẢNH ........... 48
3.1. Phát biểu bài toán ..................................................................................... 48
3.1.1. Phân tích bài toán ............................................................................ 48
3.1.2. Đối với ảnh đen trắng...................................................................... 49
3.1.3. Đối với ảnh màu .............................................................................. 49
3.1.4. Cài đặt thử nghiệm .......................................................................... 50
3.2. Thiết kế chương trình ............................................................................... 51
3.2.1. Giao diện của chương trình............................................................. 51
3.2.2. Một số kết quả minh hoạ................................................................. 52
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ...................................................... 55
TÀI LIỆU THAM KHẢO ............................................................................... 57


DANH MỤC HÌNH
Hình 1.1. Quá trình xử lý ảnh ...............................................................................7
Hình 1.2. Các bước cơ bản trong xử lý ảnh ..........................................................7
Hình 1.3. Ví dụ về nắn chỉnh hình biến dạng .....................................................15
Hình 2.1. Chọn ngưỡng các đường ngang dọc ...................................................27
Hình 2.2. Phân vùng ảnh tượng đài Washington ................................................27
Hình 2.3. Lược đồ hình rắn lượn và cách chọn ngưỡng .....................................28
Hình 2.4. Xác định ngưỡng dựa trên thuật toán tam giác ...................................29
Hình 2.5. Quá trình tính toán Pred(R) .................................................................36
Hình 2.6. Cây tứ phân của ảnh 𝑹 ........................................................................36
Hình 2.7. 4 liên thông và 8 liên thông .................................................................37
Hình 2.8. Làm mảnh ảnh .....................................................................................40

Hình 2.9. Loại bỏ đường bao hở .........................................................................41
Hình 2.10. Khép kín nhờ ngoại suy ....................................................................41
Hình 2.11. Loại bỏ các chân rết làm rõ biên .......................................................42
Hình 2.12. Phân tích kết cấu sợi bằng dải tương quan .......................................44
Hình 3.1. Form giao diện chính ..........................................................................51
Hình 3.2. Form chức năng phân vùng ảnh ..........................................................51
Hình 3.3. Lena_binary.JPEG ..............................................................................52
Hình 3.4. Ảnh Lena_binary.JPEG phân vùng.....................................................52
Hình 3.5. Ảnh xám thiếu nữ bên hoa huệ.JPEG .................................................53
Hình 3.6. Ảnh xám thiếu nữ bên hoa huệ.JPEG phân vùng ...............................53
Hình 3.7. Ảnh màu thiếu nữ hà thành.JPG .........................................................54
Hình 3.8. Ảnh màu thiếu nữ hà thành.JPG phân vùng .......................................54


1
MỞ ĐẦU
1. Lý do chọn đề tài
Trong những năm gần đây, cùng với sự phát triển vượt bậc của khoa
học máy tính, thì xử lý ảnh là một lĩnh vực đang được quan tâm. Xử lý ảnh là
một ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học
khác, hiện nay nó đang là một trong những lĩnh vực phát triển rất nhanh và
thu hút sự quan tâm từ các nhà khoa học, thúc đẩy các trung tâm nghiên cứu,
ứng dụng về lĩnh vực này.
Xử lý ảnh là ngành khoa học nghiên cứu các quá trình xử lý thông tin
dạng hình ảnh. Hình ảnh là một dạng thông tin vô cùng phong phú, đa dạng
và là phương tiện giao tiếp, trao đổi chủ yếu của con người. Thông tin hình
ảnh ngày nay có thể được xử lý dễ dàng bằng máy tính.
Mục tiêu của xử lý ảnh là:
- Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định, ví
dụ như ảnh mờ cần xử lý để được ảnh rõ hơn.

- Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân
loại, nhận biết ảnh, ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân
tay.
- Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn,
ví dụ từ ảnh một tai nạn giao thông phác họa hiện trường tai nạn.
Qua đó, có thể thấy xử lý ảnh đóng vai trò quan trọng trong các ứng
dụng thực tế về khoa học kĩ thuật cũng như trong cuộc sống thường ngày.
Những ứng dụng này dường như là vô hạn cùng với sự khám phá của con
người và sự phát triển như vũ bão của công nghệ số hóa, chẳng hạn, trong các
lĩnh vực như: Sản xuất và kiểm tra chất lượng, sự di chuyển của Robot, các
phương tiện đi lại, công cụ hướng dẫn cho người mù, an ninh và giám sát,
nhận dạng đối tượng, nhận dạng mặt, các ứng dụng trong y học, sản xuất, hiệu


2
chỉnh video, chinh phục vũ trụ.
Để xử lý được một bức ảnh thì phải trải qua nhiều khâu khác nhau tùy
theo mục đích của việc xử lý, nhưng khâu quan trọng và khó khăn nhất đó là
phân vùng ảnh. Trong một số lượng lớn các ứng dụng về xử lý ảnh và hiển thị
trên máy tính, phân vùng ảnh đóng vai trò chính yếu như là bước đầu tiên
trước khi áp dụng các thao tác xử lý ảnh mức cao hơn như: Nhận dạng, giải
thích ngữ nghĩa, và biểu diễn ảnh. Nếu bước phân vùng ảnh không tốt thì dẫn
đến việc nhận diện sai lầm về các đối tượng có trong ảnh.
Xuất phát trong hoàn cảnh đó tôi đã lựa chọn đề tài: “Thuật toán Phân
vùng ảnh dựa trên sự phân chia và kết hợp miền kề” để làm luận văn.
2. Mục đích nghiên cứu
Mục đích chính của luận văn là tìm hiểu, nghiên cứu các thuật toán
phân vùng ảnh và áp dụng thuật toán để xây dựng chương trình phân vùng
ảnh.
3. Nhiệm vụ nghiên cứu

- Tìm hiểu cơ bản về xử lý ảnh
- Tìm hiểu phương pháp phân vùng ảnh dựa trên phương pháp phân lớp.
- Tìm hiểu phương pháp phân vùng ảnh dựa trên sự phân chia và kết
hợp các miền kề.
- Tìm hiểu phương pháp phân vùng ảnh dựa theo đường biên.
- Xây dựng chương trình thử nghiệm phân vùng ảnh dựa trên sự phân
chia và kết hợp các miền kề.
4. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu
- Các thuật toán phân vùng ảnh.
b. Phạm vi nghiên cứu
Nghiên cứu, tìm hiểu thuật toán phân vùng ảnh và xây dựng chương


3
trình chương thử nghiệm.
5. Phương pháp nghiên cứu
a. Phương pháp nghiên cứu lý luận
Nghiên cứu qua việc đọc sách, báo và các tài liệu liên quan nhằm xây
dựng cơ sở lý thuyết của đề tài và các biện pháp cần thiết để giải quyết các
vấn đề của đề tài.
b. Phương pháp nghiên cứu chuyên gia
Tham khảo ý kiến của các chuyên gia để có thể thiết kế chương trình
phù hợp với yêu cầu thực tiễn, nội dung xử lý nhanh đáp ứng được yêu cầu
ngày càng cao của người sử dụng.
c. Phương pháp nghiên cứu thực nghiệm
Thông qua quan sát thực tế, yêu cầu của cơ sở, những lý luận được
nghiên cứu và kết quả đạt được qua những phương pháp trên.
6. Đóng góp của luận văn
Luận văn đã nghiên cứu, tìm hiểu về phân vùng ảnh trong xử lý ảnh và

áp dụng thuật toán để xây dựng một ứng dụng phân vùng ảnh.
 Ý nghĩa khoa học:
Phân vùng ảnh là một trong những tính tất yếu quyết định đến chất
lượng của hình ảnh. Mục tiêu của phân vùng ảnh là để đơn giản hóa hoặc thay
đổi biểu diễn của một tấm ảnh để dễ dàng phân tích. Phân vùng ảnh thường
được sử dụng để xác định vị trí các đối tượng, đường biên (đường thẳng,
cong,…). Phương pháp phân vùng ảnh dựa trên sự phân chia và kết hợp miền
kề đã giúp cho việc phân vùng ảnh trở lên nhanh chóng, rút ngắn thời gian
thực hiện và cho kết quả chính xác.
 Ý nghĩa thực tiễn:


4
Việc xây dựng chương trình mô phỏng phân vùng ảnh dựa trên sự phân
chia và kết hợp miền kề có ý nghĩa thực tiễn trong nhiều lĩnh vực khác nhau
như lĩnh vực hình ảnh y tế (medical imaging), phát hiện và nhận dạng đối
tượng, hệ thống camera giám sát, hệ thống điều khiển giao thông… Kỹ thuật
này là bước tiền xử lý quan trọng trong hầu hết các hệ thống xử lý ảnh, kết hợp
phân vùng tốt sẽ giúp cho quá trình xử lý về sau đạt hiệu quả cao hơn nhằm tiết
kiệm về chi phí tính toán, thời gian cũng như tăng độ chính xác của các ứng
dụng trên.
7. Cấu trúc của luận văn
Ngoài phần mở đầu, kết luận và tài liệu tham khảo, nội dung chính của
luận văn gồm 3 chương cụ thể như sau:
Chương 1: Tổng quan về xử lý ảnh
Chương 2: Một số thuật toán phân vùng ảnh
Chương 3: Xây dựng chương trình phân vùng ảnh


5

CHƯƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1. Xử lý ảnh và các vấn đề cơ bản trong xử lý ảnh
1.1.1. Xử lý ảnh là gì?
Xử lý ảnh là một lĩnh vực mang tính khoa học và công nghệ. Nó là một
ngành khoa học còn tương đối mới mẻ so với nhiều ngành khoa học khác,
nhưng tốc độ phát triển của nó rất nhanh, nhất là trên qui mô công nghiệp,
điều này đã kích thích các trung tâm nghiên cứu, ứng dụng, đặc biệt là máy
tính chuyên dụng cho nó. Xử lý ảnh có quan hệ mật thiết với nhận thức về ảnh
của con người. Nói một cách khác, "thị giác máy" dựa trên phép xử lý ảnh
bằng sự phân tích của máy, có thể nói "xử lý ảnh số và thị giác máy" được
liên kết chặt chẽ với nhau.
Trong các dạng truyền thông cơ bản: Lời nói, văn bản, hình ảnh, âm
thanh thì hình ảnh là dạng truyền thông truyền tải thông tin mạnh mẽ nhất.
Bằng thị giác, con người có thể nhận biết và hiểu về thế giới xung quanh
chúng ta.
Ví dụ: Những hình ảnh về trái đất, những hình ảnh trong dự báo thời tiết...
Có tới 99% lượng thông tin đã biết về thế giới xung quanh được nhận
biết thông qua thị giác [3].
Việc trang bị cho máy tính có khả năng thị giác như con người không
phải là việc dễ dàng. Chúng ta đang sống trong một không gian 3D, khi máy
tính cố gắng phân tích đối tượng trong không gian 3D thì những bộ cảm biến
có sẵn như camera, lại thường cho ảnh 2D. Như vậy, việc mất mát thông tin
của hình ảnh sẽ xảy ra. Với những cảnh động thì sự di chuyển của đối tượng
hay sự di chuyển của camera, tất cả những việc đó làm cho việc mất mát và
sai lệch thông tin rất lớn.
Ngày nay cùng với sự phát triển của ngành CNTT, chúng ta mong


6
muốn đưa được những hình ảnh mà con người có thể nhìn thấy được vào máy

tính để thực hiện các mục đích khác nhau của con người như: Phân tích ảnh,
phục hồi ảnh, phân vùng ảnh, nâng cao chất lượng ảnh. Với mục đích làm cho
ảnh sắc nét hơn hoặc làm cho ảnh gần giống nhất với trạng thái gốc, trạng thái
trước khi ảnh bị biến dạng. Để máy tính có thể hiểu và phân tích ảnh thì ảnh
cần được mã hoá và biểu diễn dưới dạng số gọi là ảnh số. Ngày nay một số
máy ảnh số sử dụng tăng cường khả năng zoom (phóng to, thu nhỏ) kỹ thuật
số của máy.
Việc xử lý ảnh trên máy tính là nhằm mục đích phân tích ảnh và phục
hồi các thông tin bị sai lệch của ảnh trong quá trình chụp. Như vậy xử lý ảnh
số là thực hiện các phép xử lý đối với ảnh số trên máy tính. Máy tính sử dụng
các phần mềm xử lý ảnh để phân tích, biến đổi ảnh nhằm làm cho ảnh đẹp
hơn ban đầu. Hầu như tất cả các phần mềm chỉnh sửa ảnh đều sử dụng một
hoặc nhiều phương pháp phân vùng ảnh. Hình ảnh sẽ mịn màng, không bị "vỡ
hạt" khi phóng to tùy vào thuật toán được sử dụng trong phân vùng ảnh. Điều
quan trọng cần ghi nhớ là phân vùng ảnh sẽ không thêm thông tin gì mới cho
hình ảnh cả, nó chỉ phân vùng các điểm ảnh và làm tăng dung lượng của tập
tin mà thôi. Tuy nhiên nhờ những phần mềm xử lý này mà ảnh có thể được
phóng to, thu nhỏ hay biến đổi tuỳ ý mà ảnh vẫn đẹp. Những biến đổi này đẹp
hay xấu tuỳ theo mục đích của người sử dụng, nhưng muốn ảnh biến đổi theo
đúng mục đích của mình thì điều quan trọng là người dùng cần phải hiểu ảnh.
Việc hiểu ảnh, phân tích ảnh và thị giác máy nhằm mục đích nhân bản
hiệu quả của thị lực con người, giúp nhận biết tốt hơn về thế giới xung quanh.
Con người thu nhận thông tin qua các giác quan, trong đó thị giác đóng
vai trò quan trọng nhất trong việc thu nhận thông tin. Những năm trở lại đây
với sự phát triển nhanh của phần cứng máy tính, xử lý ảnh và đồ hoạ đang
phát triển một cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý


7
ảnh và đồ hoạ đóng một vai trò quan trọng trong tương tác người máy. Quá

trình xử lý ảnh được xem như là quá trình thao tác ảnh đầu vào nhằm cho ra
kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một
ảnh “tốt hơn” hoặc một kết luận Error! Reference source not found..
Ảnh “Tốt hơn”
Ảnh

Xử lý ảnh
Kết luận
Hình 1.1. Quá trình xử lý ảnh

Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem
như là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó
của đối tượng trong không gian và nó có thể xem như một hàm n biến P(c1, c2,...,
cn). Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao
chất lượng ảnh và phân tích ảnh. Hình 1.2 mô tả các bước cơ bản trong xử lý
ảnh [5]:

Thu nhận
ảnh

Tiền xử
lý ảnh

Phân
đoạn ảnh

Biểu diễn
và mô tả


Cơ sở tri thức

Hình 1.2. Các bước cơ bản trong xử lý ảnh
Sơ đồ này bao gồm các thành phần sau [5]:
a. Phần thu nhận ảnh

Nhận
dạng và
nội suy


8
Ảnh tự nhiên từ thế giới bên ngoài được thu nhận qua các thiết bị thu
như Camera, từ vệ tinh qua các bộ cảm ứng, máy quét ảnh.
b. Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu, độ tương phản thấp nên cần đưa vào
bộ tiền xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc
nhiễu, nâng độ tương phản để làm ảnh rõ hơn, nét hơn.
c. Phân đoạn ảnh hay phân cùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để
biểu diễn phân tích, nhận dạng ảnh. Ví dụ: nhận dạng mã vạch cho các sản
phẩm. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây lỗi,
làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều vào
công đoạn này.
d. Biểu diễn và mô tả ảnh
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh (ảnh đã
phân đoạn) cộng với mã liên kết với các vùng lân cận. Việc biến đổi các số
liệu này thành dạng thích hợp là cần thiết cho xử lý tiếp theo bằng máy tính.
Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn đặc trưng gắn với
việc tách các đặc tính của ảnh dưới dạng các thông tin định lượng hoặc làm cơ

sở để phân biệt lớp đối tượng này với đối tượng khác trong phạm vi ảnh nhận
được.
e. Nhận dạng và nội suy
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu
được bằng cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội
suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng. Có nhiều cách phân loại
ảnh khác nhau, theo lý thuyết nhận dạng, các mô hình toán học về ảnh được
phân loại theo hai nhận dạng ảnh cơ bản:
- Nhận dạng theo tham số


9
- Nhận dạng theo cấu trúc.
Một đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng
trong khoa học và công nghệ là nhận dạng ký tự, nhận dạng vân tay, nhận
dạng mã vạch, nhận dạng mặt người,….
f. Cơ sở tri thức
Ảnh là một đối tượng khá phức tạp về đường nét, độ sáng tối, dung
lượng điểm ảnh, môi trường để thu ảnh phong phú kéo theo nhiễu. Trong
nhiều khâu xử lý và phân tích ảnh, ngoài việc đơn giản hoá các phương pháp
toán học đảm bảo tiện lợi cho việc xử lý, người ta mong muốn bắt chước quy
trình tiếp nhận và xử lý ảnh theo cách của con người.
g. Mô tả (biểu diễn ảnh)
Từ hình 1.2, ảnh sau khi số hoá sẽ được lưu vào bộ nhớ, hoặc chuyển
sang các khâu tiếp theo để phân tích. Nếu lưu trữ ảnh trực tiếp từ các ảnh thô,
đòi hỏi dung lượng bộ nhớ cực lớn và không hiệu quả theo quan điểm ứng
dụng và công nghệ. Thông thường các ảnh đó được đặc tả lại theo các đặc
điểm của ảnh được gọi là các đặc trưng ảnh như: biên ảnh, vùng ảnh. Một số
phương pháp biểu diễn thường dùng:
- Biểu diễn bằng mã chạy

- Biểu diễn bằng mã xích
- Biểu diễn bằng mã tứ phân.
Biểu diễn bằng mã chạy
Phương pháp này thường biểu diễn cho vùng ảnh và áp dụng cho ảnh
nhị phân. Một vùng ảnh R có thể mã hoá đơn giản nhờ một ma trận nhị phân:
1
𝑛ế𝑢 (𝑚, 𝑛) 𝑡ℎ𝑢ộ𝑐 𝑅
𝑈(𝑚, 𝑛) = {
0 𝑛ế𝑢 (𝑚, 𝑛) 𝑘ℎô𝑛𝑔 𝑡ℎ𝑢ộ𝑐 𝑅
Trong đó, U(m,n) là hàm mô tả mức xám tại toạ độ (m,n). Với cách
biểu diễn trên, một vùng ảnh được mô tả bằng một tập các chuỗi số 0 hoặc 1.


10
Giả sử chúng mô tả ảnh nhị phân của một vùng ảnh được thể hiện theo toạ độ
(x,y) theo các chiều và đặc tả chỉ đối với giá trị “1” khi đó dạng mô tả có thể
là (x,y)r, trong đó (x,y) là toạ độ, r là số lượng các bit có giá trị “1” liên tục
theo chiều ngang hoặc dọc.
Biểu diễn bằng mã xích
Phương pháp này thường dùng để biểu diễn đường biên ảnh. Một
đường bất kỳ được chia thành các đoạn nhỏ. Nối các điểm chia, ta có các
đoạn thẳng kế tiếp được gán hướng cho đoạn thẳng đó tạo thành một dây xích
gồm các đoạn. Các hướng có thể chọn 4, 8, 12, 24,… mỗi hướng được mã hoá
theo số thập phân hoặc số nhị phân thành mã của hướng [9].
Biểu diễn bằng mã tứ phân
Phương pháp mã tứ phân được dùng để mã hoá cho vùng ảnh. Vùng
ảnh đầu tiên được chia làm bốn phần thường là bằng nhau. Nếu mỗi vùng đã
đồng nhất (chứa toàn điểm đen (1) hay trắng (0)) thì gán cho vùng đó một mã
và không chia tiếp. Các vùng không đồng nhất được chia tiếp làm bốn phần
theo thủ tục trên cho đến khi tất cả các vùng đều đồng nhất. Các mã phân chia

thành các vùng con tạo thành một cây phân chia các vùng đồng nhất [9].
1.1.2. Các vấn đề cơ bản trong xử lý ảnh
1.1.2.1. Một số khái niệm cơ bản
Ảnh trong thực tế (ảnh tự nhiên) là một ảnh liên tục về không gian và
về giá trị độ sáng. Để có thể xử lý ảnh bằng máy tính, cần thiết phải tiến hành
số hoá ảnh nhằm biến đổi gần đúng một ảnh liên tục thành một tập điểm, phù
hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Trong quá trình
số hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá
trình lấy mẫu (rời rạc hoá về không gian), và lượng hoá thành phần giá trị mà
về nguyên tắc bằng mắt thường không phân biệt được hai điểm kề nhau.
Trong quá trình này người ta sử dụng khái niệm điểm ảnh (pixel). Như vậy
một ảnh là một tập hợp các điểm ảnh. Khi sử dụng đến phân vùng ảnh thì việc


11
phân biệt hai điểm ảnh kề nhau là việc cần thiết.
Điểm ảnh (pixel) được xem như là dấu hiệu hay cường độ sáng tại một toạ
độ trong không gian của đối tượng. Mỗi pixel gồm một cặp toạ độ x, y và màu.
Như vậy, một ảnh là một tập hợp các điểm ảnh. Khi được số hoá, nó
thường được biểu diễn bởi mảng hai chiều hay ma trận hai chiều I(n,p): mỗi
phần tử có một giá trị nguyên hoặc là một véc tơ cấu trúc màu, n dòng và p
cột. Ta nói ảnh gồm n x p pixels. Người ta thường kí hiệu I(x,y) để chỉ một
pixel. Thường giá trị của n chọn bằng p và bằng 256. Một pixel có thể lưu trữ
trên 1, 4, 8 hay 24 bit. Mỗi điểm ảnh khi mã hoá sẽ được biểu diễn dưới dạng
8 bit. Cách mã hoá kinh điển thường dùng 16, 32 hay 64 mức. Mã hoá 256
mức là phổ dụng nhất do lý do kỹ thuật. Vì 2 8 = 256 (0, 1, ..., 255), nên với
256 mức, mỗi pixel sẽ được mã hoá bởi 8 bit và từ đó có thể biểu diễn ảnh
dưới nhiều dạng khác nhau. Số pixel tạo nên một ảnh gọi là độ phân giải
(resolution).
1.1.2.2. Độ phân giải của ảnh

Độ phân giải của ảnh là mật độ điểm ảnh được ấn định trên một ảnh số
được hiển thị [5].
Khoảng cách giữa các điểm ảnh phải được chọn sao cho mắt người vẫn
thấy được sự liên tục của ảnh. Việc lựa chọn khoảng cách thích hợp tạo nên
một mật độ phân bố chính là độ phân giải, và được phân bố theo trục x, y
trong không gian hai chiều.
Ví dụ: Với màn CGA (320 x 200) là một lưới điểm theo chiều ngang
màn hình: 320 điểm chiều dọc x 200 điểm ảnh. So sánh màn hình CGA 12
(Color Graphic Adaptor) thì thấy ảnh mịn hơn màn hình CGA 17. Như vậy
diện tích càng rộng thì độ mịn của ảnh càng kém đi, cũng như khi phóng to
một ảnh cũng vậy, ảnh càng to thì càng bị vỡ hạt, độ mịn càng kém.


12
1.1.2.3. Mức xám của ảnh
Mức xám của điểm ảnh là cường độ sáng của nó được gán bằng giá trị
số tại điểm đó [5].
Trong biểu diễn số của các ảnh đa mức xám, một ảnh được biểu diễn
dưới dạng một ma trận hai chiều. Mỗi phần tử của ma trận biểu diễn cho mức
xám hay cường độ của ảnh tại vị trí đó. Mỗi phần tử trong ma trận được gọi là
một phần tử ảnh hoặc điểm ảnh (pixel). Một điểm ảnh có hai đặc trưng cơ bản
là vị trí (x,y) của điểm ảnh và độ xám.
a. Các thang giá trị mức xám thông thường
Thông thường có các thang mức xám như: 16, 32, 64, 128, 256 (với lý
do kỹ thuật máy tính dùng 1 byte (8 bit) để biểu diễn mức xám thì có thể biểu
diễn: 28 = 256 mức (0, 1, …, 255) thì mức 256 là mức phổ dụng.
- Mức xám ở ảnh đen trắng: Ảnh đen trắng là ảnh chỉ có hai màu đen
trắng, mức xám ở các điểm ảnh có thể khác nhau. Nếu dùng 8 bit (1 byte) để
biểu diễn mức xám, thì số các mức xám có thể biểu diễn được là 2 8 hay 256.
Mỗi mức xám được biểu diễn dưới dạng là một số nguyên nằm trong khoảng

từ 0 đến 255, với mức 0 biểu diễn cho mức cường độ đen nhất và 255 biểu
diễn cho mức cường độ sáng nhất.
- Mức xám ở ảnh nhị phân: Ảnh chỉ có hai mức đen, trắng phân biệt,
tức dùng 1 bit mô tả 21 mức khác nhau. Nói cách khác mỗi điểm ảnh của ảnh
nhị phân chỉ có thể là 0 hoặc 1.
- Mức xám ở ảnh màu: Ảnh màu được tạo nên từ ba màu cơ bản (Red,
Blue, Green), người ta dùng 3 byte để mô tả mức màu, khi đó giá trị màu: 28.3 =
224 = 16,7 triệu màu.
Với ảnh màu: Cách biểu diễn cũng tương tự như với ảnh đen trắng, chỉ
khác là các số tại mỗi phần tử của ma trận biểu diễn cho ba màu riêng rẽ gồm:
đỏ (red), lục (green) và lam (blue). Để biểu diễn cho một điểm ảnh màu cần


13
24 bit, 24 bit này được chia thành ba khoảng 8 bit. Mỗi khoảng này biểu diễn
cho cường độ sáng của một trong các màu chính.
b. Các kiểu ảnh
b1. Ảnh chỉ số (Index Images)
Một ảnh chỉ số bao gồm một ma trận dữ liệu X và ma trận bản đồ màu
(map). Ma trận dữ liệu có thể có kiểu thuộc lớp uint8, uint16 hoặc kiểu
double. Ma trận bản đồ màu là một mảng m x 3 kiểu double bao gồm các giá
trị dấu phẩy động nằm giữa 0 và 1. Mỗi hàng của bản đồ chỉ ra các giá trị mà:
red, green và blue của một màu đơn. Một ảnh chỉ số sử dụng ánh xạ trực tiếp
giữa giá trị của pixel ảnh tới giá trị trong bản đồ màu. Màu sắc của mỗi pixel
ảnh được tính toán bằng cách sử dụng giá trị tương ứng của X ánh xạ tới một
giá trị chỉ số của bản đồ màu. Giá trị 1 chỉ ra hàng đầu tiên, giá trị 2 chỉ ra
hàng thứ hai trong bản đồ màu.
Một bản đồ màu thường được chứa cùng với ảnh chỉ số và được tự
động nạp cùng với ảnh. Tuy nhiên, không bị giới hạn khi sử dụng bản đồ màu
mặc định, ta có thể sử dụng bất kì bản đồ màu nào. Các pixel trong ảnh được

đại diện bởi một số nguyên ánh xạ tới một giá trị tương ứng trong bản đồ
màu.
b2. Ảnh cường độ (Intensity Images)
Một ảnh cường độ là một ma trận dữ liệu ảnh I mà giá trị của nó đại
diện cho cường độ trong một số vùng nào đó của ảnh. Ma trận có thể thuộc
lớp double, uint8 hay uint16. Trong khi ảnh cường độ hiếm khi được lưu với
bản đồ màu. Những phần tử trong ma trận cường độ đại diện cho các cường
độ khác nhau hoặc độ xám.
b3. Ảnh nhị phân (Binary Images)
Trong một ảnh nhị phân, mỗi pixel chỉ có thể chứa một trong hai giá trị


14
nhị phân 0 hoặc 1. Hai giá trị này tương ứng với bật hoặc tắt (on hoặc off).
Một ảnh nhị phân được lưu trữ như một mảng logic của 0 và 1.
b4. Ảnh RGB (RGB Images)
Một ảnh RGB được lưu trữ dưới dạng một mảng dữ liệu có kích thước
3 chiều m x n x 3, định nghĩa các giá trị màu red, green và blue cho mỗi pixel
riêng biệt. Ảnh RGB không sử dụng bảng màu. Màu của mỗi pixel được
quyết định bởi sự kết hợp giữa các giá trị R, G, B (Red, Green, Blue) được
lưu trữ trong một mặt phẳng màu tại vị trí của pixel. Định dạng file đồ hoạ
lưu trữ ảnh RGB giống như một ảnh 24 bit trong đó R, G, B chiếm tương ứng
8 bit 1. Điều này cho phép nhận được 16,7 triệu màu khác nhau .
Một mảng RGB có thể thuộc lớp double, uint8 hoặc uint16. Trong một
mảng RGB thuộc lớp double, mỗi thành phần màu có giá trị giữa 0 và 1. Một
pixel mà thành phần màu của nó là (0,0,0) được hiển thị với màu đen và một
pixel mà thành phần màu là (1,1,1) được hiển thị với màu trắng.
Trong một ảnh RGB khoảng trắng tương ứng với giá trị cao nhất của
mỗi màu riêng rẽ. Chẳng hạn trong ảnh mặt phẳng R, vùng trắng đại diện cho
sự tập trung cao nhất của màu đỏ thuần khiết. Nếu R được trộn với G hoặc B

ta sẽ có màu xám. Vùng màu đen trong ảnh chỉ ra giá trị của pixel mà không
chứa màu đỏ R = 0. Tương tự cho các mặt phẳng màu G và B.
1.1.2.4. Nắn chỉnh biến dạng
Nắn chỉnh biến dạng là việc biến đổi hình học giữa hai ảnh: Ảnh
nguồn và ảnh đích. Sự biến đổi hình học được định nghĩa về mối quan hệ giữa
các điểm ảnh nguồn và điểm ảnh đích Error! Reference source not found..
Thuật toán nắn chỉnh ảnh có hai khuynh hướng: Tác động toàn cục
hoặc tác động cục bộ. Tác động toàn cục là áp dụng thuật toán, tiêu chí như
nhau đối với mọi điểm ảnh trên toàn bộ ảnh. Còn tác động cục bộ chỉ tác động
trên các điểm ảnh ở một số vùng của ảnh, còn các vùng khác của ảnh ta giữ


15
nguyên. Các thuật toán nắn chỉnh toàn cục có tốc độ xử lý tương đối nhanh
nhưng chỉ áp dụng được với các yêu cầu đơn giản như co, giãn ảnh, bóp méo
cả ảnh thành tứ giác hay một số hiệu ứng khác như mắt cá, kính núp, ...
Thuật toán nắn chỉnh cục bộ cho kết quả ấn tượng hơn. Tuy nhiên để
nắn chỉnh từng vùng, phải xác định thêm tập đặc trưng. Trong trường hợp này
việc xây dựng thuật toán tương đối phức tạp.

𝑃𝑖′

𝑃𝑖

a) Ảnh gốc

b) Ảnh qua xử lý

Hình 1.3. Ví dụ về nắn chỉnh hình biến dạng
Nắn chỉnh biến dạng là một khâu trong xử lý ảnh. Với mỗi ảnh tùy theo

mức độ, hiện trạng, và chủng loại ảnh mà người ta sử dụng ứng dụng nào cho
phù hợp nhất trong xử lý ảnh.
1.1.2.5. Khử nhiễu
Có 2 loại nhiễu cơ bản trong quá trình thu nhận ảnh:
- Nhiễu hệ thống: Là nhiễu có quy luật có thể khử bằng các phép biến đổi.
- Nhiễu ngẫu nhiên: Vết bẩn không rõ nguyên nhân và có thể khắc phục
bằng các phép lọc.
1.1.2.6. Chỉnh mức xám
Nhằm khắc phục tính không đồng đều của hệ thống gây ra. Thông
thường có hai hướng tiếp cận:


16
- Giảm số mức xám: Thực hiện bằng cách nhóm các mức xám gần nhau
thành một bó. Trường hợp chỉ có 2 mức xám thì chính là chuyển về ảnh đen
trắng. Ứng dụng: In ảnh màu ra máy in đen trắng.
- Tăng số mức xám: Thực hiện nội suy ra các mức xám trung gian bằng
kỹ thuật nội suy. Kỹ thuật này nhằm tăng cường độ mịn cho ảnh.
1.1.2.7. Trích chọn đặc điểm
Các đặc điểm của đối tượng được trích chọn tuỳ theo mục đích nhận
dạng trong quá trình xử lý ảnh. Có thể nêu ra một số đặc điểm của ảnh sau
đây:
- Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ,
điểm uốn.
- Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc
thực hiện lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc
điểm” (feature mask) thường là các khe hẹp với hình dạng khác nhau (chữ
nhật, tam giác, cung tròn).
- Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối
tượng và do vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được

dùng khi nhận dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ
toán tử gradient, toán tử la bàn, toán tử Laplace, toán tử “chéo không” (zero
crossing).
Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối
tượng ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm
xuống.
1.1.2.8. Nén ảnh
Nhằm giảm thiểu không gian lưu trữ. Thường được tiến hành theo cả
hai cách khuynh hướng là nén có bảo toàn và không bảo toàn thông tin. Nén
không bảo toàn thì thường có khả năng nén cao hơn nhưng khả năng phục hồi


17
thì kém hơn. Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong
nén ảnh Error! Reference source not found.:
- Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần suất
xuất hiện của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa
thích hợp. Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF.
- Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các
điểm ảnh để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm
ảnh trong các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX.
- Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng
nén không bảo toàn và do vậy, kỹ thuật thường nén hiệu quả hơn *.JPG chính
là tiếp cận theo kỹ thuật nén này.
- Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể
hiện sự lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ
phần gốc ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
1.1.2.9. Một số thuộc tính cần quan tâm của ảnh số
- Đường viền (Border): Đường viền của một vùng ảnh R là tập hợp các
điểm ảnh trong vùng đó mà có một hay nhiều lân cận bên ngoài vùng R.

- Biên ảnh (Edge): Một điểm ảnh có thể coi là biên nếu ở đó có sự thay
đổi đột ngột về mức xám. Tập hợp các điểm biên tạo thành đường bao của
ảnh.Thuộc tính biên gắn liền một điểm ảnh và lân cận của nó, đôi khi nó giúp
cho việc xác định đặc tính giữa một cặp điểm lân cận.
Ví dụ: Trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là
điểm đen và có ít nhất một điểm trắng lân cận.
- Độ sắc nét của ảnh: Độ sắc nét là khả năng phát hiện những chi tiết
trong ảnh. Mắt người ít nhạy cảm với sự thay đổi nhanh hay chậm của độ
sáng trong mặt phẳng ảnh nhưng nhạy cảm với sự thay đổi trung gian.
- Độ phân giải trong ảnh được giới hạn bởi khả năng phân giải ở mắt


18
người. Khi độ phân giải của ảnh cao hơn độ phân giải của mắt người thì con
người không thể cảm nhận về ảnh được nữa.
Độ phân giải trong quang học được định nghĩa là khoảng cách giữa hai
điểm ảnh gần nhất mà con người không thể phân biệt được.
Mỗi một ảnh đều có độ sắc nét, độ phân giải riêng, việc xử lý ảnh nhằm
mục đích làm cho ảnh sắc nét hơn, đẹp hơn hay gần với ảnh gốc hơn, và khi biến
đổi bằng một trong các phương pháp phân vùng ảnh làm cho ảnh có khả năng
hiển thị tốt, và để xác định vị trí các đối tượng, đường biên (đường thẳng,
cong…).
1.2. Khái quát về phân vùng ảnh
1.2.1. Một số khái niệm
Phân vùng ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm
phân tích ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên
hay các vùng liên thông [3]. Tiêu chuẩn để xác định các vùng liên thông có
thể là cùng mức xám, cùng màu hay cùng độ nhám…
Trước hết cần làm rõ khái niệm "vùng ảnh" (Segment) và đặc điểm vật
lý của vùng. Vùng ảnh là một chi tiết, một thực thể trông toàn cảnh. Nó là một

tập hợp các điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức
màu, độ nhám… Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng
ảnh là nói đến tính chất bề mặt. Đường bao quanh một vùng ảnh (Boundary)
là biên ảnh. Các điểm trong một vùng ảnh có độ biến thiên giá trị mức xám
tương đối đồng đều hay tính kết cấu tương đồng.
Phân vùng có thể được tiếp cận từ hai quan điểm: Bằng cách nhận dạng
đường biên (hoặc đường) hoặc bằng cách nhận ra các vùng (region, area) bên
trong ảnh. Các phép toán phân vùng có thể xem như là đối ngẫu của các phép
toán tìm biên (hay tách cạnh), bởi vì khi tìm biên được kết thúc, điều đó tương
đương với việc tách một vùng làm hai. Một cách lý tưởng, các phép toán tách


×