Tải bản đầy đủ (.pdf) (22 trang)

GIÁM sát AN NINH DÙNG kĩ THUẬT xử lý HÌNH ẢNH

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.08 MB, 22 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM KỸ THUẬT
THÀNH PHỐ HỒ CHÍ MINH

LUẬN VĂN THẠC SĨ
HỒ QUỐC THIỀN

GIÁM SÁT AN NINH DÙNG KỸ THUẬT
XỬ LÝ HÌNH ẢNH

NGÀNH: KỸ THUẬT ĐIỆN TỬ- 60520203

S K C0 0 4 9 1 7

Tp. Hồ Chí Minh, năm 2016


LÝ LỊCH KHOA HỌC
I. LÝ LỊCH SƠ LƢỢC:
Họ & tên: Hồ Quốc Thiền

Giới tính: Nam

Ngày, tháng, năm sinh: 25/08/1990

Nơi sinh: Đà Lạt

Quê quán: Quảng Nam

Dân tộc: Kinh


Chỗ ở riêng hoặc địa chỉ liên lạc: Căn hộ H812 - Chung cƣ CBD đƣờng Đồng
Văn Cống – Phƣờng Thạnh Mỹ Lợi – Quận 2 – Tp.Hồ Chí Minh
Điện Thoại: 0949009666
E-mail:
II. QUÁ TRÌNH ĐÀO TẠO:
1. Đại học:
Hệ đào tạo: chính quy

-

Thời gian đào tạo từ 2008 đến 2014.

Nơi học (trƣờng, thành phố): Đại học sƣ phạm kĩ thuật Tp.HCM
Ngành học: Công nghệ điện tử viễn thông
Tên đồ án, luận án hoặc môn thi tốt nghiệp:
―Xử lý và nhận dạng tiếng nói‖.
Ngày & nơi bảo vệ đồ án, luận án hoặc thi tốt nghiệp:
2/2014 tại trƣờng Đại học sƣ phạm kĩ thuật Tp.HCM
Ngƣời hƣớng dẫn: Th.S Nguyễn Ngô Lâm

i


2. Thạc sĩ:

Hệ đào tạo: chính quy - Thời gian đào tạo từ 05/2015 đến 10/2016.
Nơi học (trƣờng, thành phố):Đại học sƣ phạm kĩ thuật Tp.HCM
Ngành học: kĩ thuật điện tử
Tên luận văn: ―Giám sát an ninh dùng kĩ thuật xử lý hình ảnh‖
Ngày & nơi bảo vệ luận văn:

22/10/2016 tại trƣờng Đại học sƣ phạm kĩ thuật Tp.HCM
Ngƣời hƣớng dẫn: TS. Lê Mỹ Hà

ii


LỜI CAM ĐOAN

Tôi cam đoan đây là công trình nghiên cứu của tôi.
Các số liệu, kết quả nêu trong luận văn là trung thực và chƣa từng đƣợc ai
công bố trong bất kỳ công trình nào khác
Tp. Hồ Chí Minh, ngày 01 tháng 10 năm 2016
Hồ Quốc Thiền

iii


LỜI CẢM ƠN

Em xin chân thành cám ơn các Thầy, Cô trong khoa Điện – Điện Tử đã trang bị cho
em một kiến thức nền tảng giúp em có thể hoàn thành tốt luận văn này. Cám ơn các
bạn trong lớp đã chia sẻ các kinh nghiệm và đã hỗ trợ trong lúc làm luận văn.
Đặc biệt em xin chân thành cảm ơn Thầy hƣớng dẫn, T.SLê Mỹ Hàđã hƣớng dẫn và
hỗ trợ em trong lúc thực hiện luận văn này.

Học viên
Hồ Quốc Thiền

iv



TÓM TẮT
Khoa học kĩ thuật ngày càng phát triển dẫn đến nhu cầu về các thiết bị thông minh
có thể thay con ngƣời đƣa ra các quyết định cũng nhƣ phân loại đối tƣợng. Xử lý
ảnh – thị giác máy tính giúp giải quyết một phần nhu cầu đó.
Nhận dạng hành động ngƣời cũng là một đề tài thu hút sự chú ý nghiên cứu với các
ứng dụng của nó trong tƣơng tác giữa ngƣời và máy cũng nhƣ các ứng dụng về
giám sát anh ninh trong khu vực đặt các camera cố định.
Luận văn này xây dụng ứng dụng xử lý ảnh –thị giác máy tính vào việc phát hiện và
nhận dạng hành động của đối tƣợng qua video. Đầu tiên là phân hiện ngƣời trong
khung ảnh dùng ACF và Adaboost để trƣợt các khung cửa sổ phân loại. Sau khi đã
phát hiện đƣợc ngƣời có trong khung ảnh thì bám theo khu vực ngƣời đó
(tracking)video. Khi đã bám mục tiêu (tracking) thành công,chƣơng trình sẽ trích
các đặc trƣng HOG (Histogram of Oriented Gradients) trong nhiều frame ảnh liên
tiếp của những ngƣời trong khung ảnh và sắp xếp chúng trên miền thời gian để biểu
thị cho hành động của con ngƣời –sau cùng là phân loại các hành động thông qua
vector hỗ trợ máy học (SVM: Support Vector Machines).
Luận văn có bố cục gồm những phần nhƣ sau:
I.

Tổng Quan đề tài.

II.

Cơ sở lý thuyết.

III.

Xây dựng chƣơng trình.


IV.

Kết luận và hƣớng nghiên cứu.

v


MỤC LỤC
Trang tựa

TRANG

LÝ LỊCH KHOA HỌC ...................................................................................... i
LỜI CAM ĐOAN ............................................................................................ iii
LỜI CẢM ƠN .................................................................................................. iv
TÓM TẮT ......................................................................................................... v
MỤC LỤC ........................................................................................................ vi
DANH SÁCH HÌNH...................................................................................... viii
Chƣơng 1: TỔNG QUAN ................................................................................. 1
1.1 Tổng Quan Về Lĩnh Vực Nghiên Cứu ...................................................... 1
1.2 Mục đích của đề tài ................................................................................... 2
1.3 Nhiệm Vụ Và Giới Hạn Của Đề Tài ......................................................... 2
1.3.1Nhiệm Vụ của đề tài.................................................................................. 2
1.3.2Giới Hạn của đề tài ................................................................................... 3
1.3.3Phƣơng Pháp Nghiên Cứu ........................................................................ 3
1.4 Kế hoạch thực hiện.................................................................................... 3
Chƣơng 2: CƠ SỞ LÝ THUYẾT ...................................................................... 4
2.1. Xử lý ảnh số .............................................................................................. 4
2.1.1. Các thuật toán xử lý hình thái học ........................................................ 4
2.1.1.1


. Phần tửcấu trúc ................................................................................ 4

2.1.1.2. Phép co ảnh – Erosion .......................................................................... 6
2.1.1.3. Phép giãn ảnh – Dialtion ...................................................................... 7
2.1.1.4. Phép mở ảnh– Openning ...................................................................... 8
2.1.2. Các ứng dụng của các thuật toán xử lý hình thái học ........................... 10
2.1.2.1. Trích lọc biên ảnh –Boundaryextraction ............................................ 10
2.1.2.2. Tô đầy vùng – Region fill .................................................................. 11

vi


2.1.2.3. Trích lọc thành phần liên thông - Extracting connected components
12
2.1.2.4. Làmmỏngđốitƣợngtrongảnh–Thinning ........................................... 13
2.1.2.5. Làm dày đối tƣợng trong ảnh – Thickening .................................... 13
2.1.2.6. Thuật toán tìm xƣơng đối tƣợng trong ảnh- Skeletons ................... 14
2.2. Đặc trƣng ACF và Adaboost ................................................................. 15
2.2.1. Đặc trƣng ACF (Aggregated Channel Features ) ............................... 15
2.2.1.1. Kênh đặc trƣng tỉ lệ ............................................................................ 16
2.2.1.2

. Đặc trƣng nhanh hình tháp ............................................................ 16

2.2.1.3. Đặc trƣng kênh tổng hợp (ACF) ........................................................ 18
2.2.2.

Phƣơng pháp AdaBoost ..................................................................... 18


2.3. Bộ lọc Kalman.......................................................................................... 19
2.3.1. Bộ lọc Kalman tuyến tính ................................................................... 19
2.3.2. Bộ lọc Kalman mở rộng. .................................................................... 24
2.4. Histogram of gradient (HOG) ................................................................. 27
2.4.1. Giới thiệu HOG .................................................................................. 27
2.4.2. Rút trích đặc trƣng HOG trong ảnh .................................................... 27
2.4.3. Đặc trƣng hành động n-hog: ................................................................. 31
2.5. Support Vector Machines (SVM) .......................................................... 32
2.5.1. Giới thiệu ............................................................................................ 32
2.5.2. Các khái niệm cơ bản ............................................................................ 32
2.5.3. Phân lớp dữ liệu .................................................................................. 40
Chƣơng 3: Xây dựng chƣơng trình trên MATLAB ........................................ 43
3.1. Thiết kế: .................................................................................................. 43
3.2. Kết quả: .................................................................................................... 46
3.3. Nhận xét: .................................................................................................. 48
Chƣơng 4: Kết luận và hƣớng phát triển......................................................... 49
TÀI LIỆU THAM KHẢO ............................................................................... 53

vii


DANH SÁCH HÌNH
HÌNH

TRANG

Hình 2.1: Mộtsố hình dáng của phần tử cấu trúc phẳng. .................................. 5
Hình 2.2: Mộtmặt nạ xác định lân cận của phần tử cấu trúc không phẳng....... 5
Hình 2.3: Ma trận giá trị thực tƣơng ứng với lân cận trong phần tử cấu trúc
không phẳng. ..................................................................................................... 5

Hình 2.4: Ví dụ về phép toán co ảnh nhị phân vớiphần tử cấutrúc phẳng........ 6
Hình 2.5. Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không
phẳng. ................................................................................................................ 6
Hình 2.6: Ví dụ về phép giãn nhị phân trên ảnh vớiphần tử cấutrúc phẳng ..... 7
Hình 2.7:. Phép toán giãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng.
........................................................................................................................... 8
Hình 2.8: Phần tử cấu trúc phẳng ...................................................................... 9
Hình 2.10: Kết quả của một số phép biến đổi trên ảnh nhị phân và ảnh xám .. 9
Hình 2.11: Trích lọc biên của đối tƣợng: ........................................................ 10
Hình 2.12: Kết quả của việc thực hiện lấp đầy vùng ảnh ............................... 11
Hình 2.13: Hình dáng 4 lân cận (N4)và 8 lân cận (N8) ................................. 12
Hình 2.15: Kết quả của thực hiện tríchlọc thành phần liên thông trong ảnh .. 13
Hình 2.14: Kết quả làm mỏng đối tƣợng ........................................................ 13
Hình 2.16: Kết quả làm dày đối tƣợng ............................................................ 14
Hình 2.18: Ảnh ................................................................................................ 15
Hình 2.19: các kênh đặc trƣng trong ACF ...................................................... 15
Hình 2.20: Kênh đặc trƣng tỉ lệ....................................................................... 16
Hình 2.21: Đặc trƣng nhanh hình tháp. [10] ................................................... 17
Hình 2.22: Tổng quan về bộ phát hiện ACF. .................................................. 18
Hình 2.23: Thuật toán Kalman cổ điển. .......................................................... 23

viii


Hình 2.24: thuật toán Kalman mở rộng. ......................................................... 26
Hình 2.25: Mỗi khối (block) gồm nhiều ô (cell). ............................................ 28
Hình 2.26: Các khối (block) đƣợc xếp chồng lên nhau .................................. 28
Hình 2.27: Tính góc và biên độ theo X-gradient và Y-gradient ..................... 29
Hình 2.28: Các bƣớc rút trích đặc trƣng HOG [2] .......................................... 31
Hình 2.29: Đối tƣợng sau khi đƣợc phát hiện và trích đặc trƣng HOG ...............

trong 5-frames ảnh liên tiếp. ........................................................................... 32
Hình 2.30: Đƣờng màu vàng trên hình là đƣờng phân chia đối với tập dữ liệu
gồm hai thuộc tính ........................................................................................... 34
Hình 2.31: Một bộ dữ liệu hai chiều đƣợc phân chia tuyến tính.35Hình 2.32:
Ví dụ về siêu phẳng phân chia tuyến tính cùng với biên độ của nó. .............. 36
Hình 2.33: Đƣờng biểu diễn H1 và H2 ........................................................... 38
Hình 2.34: Các support vector trong SVM. .................................................... 39
Hình 2.35: Một trƣờng hợp không khả phân tuyến tính. ................................ 41
Hình 3.1: Tiến trình của hệ thống ................................................................... 43
Hình 3.2: Đối tƣợng sau khi đƣợc phát hiện và trích đặc trƣng HOG
trong 5-frames ảnh liên tiếp.

44

Hình 3.3: Ảnh kết quả sau khi phát hiện và tracking ngƣời test trên tập dữ liệu
PETS09 [13] với độ phân giải 768*576.......................................................... 46
Hình 4.1: Lỗi sai do đặc trƣng HOG thể hiện ................................................. 49
Hình 4.2: Sơ đồ khối của phƣơng pháp [5] để nâng cao chất lƣợng DPM..... 50
Hình 4.3: Kết quả thời gian thực thi của phƣơng pháp trên trình bày [5]. ..... 51
Hình 4.4: Kết quả thực thi của phƣơng pháp trên trình bày [5]. ..................... 51

ix


Chƣơng 1. Tổng quan

Chƣơng 1: TỔNG QUAN
1.1

Tổng Quan Về Lĩnh Vực Nghiên Cứu

Trong cuộc sống hàng ngày, con ngƣời luôn không ngừng vận động và phát

triển. Mọi thứ xung quanh chúng ta ngày một hiện đại hơn, phát triển hơn. Do đó việc
có những thiết bị thông minh hiểu đƣợc hành động ngƣời trong video có thể tạo thuận
lợi hơn trong việc tƣơng tác giữa ngƣời và máy, và ngoài ra có thể dựa vào những hành
động mà máy tính hiểu ứng dụng cho các camera giám sát trong các khu vực bất kì.Để
các thiết bị có thể nhận dạng đƣợc hành động của ngƣời gồm 3 phần:
. Phát hiện đối tượng (người): trong thị giác máy tính là công việc tìm kiếm các vật thể
trong ảnh hoặc trong video. Đây là hƣớng nghiên cứu đƣợc quan tâm nhiều hiện nay
với nhiều ứng dụng. Phát hiện ngƣời trong ảnh hoặc video là một nhánh của phát hiện
đối tƣợng. Chúng ta (con ngƣời)có thể nhận biết các đối tƣợng là ngƣời một cách dễ
dàng trong các ảnh hoặc video dù hình dạng trong các trƣờng hợp là rất khác nhau vả cả
với nền ảnh biến đổi đa dạng. Nhƣng đối với hệ thống thị giác máy tính thì công việc
này vẫn còn là thách thc lớn. Nguyên nhân chủ yếu là do diện mạo và tƣ thế của mỗi
ngƣời là hết sức đa dạng, ảnh hƣởng về điều kiện ánh sáng, sự che lấp lẫn nhau của
những ngƣời trong đám đông, chất lƣợng video…
Phát hiện ngƣời là hƣớng nghiên cứu dành đƣợc rất nhiều sự quan tâm vì khả năng
ứng dụng của nó. Manoranjan Paul, [1] đã trình bày tổng quan (review) về hầu hết các
phƣơng pháp phát hiện ngƣời cũng nhƣ các ứng dụng của nó trong thực tế. Ngoài ra,
N.Dalal; B.Triggs[2]đề xuất đặc trƣng HOG và phân loại SVM dùng cửa sổ trƣợt để
phân loại ngƣời và nền (background) trong khung ảnh, là một phƣơng pháp nền tảng và
đƣợc đƣợc biết đến rộng rãi trong lĩnh vực phát hiện ngƣời.Viola-Jone[3] đề xuất mô
hình phân tầng để nhận dạng đối tƣợng.
. Bám mục tiêu (tracking): Sau khi phát hiện đƣợc ngƣời trong ảnh, việc bám mục tiêu
(tracking) để theo dõi các đối tƣợng cũng là yếu tố cần thiết để có thể xác định đƣợc
hành động của ngƣời đó trong nhiều khung ảnh liên tiếp hoặc video. Việc bám mục tiêu
(tracking) giúp liên kết các đối tƣợng mục tiêu trong khung hình video liên tục. Một vài
kĩ thuật bám mục tiêu (tracking) đã đƣợc nghiên cứu nhƣ CAMshift[4], bộ bám mục

1



Chƣơng 1. Tổng quan
tiêu (tracker) KLT[5], dùng superpixel để bám mục tiêu (tracking)[6] kết hợp với KNN
tđể phân loại màu cho kết quả tốt nhƣng chi phí tính toán cao.
Kết quả của việc phát hiện và bám mục tiêu (tracking)liên tiếp trong nhiều khung ảnh là
cơ sở để các thiết bị có thể dựa vào đó nhận dạng hành động của ngƣời. .Nhận dạng
hành động người: cũng là một đề tài thu hút đƣợc nghiên cứu của nhiều tác giả trong và
ngoài nƣớc. Một vài đặc trƣng để phân loại hành động đƣợc đề xuất bởi các tác giả:
Laptev và các đồng nghiệp đã giới thiệu bộ miêu tả mà khi sắp xếpcác đặc trƣng HoG
(Histogram of Oriented Gradients)– HoF (Histogram of Optical Flow) trên miền thời
gian có thể rút trích thông tin về dáng vóc và chuyển động, tác giả còn giới thiệu một
đặc trƣng STIP (Space-Time Interest Points) để miêu tả hành động trong không gian
cục bộ [7].
Nazli Ikizler-Cinbis và Stan Sclaroff[8] đề xuất phƣơng pháp cho nhận diện hành động
ngƣời mà kết hợp nhiều đặc trƣng của các thực thể nhƣ: Đối tƣợng, khung cảnh và con
ngƣời.
Lê Viết Tuấn[9] phân tích tổng hợp về các phƣơng thức nhận diện hành động trong
video bằng cách kết hợp các phƣơng pháp.
Mục đích của đề tài

1.2

Xây dựng chƣơng trình trên nền tảng MATLAB để nhận dạng hành động của
con ngƣời qua các bƣớc phát hiện ngƣời, bám mục tiêu (tracking) và phân loại hành
động từ camera hoặc video.
Nhiệm Vụ Và Giới Hạn Của Đề Tài

1.3
1.3.1


Nhiệm Vụ của đề tài

 Phát hiện ngƣời trong video.
 Bám theo mục tiêu (tracking) đối tƣợng.
 Phân loại một số hành động của đối tƣợng trong khung ảnh.

2


Chƣơng 1. Tổng quan

1.3.2
-

Giới Hạn của đề tài
Độ chinh xác ở mức tƣơng đối do kết quả cuối cùng là sự tổng hợp của nhiều

khâu xử lý nhƣ phát hiện con ngƣời, bám mục tiêu (tracking) theo ngƣời và phân loại
các hành động đã qua huấn luyện.
-

Xử lý trong những khung ảnh vừa có độ phân giải vừa phải để có thể thực thi

đƣợc đáp ứng đủ khung hình video khi mà yêu cầu thông tin tính toán vừa phải.
1.3.3
-

Phƣơng Pháp Nghiên Cứu
Từ ảnh đầu vào, tiến hành phát hiện trong ảnh có đối tƣợng là ngƣời hay không


bằng đặc trƣng ACF kết hợp với thuật toán máy học Adaboost.
-

Nếu xuất hiện ngƣời trong ảnh thì bắt đầu tiến hành bám mục tiêu( tracking) đối

tƣợng ngƣời quan tâm để tiến hành khảo sát hành động.
-

Từ dữ liệu bám mục tiêu (tracking) thu đƣợc trƣớc đó, áp dụng phƣơng pháp

trích đặc trƣng HOG đối với các khung ảnh liên tiếp và tổ hợp nó lại với nhau biểu thị
cho một đặc trƣng về hành động của ngƣời đang trong tình trạng bám mục tiêu
(tracking) đó.Sau đó thông qua vector hỗ trợ máy học (SVM – Support Vector
machine) để phân loại các loại hành động.

1.4

Kế hoạch thực hiện

Tháng 2 đến tháng 4

Tìm hiểu các phƣơng pháp phát hiện ngƣời trong ảnh.

Tháng 4 đến tháng 6

Nghiên cứu các phƣơng pháp bám theo (tracking) đối tƣợng.
Tìm hiểu về các đặc trƣng hành động.

Tháng 6 đến tháng 7


Xây dựng chƣơng trình Matlab.

Tháng 7 đến tháng 9

Lập trình để phát hiện hành động ngƣời qua ba giai đoạn phát
hiện – bám theo (tracking) – phân loại.

Tháng 9 đến tháng 10

Viết luận văn tốt nghiệp. Chuẩn bị báo cáo.

3


Chƣơng 2. Cơ sở lý thuyết

Chƣơng 2: CƠ SỞ LÝ THUYẾT
Với sự gia tăng không ngừng về số lƣợng cũng nhƣ chất lƣợng của các thiết bị ghi hình
kỹ thuật số mà giá cả ngày càng giảm, việc sở hữu một chiếc máy ảnh hay máy quay
không còn xa vời đối với mỗi ngƣời, dẫn đến sự bùng nổ các dữ liệu ảnh, video, do đó
chúng ta cần các ứng dụng thông minh hơn, mạnh mẽ hơn giúp ta tổ chức, quản lý dữ
liệu một cách hiệu quả.
2.1.

Xử lý ảnh số

2.1.1. Các thuật toán xử lý hình thái học
Với sự gia tăng không ngừng về số lƣợng cũng nhƣ chất lƣợng của các thiết bị ghi hình
kỹ thuật số mà giá cả ngày càng giảm, việc sở hữu một chiếc máy ảnh hay máy quay

không còn xa vời đối với mỗi ngƣời, dẫn đến sự bùng nổ các dữ liệu ảnh, video, do đó
chúng ta cần các ứng dụng thông minh hơn, mạnh mẽ hơn giúp ta tổ chức, quản lý dữ
liệu một cách hiệu quả.
Phầnlớncácphéptoánhìnhtháihọcđƣợcđịnhnghĩatừhaiphéptoáncơbảnlà
phéptoáncoảnh(Erosion)vàgiãnảnh(Dilation).Yếutốquantrọngtrongcácphép

toán

này

làlựa chọn mộtphần tửcấu trúc cóhình dáng phùhợp.
2.1.1.1. Phần tửcấu trúc
Đốivớiảnhnhịphân,phầntửcấutrúclàmộtảnhcókíchthƣớcnhỏgồmcóhai
giátrị0và1,cácgiátrịbằng0đƣợcbỏquatrongquátrìnhtínhtoán,gọiH(i,j)là phần tử cấutrúc
của ảnh nhị phânvà đƣợc thểhiện nhƣ sau :
H(i,j)0,1 
















Mộtsốhìnhdángcủaphầntửcấutrúcthƣờngđƣợcsửdụngtrênảnhnhịphân: dạng đƣờng theo
chiều ngangvà dọc,hình vuông, hìnhellip,...

4


Chƣơng 2. Cơ sở lý thuyết

Hình 2.1: Mộtsố hình dáng của phần tử cấu trúc phẳng.
Đốivớiảnhxám,phầntửcấutrúclàkhôngphẳng,tứclàcácphầntửcấutrúcsử
dụngcácgiátrị0và1đểxácđịnhphạmvicủaphầntửcấutrúctrongmặtphẳngxvà
mặtphẳngyvàthêmgiátrịđộcaođểxácđịnhchiềuthứba. Cấutrúcphầntửkhông phẳng gồm có
hai phần :
Phầnthứnhất:Mộtmảnghaichiềugồmcócácgiátrị0và1,trongđógiá
trị bằng 1xác định lân cậncủa phần tử cấu trúc.

Hình 2.2: Mộtmặt nạ xác định lâncận của phần tử cấu trúc không phẳng.
Phầnthứhai:Mộtmảnghaichiềucókíchthƣớcbằngvớikíchthƣớccủamảng hai chiều ởphần
thứ nhất nhƣngchứa cácgiátrị thực của phần tử cấu trúc.

Hình 2.3: Ma trận giá trị thực tương ứng với lân cận trong phần tử cấu trúc không
phẳng.

5


Chƣơng 2. Cơ sở lý thuyết
2.1.1.2. Phép co ảnh – Erosion
XéttậphợpAvàtậphợpB(Phầntửcấutrúc),phépcoảnhnhịphâncủatậphợp


A

bởiphầntử cấu trúc B đƣợc kíhiệu:A B và viếtdƣới dạng công thứcnhƣ sau:
A

B=z|(B) ZA 















PhépcoảnhnhịphâncủatậphợpAbởiphầntửcấutrúcBlàtậphợpcácđiểmz(znằmở
tâmđiểmcủa phần tử cấu trúc B) sao cho Bzlàtập con củaA.

Hình 2.4: Ví dụ về phép toán co ảnh nhị phân vớiphần tử cấutrúc phẳng.
PhéptoáncoảnhcủaảnhxámIvớicấutrúcphầntửkhôngphẳngHtạivịtrí

(x,


y)

củaảnhIđƣợc xácđịnhnhƣsau:
(IH)(x,y)=max(I(x+i,y+j)+H(i,j)|(i,j)DH) 



Hình 2.5. Ví dụ về phép toán co ảnh trên ảnh xám với phần tử cấu trúc không phẳng.
Trong đó, DHlà không gian ảnh củaphần tửcấu trúc khôngphẳngH.

6


Chƣơng 2. Cơ sở lý thuyết
2.1.1.3. Phép giãn ảnh – Dialtion
Gọi A là ảnh gốc, B là một phần tử cấu trúc. Phép giãn nhị phân của ảnh A với
phần tử cấu trúc B đƣợc kí hiệu là AB và chúng ta có thể biểu diễn phép toán giãn
ảnh dƣới dạng phép toán tổ hợp sau:


PhépgiãnảnhnhịphâncủatậpAbởiphầntửcấutrúcBlàtậphợpcủacácđiểmz (zlàtâmcủa phần
tử cấu trúc B trên tập A) sao chophản xạ của Bzgiao với tập A tạiít nhấtmột điểm.

Hình 2.6: Ví dụ về phép giãn nhị phân trên ảnh vớiphần tử cấutrúc phẳng
Phép toángiãn ảnh củaảnh xámI với cấutrúc phần tử không phẳngH tạivị trí (x, y)
củaảnhIđƣợc xácđịnhnhƣsau:
(IH)(x,y)=max(I(x+i,y+j)+H(i,j)|(i,j)DH) 

7






(2.5)


Chƣơng 2. Cơ sở lý thuyết

Hình 2.7:. Phép toán giãn ảnh trên ảnh xám với phần tử cấu trúc không phẳng.
Trong đó, DH là không gian ảnh của phần tử cấu trúc không phẳng H.
2.1.1.4. Phép mở ảnh– Openning
GọiAlàhìnhảnhgốcvàBlàphầntửcấutrúc,()làkýhiệucủaphépmởảnh giữa tậphợp Avà
phần tử cấu trúcB, phépmở ảnh đƣợc xácđịnhbởi côngthức:
AB = (A⊖B)⊕B

(2.6)

2.1.1.5. Phép đóng ảnh
VớitậphợpAlàảnhgốc,Blàphầntửcấutrúc.làkýhiệuphépđóngảnh.
KhiđóphépđóngảnhcủatậphợpAbởiphầntửcấutrúcB,kíhiệulà(AB)xácđịnh bởi:

(AB)=(AB)

B.

(2.7)

Hìnhdƣớiđâylàmộtvídụvề


cácphéptoánxửlýhìnhhọctrênảnh.

Trongđó,ápdụngcácphéptoánxửlýảnhnhịphânvớiphầntửcấutrúccóhìnhdáng
ởhình2.8;vớiảnhxámsửdụngcấutrúcphầntửkhôngphẳngcóhìnhdánglân
trịnhƣ2.9.

8

cận



giá


Chƣơng 2. Cơ sở lý thuyết

Hình 2.8: Phần tử cấu trúc phẳng

Hình 2.9: Hình dáng lân cận và ma trận
giá trị tương ứng của phần tử cấu trúc
không phẳng

Hình 2.10: Kết quả của một số phép biến đổi trên ảnh nhị phân và ảnh xám

9


Chƣơng 2. Cơ sở lý thuyết
2.1.2. Các ứng dụng của các thuật toán xử lý hình thái học

2.1.2.1.Trích lọc biên ảnh –Boundaryextraction
Để trích lọc biên củaảnhnhị phân A,chúng tathực hiệnhai bƣớc sau:
 Đầu tiên, thực hiệnphép ăn mòn/phép co ảnh với phần tử cấu trúc B.
 Sauđó,thựchiệnkhửnềncủaảnhAbằngcáchlấyảnhgốcAtrừchoảnhđã thực hiện ởbƣớc 1.
Nhƣvậy,chúngtacóthểtríchlọcbiêncủaảnhA,kýhiệulàApvớimộtphầntử cấu trúc Bbằng
công thức sau:


Ap= A– (A B)

Yếu tốquantrọngtrongviệctríchlọc biêncủaảnhnhị phânlàđƣa rađƣợc phầntử cấu trúc
khôngphẳnghợp lý.

(a)

(b)

(c)

(d)

Hình 2.1: Trích lọc biên của đối tượng: (a) ảnh gốc, (b) hình dáng của phần tử
cấu trúc, (c) ảnh sau khi thực hiện phép co ảnh với phần tử cấu trúc, (d) ảnh kết quả
theo công thức trích lọc biên

10


Chƣơng 2. Cơ sở lý thuyết


2.1.2.2.Tô đầy vùng – Region fill
Ảnhnhịphânthƣờnglàkếtquảcủacácphépthựchiệnphânngƣỡnghoặcphân
đoạnảnhxámhoặcảnhmàuđầuvào.Nhữngphépbiếnđổinàyrấthiểmkhi―hoàn
donhữngnhân

tố

bênngoàimàtrong

hảo‖

quátrìnhlấymẫuảnhchúngtakhôngkiểm

soátđƣợcnhƣcƣờngđộsánghayđộchóixuấthiệntrongảnhvànócóthểđểlại
những―lỗhổng‖saukhithựchiệnlấyngƣỡnghoặcphânđoạnảnh.Sửdụngcácphép xử lý
hìnhthái họcđể lấp đầy cáclỗ hổng thực sự rấthiệuquả.
ChomộtảnhnhịphânAgồmcó:cácđiểmảnhlàbiêncủađốitƣợngđƣợcgán
nhãnbằng1vàcácđiểmảnhkhôngphảilàbiênđƣợcgánnhãnbằng0.ĐặtBlàcấu
trúcphầntửvà x0làmộtđiểm ảnhbất kìnằm tronglỗhổng đƣợc bao bọcbởi biêncủa
đốitƣợng(điểmxuấtphát).Việclàmđầyđốitƣợngđƣợcthựchiệnbằngcáchlặpđi
lạibiểu thức sau:

x0 = 1;
do 𝑥𝑘=(𝑥𝑘−1⨁ 𝐵)∩𝐴 , với k = 1,2,3,....

(2.9)

until xk = xk-1.
Kết quả vùng đối tƣợng đƣợc lấp đầy cuối cùng chúng ta có đƣợc là
H=A ∪ 𝑥𝑘


(a)

(b)

Hình 2.2: Kết quả của việc thực hiện lấp đầy vùng ảnh:
(a) ảnh nhị phân với các “lỗ hổng”, (b) ảnh sau khi được lấp đầy.

11

lặp


Chƣơng 2. Cơ sở lý thuyết
2.1.2.3. Trích lọc thành phần liên thông - Extracting connected components
Tậphợptấtcảcácđiểmảnhkếtnốitớimộtđiểmảnhnàođógọilàcácthành
phầnkếtnốicủađiểmảnhđó[25].Mộtnhómcácgiátrịđiểmảnhđƣợckếtnốivới
nhauphânbiệtvớicácnhómđiểmảnhkhácthôngquaviệcgánnhãnkhácnhaucho
cácnhóm.Cácnhãnnàylàcácsốnguyên,trongđónềncógiátrịbằng0,cácvùng

ảnh/nhóm

cácđiểmảnh liên thông với nhauđƣợc gán nhãn từ1 trởđi.

Hình 2.3: Hình dáng 4 lân cận(N4)và 8 lân cận(N8)
Thuậttoángánnhãncácthànhphầnliênthôngvớisốlân cậnlà8(N8)thực hiện nhƣ sau:
-

Quét ảnh đầu vào tuần tự theohàng từ trên xuống cho đến khi gặp một điểmp bất kì
(p=1,nếu là ảnhnhịphần) trong ảnh.


-

Kiểmtra cáclân cậnp.
Dựa trên những thôngtin đó,việcđánh nhãnsẽđƣợc thực hiện nhƣ sau:

-

Nếu tất cả4 lân cận của p đềubằng 0, thì gán một nhãn mới chop, ngƣợc lại.

-

Nếu chỉ một lân cận của p cógiá trịbằng1, gán nhãn chop, ngƣợc lại.

-

Nếu cónhiều hơn mộtlân cận của p cógiá trịbằng1, gán một nhãn trong các nhãn cho
pvà ghichú thích tƣơngtự.
Saukhihoàn tấtquá trìnhquét, cáccặp nhãntƣơngứngđã đƣợc sắp xếp vào các nhóm
tƣơng ứng vàmỗi nhómsẽchỉcó một nhãn duy nhấtđƣợc gán.

12



×