Tải bản đầy đủ (.docx) (73 trang)

Hệ thống video thông minh bám đuổi đối tượng và phát hiện té ngã

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1013.32 KB, 73 trang )

LỜI NÓI ĐẦU
Nếu tuổi già là một thách thức của nhân loại thì tai nạn té ngã của người già lại là
một thách thức lớn đối với ngành y tế hiện nay. Tai nạn té ngã ở người già rất nguy hiểm
và thường gây ra các chấn thương nghiêm trọng có thể dẫn đến tử vong nếu không được
phát hiện kịp thời. Ở nước ta, ước tính số người trên 65 tuổi vào năm 2009
khoảng 7% (khoảng 5,81 triệu người) và theo khảo sát của Tổ chức Y tế thế giới thì có
tới 28 – 35% người trên 65 tuổi bị té mỗi năm. Như vậy tại Việt Nam, có khoảng 1,6
đến 2 triệu người cao tuổi bị té ngã ít nhất một lần mỗi năm [1].
Phát hiện các tai nạn té ngã bằng hệ thống phát hiện và cảnh báo té ngã để trợ giúp
người gặp tai nạn là cần thiết để tránh những hậu quả đáng tiếc. Giải pháp đơn giản nhất
là sử dụng thiết bị cảnh báo đặt ở các vị trí thuận tiện trên cơ thể để người ta có thể ấn nút
kích hoạt cảnh báo khi bị ngã. Thực tế thiết bị này không thể hỗ trợ được khi người già
ngã do đau tim hoặc đột quỵ. Lúc này thiết bị phát hiện té ngã tự động sử dụng cảm biến
vận tốc, gia tốc... có ý nghĩa vô cùng thiết thực. Tuy nhiên, nhược điểm
của nó là không thoải mái với người già phải luôn mang chúng trên người. Để giải quyết
những khó khăn nêu trên, một giải pháp mới đã được đề xuất và triển khai trong những
năm gần đây, đó là sử dụng các hệ thống giám sát ứng dụng kỹ thuật phân tích thông
minh tín hiệu video. Khi hệ thống làm việc, mọi hoạt động của đối tượng sẽ được ghi
hình và xử lý.. Việc phân tích nội dung video sẽ được thực hiện hoàn toàn tự động bằng
máy tính và nếu phát hiện có tai nạn té ngã, đầu ra của hệ thống sẽ lập tức đưa ra cảnh
báo với độ chính xác cao.
Với mục đích ý nghĩa đó, nhiều hệ thống video thông minh phát hiện té ngã đã ra đời
và có nhiều những ứng dụng quan trọng giúp ích cho đời sống hiện đại. Trên cơ sở phát
triển những ưu điểm của các hệ thống video đó, đồng thời nhằm cải tiến những khuyết
điểm còn tồn tại, đề tài em nghiên cứu tiếp tục nằm trong mạch ý tưởng của một hệ thống
ưu việt trong lĩnh vực này. Với không gian của hệ thống thường là không gian nhà ở tĩnh
lặng, ít vật thể chuyển động, đối tượng sẽ được phát hiện bởi các phương pháp trừ nền và
bám đuổi phổ biến. Bên cạnh đó, việc phát hiện hành vi té ngã của đối tượng cũng được
tối ưu hơn và đạt hiệu suất khá cao thông qua việc bổ sung thêm các thông số trong



chuyển động cũng như cách khảo sát chuyển động, bước đầu tiền hành nghiên cứu và
ứng dụng các thuật toán cơ bản tin cậy từ các tài liệu quốc tế, em đã xây dựng được một
hệ thống phân tích video khá hoàn chỉnh, đặc biệt tỉ lệ phát hiện đúng hành vi té ngã của
hệ thống khá cao.
Bố cục của đồ án em chia làm các chương sau:
Chương 1: TỔNG QUAN HỆ THỐNG GIÁM SÁT SỬ DỤNG KỸ THUẬT PHÂN
TÍCH THÔNG MINH TÍN HIỆU VIDEO
Trình bày tổng quan hệ thống giám sát thông minh, các loại hình phổ biến của hệ thống
video thông minh, sơ đồ khối của một hệ thống video thông minh cơ bản đồng thời giới
thiệu ứng dụng mà đề tài hướng đến.
Chương 2: TRÍCH ĐỐI TƯỢNG
Trình bày khối trích đối tượng với các kỹ thuật được sử dụng là trừ nền và phương pháp
hình thái toán học.
Chương 3: BÁM ĐUỔI, TRÍCH THUỘC TÍNH VÀ PHÂN TÍCH
Bám đuổi đối tượng và trích các thuộc tính liên quan đến các đặc điểm té ngã của đối
tượng, sau đó phân tích các khả năng kết hợp thuộc tính để kết luận té ngã.
Chương 4: CHƯƠNG TRÌNH VÀ KẾT QUẢ
Phân tích lưu đồ giải thuật và viết chương trình cho hệ thống, kết quả mô phỏng và nhận
xét, hiệu suất tổng quát về toàn bộ quá trình trong các trường hợp khi chưa được cải tiến
và khi đã được cải tiến.
Phương pháp nghiên cứu xuyên suốt đồ án tốt nghiệp này là tìm hiểu và rút ra các thuật
toán cơ bản từ các tài liệu báo chí đáng tin cậy, ở Việt Nam cũng như trên thế giới. Sau
khi đã có được những kết quả ban đầu, tiếp tục đi sâu phân tích các ưu, khuyết điểm của
hệ thống và tìm cách khắc phục: ở đây là việc đẩy nhanh tốc độ xử lý của hệ thống cũng
như nâng cao hiệu suất của cả hệ thống.

LỜI CẢM ƠN


Em xin chân thành cảm ơn TS. Trần Thị Hương, giảng viên khoa Điện tử Viễn thông, đã

tận tình hướng dẫn và giúp đỡ em trong thời gian thực hiện đề tài trên, không chỉ trong
việc hoàn thành đồ án tốt nghiệp mà còn trong công việc viết các bài báo khoa học cho
Đại học Đà Nẵng và cho các hội nghị khoa học quốc tế.
Em cũng xin chân thành cảm ơn các thầy cô giảng viên khoa Điện tử viễn thông đã
truyền đạt những kiến thức hữu ích cho chúng em suốt những năm vừa qua, làm cơ sở để
chúng em có thể hoàn thành đồ án này.
Mặc dù đã cố gắng nhưng không thể tránh khỏi những sai sót trong đồ án này. Em luôn
mong nhận được sự thông cảm và góp ý tận tình từ các thầy cô.
Sinh viên

Mai Bảo Lê Hoàng


MỤC LỤC
LỜI CAM ĐOAN………………………………………………………………………….
MỤC LỤC………………………………………………………………………………….
DANH MỤC CÁC TỪ VIẾT TẮT……………………………………………………….
DANH MỤC HÌNH VẼ…………………………………………………………………...
DANH MỤC BẢNG BIỂU………………………………………………………………..
LỜI NÓI ĐẦU……………………………………………………………………………..
LỜI CẢM ƠN……………………………………………………………………………...

Chương 1: TỔNG QUAN VỀ HỆ THỐNG GIÁM SÁT SỬ DỤNG KỸ
THUẬT PHÂN TÍCH VIDEO THÔNG MINH.
1.1.
1.2.
1.2.1.
1.2.2.
1.2.3.
1.3.

1.3.1.
1.3.2.
1.4.
1.4.1.
1.4.2.
1.4.3.
1.4.4.
1.5.
1.6.

Giới thiệu chương…………………………………………………………..1
Phân loại các hệ thống té ngã……………………………………………….1
Hệ thống phát hiện té ngã dựa vào âm thanh.
Hệ thống phát hiện té ngã dựa vào thiết bị cảm biến.
Hệ thống phát hiện té ngã dựa vào video.
Tổng quan hệ thống giám sát sử dụng video………………………………...3
Hệ thống giám sát video.
Hệ thống giám sát thông minh video.
Sơ đồ khối tống quát của hệ thống video thông minh……………………….6
Khối trích đối tượng.
Khối bám đuổi đối tượng.
Khối trích thuộc tính.
Khối nhận dạng.
Một số ứng dụng của hệ thống video thông minh…………………………11
Kết luận chương……………………………………………………………13
Chương 2: TRÍCH ĐỐI TƯỢNG.

2.1.

Giới thiệu chương…………………………………………………………14


2.2.

Tổng quan về trích đối tượng……………………………………………..14

2.3.

Tổng quan về phương pháp trừ nền……………………………………….16

2.4.

Kết quả thực nghiệm của phương pháp trừ nền……………………………17

2.5.

Lọc đối tượng bằng phương pháp hình thái toán học……………………...19


2.5.1.

Giới thiệu phương pháp hình thái toán học.

2.5.2

Thực hiện MM trong xử lý ảnh.

2.6.

Kết luận chương………………………………………………………….20


Chương 3: BÁM ĐUỔI ĐỐI TƯỢNG, TRÍCH THUỘC TÍNH VÀ PHÂN
TÍCH.
3.1. Giới thiệu chương…………………………………………………………….22
3.2. Bám đuổi đối tượng…………………………………………………………..22
3.3. Giới thiệu các thuộc tính sẽ dùng để phát hiện té ngã………………………..23
3.4. Tọa độ trọng tâm đối tượng………………………………………………......24
3.5. Định dạng Elip bao quanh đối tượng…………………………………………24
3.5.1. Góc đứng của đối tượng.
3.5.2. Xác định trọng tâm đối tượng.
3.5.3. Xác định độ lớn hai bán trục.
3.5.4. Định vị Elip.
3.6. Phân tích các thuộc tính dùng để phát hiện té ngã……………………………26
3.6.1. Góc tức thời của đối tượng.
3.6.2. Tốc độ chuyển động của đối tượng.
3.6.3. Tốc độ thay đối góc đứng của đối tượng.
3.6.4. Độ lệch tâm tức thời của Elip.
3.6.5. Tốc độ thay đổi trọng tâm đối tượng theo phương thẳng đứng.
3.7. Phân tích khả năng kết hợp của các thuộc tính……………………………….28
3.8. Kết luận chương……………………………………………………………...29
Chương 4: CHƯƠNG TRÌNH VÀ KẾT QUẢ.
4.1. Giới thiệu chương…………………………………………………………….31
4.2. Cấu trúc chương trình……………………………………………………… ..31
4.2.1. Cấu trúc chương trình.
4.2.2- 4.2.7. Lưu đồ thuật toán.


4.3. Kết quả và nhận xét…………………………………………………………..47
4.4. Kết luận chung và hướng phát triển đề tài……………………………………48
PHỤ LỤC: Một số đoạn code chính của chương trình mô phỏng.
Tài liệu tham khảo.



DANH MỤC HÌNH VẼ
Hình 1.1 – Các vị trí đặt cảm biến trên cơ thể người...................................................... 2
Hình 1.2 – Sơ đồ khối hệ thống ..................................................................................... 6
Hình 1.3 – Các phương pháp bám đuổi đối tượng........................................................ ..9
Hình 1.4 – Quá trình xử lý của hệ thống giám sát thông minh video ........................... 10
Hình 2.1 – Ví dụ mô tả các bước thực hiện của khối trích đối tượng........................... 15
Hình 2.2 – Thực hiện thuật toán Frame Differencing trên video VN-SIN-VE_02.avi. 18
Hình 2.3 – Thực hiện thuật toán Frame Differencing trên video Leavy.avi................. 18
Hình 2.4 – Các phần tử cấu trúc cơ bản ........................................................................ 19
Hình 2.5 – Ví dụ hai phép toán Morphology cơ bản .....................................................20
Hình 2.6 – Ví dụ phép Opening với phần tử cấu trúc là hình vuông có 20 điểm ảnh .. 21
Hình 2.7 – Ví dụ phép Closing với phần tử cấu trúc là hình vuông có 20 điểm ảnh…..21
Hình 3.1 – Miền xác định của góc θ ............................................................................. 25
Hình 3.2 – Đối tượng với hình elip bao quanh. ............................................................ 26
Hình 3.3 – MHI của chuyển động bước đi.................................................................... 27
Hình 4.1 – Lưu đồ thuật toán chương trình chính......................................................... 33
Hình 4.2 – Lưu đồ thuật toán phương thức học nền ..................................................... 34
Hình 4.3 – Lưu đồ thuật toán phương thức trích đối tượng.......................................... 35
Hình 4.4 – Lưu đồ thuật toán phương thức phân tích chuyển động ............................. 36
Hình 4.5 – Lưu đồ thuật toán phương thức vẽ elip ....................................................... 37
Hình 4.6 – Lưu đồ thuật toán phương thức phân tích tổng hợp.................................... 38
Hình 4.7 – FallAngleThreshold và góc thỏa mãn của θ trong điều kiện 2 ................... 39
Hình 4.8 – Lưu đồ thuật toán xác định trọng tâm đối tượng ........................................ 40
Hình 4.9 – Các cửa sổ hiển thị khi chạy chương trình................................................ ..47


DANH MỤC BẢNG BIỂU
Bảng 2.1- Kết quả thực nghiệm khi sử dụng thuật toán Frame Differencing……………18

Bảng 4.1- Kết quả nhận dạng té ngã ở TH1……………………………………………...46
Bảng 4.2- Kết quả nhận dạng té ngã ở TH2……………………………………………...47


DANH MỤC CÁC TỪ VIẾT TẮT
MHI

Motion History Image

MM

Mathematical Morphology

NF

Negative False

PF

Positive False

TH1

Trường hợp 1

TH2

Trường hợp 2

R


Right

SE

Structuring Element


Chương 1:
TỔNG QUAN VỀ HỆ THỐNG GIÁM SÁT SỬ DỤNG
KỸ THUẬT PHÂN TÍCH THÔNG MINH TÍN HIỆU VIDEO
1.1

Giới thiệu chương

Ngày nay, mọi người đều nhận thấy rằng việc phát hiện kịp thời tai nạn té ngã của
người già là một bước rất quan trọng để tránh các chấn thương nặng. Một hệ thống phát hiện té ngã tự
động sẽ giải quyết được vấn đề trên bằng cách giảm thiểu tối đa khoảng thời gian từ lúc xảy ra tai nạn
đến khi có yêu cầu trợ giúp.
1.2

Phân loại các hệ thống phát hiện té ngã
Hiện nay, các hệ thống phát hiện té ngã [2] được phát triển dựa trên ba loại kỹ thuật phổ biến sau:

-

Phát hiện té ngã dựa vào âm thanh (Acoustic Based Fall Detection).

-


Phát hiện té ngã dựa vào các thiết bị cảm biến được mang trên người (Wearable Sensor Based
Fall Detection).

-

Phát hiện té ngã dựa vào video (Video Based Fall Detection).

1.2.1 Hệ thống phát hiện té ngã dựa vào âm thanh
Hệ thống phát hiện té ngã dựa vào âm thanh bao gồm một mảng các microphone và thiết bị phát
hiện chuyển động. Thành phần quan trọng của hệ thống là một phần

mềm phân loại được sự kiện là tai nạn té ngã hay chỉ là các hoạt động sinh hoạt thường
ngày dựa trên tín hiệu âm thanh phát ra từ nó.
Tuy nhiên, để thực hiện được điều này là không đơn giản: đầu tiên chúng ta có thể thấy được té
ngã là một hành động bất thường và có kho ảng hơn mười trường hợp té ngã khác nhau. Hơn thế nữa,
té ngã lại xảy ra trong môi trường sinh hoạt thực rất dễ bị nhầm lẫn với những tiếng ồn xung quanh như
rơi đồ vật, di chuyển ghế, đóng cửa và bước đi… Vì thế, khả năng cảnh báo chính xác của hệ thống này
là không cao.

1.2.2 Hệ thống phát hiên té ngã dựa vào thiết bị cảm biến
Loại hệ thống này hoạt động dựa vào các thiết bị cảm biến nhỏ được gắn trên quần áo, thắt lưng…
(hình 1.1) để theo dõi các thông số chuyển động của cơ thể con người trong thời gian thực và xác định
được thời điểm xảy ra té ngã dựa trên việc phân tích các thông số này.


Hình 1.1 – Các vị trí đặt cảm biến trên cơ thể người
Hiện nay, các hệ thống phát hiện té ngã dựa vào cảm biến hoạt động bằng cách tổ hợp các tín hiệu
gia tốc (acceleration), dao động (vibration) và nghiêng (tilt) đồng thời thiết lập giá trị ngưỡng cho các tín
hiệu tương ứng. Sau đó đưa ra quyết định bằng việc so sánh các tín hiệu thu được với ngưỡng của
chúng.

Tuy nhiên thuật toán trong kỹ thuật này vẫn tồn tại nhiều vấn đề trong việc xác định các thuộc tính
té ngã.Ví dụ như Hwang và các đồng nghiệp sử dụng góc nghiêng để kích hoạt chương trình phát hiện té
ngã. Khi góc nghiêng của cơ thể người trên 70°, chương trình sẽ bắt đầu xử lý các tín hiệu còn lại như tín
hiệu gia tốc để xác định đối tượng có bị ngã hay không? Nhưng nếu người ngã trượt khi bước xuống bậc
thang, hiển nhiên người đó sẽ ngồi trên các bậc thang và lúc đó phần trên cơ thể sẽ hợp với phương
ngang một góc nghiêng nhỏ,và do đó chương trình phát hiện sẽ không được kích hoạt, tai nạn sẽ không
được phát hiện.
1.2.3 Hệ thống phát hiện té ngã dựa vào video
Trong hệ thống phát hiện té ngã dựa vào video, mọi hoạt động con người trong video được ghi
hình lại, sau đó được phân tích dùng kỹ thuật xử lý ảnh và kỹ thuật thị giác máy tính để phát hiện té ngã
và phát tín hiệu báo động. Hệ thống cũng có thể cung cấp chính xác nguyên nhân khiến đối tượng bị té
ngã.
Hiện nay, nhiểu tổ chức cũng như cá nhân đã và đang phát triển các phương pháp phát hiện té ngã
dựa vào video. Hầu hết các hệ thống phát hiện té ngã dựa vào tầm nhìn máy tính này đều dùng thông tin
chuyển động hoặc phương pháp trừ nền để tách đối tượng. Sau đó hệ thống sẽ sử dụng các mô hình
nhận dạng như mẫu phù h ợp (TemplateMatching) hay không gian trạng thái (Space State Approach) để
từ các thuộc tính có thể xác định hành vi của đối tượng, trong trường hợp này là tai nạn té ngã . Phần
tiếp theo của chương này sẽ trình bày tổng quan về hệ thống giám sát thông minh video.


1.3

Tổng quan hệ thống giám sát thông minh video.

1.3.1 Hệ thống giám sát video
Giám sát video là một kỹ thuật của ngành công nghiệp an ninh, được ứng dụng trong kiểm soát
truy cập, phát hiện và kiểm soát hỏa hoạn, các kỹ thuật quản lý các tòa
nhà, các hệ thống để đảm bảo an toàn cá nhân và phát hiện xâm nhập.
Một hệ thống giám sát video thông thường bao gồm các điểm giám sát từ xa ở những nơi công
cộng hay khu vực giới hạn. Tại các điểm giám sát này, các camera được sử dụng để quay lại mọi cảnh

xảy ra tại hiện trường. Sau đó những hình ảnh này được truyền đến các thiết bị điều khiển và tại đây
chúng được ghi lại hoặc được xử lý để xuất ra màn hình, tùy vào mục đích của người quản lý.
Chức năng chính của các hệ thống này là chụp lại hình ảnh di chuyển của các đối tượng nhằm
mục đích theo dõi sự đến và đi của người đó, qua đó giúp ngăn chặn trộm cắp, hành hung và gian lận,
cũng như quản lý sự cố và các hoạt động á m ô ng.
1.3.2 Hệ thống giám sát thông minh video
Phân tích video, hay giám sát thông minh video, là một kỹ thuật có thể tự động xác định hành vi
hoặc thái độ của một đối tượng cụ thể thông qua việc sử dụng phần mềm để phân tích nội dung các
đoạn video ghi hình đối tượng đó. Nó có thể chuyển các đoạn video thành các luồng dữ liệu, các luồng
dữ liệu này sau đó có thể được truyền tải hoặc lưu trữ tùy thuộc vào hoạt động của hệ thống giám sát.
Với kỹ thuật này, hệ thống có thể tự động thiết lập các hoạt động của camera để có được những
dữ liệu cụ thể hơn về bối cảnh hoặc đơn giản chỉ để gửi một cảnh báo cho nhân viên giám sát để đưa ra
quyết định những can thiệp cần thiết. Cụ thể hơn, ở đây hệ thống giám sát thông minh video sử dụng các
thuật toán để phát hiện sự di chuyển các đối tượng trong chuỗi hình ảnh và lọc các chuyển động không
liên quan. Chúng tạo ra một cơ sở dữ liệu các thuộc tính của tất cả đối tượng được phát hiện và các đặc
trưng chuyển động của chúng. Các quyết định được đưa ra hoặc các sự kiện quan tâm được tìm kiếm
một cách tự động dựa trên một số quy tắc định trước. Chẳng hạn như nếu có một người bước qua một
ranh giới, hệ thống sẽ gửi ngay một cảnh báo).


Sự cần thiết của việc sử dụng hệ thống giám sát thông minh video
Ngày nay, các hệ thống giám sát video thường trang bị một số lượng lớn các

camera. Đối với những cơ sở hạ tầng lớn, chẳng hạn như một hệ thống giao thông công cộng, hơn một
nghìn camera theo dõi có thể được sử dụng. Những hệ thống với mạng lưới camera như vậy thông
thường mỗi ngày ghi hình lại một lượng lớn video cho mục đích truyền tải, xem và lưu trữ. Điều đó dẫn
đến vấn đề khó khăn cho người giám sát màn hình trong việc phân tích tất các đoạn video được thu hình
để phát hiện các hành vi đáng ngờ hoặc các sự kiện đặc biệt.



H thống phân tích video có nhiều lợi thế như:
-

Hoạt động 24/7.

-

Có thể kích hoạt các bộ phận báo động được điều khiển bởi nhân viên an ninh
hoặc nó có thể tự động yêu cầu camera thay đổi vị trí hoặc phóng to cho việc
giám sát sự kiện chính xác hơn, qua đó giúp can thiệp ngay lập tức thay vì chỉ có
thể can thiệp sau khi sự kiện xảy ra.
- Giúp làm gi m băng thông và không gian lưu trữ cần thiết bằng cách chỉ truyền hoặc ghi các dữ
liệu liên quan đến sự kiện.

-

Giúp giảm số lượng nhân viên an ninh trong việc giám sát liên tục.

Cho phép tìm kiếm nhanh chóng các sự kiện liên quan trong các đoạn phim video

-

được lưu trữ.
-

Thành công trong việc xác định đối tượng trong khung hình và theo dõi các hoạt
động của đối tượng đó.




Những thách thức đối với hệ thống
Hệ thống luôn luôn tồn tại những khó khăn cần khắc phục, dưới đây là những

thách thức chính:
-

Tỉ lệ cảnh báo sai: Hệ thống yêu cầu có độ chính xác cao và không được tạo ra các nhầm lẫn dẫn
đến cảnh báo sai một cách thường xuyên. Đây là một trong những thách thức lớn vì việc phân
biệt giữa một hành động bình thường và hành động đáng nghi ngờ là một bài toán khó đối với
máy móc. Chẳng hạn như việc phân biệt giữa một người chạy rất nhanh vì đang vội và một
người chạy rất nhanh vì vừa mới thực hiện một vụ cướp giật.

-

Điều kiện môi trường hoạt động: Hệ thống phải có khả năng làm việc b ình thường trong điều
kiện môi trường bất lợi như mưa hay sự thay đổi đột ngột về cường độ
ánh sáng.

-

Công nghệ: Các phần mềm của hệ thống phải dễ dàng trong thiết lập, duy trì và nâng cấp khi có
tính năng mới được thêm vào hay cải thiện các tính năng cũ.
Giao diện người sử dụng: Hệ thống đòi hỏi có giao diện thân thiện, dễ sử dụng.

-

Giá thành sản phẩm: Trong thị trường cạnh tranh ngày nay, yêu cầu về chất lượng hệ thống
cũng phải đi đôi với giá thành mới đáp ứng được nhu cầu của người sử dụng. Vì vậy, hệ thống
không những đòi h ỏi có chất lượng tốt mà phải có giá thành hợp lý, cạnh tranh. Đây cũng là một
trong những thử thách lớn đối với các nhà sản xuất cũng như các nhà thiết kế kỹ thuật cho hệ



thống.
Sơ đồ khối tổng quát hệ thống giám sát thông minh video

1.4

Hệ thống có th ể phân chia thành các kh ối chức năng cụ thể như hình 1.3.

Các khung

Trích đối

Bám

Trích thuộc

hình video

tượng

đuổi

tính

Nhận dạng

Ý nghĩa

Hình 1.2 – Sơ đồ khối hệ thống

Đầu tiên tín hiệu video gồm chuỗi các khung ảnh (frame) đã qua tiền xử lý được
đưa vào khối trích đối tượng để trích đối tượng cần quan sát ra khỏi hình nền. Sau đó, chuỗi khung hình
này được đưa đến hệ thống bám đuổi đối tượng và trích thuộc tính cần khảo sát của đối tượng. Cuối
cùng các thu ộc tính đã được trích ra này được đưa vào mô hình nhận dạng để xác định ý nghĩa, hành vi
của đối tượng và đưa ra kết quả
cuối cùng của hệ thống.
Xét chức năng cụ thể của mỗi khối trong hình 1.3 như sau:
1.4.1 Khối trích đối tượng (Video Object Segmentation)
Công việc trước tiên nhất của hầu hết hệ thống giám sát thông minh video là phát hiện ra đối
tượng chuyển động cần theo dõi, giám sát. Khối trích đối tượng có nhiệm vụ phát hiện, phân biệt giữa
đối tượng chuyển động như con người, động vật hay phương tiện giao thông với phần còn lại của
khung hình (hay còn gọi là hình nền).
Việc phát hiện ra đối tượng chuyển động có ý nghĩa quan trọng vì nó nhằm chỉ ra đối tượng cần tập
trung xử lý cho các công đoạn tiếp theo của hệ thống. Hiện nay, hầu hết các phương pháp trích đối
tượng sử dụng các thông tin mang y ếu tố không gian hay thời gian trong chuỗi khung hình liên tiếp.
Dưới đây sẽ trình bày một số phương pháp trích đối tượng phổ biến: Trừ hình nền (background
subtraction), bám đuổi vùng
(tracking regions), …
-

Phương pháp trừ hình nền: Đây là một phương pháp được sử dụng nhiều trong việc trích đối
tượng, đặc biệt là trong các điều kiện mà hình nền gần như tĩnh. Phương pháp này dò tìm đối
tượng chuyển động bằng cách tìm ra sự sai khác giữa khung hình hiện tại và khung hình nền đã
được ước lượng. Phương pháp trừ hình nền khá đơn giản nhưng lại dễ sai lệch nếu có sự thay


đổi nhiều về độ sáng hay có chen lẫn những đối tượng chuyển động khác trong hình nền. Vì vậy
đối với phương pháp này đòi hỏi cần có thuật toán ước lượng hình nền tối ưu nhất và thường
được sử dụng cho các hệ thống giám sát bên trong nhà với ánh sáng ổn định và hình nền ít thêm
các thành phần chuyển động khác. Trong phương pháp trừ hình nền, vấn đề quan trọng nhất là

phải ước lượng hình nền. Kỹ thuật ước lượng hình nền cũng được nghiên cứu theo nhiều hướng
phát triển nên các thuật toán khác nhau.
Ngoài các phương pháp trên, hiện nay trên thế giới đã và đang phát triển nhiều phương pháp mới
và có chất lượng tốt. Độ chính xác của khâu trích đối tượng có ảnh hưởng rất lớn đến hiệu quả hoạt
động của toàn bộ hệ thống giám sát video . Tuy nhiên, do sự biến động liên tục của môi trường tự nhiên
cũng như sự thay đổi đột ngột của cường độ ánh sáng và cảnh quan thiên nhiên, sự lặp đi lặp lại về vị trí
của đối tượng chuyển động dễ dàng gây ra nhầm lẫn, làm giảm độ tin cậy của quá trình trích đối tượng.
Tùy vào ứng dụng cụ thể mà có thể lựa chọn phương pháp trích đối tượng tối ưu nhất. Trong chương 2
của đồ án này, phương pháp trừ hình nền sẽ được phân tích cụ thể hơn ứng dụng tốt với điều kiện
không gian t nh trong nhà.
1.4.2 Khối bám đuổi đối tượng (Tracking System)
Sau khi trích đối tượng ra khỏi hình nền, hệ thống sẽ bám đuổi theo đối tượng hay thiết lập sự
liên kết của đối tượng qua các khung hình liên tiếp trong chuỗi hình ảnh. Khối bám đuổi đối tượng sẽ
cung cấp dữ liệu cho khối trích thuộc tính và khối nhận dạng hành động tiếp theo sau nó.
Các phương pháp bám đuổi đối tượng trong video có thể phân loại dựa trên ứng dụng của nó
hoặc phương pháp xử lý. Có thể chia thành 3 loại cơ bản: bám đuổi theo điểm, bám đuổi theo khung
sườn và bám đuổi theo bóng.
-

Bám đuổi theo điểm (point tracking): Đối tượng được biểu diễn bởi các điểm khi nó được phát hiện
trong mỗi khung hình. Sự tương quan giữa đối tượng và điểm biểu diễn dựa trên cơ sở vị trí trước đó
của đối tượng và hướng chuyển động của nó. Phương pháp này thích hợp cho việc bám đuổi các đối
tượng có kích thước nhỏ, có thể biểu diễn bằng một điểm. Đối với các đối tượng có kích thước lớn th ì sẽ
được biểu diễn bằng nhiều điểm.
-

Bám đuổi theo khung sườn (kernel tracking): ở đây có thể hiểu là khung sườn đại diện cho đối
tượng, chẳng hạn như hình elip bao quanh đối tượng. Đối tượng được bám đuổi xác định chuyển
động của hình bao qua các khung hình. Có nhiều thuật toán bám đuổi theo khung sườn tùy thu ộc
vào loại hình bao sử dụng, số lượng đối tượng bám đuổi và phương pháp ước lượng chuyển động

của đối tượng


(hình 1.4a)
-

Bám đuổi theo bóng (silhouette tracking): Phương pháp này thích hợp với những đối tượng linh
động phức tạp như bàn tay, đầu và vai – những đối tượng khó chọn được dạng hình học thích
hợp để miêu tả và đại diện cho nó. Trong phương pháp này, đầu tiên là xây dựng mô hình cho
đối tượng và bám đuổi mô hình đó qua các khung hình. Mô hình của đối tượng thường được sử
dụng là biểu đồ màu, đường rìa hay đường viền của đối tượng (hình 1.4b).
Chương 3 của đồ án sẽ phân tích cụ thể một phương pháp bám đuổi đối tượng.

(a)

(b)
Hình 1.3 – Các phương pháp bám đuổi đối tượng
(a) Bám đuổi cái cốc sử dụng phương pháp bám đuổi theo khung sườn
(b) Bám đuổi người đàn ông đang đi với phương pháp bám đuổi theo bóng
1.4.3 Khối trích thuộc tính (Feature Extraction)
Quá trình trích thuộc tính của đối tượng là xác định các phần của đối tượng như chiều không gian
2D hoặc 3D, phát hiện rìa của đối tượng, độ nét, độ sáng, cử động từng phần của đối tượng…
Nếu như khối bám đuổi đối tượng thực hiện việc chuẩn bị dữ liệu về h ình dáng của đối tượng thì
khối trích thuộc tính của đối tượng sẽ trích ra các thông tin đặc biệt như rìa đối tượng (ở mức độ thấp)
hay đầu, tay của đối tượng (ở mức độ cao). Nếu khối bám đuổi chuẩn bị dữ liệu cho việc nhận dạng th ì
khối trích thuộc tính sẽ chuẩn bị dữ liệu về cử động thích hợp của đối tượng [7]. Việc trích ra thuộc tính


về rìa, đầu, tay, khuôn d ạng 2D, 3D còn có tác dụng ngược lại giúp cho việc bám đuổi đối tượng được
thực hiện chính xác hơn.

Nói chung, khối bám đuổi đối tượng và trích thuộc tính có liên hệ chặt chẽ với nhau và khó phân
biệt ranh giới rõ ràng. Vì vậy, 2 khối bám đuổi đối tượng và trích thuộc tính đôi lúc được gộp chung lại
thành một khối gọi là bám đuổi đối tượng (Object Tracking System), trong đó bao gồm cả việc xác định
hình dáng, vị trí của đối tượng và trích các thuộc tính của đối tượng.

(a)

(b)

(c)

(d)

Hình 1.4 – Quá trình xử lý của hệ thống giám sát thông minh video
(a) Khung hình đầu vào; (b) Tách đối tượng;
(c) Loại bỏ bóng của đối tượng; (d) Bám đuổi
1.4.4 Khối nhận dạng (Recognition)
Nhận dạng hành động đối tượng là khâu phức tạp nhất của hệ thống giám sát
thông minh video. Tiếp theo sau quá trình bám đuổi và trích ra thuộc tính của đối
tượng, vấn đề đặt ra là hệ thống phải hiểu được ý nghĩa của các hành động của đối
tượng thông qua các thuộc tính. Trong tất cả các mô hình, những thuộc tính chuyển động được trích ra
của đối tượng sẽ tương ứng với những thuộc tính mẫu của một hành vi có sẵn nào đó. Như vậy, vấn đề
là ta phải định nghĩa hoặc huấn luyện trước cho máy mô hình thuộc tính của những hành vi cần nhận
dạng. Các mô hình nhận dạng hiện nay
được chia làm nhóm: mô hình mẫu phù hợp (template matching) và mô hình không gian trạng thái
(space state approach).
Trong mô hình template matching, mỗi hành vi khác nhau của đối tượng được trích thuộc tính,
tập hợp các thuộc tính ứng với mỗi mẫu hành vi này sẽ được lưu lại trong bộ nhớ gọi là không gian
thuộc tính. Khi hệ thống hoạt động, mỗi hành động bất kì của đối tượng được trích thuộc tính, gọi là
vectơ thuộc tính, vectơ thuộc tính này sẽ



được so sánh với tất cả các mẫu chứa trong không gian thuộc tính để tìm ra mẫu có giá trị sai lệch nhỏ
nhất so với giá trị của vectơ vừa được trích. Lúc đó hành vi tương ứng với mẫu thuộc tính trên cũng
chính là hành vi của đối tượng cần xác định. Ưu điểm của mô hình này là tính đơn giản, ở đây hệ thống
không cần bộ nhớ lớn, và quá trình tính toán chỉ là các phép so sánh đơn giản. Nhưng khuyết điểm của
mô hình này là nó yêu cầu đối tượng được trích ở những khối trước phải có độ chính xác cao, lúc đó thì
vectơ thuộc tính được trích mới chính xác. Nếu nhiễu xuất hiện, khả năng nhận dạng sai hành vi của đối
tượng là khá cao.
Vì vậy trong các trường hợp yêu cầu nhận dạng với độ chính xác cao, nhóm mô hình thứ hai sẽ
được sử dụng, đó là mô hình space state approach. Đây là một loại mô hình thống kê. Trong mô hình
này, các ho ạt động của đối tượng sẽ được mô hình hóa thành một chuỗi các trạng thái theo thời gian
với các tham số không biết trước và nhiệm vụ là xác định các tham số ẩn từ các tham số quan sát được.
Các tham số của mô hình
1.5

c rút ra có th

c s d ng k ti p.

Một số ứng dụng trong thực tế của hệ thống
Hệ thống giám sát sử dụng kỹ thuật phân tích thông minh tín hiệu video đã được đưa vào ứng

dụng thực tế trong nhiều thập niên và những năm gần đây, cùng với sự phát triển mạnh mẽ của công
nghệ máy tính thì hệ thống ngày càng được sử dụng rộng rãi hơn. Hệ thống giám sát thông minh video
có ứng dụng trong nhiều lĩnh vực như bảo vệ an ninh cho tòa nhà, giám sát giao thông trong thành phố
và trên các tuyến đường cao tốc, phát hiện các mục tiêu trong quân sự… đồng thời hệ thống còn hỗ trợ
tích cực trong việc chăm sóc sức khỏe con người.
1.5.1


Kiểm soát an ninh ở các khu vực đặc biệt

Ở các khu vực an ninh giới hạn như các căn cứ quân sự và trụ sở cấp cao của chính quyền nhà nước chỉ có
những người có quyền hạn và nhiệm vụ mới được cho phép vào ra. Để kiểm soát an ninh ở những nơi
này, người ta xây dựng trước cơ sở dữ liệu các đặc điểm về sinh trắc học của những người được cấp
phép truy nhập. Khi một
người chuẩn bị đi vào bên trong, hệ thống sẽ tự động ghi lại hình ảnh và trích ra các đặc điểm của người
đó như chiều cao, biểu hiện khuôn mặt hay dáng đi rồi so sánh với cơ sở dữ liệu sẵn có để từ đó đưa ra
quyết định cho phép vào bên trong hay không. H ệ thống có thể sẽ đưa kết quả đến hệ thống cửa mở tự
động hay hệ thống cảnh báo có người lạ xâm nhập…
1.5.2 Phân tích s ố lượng người/xe trong đám đông
Sử dụng các thuật toán về phát hiện người, hệ thống giám sát thông minh video có th ể tự động
đếm số lượng người ở các khu vực công cộng như các cửa hiệu và các


địa điểm du lịch để từ đó đưa ra các thông tin về tắc nghẽn…
1.5.3 Chẩn đoán sức khỏe
Trong lĩnh vực chăm sóc sức khỏe, hệ thống giám sát thông minh video ngày càng trở nên phổ
biến, ở một số nơi thì hệ thống này đã trở thành công cụ giúp đỡ trị liệu và chẩn đoán sơ bộ cho bệnh
nhân một cách hiệu quả và chính xác. Với các máy chụp X-quang, máy quét phân giải cao, hệ thống giám
sát thông minh video còn có thể tự động phân tích và phát hiện những dị vật hay khối u trong cơ thể
bệnh nhân. Một ứng dụng khác cũng rất phổ biến đó là việc phân tích tự động dáng đi cho những người
bị chấn thương hoặc đang trong thời kỳ vật lý trị liệu, sau đó hệ thống phân tích biểu hiện tình trạng
bệnh nhân và gửi kết quả đến nhân viên y tế để xem xét mức độ hồi phục của bệnh nhận để đưa ra
phương án điều trị tiếp theo hợp lý.
1.5.4 Giám sát nhà ở và chăm sóc sức khỏe từ xa
Trong cuộc sống hiện đại ngày nay, việc chăm sóc sức khỏe cho người bệnh lâu năm và người già
ở nhà một mình lúc người thân đi vắng hay ở xa là một vấn đề được nhiều người quan tâm. Hệ thống
giám sát thông minh video cũng được ứng dụng trong lĩnh vực này. Hệ thống sẽ phân tích, xử lý tín hiệu
video thời gian thực từ các camera đặt trong phòng của người bệnh (người già) để nhận dạng các hành vi

té, ngã hay các biểu hiện bệnh tật để từ đó gửi các cảnh báo kịp thời đến y tá, bác sĩ gần nhất hay người
thân đang làm việc ở nơi khác.
Ngoài ra, hệ thống giám sát thông minh video còn được ứng dụng trong giám sát nhà ở khi chủ
nhà đi vắng để phòng chống kẻ trộm đột nhập. Tương tự như chăm sóc sức khỏe từ xa, hệ thống sẽ gửi
các cảnh báo qua mạng khi cần thiết.
1.6 Kết luận chương
Như vậy, thông qua việc tìm hiểu phần ứng dụng có thể thấy được lợi ích to lớn và hết sức cần thiết
của hệ thống giám sát thông minh video trong thực tế, đặc biệt là ứng dụng mà đề tài muốn hướng đến
ngày càng trở thành nhu cầu phổ biến hiện nay. Hơn nữa, từ ứng dụng muốn hướng đến, hệ thống có
thể xem là một đầu cuối trong hệ thống viễn thông (đầu cuối xử lý tín hiệu video), do đó hoàn toàn phù
hợp để có thể phát triển thành một dịch vụ viễn thông rất hữu ích. Trong hai chương tiếp theo, đồ án
này sẽ tiếp tục tìm hiểu cơ sở lý thuyết và kết quả nghiên cứu của từng khối trong hệ thống giám sát
thông minh video. Chương 4 của đồ án này sẽ trình bày thuật toán, chương trình và kết quả thực nghiệm
trên cơ sở dữ liệu tự xây dựng.


Chương 2:
TRÍCH ĐỐI TƯỢNG
2.1

Giới thiệu chương
Tín hiệu video đầu vào các hệ thống giám sát là các khung hình có tốc độ đủ lớn

sao cho mắt người quan sát cảm giác đó là hình ảnh liên tục và không đứt quãng. Các
khung hình này sẽ được đưa vào khối đầu tiên của hệ thống là khối trích đối tượng để
trích ra được đối tượng cần khảo sát. Sau khi trích, đối tượng được lọc nhiễu và lấp đầy
các lỗ trống ở bên trong bằng phương pháp hình thái toán học.
Chương này sẽ trình bày tổng quan về khối trích đối tượng ở mục 2.2. Trong số các
phương pháp trích đối tượng, phương pháp trừ hình nền có thể áp dụng tốt vào môi
trường nền tĩnh, rất phù hợp với hệ thống đang thực hiện chỉ khảo sát video quay trong

nhà nên chương này cũng tập trung nghiên cứu phương pháp trừ nền. Mục 2.3 trình bày
tổng quan về phương pháp trừ nền và đánh giá các phương pháp trừ nền ở mục 2.4. Cuối
cùng, mục 2.5 là phần giới thiệu tổng quát về phương pháp hình thái toán học.
2.2

Tổng quan về trích đối tượng
Như đã trình bày sơ lược về khối trích đối tượng ở chương 1, khối này có tác

dụng trích ra đối tượng cần khảo sát trong phạm vi quan sát. Hay nói cách khác, nhiệm
vụ của khối này chính là xác định được các vùng trên các khung hình mà không ph ải là
hình nền.
Đầu tiên hệ thống sẽ xử lý để tách những vùng nổi trên nền (foreground) ra khỏi
hình nền ban đầu. Foreground chính là đối tượng đang ở trong phạm vi quan sát, bao
gồm cả bóng của đối tượng đó và gọi là đối tượng chưa được xử lý. Sau đó, bóng của
đối tượng sẽ được loại bỏ đi và thu được kết quả là đối tượng cần trích ra. Hình 2.1 là ví
dụ mô tả khái quát các bước thực hiện khối trích đối tượng cần giám sát ra khỏi nền.
Khối trích đối tượng thông thường phải thực hiện việc cập nhật hình nền trong trường
hợp nền ở trạng thái động để có thể thu được kết quả chính xác. Trong thực tế, có rất
nhiều vấn đề mà các thuật toán trong khối trích đối tượng phải giải quyết, chẳng
hạn như:


Nền động: Trong rất nhiều trường hợp phải xử lý video có chứa nhiều đối tượng

-

chuyển động khác nhau như cây cối lay động trong thiên nhiên, v ấn đề đặt ra là
phải trích ra được đúng đối tượng cần khảo sát.
Ánh sáng thay đổi: Sự thay đổi cường độ ánh sáng trong các th ời điểm khác nhau


-

trong ngày hay việc bật tắt đèn đột ngột cũng có ảnh hưởng làm thay đổi nền.
-

Che khuất: Nhiều trường hợp đối tượng có thể bị che khuất hay trùng v ới màu
nền làm cho việc trích đối tượng trở nên khó khăn hơn.

-

Đối tượng tĩnh: Khi đối tượng cần trích trở nên bất động như một người cần giám sát
đang nằm ngủ thì việc phát hiện ra đối tượng sẽ gặp trở ngại vì có thể bị nhầm và xem đó
là nền.

(a)

(b)

(c)

(d)

Hình 2.1 – Ví dụ mô tả các bước thực hiện của khối trích đối tượng
(a) Khung hình nền được ước lượng
(b) Khung hình ngẫu nhiên ở một thời điểm nào đó
(c) Kết quả sau khi trích đối tượng, gồm cả bóng (shadow)
(d) Kết quả cuối cùng sau xử lý

Hiện nay, có nhiều phương pháp trích đối tượng chuyển động đã được đề xuất và sử dụng
trong thực tế như phương pháp trừ hình nền, phương pháp bám đuổi vùng, phương pháp

phân cắt siêu đồ thị, … Tuy nhiên, ở phần tiếp theo của chương này sẽ trình bày cụ thể
hơn về phương pháp trừ nền, là phương pháp đặc biệt ứng dụng tốt trong hệ thống ứng
dụng kỹ thuật phân tích thông minh tín hiệu video để phát hiện tai nạn té ngã của người


cao tuổi, là hệ thống chỉ khảo sát video quay trong nhà với nền tương đối tĩnh.
Tổng quan về phương pháp trừ nền

2.3

Cơ sở lý thuyết của phương pháp trừ nền [7] là phát hiện đối tượng chuyển động
từ sự sai khác của khung hình hiện tại và khung hình chuẩn, thông thường được gọi là
hình nền hay mô hình nền. Có nhiều thuật toán trừ nền khác nhau với chất lượng, thời
gian xử lý và độ phức tạp khác nhau. Tuy nhiên, hầu như đều gồm các bước cơ bản như
sau:
-

Xây dựng một mô hình nền chuẩn qua việc ước lượng nền từ chuỗi khung hình trong
khoảng 3 giây.
-

Sau khi đã xây dựng được mô hình nền, việc xác định ra được đâu là đối tượng
foreground được thực hiện bằng cách so sánh từng khung hình đang xét với khung
hình nền. Giả sử đoạn video đang quan sát I gồm hình nền tĩnh B và các đối tượng
chuyển động trên hình nền đó.

-

Cập nhật lại nền qua việc so sánh với mỗi khung hình mới nếu cần thiết.
-


Cuối cùng, làm tinh đối tượng cần tách bằng cách cắt bỏ bóng c ủa đối tượng, lọc
những vùng nhiễu hay lấp đầy những lỗ trống nhỏ bên trong đối tượng. Trong số
rất nhiều phương pháp trừ nền đã được đề xuất, việc xác định được phương pháp
tối ưu là rất khó vì mỗi phương pháp đều có những ưu điểm cũng như những hạn
chế riêng. Ở phần tiếp theo của chương này sẽ trình bày cụ thể về thuật toán trừ
nền của ba phương pháp cơ bản là: Frame Differencing, Running Average và
Running Median.

2.3.1 Phương pháp Frame Differencing
Trong tất cả các phương pháp trừ nền [4] thì phương pháp Frame Differencing được
xem là phương pháp đơn giản nhất với khối lượng tính toán thấp, tốc độ thực thi thuật
toán khá nhanh[4] . Tuy nhiên, thuật toán này chỉ hoạt động chính xác trong trường hợp
các đối tượng di chuyển liên tục, hình nền là tĩnh. Thuật toán hầu như chỉ xác định
foregound chính xác đối với những điểm biên của đối tượng. Đối với những điểm ảnh
bên trong đối tượng, do sự dịch chuyển của những điểm ảnh này là không đáng kể do đó


sẽ bị xem như là thuộc hình nền. Vì vậy trong trường hợp khi một đối tượng ngưng
chuyển động trong một khoảng thời gian thì cũng sẽ bị xem là hình nền.
Nguyên tắc cơ bản của phương pháp Frame Differencing là đối tượng chuyển
động được phát hiện dựa trên sự khác biệt giữa hai khung ảnh liên tiếp nhau với một mức
ngưỡng chọn trước.
Thuật toán trên được thực hiện bằng phương pháp trừ hai khung ảnh liên tiếp, so sánh giá
trị mỗi giá trị điểm ảnh kết quả với ngưỡng đã được chọn. Nếu giá trị này thấp hơn giá trị
ngưỡng cho phép thì tại đó xem như là điểm ảnh nền và ngược lại là điểm ảnh thuộc đối
tượng.

2.4


Kết quả thực nghiệm của phương pháp trừ nền

2.4.1 Phương pháp Frame Differencing
-

Kết quả thực nghiệm:

Tên video

Kích thước

Tổng số

Tốc độ xử lý

khung hình

khung hình

(fps)

VN-SIN-VE_02.avi

352 x 288

758

33

Leavy.avi


360 x 240

4362

31

Hình 2.2 – Thực hiện thuật toán Frame Differencing trên video VN-SIN-VE_02.avi.


Hình 2.3 – Thực hiện thuật toán Frame Differencing trên video Leavy.avi.
Đối tượng được khoanh tròn ở hình 2.2 và hình 2.3 cho thấy những điểm bên trong
đối tượng và những đối tượng đứng yên bị thuật toán nhầm là hình nền.
2.5. Lọc đối tượng bằng phương pháp hình thái toán học
2.5.1 Giới thiệu hình thái toán học
Hình thái toán học[4] là kỹ thuật phân tích và xử lý các cấu trúc hình học dựa trên
cơ sở lý thuyết tập hợp. Kỹ thuật này dựa trên cấu trúc và hình dạng, dùng các toán hình
thái cơ bản để làm đơn giản ảnh nhưng vẫn giữ lại những đặc trưng chính. Ý tưởng chính
của MM là dò một bức ảnh bằng một khối đơn giản cho trước để xác định được khối này
ăn khớp (fit) hay bị chệch (miss) so với hình dạng trong hình. Các khối đơn giản được
gọi là phần tử cấu trúc (Structuring Element – SE), và hai SE thông dụng nhất là các tập
liên thông 4 và 8 như hình 2.7.
Có 4 phép toán hình thái cơ bản đó là: Dilation (Phép dãn ), Erosion (Phép co),
Opening (Phép mở) và Closing (Phép đóng). Các phép MM này không chỉ là công cụ cơ
bản để lọc nhiễu ra khỏi đối tượng trong ảnh mà còn được sử dụng để trích chọn các
thành phần ảnh như biên ảnh, xương ảnh, rất hữu dụng cho việc biểu diễn các các vùng
khác nhau trên khung hình. Để áp dụng phương pháp MM, ảnh số phải là ảnh nhị phân
trong đó các điểm ảnh thể hiện đối tượng ảnh được mã hóa bởi các điểm ảnh có giá trị 1
và nền được mã hóa bởi các điểm ảnh có giá trị 0.



Hình 2.4 – Các phần tử cấu trúc cơ bản


×