Tải bản đầy đủ (.pdf) (126 trang)

Nhận dạng và xử lý đối tượng chuyển động

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.87 MB, 126 trang )

ĐẠI HỌC QUỐC GIA TP HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THANH ĐẠT

NHẬN DẠNG VÀ XỬ LÝ
ĐỐI TƯNG CHUYỂN ĐỘNG
Chuyên Ngành:
Mã Số Ngành:

Kỹ Thuật Vô Tuyến – Điện Tử.
02.07.01

LUẬN VĂN THẠC SĨ

Tp Hồ Chí Minh, 22 tháng 07 năm 2005


Đại học Quốc Gia Tp. Hồ Chí Minh
TRƯỜNG ĐẠI HỌC BÁCH KHOA
------------------

CỘNG HOÀ XÃ HỘI CHỦ NGHĨA VIỆT NAM
Độc Lập – Tự Do – Hạnh Phúc
----------------

NHIỆM VỤ LUẬN VĂN THẠC SĨ
Họ và tên học viên
Năm sinh
Chuyên ngành


:NGUYỄN THANH ĐẠT
:28-10-1978
: Kỹ thuật Vô tuyến – Điện tử

Phái: Nam
Nơi sinh: Đồng Nai
Mã số: 2.07.01

I. TÊN ĐỀ TÀI:

NHẬN DẠNG VÀ XỬ LÝ ĐỐI TƯNG CHUYỂN ĐỘNG
II. NHIỆM VỤ VÀ NỘI DUNG:
-

Tìm hiểu về kỹ thuật xử lý ảnh.
Nghiên cứu kỹ thuật nhận dạng đối tượng tự động.
Tìm hiểu phương pháp đánh giá chuyển động của đối tượng.
Ứng dụng các phương pháp trên vào việc xử lý một đoạn phim ngắn.
Đánh giá.

III. NGÀY GIAO NHIỆM VỤ (Ngày bảo vệ đề cương):
IV. NGÀY HOÀN THÀNH NHIỆM VỤ (Ngày bảo vệ Luận án tốt nghiệp): 22-07-2005
V. HỌ VÀ TÊN CÁN BỘ HƯỚNG DẨN: PGS.TSKH NGUYỄN KIM SÁCH.
CÁN BỘ HƯỚNG DẨN CHỦ NHIỆM NGÀNH

BỘ MÔN QUẢN LÝ NGÀNH

Nội dung và đề cương Luận văn Thạc só đã được Hội Đồng Chuyên Ngành thông qua
Ngày tháng năm 2005.
PHÒNG ĐÀO TẠO SĐH

KHOA QUẢN LÝ NGÀNH


CÔNG TRÌNH ĐƯC HOÀN THÀNH TẠI
TRƯỜNG ĐẠI HỌC BÁCH KHOA
ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH

Cán bộ hướng dẩn khoa học: PGS-TSKH NGUYỄN KIM SÁCH

Cán bộ chấm nhận xét 1: TS DƯƠNG HOÀI NGHĨA

Cán bộ chấm nhận xét 2: PSG-TS VŨ ĐÌNH THÀNH

Luận văn Thạc só được bảo vệ tại
HỘI ĐỒNG CHẤM BẢO VỆ LUẬN VĂN THẠC SĨ
TRƯỜNG ĐẠI HỌC BÁCH KHOA, ngày 22 tháng 07 năm 2005


TÓM TẮT LÝ LỊCH TRÍCH NGANG
Họ và tên: Nguyễn Thanh Đạt
Phái : Nam
Ngày, tháng, năm sinh: 28 -10 -1978
Nơi sinh: Biên Hoà -Đồng Nai
Địa chỉ liên lạc: 71/3 QL1 P. Quyết Thắng, TP Biên Hoà, Đồng Nai
Quá trình đào tạo
Từ năm 1996-2001:
học Đại Học tại Trường Đại Học Bách Khoa TP Hồ Chí
Minh – khoa Điện - Điện Tử.
Từ năm 2003 – 2005:
học Cao Học tại Trường Đại Học Bách Khoa, ngành

Kỹ Thuật Vô Tuyến - Điện Tử.
Quá trình công tác
Từ năm 2001 đến nay : công tác tại Bưu Điện Tỉnh Đồng Nai.


Lời cảm ơn

Em xin chân thành bày tỏ lòng biết ơn sâu sắc đến Thầy PGS – TSKH
NGUYỄN KIM SÁCH, người đã tận tình hướng dẩn và tạo điều kiện thuận
lợi trong việc học tập cho em trong suốt thời gian thực hiện luận án tốt
nghiệp
Chân thành cảm ơn Quý Thầy Cô Trường Đại Học Bách Khoa TP Hồ Chí
Minh đã tận tình giảng dạy, hướng dẩn và giúp đở em trong học tập và
nghiên cứu khoa học.
Chân thành cảm ơn gia đình, bạn bè đã luôn quan tâm ủng hộ, giúp đỡ và
động viên trong quá trình học tập

Tp Hồ Chí Minh, 01 tháng 7 năm 2005
Học viên thực hiện
NGUYỄN THANH ĐẠT


Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách

GIỚI THIỆU
1. Tổng quát
Trong đề tài trình bày 2 phương pháp nhận dạng đối tượng trong lónh vực xử lý
ảnh động, các phương pháp này cung cấp cho ta thông tin chính xác về vị trí

xuất hiện của đối tượng trên một frame ảnh cũng như sự dịch chuyển của đối
tượng đó khi giám sát chuyển động của nó qua một chuỗi các frame liên tiếp.
Thông tin này giúp người sử dụng dễ dàng trong việc xử lý các cảnh phim
nhằm phục vụ cho nhiều mục đích khác nhau ( quảng cáo, điện ảnh, quân
sự,....).
Các phương pháp xử lý ảnh bắt nguồn từ các ứng dụng như: nâng cao
chất lượng thông tin hình ảnh đối với mắt người và xử lý số liệu cho máy tự
động. Vấn đề xử lý ảnh thật sự mang lại ý nghóa thực tế phải kể đến sự kiện
ảnh chụp mặt trăng từ vệ tinh vào năm 1964. Các bức ảnh này được truyền về
trái đất, được xử lý bằng máy tính (lọc nhiễu, làm nổi đường biên,...). Các kỹ
thuật cơ bản cho phép nâng cao chất lượng hình ảnh như làm nổi đường biên
và lưu hình ảnh.
Các kỹ thuật xử lý ảnh số hiện nay được sử dụng để giải quyết hàng
loạt vấn đề, nhằm nâng cao chất lượng thông tin hình ảnh.
Trong y học, các thuật toán máy tính nâng cao độ tương phản, hoặc mã
hoá các mức sáng thành các màu để nội suy ảnh X quang (X-rays) và các hình
ảnh y sinh học dễ dàng. Các nhà địa vật lý sử dụng kỹ thuật tương tự để
nghiên cứu các mẫu vật chất từ ảnh vệ tinh. Các thuật toán làm nổi đường
biên (image enhancement) và khôi phục hình ảnh (image restoration) được sử
dụng để xử lý hình ảnh giảm chất lượng. Trong thiên văn học, các phương
pháp xử lý ảnh nhằm khôi phục hình ảnh bị nhiễu hoặc bị mất do bóng
(artifacts) sau khi chụp. Trong vật lý và các lónh vực có liên quan như plasmas

HVTH: Nguyễn Thanh Đạt


Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách


(có năng lượng cao) và microscopy điện tử. Tương tự người ta đã ứng dụng xử
lý ảnh cho kết quả tốt trong viễn thám, sinh học, y tế, hạt nhân, quân sự, công
nghiệp,.... Nâng cao chất lượng (làm nổi đường biên) và khôi phục ảnh bị
nhiễu là quá trình xử lý ảnh dùng cho mục đích nội suy của mắt người.
Lónh vực quan trọng thứ hai là xử lý ảnh số gắn liền với việc cảm nhận
của máy. Các cố gắng đều được tập trung cho các quá trình trích thông tin ảnh
và chuyển thành dạng thích hợp cho xử lý máy tính. Ví dụ thông tin dùng cho
máy tính là các moments thống kê, các hệ số biến đổi Fourier và đo khoảng
cách nhiều chiều.
Những vấn đề tiêu biểu của kỹ thuật xử lý ảnh (tónh) và video (ảnh
động) được ứng dụng nhiều trong thực tế như: tự động nhận dạng đặc trưng,
máy nhìn công nghiệp để điều khiển kiểm tra sản phẩm, nhận dạng mục tiêu
quân sự, tự động xử lý vân tay, hiển thị lên màn hình ảnh X quang và các
mẫu máu, xử lý bằng máy các hình ảnh chụp từ vệ tinh để dự báo thời tiết,
nén ảnh (tónh) và video (ảnh động) để lưu và truyền được nhiều hơn tín hiệu
ảnh và video số trong thông tin máy tính, truyền hình thông thường và truyền
hình có độ phân giải cao.
2. Mục tiêu của đề tài
Như đã đề cập ở trên, cần thiết phải nghiên cứu các phương pháp nhằm phân
tích thông tin có được từ một ảnh số, để trên cơ sở đó ta tiếp tục xử lý nhằm
đạt được những mục tiêu đề ra. Mục đích của đề tài là:


Nhận dạng đối tượng tự động (cho ta thông tin về vị trí của đối tượng
trên một frame ảnh - phân đoạn ảnh). Quá trình này cung cấp thông
tin về các vùng ảnh cần quan tâm, từ đó tiến hành các biện pháp xử
lý như tách hoặc ghép cảnh,....

HVTH: Nguyễn Thanh Đạt



Giới thiệu



CBHD: PGS TSKH Nguyễn Kim Sách

Đánh giá chuyển động của đối tượng cho ta thông tin về toạ độ (x,y)
của đối tượng trên khung ảnh, hoặc sự thay đổi vị trí của đối tượng
trên các frame khác nhau. Đây là cơ sở cho việc ghép chính xác các
mô hình vào vị trí của phần ảnh cần xử lý, hoặc tạo mô hình ảo
chuyển động với thuộc tính gần giống với chuyển động của đối
tượng thật.

Nhằm thực hiện tốt các quá trình trên, ảnh đầu vào phải được phân tích kỹ, từ
đó đưa ra ý tưởng, giải thuật hợp lý cho từng phương pháp. Để có cơ sở đánh
giá kết quả khi ứng dụng các phương pháp nhận dạng đối tượng trên vào thực
tiễn, nội dung của Luận văn trình bày lại toàn bộ quá trình phân tích, nhận
dạng và xử lý ảnh đầu vào để tạo ra một cảnh phim được ghép bởi các tình
tiết thật và ảo (ta thường gọi là “Kỹ xảo Điện ảnh”). Đoạn phim này cũng
chính là sản phẩm của cả quá trình xử lý, nó là minh chứng để người xem
đánh giá được hiệu quả của các phương pháp trên.
3. Cấu trúc đề tài
Phần chính của Luận văn bao gồm 6 chương. Chi tiết về mỗi chương được
trình sau đây.
• Chương 1: Khái niệm về kỹ thuật xử lý ảnh.
Trình bày khái niệm về cấu trúc, tính chất của một ảnh số và các kỹ thuật
cơ bản trong lónh vực xử lý ảnh.
• Chương 2: Làm nổi đường biên.
Nêu lên cơ sở làm nổi đường biên, các phương pháp làm nổi đường biên

đối tượng dựa trên thuộc tính của ảnh số.

HVTH: Nguyễn Thanh Đạt


Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách

• Chương 3: Phân đoạn ảnh
Trình bày các phương pháp, kỹ thuật phân đoạn một ảnh số thành các vùng
có thuộc tính gần giống nhau nhằm phục vụ cho các mục đích khác nhau.
• Chương 4: Phương pháp tìm vector chuyển động
Nêu lên các giải thuật, phương pháp tìm ra một khối tương thích nhất với
khối ban đầu lấy từ một tập các khối có liên quan về không gian lẩn thời
gian.
Chương 5: Thực hiện nhận dạng các đối tượng chuyển động.
Quá trình phân tích đánh giá, nhận dạng và xử lý đối tượng từ một đoạn
phim ban đầu vào nhằm tạo ra một cảnh phim được ghép từ các tình tiết
thật và ảo (nêu lên đầy đủ, chi tiết các công đoạn để tạo ra cảnh phim theo
mục đích của tác giả). Đoạn phim là kết quả mô phỏng cho quá trình phân
tích và thực hiện 2 phương pháp trên.
Chương 6: Kết luận và hướng phát triển của đề tài.
Nêu nhận xét đánh giá những ưu khuyết điểm của từng phương pháp đồng
thời nêu lên hướng phát triển của đề tài.
Cuối cùng là phần phụ lục và các tài liệu tham khảo.

HVTH: Nguyễn Thanh Đạt



Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách

TÀI LIỆU THAM KHẢO
[1] Nguyễn Kim Sách, “Xử lý ảnh và Video số”.
[2] Bill Green,”Sobel Edge Dectector – Canny Edge Dectector”.
[3] Junavit Chalida bhongse and Jay Kuo, “Fast Motion Vector Estimation
Using Multiresolution – Spatio – Temporal Correlations”.
[4]Nguyễn Kim Sách, “ Truyền hình số có nén và Multimedia”.
[5] Stanford University, EE Department, “ Object – Tracking Using Multiple
Constraints”.
[6] Tel Aviv University, “ Fast Gradient Methods Based Global Motion
Estimation”.
[7] Jong Nam Kim and Tae Sun Choi, “A Fast Full - Search Motion Estimation Algorithm Using Representative Pixels and Adaptive Matching
Scan”.

HVTH: Nguyễn Thanh Đạt


Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách

Abstract

Image processing has mentioned since 1920s, in order to enhance images of
quality and process data. Nowadays, image processing are developed
incessantly with information technology development.
Image processing are applied on most of fields (Military, Medicine,

Television, Movies, Research in science,....).
The essay has two principle components :
1. Autonomous segmentation, in order to specify interested image regions.
2. Motion vector Estimation Techniques (using matching block) determines a
move of object.
The use of two techniques in Movies are need.
The scheme is performed by Matlab softwares . The result is a film, which is
processed by two above techniques.

HVTH: Nguyễn Thanh Đạt


Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách

LÝ THUYẾT

HVTH: Nguyễn Thanh Ñaït


Giới thiệu

CBHD: PGS TSKH Nguyễn Kim Sách

THỰC HIỆN

HVTH: Nguyễn Thanh Ñaït



Mục lục

CBHD: PGS TSKH Nguyễn Kim Sách

MỤC LỤC
1. CHƯƠNG I: KHÁI NIỆM VỀ KỸ THUẬT XỬ LÝ ẢNH
1.1 Cơ sở về xử lý ảnh số…………………………..……………………........... 01
1.2 Quan hệ giửa các pixel trong một ảnh……………………………......... 03
1.21 Các lân cận của một pixel………………………………………...........03
1.2.2 Các quan hệ………………….….……................................................ 03
1.3 Ý nghóa của phép tinh số học và logic……………………………......... 05
1.4 Phép biến đổi ảnh cơ bản………………………………...…….............. 07
1.4.1 Các phép biến đổi ảnh cơ bản……………………………….….......... 07
1.4.1a Chuyển dịch…………………………………………...….…..............07
1.4.1b Tỉ lệ…………………………………………..………….…............... 07
1.4.1c Phép quay………………………………………….….…................... 08
1.5 Xử lý ảnh màu……………………….………...…….............................. 09
2. CHƯƠNG II: LÀM NỔI ĐƯỜNG BIÊN
2.1 Cơ sở làm nổi đường biên………………………………………….............. 17
2.2 Phương pháp xử lý điểm…………………………………….………........... 18
2.2.1 Biến đổi cường độ sáng đơn giản…………………..……………….... 18
2.2.2 Xử lý histogram……………………….................................................. 22
2.2.3 Trừ ảnh ………………………………..……………………................ 27
2.2.4 Trung bình cộng……………………..…………………….................. 27
2.3 Lọc không gian ………………………….………………………................. 28
2.3.1 Lọc nhẵn …………………………………………................................ 30
2.3.2 Lọc Median ……………………………………………………........... 31
2.3.3 Lọc nét....................................................................................................32
2.4 Làm nổi đường biên miền tần số …………………………………….......... 38
2.4.1 Lọc thông thấp …………………………………………………......... 38

2.4.2 Lọc thông cao …………………………………………………............ 41

HVTH: Nguyễn Thanh Đạt


Mục lục

CBHD: PGS TSKH Nguyễn Kim Sách

3. CHƯƠNG III: PHÂN ĐOẠN ẢNH
3.1 Tách không liên tục........................................................................................ 42
3.1.1 Tách điểm...............................................................................................43
3.1.2 Tách dòng .............................................................................................. 43
3.1.3 Tách biên ............................................................................................... 44
3.2 Tạo ngưỡng .................................................................................................... 48
3.2.1 Cơ sở tạo ngưỡng .................................................................................. 49
3.2.2 Tạo ngưỡng toàn cục ............................................................................ 50
3.2.3 Tạo ngưỡng tối ưu ................................................................................. 51
3.2.4 Chọn ngưỡng trên đặc trưng liên kết ................................................... 53
3.2.5 Ngưỡng có nhiều biến .......................................................................... 55
3.3 Phân đoạn có hướng ...................................................................................... 56
3.3.1 Các cơ sở ............................................................................................... 56
3.3.2 Tăng vùng bằng cách tập hợp pixel ..................................................... 56
3.3.3 Tách và hợp nhất các vùng .................................................................. 58
3.4 Kỹ thuật không gian và tần số ...................................................................... 59
3.4.1 Kỹ thuật miền không gian .................................................................... 59
3.4.2 Kỹ thuật miền tần số ............................................................................ 62
4. CHƯƠNG 4: PHƯƠNG PHÁP TÌM VECTOR CHUYỂN ĐỘNG
4.1 Khái quát ...................................................................................................... 63
4.1.1 Phương pháp phù hợp khối với giả thuyết sai số đơn .......................... 63

4.1.2 Tìm khối tương ứng nhanh với pixel mẩu thứ cấp ............................... 64
4.1.4 Tìm block tương ứng nhanh phối hợp – dùng theo mức ưu tiên........... 65
4.2 Các thuật tóan khối tương ứng ...................................................................... 65
4.2.1 Tìm khối tương ứng dựa trên sự tương quan về không gian................. 65
4.2.2 Thuật toán không gian cải biến S2........................................................ 70
4.2.3 Thuật toán dựa trên mối quan hệ không gian và thời gian.................. 71

HVTH: Nguyễn Thanh Ñaït


Mục lục

CBHD: PGS TSKH Nguyễn Kim Sách

5. CHƯƠNG 5 THỰC HIỆN NHẬN DẠNG ĐỐI TƯNG CHUYỂN ĐỘNG
(trên cơ sở xử lý tình huống một đoạn phim )
5.1 Kỹ thuật nhận dạng đối tượng tự động
trong việc tách không gian chứa đối tượng ra khỏi cảnh phim.................... 75
5.1.1 Phân tích phương pháp làm nổi đường biên .........................................75
5.1.2 Phương pháp phân chia thành nhiều mức sáng để xử lý ..................... 78
5.1.2a Phân tích..........................................................................................78
5.1.2b Thực hiện quá trình nhận dạng trên một frame............................ 85
5.1.2c Kết quả quá trình nhận dạng trên chuỗi frame............................. 90
5.2 Kỹ thuật đánh giá chuyển động
trong xử lý các chi tiết chuyển động bị che khuất trong ở cảnh phim........ 92
5.2.1 Phân tích chung...................................................................................... 92
5.2.2 Phương pháp đánh giá vector chuyển động.......................................... 93
5.2.3 Thực hiện ghép cảnh nền vào phần không gian trống......................... 96
5.2.3a Thực hiện xử lý.............................................................................. 96
5.2.3b Kết quả thực hiện........................................................................... 97

5.2.4 Nhận dạng và xử lý các chi tiết chuyển động...................................... 99
5.2.4a Phân tích........................................................................................ 99
5.2.4b Thực hiện xử lý...............................................................................102
5.2.4c Kết quả thực hiện........................................................................... 106
5.3 Phần kết quả thực hiện……………………………………………………... 108
6. CHƯƠNG 6 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN ĐỀ TÀI
6.1 Nhận xét đánh giá ................................................................................

109

6.2 Hướng phát triển đề tài.........................................................................

110

HVTH: Nguyễn Thanh Đạt


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

CHƯƠNG I

MỘT SỐ KHÁI NIỆM VỀ KỸ THUẬT XỬ LÝ ẢNH
1.1 Cơ sở về xử lý ảnh số :
Một ảnh đơn giản (ảnh đen trắng) được biểu diễn bằng một hàm cường
độ sáng f(x,y), trong đó (x,y) là các giá trị của f tại điểm có tọa độ (x,y) sẽ tỉ
lệ với độ sáng (mức xám của ảnh) tại điểm này. Một ảnh số f(x,y) sẽ gián
đoạn theo không gian và độ sáng, nó được xem như là một ma trận với hàng
và cột . Ta biểu diễn một điểm trong ảnh bằng giá trị của một điểm trong ma

trận tương ứng với mức xám tại điểm đó. Các phần tử của một dãy số như thế
được gọi là điểm ảnh (pixels).
Kích thước của một ảnh số thay đổi theo mục đích sử dụng. Hình ảnh ta
cảm nhận được hàng ngày là từ ánh sáng phản xạ từ vật thể đó. Hàm f(x,y)
được đặc trưng bởi hai thành phần gồm:
1.

Lượng ánh sáng nguồn rơi trên vật thể được nhìn thấy.

2.

Lượng ánh sáng nguồn phản xạ từ vật thể nhìn thấy.

Chúng được gọi là sự phát sáng (illumination) và các thành phần phản
xạ (reflectance components ) được biểu diễn bằng i(x,y) và r(x,y), hai hàm này
kết hợp với nhau để tạo nên hàm f(x,y)
f(x,y) = i(x,y).r(x,y)
với

0

< i(x,y) <



0

< r(x,y)

1


<

(1.1)

thành phần phản xạ r(x,y) tập trung xung quanh 0 (sẽ mang tính hấp thụ hòan
toàn) và 1 (phản xạ hoàn toàn) được xác định thông qua đặc trưng của vật thể.
Hàm lượng sáng i(x,y) được xác định bằng nguồn sáng.
HVTH: Nguyễn Thanh Đạt

trang 1


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

Một số các giá trị đặc trưng của r(x,y):
Nhung đen:

0,01 foot - candle

Thép sạch:

0,65 foot – candle

Sơn trắng :

0,80 foot - candle


Tuyết:

0,93 foot – candle

Để xử lý bằng máy tính, một hàm ảnh f(x,y) phải được số hóa trong
không gian và biên độ. Số hóa các tọa độ không gian (x,y) được gọi là lấy
mẫu ảnh và số hóa theo biên độ được gọi là lượng tử hóa mức xám.
Một ảnh liên tục f(x,y) được xấp xỉ bằng các mẫu không gian bằng nhau
dưới dạng ma trận, trong đó từng thành phần là các giá trị rời rạc.
.f(0, M - 1) ⎤
⎡f(0,0) f(0,1) …..

f(1, M - 1) ⎥⎥
f(x,y)= ⎢f(1,0) f(1,1) …..
⎢⎣f(N - 1,0) f(N - 1,1) ... f(N - 1, M - 1)⎥⎦

(1.2)

.

Mỗi phần tử ở ma trận được gọi là một pixel. Khái niệm ảnh và pixel
được dùng để biểu thị một ảnh và các phần tử của nó.
Quá trình lấy mẫu được xem như việc đưa thành phần của mặt phẳng
vào trong một lưới, mỗi ô lưới là một cặp các phần tử (x,y) và mang giá trị
f(x,y) biểu diễn cho độ xám tại tọa độ đó. Các giá trị N,M của ma trận thường
là hàm mũ cơ số 2 và số mức xám
N=2n
M=2k

(1.3)


G=2m

HVTH: Nguyễn Thanh Ñaït

trang 2


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

Giả sử các mức xám rời rạc có khoảng cách bằng nhau từ 0 đến L trên
thang mức xám thì số bit cần để lưu một ảnh là :
B=MxNxm
Một ảnh 128x128 với 64 mức xám sẽ cần 98.304 bit để lưu
1.2 Quan hệ giữa các pixels trong một ảnh
1.2.1 Các lân cận của một pixel:
Một pixel p ở tọa độ (x,y) sẽ có các lân cận theo chiều ngang, chiều
đứng với các tọa độ sau đây:
(x+1,y), (x-1,y), (x,y+1), (x,y-1)
Tập các pixels này gọi là 4 lân cận của p ký hiệu là N4(p). Bốn lân cận
theo đường chéo của p có tọa độ như sau:
(x+1,y+1), (x+1,y-1), (x-1,y+1), (x-1,y-1)
được ký hiệu là Np(p). Các điểm này cùng với 4 lân cận gọi là 8 lân cận của p
và ký hiệu là N8(p). Một vài điểm trong Np(p) và N8(p) sẽ nằm bên ngoài ảnh
nếu (x,y) nằm ở ngoài biên của ảnh.
1.2.2 Mối liên kết (connectivity):
Mối liên kết của các pixels trong vật thể có ý nghóa khá quan trọng
trong việc xác định các giới hạn của vật thể, các vùng khác nhau trong một

ảnh. Để xác định mối liên kết của 2 pixels, ta cần phải xác định theo một ý
nghóa nào đó nếu chúng kề nhau và nếu các mức xám của chúng thỏa mãn
một chuẩn đặc trưng về sự gần giống nhau.
Cho V là tập các giá trị mức xám, dùng để định nghóa mối liên kết.
Trong ảnh nhị phân ta có V= {1} liên kết các pixels có giá trị là 1. Trong một
HVTH: Nguyễn Thanh Ñaït

trang 3


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

ảnh với thang mức xám có mối liên kết các pixels trong phạm vi các giá trị
cường độ sáng ví dụ là 32 đến 64 sẽ có V = {32, 33, ….,63,64} ta sẽ có các
loại liên kết:
a) Liên kết 4: hai pixels p và q với các giá trị từ V có liên kết 4 nếu q
nằm trong tập N4(p)
b) Liên kết 8: hai pixels p và q với các giá trị từ V có liên kết 8 nếu q
nằm trong tập N8(p)

a) hàm and

b) hàm or

c) hàm xor

d) hàm not-and
Hình1.1 Các hàm logic cơ bản trên các ảnh nhị phân

HVTH: Nguyễn Thanh Đạt

trang 4


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

c) Liên kết m (liên kết hỗn hợp): hai pixels p và q với các giá trị từ V có
liên kết m nếu q nằm trong tập N4(p) hoặc q nằm trong tập Np(p) và N4(p),
N4(q) trống (đó là tập các pixels mà 4 lân cận của p và q và các giá trị của nó
có từ V)
Liên kết hỗn hợp là một biến thể của liên kết 8 và được dùng để tách
các mối liên kết đa thành phần thường xuất hiện (nếu dùng liên kết 8)
Theo ví dụ V={1} các phần giữa các liên kết 8 của pixel ở tâm được vẽ
bằng đường nốùi (hình 1.1.a), ta chú ý tính không rõ ràng trong các liên kết
thành phần tạo từ liên kết 8, tính không rõ ràng này sẽ mất đi khi ta dùng liên
kết m (hình 1.1.b). Một pixel p kề với một pixel q nếu chúng liên kết với
nhau. Ta có thể xác định các liên kết 4,8 hoặc m kề nhau phụ thuộc vào loại
liên kết đặc trưng. Hai tập ảnh S1 và S2 kề nhau nếu một pixel trong ảnh S1 kề
với cùng pixel đó trong ảnh S2
Nếu p và q là các pixels trong một tập ảnh con S, thì p liên kết với q
trong S, nếu có một thành phần từ p đến q chứa toàn bộ các pixels trong S.
Đối với các pixels p trong S mà tập các pixels trong S liên kết với q, thì được
gọi là thành phần liên kết của S. Tuy nhiên 2 pixels nào đó của một thành
phần liên kết sẽ liên kết với mỗi thành phần khác và các thành phần liên kết
khác nhau sẽ tách rời nhau.
1.3 Toán tử số học và logic:
Các toán tử số học và logic cho các pixels được dùng nhiều trong hầu

hết các lónh vực xử lý ảnh. Toán tử số học giữa 2 pixels a và b được biểu diễn:
Cộng:

a +b

Trừ:

a–b

Nhân:

a*b

HVTH: Nguyễn Thanh Đạt

trang 5


Khái niệm về kỹ thuật xử lý ảnh

Chia:

CBHD: PGS TSKH Nguyễn Kim Sách

a/ b

Toán tử số học cho toàn ảnh được thực hiện theo từng pixel. Nguyên tắc
cộng trung bình thường được dùng nhằm làm giảm nhiễu. Phép trừ là công cụ
cơ bản nhất cho việc tách thông tin nền. Phép nhân ảnh và chia ảnh được
dùng để sửa mức xám do chiếu sáng không đồng đều. Các thuật toán số học

chỉ phục vụ cho một vị trí pixel không gian (trong một thời gian) cho nên
chúng có thể được thực hiện theo nghóa tạo một toán tử số học tại (x,y) và có
thể được lưu ở vị trí đó.
Các thuật toán logic cơ sở được dùng trong xử lý ảnh là AND, OR và
COMPLEMENT.
AND:

p and q

(hoặc :p.q)

OR:

p or q

(hoặc p+q)

COMPLEMENT: not p
Các toán tử này có thể được ghép để tạo một toán tử logic bất kỳ khác.
Các toán tử logic chỉ được dùng cho các ảnh nhị phân, còn các toán tử số học
dùng cho các pixels nhân với nhau. Toán tử logic là phương tiện cơ bản dùng
trong xử lý ảnh nhị phân, nó được dùng như mặt nạ, tách đặc trưng, phân tích
hình dạng. Toán tử logic trong toàn bộ ảnh được thực hiện theo từng pixel.
Các toán tử số học và logic được dùng để cộng từng pixel trong xử lý
toàn ảnh với các toán tử lân cận. Xử lý lân cận thường được trình bày dưới
dạng toán tử “mặt nạ” (mask). tưởng trên dùng các toán tử mặt nạ biểu
diễn một pixel là hàm của mức xám của nó và mức xám các lân cận.
Chọn đúng hệ số và sử dụng mặt nạ tại từng vị trí pixel trong một ảnh
có thể thay đổi các toán tử ảnh có ích ví dụ như giảm nhiễu, làm hẹp vùng
ảnh (region thinning) và tách đường biên. Tuy nhiên sử dụng mặt nạ tại từng

HVTH: Nguyễn Thanh Đạt

trang 6


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

vị trí pixel trong ảnh là nhiệm vụ của máy tính. Ví dụ dùng một mặt nạ 3x3
cho ảnh 512x512 sẽ cần 9 phép nhân và 8 phép cộng tại mỗi vị trí pixel, tổng
cộng 2.359.296 phép nhân và 2.097.152 phép cộng.
1.4 Phép biến đổi ảnh cơ bản:
1.4.1 Các phép biến đổi ảnh cơ bản:
Tất cả các phép biến đổi được biểu diễn trong hệ toạ độ Decarte 3
chiều (3-D), trong đó mỗi điểm có toạ độ (X,Y,Z). Trong trường hợp ảnh 2
chiều (2-D) mỗi pixel sẽ được biểu diễn theo toạ độ (x,y). (X,Y,Z) được xem
như toạ độ tổng thể cho một điểm nói chung.
1.4.1a Chuyển dịch:
Chuyển dịch một điểm có tọa độ (X,Y,Z) đến vị trí mới bằng cách thay
thế bằng (X0,Y0,Z0). Phép dịch chuyển được biểu diễn bằng phương trình:
X* = X + X0
Y* = Y + Y 0

(1.4)

Z* = Z + Z0
Trong đó X*, Y*, Z* là tọa độ của điểm mới dịch chuyển. Có thể biểu
diễn dưới dạng ma trận:
X*


1

0

0

X0

X

Y* = 0

1

0

Y0

Y

Z*

0

1

Z0

Z


0

(1.5)

1.4.1b Tỉ lệ (Scaling):
Phép tỉ lệ có các hệ số Sx, Sy Sz dọc theo trục X, Y, Z được cho bởi ma
trận :
HVTH: Nguyễn Thanh Đạt

trang 7


Khái niệm về kỹ thuật xử lý ảnh

S=

CBHD: PGS TSKH Nguyễn Kim Sách

Sx

0

0

0

0

SY


0

0

0

0

Sz

0

0

0

0

1

(1.6)

1.4.1c Phép quay:
Trong đó đơn giản nhất là quay một điểm quanh các trục tọa độ. Để
quay một điểm so với bất kỳ điểm nào trong không gian ta thực hiện các bước
1.

Chuyển dịch điểm bất kỳ so với tọa độ gốc.


2.

Thực hiện quay.

3.

Chuyển dịch điểm trở về so với vị trí gốc của nó

Quay một điểm quanh trục Z với góc θ nhờ phép biến đổi:
cosθ
R θ = -sinθ
0
0

sinθ
cosθ
0
0

0
0
1
0

0
0
0
1

(1.7)


góc quay θ được đo nếu nhìn góc tọa độ từ một điểm trên trục +Z. Sự biến đổi
này chỉ có hiệu quả với các giá trị tọa độ X và Y.
Quay một điểm quanh trục X với một góc α được thực hiện bằng phép
biến đổi:
1

0

0

cosα sinα 0

R α= 0

-sinα cosα 0

0

0

0

0

0
(1.8)

1


Và cuối cùng quay một điểm quanh trục Y với một góc µ được thực
hiện bởi phép biến đổi:
HVTH: Nguyễn Thanh Đạt

trang 8


Khái niệm về kỹ thuật xử lý ảnh

CBHD: PGS TSKH Nguyễn Kim Sách

cosµ 0
R µ= 0

1

-sinµ 0
0

0

sinµ 0

cosµ 0

0

0

0


(1.9)

1

1.5 Xử lý ảnh màu
Việc dùng màu trong xử lý ảnh được trình bày theo 2 yếu tố cơ bản:
- Trong phân tích ảnh tự động, màu là các biểu diễn có hiệu quả,
thường làm đơn giản việc nhận dạng vật thể trích từ cảnh vật.
- Trong phân tích ảnh, mắt người có thể phân biệt hàng ngàn màu và
cường độ sáng khác nhau.
Xử lý ảnh màu được chia làm 2 phần: xử lý ảnh màu đầy đủ và ảnh giả
màu. Trường hợp đầu cần sử dụng bộ cảm biến màu đầy đủ. Trường hợp sau
sẽ phân phối màu cho từng cường độ sáng tối, đen trắng hoặc phạm vi cường
độ sáng.
Mặc dù quá trình thu nhận ảnh màu trong mắt người là một hiện tượng
tâm sinh lý, nhưng vẫn còn chưa được hiểu một cách đầy đủ. Một chùm ánh
sáng trắng nếu đi qua một lăng kính nó sẽ phân thành một phổ màu liên tục :
tím, lam, lục, vàng, cam, đỏ. Nếu nhìn màu đầy đủ thì không có ranh giới giữa
các màu kề nhau, mà màu này liền sang màu khác. Màu mà mắt người cảm
nhận được bởi bản chất của ánh sáng phản xạ từ vật thể. nh sáng được nhìn
thấy bao gồm một băng tần tương đối hẹp các tần số trong phổ năng lượng
điện từ. Một vật phản xạ ánh sáng thì cân bằng trong tất cả các bước sóng
nhìn thấy để tạo ánh sáng trắng.
Đặc trưng của ánh sáng là trung tâm của khoa học về màu. Nếu ánh
sáng không màu, nó chỉ tham dự bằng cường độ sáng của nó. Ví dụ như xem
HVTH: Nguyễn Thanh Đạt

trang 9



×