Tải bản đầy đủ (.pdf) (81 trang)

NHẬN DẠNG VÀ XỬ LÝ ẢNH VẬT THỂ ỨNG DỤNG TRONG ĐIỀU KHIỂN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.61 MB, 81 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH

KHÓA LUẬN TỐT NGHIỆP
NHẬN DẠNG VÀ XỬ LÝ ẢNH VẬT THỂ ỨNG DỤNG TRONG
ĐIỀU KHIỂN

Họ và tên sinh viên:

ĐẶNG MINH CHỨC
PHẠM TRƢỜNG GIANG

Niên khóa: 2007-2011

Tháng 5/2011


NHẬN DẠNG VÀ XỬ LÝ ẢNH VẬT THỂ ỨNG DỤNG
TRONG ĐIỀU KHIỂN

ĐẶNG MINH CHỨC
PHẠM TRƯỜNG GIANG

Ts NGUYỄN VĂN HÙNG

Tháng 5/2011
i


LỜI CẢM ƠN
ầy Nguyễ




.

Xin trân trọng.
Đặng Minh Chức
Phạm Trƣờng Giang

ii


TÓM TẮT
Đề tài nghiên cứu “ nhận dạng và xử lý ảnh ứng dụng trong điều khiển” được
thực hiện tại trường Đại Học Nông Lâm Thành Phố Hồ Chí Minh, thời gian 3 tháng từ
tháng 3 đến ngày 8 tháng 5 năm 2011.
Đề tài đã thực hiện thành công và đạt được kết quả khả quan như điều khiển
được robot đến vị trí nhận dạng và thực hiện thao tác hái cà chua. Đây được xem là kết
quả chính của đề tài, để thực hiện tốt kết quả này thì chúng tôi cũng phải thực hiện
thành công quá trình xử lý ảnh nhận dạng vật thể, vị trí vật thể trong không gian 3
chiều bằng Webcame thông qua chương trình Matlab và cảm biến SRF10 thông qua vi
điều khiển ATMEGA 16. Để từ đó, chúng tôi lấy tín hiệu điều khiển robot.
Ngoài ra, chúng tôi cũng thiết kế giao diện giao tiếp với người quan sát bằng đồ
thị trong lập trình GUI của Matlab một cách thân thiện ,dễ hiểu và dễ điều khiển.

iii


MỤC LỤC
LỜI CẢM ƠN ........................................................................................................................ ii
TÓM TẮT .............................................................................................................................. iii

MỤC LỤC................................................................................................................................ iv
DANH MỤC HÌNH ...............................................................................................................vii
DANH MỤC VIẾT TẮT .......................................................................................................ix
Chƣơng 1

MỞ ĐẦU.........................................................................................................1

1.1 Đặt vấn đề. ......................................................................................................................1
1.2 Mục đích. ........................................................................................................................2
Chƣơng 2

TỔNG QUAN ................................................................................................3

2.1 Lý thuyết xử lý ảnh. .....................................................................................................3
2.1.1

Hệ thống xử lý ảnh. ..............................................................................................3

2.1.1.1

Thu nhận ảnh và số hóa. ........................................................................................3

2.1.1.2

Phân tích ảnh...........................................................................................................4

2.1.1.3

Hệ quyết định..........................................................................................................4


2.1.2

Thu nhận ảnh và lưu trữ ảnh. ................................................................................4

2.1.2.1

Thu nhận ảnh. .........................................................................................................4

2.1.2.2

Lưu trữ ảnh..............................................................................................................7

2.1.3

Phân tích ảnh...........................................................................................................8

2.1.3.1

Khái niệm pixel và pixel lân cận. .........................................................................8

2.1.3.2

Mộtsố không gian màu. .........................................................................................9

2.1.3.3

Một số công cụ trợ giúp xử lý ảnh. ................................................................... 13

2.1.3.4


Tiền xử lý ảnh. ..................................................................................................... 15

2.1.3.5

Làm trơn ảnh. ....................................................................................................... 17

2.1.3.6

Biên và các phương pháp phát hiện biên.......................................................... 20

2.2 Xác định khoảng cách bằng sóng siêu âm. ........................................................... 21
2.2.1

Khái niệm siêu âm............................................................................................... 21

2.2.2

Cảm biến siêu âm và nguyên tắc TOF.............................................................. 21

2.2.2.1

Cảm biến siêu âm. ............................................................................................... 21

2.2.2.2

Cấu tạo và nguyên lý hoạt động cảm biến siêu âm. ........................................ 22
iv


2.2.2.3


Nguyên tắc TOF. ................................................................................................. 24

2.2.2.4

Ưu điểm và nhược điểm cảm biến siêu âm. ..................................................... 26

2.2.3

Cảm biến siêu âm SRF10. .................................................................................. 27

2.3 Phần mềm matlab ứng dụng xử lý ảnh................................................................. 30
2.3.1

Khái niệm MATLAB.......................................................................................... 30

2.3.2

Giao diện trong Matlab....................................................................................... 30

2.3.3

Khả năng và ứng dụng của Matlab. .................................................................. 31

2.3.4

Hệ thống lệnh xử lý ảnh trong Matlab (Matlab Funtion). .............................. 32

Chƣơng 3


NỘI DUNG VÀ PHƢƠNG PHÁP NGHIÊN CỨU ........................... 34

3.1 Bố trí thực hiện đề tài. .............................................................................................. 34
3.1.1

Thời gian. ............................................................................................................. 34

3.1.2

Địa điểm. .............................................................................................................. 34

3.2 Phƣơng tiện nghiên cứu. .......................................................................................... 34
3.3 Phƣơng pháp nghiên cứu. ........................................................................................ 35
3.3.1

Phương pháp lý thuyết. ....................................................................................... 35

3.3.2

Phương pháp thực nghiệm. ................................................................................ 35

Chƣơng 4

KẾT QUẢ VÀ THẢO LUẬN. ................................................................ 37

4.1 Xây dựng quy trình nhận dạng và xử lý ảnh....................................................... 37
4.1.1

Quy trình nhận dạng và xử lý ảnh. .................................................................... 37


4.1.2

Quy trình xác định khoảng cách sử dụng cảm biến siêu âm.......................... 38

4.2 Kết quả nhận dạng và xử lý ảnh. ........................................................................... 39
4.2.1

Quá trình nhận dạng và xử lý ảnh. .................................................................... 39

4.2.1.1

Sơ đồ khối xử lý. ................................................................................................. 39

4.2.1.2

Nhận dạng và xử lý ảnh. ..................................................................................... 39

4.2.2

Quá trình nhận tín hiệu cảm biến SRF10. ........................................................ 46

4.2.2.1

Sơ đồ xử lý tín hiệu cảm biến ............................................................................ 46

4.2.2.2

Kết nối, chuyển đổi và hiển thị.......................................................................... 46

4.2.3


Kết quả chương trình. ......................................................................................... 47

4.3 Kết quả chế tạo và điều khiển robot...................................................................... 49
4.3.1

Mô hình chế tạo robot. ........................................................................................ 49

4.3.2

Kết quả chế tạo. ................................................................................................... 49
v


4.3.3

Điều khiển robot. ................................................................................................. 50

4.3.4

Kết quả khảo nghiệm sơ bộ................................................................................ 52

4.4 Nhận xét. ...................................................................................................................... 54
Chƣơng 5

KẾT LUẬN VÀ ĐỀ NGHỊ ...................................................................... 55

5.1 Kết luận. ....................................................................................................................... 55
5.2 Đề nghị. ........................................................................................................................ 55
TÀI LIỆU THAM KHẢO ................................................................................................. 56

PHỤ LỤC .............................................................................................................................. 57

vi


DANH MỤC HÌNH
HÌNH 2.1 Sơ đồ hệ thống xử lý ảnh. ....................................................................................3
HÌNH 2.2 Sensor quét dòng CCD .........................................................................................5
HÌNH 2.3 Quy ước tọa độ cho biểu diễn ảnh ......................................................................6
HÌNH 2-4 Pixel P và các lân cận của P .................................................................................9
HÌNH 2.5 Mô hình màu RGB............................................................................................. 10
HÌNH 2.6 Các màu gốc bù và sự pha trộn giữa chúng.................................................... 10
HÌNH 2.7 Sự biến đổi từ RGB thành CMY...................................................................... 11
HÌNH 2.8 Mô hình màu HSV............................................................................................. 12
HÌNH 2.9 Mô hình màu HLS ............................................................................................. 13
HÌNH 2.10 Một lân cận kích thước 3x3 quanh điểm (x,y) ............................................. 16
HÌNH 2.11 Các lân c ận của p sử dụng để làm nhẵn ảnh nhị phân.................................. 19
HÌNH 2.12 Làm trơn hình ảnh nhị phân. ......................................................................... 20
HÌNH 2.13 Vùng hoạt động của cảm biến siêu âm( nguồn internet) ............................ 23
HÌNH 2.14 Khu vực mù của cảm biến siêu âm( nguồn internet)................................... 23
HÌNH 2.15 Thời gian truyền trong nguyên lý TOF ......................................................... 25
HÌNH 2.16 Tầm quét của cảm biến siêu âm..................................................................... 25
HÌNH 2.17 Cảm biến siêu âm SRF10 ............................................................................... 27
HÌNH 2.18 Sơ đồ kết nối SRF10 ....................................................................................... 28
HÌNH 2.19 Giao diện Matlab ............................................................................................. 31
HÌNH 3.1 Sơ đồ phương pháp điều khiển robot .............................................................. 35
HÌNH 3.2 Phương pháp điều khiển hồi tiếp ..................................................................... 36
HÌNH 4.1 Sơ đồ nhận dạng và xử lý ảnh .......................................................................... 37
HÌNH 4.2 Sơ đồ xác định khoảng cách sử dụng cảm biến SRF10 ................................ 38
HÌNH 4.3 Sơ đồ mạch vi điều khiển.................................................................................. 38

HÌNH 4.4 Sơ đồ nhận dạng và xử lý ảnh ứng dụng điều khiển ..................................... 39
HÌNH 4.5 Hình ảnh thu nhận từ Webcame....................................................................... 40
HÌNH 4.6 Sơ đồ nhận dạng và trích đối tượng................................................................. 40
HÌNH 4.7 Ảnh sau khi chuyển sang ảnh xám .................................................................. 41
HÌNH 4.8 Ảnh khi trích xuất gam màu đỏ........................................................................ 42
vii


HÌNH 4.9 Sơ đồ quá trình xử lý phân tích ảnh................................................................. 42
HÌNH 4.10 Ảnh sau khi lọc trung vị.................................................................................. 43
HÌNH 4.11 Lọc bỏ vùng dưới 300px ................................................................................. 44
HÌNH 4.12 Ảnh đã được định tâm và đóng khung ......................................................... 44
HÌNH 4.13 Xác định khoảng cáchhiển thị tọa độ tới tâm hình ...................................... 45
HÌNH 4.14 Kết quả hệ quyết định ..................................................................................... 45
HÌNH 4.15 Sơ đồ khối quá trình nhận tín hiệu cảm biến SRF10 .................................. 46
HÌNH 4.16 Kết quả hiển thị trên màn hình LCD ............................................................. 47
HÌNH 4.17 Kết quả hiển thị tín hiệu cảm biến trên Matlab............................................ 47
HÌNH 4.18 Giao diện hiển thị chương trình xử lý ảnh.................................................... 48
HÌNH 4.19 Giao diện hiển thị kết quả hệ thống............................................................... 48
HÌNH 420 Mô hình robot ứng dụng xử lý ảnh ................................................................. 49
HÌNH 4.21 Robot ứng dụng xử lý ảnh .............................................................................. 50
HÌNH 4.22 Giải thuật điều khiển robot .............................................................................. 51
HÌNH 4.23 Biểu đồ khảo nghiệm độ phận giải xác định khoảng cách ......................... 52
HÌNH 42.4 Biểu đồ thời gian đáp ứng................................................................................. 53

viii


DANH MỤC VIẾT TẮT
CCD


Charge Coupled Device

CMOS

Complementary Metal-Oxide-Semiconductor

GIF

Graphics Interchange Format

P

Pixel

CMY

Cyan, Magenta, Yellow

TOF

Time Of Flight

RLE

Run-Length-Encoded

RGB

Red, Green, Bule


HSL

Hue, Saturation, Lightness

LED

Light Emitting Diode

ix


Chƣơng 1
MỞ ĐẦU
1.1 Đặt vấn đề.
Trong mấy thập kỷ gần đây, xử lý ảnh đã được nghiên cứu mạnh mẽ và đã có
rất nhiều ứng dụng trong thực tế. Như trong y học, xử lý ảnh số đã được dùng để phát
hiện và nhận dạng khối u, cải thiện ảnh X quang, nhận dạng đường biên mạch máu từ
những ảnh chụp mạch bằng tia X. Trong cuộc sống gia đình, xử lý ảnh được dùng để
cải thiện ảnh Ti vi. Trong truyền thông video như hội nghị video, điện thoại video thì
một vấn đề chính là cần có dải tần rộng. Việc mã hóa thẳng các chương trình video
chất lượng quảng bá cần đến 100 triệu bit/s. Điều này không thể đáp ứng được. Nhưng
bằng cách mã hóa số và khôi phục ảnh (là những vấn đề của xử lý ảnh ) thì việc trên có
thể thực hiện chỉ với băng tần 100 nghìn bit/s. Còn trong lĩnh vực khoa học kỹ thuật,
xử lý ảnh đã và đang có những đóng góp quan trọng, đặc biệt là trong lĩnh vực Robot.
Robot thông minh ngày nay không thể thiếu yếu tố xử lý ảnh. Đó là các vấn đề nhận
dạng các đối tượng ngoài môi trường. Từ việc nhận dạng có thể giải quyết rất nhiều
bài toán như tránh vật cản, dò đường, tìm vật…. Từ những cơ sở đó, việc nghiên cứu
bài toán xử lý ảnh trong thời đại ngày nay là rất quan trọng và không thể thiếu trong
hầu hết các lĩnh vực.

Ngày nay, lĩnh vực khoa học kỹ thuật công nghệ phát triển một cách nhanh
chóng và mạnh mẽ, đặc biệt là lĩnh vực Robot thông minh. Xử lý ảnh là bài toán
không thể thiếu trong Robot nó có thể được xem là con mắt của Robot, nó có thể giúp
Robot quan sát, theo dõi đối tượng, dò đường,tìm vật,. . . điều này rất quan trọng cho
điều khiển Robot. Vì thế, bài toán xử lý ảnh sẽ giúp cho ta điều khiển Robot một cách
chính xác và dễ dàng hơn.

1


1.2 Mục đích.
Dựa trên những yêu cầu thực tế ngày nay trong lĩnh vực Robot thông
minh.Chúng tôi thực hiện đề tài “nhận dạng và xử lý ảnh vật thể ứng dụng trong
điều khiển” với mục đích nhận dạng vật thể thông qua màu sắc vật và định dạng vị trí
vật thể trong không gian để lấy tín hiệu điều khiển Robot.
Vì thời gian giới hạn cũng như mức độ rộng lớn của đề tài nên chúng tôi chỉ
thực hiện nghiên cứu các vấn đề cơ bản sau:
Sử dụng Webcame kết hợp phần mềm MATLAB phát hiện đối tượng và định
vị trí đối tượng theo phương x,y trong khung ảnh.
Sử dụng cảm biến siêu âm SRF10 để xác định khoảng cách đối tượng theo
phương z.
Ứng dụng xử lý ảnh vào điều khiển ROBOT.

2


Chƣơng 2
TỔNG QUAN
2.1 Lý thuyết xử lý ảnh.
2.1.1 Hệ thống xử lý ảnh.

Một hệ thống xử lý ảnh điển hình thường bao gồm những thành phần sau:

Lưu
trữ
Thiết bị thu
nhận ảnh
(camera,
sensor)

Thu nhận
ảnh

Lưu
trữ

Số hóa

Phân
tích ảnh

Nhận
dạng

Hệ quyết
định
HÌNH 2.1 Sơ đồ hệ thống xử lý ảnh.
Từ hình vẽ 2-1 ta thấy một hệ thống xử lý ảnh bao gồm: thu nhận ảnh, số hóa
ảnh, phân tích ảnh và cuối cùng là quyết định (tùy thuộc vào yêu cầu ứng dụng cụthể
mà đưa ra quyết định cho phù hợp).
2.1.1.1 Thu nhận ảnh và số hóa.

Việc thu nhận ảnh có thể thông qua camera. Các camera có thể hoặc là tương tự
(loại camera ống kiểu CCIR) hoặc là số (loại camera kiểu CCD_ Charge Coupled
Device). Ảnh cũng có thể được thu qua các thiết bị khác như máy quét v..v .Nếu ảnh
nhận được là tương tự nó phải được số hóa nhờ quá trình lấy mẫu và lượng tử hóa
trước khi phân tích, xử lý hay lưu trữ ảnh.

3


2.1.1.2 Phân tích ảnh.
Ở giai đoạn này ảnh được xử lý theo nhiều công đoạn nhỏ như: cải thiện ảnh,
khôi phục ảnh để làm nổi bật một số đặc tính chính của ảnh hay làm ảnh gần với trạng
thái gốc. Tiếp theo là phát hiện các đặc tính như biên, phân vùng, định vị trí tọa độ ảnh
trong không gian ảnh.
2.1.1.3 Hệ quyết định.
Cuối cùng tùy theo mục đích của ứng dụng, sẽ là giai đoạn nhận dạng hay các
quyết định khác. Ở đây, hệ thống xử lý ảnh đưa ra quyết định chọn đối tượng cần làm
việc trong không gian ảnh, sau đó lấy dữ liệu và làm việc với đối tượng đó
2.1.2 Thu nhận ảnh và lưu trữ ảnh.
2.1.2.1 Thu nhận ảnh.
Ảnh có thể được thu nhận qua camera ở dạng tín hiệu tương tự (loại camera ống
chuẩn CCIR) với tần số 1/25, mỗi ảnh 625 dòng hoặc ở dạng tín hiệu số (loại CCD) là
loại photodiode tạo ra cường độ ánh sáng tại mỗi điểm ảnh. Mặt khác, ảnh cũng có thể
tiếp nhận từ vệ tinh qua các bộ cảm ứng (sensor), có thể quét ảnh từ ảnh chụp bằng
máy tính quét ảnh ( scaner).
Cấu tạo Camera (Webcame).
Webcame ( Web camera) được hiểu như một thiết bị thu nhận ảnh dưới dạng tín
hiệu số cấu tạo chung như sau:
-


Ống kính(Lens): thường làm bằng vật liệu dẻo, có thể điều chỉnh tiêu cự

của camera bằng cách xoay ống kính.
-

Cảm biến hình ảnh (Image Sensor): có thể là CCD( Charge-Coupled

Device)hay là CMOS( Complementary Metal-Oxide-Semiconductor).
-

Một số thiết bị khác.

Cảm biến hình ảnh là thiết bị có khả năng chụp và số hóa hình ảnh dựa trên
nguyên lý tích điện dưới tác dụng của ánh sáng ( hình ảnh ) thu nhận được sau đó được
số hóa thông qua tín hiệu điện đã được chuyển đổi. Trên nguyên tắc làm việc chung
đó, cảm biến hình ảnh được chia làm hai loại: CCD và CMOS. Tuy nhiên hai cảm biến
này được chế tạo theo hai kỹ thuật hoàn toàn khác nhau.
4


Trong thực tế hiện nay, không ít người trong chúng ta nghĩ rằng camera CCD
có công nghệ tiên tiến hơn camera CMOS. Thực chất, điều này không hẳn đúng bởi vì
mỗi công nghệ đều có ưu nhược điểm, thế mạnh riêng tùy theo nhu cầu và ứng dụng.
Cảm biến CCD:
Thành phần cơ bản của Sensor CCD quét dòng là một hàng phân tử ảnh silic
gọi là photosites. Các photo hình ảnh cho qua một cấu trúc cổng đa tinh thể trong suốt
và được hấp thụ trong tinh thể silic, do đó tạo nên một cặp lỗ electron. Các quang điện
tử tạo ra được tập hợp vào các photosite, lượng điện tích được tập hợp trong mỗi
photosite tỷ lệ với cường độ chiếu sáng tại điểm đó. Một sensor quét dòng điển hình
gồm một hàng các phân tử ảnh photosite, hai cổng truyền được sử dụng để chốt lại nội

dung của các phần tử hình ảnh vào các thanh ghi vận chuyển và một cổng nối ra được
sử dụng để chốt nội dung của các thanh ghi vận chuyển vào bộ khuyếch đại, lối ra của
bộ khuyếch đại này là một tín hiệu điện áp tỷ lệ với các nội dung của hàng photosites.

HÌNH 2.2 Sensor quét dòng CCD
Các mảng khối ghép diện tích giống các sensor quét dòng, ngoại trừ các
photosite được sắp xếp theo dạng ma trận và có một tổ hợp thanh ghi vận chuyển cổng
giữa các cột photosite như trong hình 2-2.Nội dung của các photosite lẻ được chốt
lầnlượt vào các thanh ghi vận chuyển dọc và sau đó lại được chốt vào các thanh ghivận
5


chuyển ngang. Nội dung của các thanh ghi vận chuyển ngang này được dẫn vào bộ
khuyếch đại, lối ra của bộkhuyếch đại là một dòng lẻ hình ảnh. Thực hiện tương tự với
các photosite chẵn để hoàn thành trường thứ hai của khung.Cơcấu quét này được lặp
lại 30 lần mỗi giây.
Các camera quét dòng chỉ cho ra một dòng hình ảnh của hình ảnh lối vào.
Những thiết bị này đặc biệt phù hợp cho các ứng dụng mà các đối tượng chuyển động
qua sensor (như trong các băng truyền). Sự chuyển động của một đối tượng theo
hướng vuông góc với sensor tạo ra hình ảnh hai chiều. Các sensor quét dòng có độ
phân giải thấp 32x3, trung bình 256x256 và cao 480 phân tử ảnh và các sensor thí
nghiệm CCD có khả năng đạt được độ phân giải khoảng 1024x1024 hay cao hơn.
Ở đây, ta ký hiệu ảnh lối ra hai chiều của camera hay thiết bị cho ảnh khác là
f(x,y) trong đó x, y biểu thị toạ độ không gian (ví dụ mặt phẳng ảnh) và giá trị f tại
điểm (x,y) bất kỳ tỷ lệ với toạ độ (cường độ sáng) của hình ảnh tại điểm đó. Hình minh
hoạ một điểm ảnh và quy ước toạ độ của nó.

HÌNH 2.3 Quy ước tọa độ cho biểu diễn ảnh
Để máy tính có thể xử lý, hàm ảnh (x,y) phải được số hoá cả về không gian lẫn
biên độ (cường độ). Việc số hoá các toạ độ không gian (x,y) được coi như là việc lấy

mẫu hình ảnh, trong khi đó việc số hoá biên độ được coi là lượng tử hoá cường độ cho
những hình ảnh đơn sắc và phản ảnh bản chất của các ảnh này là biến thiên từ đen tới
trắng theo các mức xám khác nhau. Hai thuật ngữ cường độ sáng và mức xám có thể
dung hoán chuyển cho nhau.
6


Giả sử một hình ảnh liên tục được lấy mẫu đồng nhất cho một mảng N hàng và
M cột, ở đây mỗi mẫu cũng được lượng tử hoá về biên độ. Mảng này được gọi là ảnh
số, có thể được viết như sau:
[f(0,0)f(0,1)………………………f(0,M-1)]
F(x,y) =

f(1,0)f(1,1)……………………….f(1,M-1)
…………………………………
f(N-1,0)f(N-1,1)………………f(N-1,M-1)

Ở đây các biến rời rạc:x=0, 1, 2 …, N-1 và y= 0, 1, 2, …, M-1
Mỗi phần tử trong mảng được gọi là một phần tử ảnh hay pixel. Từ mảng ta
thấy pixel tại gốc của ảnh được biểu thị là f(0,0), pixel bên phải là f(0,1), v.v. Thông
thường N, M và số mức cường độ rời rạc của mỗi pixel đã lượng tử hoá là luỹ thừa
nguyên của 2.
Cảm biến CMOS:cũng giống như cảm biến CCD, CMOS cũng hấp thụ
ánh sáng thông qua mảng diode quang. Tuy nhiên,bên trong mỗi pixel diode này được
tích hợp một mạch khuếch đại, lọc nhiễu,và mạch số hóa để có thể tự động dò tìm
photon ánh sáng hấp thụ đượcchuyển đổi thành điện áp và trực tiếp truyền tín hiệu đến
ngõ ra. Vì thế tín hiệu điện ở ngõ ra là tín hiệu ở dạng số.
2.1.2.2 Lưu trữ ảnh.
Ảnh trên máy tính là kết quả thu nhận theo các phương pháp số hoá được nhúng
trong các thiết bịkỹ thuật khác nhau.Quá trình lưu trữ ảnh nhằm 2 mục đích:

• Tiết kiệm bộ nhớ.
• Giảm thời gian xử lý.
Việc lưu trữ thông tin trong bộ nhớ có ảnh hưởng rất lớn đến việc hiển thị, in ấn
và xử lý ảnh được xem như là 1 tập hợp các điểm với cùng kích thước nếu sử dụng
càng nhiều điểm ảnh thì bức ảnh càng đẹp, càng mịn và càng thể hiện rõ hơn chi tiết
của ảnh, người ta gọi đặc điểm này là độ phân giải.
Để lưu trữ ảnh trên máy tính, một số định dạng ảnh sau như IMG, PCX, TIFF,
GIF.
Định dạng ảnh IMG dùng cho ảnh đen trắng. Phần đầu của ảnh IMG có
16 byte chứa các thông tin:
7


-

6 byte đầu: dùng để đánh dấu định dạng ảnh IMG.

-

2 byte tiếp theo: chứa độ dài mẫu tin. Đó là độ dài của dãy các byte kề

liền nhau mà dãy này sẽ được lặp lại một số lần nào đó. Số lần lặp lại này sẽ được lưu
trong byte đếm. Nhiều dãy giống nhau được lưu trong một byte. Đây là một cách lưu
trữ hình ảnh dưới dạng nén.
-

4 byte tiếp theo: mô tả kích cỡ pixel .

-


2 byte tiếp theo: cho biết số pixel trên một dòng ảnh .

-

2 byte cuối: cho biết số dòng ảnh trong ảnh.
Định dạng ảnh PCX là một trong những định dạng ảnh cổ điển nhất.

Định dạng này sử dụng phương pháp mã loại dài RLE (Run-Length-Encoded) để nén
dữ liệu ảnh. Quá trình nén và giải nén được thực hiện trên từng dòng ảnh. Tệp PCX
gồm 3 phần :đầu tệp(header), dữ liệu ảnh (image data), và bảng màu mở rộng.
Định dạng ảnh TIFF được thiết kế để làm nhẹ bớt các vấn đề liên quan
đến việc mở rộng tệp ảnh cố định. Định dạng này cũng gồm 3 phần: IFH, IFD, DE.
Định dạng ảnh GIF (Graphics Interchange Format). Định dạng này được
đưa ra để khắc phục những vấn đề mà các định dạng ảnh khác gặp phải khi số màu
trong ảnh tăng lên.
2.1.3 Phân tích ảnh.
2.1.3.1 Khái niệm pixel và pixel lân cận.
Pixel là phân tử nhỏ nhất cấu tạo nên hình ảnh. Mỗi pixel có một toạ độ (x,y) và
màu xác định.
P1

P2

P3

(x-1, y-1)

(x-1, y)

(x-1, y+1)


P4

P

P5

(x, y-1)

(x, y)

(x, y+1)

P6

P7

P8

(x+1, y-1)

(x+1, y)

(x+1, y+1)

8


HÌNH 2-4 Pixel P và các lân cận của P
Một pixel P tại các toạ độ (x, y) có ô pixel lân cận theo chiều dọc và chiều

ngang, và toạ độ tương ứng của các pixel này, như hình trên là:
P2(x-1, y)

P7(x+1, y)

P6(x+1, y-1) .

P5(x, y+1)

Tập các pixel này gọi là lân cận của P và ký hiệu là N4(p). Mỗi pixel lân cận
cách (x, y) một đơn vị và nếu (x, y) ở mép của màn hình thì sẽ có một số pixel lân cận
của p nằm ở ngoài hình ảnh. Ngoài 4 pixel lân cận của P theo chiều dọc và chiều
ngang, xung quanh P còn có 4 pixel chéo góc có các toạ độ tương ứng là:
P1(x-1, y-1)

P3(x-1, y+1)

P6(x+1, y-1)

P8(x+1, y+1)

Tập các pixel này được ký hiệu là ND(p).Bốn pixel này cùng với 4 pixel ởtrên
tạo thành 8 pixel lân cận của p và được ký hiệu là N8 (p).Tập hợp này cũng sẽ có một
số pixel ở bên ngoài hình ảnh nếu (x, y) nằm ở mép của hình ảnh.
2.1.3.2 Mộtsố không gian màu.
 Không gian màu RGB (Red, Green, Bule).
Màu đỏ, lục – xanh lá cây, lam – xanh da trời (RGB) được sử dụng phổ biến
nhất.Những màu gốc RGB được thêm vào những màu gốc khác điều đó tạo nên sự
đóng góp riêng của từng màu gốc được thêm cùng nhau để mang lại kết quả. Tập hợp
màu nhỏ thành phần sắp xếp theo khối lập phương đơn vị. Đường chéo chính của khối

lập phương với sự cân bằng về số lượng từng màu gốc tương ứng với các mức độ xám
với đen là (0,0,0) và trắng (1,1,1).

9


Blue(0,255)
(0, 0, 1)

(0,0,0)

(0,1,0)

(1,0,0)

green

Red

HÌNH 2.5 Mô hình màu RGB
 Mô hình màu CMY (Cyan, Magenta, Yellow)
Là phần bù tương ứng cho các màu đỏ, lục, lam và cũng được sử dụng như
những bộ lọc loại trừ các màu này từ ánh sáng trắng. Vì vậy CMY còn được gọi là các
phần bù loại trừ của màu gốc. Tập hợp màu thành phần biểu diễn trong hệ tọa độ Đềcác cho mô hình màu CMY cũng giống như cho mô hình màu RGB ngoại trừ màu
trắng (ánh sáng trắng), được thay thế màu đen (không có ánh sáng) ở tại nguồn sáng.
Các màu thường được tạo thành bằng cách loại bỏ hoặc được bù từ ánh sáng trắng hơn
là được thêm vào những màu tối.
Green

Cyan


Yellow

Red

Black

Blue

Magent
a

HÌNH 2.6 Các màu gốc bù và sự pha trộn giữa chúng

10


Khi bề mặt được bao phủ bởi lớp mực màu xanh tím, sẽ không có tia màu đỏ
phản chiếu từ bề mặt đó. Màu xanh tím đã loại bỏ phần màu đỏ phản xạ khi có tia sáng
trắng, mà bản chất là tổng của 3 màu đỏ, lục, lam. Vì thế ta có thể coi màu Cyan là
màu trắng trừ đi màu đỏ và đó cũng là màu lam cộng màu lục. Tương tự như vậy ta có
màu đỏ thẫm (Magenta) hấp thụ màu lục, vì thế nó tương đương với màu đỏ cộng màu
lam. Và cuối cùng màu vàng (Yellow) hấp thụ màu lam, nó sẽ bằng màu đỏ cộng với
lục.
Khi bề mặt của thực thể được bao phủ bởi xanh tím và vàng, chúng sẽ hấp thụ
hết các phần màu đỏ và xanh lam của bề mặt. Khi đó chỉ tồn tại duy nhất màu lục bị
phản xạ từ sự chiếu sáng của ánh sáng trắng. Trong trường hợp khi bề mặt được bao
phủ bởi cả 3 màu xanh tím, vàng, đỏ thẫm, hiện tượng hấp thụ xảy ra trên cả 3 màu đỏ,
lục và lam. Do đó, màu đen sẽ là màu của bề mặt. Những mối liên hệ này có thể được
miêu tả bởi:


C

1

R

M

1

G

Y

1

B

HÌNH 2.7 Sự biến đổi từ RGB thành CMY
 Mô hình màu HSV (Hue, Saturation, Value).
Các mô hình màu RGB, CMY được định hướng cho phần cứng trái ngược với
mô hình màu HSV của Smith hay còn được gọi là mẫu HSB với B là Brightness (độ
sáng), được định hướng người sử dụng dựa trên cơ sở nền tảng về trực giác về tông
màu, sắc độ và sắc thái mỹ thuật.
Hệ thống tọa độ có dạng hình trụ và tập màu thành phần của không gian bên
trong mô hình màu được xác định là hình nón hoặc hình chóp sáu cạnh như trong hình.
Đỉnh hình chóp là sáu cạnh khi V= 1 chứa đựng mối quan hệ giữa các màu sáng và
những màu trên mặt phẳng với V= 1 đều có màu sáng.


11


HÌNH 2.8 Mô hình màu HSV
Sắc màu (Hue) hoặc H được đo bởi góc quanh trục đứng với màu đỏ là 0 o , màu
lục là 120 o, màu lam là 240 o (xem hình). Các màu bổ sung trong hình chóp HSV ở
180 o đối diện với màu khác. Giá trị của S là một tập các giá trị đi từ 0 trên đường trục
tâm (trục V) đến 1 trên các mặt bên tại đỉnh của hình chóp sáu cạnh. Sự bão hòa được
đo tương đối cho gam màu tương ứng với mô hình màu này.
Mô hình màu dạng hình chóp sáu cạnh này đường cao V với đỉnh là điểm gốc tọa
độ (0,0). Điểm ở đỉnh là màu đen có giá trị tọa độ màu V= 0, tại các điểm này giá trị
của H và S là không liên quan với nhau. Khi điểm có S= 0 và V= 1 là điểm màu trắng,
những giá trị trung gian của V đối với S= 0 (trên đường thẳng qua tâm) là các màu
xám. Khi S= 0 giá trị của H phụ thuộc được gọi bởi các quy ước không xác định,
ngược lại khi S khác 0 giá trị của H sẽ là phụ thuộc.
Như vậy một màu nào đó V= 1, S= 1 là giốg như màu thuần khiết trong mỹ
thuật được sử dụng như điểm khởi đầu trong các màu pha trên. Thêm màu trắng phù
hợp để giảm S (không có sự thay đổi V) tạo nên sự thay đổi sắc thái của gam màu. Sự
chuyển màu được tạo ra bởi việc giữ S= 1 và giảm V tạo nên sự thay đổi về sắc độ và
tông màu tạo thành bởi việc thay đổi cả hai S và V.
 Mô hình màu HLS
Mô hình màu HLS được xác định bởi tập hợp hình chóp sáu cạnh đôi của không
gian hình trụ.Sắc màu là góc quanh trục đứng cảu hình chóp sáu cạnh đôi với màu đỏ
tại góc 0 o. Các màu sẽ xác định theo thứ tự giống như trong biểu đồ CIE khi ranh giới
12


của nó bị xoay ngược chiều kim đồng hồ: Màu đỏ, màu vàng, màu lục, màu xanh tím,
màu lam và đỏ thẫm. Điều này cũng giống như thứ tự sắc xếp trong mẫu hình chóp sáu
cạnh đơn HSV.


HÌNH 2.9 Mô hình màu HLS
Chúng ta có thể xem mẫu HLS như một sự biến dạng cầu mẫu HSV mà trong
đó mẫu này màu trắng được kéo hướng lên hình chóp sáu cạnh phía trên từ mặt V= 1.
Như với mẫu hình chóp sáu cạnh đơn, phần bổ sung của một màu sắc được đặt ở vị trí
180 o hơn là xunh quanh hình chóp sáu cạnh đôi, sự bão hòa được đo xung quanh trục
đứng, từ 0 trên trục tới 1 trên bề mặt. Độ sáng bằng không cho màu đen và bằng một
cho màu trắng.
2.1.3.3 Một số công cụ trợ giúp xử lý ảnh.
 Kỹ thuật lọc số.
Chất lượng hình ảnh kém do rất nhiều nguyên nhân như do nhiễm điện tử của
máy thu hay chất lượng bộ số hóa kém. Nhiễu ảnh số được xem như là sự dịch chuyển
nhanh của tín hiệu thu nhận trên một khoảng cách ngắn. Về mặt tần số, nhiễu ứng với
các thành phần tần số cao trong ảnh.Như vậy, để xử lý nhiễu ta có thể lọc các thành
phần tần số cao. Việc lọc dựa vào tính dư thừa thông tin không gian các pixel lân cận
có thể có cùng hoặc gần cùng một số đặc tính. Kỹ thuật lọc này dùng một mặt nạ và di
chuyển khắp ảnh gốc. Tùy theo cách tổ hợp điểm đang xét với các điểm lân cận mà ta
có kỹ thuật lọc tuyến tính hay kỹ thuật lọc phi tuyến. Điểm ảnhchịu tác động của biến
13


đổi là điểm ở tâm của mặt nạ. Các kỹ thuật lọc này được trình bày kỹ trong phần làm
trơn ảnh.
 Biến đổi Fourier.
Khái niệm và công thức.
Biến đổi Fourier cho một tín hiệu có thể biểu diễn như sau:

Biến đổi Fourier thuận cho tín hiệu một chiều gồm một cặp biến đổi :
-Biến đổi Fourier thuận: chuyển sự biểu diễn từ không gian thực sang không
gian tần số (phổ và pha) .Các thành phần tần số n ày đ ược gọi là các biểu diễn trong

không gian Fourier của tín hiệu.
- Biến đổi Fourier ngược: Chuyển đổi sự biểu diễn của đối tượng từ không
gian Fourier sang không gian thực.
Không gian một chiều.
Cho một hàm f(x) liên tục. Biến đổi Fourier của f(x), ký hiệu F(u) , u biểu diễn
tần số không gian, được định nghĩa là:

F(u) =
Trong đó:
f(x) : biểu diễn biên độ tín hiệu.
: biểu diễn pha.
Biến đổi Fourier ngược của F(u) cho f(x) được định nghĩa như sau:

Không gian hai chiều.
14


Cho f(x,y) là hàm biểu diễn ảnh liên tục trong không gian hai chiều, cặp biến
đổi Fourier được định nghĩa như sau:
-Biến đổi Fourier thuận:

u,v biểu diễn tần số không gian
-Biến đổi Fourier ngược

2.1.3.4 Tiền xử lý ảnh.
 Phương pháp tiền xử lý trong miền không gian.
Thuật ngữ miền không gian ở đây muốn nói đến số lượng pixel tạo nên một
hình ảnh.Các phương pháp tiền xử lý trong miền không gian là các thủ tục tác động
trực tiếp lên các pixel tạo lên hình ảnh đó. Các hàm tiền xử lý trong miền không gian
được viết như sau:

g(x,y) =h[f(x.y)]
Ở đây f(x,y) là hàm điểm ảnh chưa được xử lý.
g(x,y) là hàm điểm ảnh đã được xử lý.
Trong đó,h là toán tử áp lên f. Dạng đơn giản nhất của h là lân cận có kích
thước1x1, khi đó g chỉ phụ thuộc vào giá trị của f tại (x,y) và h trở thành hàm ánh xạ
cường độ sáng điểm ảnh.
Một trong những kỹ thuật được sử dụng rộng rãi nhất là sử dụng mặt nạ nhân
chập. Trên hình minh hoạ một mặt nạ là một mảng 2 chiều có kích thước 3x3, các hệ
số của mặt nạ được chọn để phát hiện một thuộc tính cho trước trong một hình ảnh.

15


×