Tải bản đầy đủ (.doc) (64 trang)

Thiết kế và chế tạo mô hình nhận dạng các vật thể có hình dạng khác nhau sử dụng công nghệ xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.66 MB, 64 trang )

Chương 1
MỞ ĐẦU

1.1 Đặt vấn đề
Trong những năm gần đây với sự phát triển của nền khoa học kỹ thuật hiện đại đã
ứng dụng nhiều thành tựu mới vào các qui trình sản xuất công nghiệp để nâng cao
năng suất hay tránh lỗi sai sót theo một điều kiện tiêu chuẩn nào đó. Với lại các giai
đoạn của qui trình sản xuất hiện nay vẫn bị hạn chế vẫn phụ thuộc vào sức người là
chính nên năng suất lao động thấp và sản phẩm bị lỗi nhiều khi đưa ra thị trường tiêu
thụ. Một trong những ứng dụng nhằm hạn chế những nhược điểm đó là công nghệ sử
lý ảnh vào các công đoạn: kiểm tra, xử lý, phân loại, hay nhận dạng các vật thể xem
đạt yệu cầu chưa.
Trong xu thế phát triển công nghệ thông tin mạnh mẽ, cùng với xu thế phát triển
các hệ thống hoạt động trên cơ sở nhận dạng và xử lý ảnh. Ảnh ở đây nhiều thông tin
về màu sắc, hình dáng, kích thước…Với công cụ xử lý ảnh cho chúng ta các khả năng
nhận biết chính xác các sự vật dựa trên các đặt tính bên ngoài của vật.
Cũng chính vì lý do đó và sự gởi ý, giúp đỡ của cô ThS.Nguyễn Lê Tường và anh
Huỳnh Cao Vân chúng em đã tìm hiểu nghiên cứu và chọn đề tài “Thiết kế và chế
tạo mô hình nhận dạng các vật thể có hình dạng khác nhau sử dụng công nghệ xử
lý ảnh” với mong muốn thông qua đề tài này sẽ bổ sung thêm những kiến thức mới
cũng như phục vụ cho các hoạt động sản xuất hiệu quả hơn.
1


1.2 Ý nghĩa thực tiễn
Mảng xử lý ảnh không còn mới trên thế giới và ở Việt Nam vì nó đang được phát
triển rất mạnh mẽ trong giảng dạy và trong công nghiệp.
Đồ án này nhằm tiến thêm một bước trong công nghệ xử lý ảnh mà các khóa trước
đã hình thành, khi đồ án này hoàn thành thì sẽ góp phần đáng kể trong việc nghiên cứu
sâu hơn về mảng xử lý ảnh để giúp cho các khóa sau có cơ sở nghiên cứu, hoàn thiện
các công cụ xử lý và tiến tới ứng dụng trong thực tế sản xuất.


Còn với thực tế sản xuất, đồ án khi được hoàn thiện hơn sẽ giúp giải quyết bài toán
phân loại sản phẩm theo hình dạng. So với các sản phẩm phân loại tương tự thì phần
mềm này có thể rẻ hơn và đó là lợi thế của phần mềm so với các sản phẩm khác.

1.3 Mục đích nghiên cứu

Mục đích của đề tài nhằm thiết kế và chế tạo mô hình nhận dạng các khối vật thể
khác nhau từ Webcam .Từ đó đề tài có thể dùng để tham khảo tài liệu, bổ sung kiến
thức cho các ngành học liên quan, giải quyết các tình huống thật trong sản xuất và ứng
dụng nhiều vào các nghành nghề khác: nhận dạng mã vạch,vân tay, khuôn mặt….
Tạo được phần mềm xử lý ảnh có các chức năng tương đồng với bộ Blod Tools
của phần mềm Spectation: là một công cụ xử lý ảnh có nhiều chức nãng đặc biệt trong
qui trình kiểm tra sản phẩm của hãng Siemem.
1.4 Giơí hạn đề tài

Mô hình chưa được tự động.
Nhận dạng và phân loại vật dựa vào kích thước.
Tốc độ xử lý của Webcam chậm .

2


Chương 2
TỔNG QUAN

2.1 Tổng quan về nhận dạng vật thể
Trong các dây truyền sản xuất để tạo ra sản phẩm hoàn thiện, đúng theo yêu
cầu hay đat một tiêu chuẩn nào đó nhưng sản phẩm vẫn còn bị lỗi khi đưa ra thị trường
tiêu thụ hay các bước kiểm tra an ninh: nhận dạng khuôn mặt, vân tay, các loại thẻ hay
mã vạch ở các sân bay, khách sạn, ngân hàng hoặc các khu vực công cộng vẫn còn bị

hạn chế và cũng chính do các vật thể có hình dạng, kích thước, màu sắc khác nhau (ví
dụ: hình tròn, hình vuông, hình tam giác…) mà chính do con người quan sát, thực hiện
dễ gây sai sót, hạn chế, nhầm lẫn khó phân biệt bằng mắt thường.
Để khắc phục những sai sót và hạn chế đó con người đã tìm ra các phương pháp
kiểm tra, nhận định, giám sát với các kỹ thuật hiện đại đó là công nghệ xử lý ảnh có
thể dùng Webcam hay Camera …thay thế cho mắt người với năng suất và hiệu quả
cao hơn nhiều .
2.2 Tổng quan và ứng dụng về xử lý ảnh
2.2.1 Xử lý ảnh là gì?
Xử lý ảnh là một ngành khoa học còn tương đối mới mẻ so với nhiều ngành
khoa học khác. Hiện nay nó đang là một trong những lĩnh lực được quan tâm và
đã trở thành môn học chuyên ngành trong các trường đại học. Nhờ có công nghệ
số hoá hiện đại, ngày nay con người đã có thể xử lý tín hiệu nhiều chiều thông qua
nhiều hệ thống khác nhau, từ những mạch số đơn giản cho đến những máy tính
song song cao cấp. Mục tiêu của xử lý này có thể chia làm ba hướng như sau:
3


 Xử lý ảnh ban đầu để có được ảnh mới theo một yêu cầu xác định (ví dụ như
ảnh mờ cần xử lý để được ảnh rõ hơn)
 Phân tích ảnh để thu được các thông tin đặc trưng giúp cho việc phân loại,
nhận biết ảnh (ví dụ phân tích ảnh vân tay để trích chọn các đặc trưng vân tay)
 Hiểu ảnh đầu vào để có những mô tả về ảnh ở mức cao hơn, sâu hơn (ví dụ từ
ảnh một tai nạn giao thông phác họa hiện trường tai nạn).
Xử lý ảnh là một trong những mảng quan trọng nhất trong kỹ thuật thị giác máy
tính, là tiền đề cho nhiều nghiên cứu thuộc lĩnh vực này. Hai nhiệm vụ cơ bản của quá
trình xử lý ảnh là nâng cao chất lượng thông tin hình ảnh và xử lý số liệu cung cấp cho
các quá trình khác trong đó có việc ứng dụng thị giác vào điều khiển.
Thị giác máy (Machine vision) là một ứng dụng của thị giác máy tính vào trong
cộng nghiệp và trong sản xuất. Nhưng ngược lại, thị giác máy tính (Computer vision)

là qui tắc chung để máy tính có thể nhìn được, thị giác máy là một qui tắc kỹ thuật,
liên quan tới các thiết bị số vào/ra và mạng máy tính để điều khiển thiết bị sản xuất
khác chẳng hạn như cánh tay robot. Thị giác máy là trường phụ kỹ thuật mà có liên
quan tới khoa học máy tính, quang học, kỹ thuật chế tạo máy, và tự động hóa công
nghiệp. Một trong các ứng dụng của thị giác máy là kiểm tra các sản phẩm tốt như
chíp bán dẫn, ô tô, thực phẩm và dược phẩm. Cũng như các người làm việc kiểm tra
trên các dây chuyền sản xuất, sử dụng thị giác để kiểm tra chất lượng của sản phẩm có
tốt hay không, việc này cần ở người kiểm tra về kinh nghiệm và kỹ năng, nhưng với hệ
thống thị giác máy thì chỉ cần sử dụng máy ảnh số, máy ảnh thông minh và phần mềm
xử lý ảnh để thực hiện việc kiểm tra tương tự.
Quá trình xử lý ảnh có thể xem như là quá trình thao tác ảnh đầu vào nhằm cho ra
kết quả mong muốn. Kết quả đầu ra của một quá trình xử lý ảnh có thể là một ảnh “tốt
hơn” hoặc một kết luận :
Ảnh
“Tốt
XỬ LÝ ẢNH
Ảnh
hơn”
Tóm lại xử lý ảnh là quá trình chụp ảnh, phân tích nhận
dạng ảnh và đưa ra các tín
Kết luận
hiệu điều khiển hợp lý. Thiết bị thu nhận (chụp ảnh) có thể là Scanner, camera,
4


webcam,….Thực chất quá trình phân tích và nhận dạng ảnh bao gồm nhiều công đoạn
nhỏ có thể hình hình dung quá trình xử lý ảnh thông qua sơ đồ khối sau :

Hệ quyết định



Thu nhận ảnh
(Scanner,
Camera,Sensor)

Trích chọn
Tiền xử lý

Hậu
xử lý

đặc điểm

Đối sánh rút
ra kết luận

Lưu trữ

Hình 2.1: Sơ đồ khối của quá trình xử lý ảnh
2.2.2 Ứng dụng xử lý ảnh
a) Trong nước:
Ứng dụng xử lý ảnh ở nước ta chưa nhiều cũng như chưa có thống kê chính thức
nào. Tuy nhiên có thể kể ra một số ứng dụng xử lý ảnh tiêu biểu như:
- Camera đo diện tích tấm da trong sản xuất đồ da.
- Giám sát và điều khiển tín hiệu giao thông bằng camera thời gian thực.
- Ứng dụng xử lý ảnh kết hợp với mạng neural trong nhận dạng chữ viết.
- Robot xử lý ảnh trong cuộc thi robocon 2007.
- Robot đánh bóng bàn TOPIO của công Tosy Việt Nam.
- Dây chuyền tự động nhận dạng, phân lọai gạch ốp lát granite của viện nghiên
cứu kĩ thuật quân sự.


5


Hình 2.2: Robot đánh bóng bàn TOPIO

Nhóm tác giả ở Viện tự động hóa Kỹ thuật quân sự (Bộ Quốc phòng) đã thực hiện
thành công đề tài "Nghiên cứu thiết kế, chế tạo hệ thống tự động hóa nhận dạng và
phân loại sản phẩm công nghiệp".
Với ứng dụng công nghệ nhận dạng, xử lý ảnh và trí tuệ nhân tạo trên cơ sở hệ
thống thu thập thông tin ảnh chất lượng cao sẽ bảo đảm tốc độ và độ chính xác nhận
dạng phân loại sản phẩm đạt tiêu chuẩn cao hơn hẳn bằng mắt thường hoặc các
phương pháp thủ công khác.
Hệ thống có tính linh hoạt và thích nghi cao vì có thể áp dụng trong nhiều dây
chuyền công nghiệp sản xuất hàng loạt sản phẩm có tiêu chuẩn phân loại cần áp dụng
công nghệ nhận dạng và xử lý ảnh. Tính thích nghi của hệ thống tạo các khả năng ứng
dụng cho nhiều loại sản phẩm khi cần thiết bằng sự thay đổi mềm dẻo các đặc trưng
của mẫu sản phẩm.

6


b) Ngoài nước:
Thế giới đã phát triển và ứng dụng xử lý ảnh từ những năm 1960. Khởi đầu từ
nghiên cứu của các phòng thí nghiệm Jet Propulsion, MIT, Bell Labs, và đại học
Maryland. Ban đầu được ứng dụng để phân tích ảnh từ vệ tinh. Ngày nay có rất
nhiều ứng dụng dân dụng liên quan đến công nghệ xử lý ảnh như:
- Kiểm tra lỗi ổ cứng trong nhà máy sản xuất ổ cứng.
- Robot Asimo của công ty Honda Nhật.
- Ứng dụng chụp cắt lớp trong y học, phân tích bệnh lý qua ảnh X-quang.

- Nhận dạng vân tay, nhận dạng ký tự.
- Hay đơn giản là tăng cường, phục hồi chất lượng ảnh chụp.

Hình 2.3: Robot SWAT
Trên đây là một mẫu robot được ứng dụng cho đội SWAT của Mỹ có thể
giám sát, tuần tra, phân phát vũ khí/thức ăn, tìm và phá huỷ bom.

7


2.3 Sơ lược về phần mềm xử lý ảnh của Siemen
Trong thời gian gần đây xử lý ảnh công nghiệp có những bước phát triễn tương
đối lớn, các hãng chuyên về xử lý ảnh đã không ngừng đưa ra các sản phẩm để đáp
ứng nhu cầu của khách hàng. Các công cụ ngày càng hiện đại, với tốc độ xử lý cao,
nhiều công cụ xử lý và có khả năng kết nối với các thiết bị công nghiệp khác.
Trong mảng xử lý ảnh công nghiệp không thể không nhắc tới phần mềm xử lý
ảnh tốt nhất là Spectation của Siemen.
2.3.1 Spectation
Specatation là phần mềm xử lý ảnh của Siemen với rất nhiều tính năng đặc biệt,
hãng đã tìm hiểu và đáp cứng nhu cầu của khách hàng để phát triễn bộ công cụ xử lý
ảnh phù hợp gần như toàn bộ các trường hợp trong sản xuất cần kiểm phẩm.

Hình 2 4: Giao diện của phần mềm Spectation
8


Khi xử dụng phần mềm này thì kèm theo đó là một camera công nghiệp với tốc
độ xử lý cao, bên cạnh đó camera có thể sử dụng Ethernet và giao thức kết nối TCP/IP
và UDP/IP để giao tiếp với máy tính cho nên tốc độ truyền dữ liệu rất cao và khoảng
cách rất xa.


Hình 2.5: Camera VS724 của Siemen
2.3.2

Công cụ blob của Spectation

Blob trong Spectation được định nghĩa như miền kết nối điểm ảnh có mật độ
đồng dạng. Thanh công cụ được thiết kế để tìm, tính toán (đếm), đánh dấu Blob.
Thanh công công cụ Blob bao gồm hai Softsensor: chương trình tạo Blob (Blob
Generator) và bộ chọn Blob (Blob selector).
Chương trình tạo blob phân tích ảnh và tách blob dựa trên lựa chọn của người
dùng (mức ngưỡng và loại blob để định vị trí). Một blob được định vị trí, phương án
xử lý ảnh (ăn mòn, mở rộng, ẩn hay mở) có thể dùng để loại trừ nhiễu trong ảnh.
Softsensor này có sự đánhdấu ảnh đặc thù. Màu xanh phù hợp cho nền. Màu xám
phù hợp cho blob đang được đếm. Mầu đỏ phù hợp với đường bao của blob ,hay blob
tiếp xúc với biên của Softsensor.
Bộ chọn blob được dùng để tách blob được tạo bởi chương trình tạo blob. Phần
chính sử dụng phần mềm này là hỗ trợ người dùng tìm blob mà phần mềm ứng dụng
yêu cầu bởi tính toán hệ số thông số blob. Mục đích chung là đánh dấu bộ phận quay
và dịch chuyển, một blob đặt biệt phải được cô lập và vị trí của nó được tính toán. Khi
9


nó đã làm, Softsensor khác có thể tham chiếu bộ chọn blob cho mốc qui chiếu vị trí.
Nếu mục đích chung đơn giản để tính blob hay xác định lại hình dạng/ kích thước
đúng của chúng, Soflsensor này có thể làm tự động hóa. Phần mềm này không được
đưa ra, đơn giản nó tham chiếu cho chương trình tạo blob và sử dụng trong miền được
định giới bởi đường biên của nó. Như vậy hệ quả là, nó không cài đặt ngưỡng giới
hạn, đơn giản là nó đưa ra blob từ chương trình tạo blob và thực hiện tính toán dựa
trên chúng. Thông số mà Spectation đưa ra cho mỗi blob là: vị trí, kích thước biên, độ

lệch tâm, độ khích, chu vi, cường độ sáng, diện tích, và bán kính. Người sử dụng có
thể tính toán một vài hay tất cả thông số này để hỗ trợ sự khác biệt giữa các blob mong
muốn và blob khác trong ảnh.
Việc đánh dấu của Softsensor này khác với chương trình tạo blob. Nền là màu
đen, và blob là chỗ nổi bật trong màu trắng. Blob loại bỏ thì trình màu sắc tối hơn.
Người dùng phải thiết lập thông số Softsensor để lựa chọn một blob khi làm việc với
vị trí tham chiếu.

Hình 2.6: Hình phân loại sản phẩm dựa vào vị trí của Spectation

Hình trên trình bày chỉ một blob đang được chọn và sử dụng đối với mốc tham
chiếu vị trí (chỗ nổi bật trong màu trắng). Ảnh trình bày việc đánh dấu sự định hướng
của chi tiết, đánh dấu tâm của nó. Điểm mốc này bao gồm đường màu xanh bắt đầu từ
điểm màu đỏ (điểm tâm blob).

10


Hình 2.7: Hình phân loại sản phẩm dựa vào độ tròn của Spectation
Ảnh cuối cùng trính bày việc đánh dấu cho trương hợp khi 1 viền tròn hỏng. Viền
tròn hỏng bị loại vì Softsensor chỉ tìm 3 viền tròn. Trong trương hợp này Softsensor bị
ngừng chạy dựa trên đếm blob. Chú ý trong trường hợp này, vì không có mốc tham
chiếu vị trí đang được dùng, Softsensor không đánh dấu tâm và phương của blob.
2.4 Giới thiệu một số phần mềm xử lý ảnh khác:

2.4.1 Image Analyze
Image Analyzer là một trình chỉnh sửa hình ảnh nâng cao và được tích hợp
phần mềm phân tích hình ảnh nhưng lại có dung lượng rất nhỏ . Chương trình
này có tính năng xử lý hình ảnh thông thường như điều chỉnh độ sáng, màu sắc,
loại bỏ mắt đỏ, phóng to, thu nhỏ, cắt và xoay ảnh... cùng với một số tính năng

chỉnh sửa hình ảnh nâng cao.

11


2.4.2 Paint Star :
PaintStar là chương trình xử lý hình ảnh kỹ thuật số đa năng với các công cụ
chỉnh sửa và thiết kế hình ảnh, chụp màn hình, và hiển thị hình ảnh thu nhỏ hình ảnh
trong menu của Windows Explorer. Phần mềm này cũng hỗ trợ làm việc với các
layers, tích hợp các công cụ chỉnh sửa ảnh phổ biến nhất. Ngoài ra, PaintStar còn có
bộ lọc ảnh khá tốt

.

Ngoài ra còn có một số phần mềm như: PhotoPlus, PhotoScape,
Phantasmagoria…nhưng đa phần ít ứng dụng trong công nghiệp.

12


Chương 3
NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU

3.1

Chương trình xử lý ảnh

3.1.1 Nhiệm vụ của chương trình
Chương trình có nhiệm vụ đọc ảnh được truyền về từ webcam xử lý, tính toán,
phân tích các đặc trưng của các khối bên trong ảnh, so sánh với các thông số yêu cầu

đặc ra nhằm rút ra kết luận khối đúng hay sai.
3.2

Một số khái niệm cơ bản trong xử lý ảnh
3.2.1 Ảnh và điểm ảnh:
Điểm ảnh: được xem như là dấu hiệu hay cường độ sáng tại một tọa độ

trong không gian của đối tượng .
Ảnh: là một tập hợp hữu hạn các điểm ảnh kề nhau. Ảnh thường được
biểu diễn bằng một ma trận hai chiều, mỗi phần tử của ma trận tương ứng với một
điểm ảnh.
Phân loại ảnh
 Ảnh nhị phân (đen trắng): là ảnh có giá trị mức xám của các điểm ảnh được
biểu diễn bằng 1 bit (giá trị 0 hoặc 1).
Ví dụ về biểu diễn ảnh nhị phân:

0

1

1

0

1

1

1


0

0

0

1

1

0

1

1

1

13


 Ảnh xám: giá trị mức xám của các điểm ảnh được biểu diễn bằng 8 bit (giá trị
từ 0 đến 255).
Ví dụ về biểu diễn ảnh xám:
0

5

12


0

15

94

21

0

thường, ảnh màu được tạo

nên từ 3 ảnh xám đối

0

0

156

9

với màu nền đỏ (RED),

xanh

0

11


245

12

(GREEN),

 Ảnh

màu:


thông
cây

xanh

lam

(BLUE). Tất cả các màu trong tự nhiêu đều có thể được tổng hợp từ 3 thành
phần màu trên theo các tỷ lệ khác nhau.
 Một số định dạng ảnh hiện nay:
Ảnh BMP (Bitmap)
Là ảnh được mô tả bởi một ma trận các giá trị số xác định màu và bảng màu
của các điểm ảnh tương ứng khi hiển thị. Ưu điểm của ảnh Bitmap là tốc độ vẽ và
tốc độ xử lý nhanh. Nhược điểm của nó là kích thước rất lớn.
Ảnh JPEG (Joint Photographic Experts Group)
Đây là một định dạng ảnh được hỗ trợ bởi nhiều trình duyệt web. Ảnh JPEG
được phát triển để nén dung lượng và lưu trữ ảnh chụp, và được sử dụng tốt nhất
cho đồ họa có nhiều màu sắc, ví dụ như là ảnh chụp được scan. File Ảnh JPEG là
ảnh Bitmap đã được nén lại.

Ảnh GIF (Graphics Interchange Format)
Ảnh GIF được phát triển dành cho những ảnh có tính chất thay đổi. Nó được
sử dụng tốt nhất cho đồ họa có ít màu, ví dụ như là ảnh hoạt hình hoặc là những
bức vẽ với nhiều đường thẳng. File ảnh GIF là những ảnh Bitmap được nén lại.
Có hai sự khác nhau cơ bản giữa ảnh GIF và ảnh JPEG:
+ Ảnh GIF nén lại theo cách giữ nguyên toàn bộ dữ liệu ảnh trong khi ảnh JPEG
nén lại nhưng làm mất một số dữ liệu trong ảnh.
+ Ảnh GIF bị giới hạn bởi số màu nhiều nhất là 256 trong khi ảnh JPEG không
giới hạn số màu mà chúng sử dụng.
Ảnh WMF (Windows Metafiles)
Là một tập hợp các lệnh GDI dùng để mô tả ảnh và nội dung ảnh. Có hai ưu
điểm khi sử dụng ảnh WMF: kích thước file WMF nhỏ và ít phụ thuộc vào thiết
bị hiển thị hơn so với ảnh Bitmap.
3.2.2 Phần tử ảnh (pixel):

14


Ảnh trong thực tế là một ảnh liên tục về không gian và về giá trị độ sáng. Để có
thể xử lý ảnh bằng máy tính cần thiết phải tiến hành số hoá ảnh. Trong quá trình số
hoá, người ta biến đổi tín hiệu liên tục sang tín hiệu rời rạc thông qua quá trình lấy
mẫu (rời rạc hóa về không gian) và lượng hoá thành phần giá trị mà về nguyên tắc
bằng mắt thường không phân biệt được hai điểm kề nhau. Trong quá trình này, người
ta sử dụng khái niệm Picture element mà ta quen gọi hay viết là Pixel - phần tử ảnh. Ở
đây cũng cần phân biệt khái niệm pixel hay đề cập đến trong các hệ thống đồ hoạ máy
tính. Để tránh nhầm lẫn ta tạm gọi khái niệm pixel này là pixel thiết bị. Khái niệm
pixel thiết bị có thể xem xét như sau: khi ta quan sát màn hình (trong chế độ đồ hoạ),
màn hình không liên tục mà gồm nhiều điểm nhỏ, gọi là pixel. Mỗi pixel gồm một cặp
toạ độ x, y và màu.
Như vậy một ảnh là một tập hợp các điểm ảnh. Khi được số hoá, nó thường

được biểu diễn bởi bảng hai chiều I(n,p): n hàng và p cột. Ta nói ảnh gồm n x p pixels.
Người ta thường kí hiệu I(x,y) để chỉ một pixel. Thường giá trị của n chọn bằng p và
bằng 256.
3.2.3 Mức xám:
Là kết quả của sự biến đổi tương ứng giá trị độ sáng của một điểm ảnh với
một giá trị số nguyên dương. Tùy thuộc vào số giá trị biểu diễn mức xám mà mỗi
điểm ảnh sẽ được biểu diễn trên 1, 4, 8, 24 hay 32 bit. Số lượng bit biểu diễn mức
xám càng lớn thì chất lượng ảnh càng cao nhưng sẽ tốn dung lượng bộ nhớ nhiều hơn
để lưu trữ và cần một hệ thống mạnh hơn để xử lý.

3.2.4 Khái niệm về biên
Biên là một vấn đề chủ yếu trong phân tích ảnh vì các kỹ thuật phân đoạn ảnh
chủ yếu dựa vào biên.
Một điểm ảnh có thể coi là điểm biên nếu ở đó có sự thay đổi đột ngột về mức
xám. Tập hợp các điểm biên tạo thành biên hay đường bao ảnh của ảnh (boundary).
Thí dụ, trong một ảnh nhị phân, một điểm có thể gọi là biên nếu đó là điểm đen và có
ít nhất một điểm trắng là lân cận.
15


1.1.1.1. Phân loại các kỹ thuật phát hiện biên
Xuất phát từ định nghĩa toán học của biên người ta thường sử dụng 2 phương
pháp phát hiện biên sau:
1.1.1.1.1 Phương pháp phát hiện biên trực tiếp:
Phương pháp này nhằm làm nổi biên dựa vào sự biến thiên về giá trị độ sáng của
điểm ảnh. kỹ thuật chủ yếu dùng phát hiện biên ở đây là kỹ thuật đạo hàm. Nếu lấy
đạo hàm bậc nhất của ảnh ta có phương pháp Gradient; nếu lấy đạo hàm bậc hai ta có
kỹ thuật Laplace. Hai phương pháp trên được gọi là phương pháp dò biên cục bộ.
ngoài ra người ta còn sử dụng phương pháp “đii theo đường bao”: dựa vào nguyên lý
qui hoạch hoạt động và được gọi là phương pháp dò biên tổng thể.

1.1.1.1.2 Phương pháp gián tiếp:
Nếu bằng cách nào đấy , ta phân được ảnh thành các vùng thì đường phân ranh
giữa các vùng đó chính là biên. việc phân vùng ảnh thường dựa vào kết cấu (texture)
bề mặt của ảnh.
Cũng cần lưu ý rằng, kỹ thuật dò biên và phân vùng ảnh là hai bài toán đối ngẫu
của nhau. Thực vậy, dò biên để thực hiện phân lớp đối tượng và một khi đã phân lớp
xong có nghĩa là đã phân vùng được ảnh. Và ngược lại, khi phân vùng, ảnh đã phân
lập được thành các đối tượng, ta có thể phát hiện được biên. Phương pháp dò biên trực
tiếp tỏ ra khá hiệu quả vì ít chịu ảnh hưởng của nhiễu. song nếu sự biến thiên độ sáng
không đột ngột, phương pháp này lại kém hiệu quả. Phương pháp dò biên gián tiếp tuy
có khó cài đặt song lại áp dụng khá tốt khi sự biến thiên độ sáng nhỏ.
3.2.4 Tăng cường và khôi phục ảnh
Tăng cường ảnh là bước quan trọng, tạo tiền đề cho xử lý ảnh. Nó gồm một loạt
các kỹ thuật như: Lọc độ tương phản, khử nhiễu, nổi màu, v...v.
Khôi phục ảnh là nhằm loại bỏ các suy giảm (degradation) trong ảnh.
16


3.2.5 Biến đổi ảnh
Thuật ngữ biến đổi ảnh (Image Transform) thường dùng để nói tới một lớp các
ma trận đơn vị và các kỹ thuật dùng để biến đổi ảnh. Có nhiều loại biến đổi được dùng
như :
- Biến đổi Fourier, Sin, Cosin, Hadamard,. . .
- Tích Kronecker.
- Biến đổi KL (Karhumen Loeve): Biến đổi này có nguồn gốc từ khai triển của
các quá trình ngẫu nhiên gọi là phương pháp trích chọn các thành phần chính.
Do phải xử lý nhiều thông tin, các phép toán nhân và cộng trong khai triển là
khá lớn. Do vậy, các biến đổi trên nhằm làm giảm thứ nguyên của ảnh để việc xử lý
ảnh được hiệu quả hơn.


3.2.6 Phân tích ảnh
Là khâu quan trọng trong quá trình xử lý ảnh để tiến tới hiểu ảnh. Trong phân
tích ảnh việc trích chọn đặc điểm là một bước quan trọng. Các đặc điểm của đối tượng
được trích chọn tuỳ theo mục đích nhận dạng trong quá trình xử lý ảnh. Có thể nêu ra
một số đặc điểm của ảnh sau đây:
Đặc điểm không gian: Phân bố mức xám, phân bố xác suất, biên độ, điểm uốn
v.v..
Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện
lọc vùng (zonal filtering). Các bộ vùng được gọi là “mặt nạ đặc điểm” (feature mask)
thường là các khe hẹp với hình dạng khác nhau (chữ nhật, tam giác, cung tròn v.v..)
Đặc điểm biên và đường biên: Đặc trưng cho đường biên của đối tượng và do
vậy rất hữu ích trong việc trích trọn các thuộc tính bất biến được dùng khi nhận dạng
đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử gradient, toán tử la
bàn, toán tử Laplace, toán tử “chéo không” (zero crossing) …

17


Việc trích chọn hiệu quả các đặc điểm giúp cho việc nhận dạng các đối tượng
ảnh chính xác, với tốc độ tính toán cao và dung lượng nhớ lưu trữ giảm xuống.
3.2.8 Nhận dạng:
Nhận dạng tự động (automatic recognition), mô tả đối tượng, phân loại và phân
nhóm các mẫu là những vấn đề quan trọng trong thị giác máy, được ứng dụng trong
nhiều ngành khoa học khác nhau. Tuy nhiên, một câu hỏi đặt ra là: mẫu (pattern) là gì?
Watanabe, một trong những người đi đầu trong lĩnh vực này đã định nghĩa: “Ngược lại
với hỗn loạn (chaos), mẫu là một thực thể (entity), được xác định một cách ang áng
(vaguely defined) và có thể gán cho nó một tên gọi nào đó”. Ví dụ mẫu có thể là ảnh
của vân tay, ảnh của một vật nào đó được chụp, một chữ viết, khuôn mặt người hoặc
một ký đồ tín hiệu tiếng nói. Khi biết một mẫu nào đó, để nhận dạng hoặc phân loại
mẫu đó có thể:

 Hoặc phân loại có mẫu (supervised classification), chẳng hạn phân tích
phân biệt (discriminant analyis), trong đó mẫu đầu vào được định danh như một thành
phần của một lớp đã xác định.
 Hoặc phân loại không có mẫu (unsupervised classification hay
clustering) trong đó các mẫu được gán vào các lớp khác nhau dựa trên một tiêu chuẩn
đồng dạng nào đó. Các lớp này cho đến thời điểm phân loại vẫn chưa biết hay chưa
được định danh.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn
chủ yếu sau đây:
 Thu nhận dữ liệu và tiền xử lý.
 Biểu diễn dữ liệu.
 Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng là:
 Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
 Phân loại thống kê.
18


 Đối sánh cấu trúc.
 Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng rõ ràng là không thể chỉ dùng có một cách tiếp cận đơn lẻ
để phân loại “tối ưu” do vậy cần sử dụng cùng một lúc nhiều phương pháp và cách
tiếpcận khác nhau. Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi
nhận dạng và nay đã có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai
(hybrid system) bao gồm nhiều mô hình kết hợp.
3.2.9 Nén ảnh
Dữ liệu ảnh cũng như các dữ liệu khác cần phải lưu trữ hay truyền đi trên mạng.
Lượng thông tin để biểu diễn cho một ảnh là rất lớn. Do đó làm giảm lượng thông tin
hay nén dữ liệu là một nhu cầu cần thiết.
Trên cơ sở hai khuynh hướng, có 4 cách tiếp cận cơ bản trong nén ảnh:

 Nén ảnh thống kê: Kỹ thuật nén này dựa vào việc thống kê tần xuất xuất hiện
của giá trị các điểm ảnh, trên cơ sở đó mà có chiến lược mã hóa thích hợp.
Một ví dụ điển hình cho kỹ thuật mã hóa này là *.TIF
 Nén ảnh không gian: Kỹ thuật này dựa vào vị trí không gian của các điểm ảnh
để tiến hành mã hóa. Kỹ thuật lợi dụng sự giống nhau của các điểm ảnh trong
các vùng gần nhau. Ví dụ cho kỹ thuật này là mã nén *.PCX
 Nén ảnh sử dụng phép biến đổi: Đây là kỹ thuật tiếp cận theo hướng nén
không bảo toàn và do vậy, kỹ thuật thướng nến hiệu quả hơn. *.JPG chính là
tiếp cận theo kỹ thuật nén này.

 Nén ảnh Fractal: Sử dụng tính chất Fractal của các đối tượng ảnh, thể hiện sự
lặp lại của các chi tiết. Kỹ thuật nén sẽ tính toán để chỉ cần lưu trữ phần gốc
ảnh và quy luật sinh ra ảnh theo nguyên lý Fractal.
3.2.10 Thu nhận ảnh
3.2.10.1 Thiết bị thu nhận ảnh
19


Thiết bị thu nhận ảnh là camera, scanner, webcam,…. Các thiết bị thu nhận ảnh
này có thể cho ảnh trắng đen B/W (Black and White), ảnh xám hoặc ảnh màu. Với ảnh
B/W mức màu z là 0 hoặc 1. Với ảnh đa cấp xám, mức xám biến thiên từ 0 đến 255.
Ảnh màu, mỗi điểm ảnh lưu trữ trong 3 bytes và do đó ta có 2

8x3

= 2 24 màu (cỡ 16, 7

triệu màu).
Thiết bị ra ảnh có thể là máy in đen trắng, máy in màu hay máy vẽ (ploter). Máy
vẽ cũng có nhiều loại: loại dùng bút, loại phun mực.

Nhìn chung, các hệ thống thu nhận ảnh thực hiện 2 quá trình:
 Cảm biến: biến đổi năng lượng quang học (ánh sáng) thành năng lượng
điện.
 Tổng hợp năng lượng điện thành ảnh.
3.2.10.2

Lấy mẫu và lượng tử hoá

Yêu cầu cơ bản nhất trong xử lý ảnh bằng máy tính là đưa ảnh về dạng biểu
diễn số thích hợp, nghĩa là ảnh phải được biểu diễn bởi một ma trận hữu hạn tương
ứng với việc lấy mẫu ảnh trên một lưới rời rạc và mỗi pixel được lượng hoá bởi một số
hữu hạn bit. Ảnh số được lượng hoá có thể được xử lý hay chuyển qua bước biến đổi
số tương tự - DA (Digital to Analog) để tái hiện trên thiết bị hiện ảnh
3.2.10.3 Quét ảnh (Image scanning)
Phương pháp chung để lấy mẫu là quét ảnh theo hàng và mã hoá từng hàng. Về
nguyên tắc, một đối tượng, phim hay giấy trong suốt sẽ được chiếu sáng liên tục để tạo
nên một ảnh điện tử trên tấm cảm quang. Tuỳ theo các loại camera mà tấm cảm quang
này là chất quang dẫn hay quang truyền. Hệ thống camera ống sử dụng phương pháp
scan-out-digitalizer; còn hệ thống camera CCD (Charge Couped Device) cho ảnh ma
trận.

3.2.11 Xử lý và nâng cao chất lượng ảnh

20


Nâng cao chất lượng ảnh là một bước quan trọng, tạo tiền đề cho xử lý ảnh.
Mục đích chính là nhằm làm nổi bật một số đặc tính của ảnh như thay đổi độ tương
phản, lọc nhiễu, nổi biên, làm trơn biên ảnh, khuyếch đại ảnh .. . Tăng cường ảnh và
khôi phục ảnh là 2 quá trình khác nhau về mục đích. Tăng cường ảnh bao gồm một

loạt các phương pháp nhằm hoàn thiện trạng thái quan sát của một ảnh. Tập hợp các
kỹ thuật này tạo nên giai đoạn tiền xử lý ảnh. Trong khi đó, khôi phục ảnh nhằm khôi
phục ảnh gần với ảnh thực nhất trước khi nó bị biến dạng do nhiều nguyên nhân khác
nhau. Sau đây ta tìm hiểu một số kỹ thuật tăng cường ảnh.
3.2.11.1 Các kỹ thuật tăng cường ảnh
Nhiệm vụ của tăng cường ảnh không phải là làm tăng lượng thông tin vốn có
trong ảnh mà làm nổi bật các đặc trưng đã chọn làm sao để có thể phát hiện tốt hơn,
tạo thành quá trình tiền xử lý cho phân tích ảnh
3.2.11.1.1 Tăng độ tương phản
Trước tiên cần làm rõ khái niệm độ tương phản; ảnh số là tập hợp các điểm, mà
mỗi điểm có giá trị độ sáng khác nhau. Ở đây, độ sáng để mắt người dễ cảm nhận ảnh
song không phải là quyết định. Thực tế chỉ ra rằng hai đối tượng có cùng độ sáng
nhưng đặt trên hai nền khác nhau sẽ cho cảm nhận khác nhau. Như vậy, độ tương phản
biểu diễn sự thay đổi độ sáng của đối tượng so với nền. Một cách nôm na, độ tương
phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Với định nghĩa này, nếu ảnh của
ta có độ tương phản kém, ta có thể thay đổi tuỳ ý theo ý muốn.
Ảnh với độ tương phản thấp có thể do điều kiện sáng không đủ hay không đều,
hoặc do tính không tuyến tính hay biến động nhỏ của bộ cảm nhận ảnh. Để điều chỉnh
lại độ tương phản của ảnh, ta điều chỉnh lại biên độ trên toàn dải hay trên dải có giới
hạn bằng cách biến đổi tuyến tính biên độ đầu vào (dùng hàm biến đổi là hàm tuyến
tính) hay phi tuyến (hàm mũ hay hàm lôgarít).
3.2.11.1.2 Tách nhiễu

21


Tách nhiễu là trường hợp đặc biệt của dãn độ tương phản khi hệ số góc = =0.
Tách nhiễu được ứng dụng một cách hữu hiệu để giảm nhiễu khi biết tín hiệu vào nằm
trên khoảng [a,b].
3.2.11.1.3 Trừ ảnh

Trừ ảnh được dùng để tách nhiễu khỏi nền. Người ta quan sát ảnh ở 2 thời điểm
khác nhau, so sánh chúng để tìm ra sự khác nhau. Người ta dóng thẳng 2 ảnh rồi trừ đi
và thu được ảnh mới. Ảnh mới này chính là sự khác nhau. Kỹ thuật này hay được dùng
trong dự báo thời tiết, trong y học.
3.2.11.1.4 Tăng giảm độ sáng
Giả sử ta có I ~ kích thước m × n và số nguyên c
Khi đó, kỹ thuật tăng, giảm độc sáng được thể hiện
for (i = 0; i < m; i + +)
for (j = 0; j < n; j + +)
I [i, j] = I [i, j] + c;


Nếu c > 0: ảnh sáng lên.



Nếu c < 0: ảnh tối đi.

22


3.2.11.1.5 Một số kỹ thuật cải thiện ảnh nhị phân
Với ảnh nhị phân, mức xám chỉ có 2 giá trị là 0 hay 1. Do vậy, ta coi một phần
tử ảnh như một phần tử lô gíc và có thể áp dụng các toán tử hình học (morphology
operators) dựa trên khái niệm biến đổi hình học của một ảnh bởi một phần tử cấu trúc
(structural element).
Phần tử cấu trúc là một mặt nạ dạng bất kỳ mà các phần tử của nó tạo nên một
mô-típ. Người ta tiến hành rê mặt nạ đi khắp ảnh và tính giá trị điểm ảnh bởi các điểm
lân cận với mô-típ của mặt nạ theo cách lấy hội hay lấy tuyển. Hình dưới đây , chỉ ra
một phần tử cấu trúc và cách lấy hội hay tuyển:

0

1

0

0 1 1
0
1
a) Phần tử cấu trúc

0
0
0

1

0

1

0
0 0
0
0 1
b) một vùng ảnh

1
1


0
0

0
0

1
0

1

0

0

1

c) Tuyển

d) Hội

Dựa vào nguyên tắc trên, ngưòi ta sử dụng 2 kỹ thuật: dãn ảnh (dilatation) và co
ảnh (erosion).
a) Dãn ảnh
Dãn ảnh nhằm loại bỏ điểm đen bị vây bởi các điểm trắng. Trong kỹ thuật này, một
cửa sổ N+1 x N+1 được rê đi khắp ảnh và thực hiện đối sánh một pixel của ảnh với
(N+1)2 -1 điểm lân cận (không tính điểm ở tâm). Phép đối sánh ở đây thực hiện bởi
phép tuyển lôgíc.
23



b ) Co ảnh
Co ảnh là thao tác đối ngẫu của giãn ảnh nhằm loại bỏ điểm trắng bị vây bởi
các điểm đen. Trong kỹ thuật này, một cửa sổ (N+1) x (N+1) được rê đi khắp ảnh và
thực hiện sánh một pixel của ảnh với (N+1) 2 -1 điểm lân cận. Sánh ở đây thực hiện bởi
phép hội lôgíc.
Áp dụng: Ngưòi ta thường vận dụng kỹ thuật này cho các ảnh nhị phân như vân tay,
chữ viết. Để không làm ảnh hưởng đến kích thước của đối tượng trong ảnh, người ta
tiến hành n lần dãn và n lần co.
3.2.11.1.6 Tính toán các thông số của khối
Khối (blob): là một vùng trên ảnh gồm các pixel có cùng cường độ sáng
hoặc tối nằm liền kề nhau.
Các khối có thể phân biệt dựa trên 9 thông số của khối:

Thông số

Mô tả

Ví dụ

Angle

Góc của khối được
đo từ vị trí 3 giờ
theo chiều kim
đồng hồ
Vị trí tâm của khối

Position


so với góc trên bên
trái của khối đó.

Area

Số lượng pixel của
khối.

Bounding box

Hình chữ nhật nhỏ
nhất có thể bao
quanh một khối.

24


Eccentricity

Độ lệch tâm, cho
biết độ đối xứng
của một khối.

Compactness

Mật độ pixel trong
khối.

Perimeter


Tổng chiều dài tất
cả các cạnh của một
khối, bao gồm cạnh
trong và cạnh ngoài.

Average

Giá trị cường độ

Intensity

sáng trung bình của
tất cả các pixel
trong khối.

Radius

Bán kính của khối
hình dạng tròn.
Radius không có ý
nghĩa nhiều đối với
các khối khong có
dạng tròn.
Bảng 2.2: Các thông số của khối

Chúng ta có thể dựa vào 9 thông số đặc trưng của khối để chọn ra một hoặc
nhiều khối trong ảnh.
3.3

Các phương pháp chiếu sáng trong công nghiệp


3.3.1 Chiếu sáng khuếch tán trước đối tượng
25


×