Tải bản đầy đủ (.pdf) (74 trang)

Nghiên cứu phương pháp trích chọn đặc trưng ảnh dựa trên đối sánh hình dạng và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.84 MB, 74 trang )

I

...

ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THƠNG

---------------------------------------

VŨ VÂN DU

NGHIÊN CỨU PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC
TRƢNG ẢNH DỰA TRÊN ĐỐI SÁNH HÌNH DẠNG VÀ
ỨNG DỤNG
Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH

Thái Ngun - 2014
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

II

LỜI CẢM ƠN

Tôi xin chân thành cảm ơn PGS.TS Ngô Quốc Tạo, Viện Công nghệ Thông tin
thuộc Viện Khoa học và Công nghệ Việt Nam là cán bộ trực tiếp hướng dẫn khoa học
cho tơi trong q trình thực hiện luận văn này.


Tôi xin chân thành cảm ơn các Thầy, Cô giáo, cán bộ trong trường Đại học Công
nghệ Thông tin và Truyền thông cùng các anh chị đồng nghiệp trong cơ quan đã tạo
những điều kiện thuận lợi cho tôi học tập và nghiên cứu tại trường Đại học Công nghệ
Thông tin và Truyền thông.
Xin chân thành cảm ơn các anh, các chị và các bạn học viên lớp Cao học CK11A
trường Đại học Công nghệ Thông tin và Truyền thơng đã ln động viên, giúp đỡ và
nhiệt tình chia sẻ với tôi những kinh nghiệm học tập, công tác trong suốt khố học.
Cuối cùng, tơi muốn gửi lời cảm ơn tới gia đình, bạn bè, những người thân ln
bên cạnh và động viên tơi trong suốt q trình thực hiện luận văn tốt nghiệp.
Mặc dù rất cố gắng, song luận văn này không thể tránh khỏi những thiếu sót, kính
mong được sự chỉ dẫn của các q thầy cô và các bạn.
Thái Nguyên, tháng 5 năm 2014
Tác giả

Vũ Vân Du

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

III

LỜI CAM ĐOAN

Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này là trung
thực và không trùng lặp với các đề tài khác. Tôi cũng xin cam đoan là
cho việc thực hiện luận văn này đã được cảm ơn và các thơng tin trích dẫn trong luận
văn đã được chỉ rõ nguồn gốc.

Thái Nguyên, tháng 5 năm 2014

Tác giả

Vũ Vân Du

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

IV

MỤC LỤC
LỜI CẢM ƠN ............................................................................................................ I
LỜI CAM ĐOAN ...................................................................................................III
MỤC LỤC ............................................................................................................... IV
DANH MỤC CÁC HÌNH VẼ ................................................................................ VI
DANH MỤC CÁC BẢNG BIỂU ......................................................................... VII
DANH MỤC CÁC THUẬT NGỮ ...................................................................... VIII
PHẦN MỞ ĐẨU ....................................................................................................... 1
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH ...................................................... 3
1.1.

Tổng quan về thị giác máy tính ........................................................................3

1.1.1. Thị giác con người và thị giác máy tính......................................................3
1.1.2. Mối liên quan giữa thị giác máy tính và xử lý ảnh .....................................4
1.1.3. Tầm quan trọng của thị giác máy tính.........................................................4
1.1.4. Ứng dụng của thị giác máy tính ..................................................................5
1.2.

Tổng quan về xử lý ảnh ....................................................................................8


1.2.1. Xử lý ảnh là gì? ...........................................................................................8
1.2.2. Các vấn đề cơ bản trong xử lý ảnh ..............................................................9
1.2.3. Một số khái niệm trong xử lý ảnh .............................................................12
1.2.4. Phương pháp biểu diễn ảnh .......................................................................13
1.2.5. Biên và đường biên ...................................................................................14
1.2.6. Phân vùng ảnh ...........................................................................................15
CHƢƠNG 2: MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƢNG HÌNH DẠNG
.................................................................................................................................. 16
2.1.

Các kỹ thuật phát hiện biên ảnh......................................................................18

2.2.

Kỹ thuật phát hiện biên trực tiếp ....................................................................19

2.2.1. Kỹ thuật phát hiện biên Gradient ..............................................................19
2.2.2. Kỹ thuật phát hiện biên Laplace................................................................23
2.2.3. Thuật toán làm mảnh biên .........................................................................24
2.2.4. Một số phương pháp phát hiện biên trực tiếp khác ...................................26
2.3.

Phương pháp phát hiện biên gián tiếp ............................................................29

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

V


2.3.1. Kỹ thuật dò biên gián tiếp đơn giản ..........................................................29
2.3.2. Kỹ thuật dò biên gián tiếp bằng cách xác định chu tuyến.........................30
2.4.

Xử lý ảnh trong miền tần số và biến đổi Fourier ............................................31

2.4.1. Biến đổi Fourier rời rạc (DFT)..................................................................34
2.4.2. Biến đổi Fourier nhanh (FFT) ...................................................................34
2.5.

Mô tả Fourier ..................................................................................................35

2.6.

Các bất biến moment ......................................................................................37

2.7.

Các hàm xoay/góc xoay ..................................................................................37

2.8.

Độ trịn, độ lệch tâm và hướng trục chính ......................................................38

CHƢƠNG 3: ỨNG DỤNG TRÊN BÀI TỐN TRA CỨU BIỂN BÁO GIAO
THƠNG ................................................................................................................... 40
3.1.

Bài tốn tra cứu biển báo giao thơng ..............................................................40


3.2.

Phân tích bài tốn............................................................................................41

3.3.

Xây dựng chương trình đối sánh biển báo giao thơng ....................................45

3.3.1. Sơ đồ khối .................................................................................................45
3.3.2. Đọc ảnh .....................................................................................................46
3.3.3. Dò biên đối tượng ảnh ...............................................................................46
3.3.4. Resample ...................................................................................................46
3.3.5. Biến đổi Fourier nhanh..............................................................................47
3.3.6. Tạo véc tơ đặc trưng hình dạng cho ảnh ...................................................47
3.3.7. So sánh ảnh bằng cách tính khoảng cách Euclide .....................................48
3.5.

Đánh giá chương trình ....................................................................................50

3.5.1. Kết quả đạt được .......................................................................................50
3.5.2. Hạn chế......................................................................................................50
3.5.3. Khả năng mở rộng .....................................................................................50
KẾT LUẬN ............................................................................................................. 51
TÀI LIỆU THAM KHẢO...................................................................................... 53
PHỤ LỤC ................................................................................................................ 54

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>


VI

DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Mơ phỏng hệ thống thị giác của con người ................................................ 3
Hình 1.2: Mơ phỏng hệ thống thị giác máy tính ........................................................ 3
Hình 1.3: Giao diện chương trình BKDoctor ............................................................. 6
Hình 1.4: Vị trí lắp đặt và màn hình hiển thị của hệ thống giám sát giao thơng ........ 7
Hình 1.5: Q trình xử lý ảnh ..................................................................................... 8
Hình 1.6: Các bước cơ bản trong xử lý ảnh ............................................................... 8
Hình 1.7: Biểu diễn PPI và DPI................................................................................ 12
Hình 1.8: Ví dụ về các loại ảnh ................................................................................ 13
Hình 1.9: Hướng các điểm biên và mã tương ứng ................................................... 14
Hình 2.1: Biểu diễn hình dạng theo đường biên và theo vùng ................................. 16
Hình 2.2: Biểu diễn đường biên ảnh......................................................................... 17
Hình 2.3: Minh họa biên ảnh .................................................................................... 18
Hình 2.4: Minh họa biên ảnh với độ sáng biến thiên không đột ngột ...................... 18
Hình 2.5: Ảnh minh họa làm mảnh biên .................................................................. 25
Hình 2.6: Hình biên ảnh sau khi dùng phương pháp Gradient ................................. 25
Hình 2.7: Hình sau khi làm mảnh biên ..................................................................... 25
Hình 2.8: Minh họa nguyên lý Bellman. .................................................................. 27
Hình 2.9: Hình mơ tả tìm biên theo phương pháp quy hoạch động ......................... 29
Hình 2.10: Miền thời gian và miền tần số ................................................................ 32
Hình 2.11: biểu diễn số phức thơng qua cường độ và góc pha ................................ 33
Hình 2.12: Ảnh thực (a) và ảnh thu được sau biến đổi Fourier (b) .......................... 33
Hình 3.1: Một số biển báo có hình dạng cá biệt ....................................................... 44
Hình 3.2: Sơ đồ khối phần tra cứu ảnh theo hình dạng ............................................ 45
Hình 3.3: Một số kết quả chạy thử chương trình...................................................... 49


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

VII

DANH MỤC CÁC BẢNG BIỂU

Bảng 1.1: Một số phần mềm tự động chấm bài thi trắc nghiệm ................................ 6
Bảng 2.1: So sánh đặc trưng và phương pháp khử nhiễu của hai loại nhiễu ........... 10
Bảng 3.1: Một số loại biển báo giao thơng ở Việt Nam ........................................... 42
Bảng 3.2: Hình dạng đặc trưng của một số loại biển báo ........................................ 43

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

VIII

DANH MỤC CÁC THUẬT NGỮ
Ảnh màu
Ảnh số
Ảnh tương tự
Ảnh xám
Ảnh nhị phân
Ảnh cắt lớp vi tính
Biển báo giao thơng
Biến đổi Fourier nhanh
Biến đổi Fourier rời rạc
Bộ số hoá

Bức ảnh
Cảm biến
Đầu ra
Đầu vào
Điểm ảnh
Độ phân giải
Đường biên (đường bao)
Hệ thống lai
Khung hình
Làm mảnh biên
Lọc vùng
Mã loạt dài
Mặt nạ đặc điểm
Máy ảnh
Máy ảnh điện tử
Máy quét
Nhận dạng
Nhận dạng tự động
Phần cứng
Phần mềm
Số điểm ảnh trên 1 inh
Số điểm trên 1 inh
Thị giác con người
Thị giác máy tính
Tín hiệu
Tốn tử chéo khơng
Xử lý ảnh

:
:

:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:
:

:
:
:
:
:

Color Image
Digial Image
Analog Image
Gray Image
Binary Image
Computed Tomography (CT)
Traffic sign (Road sign)
Fast Fourier Transform (FFT)
Discrete Fourier Transform (DFT)
Digitalizer
Picture, Image
Sensor
Output
Input
Pixel
Resolution
Boundary
Hybrid System
Frame
Non Maximal Suppression
Zonal Filtering
Run-length Code
Feature mask
Camera

Electronic Camera
Scanner
Recognition
Automatic recognition
Hardware
Software
Pixels per inch (PPI)
Dots per inch (DPI)
Human Vision
Computer Vision
Signal
Zero crossing
Image processing

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

1

PHẦN MỞ ĐẨU

Công nghệ Thông tin ngày càng phát triển và có vai trị hết sức quan trọng
khơng thể thiếu trong cuộc sống hiện đại. Con người ngày càng tạo ra những cỗ máy
thơng minh có khả năng tự nhận biết và xử lý được các công việc một cách tự động,
phục vụ cho lợi ích của con người.
Trong những năm gần đây, một trong những bài toán nhận được nhiều sự quan
tâm của lĩnh vực công nghệ thông tin, đó chính là thị giác máy tính. Nó đã được các
nhà nghiên cứu quan tâm vì tính ứng dụng cao của bài tốn cũng như sự phức tạp của
nó.

Bài tốn nhận dạng là một phần quan trọng của thị giác máy tính. Nó được sử
dụng trong rất nhiều lĩnh vực như: nhận dạng con người, đồ vật, chữ viết, cử chỉ…
trong các lĩnh vực đó thì đều có những nhu cầu từ thực tiễn và tính ứng dụng lớn.
Trong nhận dạng ảnh, thường dùng các phương pháp trích chọn đặc trưng để đối sánh.
Một số phương pháp thường dùng như: trích chọn đặc trưng theo màu sắc, theo kết cấu
và theo hình dạng của ảnh.
Hiện tại, thị giác máy tính ứng dụng trong khá nhiều lĩnh vực như: y khoa, quân
sự, các lĩnh vực quản lý v.v… Trong lĩnh vực thơng tin giao thơng với 200 loại biển
báo thì việc nghi nhớ nội dung biển báo là một trở ngại lớn đối với người tham gia
giao thơng. Vì vậy việc xây dựng một chương trình có thể nhận dạng và đưa ra các
thông tin cũng như cảnh báo đến người dùng là cần thiết.
Trong khuân khổ luận văn thạc sỹ tơi chọn để tài: “Nghiên cứu phƣơng pháp
trích chọn đặc trƣng ảnh dựa trên đối sánh hình dạng và ứng dụng” nhằm tìm
hiểu kỹ về các kỹ thuật trích chọn đặc trưng hình dạng của ảnh, hiểu rõ hơn bản chất
của bài tốn tìm kiếm ảnh theo hình dạng từ đó áp dụng vào bài tốn tra cứu biển báo
giao thơng.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

2

Luận văn gồm 3 chương với các nội dung sau:
Chương 1: Trình bày tổng quan về thị giác máy tính, xử lý ảnh, tầm quan trọng và
tình ứng dụng của thị giác máy tính trong cuộc sống.
Chương 2: Tìm hiểu về các phương pháp trích chọn đặc trưng hình dạng phục vụ
cho quá trình đối sánh theo hình dạng ảnh.
Chương 3: Thử nghiệm cài đặt chương trình tra cứu ảnh trên cơ sở việc nghiên cứu
các kỹ thuật trích chọn đặc trưng theo hình dạng.


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

3

CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1. Tổng quan về thị giác máy tính
1.1.1. Thị giác con ngƣời và thị giác máy tính
Thị giác con người là một hệ thống phức tạp có thể thu nhận thơng tin từ môi
trường qua ánh sáng, xử lý và đưa ra kết quả là những suy nghĩ, hành động… Xét
theo một số tiêu chí thì thị giác máy tính và và thị giác con người có cùng chức năng
gần giống nhau. Mục đích của cả hai hệ thống là để xử lý dữ liệu với đầu vào là ảnh
và cho ra kết quả.
Hệ thống thị giác máy tính xử lý hình ảnh có được từ một máy ảnh điện tử, việc
này cũng giống như hệ thống thị giác của con người nơi mà não xử lý hình ảnh từ đơi
mắt.

Hình 1.1: Mơ phỏng hệ thống thị giác của con người (nguồn: bionicvision.org.au)
Mặc dù thị giác máy tính và thị giác con người có chức năng tương tự, nhưng
khó có thể chế tạo một hệ thống thị giác máy tính có thể tái tạo chính xác chức năng
của thị giác người. Điều này phần lớn là do máy tính chưa mơ phỏng được tâm lý học
thị giác.

Kết quả

Thu nhận ảnh

Xử lý ảnh


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

4

Hình 1.2: Mơ phỏng hệ thống thị giác máy tính
Thị giác máy tính là một chủ đề phong phú và bổ ích cho học tập và nghiên cứu của
các kỹ sư điện tử, khoa học máy tính và nhiều nhóm ngành khác. Trong thương mại,
thị giác máy tính ngày càng có một tương lai rộng mở. Và xử lý ảnh là một trong
những phần quan trọng trong thị giác máy tính.
1.1.2. Mối liên quan giữa thị giác máy tính và xử lý ảnh
Thị giác máy tính là một khái niệm mở bao trùm nhiều khái niệm khác nhau từ
phần cứng (máy ảnh, máy tính, bộ phận hiển thị, chấp hành…) đến các phần mềm (xử
lý, tổng hợp, điều khiển…) và xử lý ảnh là một trong những khâu quan trọng nhất của
thị giác máy tính.
1.1.3. Tầm quan trọng của thị giác máy tính
Là một trong năm giác quan của con người, thị giác là nơi tiếp nhận phần lớn
lượng thông tin tác động đến con người hàng ngày. Có thể nói, thị giác là giác quan
quan trọng nhất là có cơ sở khi có tới gần 25% nơ-ron thần kinh dùng để tiếp nhận và
xử lý các thông tin về hình ảnh.
Trong khi đó, trải qua một thời gian dài máy tính tiếp nhận dữ liệu bằng các thao
tác từ những đầu thu nhận. Giờ đây, nhu cầu đặt ra cho hệ thống xử lý dữ liệu cần xử
lý nhanh những dữ liệu thơ, khơng chính xác của đầu vào. Và từ những yêu cầu này,
thị giác máy tính được quan tâm, nghiên cứu và phát triển trên khắp thế giới vì những
lợi ích lớn mà nó mang lại.
Nếu như trước đây chưa có ứng dụng của thị giác máy tính, số liệu từ giấy được
nhập chính xác bằng tay qua bàn phím thì giờ đây với cơng nghệ hiện đại, từ ảnh chụp
văn bản, máy tính có thể tự động nhập số liệu từ văn bản đó một cách nhanh chóng.

Hay trong một dây chuyền sản xuất cơng nghiệp. Để kiểm tra sắp xếp một sản phẩm
sau khi chế tạo, trước đây sử dụng công nhân hoặc rất nhiều các cảm biến với một hệ
thống thu nhận phức tạp thì giờ đây chỉ cần một máy ảnh cùng với hệ thống thị giác
máy tính có thể thực hiện cơng việc này một cách nhanh chóng và chính xác.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

5

1.1.4. Ứng dụng của thị giác máy tính
Hiện nay có rất nhiều hệ thống thị giác máy tính được sử dụng thường xuyên
trong công nghiệp cũng như trong quân sự, y tế hay dân dụng…
Thời điểm hiện tại cũng có khá nhiều các công ty, tổ chức trong nước ứng dụng
những thành quả của xử lý ảnh để áp dụng cho ra những sản phẩm phục vụ cho nhu
cầu, đáp ứng được nhu cầu hiện tại. Ví dụ, với cơng việc chấm bài thi trắc nghiệm có
một số các giải pháp hệ thống tự động sau:
Bảng 1.1: Một số phần mềm tự động chấm bài thi trắc nghiệm
STT

Tên phần mềm

Tác giả

1

MarkRead 1.0

Phịng Nhận dạng & Cơng nghệ Tri thức - Viện CNTT


2

TestPro

Công ty TMSoft

3

SuperEMR

Công ty PSC

4

MR.Test

TT Nghiên cứu và Phát triển Công nghệ Phần mềm – ĐH
Công nghệ - ĐHQG HN

Ngoài các ứng dụng trong nước dành cho ngành giáo dục thì cũng có một số
các nghiên cứu ứng dụng xử lý ảnh áp dụng cho các ngành khác như y tế ví dụ như
một số chương trình do Bộ môn Vật lý Kỹ thuật y sinh, Trường Đại Học Bách Khoa –
Đại học Quốc gia Thành phố Hồ Chí Minh thực hiện:
BKDoctor: Chương trình tái tạo ảnh 3D từ các lớp cắt song song
IBK: Chương trình xử lý ảnh y khoa trên nền MATLAB
sgDICOM-J: Chương trình xử lý ảnh y khoa 3-D trên nền JAVA

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


/>

6

Hình 1.3: Giao diện chương trình BKDoctor của Bộ mơn Vật lý Kỹ thuật Y sinh,
Trường Đại Học Bách Khoa – ĐHQG TP.HCM
Trong ngành giao thông vận tải, xử lý ảnh đã và đang được phát triển mạnh mẽ,
phục vụ được nhiều nhu cầu liên quan đến độ an toàn của con người và phương tiện
tham gia giao thông.
Gần đây theo báo khoahocphothong.com.vn đưa tin. Các nhà khoa học thuộc
Khoa Điện - Điện tử, Trường Đại học Giao thông Vận tải đã nghiên cứu thiết kế và
chế tạo thành công hệ thống giám sát giao thông ứng dụng công nghệ xử lý ảnh. Hệ
thống bao gồm máy ảnh giám sát, máy ảnh chụp hình, mạng truyền thơng, máy chủ
lưu trữ, phần mềm xử lý ảnh và cơ sở dữ liệu có thể tự động phát hiện và ghi nhận các
tình huống vi phạm luật Giao thông nhằm tăng cường giám sát, phát hiện và xử lý kịp
thời các vi phạm, hạn chế tai nạn và nâng cao ý thức chấp hành của người tham gia
giao thông.
Hệ thống này hiện đang được thử tại Km192+422 đường cao tốc Pháp Vân Cầu Giẽ. Trong điều kiện ánh sáng ban ngày và lưu lượng giao thơng bình thường, hệ
thống cho kết quả khá tốt. Về chức năng phát hiện xe chuyển làn trái phép, kết quả
tính tốn bằng máy được so sánh với kết quả quan sát bằng mắt thường cho thấy, độ
chính xác của phần mềm là 97%. Kết quả phát hiện xe chạy quá tốc độ được so sánh
với súng bắn tốc độ theo nguyên lý Rada, sai số của phần mềm so với súng là 5%.”
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

7

Hình 1.4: Vị trí lắp đặt và màn hình hiển thị của hệ thống giám sát giao thơng
Đây có thể nói là một giải pháp tốt, giúp cho các đơn vị quản lý giảm bớt được

thời gian và công sức trong việc giám sát và xử lý vi phạm.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

8

1.2. Tổng quan về xử lý ảnh
1.2.1. Xử lý ảnh là gì?
Trong ngành khoa học hình ảnh, xử lý ảnh là hình thức xử lý tín hiệu mà đầu
vào là một hình ảnh, chẳng hạn như một bức ảnh hoặc khung hình của đoạn phim; đầu
ra của xử lý hình ảnh có thể là một hình ảnh, một tập hợp các đặc điểm hoặc các thơng
số liên quan đến hình ảnh.





Ảnh

Xử lý ảnh


Ảnh tốt hơn



Kết luận


Hình 1.5: Quá trình xử lý ảnh
Có thể hiểu một cách khác, xử lý ảnh bao gồm tất cả các lý thuyết và kỹ thuật
liên quan, cho phép tạo lập một hệ thống có khả năng tiếp nhận thơng tin từ các hình
ảnh thu được, lưu trữ và xử lý theo nhu cầu.
Sơ đồ tổng quát của một hệ thống xử lý ảnh [1]:
Hệ
quyết định
Thu
nhận ảnh

Tiền
xử lý

Trích chọn
đặc điểm

Hậu
xử lý

Đối sánh, rút
ra kết luận

Lưu trữ

Hình 1.6: Các bước cơ bản trong xử lý ảnh

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>


9

1.2.2. Các vấn đề cơ bản trong xử lý ảnh
1.2.2.1. Thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện bước này cần có các
thiết bị nhu nhận ảnh như máy ảnh, máy quét. Các thiết bị thu nhận này có thể cho ảnh
đen trắng hoặc ảnh màu.
Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thơng dụng là Raster
và Vector. Các thiết bị thu nhận ảnh Raster thơng thường là máy ảnh, cịn các thiết bị
thu nhận ảnh Vector là cảm biến, bộ số hóa hoặc được chuyển đổi từ ảnh Raster.
Thông thường các hệ thống thu nhận ảnh thực hiện 2 khối:
Khối cảm biến: biến đổi năng lượng quang học thành năng lượng điện.
Khối xử lý: Tổng hợp năng lượng điện thành ảnh.
1.2.2.2. Tiền xử lý
Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khơi phục ảnh,
nắn chỉnh hình học… Với mục đích làm cho chất lượng ảnh trở nên tốt hơn, chuẩn bị
cho các bước xử lý sau đó.
Khử nhiễu: Nhiễu được chia thành hai loại:
Bảng 1.1: So sánh đặc trưng và phương pháp khử nhiễu của hai loại nhiễu
Loại nhiễu
Đặc trưng
Phương pháp khử nhiễu

Nhiễu hệ thống

Nhiễu ngẫu nhiên

Có quy luật

Khơng có quy luật


Phép biến đổi

Phương pháp nội suy, lọc
trung vị, lọc trung bình

Chỉnh mức xám: Là kỹ thuật nhằm chỉnh sửa tính khơng đồng đều của thiết bị
thu nhận hoặc độ tương phản giữa các vùng ảnh.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

10

Chỉnh tán xạ: Ảnh thu nhận từ các thiết bị quang học hay điện tử có thể bị mờ,
nhịe. Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho
phép giải quyết việc hiệu chỉnh này.
Nắn chỉnh hình học: Những biến dạng hình học thường do các thiết bị điện tử
và quang học gây ra. Do đó phương pháp hiệu chỉnh hình ảnh dựa trên mơ hình được
mơ tả dưới dạng phương trình biến đổi ảnh biến dạng f(x,y) thành ảnh lý tưởng f(x’,y’)
như sau:
(1.1)
Trong đó, là các phương trình tuyến tính (biến dạng do phối cảnh) hay phương
trình bậc hai (biến dạng do ống kính camera).
1.2.2.3. Trích chọn đặc điểm
Lượng thơng tin chứa trong ảnh là rất lớn, trong khi đó đa số ứng dụng chỉ cần
một số thơng tin đặc trưng. Bước trích chọn đặc điểm sẽ trích xuất lượng thộng tin hữu
ích từ khối thơng tin khổng lồ đó. Việc trích chọn hiệu quả đặc điểm giúp cho việc
nhận dạng các đối tượng ảnh chính xác, tốc độ tính tốn cao và dung lượng nhớ lưu trữ

giảm xuống.
Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng theo
một số đặc điểm của ảnh sau đây:
o Đặc điểm không gian: Phân bố mức xám, xác suất, biên độ, điểm uốn, v.v...
o Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc
vùng. Các bộ vùng được gọi là mặt nạ đặc điểm thường là các khe hẹp với hình
dạng khác nhau (chữ nhật, tam giác, cung tròn…).
o Đặc điểm biên và đƣờng biên: Đặc trưng cho đường biên của đối tượng và do rất
hữu ích trong việc trích chọn các đặc tính bất biến nên thường được dùng khi nhận
dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ tốn tử Gradien, tốn
tử Laplace, tốn tử Cross Zero...
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

11

1.2.2.4. Đối sánh, nhận dạng
Nhận dạng tự động, mô tả đối tượng, phân loại và phân nhóm các mẫu là những
vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác
nhau. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ
viết, khn mặt người hoặc một ký đồ tín hiệu tiếng nói… Khi biết một mẫu nào đó,
để nhận dạng hoặc phân loại mẫu đó.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ
yếu sau đây:
Thu nhận dữ liệu và tiền xử lý.
Biểu diễn dữ liệu.
Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng:
Đối sánh mẫu dựa trên các đặc trưng được trích chọn.

Phân loại thống kê.
Đối sánh cấu trúc.
Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại
tối ưu nên cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau.
Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã
có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai bao gồm nhiều mơ
hình kết hợp.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

12

1.2.3. Một số khái niệm trong xử lý ảnh
1.2.3.1. Ảnh tƣơng tự, điểm ảnh và ảnh số
Ảnh tương tự là một bức ảnh được lưu trữ trên phim, giấy, gỗ… Ảnh tương tự là
ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính, ảnh tương tự cần phải
được số hoá.
Số hoá ảnh là sự biến đổi gần đúng một ảnh tương tự thành một tập điểm phù
hợp với ảnh thật về vị trí (khơng gian) và độ sáng (mức xám). Khoảng cách giữa các
điểm ảnh đó được thiết lập sao cho mắt người khơng phân biệt được ranh giới giữa
chúng. Mỗi một điểm như vậy gọi là điểm ảnh và tập hợp các điểm ảnh theo một tiêu
chuẩn được gọi là một ảnh số.

1.2.3.2. Độ phân giải, mật độ điểm ảnh
Độ phân giải là số lượng điểm ảnh của một ảnh số. Độ phân giải của ảnh được
đo bằng đơn vị pixel. Hiện nay số lượng điểm ảnh đã lên tới hàng triệu và thường
được biểu diễn bằng đơn vị Megapixel (Mpx).

Mật độ điểm ảnh: Là số lượng
điểm ảnh trên một đơn vị diện tích. Mật
độ điểm ảnh cho biết có thể in ra đẹp hay
hiển thị lên màn hình tốt hay khơng.
Thường dùng đơn vị PPI hoặc DPI. PPI
dùng trong việc hiển thị lên màn hình, cịn
DPI dùng trong in ấn.
Ví dụ: thơng thường, một bức ảnh
chụp trên máy ảnh Canon 50D có độ phân
giải 15,1Mpx và mật độ điểm ảnh là
72DPI.

Hình 1.7: Biểu diễn PPI và DPI

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

13

1.2.3.3. Ảnh màu, ảnh xám và ảnh nhị phân
Ảnh màu: Xét một ảnh màu trong hệ màu RGB, mỗi điểm ảnh của ảnh bao
gồm 3 giá trị màu: đỏ, xanh lục, xanh lam. Mỗi màu có giá trị từ 0 đến 255, nghĩa là
mỗi điểm ảnh cần 3 byte hay 24 bit để biểu diễn.
Ảnh xám: mỗi điểm ảnh của ảnh xám mang giá trị trong khoảng từ 0 đến 255,
nghĩa là cần 8 bit hay 1 byte để biểu diễn mỗi điểm ảnh. Mức xám của điểm ảnh là
cường độ sáng của nó được gán bằng giá trị số tại điểm đó. Giá trị mức xám thơng
thường: 16, 32, 64, 128, 256.

Ảnh màu


Ảnh xám

Ảnh nhị phân

Hình 1.8: Ví dụ về các loại ảnh
Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt. Nói cách khác: mỗi
điểm ảnh của ảnh nhị phân chỉ có thể mang giá trị là 0 hoặc 1.
1.2.4. Phƣơng pháp biểu diễn ảnh
Sau khi thu nhận và số hóa, ảnh sẽ được lưu trữ hay chuyển sang giai đoạn phân
tích. Dưới đây là một số phương pháp biểu diễn ảnh trên bộ nhớ máy tính.
1.2.4.1. Mã loạt dài
Mã loạt dài hay dùng để biểu diễn cho vùng ảnh hay ảnh nhị phân. Một vùng
ảnh R có thể biểu diễn đơn giản nhờ một ma trận nhị phân:
(1.2)
Với các biểu diễn trên, một vùng ảnh hay ảnh nhị phân đựoc xem như chuỗi 0
hay 1 đan xen. Các chuỗi này được gọi là mạch (run). Theo phương pháp này, mỗi
mạch sẽ được biểu diễn bởi địa chỉ bắt đầu của mạch và chiều dài mạch theo dạng
{<hàng,cột>, chiều dài}.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

14

1.2.4.2. Mã xích
Mã xích thường được dùng để biểu diễn biên của ảnh. Thay vì lưu trữ tồn bộ
ảnh thì lưu trữ dãy các điểm ảnh như A, B…M. Theo phương pháp này, 8 hướng của
vectơ nối 2 điểm biên liên tục được mã hóa. Khi đó ảnh được biểu diễn qua điểm ảnh
bắt đầu A cùng với chuỗi các từ mã. Điều này được minh họa trong hình dưới đây:


Hình 1.9: Hướng các điểm biên và mã tương ứng
1.2.4.3. Mã tứ phân
Theo phương pháp mã tứ phân, một vùng ảnh coi như bao kín một hình chứ
nhật. Vùng này được chia làm 4 vùng con (Quadrant). Nếu một vùng con gồm toàn
điểm đen (1) hay toàn điểm trắng (0) thì khơng cần chia tiếp. Trong trường hợp ngược
lại, vùng con gồm cả điểm đen và trắng gọi là vùng không đồng nhất, tiếp tục chia
thành 4 vùng con tiếp và kiểm tra tính đồng nhất của các vùng con đó.
Q trình chia dừng lại khi mỗi vùng con chỉ chứa thuần nhất điểm đen hoặc
điểm trắng. Q trình đó tạo thành một cây chia theo bốn phần gọi là cây tứ phân. Như
vậy, cây biểu diễn ảnh gồm một chuỗi các ký hiệu b (black), w (white) và g (grey) kèm
theo ký hiệu mã hóa 4 vùng con.
1.2.5. Biên và đƣờng biên
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc
đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên
nếu lân cận nó có ít nhất một điểm trắng.
Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

15

Đƣờng biên: tập hợp các điểm biên liên tiếp tạo thành một đường biên hay
đường bao.
Ý nghĩa của đƣờng biên: đường biên là một loại đặc trưng cục bộ tiêu biểu
trong phân tích, nhận dạng ảnh. Biên được sử dụng làm phân cách các vùng xám
(màu) cách biệt.
1.2.6. Phân vùng ảnh
Phân vùng ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích
ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên

thông. Tiêu chuẩn để xác định các vùng liên thơng có thể là cùng mức xám, cùng
màu…
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nó là một tập hợp các
điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu, độ nhám…
Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng ảnh là nói đến tính chất bề
mặt. Đường bao quanh một vùng ảnh là biên ảnh. Các điểm trong một vùng ảnh có độ
biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.
Dựa vào đặc tính vật lý của ảnh, có nhiều kỹ thuật phân vùng: phân vùng dựa
theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề, phân
vùng dựa vào biên gọi là phân vùng biên. Ngồi ra cịn có các kỹ thuật phân vùng khác
dựa vào biên độ, phân vùng dựa theo kết cấu.

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

16

CHƢƠNG 2: MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƢNG HÌNH DẠNG
Các đặc điểm hình dạng của các vùng ảnh và các đối tượng ảnh được sử dụng
trong rất nhiều hệ thống tra cứu ảnh. So với các đặc điểm về màu sắc và các đặc điểm
về kết cấu thì các đặc điểm về hình dạng thường chỉ được sử dụng sau khi ảnh đã phân
thành các vùng hoặc các đối tượng ảnh.
Các phương pháp trích chọn đặc điểm hình dạng thường được chia thành hai loại
là trích chọn dựa theo đường biên và trích chọn dựa theo vùng ảnh.
Một phương pháp trích chọn đặc điểm hình dạng tốt phải đảm bảo yêu cầu là phải
không phụ thuộc vào vị trí, góc quay hay sự co giãn của đối tượng ảnh.
Trước khi áp dụng các phương pháp trích chọn đặc điểm hình dạng, các đối tượng
ảnh cần phải được tách ra khỏi ảnh. Giả sử là trong mỗi ảnh chỉ có một đối tượng ảnh
duy nhất, nhiệm vụ của hệ thống trước hết là phải tách được đối tượng ảnh ra khỏi nền

ảnh.
Cách biểu diễn hình dạng của đối tượng ảnh có thể chia thành hai kiểu:
Theo đường bao quanh (biên)
Theo vùng
Cách biểu diễn theo đường viền bao quanh chỉ sử dụng đường biên bên ngồi của
hình dạng, điều này có thể thực hiện được bằng cách mơ tả vùng đó bằng cách đặc tính
bên ngồi của nó tức là các điểm ảnh dọc theo đường viền bao quanh đối tượng. Cách
biểu diễn theo vùng sử dụng cả vùng ảnh bằng cách mô tả vùng đang quan tâm bằng
các đặc tính bên trong tức là các điểm ảnh ở bên trong vùng đó.

Hình 2.1: Biểu diễn hình dạng theo đường biên và theo vùng

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

/>

17

Một số khái niệm:
Màu sắc và kết cấu là những thuộc tính có khái niệm tồn cục của một bức ảnh.
Trong khi đó, hình dạng khơng phải là một thuộc tính của ảnh. Thay vì vậy, hình dạng
có khuynh hướng chỉ định tới một khu vực đặc biệt của ảnh. Sau đây là một vài khái
niệm quan trọng để hiểu cốt lõi của tìm ra hình dạng ảnh.
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh
hoặc đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là
điểm biên nếu lân cận nó có ít nhất một điểm trắng.
Đường biên: tập hợp các điểm biên liên tiếp tạo thành một đường biên hay
đường bao.
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một loại
đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Thứ hai, sử dụng biên

làm phân cách các vùng xám (màu) cách biệt. Ngược lại, cũng sử dụng các vùng ảnh
để tìm đường phân cách.
Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau:
khi người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa
mà khơng cần vẽ một cách đầy đủ.
Mơ hình biểu diễn đường biên, theo tốn học: điểm ảnh có sự biến đổi mức
xám u(x) một cách đột ngột theo hình dưới.[4]

u

u

x

u

x

x

a, Đường biên lý tưởng

b, Đường biên bậc thang

c, Đường biên thực

Hình 2.2: Biểu diễn đường biên ảnh

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


/>

×