Tải bản đầy đủ (.pdf) (72 trang)

Nghiên cứu đề xuất các phương pháp bóc tách biển số xe sử dụng công nghệ xử lý ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.44 MB, 72 trang )

Luận Văn Tốt Nghiệp
..

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
---------------------------------------

LÊ ANH DUY

Nghiên cứu đề xuất các phương pháp bóc tách
biển số xe sử dụng cơng nghệ xử lý ảnh
Chuyên ngành:

Kỹ thuật viễn thông

LUẬN VĂN THẠC SĨ KHOA HỌC
KỸ THUẬT VIỄN THÔNG

NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. NGUYỄN VĂN ĐỨC

HÀ NỘI – 2016

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

1



Luận Văn Tốt Nghiệp

LỜI NÓI ĐẦU
Xử lý ảnh số một lĩnh vực đã và đang rất phát triển. Khái niệm xử lý ảnh và
thị giác máy – Computer vision có liên quan tới nhiều lĩnh vực và hướng nghiên
cứu khác nhau. Từ những năm 1970 khi mà năng lực tính tốn của máy tính ngày
càng trở nên mạnh mẽ hơn, các máy tính lúc này có thể xử lý được những tập dữ
liệu lớn như các hình ảnh, các đoạn phim kỹ thuật liên quan đến thị giác máy hay
xử lý hình ảnh số được nghiên cứu nhiều hơn cho tới ngày nay..
Ngày nay, ứng dụng của xử lý ảnh đã trở nên rất rộng lớn và đa dạng ứng
dụng trong mọi lĩnh vực từ quân sự, khoa học, vũ trụ, cho đến y học, sản xuất, và tự
động hóa. Trong thời gian thực hiện luận văn tốt nghiệp cao học, được sự giúp đỡ
của thầy giáo hướng dẫn em đã từng bước tiếp cận và nghiên cứu từ cơ sở ban đầu
về xử lý ảnh số đến lý thuyết và ứng dụng của các bộ lọc làm nổi biên – một trong
những kiến thức quan trọng trong quá trình nhận dạng ảnh. Nhất là trong lĩnh vực
quản lý giao thơng, để làm tăng tính tự động hóa trong quản lý các phương tiện xe
cộ, công nghệ nhận dạng biển số xe tự động dựa trên nền tảng xử lý ảnh –thị giác
máy tính ngày càng được đầu tư nghiên cứu nhằm nâng cao hiệu suất của việc nhận
dạng.
Dưới sự hướng dẫn của PGS.TS Nguyễn Văn Đức, cùng với sự nhận thức
được tầm quan trọng của công nghệ xử lý ảnh với những lợi ích thiết thực mà nó
mạng lại trong việc hiện đại hóa, tự động hóa một nền giao thông thông minh, nên
em đã quyết định lựa chọn đề tài: “Nghiên cứu đề xuất các phương pháp bóc tách
biển số xe sử dụng công nghệ xử lý ảnh”
Qua đây, em xin chân thành cảm ơn thầy giáo – PGS.TS Nguyễn Văn Đức, đã
tận tình chỉ dẫn em về kiến thức chun mơn và giúp em hồn thành đồ án này. Em
cũng xin gửi lời cảm ơn tới nhóm Xử Lý Ảnh của phịng thí nghiệm Thơng Tin Vơ
Tuyến – Wicom Lab và Ths. Nguyễn Đức Quảng đã tạo điều kiện giúp đỡ em trong
quá trình nghiên cứu, thử nghiệm thực hiện luận văn này. Bên cạnh những kết quả
đạt vẫn cịn nhiều thiếu sót khơng thể tránh khỏi trong đồ án. Em rất mong nhận

được sự đóng góp ý kiến của quý thầy cô và các bạn.
Hà Nội, ngày 25 tháng 09 năm 2016
Học viên:

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

2


Luận Văn Tốt Nghiệp

MỤC LỤC

LỜI NÓI ĐẦU ........................................................................................................ 2
MỤC LỤC ............................................................................................................... 3
LỜI CAM ĐOAN ................................................................................................... 6
DANH SÁCH CÁC KÍ HIỆU, CÁC TỪ VIẾT TẮT .......................................... 7
DANH MỤC HÌNH VẼ ......................................................................................... 8
MỞ ĐẦU ............................................................................................................... 11
Lý do chọn đề tài ............................................................................................... 11
Lịch sử nghiên cứu ............................................................................................ 11
Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu ........... 12
Mục tiêu của đề tài ............................................................................................ 12
Phương pháp nghiên cứu ................................................................................. 12
Nội dung của luận văn ...................................................................................... 13
GIỚI THIỆU VỀ XỬ LÝ ẢNH ............................................... 14
Lịch sử phát triển của xử lý ảnh ........................................................... 14

Quá trình xử lý ảnh ................................................................................ 14
Ảnh số ...................................................................................................... 15
Điểm ảnh ........................................................................................... 15
Ảnh số................................................................................................ 15
Kích thước ảnh ................................................................................. 16
Phân loại ảnh số ............................................................................... 16
1.3.4.1 Ảnh màu RGB ........................................................................... 16
1.3.4.2 Ảnh đa mức xám ....................................................................... 17
1.3.4.3 Chuyển từ ảnh màu sang ảnh xám.......................................... 18
1.3.4.4 Ảnh nhị phân ............................................................................. 18
1.3.4.5 Chuyển ảnh xám sang ảnh nhị phân....................................... 19
Các phép tốn hình thái học trên ảnh .................................................. 20
Phép toán dãn nở: ............................................................................ 20
Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

3


Luận Văn Tốt Nghiệp

Phép toán co: .................................................................................... 21
Phép toán mở .................................................................................... 21
Phép tốn đóng ................................................................................. 21
Kỹ thuật phân vùng ảnh ........................................................................ 22
Điểm biên và đường biên................................................................. 22
Phân vùng ảnh sử dụng phương pháp nổi biên ............................ 22
Q trình dị biên cơ bản ................................................................ 23

Phương pháp dò biên trực tiếp ....................................................... 23
Phương pháp dò biên gián tiếp ....................................................... 23
CÁC PHƯƠNG PHÁP LÀM NỔI BIÊN ............................... 25
Dò biên ..................................................................................................... 25
Phương pháp Sobel ................................................................................. 25
Thuật toán ........................................................................................ 25
Phương pháp Canny ............................................................................... 27
Khử nhiễu dùng bộ lọc Gaussian Laplacian ................................. 28
Tính Gradient của ảnh .................................................................... 30
Xác định hướng cạnh ....................................................................... 30
Loại bỏ những điểm không phải cực đại ....................................... 31
CẢI TIẾN PHƯƠNG PHÁP CANNY .................................... 33
Đặc điểm và hạn chế của phương pháp Canny ................................... 33
Phương pháp cải tiến .............................................................................. 34
Giải thuật tìm biên Canny [22][7][9] ............................................. 34
Mục tiêu của việc cải tiến phương pháp Canny ............................ 35
Thiết kế cải tiến ................................................................................ 36
MỘT SỐ PHƯƠNG PHÁP NHẬN DẠNG BIỂN SỐ XE..... 40
Quá trình cơ bản trong nhận dạng biển số xe ..................................... 40
Một số phương pháp trích vùng biển số xe .......................................... 41
Phương pháp dử dụng thuật toán hiện biên Sobel [18] ............... 41
Phương pháp sử dụng bộ lọc Canny [19] ...................................... 43
Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

4



Luận Văn Tốt Nghiệp

ỨNG DỤNG BỘ LỌC CANNY CẢI TIẾN VÀO ANPR ..... 45
Nhận dạng biển số xe tự động ANPR ................................................... 45
Đặc trưng biển số xe ở Việt Nam [23] ............................................ 45
Ứng dụng vào nhận diện biển số xe tự động ........................................ 46
Nhận ảnh từ camera ........................................................................ 46
Tiền xử lý ảnh ................................................................................... 46
5.2.2.1 Chuyển sang ảnh xám .............................................................. 47
5.2.2.2 Lọc nhiễu và làm mịn ............................................................... 48
Tìm vị trí của biển số ....................................................................... 49
5.2.3.1 Làm nổi bật các sườn dọc và sườn ngang .............................. 49
5.2.3.2 Nhị phân hình ảnh hiện biên sử dụng Sobel .......................... 50
Trích xuất biển số ............................................................................ 55
Ứng dụng vào nhị phân cô lập ký tự trên biển số ................................ 55
Tiền xử lý ảnh biển số xe ................................................................. 55
Làm nổi biên sử dụng Canny cải tiến ............................................ 56
Tái tạo ký tự ..................................................................................... 56
KẾT QUẢ VÀ ĐÁNH GIÁ ...................................................... 59
Kết quả cải tiến phương pháp Canny ................................................... 59
Kết quả ứng dụng phương pháp Canny cải tiến vào nhị phân biển số
xe trong ANPR .................................................................................................. 62
KẾT LUẬN ........................................................................................................... 66
TÀI LIỆU THAM KHẢO ................................................................................... 67
PHỤ LỤC .............................................................................................................. 69

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:


5


Luận Văn Tốt Nghiệp

LỜI CAM ĐOAN
Tôi cam đoan đây là cơng trình nghiên cứu của riêng tơi. Các số liệu, kết quả
nêu trong luận văn là trung thực và tham khảo có dẫn chứng cụ thể. Hình ảnh sử
dụng trong luận văn có trích dẫn đầy đủ từ tài liệu tham khảo. Dữ liệu hình ảnh sử
dụng cho thử nghiệm đánh giá thuật toán được cung cấp và sự cho phép của phịng
thí nghiệm Thơng Tin Vơ Tuyến –Wicom Lab, Đại học Bách Khoa Hà Nội.

Học viên:

Lê Anh Duy

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

6


Luận Văn Tốt Nghiệp

DANH SÁCH CÁC KÍ HIỆU, CÁC TỪ VIẾT TẮT
Từ viết tắt


Từ gốc

Dịch nghĩa

ANPR

Automatic Number Plate Recognition

Nhận diện biển số xe tự động

CRS

Computer Recognition Systems

Các hệ thống nhận dạng máy tính

RGB

Red, Green, Blue

Đỏ, Xanh lá, Xanh lam

ĐH BKHN

Đại học Bách Khoa Hà Nội

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:


7


Luận Văn Tốt Nghiệp

DANH MỤC HÌNH VẼ
Hình 1-1 Q trình xử lý ảnh cơ bản ..................................................................... 14
Hình 1-2 Phối trộn màu bổ xung ............................................................................ 16
Hình 1-3 Ảnh Lena màu RGB ............................................................................... 17
Hình 1-4 Ảnh Lena-đa mức xám ........................................................................... 17
Hình 1-5 Ảnh Lena dạng nhị phân ......................................................................... 19
Hình 1-6 Ngưỡng động OTSU ............................................................................... 20
Hình 1-7 Ví dụ về điểm biên trên đồ thị cường độ điểm ảnh. ............................... 22
Hình 1-8 Điểm biên trên đồ thị vi phân ................................................................. 23
Hình 1-9 Quá trình dị biên .................................................................................... 23
Hình 2-1 Ảnh gốc Albert Einstein ......................................................................... 26
Hình 2-2 Ảnh sau khi tìm cạnh hướng dọc ............................................................ 26
Hình 2-3 Ảnh sau khi tìm cạnh hướng ngang ........................................................ 27
Hình 2-4 Sơ đơ giải thuật Canny............................................................................ 28
Hình 2-5 Phân bố Gaussian .................................................................................... 29
Hình 2-6 Chia hướng cạnh ..................................................................................... 31
Hình 2-7 Điểm lân cận của pixel theo hướng cạnh ................................................ 31
Hình 2-8 Điểm lân cận và các hướng ..................................................................... 32
Hình 3-1 Logo ĐH BKHN sau khi nổi biên .......................................................... 33
Hình 3-2 Sơ đồ tổng quan của giải thuật tìm biên Canny ...................................... 34
Hình 3-3 Ví dụ đầu ra của phương pháp Canny sau cải tiến ................................. 35
Hình 3-4 Loại bỏ điểm khơng phải là biên ............................................................ 36
Hình 3-5 4 điểm lân cận điểm biên theo hướng xét ............................................... 37
Hình 3-6 Ngưỡng đôi cho độ tương phản hai bên điểm biên ................................ 37

Hình 3-7 Thuật tốn sau khi cải tiến ...................................................................... 38
Hình 3-8 Thuật tốn tơ màu điểm biên theo độ tương phản C .............................. 39
Hình 3-9: Ảnh đầu vào ........................................................................................... 39
Hình 3-10 Kết quả sau giải thuật Canny ................................................................ 39
Hình 3-11 Kết quả của việc cải tiến Canny ........................................................... 39
Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

8


Luận Văn Tốt Nghiệp

Hình 4-1 Các bước cơ bản trong quá trình nhận dạng biển số xe .......................... 40
Hình 4-2 Làm hiện biên sử dụng phương pháp Sobel [18] .................................... 41
Hình 4-3 Sử dụng phép chiếu ngang [18] .............................................................. 42
Hình 4-4 Sử dụng phép chiếu tách ký tự khỏi biển số [18] ................................... 42
Hình 4-5 Sử dụng bộ lọc Canny làm nổi cạnh biển số [19] ................................... 43
Hình 4-6 Tìm những cạnh mạnh và chỉ tìm cạnh đứng [19].................................. 44
Hình 4-7 Phát hiện biển số xe [19] ........................................................................ 44
Hình 5-1 Ảnh xám 8 bit ......................................................................................... 48
Hình 5-2 Ảnh sau khi làm mờ bằng bộ lọc Gaussian ............................................ 49
Hình 5-3 Hiện biên bằng bộ lọc Sobel theo phương ngang. .................................. 50
Hình 5-4 Biểu đồ thể hiện giá trị ngưỡng mức xám của một bức ảnh ................... 51
Hình 5-5 Nhị phân làm nổi vùng biển số ............................................................... 52
Hình 5-6 Biến đổi hình thái học liên kết các vùng trắng nhỏ ................................ 52
Hình 5-7 Sơ đồ quá trình phát hiện vùng biển số xe .............................................. 53
Hình 5-8 Vẽ các đường bao chữ nhật quanh các vùng trắng ................................. 53

Hình 5-9 Trích lọc những hình chữ nhật thỏa mãn điều kiện kích thước và tỉ lệ các
cạnh của biển số xe. ............................................................................................... 54
Hình 5-10 Kích thước biển số ơ tơ ở Việt Nam (Thơng tư 36_2010_TT-BCA) ... 54
Hình 5-11 Chọn đối tượng theo mật độ điểm trắng trong hình chữ nhật............... 55
Hình 5-12 Hình ảnh biển số ................................................................................... 55
Hình 5-13 Làm mờ biển số bằng bộ lọc Gaussian ................................................. 56
Hình 5-14 Nổi biên sử dụng phương pháp Canny ................................................. 56
Hình 5-15 Nổi biên sử dụng phương pháp Canny cải tiến .................................... 56
Hình 5-16 Các ký tự sau khi được tái tạo .............................................................. 57
Hình 5-17 Ký tự sau khi giãn nở ............................................................................ 57
Hình 5-18 Làm mịn ............................................................................................... 57
Hình 5-19 Lọc vụn ................................................................................................. 58
Hình 6-1 Ảnh ban đầu ............................................................................................ 59
Hình 6-2 Ảnh nổi biên bằng phương pháp Canny ................................................. 59
Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

9


Luận Văn Tốt Nghiệp

Hình 6-3 Ảnh nổi biên bằng phương pháp Canny cải tiến .................................... 60
Hình 6-4 Ảnh xám đầu vào .................................................................................... 60
Hình 6-5 Nổi biên dung Canny .............................................................................. 61
Hình 6-6 Canny cải tiến với ngưỡng Sub0=10, Sub255=-10 ................................ 61
Hình 6-7 Canny cải tiến với ngưỡng Sub0=40, Sub255=-40 ................................ 62
Hình 6-8 Canny cải tiến với ngưỡng Sub0=80, Sub255=-80 ................................ 62

Hình 6-9 Tập ảnh thử nghiệm –ảnh chụp ban đêm trong điều kiện thiếu sáng ..... 63
Hình 6-10 Khơng sử dụng Canny cải tiến – Tỉ lệ trích chọn 1167/3170 ............... 63
Hình 6-11 Khơng sử dụng Canny cải tiến – Tỉ lệ trích chọn 1510/3170 ............... 64
Hình 6-12 Ứng dụng Canny cải tiến nhị phân biển số và nhị phân bằng OTSU ... 65

.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

10


Luận Văn Tốt Nghiệp

MỞ ĐẦU

Lý do chọn đề tài
Xử lý ảnh là một phân ngành trong xử lý số tín hiệu với tín hiệu xử lý là ảnh.
Đây là một phân ngành khoa học mới rất phát triển trong những năm gần đây. Xử
lý ảnh gồm 4 lĩnh vực chính: xử lý nâng cao chất lựong ảnh, nhận dạng ảnh, nén
ảnh và truy vấn ảnh. Sự phát triển của xử lý ảnh đem lại rất nhiều lợi ích cho cuộc
sống của con người.
Ngày nay xử lý ảnh đã được áp dụng rất rộng rãi trong đời sống như:
photoshop, nén ảnh, nén video, nhận dạng biển số xe, nhận dạng khuôn mặt, nhận
dạng chữ viết, nhận dạng dấu vân tay… Tất cả các cơng nghệ đều dựa vào hình dạng
và đường biên của đối tượng trên bức ảnh.
Quá trình xử lý ảnh dựa rất nhiều vào đường biên của đối tượng, cho nên q

trình xử lý ảnh làm nổi biên có vai trò quan trọng quyết định đến hiệu quả của việc
nhận dạng. Hiện nay có nhiều phương pháp làm hiện biên rất hiệu quả như phương
pháp Canny, Sobel, Laplace,…Tuy nhiên trong những trường hợp cụ thể, việc sử
dụng các phương pháp này bằng thư viện có sẵn như OpenCv lại đạt hiệu quả khơng
cao và khó tùy chỉnh theo mong muốn. Chính vì vậy, tác giả chọn đề tài “Nghiên
cứu đề xuất các phương pháp bóc tách biển số xe sử dụng công nghệ xử lý ảnh” làm
đề tài tốt nghiệp.

Lịch sử nghiên cứu
Các phương pháp xử lý ảnh bắt đầu từ các ứng dụng chính: Nâng cao chất
lượng ảnh và phân tích ảnh. Ứng dụng đầu tiên được biết đến là nâng cao chất lượng
ảnh báo được truyền qua cáp từ Luân đôn đến New York từ những năm 1920. Vấn
đề nâng cao chất lượng ảnh có liên quan tới phân bố mức sáng và độ phân giải của
ảnh.
Việc nâng cao chất lượng ảnh được phát triển vào khoảng những năm 1955.
Điều này có thể giải thích được vì sau thế chiến thứ hai, máy tính phát triển nhanh
tạo điều kiện cho q trình xử lý ảnh sơ thuận lợi.
Năm 1964, máy tính đã có khả năng xử lý và nâng cao chất lượng ảnh từ mặt
trăng và vệ tinh Ranger 7 của Mỹ bao gồm: làm nổi đường biên, lưu ảnh.
Từ năm 1964 đến nay, các phương tiện xử lý, nâng cao chất lượng, nhận dạng ảnh
phát triển không ngừng.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

11



Luận Văn Tốt Nghiệp

Ngày nay, công nghệ phát triển mạnh mẽ, các thiết bị di động trở nên phổ
biến với các camera nhỏ nhưng chất lượng ảnh cao, trở thành mảnh đất màu mỡ cho
xử lý ảnh phát triển.

Mục đích nghiên cứu của luận văn, đối tượng, phạm vi nghiên cứu
Luận văn này trình bày việc nghiên cứu và cải tiến phương pháp dị biên Canny
ứng dụng vào q trình trích chọn đặc trưng của ký tự biển số xe, nhằm nâng cao tỉ
lệ trích xuất nhận dạng ký tự trên biển số.
Đối tượng nghiên cứu của luận văn là các phương pháp làm nổi biên như
Canny, Sobel, các phép biến đổi ảnh, biến đổi hình thái học, lọc nhiễu, làm mịn,…
ứng dụng cho công nghệ nhận dạng biển số xe ở Việt Nam.
Phạm vi nghiên cứu của luận văn là nghiên cứu, cải tiến và đưa ra các phương
pháp trích xuất các ký tự trên biển số xe ơ tô ở Việt Nam bằng việc cải tiến một bộ
lọc ảnh tìm biên có sẵn, cụ thể là bộ lọc Canny.

Mục tiêu của đề tài
-

Cải tiến bộ lọc Canny, ứng dụng vào nhị phân ảnh phân tách ký tự trên biển
số xe với màu nền của biển số.

-

Nhận dạng được cả biển số loại một dòng và hai dòng

-

Bộ lọc sau khi cải tiến ứng dụng được với cả biển trắng, biển xanh và biển

đỏ

Phương pháp nghiên cứu
Như trình bày trong luận văn, thì phương pháp nghiên cứu của tác giả là tiến
hành việc nghiên cứu lý thuyết về các phép biển đổi ảnh, các bộ lọc làm nổi biên,
đặc biệt là các bộ lọc Canny, Sobel. Từ những quy định về tính chất của biển số xe
ở Việt Nam, các thơng số kích thước, màu sắc và, làm cơ sở cho việc thiết kế các
thuật tốn, tính tốn tham số vào cho các bộ lọc nhằm mục đích nhị phân ảnh biển
số xe với màu nền và màu kí tự được phân tách chính xác.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

12


Luận Văn Tốt Nghiệp

Nội dung của luận văn
Phần nội dung của luận văn gồm 6 chương sau:
Chương 1: Giới thiệu về xử lý ảnh
Chương 2: Các bộ lọc làm nổi biên
Chương 3: Cải tiến bộ lọc Canny
Chương 4: Một số phương pháp nhận dạng biển số xe
Chương 5: Ứng dụng bộ lọc Canny cải tiến trong ANPR
Chương 6: Kết quả và đánh giá

Lê Anh Duy


Kỹ thuật Viễn thông
Trang:

13


Luận Văn Tốt Nghiệp

GIỚI THIỆU VỀ XỬ LÝ ẢNH

Lịch sử phát triển của xử lý ảnh
Quá trình xử lý ảnh

Thu nhận ảnh

Tiền xử lý ảnh

Phân đoạn ảnh

Biểu diễn và
mô tả

Nhận dạng và
nội suy

Cơ sở tri thức

Hình 1-1 Quá trình xử lý ảnh cơ bản [14]
Quá trình xử lý ảnh gồm các bước:

+Thu nhận ảnh: có thể nhận qua camera màu hoặc đen trắng, đây là loại ảnh tương
tự.
+Tiền xử lý: sau bộ phận thu nhận ảnh, ảnh có thể bị nhiễu hoặc độ tương phản
thấp nên cần đưa vào bộ tiền xử lý để nâng cao chất lượng ảnh. Chức năng lọc
nhiễu và tang hoặc giảm độ tương phản.
+Phân đoạn ảnh: là tách ảnh đầu vào thành các vùng để biểu diễn phân tích và
nhận dạng ảnh.
+Biểu diễn và mơ tả: các vật thể sau khi được phân đoạn có thể được mơ tả dưới
dạng chuỗi các điểm và nó thường được sử dụng khi ta quan tâm đến đặc tính bên
trong của ảnh.
+Nhận dạng và nội suy: là quá trình phân loại vật thể dựa trên các cơ sở mơ tả vật
thể và nhận dạng ảnh là q trình xác định ảnh và quá trình này thu được bằng
cách so sánh mẫu đã được lưu từ trước
+Cơ sở tri thức: các quá trình xử lý liệt kê trong hình thức xử lý ảnh được thực
hiện dưới sự giám sát và thực hiện trên cơ sở các kiến thức về lĩnh vực xử lý ảnh.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

14


Luận Văn Tốt Nghiệp

Ảnh số
Điểm ảnh
Ảnh tự nhiên là ảnh liên tục về không gian và độ sáng. Khi số hóa, ảnh được
biến đổi gần đúng thành một tập điểm phù hợp với ảnh thật về không gian và độ

sáng. Khoảng cách giữa các điểm ảnh được thiết lập sao cho mắt người không nhận
biết được ranh giới giữa chúng. Mỗi điểm như vậy được gọi là điểm ảnh. Một bức
ảnh hai chiều thì mỗi điểm ảnh tương ứng với một cặp tọa độ (x,y).
Định nghĩa: Trong ảnh số, một điểm ảnh là một điểm vật lý trong ảnh quét,
là đơn vị nhỏ nhất trong các thiết bị hiển thị có thể xác định địa chỉ tất cả các điểm.
Địa chỉ của một điểm ảnh tương ứng với tọa độ vật lý của nó.
Hoặc: Điểm ảnh là một phần tử của ảnh số tại tọa độ (x,y) với độ sáng hoặc
màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh được thiết lập sao cho
mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số
gần như thật. Mỗi phần từ trong ma trận được gọi là phần từ ảnh
Ảnh số
Ảnh số là tập hợp hữu hạn các điểm ảnh. Ảnh có thể được biểu diễn dưới
dạng một ma trận 2 chiều, mỗi phần tử của ma trận tương ứng với một điểm ảnh.
Một bức ảnh được biểu diễn trên máy tính thường được đặc trưng bởi các đặc
tính sau:
-

Độ phân giải không gian: là số cột và số hàng của bức ảnh định nghĩa số
pixel dùng để bao phủ không gian chứa trong bức ảnh. Cái này liên quan đến
sự lấy mẫu của tín hiệu ảnh và thường được gọi là độ phân giải số hay độ
phân giải điểm ảnh của bức ảnh. Các độ phân giải ảnh phổ biến là 640 x 480,
800 x 600, 1024 x 768, .v.v. [8]Error! Reference source not found.

-

Độ phân giải bit: cái này định nghĩa số giá trị về cường độ màu mà một pixel
có thể có và liên quan đến sự lượng tử hóa thơng tin của bức ảnh. Một bức
ảnh nhị phân thì chỉ có 2 màu (đen hoặc trắng), ảnh xảm thì thường có 256
mức khác nhau từ đen tới trắng trong khi ảnh màu thì phụ thuộc vào dải màu


Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

15


Luận Văn Tốt Nghiệp

sử dụng. Các độ phân giải bit thường được nhắc đến là số bit nhị phân cần
thiết để lưu một mức lượng tử hóa, ví dụ nhị phân là 2 bit, ảnh xám là 8 bit
và ảnh màu thường là 24 bit [8]

Kích thước ảnh
Là kích thước của ma trận điểm ảnh, chiều rộng là số điểm ảnh trên một hàng,
chiều cao là số điểm ảnh trên một cột.
Phân loại ảnh số
1.3.4.1 Ảnh màu RGB

Hình 1-2 Phối trộn màu bổ xung
Mơ hình màu RGB, từ viết tắt RGB trong tiếng Anh có nghĩa là đỏ (red),
xanh lá cây (green) và xanh lam (blue), là ba màu gốc trong các mơ hình ánh sáng
bổ sung.
Ánh sáng đỏ, xanh lá cây và xanh lam được tổ hợp với nhau theo nhiều
phương thức khác nhau để tạo thành các màu khác.
Khi biểu diễn dưới dạng số, các giá trị RGB thơng thường được ghi bằng cặp
ba số ngun có giá trị nằm giữa 0 và 255 (với ảnh 8 bit), mỗi số là giá trị cường độ
của màu đỏ, xanh lá cây, xanh lam.


Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

16


Luận Văn Tốt Nghiệp

Hình 1-3 Ảnh Lena màu RGB
1.3.4.2 Ảnh đa mức xám
Ảnh đa mức xám là ảnh mà giá trị mỗi điểm ảnh nằm trong giải giá trị từ 0
đến 255, nghĩa là cần 8 bits hay 1 byte để biểu diễn mỗi điểm ảnh này.

Hình 1-4 Ảnh Lena-đa mức xám

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

17


Luận Văn Tốt Nghiệp

1.3.4.3 Chuyển từ ảnh màu sang ảnh xám
Có thể chuyển từ khơng gian màu RGB sang ảnh xám nhờ phép chuyển đổi
đơn giản. Chuyển đổi sang ảnh xám là bước khởi đầu trong nhiều thuật toán xử lý

ảnh, vì nó làm đơn giản (làm giảm) lượng thơng tin trong ảnh. Mặc dù ảnh xám
chứa ít thơng tin hơn ảnh màu, nhưng những đặc tính quan trọng vẫn được bảo lưu
như viền, vùng, sự ghép nối .v.v. Các thuật toán xử lý và phát hiện các đặc trưng
trong ảnh thường hoạt động trên ảnh mà đã được chuyển thành ảnh xám. [8]
Một ảnh màu Icolor được chuyển thành ảnh xám Igrey-scale nhờ sử dụng phép
chuyển đổi sau đây [8]:
Igrey-scale (n,m) = 𝛼 Icolor(n,m,r) +𝛽 Icolor(n,m,g) + 𝛾 Icolor(n,m,b)
Trong đó (n,m) chỉ một pixel trong ảnh xám và (n,m,c) chỉ một pixel của
kênh đỏ trong ảnh màu,(n,m,g) và (n,m,b) chỉ các pixel tương ứng của kênh xanh lá
và kênh xanh lam trong ảnh màu. Như thể hiện trong công thức, ảnh xám là tổng
các trong số của các kênh màu trong ảnh màu. Các hệ số trọng số (𝛼, 𝛽, 𝛾) được xét
theo tỉ lệ cảm thụ của mắt người với các kênh màu và được chuẩn hóa để đảm báo
tính nhất qn ( theo chuẩn truyền hình NTSC là 𝛼 = 0.2989, 𝛽 = 0.5870 và 𝛾 =
0,1140). [8]

1.3.4.4 Ảnh nhị phân
Ảnh nhị phân (binary image): giá trị mỗi điểm ảnh là 0 hoặc 1, nghĩa là trắng
hoặc đen. Trong thực tế khi xử lý trên máy tính thì người ta dùng ảnh xám (xem
khái niệm bên dưới) để biểu diễn ảnh nhị phân và lúc này 2 giá trị là 0 hoặc 255.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

18


Luận Văn Tốt Nghiệp


Hình 1-5 Ảnh Lena dạng nhị phân
1.3.4.5 Chuyển ảnh xám sang ảnh nhị phân
 Ngưỡng (θ)
Giả sử ta có một điểm ảnh xám I có giá trị kênh màu xám từ [min; max]
tương ứng [0; 255], thì θ là một giá trị nằm trong khoảng [0; 255]. Khi một giá trị
một điểm ảnh được so sánh với ngưỡng, nếu lớn hơn ngưỡng giá trị trả về sẽ là 255,
ngược lại sẽ là 0.
 Kỹ thuật tách ngưỡng tự động OTSU [15]
Trước tiên, sau khi thống kê mức xám trên ảnh đầu vào, chúng ta sẽ nhận
được một đồ thị biểu diễn mức xám có hai đỉnh, một đỉnh biểu diễn cho những vùng
có mức xám lớn nhất, đỉnh còn lại biểu diễn cho những vùng là nền của ảnh có mức
xám bé nhất (ngồi trừ 2 mức xám 0 và 255).
Ngưỡng θ trong kỹ thuật tách ngưỡng thường được cho bởi người sử dụng.
Kỹ thuật tìm tách ngưỡng tự động nhằm tìm ra ngưỡng θ một cách tự động dựa vào
histogram theo nguyên lý trong vật lý là vật thể tách làm 2 phần nếu tổng độ lệch
trong từng phần là tối thiểu.
Thuật toán OTSU [13] : ngưỡng k* tốt nhất được chọn là giá trị mà tại đó
làm cho sự chệnh Lệch giữa hai đoạn trên đồ thị đạt Cực đại

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

19


Luận Văn Tốt Nghiệp

 b2  a1a2 (m1  m2 ) 2

Trong đó a1, a2 là tần suất xuất hiện
Tương ứng của m1 và m2
Ngưỡng k* tốt nhất chính là

 b2

Hình 1-6 Ngưỡng động OTSU

Các phép tốn hình thái học trên ảnh
Các phép tốn hình thái học trên ảnh là các phép tốn liên quan đến cấu trúc
hình học của các đối tượng trong ảnh.
Phép toán dãn nở:
Phép toán này có tác dụng làm cho đối tượng ban đầu tăng lên về kích thước,
các lỗ nhỏ trong ảnh được lấp đầy, nối liền đường biên ảnh với những đoạn rời nhỏ
Cơng thức [20]
A⨁B= {c|c=a+b,a∈A,b∈B}
Trong đó:
Lê Anh Duy

Kỹ thuật Viễn thơng
Trang:

20


Luận Văn Tốt Nghiệp

A: Ma trận điểm ảnh của ảnh nhị phân
B: Là phần tử cấu trúc
Cấu trúc phần tử ảnh là một khối được định nghia sẵn nhằm tương tác với

ảnh xem nó có thỏa mãn một số tính chất nào đó hay khơng, một số cấu trúc phần
tử hay gặp là cấu trúc theo khối hình vng và hình chữ thập.
Phép tốn co:
Có ứng dụng trong việc giảm kích thước của đối tượng, tách rời các đối
thượng gần nhau và làm mảnh, tìm xương đối tượng.
Cơng thức [20]
A⊖B = {c | (B)_c ⊆A}
Trong đó:
A: Ma trận điểm ảnh của ảnh nhị phân.
B: Là phần tử cấu trúc.
Phép co ảnh sẽ cho ra một tập điểm ảnh c thuộc A, nếu đi chuyển phần tử
cấu trúc B theo c, thì B nằm trong đối tượng A.
Phép tốn mở
Giúp loại bỏ phần lồi lõm và làm đường bao của đối tượng trở nên mượt mà
hơn.
Công thức [20]
A∘B = (A⊖B) ⊕ B
Phép tốn đóng
Làm trơn đường bao của đối tượng, lấm đấy các khoảng trống trên đường
biên và loại bỏ những hố nhỏ.
Công thức [20]
A∙B = (A⊕B) ⊝ B

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

21



Luận Văn Tốt Nghiệp

Kỹ thuật phân vùng ảnh
Điểm biên và đường biên
Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc đột ngột
về mức xám hoặc màu, là phần không liên tục hoặc đoạn dốc về mặt cường độ của
điểm ảnh trong bức ảnh. [8]
Đường biên là tập hợp các điểm biên liên tiếp, đường biên là ranh giới giữa
các vùng xám.
Đường biên có ý nghĩa quan trọng trong kỹ thuật trích chọn đặc trưng, là đặc
trưng cục bộ tiêu biểu trong phân tích và nhận dạng ảnh.
Phân vùng ảnh sử dụng phương pháp nổi biên
Dùng lọc vi phân là phương pháp trung tâm trong tìm biên của đối tượng
trong ảnh. Để dễ hình dung, giả sử có một ảnh 1D. Một cạnh được chỉ ra là đoạn
nhảy bậc về mặt cường độ được chỉ ra ở Hình 1-8

Hình 1-7 Ví dụ về điểm biên trên đồ thị cường độ điểm ảnh. [21]
Đoạn “nhảy bậc” đó có thể dễ dàng thấy được nếu lấy vi phân bậc nhất [21]
(nó sẽ xuất hiện với giá trị cao nhất) như thấy trong hình 1-8.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

22


Luận Văn Tốt Nghiệp


Hình 1-8 Điểm biên trên đồ thị vi phân [21]
Vậy nên có thể tìm cạnh bằng cách thực hiện tìm vị trí pixel mà độ dốc của
nó cao hơn so với các pixel xung quanh (hoặc nói chung là cao hơn một ngưỡng nào
đó).
Q trình dị biên cơ bản

Hình 1-9 Q trình dị biên





Bước 1: Lọc nhiễu do ảnh ghi vào thường có nhiễu.
Bước 2: Làm nổi biên sử dụng các toán tử phát hiện biên.
Bước 3: Định vị biên (cần loại bỏ biên giả).
Bước 4: Liên kết và trích chọn biên.

Phương pháp dị biên trực tiếp
Phương pháp này dựa vào sự biến thiên cường độ xám của điểm ảnh theo
một phương bằng kỹ thuật đạo hàm.
Phương pháp Gradient sử dụng đạo hàm bậc nhất.
Phương pháp Laplace sử dụng đạo hàm bậc hai
Phương pháp dò biên gián tiếp
Phương pháp gián tiếp bằng cách tìm các vùng xám khác nhau, thì đường
Lê Anh Duy

Kỹ thuật Viễn thơng
Trang:


23


Luận Văn Tốt Nghiệp

phân cách giữa chúng là đường biên. Phương pháp này khó thực hiện nhưng hiệu
quả cao với các vùng xám có biến thiên nhỏ về cường độ xám.
Có nhiều phương pháp để tìm biên đối tượng như Sobel, Scharr… nhưng
phương pháp tìm biên Canny [1][9] là phương pháp được biết là tối ưu vì thỏa mãn
ba chỉ tiêu sau:
 Tỷ lệ lỗi thấp: chỉ tìm ra cạnh nếu như có cạnh thật.
 Chính xác: Khoảng cách giữa cạnh được phát hiện và cạnh thật được
giảm tới mức tối thiểu.
 Phản ứng tối thiểu: Chỉ phát hiện một cạnh cho mỗi cạnh thật.
Như vậy, trong chương này chúng ta đã biết được khái niệm chung về ảnh
số và các bước trong quá trình xử lý ảnh. Trong chương tiếp theo chúng ta sẽ tìm
hiểu về các phương pháp làm nổi biên của ảnh.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

24


Luận Văn Tốt Nghiệp

CÁC PHƯƠNG PHÁP LÀM NỔI BIÊN


Dò biên
Mục đích của việc dị biên nói chung là để giảm thiểu đáng kể số lượng trong
một hình ảnh, trong khi vẫn giữ được các đặc tính cấu trúc cần thiết để cho việc xử
lý hình ảnh sau đó.

Phương pháp Sobel
Tốn tử Sobel (Sobel operator) là một phương pháp được dùng trong tìm biên
ảnh (edge detection). Biên ảnh được tìm thơng qua sự thay đổi cường độ điểm ảnh
(pixel intensities). Một bức ảnh cũng như một tín hiệu, sự thay đổi của nó có chỉ có
thể tìm được nhờ đạo hàm, do đó tốn tử Sobel hay mặt nạ Sobel cũng như các loại
mặt nạ được dùng trong tìm biên ảnh còn được gọi là các mặt nạ đạo hàm (derivative
masks) hay toán tử đạo hàm (derivative operators). [24]
Toán tử Sobel tìm cạnh theo 2 hướng:
 Hướng ngang (Horizontal edge)
1. Hướng dọc (Vertical Edge)
Thuật toán
Mặt nạ Sobel
Hướng ngang: Hx
−1
[0
1

−2
0
2

Hướng dọc: Hy
−1
[−2
−1


−1
0]
1

0
0
0

1
2]
1

Gọi A là ảnh gốc, Gx và Gy lần lượt là 2 ảnh sau khi nhân chập ảnh với mặt
nạ theo hướng ngang và dọc. Ta có:

−𝟏
𝑮𝒙 = [ 𝟎
𝟏

−𝟐
𝟎
𝟐

−𝟏
𝑮𝒚 = [−𝟐
−𝟏

−𝟏
𝟎 ]∗𝑨

𝟏

𝟎
𝟎
𝟎

𝟏
𝟐] ∗ 𝑨
𝟏

* là phép nhân chập 2 ma trận.

Lê Anh Duy

Kỹ thuật Viễn thông
Trang:

25


×