Tải bản đầy đủ (.pdf) (74 trang)

Nghiên cứu phương pháp trích chọn đặc trưng ảnh dựa trên đối sánh hình dạng và ứng dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.85 MB, 74 trang )

I

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG




VŨ VÂN DU



NGHIÊN CỨU PHƢƠNG PHÁP TRÍCH CHỌN ĐẶC
TRƢNG ẢNH DỰA TRÊN ĐỐI SÁNH HÌNH DẠNG VÀ
ỨNG DỤNG

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01






LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH











Thái Nguyên - 2014

II

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


LỜI CẢM ƠN

Tôi xin chân thành cảm ơn PGS.TS Ngô Quốc Tạo, Viện Công nghệ Thông tin
thuộc Viện Khoa học và Công nghệ Việt Nam là cán bộ trực tiếp hướng dẫn khoa học
cho tôi trong quá trình thực hiện luận văn này.
Tôi xin chân thành cảm ơn các Thầy, Cô giáo, cán bộ trong trường Đại học Công
nghệ Thông tin và Truyền thông cùng các anh chị đồng nghiệp trong cơ quan đã tạo
những điều kiện thuận lợi cho tôi học tập và nghiên cứu tại trường Đại học Công nghệ
Thông tin và Truyền thông.
Xin chân thành cảm ơn các anh, các chị và các bạn học viên lớp Cao học CK11A
trường Đại học Công nghệ Thông tin và Truyền thông đã luôn động viên, giúp đỡ và
nhiệt tình chia sẻ với tôi những kinh nghiệm học tập, công tác trong suốt khoá học.
Cuối cùng, tôi muốn gửi lời cảm ơn tới gia đình, bạn bè, những người thân luôn
bên cạnh và động viên tôi trong suốt quá trình thực hiện luận văn tốt nghiệp.
Mặc dù rất cố gắng, song luận văn này không thể tránh khỏi những thiếu sót, kính
mong được sự chỉ dẫn của các quý thầy cô và các bạn.

Thái Nguyên, tháng 5 năm 2014
Tác giả



Vũ Vân Du
III

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

LỜI CAM ĐOAN


Tôi xin cam đoan rằng số liệu và kết quả nghiên cứu trong luận văn này là trung
thực và không trùng lặp với các đề tài khác. Tôi cũng xin cam đoan là
cho việc thực hiện luận văn này đã được cảm ơn và các thông tin trích dẫn trong luận
văn đã được chỉ rõ nguồn gốc.

Thái Nguyên, tháng 5 năm 2014
Tác giả


Vũ Vân Du


IV

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

MỤC LỤC

LỜI CẢM ƠN I
LỜI CAM ĐOAN III
MỤC LỤC IV
DANH MỤC CÁC HÌNH VẼ VI
DANH MỤC CÁC BẢNG BIỂU VII
DANH MỤC CÁC THUẬT NGỮ VIII
PHẦN MỞ ĐẨU 1
CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH 3
1.1. Tổng quan về thị giác máy tính 3
1.1.1. Thị giác con người và thị giác máy tính 3
1.1.2. Mối liên quan giữa thị giác máy tính và xử lý ảnh 4
1.1.3. Tầm quan trọng của thị giác máy tính 4
1.1.4. Ứng dụng của thị giác máy tính 5
1.2. Tổng quan về xử lý ảnh 8
1.2.1. Xử lý ảnh là gì? 8
1.2.2. Các vấn đề cơ bản trong xử lý ảnh 9
1.2.3. Một số khái niệm trong xử lý ảnh 12
1.2.4. Phương pháp biểu diễn ảnh 13
1.2.5. Biên và đường biên 14
1.2.6. Phân vùng ảnh 15
CHƢƠNG 2: MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƢNG HÌNH DẠNG
16
2.1. Các kỹ thuật phát hiện biên ảnh 18
2.2. Kỹ thuật phát hiện biên trực tiếp 19
2.2.1. Kỹ thuật phát hiện biên Gradient 19
2.2.2. Kỹ thuật phát hiện biên Laplace 23
2.2.3. Thuật toán làm mảnh biên 24
2.2.4. Một số phương pháp phát hiện biên trực tiếp khác 26
2.3. Phương pháp phát hiện biên gián tiếp 29
V


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

2.3.1. Kỹ thuật dò biên gián tiếp đơn giản 29
2.3.2. Kỹ thuật dò biên gián tiếp bằng cách xác định chu tuyến 30
2.4. Xử lý ảnh trong miền tần số và biến đổi Fourier 31
2.4.1. Biến đổi Fourier rời rạc (DFT) 34
2.4.2. Biến đổi Fourier nhanh (FFT) 34
2.5. Mô tả Fourier 35
2.6. Các bất biến moment 37
2.7. Các hàm xoay/góc xoay 37
2.8. Độ tròn, độ lệch tâm và hướng trục chính 38
CHƢƠNG 3: ỨNG DỤNG TRÊN BÀI TOÁN TRA CỨU BIỂN BÁO GIAO
THÔNG 40
3.1. Bài toán tra cứu biển báo giao thông 40
3.2. Phân tích bài toán 41
3.3. Xây dựng chương trình đối sánh biển báo giao thông 45
3.3.1. Sơ đồ khối 45
3.3.2. Đọc ảnh 46
3.3.3. Dò biên đối tượng ảnh 46
3.3.4. Resample 46
3.3.5. Biến đổi Fourier nhanh 47
3.3.6. Tạo véc tơ đặc trưng hình dạng cho ảnh 47
3.3.7. So sánh ảnh bằng cách tính khoảng cách Euclide 48
3.5. Đánh giá chương trình 50
3.5.1. Kết quả đạt được 50
3.5.2. Hạn chế 50
3.5.3. Khả năng mở rộng 50
KẾT LUẬN 51
TÀI LIỆU THAM KHẢO 53

PHỤ LỤC 54

VI

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC CÁC HÌNH VẼ

Hình 1.1: Mô phỏng hệ thống thị giác của con người 3
Hình 1.2: Mô phỏng hệ thống thị giác máy tính 3
Hình 1.3: Giao diện chương trình BKDoctor 6
Hình 1.4: Vị trí lắp đặt và màn hình hiển thị của hệ thống giám sát giao thông 7
Hình 1.5: Quá trình xử lý ảnh 8
Hình 1.6: Các bước cơ bản trong xử lý ảnh 8
Hình 1.7: Biểu diễn PPI và DPI 12
Hình 1.8: Ví dụ về các loại ảnh 13
Hình 1.9: Hướng các điểm biên và mã tương ứng 14
Hình 2.1: Biểu diễn hình dạng theo đường biên và theo vùng 16
Hình 2.2: Biểu diễn đường biên ảnh 17
Hình 2.3: Minh họa biên ảnh 18
Hình 2.4: Minh họa biên ảnh với độ sáng biến thiên không đột ngột 18
Hình 2.5: Ảnh minh họa làm mảnh biên 25
Hình 2.6: Hình biên ảnh sau khi dùng phương pháp Gradient 25
Hình 2.7: Hình sau khi làm mảnh biên 25
Hình 2.8: Minh họa nguyên lý Bellman. 27
Hình 2.9: Hình mô tả tìm biên theo phương pháp quy hoạch động 29
Hình 2.10: Miền thời gian và miền tần số 32
Hình 2.11: biểu diễn số phức thông qua cường độ và góc pha 33
Hình 2.12: Ảnh thực (a) và ảnh thu được sau biến đổi Fourier (b) 33
Hình 3.1: Một số biển báo có hình dạng cá biệt 44

Hình 3.2: Sơ đồ khối phần tra cứu ảnh theo hình dạng 45
Hình 3.3: Một số kết quả chạy thử chương trình 49

VII

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC CÁC BẢNG BIỂU

Bảng 1.1: Một số phần mềm tự động chấm bài thi trắc nghiệm 6
Bảng 2.1: So sánh đặc trưng và phương pháp khử nhiễu của hai loại nhiễu 10
Bảng 3.1: Một số loại biển báo giao thông ở Việt Nam 42
Bảng 3.2: Hình dạng đặc trưng của một số loại biển báo 43


VIII

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

DANH MỤC CÁC THUẬT NGỮ
Ảnh màu : Color Image
Ảnh số : Digial Image
Ảnh tương tự : Analog Image
Ảnh xám : Gray Image
Ảnh nhị phân : Binary Image
Ảnh cắt lớp vi tính : Computed Tomography (CT)
Biển báo giao thông : Traffic sign (Road sign)
Biến đổi Fourier nhanh : Fast Fourier Transform (FFT)
Biến đổi Fourier rời rạc : Discrete Fourier Transform (DFT)
Bộ số hoá : Digitalizer

Bức ảnh : Picture, Image
Cảm biến : Sensor
Đầu ra : Output
Đầu vào : Input
Điểm ảnh : Pixel
Độ phân giải : Resolution
Đường biên (đường bao) : Boundary
Hệ thống lai : Hybrid System
Khung hình : Frame
Làm mảnh biên : Non Maximal Suppression
Lọc vùng : Zonal Filtering
Mã loạt dài : Run-length Code
Mặt nạ đặc điểm : Feature mask
Máy ảnh : Camera
Máy ảnh điện tử : Electronic Camera
Máy quét : Scanner
Nhận dạng : Recognition
Nhận dạng tự động : Automatic recognition
Phần cứng : Hardware
Phần mềm : Software
Số điểm ảnh trên 1 inh : Pixels per inch (PPI)
Số điểm trên 1 inh : Dots per inch (DPI)
Thị giác con người : Human Vision
Thị giác máy tính : Computer Vision
Tín hiệu : Signal
Toán tử chéo không : Zero crossing
Xử lý ảnh : Image processing
1

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


PHẦN MỞ ĐẨU

Công nghệ Thông tin ngày càng phát triển và có vai trò hết sức quan trọng
không thể thiếu trong cuộc sống hiện đại. Con người ngày càng tạo ra những cỗ máy
thông minh có khả năng tự nhận biết và xử lý được các công việc một cách tự động,
phục vụ cho lợi ích của con người.
Trong những năm gần đây, một trong những bài toán nhận được nhiều sự quan
tâm của lĩnh vực công nghệ thông tin, đó chính là thị giác máy tính. Nó đã được các
nhà nghiên cứu quan tâm vì tính ứng dụng cao của bài toán cũng như sự phức tạp của
nó.
Bài toán nhận dạng là một phần quan trọng của thị giác máy tính. Nó được sử
dụng trong rất nhiều lĩnh vực như: nhận dạng con người, đồ vật, chữ viết, cử chỉ…
trong các lĩnh vực đó thì đều có những nhu cầu từ thực tiễn và tính ứng dụng lớn.
Trong nhận dạng ảnh, thường dùng các phương pháp trích chọn đặc trưng để đối sánh.
Một số phương pháp thường dùng như: trích chọn đặc trưng theo màu sắc, theo kết cấu
và theo hình dạng của ảnh.
Hiện tại, thị giác máy tính ứng dụng trong khá nhiều lĩnh vực như: y khoa, quân
sự, các lĩnh vực quản lý v.v… Trong lĩnh vực thông tin giao thông với 200 loại biển
báo thì việc nghi nhớ nội dung biển báo là một trở ngại lớn đối với người tham gia
giao thông. Vì vậy việc xây dựng một chương trình có thể nhận dạng và đưa ra các
thông tin cũng như cảnh báo đến người dùng là cần thiết.
Trong khuân khổ luận văn thạc sỹ tôi chọn để tài: “Nghiên cứu phƣơng pháp
trích chọn đặc trƣng ảnh dựa trên đối sánh hình dạng và ứng dụng” nhằm tìm
hiểu kỹ về các kỹ thuật trích chọn đặc trưng hình dạng của ảnh, hiểu rõ hơn bản chất
của bài toán tìm kiếm ảnh theo hình dạng từ đó áp dụng vào bài toán tra cứu biển báo
giao thông.


2


Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Luận văn gồm 3 chương với các nội dung sau:

Chương 1: Trình bày tổng quan về thị giác máy tính, xử lý ảnh, tầm quan trọng và
tình ứng dụng của thị giác máy tính trong cuộc sống.

Chương 2: Tìm hiểu về các phương pháp trích chọn đặc trưng hình dạng phục vụ
cho quá trình đối sánh theo hình dạng ảnh.

Chương 3: Thử nghiệm cài đặt chương trình tra cứu ảnh trên cơ sở việc nghiên cứu
các kỹ thuật trích chọn đặc trưng theo hình dạng.

3

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

CHƢƠNG 1: TỔNG QUAN VỀ XỬ LÝ ẢNH
1.1. Tổng quan về thị giác máy tính
1.1.1. Thị giác con ngƣời và thị giác máy tính
Thị giác con người là một hệ thống phức tạp có thể thu nhận thông tin từ môi
trường qua ánh sáng, xử lý và đưa ra kết quả là những suy nghĩ, hành động… Xét
theo một số tiêu chí thì thị giác máy tính và và thị giác con người có cùng chức năng
gần giống nhau. Mục đích của cả hai hệ thống là để xử lý dữ liệu với đầu vào là ảnh
và cho ra kết quả.
Hệ thống thị giác máy tính xử lý hình ảnh có được từ một máy ảnh điện tử, việc
này cũng giống như hệ thống thị giác của con người nơi mà não xử lý hình ảnh từ đôi
mắt.


Hình 1.1: Mô phỏng hệ thống thị giác của con người (nguồn: bionicvision.org.au)
Mặc dù thị giác máy tính và thị giác con người có chức năng tương tự, nhưng
khó có thể chế tạo một hệ thống thị giác máy tính có thể tái tạo chính xác chức năng
của thị giác người. Điều này phần lớn là do máy tính chưa mô phỏng được tâm lý học
thị giác.

Thu nhận ảnh
Xử lý ảnh
Kết quả
4

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Hình 1.2: Mô phỏng hệ thống thị giác máy tính
Thị giác máy tính là một chủ đề phong phú và bổ ích cho học tập và nghiên cứu của
các kỹ sư điện tử, khoa học máy tính và nhiều nhóm ngành khác. Trong thương mại,
thị giác máy tính ngày càng có một tương lai rộng mở. Và xử lý ảnh là một trong
những phần quan trọng trong thị giác máy tính.
1.1.2. Mối liên quan giữa thị giác máy tính và xử lý ảnh
Thị giác máy tính là một khái niệm mở bao trùm nhiều khái niệm khác nhau từ
phần cứng (máy ảnh, máy tính, bộ phận hiển thị, chấp hành…) đến các phần mềm (xử
lý, tổng hợp, điều khiển…) và xử lý ảnh là một trong những khâu quan trọng nhất của
thị giác máy tính.
1.1.3. Tầm quan trọng của thị giác máy tính
Là một trong năm giác quan của con người, thị giác là nơi tiếp nhận phần lớn
lượng thông tin tác động đến con người hàng ngày. Có thể nói, thị giác là giác quan
quan trọng nhất là có cơ sở khi có tới gần 25% nơ-ron thần kinh dùng để tiếp nhận và
xử lý các thông tin về hình ảnh.
Trong khi đó, trải qua một thời gian dài máy tính tiếp nhận dữ liệu bằng các thao
tác từ những đầu thu nhận. Giờ đây, nhu cầu đặt ra cho hệ thống xử lý dữ liệu cần xử

lý nhanh những dữ liệu thô, không chính xác của đầu vào. Và từ những yêu cầu này,
thị giác máy tính được quan tâm, nghiên cứu và phát triển trên khắp thế giới vì những
lợi ích lớn mà nó mang lại.
Nếu như trước đây chưa có ứng dụng của thị giác máy tính, số liệu từ giấy được
nhập chính xác bằng tay qua bàn phím thì giờ đây với công nghệ hiện đại, từ ảnh chụp
văn bản, máy tính có thể tự động nhập số liệu từ văn bản đó một cách nhanh chóng.
Hay trong một dây chuyền sản xuất công nghiệp. Để kiểm tra sắp xếp một sản phẩm
sau khi chế tạo, trước đây sử dụng công nhân hoặc rất nhiều các cảm biến với một hệ
thống thu nhận phức tạp thì giờ đây chỉ cần một máy ảnh cùng với hệ thống thị giác
máy tính có thể thực hiện công việc này một cách nhanh chóng và chính xác.

5

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.1.4. Ứng dụng của thị giác máy tính
Hiện nay có rất nhiều hệ thống thị giác máy tính được sử dụng thường xuyên
trong công nghiệp cũng như trong quân sự, y tế hay dân dụng…
Thời điểm hiện tại cũng có khá nhiều các công ty, tổ chức trong nước ứng dụng
những thành quả của xử lý ảnh để áp dụng cho ra những sản phẩm phục vụ cho nhu
cầu, đáp ứng được nhu cầu hiện tại. Ví dụ, với công việc chấm bài thi trắc nghiệm có
một số các giải pháp hệ thống tự động sau:

Bảng 1.1: Một số phần mềm tự động chấm bài thi trắc nghiệm
STT
Tên phần mềm
Tác giả
1
MarkRead 1.0
Phòng Nhận dạng & Công nghệ Tri thức - Viện CNTT

2
TestPro
Công ty TMSoft
3
SuperEMR
Công ty PSC
4
MR.Test
TT Nghiên cứu và Phát triển Công nghệ Phần mềm – ĐH
Công nghệ - ĐHQG HN

Ngoài các ứng dụng trong nước dành cho ngành giáo dục thì cũng có một số
các nghiên cứu ứng dụng xử lý ảnh áp dụng cho các ngành khác như y tế ví dụ như
một số chương trình do Bộ môn Vật lý Kỹ thuật y sinh, Trường Đại Học Bách Khoa –
Đại học Quốc gia Thành phố Hồ Chí Minh thực hiện:

BKDoctor: Chương trình tái tạo ảnh 3D từ các lớp cắt song song
IBK: Chương trình xử lý ảnh y khoa trên nền MATLAB
sgDICOM-J: Chương trình xử lý ảnh y khoa 3-D trên nền JAVA

6

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



Hình 1.3: Giao diện chương trình BKDoctor của Bộ môn Vật lý Kỹ thuật Y sinh,
Trường Đại Học Bách Khoa – ĐHQG TP.HCM
Trong ngành giao thông vận tải, xử lý ảnh đã và đang được phát triển mạnh mẽ,
phục vụ được nhiều nhu cầu liên quan đến độ an toàn của con người và phương tiện

tham gia giao thông.
Gần đây theo báo khoahocphothong.com.vn đưa tin. Các nhà khoa học thuộc
Khoa Điện - Điện tử, Trường Đại học Giao thông Vận tải đã nghiên cứu thiết kế và
chế tạo thành công hệ thống giám sát giao thông ứng dụng công nghệ xử lý ảnh. Hệ
thống bao gồm máy ảnh giám sát, máy ảnh chụp hình, mạng truyền thông, máy chủ
lưu trữ, phần mềm xử lý ảnh và cơ sở dữ liệu có thể tự động phát hiện và ghi nhận các
tình huống vi phạm luật Giao thông nhằm tăng cường giám sát, phát hiện và xử lý kịp
thời các vi phạm, hạn chế tai nạn và nâng cao ý thức chấp hành của người tham gia
giao thông.
Hệ thống này hiện đang được thử tại Km192+422 đường cao tốc Pháp Vân -
Cầu Giẽ. Trong điều kiện ánh sáng ban ngày và lưu lượng giao thông bình thường, hệ
thống cho kết quả khá tốt. Về chức năng phát hiện xe chuyển làn trái phép, kết quả
tính toán bằng máy được so sánh với kết quả quan sát bằng mắt thường cho thấy, độ
chính xác của phần mềm là 97%. Kết quả phát hiện xe chạy quá tốc độ được so sánh
với súng bắn tốc độ theo nguyên lý Rada, sai số của phần mềm so với súng là 5%.”
7

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên



Hình 1.4: Vị trí lắp đặt và màn hình hiển thị của hệ thống giám sát giao thông

Đây có thể nói là một giải pháp tốt, giúp cho các đơn vị quản lý giảm bớt được
thời gian và công sức trong việc giám sát và xử lý vi phạm.

8

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên


1.2. Tổng quan về xử lý ảnh
1.2.1. Xử lý ảnh là gì?
Trong ngành khoa học hình ảnh, xử lý ảnh là hình thức xử lý tín hiệu mà đầu
vào là một hình ảnh, chẳng hạn như một bức ảnh hoặc khung hình của đoạn phim; đầu
ra của xử lý hình ảnh có thể là một hình ảnh, một tập hợp các đặc điểm hoặc các thông
số liên quan đến hình ảnh.

Hình 1.5: Quá trình xử lý ảnh
Có thể hiểu một cách khác, xử lý ảnh bao gồm tất cả các lý thuyết và kỹ thuật
liên quan, cho phép tạo lập một hệ thống có khả năng tiếp nhận thông tin từ các hình
ảnh thu được, lưu trữ và xử lý theo nhu cầu.
Sơ đồ tổng quát của một hệ thống xử lý ảnh [1]:

Hình 1.6: Các bước cơ bản trong xử lý ảnh

Thu
nhận ảnh
Tiền
xử lý
Trích chọn
đặc điểm
Hậu
xử lý
Hệ
quyết định
Đối sánh, rút
ra kết luận

Lưu trữ




 
 
Kết luận
Ảnh tốt hơn
Xử lý ảnh

Ảnh



9

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.2.2. Các vấn đề cơ bản trong xử lý ảnh
1.2.2.1. Thu nhận ảnh
Đây là bước đầu tiên trong quá trình xử lý ảnh. Để thực hiện bước này cần có các
thiết bị nhu nhận ảnh như máy ảnh, máy quét. Các thiết bị thu nhận này có thể cho ảnh
đen trắng hoặc ảnh màu.
Các thiết bị thu nhận ảnh có 2 loại chính ứng với 2 loại ảnh thông dụng là Raster
và Vector. Các thiết bị thu nhận ảnh Raster thông thường là máy ảnh, còn các thiết bị
thu nhận ảnh Vector là cảm biến, bộ số hóa hoặc được chuyển đổi từ ảnh Raster.
Thông thường các hệ thống thu nhận ảnh thực hiện 2 khối:
Khối cảm biến: biến đổi năng lượng quang học thành năng lượng điện.
Khối xử lý: Tổng hợp năng lượng điện thành ảnh.
1.2.2.2. Tiền xử lý
Ở bước này, ảnh sẽ được cải thiện về độ tương phản, khử nhiễu, khôi phục ảnh,
nắn chỉnh hình học… Với mục đích làm cho chất lượng ảnh trở nên tốt hơn, chuẩn bị

cho các bước xử lý sau đó.
Khử nhiễu: Nhiễu được chia thành hai loại:
Bảng 1.1: So sánh đặc trưng và phương pháp khử nhiễu của hai loại nhiễu
Loại nhiễu
Nhiễu hệ thống
Nhiễu ngẫu nhiên
Đặc trưng
Có quy luật
Không có quy luật
Phương pháp khử nhiễu
Phép biến đổi
Phương pháp nội suy, lọc
trung vị, lọc trung bình

Chỉnh mức xám: Là kỹ thuật nhằm chỉnh sửa tính không đồng đều của thiết bị
thu nhận hoặc độ tương phản giữa các vùng ảnh.
10

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Chỉnh tán xạ: Ảnh thu nhận từ các thiết bị quang học hay điện tử có thể bị mờ,
nhòe. Phương pháp biến đổi Fourier dựa trên tích chập của ảnh với hàm tán xạ cho
phép giải quyết việc hiệu chỉnh này.
Nắn chỉnh hình học: Những biến dạng hình học thường do các thiết bị điện tử
và quang học gây ra. Do đó phương pháp hiệu chỉnh hình ảnh dựa trên mô hình được
mô tả dưới dạng phương trình biến đổi ảnh biến dạng f(x,y) thành ảnh lý tưởng f(x’,y’)
như sau:
(1.1)
Trong đó, là các phương trình tuyến tính (biến dạng do phối cảnh) hay phương
trình bậc hai (biến dạng do ống kính camera).

1.2.2.3. Trích chọn đặc điểm
Lượng thông tin chứa trong ảnh là rất lớn, trong khi đó đa số ứng dụng chỉ cần
một số thông tin đặc trưng. Bước trích chọn đặc điểm sẽ trích xuất lượng thộng tin hữu
ích từ khối thông tin khổng lồ đó. Việc trích chọn hiệu quả đặc điểm giúp cho việc
nhận dạng các đối tượng ảnh chính xác, tốc độ tính toán cao và dung lượng nhớ lưu trữ
giảm xuống.
Các đặc điểm của đối tượng được trích chọn tùy theo mục đích nhận dạng theo
một số đặc điểm của ảnh sau đây:
o Đặc điểm không gian: Phân bố mức xám, xác suất, biên độ, điểm uốn, v.v
o Đặc điểm biến đổi: Các đặc điểm loại này được trích chọn bằng việc thực hiện lọc
vùng. Các bộ vùng được gọi là mặt nạ đặc điểm thường là các khe hẹp với hình
dạng khác nhau (chữ nhật, tam giác, cung tròn…).
o Đặc điểm biên và đƣờng biên: Đặc trưng cho đường biên của đối tượng và do rất
hữu ích trong việc trích chọn các đặc tính bất biến nên thường được dùng khi nhận
dạng đối tượng. Các đặc điểm này có thể được trích chọn nhờ toán tử Gradien, toán
tử Laplace, toán tử Cross Zero
11

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.2.2.4. Đối sánh, nhận dạng
Nhận dạng tự động, mô tả đối tượng, phân loại và phân nhóm các mẫu là những
vấn đề quan trọng trong thị giác máy, được ứng dụng trong nhiều ngành khoa học khác
nhau. Ví dụ mẫu có thể là ảnh của vân tay, ảnh của một vật nào đó được chụp, một chữ
viết, khuôn mặt người hoặc một ký đồ tín hiệu tiếng nói… Khi biết một mẫu nào đó,
để nhận dạng hoặc phân loại mẫu đó.
Hệ thống nhận dạng tự động bao gồm ba khâu tương ứng với ba giai đoạn chủ
yếu sau đây:
Thu nhận dữ liệu và tiền xử lý.
Biểu diễn dữ liệu.

Nhận dạng, ra quyết định.
Bốn cách tiếp cận khác nhau trong lý thuyết nhận dạng:
Đối sánh mẫu dựa trên các đặc trưng được trích chọn.
Phân loại thống kê.
Đối sánh cấu trúc.
Phân loại dựa trên mạng nơ-ron nhân tạo.
Trong các ứng dụng không thể chỉ dùng có một cách tiếp cận đơn lẻ để phân loại
tối ưu nên cần sử dụng cùng một lúc nhiều phương pháp và cách tiếp cận khác nhau.
Do vậy, các phương thức phân loại tổ hợp hay được sử dụng khi nhận dạng và nay đã
có những kết quả có triển vọng dựa trên thiết kế các hệ thống lai bao gồm nhiều mô
hình kết hợp.

12

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.2.3. Một số khái niệm trong xử lý ảnh
1.2.3.1. Ảnh tƣơng tự, điểm ảnh và ảnh số
Ảnh tương tự là một bức ảnh được lưu trữ trên phim, giấy, gỗ… Ảnh tương tự là
ảnh liên tục về không gian và độ sáng. Để xử lý bằng máy tính, ảnh tương tự cần phải
được số hoá.
Số hoá ảnh là sự biến đổi gần đúng một ảnh tương tự thành một tập điểm phù
hợp với ảnh thật về vị trí (không gian) và độ sáng (mức xám). Khoảng cách giữa các
điểm ảnh đó được thiết lập sao cho mắt người không phân biệt được ranh giới giữa
chúng. Mỗi một điểm như vậy gọi là điểm ảnh và tập hợp các điểm ảnh theo một tiêu
chuẩn được gọi là một ảnh số.

1.2.3.2. Độ phân giải, mật độ điểm ảnh
Độ phân giải là số lượng điểm ảnh của một ảnh số. Độ phân giải của ảnh được
đo bằng đơn vị pixel. Hiện nay số lượng điểm ảnh đã lên tới hàng triệu và thường

được biểu diễn bằng đơn vị Megapixel (Mpx).
Mật độ điểm ảnh: Là số lượng
điểm ảnh trên một đơn vị diện tích. Mật
độ điểm ảnh cho biết có thể in ra đẹp hay
hiển thị lên màn hình tốt hay không.
Thường dùng đơn vị PPI hoặc DPI. PPI
dùng trong việc hiển thị lên màn hình, còn
DPI dùng trong in ấn.
Ví dụ: thông thường, một bức ảnh
chụp trên máy ảnh Canon 50D có độ phân
giải 15,1Mpx và mật độ điểm ảnh là
72DPI.

Hình 1.7: Biểu diễn PPI và DPI

13

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.2.3.3. Ảnh màu, ảnh xám và ảnh nhị phân
Ảnh màu: Xét một ảnh màu trong hệ màu RGB, mỗi điểm ảnh của ảnh bao
gồm 3 giá trị màu: đỏ, xanh lục, xanh lam. Mỗi màu có giá trị từ 0 đến 255, nghĩa là
mỗi điểm ảnh cần 3 byte hay 24 bit để biểu diễn.
Ảnh xám: mỗi điểm ảnh của ảnh xám mang giá trị trong khoảng từ 0 đến 255,
nghĩa là cần 8 bit hay 1 byte để biểu diễn mỗi điểm ảnh. Mức xám của điểm ảnh là
cường độ sáng của nó được gán bằng giá trị số tại điểm đó. Giá trị mức xám thông
thường: 16, 32, 64, 128, 256.

Ảnh màu Ảnh xám Ảnh nhị phân
Hình 1.8: Ví dụ về các loại ảnh

Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt. Nói cách khác: mỗi
điểm ảnh của ảnh nhị phân chỉ có thể mang giá trị là 0 hoặc 1.
1.2.4. Phƣơng pháp biểu diễn ảnh
Sau khi thu nhận và số hóa, ảnh sẽ được lưu trữ hay chuyển sang giai đoạn phân
tích. Dưới đây là một số phương pháp biểu diễn ảnh trên bộ nhớ máy tính.
1.2.4.1. Mã loạt dài
Mã loạt dài hay dùng để biểu diễn cho vùng ảnh hay ảnh nhị phân. Một vùng
ảnh R có thể biểu diễn đơn giản nhờ một ma trận nhị phân:
(1.2)
Với các biểu diễn trên, một vùng ảnh hay ảnh nhị phân đựoc xem như chuỗi 0
hay 1 đan xen. Các chuỗi này được gọi là mạch (run). Theo phương pháp này, mỗi
mạch sẽ được biểu diễn bởi địa chỉ bắt đầu của mạch và chiều dài mạch theo dạng
{<hàng,cột>, chiều dài}.
14

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

1.2.4.2. Mã xích
Mã xích thường được dùng để biểu diễn biên của ảnh. Thay vì lưu trữ toàn bộ
ảnh thì lưu trữ dãy các điểm ảnh như A, B…M. Theo phương pháp này, 8 hướng của
vectơ nối 2 điểm biên liên tục được mã hóa. Khi đó ảnh được biểu diễn qua điểm ảnh
bắt đầu A cùng với chuỗi các từ mã. Điều này được minh họa trong hình dưới đây:

Hình 1.9: Hướng các điểm biên và mã tương ứng
1.2.4.3. Mã tứ phân
Theo phương pháp mã tứ phân, một vùng ảnh coi như bao kín một hình chứ
nhật. Vùng này được chia làm 4 vùng con (Quadrant). Nếu một vùng con gồm toàn
điểm đen (1) hay toàn điểm trắng (0) thì không cần chia tiếp. Trong trường hợp ngược
lại, vùng con gồm cả điểm đen và trắng gọi là vùng không đồng nhất, tiếp tục chia
thành 4 vùng con tiếp và kiểm tra tính đồng nhất của các vùng con đó.

Quá trình chia dừng lại khi mỗi vùng con chỉ chứa thuần nhất điểm đen hoặc
điểm trắng. Quá trình đó tạo thành một cây chia theo bốn phần gọi là cây tứ phân. Như
vậy, cây biểu diễn ảnh gồm một chuỗi các ký hiệu b (black), w (white) và g (grey) kèm
theo ký hiệu mã hóa 4 vùng con.
1.2.5. Biên và đƣờng biên
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh hoặc
đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm biên
nếu lân cận nó có ít nhất một điểm trắng.
15

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Đƣờng biên: tập hợp các điểm biên liên tiếp tạo thành một đường biên hay
đường bao.
Ý nghĩa của đƣờng biên: đường biên là một loại đặc trưng cục bộ tiêu biểu
trong phân tích, nhận dạng ảnh. Biên được sử dụng làm phân cách các vùng xám
(màu) cách biệt.
1.2.6. Phân vùng ảnh
Phân vùng ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích
ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên
thông. Tiêu chuẩn để xác định các vùng liên thông có thể là cùng mức xám, cùng
màu…
Vùng ảnh là một chi tiết, một thực thể trong toàn cảnh. Nó là một tập hợp các
điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu, độ nhám…
Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng ảnh là nói đến tính chất bề
mặt. Đường bao quanh một vùng ảnh là biên ảnh. Các điểm trong một vùng ảnh có độ
biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương đồng.
Dựa vào đặc tính vật lý của ảnh, có nhiều kỹ thuật phân vùng: phân vùng dựa
theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề, phân
vùng dựa vào biên gọi là phân vùng biên. Ngoài ra còn có các kỹ thuật phân vùng khác

dựa vào biên độ, phân vùng dựa theo kết cấu.

16

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

CHƢƠNG 2: MỘT SỐ KỸ THUẬT TRÍCH CHỌN ĐẶC TRƢNG HÌNH DẠNG
Các đặc điểm hình dạng của các vùng ảnh và các đối tượng ảnh được sử dụng
trong rất nhiều hệ thống tra cứu ảnh. So với các đặc điểm về màu sắc và các đặc điểm
về kết cấu thì các đặc điểm về hình dạng thường chỉ được sử dụng sau khi ảnh đã phân
thành các vùng hoặc các đối tượng ảnh.
Các phương pháp trích chọn đặc điểm hình dạng thường được chia thành hai loại
là trích chọn dựa theo đường biên và trích chọn dựa theo vùng ảnh.
Một phương pháp trích chọn đặc điểm hình dạng tốt phải đảm bảo yêu cầu là phải
không phụ thuộc vào vị trí, góc quay hay sự co giãn của đối tượng ảnh.
Trước khi áp dụng các phương pháp trích chọn đặc điểm hình dạng, các đối tượng
ảnh cần phải được tách ra khỏi ảnh. Giả sử là trong mỗi ảnh chỉ có một đối tượng ảnh
duy nhất, nhiệm vụ của hệ thống trước hết là phải tách được đối tượng ảnh ra khỏi nền
ảnh.
Cách biểu diễn hình dạng của đối tượng ảnh có thể chia thành hai kiểu:
Theo đường bao quanh (biên)
Theo vùng
Cách biểu diễn theo đường viền bao quanh chỉ sử dụng đường biên bên ngoài của
hình dạng, điều này có thể thực hiện được bằng cách mô tả vùng đó bằng cách đặc tính
bên ngoài của nó tức là các điểm ảnh dọc theo đường viền bao quanh đối tượng. Cách
biểu diễn theo vùng sử dụng cả vùng ảnh bằng cách mô tả vùng đang quan tâm bằng
các đặc tính bên trong tức là các điểm ảnh ở bên trong vùng đó.

Hình 2.1: Biểu diễn hình dạng theo đường biên và theo vùng


17

Số hóa bởi Trung tâm Học liệu – Đại học Thái Nguyên

Một số khái niệm:
Màu sắc và kết cấu là những thuộc tính có khái niệm toàn cục của một bức ảnh.
Trong khi đó, hình dạng không phải là một thuộc tính của ảnh. Thay vì vậy, hình dạng
có khuynh hướng chỉ định tới một khu vực đặc biệt của ảnh. Sau đây là một vài khái
niệm quan trọng để hiểu cốt lõi của tìm ra hình dạng ảnh.
Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh
hoặc đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là
điểm biên nếu lân cận nó có ít nhất một điểm trắng.
Đường biên: tập hợp các điểm biên liên tiếp tạo thành một đường biên hay
đường bao.
Ý nghĩa của đường biên trong xử lý: ý nghĩa đầu tiên: đường biên là một loại
đặc trưng cục bộ tiêu biểu trong phân tích, nhận dạng ảnh. Thứ hai, sử dụng biên
làm phân cách các vùng xám (màu) cách biệt. Ngược lại, cũng sử dụng các vùng ảnh
để tìm đường phân
cách.

Tầm quan trọng của biên: để thấy rõ tầm quan trọng của biên, xét ví dụ sau:
khi người họa sỹ muốn vẽ một danh nhân, họa sỹ chỉ cần vẽ vài đường nứt tốc họa
mà không cần vẽ một cách
đầy đủ.

Mô hình biểu diễn đường biên, theo toán học: điểm ảnh có sự biến đổi mức
xám u(x) một cách đột ngột theo hình dưới.[4]







a, Đường biên lý tưởng b, Đường biên bậc thang c, Đường biên thực

Hình 2.2: Biểu diễn đường biên ảnh
u
u
u
x
x
x

×