Tải bản đầy đủ (.pdf) (78 trang)

Ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.8 MB, 78 trang )

NGUYỄN THỪA PHÁT TÀI

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

NGUYỄN THỪA PHÁT TÀI

*

ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG
PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI
KHOA HỌC MÁY TÍNH

LUẬN VĂN THẠC SĨ KHOA HỌC
CHUYÊN NGÀNH KHOA HỌC MÁY TÍNH
*
KHÓA K32
Đà Nẵng - Năm 2018


ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA
------------------------

NGUYỄN THỪA PHÁT TÀI

ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG
PHÂN TÍCH MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI

Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 60.48.01



LUẬN VĂN THẠC SĨ
KỸ THUẬT

NGƢỜI HƢỚNG DẪN KHOA HỌC
1. TS. Huỳnh Hữu Hƣng

Đà Nẵng - Năm 2018


-i-

LỜI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số liệu, kết quả
nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình
nào khác.
Tác giả

Nguyễn Thừa Phát Tài


-ii-

MỤC LỤC
MỞ ĐẦU
1. Lý do chọn đề tài ......................................................................................................... 1
2. Mục tiêu và nhiệm vụ nghiên cứu ............................................................................... 1
3. Đối tƣợng và phạm vi nghiên cứu ............................................................................... 1
4. Phƣơng pháp nghiên cứu ............................................................................................. 1
5. Ý nghĩa khoa học và thực tiễn của luận văn ................................................................ 2

6. Bố cục luận văn: .......................................................................................................... 2
CHƢƠNG 1 - TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH
1.1 Các bƣớc cơ bản trong xử lý ảnh số ......................................................................... 3
1.1.1 Thu nhận ảnh .................................................................................................... 3
1.1.2 Tiền xử lý ......................................................................................................... 3
1.1.3 Phân đoạn hay phân vùng ảnh ......................................................................... 3
1.1.4 Biểu diễn ảnh ................................................................................................... 3
1.1.5 Nhận dạng và nội suy ảnh ................................................................................ 4
1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số .................................................................. 4
1.2.1 Điểm ảnh .......................................................................................................... 4
1.2.2 Mức xám của ảnh ............................................................................................. 4
1.2.3 Ảnh đen trắng ................................................................................................... 4
1.2.4 Ảnh nhị phân .................................................................................................... 5
1.2.5 Ảnh màu ........................................................................................................... 5
1.3 Cải thiện ảnh sử dụng toán tử điểm .......................................................................... 5
1.3.1 Tăng giảm độ sáng ........................................................................................... 5
1.3.2 Tăng độ tƣơng phản ......................................................................................... 6
1.3.3 Tách nhiễu và lấy ngƣỡng ................................................................................ 7
1.3.4 Biến đổi âm bản ............................................................................................... 7
1.3.5 Biến đổi ảnh đen trắng ..................................................................................... 7
1.3.6 Lƣợc đồ xám(Histogram)................................................................................. 8
1.3.7 Kỹ thuật cải thiện ảnh nhị phân ....................................................................... 9
1.4 Trích rút đặt trƣng ảnh ............................................................................................ 11
1.4.1 Đặc trƣng màu sắc.......................................................................................... 11
1.4.2 Đặc trƣng kết cấu ........................................................................................... 12
1.4.3 Đặc trƣng hình dáng ....................................................................................... 14
1.5 Phƣơng pháp nhận dạng. ......................................................................................... 15
1.5.1 Khái niệm nhận dạng ..................................................................................... 15
1.5.2 Support vector machine (SVM) ..................................................................... 15
1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors) ............................................... 16

1.5.4 Mô hình Markov ẩn (Hidden Markov Models) ............................................. 16
1.5.5 Mạng nơ-ron nhân tạo16
1.6 Đánh giá ƣu điểm của thuật toán SVM ................................................................... 16
1.7 KẾT CHƢƠNG ...................................................................................................... 17


-iiiCHƢƠNG 2 – PHƢƠNG PHÁP NHẬN DẠNG VÀ PHÂN LOẠI
2.1 Các công trình nghiên cứu liên quan ...................................................................... 18
2.2 Trích xuất đặc trƣng trong đánh và phân loại trái cây ............................................ 18
2.2.1 Sử dụng đặc trƣng màu sắc ............................................................................ 19
2.2.2 Trích chọn đặc trƣng màu cho bài toán so màu lá lúa ................................... 19
2.2.3 Sử dụng đặc trƣng kết cấu.............................................................................. 21
2.2.4 Sử dụng đặc trƣng Gist và Gist descriptor ..................................................... 22
2.3 Các phƣơng pháp phân loại trái cây........................................................................ 23
2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây ......................... 23
2.3.2 Kết hợp các thống kê màu sắc và đặc trƣng kết cấu để nhận biết bệnh táo... 26
2.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu lá lúa ..................... 31
2.4 KẾT CHƢƠNG ...................................................................................................... 38
CHƢƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG CHẨN ĐOÁN
BỆNH TRÊN XOÀI
3.1 Phƣơng pháp phân lớp dữ liệu máy vector h trợ SVM ......................................... 39
3.1.1 Giới thiệu ....................................................................................................... 39
3.1.2 Ý tƣởng của phƣơng pháp .............................................................................. 39
3.1.3 Các bƣớc chính của phƣơng pháp .................................................................. 40
3.1.4 Cơ sở lý thuyết ............................................................................................... 40
3.2 Chẩn đoán bệnh trên xoài với máy vetor h trợ SVM. ........................................... 43
3.2.1 Mô tả bài toán ................................................................................................ 43
3.2.2 Mô hình giải quyết bài toán ........................................................................... 44
3.3 Tiền xử lý ................................................................................................................ 44
3.3.1 Tăng/giảm độ tƣơng phản của ảnh ................................................................. 44

3.3.2 Thực hiện phép co/giãn ảnh ........................................................................... 45
3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V ................................... 45
3.4 Trích chọn đặc trƣng ............................................................................................... 46
3.4.1 Đặc trƣng màu sắc.......................................................................................... 46
3.4.2 Đặc trƣng kết cấu ........................................................................................... 47
3.5 Thực nghiệm ........................................................................................................... 51
3.5.1 Tập mẫu trái xoài ........................................................................................... 51
3.5.2 Tập mẫu lá xoài .............................................................................................. 51
3.5.3 Xử lý .............................................................................................................. 52
3.5.4 Huấn luyện và chẩn đoán bệnh ứng dụng máy vetor h trợ SVM54
3.6 Kết quả chẩn đoán ................................................................................................... 55
3.6.1 Lá bệnh thán thƣ ............................................................................................ 55
3.6.2 Bệnh ghẻ lồi trên lá xoài .............................................................................. 56
3.6.3 Lá xoài không bệnh ........................................................................................ 56
3.7 KẾT CHƢƠNG ...................................................................................................... 57
KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN ................................................................. 57
MỤC LỤC .................................................................................................................... 56


-ivỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH MẪU VÀ CHẨN
ĐOÁN BỆNH TRÊN CÂY XOÀI
Học viên: Nguyễn Thừa Phát Tài; Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01; Khóa: 2016-2018 Trƣờng Đại học Bách khoa - ĐHĐN
Tóm tắt –Ứng dụng kỹ thuật nhận dạng và xử lý ảnh trong bài toán nhận dạng và phân
loại nông sản đã đƣợc ứng dụng khá thành công, các hệ thống đã giúp nâng cao năng suất lao
động, mang lại hiệu quả về mặt kinh tế, khẳng định vai trò thực tiễn của công nghệ thông tin,
tự động hóa ứng dụng trong cuộc sống, những năm gần đây, phƣơng pháp sử dụng bộ phân
loại máy h trợ vector (Support Vector Machine - SVM) đƣợc quan tâm và áp dụng nhiều
trong lĩnh vực nhận dạng và phân loại trong nông nghiệp. Từ các công trình khoa học đã công
bố cho thấy phƣơng pháp SVM có khả năng nhận dạng tốt đối với các bài toán trong lĩnh vực

nhận dạng và phân loại cũng nhƣ trong nhiều ứng dụng khác. Luận văn này nghiên cứu ứng
dụng kĩ thuật Support Vector Machine để nhận dạng mẫu và chẩn đoán bệnh trên Xoài thông
qua ảnh chụp sử dụng phƣơng pháp phân lớp SVM. Kết quả thực nghiệm với độ chính xác
phân loại trên 96% cho thấy sự thành công của việc áp dụng phƣơng pháp SVM vào việc chẩn
đoán bệnh trên cây Xoài thông qua ảnh chụp, đồng thời cho thấy khả năng xây dựng những
ứng dụng thực tiễn có hiệu quả từ cách tiếp cận này.
Từ khóa - chẩn đoán bệnh trên cây Xoài; máy vectơ h trợ; nhận dạng mẫu; nhận dạng
loài cây; phân lớp ảnh chụp lá cây.
Abstract - The application of image recognition and processing techniques in the
identification and classification of agricultural products has been proved relatively successful.
The systems have helped improve labor productivity, bring economic efficiency, as well as
emphasize the practical role of information technology, applied automation in life. In recent
years, the use of Support Vector Machine (SVM) has been taken into serious consideration
and extensively applied in the field of identification and classification in agriculture.
Published scientific work shows that the SVM method can identify the problems in the field
of identification and classification as well as in many other applications. This thesis studies
the application of Support Vector Machine technique to identify specimens and diagnose
diseases on mango through photos using SVM classification method. Experimental results
with the accuracy of over 96% indicate the success of applying the SVM method to the
diagnosis of mango disease through photos, and demonstrates the potential for developing
effective practical applications from this approach.
Key words 1- the diagnosis of mango disease; Support Vector Machine; Specimen
identification; image classification; leaf recognition


-v-

DANH MỤC CÁC CHỮ VIẾT TẮT
Từ viết tắt
Tiếng Anh

ANN
Artificial Neural Networks
CM
Convolution Mask
GLCM
Gray-Level Co-occurrence Matrices
HMM
Hidden Markov Models
HSV

Hue, Saturation, Value

KNN
MLP
PE
P-M
QP
RGB

K-Nearest Neighbors algorithm
MultiLayer Perceptron
Processing Element
McCulloch and Pitts
Quadratic Programing
Red, Green,Blue

SDM

Size-dependent measurements


SIM

Size-independent measurements

SOM

Self – Organizing Map

SVM
XLA

Support Vector Machine

Tiếng Việt
Mạng nơron
Mặc nạ cuộn
Ma trận đồng hiện mức xám
Mô hình Markov ẩn
Vùng màu, Độ bão hòa màu,
Độ sáng
K -láng giềng gần nhất
Mạng Perceptron nhiều tầng
Phần tử xử lý
McCulloch và Pitts
Quy hoạch toàn phƣơng
màu đỏ, xanh lục, xanh lơ
Đo lƣờng phụ thuộc vào kích
thƣớc
Đo lƣờng không phụ thuộc vào
kích thƣớc

Kiểu học không có giám sát
trong mạng nơron
Máy vectơ h trợ
Xử lý ảnh


-vi-

DANH MỤC HÌNH
Hình 1.1 Các bƣớc trong xử lý ảnh ................................................................................. 3
Hình 1.2 Ảnh xám ngƣỡng 255 ....................................................................................... 4
Hình 1.3 Ảnh trắng đen ................................................................................................... 5
Hình 1.4 Ảnh nhị phân .................................................................................................... 5
Hình 1.5 Ảnh màu ........................................................................................................... 5
Hình 1.6 Ảnh tăng/giảm độ sáng .................................................................................... 6
Hình 1.7 Biểu đồ giãn độ tƣơng phản ............................................................................. 6
Hình 1.8 Ảnh khi tăng tƣơng độ phản ............................................................................. 6
Hình 1.9 Ảnh âm bản....................................................................................................... 7
Hình 1.10 Ảnh trắng đen ................................................................................................. 7
Hình 1.11 Lƣợc đồ mức xám của các loại ảnh ................................................................ 8
Hình 1.12 Biểu đồ lƣợc đồ xám (Histogram) của ảnh .................................................... 9
Hình 1.13 Cân bằng mức xám của ảnh............................................................................ 9
Hình 1.14 Minh hoạ của phép giãn ảnh......................................................................... 10
Hình 1.15 Ứng dụng của phép co ảnh ........................................................................... 10
Hình 1.16 Không gian màu RGB .................................................................................. 11
Hình 1.17 Không gian màu HSV .................................................................................. 12
Hình 1.18 H2 là siêu phẳng tốt nhất .............................................................................. 15
Hình 1.19 Mô hình một nơ-ron nhân tạo ....................................................................... 16
Hình 2.1 Minh họa trích đặc trƣng màu với moment thứ nhất ...................................... 20
Hình 2.2 Minh họa trích đặc trƣng màu với 3 moment màu ......................................... 20

Hình 2.3 Minh họa hiệu suất của bộ mô tả dựa trên kết cấu ......................................... 22
Hình 2.4 Mô hình phân biệt phần cuống với các khiếm khuyết trên trái cây ............... 23
Hình 2.5 (a) Trái cây đầu vào với phần cuống và phần khiếm khuyết ......................... 24
Hình 2.6 (a) Hình ảnh đầu vào, (b) Kết quả phân đoạn chuyển dịch trung bình, ......... 25
Hình 2.7 (a) Vòng tròn đƣợc áp thủ công trong các đối tƣợng, .................................... 26
Hình 2.8 Hệ thống nhận dạng bệnh trái táo ................................................................... 27
Hình 2.9 Một số kết quả phân đoạn khiếm khuyết ........................................................ 28
Hình 2.10 Hình ảnh mẫu từ bộ dữ liệu .......................................................................... 29
Hình 2.11 Mô hình hệ thống ......................................................................................... 31
Hình 2.12 Cắt/chọn phần lá lúa cần so màu .................................................................. 31
Hình 2.13 Xử lý nhiễu ................................................................................................... 32
Hình 2.14 Sơ đồ kỹ thuật so khớp ảnh .......................................................................... 34
Hình 2.15 Cấu trúc tập dữ liệu kiểu arff ........................................................................ 34
Hình 2.16 Mô hình phân lớp ảnh với kỹ thuật K láng giềng......................................... 36
Hình 2.17 Biểu đồ so sánh kết quả thực nghiệm kỹ thuật so khớp ảnh với K-NN ....... 37
Hình 3. 1 Siêu phân hoạch tập mẫu từ không gian Rn sang không gian Rd ................. 39


-viiHình 3. 2 Siêu phẳng phân chia dữ liệu với khoảng cách biên lớn nhất ....................... 39
Hình 3. 3 Minh họa cho bài toán phân hai lớp .............................................................. 40
Hình 3. 4 Minh họa bài toán phân hai lớp với SVM ..................................................... 41
Hình 3. 5 Bài toán SVM mẫu trong trƣờng hợp không phân tách tuyến tính ............... 41
Hình 3. 6 Hàm nhận dạng của SVM 2-vs-rest có giá trị bé nhất, nên mẫu cần nhận
dạng là lớp thứ 2 ............................................................................................................ 42
Hình 3. 7 SVM loại trừ .................................................................................................. 42
Hình 3. 8 Sơ đồ loại trừ trong các tình huống ............................................................... 43
Hình 3. 9 Mô hình chẩn đoán bệnh trên cây xoài.......................................................... 44
Hình 3. 10 Độ tƣơng phản của ảnh ................................................................................ 45
Hình 3. 11 Co giãn ảnh .................................................................................................. 45
Hình 3. 12 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các kênh màu ........ 45

Hình 3. 13 Mô hình trích lọc và đo lƣờng đặc trƣng kết cấu ........................................ 48
Hình 3. 14 Xoài không bệnh ......................................................................................... 51
Hình 3. 15 bệnh thối trái ................................................................................................ 51
Hình 3. 16 bệnh nứt trái ................................................................................................. 51
Hình 3. 17 lá xoài không bệnh ..................................................................................... 51
Hình 3. 18 lá bệnh ghẻ lồi ............................................................................................. 52
Hình 3. 19 lá bệnh thán thƣ ........................................................................................... 52
Hình 3. 20 Giao diện trích xuất đặc trƣng .................................................................... 53
Hình 3. 21 Giao diện huấn luyện và chẩn đoán bệnh ................................................... 54
Hình 3. 22 Bệnh thán thƣ ............................................................................................. 56
Hình 3. 23 Bệnh ghẻ lồi ................................................................................................ 56
Hình 3. 24 Lá xoài không bệnh .................................................................................... 57


-viii-

DANH MỤC BẢNG
Bảng 2. 1 Tỉ lệ sai số tổng thể của phƣơng pháp ......................................................... 26
Bảng 2. 2 Tính chính xác phân loại bệnh khi MSVM đƣợc huấn luyện với 70 hình ảnh
m i loại ......................................................................................................................... 29
Bảng 2. 3 So sánh với các phƣơng pháp hiện tại ......................................................... 30
Bảng 2. 4 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không
gian màu RGB .............................................................................................................. 32
Bảng 2. 5 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không
gian màu HSV .............................................................................................................. 32
Bảng 2. 6 Giá trị của các vector đại diện có số chiều là 3 của các mức màu trong không
gian màu CIE – LAB .................................................................................................... 33
Bảng 2. 7 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không
gian màu RGB .............................................................................................................. 33
Bảng 2. 8 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không

gian màu HSV .............................................................................................................. 33
Bảng 2. 9 Giá trị của các vector đại diện có số chiều là 9 của các mức màu trong không
gian màu CIE LAB ....................................................................................................... 33
Bảng 2. 10 So sánh thực nghiệm giữa kỹ thuật so khớp ảnh & K láng giềng ............. 36
Bảng 2. 11 So sánh các kỹ thuật máy học với tập dữ liệu kiểm tra ............................. 37
Bảng 3. 1 So sánh giá trị trung bình nhƣng độ lệch chuẩn khác nhau .......................... 47
Bảng 3. 2 Các tham số của hàm Gabor Wavelet và đặc trƣng kết cấu ảnh V ............... 49
Bảng 3. 3 Các giá trị tham số của GLCM ..................................................................... 50
Bảng 3. 4 Các tham số đặc trƣng đƣợc trích xuất từ tập ảnh huấn luyện...................... 53
Bảng 3. 5 Số lƣợng mẫu dùng trong thực nghiệm ........................................................ 55
Bảng 3. 6 Kết quả thực nghiệm phân lớp bằng máy học SVM ..................................... 55
Bảng 3. 7 Kết quả đạt đƣợc ........................................................................................... 57


-1-

MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói chung và tỉnh Trà
Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu chỉ dựa vào kinh nghiệm mà chƣa
biết ứng dụng khoa học và công nghệ vào trong sản xuất để nâng cao chất lƣợng sản
phẩm, hiệu quả kinh tế nhằm giảm chi phí sản xuất.
Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận dạng và xử lý ảnh để
chẩn đoán bệnh trên cây Xoài, một loại cây trồng có giá trị kinh tế cao, nhằm giải
phóng sức lao động, tiết kiệm thời gian, nâng cao năng suất là một việc làm hết sức có
ý nghĩa trong giai đoạn này.
Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng dụng máy vectơ
hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài”
2. Mục tiêu và nhiệm vụ nghiên cứu
2.1 Mục tiêu nghiên cứu

Mục tiêu nghiên của đề tài là đƣa ra một giải pháp mới giúp ngƣời nông dân ứng
dụng khoa học vào trong sản xuất nông nghiệp và trong việc chẩn đoán bệnh trên cây
Xoài thông qua ứng dụng máy vectơ h trợ.
2.2 Nhiệm vụ nghiên cứu
Đề tài sẽ thực hiện nghiên cứu các vấn đề sau:
- Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật toán SVM.
- Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài thực địa.
- Phƣơng pháp huấn luyện, nhận dạng và xử lý ảnh số.
- Ứng dụng thuật toán SVM chẩn đoán bệnh trên cây Xoài.
3. Đối tƣợng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
Đề tài nghiên cứu chủ yếu tập trung vào các đối tƣợng:
- Hình ảnh, các đặc trƣng của cây Xoài bị bệnh và không bị bệnh ngoài thực địa.
- Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và nhận dạng.
3.2 Phạm vi nghiên cứu
- Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài.
- Nghiên cứu các bƣớc xử lý và xây dựng tập dữ liệu huấn luyện (training set),
tập dữ liệu tham chiếu (reference set), tập dữ liệu để nhận dạng (probe set).
4. Phƣơng pháp nghiên cứu
4.1 Phương pháp nghiên cứu lý thuyết
Nghiên cứu lý thuyết tập trung vào các vấn đề gồm:
- Thu thập, phân tích các tài liệu và thông tin liên quan đến đề tài.
- Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận dạng trái cây.


-2- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trƣng ảnh, xác định biên,
nghiên cứu các kỹ thuật nhận dạng mẫu.
4.2 Phương pháp nghiên cứu thực nghiệm
Nghiên cứu thực nghiệm tập trung vào các nội dung sau:
- So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và không bệnh ngoài

thực địa.
- Cài đặt chƣơng trình, thực hiện chƣơng trình với một số mẫu dữ liệu và đánh
giá kết quả.
5. Ý nghĩa khoa học và thực tiễn của luận văn
5.1 Ý nghĩa khoa học
Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản xuất nông nghiệp,
đƣa ra giải pháp nhằm góp phần ứng dụng kỹ thuật nhận dạng và xử lý ảnh vào sản
xuất nông nghiệp tại tỉnh Trà Vinh.
5.2 Ý nghĩa thực tiễn
Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên cây Xoài tại tỉnh
Trà Vinh, góp phần giải phóng sức lao động, tiết kiệm chi phí và nâng cao năng suất
cây trồng, tăng thu nhập cho nông dân.
6. Bố cục luận văn:
Nội dung của luận văn đƣợc trình bày bao gồm các phần chính nhƣ sau:
Chƣơng 1 - Tổng quan về nhận dạng và xử lý ảnh: Tác giả đã trình bày tổng
quan về các vấn đề liên quan tới nhận dạng và xử lý ảnh số. Tiếp theo chƣơng 2, tác
giả sẽ trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán SVM để
chẩn đoán bệnh trên cây Xoài.
Chƣơng 2 - Phƣơng pháp nhận dạng và phân loại: Tác giả tìm hiểu một số bài
toán về nhận dạng và phân loại, kết quả thực nghiệm trên các loại trái cây nhƣ táo,
cam quýt, bài toán nhận dạng trên lá và so màu lá lúa. Thông qua các công trình
nghiên cứu hiện tại tác giả đã hiểu biết đƣợc một số thuật toán và các đặc trƣng cần
trích xuất cho một bài toán nhận dạng và phân loại. Chƣơng 3 tác giả sẽ ứng dụng các
kiến thức và sự hiểu biết của mình để áp dụng vào bài toán “Ứng dụng máy vector h
trợ trong phân tích mẫu và chẩn đoán bệnh trên cây Xoài
Chƣơng 3 - Ứng dụng máy vec tơ hỗ trợ trong phân tích mẫu và chẩn đoán
bệnh trên cây Xoài: Tác giả nhận thấy SVM đƣợc đánh giá là một hƣớng tiếp cận
phân lớp đạt độ chính xác cao. Hạn chế lớn nhất của SVM là tốc độ phân lớp rất chậm,
Tuy nhiên, SVM vẫn đƣợc đánh giá là phƣơng pháp học máy tiên tiến đã đóng góp
nhiều thành công trong các lĩnh vực khai phá dữ liệu cũng nhƣ trong lĩnh vực nhận

dạng. Nét đặc trƣng cơ bản nhất của SVM là việc phân lớp đƣợc thực hiện gián tiếp
trong không gian đặc trƣng với số chiều cao hơn thông qua một hàm nhân.


-3-

CHƢƠNG 1 - TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH
1.1 Các bƣớc cơ bản trong xử lý ảnh số

Hình 1. 1 Các bƣớc trong xử lý ảnh

1.1.1 Thu nhận ảnh
Ảnh thƣờng đƣợc thu nhận qua các thiết bị nhƣ camera, scanner. Tuỳ theo yêu
cầu thực thế mà m i điểm ảnh đƣợc biểu diễn qua 1 hay nhiều bit.
Đây là giai đoạn quan trọng trong toàn bộ quá trình xử lý ảnh, ảnh nhận đƣợc là
ảnh ban đầu để đƣa vào xử lý tại các giai đoạn sau, trƣờng hợp ảnh ban đầu có chất
lƣợng kém, hiệu quả của các bƣớc xử lý tiếp theo sẽ bị giảm.
1.1.2 Tiền xử lý
Sau bộ thu nhận, ảnh có thể nhiễu độ tƣơng phản thấp nên cần đƣa vào bộ tiền xử
lý để nâng cao chất lƣợng. Chức năng của bộ tiền xử lý là lọc nhiễu, nâng độ tƣơng
phản để làm ảnh rõ hơn, nét hơn.
1.1.3 Phân đoạn hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào thành các vùng thành phần để biểu diễn
phân tích, nhận dạng ảnh. Đây là phần phức tạp khó khăn nhất trong xử lý ảnh và cũng
dễ gây l i, làm mất độ chính xác của ảnh. Kết quả nhận dạng ảnh phụ thuộc rất nhiều
vào công đoạn này.
Phân vùng ảnh theo miền đồng nhất: Gồm phƣơng pháp tách cây tứ phân,
phƣơng pháp cục bộ, phƣơng pháp tổng hợp.
Phân vùng ảnh theo kết cấu bề mặt: gồm phƣơng pháp thống kê và phƣơng pháp
cấu trúc.

1.1.4 Biểu diễn ảnh
Đầu ra ảnh sau phân đoạn chứa các điểm ảnh của vùng ảnh, và mã liên kết với
các vùng lận cận. Việc biến đổi các số liệu này thành dạng thích hợp là cần thiết cho
xử lý tiếp theo bằng máy tính. Việc chọn các tính chất để thể hiện ảnh gọi là trích chọn
đặc trƣng (Feature Selection) gắn với việc tách các đặc tính của ảnh dƣới dạng các


-4thông tin định lƣợng hoặc làm cơ sở để phân biệt lớp đối tƣợng này với đối tƣợng khác
trong phạm vi ảnh nhận đƣợc.
1.1.5 Nhận dạng và nội suy ảnh
Nhận dạng ảnh là quá trình xác định ảnh, quá trình này thƣờng thu đƣợc bằng
cách so sánh với mẫu chuẩn đã đƣợc học từ trƣớc.
Nội suy là phán đoán theo ý nghĩa trên cơ sở nhận dạng, nhận dạng theo tham số
và nhận dạng theo cấu trúc.
1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số
1.2.1 Điểm ảnh
Điểm ảnh là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc màu nhất
định. Kích thƣớc và khoảng cách giữa các điểm ảnh đó đƣợc chọn thích hợp sao cho
mắt ngƣời cảm nhận sự liên tục về không gian và mức xám (hoặc màu) của ảnh số gần
nhƣ ảnh thật. M i phần tử trong ma trận đƣợc gọi là một phần tử ảnh.
1.2.2 Mức xám của ảnh
Mức xám là kết quả của sự mã hóa tƣơng ứng với một cƣờng độ sáng của m i
điểm ảnh với một giá trị số, kết quả của quá trình lƣợng tử hóa.
Một điểm ảnh (pixel) có hai đặc trƣng cơ bản là vị trí (x, y) của điểm ảnh và độ
xám của nó.
• Mức xám của điểm ảnh là cƣờng độ sáng của nó đƣợc gán bằng giá trị số tại
điểm đó.
• Các thang giá trị mức xám thông thƣờng: 16, 32, 64, 128, 256, mức 256 là mức
phổ dụng, dùng 8 bit để biểu diễn: 28=256 mức, tức là từ 0 đến 255.


Hình 1. 2 Ảnh xám ngƣỡng 255

1.2.3 Ảnh đen trắng
Ảnh đen trắng gồm có ảnh nhị phân và ảnh đa cấp xám, nếu chỉ có hai mức 0 và
1 còn gọi là ảnh nhị phân, nếu lớn hơn hai mức ta có ảnh đa cấp xám. Với ảnh nhị
phân, m i pixel đƣợc mã hóa trên một bit. Còn với ảnh xám 256 mức đƣợc mã hóa
trên 1 byte = 8 bit.


-5-

Hình 1. 3 Ảnh trắng đen

1.2.4 Ảnh nhị phân
Ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô tả, m i điểm ảnh của
ảnh nhị phân chỉ có thể là 0 hoặc 1, các phần tử ảnh có thể coi nhƣ phần tử logic.

Hình 1. 4 Ảnh nhị phân

1.2.5 Ảnh màu
Trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo nên thế giới màu,
ngƣời ta thƣờng dùng 3 byte để mô tả mức màu, khi đó các giá trị màu 2 8*3=224≈ 16,7
triệu màu.

Hình 1. 5 Ảnh màu
1.3 Cải thiện ảnh sử dụng toán tử điểm
1.3.1 Tăng giảm độ sáng
Độ tƣơng phản biểu diễn sự thay đổi độ sáng của đối tƣợng so với nền. Vì vậy,
muốn nhìn thấy rõ đối tƣợng trong ảnh so với nền thì chúng ta có thể thay đổi giá trị
cƣờng độ sáng trong ảnh.

Giả sử ta có ảnh đầu vào I ~ kích thƣớc (m x n) và số nguyên c
Nếu c > 0: ảnh sáng lên
Nếu c < 0: ảnh tối đi


-6-

Hình 1. 6 Ảnh tăng/giảm độ sáng
1.3.2 Tăng độ tương phản
Ảnh số là tập hợp các điểm, m i điểm có giá trị độ sáng khác nhau, hai đối tƣợng
có cùng độ sáng nhƣng đặt trên hai nền khác nhau sẽ cho cảm nhận sáng khác nhau.
Vậy độ tƣơng phản biểu diễn sự thay đổi độ sáng của đối tƣợng so với nền, hay
độ tƣơng phản là độ nổi của điểm ảnh hay vùng ảnh so với nền. Nếu ảnh có độ tƣơng
phản kém, ta có thể thay đổi theo các hàm.

u
 ua


f (u )   (u  a)  Va a  u  b
  (u  b)  V b  u  L
b

Các độ dốc , ,  xác định độ tƣơng phản tƣơng đối. L là số mức xám cực đại
Ta có:
α = β = γ =1 ảnh kết quả trùng với ảnh gốc
α, β, γ > 1 giãn độ tƣơng phản
α, β, γ < 1 co độ tƣơng phản

Hình 1. 7 Biểu đồ giãn độ tƣơng phản


Hình 1. 8 Ảnh khi tăng tƣơng độ phản


-71.3.3 Tách nhiễu và lấy ngưỡng
• Tách nhiễu: là trƣờng hợp riêng của giãn độ tƣơng phản khi α = γ = 0, ứng dụng
để giảm nhiễu khi biết tín hiệu nằm trong khoảng [a,b].
• Lấy ngƣỡng: là trƣờng hợp riêng của tách nhiễu khi a = b = θ (θ là ngƣỡng),
ứng dụng trong trƣờng hợp biến đổi từ ảnh đa mức xám về ảnh nhị phân.

1.3.4 Biến đổi âm bản
Âm bản nhận đƣợc bằng phép biến đổi âm. Phép biến đổi này có rất nhiều hữu
ích cho các phim ảnh dùng trong y học.
v= f (u)  L  u
Giả sử ta có ảnh I ~ kích thƣớc (m x n)

Hình 1. 9 Ảnh âm bản
1.3.5 Biến đổi ảnh đen trắng
Để chuyển đổi một ảnh màu sang ảnh đen trắng ta dùng kĩ thuật tách ngƣỡng.
Giả sử ta có ảnh I ~ kích thƣớc (m x n), hai số Min, Max và ngƣỡng θ.

Hình 1. 10 Ảnh trắng đen


-8-

1.3.6 Lược đồ xám(Histogram)
2.3.1.1 Hiển thị lược đồ xám của ảnh
Lƣợc đồ mức xám là một hàm cung cấp tần suất xuất hiện của m i mức xám
(gray-level) trong ảnh. Biễu diễn toán học của histogram của một ảnh số có L=256

mức xám là một hàm rời rạc.

p( f k ) 

nk
n

Trong đó:
f k là giá trị xám thứ k (k = 0, 1,..., L-1)
nk là số pixel có mức xám đó và
n là tổng số pixel của ảnh
p( f k ) [0,1]
Miền giá trị của
Một cách biễu diễn toán học khác của histogram của một ảnh là số lần xuất hiện

của m i mức xám.

p( f k )  nk
Khi lƣợc đồ xám đƣợc biễu diễn trong một hệ tọa độ vuông góc x, y (trục hoành
x biễu diễn số mức xám từ 0 đến L -1, trục tung y biễu diễn số điểm ảnh có cùng mức
xám hay tỷ lệ số điểm ảnh có cùng mức xám trên tổng số điểm ảnh), thì hình dạng của
histogram của ảnh sẽ mang đến cho chúng ta thông tin về tính động của ảnh (ảnh rất
sáng hay ảnh rất đậm) dùng làm cơ sở cho việc tăng cƣờng độ tƣơng phản.

Hình 1. 11 Lƣợc đồ mức xám của các loại ảnh


-9Nhìn vào biểu đồ trên ta nhận thấy rằng: nếu ảnh tối thì mức xám sẽ tập trung ở
gần gốc tọa độ.
Theo định nghĩa của lƣợc đồ xám, thì việc xây dựng nó là khá đơn giản.


Hình 1. 12 Biểu đồ lƣợc đồ xám (Histogram) của ảnh
Lƣợc đồ xám là một công cụ hữu hiệu dùng trong nhiều công đoạn của tăng
cƣờng xử lý ảnh.
2.3.1.2 Cân bằng lược đồ xám
Với một ảnh tự nhiên đƣợc lƣợng hóa một cách tuyến tính, phần lớn các điểm
ảnh có giá trị thấp hơn độ sáng trung bình. Trong miền tối, ta khó có thể cảm nhận các
chi tiết của ảnh. Thực tế cần phải khắc phục nhƣợc điểm này bằng cách biến đổi lƣợc
đồ xám. Ngƣời ta biến đổi lƣợc đồ sao cho tiến gần tới lƣợc đồ định trƣớc. Có nhiều
phƣơng pháp, trong đó phƣơng pháp phổ dụng nhất là san bằng lƣợc đồ.
Nếu ảnh có kích thƣớc (p x p) và ảnh kết quả đƣợc mã hóa trên N F mức xám thì
số điểm ảnh cho một mức xám trong lƣợc đồ cân bằng lý tƣởng sẽ là hằng số và bằng
P 2 / N F ( N F là số mức xám đầu xa). Trên thực tế, N F thƣờng nhỏ hơn N I (số mức
xám ban đầu).

Hình 1. 13 Cân bằng mức xám của ảnh
1.3.7 Kỹ thuật cải thiện ảnh nhị phân
Với ảnh nhị phân, mức xám chỉ có 2 giá trị là 0 hay 1. Do vậy, ta xét một phần tử
ảnh nhƣ một phần tử logic và có thể áp dụng các toán tử hình học dựa trên khái niệm
biến đổi hình học của một ảnh bởi một phần tử cấu trúc.


-10Phần tử cấu trúc là một mặt nạ dạng bất kỳ mà các phần tử của nó tạo nên một
mô-típ, ngƣời ta tiến hành rê mặt nạ đi khắp ảnh và tính giá trị điểm ảnh bởi các điểm
lân cận với mô-típ của mặt nạ theo cách lấy hội hay lấy tuyển.
Dựa vào nguyên tắc trên, ngƣời ta sử dụng 2 kỹ thuật: dãn ảnh (Dilatation) và co
ảnh (Erosion).
1.4.1.1 Dãn ảnh
Dãn ảnh nhằm loại bỏ điểm đen bị vây bởi các điểm trắng. Trong kỹ thuật này,
một cửa sổ (N+1) x (N+1) đƣợc rê đi khắp ảnh và thực hiện đối sánh một pexel của

ảnh với (N+1)2-1 điểm lân cận (không tính điểm ở tâm). Phép đối sánh ở đây thực hiện
bởi phép tuyển logic.

Hình 1. 14 Minh hoạ của phép giãn ảnh
1.4.1.2 Co ảnh
Co ảnh là thao tác đối ngẫu của dãn ảnh nhằm loại bỏ điểm trắng bị vây bởi các
điểm đen.
Trong kỹ thuật này, một cửa sổ (N+1)2 đƣợc rê đi khắp ảnh và thực hiện so sánh
một pixel của ảnh với (N+1)2-1 điểm lân cận. Việc so sánh ở đây thực hiện bởi phép
hội logic.
Để không ảnh hƣởng đến kích thƣớc của đối tƣợng trong ảnh, ngƣời ta tiến hành
n lần dãn và n lần co.

Hình 1. 15 Ứng dụng của phép co ảnh


-111.4 Trích rút đặt trƣng ảnh
Trích rút đặc trƣng ảnh là cơ sở để nhận dạng ảnh, trong lĩnh vực nhận dạng ảnh
trái cây có 4 đặc trƣng cơ bản gồm: kích thƣớc, màu sắc, kết cấu và hình dáng. Để
giảm độ phức tạp và tăng độ chính xác các thuật toán phân lớp đòi hỏi các đặc trƣng
đƣợc trích chọn phải rút gọn càng nhỏ càng tốt sau cho m i lớp có thể phân biệt đƣợc
với lớp khác.
Trích rút đặc trƣng ảnh nhằm lựa chọn một tập đặc trƣng để phục vụ cho việc
phân lớp sao cho hệ thống nhận dạng đạt độ chính xác cao nhất với số lƣợng phần tử
đƣợc trích chọn ít nhất.
1.4.1 Đặc trưng màu sắc
1.4.1.1 Không gian màu
Theo lý thuyết màu do Thomas đƣa ra từ năm 1802, mọi màu đều có thể tổ hợp
từ ba màu cơ bản: Đỏ (Red), Lục (Green), Lam (Blue). Ba màu này là các màu cơ bản
của hệ màu cộng (Additive Color System). Hệ màu RGB dựa trên cơ sở hệ thống tọa

độ Cartesian – hệ thống tọa độ Decac: m i màu cơ bản đều đƣợc mã hóa bởi 8 bit, vậy
với ba màu phối hợp nhau tạo thành 224 = 16.777.216 màu thứ cấp mà mắt ngƣời có
thể cảm nhận đƣợc. Ảnh màu đƣợc lƣu trữ từng màu riêng biệt nhƣ ảnh đa cấp xám.
Ứng với một pixel của ảnh màu sẽ chiếm 3 byte, do đó ảnh màu sẽ chiếm bộ nhớ
gấp ba lần ảnh đa cấp xám cùng kích thƣớc.

Hình 1. 16 Không gian màu RGB
1.4.1.2 Mô hình màu HSV (Hue, Saturation, Value) :

Có ba thuộc tính chủ yếu trong cảm nhận màu
Trong đó:
• Hue: bƣớc sóng của ánh sáng, đƣợc biểu diển bằng góc từ 0 – 3600 giúp ta
phân biệt các màu khác nhau.
• Saturation: độ bão hòa, đo độ tinh khiết của ánh sáng gốc. S nằm trong
khoảng [0 -1].


-12• Value (brightness): cƣờng độ hay độ chói ánh sáng. V có giá trị trong
khoảng [0 -1], V = 0 có màu đen.
Mô hình HSV trực giác hơn mô hình RGB. Bắt đầu từ Hue (H cho trƣớc và V=1,
S=1). Thay đổi S: bổ sung hay bớt trắng; thay đổi V: bổ sung hay bớt đen đến khi có
màu mong muốn.

Hình 1. 17 Không gian màu HSV
1.4.2 Đặc trưng kết cấu
Kết cấu là một đặc tính quan trọng khác của ảnh. Các biểu diễn kết cấu đa dạng
đã đƣợc nghiên cứu trong nhận dạng mẫu và thị giác máy tính. Về cơ bản, các phƣơng
pháp biểu diễn kết cấu có thể đƣợc phân ra thành hai loại: cấu trúc và thống kê.
Phƣơng pháp cấu trúc, gồm toán tử hình thái và đồ thị kề, mô tả kết cấu bởi nhận
dạng cấu trúc gốc và các luật sắp đặt của chúng. Chúng có khuynh hƣớng hiệu quả

nhất khi đƣợc áp dụng với các kết cấu đều.
Các phƣơng pháp thống kê, gồm các kỹ thuật phổ năng lƣợng Fourier, các ma
trận đồng khả năng, phân tích thành phần chính bất biến - trƣợt, đặc trƣng Tamura,
phân rã Wold, trƣờng ngẫu nhiên Markov mô hình fractal, và lọc đa phân giải nhƣ biến
đổi Gabor và sóng, mô tả kết cấu bằng phân bố thống kê của cƣờng độ ảnh.
Kết cấu là một đối tƣợng dùng để phân hoạch ảnh ra thành những vùng quan tâm
để phân lớp những vùng đó. Kết cấu cung cấp thông tin về sự sắp xếp về mặt không
gian của màu sắc và cƣờng độ một ảnh, kết cấu đƣợc đặc trƣng bởi sự phân bổ không
gian của những mức cƣờng độ trong một khu vực láng giềng với nhau.
1.4.2.1 Phương pháp phân tích kết cấu
Tiêu chuẩn kết cấu thống kê: Một tập các đặc điểm đƣợc sử dụng để biểu diễn
những đặc điểm của một kết cấu ảnh, những đặc điểm này đo những thuộc tính nhƣ
độ tƣơng phản, mối tƣơng quan và entropy. Chúng thƣờng đƣợc lấy ra từ những loạt
dài giá trị mức xám, giá trị mức xám khác nhau hoặc ma trận kết hợp. những đặc điểm
đƣợc lựa chọn và ảnh không thể tái tạo lại từ tập các đặc điểm đƣợc đánh giá.


-13Mô hình kết cấu ước lượng (Stochastic): Một đặc điểm đƣợc coi là sự thực hiện
của quá trình ƣớc lƣợng bị ảnh hƣởng bởi một số tham số. Việc phân tích đƣợc thực
hiện bằng việc xác định một mô hình và những tham số ƣớc lƣợng, bởi vậy xử lý ƣớc
lƣợng có thể đƣợc tái tạo từ những mô hình và tham số kết hợp. Những tham số ƣớc
lƣợng có thể đáp ứng nhƣ là những đặc điểm cho những bài toán phân đoạn và phân
lớp kết cấu. Một khó khăn đối với mô hình kết cấu này là một số kết cấu tự nhiên
không phù hợp với sự hạn chế của mô hình đặc biệt.
Tiêu chuẩn kết cấu cấu trúc: Một số kết cấu có thể xem nhƣ là những mô hình
hai chiều gồm một tập các đặc điểm gốc hoặc các mẫu con đƣợc sắp xếp dựa trên luật
nhất định. Các đặc điểm gốc này có thể là những hình dạng thay đổi hoặc xác định
nhƣ hình tròn, hình lục giác hoặc thậm chí là mô hình dấu chấm. Những kết cấu lớn có
đặc điểm gốc lớn trong khi những kết cấu nhỏ đƣợc tạo ra từ những đặc điểm nguyên
thuỷ nhỏ, những thuật ngữ này liên quan tới độ phân giải của ảnh. Ảnh có kết cấu đƣợc

hình thành từ những đặc điểm nguyên thuỷ bởi các luật cả trên phạm vi ảnh và mối
quan hệ giữa các ảnh với nhau.
1.4.2.2 Các đặc trưng lọc Gabor
.Trong xử lý ảnh, bộ lọc Gabor là một bộ lọc tuyến tính thƣờng đƣợc sử dụng để
phát hiện biên, phần vùng ảnh, phân tích đặc trƣng ảnh, phân lớp ảnh. Tần số và hƣớng
đƣợc thể hiện trong các bộ lọc Gabor tƣơng tự nhƣ hệ thống thị giác của con ngƣời. Bộ
lọc Gabor hai chiều (2D Gabor) đƣợc áp dụng trong ảnh với tỉ lệ và tần số khác nhau.
Hàm Gabor 2D đƣợc biến đổi từ đƣờng hình sin phức tạp của hàm Gaussian 2D. Hàm
sóng con Gabor trong miền không gian có dạng nhƣ sau:

gλ,θ,φ,σ,γ(x,y)=exp(

)

)

Trong đó:
y’= - x sin(θ) + y cos(θ)
x’= - x cos(θ) + y sin(θ)
Bƣớc sóng (λ - lamda) đại diện cho sóng của các tác nhân cosine của hàm
Gaussian, hƣớng (θ - theta) đại diện cho hƣớng của các đƣờng gạch sọc song song của
hàm Gabor tại một góc nào đó (độ), độ lệch pha (φ - phi) theo góc, và tỉ lệ hƣớng (γ gamma) là tỷ lệ co giãn trong không gian và nó xác định tính đơn giản của hàm Gabor,
và độ lệch chuẩn σ xác định kích thƣớc của hàm Gaussian tuyến tính.
• Ma trận đồng hiện mức xám (GLCM) là một trong những phƣơng pháp trích
lọc đặc trƣng đƣợc đề xuất từ rất sớm bởi Haralick vào năm 1973.


-14• Ma trận đồnghiện mức xám của ảnh f(x,y) có kích thƣớc n x m và có G mức
độ xám là một ma trận hai chiều C(i, j). M i phần tử của ma trận thể hiện xác
suất xảy ra cùng giá trị cƣờng độ sáng i và j tại một khoảng cách d và một góc θ

xác định. Do đó, có thể có nhiều GLCM khác nhau phụ thuộc vào cặp giá trị d và
θ. Ma trận đồnghiện mức xám đƣợc tính toán nhƣ sau:

max(| x1  x 2 |, | y1  y 2 )  d
(( x1 , y1 ), ( x 2 , y 2 ))  

C d (i, j )  N (( x1 , y1 ), ( x 2 , y 2 ))  MxM

f ( x1 , y1 )  i, f ( x 2 , y 2 )  j
Một số trích chọn đặc điểm kết cấu suy ra từ GLCM
∑∑

∑∑

∑∑

∑∑

|

|

1.4.3 Đặc trưng hình dáng
Màu sắc và kết cấu là những thuộc tính có khái niệm toàn cục, trong khi đó hình
dáng không phải là một thuộc tính của ảnh, khi nói đến hình dáng là ta muốn nói đến
đƣờng biên của một đối tƣợng nào đó trong ảnh.
Có hai phƣơng pháp thƣờng đƣợc dùng để đo lƣờng hình dáng trong lĩnh vực xử
lý ảnh trái cây là: đo lƣờng phụ thuộc vào kích thƣớc - SMD và đo lƣờng không phụ
thuộc vào kích thƣớc - SIM.
Phƣơng pháp SDM có đặc điểm là dễ hiểu, và tính toán đơn giản. Độ rắn chắc

(compactness) là một trong những giải pháp tốt trong SDM để mô tả và đo lƣờng hình
dáng của đối tƣợng bằng cách đo tỉ lệ giữa diện tích trên bình phƣơng chu vi của đối
tƣợng.
Hình dáng của các đối tƣợng là không đồng nhất (Russ, 1999) do đó, phƣơng
pháp đo lƣờng SDM không đo lƣờng đƣợc tất cả hình dáng của mọi sản phẩm trái cây
bởi vì hình dáng của trái cây thƣờng không tuân theo một quy luật chung nào, nên
phƣơng pháp SIM đƣợc đề xuất và đƣợc sử dụng rộng rãi hơn. SIM bao gồm phƣơng


-15pháp dựa trên vùng (region-based methods) và phƣơng pháp dựa trên đƣờng biên
(boundary-based methods).
1.5 Phƣơng pháp nhận dạng.
1.5.1 Khái niệm nhận dạng.
Quá trình nhận dạng dựa vào những mẫu học biết trƣớc gọi là nhận dạng có thầy
hay học có thầy, trong những trƣờng hợp ngƣợc lại gọi là học không có thầy.
Học có thầy: Ta có một thƣ viện các mẫu chuẩn, mẫu cần nhận dạng sẽ đƣợc
đem so sánh với mẫu chuẩn để xem nó thuộc loại nào và quyết định gán cho chúng
vào một lớp nhờ các hàm phân lớp hay hàm ra quyết định.
Học không có thầy: Kỹ thuật này nhằm tiến hành mọi cách gộp nhóm có thể và
chọn lựa cách tốt nhất. Bắt đầu từ tập dữ liệu, nhiều thủ tục xử lý khác nhau nhằm
phân lớp và nâng cấp dần để đạt đƣợc một phƣơng án phân loại.
1.5.2 Support vector machine (SVM)
SVM là một phƣơng pháp phân lớp xuất phát từ lý thuyết học thống kê. SVM sẽ
cố gắng tìm cách phân lớp dữ liệu sao cho có l i xảy ra trên tập kiểm tra là nhỏ nhất.
Ý tƣởng của nó là ánh xạ (tuyến tính hoặc phi tuyến) dữ liệu vào không gian các
vector đặc trƣng mà ở đó một siêu phẳng tối ƣu đƣợc tìm ra để tách dữ liệu thuộc hai
lớp khác nhau.
Giả sử, chúng ta lựa chọn đƣợc tập các đặc trƣng là T={t1, t2, …, tn}, xi là vector
dữ liệu đƣợc biểu diễn xi=(wi1, wi2, …, win), winR là trọng số của đặc trƣng tn. Với
tập dữ liệu huấn luyện Tr={(x1, y1), (x2, y2), …, (xl, yl)}, (xiRn), yi{+1, -1}, cặp (xi,

yi) đƣợc hiểu là vector xi đƣợc gán nhãn là yi.
Nếu xem m i xi đƣợc biểu diễn tƣơng ứng với một điểm dữ liệu trong không gian
n
R thì ý tƣởng của SVM là tìm một mặt hình học (siêu phẳng) f(x) “tốt nhất trong
không gian n-chiều để phân chia dữ liệu sao cho tất cả các điểm x+ đƣợc gán nhãn 1
thuộc về phía dƣơng của siêu phẳng (f(x+)>0), các điểm x- đƣợc gán nhãn –1 thuộc về
phía âm của siêu phẳng (f(x-)<0).

Hình 1. 18 H2 là siêu phẳng tốt nhất


×