Tải bản đầy đủ (.pdf) (26 trang)

Ứng dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh trên cây xoài

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.03 MB, 26 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƢỜNG ĐẠI HỌC BÁCH KHOA


NGUYỄN THỪA PHÁT TÀI

ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG PHÂN TÍCH
MẪU VÀ CHẨN ĐOÁN BỆNH TRÊN CÂY XOÀI

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01

TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng – Năm 2018


Công trình đƣợc hoàn thành tại
TRƢỜNG ĐẠI HỌC BÁCH KHOA
Ngƣời hƣớng dẫn khoa học: TS. HUỲNH HỮU HƢNG

Phản biện 1:
PGS. TS. HUỲNH CÔNG PHÁP
Phản biện 2:
TS. NGUYỄN THÁI SƠN

Luận văn sẽ đƣợc bảo vệ trƣớc Hội đồng chấm Luận văn tốt nghiệp
thạc sĩ Khoa học máy tính tại Trƣờng Đại học Bách khoa vào ngày
03 tháng 02 năm 2018.

Có thể tìm hiểu luận văn tại:


 Trung tâm Học liệu, Đại học Đà Nẵng tại Trƣờng Đại học Bách
khoa.
 Thƣ viện Khoa Công nghệ thông tin, Trƣờng Đại học Bách khoa –
ĐHĐN.


-1MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay nông dân tại các tỉnh đồng bằng sông Cửu Long nói
chung và tỉnh Trà Vinh nói riêng chỉ canh tác và trồng trọt chủ yếu
chỉ dựa vào kinh nghiệm mà chƣa biết ứng dụng khoa học và công
nghệ vào trong sản xuất để nâng cao chất lƣợng sản phẩm, hiệu quả
kinh tế nhằm giảm chi phí sản xuất.
Chính vì vậy việc triển khai nghiên cứu các ứng dụng nhận
dạng và xử lý ảnh để chẩn đoán bệnh trên cây Xoài, một loại cây
trồng có giá trị kinh tế cao, nhằm giải phóng sức lao động, tiết kiệm
thời gian, nâng cao năng suất là một việc làm hết sức có ý nghĩa
trong giai đoạn này.
Từ hiện trạng và những lý do trên tôi xin đề xuất đề tài: “Ứng
dụng máy vectơ hỗ trợ trong phân tích mẫu và chẩn đoán bệnh
trên cây Xoài”
2. Mục tiêu và nhiệm vụ nghiên cứu
2.1 Mục tiêu nghiên cứu
Nghiên cứu ứng dụng máy vectơ hỗ trợ trong việc chẩn đoán bệnh
trên cây Xoài thông qua hình ảnh.
2.2 Nhiệm vụ nghiên cứu
- Nghiên cứu tổng quan về xử lý ảnh số, nhận dạng mẫu, thuật
toán SVM.
- Tìm hiểu và thu thập hình ảnh các loại bệnh trên Xoài ngoài
thực địa.

- Phƣơng pháp huấn luyện, nhận dạng và xử lý ảnh số.
3. Đối tƣợng và phạm vi nghiên cứu
3.1 Đối tượng nghiên cứu
- Hình ảnh, các đặc trƣng của cây Xoài bị bệnh và không bị
bệnh ngoài thực địa.
- Nghiên cứu và áp dụng thuật toán SVM trong phân lớp và
nhận dạng.


-2-

3.2 Phạm vi nghiên cứu
- Dùng thuật toán SVM trong phân tích mẫu và chẩn đoán
bệnh trên cây Xoài.
4. Phƣơng pháp nghiên cứu
4.1 Phương pháp nghiên cứu lý thuyết
- Tham khảo các đề tài, bài báo liên quan đến lĩnh vực nhận
dạng trái cây.
- Các tài liệu về cơ sở lý thuyết: Xử lý ảnh, lọc trích đặc trƣng
ảnh, xác định biên, nghiên cứu các kỹ thuật nhận dạng mẫu.
4.2 Phương pháp nghiên cứu thực nghiệm
- So sánh và phân tích hình ảnh trái, lá cây Xoài có bệnh và
không bệnh ngoài thực địa.
- Triển khai và cài đạt chƣơng trình.
5. Ý nghĩa khoa học và thực tiễn của luận văn
5.1 Ý nghĩa khoa học
Nghiên cứu nhằm ứng dụng khoa học và công nghệ vào sản
xuất nông nghiệp, đƣa ra giải pháp nhằm góp phần ứng dụng kỹ
thuật nhận dạng và xử lý ảnh vào sản xuất nông nghiệp tại tỉnh Trà
Vinh.

5.2 Ý nghĩa thực tiễn
Góp thêm một giải pháp mới để nông dân chẩn đoán bệnh trên
cây Xoài tại tỉnh Trà Vinh, góp phần giải phóng sức lao động, tiết
kiệm chi phí và nâng cao năng suất cây trồng, tăng thu nhập cho
nông dân.


-3CHƢƠNG 1 -TỔNG QUAN VỀ NHẬN DẠNG VÀ XỬ LÝ ẢNH
1.1 Các bƣớc cơ bản trong xử lý ảnh số:
Con ngƣời thu nhận thông tin qua các giác quan, trong đó thị
giác đóng vai trò quan trọng nhất. Những năm trở lại đây với sự phát
triển của phần cứng máy tính, xử lý ảnh và đồ hoạ đó phát triển một
cách mạnh mẽ và có nhiều ứng dụng trong cuộc sống. Xử lý ảnh và
đồ hoạ đóng một vai trò quan trọng trong tƣơng tác ngƣời máy.

Hình 1. 1 Các bƣớc trong xử lý ảnh
1.1.1 Thu nhận ảnh
1.1.2 Tiền xử lý
1.1.3 Phân đoạn hay phân vùng ảnh
1.1.4 Biểu diễn ảnh
1.1.5 Nhận dạng và nội suy ảnh
1.2 Mốt số vấn đề cơ bản trong xử lý ảnh số
1.2.1 Điểm ảnh
1.2.2 Ảnh đen trắng
1.2.3 Ảnh nhị phân
1.2.4 Ảnh màu
1.3 Cải thiện ảnh sử dụng toán tử điểm:
1.3.1 Tăng giảm độ sáng

Hình 1. 2 Ảnh tăng/giảm độ sáng



-41.3.2 Tăng độ tương phản

Hình 1. 3 Ảnh khi tăng tƣơng độ phản
1.3.3 Biến đổi âm bản

Hình 1. 4 Ảnh âm bản
1.3.4 Biến đổi ảnh đen trắng

Hình 1. 5 Ảnh trắng đen
1.3.5 Lược đồ xám(Histogram)

Hình 1. 6 Cân bằng mức xám của ảnh
1.3.6 Kỹ thuật cải thiện ảnh nhị phân

Hình 1. 7 Minh hoạ của phép giãn ảnh


-5-

Hình 1. 8 Ứng dụng của phép co ảnh
1.4 Trích rút đặt trƣng ảnh
1.4.1 Đặc trưng màu sắc

Hình 1. 9 Không gian màu HSV
1.4.2 Đặc trưng kết cấu
Một số trích chọn đặc điểm kết cấu suy ra từ GLCM

1.5 Phƣơng pháp nhận dạng.

1.5.1 Khái niệm nhận dạng.
Quá trình nhận dạng dựa vào những mẫu học biết trƣớc gọi là
nhận dạng có thầy hay học có thầy, trong những trƣờng hợp ngƣợc
lại gọi là học không có thầy.


-61.5.2 Support vector machine (SVM)
SVM là một phƣơng pháp phân lớp xuất phát từ lý thuyết học
thống kê. SVM sẽ cố gắng tìm cách phân lớp dữ liệu sao cho có lỗi
xảy ra trên tập kiểm tra là nhỏ nhất.
Ý tƣởng của nó là ánh xạ (tuyến tính hoặc phi tuyến) dữ liệu
vào không gian các vector đặc trƣng mà ở đó một siêu phẳng tối ƣu
đƣợc tìm ra để tách dữ liệu thuộc hai lớp khác nhau.

Hình 1. 10 H2 là siêu phẳng tốt nhất
1.5.3 K-láng giềng gần nhất (k-Nearest Neighbors)
1.5.4 Mô hình Markov ẩn (Hidden Markov Models)
1.5.5 Mạng nơ-ron nhân tạo
1.6 Đánh giá ƣu điểm của thuật toán SVM
• SVM rất hiệu quả để giải quyết bài toán dữ liệu có số chiều lớn.
• SVM giải quyết vấn đề overfitting rất tốt (dữ liệu có nhiễu và
tách dời nhóm hoặc dữ liệu huấn luyện quá ít)
• Là phƣơng pháp phân lớp nhanh
• Có hiệu suất tổng hợp tốt và hiệu suất tính toán cao
KẾT CHƢƠNG
Chƣơng 1 tác giả đã trình bày tổng quan về các vấn đề liên
quan tới nhận dạng và xử lý ảnh số. Tiếp theo chƣơng 2, tác giả sẽ
trình bày chi tiết về nhận dạng và phân tích mẫu, ứng dụng thuật toán
SVM để chẩn đoán bệnh trên cây Xoài.



-7CHƢƠNG 2 – PHƢƠNG PHÁP NHẬN DẠNG
VÀ PHÂN LOẠI
2.1 Các công trình nghiên cứu liên quan
2.2 Trích xuất đặc trƣng trong đánh và phân loại trái cây:
2.2.1 ử dụng đặc trưng màu sắc
2.2.2 Trích chọn đặc trưng màu cho bài toán so màu lá lúa

Hình 2. 1 Minh họa trích đặc trƣng màu với moment thứ nhất

Hình 2.2 Minh họa trích đặc trƣng màu với 3 moment màu

2.2.3
2.2.4

ử dụng đặc trưng kết cấu
ử dụng đặc trưng Gist và Gist descriptor.
2.3 Các phƣơng pháp phân loại trái cây:
2.3.1 Phân biệt phần cuống và khiếm khuyết thực tế trên trái cây.


-8-

Hình 2.3 Mô hình phân biệt phần cuống với các khiếm khuyết trên
trái cây
2.3.2 Kết hợp các thống kê màu sắc và đặc trưng kết cấu để
nhận biết bệnh táo


-92.3.3 Nghiên cứu xây dựng hệ thống h trợ nông dân so màu

lá lúa

Hình 2.4 Mô hình hệ thống

2.4 KẾT CHƢƠNG
Trong chƣơng 2, tác giả tìm hiểu một số bài toán về nhận dạng và
phân loại, kết quả thực nghiệm trên các loại trái cây nhƣ táo, cam
quýt, bài toán nhận dạng trên lá và so màu lá l a. Thông qua các
công trình nghiên cứu hiện tại tác giả đã hiểu biết đƣợc một số thuật
toán và các đặc trƣng cần trích xuất cho một bài toán nhận dạng và
phân loại.


-10CHƢƠNG 3 – ỨNG DỤNG MÁY VECTƠ HỖ TRỢ TRONG
CHẨN ĐOÁN BỆNH TRÊN XOÀI
3.1 Phƣơng pháp phân lớp dữ liệu máy vector hỗ trợ SVM
3.1.1 Giới thiệu

SVM thực hiện chuyển tập mẫu từ không gian biểu diễn Rn
của ch ng sang một không gian Rd có số chiều lớn hơn. Trong không
gian Rd tìm một siêu phẳng tối ƣu để phân hoạch tập mẫu này dựa
trên phân lớp của ch ng.
3.1.2 Ý tưởng của phương pháp
Cho trƣớc một tập huấn luyện, đƣợc biểu diễn trong không
gian vector, trong đó mỗi tài liệu là một điểm, phƣơng pháp này tìm
ra một siêu phẳng f quyết định tốt nhất có thể chia các điểm trên
không gian này thành hai lớp riêng biệt tƣơng ứng là lớp + và lớp -.
Chất lƣợng của siêu phẳng này đƣợc quyết định bởi khoảng cách (gọi
là biên) của điểm dữ liệu gần nhất của mỗi lớp đến mặt phẳng này.
Khi đó khoảng cách biên càng lớn thì mặt phẳng quyết định càng tốt,

đồng thời việc phân loại càng chính xác.


-113.1.3 Các bước chính của phương pháp
Phƣơng pháp SVM yêu cầu dữ liệu đƣợc diễn tả nhƣ các
vector của các số thực. Nhƣ vậy nếu đầu vào chƣa phải là số thì ta
cần phải tìm cách chuyển ch ng về dạng số của SVM.
• Tiền xử lý dữ liệu: Thực hiện biến đổi dữ liệu phù hợp cho quá
trình tính toán, tránh các số quá lớn mô tả các thuộc tính.
Thƣờng nên co giãn (scaling) dữ liệu chuyển về đoạn [-1,1]
hoặc [0,1].
• Chọn hàm hạt nhân: Lựa chọn hàm hạt nhân phù hợp tƣơng
ứng cho từng bài toán cụ thể để đạt độ chính xác cao trong quá
trình phân lớp.
• Thực hiện việc kiểm tra chéo để xác định các tham số cho ứng
dụng: Điều này cũng quyết định đến tính chính xác của quá
trình phân lớp.
• Sử dụng các tham số cho việc huấn luyện với tập mẫu: Trong
quá trình huấn luyện sẽ sử dụng thuật toán tối ƣu hóa khoảng
cách giữa các siêu phẳng trong quá trình phân lớp, xác định
hàm phân lớp trong không gian đặc trƣng nhờ việc ánh xạ dữ
liệu vào không gian đặc trƣng bằng cách mô tả hạt nhân và
cuối cùng là kiểm thử tập dữ liệu.
3.1.4 Cơ sở lý thuyết

Hình 3. 1 Minh họa cho bài toán phân hai lớp
3.2 Chẩn đoán bệnh trên xoài với máy vetor hỗ trợ SVM:
3.2.1 Mô tả bài toán



-12Để nhận dạng và chẩn đoán bệnh trên xoài, tác giả đề xuất thực
hiện các bƣớc xử lý nhƣ sau:
Bước 1: thu nhận tạp ảnh huấn luyện và ảnh kiểm tra
Bước 2: thực hiện các bƣớc tiền xử lý, nâng cao chất lƣợng
ảnh, chuyển ảnh màu RGB sang ảnh màu HSV, tách các kênh H,
S, V riêng biệt.
Bước 3: Trích xuất đặc trƣng, tính giá trị trung của mỗi kênh
màu HSV và độ lệch chuẩn của mỗi kênh màu trong không gian
màu HSV làm tham số cho màu sắc, Ảnh màu kênh màu V đƣợc
dùng trích lọc đặc trƣng kết cấu, ảnh V làm tham số đầu vào kết
hợp sóng con Gabor và lƣợc đồ mức xám đƣợc tính toán bằng ma
trận GLCM để trích lọc đặc trƣng kết cấu đƣa vào huấn luyện.
Bước 4: thuật toán SVM đƣợc sử dụng để thực hiện phân lớp,
so khớp các tham số đặc trƣng của mẫu xoài cần kiểm tra với tập
CSDL các đặc trƣng của lá/trái xoài đã đƣợc phân lớp, kết quả
trả về là/trái xoài bị bệnh gì hoặc không bệnh.
3.2.2 Mô hình giải quyết bài toán

Hình 3. 2 Mô hình chẩn đoán bệnh trên cây xoài
3.3 Tiền xử lý
3.3.1 Tăng/giảm độ tương phản của ảnh


-13Nếu ảnh có độ tƣơng phản kém so với nền, ta có thể thay đổi
theo các hàm.

Trong Matlab, để thực hiện nâng cao độ tƣơng phản của ảnh
đầu vào in_img ta sử dụng câu lệnh sau:
Out_img = imadjust(in_img);


Hình 3. 3 Độ tƣơng phản của ảnh

3.3.2 Thực hiện phép co/giãn ảnh

Hình 3. 4 Co giãn ảnh

3.3.3 Chuyển và tách ảnh màu RGB sang các kênh H-S-V
Chuyển ảnh màu RGB sang ảnh màu HSV và tách cách
kênh màu

Hình 3. 5 Ảnh màu RGB chuyển đổi sang ảnh màu HSV và ảnh các
kênh màu


-14Giá trị của S và V nằm trong khoảng 0 (màu đen) và 1 (màu
trắng), giá trị của H nằm trong khoảng 0 đến 360.
3.4 Trích chọn đặc trƣng
3.4.1 Đặc trưng màu sắc
Để tách đƣợc đặc trƣng về màu sắc, tác giả đề xuất ảnh màu
RGB đƣợc chuyển đổi sang không gian màu và tách các kênh H, S,
V riêng biệt. Tính giá trị trung của ba kênh màu H, S, V và độ lệch
chuẩn của các kênh màu trong không gian màu HSV làm tham số
đặc trƣng cho màu sắc.
Phƣơng pháp tính độ lệch chuẩn (Standard Deviation) từ một dãy
n giá trị cho trƣớc x1, x2,...xn:
Bước 1: Tìm mean của dãy số đã cho (x1+x2+...+xn) / n
Bước 2: Với mỗi x trong dãy số đã cho, tính độ lệch (deviation)
của nó so với mean bằng phép tính (x - mean)
Bước 3: Tính bình phƣơng của các giá trị thu đƣợc ở bƣớc 2.
Bước 4: Tìm mean của các bình phƣơng độ lệch tìm đƣợc ở bƣớc

3. Giá trị này đƣợc biết đến nhƣ là phƣơng sai (Variance) σ2.
Bước 5: Tính căn bậc hai (square root) của phƣơng sai (Variance)
ta đƣợc kết quả cần tìm.

3.4.2 Đặc trưng kết cấu
Ảnh màu RGB đầu vào sau khi đƣợc chuyển đổi sang không
gian màu HSV và đƣợc tách ra từng kênh H, S, V riêng biệt thì kênh
đơn màu V đƣợc dùng làm đầu vào cho sóng con Gabor để trích lọc
đặc trƣng kết cấu, sóng con Gabor có rất nhiều tham số khác nhau, vì
vậy tại bƣớc này phải thực hiện để điều chỉnh và chọn lọc các giá trị
tham số đầu vào của sóng con Gabor sao cho kết quả xử lý ảnh đơn


-15màu V nổi rõ kết cấu nhất. Sau đƣa vào sóng con Gabor một ảnh đơn
kênh mới có kết cấu rõ nhất đƣợc tạo ra (ảnh V’), ảnh V’ này đƣợc
đƣa vào ma trận đồng hiện mức xám để đo lƣờng các giá trị kết cấu
của ảnh V’. Kết quả từ ma trận đồng hiện mức xám đƣợc dùng làm
dữ liệu đầu xây dựng tập CSDL huấn luyện hoặc làm tham số đầu
vào để phân lớp đối tƣợng.

3.4.2.1 Sóng con Gabor – Gabor Wavelet
Trong xử lý ảnh, sóng con Gabor là một bộ lọc tuyến tính
thƣờng đƣợc sử dụng để phát hiện biên, phần vùng ảnh, phân tích
đặc trƣng ảnh, phân lớp ảnh,...Tần số và hƣớng đƣợc thể hiện trong
các sóng con Gabor tƣơng tự nhƣ hệ thống thị giác của con ngƣời.
Tập hợp các sóng con Gabor với tần số và hƣớng khác nhau có thể
trợ gi p cho việc trích lọc đầy đủ các đặc trƣng trong ảnh. Sóng con
Gabor hai chiều (2-D Gabor) đƣợc áp dụng trong ảnh với tỉ lệ và tần
số khác nhau. Hàm Gabor 2-D đƣợc biến đổi từ đƣờng hình sin phức
tạp của hàm Gaussian 2-D. Hàm sóng con Gabor trong miền không

gian có dạng nhƣ sau:

Bƣớc sóng (λ - lamda) đại diện cho sóng của các tác nhân cosine của
hàm Gaussian, hƣớng (θ - theta) đại diện cho hƣớng của các đƣờng
gạch sọc song song của hàm Gabor tại một góc nào đó (độ), độ lệch
pha – phase offset (φ - phi) theo góc, và tỉ lệ hƣớng (γ - gamma) là tỷ


-16lệ co giãn trong không gian và nó xác định tính đơn giản của hàm
Gabor, và độ lệch chuẩn σ xác định kích thƣớc của hàm Gaussian
tuyến tính. Băng thông (b) bán đáp ứng (half-response) trong không
gian tần số và tỉ lệ giữa σ/  có quan hệ nhƣ sau:

Bảng 3. 1 Tham số hàm Gabor Wavelet và đặc trƣng kết cấu ảnh V
Ảnh màu RGB

Gabor Wavelet


  8,   [0 2 ],   0.5,
b  1, N  10,   36


  8,   [0 2 ],   0.5,
b  1, N  10,   72


  8,   [0 2 ],   0.5,
b  1, N  10,   108



  8,   [0 2 ],   0.5,
b  1, N  10,   144


  8,   [0 2 ],   0.5,
b  1, N  10,   180

Ảnh kết cấu


-173.4.2.2 Ma trận đồng hiện mức xám Co-occurrence
GLCM là một trong những phƣơng pháp trích lọc đặc trƣng
quan trọng trong lĩnh vực phân tích kết cấu ảnh đƣợc đề xuất từ rất
sớm bởi Haralick vào năm 1973. GLCM của ảnh f(x,y) có kích thƣớc
MxM và có G mức độ xám là một ma trận hai chiều C(i, j). Mỗi phần
tử của ma trận thể hiện xác suất xảy ra cùng giá trị cƣờng độ sáng i
và j tại một khoảng cách d và một góc θ xác định. Do đó, có thể có
nhiều ma trận GLCM khác nhau phụ thuộc vào cặp giá trị d và θ
Một số đặt trƣng quan trọng có thể kể đến nhƣ năng lƣợng
(energy), độ tƣơng phản (contrast), entropy, độ tƣơng đồng
(Correlation), tính đồng nhất (homogeneity).
Bảng 3. 2 Các giá trị tham số của GLCM
Các giá trị tham số của
Ảnh màu RGB
Gabor Wavelet
GLCM
Entropy:
0.265715
Contrast:

0.143287
Correlation:
0.716450

  8,   [0 2 ],   0.5,
Energy:
0.625673
b  1, N  10,   36
Homogeneity: 0.632575


  8,   [0 2 ],   0.5,
b  1, N  10,   72


  8,   [0 2 ],   0.5,
b  1, N  10,   108


  8,   [0 2 ],   0.5,
b  1, N  10,   144

Entropy:
0.596124
Contrast:
0.343675
Correlation: 0.574691
Energy:
0.626423
Homogeneity: 0.451565

Entropy:
0.365885
Contrast:
0.241668
Correlation: 0.724789
Energy:
0.621576
Homogeneity: 0.594648
Entropy:
0.357885
Contrast:
0.341568
Correlation: 0.615239
Energy:
0.632326


-18-


  8,   [0 2 ],   0.5,
b  1, N  10,   180

Homogeneity: 0.548535
Entropy:
0.432624
Contrast:
0.241714
Correlation: 0.527460
Energy:

0.621873
Homogeneity: 0.628845

3.5 Thực nghiệm
3.5.1 Một số hình ảnh tập mẫu huấn luyện trái xoài
3.5.1.1 Mẫu xoài không bệnh

Hình 3. 6 Xoài không bệnh
3.5.1.2 Mẫu bệnh thối trái trên xoài do nấm

Hình 3. 7 bệnh thối trái
3.5.1.3 Mẫu bệnh nứt trái trên xoài

Hình 3. 8 bệnh nứt trái

3.5.2 Một số hình ảnh tập mẫu huấn luyện lá xoài
3.5.2.1 Mẫu lá không bệnh

Hình 3. 9 lá xoài không bệnh
3.5.2.2 Mẫu lá bệnh ghẻ lồi


-19-

Hình 3. 10 lá bệnh ghẻ lồi
3.5.2.3 Mẫu lá bệnh thán thư

Hình 3. 11 lá bệnh thán thƣ
Yêu cầu của chƣơng trình là thu nhận hình ảnh lá/quả xoài ở
đầu vào, đầu ra của chƣơng trình nhằm chẩn đoán lá/quả xoài có

bệnh hay không, nếu có thì xác định là bệnh gì. Hiện nay để xử lý
ảnh ta có thể sử dụng các ngôn ngữ C#, Matlab,…Tôi lựa chọn ngôn
ngữ lập trình Matlab vì trong thƣ viện của Matlab có nhiều hàm đã
đƣợc hỗ trợ sẵn.

3.5.3 Xử lý
Mở ảnh và thực hiện xử lý, trong giai đoạn này ta thực hiện cải
thiện nhằm nâng cao chất lƣợng ảnh đầu vào, khử nền, lọc nhiễu,
thay đổi độ phản,....
Chuyển kênh màu ảnh RGB  HSV sử dụng bộ lọc Gabor để
làm rõ đặc trƣng kết cấu ảnh và thu nhận ảnh sóng con kết cấu với
các đặc trƣng rỏ nhất, sóng con Gabor dùng làm ảnh đầu vào cho
GLCM để trích xuất đƣợc các tham số năng lƣợng (energy), độ
tƣơng phản (contrast), entropy, độ tƣơng đồng (Correlation), tính
đồng nhất (homogeneity), ...
Sau quá trình xử lý, kết quả ta thu đƣợc hình ảnh đã chuyển
sang không gian màu HSV, các ảnh kênh H, kênh S, kênh V sẽ đƣợc
lƣu trữ làm dữ liệu đầu vào cho quá trình trích xuất các đặc trƣng của
ảnh, tính toán các tham số trung bình và độ lệch chuẩn giữa các kênh
màu.


-20Sau quá trình thực hiện ở các bƣớc tiền xử lý ta đƣợc ảnh kết
cấu và sóng con Gabor với các đặc trƣng rõ nét nhất. Ảnh này sẽ tiếp
tục làm dữ liệu đầu vào cho GLCM để trích xuất các tham số đặc
trƣng Entropy, Contrast, Correlation, Energy, Homegeneity ứng với
các giá trị λ , φ, γ, b, N, và hƣớng (góc) θ khác nhau.

Hình 3. 12 Giao diện trích xuất đặc trƣng
Để lấy các tham số tạo ma trận đồng hiện trong Matlab ta dùng

hàm:
I=imread(A) % đọc ảnh A
GLCM = graycomatrix(I) % tạo ra ma trận co-occurrence
cấp độ xám (GLCM) từ ảnh I.
stats = graycoprops(GLCM, properties) % properties: thuộc
tính cần trích xuất Entropy, Contrast,…

Bảng 3. 3 Các tham số đặc trƣng đƣợc trích xuất từ tập ảnh huấn luyện


-21-

3.5.4 Huấn luyện và chẩn đoán bệnh ứng dụng máy vetor h
trợ VM
3.5.4.1 Giao diện chính:
• Chọn ảnh: Chọn ảnh cần chẩn đoán bệnh từ tập dữ liệu kiểm tra
• Tiền xử lý: Thực hiện các xử lý, nâng cao chất lƣợng ảnh, tách
kênh màu, trích xuất các đặc trƣng và đƣợc huấn luyện lƣu vào tập
tin Training_Data.mat
• Phân đoạn ảnh: Phân vùng ảnh đầu vào và tìm các các đặc trƣng
giống nhau trên ảnh đầu vào đƣa vào các cụm tƣơng ứng.
• Dự đoán bệnh: Thực hiện phân lớp và chẩn đoán hiển thị kết quả.

Hình 3. 13 Giao diện huấn luyện và chẩn đoán bệnh
Huấn luyện SVM yêu cầu dữ liệu đƣợc diễn tả nhƣ các vector
của các số thực. Trong quá trình huấn luyện sẽ sử dụng thuật toán tối
ƣu hóa khoảng cách giữa các siêu phẳng trong quá trình phân lớp,
xác định hàm phân lớp trong không gian đặc trƣng nhờ việc ánh xạ
dữ liệu vào không gian đặc trƣng bằng cách mô tả hạt nhân và cuối
cùng là kiểm thử tập dữ liệu.

Máy học SVM trong thực nghiệm này là máy học với hàm
nhân (kernel) RBF, với tham số C bằng 12 và Gama bằng 2-8.
Thực nghiệm cũng đã đƣợc làm với một số tham số khác của
C và Gama, bộ tham số nói trên đƣợc chọn bằng phƣơng pháp thử và
sai. Do tham số Gama nhỏ nên có thể dùng máy học SVM với hàm
nhân tuyến tính (linear kernel). Kết quả thực nghiệm trên cùng bộ dữ


-22liệu với hàm nhân tuyến tính (C=10 và eps=0.01) cho kết quả tốt hơn
trên hàm nhân RBF, nhƣng không có khác biệt nhiều. Vì vậy có thể
dùng hàm nhân RBF hay hàm nhân tuyến tính với các tham số nhƣ
vừa nêu.
3.5.4.2 Kết quả thực nghiệm:
Hình ảnh lá/quả xoài đƣa vào kiểm tra sẽ đƣợc tiền xử lý để
nâng cao chất lƣợng ảnh, loại bỏ các tạp nhiễu, sau khi xử lý tiếp tục
đƣa vào trích xuất các tham số đặc trƣng để đƣa vào chẩn đoán bệnh.
Kết quả hiển là tên bệnh/không bệnh.
Bảng 3. 4 Số lƣợng mẫu dùng trong thực nghiệm
Số mẫu huấn
Số mẫu
Tổng số
Tên lớp
luyện
kiểm tra
mẫu
Bệnh thối trái
100
20
100
Bệnh nứt trái

100
20
100
Trái không bệnh
100
20
100
Lá thán thƣ
100
20
100
Lá ghẻ lồi
100
20
100
Lá không bệnh
100
20
100
Tổng
600
120
600
Bảng 3. 5 Kết quả thực nghiệm phân lớp bằng máy học SVM
Tên lớp

Bệnh thối trái
Bệnh nứt trái
Không bệnh
Lá thán thƣ

Lá ghẻ lồi
Lá không bệnh

Nhãn lớp
1
2
3
4
5
6

Bệnh
thối
trái

Bệnh
nứt
trái

Không
bệnh

1
17
2
1
0
0
0


2
2
16
1
0
0
0

3
1
2
18
0
0
0


thán
thƣ
a. 4
0
0
0
16
1
3


ghẻ
lồi



không
bệnh

5
0
0
0
1
18
2

6
0
0
0
3
1
15

Tổng
mẫu
kiểm
tra
20
20
20
20
20

20

Trong đó:
• Tên các lớp đƣợc gán nhãn từ 1 đến 6 tƣơng ứng với 6 tên lớp
• Bệnh thối trái đƣợc gán nhãn 1, với tổng mẫu kiểm thử là 20, trong
đó 17/20 mẫu chẩn đoán đ ng “bệnh thối trái”, 1/20 mẫu đƣợc chẩn


-23đoán “không bệnh”, 2/20 mẫu đƣợc chẩn đoán “ bệnh nứt trái”, độ
chính xác=17/20*100=85%
• Bệnh Lá thán thƣ đƣợc gán nhãn 4, với tổng mẫu kiểm thử là 20,
trong đó 16/20 mẫu chẩn đoán đ ng “Lá thán thƣ”, 1/20 mẫu đƣợc
chẩn đoán “ghẻ lồi”, 3/20 mẫu đƣợc chẩn đoán “ không bệnh”, độ
chính xác=16/20*100=80%
• Với số mẫu đƣa vào kiểm tra càng nhiều thì độ chính xác càng cao
3.6 Kết quả chẩn đoán
3.6.1 Lá bệnh thán thư
• Các tham số đặc trƣng và kết quả chẩn đoán ảnh của lá xoài
bị bệnh thán thƣ khi đƣa vào kiểm tra

Hình 3. 14 Bệnh thán thƣ

3.6.2 Bệnh ghẻ lồi trên lá xoài



Các tham số đặc trƣng và kết quả chẩn đoán ảnh của lá xoài bị
bệnh ghẻ lồi khi đƣa vào kiểm tra

Hình 3. 15 Bệnh ghẻ lồi



×