Tải bản đầy đủ (.docx) (42 trang)

NHẬN DẠNG CÁC BỆNH TRÊN LÁ cây DÙNG kỹ THUẬT xử LÝ ẢNH (có code)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.09 MB, 42 trang )

ĐỒ ÁN TỐT NGHIỆP

NHẬN DẠNG CÁC BỆNH TRÊN LÁ
CÂY DÙNG KỸ THUẬT XỬ LÝ ẢNH

1


DANH MỤC CÁC TỪ VIẾT TẮT
GLCM

Gray Level Coocurrence Matrices

ICA

Independent Component Analysis

KNN

K-Nearest Neighbor

PCA

Principal Component Analysis

SVM

Support Vector Machine

SIFT


The Scale Invariant Feature Transform

2


ĐỒ ÁN TỐT NGHIỆP
Trang 1/41

CHƯƠNG 1. GIỚI THIỆU ĐỀ TÀI
1.1 Giới thiệu
Bệnh trên lá cây được xem là bệnh phổ biến đối với người nhà nông, mỗi loại
bệnh trên lá cây làm cho cây sinh trưởng phát triển kém, năng suất bị giảm sút. Ví
dụ bệnh vàng lá, bệnh sâu vẽ bùa….

Hình 1-1 Bệnh vàng lá [4]

Hình 1-2 Bệnh sâu vẽ bùa [4]

Để giúp người nhà nông các nhà nghiên cứu đã tìm ra nhiều phương hướng khắc
phục, một trong các giải pháp đó là phát hiện bệnh trên lá cây thông qua xử lý ảnh.
Nhận dạng các loại bệnh trên lá cây thông qua xử lý ảnh là phương pháp nhận dạng
màu sắc, hình dạng, kích thước của lá cây bị bệnh so với lá cây bình thường ban
đầu, từ đó rút ra nguyên nhân gây ra bệnh của cây mà khắc phục.
1.2 Mục tiêu đề tài

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP

Trang 2/41

Tìm hiểu được các loại bệnh trên lá của cây ăn quả có múi (cây bưởi) và xây
dựng giải thuật nhận diện các loại bệnh trên lá cây thông qua kỹ thuật xử lý ảnh.
Phần mềm Matlab được dùng để thực hiện tính toán, phân tích và so sánh dữ liệu
bệnh trên lá, từ đó xây dựng giao diện tương tác giúp đỡ cho những người trồng
trọt.
1.3 Nội dung thực hiện đề tài
Đề tài được thực hiện với các nội dung cơ bản như sau:
 Tìm hiểu tổng quan về xử lý ảnh và nhận dạng.
 Tìm hiểu các loại bệnh trên lá cây ăn quả có múi, tập trung vào lá cây bưởi.
 Xây dựng mô hình giải thuật phát hiện các bệnh cơ bản trên lá cây bưởi.
o Tập hợp cơ sở dữ liệu các ảnh lá bị bệnh
o Xây dựng mô hình hệ thống gồm các bước: Tiền xử lý, trích đặc trưng
dựa trên mùa sắc/hình dạng bệnh trên lá, phân loại dùng thuật toán
phân lớp SVM.
 Thực hiện đánh giá mô hình giải thuật phát hiện bệnh dựa trên tập cơ sở dữ
liệu đã thu thập.
 Xây dựng được một giao diện tương tác người dùng.

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 3/41

CHƯƠNG 2. TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ NHẬN DẠNG
1.4 Lý thuyết xử lý ảnh
Xử lý ảnh và đồ họa có vai trò rất quan trọng tương tác người và máy, với việc

thu nhận thông tin thông qua các giác quan, thị giác đóng vai trò quan trọng nhất.
Gần đây với sự phát triển mạnh mẽ của công nghệ nói chung và xử lý ảnh nói riêng,
xử lý ảnh có rất nhiều ứng dụng trong cuộc sống, góp phần làm thỏa mãn các nhu
cầu của con người.
1.1.1 Những khái niệm cơ bản trong hệ thống xử lý ảnh
 Điểm ảnh (Picture Element)
Điểm ảnh (Pixel) là một phần tử của ảnh số tại toạ độ (x, y) với độ xám hoặc
màu nhất định. Kích thước và khoảng cách giữa các điểm ảnh đó được chọn thích
hợp sao cho mắt người cảm nhận sự liên tục về không gian và mức xám (hoặc màu)
của ảnh số gần như ảnh thật. Mỗi phần tử trong ma trận được gọi là một phần tử
ảnh.
 Độ phân giải của ảnh
Độ phân giải (Resolution) của ảnh là mật độ điểm ảnh được ấn định trên một
ảnh số được hiển thị. Theo định nghĩa, khoảng cách giữa các điểm ảnh phải được
chọn làm sao cho mắt người vẫn thấy được sự liên tục của ảnh. Việc lựa chọn
khoảng cách thích hợp tạo nên một mật độ phân bổ, đó chính là độ phân giải và
được phân bố theo trục x và trục y trong không gian hai chiều.
 Mức xám của ảnh
Mức xám là cường độ sáng của điểm ảnh, được gán bằng giá trị số tại điểm đó.
Các thang giá trị mức xám thông thường: 16, 32, 64, 128, 256 (Mức 256 là mức phổ
biến). Lý do: từ kỹ thuật máy tính dùng 1 byte (8 bit), để biểu diễn mức xám: Mức
xám dùng 1 byte biểu diễn: 28=256 mức, tức là từ 0 đến 255).
 Một số phân loại ảnh:

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 4/41


o Ảnh đen trắng: là ảnh có hai màu đen, trắng (không chứa màu khác) với
mức xám ở các điểm ảnh có thể khác nhau.
o Ảnh nhị phân: là ảnh chỉ có 2 mức đen trắng phân biệt tức dùng 1 bit mô
tả 21 mức khác nhau. Nói cách khác: mỗi điểm ảnh của ảnh nhị phân chỉ
có thể là 0 hoặc 1.
o Ảnh màu: trong khuôn khổ lý thuyết ba màu (Red, Blue, Green) để tạo
nên thế giới màu, người ta thường dùng 3 byte để mô tả mức màu, khi đó
các giá trị màu: triệu màu.
o Ảnh số: Ảnh số là tập hợp các điểm ảnh với mức xám phù hợp, dùng để
mô tả ảnh gần với ảnh thật.
 Không gian màu HSV
Không gian màu HSV là một không gian màu dựa trên ba số liệu:
o H(Hue): Vùng màu
o S(Saturation): Độ bão hòa màu
o V(Value): Độ sáng

Hình 2-1 Không gian màu HSV [6]

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 5/41

 Hệ màu lab
Hệ màu CIE L*a*b*, được xây dựng dựa trên khả năng cảm nhận màu của mắt
con người. Các giá trị Lab mô tả tất cả những màu sắc, mà mắt một con người bình
thường có thể nhìn thấy được. Lab được coi là một mô hình màu độc lập đối với

thiết bị, thường được sử dụng như một cơ sở tham chiếu, khi chuyển đổi một màu
từ một không gian màu này sang một không gian màu khác.

Hình 2-2 Hệ màu Lab [6]

Đối với hệ màu lab:







có giá trị càng lớn, màu của ảnh nghiêng về màu trắng.
có giá trị càng nhỏ, màu của ảnh nghiêng về màu đen.
có giá trị càng lớn, màu của ảnh nghiêng về màu đỏ.
có giá trị càng nhỏ, màu của ảnh nghiêng về màu lục.
có giá trị càng lớn, màu của ảnh nghiêng về màu vàng.
có giá trị càng nhỏ, màu của ảnh nghiêng về màu xanh.

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 6/41

1.1.2 Giới thiệu về hệ thống xử lý ảnh
Các bước cơ bản trong một hệ thống xử lý ảnh được thể hiện trên hình 2.3.
Thu nhân

ảnh

Tiền xử lý
ảnh

Phân
đoạn ảnh

Biểu diễn
và mô tả

Nhân dạng và
nôi suy

Hình 2-3 Các bước cơ bản trong xử lý ảnh

 Thu nhận ảnh (Image Acquisition)
Ảnh có thể nhận qua camera màu hoặc đen trắng. Thường ảnh nhận qua camera
là ảnh tương tự (loại camera ống chuẩn CCIR với tần số 1/25, mỗi ảnh 25 dòng),
cũng có loại camera đã số hoá (như loại CCD – Change Coupled Device) là loại
photodiot tạo cường độ sáng tại mỗi điểm ảnh.
Camera thường dùng là loại quét dòng, ảnh tạo ra có dạng hai chiều. Chất lượng
một ảnh thu nhận được phụ thuộc vào thiết bị thu, vào môi trường (ánh sáng, phong
cảnh).
 Tiền xử lý (Image Processing)
Sau bộ thu nhận, ảnh có thể nhiễu độ tương phản thấp, nên cần đưa vào bộ tiền
xử lý để nâng cao chất lượng. Chức năng chính của bộ tiền xử lý là lọc nhiễu, nâng
độ tương phản để làm ảnh rõ hơn, nét hơn.
 Phân đoạn (Segmentation) hay phân vùng ảnh
Phân vùng ảnh là tách một ảnh đầu vào, thành các vùng thành phần để biểu diễn

phân tích, nhận dạng ảnh. Ví dụ: để nhận dạng chữ (hoặc mã vạch) trên phong bì
thư cho mục đích phân loại bưu phẩm, cần chia các câu, chữ về địa chỉ hoặc tên
người thành các từ, các số, các chữ (hoặc các vạch), riêng biệt để nhận dạng. Đây là
phần phức tạp khó khăn nhất trong xử lý ảnh và cũng dễ gây ra lỗi, làm mất độ
chính xác của ảnh, kết quả nhận dạng ảnh phụ thuộc rất nhiều vào công đoạn này.
 Biểu diễn ảnh (Image Representation)
Đầu ra ảnh sau phân đoạn, chứa các điểm ảnh của vùng ảnh (ảnh đã phân đoạn),
cộng với mã liên kết với các vùng lận cận. Việc biến đổi các số liệu này thành dạng
thích hợp là việc cần thiết cho xử lý tiếp theo bằng máy tính. Việc chọn các tính
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 7/41

chất để thể hiện ảnh gọi là trích chọn đặc trưng (Feature Selection), gắn với việc
tách các đặc tính của ảnh dưới dạng các thông tin định lượng, làm cơ sở để phân
biệt lớp đối tượng này với lớp đối tượng khác trong phạm vi ảnh nhận được. Ví dụ:
trong nhận dạng ký tự trên phong bì thư, chúng ta miêu tả các đặc trưng của từng ký
tự giúp phân biệt ký tự này với ký tự khác.
 Nhận dạng và nội suy ảnh (Image Recognition and Interpretation)
Nhận dạng ảnh là quá trình xác định ảnh. Quá trình này thường thu được bằng
cách so sánh với mẫu chuẩn đã được học (hoặc lưu) từ trước. Nội suy là phán đoán
theo ý nghĩa trên cơ sở nhận dạng. Ví dụ: Các chữ số và các nét gạch ngang trên
phong bì thư có thể được nội suy thành mã điện thoại. Có nhiều cách phân loai ảnh
khác nhau về ảnh. Theo lý thuyết về nhận dạng, các mô hình toán học về hình ảnh
được phân theo hai loại nhận dạng ảnh cơ bản:
o Nhận dạng theo tham số.
o Nhận dạng theo cấu trúc.

Một số đối tượng nhận dạng khá phổ biến hiện nay đang được áp dụng vào khoa
học và công nghệ là: nhận dạng ký tự (chữ viết tay, chữ in, chữ ký điện tử), nhận
dạng văn bản (Text), nhận dạng mã vạch, nhận dạng vân tay, nhận dạng mặt
người…
1.5 Các kỹ thuật nhận dạng
Đề phân lớp (Classification) và dự đoán (prediction) là hai bài toán cơ bản, có
rất nhiều ứng dụng trong tất cả các lĩnh vực. Có nhiều phương pháp đã được nghiên
cứu và ứng dụng cho các bài toán dạng này như: mạng Nơron nhân tạo, phương
pháp học thống kê, phương pháp phân lớp SVM (support vector machines), phương
pháp phân vùng KNN (k-nearest neighbor), hoặc dựa trên thành phần chung-nét
tổng thể PCA (Principal Component Analysis) hay thành phần riêng ICA
(Independent Component Analysis) của đối tượng…
1.1.3 Phương pháp Support Vector Machines

1.1.1.1 Giới thiệu

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 8/41

SVM là phương pháp học có giám sát do Vladimir N. Vapnik đề xuất vào năm
1995, và ngày càng được sử dụng phổ biến trong nhiều lĩnh vực, đặc biệt là lĩnh vực
phân loại mẫu và nhận dạng mẫu.
1.1.1.2 Tổng quát về SVM
Ví dụ, có các điểm dữ liệu như hình dưới đây với mỗi điểm thuôc
1 trong 2 lớp cho trước:
Lớp 1

Lớp 2

Hình 2-4 Các điểm dữ liệu nằm ở hai lớp [2]

Môt đường thẳng phân cách có thể được vẽ như sau:
Lớp 1

Đường phân cách

Lớp 2

Hình 2-5 Đường thẳng phân chia hai lớp [2]

Đường thẳng trên chia cách khá tốt 2 lớp trên mặt phẳng, tất cả
những điểm dữ liệu nằm bên trái đường thẳng, đều thuôc về lớp
hình tròn, những điểm nằm ở bên phải thuôc về lớp hình vuông.
Nhiệm vụ của SVM chính là tìm ra đường thẳng / siêu phẳng phân
cách cách sao cho phân loại dữ liệu tốt nhất có thể.

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 9/41

Mặt phân chia tôi ưu

Biên co đô rông tôi đa
Hình 2-6 Mặt phân chia tối ưu [2]


Ví dụ trên có các điểm dữ liệu thuôc 2 lớp có thể phân cách trực
tiếp bằng 1 đường thẳng. Tuy nhiên, không phải dạng dữ liệu nào
cũng đơn giản được như vây. Ví dụ với dạng dữ liệu như hình dưới:

Hình 2-7 Các điểm dữ liệu phân bố không đều [2]

Với các điểm dữ liệu thế này, không thể phân cách chỉ bằng 1 đường thẳng. Các
điểm dữ liệu của lớp hình tròn nằm tập trung ở xung quanh gốc tọa độ và để phân
cách chúng với các điểm dữ liệu của lớp hình vuông, phải sử dụng đường cong.
Trong trường hợp này, đường cong đơn giản nhất có thể nghĩ đến là hình tròn. Áp
dụng điều này bằng cách thêm 1 chiều không gian z = x2 + y2. Nếu để ý thì sẽ
thấy z chính là công thức của 1 hình tròn có tâm tại gốc tọa độ. Thử vẽ lại đồ thị
của các điểm dữ liệu trên không gian zy:

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 10/41

Hình 2-8 Các điểm dữ liệu hai lớp tách riêng biệt qua đường phân cách [2]

Tại không gian này, các điểm dữ liệu đã có thể phân cách bằng
1 đường thẳng. Nói môt cách khác, với chiều không gian mới z,
việc phân loại đã trở nên đơn giản hơn rất nhiều.
Việc sử dụng thủ thuât biến đổi đại số và thêm chiều không
gian z được gọi là phương pháp kernels, Với các tâp dữ liệu khác
nhau có thể sử dụng các kernels có sẵn hoặc sẽ phải sáng tạo ra

1 kernel mới để phù hợp với bài toán.
Tuy nhiên công việc chưa dừng lại ở đó, giả sử rằng nếu dữ liệu
không ổn định và các điểm dữ liệu không phân cách nhau môt
cách rõ ràng, thâm chí còn chồng chéo lên nhau. Xét ví dụ dưới
đây:

Hình 2-9 Ví dụ khác về phân lớp dữ liệu [2]

Với dữ liệu như thế này, việc phân cách các lớp chỉ bằng môt
đường thẳng là không khả thị, cùng xét 2 cách phân chia dưới đây:

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 11/41

Hình 2-10 Không tách được hai lớp dữ liệu riêng biệt [2]

Vẫn sử dụng 1 đường thẳng phân cách nhưng không thể phân
loại đúng được tất cả các điểm dữ liệu.

Hình 2-11 Sử dụng 3 đường thẳng phân cách để phân loại [2]

Các điểm dữ liệu đã được phân loại đúng nhưng phải sử dụng tới
3 đường thẳng phân cách.
Cách 1 sẽ bỏ qua các điểm dữ liệu bất thường (outliner) để đổi
lấy tốc đô tính toán. Cách 2 sẽ không bỏ qua điểm dữ liệu nào và
đạt đô phân cách hoàn hảo nhưng bù lại sẽ đô phức tạp hơn và tốc

đô tính toán sẽ châm hơn cách 1.
1.1.4 Phương Pháp K-nearest neighbor
KNN hay K-nearest neighbor một trong những thuật toán supervised-learning
đơn giản nhất (mà hiệu quả trong một vài trường hợp) trong Machine Learning, khi
training thuật toán này không học được một điều gì từ dữ liệu training (đây cũng là
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 12/41

lý do thuật toán này được xếp vào loại lazy learning). Mọi tính toán được thực hiện
khi nó cần dự đoán kết quả của dữ liệu mới. K-nearest neighbor có thể áp dụng
được

vào

cả

hai

loại

của

bài

toán


Supervised

learning

là Classification và Regression, KNN còn được gọi là một thuật toán Instancebased hay Memory-based learning.
Có một vài khái niệm tương ứng người-máy như sau:
Bảng 2-1 Khái niệm tương ứng người – máy [3]

Với KNN trong bài toán Classification, label của môt điểm dữ liệu
mới (hay kết quả của câu hỏi trong bài thi), được suy ra trực tiếp
từ K điểm dữ liệu gần nhất trong training set. Label của môt test
data, có thể được quyết định bằng major voting (bầu chọn theo số
phiếu), giữa các điểm gần nhất hoặc nó có thể được suy ra bằng
cách đánh trọng số khác nhau, cho mỗi trong các điểm gần nhất
đó rồi suy ra label, chi tiết sẽ được nêu trong phần tiếp theo.
Trong bài toán Regresssion thì đầu ra của môt điểm dữ liệu sẽ
bằng chính đầu ra của điểm dữ liệu đã biết gần nhất hoặc là trung
bình có trọng số của đầu ra của những điểm gần nhất, hoặc bằng
môt mối quan hệ dựa trên khoảng cách tới các điểm gần nhất đó.
Nói môt cách khác thì KNN là thuât toán đi tìm đầu ra của môt
điểm dữ liệu mới, bằng cách chỉ dựa trên thông tin của K điểm dữ
liệu trong training set gần nó nhất (K-lân cân), không quan tâm
đến việc có một vài điểm dữ liệu trong những điểm gần nhất này

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 13/41


là nhiễu. Hình dưới đây là môt ví dụ về KNN trong classification với
K = 1.

Hình 2-11 Các điểm dữ liệu nằm ở 3 lớp Đỏ, Lam, Lục [3]

Ví dụ trên đây là một bài toán Classification với 3 classes: Đỏ, Lam, Lục. Mỗi
điểm dữ liệu mới (test data point), sẽ được gán label theo màu của điểm mà nó
thuộc về. Trong hình này có một vài vùng nhỏ, xen lẫn vào các vùng lớn hơn khác
màu. Ví dụ có một điểm màu Lục ở gần góc 11 giờ, nằm giữa hai vùng lớn với
nhiều dữ liệu màu Đỏ và Lam, điểm này rất có thể là nhiễu. Dẫn đến nếu dữ liệu
test rơi vào vùng này, sẽ có nhiều khả năng cho kết quả không chính xác.
1.1.5 Phương pháp PCA
PCA (Principal Component Analysis), là thuật toán nhận dạng ảnh dựa trên nét
tổng thể của đối tượng. Áp dụng thuật toán này để thực hiện 2 công việc sau:
 Thứ nhất là tìm một khuôn mặt giống với một khuôn mặt trước đó.
 Thứ hai là xác định vị trí những khuôn mặt người trong một bức ảnh.
Phạm vi ứng dụng
 Nhận dạng một con người có phải là tội phạm truy nã hay không? Giúp
các cơ quan an ninh quản lý tốt con người.
 Hệ thống quan sát, theo dõi, bảo vệ. Các hệ thống camera sẽ xác định đâu
là con người và theo dõi con người đó xem họ có vi phạm hay không.
 Lưu trữ, (rút tiền ATM để biết ai rút tiền vào thời điểm đó).
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 14/41


 Thẻ căn cước, chứng minh nhân dân.
 An ninh sân bay, xác thực người xuất nhập cảnh, có phải là nhân vật
khủng bố hay không.
1.1.6 Phương pháp ICA
Để định nghĩa ICA (Independent Component Analysis), có thể sử dụng mô hình
các biến ẩn thống kê, quan sát được n biến ngẫu nhiên x1…, xn, là tổ hợp tuyến tính
của n biến ngẫu nhiên s1…, sn dưới dạng:
(3)
Trong đó (i, j = 1, …, n) là các hệ số thực. Theo định nghĩa, các biến s i là độc
lập thống kê với nhau, như vậy mô hình cơ bản của ICA chính là giải quyết bài toán
x = As cùng với các điều kiện ràng buộc sau:
 Các nguồn tín hiệu gốc ban đầu độc lập thống kê với nhau.
 Ma trận trộn A là ma trận vuông, (số tín hiệu nguồn s và tín hiệu trộn x bằng
nhau) khả nghịch.
 Tối đa chỉ có một nguồn tín hiệu gốc có phân bố Gauss.
1.1.7 Thuật toán SIFT
Khái niệm “Điểm đặc trưng cục bộ bất biến SIFT” (ScaleInvariant Feature
Transform) đã được David G. Lowe đưa ra hồi năm 2004 trong “Distinctive Image
Features from Scale-Invariant Keypoints”.
Ý tưởng:
 Từ các ảnh tìm ra các điểm ảnh đặc biệt, gọi là feature point hay keypoint.
Đầu vào và đầu ra của phép biến đổi SIFT: ảnh -> SIFT -> các keypoint
 Để có thể phân biệt các keypoint này với các keypoint khác cần tìm ra tham
số gì đó gọi là descriptor, 2 keypoint khác nhau thì phải descriptor khác
nhau. Thường thì descriptor là chuỗi số gồm có 128 số (vector 128 chiều).
 Sau khi áp dụng biến đổi SIFT, ứng với mỗi keypoint, thu được (1) toạ độ
keypoint (2) scale, orientation của keypoint (3) descriptor.
Đặc điểm:
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh



ĐỒ ÁN TỐT NGHIỆP
Trang 15/41

 Keypoint phụ thuộc rất ít vào cường độ sáng, nhiễu. Che khuất (một phần
ảnh bị che), góc xoay (ảnh bị xoay trong mặt phẳng 2D), thay đổi của tư thế
(pose thay đổi trong không gian 3D).
 Rất Nhanh tốc độ xử lí gần như thời gian thực (realtime).
Như vậy việc khớp ảnh mẫu với ảnh thường chính là việc khớp các keypoint trong 2
ảnh với nhau:
 Áp dụng SIFT cho từng tấm.
 So sánh descriptor của các keypoint trong ảnh này với descriptor của các
keypoint trong ảnh kia, nếu 2 keypoint có descriptor gần giống nhau thì coi
như 2 điểm trên 2 tấm ảnh, cùng thuộc về một vật (hoặc vật giống nhau).
 Dựa vào thương của scale và hiệu của orientation của 2 keypoint, có thể biết
được thêm vật trong hình này to hơn vật trong hình kia bao nhiêu, vật trong
hình này xoay bao nhiêu độ so với vật trong hình kia là bao nhiêu.

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 16/41

CHƯƠNG 3. TÌM HIỂU CÁC BỆNH TRÊN LÁ CÂY ĂN QUẢ CÓ MÚI
Theo tài liệu khuyến nông, có rất nhiều bệnh trên cây ăn quả có múi, một số
bệnh thường gặp đó là: bệnh vàng lá, bệnh sâu vẽ bùa, bệnh loét vi khuẩn…
1.6 Bệnh vàng lá

1.1.8 Dấu hiệu nhận biết
Quan sát kỹ cây bị bệnh, sẽ thấy mặt lá có những đốm vàng, kèm với đó phần
gân lá nổi rõ màu xanh (số khác lại là gân vàng), nguyên nhân là bởi các loại nấm
khuẩn, tiêu biểu nhất là Phytopthora, chúng tác động trực tiếp vào khả năng đưa
dưỡng chất di nuôi cây, khiến phần lá, quả bị ảnh hưởng nghiêm trọng.

Hình 3-1 Bệnh vàng lá [4]

Bệnh vàng lá Greening, càng có điều kiện phát triển trong những vườn bưởi
nhân giống theo hình thức ghép mắt. Vậy nên chọn giống bưởi thật kỹ càng, như
phát hiện sớm, xử lý kịp thời là điều vô cùng quan trọng.
1.1.9 Cách phòng ngừa và xử lý
Đầu tiên cần phải cách ly và chặt bỏ những cây đã bị lây nhiễm.
Làm sạch các loại cây ký sinh như: tầm gửi, tơ hồng, quế nguyệt, chúng là môi
trường tuyệt vời để các loại rầy, virus sinh sôi nẩy nở. Và cẩn thận hơn có thể sử
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 17/41

dụng một số loại thuốc bảo vệ thực vật như: Chlorpyrifos Ethyl, Cypermethrin, để
phòng và diệt rầy một cách triệt để hơn.
Thường xuyên chú ý quan sát xem cây có biểu hiện bất thường nào không, đặc
biệt là mùa có độ ẩm không khí cao như đầu xuân, hạ lộc non ra nhiều rất dễ bị tấn
công, (đây cũng là mùa rầy sinh sản và phát triển mạnh).
1.7 Bệnh ghẻ nhám
1.1.10 Dấu hiệu nhận biết
Trong danh sách các bệnh hại phổ biến ở cây ăn quả có múi thì ghẻ nhám cũng

là loại rất hay gặp. Khi cây bị bệnh, sẽ thấy lá xuất hiện những chấm nhỏ có màu
khác với màu lá. Tại đó còn xuất hiện hiện tượng lõm xuống. Giai đoạn tiếp theo
các chấm này biến đổi thành các đốm màu nâu (trông như các vết ghẻ), sau cùng lá
sẽ bị vàng và rụng xuống.

Hình 3-2 Bệnh ghẻ nhám [4]

Bệnh ghẻ nhám có thể phát triển trên: thân, bề mặt quả, tạo ra các vết lồi và sần
sùi khiến cây nhanh chết đi, năng suất giảm, ức chế ngăn cản sự phát triển của cành
non và lộc.
Nguyên nhân chính gây ra bệnh: là do nấm Elsinoe Fawcetti, xuất hiện nhiều
nhất khi mùa mưa bắt đầu, khi lộc non ra nhiều nhưng lại thiếu sự chăm sóc chu đáo
của người trồng.
1.1.11Cách phòng ngừa và khắc phục
Khi bắt đầu, lên kế hoạch trồng bưởi cần có một nguồn cây giống “sạch”, khỏe
mạnh, tránh việc trồng mau (khoảng cách nên căn cứ giống cây nào – chất đất ra
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 18/41

sao), cần thường xuyên cắt tỉa và tạo tán thường xuyên. Nên bón phân tập trung
thành đợt trong năm, tránh bón đều đều khiến lộc ra liên tục rất dễ bị nấm bệnh tấn
công.
Phun phòng ngừa bằng: Carbenda Supper 50SC 0.15%, Catcat 250EC 0.08%,
một cách khác là hòa Bemyl 300g 50WP với 100 lít nước.
Khi cây có biểu hiện bệnh, cần tránh tưới nước vào các tán cây. Nên cắt bỏ, và
đem đốt cành lá bị bệnh ở xa vườn trồng.

1.8 Bệnh sâu vẽ bùa
1.1.12 Dấu hiệu gây hại
Sâu vẽ bùa gây hại trên các lá non và chồi. Sâu non đục phá lá ở dưới phần biểu
bì, ăn phần mô mềm, sâu đi tới đâu thì biểu bì phồng lên tới đó và vẽ thành những
đường ngoằn ngoèo nên được gọi là vẽ bùa. Các lằn đục của sâu không bao giờ gặp
nhau.

Hình 3-3 Bệnh sâu vẽ bùa [4]

Các lá bị sâu vẽ bùa gây hại, thường bị co rúm lại và biến dạng nhiều nhất là
những lá non, làm giảm diện tích quang hợp, làm giảm khả năng sinh trưởng của
các chồi non.
1.1.13 Cách phòng ngừa và xử lý
Chăm sóc cho cây sinh trưởng môt cách tốt nhất, tạo tán, tỉa cành, bón thúc cho
lộc non ra tập trung, hạn chế phá hại của sâu. Thu dọn lá rụng trong vườn đốt bỏ
cũng làm hạn chế nguồn sâu. Trường hợp bị hại nặng, có thể cắt bỏ các chồi lá bị
sâu đem tập trung một chỗ để tiêu diệt.
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 19/41

Biện pháp sử dụng thuốc BVTV hợp lý để bảo vệ nguồn thiên địch của sâu vẽ
bùa trong tự nhiên. Nhận nuôi thiên địch như nuôi kiến vàng Oecophylla
smaragdina là biện pháp có hiệu quả phòng trị sâu vẽ bùa cao
Sử dụng các loai thuốc như SAIRIFOS 585EC, SAIMIDA 100SL, LANCER
50SP, SHERZOL 205EC, Dầu khoáng SK EnSpray 99EC… để phòng trị.
Nên phun thuốc hay dầu khoáng ngay khi chồi mới nảy dài khoảng từ 2 đến

4cm.
1.9 Bệnh loét vi khuẩn
1.1.14

Dấu hiệu nhân biết

Hình 3-4 Bệnh loét vi khuẩn [4]

Nằm trong danh sách những bệnh hại trên cây ăn quả có múi tiếp theo đó là
bệnh loét vi khuẩn, (hay còn gọi là Xanthomonas Campestris). Khi bị tấn công trên
bề mặt lá sẽ xuất hiện hiện tượng có các chấm lốm đốm, các đốm này khi bị nặng sẽ
kết dính lại tạo thành mảng lớn.
Đặc biệt là vào mùa mưa, độ ẩm không khí cao, tốc độ lây lan của bệnh loét vi
khuẩn sẽ càng nhanh khiến vườn cây ăn quả có thể bị trút sạch lá sau 1 thời gian
ngắn...
1.1.15 Cách phòng ngừa và xử lý
Lựa chọn giống kĩ càng, vị trí đất trồng kỹ lưỡng và có hệ thống tưới tiêu nước
tiện lợi.

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 20/41

Cần tiến hành bổ sung các chất dinh dưỡng nhằm tăng cường sức đề kháng cho
cây. Nếu thiếu kinh nghiệm trong việc bổ sung phân đơn, thì có thể dùng các loại
phân tổng hợp NPK.
Kết hợp phun thuốc bảo vệ thực vật như: Boocđô nồng độ 1%, Kasuran nồng độ

0,15% khi bưởi bắt đầu phát lộc 1 – 2 lần, mỗi lần cách nhau 2 tuần.
Khi phát hiện nấm bệnh đã nặng cần có phương án cắt bỏ, thiêu hủy sớm nhất có
thể.
1.10 Bệnh thán thư (Collectotrichum sp)
1.1.16 Dấu hiệu nhận biết
Khi bệnh bắt đầu xuất hiện, các lá hoặc trái cây ăn quả có múi sẽ có màu nâu
xẫm, dạng hình tròn ở giữa có chấm màu đen. Thông thường thì bệnh phát triển
mạnh trong thời kỳ trái bắt đầu ra hoa và tạo trái non, khả năng lây lan nhanh hơn
nếu gặp điều kiện mưa, ẩm, sương dày kéo dài.

Hình 3-5 Bệnh thán thư [4]

1.1.17 Cách phòng ngừa và xử lý
Cần tiến hành các phương án như chọn giống chất lượng, thiết kế vườn trồng
đúng quy cách.
Nên tìm đến các cửa hàng bán thuốc bảo vệ thực vật để hỏi mua các loại thuốc
có chứa Azoxystrobin, Carbendazim, Metalaxyl, Difenocanazole, Tebuconazole…
Đặc biệt là dùng Carmanthai 80WP là loại có hiệu quả cực tốt, giúp ngăn chặn gần
như 100% bệnh thán thư.

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 21/41

CHƯƠNG 4. XÂY DỰNG MÔ HÌNH GIẢI THUẬT PHÁT HIỆN BỆNH
TRÊN LÁ CÂY ĂN QUẢ CÓ MÚI
Giải thuật phát hiện bệnh trên lá cây ăn quả có múi dùng kỹ thuật xử lý ảnh

được xây dựng dựa trên hình ảnh đặc trưng bệnh trên lá đã trình bày trong chương
3. Đề tài này tập trung vào việc phát hiện một số bệnh cơ bản gồm: bệnh vàng lá,
bệnh sâu vẽ bùa, bệnh loét vi khuẩn.
1.11 Sơ đồ khối của hệ thống
Một hệ thống phát hiện bệnh trên lá cây bưởi được xây dựng tổng quát gồm các
bước như trên sơ đồ sau:
Tâp mâu huân luyện
(Lá co bệnh/không bệnh)

Mâu kiểm tra

Tiền xử lý ảnh

Tiền xử lý ảnh

Trich đặc trưng ảnh

Trich đặc trưng ảnh

Huân luyện hệ thông
(Phân lớp với thuât toán SVM)

Cơ sơ dư liệu đa đươc phân
lớp

Chuẩn đoán

Kết quả

Hình 4-1 Sơ đồ khối hệ thống phát hiện bệnh trên lá.


Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


ĐỒ ÁN TỐT NGHIỆP
Trang 22/41

1.12 Tập ảnh huấn luyện và kiểm tra
CSDL ảnh tập hợp các ảnh được chụp từ camera điện thoại, máy ảnh, từ nhiều
nguồn khác nhau …

Hình 4-2 Một số mẫu ảnh lá bị bệnh được chụp từ máy ảnh.

1.13 Tiền xử lý ảnh
Để lấy được phần ảnh bệnh của lá, hệ thống thực hiện các bước tiền xử lý sau:
Ảnh gôc

Nâng cao đô tương
phản của ảnh

Chuyển ảnh RGB sang
ảnh CIE L*a*b
Tách vung bệnh sử dung
thuât toán k-Means

Ảnh RGB chứa
vung bệnh
Hình 4-3 Sơ đồ tiền xử lý


1.1.18 Nâng cao độ tương phản của ảnh
Đầu tiên để nâng cao độ tương phản của ảnh thì cần phải quan tâm độ sáng của
bức ảnh.
Độ sáng:
Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh

(5)


ĐỒ ÁN TỐT NGHIỆP
Trang 23/41



là ảnh đã được điều chỉnh độ sáng



là ảnh ban đầu

 là hệ số chạy từ 0 đến 255
Tiếp theo để điều chỉnh độ tương phản, sử dụng công thức sau.
Độ tương phản:

(5)

 Nếu : tăng độ tương phản ảnh.
 Nếu : độ tương phản ảnh giữ nguyên.
 Nếu : giảm độ tương phản ảnh.

1.1.19 Chuyển không gian màu RGB sang CIE L*a*b
 Bước 1: Chuyển không gian màu RGB sang không gian màu CIE XYZ và
ngược lại.
(5)
Trong đó:
,
 Bước 2: Chuyển không gian màu CIE XYZ sang không gian màu CIE
L*a*b.
L* = 116Y’ – 16
a* = 500(X’ – Y’)
b* = 200(Y’ – Z’)
Trong đó:
X’ = f(X/Xref), Y’ = f(Y/Yref), Z’ = f(Z/Zref), và
Với Xref = 0.950456, Yref = 1.000000 và Zref = 1.088754. Giá trị L* là số dương nằm
trong khoảng [0, 100], các giá trị của a* và b* nằm trong khoảng từ [-127, +127].
1.1.20

Tách vùng bệnh sử dụng thuật toán k – Means

Nhận dạng các bệnh trên lá cây dùng
kỹ thuật xử lý ảnh


×