Tải bản đầy đủ (.pdf) (9 trang)

So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.47 MB, 9 trang )

168

KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC

So sánh các phương pháp kết hợp giữ xử lý ảnh và máy học trong việc
nhận dạng mẫu ứng dụng cho nhận biết bệnh trên lá cà phê
Lê Văn Minh
Khoa Công nghệ Thông tin và Truyền thơng, Đại học Đà Nẵng, Việt Nam


Tóm tắt. Hiện nay, Việt Nam đang là một trong những nước xuất khẩu cà phê hàng đầu thế
giới. Thực tế là việc phát triển cây cà phê ở nước ta luôn gặp thách thức về mơi trường và
bệnh dịch vì khí hậu nhiệt đới gió mùa thuận lợi cho sâu bệnh phát triển. Với sự phát triển
của công nghệ thông tin và các ngành nghiên cứu chuyên sâu như xử lý ảnh và máy học,
việc nhận dạng và đưa ra quyết định dựa trên hình ảnh ngày càng được áp dụng rộng rãi.
Điều này thúc đẩy nhóm tác giả nghiên cứu các phương pháp để ứng dụng những thành tựu
hiện có trong xử lý ảnh và máy học vào việc nhận dạng bệnh của cây cà phê dựa trên hình
ảnh của lá cây. Trong bài báo này, nhóm tác giả tổng hợp và so sánh các giải pháp kết hợp
giữa xử lý ảnh và các thuật toán máy học trong bài tốn nhận dạng. Nhóm tác giả cịn minh
họa bằng bài toán nhận dạng các bệnh trên cây cà phê dựa vào hình ảnh của lá cà phê.
Từ khóa: máy học; nhận dạng mẫu; xử lý ảnh; trích xuất đặt trưng; tìm đường bao;

1

Giới thiệu

1.1

Nhận dạng bệnh dựa trên lá cà phê

Hiện nay, Việt Nam đang là nước đứng thứ hai trên giới về xuất khẩu cà phê[1]. Diện tích


trồng cà phê hiện nay khoảng 643.159 ha và sẽ tăng lên trong những năm tiếp theo[2]. Thực tế
là việc phát triển cây cà phê ở nước ta luôn gặp thách thức về mơi trường và bệnh dịch vì khí
hậu nhiệt đới gió mùa thuận lợi cho sâu bệnh phát triển. Điều này thúc đẩy giới khoa học nghiên
cứu việc xác định các loại bệnh trên cây cà phê.
Thông thường, để chẩn đốn bệnh của cây trồng người nơng dân sẽ dựa vào kinh nghiệm của
mình. Cụ thể là người nơng dân sẽ quan sát lá cây cà phê rồi dùng những kinh nghiệm của mình
để chẩn đốn bệnh. Việc chẩn đốn bệnh dựa trên kinh nghiệm luôn là vấn đề đối với nơng dân
vì khơng phải mọi người dân đều có kiến thức về bệnh của cây trồng, do đó việc phát hiện bệnh
bằng kinh nghiệm không kịp thời và tỉ lệ chính xác chưa cao dẫn đến nhiều thiệt hại về kinh tế.
Vì vậy cần sử dụng các phương pháp xác định bệnh nhanh chóng để nơng dân có những phương
pháp xử lý kịp thời.
Với sự phát triển của công nghệ thông tin và các ngành nghiên cứu chuyên sâu như xử lý
ảnh[3] và máy học[4], việc nhận dạng và đưa ra quyết định dựa trên hình ảnh ngày càng được
áp dụng rộng rãi[5]. Điều này thúc đẩy nhóm tác giả nghiên cứu các phương pháp để ứng dụng
những thành tựu hiện có trong xử lý ảnh và máy học để nhận dạng bệnh của cây cà phê dựa vào
hình ảnh của lá cây.
1.2

Bài toán cần giải quyết

Cho tới nay, nhiều nhóm tác giả đã cơng bố nhiều cơng trình khác nhau liên quan đến việc
kết hợp sự ưu việt của xử lý ảnh và máy học để giải quyết một vấn đề cụ thể nào đó về nhận


Lê Văn Minh

169

dạng[6]. Nhóm tác giả ở[7] đã trình bày những cống hiến của xử lý ảnh đối với việc phát hiện
và điều trị bệnh tiểu đường. Ngay trong lĩnh vực nơng nghiệp, nhiều cơng trình ứng dụng xử lý

ảnh vào nhận dạng cũng được sử dụng[8][9][10].
Trong bài báo này, bài tốn mà nhóm tác giả phải giải quyết là nhận biết bệnh của cây cà phê
dựa vào hình ảnh của lá cà phê. Yêu cầu của bài toán này cụ thể là một chương trình nhận diện
hình ảnh của lá cà phê làm đầu vào và trả về kết quả là cây cà phê đó bị bệnh gì. Để tăng tính
cống hiến của cơng trình, nhóm tác cịn giả trình bày việc so sánh các giải pháp kết hợp giữa xử
lý ảnh và máy học với mục đích là áp dụng vào việc nhận biết bệnh của cây cà phê dựa trên
hình ảnh của lá cà phê. Nhóm tác giả kỳ vọng cơng trình này sẽ hữu ích cho những nghiên cứu
sau này khi chọn giải pháp cho bài toán nhận dạng bệnh đối với cây trồng dựa vào hình ảnh của
lá cây. Bài báo này được tổ chức như sau: phần hai sẽ đánh giá các nghiên cứu hiện tại liên quan
đến vấn đề đang trình bày; phần ba sẽ trình bày giải pháp mà nhóm tác giả đề xuất để so sánh
các phương pháp nhằm chọn ra phương pháp tốt nhất; phần bốn sẽ là phần thực nghiệm và đánh
giá; cuối cùng là phần kết luận và các thảo luận liên quan đến kết quả thu được.

2

Giới thiệu

Nhận định đầu tiên của nhóm tác giả đó là bài toán này thuộc loại bài toán nhận dạng mẫu
(pattern recognition)[11][12]. Do đó, trình tự các bước trong bài báo này tương ứng với trình tự
các bước giải một bài tốn nhận dạng nói chung[13][14].
2.1

Tiền xử lý

Đối tượng làm việc của bài tốn này là các tập ảnh, do đó việc tiền xử lý thực chất là xử lý
ảnh. Đây cũng là lý do mà nhận dạng mẫu thường gắn liền với xử lý ảnh.
Phân tích màu.
Như chúng ta đã biết thì có nhiều hệ thống màu thể hiện cho bức ảnh[15][16]. Để đơn giản,
nhóm tác giả đề xuất tập trung vào hệ thống màu RGB[17]. Đối với hệ màu này, chúng ta sẽ
tổng hợp tất cả các màu khả kiến dựa trên tỉ lệ của ba màu (xanh lục, xanh dương và màu đỏ).

Việc phân tích từng kênh màu cũng đóng góp đáng kể cho việc nhận dạng như đã trình bày
trong các cơng trình [18][19][20]. Trong đề tài này, nhóm tác giả cũng thực hiện phân tích màu
vì những lá cà phê bị những bệnh khác nhau thì màu sắc cũng khác nhau. Chi tiết trình bày
trong phần tiếp theo của bài báo.
Phát hiện biên.
Phát hiện biên cũng là một kỹ thuật quan trọng trong việc tiền xử lý dữ liệu. Các phương
pháp phát hiện biên như canny[21], sobel[22], prewitt[23] cũng góp phần nâng cao độ chính xác
của nhận dạng.
2.2

Trích xuất đặc trưng

Trích xuất đặc trưng được xem như là bước quan trọng nhất của việc nhận dạng. Bước này
quyết định chủ yếu độ chính xác của quá trình nhận dạng. Tuy vậy, việc trích xuất đặc trưng này
rất khó và phụ thuộc vào từng bài tốn cụ thể. Bài báo này chỉ tập trung vào việc ứng dụng các
phương pháp máy học và xử lý ảnh, vì vậy nhóm tác giả chọn một phương pháp trích xuất đặt
trưng tổng quát nhất. Phương pháp được chọn là Texture Features. Phương pháp này có thể sử


170

KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC

dụng cho phần lớn bài toán nhận dạng ảnh với kết quả tương đối khả quan. Thực tế thì phương
pháp này đã mang lại thành cơng cho nhiều cơng trình như[24][25][26].
2.3

Training và testing

Training và testing là hai thuật ngữ quan trọng và thân thiện với tất cả các nhà khoa học

trong lĩnh vực máy học, lĩnh vực nhận dạng và thậm chí là khoa học dữ liệu. Trong hai bước
này, thơng thường thì các phương pháp máy học (còn được gọi với tên là classifier) sẽ được sử
dụng để phân lớp các đối tượng nghiên cứu. Trong bài báo này, nhóm tác giả tập trung vào các
phương pháp nổi tiếng như: Support Vector Machine[13][27], Bayes[28], Simple Logistic[29].

3

Đề xuất phương pháp

3.1

Hướng tiếp cận

Chúng ta đã biết hiện nay deep learning và convolution neural network là hướng tiếp cận rất
hiệu quả để giải quyết các bài tốn nhận dạng với ảnh. Trong cơng trình[30] tác giả đã trình bày
những thành tựu và ưu điểm của convolution neural network. Tuy nhiên, convolution neural
network nói riêng hay deep learning nói chung yêu cầu dữ liệu lớn với hàng ngàn mẫu thử.
Trong cơng trình này, chúng tơi chỉ thu thập khoảng vài trăm mẫu thử do đó các giải pháp sẽ bị
giới hạn về hướng dữ liệu ít. Do đó, trong cơng trình này tác giả khơng sử dụng convolution
neural network mà thay vào đó là sự kết hợp giữa xử lý ảnh và phương pháp máy học truyền
thông thường để xây dựng giải pháp.
Trước khi đi vào chi tiết đề xuất, nhóm tác giả trình bày bài tốn cụ thể. Bài toán cụ thể như
sau:
1. Đầu vào của bài toán là một ảnh của lá cà phê bị bệnh
2. Kết quả trả về là sự dự đoán rằng: lá cà phê đó bị bệnh gì
3. Trong đề tài này, nhóm tác giả chỉ nghiên cứu 6 loại bệnh thông dụng của lá cà phê gồm:
Rust Disease, Calcium Deficiency, Protein Deficiency, Iron Deficiency, Kaly Deficiency,
Phospho Deficiency, Magnesium Deficiency
Nội dung cơ bản của bài báo này là sự kết hợp giữa phương pháp xử lý ảnh và thuật toán
máy học để nhận dạng bệnh dựa trên hình ảnh lá cà phê. Do đó, hướng tiếp cận để giải bài tốn

này cũng bao gồm tất cả các yếu tố này. Cụ thể, nhóm tác giả đề xuất:
 Nhóm nghiên cứu chuẩn bị khoảng 500 ảnh của lá cà phê bị bệnh và được phân loại (còn
được gọi là dán nhãn) nhờ sự giúp đỡ chuyên gia nông nghiệp.
 Các ảnh đầu vào được áp dụng các thuật toán xử lý ảnh cho bước tiền xử lý.
 Kết quả của tiền xử lý sẽ được sử dụng để xây dựng vector đặc tính.
 Vector đặc tính này cùng với phân loại của lá cà phê sẽ được đưa vào thuật toán máy học để
train và test.
─ Nhóm tác giả sử dụng ngẫu nhiên 60\% ảnh để train và 40\% ảnh để test.
─ Kết quả đầu ra là tỉ lệ phần trăm độ chính xác của q trình dự đốn trên tập dữ liệu test.


Lê Văn Minh
3.2

171

Tiền xử lý

Phân tích màu.
Trước hết nhóm tác giả phân tích hình ảnh thành 3 kênh màu khác nhau. Nghĩa là sau khi
phân tích, chương trình sẽ thu được 3 ảnh xám (gray-scale image) khác nhau tương ứng với 3
kênh màu. Ngồi ra, nhóm tác giả cũng tính trung bình của 3 kênh màu này để thu được kênh
màu thứ 4. Hình 1 trình bày 4 ảnh của một lá cà phê sau khi phân tích màu.
Fig. 1. Phân tích 1 ảnh màu thành 4 ảnh xám

Để có thêm đánh giá định tính nhằm phân biệt sự khác nhau của các ảnh tượng trưng cho các
loại bệnh. Nhóm tác giả tính phổ màu (histogram) của từng kênh màu. Hình 2 trình bày phổ
màu của 4 ảnh thu được từ bước trên.
Phát hiện biên.
Dựa trên sự quan sát thực tế, những lá cà phê bị bệnh thường có sự chênh lệch màu sắc bên

trong lá,chúng khơng hồn tồn xanh như lá cây không bị bệnh. Sự chênh lệch này cũng thể
hiện được sự thay đổi hình ảnh khi thực hiện việc phát hiện biên. Điều này thúc đẩy tác giả sử
dụng việc phát hiện biên trong bước tiền xử lý với hy vọng tăng độ chính xác của nhận dạng.
Hình 3 minh họa cho kết quả sau khi thực hiện phương pháp.
Fig. 2. Histogram của ảnh phân tích được


172

KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC

Fig. 3. Kết quả sau khi sử dụng thuật tốn Canny để tìm đường viền

Trích xuất đặc trưng.
Như đã trình bày ở phần trước, nhóm tác giả đề xuất sử dụng phương pháp Texture Feature.
Thành tựu của Texture Feature đã được trình bày bởi nhóm tác giả \cite{mohanaiah2013image}.
Texture Feature trong đề tài này đã được thay đổi một chút để áp dụng vào bài tốn của chúng
tơi. Cụ thể là tính trung bình độ sáng của ảnh, sau đó chia ảnh thành 4 rồi tính trung bình điểm
sáng của từng ảnh nhỏ rồi tiếp tục lặp lại việc chia 4 như thế. Hình 4 trình bày một bước lặp của
việc trích xuất đặc trưng dựa trên phương pháp Texture Feature. Trong đó, hình bên trái là
hìnhảnh ban đầu, 4 hình bên phải là hình ảnh sau khi chia thành 4 hình khác nhau. Với cách làm
này, độ dài của vector sẽ phụ thuộc vào số lần chia. Trong tình huống này, chúng tơi đề xuất
giới hạn số lần chia này là 8.


Lê Văn Minh

173
Fig. 4. Texture Features Extraction


Để làm rõ hơn ảnh hưởng của việc áp dụng thuật toán xử lý ảnh đối với độ chính xác của q
trình phân lớp, nhóm tác giả đã đề xuất nhiều phương pháp trích xuất đặc trưng khác nhau và
mỗi phương pháp sẽ cho ra một kết quả khác nhau về độ chính xác. Các phương pháp trích xuất
như sau:
 Extraction 1: trích xuất đặc trưng trên cả 3 ảnh xám RGB.
 Extraction 2: trích xuất đặc trưng trên 4 ảnh gồm: 3 ảnh xám RGB và ảnh trung bình cộng
của 3 ảnh này.
 Extraction 3: trích xuất đặc trưng trên 6 ảnh gồm: 3 ảnh RGB và 3 ảnh Canny của 3 ảnh RGB
này.
 Extraction 4: trích xuất đặc trưng trên 3 ảnh xám RGB và sử dụng thêm histogram của 3 ảnh
xám.
 Extraction 5: trích xuất đặc trưng trên 3 ảnh Canny của 3 ảnh xám RGB và sử dụng thêm
histogram của 4 ảnh xám.
 Extraction 6: trích xuất đặc trưng trên 6 ảnh gồm: 3 ảnh RGB và 3 ảnh Canny và sử dụng
thêm histogram của 4 ảnh xám.
3.3

Train và test

Nhóm tác giả đề xuất sử dụng các thuật toán máy học để thực nghiệm việc phân loại. Các
thuật toán này bao gồm: SimpleLogistic, AttributeSelectedClassifier, J48, NaiveBayes, LWL.


174

4

KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC

Kết quả


Kết quả thực nghiệm cho thấy có mối quan hệ mật thiết giữa tiền xử lý bằng xử lý ảnh và các
phương pháp. Như trong hình 5 chúng ta có thể thấy rằng mỗi phương pháp tiền xử lý có thể rất
tốt với phương pháp máy học này nhưng không tốt với phương pháp máy học khác. Cũng trong
hình này, tác giả đã thực hiện phép tốn logarit đối với độ chính xác của kết quả thu được với
mục đích làm rõ sự chênh lệch về kết quả khi chọn các thuật toán khác nhau. Vì giá trị lớn nhất
của độ chính xác là 100 (đơn vị là %) nên giá trị lớn nhất của trục hoành là 2 (lg(100) = 2).
Fig. 5. So sánh kết quả các phương pháp

Trong tình huống này, tác giả cũng đã phân tích một trường hợp tốt nhất đó là trường hợp sử
dụng thuật tốn Logistic đối với phương pháp extraction 6. Kết quả chính xác của phương pháp
này lên đến 95%. Hình 6 trình bày ma trận nhầm lẫn của trường hợp này. Đây là trường hợp test
với 40% số ảnh trong cơ sở dữ liệu.

Fig. 6. Ma trận nhầm lẫn

5

Kết luận

Nhóm tác giả đã làm rõ sự tương quan giữa xử lý ảnh (cho việc tiền xử lý) và phương pháp
máy học trong nhận dạng mẫu. Nhóm tác giả cũng đưa ra được một trường hợp nghiên cứu cụ
thể đó là: nhận dạng bệnh dựa trên hình ảnh của lá cà phê. Đóng góp quan trọng nhất của bài


Lê Văn Minh

175

báo này là với từng bài toán cụ thể, chúng ta cần chọn phương pháp máy học phù hợp với

phương pháp tiền xử lý để thu được kết quả tốt nhất.
Về hướng phát triển, nhóm tác giả sẽ mở rộng đề tài này với những phương pháp trích xuất
đặc trưng khác thay cho phương pháp Texture Feature. Mặt khác, nhóm tác giả đề xuất mở rộng
với phương pháp deep-learning để tăng độ chính xác khi số lượng ảnh nhiều dần.
Tài liệu tham khảo
1. D. WORKMAN: “Coffee exports by country” 2017. [Online; accessed July- 2017].
2. G. NAM: “Cà phê việt nam sẽ chiếm “ngôi vương” của brazil”. 2017. [Online; accessed July-2017]
3. M. D. Abràmoff, P. J. Magalhães, and S. J. Ram: “Image processing with imagej”. Biophotonics
international, vol. 11, no. 7, pp. 36–42, 2004Author, F., Author, S., Author, T.: Book title. 2nd edn.
Publisher, Location (1999).
4. I. H. Witten, E. Frank, M. A. Hall, and C. J. Pal, Data Mining: Practical machine learning tools and
techniques. Morgan Kaufmann (2016).
5. H. J. Siegel, L. J. Siegel, F. C. Kemmerer, M. PT Jr, S. HE Jr, and S. D. Smith: “Pasm: A
partitionable simd/mimd system for image processing and pattern recognition”. IEEE Transactions
on computers, no. 12, pp. 934–947 (1981).
6. T. Acharya and A. K. Ray: Image processing: principles and applications. John Wiley & Sons (2005).
7. T. Walter, J.-C. Klein, P. Massin, and A. Erginay: “A contribution of image processing to the
diagnosis of diabetic retinopathy-detection of exudates in color fundus images of the human retina”.
IEEE transactions on medical imaging, vol. 21, no. 10, pp. 1236–1243 (2002).
8. A. H. Kulkarni and R. A. Patil: “Applying image processing technique to detect plant diseases”.
International Journal of Modern Engineering Research (IJMER), vol. 2, no. 5, pp. 3661–3664 (2012).
9. V. Singh, A. Misra, et al.: “Detection of unhealthy region of plant leaves using image processing and
genetic algorithm” in Computer Engineering and Applications (ICACEA), 2015 International
Conference on Advances in, pp. 1028–1032, IEEE (2015).
10. J. G. A. Barbedo: “An automatic method to detect and measure leaf disease symptoms using digital
image processing”. Plant Disease, vol. 98, no. 12, pp. 1709–1716 (2014).
11. C. M. Bishop: Pattern recognition and machine learning. springer (2006).
12. D. W. Paulus and J. Hornegger: Applied pattern recognition: A practical introduction to image and
speech processing in C++. Morgan Kaufmann Publishers (1998).
13. C. J. Burges: “A tutorial on support vector machines for pattern recognition”. Data mining and

knowledge discovery, vol. 2, no. 2, pp. 121–167 (1998).
14. J. J. Hopfield et al.: “Pattern recognition computation using action potential timing for stimulus
representation”. Nature, vol. 376, no. 6535, pp. 33–36 (1995).
15. K. Plataniotis and A. N. Venetsanopoulos: Color image processing and applications. Springer
Science & Business Media (2013).
16. S. J. Sangwine and R. E. Horne: The colour image processing handbook. Springer Science &
Business Media (2012).
17. B.
Lindbloom:
“Rgb
working
space
information”.
Specifications,
html# Specifications (January 2014), 2001.
18. G. Sulong et al.: “Rgb colour image watermarking using canny edge detection and discrete wavelet
transform (dwt)” (2013).
19. K. Van De Sande, T. Gevers, and C. Snoek: “Evaluating color descriptors for object and scene
recognition”. IEEE transactions on pattern analysis and machine intelligence, vol. 32, no. 9, pp.
1582–1596 (2010).
20. E. Sutton: “Histograms and the zone system”. Illustrated Photography. Accessed at http://www.
illustratedphotography. com/photography- tips/basic/contrast.


176

KỶ YẾU HỘI THẢO KHOA HỌC QUỐC GIA 2018 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC

21. J. Canny: “A computational approach to edge detection”. IEEE Transac- tions on pattern analysis
and machine intelligence, no. 6, pp. 679–698 (1986).

22. I. Sobel: “History and definition of the sobel operator”. Retrieved from the World Wide Web (2014).
23. J. M. Prewitt: “Object enhancement and extraction”. Picture processing and Psychopictorics, vol. 10,
no. 1, pp. 15–19 (1970).
24. D.-C. He, L. Wang, and J. Guibert: “Texture feature extraction”. Pattern recognition letters, vol. 6,
no. 4, pp. 269–273 (1987).
25. T. Ahonen, A. Hadid, and M. Pietikainen: “Face description with local binary patterns: Application to
face recognition”. IEEE transactions on pattern analysis and machine intelligence, vol. 28, no. 12,
pp. 2037–2041 (2006).
26. M. Unser: “Texture classification and segmentation using wavelet frames”. IEEE Transactions on
image processing, vol. 4, no. 11, pp. 1549–1560 (1995).
27. N. Cristianini and J. Shawe-Taylor: An introduction to support vector machines and other kernelbased learning methods. Cambridge university press (2000).
28. P. Domingos and M. Pazzani: “On the optimality of the simple Bayesian classifier under zero-one
loss”. Machine learning, vol. 29, no. 2-3, pp. 103–130 (1997).
29. J. M. Hilbe: Logistic regression models. CRC press (2009).
30. P. Y. Simard, D. Steinkraus, and J. C. Platt: “Best practices for convolutional neural networks applied
to visual document analysis” in null, p. 958, IEEE (2003).
31. P. Mohanaiah, P. Sathyanarayana, and L. GuruKumar: “Image texture feature extraction using glcm
approach”. International Journal of Scientific and Research Publications, vol. 3, no. 5, p. 1 (2013).



×