TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI
KHOA CÔNG NGHỆ THÔNG TIN
______________________________
ĐỒ ÁN CHUYÊN NGÀNH
NGÀNH: KHOA HỌC MÁY TÍNH
ĐỀ TÀI: CHẨN ĐOÁN BỆNH CÂY TRỒNG TRÊN DƯA LEO
BẰNG MẠNG NƠ RON TÍCH CHẬP
GVHD: TS.Nguyễn Mạnh Cường
Lớp: 20231IT6052002
Nhóm: 03
Thành viên: 1. Trần Tiến Điệp
2020603359
2. Hoàng Đức Hùng
2020603033
3. Đỗ Khánh Vinh
2020600932
Hà Nội, 2023
2
MỤC LỤC
DANH MỤC HÌNH ẢNH ............................................................................................. 3
LỜI CẢM ƠN............................................................................................................... 4
LỜI MỞ ĐẦU............................................................................................................... 5
CHƯƠNG I: KHẢO SÁT VÀ PHÁT BIỂU BÀI TỐN.............................................. 7
1.1
Khảo sát hiện trạng nơng nghiệp Việt Nam .........................................................7
Hiện trạng nông nghiệp Việt Nam ..............................................................7
Ứng dụng công nghệ cao trong nơng nghiệp..............................................9
1.2
Tìm hiểu về bài tốn chẩn đốn bệnh cây trồng trên dưa leo ..........................13
1.2.1
Các bệnh thường gặp trên cây dưa leo .....................................................13
1.2.2
Dữ liệu đầu vào và đầu ra ..........................................................................16
CHƯƠNG II. CÁC PHƯƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ .................................17
2.1
Mô hình mạng neuron cơ bản .............................................................................17
Perceptron cơ bản.......................................................................................17
Các hàm kích hoạt ......................................................................................18
2.2
Tổng quan về kiến trúc mạng CNN ....................................................................22
Giới thiệu .....................................................................................................22
Các lớp cơ bản trong mạng CNN ..............................................................23
Tổng kết .......................................................................................................27
2.3
Mô hình VGG-16 ..................................................................................................29
CHƯƠNG III. XÂY DỰNG MƠ HÌNH .....................................................................31
3.1
Thư viện và công cụ sử dụng ...............................................................................31
3.2
Chuẩn bị dữ liệu....................................................................................................32
3.3
Huấn luyện mơ hình .............................................................................................34
CHƯƠNG 4: THỰC NGHIỆM ..................................................................................42
4.1
Thực nghiệm mơ hình ..........................................................................................42
Chương trình thực nghiệm ........................................................................42
Kiểm tra kết quả tập test ...........................................................................44
Thực hiện dự đoán với từng ảnh với giao diện người dùng ...................46
KẾT LUẬN ................................................................................................................51
TÀI LIỆU THAM KHẢO ..........................................................................................52
3
DANH MỤC HÌNH ẢNH
Hình 1.1 Bệnh sương mai trên dưa leo .................................................................... 13
Hình 1.2 Bệnh phấn trắng trên dưa leo .................................................................... 14
Hình 1.3 Bệnh thán thư trên dưa leo ........................................................................ 14
Hình 1.4 Bệnh héo rũ trên dưa leo ........................................................................... 15
Hình 1.5 Bệnh vàng lá trên dưa leo .......................................................................... 15
Hình 2.1 Ảnh minh họa Neuron sinh học ................................................................ 17
Hình 2.2 Ảnh minh họa Perceptron .......................................................................... 18
Hình 2.3 Hàm đồng nhất .......................................................................................... 19
Hình 2.4 Hàm bước nhị phân (Binary step function. Hard limit function) .............. 19
Hình 2.5 Hàm sigmoid (Sigmoid fuction) ................................................................ 20
Hình 2.6 Hàm sigmoid lưỡng cực (Bipolar sigmoid function) ................................ 21
Hình 2.7 Ảnh minh họa mạng CNN......................................................................... 22
Hình 2.8 Ảnh minh họa mạng CNN có tầng ẩn ....................................................... 23
Hình 2.9 Lớp tích chập - Convolutional layer ......................................................... 24
Hình 2.11 Q trình Max-pooling 2x2 ..................................................................... 25
Hình 2.12 Đầu ra các neuron sau lớp pooling .......................................................... 26
Hình 2.13 Ứng dụng lớp phi tuyến - ReLU layer .................................................... 26
Hình 2.14 Lớp kết nối đầy đủ - Fully connected layer ............................................ 27
Hình 2.15 Mơ hình mạng CNN tổng quan ............................................................... 28
Hình 2.16 Mơ hình VGG-16 .................................................................................... 29
Hình 3.1 Bộ dữ liệu chuẩn bị ................................................................................... 32
Hình 3.2 Minh hoạ một phần bộ dữ liệu .................................................................. 33
Hình 3.3 Minh hoạ một phần bộ dữ liệu .................................................................. 33
4
LỜI CẢM ƠN
Lời đầu tiên, chúng em xin chân thành cảm ơn các thầy cô là giảng viên các bộ môn
trong khoa Công nghệ thông tin – Trường Đại học Công nghiệp Hà Nội đã truyền đạt
cho chúng em những kiến thức nền tảng quan trọng liên quan đến học sâu và trí tuệ nhân
tạo. Đồng thời, chúng em muốn gửi lời cảm ơn sâu sắc đến giảng viên Tiến sĩ Nguyễn Mạnh
Cường người đã trực tiếp giảng dạy và hỗ trợ chúng em trong suốt quá trình lên ý tưởng,
nghiên cứu và hoàn thành báo cáo đề tài này. Bên cạnh đó, chúng em muốn cảm ơn các bạn
là thành viên của các nhóm thực hiện những đề tài liên quan, đã giúp đỡ nhóm về mặt tinh
thần để có thể thực hiện tốt nhiệm vụ cá nhân trong bài báo cáo của tập thể nhóm.
Trong q trình nghiên cứu thực hiện đề tài, do năng lực, kiến thức, kỹ năng cũng như
trình độ của bản thân các thành viên trong nhóm cịn hạn hẹp, thiếu chun sâu nên khơng
thể tránh khỏi những sai sót liên quan đến kỹ thuật. Vì vậy, chúng em chân thành muốn được
lắng nghe những góp ý từ q thầy cơ là giảng viên các bộ mơn cũng như các thành viên
của các nhóm còn lại thực hiện những đề tài khác. Để từ đó rút kinh nghiệm và hồn thiện
bài báo cáo tốt hơn trong tương lai. Chúng em xin chân thành cảm ơn !
Nhóm thực hiện đề tài !
5
LỜI MỞ ĐẦU
Trong thời kỳ khoa học công nghệ đã và đang phát triển, việc ứng dụng các thành tựu,
phát minh sáng chế kỹ thuật vào các mặt của đời sống xã hội đang ngày càng trở nên phổ
biến và mang lại những dấu hiệu tích cực. Những năm gần đây, AI hay trí tuệ nhân tạo nổi
lên như một bằng chứng của cuộc cách mạng công nghiệp lần thứ tư (4.0). Trí tuệ nhân tạo
có thể được định nghĩa như một ngành của khoa học máy tính liên quan đến việc tự động
hóa các hành vi thơng minh. Trí tuệ nhân tạo là một bộ phận của khoa học máy tính và do
đó nó phải được đặt trên những nguyên lý lý thuyết vững chắc, có khả năng ứng dụng được
cả lĩnh vực này. Ở thời điểm hiện tại, thuật ngữ này thường dùng để nói đến các máy tính có
mục đích khơng nhất định và ngành khoa học nghiên cứu về các lý thuyết và các ứng dụng
của trí tuệ nhân tạo.
Theo đà phát triển của cơng nghệ, ứng dụng trí tuệ nhân tạo ln là xu hướng cơng
nghệ tương lai mà các hãng cơng nghệ trên tồn thế giới đua nhau sáng tạo, nó là nền tảng
cốt lõi của cuộc cách mạng công nghệ 4.0.
DL (Deep Learning) là một lĩnh vực của trí tuệ nhân tạo, được sinh ra từ khả năng nhận
diện mẫu và từ lý thuyết các máy tính có thể học mà khơng cần phải lập trình để xử lý các
nhiệm vụ cụ thể nào đó.
Hầu hết mọi ngành cơng nghiệp đang làm việc với hàm lượng lớn đã liệu đều nhận ra
tầm quan trọng của cơng nghệ AI. Những cái nhìn sáng suốt từ nguồn dữ liệu này chủ yếu
trong thời gian thực sẽ giúp các tổ chức vận hành hiệu quả hơn hoặc tạo lợi thế cạnh tranh
với các đối thủ. Các ứng dụng của AI đã quá quen thuộc với con người: xe tự hành của
Google và Tesla, hệ thống tự tag khuôn mặt trên Facebook , hệ thống gợi ý sản phẩm của
Amazon, hệ thống gợi ý phim trên ứng dụng Netflix… chỉ là một vài ứng dụng trong muôn
vàn những ứng dụng của trí tuệ nhân tạo và cụ thể là ML - Machine Learning.
Trong báo cáo đề tài "Chuẩn đoán bệnh cây trồng trên dưa leo bằng mạng nơ ron tích
chập", chúng em sẽ sử dụng những kiến thức nền tảng đã được tìm hiểu trước đó để hoàn
thành các chương sau:
6
Chương 1: Khảo sát và phát biểu bài toán
Trong chương này chúng em sẽ trình bày những khái niệm liên quan đến bài toán chuẩn
đoán bệnh cây trồng trên dưa leo, sơ lược về cấu trúc bài tốn để tìm ra vấn đề chính của đề
tài, data input và output cho bài toán chuẩn đoán bệnh cây trồng trên dưa leo.
Chương 2: Các phương pháp giải quyết vấn đề
Với bài toán chẩn đoán bệnh cây trồng trên dưa leo đặt ra ở đây, chúng em sẽ khái quát
các bước đề thầy cơ và các bạn hình dung cụ thể về cách xử lý bài toán. Chúng em sẽ cung
cấp một kiến trúc mạng CNN mà máy sẽ sử dụng để phát triển giải quyết bài tốn. Áp dụng
mơ hình mạng nơ ron tích chập VGG-16, một trong những mơ hình tiêu biểu của deep
learning, để xây dựng một hệ thống chẩn đoán bệnh trên cây dưa leo. Mục tiêu cuối cùng
của đề tài là giúp nông dân và người quản lý nơng trại nhận biết và chẩn đốn các vấn đề về
sức khỏe của cây trồng một cách hiệu quả, dự đoán sự phát triển của bệnh và áp dụng biện
pháp can thiệp kịp thời..
Chương 3: Xây dựng mơ hình
Tại chương này, chúng em tiến hành thu thập và tiền xử lí dữ liệu sau đó triển khai mơ
hình VGG- 16 vào việc phát hiện bệnh phổ biến thường gặp trên cây dưa leo với môi trường
làm việc sử dụng Python.
Chương 4: Thực nghiệm mơ hình bài tốn và kiểm thử
Với các kiến thức đã được tìm tịi, chuẩn bị và nghiên cứu, chúng em sẽ tiến hành thực
nghiệm chuẩn đốn bệnh cây trồng trên dưa leo dưa trên mơ hình đã xây dựng. Thu thập kết
quả chạy chương trình và đánh giá độ chính xác các trường hợp dựa trên kết quả đầu ra, tốc
độ xử lý và mức độ chuẩn xác. Cuối cùng sẽ là phần kết luận và đánh giá kết quả đề tài nói
chung, đưa ra định hướng phát triển cho mơ hình cũng như bài tồn chuẩn đốn bệnh cây
trồng trên dưa leo sau này.
Chúng em hy vọng rằng đồ án này sẽ mang lại giá trị đáng kể cho lĩnh vực nông nghiệp
thông qua ứng dụng của cơng nghệ thơng tin và trí tuệ nhân tạo, đồng thời đóng góp vào sự
phát triển bền vững của ngành nông nghiệp.
7
CHƯƠNG I: KHẢO SÁT VÀ PHÁT BIỂU BÀI TOÁN
1.1 Khảo sát hiện trạng nông nghiệp Việt Nam
Hiện trạng nông nghiệp Việt Nam
Nông nghiệp ở Việt Nam được đánh giá là một trong những ngành kinh tế quan
trọng. Mặc dù đất nước đang thực hiện cơng cuộc cơng nghiệp hóa hiện đại hóa đất
nước. Thế nhưng ngành nơng nghiệp với những thay đổi phù hợp đã và đang khẳng
định đúng vị thế của mình trong nền kinh tế nước nhà. Từ trước tới nay, lĩnh vực nông
nghiệp luôn là một trong những mũi nhọn của nền kinh tế Việt Nam với những đóng
góp to lớn giúp đảm bảo an ninh lương thực trong nước và xuất khẩu nông sản ra thị
trường quốc tế.
Theo nhận định của Tổng cục Thống kê, kinh tế thế giới trong bảy tháng đầu năm
2023 đối mặt với nhiều khó khăn và thách thức, chiến sự Nga-Ukraine kéo dà, lạm
phát toàn cầu mặc dù đã hạ nhiệt nhưng vẫn ở mức cao, ngân hàng trung ương của
nhiều quốc gia vẫn theo đuổi chính sách tiền tệ thắt chặt đã tác động mạnh tới tăng
trưởng kinh tế, đầu tư, tiêu dùng. Nhiều nền kinh tế lớn, trong đó có các đối tác thương
mại quan trọng của Việt Nam đã tăng trưởng chậm lại, thậm chí rơi vào suy thối.
Dự báo, những tháng tiếp theo khó khăn này tiếp tục ảnh hưởng chung đến các
ngành kinh tế của Việt Nam. Đối với ngành nông nghiệp, các biến động cũng dần lộ
diện, địi hỏi tồn ngành phải nỗ lực hơn nữa để vượt qua khó khăn, tận dụng mọi cơ
hội tăng trưởng, nhất là đối với các ngành hàng chủ lực.
Vụ trưởng Kế hoạch (Bộ Nông nghiệp và Phát triển nông thôn) Nguyễn Văn Việt
cho biết: Hiện các địa phương đang đẩy nhanh tiến độ gieo cấy lúa mùa và lúa thu
đơng, chăm sóc và thu hoạch lúa hè thu. Lũy kế đến giữa tháng 7, cả nước gieo cấy
được gần 6,2 triệu héc-ta lúa.
Các địa phương thu hoạch gần 3,7 triệu héc-ta với năng suất bình quân đạt 65,7
tạ/ha, tăng 0,8 tạ/ha nên sản lượng lúa thu hoạch đạt hơn 24,1 triệu tấn, tăng 0,4% so
với cùng kỳ năm 2022. Dự kiến, năm 2023, cả nước sẽ sản xuất được từ 43,2-43,4 triệu
tấn lúa.
8
Với tình hình sản xuất lúa như vậy, sẽ bảo đảm an ninh lương thực trong nước và
xuất khẩu. Việc sản xuất lúa được duy trì ổn định cả về diện tích, năng suất, sản lượng
là một tin mừng đáng kể của nền nông nghiệp Việt Nam đồng thời cũng là nỗ lực hết
sức to lớn của những người nông dân trồng lúa.
Thực tế, thời gian qua, hiện tượng El Nino ít nhiều ảnh hưởng đến sản xuất nơng
nghiệp của nước ta, cộng với giá vật tư đầu vào sản xuất liên tục tăng cao, nhưng nông
dân vẫn bền bỉ gia tăng sản xuất, áp dụng các phương thức canh tác tiên tiến để giảm
lượng nước tưới, giảm phân bón, giảm thuốc bảo vệ thực vật…; ưu tiên sử dụng các
loại thuốc bảo vệ thực vật sinh học, thực hiện kinh tế tuần hoàn trên đồng ruộng để
giảm bớt chi phí đầu vào, tăng chất lượng lúa, nâng cao giá bán…
Bên cạnh trồng trọt, lĩnh vực chăn nuôi cũng tương đối ổn định, trong đó chăn
ni lợn và gia cầm hồi phục. Ước tính tổng số lợn của cả nước đến thời điểm cuối
tháng 7/2023 tăng 2,8% so với cùng thời điểm năm 2022; tổng số bò tăng 1%; tổng số
gia cầm tăng 2,3%.
Về thủy sản, tính chung bảy tháng năm 2023, sản lượng thủy sản ước đạt gần 5,1
triệu tấn, tăng 1,9% so với cùng kỳ năm 2022, bao gồm: cá đạt hơn 3,6 triệu tấn, tăng
1,7%; tôm đạt 673 nghìn tấn, tăng 3,5%; thủy sản khác đạt 751 nghìn tấn, tăng 1,3%.
Trong điều kiện xuất khẩu thủy sản hai quý đầu năm 2023 liên tục sụt giảm, thì việc
các hộ ni trồng vẫn duy trì sản xuất là nỗ lực rất lớn.
Riêng tỉnh Bạc Liêu - vùng nuôi tơm trọng điểm của cả nước, tính từ đầu tháng
7/2023 đến nay, giá tôm nguyên liệu trên địa bàn tỉnh giảm từ 4-18%. Người ni đã
phải tính nhiều cách làm mới, phù hợp với kinh tế hộ gia đình; áp dụng cơng nghệ mới
để tối ưu hóa chi phí nhằm bảo đảm có lãi…
Theo dự báo của Hiệp hội Chế biến và Xuất khẩu thủy sản Việt Nam (VASEP),
xuất khẩu thủy sản thời gian tới có nhiều khả năng phục hồi tại các thị trường trọng
điểm như Mỹ, châu Âu, Trung Quốc, nên người ni có nhiều cơ hội tăng thu nhập khi
bảo đảm nguồn cung thủy sản chất lượng.
Sức sản xuất bền bỉ của tồn ngành nơng nghiệp chính là bệ đỡ để nhiều ngành
hàng xuất khẩu liên tục lập kỷ lục trong bảy tháng đầu năm. Điển hình là ngành hàng
9
rau quả, kim ngạch xuất khẩu bảy tháng năm 2023 đạt 3,23 tỷ USD, tăng 68,1%; xuất
khẩu gạo đạt 2,58 tỷ USD, tăng 29,6%, cà-phê đạt 2,76 tỷ USD, tăng 6% so với cùng
kỳ năm 2022. Trung Quốc, Mỹ, Nhật Bản tiếp tục duy trì là 3 thị trường xuất khẩu
nông, lâm, thủy sản lớn nhất của Việt Nam, trong đó giá trị xuất khẩu sang Trung Quốc
chiếm tỷ trọng 21,9%, tăng 12,5% so với cùng kỳ năm 2022.
Theo số liệu của Tổng cục Thống kê, cán cân thương mại hàng hóa bảy tháng
năm 2023 ước xuất siêu 15,23 tỷ USD, trong đó có một số mặt hàng nơng sản xuất siêu
cao như: gỗ và sản phẩm gỗ 5,9 tỷ USD; thủy sản 3,4 tỷ USD; rau quả 2,1 tỷ USD…
Trong bối cảnh chỉ số sản xuất tồn ngành cơng nghiệp bị suy giảm với mức tính chung
bảy tháng năm 2023 ước giảm 0,7% so với cùng kỳ năm 2022, thì sản xuất và xuất
khẩu nơng nghiệp vẫn duy trì tốt là một thành tựu đáng kể.
Ứng dụng công nghệ cao trong nông nghiệp
Trong những năm gần đây, mặc dù phải gánh chịu thời tiết bất thường, thiên
tai, dịch bệnh (dịch tả lợn châu Phi trên cả nước, dịch Covid-19…), nhưng nhờ
đẩy mạnh áp dụng khoa học - kỹ thuật, tái cơ cấu sản xuất, ngăn ngừa kiểm soát
dịch bệnh, nên ngành Nông nghiệp và Phát triển nông thôn vẫn vượt qua khó
khăn, thách thức, thực hiện tốt “mục tiêu kép” vừa phát triển ngành, vừa phòng,
chống hiệu quả dịch bệnh. Nông nghiệp công nghệ cao là một nền nông nghiệp
ứng dụng hợp lý những công nghệ mới, tiên tiến vào sản xuất nhằm nâng cao
hiệu quả, tạo bước đột phá về năng suất, chất lượng nông sản, thỏa mãn nhu cầu
ngày càng cao của xã hội và bảo đảm sự phát triển nông nghiệp bền vững.
Phát triển nông nghiệp công nghệ cao, đổi mới khoa học công nghệ được
coi là một trong những giải pháp then chốt, trọng tâm. Ứng dụng khoa học công
nghệ giải quyết các thách thức trong phát triển nông nghiệp bằng các ưu việt của
các công nghệ như: Công nghệ sinh học, công nghệ nhà kính, cơng nghệ tưới nhỏ
giọt, cơng nghệ cảm biến, tự động hóa, internet vạn vật… giúp sản xuất nơng
nghiệp tiết kiệm chi phí, tăng năng suất, hạ giá thành và nâng cao chất lượng nông
sản, bảo vệ môi trường. Mặt khác, nông nghiệp công nghệ cao giúp nông dân chủ
động trong sản xuất, khắc phục được tính mùa vụ, giảm sự lệ thuộc vào thời tiết,
khí hậu, đáp ứng nhu cầu thị trường về chất lượng nông sản.
10
Nhận định về sự đóng góp của khoa học cơng nghệ đối với sự phát triển của
nông nghiệp nước ta, nhiều chuyên gia, nhà khoa học chung nhận định, khoa học
và công nghệ thực sự là một trong các giải pháp quan trọng đóng góp có hiệu quả,
tạo ra chuyển biến mang tính đột phá trong phát triển sản xuất nông nghiệp, phục
vụ tái cơ cấu nền nông nghiệp, nâng cao đời sống của người dân.Theo báo cáo,
các tiến bộ về khoa học cơng nghệ đóng góp trên 30% giá trị gia tăng trong sản
xuất nông nghiệp, 38% trong sản xuất giống cây trồng, vật nuôi. Mức độ tổn thất
của nơng sản đã giảm đáng kể (lúa gạo cịn dưới 10%,...). Mức độ cơ giới hóa ở
khâu làm đất đối với các loại cây hàng năm (lúa, mía, ngơ, rau màu) đạt khoảng
94%; khâu thu hoạch lúa đạt 50% (các tỉnh đồng bằng đạt 90%).
Theo báo cáo của Bộ Khoa học và Công nghệ những năm gần đây, nhờ ứng
dụng khoa học công nghệ trong sản xuất, cơ cấu sản xuất nông nghiệp tiếp tục
được điều chỉnh theo hướng phát huy lợi thế của mỗi địa phương, vùng, miền và
cả nước, gắn với nhu cầu thị trường trong nước và quốc tế, thích ứng với biến đổi
khí hậu. Nhiều doanh nghiệp đã đầu tư vào các khu sản xuất tập trung quy mô
lớn với công nghệ hiện đại gắn với các nhà máy, cơ sở bảo quản, chế biến nông
sản có giá trị xuất khẩu cao.
Việc áp dụng quy trình thực hành sản xuất nông nghiệp tốt (VietGAP) ngày
càng mở rộng và hiệu quả mang lại sản phẩm an toàn, chất lượng tốt, năng suất
cao. Bên cạnh đó, việc mở rộng ứng dụng tiến bộ khoa học công nghệ vào sản
xuất cùng với kết quả nghiên cứu, đánh giá, triển khai mơ hình cánh đồng mẫu
lớn đã đẩy mạnh sản xuất nông nghiệp, liên kết sản xuất và tiêu thụ nông sản theo
chuỗi giá trị …Trong lĩnh vực trồng trọt đã đẩy mạnh chuyển đổi cơ cấu cây
trồng, áp dụng các quy trình sản xuất tiên tiến; do làm tốt cơng tác phịng trừ sâu
bệnh nên sản lượng và chất lượng nhiều loại cây trồng có giá trị kinh tế tăng.
Với sự giúp sức của khoa học công nghệ được ứng dụng trong tất cả các
khâu của quá trình sản xuất nông nghiệp từ nghiên cứu, chọn tạo giống cây trồng,
vật ni; kỹ thuật gieo trồng, chăm sóc, canh tác; thức ăn chăn ni; phân bón,
thuốc bảo vệ thực vật, thuốc thú y; kỹ thuật chế biến, bảo quản sau thu hoạch…
đã tạo ra giá trị mới cho nông sản, giúp sản phẩm tươi, an toàn, nâng cao năng
suất, đảm bảo tiêu chuẩn chất lượng... Giá trị xuất khẩu toàn ngành nông nghiệp
11
năm 2022 đạt trên 53 tỷ USD, cao nhất từ trước tới nay, xuất siêu tới 8,5 tỷ USD,
đặc biệt 11 nhóm hàng nơng, lâm, thuỷ sản có giá trị xuất khẩu trên 1 tỷ USD,
tăng 2 nhóm hàng so với năm ngối. Theo đại diện của Bộ Nơng nghiệp và Phát
triển nông thôn, những con số trên cho thấy ngành nông nghiệp đang đi đúng
hướng về tái cơ cấu cũng như triển khai Chiến lược Phát triển Nông nghiệp Nông
thôn bền vững.
Đặc trưng của nền nông nghiệp công nghệ cao:
Vốn đầu tư lớn,
Ứng dụng những công nghệ khoa học mới nhất,
Xây dựng các xí nghiệp nơng nghiệp kiểu mới
Quy trình trồng trọt, chăn ni được kiểm sốt chặt chẽ
Tối ưu hóa nguồn nhân lực, giảm rủi ro thiên tai
Phát triển các nguồn năng lượng mới, phân bón hữu cơ, thuốc bảo
vệ thực vật thiên nhiên
Những yếu tố quan trọng để phát triển nơng nghiệp cơng nghệ cao bền vững:
Có kiến thức, am hiểu, đam mê nơng nghiệp
Khơng ngại khó, khơng nản chí khi thất bại
Quản lý dịng tiền hiệu quả, để tiết kiệm chi phí đầu tư, tránh thất
thốt lợi nhuận
Có phương pháp xử lý đầu ra hiệu quả, tránh tình trạng được giá
mất mùa, được mùa mất giá
Lưu ý khâu chế biến và bảo quản sau thu hoạch, để làm tăng giá trị
của nơng sản
Có thể kết hợp xây dựng mơ hình nơng nghiệp ứng dụng cơng nghệ
cao kết hợp du lịch sinh thái làm gia tăng nguồn thu nhập
nông sản
Đẩy mạnh truyền thông, để tăng mức độ phủ sóng của thương hiệu
12
Những đóng góp của khoa học cơng nghệ trong sản xuất nông nghiệp cho
thấy việc phát triển sản xuất ứng dụng công nghệ cao là hướng đi đúng, đã và
đang tạo động lực mới cho ngành nông nghiệp Việt Nam. Tuy nhiên các nghiên
cứu hỗ trợ hầu như chỉ nhắm tới các trang trại lớn hoặc cánh đồng lớn cho các
doanh nghiệp có quy mơ lớn. Trong khi tại nước ta hiện nay, có tới 95% doanh
nghiệp nơng nghiệp có quy mô nhỏ và vừa. Việc ứng dụng, chuyển giao kỹ thuật,
công nghệ cao vào phát triển nông nghiệp, nông thơn cịn gặp nhiều khó khăn,
nhất là nơng thơn miền núi, vùng dân tộc thiểu số.
1.2 Tìm hiểu về bài tốn chẩn đốn bệnh cây trồng trên dưa leo
1.2.1
Các bệnh thường gặp trên cây dưa leo
Hiện nay, việc chẩn đoán bệnh cây trồng thường dựa vào sự quan sát của
nông dân và chuyên gia nông nghiệp. Tuy nhiên, phương pháp này không chỉ
tốn thời gian mà cịn có thể khơng chính xác, dẫn đến việc áp dụng thuốc phịng
trừ và điều trị khơng hiệu quả hoặc quá muộn. Dưới đây là danh sách các bệnh
phổ biến gây hại cho cây trồng dưa leo trong nông nghiệp:
- Sương mai: bệnh này làm cho cây trồng bị phủ bởi một lớp bệnh sương
mờ trắng trên lá, giảm sức sống của cây và ảnh hưởng đến quá trình quang hợp.
Hình 1.1 Bệnh sương mai trên dưa leo
- Phấn trắng: phấn trắng là một loại bệnh gây ra sự nảy mầm của nấm và
làm mục nát các cánh hoa và lá cây dưa leo.
14
Hình 1.2 Bệnh phấn trắng trên dưa leo
- Thán thư: bệnh này gây ra sự héo rũ, nát lá và làm giảm khả năng hấp
thụ CO2 của cây.
Hình 1.3 Bệnh thán thư trên dưa leo
- Héo rũ: bệnh héo rũ gây ra sự héo rũ và mục nát các lá cây, làm suy
giảm khả năng quang hợp và sinh trưởng của cây.
15
Hình 1.4 Bệnh héo rũ trên dưa leo
- Vàng lá: bệnh vàng lá là một bệnh nghiêm trọng gây ra sự thay đổi màu
sắc của lá, làm mất màu xanh của lá và ảnh hưởng đến quá trình quang hợp.
Hình 1.5 Bệnh vàng lá trên dưa leo
Các bệnh này có thể gây ra thiệt hại lớn cho cây trồng dưa leo và đang đặt
ra thách thức trong việc duy trì năng suất và chất lượng sản phẩm trong ngành
nông nghiệp.
16
1.2.2
Dữ liệu đầu vào và đầu ra
Bài toán chẩn đoán bệnh cây trồng trên dưa leo là một trong những ứng
dụng quan trọng của trí tuệ nhân tạo trong lĩnh vực nơng nghiệp thơng minh.
Nó giúp người nơng dân và các chun gia nơng nghiệp xác định và chẩn đốn
các vấn đề về sức kháng của cây trồng một cách nhanh chóng và hiệu quả.
Dữ liệu đầu vào (Input Data): Ảnh của cây dưa leo ( đây là dữ liệu hình
ảnh của cây dưa leo cần chẩn đốn).
Dữ liệu đầu ra (Output Data):
Phân loại chẩn đoán: Đầu ra chính của bài tốn là kết quả chẩn đốn
cho cây dưa leo đó. Điều này bao gồm:
Xác định liệu cây dưa leo có khỏe mạnh (khơng bị nhiễm
bệnh) hay không.
Nếu cây bị nhiễm bệnh, đưa ra loại bệnh cụ thể. Loại bệnh
này có thể được đánh dấu bằng một tên hoặc mã cụ thể.
17
CHƯƠNG II. CÁC PHƯƠNG PHÁP GIẢI QUYẾT VẤN ĐỀ
2.1 Mô hình mạng neuron cơ bản
Perceptron cơ bản
Một mạng nơ-ron được cấu thành bởi các nơ-ron đơn lẻ được gọi là các
perceptron. Nên trước tiên ta tìm hiểu xem perceptron là gì đã rồi tiến tới mơ
hình của mạng nơ-ron sau. Nơ-ron nhân tạo được lấy cảm hứng từ nơ-ron sinh
học.
Neuron là tế bào thần kinh có khả năng cảm ứng, phát sinh xung thần kinh
và dẫn truyền xung điện này. Neuron (thường được viết là neuron) là đơn vị cơ
bản cấu tạo hệ thần kinh của hầu hết các loài động vật và là thành phần quan
trọng bậc nhất của não. Thân và sợi nhánh của các neuron tạo thành chất xám.
Sợi trục (nếu đi chung với nhau thành bó gọi là dây thần kinh) cấu tạo chất trắng
trong não. Ước tính có khoảng 100 tỷ (1011) neuron và 100 nghìn tỷ (1014)
xynap trong não người. Các tế bào thần kinh được hỗ trợ bởi microglia và tế
bào hình sao (các tế bào thần kinh đệm). Neuron là những tế bào dài nhất trong
cơ thể, biệt hóa cao độ nên mất trung thể và khả năng phân chia, nhưng có khả
năng tái sinh phần cuối sợi trục nếu bị tổn thương.
Hình 2.1 Ảnh minh họa Neuron sinh học
Mơ hình của perceptron cũng tương tự như vậy, dựa trên cấu trúc mạng
neuron sinh học.
18
Hình 2.2 Ảnh minh họa Perceptron
Trong đó:
- Xi (0,1,2,3,4 …): các đầu vào
- Wj (0,1,2,3,4 …): các trọng số tương ứng vứi các đầu vào
- F(x): hàm khích hoạt
Trong một mạng neuron có ba kiểu đơn vị:
- Các đơn vị đầu vào (Input units), nhận tín hiệu từ bên ngồi.
- Các đơn vị đầu ra (Output units) , gửi dữ liệu ra bên ngoài
- Các đơn vị ẩn (Hidden units), tín hiệu vào (input) và ra (output) của nó
nằm trong mạng.
Mỗi đơn vị có thể có một hoặc nhiều đầu vào: X0, X1, X2, .. Xn nhưng
chỉ có một đầu ra là Y’ . Một đầu vào tới một đơn vị có thể là dữ liệu từ bên
ngồi mạng, hoặc đầu ra của một đơn vị khác, hoặc đầu ra của chính nó.
Các hàm kích hoạt
Phần lớn các đơn vị trong mạng nơron chuyển net input bằng cách sử dụng
một hàm vơ hướng (scalar-to-scalar function) gọi là hàm kích hoạt, kết quả của
hàm này là một giá trị gọi là mức độ kích hoạt của đơn vị (unit's activation).
Loại trừ khả năng đơn vị đó thuộc lớp ra, giá trị kích hoạt được đưa vào một
hay nhiều đơn vị khác. Các hàm kích hoạt thường bị ép vào một khoảng giá trị
xác định, do đó thường được gọi là các hàm bẹp (squashing). Các hàm kích hoạt
hay được sử dụng là:
19
2.1.2.1
Hàm đồng nhất (Linear function)
Nếu coi các đầu vào là một đơn vị thì chúng sẽ sử dụng hàm này.
Đơi khi một hằng số được nhân với net-input để tạo ra một hàm đồng nhất.
H
ì
Hình 2.3 Hàm đồng nhất
n
2.1.2.2
Hàm bước nhị phân
h
S Hàm này cũng được biết đến với tên “Hàm ngưỡng” (Threshold hay
T
Heaviside
function). Đầu ra hàm này được giới hạn vào một trong hai giá
Y
trị: L
E
R
E
F
1
\
s
1
.
S
E
Hình
Q 2.4 Hàm bước nhị phân (Binary step function. Hard limit function)
H Dạng hàm này được sử dụng trong các mạng chỉ có một lớp . Trong
ì
hìnhn vẽ sau, theta được chọn bằng 1.
h
2.1.2.3
Hàm Sigmoid ( Sigmoid Function)
\
* Với đầu vào và đầu ra dạng nhị phân, ta rất khó có thể điều chỉnh
mộtAlượng nhỏ đầu vào để đầu ra thay đổi chút ít, nên để linh động, ta có
R
thể Amở rộng chúng ra cả khoảng [0, 1] [0,1]. Lúc này đầu ra được quyết
địnhB bởi một hàm sigmoid σ(w⊺.x). Hàm sigmoid có cơng thức:
I
C
\
20
Hình 2.5 Hàm sigmoid (Sigmoid fuction)
Hàm này đặc biệt thuận lợi khi sử dụng cho các mạng được huấn
luyện (trained) bởi thuật tốn Lan truyền ngược (back-propagation), bởi
vì nó dễ lấy đạo hàm, do đó có thể giảm đáng kể tính tốn trong q trình
huấn luyện. Hàm này được ứng dụng cho các chương trình ứng dụng mà
các đầu ra mong muốn rơi vào khoảng [0,1].
2.1.2.4
Hàm Sigmoid lưỡng cực (Bipolar Sigmoid Function)
Hàm này có các thuộc tính tương tự hàm sigmoid. Nó làm việc tốt
đối với các ứng dụng có đầu ra yêu cầu trong khoảng [-1,1].
21
Hình 2.6 Hàm sigmoid lưỡng cực (Bipolar sigmoid function)
Các hàm chuyển của các đơn vị ẩn (hidden units) là cần thiết để biểu
diễn sự phi tuyến vào trong mạng. Lý do là hợp thành của các hàm đồng
nhất là một hàm đồng nhất. Mặc dù vậy nhưng nó mang tính chất phi tuyến
(nghĩa là, khả năng biểu diễn các hàm phi tuyến) làm cho các mạng nhiều
tầng có khả năng rất tốt trong biểu diễn các ánh xạ phi tuyến. Tuy nhiên,
đối với luật học lan truyền ngược, hàm phải khả vi (differentiable) và sẽ
có ích nếu như hàm được gắn trong một khoảng nào đó. Do vậy, hàm
sigmoid là lựa chọn thông dụng nhất.
Đối với các đơn vị đầu ra (output units), các hàm chuyển cần được
chọn sao cho phù hợp với sự phân phối của các giá trị đích mong muốn.
Chúng ta đã thấy rằng đối với các giá trị ra trong khoảng [0,1], hàm
sigmoid là có ích; đối với các giá trị đích mong muốn là liên tục trong
khoảng đó thì hàm này cũng vẫn có ích, nó có thể cho ta các giá trị ra hay
giá trị đích được căn trong một khoảng của hàm kích hoạt đầu ra. Nhưng
nếu các giá trị đích khơng được biết trước khoảng xác định thì hàm hay
được sử dụng nhất là hàm đồng nhất (identity function). Nếu giá trị mong
muốn là dương nhưng khơng biết cận trên thì nên sử dụng một hàm kích
hoạt dạng mũ (exponential output activation function).
22
2.2 Tổng quan về kiến trúc mạng CNN
Giới thiệu
Mạng CNN là sự kết hợp của của các tầng perceptron hay cịn được gọi là
perceptron đa tầng (multilayer perceptron) như hình vẽ bên dưới:
Hình 2.7 Ảnh minh họa mạng CNN
Một mạng NN sẽ có 3 kiểu tầng:
- Tầng vào (input layer): Là tầng bên trái cùng của mạng thể hiện cho
các đầu vào của mạng.
- Tầng ra (output layer): Là tầng bên phải cùng của mạng thể hiện cho
các đầu ra của mạng.
- Tầng ẩn (hidden layer): Là tầng nằm giữa tầng vào và tầng ra thể hiện
cho việc suy luận logic của mạng.
Một NN chỉ có 1 tầng vào và 1 tầng ra nhưng có thể có nhiều tầng ẩn.
23
Hình 2.8 Ảnh minh họa mạng CNN có tầng ẩn
Trong mạng NN, mỗi nút mạng là một sigmoid nơ-ron nhưng hàm kích
hoạt của chúng có thể khác nhau. Tuy nhiên trong thực tế người ta thường để
chúng cùng dạng với nhau để tính tốn cho thuận lợi.
Ở mỗi tầng, số lượng các nút mạng (nơ-ron) có thể khác nhau tuỳ thuộc
vào bài toán và cách giải quyết. Nhưng thường khi làm việc người ta để các tầng
ẩn có số lượng nơ-ron bằng nhau. Ngoài ra, các nơ-ron ở các tầng thường được
liên kết đôi một với nhau tạo thành mạng kết nối đầy đủ (full-connected
network). Khi đó ta có thể tính được kích cỡ của mạng dựa vào số tầng và số
nơ-ron. Ví dụ ở hình trên ta có:
- 4 tầng mạng, trong đó có 22 tầng ẩn
- 3+4*2+1=123+4∗2+1=12 nút mạng
- (3*4+4*4+4*1)+(4+4+1)=41(3∗4+4∗4+4∗1)+(4+4+1)=41 tham số
Các lớp cơ bản trong mạng CNN
2.2.2.1
Lớp tích chập – Convolutional Layer
Có thể nói đây là một lớp cực kỳ quan trọng trong CNN, bởi ở lớp này sẽ
thực hiện mọi phép tính tốn. Về cơ bản nó là một cửa sổ trượt (Sliding
Windows) trên một ma trận như mơ tả hình dưới:
24
Hình 2.9 Lớp tích chập - Convolutional layer
Các convolutional layer có các parameter(kernel) đã được học để tự điều
chỉnh lấy ra những thơng tin chính xác nhất mà khơng cần chọn các feature
Trong hình ảnh ví dụ trên, ma trận bên trái là một hình ảnh trắng đen được
số hóa. Ma trận có kích thước 5×5 và mỗi điểm ảnh có giá trị 1 hoặc 0 là giao
điểm của dịng và cột.
Convolution hay tích chập là nhân từng phần tử trong ma trận 3. Sliding
Window hay còn gọi là kernel, filter hoặc feature detection là một ma trận có
kích thước nhỏ như trong ví dụ trên là 3×3
Convolution hay tích chập là nhân từng phần tử bên trong ma trận 3×3 với
ma trận bên trái. Kết quả được một ma trận gọi là Convolved feature được sinh
ra từ việc nhận ma trận Filter với ma trận ảnh 5×5 bên trái.
Khi cửa sổ trượt trên ma trận Input, các điểm ảnh nằm ở biên sẽ bị bỏ qua
chính bởi vậy mà ta cần thêm padding (các giá trị 0) cho Input.
2.2.2.2
Lớp gộp – Pooling Layer
Lớp pooling thường được sử dụng ngay sau lớp convolutional để đơn
giản hóa thơng tin đầu ra để giảm bớt số lượng neuron.
25
Hình 2.10 Lớp gộp - Pooling layer
Thủ tục pooling phổ biến là max-pooling, thủ tục này chọn giá trị lớn
nhất trong vùng đầu vào 2×2
Hình 2.10 Q trình Max-pooling 2x2
Như vậy qua lớp Max Pooling thì số lượng neuron giảm đi phân nửa.
Trong một mạng CNN có nhiều Feature Map nên mỗi Feature Map chúng
ta sẽ cho mỗi Max Pooling khác nhau. Chúng ta có thể thấy rằng Max
Pooling là cách hỏi xem trong các đặc trưng này thì đặc trưng nào là đặc
trưng nhất. Ngồi Max Pooling cịn có L2 Pooling
Cuối cùng ta đặt tất cả các lớp lại với nhau thành một CNN với đầu
ra gồm các neuron với số lượng tùy bài toán.