Tải bản đầy đủ (.pdf) (115 trang)

Thiết kế hệ thống giám sát và cảnh báo bệnh phấn trắng trên cây dưa chuột bằng trí tuệ nhân tạo

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.57 MB, 115 trang )

HỌC VIỆN NÔNG NGHIỆP VIỆT NAM

KHOA CƠ ĐIỆN
------------

ĐỒ ÁN TỐT NGHIỆP
ĐỀ TÀI:
THIẾT KẾ HỆ THỐNG GIÁM SÁT VÀ CẢNH BÁO
BỆNH PHẤN TRẮNG TRÊN CÂY DƯA CHUỘT
BẰNG TRÍ TUỆ NHÂN TẠO

Giảng viên hướng dẫn

: TS. NGƠ TRÍ DƯƠNG

Sinh viên thưc hiện

: PHẠM TRUNG DUẨN

Msv

: 605521

Lớp

: K60 – TDHB

Hà Nội - 2021


LỜI CAM ĐOAN


Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tôi, các kết quả
nghiên cứu được trình bày trong đồ án là trung thực, khách quan và chưa từng
dùng để bảo vệ cho bất kỳ đồ án môn học nào.
Tôi xin cam đoan rằng mọi sự giúp đỡ cho việc thực hiện đồ án đã được
cám ơn, các thơng tin trích dẫn trong đồ án này đều được chỉ rõ nguồn gốc.
Hà Nội, ngày tháng năm 2021
Tác giả đồ án

Phạm Trung Duẩn

i


LỜI CẢM ƠN
Để hồn thành tốt bài khóa luận tốt nghiệp này trước tiên cho phép em
xin được gửi lời biết ơn sâu sắc nhất đến Thầy giáo TS. NGÔ TRÍ DƯƠNG và
ThS. NGƠ QUANG ƯỚC, em cảm ơn thầy đã tận tâm, nhiệt tình khơng quản
ngại khó khăn, vất vả để theo sát hướng dẫn em trong suốt quá trình thực tập và
khóa luận tốt nghiệp vừa qua. Nhờ những tâm huyết đối với sinh viên của Thầy
mà em đã biết và áp dụng thành thạo những kiến thức đã học vào đề tài tốt
nghiệp và để chuẩn bị cho ngành nghề công việc sau khi ra trường.
Đồng thời em cũng gửi lời cảm ơn trân thành nhất đến tồn thể q thầy
cơ trong Trường Học Viện Nơng nghiệp Việt Nam nói chung, các thầy cơ trong
Khoa Cơ – Điện và bộ mơn: Tự Động Hóa nói riêng đã bỏ công sức truyền đạt
lại những kiến thức cho chúng em trong những năm theo học tại trường.
Mặc dù đã có nhiều cố gắng, song chắc chắn khơng tránh khỏi thiếu sót
nhất định. Rất mong được sự đóng góp ý kiến của Hội đồng chấm đồ án tốt
nghiệp, và các đọc quan tâm đến đề tài của đồ án.
Cuối cùng chúng em chúc Thầy giáo TS. NGƠ TRÍ DƯƠNG
Và ThS. NGƠ QUANG ƯỚC cùng q thầy cơ trong Học Viện luôn mạnh

khỏe để giảng dạy và công tác tốt.
Em xin chân thành cảm ơn!
Hà Nội,

tháng
Sinh viên

ii

năm 2021


MỤC LỤC
LỜI CAM ĐOAN ..................................................................................................i
LỜI CẢM ƠN ...................................................................................................... ii
MỤC LỤC .......................................................................................................... iii
DANH MỤC BẢNG ............................................................................................ v
DANH MỤC HÌNH .............................................................................................vi
CHƯƠNG I: TỔNG QUAN VỀ TÀI LIỆU ......................................................... 4
1.1 Tổng quan về xử lý ảnh .................................................................................. 4
1.2 Những vấn đề trong xử lý ảnh ....................................................................... 5
1.3 Tổng quan về trí tuệ nhân tạo ......................................................................... 7
1.3.1 Giới thiệu về trí tuệ nhân tạo ....................................................................... 7
1.3.2 Tìm hiểu về Máy học ( Machine Learning ) ................................................ 9
1.3.3 Tìm hiểu về Học Sâu (Deep Learning). ..................................................... 11
1.3.4 Mối quan hệ giữa AI, Machine Learing và DeepLearning........................ 13
1.4 Ứng dụng cơng nghệ trí tuệ nhân tạo trong đời sống. .................................. 13
1.5 Yêu cầu thiết kế mô hình .............................................................................. 24
CHƯƠNG II: Đối tượng và phương pháp nghiên cứu ....................................... 26
2.1 Đối tượng nghiên cứu ................................................................................... 26

2.1.1 Tổng quan về cây dưa chuột ...................................................................... 26
2.1.2 Kĩ thuật xử lý ảnh ...................................................................................... 46
2.2. Nội dung nghiên cứu.................................................................................... 68
2.3. Phương pháp nghiên cứu ............................................................................. 68
CHƯƠNG III: KẾT QUẢ VÀ THẢO LUẬN ................................................... 70
3.1. Sơ đồ tổng quát ............................................................................................ 70
3.1.1. Sơ đồ khối hệ thống .................................................................................. 70
3.1.2 Sơ đồ cấu trúc hoạt động ........................................................................... 70
3.1.3. Sơ đồ khối quá trình train ảnh .................................................................. 71

iii


3.2 Thiết kế phần cứng........................................................................................ 72
3.2.1 Robot .......................................................................................................... 72
3.2.2 Lựa chọn thiết bị ........................................................................................ 74
3.3. Lưu đồ thuật toán ......................................................................................... 81
3.4 Bộ dữ liệu ...................................................................................................... 82
3.4.1 Chuẩn bị dữ liệu ......................................................................................... 82
3.4.2 Train YOLO V4 trên Colaboratory ........................................................... 83
3.5 Chạy thử robot và gửi dữ liệu. ...................................................................... 87
3.6 Kết quả và thảo luận ..................................................................................... 90
3.6.1 Kết quả ....................................................................................................... 90
3.6.2 Thảo luận ................................................................................................... 90
3.7 Hoạch toán .................................................................................................... 91
KẾT LUẬN VÀ KIẾN NGHỊ ............................................................................ 92
TÀI LIỆU THAM KHẢO .................................................................................. 94
Phụ Lục ............................................................................................................... 95

iv



DANH MỤC BẢNG
Bảng 3.6. Kết quả chạy thực tế tại nhà lưới........................................................ 90
Bảng 3.7. Bảng hoạch toán ................................................................................. 91

v


DANH MỤC HÌNH
Hình 1.1. Q trình xử lý ảnh ............................................................................... 4
Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh.................................... 5
Hình 1.3. Ảnh sau khi đã được xóa nền ................................................................ 7
Hình 1.4 Machine Learning ................................................................................. 9
Hình 1.5. DeepLearning...................................................................................... 11
Hình 1.6. Mối quan hệ giữa AI, Machine Learning, DeepLearning .................. 13
Hình 1.7. Hệ thống Camera nhận dạng khn mặt ............................................ 14
Hình 1.8. Cơng nghệ xử lý ảnh giúp nhận diện xe ............................................. 15
Hình 1.9. Ứng dụng xử lý ảnh trong y học ......................................................... 15
Hình 1.10. Ứng dụng cơng nghệ trí tuệ nhân tạo vào trong máy X-Quang ....... 16
Hình 1.11. Áp dụng cơng nghệ trí tuệ nhân tạo vào kỹ thuật siêu âm ............... 16
Hình 1.12.Giám sát tình trạng máy móc ............................................................. 17
Hình 1.13. Đọc mã vạch sản phẩm ..................................................................... 19
Hình 1.14. Kiểm tra 3d ....................................................................................... 20
Hình 1.15. Phân loại sản phẩm theo màu sắc ..................................................... 24
Hình 2.1. Cây dưa chuột, rễ cây dưa chuột......................................................... 26
Hình 2.2. Thân cây dưa chuột, tua cuốn mọc trên thân chính ............................ 27
Hình 2.3. Lá mầm cây dưa chuột ........................................................................ 28
Hình 2.4. Lá cây dưa chuột ................................................................................. 28
Hình 2.5. Hoa cây dưa chuột .............................................................................. 29

Hình 2.6. Giải phẫu hoa cây dưa chuột............................................................... 29
Hình 2.7. Giải phẫu trái dưa leo.......................................................................... 30
Hình 2.8. Dưa leo thuộc nhóm cây ưa nhiệt ....................................................... 31
Hình 2.9. Chuẩn bị nền nhà lưới ......................................................................... 32
Hình 2.10. Hệ thống chiếu sáng và giám sát nhà lưới ........................................ 33
Hình 2.11. Chuẩn bị bầu cây và hệ thống tưới ................................................... 33

vi


Hình 2.12. Dung dịch dinh dưỡng ...................................................................... 34
Hình 2.13. Trồng cây ươm vào bầu .................................................................... 34
Hình 2.14. Cây dưa chuột sau 2 tuần .................................................................. 35
Hình 2.15. Cây dưa chuột sau 3 tuần đậu hoa .................................................... 35
Hình 2.16. Cây dưa chuột sau 25-28 ngày đậu quả ............................................ 35
Hình 2.17. Cây dưa chuột sau 45-50 ngày bắt đầu tàn ....................................... 36
Hình 2.18. Hình ảnh lá dưa chuột mới bị bệnh phấn trắng ................................ 37
Hình 2.19. Lá bị bệnh phấn trắng từ 7-10 ngày .................................................. 38
Hình 2.20. Lá bị bệnh phấn trắng sau 14 ngày ................................................... 38
Hình 2.21. Bệnh thối rễ trên cây dưa chuột ........................................................ 40
Hình 2.22. Bệnh khảm trên cây dưa chuột ......................................................... 41
Hình 2.23. Bệnh sương mai trên cây dưa chuột ................................................. 42
Hình 2.24. Bệnh thối trái non trên cây dưa chuột ............................................... 44
Hình 2.25. Bệnh phấn trắng trên cây dưa chuột ................................................. 45
Hình 2.26. Sơ đồ cấu trúc thuật tốn trong LeNet-5 .......................................... 50
Hình 2.27. Sơ đồ cấu trúc thuật tốn trong AlexNet .......................................... 50
Hình 2.28. Sơ đồ cấu trúc thuật tốn trong VGG-16 .......................................... 50
Hình 2.29. Sơ đồ cấu trúc thuật tốn trong GoogleLeNet .................................. 51
Hình 2.30. Sơ đồ cấu trúc thuật tốn trong ResNet ............................................ 51
Hình 2.31. Mơ hình Yolo .................................................................................... 52

Hình 2.32. Kết quả so sánh YOLOv4 với các SOTA ở thời điểm hiện tại ........ 53
Hình 2.33. Mạch Raspberry PI 3B...................................................................... 54
Hình 2.34. Mặt trước của Module Camera Raspberry ....................................... 55
Hình 2.35. Các khối chức năng CPU S7-1200 ................................................... 57
Hình 2.36. Các kết nối của PLC S7-1200 ........................................................... 58
Hình 2.37. Sơ đồ cắm các đầu kết nối để cài hệ điều hành ................................ 58
Hình2.38. Hướng dẫn cài đặt hệ điều hành trung tâm ........................................ 59

vii


Hình2.39. Giao diện sau khi đã cài đặt xong hệ điều hành trung tâm
Raspberry Pi3 .................................................................................... 59
Hình 2.40. Cấu trúc của Open CV ...................................................................... 60
Hình 2.41. Cài thư viện ....................................................................................... 62
Hình 2.42. Cài thư viện OpenCV ....................................................................... 62
Hình 2.43. Cài thư viện OpenCV cho Raspberry PI .......................................... 63
Hình 2.44. Giao diện Visual Studio 2015 ........................................................... 64
Hình 2.45. Cài OpenCV trên visual .................................................................... 64
Hình 2.46. Cài OpenCV trên visual .................................................................... 65
Hình 2.47. Build lib OpenCV trên Visual Studio ............................................... 65
Hình 2.48. Giao diện Thonny Python IDE ......................................................... 68
Hình 3.1. Sơ đồ khối hệ thống ............................................................................ 70
Hình 3.2. Sơ đồ cấu trúc hoạt động hệ thống ..................................................... 70
Hình 3.3. Sơ đồ khối quá trình train ảnh ............................................................ 71
Hình 3.4. Robot ................................................................................................... 72
Hình 3.5. Hình ảnh khung nhơm thiết kế khung xe ............................................ 72
Hình 3.6. Bánh xe dùng trong mơ hình .............................................................. 73
Hình 3.7. Hình ảnh Động Cơ DC Servo GM25-370 DC Geared Motor ............ 73
Hình 3.8. Hình ảnh Động cơ RC Servo MG996................................................. 74

Hình 3.9. Hình ảnh cơ cấu vít-me ....................................................................... 74
Hình 3.10. Raspberry Pi3 .................................................................................... 75
Hình 3.11. Sơ đồ chân tín hiệu module L298N .................................................. 76
Hình 3.12. Arduino Nano ................................................................................... 77
Hình 3.13. Hình ảnh Modul Webcam Dahua Z2+ Plus...................................... 78
Hình 3.14. Hình ảnh Màn hình LCD 5″ cho Raspberry ..................................... 79
Hình 3.15. Modul sim 800l ................................................................................. 79
Hình 3.16. Modul ESP8266 v1 ........................................................................... 80
Hình 3.17. Lưu đồ thuật tốn q trình xử lí ảnh ............................................... 81

viii


Hình 3.18. Giao diện phần mềm labellmg .......................................................... 82
Hình 3.19. Gán nhãn ảnh .................................................................................... 82
Hình 3.20. Ảnh mã hố sau khi gán nhãn ........................................................... 83
Hình 3.21. Tạo code block .................................................................................. 83
Hình 3.22. Dán code chọn tài khoản Google Driver .......................................... 84
Hình 3.23. Tải mã nguồn YOLO V4 về Driver .................................................. 84
Hình 3.24. UPLOAD file lên Google Driver ...................................................... 84
Hình 3.25. Giải nén file data.zip ......................................................................... 84
Hình 3.26. Tạo file Yolo.Names ......................................................................... 85
Hình 3.27. Tạo file train.txt và val.txt ................................................................ 85
Hình 3.28. Tạo file Yolo.data ............................................................................. 85
Hình 3.29. Biên dịch mã nguồn Darknet ............................................................ 86
Hình 3.30.Download pretrain weight ................................................................. 86
Hình 3.31. Train .................................................................................................. 86
Hình 3.32. Thơng số kết quả sau khi train .......................................................... 86
Hình 3.33. Ảnh nhận dạng bệnh phấn trắng ....................................................... 87
Hình 3.34. Ảnh dưa chuột trong nhà lưới ........................................................... 87

Hình 3.35. Robot chụp ảnh lá dưa chuột bị bệnh phấn trắng ............................. 88
Hình 3.36. Kết quả hiển thị trên màn hình LCD của robot ................................ 88
Hình 3.37. Gửi cảnh báo cây bị bệnh phấn trắng về Sim và Email.................... 88
Hình 3.38. Robot chụp ảnh lá dưa chuột khơng bị bệnh ................................... 89
Hình 3.39. Gửi dữ liệu cây khơng bị bênh về Sim và Email .............................. 89

ix


MỞ ĐẦU
1. Đặt vấn đề
Hiện nay trên thế giới, việc ứng dụng các công nghệ điều khiển vào trong
sản xuất là rất nhiều và cần thiết trong các ngành nghề kể cả trong nông nghiệp.
Trong nông nghiệp, nhờ ứng dụng các công nghệ điều khiển hiện đại mà năng
suất và chất lượng cây trồng tăng lên đáng kể. Với công nghệ trồng rau quả
trong nhà lưới có sự hỗ trợ của các thiết bị điều khiển đã cho những kết quả
ngoài mong đợi như năng suất cao, chất lượng tốt, sạch, an tồn mà cịn có thể
trồng những loại cây mà từ trước không phải là truyền thống của vùng miền.
Ở Việt Nam, việc trồng rau quả trong nhà lưới đang phát triển nhanh
chóng đem lại lợi ích cao cho người nơng dân. Tuy nhiên, do chi phí đầu tư cao
nên việc ứng dụng chỉ hạn chế trong các nông trang lớn có khả năng về kinh tế,
hoặc chỉ điều khiển ở dạng bán tự động nên vẫn cần nhiều nhân cơng trong việc
điều khiển vì hầu hết các trang thiết bị điều khiển đều phải nhập từ nước ngoài
nên giá thành cao. Do đó cần phải có hướng nghiên cứu, thiết kế và chế tạo
những thiết bị này ngay ở trong nước để giảm chi phí, phù hợp với điều kiện
kinh tế của người nông dân và điều kiện môi trường ở Việt Nam.
Sự phát triển và tiến bộ khơng ngừng của khoa học kỹ thuật thì trí tuệ
nhân tạo là một trong những đề tài cần được quan tâm và phát triển. Từ những
nghiên cứu ban đầu về xử lý ảnh, phân loại, giám sát,… thì trí tuệ nhân tạo đã
được nghiên cứu chuyên sâu và ứng dụng rất nhiều trong cuộc sống. Bên cạnh

đó, sự phổ biến của kit Raspberry Pi với kích thước nhỏ gọn, được xem như
máy tính thu nhỏ nên có nhiều đề tài nghiên cứu và ứng dụng kit Raspberry Pi
trong thực tiễn. Ứng dụng kit Raspberry Pi vào xử lý nhằm đưa ra một số giải
pháp giám sát để áp dụng vào đời sống.
Trong thời gian gần đây biến đổi khí hậu đã làm thay đổi môi trường
sống của cây cũng như gây ra nhiều bệnh tật trên cây trồng, dẫn đến thiệt hại

1


không hề nhỏ trong sản xuất. Một số loại bệnh có thể quan sát bằng mắt thường,
nhưng phương pháp này không hiệu quả với các nhà lưới, trang trại lớn. Để giải
quyết vấn đề này em đã nghiên cứu và phát triển ý tưởng “ Thiết kế hệ thống
giám sát và cảnh báo bệnh phấn trắng trên cây dưa chuột bằng trí tuệ nhân tạo ”
2. Mục đích nghiêm cứu
Với những mục tiêu của đề tài hướng đến là tìm ra một giải pháp giúp ích
thực tế trong một lĩnh vực của nghành nông nghiệp là:
-Thứ nhất: Thiết kế được một hệ thống có thể theo dõi, giám sát quá trình
phát triển của cây trồng, nhận biết bệnh phấn trắng có trên cây. Từ đó xây dựng
được bộ dữ liệu bệnh phấn trắng.
-Thứ hai: Robot chụp được ảnh, nhận dạng được bệnh phấn trắng trên cây
dưa chuột nếu có.
-Thứ ba: Gửi nhận tín hiệu khơng dây về điện thoại và Email.
3. Phạm vi nghiên cứu
Trong phạm vi của đề tài này em đi tìm hiểu về nhận dạng đối tượng,
bước đầu đi vào nghiên cứu bài toán về nhận dạng bệnh phấn trắng, đưa dữ liệu,
thông tin điều khiển về tủ điều khiển bộ xử lí trung tâm.
Do thời gian hạn hẹp và kiến thức còn hạn chế nên em chỉ tập trung nhận
dạng và xử lý từng lá cây dưa chuột trong quá trình thực nghiệm.
Đề tài sẽ giúp ta có cái nhìn tốt hơn khi xây dựng hệ thống tự động trong

thực tế với quy mô nhỏ (các vấn đề về kinh phí, về cách thức lựa chọn cũng như
sử dụng các thiết bị nào cho phù hợp, lắp đặt thiết bị sao cho đúng,...). Để từ đó
ta có thể thương mại hóa, xây dựng với quy mơ lớn hơn.
4. Ý nghĩa khoa học của đề tài
Đề tài: “ Nghiên cứu thiết kế hệ thống giám sát và cảnh báo bệnh phấn
trắng trên cây dưa chuột bằng trí tuệ nhân tạo ”, nhằm phụ vụ cho việc phát hiện
bệnh phấn trắng sớm kịp thời, trong sản xuất nông nghiệp. giúp cho quá trình
trồng dưa chuột cũng như các loại cây khác trở lên đơn giản ,hiệu quả, nâng cao

2


chất lượng sản phẩm và hiệu quả sản suất. Đưa việc sản xuất, canh tác nông
nghiệp của Việt Nam tiến gần hơn với nông nghiệp 4.0
5. Phương pháp nghiên cứu
Phương pháp tham khảo tài liệu: bằng cách thu thập tài liệu, thơng tin từ
sách, báo, tạp chí về trí tuệ nhân tạo.
 Tài liệu về trí tuệ nhân tạo
 Tài liệu nghiên cứu về Raspberry trong bài toán giám sát.
 Mơ hình thuật tốn YOLO
Phương pháp kế thừa:
 Kế thừa tính năng của Raspberry Pi3 chế tạo thiết bị có khả năng đưa
hình ảnh cũng như lưu trữ hình ảnh về hệ thống.
 Kế thừa từ các cơng trình nghiên cứu khoa học và sử dụng các phần
mềm, ngôn ngữ lập trình.
 Tiến hành chạy thử nghiệm mơ hình thuật tốn trí tuệ nhân tạo đã có để
phân tích đối tượng.

3



CHƯƠNG I: TỔNG QUAN VỀ TÀI LIỆU
1.1 Tổng quan về xử lý ảnh
Xử lý ảnh (XLA) là đối tượng nghiên cứu của lĩnh vực thị giác máy, là
quá trình biến đổi từ một ảnh ban đầu sang một ảnh mới với các đặc tính và tuân
theo ý muốn của người sử dụng. Xử lý ảnh có thể gồm q trình phân tích, phân
lớp các đối tượng, làm tăng chất lượng, phân đoạn và tách cạnh, gán nhãn cho
vùng hay quá trình biên dịch các thơng tin hình ảnh của ảnh. Cũng như xử lý dữ
liệu bằng đồ hoạ, xử lý ảnh số là một lĩnh vực của tin học ứng dụng. Xử lý dữ
liệu bằng đồ họa đề cập đến những ảnh nhân tạo, các ảnh này được xem xét như
là một cấu trúc dữ liệu và được tạo bởi các chương trình.
Xử lý ảnh số bao gồm các phương pháp và kỹ thuật biến đổi, để truyền tải
hoặc mã hố các ảnh tự nhiên. Mục đích của xử lý ảnh gồm: Biến đổi ảnh làm
tăng chất lượng ảnh. Tự động nhận dạng ảnh, đoán nhận ảnh, đánh giá các nội
dung của ảnh. Nhận biết và đánh giá các nội dung của ảnh là sự phân tích một
hình ảnh thành những phần có ý nghĩa để phân biệt đối tượng này với đối tượng
khác, dựa vào đó ta có thể mơ tả cấu trúc của hình ảnh ban đầu. Có thể liệt kê
một số phương pháp nhận dạng cơ bản như nhận dạng ảnh của các đối tượng
trên ảnh, tách cạnh, phân đoạn hình ảnh,... Kỹ thuật này được dùng nhiều trong
y học (xử lý tế bào, nhiễm sắc thể), nhận dạng chữ trong văn bản

Hình 1.1. Quá trình xử lý ảnh
Ảnh có thể xem là tập hợp các điểm ảnh và mỗi điểm ảnh được xem như
là đặc trưng cường độ sáng hay một dấu hiệu nào đó tại một vị trí nào đó của
đối tượng trong khơng gian và nó có thể xem như một hàm n biến P(c,c1,c2,...).
Do đó, ảnh trong xử lý ảnh có thể xem như ảnh n chiều.

4



Hình 1.2. Các bước cơ bản trong một hệ thống xử lý ảnh
1.2 Những vấn đề trong xử lý ảnh
a. Điểm ảnh (Picture Element)
Là đơn vị cơ bản nhất để tạo nên một bước ảnh kỹ thuật số. Địa chỉ của
điểm ảnh được xem như là một tọa độ (x,y) nào đó. Một bức ảnh kỹ thuật số, có
thể được tạo ra bằng cách chụp hoặc bằng một phương pháp đồ họa nào khác,
được tạo nên từ hàng ngàn hoặc hàng triệu pixel riêng lẻ. Bức ảnh càng chứa
nhiều pixel thì càng chi tiết. Một triệu pixel thì tương đương với 1 megapixel
b. Phân loại ảnh
Mức xám của điểm ảnh là cường độ sáng, gán bằng một giá trị tại điểm
đó. Các mức ảnh xám thơng thường: 16, 32, 64, 128, 256. Mức được sử dụng
thông dụng nhất là 265, tức là dùng 1byte để biểu diễn mức xám. Trong đó:
Ảnh nhị phân: Là ảnh có 2 mức trắng và đen, chỉ có 2 giá trị 0 và 1 và chỉ
sử dụng 1 bit dữ liệu trên 1 điểm ảnh
Ảnh đen trắng: Là ảnh có hai màu đen, trắng (khơng chứa màu khác) với
mức xám ở các điểm ảnh có thể khác nhau.
Ảnh màu: Là ảnh kết hợp của 3 màu cơ bản lại với nhau để tạo ra một thế
giới màu sinh động. Người ta thường dùng 3byte để mơ tả mức màu, tức là có
khoảng 16,7 triệu mức màu.

5


c. Giải thuật Background Subtraction- Trừ nền
Giải thuật Background Subtraction (tạm dịch: trừ nền) là giải thuật mà ta sẽ
cần có 2 ảnh, một ảnh nền và một ảnh có đối tượng, ta lấy 2 ảnh đó để trừ nhau.
Mục đích là bằng cách loại bỏ nền ta sẽ giữ lại được đối tượng có trên ảnh.
Giải thuật này phù hợp cho các trường hợp xử lý ảnh khi đã biết trước, hoặc
tính tốn được ảnh nền (background) từ camera. Chi phí chạy giải thuật nhỏ nên
thường được áp dụng trên các bo nhúng (trong bài này là Raspberry Pi4).

Cách làm thực ra chỉ cần một bước duy nhất là lấy 2 ảnh trừ nhau, từ đó
chuẩn hóa để tạo mặt nạ cho foreground. Nhưng e có thực hiện bổ sung thêm một
vài bước để có thể trích xuất đối tượng được kết quả tốt hơn. Cách làm như sau:
Làm mờ ảnh background lẫn foreground bằng bộ lọc làm mờ Gaussian.
Bước tiếp theo chính là linh hồn tinh túy của Background Subtraction, đó
là lấy ảnh 1 trừ ảnh 2.
Do ta vừa lấy 2 ảnh trừ nhau mà mỗi ảnh các pixel có giá trị nằm trong
đoạn 0->255. Vậy khi ta trừ nhau ảnh kết quả các pixel sẽ khơng cịn nằm trong
đoạn 0->255 nữa, nó sẽ nằm trong đoạn -255->255. Sẽ có nhiều cách để chuẩn
hóa nhằm đưa mặt nạ này về giá trị chuẩn là 0->1 hoặc 0->255. Ở đây em dùng
giá trị tuyệt đối.
Do ảnh foreground và background đưa vào đều là ảnh màu, chúng có đến 3
kênh màu. Vì vậy muốn cịn 1 kênh ta lấy trung bình các giá trị của 3 kênh màu
này để cịn giữ duy nhất một kênh cho mặt nạ của mình. Miền giá trị các pixel trên
mặt nạ là 0->255 (cho dễ visualize in thành ảnh).
Bước tiếp theo không kém phần quan trọng đó là nhị phân hóa cái mặt nạ
ta vừa có được. Bản chất của mỗi pixel trên mặt nạ thể hiện độ khác biệt trên
từng pixel tương giữa ảnh background và ảnh foreground! Nếu chúng khác biệt
càng lớn thì có khả năng pixel tại đấy có đối tượng hoặc biến đổi về mức sáng.
Do đó ta cần phải tự nhặt cho mình một siêu tham số để nhị phân hóa ảnh. Gía trị
của siêu tham số này có ảnh hưởng đến chất lượng kết quả ảnh đầu ra cuối cùng.

6


Hình 1.3. Ảnh sau khi đã được xóa nền
1.3 Tổng quan về trí tuệ nhân tạo
1.3.1 Giới thiệu về trí tuệ nhân tạo
Trong khoa học máy tính, trí tuệ nhân tạo hay AI ( Artificial Intelligence),
đôi khi được gọi là trí thơng minh nhân tạo, là trí thơng minh được thể hiện

bằng máy móc, trái ngược với trí thơng minh tự nhiên được con người thể hiện.
Thông thường, thuật ngữ "trí tuệ nhân tạo" thường được sử dụng để mơ tả các
máy móc (hoặc máy tính) bắt chước các chức năng "nhận thức" mà con người
liên kết với tâm trí con người, như "học tập" và "giải quyết vấn đề".
Alan Turing là một nhà toán học, logic học và mật mã học người Anh,
người được cho là cha đẻ của ngành khoa học máy tính và trí tuệ nhân tạo. Ông
được biết đến rộng rãi với vai trò là người giải được mật mã Enigma, thứ mật
mã được quân Phát Xít Đức dùng để liên lạc trong Chiến tranh Thế giới thứ, tác
giả của Máy Turing và Phép thử Turing, những cống hiến quan trọng trong
ngành Trí tuệ nhân tạo.
Vào năm 1955, John McCarthy, một nhà khoa học máy tính và khoa học
nhận thức của Mỹ đã lần đầu tiên đưa ra khái niệm Trí tuệ nhân tạo, mà theo đó
có nghĩa là bộ mơn khoa học và kĩ thuật chế tạo máy thơng minh. Một năm sau
đó, ơng đứng ra tổ chức Hội nghị Dartmouth, hội nghị đầu tiên về chủ đề này.

7


Các chuyên gia đến từ nhiều trường đại học và công ty khác nhau như Carnegie
Mellon University, Massachusetts Institute of Technology và IBM đã tham gia
hội nghị. Từ đó, khái niệm “Trí tuệ nhân tạo” được sử dụng rộng rãi.
AI có thể nói là gần như bộ não của con người, con người làm được gì,
hiểu gì thì khi ứng dụng AI vào các thiết bị hay bộ máy nào đó họ cũng làm
được như con người chúng ta.
Trí tuệ nhân tạo khác với việc lập trình logic trong các ngơn ngữ lập
trình là ở việc ứng dụng các hệ thống học máy (machine learning) để mơ phỏng
trí tuệ của con người trong các xử lý mà con người làm tốt hơn máy tính.
Cụ thể, trí tuệ nhân tạo giúp máy tính có được những trí tuệ của con
người như: biết suy nghĩ và lập luận để giải quyết vấn đề, biết giao tiếp do hiểu
ngơn ngữ, tiếng nói, biết học và tự thích nghi,…

Tuy rằng trí thơng minh nhân tạo có nghĩa rộng như là trí thơng minh
trong các tác phẩm khoa học viễn tưởng, nó là một trong những ngành trọng yếu
của tin học. Trí thơng minh nhân tạo liên quan đến cách cư xử, sự học hỏi và
khả năng thích ứng thơng minh của máy móc.
Cơng nghệ AI được chia làm 4 loại chính:
 Loại 1: Cơng nghệ AI phản ứng.
Cơng nghệ AI phản ứng có khả năng phân tích những động thái khả thi
nhất của chính mình và của đối thủ, từ đó, đưa ra được giải pháp tối ưu nhất.
Một ví dụ điển hình của công nghệ AI phản ứng là Deep Blue. Đây là một
chương trình chơi cờ vua tự động, được tạo ra bởi IBM, với khả năng xác định
các nước cờ đồng thời dự đoán những bước đi tiếp theo của đối thủ. Thơng qua
đó, Deep Blue đưa ra những nước đi thích hợp nhất.
 Loại 2: Cơng nghệ AI với bộ nhớ hạn chế
Đặc điểm của công nghệ AI với bộ nhớ hạn chế là khả năng sử dụng
những kinh nghiệm trong quá khứ để đưa ra những quyết định trong tương lai.

8


Công nghệ AI này thường kết hợp với cảm biến mơi trường xung quanh nhằm
mục đích dự đốn những trường hợp có thể xảy ra và đưa ra quyết định tốt nhất
cho thiết bị.
 Loại 3: Lý thuyết trí tuệ nhân tạo
Cơng nghệ AI này có thể học hỏi cũng như tự suy nghĩ, sau đó áp dụng
những gì học được để thực hiện một việc cụ thể. Hiện nay, công nghệ AI này
vẫn chưa trở thành một phương án khả thi.
 Loại 4: Tự nhận thức
Công nghệ AI này có khả năng tự nhận thức về bản thân, có ý thức và hành
xử như con người. Thậm chí, chúng cịn có thể bộc lộ cảm xúc cũng như hiểu
được những cảm xúc của con người. Đây được xem là bước phát triển cao nhất

của công nghệ AI và đến thời điểm hiện tại, công nghệ này vẫn chưa khả thi.
1.3.2 Tìm hiểu về Máy học ( Machine Learning )

Hình 1.4 Machine Learning
Machine Learning là một lĩnh vực con của AI. Nguyên tắc cốt lõi của
Machine Learning là các máy tiếp nhận dữ liệu và tự học. Machine learning là
một phương pháp phân tích dữ liệu mà sẽ tự động hóa việc xây dựng mơ hình
phân tích. Sử dụng các thuật toán lặp để học từ dữ liệu, machine learning cho

9


phép máy tính tìm thấy những thơng tin giá trị ẩn sâu mà khơng được lập trình
một cách rõ ràng nơi để tìm. Khía cạnh lặp lại của machine learning là quan
trọng bởi vì khi các mơ hình này được tiếp xúc với dữ liệu mới thì chúng có thể
thích ứng một cách độc lập. Chúng học từ các tính tốn trước đó để tạo ra những
quyết định cũng như kết quả lặp lại và đáng tin cậy.
Nó hiện là công cụ hứa hẹn nhất của AI dành cho doanh nghiệp. Các hệ
thống Machine Learning có thể nhanh chóng áp dụng kiến thức và đào tạo từ
các bộ dữ liệu lớn để thực hiện các công việc về nhận dạng khn mặt, nhận
dạng giọng nói, nhận diện đối tượng, dịch và nhiều công việc khác một cách
xuất sắc. Không giống mã hóa thủ cơng một chương trình phần mềm với các
hướng dẫn cụ thể để hoàn thành một tác vụ, Machine Learning cho phép một hệ
thống tự học để nhận dạng các biểu mẫu và đưa ra dự đoán một cách chính xác.
Alpha Go là một ví dụ hồn hảo về Machine Learning, khi nó tiếp nhận và học
hỏi một lượng lớn dữ liệu từ cách bước đi cũng như tính tốn của các cao thủ để
đánh bại nhà vơ địch thế giới Lee Sedol. Hiện tại, các tập đoàn lớn như IBM,
Google, Amazon, Microsoft… đều cung cấp các nền tảng Machine Learning để
các doanh nghiệp ứng dụng và tích hợp vào các chiến lược kinh doanh.
 Một số loại thuật tốn

 Học có giám sát (Supervised Learning ) : Về cơ bản, trong thuật toán
được giám sát này, dữ liệu đầu vào được gọi là dữ liệu huấn luyện và có nhãn
hoặc kết quả đã biết như thư rác / không phải thư rác hoặc giá cổ phiếu tại một
thời điểm.Trong đó, một mơ hình được chuẩn bị thơng qua một q trình đào
tạo. Ngồi ra, điều này cần thiết để đưa ra dự đoán. Và được sửa chữa khi
những dự đốn đó là sai. Q trình đào tạo tiếp tục cho đến khi mơ hình đạt
được mức độ mong muốn.
 Học không giám sát (Unsupervised Learning) : Trong thuật tốn
machine learning khơng giám sát này, input data đều khơng được dán nhãn và
khơng có kết quả rõ ràng. Vì vậy, chúng ta phải chuẩn bị mơ hình bằng cách suy

10


đốn các cấu trúc có trong input data. Điều này có thể là trích xuất các quy tắc
chung. Nó có thể là thơng qua một q trình tốn học để giảm sự sai lệch và lỗi.
 Học nửa giám sát (Semi-Supervised Learning) : Đầu vào dữ liệu là một
hỗn hợp của các dữ liệu được gắn nhãn và không gắn nhãn. Trong đó chúng ta
có đặt ra một kết quả và mục tiêu theo mong muốn. Nhưng mơ hình thuật toán
cần phải học các cấu trúc để tổ chức dữ liệu cũng như đưa ra các dự đoán.
 Học tăng cường (Reinforcement Learning) : Reinforcement learning là các
bài toán giúp cho một hệ thống tự động xác định hành vi dựa trên hồn cảnh để đạt
được lợi ích cao nhất (maximizing the performance). Hiện tại, Reinforcement
learning chủ yếu được áp dụng vào Lý Thuyết Trị Chơi (Game Theory), các thuật
tốn cần xác định nước đi tiếp theo để đạt được điểm số cao nhất.
 Chuyển đổi: Tương tự học có giám sát nhưng không xây dựng hàm
một cách rõ ràng. Thay vì thế, cố gắng đốn kết quả mới dựa vào các dữ liệu
huấn luyện, kết quả huấn luyện, và dữ liệu thử nghiệm có sẵn trong q trình
huấn luyện.
 Học cách học: Trong đó thuật tốn học thiên kiến quy nạp của chính

mình, dựa theo các kinh nghiệm đã gặp.
1.3.3 Tìm hiểu về Học Sâu (Deep Learning).

Hình 1.5. DeepLearning

11


Deep learning là một lĩnh vực chuyên sâu của Machine Leaning. Nó sử
dụng một số kỹ thuật của Machine Learning để giải quyết các vấn đề thực tế
bằng cách khai thác các mạng thần kinh nhân tạo (dựa trên các thiết bị phần
cứng và phần mềm được kết nối với nhau theo cách nào đó) và mơ phỏng việc
đưa ra các quyết định của con người. Deep Learning có chi phí khá đắt đỏ, và
địi hỏi các bộ dữ liệu lớn để tự tập luyện, bởi vì có một số lượng lớn các tham
số cần được tìm hiểu theo giải thuật, mà ban đầu có thể tạo ra rất nhiều dữ liệu
tích cực giả. Ví dụ, một thuật tốn deep learning có thể được hướng dẫn để
“học” về việc một con mèo trơng như thế nào. Nó sẽ có một bộ dữ liệu khổng lồ
của hình ảnh để nó hiểu được các chi tiết rất nhỏ mà phân biệt một con mèo với
một con báo hoa, một con báo đen hay một con cáo. Tiếp tục với ví dụ về Alpha
Go, Google đã lý giải về việc hệ thống đã sử dụng deep learning theo cách kết
hợp tìm kiếm cây Monte-Carlo với mạng thần kinh nhân tạo đã được đào tạo
bằng cách học có giám sát các trận của của những chuyên gia và bằng cách tăng
cường học tập từ các trận đấu tự chơi.
Deep Learning đã cho phép ứng dụng nhiếu vấn đề thực tế của máy
học và bằng cách mở rộng lĩnh vực tổng thể của AI. Deep learning phá vỡ các
cách thức con người làm việc bằng cách làm cho tất cả các loại máy móc trợ
giúp có thể thực hiện được, gần hoặc giống hệt con người.
Deep Learning có ứng dụng sâu rộng trong các lĩnh vực của đời sống, ví
dụ như tìm kiếm dựa trên văn bản, phát hiện gian lận, phát hiện spam, nhận
dạng chữ viết tay, tìm kiếm hình ảnh, nhận dạng giọng nói, phát hiện chế độ

xem phố và bản dịch là tất cả các tác vụ có thể được thực hiện thông qua deep
learning, thay thế nhiều hệ thống dựa trên các nguyên tắc thủ công. Tuy nhiên,
deep learning cũng rất dễ bị thiên lệch, nếu trong bộ dữ liệu không có những
tham số cần thiết.
Điểm yếu của DL: Deep learning khơng phải là thuật tốn generalpurpose bởi vì chúng địi hỏi một lượng dữ liệu khổng lồ để training. Thực tế,

12


chúng bị vượt mặt bởi các thuật toán tree ensembles trong các tác vụ machine
leanring cơ bản. Hơn nữa, mô hình này tốn rất nhiều tài nguyên để train và đòi
hỏi nhiều chuyên gia để tuning hypermarameters (số layer, số node từng layer,
learning rate, số lần lặp).
1.3.4 Mối quan hệ giữa AI, Machine Learing và DeepLearning.

Hình 1.6. Mối quan hệ giữa AI, Machine Learning, DeepLearning
Như vậy, ta có thể thấy ML chỉ là một thành phần trong hướng tiếp cận
hành động như người, và hướng tiếp cận này lại thuộc bốn hướng tiếp cận của
AI. Để đạt được mục tiêu này, các nhà khoa học đã nghiên cứu ra nhiều giải
thuật và các hướng giải quyết khác nhau:
 Supervised-learning: decision tree, k-NN, naive bayes, SVM, neural
network, deep learning, …
 Unsupervised-learning: k-means, hierachical clustering
 Reinforcement learning: passive/acive/generalization.
Một lần nữa ta có thể thấy Deep learning chỉ là một phương pháp nằm
trong hướng giải quyết học có giám sát của Machine Learning.
1.4 Ứng dụng cơng nghệ trí tuệ nhân tạo trong đời sống.
Thời gian gần đây, phạm vi ứng dụng của trí tuệ nhân tạo mở rộng khơng
ngừng, có thể nói hiện khơng có lĩnh vực khoa học nào khơng sử dụng các


13


thành tựu của cơng nghệ trí tuệ nhân tạo.
a. Trong lĩnh vực quân sự
Các hệ thống tích hợp quang hồng ngoại có khả năng tự động điều khiển
dàn hỏa lực (pháo, tên lửa) được lắp đặt cho các trận địa cao xạ, trên xe tăng,
tàu chiến, máy bay, tên lửa hoặc vệ tinh. Chúng được thay thế và hỗ trợ các dàn
rada dễ bị nhiễu trong việc tự động phát hiện, cảnh giới, bám bắt mục tiêu.
b. Trong an ninh, phòng chống tội phạm, bảo vệ pháp luật
Các hệ thống camera nhận dạng khuôn mặt vân tay tự động cũng như
phát hiện, theo dõi, cảnh báo các âm mưu và hoạt động khủng bố. Các xe robốt
tự hành có gắn các camera cũng được ứng dụng trong các môi trường độc hại,
dị phá bom mìn.

Hình 1.7. Hệ thống Camera nhận dạng khuôn mặt
c. Trong lĩnh vực hàng không vũ trụ
Các hệ thống ống kính chụp ảnh viễn thám (remote sensing) lắp trên các
vệ tinh bay quanh trái đất có thể chụp và quan sát được các vật kích cỡ 0,5 m từ
độ cao 750 km trong mọi điều kiện thời tiết... Việc nối ghép các ống kính này
với hệ thống GPS sẽ cho phép xây dựng các bản đồ số có những lĩnh vực ứng
dụng cực kỳ quan trọng trong quốc phòng an ninh, phát triển kinh tế, xã hội...
d. Trong công nghiệp, giao thông, xây dựng
Hệ thống quang điện tử đóng vai trị của các thị giác máy (machine

14


vision) có khả năng tự động đo đạc kiểm tra chất lượng sản phẩm trong các dây
truyền sản xuất: phân loại hạt ngũ cốc, cà phê; tìm lỗi lắp ráp linh kiện các bản

vi mạch và khuyết tật các mối hàn và động cơ... Các hệ thống quang điện tử
cũng được ứng dụng ngày càng nhiều trong giao thông như đo tốc độ, tự động
kiểm soát điều khiển và phân luồng giao thơng.

Hình 1.8. Cơng nghệ xử lý ảnh giúp nhận diện xe
e. Trong nghiên cứu y sinh dược học
Các kính hiển vi có khả năng tự động nhận dạng và đo đếm các tế bào với
độ chính xác cao. Các kính hiển vi có hệ thống dẫn đường laser cho phép thực
hiện những phẫu thuật rất phức tạp như mổ u não, nơi mà một sự khơng chính
xác cũng gây tổn hại đến các dây thần kinh chằng chịt xung quanh.

Hình 1.9. Ứng dụng xử lý ảnh trong y học

15


×