Tải bản đầy đủ (.pdf) (73 trang)

Nghiên cứu ứng dụng kỹ thuật học sâu trong nhận dạng một số sâu bệnh trên cây lúa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.39 MB, 73 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO

UBND TỈNH THANH HÓA

TRƢỜNG ĐẠI HỌC HỒNG ĐỨC

LƢU TÙNG DƢƠNG

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT HỌC SÂU
TRONG NHẬN DẠNG MỘT SỐ SÂU BỆNH TRÊN CÂY LÚA

LUẬN VĂN THẠC SĨ CƠNG NGHỆ THƠNG TIN

THANH HĨA - 2019


BỘ GIÁO DỤC VÀ ĐÀO TẠO

UBND TỈNH THANH HÓA

TRƢỜNG ĐẠI HỌC HỒNG ĐỨC

LƢU TÙNG DƢƠNG

NGHIÊN CỨU ỨNG DỤNG KỸ THUẬT HỌC SÂU
TRONG NHẬN DẠNG MỘT SỐ SÂU BỆNH TRÊN CÂY LÚA

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Chuyên ngành: KHOA HỌC MÁY TÍNH
Mã số: 8480101



Ngƣời hƣớng dẫn khoa học: TS. Hồng Văn Dũng

THANH HĨA - 2019


Danh sách Hội đồng chấm luận văn Thạc sĩ khoa học
(theo quyết định số …/QĐ-ĐHHĐ ngày tháng năm 2019 của Hiệu trưởng
Trường Đại học Hồng Đức)
Học hàm, học vị, Họ và tên

Cơ quan công tác

Chức danh
trong Hội đồng
Chủ tịch
Phản biện 1
Phản biện 2
Ủy viên
Thư ký

Xác nhận của Ngƣời hƣớng dẫn
Học viên đã chỉnh sửa theo ý kiến của Hội đồng

Thanh Hóa, ngày

tháng

năm 2019


(Ký và ghi rõ họ tên)

TS. Hồng Văn Dũng


i

LỜI CAM ĐOAN

Những nội dung trong luận văn này là do tôi thực hiện dưới sự hướng dẫn
trực tiếp của thầy giáo hướng dẫn TS. Hoàng Văn Dũng.
Các tài liệu tham khảo dùng trong luận văn đều được trích dẫn rõ ràng tên
tác giả, tên cơng trình, thời gian, địa điểm công bố.
Tôi xin cam đoan luận văn này không trùng lặp với các khóa luận, luận
văn, luận án và các cơng trình nghiên cứu đã cơng bố.

Ngƣời cam đoan

Lƣu Tùng Dƣơng


ii

LỜI CẢM ƠN

Em xin chân thành cám ơn quý thầy, cô trong khoa Công nghệ thông tin &
Truyền thông đã trang bị cho em một kiến thức nền tảng giúp em có thể hồn
thành tốt luận văn này. Cám ơn các bạn trong lớp đã chia sẻ các kinh nghiệm và
đã hỗ trợ trong lúc làm luận văn.
Đặc biệt em xin chân thành cảm ơn thầy hướng dẫn, T.S Hoàng Văn Dũng

đã hỗ trợ em trong quá trình thực hiện luận văn này.
Mặc dù đã cố gắng hết khả năng nhưng khơng thể nào tránh khỏi những
thiếu sót. Rất mong nhận được sự góp ý quý báu của quý thầy cơ để em hồn
chỉnh hơn.
Ngƣời cảm ơn

Lƣu Tùng Dƣơng


iii

MỤC LỤC
MỞ ĐẦU .........................................................................................................................1
1. Lý do chọn đề tài .....................................................................................................1
2. Mục tiêu nghiên cứu ................................................................................................2
3. Nhiệm vụ và giới hạn của đề tài ..............................................................................2
3.1. Nhiệm vụ của đề tài ..........................................................................................2
3.2. Giới hạn của đề tài ............................................................................................2
4. Phương pháp nghiên cứu .........................................................................................2
5. Cấu trúc luận văn .....................................................................................................3
CHƢƠNG I: TỔNG QUAN VỀ NHẬN DẠNG XỬ LÝ ẢNH..................................4
VÀ HỌC MÁY ...............................................................................................................4
1.1. Một số kỹ thuật xử lý ảnh .................................................................................4
1.1.1. Tổng quan về xử lý ảnh .............................................................................4
1.1.2. Một số dạng ảnh ........................................................................................5
1.1.3. Các thành phần trong hệ thống xử lý ảnh ..................................................6
1.1.4. Phương pháp phát hiện biên ảnh ...............................................................7
1.1.4.1. Một số khái niệm ................................................................................7
1.1.4.2. Kỹ thuật phát hiện biên Gradient .......................................................7
1.1.4.3. Kỹ thuật phát hiện biên Canny ...........................................................8

1.1.4.4. Phát hiện biên gián tiếp ......................................................................9
1.1.5. Phân vùng ảnh .........................................................................................10
1.1.5.1. Phân vùng theo ngưỡng biên độ .......................................................10
1.1.5.2. Phân vùng theo miền đồng nhất .......................................................11
1.1.5.3. Phương pháp tách cây tứ phân .........................................................11
1.1.5.4. Phương pháp cục bộ .........................................................................11
1.1.5.5. Phương pháp tổng hợp......................................................................12
1.1.5.6. Phân vùng theo kết cấu bề mặt .........................................................12
1.2. Một số vấn đề về học máy ..............................................................................13
1.2.1. Khái niệm học máy..................................................................................13
1.2.2. Phân loại phương pháp học máy .............................................................13


iv
1.2.3. Ứng dụng của học máy ............................................................................14
1.3. Một số kỹ thuật nhận dạng mẫu .....................................................................14
1.3.1. Tổng quan về nhận dạng..........................................................................14
1.3.2. Quá trình nhận thức của con người là quá trình nhận dạng ....................15
1.3.3 Kỹ thuật trượt window trong nhận dạng ..................................................15
1.3.4. Huấn luyện mơ hình trong nhận dạng .....................................................19
1.3.5. Phương pháp nhận dạng đối tượng trong ảnh .........................................20
1.4. Một số kỹ thuật học máy sử dụng trong nhận dạng .......................................21
1.4.1. Máy vector hỗ trợ SVM...........................................................................21
1.4.2. Mạng Nơron nhân tạo ..............................................................................23
1.4.3. Kỹ thuật học sâu ......................................................................................26
1.4.3.1. Tổng quan về học sâu .......................................................................26
1.4.3.2. Mạng Neural học sâu ........................................................................27
CHƢƠNG II: KỸ THUẬT MẠNG TÍCH CHẬP TRONG DỰ ĐỐN BỆNH VỀ
LÚA ...............................................................................................................................29
2.1. MẠNG NEURAL TÍCH CHẬP.....................................................................29

2.1.1. Khái niệm ................................................................................................ 29
2.1.2. Cấu trúc cơ bản của mạng CNN ..............................................................29
2.1.3.2. Mạng ZFNet .....................................................................................33
2.1.3.3. Mạng GoogLeNet .............................................................................34
2.1.3.4. Mạng neural tích chập 3D-CNN ......................................................36
2.2. GIẢI PHÁP DỰ ĐỐN BỆNH LÚA BẰNG MẠNG TÍCH CHẬP ............37
2.2.1. Mơ tả bài toán nhận dạng bệnh lúa..........................................................37
2.2.2. Giải pháp tổng quát .................................................................................38
2.2.3. Định nghĩa kiến trúc mạng CNN .............................................................39
2.2.4. Các vấn đề trong dự đoán loại bệnh: .......................................................40
2.2.5. Tăng cường dữ liệu cho mạng học sâu ....................................................41
CHƢƠNG III. THỰC NGHIỆM, ĐÁNH GIÁ KẾT QUẢ .....................................43
3.1. Dữ liệu dùng trong thực nghiệm ....................................................................43
3.2. Xây dựng mạng học sâu .................................................................................43
3.3. Kết quả thực nghiệm.......................................................................................46


v
3.4. Tiêu chí đánh giá ............................................................................................48
3.5. Kết quả đánh giá .............................................................................................50
3.6. Đánh giá hệ thống ...........................................................................................54
3.7. Chương trình minh họa...................................................................................55
CHƢƠNG IV. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .......................................57
4.1. Kết luận ..........................................................................................................57
4.2. Hướng phát triển .............................................................................................57
TÀI LIỆU THAM KHẢO...........................................................................................58


vi
DANH SÁCH CÁC HÌNH

Hình 1. 1: Sơ đồ các bước cơ bản trong xử lý .................................................................5
Hình 1. 2: Cấu trúc điểm ảnh với 3 lớp màu RGB ..........................................................5
Hình 1. 3: Ảnh đa mức xám ............................................................................................6
Hình 1. 4: Sơ đồ tổng qt hệ thống xử lý ảnh ................................................................6
Hình 1. 5: Ví dụ về pixel cần tính vector gradient. .........................................................8
Hình 1. 6: Phần ngưỡng ...................................................................................................9
Hình 1. 7: Liên thơng .....................................................................................................12
Hình 1. 8: Trượt window ...............................................................................................16
Hình 1. 9: Nhận dạng bằng phương pháp trượt window trên nhiều mức tỷ lệ ..............18
Hình 1. 10: Gom cụm các nhận dạng cùng một đối tượng: ..........................................19
Hình 1. 11: Đường thẳng phân chia 2 lớp trong không gian 2 chiều ............................22
Hình 1. 12: Margin trong SVM .....................................................................................22
Hình 1. 13: Kiến trúc chung của mạng nơron nhân tạo.................................................24
Hình 1. 14: (a) Mơ hình mạng neural cạn[27] (b) Mơ hình mạng neural sâu[37] ........27
Hình 1. 15: Biểu diễn đặc trưng đối tượng trong mạng học sâu [28] ............................28
Hình 2. 1:. Phép MaxPooling (2x2), stride=2 (nguồn internet) ...................................30
Hình 2. 2: Kiến trúc 8 lớp của mơ hình AlexNet ..........................................................31
Hình 2. 3: Kiến trúc 8 lớp của mơ hình FZNet. ............................................................33
Hình 2. 4: Một dạng cụ thể của kiến trúc mạng GoogLeNet. .......................................35
Hình 2. 5: Mạng neural học sâu đơn giản gồm 3 inception ..........................................36
Hình 2. 6: Ph p tích chập khối 3D-CNN) ....................................................................37
Hình 2. 7: Sơ đồ tổng quát giải pháp phân loại bệnh qua hình ảnh...............................38
Hình 3. 1: Mơ hình kiến trúc mạng CNN ......................................................................46
Hình 3. 2: Trọng số của bộ lọc của lớp tích chập đầu tiên. Lớp này bao gồm 32 bộ lọc
kích thước 7 x 7, mỗi bộ lọc được kết nối với ba kênh đầu vào ảnh màu RGB. ..........47
Hình 3. 3: Đầu ra 32 bộ tích chập tại lớp convolution đầu tiên ....................................47
Hình 3. 4: Giá trị chỉnh sửa tuyến tính sau lớp tích chập đầu tiên ................................ 48
Hình 3. 5: Đầu ra của 32 mẫu tại lớp Convolution thứ hai ...........................................48
Hình 3. 6: Bệnh đạo ơn ..................................................................................................50
Hình 3. 7: Cháy bìa lá ....................................................................................................50



vii
Hình 3. 8: Ngộ độc phèn................................................................................................ 51
Hình 3. 9: Sâu cuốn lá ...................................................................................................51
Hình 3. 10: Minh họa một số mẫu bệnh chuẩn đốn đúng ............................................54
Hình 3. 11: Minh họa một số mẫu bệnh chuẩn đoán nhầm ...........................................54


viii
DANH SÁCH CÁC BẢNG BIỂU
Bảng 2. 1: Bảng mô tả kiến trúc 25 lớp của mạng AlexNet trong Matlab. ...................31
Bảng 2. 2: Tham số mạng CNN ....................................................................................39
Bảng 2. 3: Tham số mạng NN. ......................................................................................40
Bảng 3. 1: Mô tả các loại bệnh về lúa ...........................................................................50
Bảng 3. 2: Số liệu về tập dữ liệu dùng để huấn luyện ...................................................51
Bảng 3. 3: Số liệu về tập dữ liệu dùng để đánh giá. ......................................................51
Bảng 3. 4: Kết quả số liệu đánh giá trên tập dữ liệu tự thu thập ...................................52
Bảng 3. 5: Độ chính xác tính theo từng loại bệnh riêng biệt .........................................52
Bảng 3. 6: Kết quả đánh giá theo các tiêu chí chẩn đoán ..............................................53


ix
DANH SÁCH CÁC CHỮ VIẾT TẮT
Ký hiệu

Tiếng anh

Tiếng việt


ANN

Artificial Neural Network

Mạng Neural nhân tạo

CNN

Convolutional Neural Network

Mạng Neural tích chập

DNN

Deep Neural Network

Mạng Neural sâu

SVM

Support vector machine

Máy vector hỗ trợ

AI

Artificial Intelligence

Trí tuệ nhân tạo


GPU

Graphics Processing Unit

Đơn vị xử lý đồ họa

CONV

Convolutional

Tích chập

MLNN

Multi Layer Neural Network

Mạng Neural đa lớp

ReLU

Rectified Linear Unit

Hiệu chỉnh đơn vị tuyến tính

CUDA

Compute Unified Device
Architecture

Kiến trúc thiết bị tính tốn hợp

nhất


1
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay đã có nhiều nghiên cứu về các hệ thống tự động phát hiện đối tượng
trong lĩnh vực thị giác máy tính. Phát hiện đối tượng được dùng trong nhiều lĩnh vực
khác nhau như: nhận dạng khuôn mặt, nhận dạng sâu bênh, phát hiện biểu hiện tổn
thương da, phát hiện loại sản phẩm, …
Phát hiện đối tượng cụ thể là biểu hiện của sâu bệnh để phân loại các bệnh trên
cây lúa, đã được quan tâm từ lâu nay. Cùng với yêu cầu phát triển xã hội, hiệu quả các
hệ thống phát hiện đòi hỏi ngày càng được cải thiện và nâng cấp. Có nhiều hướng tiếp
cận khác nhau để giải bài tốn phát hiện khác nhau như: xác định biên, tìm kiểm sâu
trong việc nhận dạng.
Theo dự báo của các tổ chức quốc tế, đến năm 2050, sản xuất lương thực trên thế
giới phải tăng 70% so với hiện nay để nuôi đủ chín tỷ người. Lượng gạo giao dịch
thương mại vào năm 2022 ước đạt 45 triệu tấn, tăng 23% so với năm 2013. Giá lương
thực tồn cầu có thể tăng 10 - 14% trong 10 năm tới.
Ở nước ta sản xuất lúa gạo góp phần quan trọng bảo đảm an ninh lương thực, xóa
đói giảm nghèo, thúc đẩy xuất khẩu, tăng thu ngoại tệ và nâng cao vị thế của Việt Nam
trên thế giới. Theo đó, giai đoạn 1989 đến 2012, xuất khẩu gạo tăng bình quân
14%/năm về lượng và 10% giá trị. Gạo Việt có mặt trên 150 quốc gia, vùng lãnh thổ.
Diện tích trồng và năng suất tăng liên tục, sau 20 năm từ 1995 đến 2015 tăng từ 3,2
triệu ha lên 4,3 triệu ha vùng ĐBSCL…
Bên cạnh kết quả đạt được, hạn chế của ngành lúa gạo cịn rất nhiều, trong đó
cơng tác sản xuất cịn gặp nhiều khó khăn như việc phịng chống sâu bệnh trên cây lúa
từ đó dẫn đến hiệu quả năng suất chất lượng chưa cao, hiện nay trung bình mỗi hộ
canh tác lúa được lợi nhuận 35 - 40 triệu đồng/ha/năm, thấp hơn 2,7 lần so với Tháilan; 1,5 lần so với Indonesia và Philippines. Việc áp dụng các biện pháp phòng trừ sâu
bệnh vẫn còn nhiều hạn chế, nhiều loại bệnh chưa có thuốc đặc trị, việc sử dụng thuốc

bảo vệ thực vật trên cây lúa cũng có nhiều vấn đề đáng bàn… Vấn đề này được nhiều
cá nhân tổ chức nghiên cứu quan tâm. Tuy nhiên có những vùng miền và địa hình
trồng cây lúa của người dân Việt Nam khác nhau. Trong khi đó tình hình nghiên cứu
phịng ngừa, khắc phục còn nhiều hạn chế và chưa kịp thời chính xác.


2
Việc nghiên cứu, tìm hiểu nền tảng cơng nghệ, các lý thuyết cơ bản trong bài
toán xử lý ảnh và áp dụng trong việc nhận dạng sâu bệnh nhằm hỗ trợ cho công tác
cảnh báo đến người sản xuất, phát hiện bệnh sớm và phân loại bệnh là việc hết sức
quan trọng và có tính cấp thiết cao quyết định cách phịng trừ sâu bệnh. Do vậy, tơi đã
chọn đề tài ―Nghiên cứu sử dụng kỹ thuật Học sâu trong nhận dạng một số sâu
bệnh trên cây Lúa‖ nhằm hỗ trợ chuẩn đốn và phân loại bệnh để có cách phòng trừ
bệnh.
2. Mục tiêu nghiên cứu
Mục tiêu của đề tài là nghiên cứu áp dụng kỹ thuật học sâu trong xây dựng cấu
trúc mạng, tổ chức huấn luyện, các biện pháp tiền xử lý hình ảnh nhằm nâng cao độ
chính xác nhận dạng sâu bệnh. Kết quả nghiên cứu có thể là cơ sở hỗ trợ việc chuẩn
đoán, phân loại bệnh để có cách phịng trừ bệnh phù hợp, hiệu quả.
3. Nhiệm vụ và giới hạn của đề tài
3.1. Nhiệm vụ của đề tài
Tìm hiểu lý thuyết về xử lý ảnh và một số kỹ thuật trí tuệ nhân tạo.
Tìm hiểu phương pháp học sâu, xây dựng mơ hình kiến trúc mạng tích chập,
huấn luyện và tăng cường dữ liệu nhằm nâng cao độ chính xác nhận dạng sâu bệnh.
Xây dựng module nhận dạng ra từng loại phân tích sâu bệnh của hình ảnh trên
cơ sở đầu vào là các mẫu chứa trong hình ảnh sâu bệnh.
3.2. Giới hạn của đề tài
Đề tài này tập trung nghiên đề xuất giải pháp nâng cao độ chính xác nhận dạng
các mẫu hình ảnh. Chúng tơi khơng chú trọng vào việc trích xuất vùng chứa hình ảnh
sâu bệnh từ ảnh tổng thể, nhiệm vụ này có thể sử dụng những phương pháp hiện nay,

như phương pháp phân đoạn đoạn ngữ nghĩa hay phương pháp trích vùng quan tâm
bằng màu sắc và hình dáng.
4. Phƣơng pháp nghiên cứu
Phương pháp nghiên cứu lý thuyết
Nghiên cứu cơ sở lý thuyết về trí tuệ nhân tạo, mạng neural và các kỹ thuật
nhận dạng và xử lý ảnh
Nghiên cứu nguyên lý hoạt động của mạng tích chập học sâu và ứng dụng của
nó trong nhận dạng mẫu.


3
Phân tích đánh giá tổn thương da và sử dụng kỹ thuật học sâu để nhận dạng
phân loại ra từng loại bệnh.
Phương pháp nghiên cứu thực nghiệm
Cài đặt, thực nghiệm giải pháp kỹ thuật học sâu trong phân tích, biểu diễn dữ
liệu và phân loại bệnh.
Đánh giá tính hiệu quả của giải pháp ứng dụng kỹ thuật học sâu với các các tiếp
cận khác về nhận dạng sâu bệnh, nhận x t đánh giá về giải pháp và đề xuất ứng dụng.
Cài đặt thử nghiệm và đánh giá các cải tiến thuật toán nhận dạng sâu bệnh bằng
kỹ thuật học sâu.
5. Cấu trúc luận văn
Đề tài ―Nghiên cứu sử dụng kỹ thuật Học sâu trong nhận dạng một số sâu
bệnh trên cây Lúa‖ gồm 4 chương.
Chương 1: Tổng quan về học máy, nhận dạng và xử lý ảnh: Trình bày khái
niệm, các nội dung cơ bản của học máy, nhận dạng và xử lý ảnh. Các ứng dụng của
học máy và kỹ thuật xử lý ảnh trong thực tế.
Chương 2: Kỹ thuật Học sâu cho bài toán nhận dạng biểu hiện của sâu bệnh
trên cây Lúa: Nghiên cứu kỹ thuật Học sâu và một số kỹ thuật trí tuệ nhân tạo truyền
thống áp dụng cho bài toán nhận dạng sâu bệnh.
Chương 3: Thực nghiệm đánh giá, cài đặt, thử nghiệm và đánh giá giải pháp;

mơ tả q trình thực nghiệm xây dựng mạng neural học sâu, tổ chức huyến luyện và
kiểm tra đánh giá mơ hình mạng; xây dựng dữ liệu một số loại hình ảnh hiểu hiện và
loại bệnh, mơ tả về q trình xây dựng dữ liệu và tiền xử lý cơ sở dữ liệu; đánh giá, so
sánh giữa kỹ thuật Học sâu và phương pháp khác hiện nay về độ chính xác và thời
gian thực hiện trên tập dữ liệu tự tạo và bộ dữ liệu chuẩn của nhóm nghiên cứu khác.
Chương 4: Kết luận và hướng phát triển.


4
CHƢƠNG I: TỔNG QUAN VỀ NHẬN DẠNG XỬ LÝ ẢNH
VÀ HỌC MÁY
1.1. Một số kỹ thuật xử lý ảnh
1.1.1. Tổng quan về xử lý ảnh
Xử lý ảnh là một ngành khoa học mới so với nhiều ngành khoa học khác nhưng
tốc độ phát triển của nó rất nhanh. Nó được đưa vào giảng dạy đại học thời gian vài
chục năm gần đây ở nước ta. Xử lý ảnh là môn học liên quan đến nhiều lĩnh vực và
cần nhiều kiến thức cơ sở khác. Đầu tiên phải kể đến Xử lý tín hiệu số là một mơn học
hết sức cơ bản cho xử lý tín hiệu chung, các khái niệm về tích chập, các biến đổi
Fourier, biến đổi Laplace, các bộ lọc hữu hạn… Thứ hai, các cơng cụ tốn như: Đại số
tuyến tính, xác suất, thống kê. Một số kiến thứ cần thiết như Trí tuệ nhân tao, Mạng nơ
ron nhân tạo cũng được đề cập trong quá trình phân tích và nhận dạng ảnh.
Các phương pháp xử lý ảnh được bắt đầu từ các ứng dụng nhằm nâng cao chất
lượng ảnh như : Nâng cao độ sáng hay độ phân giải của hình ảnh,... bằng các phương
pháp phân tích được nghiên cứu trong giai đoạn thiết bị phần cứng bị hạn chế. Về sau
sự phát triển của máy tính đã tạo điều kiện cho việc thực hiện các thuật toán xử lý ảnh.
Ứng dụng xử lý ảnh ngày càng được mở rộng sang nhiều lĩnh vực khác như: Phân tích
hình ảnh, chẩn đốn bệnh qua các loại hình ảnh tia Gamma, X-quang, scan PET/CT
(cắt lớp phát xạ); Lĩnh vực tự động hóa, robot: Hệ thống xe khơng người lái, giám sát
sản xuất sản phẩm công nghiệp, robot phục vụ dân sự, điều khiển giao thông thông
minh; biểu hiện tâm lý, giao thông thông minh, giám sát an ninh,... Xử lý hình ảnh

được thực hiện trên hầu hết các thiết bị có màn hình hiển thị như camera kỹ thuật số,
điện thoại thông minh, ti vi thông minh, máy tính xách tay.
Các phương pháp tri thức nhân tạo như mạng nơ ron nhân tạo, các thuật toán xử
lý hiện đại và cải tiến, các công cụ nén ảnh ngày càng được áp dụng rộng rãi và thu
nhiều kết quả khả quan. Để dễ tưởng tượng, x t các bước cần thiết trong xử lý ảnh.
Đầu tiên, ảnh tự nhiên từ thế giới ngoài được thu nhận qua các thiết bị thu.
Trước đây, ảnh thu qua Camera là các ảnh tương tự. Gần đây, với sự phát triển
của công nghệ, ảnh màu hoặc đen trắng được lấy ra từ Camera, sau đó nó được chuyển
trực tiếp thành ảnh số tạo thuận lợi cho xử lý tiếp theo. Mặt khác, ảnh cũng có thể tiếp
nhận từ vệ tinh; có thể quét từ ảnh chụp bằng máy quét ảnh.


5

Hình 1. 1: Sơ đồ các bước cơ bản trong xử lý
1.1.2. Một số dạng ảnh
- Ảnh màu: Thường là các ảnh chứa thông tin về đối tượng được biểu diễn dưới
dạng màu sắc mà mắc thường có thể quan sát được. Mỗi điểm ảnh có cấu trúc gồm
nhiều kênh khác nhau, thơng thường trong máy tính, nó biểu diễn 3 lớp màu cơ bản
RGB (Red,Green,Blue) [13].

Hình 1. 2: Cấu trúc điểm ảnh với 3 lớp màu RGB
- Ảnh đa mức xám: thường biểu diễn thông tin liên quan đến cường độ đa xám
của đối tượng trong không gian mà khơng được thể hiện bởi màu sắc thực của nó)
[13].


6

Hình 1. 3: Ảnh đa mức xám

- Ảnh hồng ngoại (infrared image): biễu diễn trực quan quang phổ, liên quan đến
phổ điện từ. Nó cung cấp thơng tin ảnh dựa trên phản xạ ánh sáng hồng ngoại hoặc
bức xạ hồng ngoại mà các đối tượng trong khung nhìn phát ra. Dựa vào khả năng thu
nhận phản xạ hoặc bức xạ hồng ngoại mà các loại camera hồng ngoại có thể thu được
các hình ảnh trong điều kiện khơng có ánh sáng hoặc ánh sáng kém.
1.1.3. Các thành phần trong hệ thống xử lý ảnh
Hệ thống xử lý ảnh là đối tượng nghiên cứu liên quan đến các kỹ thuật thị giác
máy (computer vision), nó là q trình biến đổi từ một ảnh ban đầu được thu nhận từ
thiết bị sang một khơng gian mới, làm nổi bật các đặc tính dữ liệu, thuận lợi cho q
trình xử lý thơng tin và nâng cao độ chính xác. Nó có thể bao gồm một số thành phần
chính như sau:

Hình 1. 4: Sơ đồ tổng quát hệ thống xử lý ảnh
Hệ thống xử lý ảnh hoạt động theo các bước sau:
- Thu nhận ảnh: Là việc hình ảnh về thế giới thực được thu nhận và chuyển qua
tín hiệu ảnh rời rạc thơng qua các thiết bị thu hình ảnh.


7
- Tiền xử lý: Là bước xử lý trên ảnh đầu vào nhằm khử nhiễu, làm nổi bật một số
tính chất của ảnh nhằm nâng cao chất lượng các bước xử lý sau.
- Trích chọn đặc trưng: Là q trình biến đổi dữ liệu ảnh đầu vào thành tập các
đặc trưng. Các đặc trưng thường có đặc tính phân biệt cao của các mẫu đầu vào, việc
phân biệt các mẫu dữ liệu ảnh đầu vào dễ dàng hơn nhằm nâng cao chất lượng phân
loại mẫu so với xử lý dữ liệu thơ trên giá trị pixel ảnh. Việc trích chọn đặc trưng dùng
để thể hiện thông tin trong ảnh trong khi dữ liệu có tính phân biệt cao và cũng có thể
làm giảm kích thước.
- Phân loại, nhận dạng mẫu: Là quá trình xử lý dữ liệu bằng các kỹ thuật, phương
pháp phân tích đặc trưng để phân loại các mẫu về các nhóm có chung một số tính chất
nào đó. Các phương pháp phân loại, nhận dạng mẫu thường liên quan đến các kỹ thuật

học máy, bao gồm cả học có giám sát và học khơng có giám sát.
- Biểu diễn tri thức: Là việc thể hiện ở mức độ cao của biểu diễn dữ liệu, các mẫu
dữ liệu sau khi phân loại, nhận dạng được biểu diễn dưới dạng tri thức giúp hệ thống
có khả năng ―hiểu biết‖ ngữ nghĩa của nó theo từng kiểu ứng dụng khác nhau trong hệ
thống trí tuệ nhân tạo và hệ thống thông minh.
- Ra quyết định: Là bước cuối cùng của một hệ thống nói chung trong lĩnh vực
thị giác máy tính. Các mẫu được biểu diễn dưới dạng tri thức và được suy luận ngữ
nghĩa để đưa ra các quyết định thực hiện một nhiệm vụ nào đó.
1.1.4. Phƣơng pháp phát hiện biên ảnh
1.1.4.1. Một số khái niệm
- Điểm Biên: Một điểm ảnh được coi là điểm biên nếu có sự thay đổi nhanh
hoặc đột ngột về mức xám (hoặc màu). Ví dụ trong ảnh nhị phân, điểm đen gọi là điểm
biên nếu lân cận nó có ít nhất một điểm trắng.
- Đường biên đường bao: boundary): Tập hợp các điểm biên liên tiếp tạo thành
một đường biên hay đường bao.
- Ý nghĩa của đường biên: Đường biên là một loại đặc trưng cục bộ tiêu biểu
trong phân tích, nhận dạng ảnh. Người ta sử dụng biên làm phân cách các vùng xám
(màu) cách biệt.
1.1.4.2. Kỹ thuật phát hiện biên Gradient
Gradient là một vec tơ f(x, y) có các thành phần biểu thị tốc độ thay đổi mức
xám của điểm ảnh theo hai hướng x, y trong bối cảnh xử lý ảnh hai chiều)


8
Error! No text of specified style in document..1

Error! No text of specified style in document..2
Trong đó, dx, dy là khoảng cách (tính bằng số điểm) theo hướng x và y. Tuy ta
nói là lấy đạo hàm nhưng thực chất chỉ là mô phỏng và xấp xỉ đạo hàm bằng các kỹ
thuật nhân chập vì ảnh số là tín hiệu rời rạc nên đạo hàm không tồn tại (thực tế chọn

dx= dy=1).
Một vector gradient có thể được tính cho mỗi pixel của một ảnh. Nó là sự thay
đổi trong giá trị pixel theo hướng x và hướng y quanh mỗi pixel. Ví dụ, tính vector
gradient tại pixel được tơ nỗi bằng màu xanh trong hình 1.6a dưới đây theo phương
pháp chập với các bộ lọc [-1 0 1] và [-1 0 1] T :

Hình 1. 5: Ví dụ về pixel cần tính vector gradient.
Đây là một ảnh tỉ lệ xám, do đó các giá trị pixel chỉ trong khoảng từ 0 đến 255
0 là điểm đen, 255 là điểm trắng). Các giá trị pixel bên trái và bên phải của pixel đang
xét (hình 1.7.) là 128 và 84. Tỉ lệ thay đổi theo phương x là 128-84=44. Tương tự, các
giá trị pixel bên trên và bên dưới của pixel đang x t là 161 và 54. Tỉ lệ thay đổi theo
phương y là 161-54=107. Do đó:
 44 

Vector gradient: f  44i  107 j =  
107




Độ lớn: G = 442  107 2  115.69
107
)  73.330
44

Hướng góc:   tan 1 (

Vector gradient bây giờ có thể được vẽ như một mũi tên trên ảnh.
1.1.4.3. Kỹ thuật phát hiện biên Canny



9
Đây là một thuật tốn tương đối tốt, có khả năng đưa ra đường biên mảnh, và
phát hiện chính xác điểm biên với điểm nhiễu.
Ta có thuật tốn như sau:
-

Bƣớc 1: Làm trơn ảnh

Tính I  H, với:
Gọi G là kết quả lọc nhiễu: G= IH
- Bƣớc 2: Tính gradient của ảnh bằng mặt nạ Prewitt, kết quả đặt vào Gx,Gy.
Gx = GHx, Gy = GHy
- Bƣớc 3: Tính gradient hướng tại mỗi điểm (i,j) của ảnh. Hướng này sẽ được
nguyên hóa để nằm trong 8 hướng [0..7], tương đương với 8 lân cận của một điểm ảnh.
- Bước 4: Dùng ràng buộc ―loại bỏ những điểm không phải là cực đại‖ để xóa bỏ
những điểm khơng là biên. Xét (i,j),  là gradient hướng tại i,j). I1, I2 là hai điểm lân
cận của i,j) theo hướng . Theo định nghĩa điểm biên cục bộ thì (i,j) là biên nếu I(i,j)
cực đại địa phương theo hướng gradient


Nếu I(i,j) > I1 và I(i,j) > I2 thì mới giữ lại I i,j), ngược lại xóa I(i,j) về điểm ảnh nền.

- Bước 5: Phân ngưỡng. Với các điểm được giữ lại, thực hiện lấy ngưỡng
gradient biên độ lần cuối để xác định các điểm biên thực sự.

Hình 1. 6: Phần ngưỡng
1.1.4.4. Phát hiện biên gián tiếp
Bằng cách nào đấy, ta thu được các vùng ảnh khác nhau thì đường phân cách



10
giữa các vùng đó chính là biên. Nói cách khác, việc xác định đường bao của ảnh được
thực hiện từ ảnh đã được phân vùng. Phương pháp dò biên gián tiếp khó cài đặt nhưng
áp dụng tốt khi sự biến thiên độ sáng nhỏ. Để có thể tiến hành xác định biên theo cách
gián tiếp này, ta cần giải quyết được bài toán phân vùng ảnh.
1.1.5. Phân vùng ảnh
Phân vùng ảnh là bước then chốt trong xử lý ảnh. Giai đoạn này nhằm phân tích
ảnh thành những thành phần có cùng tính chất nào đó dựa theo biên hay các vùng liên
thông. Tiêu chuẩn để xác định các vùng liên thơng có thể là cùng mức xám, cùng màu
hay cùng độ nhám…
Vùng ảnh là một chi tiết, một thực thể trơng tồn cảnh. Nó là một tập hợp các
điểm có cùng hoặc gần cùng một tính chất nào đó: mức xám, mức màu, độ nhám…
Vùng ảnh là một trong hai thuộc tính của ảnh. Nói đến vùng ảnh là nói đến tính chất bề
mặt. Đường bao quanh một vùng ảnh (Boundary) là biên ảnh. Các điểm trong một
vùng ảnh có độ biến thiên giá trị mức xám tương đối đồng đều hay tính kết cấu tương
đồng.
Dựa vào đặc tính vật lý của ảnh, người ta có nhiều kỹ thuật phân vùng: Phân
vùng dựa theo miền liên thông gọi là phân vùng dựa theo miền đồng nhất hay miền kề,
phân vùng dựa vào biên gọi là phân vùng biên. Ngoài ra cịn có các kỹ thuật phân
vùng khác dựa vào biên độ, phân vùng dựa theo kết cấu.
1.1.5.1. Phân vùng theo ngƣỡng biên độ
Đặc tính đơn giản nhất và có thể hữu ích nhất của ảnh đó là biên độ của các tính
chất vật lý của ảnh như: Độ tương phản, độ truyền sáng, màu sắc hoặc quang phổ.
Như vậy, có thể dùng ngưỡng biên độ để phân vùng khi biên độ đủ lớn đặc trưng cho
ảnh. Ví dụ, biên độ trong bộ cảm biến ảnh hồng ngoại có thể phản ánh vùng có nhiệt
độ thấp hay vùng có nhiệt độ cao. Kỹ thuật phân ngưỡng theo biên độ rất có lợi đối với
ảnh nhị phân như văn bản in, đồ họa, ảnh màu hay ảnh X-quang.
Việc chọn ngưỡng rất quan trọng. Nó bao gồm các bước:
* Xem x t lược đồ xám của ảnh để xác định các đỉnh và các khe. Nếu ảnh có

dạng rắn lượn (nhiều đỉnh và khe), các khe có thể dùng để chọn ngưỡng.
* Chọn ngưỡng t sao cho một phần xác định trước η của toàn bộ số mẫu là thấp
hơn t.
* Điều chỉnh ngưỡng dựa trên lược đồ xám của các điểm lân cận.
* Chọn ngưỡng theo lược đồ xám của những điểm thỏa mãn tiêu chuẩn chọn.
Thí dụ, với ảnh có độ tương phản thấp, lược đồ của những điểm có biên độ Laplace


11
g(m,n) lớn hơn giá trị t định trước (sao cho từ 5% đến 10% số điểm ảnh với Gradient
lớn nhất sẽ coi như biên) sẽ cho ph p xác định các đặc tính ảnh lưỡng cực tốt hơn ảnh
gốc.
Ta xét ví dụ sau về việc phân vùng dựa trên ngưỡng biên độ:
Giả sử ảnh có lược đồ xám và cách chọn các ngưỡng như hình trên với:
T0=Lmin, …, T4=Lmax. Ta có 5 ngưỡng và phân ảnh thành 4 vùng, ký hiệu Ck là
vùng thứ k của ảnh, k=1,2,3,4. Cách phân vùng theo nguyên tắc :
P(m,n) Ck nếu Tk-1 ≤ P(m,n) < Tk , k=1,2,3,4.
Khi phân vùng xong, nếu ảnh rõ nét thì việc phân vùng coi như kết thúc. Nếu
khơng, cần điều chỉnh ngưỡng.
1.1.5.2. Phân vùng theo miền đồng nhất
Kỹ thuật phân vùng ảnh thành các miền đồng nhất dựa vào các tính chất quan
trọng nào đó của miền ảnh. Việc lựa chọn các tính chất của miền sẽ xác định tiêu
chuẩn phân vùng. Tính đồng nhất của một miền ảnh là điểm chủ yếu xác định tính hiệu
quả của việc phân vùng. Các tiêu chuẩn hay được dùng là sự thuần nhất về mức xám,
màu sắc đối với ảnh màu, kết cấu sợi và chuyển động.
Các phương pháp phân vùng ảnh theo miền đồng nhất thường áp dụng là :
- Phương pháp tách cây tứ phân
- Phương pháp cục bộ
- Phương pháp tổng hợp
1.1.5.3. Phƣơng pháp tách cây tứ phân

Phương pháp này về nguyên tắc sẽ kiểm tra tiêu chuẩn đồng đều trên một miền
lớn của ảnh. Khi tiêu chuẩn này thỏa mãn thì quá trình phân đoạn kết thúc. Ngược lại
thì chia miền đang x t thành bốn miền nhỏ hơn. Với mỗi miền nhỏ, ta lại áp dụng một
cách đệ quy phương pháp trên cho đến khi tất cả các miền đều thỏa mãn.
Tiêu chuẩn để x t đồng đều có thể dựa vào mức xám, số đo độ không đồng đều
hoặc độ chênh giữa giá trị mức xám lớn nhất và giá trị mức xám nhỏ nhất trong miền
đang xét. Nếu vùng đang x t là đồng nhất thì tính lại giá trị cho các điểm thuộc vùng,
giá trị đó có thể lấy trung bình: tổng giá trị mức xám/tổng số điểm trong vùng.
1.1.5.4. Phƣơng pháp cục bộ
Ý tưởng của phương pháp này là xem x t ảnh từ các miền nhỏ nhất rồi hợp
chúng lại nếu thỏa tiêu chuẩn để được một miền đồng nhất lớn hơn. Ta lại thực hiện
với các miền thu được cho đến khi không thể hợp lại được nữa. Số miền còn lại cho ta


12
kết quả phân đoạn. Miền nhỏ nhất của bước xuất phát là điểm ảnh. Việc hợp hai vùng
được thực hiện theo nguyên tắc: - Khi hợp hai vùng này ta phải thu được một vùng
đồng nhất. - Hai vùng này phải kế cận nhau.
Trong xử lý ảnh, người ta dùng khái niệm liên thơng để xác định kế cận. Có hai
khái niệm liên thơng đó là 4 liên thơng và 8 liên thơng.
4 liên thơng

8 liên thơng

Hình 1. 7: Liên thông
1.1.5.5. Phƣơng pháp tổng hợp
Hai phương pháp nối (hợp) và tách đều có nhược điểm. Phương pháp tách sẽ
tạo nên một cấu trúc phân cấp và thiết lập mối quan hệ giữa các vùng. Tuy nhiên, nó
thực hiện việc chia quá chi tiết. Phương pháp hợp cho phép làm giảm số miền liên
thông xuống tối thiểu, nhưng cấu trúc hàng ngang dàn trải, không cho ta thấy rõ mối

liên hệ giữa các miền.
Vì nhược điểm này, người ta nghĩ đến phối hợp cả 2 phương pháp. Trước tiên,
dùng phương pháp tách để tạo nên cây tứ phân, phân đoạn theo hướng từ gốc đến lá.
Tiếp theo, tiến hành duyệt cây theo chiều ngược lại và hợp các vùng có cùng tiêu
chuẩn. Với phương pháp này ta thu được một cấu trúc ảnh với các miền liên thơng có
kích thước tối đa.
1.1.5.6. Phân vùng theo kết cấu bề mặt
Kết cấu thường được nhận biết trên bề mặt của các đối tượng như gỗ, cát, vải
vóc… Kết cấu là thuật ngữ phản ánh sự lặp lại của các phần tử sợi texel) cơ bản. Sự
lặp lại này có thể ngẫu nhiên hay có tính chu kì hoặc gần chu kì. Một texel chứa rất
nhiều điểm ảnh. Trong phân tích ảnh, kết cấu được chia làm hai loại chính là: Loại
thống kê và loại cấu trúc.
Khi đối tượng xuất hiện trên một nền có tính kết cấu cao, việc phân đoạn dựa
vào tính kết cấu trở nên quan trọng. Nguyên nhân là kết cấu sợi thường chứa mật độ
cao các gờ edge) làm cho phân đoạn theo biên kém hiệu quả, trừ phi ta loại tính kết
cấu.


13
Nhìn chung, việc phân loại và phân vùng dựa vào kết cấu là một vấn đề phức
tạp. Trong thực tế, ta thường chỉ giải quyết vấn đề này bằng cách cho biết trước các
loại kết cấu (dựa vào quy luật hay cách phân bố của nó).
1.2. Một số vấn đề về học máy
1.2.1. Khái niệm học máy
Học máy (machine learning) là một lĩnh vực nghiên cứu trong trí tuệ nhân tạo, nó
liên quan đến việc nghiên cứu, xây dựng các kĩ thuật để các hệ thống ―học‖ tự động từ
dữ liệu từ đó giải quyết những vấn đề cụ thể nào đó. Trong học máy, máy tính khơng
cần phải được lập trình một cách rõ ràng mà nó có thể tự thay đổi và cải thiện các thuật
tốn của mình.
Học máy có liên quan đến thống kê, nó nghiên cứu việc phân tích dữ liệu và tập

trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán. Máy học nghiên
cứu sự phát triển các giải thuật suy luận xấp xỉ mà có thể xử lý được, nó nghiên cứu
cách thức để mơ hình hóa bài tốn cho phép máy tính tự động hiểu, xử lý và học từ dữ
liệu để thực hiện nhiệm vụ được giao cũng như cách đánh giá giúp tăng tính hiệu quả.
Ngày nay, học máy cho phép máy tính giao tiếp với con người và được áp dụng
rộng rãi trong nhiều lĩnh vực như: tự lái xe, chẩn đoán y khoa, phát hiện thẻ tín dụng
giả, phân tích thị trường chứng khốn, phân loại các chuỗi DNA, nhận dạng tiếng nói
và chữ viết, dịch tự động, chơi trò chơi và cử động rơ-bốt.
1.2.2. Phân loại phƣơng pháp học máy
Học máy có hai loại phương pháp học máy chính
 Phương pháp quy nạp: Máy học/phân biệt các khái niệm dựa trên dữ liệu đã thu
thập được trước đó. Phương pháp này cho phép tận dụng được nguồn dữ liệu rất nhiều
và sẵn có.
 Phương pháp suy diễn: Máy học/phân biệt các khái niệm dựa vào các luật. Phương
pháp này cho phép tận dụng được các kiến thức chuyên ngành để hỗ trợ máy tính.
Hiện nay, các thuật tốn đều cố gắng tận dụng được ưu điểm của hai phương pháp này.
Các thuật toán học máy được phân loại theo kết quả mong muốn của thuật toán.
Các loại thuật toán thường dùng bao gồm:
Học có giám sát—trong đó, thuật tốn tạo ra một hàm ánh xạ dữ liệu vào tới kết
quả mong muốn. Một phát biểu chuẩn về một việc học có giám sát là bài tốn phân
loại: chương trình cần học cách xấp xỉ biểu hiện của) một hàm ánh xạ một vector tới
một vài lớp bằng cách xem x t một số mẫu dữ liệu - kết quả của hàm đó. Học khơng
giám sát—mơ hình hóa một tập dữ liệu, khơng có sẵn các ví dụ đã được gắn nhãn.
Học nửa giám sát—kết hợp các ví dụ có gắn nhãn và khơng gắn nhãn để sinh một


×