Tải bản đầy đủ (.pdf) (101 trang)

Kỹ thuật lựa chọn đặc trưng có giám sát cho vấn đề phân loại ảnh hạt giống lúa

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (7.57 MB, 101 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
——————————————

Lâm Trần Tuấn Dzi

KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG CÓ GIÁM SÁT
CHO VẤN ĐỀ PHÂN LOẠI ẢNH HẠT GIỐNG LÚA

LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH

TP. Hồ Chí Minh, Năm 2020


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC MỞ THÀNH PHỐ HỒ CHÍ MINH
——————————————

Lâm Trần Tuấn Dzi

KỸ THUẬT LỰA CHỌN ĐẶC TRƯNG CÓ GIÁM SÁT
CHO VẤN ĐỀ PHÂN LOẠI ẢNH HẠT GIỐNG LÚA

Chuyên ngành

: Khoa học máy tính

Mã số chuyên ngành : 60 48 01 01

LUẬN VĂN THẠC SỸ KHOA HỌC MÁY TÍNH


Người hướng dẫn khoa học:
TS. Trương Hoàng Vinh

TP. Hồ Chí Minh, năm 2020


LỜI CAM ĐOAN
Tôi cam đoan rằng luận văn “Kỹ thuật lựa chọn đặc trưng có giám sát cho vấn
đề phân loại ảnh hạt giống lúa” là bài nghiên cứu của chính tôi.
Ngoại trừ những tài liệu tham khảo được trích dẫn trong luận văn này, tôi cam
đoan rằng toàn phần hay những phần nhỏ của luận văn này chưa từng được sử
dụng để nhận bằng thạc sĩ ở những nơi khác.
Không có sản phẩm/nghiên cứu nào của người khác được sử dụng trong luận
văn này mà không được trích dẫn theo đúng qui định.
Luận văn này chưa bao giờ được nộp để nhận bất kỳ bằng cấp nào tại các
trường đại học hoặc cơ sở đào tạo khác.

Thành phố Hồ Chí Minh, năm 2020

Lâm Trần Tuấn Dzi

i


LỜI CẢM ƠN
Trong thời gian học tập, nghiên cứu để hoàn thiện luận văn, tôi đã nhận được
sự hướng dẫn, giúp đỡ rất tận tình của quý thầy cô, bạn bè và đồng nghiệp.
Tôi xin gửi lời cảm ơn sâu sắc đến TS. Trương Hoàng Vinh, thầy đã rất nhiệt
tình hướng dẫn và hỗ trợ tôi tận tình trong suốt thời gian nghiên cứu và thực
hiện luận văn. Tôi đã rất may mắn khi được thầy chấp nhận hướng dẫn, một lần

nữa xin gửi lời cảm ơn sâu sắc đến thầy, TS. Trương Hoàng Vinh.
Ngoài ra tôi xin cảm ơn quý thầy cô lãnh đạo, giảng viên, chuyên viên, thư
viện trường Đại học Mở TP. Hồ Chí Minh đã cung cấp những kiến thức, tài liệu
quý báu cũng như hỗ trợ cho tôi trong suốt thời gian học tập tại trường.
Tôi xin chân thành cảm ơn đến các anh chị trong nhóm cùng thầy hướng dẫn
đã cùng thảo luận trao đổi, hướng dẫn, hỗ trợ tôi, cùng những góp ý quý báu để
tôi có thể hoàn thành luận văn này tốt hơn.
Cuối cùng tôi xin gửi lời cảm ơn hơn đến những người thân yêu trong gia đình
đã luôn ở bên cạnh, hỗ trợ, động viên và tạo điều kiện thuận lợi nhất để tôi hoàn
thành luận văn cũng như chương trình học tại trường.

ii


TÓM TẮT
Lựa chọn đặc trưng là một kỹ thuật giúp loại bỏ các đặc trưng dư thừa - giảm
kích thước, làm tăng độ chính xác khi phân lớp, vì các bộ phân lớp thường giảm
hiệu xuất khi có nhiều dữ liệu gây nhiễu. Trong luận văn này sử dụng kỹ thuật
lựa chọn đặc trưng trên bộ dữ liệu hình ảnh một số giống lúa ở Việt Nam với các
đề xuất như sau:
• Rút trích dựa trên ba loại mô tả đặc trưng là LBP, GIST, HOG;
• Ghép các mô tả đặc trưng này lại, được bảy tập mô tả đặc trưng;
• Sử dụng sáu phương pháp lựa chọn đặc trưng thông dụng là mRMR, ReliefF,
Ilfs, CFS, Fisher score, Lasso để thực nghiệm trên bảy tập mô tả đặc trưng;

• Phân loại bảy tập mô tả đặc trưng trước và sau khi qua các bước lựa chọn
đặc trưng trên, với hai bộ phân lớp là 1-NN và SVM;
• Một phương pháp cải tiến nhằm làm tăng độ chính xác, trước tiên là lựa
chọn các phương pháp lựa chọn đặc trưng có hiệu xuất cao nhất ở trên, tiến
hành ghép các đặc trưng hữu ích được trả về từ các phương pháp lựa chọn

đặc trưng này, chọn một phương pháp lựa chọn đặc trưng để tiến hành “lựa
chọn và sắp xếp lại” các đặc trưng lần cuối, cuối cùng là phân lớp tập đặc
trưng mới vừa được sắp xếp. Cách thực hiện này hoàn toàn mới so với các
kỹ thuật ghép lựa chọn đặc trưng trước đây.
Với kết quả thực nghiệm cho thấy, các phương ghép mô tả đặc trưng cho hiệu
năng cao hơn so với các mô tả đặc trưng ban đầu; một số phương pháp lựa chọn
đặc trưng cho hiệu quả tốt hơn so với dự kiến, tăng độ chính xác cao hơn vài
phần trăm trong khi vẫn giảm được kích thước của dữ liệu; phương pháp đề xuất
này làm việc tốt với bộ dữ liệu thực nghiệm, giúp tăng được độ chính xác lên,
tuy nhiên sẽ có một số khó khăn trong quá trình thực hiện phương pháp này, đã
được chỉ ra trong luận văn.
iii


Nhìn tổng quát là các phương pháp đề xuất đều hoạt động hiệu quả với dữ
liệu thực nghiệm. Đề xuất đã mở ra được một hướng nghiên cứu mới với dữ liệu
các giống lúa ở Việt Nam, các phương pháp này có thể áp dụng được cho các
dữ liệu khác với dữ liệu thực nghiệm ở đây. Đặc biệt là đóng góp thêm một kỹ
thuật ghép các phương pháp lựa chọn đặc trưng cho tích hợp lựa chọn đặc trưng
(ensemble feature selection).

iv


ABSTRACT
Featured selection is a method that allows eliminating irrelevant features and
decreasing the dimension of feature space due to the performance of classification
is sensible with high dimensional feature vector. In this thesis, we applied feature
selection techniques for rice seed images classification on the images database of
common rice variety in Vietnam. There are several propositions such as:

- Extracting on three local image descriptors including LBP, GIST and HOG;
- Fusing all features to create seven features sets;
- Using six common feature selection methods such as mRMR, ReliefF, Ilfs,
CFS, Fisher score, Lasso for experimental evaluation on seven features set;
- Using 1-N and SVM classifier for classifying;
- A new selection method is proposed to combine multiple selection method
to create a compact representation of rice seed images. This method is used to
find the most useful features of each feature selection method and then they are
combined and re-ranked in the last time before feeding into the classifier. However,
this approach raises several limitations which are presented in this thesis.
In general, the results show that the efficiency of the proposed method in term
of accuracy. This method opens a new research direction for rice variety in Vietnam so that we can verity on other data in this thesis. Additionally, we contribute
a new ensemble approach that combine multiple feature selection methods.

v


MỤC LỤC

Lời cam đoan

i

Lời cảm ơn

ii

Tóm tắt

iii


Abstract

v

Mục lục

vi

Danh mục hình và đồ thị

vii

Danh mục bảng

viii

Danh mục ký hiệu

ix

Danh mục viết tắt

x

1 Tổng quan về xử lý ảnh và nhận dạng hạt
1.1 Giới thiệu . . . . . . . . . . . . . . . . . .
1.2 Mục tiêu của luận văn . . . . . . . . . . .
1.3 Đóng góp của luận văn . . . . . . . . . . .
1.3.1 Tính khoa học . . . . . . . . . . . .


1.4
1.5

1.3.2 Tính thực tế . .
1.3.3 Kinh tế xã hội .
Cấu trúc của luận văn
Phương pháp . . . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.

.
.
.

vi

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.


.
.
.
.

giống
. . . .
. . . .
. . . .
. . . .

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.

.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

1
1
3

5
5

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.

.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

5
6
6
6

.
.

.
.

.
.
.
.

.
.
.
.


2

Cơ sở lý thuyết
2.1 Không gian màu . . . . . . .
2.1.1 Không gian màu RGB
2.1.2 Độ sâu màu . . . . . .
2.2 Đặc trưng (feature) . . . . . .
2.2.1 Đặc trưng cơ bản . . .
2.2.2 Đặc trưng SIFT . . . .
2.2.3 Đặc trưng LBP . . . .
2.2.4 Đặc trưng GIST . . . .
2.2.5 Đặc trưng HOG . . . .
2.3 Bộ phân lớp (classifier) . . . .
2.3.1 Random Forest . . . .

2.4


2.5
3

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.

.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.

.
.
.

.
.
.
.
.
.
.
.
.
.
.

8
8
9
10
13
13
16
17
18
19
21
22

2.3.2 K-nearest neighbor . . . . . . . . . . . . . . . . .

2.3.3 Support vector machine . . . . . . . . . . . . . .
Lựa chọn đặc trưng . . . . . . . . . . . . . . . . . . . . .
2.4.1 Least Absolute Shrinkage and Selection Operator
2.4.2 Maximum Relevance and Minimum Redundancy
2.4.3 ReliefF . . . . . . . . . . . . . . . . . . . . . . . .
2.4.4 Correlation Feature Selection . . . . . . . . . . .
2.4.5 Fisher score: . . . . . . . . . . . . . . . . . . . .
2.4.6 Infinite Latent Feature Selection . . . . . . . . .
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . .

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.

.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.

.
.
.
.

23
24
25
29
30
31
32
32
33
33

.
.
.
.
.
.
.

35
35
36
36
37
38

39
40

Chia dữ liệu và phân lớp . . . . . . . . . . . . . . . . . . . . . . .
3.4.1 Chia dữ liệu . . . . . . . . . . . . . . . . . . . . . . . . . .
3.4.2 Phân lớp . . . . . . . . . . . . . . . . . . . . . . . . . . . .

41
41
42

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.

.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

.
.
.
.
.
.
.
.
.
.
.

Phương pháp đề xuất

3.1 Tiền xử lý . . . . . . . . . . . . . . . . . . . . . . . . . .
3.1.1 Chuẩn hóa kích thước . . . . . . . . . . . . . . .
3.1.2 Loại bỏ ảnh nền và phần bị nhiễu bên ngoài ảnh .
3.2 Chuẩn hóa dữ liệu . . . . . . . . . . . . . . . . . . . . .
3.3 Ghép các mô tả đặc trưng . . . . . . . . . . . . . . . . .
3.3.1 Rút trích mô tả đặc trưng LBP, GIST, HOG . . .
3.3.2 Ghép các mô tả đặc trưng . . . . . . . . . . . . .
3.4

vii

.
.
.
.
.
.
.

.
.
.
.
.
.
.

.
.
.

.
.
.
.

.
.
.
.
.
.
.


3.5
3.6
3.7
4

Cách dùng các phương pháp lựa chọn đặc trưng với bộ phân lớp
và đọc kết quả . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Một đề xuất tăng độ chính xác với dữ liệu đang xét . . . . . . . .
Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Kết quả thực nghiệm
4.1 Dữ liệu thực nghiệm . . . . . . . . . . . . . . . . . . . . . . . .
4.2 So sánh, phân tích, đánh giá kết quả . . . . . . . . . . . . . . .
4.2.1 Độ chính xác của các mô tả đặc trưng đơn và ghép . . .
4.2.2 Thực nghiệm với các phương pháp lựa chọn đặc trưng .
4.2.3 Kết quả thực nghiệm phương pháp đề xuất nâng cao Acc

4.3 Kết luận . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

5 Hướng phát triển và kết luận
5.1 Đóng góp, hạn chế của luận văn
5.1.1 Đóng góp . . . . . . . .
5.1.2 Hạn chế . . . . . . . . .
5.2 Hướng phát triển và kết luận .
Phụ lục

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.

.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.

.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.
.
.
.

.

.
.
.

.
.
.
.

42
44
46

.
.
.
.
.
.

48
48
50
50
53
67
69

.
.

.
.

70
70
70
71
72
78

viii


DANH MỤC HÌNH VÀ ĐỒ THỊ

1.1
1.2
1.3

Kỹ thuật viên và người có kinh nghiệm. . . . . . . . . . . . . . . .
Lúa và gạo ST25 (Sóc Trăng 25) của Việt Nam . . . . . . . . . .
Số lượng tối ưu của các đặc trưng [1] . . . . . . . . . . . . . . . .

2
2
4

2.1
2.2


Phối trộn màu trong RGB . . . . . . . . . . . . . . . . . . . . . .
Mô phỏng màu điểm ảnh trong hệ tọa độ 3D của không gian màu
RGB . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Một phần Gradients của ảnh (ảnh trái), biểu đồ định hướng (ảnh phải)
SVM trong không gian 2 chiều . . . . . . . . . . . . . . . . . . . .
Các bước của lựa chọn đặc trưng [2] . . . . . . . . . . . . . . . . .

9
10
20
25
26

3.2
3.3

Hình ảnh mô tả trước và sau khi smoothdata, hình
từ trang chủ của Matlab . . . . . . . . . . . . . . .
Mô hình huấn luyện và dự đoán kết quả với FS. . .
Mô hình tăng Acc . . . . . . . . . . . . . . . . . . .

ảnh được lấy
. . . . . . . .
. . . . . . . .
. . . . . . . .

38
43
45


4.1
4.2
4.3
4.4
4.5

6 giống lúa, bộ ảnh nghiên cứu. . . . . . . . . . .
20 giống lúa, bộ ảnh thử nghiệm lại kết quả. . . .
Phân lớp 1-NN và SVM trên tập đặc trưng LBP .
Phân lớp 1-NN và SVM trên tập đặc trưng GIST
Phân lớp 1-NN và SVM trên tập đặc trưng HOG

.
.
.
.
.

.
.
.
.
.

50
51
54
58
58


4.6
4.7
4.8
4.9

Phân
Phân
Phân
Phân

LBP + GIST . . . . .
LBP + HOG . . . . .
GIST + HOG . . . .
LBP + GIST + HOG

61
61
64
64

2.3
2.4
2.5
3.1

lớp
lớp
lớp
lớp


1-NN
1-NN
1-NN
1-NN






SVM
SVM
SVM
SVM

trên
trên
trên
trên

tập
tập
tập
tập

ix

đặc
đặc
đặc

đặc

trưng
trưng
trưng
trưng

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.

.
.
.
.
.


.
.
.
.
.

.
.
.
.
.

.
.
.
.
.


DANH MỤC BẢNG

3.1

Các tập dữ liệu (mô tả đặc trưng) và số chiều. . . . . . . . . . . .

40

4.1
4.2

4.3

Thống kê số lượng từng giống, trong bộ ảnh 6 giống . . . . . . . .
Thống kê số lượng từng giống, trong bộ ảnh 6 giống . . . . . . . .
Kết quả phân loại với 1-NN, SVM mà không qua các phương pháp
lựa chọn đặc trưng. . . . . . . . . . . . . . . . . . . . . . . . . . .
Hiệu quả của các phương pháp FS trên tập LBP với phân lớp 1-NN
và SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Hiệu quả của các phương pháp FS trên tập GIST với phân lớp
1-NN và SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

49
49

4.4
4.5

52
56
57

4.6

Hiệu quả của các phương pháp FS trên tập HOG với phân lớp
1-NN và SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.7 Hiệu quả của các phương pháp FS trên tập LBP + GIST với phân
lớp 1-NN và SVM . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.8 Hiệu quả của các phương pháp FS trên tập LBP + HOG với phân
lớp 1-NN và SVM . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.9 Hiệu quả của các phương pháp FS trên tập GIST + HOG với phân

lớp 1-NN và SVM . . . . . . . . . . . . . . . . . . . . . . . . . . .
4.10 Hiệu quả của các phương pháp FS trên tập LBP + GIST + HOG
với phân lớp 1-NN và SVM . . . . . . . . . . . . . . . . . . . . .
4.11 Lựa chọn đặc trưng trên tập 20 giống lúa: LBP, HOG, GIST, LBP
+ GIST , LBP + GIST + HOG với phân lớp SVM . . . . . . . .

66

4.12 So sánh Acc trước với sau khi lựa chọn đặc trưng và ghép các lựa
chọn đặc trưng . . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

x

59
60
62
63
65


DANH MỤC KÝ HIỆU

ACC
Dim
Dim full
id
id%


:
:
:
:
:

Độ chính xác.
Số đặc trưng hay số chiều.
Tất cả đặc trưng hay tất cả chiều.
Số chiều của dữ liệu tính theo đơn vị %.
Số chiều cần có để đạt được Max ACC.

Imgk
Max ACC
Ranker
xi,j ; yi,j ; zi,j
id%

:
:
:
:
:

Ảnh thứ k.
Độ chính xác tối đa.
Phương pháp lựa chọn đặc trưng được áp dụng ở lần ghép cuối.
x,y,z là giá trị của đặc trưng thứ j trong ảnh i.
Số chiều ít nhất để đạt được độ chính xác lớn hơn hoặc bằng ACC.


xi


DANH MỤC VIẾT TẮT

bpp

: Bits per pixel

CNN : Convolution neuron network
FS
: Feature selection
HOG : Histograms of Oriented Gradients
k-NN : k-Nearest Neighbor
LBP
ML

: Local Binary Pattern
: Machine Learning

NB
RF

: Naive Bayesian
: Random Forest

RFE
RGB

: Recursive feature elimination

: Hệ màu RGB (Red, Green, Blue)

SIFT : Scale-Invariant Feature Transform
SVM : Support Vector Machines

xii


Chương

1

TỔNG QUAN VỀ XỬ LÝ ẢNH VÀ
NHẬN DẠNG HẠT GIỐNG
1.1

Giới thiệu

Lúa là một trong những cây lương thực quan trọng trong sáu loại cây
lương thực trên thế giới (lục cốc). Sản phẩm chế biến từ lúa, bao gồm sản
phẩm trực tiếp từ gạo và các sản phẩm gián tiếp là không thể thiếu trong
bữa ăn hàng ngày của hàng tỷ người trên thế giới. Nhiều khu vực trên thế
giới sử dụng lúa hiện nay như Châu Á, Châu Phi, Mĩ La Tinh và cả Trung
Đông. Cây lúa có tầm quan trọng đặc biệt nhiều sản phẩm từ lúa cũng được
tạo ra ngày càng nhiều hơn.
Các giống lúa khác nhau có thể bị trộn lẫn trong quá trình sản xuất
và kinh doanh. Các tạp chất có thể làm hỏng niềm tin giữa các nhà nhập
khẩu và xuất khẩu lúa gạo, hoặc sẽ làm giảm năng suất và chất lượng
gạo nếu giống lúa không được thuần chủng qua các đời, lai tạp về giống.
Hiện nay, việc phân biệt giống lúa (loại lúa) được thực hiện hoàn toàn thủ

công bởi những người có kinh nghiệm (hình 1.1a)1 hoặc các kỹ thuật viên
(hình 1.1b)2 . Đây không phải là một công việc dễ dàng đối với một người
thường và sẽ tốn nhiều thời gian. Trên thực tế, kết quả của việc nhận dạng
sẽ bị phụ thuộc hoàn toàn vào sự tập trung và sức khỏe (độ mỏi của mắt)
của kỹ thuật viên.
1
2




1


(a) Phân loại các giống lúa quý

(b) Quan sát dòng phân ly mới
của giống LD2012

Hình 1.1: Kỹ thuật viên và người có kinh nghiệm.
Trong điều kiện diện tích đất nông nghiệp ngày càng thu hẹp và sự phát
triển mạnh mẽ của khoa học kỹ thuật, thì việc ứng dụng công nghệ cao
trong nông nghiệp nói chung và trồng lúa nói riêng là điều thiết yếu. Một
trong những khâu đầu tiên để tăng sản lượng lúa là việc lựa chọn các giống
lúa chất lượng cao phù hợp với thổ nhưỡng của từng địa phương.

(a) Lúa ST25

(b) Gạo ST25


Hình 1.2: Lúa và gạo ST25 (Sóc Trăng 25) của Việt Nam
Gần đây gạo ST25 (ảnh 1.2b) của Việt Nam được công nhận là ngon
nhất thế giới, chính tác giả cho hay3 , hiện tượng bán giả tràn lan ở nhiều
nơi tại Việt Nam và ở Mỹ. Người dùng không thể phân biệt được mình mua
đúng hay không. Muốn phân biệt được thì cần phải có những kỹ thuật viên
3



2


và chuyên gia có kinh nghiệm, tuy nhiên đâu phải lúc nào cũng cần là có
chuyên gia hay kỹ thuật viên liền, chưa kể về yếu tố sức khỏe cũng có thể
làm ảnh hưởng tới kết quả.
Từ những phân tích trên đã cho ta thấy sự cần thiết phải phát triển một
hệ thống để nhận dạng giống lúa một cách tự động dựa trên các kỹ thuật
tiên tiến trong thị giác máy tính và học máy. Hệ thống này sẽ cho phép
giảm được chi phí lao động và tăng độ chính xác cho việc nhận dạng hạt
giống lúa. Một người bình thường cũng có thể sử dụng bằng việc đưa hạt
giống cần phân loại vào hệ thống là đưa ra kết quả nhận dạng.
Tính tới thời điểm này, có rất nhiều nghiên cứu trong lĩnh vực máy học
đã đạt kết quả rất tốt như nhận dạng khuôn mặt[3], nhận dạng móng mắt,
nhận dạng vân tay [4] [5]. Trong đó nhận dạng móng mắt và vân tay gần
như đã đạt tới kết quả bão hòa và có thể ứng dụng vào thực tiễn với độ
chính xác gần như tuyệt đối. Tuy nhiên trong các lĩnh vực khác, trong đó
có nhận dạng giống lúa thì trên thế giới có ít công trình nghiên cứu và độ
chính xác cũng chưa được tuyệt đối. Dưới đây là một số công trình có liên
quan tới các kỹ thuật học máy và nhận dạng giống lúa trong nước và trên
thế giới gần đây, cũng như có liên quan đến trong đề tài nghiên cứu.


1.2

Mục tiêu của luận văn

Hiện nay các mô hình nhận dạng giống lúa bằng các thuật toán thị giác
máy tính và học máy như: Dùng đặc trưng cơ bản (hình thái, màu sắc,
cấu trúc vân), GIST, SIFT, HOG,... kết hợp với các phương pháp phân
lớp KNN, SVM, RF,... Trong đó RF với kỹ thuật trích xuất đặc trưng đơn
giản đã được sử dụng với độ chính xác cao (90,54% )[6]; giống lúa được xác
định từ dữ liệu quang phổ thu được bằng cách sử dụng Deep CNN cụ thể
là sự phối hợp giữa hình ảnh siêu âm và học sâu spatio-Spectral cho tỉ lệ
86,3% trên tập dữ liệu 4 giống lúa của Thái (Thai Rice Department of the
Ministry of Agriculture and Cooperatives: Khao Dawk Mali 105, Pathum
Thani 1, Chai Nat 1, and Phitsanulok 2) [7].
Khi trích xuất đặc trưng (feature extraction) lấy nhiều thuộc tính quá
3


cũng không tốt [1]. Ta hay nghĩ rằng nhiều thuộc tính sẽ tăng độ chính xác
và do mong muốn đó ta lựa chọn nhiều thuộc tính hơn, nó có thể hữu ích.
Nhưng đó không phải lúc nào cũng là cách tốt, thêm đặc trưng cũng đồng
nghĩa không gian bộ nhớ tăng lên. Hình 1.3 cho ta thấy là số lượng các
đặc trưng tăng lên, hiệu suất của phân loại cũng tăng cho đến khi đạt đến
ngưỡng tối ưu, sau đó bổ sung thêm các đặc trưng sẽ làm giảm độ chính xác
của phân loại. Khi số lượng mẫu huấn luyện tăng theo cấp số nhân, đó thực
sự là một vấn đề, là một thách thức đối với các nhà nghiên cứu trong lĩnh
vực học máy và khai thác dữ liệu. Nếu áp dụng phương pháp trích, chọn
đặc trưng (feature selection) tốt sẽ giảm được rất nhiều thời gian, công sức,


Độchínhxác

tài nguyên, thậm chí có thể nâng cao độ chính xác hơn.

0

Sốchiều(sốđặctrưng)

Hình 1.3: Số lượng tối ưu của các đặc trưng [1]

Mục tiêu của đề tài là nghiên cứu và áp dụng kết hợp một số phương
pháp trong thị giác máy tính và học máy, thêm kỹ thuật trích, chọn đặc
trưng (lựa chọn đặc trưng) để phân loại một số giống lúa ở Việt Nam nhằm
cải thiện và nâng cao độ chính xác hơn các phương pháp trước đây hoặc
ít nhất là giảm dung lượng lưu trữ đồng nghĩa với việc thời gian tính toán
(xử lý) nhanh hơn.

4


1.3

Đóng góp của luận văn

Trong quá trình nghiên cứu thực hiện đề tài, tôi phát hiện ra một số
phương pháp tốt khi áp dụng đối với bộ ảnh các giống lúa tại Việt Nam.
Nó có thể sẽ được tiếp tục áp dụng tại các nghiên cứu trong thời gian tới
của cá nhân tôi, hoặc bất kỳ ai thấy hữu dụng.

1.3.1


Tính khoa học

Phương pháp tiền xử ảnh các giống lúa, kỹ thuật chọn kích thước ảnh
trước khi rút trích đặc trưng vì một số giải thuật buộc phải đầu vào là các
ảnh có cùng kích thước; Chỉ ra phương pháp mới kết hợp các đặc trưng
HOG, LBP, GIST cũng làm tăng độ chính xác khi phân lớp với k-NN và
SVM;
Sử dụng, so sánh 06 phương pháp lựa chọn đặc trưng khác nhau trong
học có giám sát; chỉ ra kỹ thuật lựa chọn đặc trưng phù hợp để có độ chính
xác cao hơn khi chưa áp dụng kỹ thuật lựa chọn đặc trưng, mà vẫn giảm
được số đặc trưng gốc hay còn gọi là giảm số chiều và giảm dung lượng lưu
trữ trong giới hạn nào đó. Hoặc chọn một kỹ thuật lựa chọn một đặc trưng
phù hợp với hệ thống máy yếu hơn, có thể giảm được dung lượng lưu trữ tăng tốc xử lý mà vẫn giữ được độ chính xác bằng thậm chí cao hơn trước
khi lựa chọn đặc trưng được áp dụng;
Một phương pháp mới là ghép các phương pháp lựa chọn đặc trưng,
không sử dụng thêm mô tả đặc trưng nào khác, không cần phải tiền xử lý
ảnh lại mà vẫn làm tăng độ chính xác hơn trước khi ghép các phương pháp
lựa chọn đặc trưng. Đóng góp một phương pháp mới trong kỹ thuật tích
hợp lựa chọn đặc trưng (ensemble feature selection).

1.3.2

Tính thực tế

Hiện nay tại Việt Nam việc nhận dạng lúa giống hầu như chỉ thực hiện
bằng mắt thường bởi các chuyên gia tại các Trung tâm lúa giống, hoặc bởi
người có nhiều kinh nghiệm, để phục vụ cho công việc. Nhưng nếu lúa đó
5



đã bị lai tạo, hoặc do tác động bởi một lý do nào đó, thì việc kiểm tra là rất
khó khăn bằng mắt thường, mất nhiều thời gian và độ chính xác không cao.
Do đó nghiên cứu này sẽ đóng góp một phần cho việc phân loại hạt giống
một cách nhanh chóng và thuận lợi bởi bất kỳ ai, không cần có chuyên môn
và kinh nghiệm.

1.3.3

Kinh tế xã hội

Giảm chi phí nhân công lao động; tăng chất lượng giống trước khi xuống
vụ mới - tăng năng xuất; tăng chất lượng gạo thành phẩm - không lẫn lộn
giống khác, hay tạp chất; tăng giá trị lúa/gạo Việt Nam.

1.4

Cấu trúc của luận văn

Luận văn gồm có 5 chương, cùng tài liệu tham khảo và phụ lục:
Chương 1: Tổng quan về xử lý ảnh và nhận dạng hạt giống
Chương 2: Cơ sở lý thuyết
Chương 3: Phương pháp đề xuất
Chương 4: Kết quả thực nghiệm
Chương 5: Hướng phát triển và kết luận
Tài liệu tham khảo
Phụ lục

1.5


Phương pháp

Phương pháp nghiên cứu:
• Tìm hiểu lý thuyết hệ màu RGB, phương pháp tiền xử lý ảnh, các
phương pháp rút trích đặc trưng, các phương pháp lựa đặc trưng;

• Nghiên cứu về phương pháp chuẩn hóa dữ liệu;
• Tìm hiểu và phân tích đặc điểm của 02 bộ dữ liệu ảnh giống lúa; tiền
xử lý ảnh; chuẩn hóa kích thước ảnh;
6


• Sử dụng LBP, GIST, HOG trên tập dữ liệu để rút trích ra các đặc
trưng;
• Đề xuất kết hợp các đặc trưng của LBP, GIST, HOG để tạo ra các tập
đặc trưng mới;
• Đề xuất cách chia tập dữ liệu để huấn luyện và tập dữ liệu để kiểm tra;
• Phân lớp các tập đặc trưng LBP, GIST, HOG và các tập đặc trưng mới
với k-NN và SVM để tính ra kết quả độ chính xác;

• Đề xuất một kỹ thuật tăng độ chính xác;
• Áp dụng các thuật toán lựa chọn đặc trưng trên các tập đặc trưng trên

và tiếp tục phân lớp với k-NN và SVM để so sánh với kết quả ở bước
chưa qua lựa chọn đặc trưng;

• Lập trình và thực nghiệm trên bộ 06 giống lúa, so sánh kết quả với công
trình nghiên cứu trước. Rút ra kết luận trên tập 06 giống lúa;
• Áp dụng thử nghiệm kết quả rút ra từ 06 giống lúa với tập 20 giống
lúa và kết luận.


7


Chương

2
CƠ SỞ LÝ THUYẾT

Trong chương này sẽ đề cập một số cơ sở lý thuyết cơ bản về không gian
màu (2.1), cụ thể hơn là không gian màu RGB (2.1.1); Các mô tả đặc trưng
(2.2), đặc trưng cơ bản, đặc trưng LBP, GIST, HOG, SHIFT; Bộ phân lớp
(2.3) RF, k-NN, SVM; (2.4) trình bày về các phương pháp lựa chọn đặc
trưng có tham khảo.
Trước tiên là khái niệm không gian màu, không gian màu RGB được tổ
chức như thế nào sẽ được trình bày trong phần tiếp theo.

2.1

Không gian màu

Nhận biết màu sắc rất quan trọng trong đời sống của con người. Năm
1802, Thomas Young mặc nhiên công nhận sự tồn tại của ba loại tế bào
cảm quang (nay được gọi là tế bào hình nón) trong mắt người hay nói cách
khác là Võng mạc của con người có ba loại tế bào tiếp nhận ánh sáng, mỗi
tế bào nhạy cảm với một phạm vi cụ thể của ánh sáng nhìn thấy được.
Hermann von Helmholtz đã phát triển lý thuyết Young-Helmholtz vào năm
1850: đó là ba loại tế bào cảm quang hình nón có thể được phân loại như
màu đỏ - Red, xanh lá cây - Green và xanh dương - Blue, nó phản ứng với
họ các bước sóng của võng mạc. Các tín hiệu phát hiện bởi ba loại tế bào

hình nón được xử lý bởi não như một màu nhìn thấy được. Dựa vào cách
tiếp nhận ánh sáng của võng mạc, nhiều thiết bị đã mô phỏng lại ảnh màu
dựa trên ba màu đó là Red, Green, Blue tạo thành không gian màu RGB
8


đây cũng là không gian màu cơ bản [2].
Nói một cách ngắn gọn, một không gian màu là một cách tổ chức màu
sắc. Nó cho phép ta tái hiện màu sắc thực tế trên thiết bị một cách khoa
học, trong đó mỗi màu sẽ được xác định bằng giá trị số. Giá trị số này được
tạo ra từ tổ hợp các giá trị khác tùy định nghĩa riêng của nó. Người ta cũng
xây dựng công thức để chuyển đổi qua lại giữa các không gian màu [2].
Có nhiều không gian màu, tùy theo cách phân loại theo mô hình (kiểu)
mà ta có thể gom thành 04 nhóm (The primary color spaces; The luminancechrominance; The independent axis colorspaces; The perceptual color spaces) [8].
Do không sử dụng các không gian màu khác ngoài RGB, nên không đề cập
chi tiết tới các không gian màu còn lại.

2.1.1

Không gian màu RGB

Không gian màu RGB thường được sử dụng để hiển thị màu trên các
màn hình Ti vi, màn hình máy tính và những thiết bị điện tử khác (chẳng
hạn như camera kỹ thuật số) và được tổ chức như sau: Một điểm màu trong
không gian này được đặc trưng bởi ba thành phần của các điểm ảnh đó là
màu đỏ (R), các màu xanh lá cây (G) và màu xanh dương (B) - nó được
trộn một lượng thích hợp ba giá trị màu này lại (hình 2.1). Có thể hình
dung một điểm ảnh chính là điểm trong không gian ba chiều, điểm ảnh có
tọa độ (x, y, z) (hình 2.2) thì giá trị màu của điểm ảnh này là (R,G,B) (có
thể thứ tự sẽ khác, tùy theo cách dùng).


Hình 2.1: Phối trộn màu trong RGB

9


Ví dụ với một số màu cơ bản 24 bits:
(0, 0, 0) là màu đen
(255, 255, 255) là màu trắng
(255, 0, 0) là màu đỏ
(0, 255, 0) là màu xanh lục
(0, 0, 255) là màu xanh lam
(255, 255, 0) là màu vàng
(0, 255, 255) là màu xanh ngọc
(255, 0, 255) là màu hồng cánh sen
Y

Green

Yellow

(0,1,0)

(1,1,0)

Cyan

White

(0,1,1)


(1,1,1)

Black

Red

(0,0,0)

(1,0,0)

Blue

X

Magenta

(0,0,1)

(1,0,1)

Z

Hình 2.2: Mô phỏng màu điểm ảnh trong hệ tọa độ 3D của không gian
màu RGB

Ta đã biết giá trị số là vô hạn vậy các giá trị màu của từng kênh R, G, B
có giới hạn không hay cũng vô hạn, câu trả lời là tùy thuộc và độ sâu màu
của ảnh mà ta sử dụng.


2.1.2

Độ sâu màu

Độ sâu màu (color depth) hay còn gọi là độ sâu bit (0 và 1) nó đo số
lượng màu sắc có thể thể hiện mà một bức ảnh có thể dùng để hiển thị.
10


Bức ảnh có độ sâu màu lớn thì có thể biểu thị được dải màu rộng hơn, có
nghĩa là cho màu sắc phong phú hơn, thực hơn.
Khi độ sâu màu tăng lên, việc nhận dạng ảnh trong học máy cũng sẽ
chính xác hơn, đồng nghĩa với việc bộ nhớ tăng lên, thời gian xử lý cũng
lâu hơn. Nên việc chọn một ảnh có độ sâu màu như thế nào, kích thước ảnh
là bao nhiêu nó sẽ ảnh hưởng rất lớn trong quá trình học máy (sẽ nhắc lại
vấn đề này ở phía sau).
Ví dụ một ảnh RGB (3 kênh R, G và B) có độ sâu màu 8 bits nghĩa là 8
bits/kênh thì 8 × 3 = 24 bits màu/pixel (điểm ảnh). Như vậy mỗi pixel có
thể hiển thị được màu sắc ở 1 dải khoảng 16,7 triệu màu.
Biểu diễn dạng số 24 bits: 2563 = (28 )3 = 16.777.216
Một số dạng khác:
• 16 bits, trong đó hoặc là có 5 bit cho mỗi màu, gọi là kiểu 555 hay thêm

một bit còn lại cho màu xanh lá cây (vì mắt có thể cảm nhận màu này tốt
hơn so với các màu khác), gọi là kiểu 565.

• 32 bits, là sự đồng nhất với kiểu 24 bpp, thực sự cũng chỉ có 8 bit cho
mỗi màu thành phần, bit dư đơn giản là không sử dụng (ngoại trừ khả năng
sử dụng như là kênh alpha). Lý do của việc mở rộng của kiểu 32 bpp cho
tốc độ xử lý cao hơn do phần lớn các phần cứng ngày nay có thể truy cập

các dữ liệu được sắp xếp trong các địa chỉ byte theo cấp số của 2.
• Ảnh xám (gray image) hay còn gọi là ảnh đơn sắc (monochromatic), là
một hệ thống màu có mô hình màu đơn giản nhất với 256 cấp độ xám biến
thiên từ màu đen đến màu trắng (chỉ có 2 màu đen và trắng). Mỗi giá trị
điểm ảnh trong ma trận điểm ảnh mang giá trị từ 0 đến 255.
Để chuyển đổi ảnh màu RGB 24 bits sang ảnh xám 8 bits ta tính cường
độ sáng (I) tại một điểm ảnh:
I =α×R+β×G+γ×B

(2.1)

Trong đó: α = 0, 299; β = 0, 587 ; γ = 0, 114 [9]
• Ảnh nhị phân là ảnh mà giá trị của các điểm ảnh chỉ được biểu diễn

bằng hai giá trị là 0 (đen) hoặc 255 (trắng) (tương ứng với 0 và 1). Vì giá
11


×