Tải bản đầy đủ (.doc) (66 trang)

Luận văn thạc sĩ NHẬN DẠNG lá NGÓN sử DỤNG MẠNG NƠRON LAN TRUYỀN NGƯỢC

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.77 MB, 66 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI

HOÀNG THỊ MAI

NHẬN DẠNG LÁ NGÓN SỬ DỤNG MẠNG NƠRON LAN
TRUYỀN NGƯỢC

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Chuyên nghành: Khoa học máy tính

Người hướng dẫn khoa học
PGS.TS ĐỖ NĂNG TOÀN

Hà nội/2015


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI

HOÀNG THỊ MAI

NHẬN DẠNG LÁ NGÓN SỬ DỤNG MẠNG NƠRON LAN
TRUYỀN NGƯỢC

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN
Chuyên nghành: Khoa học máy tính
Mã số chuyên ngành: 60.48.01.01

Người hướng dẫn khoa học
PGS.TS ĐỖ NĂNG TOÀN



Hà nội/2015


LỜI CẢM ƠN
Để hoàn thành chương trình cao học và viết luận văn này, em đã nhận
được sự hướng dẫn, giúp đỡ và góp ý nhiệt tình của quý Thầy, Cô Khoa Công
nghệ thông tin trường Đại học Sư phạm Hà Nội.
Trước hết, tôi xin chân thành cảm ơn đến quý Thầy, Cô Khoa Công
nghệ thông tin trường Đại học Sư phạm Hà Nội, đặc biệt là những Thầy Cô
đã tận tình dạy bảo em suốt thời gian học tập. Đồng thời, tôi xin chân thành
cảm ơn các Thầy, Cô trường Đại học Tây Bắc đã tạo điều kiện về cơ sở vật
chất để tôi có thể hoàn thành chương trình học tập tại trường.
Em xin gửi lời biết ơn sâu sắc và chân thành nhất đến PGS.TS. Đỗ
Năng Toàn đã dành rất nhiều thời gian và tâm huyết hướng dẫn nghiên cứu và
giúp tôi hoàn thành luận văn tốt nghiệp.
Cuối cùng, em xin gửi lời cảm ơn tới cơ quan, bạn bè đồng nghiệp, gia
đình và người thân đã cùng chia sẻ giúp đỡ, động viên, tạo mọi điều kiện
thuận lợi để tôi hoàn thành nhiệm vụ học tập và nghiên cứu.
Mặc dù có nhiều cố gắng hoàn thiện luận văn bằng tất cả sự nhiệt tình
và năng lực của mình, tuy nhiên không thể tránh khỏi những thiếu sót, rất
mong nhận được những đóng góp quý báu của quý Thầy Cô và các bạn.
Hà Nội, tháng 10 năm 2015
Học viên

Hoàng Thị Mai


LỜI CAM ĐOAN


Tôi xin cam đoan số liệu và kết quả nghiên cứu trong luận văn là trung
thực và không sao chép. Các thông tin trích dẫn trong luận văn này đã được
chỉ rõ nguồn gốc tham khảo.
Tác giả luận văn

Hoàng Thị Mai


MỤC LỤC

Nội dung

Trang
MỞ ĐẦU

Chương 1: KHÁI QUÁT VỀ NHẬN DẠNG MẪU
VÀ BÀI TOÁN NHẬN DẠNG LÁ NGÓN

1
3

1.1. Khái quát về nhận dạng mẫu

3

1.1.1. Khái niệm nhận dạng mẫu

3

1.1.1.1. Mẫu là gì?


3

1.1.1.2. Nhận dạng mẫu là gì?

3

1.1.1.3. Lịch sử của lĩnh vực nhận dạng mẫu

4

1.1.1.4. Ứng dụng của nhận dạng mẫu

4

1.1.1.5. Các bài toán nhận dạng mẫu

5

1.1.2. Quy trình hoạt động của một hệ thống nhận dạng mẫu

5

1.1.2.1. Thu nhận tín hiệu

6

1.1.2.2. Phân đoạn (segmentation)

6


1.1.2.3. Trích chọn đặc trưng

6

1.1.2.4. Nhận dạng

7

1.1.2.5. Hậu xử lý

7

1.2. Bài toán nhận dạng lá ngón

7

1.2.1. Đặc điểm của lá ngón

7

1.2.2. Đặt bài toán

9

1.2.3. Các khó khăn trong giải quyết bài toán

10

Chương 2: NHẬN DẠNG LÁ NGÓN SỬ DỤNG MẠNG NƠRON

LAN TRUYỀN NGƯỢC
2.1. Trích chọn đặc trưng của lá ngón
2.2. Mạng nơron lan truyền ngược trong hệ thống nhận dạng lá
ngón

11
11
12


2.2.1. Lan truyền ngược độ nhậy cảm

12

2.2.1.1. Sử dụng thuật toán lan truyền ngược

15

2.2.1.2. Chon lựa cấu trúc mạng

16

2.2.1.3. Sự hội tụ

18

2.2.1.4. Sự tổng quát hóa (Generalization):

19


2.2.2. Một số biến thể của mạng nơron lan truyền ngược

20

2.2.2.1. Sử dụng tham số bước đà (Momentum)

20

2.2.2.2. Sử dụng hệ số học biến đổi

21

2.2.2.3. Sử dụng phương pháp Gradient kết hợp:

22

Chương 3: CHƯƠNG TRÌNH THỬ NGHIỆM

31

3.1. Giới thiệu bài toán

31

3.2. Thu thập, phân tích và xử lý dữ liệu

32

3.2.1. Thu thập dữ liệu


32

3.2.2. Tiền xử lý dữ liệu

34

3.2.3. Xử lý dữ liệu

35

3.2.4. Hậu xử lý

36

3.3. Thuật toán xử lý ảnh trích chọn đặc trưng của mẫu lá cây

36

3.4. Mạng nơron trong hệ thống nhận dạng lá cây

37

3.5. Một số kết quả thử nghiệm và đánh giá hệ thống nhận dạng lá cây

38

3.5.1. Thử nghiệm hệ thống nhận dạng lá cây

38


3.5.2. Đánh giá hệ thống

52

3.5.2.1. Độ chính xác

52

3.5.2.2. Ưu điểm và hạn chế

54

KẾT LUẬN

56


DANH MỤC HÌNH VẼ
Hình

Trang

Hình 1.1. các bước xử lý trong hệ thống nhận dạng mẫu

5

Hình 1.2. Cây lá ngón

9


Hình 2.1. Hoa cây lá ngón

12

Hình 3.1. Các loại cây dùng để nhận dạng

33

Hình 3.2. Một phần của tập ảnh huấn luyện

33

Hình 3.3. Một phần của tập ảnh thử nghiệm

34

Hình 3.4. Đặc trưng của lá cây

35

Hình 3.5. Mô hình rron trong bài toán nhận dạng mẫu

37

Hình 3.6. Giao diện hệ thống nhận dạng lá cây

39

Hình 3.7. Giao diện nhận dạng đặc trưng của ảnh cây


40

Hình 3.8. Giao diện chức năng huấn luyện mạng nơron

41

Hình 3.9. Giao diện chức năng nhận dạng ảnh lá cây

42

Hình 3.10. Kết quả nhận dạng khi tham số khoảng cách giữa
các điểm lớn
Hình 3.11. Kết quả nhận dạng khi tham số khoảng cách giữa
các điểm nhỏ

53
54

DANH MỤC BẢNG BIỂU
Bảng
Bảng 3.1. Số lượng ảnh trong tập huấn luyện và tập thử

Trang
43


nghiệm của mỗi loài
Bảng 3.2. Kết quả thử nghiệm nhận dạng lá cây

44



PHẦN MỞ ĐẦU
1. Lý do chọn đề tài
Cây lá ngón, tên khoa học Gelsemium elegans, thuộc họ Hoàng đằng
(Gelsemiaceae) là một loại cây leo, thân quấn, màu xanh dài tới 12 m, mọc
hoang phổ biến ở vùng rừng núi nước ta. Đây là một trong bốn cây có độc tố
cao nhất (thuốc độc bảng A). Người ta cho rằng chỉ cần ăn 3 lá là đủ gây chết
người với các triệu chứng ngộ độc: Khát nước, đau họng, chóng mặt, hoa mắt,
buồn nôn… sau đó bị mỏi cơ, thân nhiệt hạ, huyết áp hạ, răng cắn chặt, sùi
bọt mép, đau bụng dữ dội, tim đập yếu, khó thở, đồng tử giãn và chết rất
nhanh do ngừng hô hấp. Mức độ độc của cây giảm theo thứ tự: rễ, lá, hoa,
quả, thân cây. Các nhà khoa học đã tìm thấy 17 đơn phân ancaloit gây độc
được chiết ra từ lá ngón. Hàng năm ở nước ta xảy ra nhiều vụ ngộ độc cây Lá
ngón do sử dụng nhầm lẫn, đầu độc, tự sát. Qua đó chúng ta nhận thấy rằng
vẫn có không ít người dân nhầm lẫn lá ngón với các loại lá thuốc khác. Vì
mức độ nguy hiểm của loài cây này, là một học viên đang tham gia học công
nghệ thông tin, tôi rất muốn đóng góp kiến thức chuyên ngành của mình để có
thể giúp mọi người phân biệt được lá ngón. Trong khuôn khổ của một luận
văn thạc sĩ tôi chọn đề tài: “Nhận dạng lá Ngón sử dụng mạng nơron lan
truyền ngược” nhằm nghiên cứu về phương pháp nhận dạng mẫu trong xử lý
ảnh và xây dựng bài toán nhận dạng giúp
2. Mục đích, nhiệm vụ nghiên cứu
Mục đích của luận văn này là trình bày một phương pháp nhận dạng vật
mẫu dựa trên mạng nơron lan truyền ngược. Theo đó, tôi sẽ lần lượt trình bày
về cơ sở lý thuyết của việc nhận dạng mẫu trong xử lý ảnh, quy trình hoạt
động của một hệ thống nhận dạng mẫu.
Bởi thời gian hạn hẹp và nhiều hạn chế về kiến thức trong lĩnh vực hết
1



sức mới mẻ này, tôi mong luận văn này sẽ trình bày một sự hiểu biết tương
đối về xử lý ảnh nói chung và nhận dạng lá ngón nói riêng. Đồng thời, hy
vọng rằng trong một tương lai không xa sẽ có điều kiện ứng dụng những
nghiên cứu đã đạt được trong luận văn này vào thực tế.
3. Đối tượng nghiên cứu
Trong luận văn này, tôi tìm hiểu cơ bản về phần lý thuyết nhận dạng mẫu
trong xử lý ảnh và đi sâu vào việc nhận dạng lá Ngón sử dụng mạng nơron lan
truyền ngược.
4. Nội dung nghiên cứu
Giới thiệu về các phương pháp chung nhất trong nhận dạng mẫu bằng
mạng nơron lan truyền ngược.
Tìm hiểu tổng quan về lý thuyết xử lý ảnh.
Cài đặt bài toán về nhận dạng mẫu bằng mạng nơron lan truyền ngược.
5. Phạm vi nghiên cứu
Lý thuyết về xử lý ảnh–nhận dạng mẫu bằng mạng nơron lan truyền ngược.
Một số thuật toán.
6. Phương pháp nghiên cứu
Dự kiến luận văn sử dụng hai phương pháp nghiên cứu chính là:
Phương pháp đọc tài liệu, phân tích, tổng hợp.
Phương pháp thực nghiệm, kiểm tra, đánh giá.

2


Chương 1: KHÁI QUÁT VỀ NHẬN DẠNG MẪU
VÀ BÀI TOÁN NHẬN DẠNG LÁ NGÓN
1.1. Khái quát về nhận dạng mẫu
1.1.1. Khái niệm nhận dạng mẫu
1.1.1.1. Mẫu là gì?

Mẫu (pattern) có thể phân thành 2 loại: mẫu trừu tượng và mẫu cụ thể.
Các ý tưởng, lập luận và khái niệm… là những ví dụ về mẫu trừu tượng, nhận
dạng các mẫu như vậy thuộc về lĩnh vực nhận dạng khái niệm. Các mẫu cụ
thể bao gồm các đối tượng có tính không gian, thời gian và hình ảnh… Các
đối tượng vật lý, chữ ký, chữ viết, ký hiệu, ảnh, đoạn sóng âm thanh, điện não
đồ hoặc điện tâm đồ, hàm số… là những ví dụ về mẫu cụ thể.
1.1.1.2. Nhận dạng mẫu là gì?
Không có một định nghĩa thống nhất cho nhận dạng mẫu (Pattern
recognition) nhưng điều này không gây tranh cãi gì trong giới nghiên cứu.
Sau đây là một số định nghĩa theo ngữ cảnh nghiên cứu:
Duda Et Al: Nhận dạng mẫu là việc quy những đối tượng vật lí hay sự
kiện vào một loại (nhóm) nào đó đã xác định từ trước.
Jiirgen Schiirmann: Nhận dạng mẫu là việc gán nhãn w cho một quan
sát x.
Selim Aksoy: Nhận dạng mẫu là việc nghiên cứu cách làm cho một máy
có thể thực hiện:
+ Quan sát môi trường
+ Học cách phân biệt được các mẫu cần quan tâm
+ Đưa ra các quyết định đúng đắn về loại (nhóm) của các mẫu
3


1.1.1.3. Lịch sử của lĩnh vực nhận dạng mẫu
Nhận dạng mẫu đã có lịch sử khá lâu đời, trong thập kỷ 60 của thế kỷ
20 hầu hết vấn đề nhận dạng mẫu dừng lại ở việc nghiên cứu lí thuyết thống
kê. Về sau với sự phát triển mạnh mẽ của máy tính thì phần thực hiện cũng
trở nên đơn giản hơn. Khi mà xã hội chúng ta đang phát triển từ thời kỳ công
nghiệp sang hậu công nghiệp, đối với vấn đề tự động hóa thì việc thông tin
nhận được và xử lý một cách tự động là rất cần thiết. Khuynh hướng này làm
cho vấn đề nhận dạng mẫu trở nên rất quan trọng trong ứng dụng kỹ thuật và

trong nghiên cứu ngày nay. Nhận dạng mẫu tích hợp hầu hết vào các hệ thống
máy móc thông minh, có khả năng tự đưa ra quyết định để giải quyết vấn đề.
1.1.1.4. Ứng dụng của nhận dạng mẫu
Nhận dạng mẫu có rất nhiều ứng dụng trong đời sống cũng như trong
khoa học kỹ thuật:
Trong nông nghiệp: Nhận dạng mẫu được sử dụng để phân tích mùa
màng, dự báo các đại dịch như châu chấu, sâu bệnh, cúm gia cầm, cúm lợn…
Ngoài ra nhận dạng mẫu cũng còn được dùng để phân loại đất từ các ảnh
được chụp từ vệ tinh.
Khám phá tri thức trên Web: Ngày nay việc bùng nổ lượng thông tin
khổng lồ trên Internet làm cho việc tìm kiếm và lọc thông tin trên mạng là hết
sức quan trọng. Nhận dạng mẫu được nhúng vào các máy tìm kiếm để trả lại
kết quả tìm kiếm thông minh và chính xác. Ngoài ra nó cũng được sử dụng
trong các hệ thống lọc thư rác, nhận dạng tự động các trang web đen.
Trong lĩnh vực y học: Phân tích và biểu diễn gene, phân loại sinh học
dựa trên thông tin di truyền.
Trong lĩnh vực kinh tế: Phân tích đánh giá sự thay đổi kinh tế, chỉ số
chứng khoán,…
4


1.1.1.5. Các bài toán nhận dạng mẫu
Trên thực tế thường gặp các bài toán nhận dạng mẫu sau:
Phân lớp (classify): Dựa trên một tập con đã biết nhãn, đưa ra một cách
phân các đối tượng thuộc tập nền thành các lớp.
Phân cụm (cluster): Chia tập đối tượng thành nhóm sao cho các đối
tượng trong mỗi nhóm tương đối giống nhau còn các đối tượng khác nhóm thì
khác nhau.
Phân tích hồi quy (regression) hay nhận dạng hàm: Xác định một biến
(hàm) qua tập các biến khác.

Nhận thực (Identify): Xác định đối tượng trong tập đã cho có là đối
tượng đang quan tâm hay không. Chẳng hạn như nhận thực vân tay, nhận thực
mặt người…
Mô tả: Mô tả các đối tượng dưới hình thức dễ phân tích. Ví dụ đối
tượng mô ta điện tâm đồ dưới dạng biểu đồ đặc trưng hoặc xâu mã.
1.1.2. Quy trình hoạt động của một hệ thống nhận dạng mẫu
Mặc dù có rất nhiều loại bài toán nhận dạng mẫu, tuy nhiên để giải
quyết một bài toán thì một hệ thống nhận dạng mẫu phải thực hiện qua các
bước cơ bản dưới đây:

5


Hình 1.1. Các bước xử lý trong hệ thống nhận dạng mẫu
1.1.2.1. Thu nhận tín hiệu
Nếu là hệ nhận dạng đối tượng vật lý, ở đầu vào của hệ thống thường là
một loại thiết bị chuyển đổi như máy ghi hình hay ghi âm… Thiết bị này thu
nhận tín hiệu về đối tượng để nhận dạng. Các tín hiệu này thông thường sẽ
được số hóa, sau đó sẽ được tiến hành tiền xử lý như: lọc nhiễu, tách ngưỡng,

1.1.2.2. Phân đoạn (segmentation)
Phân đoạn là một trong những bài toán rất khó trong nhận dạng mẫu.
Chẳng hạn, trong bài toán nhận dạng văn bản in ra dữ liệu text thì giai đoạn
phân đoạn chính là việc xác định đâu là vùng dữ liệu text để nhận dạng, tiếp
đó ta phải tách được những vùng có thể là một từ, rồi lại tách tiếp ra từng ký
tự… Như vậy có thể nói việc phân đoạn trong bài toán nhận dạng mẫu là quá
trình xác định được đâu là vùng dữ liệu cần quan tâm.
1.1.2.3. Trích chọn đặc trưng
Ranh giới khái niệm giữa việc trích chọn đặc trưng và phân lớp ở mức
độ nào đó có phần không rõ ràng: một bộ trích chọn đặc trưng lý tưởng phải

làm cho công việc còn lại của bộ phân lớp trở nên dễ dàng. Mục tiêu chung
của bộ trích chọn đặc trưng là dựa trên tín hiệu thu được mô tả các đối tượng
bằng các giá trị của chúng mà chúng có giá trị gần xấp xỉ nhau đối với các đối
tượng thuộc cùng loại và khác xa nhau nếu khác loại. Hơn nữa để tiện xử lý
thì càng ít đặc trưng càng tốt. Điều này dẫn đến việc phải tìm ra các đặc trưng
khác nhau và chúng không phụ thuộc hoàn cảnh ta thu tín hiệu về đối tượng.
Đầu ra của công đoạn này được gọi là vector đặc trưng của đối tượng, thông
thường đây là một vector số thực.

6


1.1.2.4. Nhận dạng
Nhiệm vụ của thành phần này trong hệ thống là sử dụng các vector đặc
trưng được cung cấp từ bước trước (trích chọn đặc trưng) để gắn các đối
tượng vào các lớp hoặc phân tích hồi quy hay mô tả đối tượng. Các kỹ thuật
thường được sử dụng cho công đoạn nhận dạng đó là: thuật toán k-láng giềng
gần nhất, mạng neural, máy vector hỗ trợ SVM… Nói chung, ở bước này gần
như đã có công thức xử lý cố định thường không bị phụ thuộc vào bài nhận
dạng mẫu cụ thể nào.
1.1.2.5. Hậu xử lý
Một bộ nhận dạng hiếm khi chỉ để dùng đơn lẻ. Thay vào đó nó thường
dùng để đưa ra thao tác tương ứng, mỗi thao tác mất một chi phí tương ứng.
Hậu xử lý sẽ dùng đầu ra của bộ phân lớp để quyết định thao tác tương ứng.
Theo quan niệm, cách đơn giản nhất để đánh giá hoạt động của một bộ nhận
dạng là xem tỷ lệ nhận dạng sai với các mẫu mới. Do đó chúng ta cần phải
nhận dạng với tỷ lệ lỗi thấp nhất. Tuy nhiên chúng ta cần các thao tác tương
ứng phải làm cho tổng chi phí là thấp nhất. Có thể phải kết hợp các tri thức đã
biết về chi phí, và nó sẽ có ảnh hưởng đến việc ra các quyết định hành động.
Chúng ta cũng cần ước lượng trước chi phí để xem có thỏa mãn hay không.

1.2. Bài toán nhận dạng lá ngón
1.2.1. Đặc điểm của lá ngón
Lá ngón (còn gọi là cây co ngón, rút ruột, hoàng đằng, hồ mạn đắng,
đoạn trường thảo) khá phổ biến ở miền rừng núi nước ta, ngay cả ở vùng rừng
ngập mặn – nơi chỉ có một số loài thực vật đặc thù.

7


Hầu như tỉnh thành nào cũng có sự xuất hiện của cây lá ngón. Tại Lâm
Đồng, mặc dù điều kiện khí hậu, thổ nhưỡng, độ cao có sự khác biệt rất lớn
nhưng tất cả các huyện, thị đều có cây lá ngón: Từ thôn Cao Xinh (Gia Viễn,
Cát Tiên) ở độ cao 200m so với mặt nước biển đến thôn Đưng K’Si (Đạ
Chais, Lạc Dương) 1.500m hay đỉnh núi Lang Biang hơn 1.900m.
Là loài cây ưa sáng nên lá ngón thường mọc chỗ đất trống, bìa rừng,
ven đường như đèo Bảo Lộc (TX Bảo Lộc), xã Hòa Bắc (Di Linh), xã Ka Đô
(Đơn Dương), Núi Voi (Đức Trọng), xã Đạ Rsal (Đam Rông) …
Lá ngón không những rất giống mà còn mọc gần nhiều cây thuốc và
rau ăn nên dễ dẫn đến sự nhầm lẫn gây hậu quả chết người.
Đặc điểm quan trọng để phân biệt là lá ngón có hoa màu vàng, còn hầu
hết cây thuốc và rau ăn gần giống lá ngón như là thủ ô nam, bướm bạc cam
bốt, chè vằng, lài gân, lá bép, lá giang… đều ra hoa màu trắng.
Nguy hiểm hơn, các nhà khoa học phát hiện tại khu vực Suối Vàng
(Lạc Dương), cây thuốc bướm bạc mọc trong cùng một bụi với lá ngón.
Chỉ cần nhầm lẫn bứt vài lá ngón cho vào gói lá thuốc cũng đủ dẫn đến
chết người bởi lá ngón cực độc. Theo nhóm tác giả thuộc Khoa Sinh, Đại học
Đà Lạt, “9 phút sau khi uống 3 giọt dung dịch (10g lá ngón tươi/10ml nước
cất), chuột đã lăn ra chết”.
Với con người, chỉ cần ăn 3 lá ngón hoặc 1 lá ngón với một chút rượu
sẽ bị thiệt mạng. Không chỉ lá mà tất cả các bộ phận rễ, thân, hoa, quả và hạt

của lá ngón đều chứa các chất độc nguy hại.
Người bị ngộ độc lá ngón có các triệu chứng khát nước, đau họng,
chóng mặt, hoa mắt, buồn nôn… sau đó bị mỏi cơ, thân nhiệt hạ, huyết áp hạ,

8


răng cắn chặt, sùi bọt mép, đau bụng dữ dội, tim đập yếu, khó thở, đồng tử
giãn và chết rất nhanh do ngừng hô hấp.
Sở dĩ ngộ độc lá ngón gây tử vong rất nhanh vì độc tính nội tại của nó
quá mạnh. Bởi thế, khi có biểu hiện ngộ độc phải lập tức áp dụng kinh
nghiệm dân gian như giã thật nhiều cây rau má hoặc rau muống, vắt lấy nước
cốt uống để làm giảm độc tính của lá ngón, sau đó đưa đến bệnh viện cấp cứu.

Hình 1.2. Cây lá ngón
1.2.2. Đặt bài

toán

Để nhận

dạng lá ngón bằng

nơron

lan truyền ngược

trước hết ta

phải phân biệt được


đặc điểm thực

vật học và thành

phần hóa học

của cây lá ngón từ

mạng

đó sẽ áp dụng các phương pháp đúng đắn vào để giải quyết vấn đề được đặt
ra.
Trước hết ta xét mặt thực vật của cây lá ngón với những thành phần sau:
1. Đặc điểm thực vật, định tên khoa học mẫu nghiên cứu.
2. Xác định đặc điểm vi phẫu: rễ, thân, lá.
3. Xác định đặc điểm bộ rễ, bộ thân, bộ lá.
Sau đó ta xét về thành phần hóa học:
1. Định tính các nhóm chất hữu cơ trong rễ, thân, lá.
2. Định tính alcoloid bằng sắc ký lớp mỏng.
3. Định lượng alcoloid toàn phần trong rễ, thân, lá.

9


4. Chiết xuất và phân lập alcaloid chính.
5. Nhận dạng alcaloid phân lập được.
Có hai phương pháp nhận dạng phổ biến hiện nay là nhận dạng dựa
trên đặc trưng của các phần tử trên bề mặt lá ngón như biến đổi Gabor
Wavelet và mạng Neural, SVM,… và nhận dạng dựa trên xét tổng thể toàn bộ

cây lá ngón như phương pháp PCA, LDA, LFA. Trong đó, PCA là phương
pháp trích rút đặc trưng nhằm giảm số chiều của ảnh tuy đơn giản nhưng lại
mang lại hiệu quả tốt. Nhận dạng lá ngón dùng PCA kết hợp với mạng nơron
là phương pháp mang lại hiệu quả nhận dạng cao bởi nó phát huy được ưu
điểm của PCA và mạng nơron.
1.2.3. Các khó khăn trong giải quyết bài toán
Dựa vào đặc điểm nhận dạng cũng như các thành phần độc tính hóa
học trong cây lá ngón đôi khi thực nghiệm sẽ gây ra nhiều khó khăn bất cập
trong việc xử lý vật phẩm như:
1. Nhận diện về mặt thực vật sinh học gây khó khăn do cây lá ngón
giống một số cây khác như cây chè vằng.
2. Nhận diện về mặt độc tính hóa học cũng gây ra nhiều khó khăn vì
độc tính của loại cây này giống độc tính của một số cây địa phương khác.
Một khó khăn thách thức nữa khi nhận dạng lá ngón bằng mạng nơron
lan truyền ngược là: khi dùng mạng nơron chưa có phương pháp luận chung
khi thiết kế cấu trúc mạng cho các bài toán nhận dạng mà phải cần tới kiến
thức của chuyên gia. Mặt khác khi xấp xỉ mạng nơron với một hệ phi tuyến sẽ
khó khăn khi luyện mạng vì có thể không tìm được điểm tối ưu toàn cục…

10


Chương 2: NHẬN DẠNG LÁ NGÓN SỬ DỤNG MẠNG NƠRON LAN
TRUYỀN NGƯỢC
2.1. Trích chọn đặc trưng của lá ngón

Cây Lá ngón còn có tên là Co ngón, Thuốc rút ruột, Hồ mạn trường,
Hồ mạn đằng, Đại trà đằng, Hoàng đằng, Câu vẫn, Đoạn trường thảo. Tên
khoa học là Gelsemium elegans Benth (Medica elegans Gardn) Họ Mã tiền
(Loganiaceae)

Cây Lá ngón thuộc loại cây bụi, thân gỗ nhỏ thẳng, dựa vào cây khác
dài 10-12m. Cành non mầu xanh lục nhạt không có lông. Cành già mầu
xám nâu nhạt. Lá mọc đối không có lông, xanh bóng, lá nguyên, hình trứng,
thuôn dài về hai phía, mũi lá nhọn. Hoa mọc thành chùm ở kẽ lá hoặc đầu
cành, hoa mầu vàng, mùa hoa từ tháng 6 – 10. Quả nang thon dài 1cm x
0,5cm, mầu nâu xỉn. Hạt nhỏ, hình thận, mầu nâu nhạt, có diềm mỏng giúp
hạt phát tán theo gió.

11


Hình 2.1. Hoa cây lá ngón
Mặc dù cây Lá ngón mọc tự nhiên, khá phổ biến ở rừng núi nước ta,
Trung Quốc, Bắc Mỹ và có tên là Thuốc rút ruột nhưng nhân dân ta không
dùng làm thuốc vì là cây cực độc (độc nhất trong các cây độc). Tất cả các bộ
phận rễ, thân, lá, hoa, quả và hạt đều chứa các chất độc nguy hại. Một người
lớn chỉ ăn nhầm phải ba Lá ngón đã có thể bi ngộ độc chết. Người bị ngộ độc
Lá ngón có các triệu chứng mệt mỏi, chóng mặt, buồn nôn, chảy nước bọt
(xều bọt mép), đau bụng dữ dội, mỏi cơ, đứng không vững, tim đập yếu, khó
thở, đồng tử giãn và chết nhanh.
2.2. Mạng nơron lan truyền ngược trong hệ thống nhận dạng lá ngón
2.2.1. Lan truyền ngược độ nhậy cảm
Bây giờ ta cần tính nốt ma trận độ nhậy cảm s m. Để thực hiện điều này
chỉ cần sử dụng một áp dụng khác của luật xích. Quá trình này cho ta khái
niệm về sự “lan truyền ngược” bởi vì nó mô tả mối quan hệ hồi quy trong đó
độ nhậy cảm sm được tính qua độ nhậy cảm sm+1 của lớp m+1

12



Để dẫn đến quan hệ đó, ta sử dụng ma trận Jacobi sau:

Xét phần tử (i, j) của ma trận trên:

trong đó:

Như vậy, ma trận Jacobi có thể viết lại như sau:

13


trong đó:

Bây giờ ta viết lại quan hệ hồi quy cho độ nhậy cảm dưới dạng ma trận:

Đến đây có thể thấy độ nhậy cảm được lan truyền ngược qua mạng từ
lớp cuối cùng trở về lớp đầu tiên:

Cần nhấn mạnh rằng ở đây thuật toán lan truyền ngược lỗi sử dụng
cùng một kỹ thuật giảm theo hướng như thuật toán LMS. Sự phức tạp duy

14


nhất là ở chỗ để tính gradient ta cần phải lan truyền ngược độ nhậy cảm từ các
lớp sau về các lớp trước như đã nêu trên.
Bây giờ ta cần biết điểm bắt đầu lan truyền ngược, xét độ nhậy cảm sM
tại lớp cuối cùng:

Bởi vì:


nên ta có thể viết:

Ở dạng ma trận sẽ là:

2.2.1.1. Sử dụng thuật toán lan truyền ngược
Trên đây là thuật toán lan truyền ngược cơ bản, sau đây ta sẽ bàn về
các khía cạnh ứng dụng của thuật toán lan truyền ngược như chọn lựa cấu
trúc mạng, sự hội tụ và khả năng tổng quát hóa.

15


2.2.1.2. Chon lựa cấu trúc mạng
Như ta đã biết, thuật toán lan truyền ngược có thể được sử dụng để xấp
xỉ bất kỳ một hàm số học nào nếu như ta có đủ số nơron trong các lớp ẩn.
Mặc dù vậy, phát biểu trên chưa cho ta được một số cụ thể các lớp và số
nơron trong mỗi lớp cần sử dụng. Ta sẽ dùng một ví dụ để có được cái nhìn
chi tiết hơn về vấn đề này.
Ví dụ, ta muốn xấp xỉ hàm số sau:

Trong đó i nhận các giá trị 1, 2, 4 và 8. Khi i tăng thì hàm số cần xét
sẽ trở nên phức tạp hơn do ta sẽ nhận được nhiều chu kỳ của hình sin trong
phạm vi [-2, 2]. Khi đó, mạng nơron với một số nơron cố định sẽ khó có thể
xấp xỉ được hàm nếu i tăng. Trong phần sau, ta sẽ sử dụng ví dụ Function
Approximation trong thư viện của bộ Matlab 5.3 (file nnd11fa.m). Ở đây,
mạng sử dụng có 1 lớp ẩn, 1 lớp ra; đương nhiên, mạng có 1 đầu vào và một
đầu ra. Lớp ẩn sử dụng hàm sigmoid, lớp ra dùng hàm đồng nhất:

Số nơron trong lớp ẩn là 4, kết quả xấp xỉ của mạng trong các trường

hợp i = 1, 2, 4, 8 như trong các hình vẽ dưới đây. Các đường màu đen là trả
lời của mạng, còn các đường mờ hơn là hàm cần xấp xỉ.

16


Khi ta tăng số nơron trong lớp ẩn lên thì khả năng xấp xỉ hàm số của
mạng sẽ tốt hơn.
Chẳng hạn, xét trường hợp sử dụng 9 nơron trong lớp ẩn và i = 8 ta có
được kết quả sau:

17


×