Nhận dạng thức ăn rau quả tươi bằng hình ảnh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (384.37 KB, 21 trang )

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Nguyễn Thị Hồng

NHẬN DẠNG THỨC ĂN RAU QUẢ TƢƠI BẰNG HÌNH ẢNH

Chuyên ngành: Khoa học máy tinh
Mã số: 604801

TÓM TẮT LUẬN VĂN THẠC SĨ

HÀ NỘI – 2013

Luận văn đƣợc hoàn thành tại:

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG

Ngƣời hƣớng dẫn khoa học: Tiến sĩ Phạm Văn Cƣờng

Phản biện 1: ……………………………………………………………………………

Phản biện 2: …………………………………………………………………………

Luận văn sẽ đƣợc bảo vệ trƣớc Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ
Bƣu chính Viễn thông
Vào lúc: giờ ngày tháng năm

Có thể tìm hiểu luận văn tại:
- Thƣ viện của Học viện Công nghệ Bƣu chính Viễn thông

MỞ ĐẦU
1. Lý do chọn đề tài
Thức ăn hàng ngày là một phần tất yếu của cuộc sống. Thức ăn với chế độ dinh dƣỡng hợp
lý sẽ đem lại sức khỏe tốt cho con ngƣời. Ngƣợc lại, chế độ dinh dƣỡng không hợp lý có thể dẫn tới
bệnh tật. Một trong số những bệnh thƣờng gặp là bệnh tiểu đƣờng. Nó liên quan mật thiết tới chế độ
ăn hàng ngày. Trong những năm gần đây, bệnh tiểu đƣờng (hay còn gọi là đái tháo đƣờng) đang trở
thành vấn đề lo ngại lớn đối với giới y khoa và cả cộng đồng. Một nghiên cứu cho thấy khoảng 73
triệu ngƣời ở Hoa Kỳ, hoặc bị bệnh hoặc đang có nguy cơ mắc bệnh. Hơn nữa, tổng chi phí trực

tiếp và gián tiếp liên quan đến bệnh tiểu đƣờng khoảng 132 tỷ đồng ở Hoa Kỳ [8]. Ở Việt Nam,
theo tính toán của Hội ngƣời giáo dục bệnh đái tháo đƣờng Việt Nam cho thấy: Tỷ lệ ngƣời mắc
bệnh đái tháo đƣờng năm 2002 chiếm 2,7%, đến 2008 đã tăng lên 5,7% dân số. Tỷ lệ ngƣời mắc
bệnh đái tháo đƣờng ở các thành phố lớn chiếm tỷ lệ 7,2% dân số. Theo dự kiến ngƣời mắc tiểu
đƣờng sẽ tăng lên khoảng 7-8 triệu ngƣời vào năm 2025. Đây chính là con số đáng báo động cho
thấy tốc độ ra tăng rất nhanh về số lƣợng ngƣời bệnh. Nghiêm trọng hơn thực trạng bệnh tiểu đƣờng
đang bị trẻ hóa do béo phì gây ra nhiều biến chứng khó lƣờng. Điều này cho thấy cần có một chế
độ dinh dƣỡng khoa học riêng cho từng cá nhân đảm bảo cuộc sống mà vẫn duy trì đƣợc trọng
lƣợng cơ thể ở mức cần thiết. Một hệ thống nhận dạng thức ăn hàng ngày dựa trên điện thoại di
động với một chi phí thấp, tự động, mang tính cá nhân là cần thiết.
2. Mục đích nghiên cứu
Hệ thống nhận dạng thức ăn hàng ngày dựa trên điện thoại di động giúp cho ngƣời dùng
quản lý và theo dõi chế độ dinh dƣỡng hàng ngày hiệu quả và thuận tiện hơn trong việc giữ gìn sức
khỏe và giảm cân liên quan đến ứng dụng. Đối với ngƣời bệnh tiểu đƣờng thì những dữ liệu đƣợc
ghi và hiển thị cũng sẽ hỗ trợ ngƣời chăm sóc và chuyên gia y tế của họ cung cấp các hình thức điều
trị chính xác hơn.
3. Đối tượng và phạm vi nghiên cứu
Tuy nhiên, trên thực tế thức ăn hàng ngày rất đa dạng phong phú và rất khó nhận dạng vì
đặc điểm bên ngoài của chúng có thể khá giống nhau ví dụ nhƣ thịt lợn và thịt bò. Nên trong khuôn
khổ luận văn này em xin đƣợc tập trung vào nhận dạng thức ăn rau quả tƣơi trong giai đoạn tiền chế
biến. Đóng góp chính của luận văn này là phát triển một hệ thống nhận dạng rau quả tƣơi trên điện
thoại di động bằng việc phân loại hình ảnh của chúng.
4. Phương pháp nghiên cứu
Luận văn sử dụng thuật toán phân cụm K-means để phân đoạn ảnh rau quả, và thuật toán hỗ
trợ máy vector (SVM) để phân loại thực phẩm rau quả. Dữ liệu về hình ảnh rau quả (khoảng 3000 –
4000 ảnh từ 10 loại rau, quả khác nhau) sẽ đƣợc thu thập bằng điện thoại di động với độ phân giải
thấp và thuật toán nhận dạng sẽ đƣợc đánh giá trên tập dữ liệu này.

CHƢƠNG 1 TỔNG QUAN VỀ BÀI TOÁN NHẬN DẠNG THỰC

PHẨM
Chƣơng này nói về sự cần thiết phải xây dựng bài toán nhận dạng thực phẩm. Một số hạn
chế của những bài toán nhận dạng thực phẩm trƣớc đó. Cách tiếp cận với bài toán nhận dạng rau
quả tƣơi thông qua hình ảnh chụp từ điện thoại di động. Một số vấn đề có thể gặp phải khi xử lý
ảnh.
1.1 Đặt vấn đề
Hiện nay, chất lƣợng sống của ngƣời dân đƣợc nâng cao, những đáp ứng về nhu cầu thực
phẩm của mỗi ngƣời đôi khi trở nên dƣ thừa. Đây chính là những nguyên nhân gây béo phì từ đó
phát sinh nhiều bệnh là điều khó tránh. Bệnh phổ biến thƣờng gặp là bệnh tiểu đƣờng. Từ năm 2006
bệnh tiểu đƣờng đã đƣợc Liên hiệp quốc công nhận là căn bệnh mãn tính nguy hiểm gây ảnh hƣởng
tới cuộc sống toàn nhân loại. Theo Tổ chức Y tế thế giới (WHO) và Liên đoàn Đái tháo đƣờng thế
giới (IDF) Việt Nam không phải là quốc gia có tỷ lệ đái tháo đƣờng lớn nhất thế giới, nhƣng bệnh
đái tháo đƣờng ở Việt Nam phát triển nhanh nhất thế giới. Đối tƣợng mắc bệnh đái tháo đƣờng
thƣờng ở độ tuổi từ 30-65, tuy nhiên hiện nay có những bệnh nhân đái tháo đƣờng mới chỉ 9-10
tuổi, điều này phản ánh sự trẻ hóa về bệnh này ở nƣớc ta
Vấn đề kiểm soát ăn uống trở nên vô cùng hệ trọng cho từng trƣờng hợp cá biệt. Ngƣời bệnh
tiểu đƣờng cần có chế độ ăn uống hợp lý và rau quả là nguồn dinh dƣỡng tốt nhất. Chính vì vậy mà
áp dụng một chƣơng trình dinh dƣỡng hợp lý là một trong những biện pháp điều trị căn bản và quan
trọng không chỉ giúp phòng ngừa bệnh tiểu đƣờng mà còn giúp phòng ngừa hàng loạt các bệnh mãn
tính khác nhƣ tim mạch, cao huyết áp, ung thƣ,… Nhờ đó mà cuộc sống của những thành viên trong
cộng đồng xã hội đƣợc cải thiện. Với thực phẩm cho mỗi bữa ăn rất đa dạng cần lựa chọn thực
phẩm thế nào cho phù hợp đang là những băn khoăn cho nhiều bà nội trợ. Họ cần rất nhiều hiểu biệt
về vấn đề này cũng nhƣ cần có những hỗ trợ riêng để ƣớc tính lƣợng calo từ thực phẩm cung cấp
cho các bữa ăn hàng ngày. Nhu cầu năng lƣợng cho ngƣời già, ngƣời lao động, ngƣời trẻ, trẻ em,
ngƣời bệnh,…. Để có đƣợc tƣ vấn thƣờng xuyên của các chuyên gia Y tế là một hạn chế và tốn
kém. Do đó, một hệ thống nhận dạng thức ăn trên mobile trợ giúp cho ngƣời bình thƣờng ăn kiêng,
giảm cân và đặc biệt không chỉ cho ngƣơi bệnh tiểu đƣờng mà những ngƣời bệnh khác một chế độ
dinh dƣỡng hợp lý là băt buộc và cần thiết.
1.2 Nghiên cứu trước đây
Một hệ thống quản lý chế độ dinh dƣỡng của ngƣời bệnh tiểu đƣờng tại Đại học Carnegie

Mellon dựa trên thực đơn ghi lại thực phẩm tiêu thụ hàng ngày[8]. Hệ thống làm giảm thời gian
tƣơng tác ngƣời dùng với thiết bị, là một kỹ thuật nhận dạng tự động thực phẩm để theo dõi lƣợng
calo. Wellness Nokia Diary là một thiết bị dựa trên ứng dụng di động cũng cho phép theo dõi sức
khỏe hàng ngày của ngƣời sử dụng[11], yêu cầu ngƣời dùng nhập thông tin về thói quen ăn uống
của họ.
Nhận dạng thực phẩm tự động dựa trên hình ảnh là rất khó khăn. Trƣớc đây, những nghiên
cứu bị giới hạn trong một số loại thực phẩm cụ thể nhƣ cá, thịt, hoặc trái cây họ cam quýt ngành

công nghiệp [2] [3] [4]. Phƣơng pháp phân loại thực phẩm dựa trên màu sắc cho thực phẩm đã chế
biến nhƣ thịt và cá đƣợc phát hiện với một bộ lọc để tách thực phẩm với nền hình ảnh. Những thuật
toán SFBB (Safer Food, Better Business), hay thuật toán SVM đã đƣợc sử dụng để phân loại thực
phẩm cũng rất hiệu quả[3]. Sự nhận dạng thực phẩm còn dựa trên sự sắp xếp thức ăn trên đĩa hay
đƣợc quy định bởi các ngăn chia [6] [7].
Không có phƣơng pháp nào đáp ứng đƣợc yêu cầu dinh dƣỡng hàng ngày cho ngƣời
bệnh.Việc sử dụng điện thoại di động hỗ trợ chế độ dinh dƣỡng hợp lý thông qua hình ảnh là một
phƣơng pháp đáng kể. Nó kết nối nhanh khoảng cách giữa sức khỏe cá nhân và công nghệ, ngƣời
dùng và thông tin dinh dƣỡng của họ,bằng cách giám sát thực phẩm dựa trên thiết bị tính toán cầm
tay cá nhân. Cho phép họ theo dõi tình trạng sức khỏe hàng ngày để giảm chi phí y tế tổng thể.
1.3 Cách tiếp cận
Do đó, việc xây dựng một hệ thống nhận dạng thức ăn rau quả tƣơi bằng hình ảnh là cần
thiết, nó mang tính cá nhân với chi phí thấp, rất tiện lợi cho ngƣời dùng. Từ thực phẩm đƣợc nhận
dạng sẽ ƣớc tính lƣợng calo tƣơng ứng cho mỗi loại. Đây cũng là giải pháp cho vấn đề quản lý dinh
dƣỡng đã đƣợc đề cập ở trên.
Hình ảnh thức ăn rau củ quả có đƣợc từ ngƣời dùng chụp với điện di động có độ phân giải
thấp. Từ những hình ảnh này hệ thống sẽ thực hiện phân loại thực phẩm qua hai bƣớc: phân đoạn và
làm mịn ảnh. Mỗi hình ảnh có đƣợc là từ bề mặt của các loại rau, quả, củ, số lƣợng màu sắc chƣa
xác định, một phƣơng thức không có giám sát là cần thiết để phân vùng ảnh. Và thuật toán phân
cụm K-mean đƣợc thực hiện cho việc phân đoạn màu sắc thực của ảnh. Khi chụp hình trong khung
cảnh thực những hình ảnh chứa đựng những đối tƣợng xung quanh đầy ý nghĩa, làm phát sinh một

số cụm (nhỏ) không có liên quan đến đối tƣợng quan tâm. Để loại bỏ những đối tƣợng này, ta áp
dụng các toán tử hình thái [13] (mathematical morphology) bao gồm open và close để làm mịn hình
ảnh phân đoạn. Vùng chính cần quan tâm có thức ăn sẽ đƣợc trích xuất bằng việc sử dụng các thuộc
tính màu sắc và SURF cho việc xác nhận thức ăn. Cuối cùng thực hiện sự phân lớp ảnh cho việc xác
nhận từng loại thức ăn dựa trên đặc trƣng SURF và thuộc tính màu sắc thông qua thuật toán máy hỗ
trợ vector (SVM)

Hình ảnh của Rau,
quả, củ,…
Ảnh đã phân đoạn
Vectơ đặc trƣng
Hình ảnh từng loại thực
phẩm
Phân đoạn
(K-mean)
Phân loại
(SVM)

1.4 Một số vấn đề
1.4.1 Những hưóng công nhận hình ảnh chung
Hình ảnh thực phẩm chụp đƣợc từ ngƣời dùng đƣợc thu nhận từ rất nhiều hƣớng khác nhau.
Để xác định rõ từng loại đối tƣợng thực phẩm là rất phức tạp và có nhiều khía cạnh cần đƣợc xem
xét hoặc bị bỏ qua. Ta có thể xem xét một số trƣờng hợp cụ thể nhƣ sau:
Sự co giãn của hình ảnh: Hình ảnh thực phẩm có thể đƣợc chụp từ những khoảng cách
khác nhau: sự chụp hình xa, gần, nghiêng, thẳng, trên xuống…Những khoảng cách hay góc chụp
này tạo cho ngƣời xem một cảm nhận chƣa chính xác về kích thƣớc thực của các thực phẩm trong
hình. Và khó phân biệt lƣợng thực phẩm đủ dùng, nhỏ, hay lớn.
Hướng chụp hình: Hình ảnh của các thực phẩm có thể chụp từ nhiều hƣớng khác nhau:
Chụp chính diện thực phẩm này nhƣng lại chụp đƣợc góc của thực phẩm kia Nhƣ trong hình 1.1
có thể thấy ở góc chụp này quả ớt ngọt, quả táo xanh có kích thƣớc lớn hơn, quả táo tàu trông lại
nhỏ đi. Hay các phạm vi về màu sắc, kết cấu, hình dạng thực phẩm trong bức ảnh có thể thay đổi
đáng kể ở mỗi góc chụp khác nhau.
Phụ thuộc chất lượng mỗi máy ảnh: Và không phải tất cả các máy điện thoại di động đều
cho cùng một chất lƣợng ảnh nhƣ nhau. Với mỗi máy điện thoại di động sẽ có những thiết lập về độ
sáng, độ phân giải, độ co giãn khung hình đƣợc thực hiện khác nhau. Cũng với cùng một máy ảnh
nhƣng mỗi ngƣời chụp lại cho hình ảnh khác nhau. Điều này sẽ làm thay đổi chất lƣợng của hình
ảnh thực phẩm.
Điều kiện ánh sáng môi trường: Đây là yếu tố bên ngoài nhƣng lại ảnh hƣởng rất lớn tới
độ sáng của khung hình. Không phải tất cả các hình ảnh sẽ đƣợc thực hiện trong cùng một điều kiện
ánh sáng nhƣ nhau. Mỗi sự thay đổi nhỏ trong ánh sáng cũng tạo ra những hình ảnh khác nhau đáng
kể. Điều này tạo nên sự biến dạng trong nhiều đặc trƣng trích chọn của các mẫu thực phẩm.
1.4.2 Những vấn đề có thể gặp trong quá trình xử lý ảnh
Khi xử lý ảnh cho bƣớc đầu tiên trong phân đoạn ảnh ta sẽ gặp một số trƣờng hợp nhƣ:
Vị trí thực phẩm trong hình: Thứ tự hình ảnh đứng trƣớc, đứng sau, hay chỉ thấy đƣợc một
góc của thực phẩm. Việc này làm tăng tính phức tạp trong việc xác nhận hình ảnh thực của mỗi loại
thực phẩm có trong hình.
Sự đa dạng về hình dạng: Không phải tất cả các loại thực phẩm sẽ có hình dạng giống

nhau cho mỗi lần chụp. Mỗi bức ảnh tuy chụp cùng một khung cảnh nhƣng sẽ cho các hình dạng
khác nhau với mỗi loại thực phẩm.
Sự thay đổi trong kết cấu hình ảnh: điều kiện ánh sáng khác nhau và điều kiện kết hợp
các thành phần thực phẩm trong mỗi hình cũng khác nhau, cũng nhƣ việc tạo một phông nền lộn
xộn gây khó khăn cho việc phát hiện đối tƣợng cần quan tâm
1.5 Phạm vi nghiên cứu
Thực phẩm xung quanh chúng ta rất đa dạng và cực kỳ phong phú. Có rất nhiều loại với
hình dạng bên ngoài của chúng có thể rất giống nhau về màu sắc, hình dạng và kích thƣớc nhƣ các

loại trứng gà và trứng vịt, thịt bê và thịt bò, quả bí và quả mƣớp, …. Để có một hệ thống phát hiện
chính xác và trực tiếp nhiều nguồn thực phẩm nhƣ vậy cần rất nhiều các trích chọn đặc trƣng riêng
cho từng loại về màu sắc, hình dạng, kích thƣớc của mỗi loại đƣợc sử dụng cho quá trình nhận
dạng. Việc làm này đòi hỏi rất nhiều thời gian cho quá trình thu thập dữ liệu. Tuy nhiên luận văn
chỉ dừng lại ở việc nhận dạng rau quả tƣơi trong giai đoạn tiền chế biến hỗ trợ dinh dƣỡng cho mỗi
ngƣời.
1.6 Các giả định
Để hình ảnh đƣợc rõ nét, dễ phân loại thực phẩm. Ta có thể xem xét hình ảnh theo các giả
định sau:
Không chạm vào các đối tượng: Để hạn chế khả năng bị che đi của các đối tƣợng, dễ dàng
hơn cho việc phân cụm ảnh.
Chụp được đối tượng tổng thể: Chụp đƣợc hình ảnh tổng thể sẽ dễ dàng hơn trong nhận biết
đối tƣợng dựa trên hình dạng, màu sắc, kích thƣớc thực của chúng.
Có một màu nền chung: Thuận tiện hơn cho việc phân đoạn ảnh chỉ cẩn tập trung vào
những đối tƣợng phát hiện đƣợc nhƣ trên nền trắng của khay đựng đồ
Nền nhẹ hơn các đối tượng: Để cho phép cho một kỹ thuật đơn giản hóa thích nghi cho loại
bỏ nền
Tối thiểu bóng tối và ánh sáng không có đèn flash: Để tránh trƣờng hợp các đặc trƣng hàng
thực phẩm bị tổn hại do phát hiện không đúng của bóng hoặc các điểm đèn flash.
1.7 Kết luận

Nhƣ vậy, tuỳ chọn sử dụng tĩnh nhƣ là một bối cảnh áp dụng cho việc lọc ra các mẫu đặc
trƣng để phân loại thực phẩm từ hình ảnh có đƣợc. Một số lƣợng lớn bệnh nhân tiểu đƣờng rơi vào
ngƣời mù và ngƣời già trong cộng đồng. Những nhóm này có thể không thoải mái sử dụng điện
thoại di động và khả năng tiếp cận hệ thống với nhiều lý do khác nhau. Do đó, phần mềm cũng cần
mang lại tính tự động hóa hơn nữa trong việc giám sát thực phẩm bằng các menu, thông qua việc
thừa nhận hình ảnh tự động của thực phẩm bằng cách tận dụng bảng thiết bị trên máy ảnh và Wifi
Nghiên cứu sử dụng thêm các thiết bị di động để đạt đƣợc bối cảnh hữu ích nhƣ hệ thống
thời gian và sở thích của ngƣời sử dụng dựa trên các bộ lọc theo ngữ cảnh để áp dụng vào phƣơng
pháp nhận dạng hình ảnh dựa trên thực phẩm.

CHƢƠNG 2 THUẬT TOÁN NHẬN DẠNG THỰC PHẨM
2.1 Giới thiệu
Chƣơng này trình bày hai thuật toán chính sử dụng trong hệ thống nhận dạng thực phẩm
bằng hình ảnh là thuật toán K-mean và thuật toán máy hỗ trợ vector (SVM). Cách phân đoạn ảnh
đầu vào dựa trên thuật toán K-mean để trích chọn các đặc trƣng. Và sử dụng thuật toán SVM cho
phân loại ảnh.
2.2 Phân đoạn ảnh và tiền xử lý
2.2.1 Phân đoạn ảnh bằng thuật toán K-MEAN
K-Mean là thuật toán rất quan trọng và đƣợc sử dụng phổ biến trong kỹ thuật phân cụm. Tƣ
tƣởng chính của thuật toán K-Mean là tìm cách phân nhóm các đối tƣợng đã cho vào K cụm (K là
số các cụm đƣợc xác đinh trƣớc, K nguyên dƣơng) sao cho tổng bình phƣơng khoảng cách giữa các
đối tƣợng đến tâm nhóm là nhỏ nhất.
Bài toán phân cụm dữ liệu trong thuật toán K-mean:
Cho tập các điểm D = {x
1
, x
2
,…, x
n

},
Trong đó x
i
= (x
i1
, x
i2
,…, x
ir
) là một vector có r chiều trong không gian R
r
, và r là một số
thuộc tính của tập dữ liệu D.
Giải thuật K-Mean phân cụm dữ liệu dựa trên khoảng cách Euclidean nhỏ nhất giữa đối
tƣợng đến phần tử trung tâm của các nhóm.
Khoảng cách Euclidean
Ta giả sử:
x
i
= (x
i1
, x
i2
,…, x
ir
) - đối tƣợng thứ i cần phân phân loại, (i=1 n)
c
j
= (c
j1

, c
j2
,…, c
jr
) - phần tử trung tâm nhóm j (j=1 k)
Khoảng cách Euclidean từ đối tƣợng a
i
đến c
j
(phần tử trung tâm nhóm j) đƣợc tính
toán dựa trên công thức:



m
s
jsisji
xx
1
2
)(


(2.1)
Trong đó:
ji

- khoảng cách Euclidean từ a
i
đến c

j

is
x
- thuộc tính thứ s của đối tƣợng x
i

js
x
- thuộc tính thứ s của phần tử trung tâm c
j

Phần tử trung tâm của nhóm đƣợc xác định bằng giá trị trung bình các phần tử trong nhóm.
Phần tử trung tâm
k phần tử trung tâm (k nhóm) ban đầu đƣợc chọn ngẫu nhiên, sau mỗi lần nhóm các đối
tƣợng vào các nhóm, phần tử trung tâm đƣợc tính toán lại.
Cluster
i
{x
1
, x
2
,…, x
t
} – Nhóm thứ i
i=1 k, k số số nhóm cần phân chùm ; j= 1 r, r số thuộc tính

t - số phần tử hiện có của nhóm thứ I; x
sj

- thuộc tính thứ j của phần tử s s=1 t
c
ij
- toạ độ thứ j của phần tử trung tâm nhóm i;
t
x
c
t
s
sj
ji



1

(2.2)
Giải thuật K- mean:
1. Chọn ngẫu nhiên K tâm (centroid) cho K cụm (cluster). Mỗi cụm đƣợc đại diện
bằng các tâm của cụm.
2. Tính khoảng cách giữa các đối tƣợng (objects) đến K tâm (thƣờng dùng khoảng
cách Euclidean)
3. Nhóm các đối tƣợng vào nhóm gần nhất
4. Xác định lại tâm mới cho các nhóm
5. Thực hiện lại bƣớc 2 cho đến khi không có sự thay đổi nhóm nào của các đối
tƣợng
Phân đoạn ảnh là bƣớc đầu tiên trong quá trình xử lý ảnh. Quá trình này thực hiện phân
vùng ảnh thành các vùng rời rạc và đồng nhất với nhau, nó chính là việc xác định các biên của các
vùng ảnh đó. Mỗi vùng gồm một nhóm điểm ảnh liên thông hoặc đồng nhất theo một tiêu chí lựa
chọn nhƣ màu sắc, hình dạng, kết cấu, …. Sau khi phân đoạn mỗi điểm ảnh chỉ thuộc về một vùng

duy nhất. Những vùng ảnh đồng nhất này thông thƣờng sẽ tƣơng ứng với toàn bộ hay từng phần của
các đối tƣợng thật sự có trong ảnh.
Giả sử màu sắc bề mặt của các đối tƣợng trong ảnh là một thuộc tính không đổi và màu sắc
đó đƣợc ánh xạ vào một không gian 2 chiều và màu. Khi đó áp dụng giải thuật phân cụm K-mean
cho việc xác định các cụm màu, mỗi cụm màu có tập các điểm ảnh tƣơng tự nhau.
2.2.2 Tiền xử lý
Để việc nhận dạng ảnh chỉ tập trung vào đúng đối tƣợng quan tâm. Ta cần loại bỏ những đối
tƣợng không liên quan tới nhận dạng nhƣ phông nền xung quanh đối tƣợng quan tâm, dụng cụ xử lý
thực phẩm, vật đựng thực phẩm,… Nhằm tăng cƣờng chất lƣợng ảnh, mà công đoạn tiền xử lý là
bƣớc đầu tiên nhằm loại bỏ nhiễu, khắc phục những khiếm khuyết do bƣớc thu nhận ảnh không tốt
là việc làm quan trọng. Có nhiều phƣơng pháp cho việc nâng cao chất lƣợng ảnh nói chung và tiền
xử lý nói riêng. Trong giai đoạn này, chúng tôi sử dụng các toán tử hình thái (mathematic
morphology) bao gồm các toán tử mở (open) và đóng (close) ảnh [15] để loại bỏ phần nhiễu có
trong ảnh thu nhập đƣợc.

2.3 Trích chọn đặc trưng
2.3 .1 Đặc trưng màu
Màu sắc là một đặc trƣng nổi bật dựa trên bề mặt của các đối tƣợng trong ảnh Mỗi một
điểm ảnh (thông tin màu sắc) có thể đƣợc biểu diễn nhƣ một điểm trong không gian màu sắc ba
chiều: RGB. Rút trích đặc trƣng màu đƣợc tiến hành tính toán trong biểu đồ màu cho mỗi ảnh để
xác định tỉ trọng các điểm ảnh của ảnh chứa các giá trị đặc biệt (màu sắc).
2.3 .2 Đặc trưng SURF
Những đặc trƣng mạnh (SURF) [9] đƣợc biết đến nhƣ một trong những phát hiện thuộc tính
mạnh mẽ nhất và đƣợc sử dụng trong rất nhiều đối tƣợng hiệu chỉnh [10,11]và xác nhận đối tƣợng
các ứng dụng [12]. SURF cũng đƣợc biết đến rất nhiều để xử lý mờ. Hơn nữa, đặc trƣng SURF
cũng bất biến về hƣớng và độ co giãn. Những đặc trƣng này là rất quan trọng để phân lớp các thành
phần có trong thực phẩm dựa trên bề mặt, nhƣ vị trí của thực phẩm rất đa dạng và có nhiều kích
thƣớc khác nhau (nhƣ củ cà rốt con chụp cận cảnh thành một củ cà rốt lớn). Trong khi một bộ nhận
dạng SURF bao gồm những mô tả đặc trƣng giống nhƣ góc, cạnh và điểm, nhƣng chuẩn SURF lại

không bao gồm màu sắc. Tuy nhiên, thông tin màu sặc cũng rất quan trọng cho việc mô tả giữa các
thành phần thực phẩm, trong việc thêm vào các đặc tính SURF, và sử dụng chúng trong xác nhận
các điểm ảnh.
2.3.3 Đặc trưng kết cấu (texture)
Kết cấu là một đối tƣợng dùng để phân hoạch ảnh ra thành những vùng quan tâm để phân
lớp những vùng đó. Kết cấu cung cấp thông tin về sự sắp xếp về mặt không gian của màu sắc và
cƣờng độ một ảnh. Kết cấu đƣợc đặc trƣng bởi sự phân bổ không gian của những mức cƣờng độ
trong một khu vực gần nhau. Kết cấu gồm các kết cấu gốc hay nhiều kết cấu gộp lại đôi khi gọi là
texel.
2.3.4 Vector đặc trưng
Để phân lớp thực phẩm, một bộ rút trích đặc trƣng (feature extractor -FE) đƣợc thực hiện để
hoàn thành 2 thủ tục chính. Một là sự thực hiện của máy dò Fast_Hessian, và một biểu đồ màu
RGB. Đầu vào của FE là một hình ảnh phân đoạn bằng cách thực hiện thuật toán phân cụm K-
Mean, đầu ra của chúng là 2 danh sách: một danh sách chứa 64 phần tử của những điểm quan tâm
SURF (đặc trƣng SURF) S = (s1, s2,. , S64), và danh sách kia là một biểu đồ 64 màu sắc C = (c1,
c2, , C64). Sau khi bình thƣờng hóa, các danh sách này đƣợc kết hợp thành một đặc trƣng vector
trong 128-phần tử vector đặc trƣng:
V = [α * s1, α * s2, , α * S64, (1-α) * C65, (1-α) * C66, , (1-α) * C128] trong đó α là một
trọng lƣợng bằng mà SURF và các đặc trƣng kết hợp màu sắc đƣợc xếp hạng tƣơng ứng. Trong thí
nghiệm của chúng tôi, giá trị của α = 0,4 đƣợc heuristically chọn (bằng cách đánh giá giá trị khác
nhau của α trong một nghiên cứu thí điểm).

2.4 Phân loại hình ảnh
2.4.1 Thuật toán máy hỗ trợ vector (SVM)
2.4.1.1 Bài toán phân lớp:
Phân lớp là một tiến trình xử lý nhằm xếp các mẫu dữ liệu hay các đối tƣợng vào một trong
các lớp đã đƣợc định nghĩa trƣớc. Các mẫu dữ liệu hay các đối tƣợng đƣợc xếp vào các lớp dựa vào
giá trị của các thuộc tính cho một mẫu dữ liệu hay đối tƣợng. Sau khi đã xếp tất cả các đối tƣợng đã
biết trƣớc vào các lớp tƣơng ứng thì mỗi lớp đƣợc đặc trƣng bởi tập các thuộc tính của các đối

tƣợng chứa trong lớp đó.
Quá trình phân lớp còn đƣợc gọi là quá trình gán nhãn cho các tập dữ liệu. Nhiệm vụ của bài
toán phân lớp dữ liệu là cần xây dựng mô hình (bộ) phân lớp để khi có một dữ liệu mới vào thì mô
hình phân lớp sẽ cho biết dữ liệu đó thuộc lớp nào. Có nhiều cách để biểu diễn một mô hình phân
lớp và có rất nhiều thuật toán giải quyết nó. Các thuật toán phân lớp tiêu biểu bao gồm nhƣ mạng
neural, cây quyết định, suy luận quy nạp, mạng Beyesian, Support Vector Machine (SVM),…
Trong các kỹ thuật đó, SVM đƣợc coi là công cụ mạnh, phổ biến và đặc biệt thích hợp cho phân lớp
dữ liệu lớn và nhiều chiều.
2.4.1.2 Thuật toán máy hỗ trợ vector (SVM)
Thuật toán máy hỗ trợ vector (SVM) xây dựng một siêu phẳng hoặc một tập hợp các siêu
phẳng trong một không gian nhiều chiều hoặc vô hạn chiều, có thể đƣợc sử dụng cho phân loại, hồi
quy, hoặc các nhiệm vụ khác.
Mục tiêu của thuật toán là xác định xem một điểm dữ liệu mới sẽ thuộc về lớp nào. Mỗi
điểm dữ liệu đƣợc biểu diễn dƣới dạng một vector p -chiều, và ta muốn biết liệu có thể chia tách hai
lớp dữ liệu bằng một siêu phẳng p − 1 chiều. Đây gọi là phân loại tuyến tính.
2.4.1.3 SVM cho bài toán phân lớp tuyến tính (SVMS)
Hình thức đơn giản của việc phân lớp là phân lớp nhị phân: phân biệt giữa các đối tƣợng
thuộc về một trong hai lớp: dƣơng (+1) hoặc âm (-1). SVMs sử dụng hai khái niệm để giải quyết
vấn đề này: phân lớp biên rộng và hàm kernel. Ý tƣởng của phân lớp biên rộng có thể đƣợc minh
họa bởi sự phân lớp của các điểm trong không gian hai chiều (Hình 2.1). Một cách đơn giản để
phân lớp các điểm này là sử dụng một đƣờng thẳng để phân tách các điểm nằm ở một bên là dƣơng
và các điểm bên kia là âm. Nếu có hai đƣờng thẳng phân chia tốt thì ta có thể phân tách khá xa hai
tập dữ liệu (Hình 2.1 và 2.2). Đây là ý tƣởng về sự phân chia biên rộng.

Hình 2.1: Một đường thẳng tuyến tính phân chia 2 lớp điểm
(hình vuông và hình tròn) trong không gian hai chiều. Ranh giới quyết định chia
không gian thành hai tập tùy thuộc vào dấu của hàm f (x) = <w, x> + b.

Hình 2.2: Độ rộng biên lớn nhất được tính toán bởi một SVMs tuyến tính.
Khu vực giữa hai đƣờng mảnh xác định miền biên với -1 ≤ <w, x> + b ≤ 1. Những
điểm sáng hơn với chấm đen ở giữa gọi là các điểm support vectors, đó là những điểm gần
biên quyết định nhất. Ở đây, có ba support vectors trên các cạnh của vùng biên (f(x) = -1
hoặc f (x)=1).
Trong phần này, ý tƣởng về phân lớp tuyến tính sử dụng SVM đƣợc giới thiệu. Các dữ liệu
bao gồm các đối tƣợng có nhãn là một trong hai nhãn. Để thuận tiện, giả định rằng các nhãn +1
(dƣơng) và -1 (âm). Lấy x biểu thị một vector với M phần tử x
j
, , (j = 1,. , M) tức là một điểm

trong một không gian vector M-chiều. Các x
i
ký hiệu biểu thị vector thứ i trong một tập dữ liệu
  
n
i
ii
yx
1
trong đó yi là nhãn liên quan x
i
. Các đối tƣợng x
i
đƣợc gọi là đặc tính đầu vào.
Một khái niệm quan trọng cần thiết để xác định một phân lớp tuyến tính là tích vô hƣớng
giữa hai vectơ




M
j
jj
xwxw
1
,
, còn đƣợc gọi là tích trong. Phân lớp tuyến tính đƣợc dựa trên
một hàm tuyến tính dạng:
bxwxf  ,)(

(2.4)
Hàm f(x) là hàm của đầu vào x, f(x) đƣợc sử dụng để quyết định làm thế nào để phân lớp x.
Vector w đƣợc gọi là vector trọng số, và b đƣợc gọi là độ dịch. Trong không gian 2 chiều các
điểm ứng với phƣơng trình <w, x> = 0 tƣơng ứng với một đƣờng qua gốc tọa độ, trong không gian
3 chiều thì nó là một mặt phẳng qua gốc tọa độ. Biến b sẽ dịch chuyển mặt phẳng đi một lƣợng so
với mặt phẳng qua gốc tọa độ. Mặt phẳng phân chia không gian thành hai không gian theo dấu của
f(x), nếu f(x)> 0 thì quyết định cho một lớp dƣơng lớp kia là âm. Ranh giới giữa các vùng đƣợc
phân lớp là dƣơng và âm đƣợc gọi là ranh giới quyết định của các phân lớp. Ranh giới quyết định
đƣợc xác định bởi một mặt phẳng (phƣơng trình (2.4)) đƣợc cho là đƣợc tuyến tính bởi vì nó là
tuyến tính đầu vào. Phân lớp với một ranh giới quyết định tuyến tính đƣợc gọi là phân lớp tuyến
tính.
Với bất kỳ một tập dữ liệu khả tách tuyến tính có tồn tại một mặt phẳng phân lớp tất cả các
điểm dữ liệu. Có nhiều mặt phẳng nhƣ vậy nhƣng phải lựa chọn mặt phẳng nào để đảm bảo thời
gian huấn luyện ngắn và phân lớp một cách chính xác. Thực tế quan sát cũng nhƣ lý thuyết học
thống kê (Vapnik, 1999) cho thấy rằng phân lớp siêu phẳng sẽ làm việc tốt hơn nếu siêu phẳng
tách biệt chính xác với một biên độ lớn. Ở đây, biên của một phân lớp tuyến tính đƣợc định nghĩa là
khoảng cách gần nhất để quyết định ranh giới, nhƣ thể hiện trong hình 2.2. Có thể điều chỉnh b để
siêu phẳng phân tách các điểm tƣơng ứng. Hơn nữa nếu cho phƣơng trình (2.4) các giá trị ± 1,

thì biên độ sẽ là 1 / ||w|| (trong đó ||w|| là độ dài của vec tơ w) còn đƣợc gọi là chuẩn, đƣợc tính là
 ww,

2.4.1.4 Thiết lập lề (biên)
Để tính toán w và b tƣơng ứng với các biên cực đại, ta phải giải quyết bài toán tối ƣu sau
đây:
2
min
,
2
1
w
imize
bw
, với ràng buộc
nibxwy
ii
, ,1,1),( 

(2.5
)
Các ràng buộc đảm bảo sự phân lớp chính xác, và cực tiểu ||w||
2
, tƣơng đƣơng với biên cực
đại. Đây là bài toán tối ƣu bậc hai, trong đó nghiệm tối ƣu (w, b) thỏa mãn các ràng buộc

y
i
(<w,x

i
>+b) ≥ 1, với w càng nhỏ càng tốt. Bài toán tối ƣu hóa này có thể đƣợc giải bằng cách sử
dụng các công cụ tiêu chuẩn từ tối ƣu hóa lồi (Boyd và Vandenberghe, 2004).
Trong thực tế, dữ liệu thƣờng không phân chia tuyến tính. Kết quả lý thuyết và thực nghiệm
cho thấy với biên lớn hơn thì SVM biên mềm sẽ cho hiệu quả tốt hơn so với SVM biên cứng. Để
chấp nhận một số lỗi, ngƣời ta thay thế các ràng buộc dạng bất đẳng thức (2.5) với
nibxwy
iii
, ,1,1),( 

trong đó
0
i

là các biến phụ không âm


n
i
i
C
1

đƣợc thêm vào hàm tối ƣu hóa:



n
i
i

imize
bw
Cw
1
2
min
,
2
1

với ràng buộc
0,1),( 
iiii
bxwy


(2.6)
Hằng số C> 0 thiết lập mức độ quan trọng của việc cực đại biên và giảm số lƣợng biến phụ
ξi. Công thức này đƣợc gọi là SVM biên mềm (Cortes và Vapnik, 1995).
2.4.1.5 Hàm nhân kernel
Hàm nhân Kernel: K(x,y) phù hợp với một siêu phẳng trong không gian mới đƣợc định
nghĩa là tập hợp các điểm có tích vô hƣớng với một vectơ cố định trong không gian đó là một hằng
số. Vectơ xác định một siêu phẳng sử dụng trong SVM là một tổ hợp tuyến tính của các vectơ dữ
liệu luyện tập trong không gian mới với các hệ số . Với siêu phẳng lựa chọn nhƣ trên, các điểm x
trong không gian đặc trƣng đƣợc ánh xạ vào một siêu mặt phẳng là các điểm thỏa mãn:
Σ
i
α
i
K(x

i
,x) = hằng số.
Nếu K(x,y) nhận giá trị ngày càng nhỏ khi y xa dần khỏi x thì mỗi số hạng của tổng trên
đƣợc dùng để đo độ tƣơng tự giữa x với điểm x
i
tƣơng ứng trong dữ liệu luyện tập. Nhƣ vậy, tác
dụng của tổng trên chính là so sánh khoảng cách giữa điểm cần dự đoán với các điểm dữ liệu đã
biết. Với tập hợp các điểm x đƣợc ánh xạ vào một siêu phẳng có thể có độ phức tạp tùy ý trong
không gian ban đầu, nên có thể phân tách các tập hợp thậm chí không lồi trong không gian ban đầu.
2.4.2 Thiết lập các tham số
Trong luận văn này, chúng tôi sử dụng thƣ viện libSVM [16] phát triển bởi Chih-Chung
Chang and Chih-Jen Lin tại Đại học Quốc gia Taiwan. Các tham số đƣợc lựa chọn nhƣ sau cho bộ
phân loại hỗ trợ máy vector (SVM). Tham số C đƣợc đặt bằng 1; chúng tôi sử dụng hàm nhân tuyến
tính (linear kernel function)
2.5 Kết luận
Chƣơng hai trình bày hai bƣớc chính của hệ thống nhận dạng thức ăn rau quả tƣơi bằng hình
ảnh. Đây là hai bƣớc chính trong quá trính phân loại ảnh. Với bƣớc đầu tiên sử dụng thuật toán K-

mean cho phân đoạn ảnh đầu vào. Từ đó rút trích đƣợc vector đặc trƣng làm cơ sở cho việc phân
lớp tiếp theo dựa trên thuật toán máy hỗ trợ vector (SVM).

CHƢƠNG 3 THỬ NGHIỆM VÀ ĐÁNH GIÁ
3.1 Giới thiệu
Trong chƣơng này nói về quá trình thu thập dữ liệu từ điện thoại di động. Tập hình ảnh chụp
đƣợc (khoảng 3000-4000 ảnh của 9 loại rau quả khác nhau) từ máy ảnh của điện thoại di động là tập
dữ liệu đầu vào. Chúng đƣợc phân loại bằng tay vào hai nhóm hình ảnh: Hình đơn loại thực phẩm
(mỗi hình chỉ có một loại rau, củ, quả) và hình đa loại thực phẩm (mỗi hình có từ hai loại rau, củ,
quả trở lên). Tập dữ liệu này đƣợc dùng cho việc nhận dạng.

3.2 Thu thập dữ liệu

Hình 3.1: Điện thoại di động Nokia C2-01 Sliver
Hình ảnh thực phẩm rau quả tƣơi đƣợc chụp từ máy ảnh nokia C2-01 Sliver, với Camera
3.2MP. Tập hình ảnh chụp đƣợc gồm 3000-4000 ảnh của 9 loại rau quả khác nhau: cà chua, cam,
chuối, dƣa chuột, hành, nho, ớt, rau cải, táo từ máy ảnh của điện thoại di động là tập dữ liệu đầu
vào.
3.2.1 Tập dữ liệu SingleFood
Trong tập hình ảnh singleFood, mỗi hình ảnh là một loại rau, quả riêng biệt.
Tổng số ảnh chụp đƣợc trong tập dữ liệu này là 1456 hình. Số lƣợng cụ thể từng loại rau quả
đƣợc liệt kê trong bảng 3.1
Bảng 3.1: Bảng số lượng hình ảnh của một loại rau quả
Loại rau quả
Số ảnh
Cà chua
192
Cam
287
Chuối
136
Dƣa chuột
89
Hành
100

Nho
88
Ớt
99

Rau cải
162
Táo
303
TỔNG
1456
3.2.2 Tập dữ liệu Multi-Food
Với tập dữ liệu Multi-Food, hình ảnh thực phẩm thu đƣợc khoảng 1500 ảnh đầu vào. Mỗi
bức hình chụp từ hơn hai loại rau, củ quả khác nhau.
3.3 Thử nghiệm và Đánh giá
Trong thử nghiệm này, do thời gian có hạn, chúng tôi thử nghiệm trên tập dữ liệu
SingleFood (Mỗi ảnh có một loại rau quả) gồm 1456 ảnh đƣợc thu thập (số ảnh thu thập trên tập dữ
liệu MultiFood cũng khoảng 1500 ảnh). Sau giai đoạn trích chọn đặc trƣng, ta thu đƣợc 1456 vector
đặc trƣng từ tập SingleFood. Các vector này đƣợc sử dụng để huấn luyện (training) bộ phân loại
SVM (từ thƣ viện libSVM [16]). Sau đó, chúng tôi sử dụng phƣơng pháp kiểm thử 10-fold cross
validation. Theo phƣơng pháp này, tập dữ liệu đƣợc phân hoạch (ngẫu nhiên) thành 10 phần; ta sử
dụng 9 phần để huấn luyện (training) và một phần còn lại để thử nghiệm (testing); quá trình này lặp
lại cho đến khi tất cả các phần đều đƣợc thử nghiệm. Kết quả cuối cùng là trung bình cộng của cả
10 phần. Kết quả thử nghiệm gồm 2 độ đo Precision và Recall [17] đƣợc tổng hợp trong bảng sau
đây:
Bảng 3.2: Kết quả thử nghiệm trên tập SingleFood
Loại rau quả
Precision
Recall
Cà chua
86.98
88.02
Cam
71.78
67.25

Chuối
84.56
86.03
Dƣa chuột
93.26
84.27
Hành
91
89
Nho
89.77
82.95
Ớt
86.87
91.92
Rau cải
91.98
93.83
Táo
79.54
82.84
TỔNG
83.59
83.1
Trong đó:
Precision =True Positive /(True Positive + False Positive);
Recall = True Positive /( True Positive + False Negative);
Precision: Độ chính xác
Recall: Tỷ lệ thu hồi
True Positive: (Xác thực thực sự hay dƣơng tính thực sự) Số các mục phù hợp đƣợc dán

nhãn thuộc về lớp tích cực (positive class)

True Negative: (Thực sự tiêu cực hay Thực âm) Những mục đƣợc dãn nhãn thuộc về lớp
tích cực nhƣng cần phải có
False Positive: (Không xác thực hay dƣơng tính giả): Những mục đƣợc dán nhãn không
chính xác cũng thuộc lớp tích cực (positive class)
False Negative: (Âm tính giả ) Những mục không đƣợc dán nhãn thuộc về các lớp tích cực
cần phải có đƣợc
Kết quả bảng 3.2 thử nghiệm trên tập dữ liệu singlefood cho thấy:
Tỷ lệ nhận dạng của các loại rau, củ, quả cho độ chính xác cao và tỷ lệ thu hồi đạt xấp xỉ
trên 80% với 1456 hình ảnh của 9 thành phần thực phẩm. Trong đó, dƣa chuột, hành và rau cải có tỷ
lệ nhận dạng cao trên 90% với đặc trƣng về màu sắc của chúng có phần giống nhau, nhƣng đặc
trƣng hình dạng, SURF lại khá riêng biệt. Do đó, có rất ít hình ảnh cho kết quả phân lớp sai khác về
kích thƣớc thực (tức lớn hơn 20%). Những hình ảnh cho phân lớp sai dễ nhầm lẫn về màu sắc nhƣ
cà chua và ớt đỏ. Hay trong một vài trƣờng hợp, có sự giống nhau về đặc trƣng SURF nhƣ cam và
cà chua. Qua đó có thể chứng minh phƣơng pháp nhận dạng hình ảnh dựa trên bề mặt thực phẩm
nhƣ một công nghệ ứng dụng cao trong thực tế.
3.4 Kết luận
Trong chƣơng này, chúng tôi trình bày quá trình thu thập hình ảnh thực phẩm của mƣời loại
rau, củ, quả trong thực tế, tập hình ảnh thu đƣợc là tập dữ liệu đầu vào. Từ đó, phân chia tập dữ liệu
đầu này thành hai tập dữ liệu single-Food và multi-Food. Trong thời gian cho phép, chúng tôi đã
kiểm nghiệm trên tập dữ liệu single-Food với 1456 hình ảnh của 10 loại rau, củ, quả. Kết quả nhận
dạng thu đƣợc đạt độ chính xác và độ thu hồi xấp xỉ trên 80%.
3.5 Thảo luận và hạn chế:

KẾT LUẬN
Kết quả nghiên cứu

Luận văn xây dựng hệ thống nhận dạng rau quả tƣơi ở giai đoạn tiền chế biến dựa trên điện
thoại di động. Hệ thống xây dựng dựa trên hai thuật giải chính: Thuật toán K-mean cho bƣớc đầu
phân đoạn ảnh đầu vào và thuật toán máy hỗ trợ vector (SVM) cho phân lớp ảnh. Kết quả thực
nghiệm trên tập dữ liệu single-Food cho kết quả phân loại chính xác cao và độ thu hồi cao. Là kết
quả đúng đắn cho ứng dụng của hệ thống vào thực tế.
Các hỗ trợ theo dõi chế độ dinh dưỡng
Luận văn xây dựng hệ thống nhận dạng rau quả tƣơi ở giai đoạn tiền chế biến dựa trên điện
thoại di động với một chi phí thấp, tự động, mang tính cá nhân. Hệ thống giúp cho ngƣời dùng quản
lý và theo dõi chế độ dinh dƣỡng hàng ngày hiệu quả và thuận tiện hơn trong việc giữ gìn sức khỏe
và giảm cân. Đối với ngƣời bệnh tiểu đƣờng thì những dữ liệu đƣợc ghi và hiển thị cũng sẽ hỗ trợ
ngƣời chăm sóc và chuyên gia y tế của họ cung cấp các hình thức điều trị chính xác hơn
Các hạn chế
Do có những hạn chế nhất định về mặt thời gian và kiến thức của bản thân, luận văn mới
chỉ dừng lại ở mức thử nghiệm của hệ thống trên một tập dữ liệu single-Food với số lƣợng ảnh khá
khiêm tốn cho việc xác nhận thực phẩm trong hình
Hướng phát triển tiếp
Trong thời gian tới, chúng tôi sẽ tiến hành thử nghiệm hệ thống với tập dữ liệu multi-Food.
Đồng thời, tăng số lƣợng ảnh cần nhận dạng để xây dựng môt hệ thống hoàn chỉnh.

TÀI LIỆU THAM KHẢO
Tiếng Anh:

[1] C.C Cowie et al., “Prevalence of Diabetes and Impaired Fasting Glucose in Adults in the
U.SPopulation: National Health and Nutrition Examination Survey 1999–2002”, Diabetes Care,
2006, pp. 1263-1268.
[2] A. Smailagic and D. Siewiorek, “DIMA: Diabetes Management Assistant Wearable
Computer”, Wearable Computing, IEEE Pervasive Computing, Oct-Dec. 2002, Vol.1, no. 4, pp.71-
73
[3] K.M. Lee, et al., “Effects of Classification Methods on Color-Based Feature Detection

with Food Processing Applications”, IEEE Transactions of Automation Science and Engineering,
Jan. 2007, vol.1 pp. 40-51
[4] Gamage, L.B., de Silva, C.W., and Gosine, R.G., “Statistical pattern recognition for
cutter positioning in automated fish processing”, Communications, Computers and Signal
Processing, 1993., IEEE Pacific Rim Conference on, Volume 2, 19-21 May 1993 Page(s):786 - 789
[5] Aleixos, N., Blasco, J., Molto, E., and Navarron, F., “Assessment of citrus fruit quality
usinga real-time machine vision system”,Pattern Recognition, 2000. Proceedings. 15th International
Conference on, Volume 1, 3-7 Sept. 2000 Page(s):482 - 485
[6] T. Aono, H. Kimura, Y. Yamauchi, “A food recognition algorithm based on dish
recognition”, 28th Annual Conference of the Industrial Electronics Society, IEEE
2002,Volume 2, 5-8 Nov. 2002 Vol.2, pp. 1445 – 1450
[7] F. Takeda; K. Kumada, and M. Takara, “Dish extraction method with neural network for
food intake measuring system on medical use”, Computational Intelligence for Measurement
Systems and Applications, 29-31 July 2003, pp.56 – 59
[8] National Diabetes Fact Sheet:
[9] H. Bay, A. Ess, T. Tuytelaars, and L. van Gool. (2008). Speeded-Up Robust Features
(SURF). Comp. Vis. Image Underst. 110(3), 346-59.
[10] R. Chincha and Y. Tian. (2011). Finding objects for blind people on
SURF features. In Proc. BIBMW.
[11] D. N. Ta, W. C. Chen, N. Gelfand, and K. Pulli. (2009). SURFTrac:
Efficient Tracking and Continuous Object recognition using Local
Feature Descriptors. In Proc. CVPR.
[12] J. Chen, A. H. Kam, J. Zhang, N. Liu, and L. Shue. (2005). Bathroom
activity monitoring based on sound. In Proc. Pervasive.
Internet:
[13]

[14]
[15]

[16] libSVM:
[17]

Nhận dạng thức ăn rau quả tươi bằng hình ảnh

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về