NGHIÊN CỨU VÀ XÂY DỰNG HỆ GIÁM SÁT HOẠT ĐỘNG, HỖ TRỢ CHĂN NUÔI GIA SÚC. TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ ĐIỆN TỬ - VIỄN THÔNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (924.15 KB, 27 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

PHÙNG CÔNG PHI KHANH

NGHIÊN CỨU VÀ XÂY DỰNG HỆ GIÁM SÁT HOẠT ĐỘNG,
HỖ TRỢ CHĂN NUÔI GIA SÚC

Chuyên ngành: Kỹ thuật điện tử
Mã số: 9520203.01
TĨM TẮT LUẬN ÁN TIẾN SĨ CƠNG NGHỆ ĐIỆN TỬ - VIỄN THÔNG

Hà Nội – 2021

Cơng trình được hồn thành tại: Trường Đại học Cơng nghệ, Đại học Quốc Gia Hà Nội
Người hướng dẫn khoa học: PGS. TS. Trần Đức Tân
Phản biện:………………………………………………………………………………..
…………………………………………………………………………………………...
Phản biện:………………………………………………………………………………..
…………………………………………………………………………………………...
Phản biện:………………………………………………………………………………..
…………………………………………………………………………………………

Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp
tại .............................................................................................................................
vào hồi … giờ … ngày … tháng … năm

Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội

MỞ ĐẦU
1. Đặt vấn đề
Việc phân loại hành vi của bị là mợt cách phát hiện sớm các bệnh tật, các tương tác
trong đàn gây ảnh hưởng đến sức khỏe. Hành vi thay đổi khi bị bị bệnh có thể bao gồm
giảm hoạt động thường ngày như hành vi ăn, uống, đi, đứng, nằm. Việc giám sát bò
được tập trung theo ba hướng phổ biến nhất đó là giám sát phân loại hành vi của bò,
phát hiện trấn thương, xác định thời điểm sinh sản của bị.
Mợt hệ thống giám sát hoạt động, hỗ trợ chăn nuôi thường gồm một bợ xử lý trung tâm
thường là máy tính có nhiệm vụ nhận thông tin và xử lý thông tin theo mợt thuật tốn
phân loại hành vi, thơng qua các thơng tin hoạt đợng của bị. Các bợ thu thập thơng tin
về hoạt đợng của bị lấy từ các cảm biến và gửi về cho bợ xử lý trung tâm. Ngồi ra cịn
có hệ thống lưu trữ dữ liệu, đưa dữ liệu lên internet để thuận lợi cho việc giám sát hành
vi của bị, quản lý và xử lý các thơng tin.
2. Mục tiêu nghiên cứu của luận án
Mục tiêu chung: Nghiên cứu xây dựng 01 hệ thống triển khai thu thập dữ liệu gia tốc ba
trục (từ chuyển động của bò) và phân loại hành vi của bò từ dữ liệu cảm biến gia tốc ba
trục gắn trên bò.
Mục tiêu cụ thể:
- Nghiên cứu giải thuật phân loại hành vi bò dựa trên dữ liệu cảm biến gia tốc ba trục
gắn trên bị.
- Đề xuất, xây dựng hệ thống hồn chỉnh phân loại hành vi của bò (bao gồm phần cứng
và phần mềm).
- Nghiên cứu nhóm giải pháp tiết kiệm năng lượng tại nút cảm biến đặt tại sườn dốc.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu ở đây là bị (mợt trong những loại gia súc phổ biến, có giá trị kinh
tế cao). Các cảm biến gắn trên bị là các cảm biến gia tốc, vì thế dữ liệu thu nhận được
là tín hiệu gia tốc thu nhận được từ các chuyển đợng của bị. Ngồi ra, luận án cịn sử
dụng tập dữ liệu cơng khai để đảm bảo tính khách quan của thuật tốn đề xuất.

4. Nội dung nghiên cứu
Đề tài được thực hiện thông qua 4 nợi dung chính như sau
1) Nghiên cứu về các hệ thống giám sát và nhận dạng hành vi của bị.
2) Nghiên cứu các thuật tốn xử lý dữ liệu từ cảm biến để phân loại hành vi của bị.
3) Nghiên cứu giải pháp và mơ hình tích hợp các cảm biến phục vụ việc ghi nhận và xử
lý dữ liệu về hành vi của bò.
4) Xây dựng phần mềm phân loại hành vi của bò và chạy thử nghiệm.
5. Phương pháp nghiên cứu
Kết hợp nghiên cứu lý thuyết, mơ phỏng và thực nghiệm kiểm chứng.
Để có thể thực hiện đề tài thành công, trước tiên phải nghiên cứu, nắm vững được lý
thuyết về các nguyên tắc đo và giám sát hành vi của bò, của cảm biến và các kỹ thuật
1

xử lý tín hiệu tiên tiến để xử lý, đề xuất giải thuật giám sát và phân loại hành vi. Tiếp
đó, các giải thuật và ngun lý hoạt đợng của hệ thống phải được mơ hình hóa và mơ
phỏng để đánh giá tính hiệu quả của giải thuật và hệ thống đề xuất. Sau đó, nghiên cứu
sinh xây dựng thành một hệ cảm biến không dây thu thập dữ liệu thực tế. Cuối cùng, hệ
thống sẽ được kiểm chứng thực nghiệm trong phịng thí nghiệm và tại nơng trại chăn
ni bị.
6. Ý nghĩa khoa học và đóng góp mới của luận án
Luận án này có 3 đóng góp mới
1/ Xây dựng bợ phân loại bảy hành vi của bị sử dụng dữ liệu cảm biến gia tốc ba trục
gắn ở chân bị.
2/ Xây dựng hệ thống mạng cảm biến khơng dây ở đó mỗi nút mạng được gắn lên mợt
con bò. Hai cảm biến gia tốc ba trục được gắn tại vị trí chân và cổ. Dữ liệu gia tốc từ
chân và cổ bị được đồng bợ để phục vụ cho bài tốn phân loại hành vi của bị.
3/ Xây dựng bợ phân loại hành vi của bị sử dụng dữ liệu đồng bộ từ cảm biến gia tốc
gắn chân bò và cổ bò.

2

CHƯƠNG 1. TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU
1.1. Nghiên cứu trên thế giới
Hiện nay trên thế giới có rất nhiều kỹ thuật giúp giám sát sức khoẻ, hoạt động và các
vấn đề sinh sản của vật nuôi trên quy mô lớn. Những kỹ thuật này giúp chủ các trang
trại, công ty hay doanh nghiệp kiểm sốt vật ni của mình, từ đó giúp nâng cao hiệu
quả chăn ni. Tuy nhiên những kỹ thuật được áp dụng hiện tại còn khá thủ công và cần
sự can thiệp sức người. Việc nghiên cứu ra các kỹ thuật và thiết bị mới vẫn luôn là một
chủ để đang được quan tâm mạnh mẽ.
Các trang trại chăn nuôi ngày nay đang phải đối mặt với những thách thức lớn trong việc
giám sát, duy trì sức khỏe về thể chất và tinh thần của vật ni, nó liên quan trực tiếp
đến số lượng và chất lượng sản phẩm chăn nuôi. Các trang trại chăn nuôi có quy mơ từ
trung bình đến lớn rất khó theo dõi vật nuôi thông qua quan sát, dẫn đến các tổn thất cho
trang trại.
1.2. Nghiên cứu trong nước
Trên thực tế, 95% bị trong nước đã được ni mợt cách rải rác bởi các hợ gia đình nhỏ
và khơng có kỹ năng. Nông dân không được đào tạo kỹ thuật chăn ni, biện pháp phịng
bệnh. Nhờ áp dụng các kỹ thuật hiện đại, việc quản lý chuồng trở nên dễ dàng và dễ
dàng hơn Ngoài ra, giá của sản xuất cũng giảm và tiết kiệm lao động. Một số công ty
chế biến sữa tại Việt Nam, nơi thực hiện công nghệ tiên tiến để tăng số lượng chăn nuôi
của họ và cải thiện năng suất và chất lượng sữa tươi. Chẳng hạn như: công ty sữa TH
true milk của Việt Nam, áp dụng công nghệ Israel thông qua công ty AfiMilk. AfiMilk
chính là cơng ty đã mang lại cho Israel thương hiệu đợc tơn trong ngành chăn ni bị
sữa, có trang trại bị sữa cơng nghiệp lớn trên thế giới. Cơng ty VINAMILK ở Việt Nam
đã có đàn bị mà mỗi con bò sử dụng chip điện tử đeo trên cổ được kiểm soát bằng hệ
thống quản lý ALPRO được cung cấp bởi DELAVAL (cơng ty con của tập đồn
TetraPark). Nói chung các thiết bị giám sát hỗ trợ trăn nuôi bị hiện này thường ở dạng
thương phẩm và đợc quyền của các công ty cung cấp nên không phục vụ cho việc nghiên

cứu, cải tiến thiết bị. Các nhóm nghiên cứu, phát triển thiết bị giám sát hành vi của bị ở
việt nam khơng nhiều.
1.3. Một số mơ hình hệ thống cảnh báo thực tế
Vấn đề phức tạp trong việc nhận ra hành vi của động vật đã thúc đẩy các nhóm nghiên
cứu khác nhau đánh giá các kịch bản trong thực tế khác nhau bằng các giải pháp đeo
thiết bị có gắn chứa cảm biến Error! Reference source not found.Error! Reference
source not found.Error! Reference source not found.. Học máy cung cấp một cách
tiếp cận tốt để cải thiện độ chính xác của mơ hình, dựa trên các cấu trúc dữ liệu có thể
thay đổi linh hoạt, trong khi xử lý các bộ dữ liệu lớn và phức tạp thu được từ một môi
trường cụ thể Error! Reference source not found.. Ví dụ Martiskainen và cợng sự
trong nghiên cứu Error! Reference source not found. đã phát triển một phương pháp
sử dụng dữ liệu gia tốc và thuật toán máy vectơ hỗ trợ đa lớp (SVM) để tự động phân
loại một số hành vi ở bị sữa. Trong mợt nghiên cứu tương tự, Diosdado et al Error!
Reference source not found. đã thực hiện thuật toán cây quyết định để phân loại các
3

hành vi gia súc khác nhau. Arcidiacono et al Error! Reference source not found. đã
tính mợt ngưỡng gia tốc để phân loại các hoạt đợng ăn và đứng của bị sữa trong chuồng
ni tự do. Thuật tốn của họ cũng ước tính số bước chân của mỗi con bị từ dữ liệu gia
tốc bằng cách sử dụng các ngưỡng được xác định theo thống kê. Trong nghiên cứu tiếp
theo của họ Error! Reference source not found., các tác giả này đã chỉ ra rằng phương
pháp mới có thể được thực hiện theo cách thức thời gian thực do sử dụng tần số lấy mẫu
thấp (tần số 4 Hz) và độ phức tạp thấp. Họ cũng giải thích hai lý do chính cho việc phân
loại sai giữa ăn và đứng thứ nhất là: khi con bò quay đầu trong khi hoạt đợng ăn thì vị
trí của cảm biến bị lệch. Thứ hai là trong một số trường hợp, ngay cả con bị đang đứng,
đầu vẫn cúi xuống. Cuối cùng, mợt số đề xuất được đưa ra để cải thiện cả hiệu suất phân
loại và thực hiện theo thời gian thực.
1.4. Thách thức trong xây dựng hệ thống
Nói chung các nghiên cứu thường sử dụng cảm biến gia tốc gắn trên cổ bò và chân bò,

hoặc sử dụng cảm biến áp suất gắn trên má bị. Số hành vi phân loại ít thông thường chỉ
là đi, đứng, nằm, ăn. Nhiều nghiên cứu cịn thủ cơng dữ liệu ghi trên thẻ nhớ. Nền tảng
cảm biến không dây cần được nghiên cứu và áp dụng hiệu quả hơn. Bên cạnh đó các
thuật tốn cũng cần được cải tiến để nâng cao hiệu quả phân loại. Trong các nghiên cứu
Error! Reference source not found.Error! Reference source not found.Error!
Reference source not found.Error! Reference source not found. đã chứng minh tiềm
năng của việc sử dụng học máy trong phân loại hành vi bò, họ chỉ phân loại hai hoặc ba
hành vi Error! Reference source not found.Error! Reference source not found., giá
trị tiên đốn dương tính của phân loại không cao Error! Reference source not found.
và thiếu phân tích về các đặc trưng của dữ liệu Error! Reference source not
found.Error! Reference source not found.. Thực tế là hiệu suất của phương pháp
phân loại sẽ phụ thuộc vào các đặc trưng và cửa sổ dữ liệu (liên quan đến số lượng mẫu
của một bản ghi).
1.5. Kết luận chương
Chương 1 trình bày tổng quan về tình hình nghiên cứu trong và ngồi nước. Phân tích
mợt số mơ hình hệ thống giám sát và cảnh báo trượt lở đất do mưa. Chương này đề cập
đến những thách thức khi xây dựng hệ thống giám sát và cảnh báo như xác định vị trí
trượt lở đất, khối lượng trượt, lựa chọn các thơng số cần giám sát, tính ổn định và tin
cậy của hệ thống, cũng như những yêu cầu thực tế về giá thành xây dựng hệ thống giám
sát và cảnh báo.

4

CHƯƠNG 2. THIẾT KẾ, CHẾ TẠO THIẾT BỊ THU DỮ LIỆU
2.1. Thiết kế hệ thống giám sát bị theo mơ hình mạng cảm biến khơng dây
Hệ thống giám sát mơ hình mạng cảm biến khơng dây thường bảo gồm:
- Các thiết bị gắn trên các con bò, thường là 01 thiết bị trên mợt con bị, thiết bị có thể
được gắn ở chân, cổ, mũi hoặc má bị, …, đóng vai trò là nút mạng cảm biến, thu các dữ
liệu phục vụ cho việc giám sát và truyền không dây về nơi thu.

- 01 Thiết bị trung tâm đóng vai trị như mợt nút mạng thu nhận dữ liệu từ các thiết bị
gắn trên bị nhằm mục đích lưu trữ và xử lý dữ liệu, có thể đưa lên internet giúp việc
giám sát thuận lợi qua các thiết bị di động.
Hệ thống cảm biến không dây thu nhận dữ liệu bị được thiết kế cần được đảm bảo mợt
số tiêu chí kỹ thuật sau: 1/ mỗi nút mạng được gắn lên mợt con bị với khoảng cách
truyền tin từ mỗi nút mạng tới nút trung tâm đạt tới 200 m; 2/ dữ liệu gia tốc ở chân và
cổ phải được đồng bộ theo mỗi giây để phục vụ cho bài tốn phân loại; 3/ những thơng
tin khác (ID nhận dạng bị, vị trí bị, phần trăm pin cịn lại của nút mạng) cũng phải giám
sát được nhằm phục vụ cho công tác vận hành.
Trong nghiên cứu này đề xuất hệ giám sát trạng thái hành vi trên bị thơng qua mơ hình
mạng cảm biến khơng dây, mỗi nút mạng sẽ là sự kết hợp của hai thiết bị giám sát gắn
trên cổ bò và chân bò, hai thiết bị được kết nối không dây với nhau và được phát triển
dựa trên cảm biến gia tốc 3 trục giúp việc xác định trạng thái được chính xác hơn (

Hình 1).
433 MHz
Thiết bị cổ bị

Nút trung tâm
UART-USB

2.4 GHz
Thiết bị chân bị

Máy tính

Bị thứ n

Hình 1. Mơ hình mạng cảm biến khơng dây
Hệ thống gồm được chia thành hai phần chính: phần mợt là các thiết bị được gắn trên

bò nhằm đo đạc chuyển đợng tại vị trí chân và cổ bị, phần hai là phần thu dữ liệu, lưu
trữ và xử lý dữ liệu thu được nhằm phân loại và dự đoán hành vi. Phần một gồm hai
thiết bị là: thiết bị đo chuyển động tại chân và thiết bị đo chuyển đợng tại cổ bị, hai thiết
bị này truyền thơng RF với nhau ở tần số 2,4 GHz và tạo thành một nút mạng. Phần hai
5

gồm thiết bị đóng vai trị là nút trung tâm, nhận dữ liệu từ các nút mạng nhờ truyền
thông không dây ở dải tần 433MHz. Nút trung tâm được kết nối với máy tính và dữ liệu
được đưa về máy tính. Máy tính lưu dữ liệu thành các bản ghi phục vụ cho việc lưu trữ,
xử lý và đưa ra phân tích về hành vi của bị.
2.2. Các thiết bị
2.2.1. Thiết bị đo chuyển động gắn vào chân bò
Thiết bị thu dữ liệu ở chân (Hình 2) có kích thước 85×60×35mm, khổi lượng khoảng
300 g. Thiết bị ở chân dùng ATMega328 để xử lý thu tín hiệu gia tốc từ MPU-6050 với
tần số là 10Hz và truyền dữ liệu tới modul khơng dây RF2401. Theo nhà sản xuất đưa
ra thì RF2401 có cự ly phát cực đại khoảng 100m, với ăng ten chìm trên mạch thì thiết
bị phát sóng định hướng. trong điều kiện sử dụng thiết bị ở chân trước bị và ở cổ bị
cách nhau khơng q 2m, nên tỉ lệ lỗi bít rất thấp q trình thử nghiệm khơng cho thấy
lỗi bít, trong khi nhà sản xuất đưa ra lỗi bít khoảng 0.001%.

Hình 2. Thiết bị thu dữ liệu ở chân
2.2.2. Thiết bị đo chuyển động gắn vào cổ bị

Thiết bị thu dữ liệu ở cổ (Hình 3) có kích thước giống thiết bị ở chân 85×60×35mm,
khổi lượng khoảng 300g. Thiết bị ở cổ bò thu dữ liệu gia tốc từ MPU-6050, dữ liệu GPS
từ modul GPS NEO-UBLOX-6M V2. Mặt khác thiết bị ở cố còn thu dữ liệu gia tốc 3
trục từ thiết bị từ chân bị gửi lên, nó kết hợp với dữ liệu ở cổ bị ghép thành mợt bản tin
bao gồm: thơng tin về gia tốc chân bò, gia tốc cổ bò và thơng tin GPS ở cổ bị. Tín hiệu
gia tốc ở chân và ở cổ làm thu nhận với tốc độ 11 mẫu/ giây. Tín hiệu GPS thu nhận với

tần số 0,5Hz. Bản tin tổng hợp sau đó được Lora truyền đến nút trung tâm. Theo nhà
sản xuất đưa ra khoảng cách cực đại của Lora có thể truyền lên tới 10km, tuy nhiên trong
điều kiện nghiên cứu chúng tôi chỉ khảo sát trong khoảng 1km và tỉ lệ lỗi bít rất thấp
dưới 1%.

Hình 3. Thiết bị thu dữ liệu ở cổ

6

2.2.3. Nút trung tâm

Trung tâm thu thập dữ liệu gồm mợt modul thu phát (Hình 4), mợt modul chuyển đổi
dữ liệu UART-USB và mợt phần mềm trên máy tính.

Hình 4. Nút trung tâm thu dữ liệu
2.3. Căn chỉnh cảm biến và chuẩn hóa dữ liệu
2.3.1. Căn chỉnh cảm biến
Thu nhận dữ liệu và tiền xử lý dữ liệu là cần thiết trong các hệ đo. Các cảm biến
mặc dù đã được căn chỉnh tại nơi sản xuất nhưng vẫn cần được hiệu chỉnh trong hệ thống
mà nó được sử dụng. Căn chỉnh là một phương pháp cải thiện hiệu năng của cảm biến
bằng cách loại bỏ hoặc giảm thiểu sai số trong dữ liệu đầu ra cảm biến. Lỗi cảm biến
phân làm 2 loại là lỗi tất định và lỗi ngẫu nhiên.
2.3.2. Chuẩn hóa dữ liệu
Chuẩn hóa giải đo từ giá trị thô dùng modul MPU6050. Modul MPU6050 thiết lập
để do giá trị 16 bit có các giải đo ±2, 4, 8, 16g.
2.4. Kết luận chương
Cảm biến gia tốc ba chiều cung cấp một phương pháp không xâm lấn để phân loại
hành vi của bò trong điều kiện trang trại. Đóng góp của chương này là đã thành cơng
trong việc xây dựng một mạng cảm biến không dây gắn trên bị mà ở đó mỗi nút mạng

sẽ thu thập dữ liệu đồng bợ từ chân và cổ bị. Cơng trình khoa học liên quan tới chương
này là số 4, 5 và 6.

7

CHƯƠNG 3. ĐỀ XUẤT THUẬT TOÁN HỌC MÁY PHÂN LOẠI HÀNH VI
CỦA BỊ
3.1. Dữ liệu sử dụng
Chúng tơi sử dụng tập dữ liệu công khai trực tuyến trong nghiên cứu của Jun Wang và
cộng sự Error! Reference source not found. tại địa chỉ:
/>Bảng 1 tóm tắt các định nghĩa của hành vi trong tập dữ liệu này.
Bảng 1. Mô tả các hành vi
Định nghĩa hành vi
Ăn
Bò đang ở khu vực ăn, tìm kiếm hoặc ăn thức ăn.
Nằm
Con bị ở trong buồng trong tư thế nằm.
Đứng
Con bị đứng hồn tồn bằng bốn chân.
Bị chùng mợt chân trước, hạ thấp chân trước, sau đó hạ chân sau xuống ở
Nằm xuống
trạng thái nằm.
Đứng lên
Con bò vươn lên từ trạng thái nằm để đứng bằng cả bốn chân.
Đi bình Hoạt đợng được đặc trưng bởi ít nhất 3 cử đợng chân liên tiếp (mợt bước
thường
tiến trong khoảng thời gian 1 giây).
Đi nhanh Con bò tiến nhanh về phía trước với những bước dài (hai bước tiến trong
khoảng thời gian 1 giây của video).

Tập dữ liệu được đề xuất của chúng tôi là một quan sát được gắn nhãn trong tập dữ liệu
chứa 16 mẫu dữ liệu gia tốc, mỗi mẫu được ghi lại theo ba trục vng góc với tốc đợ lấy
mẫu là 1Hz.
3.2. Phương pháp phân loại đề xuất

Các đặc trưng và cửa sổ dữ liệu rất quan trọng đối với việc thực hiện các thuật
toán phân loại. Các đặc trưng của dữ liệu được trích xuất dựa trên cửa sổ thời
gian. Để tìm đợ dài cửa sổ tốt nhất, chúng tơi đã thực hiện một số so sánh với vấn
đề nhận biết hoạt đợng của con người (HAR) trong đó tín hiệu gia tốc được lấy
mẫu ở tốc độ lấy mẫu cao hơn nhiều (ví dụ: 50 Hz) so với dữ liệu bị của chúng
tơi (ở tần số 1 Hz). Trong bối cảnh của vấn đề HAR, các cửa sổ cỡ trung bình (dài
từ 5 đến 7 giây) hoạt đợng tốt nhất từ một loạt các cửa sổ từ 1 đến 15 giây cho
cảm biến gia tốc đặt ở cổ tay. Vì bị sữa ít hoạt đợng hơn con người, chúng tơi có
thể sử dụng chiều dài cửa sổ dài hơn cho nghiên cứu của chúng tôi.
Phương pháp của chúng tôi để phân loại hành vi của bò sử dụng 5 đặc điểm của dữ liệu
gia tốc, đó là: giá trị trung bình, trung vị, SD, RMS và dải giá trị. Lí do lựa chọn 5 loại
đặc trưng này dựa vào bản chất của tín hiệu sử dụng để phân loại. Đây là các tín hiệu
theo chuỗi thời gian (giá trị gia tốc thu được thay đổi theo thời gian). Với loại tín hiệu
này thì các kỹ sư có thể khai thác thông tin trên miền thời gian và / hoặc miền tần số.
Tuy nhiên nếu lựa chọn khai thác đặc trưng miền tần số sẽ dẫn đến đợ phức tạp tính tốn
lớn. Chính vì thế, NCS lựa chọn việc khai thác các đặc trưng trên miền thời gian, cụ thể
là các độ đo bậc 1 và 2 để giảm thiểu độ phức tạp tính tốn những vẫn đảm bảo phân
loại chính xác. Những thử nghiệm khác nhau đã được tiến hành với các độ đo để ước
8

lượng khả năng phân loại hành vi dựa vào sự khác biết biệt các giá trị độ đo thu được.
Cuối cùng cịn 5 đặc trưng nói trên được lựa chọn. Chúng tôi đã đề xuất một lựa chọn
cửa sổ và sơ đồ trích xuất đặc trưng cho q trình nhận dạng. Q trình nhận dạng bắt
đầu với đặc trưng trích xuất dữ liệu gia tốc. Chúng tôi đã sử dụng cửa sổ trượt có đợ

rợng cố định là n giây (bản ghi thứ i có n mẫu, bao gồm n-6 mẫu cuối cùng của bản ghi
i-1) trên dữ liệu của từng hành vi. Từ mỗi cửa sổ, một vectơ gồm 5 đặc trưng sẽ được
thu thập. Tồn bợ q trình nhận dạng hành vi được thể hiện trong Hình 5.

Hình 5. Quy trình nhận dạng hành vi.
Hình 6 phác thảo quy trình xây dựng của bợ phân loại trong nghiên cứu này.

Hình 6. Lưu đồ quá trình xây dựng của bộ phân loại.

9

Ở đây 60% dữ liệu được chọn ngẫu nhiên làm tập dữ liệu đào tạo và 40% còn lại được
sử dụng làm tập dữ liệu thử nghiệm. Bộ phân loại đã được đào tạo với các đặc trưng
được tính tốn từ các phép đo gia tốc (đầu vào) và hành vi khớp (đầu ra). Mơ hình phân
loại kết quả đã được thử nghiệm và các chỉ số hoạt động của mơ hình được tính tốn từ
tập dữ liệu thử nghiệm đợc lập. Mợt chương trình được viết bằng Python đã được phát
triển áp dụng các thuật tốn học có giám sát khác nhau để kiểm tra tính hiệu quả của
phương pháp được đề xuất.
Trong nghiên cứu học máy này, mỗi đặc trưng là mợt tḥc tính có thể đo lường được
của dữ liệu gia tốc. Thiết kế các đặc trưng là mợt bước quan trọng cho hiệu quả phân
loại. Đóng góp mới trong phần này là chúng tơi đã đề xuất một bộ đặc trưng hiệu quả
để phân loại bảy hành vi của bò. Với các đặc trưng tốt, các thuật tốn học máy sẽ tìm
thấy những gì chúng ta đang cần. Ví dụ: Giá trị trung bình (mợt trong các đặc trưng của
chúng tôi) của dữ liệu gia tốc rõ ràng khác nhau giữa Nằm và Ăn. Cụ thể, các đặc trưng
được tính tốn (trung bình, SD, RMS, trung vị, dải giá trị) của từng dữ liệu trạng thái
tĩnh và trạng thái động theo 3 trục X, Y và Z đã được trình bày.
Dải giá trị có thể được chọn làm một đặc trưng để nắm bắt sự khác biệt giữa giá trị cao
nhất và thấp nhất giữa các trạng thái đó.
(3.1)

range(X j )   min iN1  xi  , max iN1  xi 
trong đó X là dữ liệu của trục X;
Xj là bản ghi j;
N là số lượng mẫu của mợt bản ghi (kích thước cửa sổ);
Xi là mẫu i của bản ghi Xj;
min là giá trị tối thiểu của Xj;
max là giá trị tối đa của Xj;
Dải giá trị range(Xj ) là khoảng cách giữa giá trị tối thiểu và giá trị tối đa của Xj.
Dữ liệu trạng thái tĩnh có xu hướng có mợt giá trị điển hình khác nhau. Giá trị trung
bình có thể đề cập đến các phép đo của xu hướng trung tâm và trung vị cho phép đo giá
trị tiêu biểu như các đặc trưng để phân biệt trạng thái tĩnh với trạng thái động và cũng
để phân loại trạng thái tĩnh với nhau. Công thức biểu diễn của trị trung bình và trung vị:
1
N
m( X j )   i 1 xi
(3.2)
N
median( X j ) 

x# N /2  x# N /21
2

(3.3)

trong đó m(Xj) là trung bình của Xj, các giá trị xi trong Xj được sắp xếp. Giữa bốn trạng
thái đợng, dữ liệu Đi bình thường (SD khoảng 0,5) có xu hướng tập trung hơn các trạng
thái khác (SD hơn 1). Dữ liệu đi nhanh (SD khoảng 1,5) có phạm vi giá trị lớn nhất và
cũng là dữ liệu thưa thớt nhất. Vì vậy, đợ lệch chuẩn đã nắm bắt những khác biệt giữa
các trạng thái này.
 (X j ) 

1
k
( xi  m)2

i 1
N

10

(3.4)

trong đó  (Xj) là đợ lệch chuẩn của Xj. Dữ liệu khi Nằm xuống có nhiều giá trị khơng
khác dữ liệu đứng lên nhiều. Điều này dẫn chúng ta đến việc sử dụng RMS để đo đặc
tính này.
(3.5)
2
1
N
RMS X j 

N



i 1

xi

trong đó RMSXj là bình phương trung bình gốc của Xj. Lưu ý rằng tất cả các công thức
(3.1- 3.5) đều dành cho trục X; công thức cho trục Y, trục Z tương tự.
Chúng tôi đánh giá hiệu suất phân loại của 4 thuật toán học máy riêng lẻ (Cây quyết
định tăng cường Gradient, Máy vectơ hỗ trợ, Rừng ngẫu nhiên và K-Nearest Neighbor)
với các cửa sổ khác nhau (6 giây, 12 giây, 16 giây và 20 giây) với 5 đặc trưng đã nói ở
trên (giá trị trung bình, trung vị, SD, RMS và dải giá trị). Hiệu suất của mơ hình được
đánh giá dựa trên bốn chỉ số hiệu suất. Cuối cùng, chúng tôi đã so sánh về hiệu suất tổng
thể với các nghiên cứu của Jun Wang và cộng sự Error! Reference source not found.
và Martiskainen và M. Jarvinen Error! Reference source not found..
Chúng tôi sử dụng các định nghĩa sau:
- TP: Một kết quả phân loại là dương tính thật, khi kết quả phát hiện hành vi và hành vi
đó xuất hiện.
- TN: Mợt kết quả phân loại là âm tính thật, khi kết quả khơng phát hiện hành vi và hành
vi đó khơng xuất hiện.
- FP: Mợt kết quả phân loại là dương tính giả, khi kết quả phát hiện hành vi nhưng hành
vi đó khơng xuất hiện.
- FN: Mợt kết quả phân loại là âm tính giả, khi kết quả khơng phát hiện hành vi nhưng
hành vi đó xuất hiện.
Chúng tơi đã đánh giá hiệu suất của thuật tốn dựa trên đợ chính xác, đợ nhạy, giá trị
tiên đốn dương và giá trị tiên đốn âm.
- Acc (Đợ chính xác): Xác định bằng tỷ số giữa “số dự đoán đúng” với “Tổng số dự
đốn”.
- Sen (Đợ nhạy): Đo khả năng phân loại để phát hiện hành vi khi có hành vi.
- PPV (Giá trị tiên đốn dương tính): Trình bày tỷ lệ phân loại dương tính.
- NPV (Giá trị tiên đốn âm): Thể hiện tỷ lệ phân loại âm tính.
Từ các định nghĩa, chúng tơi có các cơng thức:
TP + TN
Acc 
(3.6)
TP + FP + FN + TN

TP
Sen 
(3.7)
TP + FN
TP
PPV 
(3.8)
TP + FP
TN
NPV 
(3.9)
TN + FN
trong đó TP (True Positives) là dương tính thật (tất cả đều dương), TN (False
Positives) là âm tính thật, FP (False Positives) là dương tính giả và FN (False
Negatives) là âm tính giả. Acc được biểu thị cho đợ chính xác, Sen là đợ nhạy, PPV là
giá trị tiên đoán dương và NPV là giá trị tiên đoán âm.
11

3.3. Kết quả
Thử nghiệm được dùng để đánh giá hiệu quả phân loại của 4 phương pháp học máy
riêng lẻ khi được thử nghiệm với các cửa sổ khác nhau (6 giây, 12 giây, 16 giây và 20
giây) và 5 đặc trưng (phần 3.2). Chúng tôi so sánh giữa GBDT, SVM, Rừng ngẫu nhiên
và K hàng xóm gần nhất (KNN). Trên Error! Reference source not found., bằng cách
sử dụng cùng mợt bợ dữ liệu đầu vào (phần 3.1). Đợ chính xác và độ nhạy khi sử dụng
các cửa sổ 6 giây, 12 giây, 16 giây và 20 giây đã được khai thác. Đợ chính xác tổng thể
được tính là đợ chính xác trung bình cho 7 hành vi. Đợ nhạy tổng thể được tính theo
cách tương tự. Thuật tốn GBDT (cửa sổ 16 giây) đạt hiệu suất cao nhất (độ chính xác
86,3% và đợ nhạy 80,6%). Error! Reference source not found. cho thấy hiệu suất của
các thuật toán phân loại này.

Trong mọi trường hợp, có sự phụ tḥc lớn vào kích thước cửa sổ, đợ chính xác
và đợ nhạy tổng thể tăng theo kích thước cửa sổ cho tất cả các thuật tốn được xem
xét. Từ kết quả, có thể nói rằng xu hướng chung là kích thước cửa sổ có ảnh hưởng đến
hiệu suất phân loại. Mợt cửa sổ phù hợp sẽ giảm gánh nặng tính tốn của các thuật toán
phân loại cũng như ảnh hưởng của nhiễu. Tuy nhiên nếu chiều dài cửa sổ trở nên quá
lớn, xác suất mợt cửa sổ nhất định có nhiều hơn mợt hoạt động sẽ tăng lên, độ trễ trước
khi đầu ra phân loại có thể tăng lên và số lượng dữ liệu học cũng sẽ giảm. Xem xét tất
cả các tùy chọn ở trên, chúng tơi thấy rằng thuật tốn GBDT (cửa sổ 16 giây) có thể đạt
được hiệu suất cao nhất, với đợ chính xác tổng thể 86,3% và đợ nhạy tổng thể 80,6%.
Các kết quả chi tiết của việc sử dụng trình phân loại GBDT (cửa sổ 16 giây) mang lại
hiệu suất tổng thể tốt nhất (phần 3.1) được trình bày trong Bảng 2. Trong Bảng 2 các ma
trận nhầm lẫn đạt được từ việc phân loại dữ liệu thử nghiệm hành vi bị (1456 bản ghi,
đã giải thích trong phần 3.1) theo thuật toán GBDT (cửa sổ 16-giây). Bảng 2 cho thấy
số trường hợp được xác định chính xác là dương tính (hành vi được mơ hình hóa), như
cũng như xác định chính xác là âm tính (các hành vi khác). Các trường hợp mợt mẫu âm
tính đã được phân loại sai thành dương tính và ngược lại, được gọi là dương tính giả và
âm tính giả, tương ứng.
Bảng 2. Các ma trận nhầm lẫn đạt được từ việc phân loại dữ liệu thử nghiệm hành vi
bò sữa.
Dự đốn hành vi
Hành vi
Nằm
Đứng Đi bình
Tồn
Ăn
Nằm Đứng
Đi nhanh
thực tế
xuống
lên

thường
bợ
Ăn
0
23
0
0
0
0
243
220
Nằm
0
0
0
0
0
0
290
290
Đứng
57
0
0
0
2
0
179
120
Nằm xuống

0
0
0
53
0
5
129
71
Đứng lên
0
0
0
47
3
5
120
65
Đi bình
0
0
0
1
0
0
291
290
thường
Đi nhanh
0
0

0
2
2
0
204
200
Tồn bợ
277
290
143
121
120
295
210
1456

12

Theo Bảng 2, nằm (290/290), đi bình thường (290/291) và đi nhanh (200/204) đã được
phân loại tốt, chỉ có mợt vài phân loại sai về các hành vi xảy ra (1/291 Đi bình thường
và 4/204 đi nhanh). Ăn và đứng được phân loại sai với nhau (57/179 ăn được phân loại
sai là đứng và 23/243 đứng được phân loại sai là ăn). Nằm xuống được phân loại sai với
đứng lên (53/129 nằm xuống được phân loại sai là đứng lên và 47/120 đứng lên được
phân loại sai là nằm xuống). Hiệu suất của mơ hình được đánh giá dựa trên bốn chỉ số
(phần 3.2), cụ thể là đợ chính xác (7), độ nhạy (8), PPV (9) và NPV (10) như trong Bảng
3.
Bảng 3. Tóm tắt các chỉ số hiệu suất của thuật toán GBDT cho tất cả các hành vi.
Các chỉ số
Đợ chính xác

Đợ nhạy
PPV
NPV
Ăn
94,0%
90,5%
79,4%
97,8%
Nằm
100%
100%
100%
100%
Đứng
93,9%
67,0%
83,9%
95,1%
Nằm xuống
92,1%
55,0%
58,7%
95,3%
Đứng lên
91,9%
54,2%
54,2%
95,6%
Đi bình thường
99,5%

99,7%
98,3%
99,9%
Đi nhanh
98,9%
98,0%
95,2%
99,6%
Hiệu suất tổng thể của mơ hình GBDT là tốt. Đợ nhạy là cao (> 90%) cho tất cả các
lớp trừ đứng (67%), nằm xuống (55%) và đứng lên (54,2%). Độ chính xác là rất tốt
cho tất cả các lớp (> 91,9%) hành vi, cũng như cho hiệu suất phân loại tổng thể. PPV
tốt cho việc nằm (100%), đứng (83,9%), ăn (79,4%), đi bình thường (98,3%), đi
nhanh (95,2%). Các giá trị PPV thấp hơn cho đứng lên (54,2%) và nằm xuống
(58,7%) cho thấy rằng bợ phân loại có vấn đề dự đốn chính xác các trường hợp
dương tính trong các lớp này, điều này cho thấy thêm rằng các mẫu hành vi này dễ bị
nhầm lẫn nhất với các hành vi khác. NPV cũng xuất sắc cho tất cả các lớp (> 95%) hành
vi.
Chúng tôi đã so sánh chi tiết về hiệu suất tổng thể với công việc của Jun Wang khi sử
dụng cùng một bộ dữ liệu. Bảng 4 cho thấy kết quả so sánh khi chúng tôi sử dụng phương
pháp đánh giá trung bình vĩ mơ (macro), tính tốn số liệu một cách độc lập cho từng lớp
và sau đó lấy trung bình (do đó xử lý với tất cả các phân loại bình đẳng). Bảng 5 cho
thấy kết quả so sánh khi chúng tôi sử dụng phương pháp đánh giá trung bình vi mơ
(micro), tổng hợp sự đóng góp của tất cả các lớp vào các giá trị trung bình được tính
tốn.
Bảng 4. Các chỉ số hiệu suất tổng thể được sử dụng
phương pháp đánh giá trung bình vĩ mô.
Jun Wang và cộng sự Error!
Các chỉ số
Kết quả của chúng tơi
Reference source not found.

Đợ chính xác
92,3%
95,8%
Đợ nhạy
79,1%
80,6%
PPV
82,1%
81,4%
NPV
Khơng cung cấp
97,6%
13

Bảng 5. Các chỉ số hiệu suất tổng thể được sử dụng phương pháp đánh giá trung bình
vi mơ.

Các chỉ số

Jun Wang và cộng sự Error!

Kết quả của chúng tôi

Reference source not found.

Đợ chính xác

86,6%

96,6%

Đợ nhạy

85,2%

86,3%

PPV

79,8%

86,0%

NPV

Khơng cung cấp

98,3%

3.4. Kết luận chương
Tóm lại, trong chương này NCS đã đề xuất mợt bợ phân loại các hành vi của bị mợt cách hiệu
quả. Dữ liệu được tạo ra bởi cảm biến gia tốc được sử dụng để huấn luyện sử dụng một số phân
loại, bao gồm KNN, SVM, Rừng ngẫu nhiên và Cây quyết định tăng cường Gradient được hỗ
trợ bởi thư viện Scikit-learn library1. Công bố khoa học liên quan tới chương này là cơng trình
số 2 và 3.

Scikit-learn library là mợt thư viện Python mã nguồn mở có các cơng cụ mạnh mẽ để phân tích dữ liệu và khai
thác dữ liệu.
1

14

CHƯƠNG 4. PHÂN LOẠI HÀNH VI SỬ DỤNG DỮ LIỆU ĐỒNG BỘ TỪ
CHÂN VÀ CỔ BỊ
4.1. Động lực nghiên cứu
Có hai cách tiếp cận phổ biến để thu thập dữ liệu gia tốc từ mợt con bị: cảm biến gia
tốc có thể được gắn vào chân hoặc cổ của bị. Một số nghiên cứu dựa trên dữ liệu gia
tốc gắn cổ Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found., một số nghiên cứu khác dựa trên dữ liệu
gia tốc gắn chân Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.. Sự lựa chọn chân hay cổ phụ thuộc vào
những hành vi được tập trung vào, chẳng hạn như dữ liệu gia tốc được gắn trên cổ sẽ tốt
hơn để phân biệt hành vi ăn. Tuy nhiên, việc sử dụng cảm biến gia tốc chỉ ở chân hoặc
cổ có thể dẫn đến mợt số hành vi phân loại nhầm lẫn nhau. Ví dụ nếu chúng chứa các
hành vi tương tự chẳng hạn như đứng và ăn (trong trường hợp dữ liệu gia tốc được gắn
trên chân). Sự giới hạn này thường đến từ chính dữ liệu. Nó cho thấy rằng trong loại vấn
đề này, dữ liệu quan trọng hơn các phương pháp học máy. Do đó, chúng tôi đề xuất một
cách tiếp cận mới tập trung vào việc cải thiện chất lượng dữ liệu.
4.2. Dữ liệu sử dụng
Gắn mợt cảm biến gia tốc vào chân bị và mợt cảm biến gia tốc vào cổ bị là cách thức
để theo dõi hành vi của từng con bò. Các chuyển động của chân và cổ thông qua cảm
biến gia tốc được chuyển đổi thành tín hiệu điện, được gửi đến bộ vi điều khiển của chân
và một bộ vi điều khiển khác ở cổ. Dựa trên các quan sát trực tiếp về hành vi bị, chúng
tơi đã gắn nhãn dữ liệu của mình (tức là gán hành vi theo cách thủ công mà dữ liệu được
thu thập tại thời điểm đó tương ứng với) thành bốn loại hành vi khác nhau
Điểm mấu chốt của nghiên cứu là đồng bộ hóa dữ liệu gia tốc giữa chân và cổ. Trong
trường hợp tốt nhất, khơng có dữ liệu nào bị mất trong q trình thu thập dữ liệu, và

khơng có dữ liệu nào bị mất trong quá trình truyền dữ liệu từ chân đến cổ bị. Sau đó cứ
mỗi 0,1 giây, bộ vi điều khiển trên cổ nhận được hai khung dữ liệu được đồng bợ hóa
theo thời gian. Chúng tơi sử dụng mười khung dữ liệu từ chân để tính trung bình nhằm
thu được mợt khung dữ liệu với tốc độ cập nhật là một giây. Tương tự như vậy, mười
khung dữ liệu từ cổ sẽ được tính trung bình để thu được một khung dữ liệu với tốc độ
cập nhật là mợt giây. Mục đích của việc lấy trung bình là làm mịn dữ liệu, loại bỏ thành
phần nhiễu tần số cao. Nếu dữ liệu bị mất trong quá trình thu thập dữ liệu, hoặc thơng
tin bị mất trong quá trình truyền dữ liệu từ thiết bị chân sang thiết bị cổ thì sẽ xử lý như
sau:
+ Lấy số mẫu gia tốc chân bị nhận được trong mợt giây gọi là N, N sẽ có giá trị nhỏ
hơn 10, tính trung bình cợng giá trị gia tốc của N mẫu thu được trên mỗi trục X, Y, Z.
+ Lấy số mẫu gia tốc nhận được từ cổ bò trong mợt giây gọi là M, M sẽ có giá trị nhỏ
hơn 10, tính trung bình cợng giá trị gia tốc của M mẫu thu được trên mỗi trục X, Y, Z.
+ Xóa các mẫu có giá trị trung bình chỉ tồn tại ở chân hoặc cổ. Chúng tôi lưu các giá trị
trung bình mà thơng tin thời gian (tính bằng giây) tồn tại ở cả chân và cổ.

15

Thiết bị ở cổ có dữ liệu gia tốc cổ và chân được đồng bợ hóa từng giây và được đóng
gói thành mợt siêu khung bao gồm các thành phần sau:
+ Mã định danh (ID) của bị
+ Thời gian tính theo từng giây
+ Phần trăm pin còn lại trong thiết bị cổ và chân
+ Gia tốc ba trục X, Y, Z đo ở chân bò.
+ Gia tốc ba trục X, Y, Z đo ở cổ bị.
Dữ liệu đóng gói được gửi đến nút trung tâm thông qua mô-đun giao tiếp LoRa. Pin của
nút cảm biến là pin Lithium có dung lượng 6600mAh và điện áp làm việc là 3,7V. Tổng
công suất trung bình trong mơ hình hoạt đợng của nút cảm biến của chân là 68,99 mW.
Do đó, thời gian lý thuyết của lần sạc tiếp theo là 22440mWh / 68,99 mW = 325 giờ

(hoặc 13,5 ngày). Tương tự, thời gian sạc tiếp theo của nút cảm biến của cổ là
22440mWh / 134,99 mW = 166 giờ (hoặc bảy ngày). Tuổi thọ của nút cảm biến cổ nhỏ
hơn so với nút chân vì nó bao gồm mợt mơ-đun LoRa.
Việc phân loại các hành vi của bò được thực hiện trên máy tính. Các thiết bị hỗ trợ
Internet như điện thoại hoặc máy tính có thể truy cập và theo dõi tình trạng của từng con
bị trong thời gian thực.
Năm con bị trong thử nghiệm của chúng tơi được chỉ định năm ID tương ứng (ID1, ID2,
ID3, ID4 và ID5). Để đánh giá sự thích nghi của con bị khi đeo thiết bị, những con bị
được chia thành hai nhóm. Các cảm biến được gắn vào bị của nhóm đầu tiên (bao gồm
ID1 và ID4) hai tuần trước khi thử nghiệm, và cho bị của nhóm cịn lại (bao gồm ID2,
ID3 và ID5) vào ngày thử nghiệm. 20 mẫu / giây là tốc đợ lấy mẫu của tín hiệu thơ;
chúng tơi lấy trung bình ở mợt mẫu / giây để lưu trữ tín hiệu lấy mẫu xuống. Khơng có
hạn chế hoặc ảnh hưởng đến các hoạt đợng của bị được cơng nhận trong q trình thử
nghiệm. Ba bợ dữ liệu được tạo từ dữ liệu gia tốc của năm con bò. Tập dữ liệu đầu tiên
(DATASET01) chứa dữ liệu từ cảm biến gắn trên chân, tập dữ liệu thứ hai
(DATASET02) bao gồm dữ liệu từ cảm biến gắn trên cổ và tập dữ liệu thứ ba
(DATASET03) đã đồng bợ hóa dữ liệu từ cảm biến gắn trên chân và gắn trên cổ. Phân
loại hành vi của bò được áp dụng cho tất cả các bộ dữ liệu này để đánh giá hiệu suất của
cùng một phương pháp với các cấu trúc dữ liệu khác nhau.
Bảng 6. Các hành vi phân loại
Hành vi
Định nghĩa
Ăn
Bò ăn (nhai và lấy thức ăn dùng miệng)
Nằm
Bò ở tư thế nằm nghỉ ngơi.
Đứng
Bò đứng trên tất cả 4 chân.
Đi
Bị bước trong vịng 1 giây (ít nhất 3 cử động chân liên tiếp).

4.3. Phương pháp phân loại đề xuất
Hình 7 cho thấy quy trình mà chúng tơi sử dụng trong nghiên cứu này. Dữ liệu gia
tốc chân và ở cổ được đồng bợ hóa được hiển thị với độ dài cố định: bản ghi thứ i chứa
dữ liệu gia tốc 16 giây (16 mẫu), bao gồm dữ liệu gia tốc mười giây cuối cùng (10 mẫu
cuối cùng) của bản ghi thứ (i-1). Ở chương này chúng tôi chỉ sử dụng các đặc trưng
gồm: RMS, độ lệch chuẩn (SD) và giá trị trung bình cho tất cả các bản ghi. Dữ liệu được

16

gắn nhãn dựa trên những quan sát thực tế về hành vi của bị gồm có bốn hành vi: đi, ăn,
nằm và đứng.

Hình 7. Quy trình phân loại hành vi bị.

Hình 8. Quy trình hoạt động của bộ phân loại
Dữ liệu huấn luyện được lựa chọn ngẫu nhiên trong 60% của bợ dữ liệu; phần cịn lại
(khoảng 40%) là dữ liệu thử nghiệm. Sự phân chia này đã được chứng minh là phù hợp
với bài tốn phân loại tập tính bị Error! Reference source not found.Error!
Reference source not found.. Mơ hình phân loại được đào tạo bằng dữ liệu đào tạo
được gắn nhãn dựa trên bộ đặc trưng được đề xuất.

17

4.4. Kết quả
Thử nghiệm được đưa ra để đánh giá hiệu suất phân loại của thuật toán RF được áp dụng
với cửa sổ 16 giây và ba đặc trưng (trung bình, SD và RMS). Chúng tơi đã so sánh hiệu
suất phân loại về đợ chính xác, đợ nhạy và PPV. Nghiên cứu quan tâm đến bốn loại hành
vi trong nghiên cứu này: đứng, ăn, nằm và đi. Những hành vi này cũng có thể được chia

thành hai nhóm: 1 / đứng và ăn; và 2 / nằm và đi. Nếu chúng ta quan sát vị trí của cảm
biến gia tốc, cảm biến được gắn trên cổ dự kiến sẽ có hiệu suất tốt trong nhóm đầu tiên.
Cảm biến gắn trên chân được kỳ vọng sẽ có hiệu suất tốt lần lượt ở nhóm thứ hai. Trên
Hình 9, DATASET01 (đen) chứa dữ liệu từ cảm biến gắn trên chân. DATASET02 (màu
đỏ) chứa dữ liệu từ cảm biến được gắn trên cổ. DATASET03 (màu xanh lam) chứa dữ
liệu được đồng bợ hóa từ các cảm biến được gắn ở chân và được gắn trên cổ. Hình 9 cho
thấy số lượng TP cho nhóm đầu tiên (đứng và ăn) trên tập dữ liệu của năm con bò trong
các kịch bản của chúng:
+ Dữ liệu từ chân (tức là DATASET01)
+ Dữ liệu từ cổ (tức là DATASET02)
+ Dữ liệu được đồng bợ hóa từ chân và cổ (tức là DATASET03)
Dữ liệu được đồng bộ hóa từ các cảm biến gắn trên chân và gắn trên cổ (DATASET03)
cung cấp số lượng TP lớn nhất. Tổng số hành vi đứng và ăn là 865, 817, 735, 813, 622
(Error! Reference source not found.B), số lượng các TP là 853, 723, 634, 764, 534
(Error! Reference source not found.) cho các con bò ID1, ID2, ID3, ID4, ID5. Điều
thú vị là số lượng TP từ cảm biến gắn trên cổ (DATASET02) nhiều hơn so với cảm biến
gắn ở chân (DATASET01).
1000

853
764

723

800

634
534

600

400
200
0
ID1

ID2

DATASET01

ID3
DATASET02

ID4

ID5

DATASET03

Hình 9. TP của hành vi đứng và ăn
Hình 10 với DATASET01 (đen) chứa dữ liệu từ cảm biến gắn trên chân. DATASET02
(màu đỏ) chứa dữ liệu từ cảm biến được gắn trên cổ. DATASET03 (màu xanh lam) chứa
dữ liệu được đồng bợ hóa từ các cảm biến được gắn ở chân và được gắn trên cổ. Hình
10 cho thấy số lượng TP của nhóm thứ hai (nằm và đi) trên tập dữ liệu của năm con bò
trong các kịch bản trên. Dữ liệu được đồng bợ hóa từ các cảm biến gắn trên chân và gắn
trên cổ (DATASET03) cung cấp số lượng TP lớn nhất. Tổng số lần nằm và và đi được
quan sát là 570, 370, 185, 513, 547 (Error! Reference source not found.(b)), số TP là
564, 369, 185, 511, 547 tương ứng cho các con bò ID1, ID2, ID3, ID4, ID5. Như chúng

18

tôi mong đợi, số lượng TP từ cảm biến gắn trên chân (DATASET01) lớn hơn so với
cảm biến gắn trên cổ (DATASET02).
564

600

547

511

500
369

400
300

185

200
100
0
ID1

ID2

DATASET01

ID3
DATASET02

ID4

ID5

DATASET03

Hình 10. TP của nằm và đi.
Bảng 7 trình bày kết quả của phương pháp đánh giá trung bình vĩ mơ và phương pháp
đánh giá trung bình vi mơ. Phương pháp đánh giá trung bình vĩ mơ tính tốn chỉ số một
cách độc lập cho từng lớp và sau đó lấy giá trị trung bình (tất cả các lớp được đối xử
như nhau). Phương pháp đánh giá trung bình vi mơ tổng hợp đóng góp của tất cả các
lớp vào các giá trị trung bình được tính tốn.
Bảng 7. Hiệu suất sử dụng trung bình vi mơ và trung bình vĩ mơ
so sánh ba tập dữ liệu (a), năm con bị của DATASET03 (b)

(A)
Bợ dữ liệu
01
02
03

Đợ chính xác Đợ nhạy PPV
Micro
Macro
Micro
Macro
Micro
Macro

0.81
0.84
0.82
0.80
0.94
0.95

0.81
0.84
0.82
0.80
0.94
0.95

0.81
0.84
0.82
0.81
0.94
0.95

(B)
Đợ chính xác Đợ nhạy PPV

COW ID
ID1
ID2
ID3
ID4
ID5

Micro
Macro
Micro
Macro
Micro
Macro
Micro
Macro
Micro

0.99
0.99
0.92
0.93
0.89
0.93
0.96
0.97
0.92
19

0.99
0.99
0.92
0.94
0.89
0.93
0.96
0.97

0.92

0.99
0.99
0.92
0.92
0.89
0.93
0.96
0.96
0.92

Macro

0.93
0.93
0.95
Như thể hiện trong Bảng 7 (a), trung bình vi mơ và trung bình vĩ mơ của DATASET01
và DATASET02 là gần nhau. Kết quả có ý nghĩa vì DATASET01 cho kết quả nằm và
đi tốt hơn và DATASET02 cho kết quả đứng và ăn tốt hơn. Hiệu suất của DATASET03
là đáng kể hơn so với trường hợp của DATASET01 và DATASET02. Hiệu suất phân
loại tổng thể của chúng tôi cho DATASET03: đợ chính xác 0,94, đợ nhạy 0,94 và 0,94
PPV trong trường hợp trung bình vi mơ; Đợ chính xác 0,95, độ nhạy 0,95 và 0,95 PPV
trong trường hợp trung bình vĩ mơ. Bảng 7 (b) cho thấy trung bình vi mơ và trung bình
vĩ mơ của năm con bị. ID1 có hiệu suất tốt nhất với tất cả các giá trị bằng 0,99. ID4 có
hiệu suất tốt; giá trị nhỏ nhất là 0,96. ID3 có hiệu suất thấp nhất. Tuy nhiên, ba chỉ tiêu
vẫn ở mức cao (0,89 ở trung bình vi mơ và 0,93 ở trung bình vĩ mơ).
4.5. Thảo luận
Như kết quả trình bày trong các bảng trên, các hành vi của bị có thể được phân loại

thành công với hiệu suất cao bằng cách đạt được đợ chính xác 0,95, đợ nhạy 0,95 và
0,95 PPV khi sử dụng đề xuất của chúng tôi (DATASET03). So với các kết quả tài liệu,
phương pháp kết hợp cảm biến gia tốc gắn trên chân và gắn trên cổ của chúng tơi được
áp dụng ở đây có thể được coi là đạt được hiệu suất phân loại hành vi rất tốt. Chúng tôi
đã đạt được hiệu suất cao khi phân loại ăn (đợ chính xác 0,914, đợ nhạy 0,884 và PPV
0,956) và đứng (đợ chính xác 0,88, đợ nhạy 0,928 và PPV 0,842), thường là có mợt giới
hạn Error! Reference source not found.Error! Reference source not found.Error!
Reference source not found.Error! Reference source not found.Error! Reference
source not found. Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not found..
Chúng tôi đã thực hiện những kết quả này mà không yêu cầu bất kỳ điều kiện nào cho
trang trại.

Bảng 8 trình bày so sánh với mợt số nghiên cứu liên quan. P. Martiskainen và M.
Jarvinen Error! Reference source not found. đã sử dụng SVM (máy vectơ hỗ trợ) để
nhận ra các hành vi dựa trên dữ liệu gia tốc gắn trên cổ. Tám hành vi được phân loại với
việc sử dụng một cảm biến gia tốc cho mỗi con bò. Tần số lấy mẫu của cảm biến gia tốc
là 10 Hz; thời lượng cửa sổ là 10 giây. Do đó, mợt bản ghi của họ dữ liệu đã có 100 mẫu
(trong nghiên cứu của chúng tơi, mợt bản ghi 16 mẫu). Tám đặc trưng đã được sử dụng,
bao gồm trung bình, SD, giá trị nhỏ nhất, giá trị lớn nhất…. Các kết quả phân loại hành
vi đi, ăn, nằm và đứng sẽ được so sánh với kết quả của chúng tôi. Họ thu được kết quả
tốt trong hành vi ăn (0,96 đợ chính xác, 0,75 nhạy cảm, 0,81 PPV) , nhưng khơng tốt
trong nằm (0,84 đợ chính xác, 0,80 độ nhạy, , 0,83 PPV) và đi (0,99 đợ chính xác, 0,79
đợ nhạy, 0,79 PPV ), so với các nghiên cứu dựa trên dữ liệu gia tốc gắn trên chân Error!
Reference source not found.Error! Reference source not found.Error! Reference
source not found..
Lí do là vì cảm biến gia tốc gắn trên cổ đã được sử dụng trong thí nghiệm của họ. Dữ
liệu gia tốc được gắn trên cổ nhận biết việc ăn tốt hơn so với dữ liệu gia tốc được gắn ở
20

chân và ngược lại; Dữ liệu gia tốc gắn ở chân nhận biết nằm và đi tốt hơn so với dữ liệu
gia tốc gắn ở cổ. Kết quả PPV của họ là 0,65 đứng, 0,83 nằm, 0,81 ăn và 0,79 đi. Kết
quả PPV của chúng tôi tốt hơn đáng kể, và cũng tốt hơn với đợ chính xác và đợ nhạy.
Tóm lại, lượng mẫu của mợt bản ghi lớn (100), nhiều đặc trưng (8) đã được sử dụng
nhưng hiệu suất vẫn chưa cao. Tuy nhiên, lưu ý rằng nghiên cứu của P. Martiskainen và
M. Jarvinen Error! Reference source not found. là mợt trong những cơng trình ban
đầu về chủ đề này. Khi cơng trình của họ được xuất bản, việc giám sát tự động dựa trên
hành vi của động vật là tương đối mới.

Bảng 8. Tóm tắt các nghiên cứu liên quan
Các
trình

cơng

P.
Martiskainen
and
M.
Jarvinen
Error!
Reference
source
not
found.
Oudshoorn et
al
Error!
Reference

source
not
found.
Arcidiacono et
al
Error!
Reference
source
not
found.
Wang et al
Error!
Reference
source
not
found.

Các hành vi

Cơng nghệ sử dụng

Tần
Cửa Phương
số lấy số dữ pháp
sử
mẫu liệu
dụng

đứng, nằm,
cảm biến gia tốc gắn

10
ăn, đi và bốn
10 Hz
cổ
giây
hành vi khác

SVM

ăn (bò chăn cảm biến gia tốc gắn
1 Hz
thả)
cổ

10
phút

So
sánh
ngưỡng

đứng và đi

cảm biến gia tốc gắn
4 Hz
cổ

5
giây

So
sánh
ngưỡng

đứng, nằm,
ăn, đi, nằm
xuống, đứng
lên, đi nhanh

combining
mounted
accelerometer
location sensor

6
giây

AdaBoost

Barwick et al
đứng,
Error!
ăn, đi
Reference

legand

1 Hz

cảm biến gia tốc gắn

3, 5,
nằm, cổ, cảm biến gia tốc
Random
12 Hz và 10
gắn chân, cảm biến
Forest
giây
gia tốc gắn tai
21

source
found.

not

Nghiên
cứu đứng,
của chúng tôi
ăn, đi

nằm,

cảm biến gia tốc gắn
16
cổ và cảm biến gia tốc 10 Hz
giây
gắn chân

Random

Forest

Arcidiacono và cộng sự Error! Reference source not found. đã đề xuất một công cụ
phân loại làm giảm ngưỡng cảm biến gia tốc. Hệ thống của họ tập trung vào việc đứng
và ăn. Tần số lấy mẫu là 4 Hz và thời lượng cửa sổ là 5 giây. Vì vậy, có 20 mẫu mỗi bản
ghi. Vì bài tốn phân loại chỉ phân biệt giữa đứng và ăn, nên chỉ có mợt đặc trưng (trung
vị) được sử dụng để tính ngưỡng. Ngưỡng gia tốc này sẽ được sử dụng để phân biệt
trạng thái ăn. Khi ăn có chuyển đợng của đầu, và chỉ phân tích dữ liệu cảm biến gia tốc
của trục X.
Oudshoorn và cộng sự Error! Reference source not found. đã sử dụng cảm biến cảm
biến gia tốc để ước tính thời gian chăn thả. Dữ liệu được thu thập với tốc độ lấy mẫu là
1 Hz. Ước tính của việc chăn thả được so sánh với việc quan sát thủ công trên cửa sổ 10
phút. Phương pháp được đề xuất dựa trên sự so sánh các ngưỡng, tương tự như ý tưởng
của Error! Reference source not found.. Số lượng hành vi trong công việc này bị hạn
chế vì họ khơng tập trung vào phân loại hành vi. Lượng cỏ là thông tin mà họ quan tâm,
lượng cỏ có thể được ước tính từ tần suất cắn và thời gian chăn thả. Hiệu suất ước tính
khơng cao: 0,7 đợ nhạy và 0,82 PPV. Mợt trong những lý do là chất lượng của dữ liệu
gia tốc được thu thập. Nghiên cứu này là một trong số ít nghiên cứu nói về việc phân
loại bị ăn cỏ.
Wang và cộng sự Error! Reference source not found. đề xuất một phương pháp dựa
trên việc kết hợp cảm biến gia tốc và cảm biến vị trí gắn trên chân. Dùng thuật toán
AdaBoost để phân loại bảy hành vi của bò. Bốn hành vi như trong nghiên cứu này của
chúng tơi: ăn, nằm, đứng, đi bình thường. Ba hành vi khác: đi nhanh, đứng lên, nằm
xuống. Trong thí nghiệm của họ, tốc độ lấy mẫu là 1 Hz, thời lượng cửa sổ là 6 giây.
Hiệu suất của chúng tôi tốt hơn của họ đối với tất cả các chỉ số: đợ chính xác (0,9 5 so
với 0,86), đợ nhạy (0,95 so với 0,85) và PPV (0,95 so với 0,80). Kết quả ăn của họ là đợ
chính xác 0,75, đợ nhạy 0,73 và 0,75 PPV. Kết quả đứng là đợ chính xác 0,75, độ nhạy
0,78 và 0,72 PPV. Những kết quả này thấp hơn trường hợp xấu nhất của chúng tôi (bị
ID2). Nó đã chứng minh rằng giải pháp kết hợp cảm biến chân và cảm biến cổ của chúng
tôi hoạt động tốt hơn so với giải pháp cảm biến chân và cảm biến vị trí của họ. Hơn nữa,

giải pháp của họ chỉ phù hợp với bị chuồng thả rơng vì vị trí ăn là cố định. Trong trường
hợp này, sự nhầm lẫn có thể xuất hiện nếu bị đang đứng ở vị trí ăn cố định.
Barwick và cợng sự Error! Reference source not found. xác định hành vi của cừu thay
vì hành vi của bị. Các vấn đề phân loại cũng tương tự. Họ cũng quan tâm đến bốn hành
vi chính bao gồm ăn, nằm, đứng và đi. Ba loại cảm biến khác nhau đã được sử dụng
trong ba thí nghiệm (khơng kết hợp, chỉ mợt cảm biến cho mợt thí nghiệm). Thí nghiệm
cảm biến gia tốc đeo cổ, cảm biến gia tốc gắn trên chân và cảm biến gia tốc đeo tai. Dữ
liệu được lấy mẫu ở tần số 12 Hz. Họ đã thử độ dài cửa sổ khác nhau: 3, 5 và 10 giây.
Mơ hình phân loại sử dụng RF. Hiệu suất của hệ thống giám sát cừu này thấp hơn so với
hệ thống của chúng tôi. Đợ chính xác của thử nghiệm cảm biến gắn trên tai là lớn nhất,
22

dao đợng từ 0,86 đến 0,95. Cụ thể, đợ chính xác khi đứng dao động từ 0,69 đến 0,97, đi
0,85 đến 1, ăn 0,58 đến 0,95 và đợ chính xác khi nằm thấp.
Trong bài tốn ML này, mợt cửa sổ dữ liệu phù hợp là điều cần thiết Error! Reference
source not found.. Nếu độ dài cửa sổ lớn, số lượng dữ liệu huấn luyện sẽ giảm và một
cửa sổ nhất định (mợt bản ghi) có thể chứa nhiều hoạt đợng. Như vậy, hiệu suất phân
loại sẽ giảm Error! Reference source not found.. Độ dài cửa sổ được ưu tiên trong
khoảng 5-16 giây Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.. Trong nghiên cứu này, độ dài cửa sổ là 16
giây.
Tất cả các cơng việc được thảo luận ở trên nhằm mục đích phát triển một hệ thống dựa
trên IoT để giám sát động vật. Hệ thống của chúng tôi đã sử dụng các thiết bị cảm biến
(cảm biến gia tốc đeo ở cổ và gia tốc gắn ở chân) để cảm nhận và phân tích dữ liệu với
sự hỗ trợ của trí tuệ nhân tạo (trong trường hợp này là các thuật tốn ML). Có các nghiên
cứu nâng cao chất lượng hệ thống IoT dựa trên trí tuệ nhân tạo Error! Reference
source not found.Error! Reference source not found.Error! Reference source not

found., hoặc mợt bài tốn thời gian thực, mợt thuật tốn nhanh và đơn giản là điều bắt
buộc. Xét rằng dữ liệu gia tốc không phức tạp chỉ với các giá trị số, thuật toán RF, Cây
quyết định tăng cường Gradient và AdaBoost (thuật toán dựa trên cây quyết định) là phù
hợp Error! Reference source not found.Error! Reference source not found.Error!
Reference source not found.Error! Reference source not found.. Chúng tôi nhận
thấy rằng hiệu suất khác biệt nhất giữa các nghiên cứu này khơng đến từ thuật tốn ML.
Vì vậy, việc cải thiện dữ liệu là mục tiêu của bài báo này. Trong các bài tốn ML, thơng
tin tốt hơn có nghĩa là hiệu suất tốt hơn. Dữ liệu gia tốc được đồng bợ hóa từ cảm biến
chân và cảm biến vịng cổ là lựa chọn của chúng tôi. Kết quả nổi bật trong bài báo này
đã chứng minh rằng hiệu suất vượt trợi có thể được thực hiện bằng cách sử dụng mợt
mơ hình phân loại đơn giản.
4.6. Kết luận chương
Đóng góp quan trọng trong chương này là đề xuất việc sử dụng dữ liệu đồng bợ hóa từ
hai cảm biến lắp ở chân và cổ bị cho bợ phân loại bốn hành vi quan trọng của bò. Việc
phân loại các hành vi của bò ăn cỏ dựa trên hệ thống cảm biến kết hợp của chúng tôi
cung cấp sự cải tiến đáng kể so với các hệ thống truyền thống khác (chỉ sử dụng một
cảm biến, gắn trên chân hoặc gắn trên cổ). Công bố liên quan tới chương này là cơng
trình số 1 và 6.

23

NGHIÊN CỨU VÀ XÂY DỰNG HỆ GIÁM SÁT HOẠT ĐỘNG, HỖ TRỢ CHĂN NUÔI GIA SÚC. TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ ĐIỆN TỬ - VIỄN THÔNG

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về