Tải bản đầy đủ (.pdf) (27 trang)

NGHIÊN CỨU VÀ XÂY DỰNG HỆ GIÁM SÁT HOẠT ĐỘNG, HỖ TRỢ CHĂN NUÔI GIA SÚC. TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ ĐIỆN TỬ - VIỄN THÔNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (924.15 KB, 27 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

PHÙNG CÔNG PHI KHANH

NGHIÊN CỨU VÀ XÂY DỰNG HỆ GIÁM SÁT HOẠT ĐỘNG,
HỖ TRỢ CHĂN NUÔI GIA SÚC

Chuyên ngành: Kỹ thuật điện tử
Mã số: 9520203.01
TĨM TẮT LUẬN ÁN TIẾN SĨ CƠNG NGHỆ ĐIỆN TỬ - VIỄN THÔNG

Hà Nội – 2021


Cơng trình được hồn thành tại: Trường Đại học Cơng nghệ, Đại học Quốc Gia Hà Nội
Người hướng dẫn khoa học: PGS. TS. Trần Đức Tân
Phản biện:………………………………………………………………………………..
…………………………………………………………………………………………...
Phản biện:………………………………………………………………………………..
…………………………………………………………………………………………...
Phản biện:………………………………………………………………………………..
…………………………………………………………………………………………

Luận án sẽ được bảo vệ trước Hội đồng cấp Đại học Quốc gia chấm luận án tiến sĩ họp
tại .............................................................................................................................
vào hồi … giờ … ngày … tháng … năm

Có thể tìm hiểu luận án tại:
- Thư viện Quốc gia Việt Nam
- Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội




MỞ ĐẦU
1. Đặt vấn đề
Việc phân loại hành vi của bị là mợt cách phát hiện sớm các bệnh tật, các tương tác
trong đàn gây ảnh hưởng đến sức khỏe. Hành vi thay đổi khi bị bị bệnh có thể bao gồm
giảm hoạt động thường ngày như hành vi ăn, uống, đi, đứng, nằm. Việc giám sát bò
được tập trung theo ba hướng phổ biến nhất đó là giám sát phân loại hành vi của bò,
phát hiện trấn thương, xác định thời điểm sinh sản của bị.
Mợt hệ thống giám sát hoạt động, hỗ trợ chăn nuôi thường gồm một bợ xử lý trung tâm
thường là máy tính có nhiệm vụ nhận thông tin và xử lý thông tin theo mợt thuật tốn
phân loại hành vi, thơng qua các thơng tin hoạt đợng của bị. Các bợ thu thập thơng tin
về hoạt đợng của bị lấy từ các cảm biến và gửi về cho bợ xử lý trung tâm. Ngồi ra cịn
có hệ thống lưu trữ dữ liệu, đưa dữ liệu lên internet để thuận lợi cho việc giám sát hành
vi của bị, quản lý và xử lý các thơng tin.
2. Mục tiêu nghiên cứu của luận án
Mục tiêu chung: Nghiên cứu xây dựng 01 hệ thống triển khai thu thập dữ liệu gia tốc ba
trục (từ chuyển động của bò) và phân loại hành vi của bò từ dữ liệu cảm biến gia tốc ba
trục gắn trên bò.
Mục tiêu cụ thể:
- Nghiên cứu giải thuật phân loại hành vi bò dựa trên dữ liệu cảm biến gia tốc ba trục
gắn trên bị.
- Đề xuất, xây dựng hệ thống hồn chỉnh phân loại hành vi của bò (bao gồm phần cứng
và phần mềm).
- Nghiên cứu nhóm giải pháp tiết kiệm năng lượng tại nút cảm biến đặt tại sườn dốc.
3. Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu ở đây là bị (mợt trong những loại gia súc phổ biến, có giá trị kinh
tế cao). Các cảm biến gắn trên bị là các cảm biến gia tốc, vì thế dữ liệu thu nhận được
là tín hiệu gia tốc thu nhận được từ các chuyển đợng của bị. Ngồi ra, luận án cịn sử
dụng tập dữ liệu cơng khai để đảm bảo tính khách quan của thuật tốn đề xuất.

4. Nội dung nghiên cứu
Đề tài được thực hiện thông qua 4 nợi dung chính như sau
1) Nghiên cứu về các hệ thống giám sát và nhận dạng hành vi của bị.
2) Nghiên cứu các thuật tốn xử lý dữ liệu từ cảm biến để phân loại hành vi của bị.
3) Nghiên cứu giải pháp và mơ hình tích hợp các cảm biến phục vụ việc ghi nhận và xử
lý dữ liệu về hành vi của bò.
4) Xây dựng phần mềm phân loại hành vi của bò và chạy thử nghiệm.
5. Phương pháp nghiên cứu
Kết hợp nghiên cứu lý thuyết, mơ phỏng và thực nghiệm kiểm chứng.
Để có thể thực hiện đề tài thành công, trước tiên phải nghiên cứu, nắm vững được lý
thuyết về các nguyên tắc đo và giám sát hành vi của bò, của cảm biến và các kỹ thuật
1


xử lý tín hiệu tiên tiến để xử lý, đề xuất giải thuật giám sát và phân loại hành vi. Tiếp
đó, các giải thuật và ngun lý hoạt đợng của hệ thống phải được mơ hình hóa và mơ
phỏng để đánh giá tính hiệu quả của giải thuật và hệ thống đề xuất. Sau đó, nghiên cứu
sinh xây dựng thành một hệ cảm biến không dây thu thập dữ liệu thực tế. Cuối cùng, hệ
thống sẽ được kiểm chứng thực nghiệm trong phịng thí nghiệm và tại nơng trại chăn
ni bị.
6. Ý nghĩa khoa học và đóng góp mới của luận án
Luận án này có 3 đóng góp mới
1/ Xây dựng bợ phân loại bảy hành vi của bị sử dụng dữ liệu cảm biến gia tốc ba trục
gắn ở chân bị.
2/ Xây dựng hệ thống mạng cảm biến khơng dây ở đó mỗi nút mạng được gắn lên mợt
con bò. Hai cảm biến gia tốc ba trục được gắn tại vị trí chân và cổ. Dữ liệu gia tốc từ
chân và cổ bị được đồng bợ để phục vụ cho bài tốn phân loại hành vi của bị.
3/ Xây dựng bợ phân loại hành vi của bị sử dụng dữ liệu đồng bộ từ cảm biến gia tốc
gắn chân bò và cổ bò.


2


CHƯƠNG 1. TỔNG QUAN TÌNH HÌNH NGHIÊN CỨU
1.1. Nghiên cứu trên thế giới
Hiện nay trên thế giới có rất nhiều kỹ thuật giúp giám sát sức khoẻ, hoạt động và các
vấn đề sinh sản của vật nuôi trên quy mô lớn. Những kỹ thuật này giúp chủ các trang
trại, công ty hay doanh nghiệp kiểm sốt vật ni của mình, từ đó giúp nâng cao hiệu
quả chăn ni. Tuy nhiên những kỹ thuật được áp dụng hiện tại còn khá thủ công và cần
sự can thiệp sức người. Việc nghiên cứu ra các kỹ thuật và thiết bị mới vẫn luôn là một
chủ để đang được quan tâm mạnh mẽ.
Các trang trại chăn nuôi ngày nay đang phải đối mặt với những thách thức lớn trong việc
giám sát, duy trì sức khỏe về thể chất và tinh thần của vật ni, nó liên quan trực tiếp
đến số lượng và chất lượng sản phẩm chăn nuôi. Các trang trại chăn nuôi có quy mơ từ
trung bình đến lớn rất khó theo dõi vật nuôi thông qua quan sát, dẫn đến các tổn thất cho
trang trại.
1.2. Nghiên cứu trong nước
Trên thực tế, 95% bị trong nước đã được ni mợt cách rải rác bởi các hợ gia đình nhỏ
và khơng có kỹ năng. Nông dân không được đào tạo kỹ thuật chăn ni, biện pháp phịng
bệnh. Nhờ áp dụng các kỹ thuật hiện đại, việc quản lý chuồng trở nên dễ dàng và dễ
dàng hơn Ngoài ra, giá của sản xuất cũng giảm và tiết kiệm lao động. Một số công ty
chế biến sữa tại Việt Nam, nơi thực hiện công nghệ tiên tiến để tăng số lượng chăn nuôi
của họ và cải thiện năng suất và chất lượng sữa tươi. Chẳng hạn như: công ty sữa TH
true milk của Việt Nam, áp dụng công nghệ Israel thông qua công ty AfiMilk. AfiMilk
chính là cơng ty đã mang lại cho Israel thương hiệu đợc tơn trong ngành chăn ni bị
sữa, có trang trại bị sữa cơng nghiệp lớn trên thế giới. Cơng ty VINAMILK ở Việt Nam
đã có đàn bị mà mỗi con bò sử dụng chip điện tử đeo trên cổ được kiểm soát bằng hệ
thống quản lý ALPRO được cung cấp bởi DELAVAL (cơng ty con của tập đồn
TetraPark). Nói chung các thiết bị giám sát hỗ trợ trăn nuôi bị hiện này thường ở dạng
thương phẩm và đợc quyền của các công ty cung cấp nên không phục vụ cho việc nghiên

cứu, cải tiến thiết bị. Các nhóm nghiên cứu, phát triển thiết bị giám sát hành vi của bị ở
việt nam khơng nhiều.
1.3. Một số mơ hình hệ thống cảnh báo thực tế
Vấn đề phức tạp trong việc nhận ra hành vi của động vật đã thúc đẩy các nhóm nghiên
cứu khác nhau đánh giá các kịch bản trong thực tế khác nhau bằng các giải pháp đeo
thiết bị có gắn chứa cảm biến Error! Reference source not found.Error! Reference
source not found.Error! Reference source not found.. Học máy cung cấp một cách
tiếp cận tốt để cải thiện độ chính xác của mơ hình, dựa trên các cấu trúc dữ liệu có thể
thay đổi linh hoạt, trong khi xử lý các bộ dữ liệu lớn và phức tạp thu được từ một môi
trường cụ thể Error! Reference source not found.. Ví dụ Martiskainen và cợng sự
trong nghiên cứu Error! Reference source not found. đã phát triển một phương pháp
sử dụng dữ liệu gia tốc và thuật toán máy vectơ hỗ trợ đa lớp (SVM) để tự động phân
loại một số hành vi ở bị sữa. Trong mợt nghiên cứu tương tự, Diosdado et al Error!
Reference source not found. đã thực hiện thuật toán cây quyết định để phân loại các
3


hành vi gia súc khác nhau. Arcidiacono et al Error! Reference source not found. đã
tính mợt ngưỡng gia tốc để phân loại các hoạt đợng ăn và đứng của bị sữa trong chuồng
ni tự do. Thuật tốn của họ cũng ước tính số bước chân của mỗi con bị từ dữ liệu gia
tốc bằng cách sử dụng các ngưỡng được xác định theo thống kê. Trong nghiên cứu tiếp
theo của họ Error! Reference source not found., các tác giả này đã chỉ ra rằng phương
pháp mới có thể được thực hiện theo cách thức thời gian thực do sử dụng tần số lấy mẫu
thấp (tần số 4 Hz) và độ phức tạp thấp. Họ cũng giải thích hai lý do chính cho việc phân
loại sai giữa ăn và đứng thứ nhất là: khi con bò quay đầu trong khi hoạt đợng ăn thì vị
trí của cảm biến bị lệch. Thứ hai là trong một số trường hợp, ngay cả con bị đang đứng,
đầu vẫn cúi xuống. Cuối cùng, mợt số đề xuất được đưa ra để cải thiện cả hiệu suất phân
loại và thực hiện theo thời gian thực.
1.4. Thách thức trong xây dựng hệ thống
Nói chung các nghiên cứu thường sử dụng cảm biến gia tốc gắn trên cổ bò và chân bò,

hoặc sử dụng cảm biến áp suất gắn trên má bị. Số hành vi phân loại ít thông thường chỉ
là đi, đứng, nằm, ăn. Nhiều nghiên cứu cịn thủ cơng dữ liệu ghi trên thẻ nhớ. Nền tảng
cảm biến không dây cần được nghiên cứu và áp dụng hiệu quả hơn. Bên cạnh đó các
thuật tốn cũng cần được cải tiến để nâng cao hiệu quả phân loại. Trong các nghiên cứu
Error! Reference source not found.Error! Reference source not found.Error!
Reference source not found.Error! Reference source not found. đã chứng minh tiềm
năng của việc sử dụng học máy trong phân loại hành vi bò, họ chỉ phân loại hai hoặc ba
hành vi Error! Reference source not found.Error! Reference source not found., giá
trị tiên đốn dương tính của phân loại không cao Error! Reference source not found.
và thiếu phân tích về các đặc trưng của dữ liệu Error! Reference source not
found.Error! Reference source not found.. Thực tế là hiệu suất của phương pháp
phân loại sẽ phụ thuộc vào các đặc trưng và cửa sổ dữ liệu (liên quan đến số lượng mẫu
của một bản ghi).
1.5. Kết luận chương
Chương 1 trình bày tổng quan về tình hình nghiên cứu trong và ngồi nước. Phân tích
mợt số mơ hình hệ thống giám sát và cảnh báo trượt lở đất do mưa. Chương này đề cập
đến những thách thức khi xây dựng hệ thống giám sát và cảnh báo như xác định vị trí
trượt lở đất, khối lượng trượt, lựa chọn các thơng số cần giám sát, tính ổn định và tin
cậy của hệ thống, cũng như những yêu cầu thực tế về giá thành xây dựng hệ thống giám
sát và cảnh báo.

4


CHƯƠNG 2. THIẾT KẾ, CHẾ TẠO THIẾT BỊ THU DỮ LIỆU
2.1. Thiết kế hệ thống giám sát bị theo mơ hình mạng cảm biến khơng dây
Hệ thống giám sát mơ hình mạng cảm biến khơng dây thường bảo gồm:
- Các thiết bị gắn trên các con bò, thường là 01 thiết bị trên mợt con bị, thiết bị có thể
được gắn ở chân, cổ, mũi hoặc má bị, …, đóng vai trò là nút mạng cảm biến, thu các dữ
liệu phục vụ cho việc giám sát và truyền không dây về nơi thu.

- 01 Thiết bị trung tâm đóng vai trị như mợt nút mạng thu nhận dữ liệu từ các thiết bị
gắn trên bị nhằm mục đích lưu trữ và xử lý dữ liệu, có thể đưa lên internet giúp việc
giám sát thuận lợi qua các thiết bị di động.
Hệ thống cảm biến không dây thu nhận dữ liệu bị được thiết kế cần được đảm bảo mợt
số tiêu chí kỹ thuật sau: 1/ mỗi nút mạng được gắn lên mợt con bị với khoảng cách
truyền tin từ mỗi nút mạng tới nút trung tâm đạt tới 200 m; 2/ dữ liệu gia tốc ở chân và
cổ phải được đồng bộ theo mỗi giây để phục vụ cho bài tốn phân loại; 3/ những thơng
tin khác (ID nhận dạng bị, vị trí bị, phần trăm pin cịn lại của nút mạng) cũng phải giám
sát được nhằm phục vụ cho công tác vận hành.
Trong nghiên cứu này đề xuất hệ giám sát trạng thái hành vi trên bị thơng qua mơ hình
mạng cảm biến khơng dây, mỗi nút mạng sẽ là sự kết hợp của hai thiết bị giám sát gắn
trên cổ bò và chân bò, hai thiết bị được kết nối không dây với nhau và được phát triển
dựa trên cảm biến gia tốc 3 trục giúp việc xác định trạng thái được chính xác hơn (

Hình 1).
433 MHz
Thiết bị cổ bị

Nút trung tâm
UART-USB

2.4 GHz
Thiết bị chân bị

Máy tính

Bị thứ n

Hình 1. Mơ hình mạng cảm biến khơng dây
Hệ thống gồm được chia thành hai phần chính: phần mợt là các thiết bị được gắn trên

bò nhằm đo đạc chuyển đợng tại vị trí chân và cổ bị, phần hai là phần thu dữ liệu, lưu
trữ và xử lý dữ liệu thu được nhằm phân loại và dự đoán hành vi. Phần một gồm hai
thiết bị là: thiết bị đo chuyển động tại chân và thiết bị đo chuyển đợng tại cổ bị, hai thiết
bị này truyền thơng RF với nhau ở tần số 2,4 GHz và tạo thành một nút mạng. Phần hai
5


gồm thiết bị đóng vai trị là nút trung tâm, nhận dữ liệu từ các nút mạng nhờ truyền
thông không dây ở dải tần 433MHz. Nút trung tâm được kết nối với máy tính và dữ liệu
được đưa về máy tính. Máy tính lưu dữ liệu thành các bản ghi phục vụ cho việc lưu trữ,
xử lý và đưa ra phân tích về hành vi của bị.
2.2. Các thiết bị
2.2.1. Thiết bị đo chuyển động gắn vào chân bò
Thiết bị thu dữ liệu ở chân (Hình 2) có kích thước 85×60×35mm, khổi lượng khoảng
300 g. Thiết bị ở chân dùng ATMega328 để xử lý thu tín hiệu gia tốc từ MPU-6050 với
tần số là 10Hz và truyền dữ liệu tới modul khơng dây RF2401. Theo nhà sản xuất đưa
ra thì RF2401 có cự ly phát cực đại khoảng 100m, với ăng ten chìm trên mạch thì thiết
bị phát sóng định hướng. trong điều kiện sử dụng thiết bị ở chân trước bị và ở cổ bị
cách nhau khơng q 2m, nên tỉ lệ lỗi bít rất thấp q trình thử nghiệm khơng cho thấy
lỗi bít, trong khi nhà sản xuất đưa ra lỗi bít khoảng 0.001%.

Hình 2. Thiết bị thu dữ liệu ở chân
2.2.2. Thiết bị đo chuyển động gắn vào cổ bị

Thiết bị thu dữ liệu ở cổ (Hình 3) có kích thước giống thiết bị ở chân 85×60×35mm,
khổi lượng khoảng 300g. Thiết bị ở cổ bò thu dữ liệu gia tốc từ MPU-6050, dữ liệu GPS
từ modul GPS NEO-UBLOX-6M V2. Mặt khác thiết bị ở cố còn thu dữ liệu gia tốc 3
trục từ thiết bị từ chân bị gửi lên, nó kết hợp với dữ liệu ở cổ bị ghép thành mợt bản tin
bao gồm: thơng tin về gia tốc chân bò, gia tốc cổ bò và thơng tin GPS ở cổ bị. Tín hiệu
gia tốc ở chân và ở cổ làm thu nhận với tốc độ 11 mẫu/ giây. Tín hiệu GPS thu nhận với

tần số 0,5Hz. Bản tin tổng hợp sau đó được Lora truyền đến nút trung tâm. Theo nhà
sản xuất đưa ra khoảng cách cực đại của Lora có thể truyền lên tới 10km, tuy nhiên trong
điều kiện nghiên cứu chúng tôi chỉ khảo sát trong khoảng 1km và tỉ lệ lỗi bít rất thấp
dưới 1%.

Hình 3. Thiết bị thu dữ liệu ở cổ

6


2.2.3. Nút trung tâm

Trung tâm thu thập dữ liệu gồm mợt modul thu phát (Hình 4), mợt modul chuyển đổi
dữ liệu UART-USB và mợt phần mềm trên máy tính.

Hình 4. Nút trung tâm thu dữ liệu
2.3. Căn chỉnh cảm biến và chuẩn hóa dữ liệu
2.3.1. Căn chỉnh cảm biến
Thu nhận dữ liệu và tiền xử lý dữ liệu là cần thiết trong các hệ đo. Các cảm biến
mặc dù đã được căn chỉnh tại nơi sản xuất nhưng vẫn cần được hiệu chỉnh trong hệ thống
mà nó được sử dụng. Căn chỉnh là một phương pháp cải thiện hiệu năng của cảm biến
bằng cách loại bỏ hoặc giảm thiểu sai số trong dữ liệu đầu ra cảm biến. Lỗi cảm biến
phân làm 2 loại là lỗi tất định và lỗi ngẫu nhiên.
2.3.2. Chuẩn hóa dữ liệu
Chuẩn hóa giải đo từ giá trị thô dùng modul MPU6050. Modul MPU6050 thiết lập
để do giá trị 16 bit có các giải đo ±2, 4, 8, 16g.
2.4. Kết luận chương
Cảm biến gia tốc ba chiều cung cấp một phương pháp không xâm lấn để phân loại
hành vi của bò trong điều kiện trang trại. Đóng góp của chương này là đã thành cơng
trong việc xây dựng một mạng cảm biến không dây gắn trên bị mà ở đó mỗi nút mạng

sẽ thu thập dữ liệu đồng bợ từ chân và cổ bị. Cơng trình khoa học liên quan tới chương
này là số 4, 5 và 6.

7


CHƯƠNG 3. ĐỀ XUẤT THUẬT TOÁN HỌC MÁY PHÂN LOẠI HÀNH VI
CỦA BỊ
3.1. Dữ liệu sử dụng
Chúng tơi sử dụng tập dữ liệu công khai trực tuyến trong nghiên cứu của Jun Wang và
cộng sự Error! Reference source not found. tại địa chỉ:
/>Bảng 1 tóm tắt các định nghĩa của hành vi trong tập dữ liệu này.
Bảng 1. Mô tả các hành vi
Định nghĩa hành vi
Ăn
Bò đang ở khu vực ăn, tìm kiếm hoặc ăn thức ăn.
Nằm
Con bị ở trong buồng trong tư thế nằm.
Đứng
Con bị đứng hồn tồn bằng bốn chân.
Bị chùng mợt chân trước, hạ thấp chân trước, sau đó hạ chân sau xuống ở
Nằm xuống
trạng thái nằm.
Đứng lên
Con bò vươn lên từ trạng thái nằm để đứng bằng cả bốn chân.
Đi bình Hoạt đợng được đặc trưng bởi ít nhất 3 cử đợng chân liên tiếp (mợt bước
thường
tiến trong khoảng thời gian 1 giây).
Đi nhanh Con bò tiến nhanh về phía trước với những bước dài (hai bước tiến trong
khoảng thời gian 1 giây của video).

Tập dữ liệu được đề xuất của chúng tôi là một quan sát được gắn nhãn trong tập dữ liệu
chứa 16 mẫu dữ liệu gia tốc, mỗi mẫu được ghi lại theo ba trục vng góc với tốc đợ lấy
mẫu là 1Hz.
3.2. Phương pháp phân loại đề xuất

Các đặc trưng và cửa sổ dữ liệu rất quan trọng đối với việc thực hiện các thuật
toán phân loại. Các đặc trưng của dữ liệu được trích xuất dựa trên cửa sổ thời
gian. Để tìm đợ dài cửa sổ tốt nhất, chúng tơi đã thực hiện một số so sánh với vấn
đề nhận biết hoạt đợng của con người (HAR) trong đó tín hiệu gia tốc được lấy
mẫu ở tốc độ lấy mẫu cao hơn nhiều (ví dụ: 50 Hz) so với dữ liệu bị của chúng
tơi (ở tần số 1 Hz). Trong bối cảnh của vấn đề HAR, các cửa sổ cỡ trung bình (dài
từ 5 đến 7 giây) hoạt đợng tốt nhất từ một loạt các cửa sổ từ 1 đến 15 giây cho
cảm biến gia tốc đặt ở cổ tay. Vì bị sữa ít hoạt đợng hơn con người, chúng tơi có
thể sử dụng chiều dài cửa sổ dài hơn cho nghiên cứu của chúng tôi.
Phương pháp của chúng tôi để phân loại hành vi của bò sử dụng 5 đặc điểm của dữ liệu
gia tốc, đó là: giá trị trung bình, trung vị, SD, RMS và dải giá trị. Lí do lựa chọn 5 loại
đặc trưng này dựa vào bản chất của tín hiệu sử dụng để phân loại. Đây là các tín hiệu
theo chuỗi thời gian (giá trị gia tốc thu được thay đổi theo thời gian). Với loại tín hiệu
này thì các kỹ sư có thể khai thác thông tin trên miền thời gian và / hoặc miền tần số.
Tuy nhiên nếu lựa chọn khai thác đặc trưng miền tần số sẽ dẫn đến đợ phức tạp tính tốn
lớn. Chính vì thế, NCS lựa chọn việc khai thác các đặc trưng trên miền thời gian, cụ thể
là các độ đo bậc 1 và 2 để giảm thiểu độ phức tạp tính tốn những vẫn đảm bảo phân
loại chính xác. Những thử nghiệm khác nhau đã được tiến hành với các độ đo để ước
8


lượng khả năng phân loại hành vi dựa vào sự khác biết biệt các giá trị độ đo thu được.
Cuối cùng cịn 5 đặc trưng nói trên được lựa chọn. Chúng tôi đã đề xuất một lựa chọn
cửa sổ và sơ đồ trích xuất đặc trưng cho q trình nhận dạng. Q trình nhận dạng bắt
đầu với đặc trưng trích xuất dữ liệu gia tốc. Chúng tôi đã sử dụng cửa sổ trượt có đợ

rợng cố định là n giây (bản ghi thứ i có n mẫu, bao gồm n-6 mẫu cuối cùng của bản ghi
i-1) trên dữ liệu của từng hành vi. Từ mỗi cửa sổ, một vectơ gồm 5 đặc trưng sẽ được
thu thập. Tồn bợ q trình nhận dạng hành vi được thể hiện trong Hình 5.

Hình 5. Quy trình nhận dạng hành vi.
Hình 6 phác thảo quy trình xây dựng của bợ phân loại trong nghiên cứu này.

Hình 6. Lưu đồ quá trình xây dựng của bộ phân loại.

9


Ở đây 60% dữ liệu được chọn ngẫu nhiên làm tập dữ liệu đào tạo và 40% còn lại được
sử dụng làm tập dữ liệu thử nghiệm. Bộ phân loại đã được đào tạo với các đặc trưng
được tính tốn từ các phép đo gia tốc (đầu vào) và hành vi khớp (đầu ra). Mơ hình phân
loại kết quả đã được thử nghiệm và các chỉ số hoạt động của mơ hình được tính tốn từ
tập dữ liệu thử nghiệm đợc lập. Mợt chương trình được viết bằng Python đã được phát
triển áp dụng các thuật tốn học có giám sát khác nhau để kiểm tra tính hiệu quả của
phương pháp được đề xuất.
Trong nghiên cứu học máy này, mỗi đặc trưng là mợt tḥc tính có thể đo lường được
của dữ liệu gia tốc. Thiết kế các đặc trưng là mợt bước quan trọng cho hiệu quả phân
loại. Đóng góp mới trong phần này là chúng tơi đã đề xuất một bộ đặc trưng hiệu quả
để phân loại bảy hành vi của bò. Với các đặc trưng tốt, các thuật tốn học máy sẽ tìm
thấy những gì chúng ta đang cần. Ví dụ: Giá trị trung bình (mợt trong các đặc trưng của
chúng tôi) của dữ liệu gia tốc rõ ràng khác nhau giữa Nằm và Ăn. Cụ thể, các đặc trưng
được tính tốn (trung bình, SD, RMS, trung vị, dải giá trị) của từng dữ liệu trạng thái
tĩnh và trạng thái động theo 3 trục X, Y và Z đã được trình bày.
Dải giá trị có thể được chọn làm một đặc trưng để nắm bắt sự khác biệt giữa giá trị cao
nhất và thấp nhất giữa các trạng thái đó.
(3.1)

range(X j )   min iN1  xi  , max iN1  xi 
trong đó X là dữ liệu của trục X;
Xj là bản ghi j;
N là số lượng mẫu của mợt bản ghi (kích thước cửa sổ);
Xi là mẫu i của bản ghi Xj;
min là giá trị tối thiểu của Xj;
max là giá trị tối đa của Xj;
Dải giá trị range(Xj ) là khoảng cách giữa giá trị tối thiểu và giá trị tối đa của Xj.
Dữ liệu trạng thái tĩnh có xu hướng có mợt giá trị điển hình khác nhau. Giá trị trung
bình có thể đề cập đến các phép đo của xu hướng trung tâm và trung vị cho phép đo giá
trị tiêu biểu như các đặc trưng để phân biệt trạng thái tĩnh với trạng thái động và cũng
để phân loại trạng thái tĩnh với nhau. Công thức biểu diễn của trị trung bình và trung vị:
1
N
m( X j )   i 1 xi
(3.2)
N
median( X j ) 

x# N /2  x# N /21
2

(3.3)

trong đó m(Xj) là trung bình của Xj, các giá trị xi trong Xj được sắp xếp. Giữa bốn trạng
thái đợng, dữ liệu Đi bình thường (SD khoảng 0,5) có xu hướng tập trung hơn các trạng
thái khác (SD hơn 1). Dữ liệu đi nhanh (SD khoảng 1,5) có phạm vi giá trị lớn nhất và
cũng là dữ liệu thưa thớt nhất. Vì vậy, đợ lệch chuẩn đã nắm bắt những khác biệt giữa
các trạng thái này.
 (X j ) 


1
k
( xi  m)2

i 1
N

10

(3.4)


trong đó  (Xj) là đợ lệch chuẩn của Xj. Dữ liệu khi Nằm xuống có nhiều giá trị khơng
khác dữ liệu đứng lên nhiều. Điều này dẫn chúng ta đến việc sử dụng RMS để đo đặc
tính này.
(3.5)
2
1
N
RMS X j 

N



i 1

xi


trong đó RMSXj là bình phương trung bình gốc của Xj. Lưu ý rằng tất cả các công thức
(3.1- 3.5) đều dành cho trục X; công thức cho trục Y, trục Z tương tự.
Chúng tôi đánh giá hiệu suất phân loại của 4 thuật toán học máy riêng lẻ (Cây quyết
định tăng cường Gradient, Máy vectơ hỗ trợ, Rừng ngẫu nhiên và K-Nearest Neighbor)
với các cửa sổ khác nhau (6 giây, 12 giây, 16 giây và 20 giây) với 5 đặc trưng đã nói ở
trên (giá trị trung bình, trung vị, SD, RMS và dải giá trị). Hiệu suất của mơ hình được
đánh giá dựa trên bốn chỉ số hiệu suất. Cuối cùng, chúng tôi đã so sánh về hiệu suất tổng
thể với các nghiên cứu của Jun Wang và cộng sự Error! Reference source not found.
và Martiskainen và M. Jarvinen Error! Reference source not found..
Chúng tôi sử dụng các định nghĩa sau:
- TP: Một kết quả phân loại là dương tính thật, khi kết quả phát hiện hành vi và hành vi
đó xuất hiện.
- TN: Mợt kết quả phân loại là âm tính thật, khi kết quả khơng phát hiện hành vi và hành
vi đó khơng xuất hiện.
- FP: Mợt kết quả phân loại là dương tính giả, khi kết quả phát hiện hành vi nhưng hành
vi đó khơng xuất hiện.
- FN: Mợt kết quả phân loại là âm tính giả, khi kết quả khơng phát hiện hành vi nhưng
hành vi đó xuất hiện.
Chúng tơi đã đánh giá hiệu suất của thuật tốn dựa trên đợ chính xác, đợ nhạy, giá trị
tiên đốn dương và giá trị tiên đốn âm.
- Acc (Đợ chính xác): Xác định bằng tỷ số giữa “số dự đoán đúng” với “Tổng số dự
đốn”.
- Sen (Đợ nhạy): Đo khả năng phân loại để phát hiện hành vi khi có hành vi.
- PPV (Giá trị tiên đốn dương tính): Trình bày tỷ lệ phân loại dương tính.
- NPV (Giá trị tiên đốn âm): Thể hiện tỷ lệ phân loại âm tính.
Từ các định nghĩa, chúng tơi có các cơng thức:
TP + TN
Acc 
(3.6)
TP + FP + FN + TN

TP
Sen 
(3.7)
TP + FN
TP
PPV 
(3.8)
TP + FP
TN
NPV 
(3.9)
TN + FN
trong đó TP (True Positives) là dương tính thật (tất cả đều dương), TN (False
Positives) là âm tính thật, FP (False Positives) là dương tính giả và FN (False
Negatives) là âm tính giả. Acc được biểu thị cho đợ chính xác, Sen là đợ nhạy, PPV là
giá trị tiên đoán dương và NPV là giá trị tiên đoán âm.
11


3.3. Kết quả
Thử nghiệm được dùng để đánh giá hiệu quả phân loại của 4 phương pháp học máy
riêng lẻ khi được thử nghiệm với các cửa sổ khác nhau (6 giây, 12 giây, 16 giây và 20
giây) và 5 đặc trưng (phần 3.2). Chúng tôi so sánh giữa GBDT, SVM, Rừng ngẫu nhiên
và K hàng xóm gần nhất (KNN). Trên Error! Reference source not found., bằng cách
sử dụng cùng mợt bợ dữ liệu đầu vào (phần 3.1). Đợ chính xác và độ nhạy khi sử dụng
các cửa sổ 6 giây, 12 giây, 16 giây và 20 giây đã được khai thác. Đợ chính xác tổng thể
được tính là đợ chính xác trung bình cho 7 hành vi. Đợ nhạy tổng thể được tính theo
cách tương tự. Thuật tốn GBDT (cửa sổ 16 giây) đạt hiệu suất cao nhất (độ chính xác
86,3% và đợ nhạy 80,6%). Error! Reference source not found. cho thấy hiệu suất của
các thuật toán phân loại này.

Trong mọi trường hợp, có sự phụ tḥc lớn vào kích thước cửa sổ, đợ chính xác
và đợ nhạy tổng thể tăng theo kích thước cửa sổ cho tất cả các thuật tốn được xem
xét. Từ kết quả, có thể nói rằng xu hướng chung là kích thước cửa sổ có ảnh hưởng đến
hiệu suất phân loại. Mợt cửa sổ phù hợp sẽ giảm gánh nặng tính tốn của các thuật toán
phân loại cũng như ảnh hưởng của nhiễu. Tuy nhiên nếu chiều dài cửa sổ trở nên quá
lớn, xác suất mợt cửa sổ nhất định có nhiều hơn mợt hoạt động sẽ tăng lên, độ trễ trước
khi đầu ra phân loại có thể tăng lên và số lượng dữ liệu học cũng sẽ giảm. Xem xét tất
cả các tùy chọn ở trên, chúng tơi thấy rằng thuật tốn GBDT (cửa sổ 16 giây) có thể đạt
được hiệu suất cao nhất, với đợ chính xác tổng thể 86,3% và đợ nhạy tổng thể 80,6%.
Các kết quả chi tiết của việc sử dụng trình phân loại GBDT (cửa sổ 16 giây) mang lại
hiệu suất tổng thể tốt nhất (phần 3.1) được trình bày trong Bảng 2. Trong Bảng 2 các ma
trận nhầm lẫn đạt được từ việc phân loại dữ liệu thử nghiệm hành vi bị (1456 bản ghi,
đã giải thích trong phần 3.1) theo thuật toán GBDT (cửa sổ 16-giây). Bảng 2 cho thấy
số trường hợp được xác định chính xác là dương tính (hành vi được mơ hình hóa), như
cũng như xác định chính xác là âm tính (các hành vi khác). Các trường hợp mợt mẫu âm
tính đã được phân loại sai thành dương tính và ngược lại, được gọi là dương tính giả và
âm tính giả, tương ứng.
Bảng 2. Các ma trận nhầm lẫn đạt được từ việc phân loại dữ liệu thử nghiệm hành vi
bò sữa.
Dự đốn hành vi
Hành vi
Nằm
Đứng Đi bình
Tồn
Ăn
Nằm Đứng
Đi nhanh
thực tế
xuống
lên

thường
bợ
Ăn
0
23
0
0
0
0
243
220
Nằm
0
0
0
0
0
0
290
290
Đứng
57
0
0
0
2
0
179
120
Nằm xuống

0
0
0
53
0
5
129
71
Đứng lên
0
0
0
47
3
5
120
65
Đi bình
0
0
0
1
0
0
291
290
thường
Đi nhanh
0
0

0
2
2
0
204
200
Tồn bợ
277
290
143
121
120
295
210
1456

12


Theo Bảng 2, nằm (290/290), đi bình thường (290/291) và đi nhanh (200/204) đã được
phân loại tốt, chỉ có mợt vài phân loại sai về các hành vi xảy ra (1/291 Đi bình thường
và 4/204 đi nhanh). Ăn và đứng được phân loại sai với nhau (57/179 ăn được phân loại
sai là đứng và 23/243 đứng được phân loại sai là ăn). Nằm xuống được phân loại sai với
đứng lên (53/129 nằm xuống được phân loại sai là đứng lên và 47/120 đứng lên được
phân loại sai là nằm xuống). Hiệu suất của mơ hình được đánh giá dựa trên bốn chỉ số
(phần 3.2), cụ thể là đợ chính xác (7), độ nhạy (8), PPV (9) và NPV (10) như trong Bảng
3.
Bảng 3. Tóm tắt các chỉ số hiệu suất của thuật toán GBDT cho tất cả các hành vi.
Các chỉ số
Đợ chính xác

Đợ nhạy
PPV
NPV
Ăn
94,0%
90,5%
79,4%
97,8%
Nằm
100%
100%
100%
100%
Đứng
93,9%
67,0%
83,9%
95,1%
Nằm xuống
92,1%
55,0%
58,7%
95,3%
Đứng lên
91,9%
54,2%
54,2%
95,6%
Đi bình thường
99,5%

99,7%
98,3%
99,9%
Đi nhanh
98,9%
98,0%
95,2%
99,6%
Hiệu suất tổng thể của mơ hình GBDT là tốt. Đợ nhạy là cao (> 90%) cho tất cả các
lớp trừ đứng (67%), nằm xuống (55%) và đứng lên (54,2%). Độ chính xác là rất tốt
cho tất cả các lớp (> 91,9%) hành vi, cũng như cho hiệu suất phân loại tổng thể. PPV
tốt cho việc nằm (100%), đứng (83,9%), ăn (79,4%), đi bình thường (98,3%), đi
nhanh (95,2%). Các giá trị PPV thấp hơn cho đứng lên (54,2%) và nằm xuống
(58,7%) cho thấy rằng bợ phân loại có vấn đề dự đốn chính xác các trường hợp
dương tính trong các lớp này, điều này cho thấy thêm rằng các mẫu hành vi này dễ bị
nhầm lẫn nhất với các hành vi khác. NPV cũng xuất sắc cho tất cả các lớp (> 95%) hành
vi.
Chúng tôi đã so sánh chi tiết về hiệu suất tổng thể với công việc của Jun Wang khi sử
dụng cùng một bộ dữ liệu. Bảng 4 cho thấy kết quả so sánh khi chúng tôi sử dụng phương
pháp đánh giá trung bình vĩ mơ (macro), tính tốn số liệu một cách độc lập cho từng lớp
và sau đó lấy trung bình (do đó xử lý với tất cả các phân loại bình đẳng). Bảng 5 cho
thấy kết quả so sánh khi chúng tôi sử dụng phương pháp đánh giá trung bình vi mơ
(micro), tổng hợp sự đóng góp của tất cả các lớp vào các giá trị trung bình được tính
tốn.
Bảng 4. Các chỉ số hiệu suất tổng thể được sử dụng
phương pháp đánh giá trung bình vĩ mô.
Jun Wang và cộng sự Error!
Các chỉ số
Kết quả của chúng tơi
Reference source not found.

Đợ chính xác
92,3%
95,8%
Đợ nhạy
79,1%
80,6%
PPV
82,1%
81,4%
NPV
Khơng cung cấp
97,6%
13


Bảng 5. Các chỉ số hiệu suất tổng thể được sử dụng phương pháp đánh giá trung bình
vi mơ.

Các chỉ số

Jun Wang và cộng sự Error!

Kết quả của chúng tôi

Reference source not found.

Đợ chính xác

86,6%


96,6%

Đợ nhạy

85,2%

86,3%

PPV

79,8%

86,0%

NPV

Khơng cung cấp

98,3%

3.4. Kết luận chương
Tóm lại, trong chương này NCS đã đề xuất mợt bợ phân loại các hành vi của bị mợt cách hiệu
quả. Dữ liệu được tạo ra bởi cảm biến gia tốc được sử dụng để huấn luyện sử dụng một số phân
loại, bao gồm KNN, SVM, Rừng ngẫu nhiên và Cây quyết định tăng cường Gradient được hỗ
trợ bởi thư viện Scikit-learn library1. Công bố khoa học liên quan tới chương này là cơng trình
số 2 và 3.

Scikit-learn library là mợt thư viện Python mã nguồn mở có các cơng cụ mạnh mẽ để phân tích dữ liệu và khai
thác dữ liệu.
1


14


CHƯƠNG 4. PHÂN LOẠI HÀNH VI SỬ DỤNG DỮ LIỆU ĐỒNG BỘ TỪ
CHÂN VÀ CỔ BỊ
4.1. Động lực nghiên cứu
Có hai cách tiếp cận phổ biến để thu thập dữ liệu gia tốc từ mợt con bị: cảm biến gia
tốc có thể được gắn vào chân hoặc cổ của bị. Một số nghiên cứu dựa trên dữ liệu gia
tốc gắn cổ Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found., một số nghiên cứu khác dựa trên dữ liệu
gia tốc gắn chân Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.. Sự lựa chọn chân hay cổ phụ thuộc vào
những hành vi được tập trung vào, chẳng hạn như dữ liệu gia tốc được gắn trên cổ sẽ tốt
hơn để phân biệt hành vi ăn. Tuy nhiên, việc sử dụng cảm biến gia tốc chỉ ở chân hoặc
cổ có thể dẫn đến mợt số hành vi phân loại nhầm lẫn nhau. Ví dụ nếu chúng chứa các
hành vi tương tự chẳng hạn như đứng và ăn (trong trường hợp dữ liệu gia tốc được gắn
trên chân). Sự giới hạn này thường đến từ chính dữ liệu. Nó cho thấy rằng trong loại vấn
đề này, dữ liệu quan trọng hơn các phương pháp học máy. Do đó, chúng tôi đề xuất một
cách tiếp cận mới tập trung vào việc cải thiện chất lượng dữ liệu.
4.2. Dữ liệu sử dụng
Gắn mợt cảm biến gia tốc vào chân bị và mợt cảm biến gia tốc vào cổ bị là cách thức
để theo dõi hành vi của từng con bò. Các chuyển động của chân và cổ thông qua cảm
biến gia tốc được chuyển đổi thành tín hiệu điện, được gửi đến bộ vi điều khiển của chân
và một bộ vi điều khiển khác ở cổ. Dựa trên các quan sát trực tiếp về hành vi bị, chúng
tơi đã gắn nhãn dữ liệu của mình (tức là gán hành vi theo cách thủ công mà dữ liệu được
thu thập tại thời điểm đó tương ứng với) thành bốn loại hành vi khác nhau
Điểm mấu chốt của nghiên cứu là đồng bộ hóa dữ liệu gia tốc giữa chân và cổ. Trong
trường hợp tốt nhất, khơng có dữ liệu nào bị mất trong q trình thu thập dữ liệu, và

khơng có dữ liệu nào bị mất trong quá trình truyền dữ liệu từ chân đến cổ bị. Sau đó cứ
mỗi 0,1 giây, bộ vi điều khiển trên cổ nhận được hai khung dữ liệu được đồng bợ hóa
theo thời gian. Chúng tơi sử dụng mười khung dữ liệu từ chân để tính trung bình nhằm
thu được mợt khung dữ liệu với tốc độ cập nhật là một giây. Tương tự như vậy, mười
khung dữ liệu từ cổ sẽ được tính trung bình để thu được một khung dữ liệu với tốc độ
cập nhật là mợt giây. Mục đích của việc lấy trung bình là làm mịn dữ liệu, loại bỏ thành
phần nhiễu tần số cao. Nếu dữ liệu bị mất trong quá trình thu thập dữ liệu, hoặc thơng
tin bị mất trong quá trình truyền dữ liệu từ thiết bị chân sang thiết bị cổ thì sẽ xử lý như
sau:
+ Lấy số mẫu gia tốc chân bị nhận được trong mợt giây gọi là N, N sẽ có giá trị nhỏ
hơn 10, tính trung bình cợng giá trị gia tốc của N mẫu thu được trên mỗi trục X, Y, Z.
+ Lấy số mẫu gia tốc nhận được từ cổ bò trong mợt giây gọi là M, M sẽ có giá trị nhỏ
hơn 10, tính trung bình cợng giá trị gia tốc của M mẫu thu được trên mỗi trục X, Y, Z.
+ Xóa các mẫu có giá trị trung bình chỉ tồn tại ở chân hoặc cổ. Chúng tôi lưu các giá trị
trung bình mà thơng tin thời gian (tính bằng giây) tồn tại ở cả chân và cổ.

15


Thiết bị ở cổ có dữ liệu gia tốc cổ và chân được đồng bợ hóa từng giây và được đóng
gói thành mợt siêu khung bao gồm các thành phần sau:
+ Mã định danh (ID) của bị
+ Thời gian tính theo từng giây
+ Phần trăm pin còn lại trong thiết bị cổ và chân
+ Gia tốc ba trục X, Y, Z đo ở chân bò.
+ Gia tốc ba trục X, Y, Z đo ở cổ bị.
Dữ liệu đóng gói được gửi đến nút trung tâm thông qua mô-đun giao tiếp LoRa. Pin của
nút cảm biến là pin Lithium có dung lượng 6600mAh và điện áp làm việc là 3,7V. Tổng
công suất trung bình trong mơ hình hoạt đợng của nút cảm biến của chân là 68,99 mW.
Do đó, thời gian lý thuyết của lần sạc tiếp theo là 22440mWh / 68,99 mW = 325 giờ

(hoặc 13,5 ngày). Tương tự, thời gian sạc tiếp theo của nút cảm biến của cổ là
22440mWh / 134,99 mW = 166 giờ (hoặc bảy ngày). Tuổi thọ của nút cảm biến cổ nhỏ
hơn so với nút chân vì nó bao gồm mợt mơ-đun LoRa.
Việc phân loại các hành vi của bò được thực hiện trên máy tính. Các thiết bị hỗ trợ
Internet như điện thoại hoặc máy tính có thể truy cập và theo dõi tình trạng của từng con
bị trong thời gian thực.
Năm con bị trong thử nghiệm của chúng tơi được chỉ định năm ID tương ứng (ID1, ID2,
ID3, ID4 và ID5). Để đánh giá sự thích nghi của con bị khi đeo thiết bị, những con bị
được chia thành hai nhóm. Các cảm biến được gắn vào bị của nhóm đầu tiên (bao gồm
ID1 và ID4) hai tuần trước khi thử nghiệm, và cho bị của nhóm cịn lại (bao gồm ID2,
ID3 và ID5) vào ngày thử nghiệm. 20 mẫu / giây là tốc đợ lấy mẫu của tín hiệu thơ;
chúng tơi lấy trung bình ở mợt mẫu / giây để lưu trữ tín hiệu lấy mẫu xuống. Khơng có
hạn chế hoặc ảnh hưởng đến các hoạt đợng của bị được cơng nhận trong q trình thử
nghiệm. Ba bợ dữ liệu được tạo từ dữ liệu gia tốc của năm con bò. Tập dữ liệu đầu tiên
(DATASET01) chứa dữ liệu từ cảm biến gắn trên chân, tập dữ liệu thứ hai
(DATASET02) bao gồm dữ liệu từ cảm biến gắn trên cổ và tập dữ liệu thứ ba
(DATASET03) đã đồng bợ hóa dữ liệu từ cảm biến gắn trên chân và gắn trên cổ. Phân
loại hành vi của bò được áp dụng cho tất cả các bộ dữ liệu này để đánh giá hiệu suất của
cùng một phương pháp với các cấu trúc dữ liệu khác nhau.
Bảng 6. Các hành vi phân loại
Hành vi
Định nghĩa
Ăn
Bò ăn (nhai và lấy thức ăn dùng miệng)
Nằm
Bò ở tư thế nằm nghỉ ngơi.
Đứng
Bò đứng trên tất cả 4 chân.
Đi
Bị bước trong vịng 1 giây (ít nhất 3 cử động chân liên tiếp).

4.3. Phương pháp phân loại đề xuất
Hình 7 cho thấy quy trình mà chúng tơi sử dụng trong nghiên cứu này. Dữ liệu gia
tốc chân và ở cổ được đồng bợ hóa được hiển thị với độ dài cố định: bản ghi thứ i chứa
dữ liệu gia tốc 16 giây (16 mẫu), bao gồm dữ liệu gia tốc mười giây cuối cùng (10 mẫu
cuối cùng) của bản ghi thứ (i-1). Ở chương này chúng tôi chỉ sử dụng các đặc trưng
gồm: RMS, độ lệch chuẩn (SD) và giá trị trung bình cho tất cả các bản ghi. Dữ liệu được

16


gắn nhãn dựa trên những quan sát thực tế về hành vi của bị gồm có bốn hành vi: đi, ăn,
nằm và đứng.

Hình 7. Quy trình phân loại hành vi bị.

Hình 8. Quy trình hoạt động của bộ phân loại
Dữ liệu huấn luyện được lựa chọn ngẫu nhiên trong 60% của bợ dữ liệu; phần cịn lại
(khoảng 40%) là dữ liệu thử nghiệm. Sự phân chia này đã được chứng minh là phù hợp
với bài tốn phân loại tập tính bị Error! Reference source not found.Error!
Reference source not found.. Mơ hình phân loại được đào tạo bằng dữ liệu đào tạo
được gắn nhãn dựa trên bộ đặc trưng được đề xuất.

17


4.4. Kết quả
Thử nghiệm được đưa ra để đánh giá hiệu suất phân loại của thuật toán RF được áp dụng
với cửa sổ 16 giây và ba đặc trưng (trung bình, SD và RMS). Chúng tơi đã so sánh hiệu
suất phân loại về đợ chính xác, đợ nhạy và PPV. Nghiên cứu quan tâm đến bốn loại hành
vi trong nghiên cứu này: đứng, ăn, nằm và đi. Những hành vi này cũng có thể được chia

thành hai nhóm: 1 / đứng và ăn; và 2 / nằm và đi. Nếu chúng ta quan sát vị trí của cảm
biến gia tốc, cảm biến được gắn trên cổ dự kiến sẽ có hiệu suất tốt trong nhóm đầu tiên.
Cảm biến gắn trên chân được kỳ vọng sẽ có hiệu suất tốt lần lượt ở nhóm thứ hai. Trên
Hình 9, DATASET01 (đen) chứa dữ liệu từ cảm biến gắn trên chân. DATASET02 (màu
đỏ) chứa dữ liệu từ cảm biến được gắn trên cổ. DATASET03 (màu xanh lam) chứa dữ
liệu được đồng bợ hóa từ các cảm biến được gắn ở chân và được gắn trên cổ. Hình 9 cho
thấy số lượng TP cho nhóm đầu tiên (đứng và ăn) trên tập dữ liệu của năm con bò trong
các kịch bản của chúng:
+ Dữ liệu từ chân (tức là DATASET01)
+ Dữ liệu từ cổ (tức là DATASET02)
+ Dữ liệu được đồng bợ hóa từ chân và cổ (tức là DATASET03)
Dữ liệu được đồng bộ hóa từ các cảm biến gắn trên chân và gắn trên cổ (DATASET03)
cung cấp số lượng TP lớn nhất. Tổng số hành vi đứng và ăn là 865, 817, 735, 813, 622
(Error! Reference source not found.B), số lượng các TP là 853, 723, 634, 764, 534
(Error! Reference source not found.) cho các con bò ID1, ID2, ID3, ID4, ID5. Điều
thú vị là số lượng TP từ cảm biến gắn trên cổ (DATASET02) nhiều hơn so với cảm biến
gắn ở chân (DATASET01).
1000

853
764

723

800

634
534

600

400
200
0
ID1

ID2

DATASET01

ID3
DATASET02

ID4

ID5

DATASET03

Hình 9. TP của hành vi đứng và ăn
Hình 10 với DATASET01 (đen) chứa dữ liệu từ cảm biến gắn trên chân. DATASET02
(màu đỏ) chứa dữ liệu từ cảm biến được gắn trên cổ. DATASET03 (màu xanh lam) chứa
dữ liệu được đồng bợ hóa từ các cảm biến được gắn ở chân và được gắn trên cổ. Hình
10 cho thấy số lượng TP của nhóm thứ hai (nằm và đi) trên tập dữ liệu của năm con bò
trong các kịch bản trên. Dữ liệu được đồng bợ hóa từ các cảm biến gắn trên chân và gắn
trên cổ (DATASET03) cung cấp số lượng TP lớn nhất. Tổng số lần nằm và và đi được
quan sát là 570, 370, 185, 513, 547 (Error! Reference source not found.(b)), số TP là
564, 369, 185, 511, 547 tương ứng cho các con bò ID1, ID2, ID3, ID4, ID5. Như chúng

18



tôi mong đợi, số lượng TP từ cảm biến gắn trên chân (DATASET01) lớn hơn so với
cảm biến gắn trên cổ (DATASET02).
564

600

547

511

500
369

400
300

185

200
100
0
ID1

ID2

DATASET01

ID3
DATASET02


ID4

ID5

DATASET03

Hình 10. TP của nằm và đi.
Bảng 7 trình bày kết quả của phương pháp đánh giá trung bình vĩ mơ và phương pháp
đánh giá trung bình vi mơ. Phương pháp đánh giá trung bình vĩ mơ tính tốn chỉ số một
cách độc lập cho từng lớp và sau đó lấy giá trị trung bình (tất cả các lớp được đối xử
như nhau). Phương pháp đánh giá trung bình vi mơ tổng hợp đóng góp của tất cả các
lớp vào các giá trị trung bình được tính tốn.
Bảng 7. Hiệu suất sử dụng trung bình vi mơ và trung bình vĩ mơ
so sánh ba tập dữ liệu (a), năm con bị của DATASET03 (b)

(A)
Bợ dữ liệu
01
02
03

Đợ chính xác Đợ nhạy PPV
Micro
Macro
Micro
Macro
Micro
Macro


0.81
0.84
0.82
0.80
0.94
0.95

0.81
0.84
0.82
0.80
0.94
0.95

0.81
0.84
0.82
0.81
0.94
0.95

(B)
Đợ chính xác Đợ nhạy PPV

COW ID
ID1
ID2
ID3
ID4
ID5


Micro
Macro
Micro
Macro
Micro
Macro
Micro
Macro
Micro

0.99
0.99
0.92
0.93
0.89
0.93
0.96
0.97
0.92
19

0.99
0.99
0.92
0.94
0.89
0.93
0.96
0.97

0.92

0.99
0.99
0.92
0.92
0.89
0.93
0.96
0.96
0.92


Macro

0.93
0.93
0.95
Như thể hiện trong Bảng 7 (a), trung bình vi mơ và trung bình vĩ mơ của DATASET01
và DATASET02 là gần nhau. Kết quả có ý nghĩa vì DATASET01 cho kết quả nằm và
đi tốt hơn và DATASET02 cho kết quả đứng và ăn tốt hơn. Hiệu suất của DATASET03
là đáng kể hơn so với trường hợp của DATASET01 và DATASET02. Hiệu suất phân
loại tổng thể của chúng tôi cho DATASET03: đợ chính xác 0,94, đợ nhạy 0,94 và 0,94
PPV trong trường hợp trung bình vi mơ; Đợ chính xác 0,95, độ nhạy 0,95 và 0,95 PPV
trong trường hợp trung bình vĩ mơ. Bảng 7 (b) cho thấy trung bình vi mơ và trung bình
vĩ mơ của năm con bị. ID1 có hiệu suất tốt nhất với tất cả các giá trị bằng 0,99. ID4 có
hiệu suất tốt; giá trị nhỏ nhất là 0,96. ID3 có hiệu suất thấp nhất. Tuy nhiên, ba chỉ tiêu
vẫn ở mức cao (0,89 ở trung bình vi mơ và 0,93 ở trung bình vĩ mơ).
4.5. Thảo luận
Như kết quả trình bày trong các bảng trên, các hành vi của bị có thể được phân loại

thành công với hiệu suất cao bằng cách đạt được đợ chính xác 0,95, đợ nhạy 0,95 và
0,95 PPV khi sử dụng đề xuất của chúng tôi (DATASET03). So với các kết quả tài liệu,
phương pháp kết hợp cảm biến gia tốc gắn trên chân và gắn trên cổ của chúng tơi được
áp dụng ở đây có thể được coi là đạt được hiệu suất phân loại hành vi rất tốt. Chúng tôi
đã đạt được hiệu suất cao khi phân loại ăn (đợ chính xác 0,914, đợ nhạy 0,884 và PPV
0,956) và đứng (đợ chính xác 0,88, đợ nhạy 0,928 và PPV 0,842), thường là có mợt giới
hạn Error! Reference source not found.Error! Reference source not found.Error!
Reference source not found.Error! Reference source not found.Error! Reference
source not found. Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not found..
Chúng tôi đã thực hiện những kết quả này mà không yêu cầu bất kỳ điều kiện nào cho
trang trại.

Bảng 8 trình bày so sánh với mợt số nghiên cứu liên quan. P. Martiskainen và M.
Jarvinen Error! Reference source not found. đã sử dụng SVM (máy vectơ hỗ trợ) để
nhận ra các hành vi dựa trên dữ liệu gia tốc gắn trên cổ. Tám hành vi được phân loại với
việc sử dụng một cảm biến gia tốc cho mỗi con bò. Tần số lấy mẫu của cảm biến gia tốc
là 10 Hz; thời lượng cửa sổ là 10 giây. Do đó, mợt bản ghi của họ dữ liệu đã có 100 mẫu
(trong nghiên cứu của chúng tơi, mợt bản ghi 16 mẫu). Tám đặc trưng đã được sử dụng,
bao gồm trung bình, SD, giá trị nhỏ nhất, giá trị lớn nhất…. Các kết quả phân loại hành
vi đi, ăn, nằm và đứng sẽ được so sánh với kết quả của chúng tôi. Họ thu được kết quả
tốt trong hành vi ăn (0,96 đợ chính xác, 0,75 nhạy cảm, 0,81 PPV) , nhưng khơng tốt
trong nằm (0,84 đợ chính xác, 0,80 độ nhạy, , 0,83 PPV) và đi (0,99 đợ chính xác, 0,79
đợ nhạy, 0,79 PPV ), so với các nghiên cứu dựa trên dữ liệu gia tốc gắn trên chân Error!
Reference source not found.Error! Reference source not found.Error! Reference
source not found..
Lí do là vì cảm biến gia tốc gắn trên cổ đã được sử dụng trong thí nghiệm của họ. Dữ
liệu gia tốc được gắn trên cổ nhận biết việc ăn tốt hơn so với dữ liệu gia tốc được gắn ở
20



chân và ngược lại; Dữ liệu gia tốc gắn ở chân nhận biết nằm và đi tốt hơn so với dữ liệu
gia tốc gắn ở cổ. Kết quả PPV của họ là 0,65 đứng, 0,83 nằm, 0,81 ăn và 0,79 đi. Kết
quả PPV của chúng tôi tốt hơn đáng kể, và cũng tốt hơn với đợ chính xác và đợ nhạy.
Tóm lại, lượng mẫu của mợt bản ghi lớn (100), nhiều đặc trưng (8) đã được sử dụng
nhưng hiệu suất vẫn chưa cao. Tuy nhiên, lưu ý rằng nghiên cứu của P. Martiskainen và
M. Jarvinen Error! Reference source not found. là mợt trong những cơng trình ban
đầu về chủ đề này. Khi cơng trình của họ được xuất bản, việc giám sát tự động dựa trên
hành vi của động vật là tương đối mới.

Bảng 8. Tóm tắt các nghiên cứu liên quan
Các
trình

cơng

P.
Martiskainen
and
M.
Jarvinen
Error!
Reference
source
not
found.
Oudshoorn et
al
Error!
Reference

source
not
found.
Arcidiacono et
al
Error!
Reference
source
not
found.
Wang et al
Error!
Reference
source
not
found.

Các hành vi

Cơng nghệ sử dụng

Tần
Cửa Phương
số lấy số dữ pháp
sử
mẫu liệu
dụng

đứng, nằm,
cảm biến gia tốc gắn

10
ăn, đi và bốn
10 Hz
cổ
giây
hành vi khác

SVM

ăn (bò chăn cảm biến gia tốc gắn
1 Hz
thả)
cổ

10
phút

So
sánh
ngưỡng

đứng và đi

cảm biến gia tốc gắn
4 Hz
cổ

5
giây


So
sánh
ngưỡng

đứng, nằm,
ăn, đi, nằm
xuống, đứng
lên, đi nhanh

combining
mounted
accelerometer
location sensor

6
giây

AdaBoost

Barwick et al
đứng,
Error!
ăn, đi
Reference

legand

1 Hz

cảm biến gia tốc gắn

3, 5,
nằm, cổ, cảm biến gia tốc
Random
12 Hz và 10
gắn chân, cảm biến
Forest
giây
gia tốc gắn tai
21


source
found.

not

Nghiên
cứu đứng,
của chúng tôi
ăn, đi

nằm,

cảm biến gia tốc gắn
16
cổ và cảm biến gia tốc 10 Hz
giây
gắn chân

Random

Forest

Arcidiacono và cộng sự Error! Reference source not found. đã đề xuất một công cụ
phân loại làm giảm ngưỡng cảm biến gia tốc. Hệ thống của họ tập trung vào việc đứng
và ăn. Tần số lấy mẫu là 4 Hz và thời lượng cửa sổ là 5 giây. Vì vậy, có 20 mẫu mỗi bản
ghi. Vì bài tốn phân loại chỉ phân biệt giữa đứng và ăn, nên chỉ có mợt đặc trưng (trung
vị) được sử dụng để tính ngưỡng. Ngưỡng gia tốc này sẽ được sử dụng để phân biệt
trạng thái ăn. Khi ăn có chuyển đợng của đầu, và chỉ phân tích dữ liệu cảm biến gia tốc
của trục X.
Oudshoorn và cộng sự Error! Reference source not found. đã sử dụng cảm biến cảm
biến gia tốc để ước tính thời gian chăn thả. Dữ liệu được thu thập với tốc độ lấy mẫu là
1 Hz. Ước tính của việc chăn thả được so sánh với việc quan sát thủ công trên cửa sổ 10
phút. Phương pháp được đề xuất dựa trên sự so sánh các ngưỡng, tương tự như ý tưởng
của Error! Reference source not found.. Số lượng hành vi trong công việc này bị hạn
chế vì họ khơng tập trung vào phân loại hành vi. Lượng cỏ là thông tin mà họ quan tâm,
lượng cỏ có thể được ước tính từ tần suất cắn và thời gian chăn thả. Hiệu suất ước tính
khơng cao: 0,7 đợ nhạy và 0,82 PPV. Mợt trong những lý do là chất lượng của dữ liệu
gia tốc được thu thập. Nghiên cứu này là một trong số ít nghiên cứu nói về việc phân
loại bị ăn cỏ.
Wang và cộng sự Error! Reference source not found. đề xuất một phương pháp dựa
trên việc kết hợp cảm biến gia tốc và cảm biến vị trí gắn trên chân. Dùng thuật toán
AdaBoost để phân loại bảy hành vi của bò. Bốn hành vi như trong nghiên cứu này của
chúng tơi: ăn, nằm, đứng, đi bình thường. Ba hành vi khác: đi nhanh, đứng lên, nằm
xuống. Trong thí nghiệm của họ, tốc độ lấy mẫu là 1 Hz, thời lượng cửa sổ là 6 giây.
Hiệu suất của chúng tôi tốt hơn của họ đối với tất cả các chỉ số: đợ chính xác (0,9 5 so
với 0,86), đợ nhạy (0,95 so với 0,85) và PPV (0,95 so với 0,80). Kết quả ăn của họ là đợ
chính xác 0,75, đợ nhạy 0,73 và 0,75 PPV. Kết quả đứng là đợ chính xác 0,75, độ nhạy
0,78 và 0,72 PPV. Những kết quả này thấp hơn trường hợp xấu nhất của chúng tôi (bị
ID2). Nó đã chứng minh rằng giải pháp kết hợp cảm biến chân và cảm biến cổ của chúng
tôi hoạt động tốt hơn so với giải pháp cảm biến chân và cảm biến vị trí của họ. Hơn nữa,

giải pháp của họ chỉ phù hợp với bị chuồng thả rơng vì vị trí ăn là cố định. Trong trường
hợp này, sự nhầm lẫn có thể xuất hiện nếu bị đang đứng ở vị trí ăn cố định.
Barwick và cợng sự Error! Reference source not found. xác định hành vi của cừu thay
vì hành vi của bị. Các vấn đề phân loại cũng tương tự. Họ cũng quan tâm đến bốn hành
vi chính bao gồm ăn, nằm, đứng và đi. Ba loại cảm biến khác nhau đã được sử dụng
trong ba thí nghiệm (khơng kết hợp, chỉ mợt cảm biến cho mợt thí nghiệm). Thí nghiệm
cảm biến gia tốc đeo cổ, cảm biến gia tốc gắn trên chân và cảm biến gia tốc đeo tai. Dữ
liệu được lấy mẫu ở tần số 12 Hz. Họ đã thử độ dài cửa sổ khác nhau: 3, 5 và 10 giây.
Mơ hình phân loại sử dụng RF. Hiệu suất của hệ thống giám sát cừu này thấp hơn so với
hệ thống của chúng tôi. Đợ chính xác của thử nghiệm cảm biến gắn trên tai là lớn nhất,
22


dao đợng từ 0,86 đến 0,95. Cụ thể, đợ chính xác khi đứng dao động từ 0,69 đến 0,97, đi
0,85 đến 1, ăn 0,58 đến 0,95 và đợ chính xác khi nằm thấp.
Trong bài tốn ML này, mợt cửa sổ dữ liệu phù hợp là điều cần thiết Error! Reference
source not found.. Nếu độ dài cửa sổ lớn, số lượng dữ liệu huấn luyện sẽ giảm và một
cửa sổ nhất định (mợt bản ghi) có thể chứa nhiều hoạt đợng. Như vậy, hiệu suất phân
loại sẽ giảm Error! Reference source not found.. Độ dài cửa sổ được ưu tiên trong
khoảng 5-16 giây Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.Error! Reference source not
found.Error! Reference source not found.. Trong nghiên cứu này, độ dài cửa sổ là 16
giây.
Tất cả các cơng việc được thảo luận ở trên nhằm mục đích phát triển một hệ thống dựa
trên IoT để giám sát động vật. Hệ thống của chúng tôi đã sử dụng các thiết bị cảm biến
(cảm biến gia tốc đeo ở cổ và gia tốc gắn ở chân) để cảm nhận và phân tích dữ liệu với
sự hỗ trợ của trí tuệ nhân tạo (trong trường hợp này là các thuật tốn ML). Có các nghiên
cứu nâng cao chất lượng hệ thống IoT dựa trên trí tuệ nhân tạo Error! Reference
source not found.Error! Reference source not found.Error! Reference source not

found., hoặc mợt bài tốn thời gian thực, mợt thuật tốn nhanh và đơn giản là điều bắt
buộc. Xét rằng dữ liệu gia tốc không phức tạp chỉ với các giá trị số, thuật toán RF, Cây
quyết định tăng cường Gradient và AdaBoost (thuật toán dựa trên cây quyết định) là phù
hợp Error! Reference source not found.Error! Reference source not found.Error!
Reference source not found.Error! Reference source not found.. Chúng tôi nhận
thấy rằng hiệu suất khác biệt nhất giữa các nghiên cứu này khơng đến từ thuật tốn ML.
Vì vậy, việc cải thiện dữ liệu là mục tiêu của bài báo này. Trong các bài tốn ML, thơng
tin tốt hơn có nghĩa là hiệu suất tốt hơn. Dữ liệu gia tốc được đồng bợ hóa từ cảm biến
chân và cảm biến vịng cổ là lựa chọn của chúng tôi. Kết quả nổi bật trong bài báo này
đã chứng minh rằng hiệu suất vượt trợi có thể được thực hiện bằng cách sử dụng mợt
mơ hình phân loại đơn giản.
4.6. Kết luận chương
Đóng góp quan trọng trong chương này là đề xuất việc sử dụng dữ liệu đồng bợ hóa từ
hai cảm biến lắp ở chân và cổ bị cho bợ phân loại bốn hành vi quan trọng của bò. Việc
phân loại các hành vi của bò ăn cỏ dựa trên hệ thống cảm biến kết hợp của chúng tôi
cung cấp sự cải tiến đáng kể so với các hệ thống truyền thống khác (chỉ sử dụng một
cảm biến, gắn trên chân hoặc gắn trên cổ). Công bố liên quan tới chương này là cơng
trình số 1 và 6.

23


×