ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ
LỮ ĐĂNG NHẠC
NHẬN DẠNG HÀNH VI CỦA NGƯỜI THAM GIA GIAO
THÔNG DỰA TRÊN CẢM BIẾN ĐIỆN THOẠI
Chuyên ngành: Hệ thống Thông tin
Mã số: 9480401.01
TÓM TẮT LUẬN ÁN TIẾN SĨ CÔNG NGHỆ THÔNG TIN
MỞ ĐẦU
Tính cấp thiết của luận án
Trong hệ thống giao thông đô thị, có nhiều yếu tố tác động đến
vấn đề quản lý và an toàn giao thông. Trong đó, thái độ và hành vi của
người tham gia giao thông có tác động trực tiếp hệ thống. Do đó, việc
nhận dạng hành vi của người tham gia giao thông bao gồm cả nhận
dạng các hành động và hành vi bất thường có một ý nghĩa rất lớn trong
việc xây dựng giải pháp, ứng dụng hỗ trợ người tham gia giao thông . Vì
vậy, chủ đề này đã và đang thu hút được sự quan tâm nghiên cứu của
nhiều nhà khoa học, các phòng thí nghiệm trên thế giới. Hơn thế nữa,
những thông tin về hành vi của người tham gia giao thông sẽ rất hữu ích
cho những nhà quản lý trong việc quy hoạch hệ thống và xây dựng
chính sách quản lý giao thông và các chính sách an sinh xã hội khác.
Ngoài ra, mô hình nhận dạng hành vi người tham gia giao thông còn trợ
giúp đánh giá mức độ rủi ro trong các lĩnh vực bảo hiểm cũng như có
thể ước tính mức độ tiêu thụ năng lượng và ô nhiễm môi trường của hệ
thống giao thông.
Để xây dựng được mô hình nhận dạng hành vi của người tham gia
giao thông các thông tin, dữ liệu của người tham gia được thu thập bằng
nhiều cách khác nhau. Thí nghiệm ban đầu đã thu thập dữ liệu bằng các
thiết bị cảm biến cố định trên đối tượng nghiên cứu. Nhờ sự phát triển
của công nghệ phần cứng, nhiều loại cảm biến khác nhau được tích
hợp đã cho phép điện thoại thông minh trở thành công cụ hữu ích trong
việc thu thập dữ liệu từ người dùng. Chính vì vậy, trong thời gian gần
đây, nhiều công trình nghiên cứu về nhận dạng hành vi người dùng bao
gồm cả hành vi cử chỉ và hành vi trong giao thông dựa trên cảm biến
điện thoại thông minh được công bố. Tuy nhiên, để đảm bảo độ chính
xác cao trong kết quả của mô hình nhận dạng thì hầu hết các nghiên
cứu được thực hiện với vị trí điện thoại cố định trên phương tiện giao
thông hoặc sử dụng tập thuộc tính đặc trưng có số lượng lớn nhằm
trích xuất dữ liệu từ nhiều nguồn cảm biến khác nhau của điện thoại.
Điều này làm cho mô hình xây dựng giảm tính tiện dụng cũng như giảm
khả năng ứng dụng trong thực tế. Điều này dẫn đến hướng nghiên cứu
về nhận dạng hành vi của người dùng khi vị trí điện thoại người dùng
không cố định trong quá trình tham gia giao thông.
Ngoài ra, những nghiên cứu đã công bố về nhận dạng hành vi giao
thông được thực hiện trong các điều kiện hoàn cảnh khác nhau. Trong
đó, có sự khác nhau về yếu tố khu vực địa lý, hạ tầng giao thông và văn
hóa so với các điều kiện và môi trường giao thông tại Việt Nam. Do
vậy, những mô hình nhận dạng đã được xây dựng gặp nhiều khó khăn
khi phát triển và áp dụng trong điều kiện cụ thể của Việt Nam. Sự khác
biệt này xuất phát từ một số yếu tố quan trọng bao gồm cả yếu tố
khách quan và yếu tố chủ quan. Thứ nhất, đó là các nghiên cứu về bài
toán nhận dạng thường tập trung vào các phương tiện giao thông phổ
biến tại các nước phát triển với đa số phương tiện sử dụng cho thực
nghiệm là xe ô tô, xe buýt và tàu điện ngầm mà ít khi xét đến các
phương tiện thô sơ. Trong khi đó, hệ thống giao thông đô thị tại các
nước đang phát triển hoặc chậm phát triển, trong đó có Việt nam, các
phương tiện giao thông được người dân sử dụng chủ yếu vẫn là xe máy
và xe đạp cùng một số phương tiện công cộng khác. Hơn thế nữa, phần
lớn các nghiên cứu trước đây thực hiện trong điều kiện hạ tầng giao
thông ổn định hơn so với tính đa dạng điều kiện giao thông như ở Việt
Nam. Thứ hai, về yếu tố chủ quan đó là văn hóa và thói quen di chuyển
của người dân khi tham gia giao thông. Với những phương tiện như ô tô
hay xe buýt trong các nghiên cứu, dữ liệu cảm biến được thu thập trong
điều kiện phương tiện di chuyển trên các làn đường riêng, hoặc hay
đường chạy xác định trước. Điều kiện này không thể thực hiện được
với hiện trạng giao thông đô thị của Việt Nam. Tất cả những yếu tố cơ
bản kể trên là những lý do giải thích tại sao cần có các nghiên cứu mô
hình nhận dạng hành vi giao thông phù hợp với tính chất đặc thù tại
Việt Nam.
Để hỗ trợ được người tham gia giao thông, một trong những mục
đích quan trọng, cấp thiết của mô hình phát hiện hành vi đó là khả năng
phát hiện được các hành vi giao thông bất thường. Các nghiên cứu về
vấn đề này thường tập trung vào phương tiện ô tô; các phương tiện có
những thiết kế, đặc tính khác nhau nên rất khó có một mô hình phù hợp
với tất cả các loại phương tiện khác nhau. Các nghiên cứu này cũng
thường sử dụng hướng tiếp cận kết hợp nhiều loại cảm biến để thu
thập, phân tích dữ liệu cho quá trình nhận dạng. Bên cạnh các cảm biến
chuyển động thì các cảm biến khác như GPS, camera hình ảnh và cảm
biến âm thanh cũng có thể được sử dụng nhằm nâng cao độ chính xác
trong nhận dạng các hành vi bất thường khi lái xe. Việc sử dụng đồng
thời nhiều dữ liệu cảm biến cùng một thời điểm dẫn đến tiêu tốn nhiều
năng lượng của điện thoại thông minh và khó có thể áp dụng trong thực
tế. Hướng tiếp cận lựa chọn thu thập, phân tích dữ liệu cảm biến
chuyển động như cảm biến gia tốc sẽ có mức tiêu tốn năng lượng thấp
nhất nhưng cần phải xây dựng một mô hình phù hợp để đảm bảo độ
chính xác nhận dạng trên các loại phương tiện giao thông khác nhau.
Một trong những giải pháp căn cốt cho vấn đề này đó là cần xác định,
lựa chọn được tập thuộc tính đặc trưng phù hợp cho các loại phương
tiện, thể hiện rõ đặc trưng của hành vi sao cho nhận dạng, phát hiện
không làm tăng độ phức tạp tính toán của mô hình mà vẫn đảm bảo kết
quả phát hiện hành động, hành vi bất thường.
Với mong muốn xây dựng mô hình phát hiện và đoán nhận hành vi
bất thường sử dụng cảm biết gia tốc của điện thoại thông minh, chúng
tôi chọn đề tài: “Nhận dạng hành vi của người tham gia giao thông dựa
trên cảm biến điện thoại” làm đề tài nghiên cứu trong khuôn khổ luận
án tiến sĩ chuyên ngành Hệ thống Thông tin nhằm giải quyết một số
vấn đề đã đặt ra.
Mục tiêu của luận án
Mục tiêu chính của Luận án tập trung vào phân tích dữ liệu cảm
biến thu được từ điện thoại của người tham gia giao thông nhằm nhận
dạng được các hành vi giao thông bất thường.
Để giải quyết được mục tiêu của Luận án, chúng tôi tập trung vào
giải quyết các vấn đề chính sau:
Khảo sát các kỹ thuật phân tích dữ liệu trong và ngoài nước. Tìm
hiểu các kỹ thuật thu thập và biến đổi dữ liệu áp dụng cho các loại cảm
biến khác nhau, trong đó tập trung vào cảm biến gia tốc có mức tiêu thụ
năng lượng thấp nhằm tìm ra tập thuộc tính đặc trưng phù hợp cho hệ
thống nhận dạng hành động và hành vi.
Xây dựng hệ thống nhận dạng hành động giao thông cơ bản (đi
thẳng, dừng, rẽ trái, rẽ phải) của người điều khiển phương tiện dựa
trên dữ liệu cảm biến gia tốc được biến đổi từ tập thuộc tính lựa chọn.
Dựa trên hệ thống nhận dạng hành động, nghiên cứu, đề xuất giải
pháp phát hiện hành vi giao thông bất thường, chủ yếu là với phương
tiện xe máy. Trong một thời gian ngắn tương ứng với một hành động cơ
bản xảy ra, nếu phát hiện thấy có các hành động sai khác xảy ra thì xác
định là một hành vi bất thường. Sự bất thường được đánh giá bằng việc
phân đoạn cửa sổ hành động giao thông cơ bản thành các cửa sổ dữ liệu
có kích thước nhỏ hơn rồi so sánh nhãn hành động nhận dạng được của
các cửa sổ này so với nhãn của hành động giao thông cơ bản đó để xác
định sự bất thường hay bình thường dựa trên việc so sánh tỉ lệ sai khác
với một tỉ lệ cho trước
Đối tượng và phạm vi nghiên cứu
Đối tượng nghiên cứu của Luận án là phân tích, nhận dạng hành
vi, hành vi giao thông bất thường của người điều khiển phương tiện.
Dựa trên cảm biến gia tốc thu được từ điện thoại thông minh của các
đối tượng sử dụng phương tiện để đưa ra giải pháp nhận dạng hành
động cơ bản làm cơ sở cho nhận dạng hành vi giao thông bất thường ở
đô thị của Việt Nam.
Phương pháp nghiên cứu
Luận án sử dụng các phương pháp khảo sát, tổng hợp, phân tích
thông tin cần thiết; tham khảo, đánh giá các nghiên cứu liên quan để từ
đó tìm ra hướng giải quyết vấn đề. Xác định rõ đối tượng và phạm vi
nghiên cứu để từ đó xây dựng mô hình nhận dạng hành động và hành vi
giao thông.
Khảo sát các kỹ thuật thu thập, xử lý dữ liệu cảm biến, phân tích
các đặc điểm của phương tiện, hành động giao thông để từ đó đề xuất
giải pháp nhận dạng hành động, hành vi giao thông bất thường dựa trên
cảm biến thu được. Phương pháp phân tích sử dụng lý thuyết và chứng
minh bằng thực nghiệm được áp dụng để thực hiện yêu cầu bài toán
đặt ra
Đóng góp của luận án
Đóng góp thứ nhất của luận án: là đề xuất tập thuộc tính đặc
trưng dựa trên miền thời gian và miền tần số nhằm biến đổi dữ liệu
cảm biến thành dữ liệu đặc trưng phục vụ cho nhận dạng hành động và
hành vi bất thường. Kết quả đọ đo phân lớp dữ liệu được sử dụng để
đánh giá, lựa chọn tập thuộc tính. Trong đó, sử dụng tham số Hjorth cho
các đại lượng khác nhau nhằm thu được các thuộc tính phù hợp để biến
đổi dữ liệu cảm biến thành dữ liệu đặc trưng. Tập thuộc tính đặc trưng
phù hợp sẽ sử dụng làm cơ sở cho việc xây dựng hệ thống nhận dạng
bằng phương pháp phân lớp [CT2], [CT4].
Khảo sát, lựa chọn kích thước cửa sổ và tỉ lệ chồng dữ liệu để
phân tích tìm ra các giá trị tương ứng, phù hợp với các hành động. Qua
đó, hỗ trợ hệ thống nhận dạng các hành động giao thông có hiệu quả
hơn [CT1], [CT2], [CT4]. Kết quả nhận dạng bằng hệ thống đề xuất
cao hơn so với một số nghiên cứu đã được công bố đã có [CT4].
Đóng góp thứ hai của luận án: đề xuất giải pháp phát hiện hành vi
giao thông bất thường theo một hướng tiếp cận mới, hướng tiếp cận
này dựa trên kết quả nhận dạng hành động cơ bản. Trong thời gian
ngắn mà một hành động cơ bản xảy ra, nếu hệ thống nhận dạng được
chuỗi các hành động bất thường thì xác định đây là hành vi bất thường.
Các giải pháp, kết quả thu được của luận án được trình bày trong 4
công trình đã được công bố. Trong đó có 1 bài báo quốc tế có chỉ số
SCIE; 3 bài báo hội nghị quốc tế có phản biện và có chỉ số Scopus
được thể hiện ở các công trình [CT1], [CT2], [CT3] và [CT4].
Bố cục của luận án
Ngoài phần mở đầu, mục lục, kết luận và tài liệu tham khảo, nội
dung chính của luận án được chia thành 3 chương, cụ thể như sau:
Chương 1: Giới thiệu một số khái niệm cơ bản về hành động,
hành vi giao thông và bài toán nhận dạng hành vi giao sử dụng dữ liệu
cảm biến.
Chương 2: Xây dựng hệ thống nhận dạng hành động giao thông cơ
bản dựa trên cảm biến điện thoại.
Chương 3: Dựa trên kết quả của hệ thống nhận dạng hành động,
đề xuất giải pháp nhận dạng hành vi giao thông, hành vi bất thường.
1.
TỔNG QUAN VỀ PHÂN TÍCH HÀNH VI
1.1 Giới thiệu
Cảm biến thu được từ điện thoại được dùng phân tích trong nhiều
bài toán khác nhau. Trong đó có bài toán nhận dạng hành vi. Vì điện
thoại thông minh được sử dụng cho nhiều mục đích cá nhân khác nhau
cũng như có giới hạn về năng lượng, sự đa dạng về chủng loại, chất
lượng của thiết bị phần cứng dẫn đến yêu cầu cần phải xây dựng hệ
thống, giải pháp phân tích, phát hiện hành động, hành vi sao cho phù hợp
là một bài toán đặt ra cần được giải quyết.
1.2 Một số khái niệm cơ bản
1.2.1
Hành động giao thông
Hành động giao thông là việc người điều khiển thay đổi trạng thái
của phương tiện trong quá trình tham gia giao thông[10].
1.2.2
Hành vi giao thông
Hành vi giao thông là sự biểu hiện thay đổi trạng thái của phương
tiện theo những cách thức, mức độ, tính chất khác nhau trong quá trình
lưu thông [10][11][12] [13].
1.3 Sử dụng dữ liệu cảm biến để phân tích hành vi
Cảm biến điện thoại thông minh hiện nay ngày càng đa dạng. Khi
sử dụng kết hợp nhiều cảm biến sẽ làm tiêu hao năng lượng nên lựa
chọn cảm biến gia tốc có ưu điểm tốn ít tài nguyên của thiết bị để xây
dựng hệ thống là một trong hướng tiếp cận phù hợp đáp ứng được yêu
cầu của bài toán phân tích, nhận dạng hành vi giao thông dựa trên điện
thoại thông minh của người điều khiển phương tiện mang theo trong
điều kiện, môi trường giao thông đô thị Việt Nam.
1.4 Một số nghiên cứu liên quan
Các nghiên cứu công bố gần đây đã chỉ ra hiệu quả của việc kết
hợp nhiều loại cảm biến khác nhau trong bài toán phân tích hành vi. Tuy
nhiên, việc chỉ sử dụng dữ liệu cảm biến gia tốc sẽ phù hợp với các
điện thoại phổ biến và ít tiêu hao năng lượng. Cũng như hướng tiếp cận
sử dụng tập đặc trưng và phương pháp phân lớp cho dạng bài toán này.
1.5 Phương pháp nhận dạng hành vi giao thông dựa trên cảm biến
Từ những vấn đề trên chúng tôi đề xuất phương phân tích, pháp
nhận dạng hành vi giao thông bất thường dựa trên cảm biến gia tốc như
Hình 1 dưới đây:
Hình 1. Hệ thống phân tích hành vi bất thường
1.6 Kết luận
Trong chương này, chúng tôi đã tìm hiểu, khảo sát các nghiên cứu
liên quan đến bài toán nhận dạng hành vi. Làm rõ một số khái niệm cơ
bản về hành động, hành vi, hành vi bất thường trong lĩnh vực giao
thông. Tìm hiểu phương pháp, kỹ thuật phân tích, nhận dạng hành vi,
đặc biệt là hướng tiếp cận sử dụng dữ liệu cảm biến điện thoại thông
minh thu được của người điều khiển phương tiện
2.
NHẬN DẠNG HÀNH ĐỘNG GIAO THÔNG
2.1 Giới thiệu
Trong chương này, Luận án tập trung vào việc xây dựng hệ thống
nhận dạng hành động cơ bản của các đối tượng điều khiển phương
tiện giao thông dựa trên tín hiệu cảm biến thu được từ điện thoại mang
theo. Hướng tiếp cận sử dụng biến đổi dữ liệu cảm biến thô thành dữ
liệu đặc trưng áp dụng kỹ thuật cửa sổ dữ liệu với tập thuộc tính đặc
trưng được khảo sát và lựa chọn. Sau đó, nhận dạng bằng phương pháp
phân lớp.
2.2 Sử dụng dữ liệu cảm biến để nhận dạng hành động giao thông
Sử dụng tín hiệu cảm biến của điện thoại mang theo để phân tích,
nhận dạng ngày càng được phổ biến và sử dụng với các yêu cầu khác
nhau trong nhiều hệ thống thông minh. Một số hướng nghiên cứu đã sử
dụng cảm biến hình ảnh thu được từ camera hoặc kết hợp nhiều cảm
biến khác nhau để nhận dạng hành động. Tuy nhiên, hướng tới sự thuận
lợi và tiết kiệm năng lượng của thiết bị. Chúng tôi chỉ sử dụng thông
tin, dữ liệu đầu vào là cảm biến gia tốc thu được từ điện thoại thông
minh mang theo của người tham gia giao thông, vị trí của điện thoại có
thể thay đổi trong hành trình[CT2], [CT4].
2.3 Một số nghiên cứu liên quan
Đối với bài toán nhận dạng hành động giao thông, một số sự kiện,
hành động, hành vi cơ bản của người điều khiển được thể hiện ở công
bố của một số nghiên cứu liên quan. Trong đó, các hành hành động, hành
vi thường được nhận dạng với các vị trí điện thoại được cố định hoặc
biết trước góc xoay so với chuyển động nhằm thu được dữ liệu mẫu ổn
định. Ngoài phương pháp so khớp, phương pháp phân lớp cũng thường
được sử dụng cho bài toán này dựa trên hướng tiếp cận trích xuất đặc
trưng.
2.4 Hệ thống nhận dạng hành động sử dụng cảm biến gia tốc
2.4.1
Một số kiến thức cơ sở
2.4.1.1
Tiền xử lý dữ liệu
Chuẩn bị dữ liệu là một bước quan trọng trong khai phá dữ liệu,
dữ liệu được chuẩn bị tốt sẽ giúp hệ thống thực hiện hiệu quả hơn [36]
[37]. Trong bài toán nhận dạng hành động giao thông sử dụng dữ liệu
cảm biến từ điện thoại sau khi tiền xử lý, biến đổi thành dữ liệu đặc
trưng và nhận dạng dựa trên phương pháp phân lớp
2.4.1.2 Cửa sổ dữ liệu
Trong hệ thống nhận dạng đề xuất, cửa sổ dữ liệu được khảo sát
nhằm chọn ra kích thước phù hợp với từng loại hành động với mục đích
nâng cao kết quả nhận dạng được trình bày như Hình 2 2 dưới đây:
Hình 22. Phân đoạn chuỗi thành các cửa sổ dữ liệu
2.4.1.3 Biến đổ hệ tọa độ
Phương pháp biến đổi hệ tọa độ của thiết bị sang hệ tọa độ trái
đất cũng thường được áp dụng trong phân tích dữ liệu cảm biến gia
tốc[41][42] khi thiết bị cảm biến không cố định theo hướng chuyển
động của phương tiện.Phương pháp biến đổi hệ tọa độ của thiết bị
cảm biến về hệ trục tọa độ của trái đất được thể hiện như
(a)
(b)
Hình 23. (a) Hướng của điện thoại được xác định bởi hệ tọa độ (X, Y, Z). (b) Hướng di
chuyển của phương tiện theo hệ tọa độ trái đất (X’, Y’, Z’)
2.4.1.4 Biến đổi dữ liệu đặc trưng
Trong kỹ thuật xử lý tín hiệu cảm biến, các thuộc tính đặc trưng
thường được lựa chọn dựa trên tính chất thời gian và tần số [44][45].
Phương pháp kết hợp thuộc tính trên các miền thường được sử dụng để
phân tích, nhận dạng hành động, hành vi được biểu diễn như trong Hình
2 4 dưới đây [46].
Hình 24. Kết hợp biểu diễn thông tin trên miền thời gian và miền tần số [46]
2.4.1.5 Thuộc tính trên miền thời gian
Các thuộc tính trong miền thời gian có đặc điểm tính toán nhanh,
thực hiện với các giá trị thống kê, so sánh sự khác biệt của các mẫu dữ
liệu. Do tính chất dữ liệu cảm biến thu được của các hành động, hành
vi thay đổi theo thời gian.
2.4.1.6 Thuộc tính trên miền tần số
Các kỹ thuật miền tần số thường được sử dụng để xác định bản
chất lặp lại của tín hiệu cảm biến. Tính lặp lại này thường tương quan
với bản chất tuần hoàn của một hành động, hành vi nào đó cần nhận
dạng.
2.4.1.7 Tham số Hjorth
Tham số Hjorth [49] là đại lượng thường được sử dụng trong phân
tích các tín hiệu y sinh. Đại lượng này chỉ ra tính chất thống kê của một
tín hiệu trong miền thời gian gồm ba loại tham số là tính hoạt động
(Activity), tính di động (Mobility) và độ phức tạp (Complexity).
2.4.1.8 Phương pháp đánh giá phân lớp bằng AUC
Các phương pháp đánh giá mô hình thường được sử dụng khi đánh
giá với mô hình phân lớp dữ liệu đó là dựa trên ma trận nhầm lẫn. Có
hai độ đo thường được sử dụng để đánh giá mô hình phân lớp đó là độ
chính xác (Accuracy) và độ đo AUC sử dụng CV10.
2.4.2
Tập thuộc tính đặc trưng
Sự di chuyển của phương tiện giao thông làm thay đổi gia tốc nên
các thuộc tính trong miền thời gian có ý nghĩa và hàm chứa những thông
tin hữu ích khi phân tích các hành động, hành vi. Tập thuộc tính kết hợp
cho nhận dạng được thể hiện như bảng dưới đây:
Miền, tham số Hjorth
Tên tập thuộc tính
Thời gian
T2
Tần số
F2
Hjorth
H2
Thời gian + Tần số
TF2
Thời gian + Hjorth
TH2
Thời gian + Tần số + Hojrth
TFH2
Bảng 2. Tập thuộc tính sử dụng nhận dạng
2.4.3
Đề xuất hệ thống nhận dạng hành động
Việc nhận dạng hành động, hành vi cần có những giải pháp, kỹ
thuật phù hợp với yêu cầu thực tiễn của bài toán. Do vậy, chúng tôi xây
dựng hệ thống nhận dạng như Hình 2 nhằm nhận dạng hành động giao
thông cơ bản (Dừng, Đi thẳng, Rẽ trái, Rẽ phải) được biểu diễn như
Hình 2 7 dưới đây:
Hình 27. Hệ thống nhận dạng hành động giao thông
Hệ thống nhận dạng bao gồm Pha huấn luyện để xây dựng mô
hình nhận dạng. Pha thứ hai: nhận dạng các hành động dựa trên dữ liệu
cảm biến phát hiện thu được từ điện thoại của đối tượng đang tham gia
giao thông dựa trên mô hình đã xây dựng được. Giải pháp nâng cao kết
quả nhận dạng thông qua lựa chọn kích thước cửa sổ cho từng hành
động dựa trên độ đo AUC được trình bày trong Hình 2 8 sau đây:
Hình 28. Thuật toán tối ưu kích thước cửa sổ và chồng dữ liệu theo AUC
Trong đó pha phát hiện với N nhãn lớp hành động khi sử dụng giải
pháp tối ưu cửa sổ sẽ có N kích thước cửa sổ khác nhau, đồng thời cần
phải thực hiện N lần phân lớp để xác định kết quả nhãn lớp để đưa ra
nhãn lớp phù hợp theo Hình 2 9 như sau:
Hình 29. Nhận dạng hành động với các kích thước cửa sổ đã được lựa chọn.
Tại một thời điểm, dữ liệu được tiền xử lý với N kích thước cửa
sổ tối ưu và được nhận dạng nhãn lớp tương ứng. Sử dụng kỹ thuận
nhận dạng như trên sẽ cho kết quả nhãn lớp phù hợp với cửa sổ dữ liệu
đầu vào.
2.5 Thực nghiệm và đánh giá
2.5.1
Môi trường thực nghiệm
Hệ thống thu thập và phân tích dữ liệu cảm biến của điện thoại
được xây dựng dựa trên hệ điều hành Android phiên bản 4.5 đến 6.0;
ngôn ngữ Java và bộ công cụ WEKA [53] để phân tích, thực nghiệm.
Các đối tượng tham gia thực nghiệm mang điện thoại khi điều khiển
phương tiện hoặc ngồi sau các phương tiện do người khác điều khiển
trong quá trình tham gia giao thông trên đường phố. Vị trí điện thoại có
thể thay đổi tùy ý khi tiến hành thực nghiệm khi đi xe máy.
2.5.2
Dữ liệu thực nghiệm
Hệ thống nhận dạng hành động giao thông được thực hiện để
nhận dạng 4 hành động cơ bản là: đi thẳng, dừng, rẽ trái và rẽ phải. Số
lượng các mẫu thu được cho thực nghiệm được thể hiện ở bảng sau:
Hành động
Số lượng
mẫu
Dừng
361
Đi thẳng
3797
Rẽ trái
1750
Rẽ phải
1656
Bảng 25. Tập mẫu dữ liệu đặc trưng sử dụng nhận dạng hành động giao thông cơ bản
2.5.3
Lựa chọn tập thuộc tính
Để đánh giá, lựa chọn tập thuộc tính phù hợp, chúng tôi sử dụng
cách kết hợp các tập thuộc tính với nhau. Thực nghiệm với các tập
thuộc tính trên thu được các kết quả về độ chính xác Accuracy và AUC
như sau:
Rando
m
Forest
J48
Naïve
Bayes
KNN
H2
ACC
82,39%
AUC
0,9531
ACC
65,57%
AUC
0,8881
F2
82,85%
79,16%
T2
88,79%
0,953
0
0,9730
69,90%
0,869
0
0,9213
TH2
88,39%
0,975
82,06%
0,862
SVM
ACC
65,57%
AUC
ACC
0,832 66,89%
6
54,29% 0,7970 75,99%
AUC
0,8153
ACC
65,41%
AUC
0,7273
0,8120
51,12%
0,6551
69,90% 0,8546
73,91%
70,86%
0,7506
38,19%
78,56%
0,859
6
0,840
76,45%
0,8090
0,844
88,85%
0,9752
70,60%
0
0,9134
TFH2 88,32%
0,9768
70,36%
0,9104
TF2
70,60%
70,36%
0
0,846
2
0,8479
74,08%
72,39%
0
0,8481
70,99%
0,7384
0,840
6
69,64
%
0,7384
Bảng 211, Kết quả phân lớp hành động trên các tập thuộc tính
Kết quả thực nghiệm cho thấy, tập thuộc tính TFH2 kết hợp từ
các tập thuộc tính khác cho kết quả cao nhất. Thực nghiệm với dữ liệu
đã biến đổi hệ tọa độ thu được kết quả ở bảng sau:
DL thô
DL CT
RF
AUC
J48
ACC
NB
AUC
0,97676
0,98541
88,32%
90,97%
0,910449
0,95921
KNN
ACC
85,55%
89,94%
AUC
ACC
0,84794
0,94450
70,36%
86,05%
SVM
AUC
ACC
0,84058
0,93778
72,39%
86,40%
AUC
ACC
0,73837
0,81313
69,64%
74,87%
Bảng 212. Kết quả so sánh dữ liệu thô và dữ liệu đã biến đổi hệ tọa độ
Kết quả thực nghiệm cho thấy, sau khi chuyển trục, kết quả nhận
dạng hành động thu được cao hơn so với kết quả sử dụng dữ liệu thô ở
trên cả 5 thuật toán nên dữ liệu chuyển trục được sử dụng cho nhận
dạng hành động và hành vi giao thông.
2.5.4
Khảo sát thuật toán phân lớp
Thực nghiệm cũng được tiến hành bằng dữ liệu thô trên các thuật
toán thường được sử dụng trong phân tích hành động người là Random
Forest, Naïve Bayes, J48, KNN và SVM với các giá trị mặc định thường
dùng cho mỗi thuật toán với phương pháp kiểm chứng chéo CV10 cho
kết quả như trong hình dưới đây:
Hình 21. Kết quả phân lớp với các thuật toán khác nhau
Qua thực nghiệm này chúng tôi lựa chọn được thuật toán RF là phù
hợp cho hệ thống nhận dạng.
2.5.5
Xây dựng dữ liệu huấn luyện
Thực nghiệm tiến hành trên tập thuộc tính TFH2 cùng với và kết
quả phân lớp sử dụng thuật toán rừng ngẫu nhiên tìm ra kích thước cửa
sổ khảo sát trong khoảng từ 1 giây, đến 6 giây được sử dụng với mục
đích tìm ra kích thước cửa sổ phù hợp nhất đối trên từng nhãn lớp. Kết
quả thu được là bộ tham số kích thước cửa sổ và chồng dữ liệu được
thể hiện ở Bảng 2 17 dưới đây:
S
4
75%
0,999422
Hành động
Của sổ (giây)
Chồng dữ liệu
AUC
G
6
75%
0,992828
L
5
50%
0,996841
R
6
50%
0,987251
Bảng 217. Kích thước cửa sổ được tối ưu theo độ đo AUC
Để đánh giá kết quả nhận dạng với tập dữ liệu đặc trưng có được
với dữ liệu đã chuyển trục và xây dựng được từ tập dữ liệu huấn luyện
với kích thước đã tối ưu sử dụng phương pháp kiểm chứng chéo CV10
trên hai tập TF2 và TFH2 thu được kết quả ở Bảng 2 18 dưới đây:
RF
ACC
TF2
95,78%
TFH2
98,95%
J48
AUC
NB
ACC
0,998550
0,999852
KNN
AUC
SVM
ACC
AUC
ACC
AUC
ACC
AUC
94,78%
0,978238
90,44%
0,967257
92,04%
0,965410
80,40%
0,836312
98.38%
0,995950
95,25%
0,989185
95,73%
0,982722
83,35%
0,850271
Bảng 218. Kết quả phân lớp với tham số tối ưu trên hai tập TF2 và TFH2
Từ kết quả trên cho thấy, khi bổ sung tham số Hjorth vào tập
thuộc tính TF2 ta thu được tập thuộc tính TFH2 mới cho kết quả độ đo
Accuracy lớn hơn độ đo trên tập TF2 cùng một thuật toán phân lớp RF
được lựa chọn là 3,17% và giá trị độ đo AUC lớn hơn là 0,0013.
2.5.6
Đánh giá hệ thống đề xuất so với một số nghiên cứu hiện
tại[CT4].
Để đánh giá hệ thống nhận dạng được đề xuất, qua tìm hiểu thu
thập, chúng tôi tiến hành thực nghiệm đánh giá hệ thống dựa trên tập dữ
liệu được thu thập bởi công ty HTC của Đài Loan được công bố trong
[56]. Thực nghiệm so sánh phương pháp chúng tôi đề xuất so với một
số nghiên cứu trên cùng tập dữ liệu này thể hiện ở bảng dưới đây:
Kết quả phân lớp
accuracy
Fang et al, [31] (Sử dụng KNN)
83,57%
Guvensan et al [32], (Sử dụng RF)
91,63%
Phương pháp đề xuất (sử dụng RF)
97,33%
Bảng 219. Kết quả so sánh tập thuộc tính với các phương pháp khác trên cùng bộ dữ liệu
HTC [56] [CT4]
Nghiên cứu
2.6 Kết luận
Trong chương này chúng tôi đề xuất hệ thống nhận dạng để thực
hiện nhận dạng hành động giao thông cơ bản là {Dừng, Đi thẳng, Rẽ
trái, Rẽ phải} dựa trên cảm biến gia tốc thu được từ điện thoại thông
minh của người sử dụng phương tiện khi vị trí điện thoại không cố
định. Lựa chọn được tập thuộc tính TFH2 và thuật toán RF cho nhận
dạng hành động. Thực nghiệm với hệ thống đề xuất cũng cho kết quả
cao hơn so với một số công bố đã có trên cùng một tập dữ liệu.
3.
NHẬN DẠNG HÀNH VI BẤT THƯỜNG
3.1 Giới thiệu
Luận án đã tìm hiểu, khảo sát các kỹ thuật phân tích dữ liệu cảm
biến sử dụng cho bài toán nhận dạng hành vi. Từ đó, đề xuất giải pháp
nhận dạng ra hành vi bất thường dựa trên hệ thống nhận dạng hành
động đã được trình bày trong chương 2,
3.2 Bài toán nhận dạng hành vi bất thường
3.2.1
Nhận dạng bất thường
3.2.1.1 Dữ liệu bình thường và bất thường
Một dữ liệu bất thường là một dạng mẫu mà nó khác với định
nghĩa của mẫu dữ liệu bình thường. Tuy nhiên, trong thực tế việc định
nghĩa một mẫu bất thường khó hơn rất nhiều so với việc định nghĩa
mẫu bình thường. Do đó, một trong những hướng tiếp cận và định nghĩa
một mẫu bất thường phổ biến đó là dựa vào định nghĩa của mẫu bình
thường.
3.2.1.2 Một số kỹ thuật gán nhãn bất thường
Nhãn của dữ liệu thường được gán bởi các chuyên gia trong lĩnh
vực đó. Gán nhãn bất thường khó hơn rất nhiều so với việc gán nhãn
bình thường. Do nhãn bất thường luôn thay đổi và phát sinh nên rất khó
gán nhãn từ tập dữ liệu huấn luyện. Một số kỹ thuật nhận dạng bất
thường cơ bản sử dụng phương pháp gán nhãn được chia thành 3 dạng
cơ bản đó là[58][59]: Dạng 1: Phát hiện bởi phương pháp có giám sát.
Dạng 2: Phát hiện bất thường sử dụng phương pháp bán giám sát. Dạng
3: Sử dụng phương pháp phát hiện bất thường không giám sát.
3.2.1.3 Phương pháp đánh giá nhận dạng bất thường
Do sự khó khăn về xác định tính chất bất thường và tính chất bình
thường cũng như áp dụng các phương pháp gán nhãn bất thường cho dữ
liệu. Việc đánh giá hệ thống phát hiện bất thường được thiết kế cho
từng miền, lĩnh vực khác nhau và phổ biến ở hai dạng sau[58]: Đánh giá
dựa vào kỹ thuật cho điểm và đánh giá dựa vào kỹ thuật gán nhãn..
3.2.2
Sử dụng cảm biến điện thoại để nhận dạng hành vi bất thường
Các đối tượng tham gia giao thông chịu nhiều tác động từ chính
yếu tố tâm lý cá nhân cũng như các yếu tố bên ngoài như hạ tầng giao
thông, yếu tố môi trường, đặc tính của phương tiện và cả hiện trạng
giao thông trong từng thời điểm. Hướng tiếp cận sử dụng cảm biến
điện thoại để nhận dạng hành vi bất thường đang được cộng đồng các
nhà nghiên cứu quan tâm. Tuy nhiên, sử dụng chỉ mình cảm biến gia tốc
để nhận dạng hành vi được chúng tôi lựa chọn thực hiện trong đề tài
nghiên cứu này. Với giải pháp nhận dạng hành vi bất thường là: Nếu
chuỗi hành động xảy ra trong khoảng một thời gian ngắn có sự sai khác
so với thời gian một hành động cơ bản tương ứng xảy ra thì xác định
đây là một hành vi bất thường.
3.3 Một số nghiên cứu liên quan
Các phương pháp, kỹ thuật phát hiện hành vi bất thường trong các
nghiên cứu trên gặp phải vấn đề khó khăn đó là làm thế nào để xác
định, thu thập các mẫu dữ liệu bất thường, trong khi dữ liệu cảm biến
gia tốc có nhiều nhiễu từ thiết bị cũng như vị trí điện thoại. Do vậy, để
vượt qua được việc phụ thuộc vào mẫu dữ liệu bất thường, chúng tôi
đề xuất hướng tiếp cận mới để có thể xác định hành vi giao thông bất
thường dựa trên phân tích chuỗi các hành động trong khoảng thời gian
ngắn tương ứng một hành động cơ bản diễn ra.
3.4 Giải pháp nhận dạng hành vi bất thường dựa trên hệ thống
nhận dạng hành động
3.4.1
Một số kỹ thuật nhận dạng hành vi bất thường
3.4.1.1 Kỹ thuật so khớp DTW
Kỹ thuật so khớp thường sử dụng để tìm sự tương đồng giữa hai
chuỗi. Chúng tôi sử dụng phương pháp này để phát hiện hành vi bất
thường dựa trên cảm biến gia tốc được mô tả như Hình 3 dưới đây:
Hình 3. Sử dụng DTW để phát hiện hành vi bất thường
3.4.1.2 Phân lớp dữ liệu với RF và kỹ thuật học sâu
Thuật toán RF và kỹ thuật học sâu được phát triển dựa trên ANN
đang được nhiều sự quan tâm của cộng đồng nghiên cứu. Do vậy, chúng
tôi sử dụng bộ phân lớp Dl4jMlpClassifier được tích hợp trong gói học
sâu WekaDeeplearning4J để nhận dạng hành vi của người tham gia giao
thông với tập dữ liệu huấn luyện được gán nhãn bình thường/ bất
thường. Phương pháp này được thực hiện như mô tả của hình dưới đây:
Hình 3. Phát hiện bất thường sử dụng
3.4.2
Giải pháp đề xuất nhận dạng hành vi bất thường dựa trên hệ
thống nhận dạng hành động
Các kỹ thuật trên gặp sự khó khăn chung đó là sự phụ thuộc vào
cách xác định và thu thập mẫu dữ liệu hành vi bất thường. Do vậy,
chúng tôi đề xuất giải pháp nhận dạng hành vi như hình dưới đây:
Hình 3.Sơ đồ hệ thống phát hiện hành vi bất thường
Trong hệ thống nhận dạng hành vi này gồm hai pha: pha thứ nhất
là pha huấn luyện, pha thứ hai là pha nhận dạng hành vi bất thường.
Trong pha huấn luyện được thực hiện dựa trên dữ liệu huấn luyện với
mục đích tìm ra bộ tham số cho kết quả nhận dạng hành vi tốt nhất:
tương ứng với ; và n là số các bộ giá trị tham gia thực hiện trong pha
huấn luyện.
Trong Pha nhận dạng, sử dụng các tham số đã nhận được từ Pha
huấn luyện để thực hiện các bước thực hiện nhận dạng hành vi được
mô tả như trong Hình 3 sau đây:
Hình 3. Phát hiện hành vi bất thường dựa trên hành động giao thông cơ bản
3.5 Thực nghiệm và đánh giá
3.5.1
Môi trường thực nghiệm
Chương trình thu dữ liệu cảm biến được xây dựng và thực hiện
trên hệ điều hành Android phiên bản 4.5 đến 6.0. Ngôn ngữ Java được
sử dụng để xây dựng hệ thống, thực hiện quy trình tiền xử lý dữ liệu,
các mô hình phân lớp trong Bộ công cụ WEKA được sử dụng để phát
hiện, nhận dạng phương tiện, hành động hành vi như trong chương 2.
3.5.2
Dữ liệu thực nghiệm
Thực nghiệm thực hiện với phương tiện đặc thù, phổ thông là xe
máy. Hành vi bất thường được xác định nhận dạng trong thực nghiệm
đó là “hành vi lạng lách”. Hành vi này liên quan đến thay đổi hướng điều
khiển phương tiện trong một khoảng thời gian ngắn. Thực nghiệm
được tiến hành trên 8 đối tượng là các cán bộ, nhân viên văn phòng và
sinh viên. Dữ liệu mẫu về hành vi bất thường thực hiện ở các cung
đường vắng, theo cảnh huống giả định của hành vi bất thường đặt ra
cùng với các hành vi bình thường. Vị trí của điện thoại khi thu dữ liệu
thể hiện ở Bảng 3 sau: