Tải bản đầy đủ (.pdf) (12 trang)

Tìm hiểu mô hình học máy giải quyết bài toán dự đoán dự báo ứng dụng trong phân tích hành vi giao thông sử dụng dữ liệu cảm biến

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (465.32 KB, 12 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

VŨ VĂN VỸ

TÌM HIỂU MÔ HÌNH HỌC MÁY GIẢI QUYẾT BÀI TOÁN DỰ
ĐOÁN DỰ BÁO ỨNG DỤNG TRONG PHÂN TÍCH HÀNH VI
GIAO THÔNG SỬ DỤNG DỮ LIỆU CẢM BIẾN

LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

Hà Nội – 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ

VŨ VĂN VỸ

TÌM HIỂU MÔ HÌNH HỌC MÁY GIẢI QUYẾT BÀI TOÁN DỰ
ĐOÁN DỰ BÁO ỨNG DỤNG TRONG PHÂN TÍCH HÀNH VI
GIAO THÔNG SỬ DỤNG DỮ LIỆU CẢM BIẾN

Ngành
Chuyên ngành
Mã số

: Công nghệ thông tin
: Hệ thống thông tin
: 60.48.05


LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN

NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS NGUYỄN HÀ NAM

Hà Nội – 2015


LỜI CAM ĐOAN
Tôi cam đoan đây là công trình nghiên cứu của riêng tôi, với sự hỗ trợ từ
người hướng dẫn khoa học PGS.TS Nguyễn Hà Nam.
Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai
công bố trong bất kỳ công trình nào khác. Việc sử dụng những dữ liệu có trong luận
văn được thu thập từ các nguồn thông tin khác nhau có ghi trong phần tài liệu tham
khảo.
Nếu phát hiện bất kỳ sự gian lận nào, tôi xin chịu trách nhiệm trước Hộiđồng,
cũng như kết quả luận văn của mình.
Hà Nội, tháng 11 năm 2015
Học viên

Vũ Văn Vỹ

i


LỜI CẢM ƠN
Tôi muốn bày tỏ lòng biết ơn sâu sắc tới những người đã giúp đỡ tôi trong
quá trình làm luận văn, đặc biệt tôi xin cám ơn PGS.TS Nguyễn Hà Nam, với lòng
kiên trì, thầy đã chỉ bảo tôi chi tiết và cho tôi những định hướng quí báu trong quá
trình từng bước làm luận văn. Đồng thời tôi cũng xin gửi lời cảm ơn tới các thầy cô
giáo khoa Công nghệ thông tin – Trường Đại học Công nghệ - Đại học Quốc gia Hà

Nội đã truyền đạt các kiến thức cho tôi trong suốt thời gian học tập và nghiên cứu
vừa qua.
Tôi cũng xin chân thành cảm ơn cơ quan, bạn bè, đồng nghiệp, gia đình và
những người thân đã cùng chia sẻ, giúp đỡ, động viên, tạo mọi điều kiện thuận lợi
để tôi hoàn thành nhiệm vụ học tập và cuốn luận văn này

Hà Nội, tháng 11 năm 2015

ii


MỤC LỤC
MỤC LỤC ................................................................................................................ iii
DANH MỤC HÌNH VẼ .......................................................................................... iv
DANH MỤC BẢNG BIỂU .......................................................................................v
DANH MỤC CHỮ VIẾT TẮT .............................................................................. vi
PHẦN MỞ ĐẦU ........................................................................................................1
CHƢƠNG 1 - TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU PHÁT HIỆN
HÀNH VI THAM GIA GIAO THÔNG ..................................................................2
1.1 Hành vi tham gia giao thông và phát hiện hành vi tham gia giao thông ...2
1.2 Các nghiên cứu liên quan ................................. Error! Bookmark not defined.
1.3 Một số thách thức trong nghiên cứu ................ Error! Bookmark not defined.
1.4 Đề xuất phƣơng pháp tiếp cận ......................... Error! Bookmark not defined.
CHƢƠNG 2 - KHÁI QUÁT VỀ KHAI PHÁ DỮ LIỆU VÀ GIỚI THIỆU MỘT
SỐ KỸ THUẬT ÁP DỤNG TRONG ĐỀ TÀI .......... Error! Bookmark not defined.
2.1 Giới thiệu về khai phá dữ liệu (Data Mining) Error! Bookmark not defined.
2.2 Phân lớp ............................................................ Error! Bookmark not defined.
2.3 Giới thiệu về WEKA. ....................................... Error! Bookmark not defined.
CHƢƠNG 3 - PHƢƠNG PHÁP PHÁT HIỆN HÀNH VI THAM GIA GIAO
THÔNG DỰA TRÊN DỮ LIỆU CẢM BIẾN ĐIỆN THOẠI DI ĐỘNG ..... Error!

Bookmark not defined.
3.1 Sơ đồ hệ thống phát hiện hành vi tham gia giao thông .... Error! Bookmark
not defined.
3.2 Dữ liệu cảm biến ............................................... Error! Bookmark not defined.
3.3 Lọc nhiễu ........................................................... Error! Bookmark not defined.
3.4 Chuyển hệ trục tọa độ trong không gian ....... Error! Bookmark not defined.
3.5 Trích chọn đặc trƣng ........................................ Error! Bookmark not defined.
CHƢƠNG 4 - THỰC NGHIỆM VÀ ĐÁNH GIÁ .... Error! Bookmark not defined.
4.1 Thu thập dữ liệu huấn luyện mô hình ............. Error! Bookmark not defined.
4.2 Xây dựng bộ dữ liệu huấn luyện ...................... Error! Bookmark not defined.
4.4 Thực nghiệm phát hiện hành vi tham gia giao thông thời gian thực . Error!
Bookmark not defined.
4.5 Phân tích, đánh giá quá trình thực nghiệm ... Error! Bookmark not defined.
KẾT LUẬN .............................................................. Error! Bookmark not defined.
TÀI LIỆU THAM KHẢO ........................................................................................3
iii


DANH MỤC HÌNH VẼ

Hình 1.1: Xu hƣớng dùng điện thoại di động .........................................................2
Hình 1.2: Sự bùng nổ của smartphone và máy tính bảng trong những năm gần
đây ...............................................................................................................................2
Hình 2.1: Quá trình khám phá tri thức..................... Error! Bookmark not defined.
Hình 2.2: (a) Bƣớc xây dựng mô hình phân lớp ....... Error! Bookmark not defined.
Hình 2.3: (b1)Ƣớc lƣợng độ chính xác của mô hình Error! Bookmark not defined.
Hình 2.4: (b2) Phân lớp dữ liệu mới .......................... Error! Bookmark not defined.
Hình 2.5: Phƣơng pháp phân lớp Random Rorest .. Error! Bookmark not defined.
Hình 3.1: Sơ đồ hệ thống phát hiện hành vi giao thông từ dữ liệu cảm biến
....................................................................................... Error! Bookmark not defined.

Hình 3.2 : Cảm biến gia tốc kế ................................... Error! Bookmark not defined.
Hình 3.3: Cảm biến từ trƣờng ................................... Error! Bookmark not defined.
Hình 3.4: Cảm biến trọng lực..................................... Error! Bookmark not defined.
Hình 3.5: Dữ liệu gia tốc trục X qua bộ lọc thông thấp ......... Error! Bookmark not
defined.
Hình 3.6: Dữ liệu gia tốc đã qua lọc nhiễu(trên) và chƣa qua lọc nhiễu(dƣới)
....................................................................................... Error! Bookmark not defined.
Hình 3.7: Sự khác nhau giữa cảm biến gia tốc của 2 điện thoại khác nhau Error!
Bookmark not defined.
Hình 3.8: Hệ trục tọa độ điện thoại và Hệ trục tọa độ Trái Đất Error! Bookmark
not defined.
Hình 3.9: Các trạng thái xoay điện thoại .................. Error! Bookmark not defined.
Hình 3.10: Sự khác nhau giữa đổi trục và không đổi trục .... Error! Bookmark not
defined.
Hình 3.11 Chuyển từ trục điện thoại về trục Trái Đất .......... Error! Bookmark not
defined.
Hình 3.12: Hệ tọa độ không gian ............................... Error! Bookmark not defined.
Hình 4.1: Quá trình thực nghiệm phát hiện hành vi tham gia giao thông .. Error!
Bookmark not defined.
Hình 4.2: Giao diện thu dữ liệu mẫu ......................... Error! Bookmark not defined.
Hình 4.3: Dữ liệu lƣu trữ trong điện thoại................ Error! Bookmark not defined.
Hình 4.4: Mẫu dữ liệu của hành vi Tăng tốc ............ Error! Bookmark not defined.
Hình 4.5: Mô tả quá trình tính toán 6 thông số đặc trƣng .... Error! Bookmark not
defined.
Hình 4.6: Các tham số huấn luyện mô hình k-NN ... Error! Bookmark not defined.
Hình 4.7: Các tham số huấn luyện mô hình Naïve Bayes...... Error! Bookmark not
defined.
Hình 4.8: Các tham số huấn luyện mô hình Random forest . Error! Bookmark not
defined.
iv



Hình 4.9: Giao diện chƣơng trình phát hiện hành vi thời gian thực............ Error!
Bookmark not defined.

v


DANH MỤC BẢNG BIỂU

Bảng 2.1: Ma trận thống kê ........................................ Error! Bookmark not defined.
Bảng 3.1: Các loại cảm biến trên các phiên bản hệ điều hành Android ...... Error!
Bookmark not defined.
Bảng 3.2: Các thông số gia tốc kế .............................. Error! Bookmark not defined.
Bảng 3.3: Các thông số từ trƣờng kế ......................... Error! Bookmark not defined.
Bảng 3.4: Các thông số gia tốc trọng lực ................... Error! Bookmark not defined.
Bảng 4.1: Kết quả huấn luyện của mô hình k-NN ... Error! Bookmark not defined.
Bảng 4.2: Kết quả huấn luyện của mô hình Naïve Bayes ...... Error! Bookmark not
defined.
Bảng 4.3: Kết quả huấn luyện của mô hình Random forest . Error! Bookmark not
defined.
Bảng 4.4: Kết quả thực nghiệm phát hiện hành vi bằng k-NN .. Error! Bookmark
not defined.
Bảng 4.5 : Kết quả thực nghiệm phát hiện hành vi bằng Naïve Bayes ........ Error!
Bookmark not defined.
Bảng 4.6: Kết quả huấn luyện phát hiện hành vi bằng Random forest ....... Error!
Bookmark not defined.

vi



DANH MỤC CHỮ VIẾT TẮT

ANN

Artificial Neural Network

FN

False Negatives

FP

False Positives

HAR

Human Activity Recognition

HMM

Hidden Markov Model

k-NN

k - Nearest Neighbor

TN

True Negatives


TP

True Positives

CSDL

Cơ sở dữ liệu

KDD

Knowledge Discovery in Database

vii


PHẦN MỞ ĐẦU
Trong thập kỷ gân đây, sự phát triển vượt bậc của khoa học công nghệ đã đem
lại cho con người những tiện ích thiết thực thông qua các thiết bị di động. Thiết bị di
động giờ đây đã trở thành công cụ hỗ trợ đắc lực cho con người trong mọi hoạt động
trong cuộc sống ngày nay. Cùng với những ứng dụng hỗ trợ công việc hàng ngày thì
các ứng dụng mang tính tiên đoán, nhắc nhở, điều hướng người dùng ngày càng trở
nên phổ biến.
Bên cạnh đó việc tham gia giao thông của con người là một hoạt động tất yếu
hàng ngày. Việc tham gia giao thông luôn tiềm ẩn nhiều rủi ro do các tác nhân có ý
thức hoặc vô thức của con người. Việc có một ứng dụng có thể nhắc nhở, điều hướng
người tham gia giao thông sao cho an toàn trở thành nhu cầu thiết thực, cần có trong
một xã hội các thiết bị di động đã trở nên phổ dụng với mỗi người.
Nội dung của luận văn tập trung nghiên cứu về mặt thuật toán, kết hợp giữa lý
thuyết và áp dụng thực tiến để đánh giá các phương pháp nhận diện hành vi của người

tham gia giao thông bằng xe gắn máy, từ đó chọn ra phương pháp tối ưu nhất gắn liền
với thực tế của người sử dụng điện thoại thông minh. Đề tài có tính ứng dụng cao
trong cuộc sống, làm tiền đề cho sự phát triển, nghiên cứu sâu về các hành vi của con
người khi tham gia giao thông ở nhiều khía cạnh khác nhau. Từ đó, nghiên cứu luận
văn hướng tới các mục tiêu sau:
-

-

Phát hiện được một số hành vi giao thông cơ bản của người tham gia giao
thông bằng xe gắn máy: Dừng, Đang di chuyển, Tăng tốc, giảm tốc và đưa ra
cảnh báo
So sánh một số kỹ thuật học máy nhằm đưa ra kỹ thuật tối ưu nhất.

Cấu trúc luận văn nhƣ sau:
Chƣơng 1: Tổng quan về lĩnh vực nghiên cứu phát hiện hành vi tham gia giao
thông dựa trên những điều kiện khác nhau, các phương pháp nghiên cứu trước đó và
đề xuất phương pháp tiếp cận vấn đề tối ưu nhất trong thực tiễn
Chƣơng 2: Khái quát về khai phá dữ liệu và giới thiệu một số kỹ thuật áp dụng
trong đề tài.
Chƣơng 3: Phương pháp phát hiện hành vi tham gia giao thông dựa vào dữ liệu
cảm biến của điện thoại di động với các mô hình học máy.
Chƣơng 4: Thực nghiệm và đánh giá.
Kết luận

1


CHƢƠNG 1 - TỔNG QUAN VỀ LĨNH VỰC NGHIÊN CỨU PHÁT HIỆN
HÀNH VI THAM GIA GIAO THÔNG

Trong chương này trình bày về mục đích của phát hiện hành vi tham gia giao
thông, các nghiên cứu trước đây về cách tiếp cận giải quyết bài toán phát hiện hành vi
tham gia giao thông.
1.1 Hành vi tham gia giao thông và phát hiện hành vi tham gia giao thông
Trong suốt thập kỷ vừa qua đã có sự phát triển vượt bậc của hệ thống vi điện tử
và máy tính, các cảm biến và các thiết bị di động với các tính năng hiện đại. Chúng có
khả năng tính toán cao, kích thước nhỏ và chi phí thấp, cho phép con người tương tác
với các thiết bị như một phần của cuộc sống hàng ngày. Hình 1.1 cho thấy một kết quả
đáng kinh ngạc, dân số thế giới ước tính khoảng 7 tỷ người, thì hơn 5 tỷ người sử
dụng điện thoại di động. Số lượng người dùng điện thoại thông minh cũng rất cao so
với số lượng người dùng điện thoại di động (1.5 tỷ người sử dụng điện thoại thông
minh).

Hình 1.1: Xu hướng dùng điện thoại di động
Sự bùng nổ của người sử dụng điện thoại thông minh trong những năm gần đây
đã dẫn đến sự bùng nổ của các ứng dụng cho điện thoại thông minh. Hình 1.2 cho thấy
số lượng đáng kinh ngạc của các thiết bị di động thông minh tăng nhanh qua các năm.
Vì vậy, việc phát triển ứng dụng trên điện thoại di động là xu hướng nóng hiện nay và
có khả năng áp dụng cao vào đời sống.

Hình 1.2: Sự bùng nổ của smartphone và máy tính bảng trong những năm gần đây
2


TÀI LIỆU THAM KHẢO
Tiếng Anh
[1] Singh, P., Juneja, N., Kapoor, S.: Using mobile phone sensors to detect driving
behavior. In: Proceedings of the 3rd ACM Symposium on Computing for
Development, ACM (2013)
[2] Fazeen, M., Gozick, B., Dantu, R., Bhukhiya, M., Gonzalez, M.C.:

SafeDrivingUsing Mobile Phones. In:IEEE Transactions on Intelligent Transportation
Systems (2012)
[3] Chigurupa, S., Polavarap, S., Kancherla,Y., Nikhath, K.A.:Integrated Computing
System for measuring Driver Safety Index. In: International Journalof Emerging
Technology and Advanced Engineering, ISSN 2250-2459,Volume 2 (2012)
[4] Johnson, D.A., Trivedi, M.M.:Driving Style Recognition using a smartphone as
a sensor platform. In: IEEE 14th International Conference on IntelligentTransportation
system, October(2011)
[5] Dai, J., Tang, J., Bai, X., Shen, Z., Xuan, D.:Mobile phone based drunk driving
detection. In: Proc. 4th Int. Conf. Pervasive Health NO PERMISSIONS, pp.18 (2010)
[6] Zhang, Y., Lin, W., Chin, Y.K.:A pattern-recognition approach for driving skill
characterization. In: IEEE Trans. Intell. Transp. Syst., vol. 11, no.4, pp.905916 (2010)
[7] Gazali, H: Monitoring Erratic Driving Behavior caused by Vehicle Overtaking
Using Off-theshelfTechnologies.
[8] Nguyen Thang Ngoc, “Real-Time human activity recognition using, mobile
phone”, Posts and telecommunications institute of technology, 2013.
[9] C. W. Han, S. J. Kang and N. S. Kim, “Implementation of HMM-BasedHuman
Activity Recognition Using Single Triaxial Accelerometer,” IEICETransactions
Fundamentals, Vol. E93-A, No. 7, July 2010.
[10] Y. Fujiki, “iPhone as a Physical Activity Measurement Platform,” in Proceedings
of ACM CHI 2010.
[11] Z. He, Z. Liu, L. Jin, L.-X. Zhen, and J.-C. Huang, “Weightlessness feature; a
novel feature for single tri-axial accelerometer based activity recognition,” in 19th
International Conference on Pattern Recognition, pp. 1–4, 2008.
[12] Z. He and L. Jin, “Activity recognition from acceleration data based on discrete
consine transform and svm,” in IEEE International Conference on Systems, Man and
Cybernetics, pp. 5041–5044, 2009.
[13] Y.-P. Chen, J.-Y. Yang, S.-N. Liou, Gwo-Yun=Lee, and J.-S. Wang, “Online
classifier construction algorithm for human activity detection using a triaxial
accelerometer,” Applied Mathematics and Computation, vol. 205, no. 2, pp. 849–860,

2008.

3



×