HỆ HỖ TRỢ QUYẾT ĐỊNH
NGUYỄN HOÀNG NGÂN
NGUYỄN HỒ DUY TRI
NGUYỄN HỒ DUY TRÍ
TÌM HIỂU PHÂN LỚP DỮ LIỆU VÀ ỨNG
DỤNG VÀO BÀI TOÁN DỰ BÁO
TỘI PHẠM
Bài toán dự báo tội phạm
Các bước thực hiện
Phương pháp thực hiện
Demo
NỘI DUNG
2
Giới thiệu về Kaggle
BÀI TOÁN DỰ BÁO TỘI PHẠM
3
Giới thiệu về Kaggle
BÀI TOÁN DỰ BÁO TỘI PHẠM
4
Giới thiệu về Kaggle
BÀI TOÁN DỰ BÁO TỘI PHẠM
5
Nguồn: Sunday Morning Insight: Why Kaggle Changes Everything
/>
Bài toán dự báo loại tội phạm tại thành phố San Francisco
BÀI TOÁN DỰ BÁO TỘI PHẠM
6
Dữ liệu tội phạm tại thành phố San Francisco
Dates: thời điểm xảy ra (timestamp)
Category: loại tội phạm, là mục tiêu chúng ta muốn dự đoán.
Descript: mô tả chi tiết phạm tội.
DayOfWeek: thứ
PdDistrict: tên của Văn phòng cảnh sát khu vực
Resolution: giải pháp bắt tội phạm
Address: địa chỉ nơi phạm tội
X: kinh độ
Y: vĩ độ
BÀI TOÁN DỰ BÁO TỘI PHẠM
7
Tiến trình ra quyết định của Simon
CÁC BƯỚC THỰC HIỆN
8
Các giải thuật phân lớp phổ biến:
SVM
NaiveBayes
Decision Table
…
PHƯƠNG PHÁP THỰC HIỆN
9
Cài đặt và thực hiện trên phần mềm Weka.
Kích thước dữ liệu:
Tập huấn luyện: 20000 dòng
Tập kiểm thử: 100 dòng
Kết quả (độ chính xác):
NaiveBayes: 30%
Decision Table: 27.73 %
PHƯƠNG PHÁP THỰC HIỆN
10
Kết luận:
-
Nhóm đã tìm hiểu các thuật toán: Naïve Bayes, Decision Table,
Tree J48 (Cây C4.5)
-
Ứng dụng vào bài toán dự báo tội phạm đạt được một số kết
quả nhất định
Hướng phát triển:
-
Xử lý tập dữ liệu lớn
-
Sử dụng các công cụ xử lý dữ liệu lớn khác nhau
-
Cải tiến thuật toán để nâng cao độ tin cây của kết quả dự báo
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
11
1. Tom Mitchell, Machine Learning, McGraw-Hill Education, 1997.
2. - 06/08/2015
3. /> - 06/08/2015
4. Phuc Do, Unit_1_DSS_Introduction_handout, UIT, 2015.
TÀI LIỆU THAM KHẢO
12
DEMO
13
XIN CHÂN THÀNH CẢM ƠN
THẦY VÀ CÁC BẠN ĐÃ LẮNG NGHE!
14