Tải bản đầy đủ (.pptx) (14 trang)

Thuyết trình tìm HIỂU PHÂN lớp dữ LIỆU và ỨNG DỤNG vào bài TOÁN dự báo tội PHẠM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (536.67 KB, 14 trang )

HỆ HỖ TRỢ QUYẾT ĐỊNH
NGUYỄN HOÀNG NGÂN
NGUYỄN HỒ DUY TRI
NGUYỄN HỒ DUY TRÍ
TÌM HIỂU PHÂN LỚP DỮ LIỆU VÀ ỨNG
DỤNG VÀO BÀI TOÁN DỰ BÁO
TỘI PHẠM

Bài toán dự báo tội phạm

Các bước thực hiện

Phương pháp thực hiện

Demo
NỘI DUNG
2

Giới thiệu về Kaggle
BÀI TOÁN DỰ BÁO TỘI PHẠM
3

Giới thiệu về Kaggle
BÀI TOÁN DỰ BÁO TỘI PHẠM
4

Giới thiệu về Kaggle
BÀI TOÁN DỰ BÁO TỘI PHẠM
5
Nguồn: Sunday Morning Insight: Why Kaggle Changes Everything
/>


Bài toán dự báo loại tội phạm tại thành phố San Francisco
BÀI TOÁN DỰ BÁO TỘI PHẠM
6
Dữ liệu tội phạm tại thành phố San Francisco

Dates: thời điểm xảy ra (timestamp)

Category: loại tội phạm, là mục tiêu chúng ta muốn dự đoán.

Descript: mô tả chi tiết phạm tội.

DayOfWeek: thứ

PdDistrict: tên của Văn phòng cảnh sát khu vực

Resolution: giải pháp bắt tội phạm

Address: địa chỉ nơi phạm tội

X: kinh độ

Y: vĩ độ
BÀI TOÁN DỰ BÁO TỘI PHẠM
7

Tiến trình ra quyết định của Simon
CÁC BƯỚC THỰC HIỆN
8

Các giải thuật phân lớp phổ biến:


SVM

NaiveBayes

Decision Table


PHƯƠNG PHÁP THỰC HIỆN
9

Cài đặt và thực hiện trên phần mềm Weka.

Kích thước dữ liệu:

Tập huấn luyện: 20000 dòng

Tập kiểm thử: 100 dòng

Kết quả (độ chính xác):

NaiveBayes: 30%

Decision Table: 27.73 %
PHƯƠNG PHÁP THỰC HIỆN
10

Kết luận:
-
Nhóm đã tìm hiểu các thuật toán: Naïve Bayes, Decision Table,

Tree J48 (Cây C4.5)
-
Ứng dụng vào bài toán dự báo tội phạm đạt được một số kết
quả nhất định

Hướng phát triển:
-
Xử lý tập dữ liệu lớn
-
Sử dụng các công cụ xử lý dữ liệu lớn khác nhau
-
Cải tiến thuật toán để nâng cao độ tin cây của kết quả dự báo
KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
11
1. Tom Mitchell, Machine Learning, McGraw-Hill Education, 1997.
2. - 06/08/2015
3. /> - 06/08/2015
4. Phuc Do, Unit_1_DSS_Introduction_handout, UIT, 2015.
TÀI LIỆU THAM KHẢO
12
DEMO
13
XIN CHÂN THÀNH CẢM ƠN
THẦY VÀ CÁC BẠN ĐÃ LẮNG NGHE!
14

×