Khai Thác Dữ Liệu
GV: Nguyễn Kim Long
Giới thiệu môn học
•
Trình bày được các khái niệm cơ bản trong khai
thác dữ liệu.
•
Các kỹ thuật, công nghệ, phương pháp áp dụng
trong khai thác dữ liệu.
•
Triển khai phương pháp khai thác dữ liệu đối với
một lĩnh vực cụ thể.
•
Nâng cao kỹ năng tham khảo tài liệu về lĩnh vực
khai thác dữ liệu.
Kết quả đạt được
•
Điểm tích cực(30%)
–
Thuyết trình lý thuyết (1/2)
–
Bài tập hàng tuần (1/2)
•
Đồ án(30%)
–
Báo cáo tuần 9 (40%), tuần 13-14 (60%)
•
Thi cuối kỳ(40%)
–
Thi vấn đáp theo lịch phòng đào tạo
Đánh giá kết quả
•
Sách principle of DataMining
•
Sách DataMining Concepts and Techniques
•
Slides
•
DataMining MSSQL2008
•
google
Tài liệu
•
Lý thuyết: trên lớp CS2
•
Thực hành: phòng máy CS2
•
Bài tập: tùy chọn
Môi trường học và thực hành
•
1-2. Tổng quan
•
3. Xác xuất và entropy
•
4. Tiền xử lý dữ liệu
•
5. Kho dữ liệu và OLAP
•
6-7. Luật kết hợp
•
8-9. Phân nhóm
•
10-11. Phân cụm.
•
12-13. Web Mining, Text Mining
•
14. Ôn tập
Nội dung môn học (Lý thuyết)
•
1-3. Làm quen công cụ mining
•
4-8. MSSQL 2008
•
9-13. Text Mining
•
14. Ôn tập
Nội dung môn học (Thực hành)
Bài giảng 1. Giới thiệu
1. L ch s KTDL.ị ử
2. T i sao khai ạ thác d li u?ữ ệ
3. Khái thác d li u là gì?ữ ệ
4. Các b c KTDL.ướ
5. Khai thác trên ki u d li u gì?ể ữ ệ
6. Ch c n ng KTDLứ ă
7. Các k thu t (thu t tóan) KTDLỹ ậ ậ
8. Phân l ai h th ng KTDLọ ệ ố
9. Tóm t tắ
Nội dung
•
1960s: HT xử lý tập tin đơn giản -> HT CSDL
•
1970s: CSDL quan hệ, mô hình hóa, câu truy
vấn,...
•
1980s: lý thuyết mô hình hướng đối tượng,
CSDL phân tán, ...
=> sự bùng nổ kho dữ liệu khổng lồ
=> „giàu dữ liệu, nghèo thông tin”
Lịch Sử
Tại sao KTDL?
KTDL là gì?
•
khai thác tri thức
•
Knowledge Discovery form Data (KDD)
•
knowledge mining from data
•
knowledge extraction
•
data/pattern analysis
•
data archaeology (khai quật dữ liệu)
•
data dredging (nạo vét dữ liệu)
Các khái niệm tương đương