ĐẠI HỌC THỦ DẦU MỘT
KHOA KỸ THUẬT CÔNG NGHỆ
TIỂU LUẬN TỐT NGHIỆP
XÂY DỰNG WEBSITE DỰ ĐOÁN KẾT QUẢ HỌC
TẬP VÀ GỢI Ý LỰA CHỌN MÔN HỌC DỰA TRÊN
KHAI PHÁ DỮ LIỆU VÀ MÁY HỌC
GVHD: TS. Bùi Thành Hùng
SVTH: Trương Thiệu Huy
MSSV: 1424801030127
NIÊN KHĨA: 2014 - 2018
Bình Dương – 5/2018
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
NỘI DUNG
1. GIỚI THIỆU
2. TỔNG QUAN
3. MƠ HÌNH TIẾP CẬN
4. THỰC NGHIỆM
5. DEMO
6. KẾT LUẬN
2
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
1. GIỚI THIỆU
3
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
4
LÝ DO CHỌN ĐỀ TÀI
• Về sự tiến bộ của khoa học kỹ thuật:
• Trí thơng minh nhân tạo (AI) đang là xu hướng
• Sự tiến bộ khơng ngừng của máy học (Machine Learning)
• Các giải thuật gợi ý ngày càng chính xác
• Về nhu cầu thiết yếu:
• Định hướng và chọn mục tiêu là việc rất quan trọng
• Chọn sai mơn học gây tổn thất lớn cho sinh viên, gia đình và xã hội
• Dự đoán kết quả học tập giúp đánh giá, phân loại sinh viên một cách nhanh
chóng, chính xác.
• Về cá nhân
• Với mong muốn học hỏi và ứng dụng máy học vào các vấn đề thực tiễn nhất
là đối với việc cấp thiết như lựa chọn môn học
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
5
MỤC TIÊU
• Từ những dữ liệu của sinh viên thông qua máy học để tiến hành
dự đốn và gợi ý mơn học
• Thực hiện dự đốn trên 3 giải thuật gợi ý:
• Content base
• Collaborative Filtering
• Matrix Factorization
• Xây dựng website hiển thị kết quả dự đốn và gợi ý lựa chọn
mơn học
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
2. TỔNG QUAN
6
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
CƠ SỞ LÍ THUYẾT
• Máy học (Machine Learning)
• Hệ thống gợi ý (Recommender System)
7
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
Recommender System
8
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
9
Các nghiên cứu ở Việt Nam
Dự đoán kết quả học tập và gợi ý lựa chọn môn học bằng phương
pháp Phân rã ma trận – Huỳnh Lý Thanh Nhân (Luận văn Thạc sĩ –
Đại học Cần Thơ - 2013)
Khai phá dữ liệu điểm để dự đoán kết quả học tập của sinh viên
trường Cao đẳng Sư phạm Hà Nội bằng Business Intelligence
Development Studio của SQL Server 2008 - Phạm Thị Như Trang
(Luận văn Thạc sĩ – Đại học Công nghệ - 2013)
Huynh Ly Thanh-Nhan, Huu-Hoa Nguyen, and Nguyen Thai-Nghe.
2016. Methods for building course recommendation systems. In
Proceedings of the 2016 International Conference on Knowledge and
Systems Engineering (KSE 2016), pp.163-168, ISBN 978-1-46738929-7, IEEE Xplore.
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
10
Giải pháp đề xuất
Xây dựng hệ thống dự đoán kết quả học tập và gợi ý lựa
chọn môn học bằng 3 phương pháp:
- Content based filtering
- Collaborative filtering
- Matrix Factorization
Xây dựng Website trực quan hóa kết quả
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
11
Xây dựng Website trực quan hóa kết quả
Dự đốn kết quả
Gợi ý lựa chọn mơn học
Phân tích kết quả
Thơng tin
So sánh đánh giá
các mơ hình
Tích hợp vào
thống quản lý
hệ
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
3. MƠ HÌNH ĐỀ XUẤT
12
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
13
MƠ HÌNH ĐỀ XUẤT
ỨNG DỤNG
XÂY DỰNG MODEL
Dữ liệu thơ
Xử lí và chọn
lọc
Phân tách
Server
6 Models:
- Content base (2)
- Collaborative Filtering (2)
- Matrix Factorization (2)
API
Http
Huấn luyện
Xây dựng
model
Website
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
DỮ LIỆU THÔ
14
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
DỮ LIỆU THÔ
15
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
XỬ LÝ VÀ CHỌN LỌC
16
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
PHÂN TÁCH DỮ LIỆU
Hình a
Hình b
17
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
18
XÂY DỰNG HỆ THỐNG BẰNG 3 PHƯƠNG PHÁP
• Content based filtering
• Collaborative filtering
• Matrix Factorization
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
19
Content based filtering
Là feature môn đã có điểm
Sn là số mơn đã có điểm
Là giá trị điểm của mơn đã có điểm
e là vector cột chứa S(n) phần tử 1
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
Content based filtering
Ta có feature matrix cho item như sau:
Xét user E ta có:
Từ đó suy ra:
Áp dụng vào cơng thức để tìm nghiệm w5 và b5:
20
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa
chọn môn học dựa trên khai phá dữ liệu và máy học
21
Content based filtering
• Sau khi ta tìm được mơ hình cho user. Thì kết quả dự
đốn của user (n) và item (m) sẽ được tính bằng:
Với X(m) là feature của item
Wn và bn là mơ hình của user (n)
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
Collaborative Filtering
Các bước thực hiện:
• Tìm mean (Số điểm trung bình)
• Chuẩn hóa
• Tìm độ tương đồng
• Dự đốn
22
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
Collaborative Filtering
23
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
Collaborative Filtering
Ví dụ ta dự đốn u1 với i1:
Ta chọn hệ số k = 2
Các sinh viên có điểm i1: {u0, u3, u5}
Độ tương quan với u1: {0.83, -0.4, -0.23}
2 sinh viên gần u1 nhất: {u0, u5}
Điểm đã chuẩn hóa: {0.75, 0.5}
24
Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học
25
Matrix Factorization
Tìm ra 2 ma trận X và W sao cho X.W = Y
K là số nhân tố tiềm ẩn
Thay vì cần N*N hoặc M*M bộ nhớ để lưu
Giờ ta chỉ cần K(N+M)