Tải bản đầy đủ (.pdf) (43 trang)

Tiểu luận tốt nghiệp xây dựng website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.79 MB, 43 trang )

ĐẠI HỌC THỦ DẦU MỘT
KHOA KỸ THUẬT CÔNG NGHỆ

TIỂU LUẬN TỐT NGHIỆP
XÂY DỰNG WEBSITE DỰ ĐOÁN KẾT QUẢ HỌC
TẬP VÀ GỢI Ý LỰA CHỌN MÔN HỌC DỰA TRÊN
KHAI PHÁ DỮ LIỆU VÀ MÁY HỌC

GVHD: TS. Bùi Thành Hùng
SVTH: Trương Thiệu Huy
MSSV: 1424801030127
NIÊN KHÓA: 2014 - 2018
Bình Dương – 5/2018


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

NỘI DUNG
1. GIỚI THIỆU

2. TỔNG QUAN

3. MÔ HÌNH TIẾP CẬN

4. THỰC NGHIỆM

5. DEMO

6. KẾT LUẬN

2




Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

1. GIỚI THIỆU

3


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

4

LÝ DO CHỌN ĐỀ TÀI
• Về sự tiến bộ của khoa học kỹ thuật:
• Trí thông minh nhân tạo (AI) đang là xu hướng
• Sự tiến bộ không ngừng của máy học (Machine Learning)
• Các giải thuật gợi ý ngày càng chính xác
• Về nhu cầu thiết yếu:
• Định hướng và chọn mục tiêu là việc rất quan trọng
• Chọn sai môn học gây tổn thất lớn cho sinh viên, gia đình và xã hội
• Dự đoán kết quả học tập giúp đánh giá, phân loại sinh viên một cách nhanh
chóng, chính xác.
• Về cá nhân
• Với mong muốn học hỏi và ứng dụng máy học vào các vấn đề thực tiễn nhất
là đối với việc cấp thiết như lựa chọn môn học


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học


5

MỤC TIÊU
• Từ những dữ liệu của sinh viên thông qua máy học để tiến hành

dự đoán và gợi ý môn học
• Thực hiện dự đoán trên 3 giải thuật gợi ý:
• Content base
• Collaborative Filtering
• Matrix Factorization
• Xây dựng website hiển thị kết quả dự đoán và gợi ý lựa chọn

môn học


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

2. TỔNG QUAN

6


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

CƠ SỞ LÍ THUYẾT
• Máy học (Machine Learning)

• Hệ thống gợi ý (Recommender System)

7



Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

Recommender System

8


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

9

Các nghiên cứu ở Việt Nam
Dự đoán kết quả học tập và gợi ý lựa chọn môn học bằng phương

pháp Phân rã ma trận – Huỳnh Lý Thanh Nhân (Luận văn Thạc sĩ –
Đại học Cần Thơ - 2013)
Khai phá dữ liệu điểm để dự đoán kết quả học tập của sinh viên
trường Cao đẳng Sư phạm Hà Nội bằng Business Intelligence
Development Studio của SQL Server 2008 - Phạm Thị Như Trang
(Luận văn Thạc sĩ – Đại học Công nghệ - 2013)
Huynh Ly Thanh-Nhan, Huu-Hoa Nguyen, and Nguyen Thai-Nghe.
2016. Methods for building course recommendation systems. In
Proceedings of the 2016 International Conference on Knowledge and
Systems Engineering (KSE 2016), pp.163-168, ISBN 978-1-46738929-7, IEEE Xplore.


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học


10

Giải pháp đề xuất
 Xây dựng hệ thống dự đoán kết quả học tập và gợi ý lựa

chọn môn học bằng 3 phương pháp:
- Content based filtering
- Collaborative filtering
- Matrix Factorization
 Xây dựng Website trực quan hóa kết quả


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

11

Xây dựng Website trực quan hóa kết quả

Dự đoán kết quả
Gợi ý lựa chọn môn học

Phân tích kết quả

Thông tin

So sánh đánh giá
các mô hình

Tích hợp vào
thống quản lý


hệ


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

3. MÔ HÌNH ĐỀ XUẤT

12


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

13

MÔ HÌNH ĐỀ XUẤT
ỨNG DỤNG

XÂY DỰNG MODEL

Dữ liệu thô
Xử lí và chọn
lọc
Phân tách

Server

6 Models:
- Content base (2)
- Collaborative Filtering (2)

- Matrix Factorization (2)

API

Http
Huấn luyện
Xây dựng
model

Website


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

DỮ LIỆU THÔ

14


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

DỮ LIỆU THÔ

15


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

XỬ LÝ VÀ CHỌN LỌC


16


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

PHÂN TÁCH DỮ LIỆU

Hình a

Hình b

17


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

18

XÂY DỰNG HỆ THỐNG BẰNG 3 PHƯƠNG PHÁP
• Content based filtering
• Collaborative filtering
• Matrix Factorization


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

19

Content based filtering


Là feature môn đã có điểm

Sn là số môn đã có điểm

Là giá trị điểm của môn đã có điểm

e là vector cột chứa S(n) phần tử 1


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

Content based filtering
Ta có feature matrix cho item như sau:
Xét user E ta có:

Từ đó suy ra:

Áp dụng vào công thức để tìm nghiệm w5 và b5:

20


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa
chọn môn học dựa trên khai phá dữ liệu và máy học

21

Content based filtering
• Sau khi ta tìm được mô hình cho user. Thì kết quả dự


đoán của user (n) và item (m) sẽ được tính bằng:

Với X(m) là feature của item
Wn và bn là mô hình của user (n)


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

Collaborative Filtering
Các bước thực hiện:
• Tìm mean (Số điểm trung bình)
• Chuẩn hóa
• Tìm độ tương đồng
• Dự đoán

22


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

Collaborative Filtering

23


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

Collaborative Filtering

Ví dụ ta dự đoán u1 với i1:

Ta chọn hệ số k = 2
Các sinh viên có điểm i1: {u0, u3, u5}
Độ tương quan với u1: {0.83, -0.4, -0.23}
 2 sinh viên gần u1 nhất: {u0, u5}
 Điểm đã chuẩn hóa: {0.75, 0.5}

24


Xây dựng Website dự đoán kết quả học tập và gợi ý lựa chọn môn học dựa trên khai phá dữ liệu và máy học

25

Matrix Factorization

Tìm ra 2 ma trận X và W sao cho X.W = Y
K là số nhân tố tiềm ẩn
 Thay vì cần N*N hoặc M*M bộ nhớ để lưu
Giờ ta chỉ cần K(N+M)


×