Tải bản đầy đủ (.pdf) (13 trang)

BÁO CÁO MÔN: TRÍ TUỆ NHÂN TẠO NÂNG CAO Đề tài: Ứng dụng mạng nơron nhân tạo trong bài toán dự báo kết quả học tập

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (400.25 KB, 13 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

BÁO CÁO
MƠN: TRÍ TUỆ NHÂN TẠO NÂNG CAO
Đề tài: Ứng dụng mạng nơ-ron nhân tạo trong bài toán dự báo kết quả học tập

Người thực hiện:
Nguyễn Quang Bách

HÀ NỘI - 2022


Mục lục

1.

Đặt vấn đề ..........................................................................................................3
1.1 Vấn đề............................................................................................................3
1.2 Mục tiêu nghiên cứu ........................................................................................3

2.

Mạng nơ-ron nhân tạo ........................................................................................4
2.1 Mạng nơ-ron nhân tạo là gì? ............................................................................4
2.2 Các thành phần cơ bản của mạng nơ-ron.........................................................4
2.2.1 Nơ-ron nhân tạo ........................................................................................4
2.2.2 Hàm kết hợp ..............................................................................................4
2.2.3 Hàm kích hoạt ...........................................................................................5
2.3. Phân loại..........................................................................................................5
2.3.1 Phân loại mạng theo số lớp trong mạng ...................................................5


2.3.2 Phân loại theo đường truyền tín hiệu ........................................................6
2.4. Mạng truyền thẳng nhiều lớp ..........................................................................6
2.4.1 Khái niệm ..................................................................................................6
2.4.2 Xác định cấu trúc mạng tối ưu ..................................................................7
2.4.3 Thuật toán lan truyền ngược .....................................................................7

3. Bài toán dự báo kết quả học tập .............................................................................8
3.1 Bài toán dự báo kết quả học tập .......................................................................8
3.2 Dữ liệu nghiên cứu ...........................................................................................9
3.3 Xây dựng mạng nơ-ron cho dự báo kết quả học tập .....................................9
3.3.1 Cấu trúc mạng ...........................................................................................9
3.3.2 Hàm kích hoạt ...........................................................................................9
4. Cài đặt và thử nghiệm ..........................................................................................10
4.1 Cài đặt ............................................................................................................10
4.2 Kết quả ...........................................................................................................12
5. Kết luận ................................................................................................................12
5.1 Kết quả đạt được ............................................................................................12
5.2 Hướng phát triển trong tương lai ...................................................................12
Tài liệu tham khảo....................................................................................................13


1. Đặt vấn đề
1.1

Vấn đề

Ngày nay, việc học trực tuyến càng ngày càng phổ biến đặc biệt trong giai đoạn dịch
Covid hoành hành. Học trực tuyến mang lại nhiều lợi ích như không cần phải đến lớp, học
mọi lúc mọi nơi, nguồn tài liệu học tập phong phú nhưng cũng có nhiều điểm bất cập như
giảng viên khơng thể theo dõi người học, ít giao tiếp giữa giảng viên với người học và giữa

người học với nhau. Từ đó việc đánh giá hay dự báo kết quả học tập của người học qua các
tương tác với hệ thống học trực tuyến là cần thiết để giảng viên có thể cảnh báo sớm và
đưa ra những giải pháp kịp thời giúp người học có kết quả tốt nhất.
Với lượng dữ liệu khủng lồ được sinh ra từ các hệ thống học trực tuyến, các phương
pháp học máy có thể được sử dụng để tạo ra các mơ hình dự báo kết quả học tập. Mạng
nơ-ron nhân tạo nhờ khả năng học, nhớ lại và khái quát hóa từ các mẫu dữ liệu huấn luyện
giúp mơ hình dự đốn có thể đạt được độ chính xác cao và ngày càng chính xác hơn.
1.2 Mục tiêu nghiên cứu
Trong báo cáo này, em sẽ tìm hiểu các đặc trưng của mạng nơ-ron nhân tạo, khả năng
và các nguyên tắc để ứng dụng thành công mạng nơ-ron nhân tạo trong thực tế. Nghiên
cứu ứng dụng mạng nơ-ron nhân tạo vào lớp bài toán dự đoán và phân loại. Từ đó xây
dựng mơ hình dự báo kết quả học tập dựa trên dữ liệu được sinh ra từ hệ thống học trực
tuyến.


2. Mạng nơ-ron nhân tạo
2.1 Mạng nơ-ron nhân tạo là gì? [1]
Mạng noron nhân tạo mơ phỏng lại mạng noron sinh học là một cấu trúc khối gồm các
đơn vị tính tốn đơn giản được liên kết chặt chẽ với nhau trong đó các liên kết giữa các
noron quyết định chức năng của mạng.
2.2 Các thành phần cơ bản của mạng nơ-ron [2]
2.2.1 Nơ-ron nhân tạo
Một mạng nơ-ron được xây dựng từ thành phần cơ sở là những nơ-ron nhân tạo.

Mỗi nơ-ron có 1 bộ đầu vào xi vào với trọng số wi sau đó sẽ được cộng lại bằng hàm
kết hợp. Tín hiệu sau đó sẽ được tiếp tục biến đổi nhờ một hàm kích hoạt g(aj). Và cuối
cùng tín hiệu sẽ được đưa đến đầu ra z của nơ-ron để lại trở thành đầu vào của các nơ-ron
khác hoặc trở thành tín hiệu ra của tồn bộ mạng.
2.2.2 Hàm kết hợp
Mỗi một đơn vị trong một mạng kết hợp các giá trị đưa vào nó thơng qua các liên

kết với các đơn vị khác, sinh ra một giá trị gọi là net input. Hàm thực hiện nhiệm vụ này
gọi là hàm kết hợp (combination function), được định nghĩa bởi một luật lan truyền cụ thể.
Trong phần lớn các mạng nơron, chúng ta giả sử rằng mỗi một đơn vị cung cấp một bộ
cộng như là đầu vào cho đơn vị mà nó có liên kết. Tổng đầu vào đơn vị j đơn giản chỉ là


tổng trọng số của các đầu ra riêng lẻ từ các đơn vị kết nối cộng thêm ngưỡng hay độ lệch
θj

2.2.3 Hàm kích hoạt
Trong mạng neural nhân tạo, một hàm kích hoạt là một hàm ánh xạ các đầu vào của
một nút với đầu ra tương ứng của nó. Hàm kích hoạt thực hiện một số loại hoạt động để
biến đổi tổng các đầu vào thành một số. Phép biến đổi này thường là một phép biến đổi phi
tuyến tính.
Một số hàm kích hoạt [2]:
- Hàm đồng nhất

-

Hàm bước nhị phân

-

Hàm sigmoid

-

Hàm sigmoid lưỡng cực

2.3. Phân loại

2.3.1 Phân loại mạng theo số lớp trong mạng
- Mạng 1 lớp: Là tập hợp các phần tử nơ-ron có đầu vào đầu ra trên cùng 1 phần tử


Mạng nhiều lớp: Gồm lớp đầu vào đầu ra riêng biệt và có các lớp ẩn giữa lớp đầu
vào và lớp đầu ra
2.3.2 Phân loại theo đường truyền tín hiệu
- Mạng truyền thẳng: Dòng dữ liệu từ đơn vị đầu vào đến đơn vị đầu ra chỉ được
truyền thẳng
- Mạng hồi quy
- Mạng tự tổ chức
-

2.4. Mạng truyền thẳng nhiều lớp
2.4.1 Khái niệm
Mạng truyền thẳng nhiều lớp bao gồm một lớp vào, một lớp ra, một hoặc nhiều lớp
ẩn. Các lớp đầu vào nhận tín hiệu, khơng thực hiện bất kỳ tính tốn nào, tái phân phối cho
các nơ-ron lớp ẩn. Các nơ-ron lớp ẩn thực hiện tính tốn, kết quả được định dạng bởi hàm
kích hoạt. Tín hiệu được truyền thẳng từ trái qua phải bắt đầu lớp vào qua các lớp ẩn tính
tốn để được kết quả lại lớp ra.


2.4.2 Xác định cấu trúc mạng tối ưu
2.4.2.1 Số lớp ẩn
Các mạng có hai lớp ẩn có thể thể hiện các hàm bất kỳ, nên theo lý thuyết một mạng
nơ-ron chỉ cần hai lớp ẩn. Tuy nhiên với phần lớn các bài toán cụ thể chỉ cần một lớp ẩn là
đủ, các bài toán sử dụng hai lớp ẩn rất hiếm khi xảy ra trong thực tế. Việc sử dụng nhiều
lớp ẩn cũng làm chậm việc huấn luyện mạng.

2.4.2.2 Số nơ-ron trong lớp ẩn

2.4.3 Thuật toán lan truyền ngược
Thuật toán lan truyền ngược được quyết định bởi sự kết nối giữa các nơron, hàm
kích hoạt và các thuật tốn học (hay luật học) để điều chỉnh trọng số.
Giải thuật lan truyền ngược tìm kiếm một vector các trọng số giúp cực tiểu hóa lỗi tổng thể
của hệ thống đối lập với tập huấn luyện.
Giải thuật gồm 3 bước:
Bước 1: Lan truyền xi các tính tốn trong mạng truyền thẳng. Đầu ra của một lớp
trở thành đầu vào cho lớp kế tiếp
Bước 2: Lan truyền lỗi ngược lại. Mỗi đầu vào đưa vào mạng, đầu ra của mạng đối
với nó được đem so sánh với đầu ra mong muốn. Thuật toán sẽ điều chỉnh các tham số của
mạng để tối thiểu hóa trung bình bình phương lỗi
Bước 3: Cập nhật các trọng số và độ lệch tương ứng


3. Bài toán dự báo kết quả học tập
3.1 Bài toán dự báo kết quả học tập
Dữ liệu được sinh ra từ các hoạt động học tập của người học trên các hệ thống quản lý
học trực tuyến ngày càng nhiều. Các dữ liệu này có thể phản ánh mức độ tương tác, sự
tham gia của người học vào khóa học. Khi người học tham gia các lớp học cách năng động
và hiệu quả thì kết quả học tập sẽ tốt hơn so với những người học ít tương tác với hệ thống.
Từ đó, chúng ta có thể dự đốn được kết quả học tập của người học dựa trên các tương tác
của người học với hệ thống học trực tuyến.
Một khóa học thơng thường sẽ có 2 kiểm tra vào khoảng tuần thứ 7 và tuần thứ 15 để
đánh giá kết quả học tập của người học. Vì thế, chúng ta cần dự báo kết quả cho người học
vào các tuần trước tuần thứ 7 và tuần 15 giúp người học có những điều chỉnh kịp thời để
đạt được những kết quả mong muốn. Có nhiều cách để đánh giá kết quả học tập của người
học nhưng phổ biến nhất là qua điểm số được phân thành các nhóm khác nhau A,B,C,D,F.
Khi mơ hình cung cấp giá trị chính xác của điểm số như 6.5 hay 7.0 thì sẽ mất đi tính khái
quát của điểm số và dễ gây hoang mang cho người học nên kết quả được dự báo theo điểm
bằng chữ. Như vậy chúng ta đã có nhãn để có thể sử dụng các thuật tốn phân loại và gán

các người học vào các nhóm điểm.
Thêm một vấn đề nữa, chúng ta dựa vào giá trị các thuộc tính của tuần học thứ 7 và
tuần học thứ 15 để phân loại và đánh giá nhưng chúng ta cần dự báo kết quả trước các tuần
này, vậy làm sao để có giá trị của các thuộc tính trong tuần 7 và tuần 15 từ các tuần trước
để dự báo kết quả cho người học? Nếu người học thường xuyên truy cập để sử dụng các
học liệu trên hệ thống thì chắc chắn các tương tác của người học sẽ tăng dần qua các tuần
học. Do đó, chúng ta có thể sử dụng các thuật tốn hồi quy tuyến tính để đưa ra các dự báo
về q trình học. Chúng ta lấy dữ liệu từ tuần cần dự báo, dự báo giá trị của thuộc tính vào
tuần 7 và tuần 15, phân loại và đưa ra kết quả dự báo. Chúng ta có thể dự báo tương tác
của người học ngay từ những tuần đầu của khóa học nên giúp người học có sự chuẩn bị tốt
hơn.
Ta có mơ hình sau đây:


3.2 Dữ liệu nghiên cứu
Nghiên cứu mơ hình với tập dữ liệu học là từ lớp học Phát triển ứng dụng web của thầy
Nguyễn Việt Anh trên hệ thống Moodle của Trường Đại học Công nghệ - Đại học Quốc
gia Hà Nội với 81 sinh viên, 9 bài tập, 2 diễn đàn, 20 học liệu, 29 tệp dữ liệu và lớp học
Lập trình hướng đối tượng của thầy Tơ Văn Khánh với 150 sinh viên, 24 bài tập, 3 diễn
đàn, 33 học liệu. Tập dữ liệu kiểm thử là lớp học Lập trình hướng đối tượng của cơ Vũ
Diệu Hương với 59 sinh viên, 8 bài tập, 2 diễn đàn, 12 học liệu.
3.3 Xây dựng mạng nơ-ron cho dự báo kết quả học tập
3.3.1 Cấu trúc mạng
Em sử dụng mô hình mạng nơ-ron với 3 lớp: 1 lớp vào, 1 lớp ẩn, 1 lớp ra. Lớp vào
gồm 5 nơ-ron tương ứng với các giá trị lượt xem (view), lượt đăng (post), lượt xem diễn
đàn (forum_view), lượt đăng diễn đàn (forum_post), tỷ lệ nộp bài tập
(assignment_submission). Số nơ-ron lớp ra là 5 tương ứng với 5 điểm A, B, C, D, F.
3.3.2 Hàm kích hoạt
Hàm kích hoạt được sử dụng trong lớp vào và lớp ẩn là hàm Log-sigmoid



4. Cài đặt và thử nghiệm
4.1 Cài đặt
Cài đặt mạng nơ-ron bằng ngơn ngữ lập trình python và thư viện scikit-learn [3]



4.2 Kết quả
Mơ hình dự báo kết quả của người học vào tuần 3, 6, 7,10 và 13 của khóa học, tuần
3 và 6 dự báo kết quả của điểm giữa kỳ(tuần 7) và cuối kỳ (tuần 15), tuần 10 và 13 chỉ dự
báo kết quả của điểm cuối kỳ.
Chạy thử với dữ liệu được nêu ở trên em được bảng kết quả sau:
Tuần

3

6

7

10

13

Tỉ lệ dự báo chính xác GK: 52.5% GK: 50% CK: 45% CK:44% CK: 44%
CK: 52.5% CK: 50%

5. Kết luận
5.1 Kết quả đạt được
Qua bài tập lớn này, em đã tìm hiểu về mạng nơ-ron nhân tạo, các thành phần cơ bản

của một mạng nơ-ron nhân tạo. Em đã tìm hiểu được về mạng nơ-ron truyền thẳng và thuật
tốn lan truyền ngược. Từ đó em xây dựng được mơ hình để dự báo kết quả học tập của
người học qua các tương tác của người học trên hệ thống học trực tuyến.
5.2 Hướng phát triển trong tương lai
-

Tim hiểu thêm về mạng nơ-ron nhân tạo và các thuật toán liên quan
Xây dựng thêm các bộ dữ liệu huấn luyện để có được kết quả tốt hơn
Nghiên cứu thêm về việc mạng nơ-ron tự huấn luyện khi có thêm các dữ liệu mới
được bổ sung


Tài liệu tham khảo
[1] D. Tân, Lý thuyết mạng nơ-ron, />[2] D. T. TRANG, "ỨNG DỤNG MẠNG NƠRON NHÂN TẠO DỰ BÁO SỐ
HỌC SINH TUYỂN VÀO TRUNG TÂM GDNN – GDTX QUẬN ĐỐNG
ĐA," 2017.
[3] F. a. V. G. a. G. A. a. M. V. Pedregosa, "Scikit-learn: Machine Learning in
Python," Journal of Machine Learning Research, vol. 12, pp. 2825--2830,
2011.



×