Tải bản đầy đủ (.pdf) (137 trang)

Phân tích, khai phá dữ liệu dạy học và thông tin phản hồi của sinh viên nhằm nâng cao chất lượng và hiệu quả quản lý đào tạo phụ lục 2

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (14.89 MB, 137 trang )

ĐẠI HQC QUỐC GIA HÀ NỘI

PHỤ LỤC 2
CÁC BÁO CÁO CHUYÊN ĐỀ

Tên đề tài:

Phân tích, khai phá dũ liệu dạy học và thông tiu
phàn hõt của sinh viẽtt nhằm nâng cao chất Ệrợng
và hiệu qua quản ìỷ dào tạo

Mã số:

QG.15.29

Chủ nhiệm:

PGS.TS. Phan Xuân Riêu

Hà Nội, 02/2018
1


MỤC LỤC
TH Ứ T ự CÁC BÁ O CÁO C H U Y Ê N ĐÈ
— C ác b á o cả o đ ư ợ c n g ă n c á c h b ở i tr a n g b ìa c ứ n g —

TT

T ên b áo cáo


1 Thu thập và tiền xử lý dữ liệu đào tạo
2 Nghiên cửu và đề xuất các mô hình phương pháp phân tích khai phá dữ liệu đào tạo
3 Thực trạng quản lý hoạt động đào tạo ở Đại học Quốc gia Hà N ội
4 Tổng hợp thông tin phản hồi của sinh viên
5 Tổng hợp thông tin phản hồi của cán bộ
6 Khung tư vấn m ôn học và xử lý đa ràng buộc
7 X ây dựng mô hình dự đoán điểm cho sinh viên

1


ĐẠI HỌC QUỐC GIA HÀ NỘI

BÁO CÁO 01

THƯ THẬP
VÀ TIÈN x ử LÝ DỮ LIỆU
ĐÀO TẠO



Thuộc đề tài
PHÂN TÍCH, PHAI KHÁ DỮ LIỆU DẠY HỌC VÀ THÔNG TIN PHẢN
HÒI CỦA SINH VIÊN NHẰM NÂNG CAO CHÁT LƯỢNG VÀ HIỆU
QUẢ QUẢN LÝ ĐÀO TẠO
Mã số QG.15.29

Thành viên thực hiện: Trần Thị Oanh
Phan Xuân Hiếu
Trương Thị Minh Ngọc


ữAÍ học q u ố c g ĨÃ hà nội
TRUNG TÂM THÒNG ĨÌN THƯ VIỆ N

0006000050/1
Hà Nội 2015


MỤC LỤC

THU THẬP VÀ TIỀN x ử LÝ DỮ LIỆU ĐÀO T Ạ O ................................... ....................3
1. Khảo sát thực trạng quản lý đào tạo............................................................................. 3
a)

Khung

chương trình năm 2007......................................................................... 3

b)

Khung

chương trình năm 2010......................................................................... 5

c)

Khung

chương trình năm 2012......................................................................... 6


2. Thu thập dữ liệu ...............................................................................................................7
3. Chuẩn hóa dữ liệ u ...................................................................................................... . 8
4. Bộ dữ liệu tổng hợp......................................................................................................... 9

1


THU THẬP VÀ TIÈN x ử LÝ DỮ LIỆU ĐÀO TẠO

Báo cáo này trình bày về việc thu thập và tiền xử lý dữ liệu đào tạo phục vụ
cho các nhiệm vụ phân tích và khai phá tiếp theo.Trong báo cáo này, chúng tôi tập
trung vào các dữ liệu ghi lại các hoạt động dạy-học ở các đơn vị đào tạo như các môn
học (course), sinh viên, đánh giá cuối kỳ của môn học... Đây là dữ liệu có cấu trúc
được truy xuất từ cơ sở dữ liệu đào tạo tại các đơn vị. Dữ liệu thu thập được sẽ được
làm sạch, chuẩn hóa, tích hợp để thuận tiện cho việc khai phá tìm ra cái nhìn mới mẻ
và trích rút tri thức có giá trị phục vụ cho việc nâng cao hoạt động dạy-học và hiệu
quả quản lý đào tạo trong nhà trường.
Báo cáo bao gồm 4 phần chính. Phần 1 mô tả thực trạng quản lý đào tạo trong
một đơn vị của ĐHQG làm cơ sờ cho việc thu thập dữ liệu đào tạo. Phần 2 mô tả quá
trình thu thập dữ liệu. Phần 3 trình bày các bước chuẩn hóa dữ liệu thành bộ dữ liệu
tổng họp - được chi tiết hóa trong Phần 4 của báo cáo.

1. Khảo sát thực trạng quản lý đào tạo
Đe tài đã tiến hành thu thập dữ liệu đào tạo của Khoa Công nghệ Thông tin - Đại
học Quốc gia Hà Nội (Hệ chuẩn đào tạo chính quy). Dữ liệu thu thập được từ học kỳ I
năm học 2007-2008 tới hết học kỳ II năm học 2013-2014. Theo đó, các khóa đào tạo
theo tín chi của Khoa được thực hiện dựa trên 3 khung chương trình (KCT) chính:


KCT CNTT 2007: Áp dụng cho sinh viên các khóa K54 trở về trước.




KCT CNTT 2010: Áp dụng cho sinh viên của khóa K55 và K56.



KCT CNTT 2012: Áp dụng cho sinh viên thuộc các khóa K57 trở đi.

Các KCT này được thiết kế cho 4 năm học tập trung. Phần tiếp theo, báo cáo trình
bày tóm tắt 3 khung chương trình làm cơ sở để chuẩn hóa và tổng hợp dữ liệu đào tạo:
a) K hung chương trình năm 2007
Sinh viên ngành Công nghệ thông tin được trang bị các kiến thức cơ bản và
chuyên sâu về Công nghệ thông tin, cũng như được định hướng một số vấn đề hiện
đại tiệm cận với kiến thức chung về Công nghệ thông tin của thế giới.
Sinh viên ngành Công nghệ thông tin được đào tạo kỹ năng thực hành cao trong
hầu hết các lĩnh vực của Công nghệ thông tin, cho phép sinh viên tốt nghiệp dễ dàng
hòa nhập và phát triển trong môi trường làm việc mới. Ngoài ra, sinh viên ngành Công


nghệ thông tin cũng được trang bị kỹ năng tự học tập, nghiên cứu, làm việc theo nhóm
và kỹ năng giao tiếp.
Ngoài các mục tiêu chung, sinh viên được đào tạo với các mục tiêu bô sung cho môi
chuyên ngành:

Chuyên ngành Các hệ thống thông tin
Nắm vững kiến thức cơ bản và chuyên sâu về Hệ thống thông tin, đáp ứng các yêu cầu
về nghiên cứu phát triển và ứng dụng Công nghệ thông tin của xã hội. Xây dựng được
các hệ thống thông tin cho việc quản lý kinh tế, hành chính và dịch vụ.


Chuyên ngành Công nghệ phần mềm
Nắm vững kiến thức cơ bản và chuyên sâu về Công nghệ phần mềm: quy trình xây
dựng, quản lý và bảo trì hệ thống phần mềm; phân tích, thiết kế và quản lý các dự án
phần mềm. Tổ chức thục hiện và quản lý được các công việc trong lĩnh vực công nghệ
phần mềm, có khả năng xây dựng mô hình và áp dụng các nguyên tắc của công nghệ
phần mềm vào thực tế.

Chuyên ngành Khoa học máy tính
Nắm vững kiến thức cơ bản và chuyên môn sâu về Khoa học máy tính. Đáp ứng các
vấn đề về Dhân tích, thiết kế thuật toán, xây dựng giải nháp đặt nền tàng đe giải quyết

các bài toán ứng dụng trong thực tế. Thực hiện được việc nghiên cứu, phát triển và
ứng dụng Công nghệ thông tin trong khoa học và xã hội.

Chuyên ngành Mạng và truyền thông máy tính
Nắm vững kiến thức cơ bản và chuyên sâu về Mạng và truyền thông máy tính, đáp
ứng yêu cẩu về nghiên cứu, ứng dụng trong lĩnh vực mạng và truyền thông máy tính.
Có khả năng thiết kế, chế tạo, bảo trì, sản xuất, thử nghiệm, quản lý các hệ thống
mạng và truyền thông máy tính.

Tổng số tín chỉ phải tích lũy:

132 tín chỉ, trong đó:

- Khối kiến thức chung:

33 tín chì

{Không tỉnh các môn học GDTC và GDQP-AN)
- Khối kiến thức xã hội và nhân văn:


4 tín chi

- Khối kiến thức cơ bản của nhóm ngành:

35 tín chi

- Khối kiến thức cơ sở của ngành:

42 tín chi

- Khối kiến thức chuyên ngành:

11 tín chi
4


+ Bắt buộc:

5 tín chỉ

+ Tự chọn:

6 tín chỉ

- Khóa luận tốt nghiệp hoặc tương đương:

07 tín chi

b) K hung chương trình năm 2010

Sinh viên tốt nghiệp ngành Công nghệ thông tin được trang bị các kiến thức cơ
bản và chuyên sâu về Công nghệ thông tin, cũng như đuợc định hướng một số vấn đề
hiện đại tiệm cận với kiến thức chung về Công nghệ thông tin của thế giới.
Sinh viên tốt nghiệp ngành Công nghệ thông tin được đào tạo kỹ năng thực hành
cao trong hầu hết các lĩnh vực cùa Công nghệ thông tin, cho phép sinh viên tốt nghiệp
dễ dàng hòa nhập và phát triển trong môi trường làm việc mới. Ngoài ra, sinh viên
ngành Công nghệ thông tin cũng được trang bị kỹ năng tự học tập, nghiên cứu, làm
việc theo nhóm vả kỹ năng giao tiếp.
Ngoài các mục tiêu chung, sinh viên được đào tạo vói các mục tiêu bô sung cho
moi chuyên ngành:
Chuyên ngành Công nghệ phần mềm
Nắm vững kiến thức cơ bản và chuyên sâu về Công nghệ phần mềm: quy trình
xây dựng, quản lý và bảo trì hệ thống phần mềm; phân tích, thiết kế và quản lý các dự
án phần mềm.Tổ chức thực hiện và quản lý được các công việc trong lĩnh vực công
nghệ phần mềm, có khả năng xây dựng mô hình và áp dụng các nguyên tắc của công
nghệ phần mềm vào thực tế.
C huyên ngành Hệ thống thông tín
Nắm vững kiến thức cơ bản và chuyên sâu về Hệ thống thông tin, đáp ứng các
yêu cầu về nghiên cứu phát triển và ứng dụng công nghệ thông tin của xã hội. Xây
dựng được các hệ thống thông tin cho việc quản lý kinh tế, hành chính và dịch vụ.
C huyên ngành M ạng và truyền thông máy tính
Nắm vững kiến thức cơ bản và chuyên sâu về Mạng và truyền thông máy tính,
đáp ứng yêu cầu về nghiên cứu, ứng dụng trong lĩnh vực mạng và truyền thông máy
tính.Có khả năng thiết kế, chế tạo, bảo trì, sản xuất, thử nghiệm, quản lý các hệ thống
mạng và truyền thông máy tính.
C huyên ngành Khoa học dịch vụ / Dịch vụ Công nghệ thông tin

5



Nắm vững kiến thức cơ bản và chuyên sâu về nghiên cứu và triển khai các Dịch
vụ Côngnghệ thông tin, đáp ứngcác vấn đề về phân tích, xây dựng giải

pháp nền tảng

cho các dịch vụ Công nghệ thông tin và dịch vụ dựa trênCông nghệthông tin trong
thực tế. Tổ chức thực hiện và quản lý được các công việc trong lĩnh vực Dịch vụ Công
nghệ thông tin, có khả năng xây dựng mô hình và áp dụng các nguyên tắc của Dịch vụ
Công nghệ thông tin vào thực tế.

Tồng so tín chỉ phải tích lũy'.

136 tín chỉ, trong đó:

- Khối kiến thức chung

29 tín chi

(Không tính các môn GDTC vò GDQP-AN)
- Khối kiến thức khoa học xã hội và nhân văn

04 tín chỉ

- Khối kiến thức cơ bản của nhóm ngành

35 tín chi

- Khối kiến thức cơ sở của ngành

43 tín chi


- Khối kiến thức chuyên ngành

18 tín chi

+ Bắt buộc

06 tín chỉ

+ Tự chọn

12 tín chỉ

- Khóa luân
- tot nehiện
w • i Ạioăc
\
■ các môn thay
J thể)/

7 tín chỉ

c) Khung chương trình năm 2012
v ề kiến thức, KCT này nhằm trang bị cho sinh viên các kiến thức:
-

Kiến thức trong ĐHQG Hà Nội bao gồm kiến thức về lý luận chính trị, tin
học và ngoại ngữ.

-


Kiến thức chung theo lĩnh vực

-

Kiến thức chung của khối ngành

-

Kiến thức chung của nhóm ngành

-

Kiến thức của ngành và bổ trợ

-

Kiến thức thực tập và tốt nghiệp

v ề kỹ năng, KCT trang bị các kỹ năng cứng và kỹ năng mềm. Kỹ năng cứng gồm
các kỹ năng nghề nghiệp, kỹ năng lập luận tư duy và giải quyết vấn đề, kỹ năng
nghiên cứu và khám phá kiến thức, ... Các kỹ năng mềm gồm năng lực cánhân, làm
việc nhóm, kỹ năng lãnh đạo, giao tiếp, ...Đ ây là tóm tắt yêu
đào tạo:
6

cầu của chương trình


Tổng số tín chỉ phải tích lũy


128 tín chỉ, trong đó:
29 tín chi

• Khối kiến thức chung:
(Không tính các món từ 10-12)
• Khối kiến thức chung theo lĩnh vực:

20 tín chi

• Khối kiến thức chung cùa khối ngành (CNTT, ĐTVT):

9 tín chi

• Khối kiến thức chung của nhóm ngành:

22 tín chi

• Khối kiến thức ngành và bổ trợ:

38 tín chi



+ Bắt buộc

18 tín chỉ

+ Bổ trợ


5 tín chi

+ Tự chọn

15 tín chỉ

Khối kiến thức thực tập và tốt nghiệp:

10 tín chi

2. Thu thập dữ liệu
Được sự hỗ trợ của phòng Đào tạo trường Đại học Công nghệ, đề tài đã trích
xuất dữ liệu dưới dạng các file excel có định dạng như trong Hình 1. Dữ liệu thu thập
được từ học kỳ I năm học 2007-2008 tới hết học kỳ II năm học 2013-2014.

Bảng 1 - Dữ liệu điểm - môn học của sinh viên lớp QH-2007-I/CQ-C-A, học kỳ 2

năm học 2008-2009.
BĂNGĐltAILỚPQB-2007-I/CQ-C-A
HỌCri' ĩ. NẢMHOCaaonÒM
CT
Ho tia
N| ìt linh
0
1
3
4
2
Vú Tuân Anh
Nam 06/01-1989

80
6.4
6.7
7.4
5.5
Nam 30-07/1588
Trtn Nịọc Đá

7,4
5.Ố
52
1.0
Tria Níuvèn Đinh
Xam 30/01/1991
5.1
3
6.8
6.1
4.5
3.8
80
Trần Đai Hiệp
Nam 20/09'1988
5J
5J
7.8
5.6
4
Ptậm Trunj£ Hĩéo
Nam 06*10/19»

5.1
7.1
s.ỗ
í .í
5
s.o
Neuvỉn Thỉng Huv Nam 27/10^1988
6.1
7.0
6
tf.l
7.5
tf.t
Dỏ Vin Chann
1
7.8
7.0
Nam 27/12^1988
4.0
6.8
5.2
Bach Nsoc Minh
Nam 25/12/1980
6.8
70
6.1
7.7
5.6
8
Nsuvỉo Trung Tho Nam OMI7/I989

12
1.5
tf 0
5.1
6.1
9
Đmh Thi Thu
7.0
6.1
10
Xừ
11/11/1989
6.1
7J
Đina Mmh Tôãn
Nua 2&'11/]9M
8.0
51
69
6.5
6.7
11
Nam 01/11/1989
6.3
12
Neuvỉa Taấn Toin
69
7.0
5.4
7.3

Dịu
Ọuỏc
Toãa
Nam
<W>08'lS8g
7.4
65
7.8
8.0
6.9
13
5.4
14 70204« Đino Thanh TÌWP
Nam 13/02/1918
80
4.7
4-2
7.4
7.0
Nam 2&w/ig88
7.4
6.7
51
65
15 702M77 Chu Quóc Vin
5TC(2)_TẾniuẾn rrúc mrv rinh
1 PEC1001: STQ3) TẽalLmh tẻ danh tn Mác - Lítco
IS T 2 0 0 5 STC(3)_Tétil4p ninh hướng dổi tưọng
3~MAT1089: STC(3)"_JẻnJ>hương pbip iQ
u l F l . F l 115 STC(4)_Tèn'Tícng Anh chuyện ũgãnh

ỉ IXTIQSỮ STCOO TÒL Toán học rời rạc
jổ~E L T l05fl STC(2)_TèrXừ Ịỷ ân Inệu si
TT
1

m sv
7020024
7o:ooaa
7020100
7020155
7020150
7020194
7020212
7Q2053Ể
7020388
7020393
7010420
7020423

j0_H.T200J
ja

3
4.9
7.2
4-S
72
63
83
7.4

7.Ổ
78
12
5.7
5.C
6.5
ố.s
5.1

é SẮTCU*
48
4.4
3
5.2
50
5.4
6.3
6.0
Ổ.2
7.4
5.7
5.4
18
2
5.4
7.8
5.6

Biim TBC
2.12

2J6
1.45
2J6
150
2.64
2.36
2.55
2.50
2.62
2-26
2.12
2.71
2.31
2.31

S ắT C IL
21
21
1S
21
21
21
21
21
21
21
21
19
21
21

21

TBCTL
2.62
2.65
2.64
2.73
2.78
2.70
2.58
2.71
2.59
2.58
2.63
2.53
2.64
2.67
2.61

Dữ liệu được thu thập dưới dạng các file excel. Bảng 1 mô tả định dạng một
file dừ liệu thu được. Mỗi file excel là một bảng thông tin về điểm của sinh viên mỗi
lớp học trong một học kỳ. Các file này sau được chuyển sang định dạng
tiện cho việc tiền xử lý.
Một số thống kê về dữ liệu:

7

.CVS

để thuận



- Tổng số khóa: từ K52 đến K58
- Tổng số sinh viên: 1264 sinh viên
Thông tin của sinh viên được lấy ra bao gồm:
-

Họ tên sinh viên

-

Mã sinh viên

-

Giới tính

-

Ngày sinh

- Môn học - Lần thứ mấy - Điểm - Học khi

nào

- Tổng số điểm tích lũy, số tín chỉ tích lũy, điểm TBC, số tín chi liệt
Thông tin của môn học gồm:
-

Tên môn học


-

Mã môn học

-

Số tín chỉ

-

Điều kiện tiên quyết (dựa vào khung chương trình)

Ví dụ như một môn học thuộc KCT 2012 có tên “Trí tuệ nhân tạo” có mã
“INT340T’ được thiết kế gồm 3 tín chi và điều kiện môn tiên quyết là môn INT2203c.âu trúc d ữ liêu và g iả i thuật

3. Chuẩn hóa dữ liệu
Mục tiêu của đề tài là xây dựng hệ phát triển thử nghiệm một mô đun tự động
gợi ý môn học, lớp môn học cho sinh viên dựa trên nhiều tiêu chí như hồ sơ sinh viên,
năng lực và khả năng tiếp thu kiến thức, sở thích và định hướng nghề nghiệp, các môn
học thường được học cùng nhau, sự kế thừa và phụ thuộc lẫn nhau giữa các môn học,
tình trạng hiện tại của sinh viên (ví dụ: đang bị cảnh báo học vụ, đang bị quá tải, đang
bị nợ môn, .V.V.), và các nhóm sinh viên có sự tương đồng về học lực, về sờ thích, và
lựa chọn nghề nghiệp. Do đó, đề tài sẽ bám sát theo khung chương trình hiện hành KCT 2012 để thực hiện. Hai khung chương trình năm 2007 và 2010 sẽ được chuẩn
hóa đưa về KCT 2012 sao cho sự thay đổi là ít nhất và không làm sai lệch nội dung
chính của KCT. Việc làm này được sự tư vấn và hỗ trợ đắc lực từ Phòng Đào tạo đơn vị trực tiếp tham gia xây dựng, quản lý và thực thi các KCT này.
Cụ thể, khi áp các KCT cũ cho KCT 2012 chúng tôi thấy một số sự không đồng
nhất và đã thực hiện việc chuẩn hóa như sau:
8





Các môn kỹ năng mềm: Không có điểm nên được bỏ qua.



Thay đổi mã môn học: Thay đổi theo KCT mới.



Thay đổi tên môn học: Ánh xạ sang môn gần nhất với KCT mới.



Thay đổi số tín chi của môn học: Thay đổi theo số tín chi của KCT mới.



Gộp môn học: Lấy điểm trung bình chung của 2 môn học làm điểm môn học
gộp chung.



Tách môn học: Lấy điểm môn đó làm điểm cho các môn tách ra từ nó.



Thêm môn học mới, bỏ môn học đã có: Bỏ đi các môn không còn phù hợp theo
KCT mới. Một số môn học bị thay đổi tên nhưng phần nội dung gần giống

nhau nên ta đồng nhất theo môn của KCT mới.
Trong quá trình chuẩn hóa, đề tài quan tâm chính đến việc chỉnh phần lệch các

môn chuyên ngành chứ không chỉnh sửa các môn về kỹ năng mềm, các môn bắt buộc
(như môn cơ s ở ,...).

4. Bộ dữ liệu tổng họp
Từ việc chuẩn hóa KCT, đề tài đã thêm một số môn học của khác khung trước
vào khung chương trình 2012. Kêt quả thu được KCT 2012 như mô tả trong Bảng 2.

Bảng 2 - Khung chương trình năm 2012 có bỗ sung thêm môn.
STT

I

1

Mã MH

Tên MH

Khối kiến thức chung(không tính các môn học từ
10 - 15)
PHI 1004

Những nguyên lý cơ bản của chủ nghĩa

Số

Môn tiên


STC

quyết

29

2

Mác - Lênin 1
2

PHI 1005

Những nguyên lý cơ bản của chủ nghĩa
3

PHI 1004

2

PHI 1005

3

POLIOOl

Mác - Lênin 2
3


POLIOOI

Tư tường Hô Chí Minh

HIS1002

Đường lôi cách mạng của Đảng Cộng sản

4
Việt Nam
5

INT1003

Tin học cơ sờ 1

2

6

INT1006

Tin học cơ sở 4

3

9

INT1003



7

FLF1105

Tiếng Anh AI

4

8

FLF1106

Tiêng Anh A2

5

FLF1105

9

FLF1107

TiCng Anh BI

5

FLF1106

10


Giáo dục thê chât

4

11

Giáo dục quôc phòng - an ninh

8

12

Kỹ năng mêm

3

II

Khôi kiên thức chung theo lĩnh vực

20

13

MAT1093

Đại sô

4


14

MAT1094

Giải tích 1

5

15

MAT1095

Giải tích 2

5

16

PHY1100

C ơ -N h iệ t

3

17

PHY1103

Điện và Quang


3

Khối

kiến

thức

chung

của

khối

MAT1094

PHY1100

ngành

III

9/12
(CN TT& Đ TVT)

18

ELT2035


Tín hiệu và hệ thông

3

MAT1095

19

INT2203

Cấu trúc dữ liệu và giải thuật

3

INT1006

Chọn ỉhciũ 1 iiúùg 2 II1ỎU i>au

3/6

â
20

MAT1101

Xác suât thông kê

3

MAT1094


21

ELT2029

Toán trong công nghệ

3

MAT1094

Khối kiến thức chung của nhóm ngành

22

b
22

INT1050

Toán học rời rạc

4

23

INT2204

Lập trình hướng đổi tượng


3

INT1006

24

INT2205

Kiên trúc máy tính

3

INT1003

25

INT2206

Nguyên lý hệ điều hành

3

INT1006

26

INT2209

Mạng máy tính


3

INT1006

27

INT2207

Cơ sở dữ liệu

3

INT1006

28

INT2208

Công nghệ phân mêm

3

INT1006

V

Khối kiến thức ngành và bổ trợ

38


v .l

C ác môn băt buộc

18

29

INT2202

3

Lập trình nâng cao

10


i

INT1006


30

INT3202

Hệ quản trị cơ sở dữ liệu

3


INT2207

31

rNT3110

Phân tích và thiết kê hướng đối tượng

3

INT2204

INT3306

Phát triên ứng dụng Web

INT2204 /
3

32

INT2207

33

INT3115

Thiêt kê giao diện người dùng

3


INT2204

34

INT3507

Các vân đê hiện đại Công nghệ thông tin

3

INT1003

V.2

Các môn bô trợ

5/20
MAT1093 /

MAT1099
35
MAT1100
36

Phương pháp tính

2

Tối ưu hóa


2

MAT1095
MAT1093 /
MAT1095

37

ELT2028

Chuyên nghiệp trong công nghệ

2

38

ELT2031

Mô hình hỏa và mô phỏng

2

Xừ lý tín hiệu số

3

MAT1093

ELT3044

39

/MAT1094

40

BSA2022

Nguyên lý Marketing

3

41

INE1150

Kinh tế vi mô 1

3

42

INE1151

Kinh tê vĩ mô 1

3

V.3


C ác môn học tự chọn theo các định hướng

43

INT3117

INT1006

15/78

Kiểm thử và đảm bảo chẩt lượng phần
3

INT2204

mềm
44

INT3105

Kiến trúc phần mềm

3

INT2204

45

INT3106


Phương pháp hình thức

3

INT1050

INT3108

Lập trình nhúng và thời gian thực

INT2205 /
3

46

INT2202

47

INT3109

Thu thập và phân tích yêu câu

3

INT2208

48

INT3111


Quản lý dự án phân mêm

3

INT2208

49

INT3206

Cơ sở dữ liệu phân tán

3

INT2207

50

INT3207

Kho dữ liệu

3

INT2207

51

INT3209


Khai phá dữ liệu

3

INT2207

11


52

INT3213

Nhập môn an toàn thông tin

3

INT3201

53

INT3216

Phân tích, đánh giá hiệu năng hệ thông

3

INT2207


54

INT3217

Lập trình hệ thông

3

INT2207

55

INT3301

Thực hành hệ điêu hành mạng

3

INT1006

56

INT3303

Mạng không dây

3

INT2209


57

INT3304

Lập trình mạng

3

INT2209

58

INT3305

Truyên thông đa phương tiện

3

INT2209

59

INT3307

An toàn và an ninh mạng

3

INT2209


60

INT3309

Phân tích và thiêt kê mạng máy tính

3

INT2209

61

INT3310

Quản trị mạng

3

INT2209

62

INT3501

Khoa học dịch vụ

3

INT1003


63

INT3505

Kiên trúc hướng dịch vụ

3

INT2204

64

INT3506

Các hệ thống thương mại điện tử

3

INT1003

65

INT3401

Trí tuệ nhân tạo

3

INT2203


66

INT3403

Đô họa máy tính

3

INT2203

67

INT3404

Xử lý ảnh

3

INT2203

68

1NT34U7

Tin sinh học

3

INT2202


VI

Khối kiến t lức thực tập và tốt nghiệp

10

69

INT3508

3

VI.l
70

Thực tập chuyên ngành

7

Khóa luận tốt nghiệp
INT4050

7

Khóa luận tôt nghiệp

7

VI.2 Các môn học tương đương
71


INT3509

INT1003

4

Dự án (băt buộc)
3 tín chi từ danh sách các môn tự chọn

72

3

theo các định hướng

Các môn trong KCT2010, 2007-2009 mà không có
VII

10

trong KCT2012 + Không hợp nhất được

73

INT2201

Lý thuyêt thông tin

3


74

INT3405

Học máy

3

75

INT3402

Chương trình dịch

3

12

INT1003

INT2203


76

INT3211

Tích họp hệ thống


3

INT2020

Phân tích và thiêt kê các hệ thông thông

77

INT2016/
3
INT2014

tin
Môi trường lập trình trực quan

INT2009

INT2005 /

78

2
INT2003

79

INT3212

Xử lý dữ liệu thông kê


3

80

INT3061

Xử lý ngôn ngữ tự nhiên

3

MAT1089

Phuơng pháp sô

INT3401
MAT1082 /

81

3
MAT1084

82

INT3221

Cơ sờ dữ liệu nâng cao
\

1


3

INT2207

»

Sau đó, đê tài tông hợp tạo ma trận sinh viên-điêm dựa trên k lung ở Hình 2
với các cách tính điểm như mô tả ở phần ừên. Kểt quả tổng hợp thu được 1264 bản
ghi tương ứng với dữ liệu mô tả kết quả học tập cùa 1264 sinh viên ngành Công nghệ
thông tin. Các thông tin gồm: Thông tin cá nhân của sinh viên, điểm môn học tương
ứng với mỗi lần học và thời gian học của sinh viên.

13


ĐẠI HỌC QUỐC GIA HÀ NỘI

BÁO CÁO 02

NGHIÊN CỨU VÀ ĐÈ XUẤT CÁC MÔ HÌNH PHƯƠNG
PHÁP PHÂN TÍCH VÀ KHAI PHÁ DỮ LIỆU ĐÀO TẠO

Thuộc đề tài
PHẦN TÍCH, PHAI KHÁ DỮ LIỆU DẠY HỌC VÀ THÔNG TIN PHẢN
HỒI CỦA SINH VIÊN NHẰM NÂNG CAO CHÁT LƯỢNG VÀ HIỆU
QUẢ QUẢN LÝ ĐÀO TẠO
Mã số QG.15.29

Thành viên thực hiện:


Trương Thị Minh Ngọc
Nguyễn Đức Linh
Trần Thị Oanh
Phan Xuân Hiếu

Hà Nội 2015


M ỤC LỤC

MỤC L Ụ C ........................................................................................................................................... 2
MỞ Đ Ầ U ..............................................................................................................................................3
1.

Những vấn đề quan trọng được đặt ra và giải quyết.......................................................4

2.

Những khía cạnh được đưa ra nghiên cứu và thu thập dữ liệu :................................... 4

3.

Những nhóm chức năng được phát triể n :........................................................................ 4

4.

Các phương pháp được đề xuất áp dụng...........................................................................6

K ÉT L U Ậ N ....................................................................................................................................... 11

PHỤ L Ụ C .......................................................................................................................................... 12

2


M Ở ĐẦU
Khảo sát đánh giá các hướng tiếp cận và nghiên cứu phân tích khai phá dữ liệu trên
bộ dữ liệu giáo dục là một trong những bước mở đầu quan trọng, cần thiết và yêu cầu bám
sát dữ liệu giáo dục thực tế. Với những hoạt động chính bao gồm:
-

Phân tích mối tương quan giữa các môn học, phương pháp giảng dạy, phương pháp
đánh giá, kết quả đạt được của sinh viên.

-

Phương pháp gợi ý tự động cho từng sinh viên các môn học.

Nội dung chính của báo cáo là trình bày những kết quả đạt được trong quá trình tiếp
cận bộ dữ liệu đào tạo, đưa ra những phương pháp áp dụng cho bộ dữ liệu đã thu thập được.
Báo cáo cũng chi rõ những nội dung chính được ưu tiên triển khai, cũng là những chức
năng chính được chỉ rõ những đầu vào đàu ra và phương pháp thực hiện, tiếp tới là những
chức năng phụ cũng được xem xét triển khai cùng với hệ thống.
Ngoài ra việc thực hiện triển khai cũng dựa ưên những phương pháp khoa học và phù
hợp bao gồm:
-

Làm việc với các chuyên gia trong lĩnh vực đào tạo

-


Thu thập những dữ liệu về chương trình học

-

Họp nhóm chuyên gia thường kỳ

-

Nghiên cứu tham khảo các công trình nghiên cứu những hệ thống đào tạo đã được
áp dụng

-

Nghiên cứu xác định rõ với hiện trạng tại đom vị đào tạo

3


1. Những vấn đề quan trọng được đặt ra và giải quyết.
-

Xác định các chức năng chính của hệ thống dựa trên phân tích và so sánh thực trạng
của sinh viên tại trường. Đưa ra được hai nhóm chức năng chính cần tập trung phân
tích và thiết kế ngay:
o Thống kê, chọn lọc và phân tích các số liệu thu thập được từ sinh viên để
đánh giá hiện trạng và mức độ phù h ợ p ...
o Chức năng gợi ý cho sinh viên những thông tin quan trọng giúp sinh viên
định hướng lộ trình học, xác định rõ mục tiêu nghề nghiệp và đưa ra các giải
pháp giúp phát huy tối đa khả năng của sinh v iê n ...


- Xây dựng mô hình phương pháp giải quyết cho các yêu cầu được xác định.
- Đưa ra những thông tin cần khảo sát đối với sinh viên và giảng viên về hiện trạng
học tập và nghiên cứu của sinh viên, xác định những nhu cầu thực tiễn cần thiết nhất
của sinh viên và giảng viên, để có thể xây dựng hệ thống tư vấn gợi ý phù hợp.
- Tận dụng những dữ liệu đào tạo có sẵn trong quá khứ, thu thập được từ trước tới
nay.

2. Những khía cạnh được đưa ra nghiên cứu và thu thập dữ liệu:
-

Xác định rõ những đối tượng và thông tin cần nghiên cứu:
o Đối tượng sinh viên: tìm hiểu những đặc điểm chung, xem xét các khía cạnh
định hướng nghề nghiệp, sở thích. Thu thập điểm tích lũy và các thành tích.
Khai thác các đặc điểm của nhóm sinh viên giỏi, khá, trung bình,
o Đối tượng giảng viên: Những nhiệm vụ và cách thức giao tiếp với sinh viên

-

Thống kê những định hướng nghề nghiệp của sinh viên và chia định hướng theo
lĩnh vực ứng dụng: lấy ví dụ với CNTT: CNTT cho ngân hàng, tài chính, giáo đ ụ c...

- Xác định rõ các chuyên ngành và chương trình đào tạo, các yêu cầu và ràng buộc
- Xác định cập nhật các lĩnh vực nghiên cứu đặc thù của chuyên ngành.

3. Những nhóm chức năng được phát triển:
-

Những chức năng chính được xác định để ưu tiên
4



C N 1.

Xác định và phân cụm nhóm sinh viên nghiên cứu cùng chuyên

ngành.
CN2.

Lên lộ trình học cho từng sinh viên, kiểm tra tiến độ theo từng kỳ

học, biểu diễn trực quan trên biểu đồ, xác định tỷ lệ hoàn thành. Xác định
tình trạng hiện tại của sinh viên đưa ra các cảnh báo.
CN3.
-

Gợi ý những môn học (theo kỳ, lộ trình, những môn liên quan).

N hững chức năng được phát triển tiếp theo:
CN4.

Gợi ý số điểm, số tín chỉ cần đạt được trong học kỳ (dựa trên tiêu chí

lựa chọn cho người dùng về định hướng nghề nghiệp, chuyên ngành đào tạo).
CN5.

Gợi ý môn học theo sở thích (dựa trên định hướng nghề nghiệp, sở

thích hoặc quan tâm từ các feedback).
CN6.


Dự đoán kết quả khả năng qua môn với tình trạng hiện tại.

CN7.

Kiểm ừ a sự phù họp của lộ trình sinh viên định hướng theo tình trạng

hiện tại, khuyển cáo và đưa ra gợi ý (có thể thay đổi chuyên ngành, định
hướng để phù hợp với sở trường và tình trạng hiện tại).
CN8.

Tạo các mẫu form báo cáo (thiết kế theo yêu cầu của các cấp lãnh đạo)

giúp nhà trường nắm bắt tình hình và có thể đưa ra các thay đổi phù hợp.
CN9.

Tạo dựng mẫu để khảo sát, thu thập ý kiến của sinh viên ngay trên hệ

thống. Thu thập các phản hồi về hiện trạng của sinh viên để có thể đưa ra tư
vấn hỗ trợ.
CN10.

Cập nhật và gợi ý các định hướng nghề nghiệp cho đối tượng sinh

viên chưa có lộ trình hay định hướng (theo những nguồn thị trường lao động).
CN11.

Gợi ý cho sinh viên những hướng nghiên cứu khóa luận/luận văn,

nghiên cứu khoa học và các thày hướng dẫn theo hướng nghiên cứu đó.

CN12.

Cập nhật liên tục tình trạng hiện tại của sinh viên về sửc khỏe, khóa

học ngoài hay các cảnh c áo ...
CN13.

Xây dựng CSDL theo những dữ liệu thu thập được, tích hợp vào hệ

thống CSDL chung về người học đã có.

5


Những nội dung nghiệp vụ đã thực hiện bao gồm xác định các vấn đề quan trọng cần
đạt được khi xây dựng hệ thống, tiếp tới là xác định cách thức giải quyết và tiến hành thực
hiện.

4. Các phưong pháp được đề xuất áp dụng
Báo cáo sẽ nêu lại những nội dung, lý do mục đích của chức năng, đưa ra những ph ân
tích và cách thức giải quyết, từ đó xác định được những đầu vào và đầu ra của từng m ô
đun.
Với chức năng 1 - C N 1X á c định và phân cụm nhóm sinh viên nghiên cứu cùng chuyên
ngành. Mục đích để tìm hiểu những tương quan giữa những cụm sinh viên này về m ôn học,
cùng hướng nghiên cứu. Từ đó cũng tập trung phân tích đối với đối tượng sinh viên giỏi
và trung bình, phục vụ cho việc tư vấn gợi ý môn học cho sinh viên. D ựa trên việc khảo
sát nhóm sinh viên đã có điểm, những sinh viên đã hoàn thành chương trình học, sử dụng
phướng pháp khai phá là phân cụm (Clustering) và lọc cộng tác (Collaborative Filtering),
đầu ra sẽ là những nhóm sinh viên giống nhau về chuyên ngành, hướng nghiên cứu. X em
xét một sổ giả thiết những nhóm sinh viên này khá tương đồng về sở trường, sở đoản,

những môn học và các cách tiếp cận nghiên cứu và chọn m ôn học.
CN2. Lên lộ trình học cho từng sinh viên, kiểm tra tiến độ theo từng kỳ học, biểu diên trực
quan trên biểu đồ, xác định tỷ lệ hoàn thành. Xác định tình trạng hiện tại của sinh viên
đưa ra các cảnh báo. Đây là m ột cụm chức năng hỗ trợ theo sát lộ trình học của từng sinh
viên, mục đích chính là giúp sinh viên hiểu rõ được những kế hoạch học tập của m ình qua
việc theo dõi sát tiến trình, những thống kê, biểu đồ thể hiện lộ trình kế hoạch và thực tế,
giúp sinh viên điều chinh và định hướng rõ ràng, giảm thiểu rủi ro. Từ những mục đích và
yêu cầu trên, chức năng này được thiết kế tạo ra những biểu đồ và các công thức tính toán.
B iểu đồ bao gồm: thứ nhất là biểu đồ lộ trình lý tường được thiết kế dựa trên mục tiêu định
hướng ban đầu của sinh viên và được tham khảo ý kiến chuyên gia, các giảng viên và
những đối tượng sinh viên xuất sắc giỏi... thứ hai là biểu đồ đường đi hiện trạng dựa trên
những điểm tích lũy đến thời điểm hiện tại cùa sinh viên. Ngoài ra những lộ trình được
thiết kế phụ thuộc vào ràng buộc là khung chương trình chuẩn, các điều kiện môn tiên
6


quyết, số tín chỉ yêu cầu đạt được...Với đầu vào là những điểm tích lũy của từng sinh viên;
định hirớng nghề nghiệp và nghiên cứu theo nguyện vọng của sinh viên; hoặc là gợi ý
chuyên ngành cho sinh viên. Đầu ra là các biểu đồ mô tả, những báo cáo so sánh, một số
trạng thái cảnh báo: cảnh báo học vụ, cảnh báo về tình trạng có thể lệch lộ tìn h ...
CN3. Gợi ỷ những môn học (theo kỳ, lộ ưình, những môn liên quan): Xác định những
môn học tương quan dựa theo kỳ học, lộ trình của sinh viên, những ràng buộc môn học.
Chức năng này khai thác chủ yếu những thông tin được cung cấp bời sinh viên và ban đào
tạo từ mô đun thu thập dữ liệu sinh viên. Dựa vào thông tin về sở thích cá nhân, lĩnh vực
nghiên cứu, định hướng nghề nghiệp, tình trạng hiện tại của sinh viên; đưa ra được những
môn học theo kỳ, theo lộ trình. Phương pháp và kỹ thuật được sử dụng là sử dụng lọc cộng
tác chọn nhóm sinh viên giống nhau về sở thích và định hướng, có cùng những môn học
và cùng đạt điểm số tương đồng, lựa chọn ra nhóm sinh viên giỏi và tạo lộ trình gợi ý theo
nhóm sinh viên này. Ngoài ra tham khảo thêm các kiến thức chuyên gia, những giảng viên
của chuyên ngành và sổ tay học vụ để xác định thêm tương quan chắc chắn giữa các môn

học.
CN4. Gợi ỷ số điểm, so tín chi cần đạt được trong học kỳ (dựa trên tiêu chí lựa chọn cho
người dùng về định hướng nghề nghiệp, chuyên ngành đào tạo). Chức năng này được xác
định là chức năng phụ sẽ được xây dựng kèm với chức năng 2 và 3. Những ràng buộc được
xác định là phải đạt được tối đa và tối thiểu bao nhiêu tín chỉ trong một học kỳ chính, và
phụ. Cách thức xác định là sau khi xây dựng được lộ trình học, sẽ xây dựng cận trên và cận
dưới dựa trên những đầu vào lànhững tiêu chí được đặt ra lúc đầu (có hoặc không) của sinh
viên hoặc nhà trường. Đầu ra là đưa ra khuyến nghị số tín chỉ phù hợp nhất, không quá tải
với sinh viên, phù hợp với năng lực hiện tại.
CN5. Gợi ý môn học theo sở thích (dựa trên định hướng nghề nghiệp, sở thích hoặc quan
tâm từ các feedback). Đây là chức năng được quan tâm phát triển, tuy nhiên khi ưiển khai
cần tiến hành xác định rõ những loại thông tin và dữ liệu nào có thể thu thập. Dữ liệu đầu
vào thu thập được hiện tại bao gồm những danh sách các môn tự chọn, các ràng buộc môn,
các trạng thái môn đã học của sinh viên, sở thích của sinh viên. Gợi ý môn học cũng tham
7


gia góp phần vào khâu xây dựng lộ trình học cho sinh viên, chủ yếu đối với nhóm môn học
tự chọn và bổ trợ. Chức năng này còn đang được tiếp tục xem xét và bổ sung thêm những
trường dữ liệu có thể thu thập được từ dữ liệu phản hồi. Phương pháp chính được đề xuất
là sử dụng luật kết hợp và dựa trên nội dung môn học, xác định những môn học phù hợp
cho từng sinh viên.
CN6. D ự đoán kết quả khả năng qua môn với tình trạng hiện tại. Kèm theo với chức năng
5, đây là chức năng đưa ra giải thích cho gợi ý các môn học và lộ trình, ngoài ra cũng sử
dụng như là một báo cáo để xác định tình trạng hiện tại của từng sinh viên, đều được thiết
kế và biểu diễn trực quan trên biểu đồ môn học được xây dựng ờ chức năng 2. K ỹ thuật sừ
dụng là luật kết họp xác định các ràng buộc của các môn, sử dụng lọc cộng tác khai phá ra
những nhóm học tương đương (chínhlà đầu ra của chức năng thứ nhất) để dự đoán kết quả
của sinh viên nào đó.
CN7. Kiểm tra sự phù hợp của lộ trình sinh viên định hướng theo tình trạng hiện tại,

khuyến cáo và đưa ra gợi ý (có thể thay đổi chuyên ngành, định hướng để phù hợp với sở
trường và tình trạng hiện tại). Đây là chức năng phụ đi sau chức năng 2, đưa ra các thông
báo mức độ phù hợp với lộ trình đã thiết lập trước dựa vào hiện trạng của sinh viên, điểm
tích lũy và một số phản hồi.
CN8. Tạo các mẫu báo cáo (thiết kế theo yêu cầu của các cấp lãnh đạo) giúp nhà trường
nắm bắt tình hình và có thể đưa ra các thay đổi phù hợp. Với thực trạng có những môn học
không đủ sinh viên đăng ký trong nhiều kỳ, sinh viên điểm thấp chiếm đa s ố ... hay những
môn học mới cần có thêm trong khung chương trình dựa theo nguyện vọng sờ thích nghề
nghiệp của sinh viên ... Do đó từ những dữ liệu như kết quả học tập của sinh viên, bộ môn,
khóa h ọ c...và những phản hồi, ý kiến của cá nhân thu được thông qua các cuộc khảo sát
và mạng xã h ộ i... nhằm vào khai phá trích xuất ra các thông tin báo cáo.
CN9. Tạo dựng mẫu đ ể khảo sát, thu thập ỷ kiến của sinh viên ngay trên hệ thống. Thu
thập các phản hồi về hiện trạng của sinh viên để có thể đưa ra tư vấn hỗ trợ. Đây là một
khâu quan trọng bao gồm triển khai thiết kế các mẫu bảng hỏi, nhằm luôn nắm bắt cập nhật
8


được các thông tin quan trọng nhất của sinh viên, đưa ra những gợi ý hay điều chỉnh kịp
thời. Những bước thực hiện được đề cập đến là lên danh sách những thông tin có thể khai
thác được trực tiếp từ sinh viên; khuyến khích sinh viên luôn có những phản hồi nhanh
chóng qua thông tin từ mạng xã hội; tham khảo ý kiến chuyên gia, giảng viên và những
cuộc khảo sát sinh viên trước đó. Những mẫu khảo sát này sẽ được thiết kế và tích hợp vào
hệ thống chung, giúp giảm thiểu những cuộc khảo sát qua giấy.
CN10. Cập nhật và gợi ỷ các định hướng nghề nghiệp cho đổi tượng sinh viên chưa cỏ lộ
trình hay định hướngVới những sinh viên chưa tìm được nguyện vọng hoặc nguyện vọng
không phù hợp tình trạng học hiện tại, hay có những hướng phù hợp hơn, ... tất cả được
tính độ phù hợp và đưa ra gợi ý về hướng nghề nghiệp, hay hướng nghiên cứu. Có thể kết
hợp với những chương trình liên kết giữa các doanh nghiệp (theo những nguồn thị trường
lao động) kết hợp đào tạo sẽ xác định mức độ phù hợp với sinh viên dựa vào những kết
quả hiện tại, hay nguyện vọng hiện tại của sinh viên. Đầu vào cần có là những thông tin cơ

bản của sinh viên, những đặc điểm của sinh viên thu thập được từ những cuộc khảo sát
trước đó, thu thập được từ dữ liệu điểm tích lũy môn học, từ những mạng xã hội (n lu có);
tiép theo là danh sách nghề nghiệp/hướng chuyên môn khảo sát thu thập được từ thị trường
lao động. Đầu ra được xác định là độ phù hợp của sinh viên đó với những ngành nghề này.
Đây là một chức năng cần quan tâm đến vấn đề cập nhật thường xuyên dữ liệu, do đỏ sẽ
được thiết kế để có thể thích nghi với những thay đổi có thể có trong tương lai.
C N 11. Gợi ý cho sinh viên những hướng nghiên cứu khóa luậrưluận văn, nghiên cứu khoa
học và các thầy hướng dẫn theo hướng nghiên cứu đó. Chức năng này có mục đích chính
là kết nối giữa sinh viên và giảng viên hướng dẫn, thông qua những thông tin về sở thích
hay nguyện vọng môn học yêu thích, ngành học yêu thích, đang quan tâm, những môn học
có khả năng, hay sở trường riêng biệt của từng sinh viên; những thông tin về đề tài hướng
nghiên cứu của giảng viên. Đây cũng là một chức năng càn được cập nhật dữ liệu liên tục
đưa ra gợi ý cho đối tượng sinh viên những giảng viên hướng dẫn phù hợp và gợi ý cho
đối tượng giảng viên những sinh viên đạt yêu cầu trong trường hợp các giảng viên tìm kiếm
sinh viên tham gia các đề tài nghiên cứu khoa học.
9


CN12. Cập nhật liên tục tình trạng hiện tại của sinh viên về sức khỏe, khóa học ngoài hay
các cảnh cáo .. .Chức năng này được xây dựng để cập nhật các thông tin cơ bản của sinh
viên thu được từ các nguồn kể trên bao gồm: nguồn dữ liệu đào tạo, dữ liệu phản hồi, và
mạng xã hội. Căn cứ vào đó đưa ra những thông báo cảnh báo có thể có cho sinh viên và
cho phòng đào tạo nhà trường.
CN13.Jfóy dựng CSDL theo những dữ liệu thu thập được, tích hợp vào hệ thong CSDL
chung về người học đã có. Tích hợp với hệ thống chung của nhà trường là rất quan trọng,
đây là chức năng cần có sự tham gia của bộ phận phụ trách chuyên trách, sẽ được bàn đến
và giải quyết trong pha tiếp theo.

10



×