ĐẠI HQC QUỐC GIA HÀ NỘI
PHỤ LỤC 2
CÁC BÁO CÁO CHUYÊN ĐỀ
Tên đề tài:
Phân tích, khai phá dũ liệu dạy học và thông tiu
phàn hõt của sinh viẽtt nhằm nâng cao chất Ệrợng
và hiệu qua quản ìỷ dào tạo
Mã số:
QG.15.29
Chủ nhiệm:
PGS.TS. Phan Xuân Riêu
Hà Nội, 02/2018
1
MỤC LỤC
TH Ứ T ự CÁC BÁ O CÁO C H U Y Ê N ĐÈ
— C ác b á o cả o đ ư ợ c n g ă n c á c h b ở i tr a n g b ìa c ứ n g —
TT
T ên b áo cáo
1 Thu thập và tiền xử lý dữ liệu đào tạo
2 Nghiên cửu và đề xuất các mô hình phương pháp phân tích khai phá dữ liệu đào tạo
3 Thực trạng quản lý hoạt động đào tạo ở Đại học Quốc gia Hà N ội
4 Tổng hợp thông tin phản hồi của sinh viên
5 Tổng hợp thông tin phản hồi của cán bộ
6 Khung tư vấn m ôn học và xử lý đa ràng buộc
7 X ây dựng mô hình dự đoán điểm cho sinh viên
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
BÁO CÁO 01
THƯ THẬP
VÀ TIÈN x ử LÝ DỮ LIỆU
ĐÀO TẠO
•
•
•
Thuộc đề tài
PHÂN TÍCH, PHAI KHÁ DỮ LIỆU DẠY HỌC VÀ THÔNG TIN PHẢN
HÒI CỦA SINH VIÊN NHẰM NÂNG CAO CHÁT LƯỢNG VÀ HIỆU
QUẢ QUẢN LÝ ĐÀO TẠO
Mã số QG.15.29
Thành viên thực hiện: Trần Thị Oanh
Phan Xuân Hiếu
Trương Thị Minh Ngọc
ữAÍ học q u ố c g ĨÃ hà nội
TRUNG TÂM THÒNG ĨÌN THƯ VIỆ N
0006000050/1
Hà Nội 2015
MỤC LỤC
THU THẬP VÀ TIỀN x ử LÝ DỮ LIỆU ĐÀO T Ạ O ................................... ....................3
1. Khảo sát thực trạng quản lý đào tạo............................................................................. 3
a)
Khung
chương trình năm 2007......................................................................... 3
b)
Khung
chương trình năm 2010......................................................................... 5
c)
Khung
chương trình năm 2012......................................................................... 6
2. Thu thập dữ liệu ...............................................................................................................7
3. Chuẩn hóa dữ liệ u ...................................................................................................... . 8
4. Bộ dữ liệu tổng hợp......................................................................................................... 9
1
THU THẬP VÀ TIÈN x ử LÝ DỮ LIỆU ĐÀO TẠO
Báo cáo này trình bày về việc thu thập và tiền xử lý dữ liệu đào tạo phục vụ
cho các nhiệm vụ phân tích và khai phá tiếp theo.Trong báo cáo này, chúng tôi tập
trung vào các dữ liệu ghi lại các hoạt động dạy-học ở các đơn vị đào tạo như các môn
học (course), sinh viên, đánh giá cuối kỳ của môn học... Đây là dữ liệu có cấu trúc
được truy xuất từ cơ sở dữ liệu đào tạo tại các đơn vị. Dữ liệu thu thập được sẽ được
làm sạch, chuẩn hóa, tích hợp để thuận tiện cho việc khai phá tìm ra cái nhìn mới mẻ
và trích rút tri thức có giá trị phục vụ cho việc nâng cao hoạt động dạy-học và hiệu
quả quản lý đào tạo trong nhà trường.
Báo cáo bao gồm 4 phần chính. Phần 1 mô tả thực trạng quản lý đào tạo trong
một đơn vị của ĐHQG làm cơ sờ cho việc thu thập dữ liệu đào tạo. Phần 2 mô tả quá
trình thu thập dữ liệu. Phần 3 trình bày các bước chuẩn hóa dữ liệu thành bộ dữ liệu
tổng họp - được chi tiết hóa trong Phần 4 của báo cáo.
1. Khảo sát thực trạng quản lý đào tạo
Đe tài đã tiến hành thu thập dữ liệu đào tạo của Khoa Công nghệ Thông tin - Đại
học Quốc gia Hà Nội (Hệ chuẩn đào tạo chính quy). Dữ liệu thu thập được từ học kỳ I
năm học 2007-2008 tới hết học kỳ II năm học 2013-2014. Theo đó, các khóa đào tạo
theo tín chi của Khoa được thực hiện dựa trên 3 khung chương trình (KCT) chính:
•
KCT CNTT 2007: Áp dụng cho sinh viên các khóa K54 trở về trước.
•
KCT CNTT 2010: Áp dụng cho sinh viên của khóa K55 và K56.
•
KCT CNTT 2012: Áp dụng cho sinh viên thuộc các khóa K57 trở đi.
Các KCT này được thiết kế cho 4 năm học tập trung. Phần tiếp theo, báo cáo trình
bày tóm tắt 3 khung chương trình làm cơ sở để chuẩn hóa và tổng hợp dữ liệu đào tạo:
a) K hung chương trình năm 2007
Sinh viên ngành Công nghệ thông tin được trang bị các kiến thức cơ bản và
chuyên sâu về Công nghệ thông tin, cũng như được định hướng một số vấn đề hiện
đại tiệm cận với kiến thức chung về Công nghệ thông tin của thế giới.
Sinh viên ngành Công nghệ thông tin được đào tạo kỹ năng thực hành cao trong
hầu hết các lĩnh vực của Công nghệ thông tin, cho phép sinh viên tốt nghiệp dễ dàng
hòa nhập và phát triển trong môi trường làm việc mới. Ngoài ra, sinh viên ngành Công
nghệ thông tin cũng được trang bị kỹ năng tự học tập, nghiên cứu, làm việc theo nhóm
và kỹ năng giao tiếp.
Ngoài các mục tiêu chung, sinh viên được đào tạo với các mục tiêu bô sung cho môi
chuyên ngành:
Chuyên ngành Các hệ thống thông tin
Nắm vững kiến thức cơ bản và chuyên sâu về Hệ thống thông tin, đáp ứng các yêu cầu
về nghiên cứu phát triển và ứng dụng Công nghệ thông tin của xã hội. Xây dựng được
các hệ thống thông tin cho việc quản lý kinh tế, hành chính và dịch vụ.
Chuyên ngành Công nghệ phần mềm
Nắm vững kiến thức cơ bản và chuyên sâu về Công nghệ phần mềm: quy trình xây
dựng, quản lý và bảo trì hệ thống phần mềm; phân tích, thiết kế và quản lý các dự án
phần mềm. Tổ chức thục hiện và quản lý được các công việc trong lĩnh vực công nghệ
phần mềm, có khả năng xây dựng mô hình và áp dụng các nguyên tắc của công nghệ
phần mềm vào thực tế.
Chuyên ngành Khoa học máy tính
Nắm vững kiến thức cơ bản và chuyên môn sâu về Khoa học máy tính. Đáp ứng các
vấn đề về Dhân tích, thiết kế thuật toán, xây dựng giải nháp đặt nền tàng đe giải quyết
các bài toán ứng dụng trong thực tế. Thực hiện được việc nghiên cứu, phát triển và
ứng dụng Công nghệ thông tin trong khoa học và xã hội.
Chuyên ngành Mạng và truyền thông máy tính
Nắm vững kiến thức cơ bản và chuyên sâu về Mạng và truyền thông máy tính, đáp
ứng yêu cẩu về nghiên cứu, ứng dụng trong lĩnh vực mạng và truyền thông máy tính.
Có khả năng thiết kế, chế tạo, bảo trì, sản xuất, thử nghiệm, quản lý các hệ thống
mạng và truyền thông máy tính.
Tổng số tín chỉ phải tích lũy:
132 tín chỉ, trong đó:
- Khối kiến thức chung:
33 tín chì
{Không tỉnh các môn học GDTC và GDQP-AN)
- Khối kiến thức xã hội và nhân văn:
4 tín chi
- Khối kiến thức cơ bản của nhóm ngành:
35 tín chi
- Khối kiến thức cơ sở của ngành:
42 tín chi
- Khối kiến thức chuyên ngành:
11 tín chi
4
+ Bắt buộc:
5 tín chỉ
+ Tự chọn:
6 tín chỉ
- Khóa luận tốt nghiệp hoặc tương đương:
07 tín chi
b) K hung chương trình năm 2010
Sinh viên tốt nghiệp ngành Công nghệ thông tin được trang bị các kiến thức cơ
bản và chuyên sâu về Công nghệ thông tin, cũng như đuợc định hướng một số vấn đề
hiện đại tiệm cận với kiến thức chung về Công nghệ thông tin của thế giới.
Sinh viên tốt nghiệp ngành Công nghệ thông tin được đào tạo kỹ năng thực hành
cao trong hầu hết các lĩnh vực cùa Công nghệ thông tin, cho phép sinh viên tốt nghiệp
dễ dàng hòa nhập và phát triển trong môi trường làm việc mới. Ngoài ra, sinh viên
ngành Công nghệ thông tin cũng được trang bị kỹ năng tự học tập, nghiên cứu, làm
việc theo nhóm vả kỹ năng giao tiếp.
Ngoài các mục tiêu chung, sinh viên được đào tạo vói các mục tiêu bô sung cho
moi chuyên ngành:
Chuyên ngành Công nghệ phần mềm
Nắm vững kiến thức cơ bản và chuyên sâu về Công nghệ phần mềm: quy trình
xây dựng, quản lý và bảo trì hệ thống phần mềm; phân tích, thiết kế và quản lý các dự
án phần mềm.Tổ chức thực hiện và quản lý được các công việc trong lĩnh vực công
nghệ phần mềm, có khả năng xây dựng mô hình và áp dụng các nguyên tắc của công
nghệ phần mềm vào thực tế.
C huyên ngành Hệ thống thông tín
Nắm vững kiến thức cơ bản và chuyên sâu về Hệ thống thông tin, đáp ứng các
yêu cầu về nghiên cứu phát triển và ứng dụng công nghệ thông tin của xã hội. Xây
dựng được các hệ thống thông tin cho việc quản lý kinh tế, hành chính và dịch vụ.
C huyên ngành M ạng và truyền thông máy tính
Nắm vững kiến thức cơ bản và chuyên sâu về Mạng và truyền thông máy tính,
đáp ứng yêu cầu về nghiên cứu, ứng dụng trong lĩnh vực mạng và truyền thông máy
tính.Có khả năng thiết kế, chế tạo, bảo trì, sản xuất, thử nghiệm, quản lý các hệ thống
mạng và truyền thông máy tính.
C huyên ngành Khoa học dịch vụ / Dịch vụ Công nghệ thông tin
5
Nắm vững kiến thức cơ bản và chuyên sâu về nghiên cứu và triển khai các Dịch
vụ Côngnghệ thông tin, đáp ứngcác vấn đề về phân tích, xây dựng giải
pháp nền tảng
cho các dịch vụ Công nghệ thông tin và dịch vụ dựa trênCông nghệthông tin trong
thực tế. Tổ chức thực hiện và quản lý được các công việc trong lĩnh vực Dịch vụ Công
nghệ thông tin, có khả năng xây dựng mô hình và áp dụng các nguyên tắc của Dịch vụ
Công nghệ thông tin vào thực tế.
Tồng so tín chỉ phải tích lũy'.
136 tín chỉ, trong đó:
- Khối kiến thức chung
29 tín chi
(Không tính các môn GDTC vò GDQP-AN)
- Khối kiến thức khoa học xã hội và nhân văn
04 tín chỉ
- Khối kiến thức cơ bản của nhóm ngành
35 tín chi
- Khối kiến thức cơ sở của ngành
43 tín chi
- Khối kiến thức chuyên ngành
18 tín chi
+ Bắt buộc
06 tín chỉ
+ Tự chọn
12 tín chỉ
- Khóa luân
- tot nehiện
w • i Ạioăc
\
■ các môn thay
J thể)/
7 tín chỉ
c) Khung chương trình năm 2012
v ề kiến thức, KCT này nhằm trang bị cho sinh viên các kiến thức:
-
Kiến thức trong ĐHQG Hà Nội bao gồm kiến thức về lý luận chính trị, tin
học và ngoại ngữ.
-
Kiến thức chung theo lĩnh vực
-
Kiến thức chung của khối ngành
-
Kiến thức chung của nhóm ngành
-
Kiến thức của ngành và bổ trợ
-
Kiến thức thực tập và tốt nghiệp
v ề kỹ năng, KCT trang bị các kỹ năng cứng và kỹ năng mềm. Kỹ năng cứng gồm
các kỹ năng nghề nghiệp, kỹ năng lập luận tư duy và giải quyết vấn đề, kỹ năng
nghiên cứu và khám phá kiến thức, ... Các kỹ năng mềm gồm năng lực cánhân, làm
việc nhóm, kỹ năng lãnh đạo, giao tiếp, ...Đ ây là tóm tắt yêu
đào tạo:
6
cầu của chương trình
Tổng số tín chỉ phải tích lũy
128 tín chỉ, trong đó:
29 tín chi
• Khối kiến thức chung:
(Không tính các món từ 10-12)
• Khối kiến thức chung theo lĩnh vực:
20 tín chi
• Khối kiến thức chung cùa khối ngành (CNTT, ĐTVT):
9 tín chi
• Khối kiến thức chung của nhóm ngành:
22 tín chi
• Khối kiến thức ngành và bổ trợ:
38 tín chi
•
+ Bắt buộc
18 tín chỉ
+ Bổ trợ
5 tín chi
+ Tự chọn
15 tín chỉ
Khối kiến thức thực tập và tốt nghiệp:
10 tín chi
2. Thu thập dữ liệu
Được sự hỗ trợ của phòng Đào tạo trường Đại học Công nghệ, đề tài đã trích
xuất dữ liệu dưới dạng các file excel có định dạng như trong Hình 1. Dữ liệu thu thập
được từ học kỳ I năm học 2007-2008 tới hết học kỳ II năm học 2013-2014.
Bảng 1 - Dữ liệu điểm - môn học của sinh viên lớp QH-2007-I/CQ-C-A, học kỳ 2
năm học 2008-2009.
BĂNGĐltAILỚPQB-2007-I/CQ-C-A
HỌCri' ĩ. NẢMHOCaaonÒM
CT
Ho tia
N| ìt linh
0
1
3
4
2
Vú Tuân Anh
Nam 06/01-1989
80
6.4
6.7
7.4
5.5
Nam 30-07/1588
Trtn Nịọc Đá
5í
7,4
5.Ố
52
1.0
Tria Níuvèn Đinh
Xam 30/01/1991
5.1
3
6.8
6.1
4.5
3.8
80
Trần Đai Hiệp
Nam 20/09'1988
5J
5J
7.8
5.6
4
Ptậm Trunj£ Hĩéo
Nam 06*10/19»
5.1
7.1
s.ỗ
í .í
5
s.o
Neuvỉn Thỉng Huv Nam 27/10^1988
6.1
7.0
6
tf.l
7.5
tf.t
Dỏ Vin Chann
1
7.8
7.0
Nam 27/12^1988
4.0
6.8
5.2
Bach Nsoc Minh
Nam 25/12/1980
6.8
70
6.1
7.7
5.6
8
Nsuvỉo Trung Tho Nam OMI7/I989
12
1.5
tf 0
5.1
6.1
9
Đmh Thi Thu
7.0
6.1
10
Xừ
11/11/1989
6.1
7J
Đina Mmh Tôãn
Nua 2&'11/]9M
8.0
51
69
6.5
6.7
11
Nam 01/11/1989
6.3
12
Neuvỉa Taấn Toin
69
7.0
5.4
7.3
Dịu
Ọuỏc
Toãa
Nam
<W>08'lS8g
7.4
65
7.8
8.0
6.9
13
5.4
14 70204« Đino Thanh TÌWP
Nam 13/02/1918
80
4.7
4-2
7.4
7.0
Nam 2&w/ig88
7.4
6.7
51
65
15 702M77 Chu Quóc Vin
5TC(2)_TẾniuẾn rrúc mrv rinh
1 PEC1001: STQ3) TẽalLmh tẻ danh tn Mác - Lítco
IS T 2 0 0 5 STC(3)_Tétil4p ninh hướng dổi tưọng
3~MAT1089: STC(3)"_JẻnJ>hương pbip iQ
u l F l . F l 115 STC(4)_Tèn'Tícng Anh chuyện ũgãnh
ỉ IXTIQSỮ STCOO TÒL Toán học rời rạc
jổ~E L T l05fl STC(2)_TèrXừ Ịỷ ân Inệu si
TT
1
m sv
7020024
7o:ooaa
7020100
7020155
7020150
7020194
7020212
7Q2053Ể
7020388
7020393
7010420
7020423
j0_H.T200J
ja
3
4.9
7.2
4-S
72
63
83
7.4
7.Ổ
78
12
5.7
5.C
6.5
ố.s
5.1
é SẮTCU*
48
4.4
3
5.2
50
5.4
6.3
6.0
Ổ.2
7.4
5.7
5.4
18
2
5.4
7.8
5.6
Biim TBC
2.12
2J6
1.45
2J6
150
2.64
2.36
2.55
2.50
2.62
2-26
2.12
2.71
2.31
2.31
S ắT C IL
21
21
1S
21
21
21
21
21
21
21
21
19
21
21
21
TBCTL
2.62
2.65
2.64
2.73
2.78
2.70
2.58
2.71
2.59
2.58
2.63
2.53
2.64
2.67
2.61
Dữ liệu được thu thập dưới dạng các file excel. Bảng 1 mô tả định dạng một
file dừ liệu thu được. Mỗi file excel là một bảng thông tin về điểm của sinh viên mỗi
lớp học trong một học kỳ. Các file này sau được chuyển sang định dạng
tiện cho việc tiền xử lý.
Một số thống kê về dữ liệu:
7
.CVS
để thuận
- Tổng số khóa: từ K52 đến K58
- Tổng số sinh viên: 1264 sinh viên
Thông tin của sinh viên được lấy ra bao gồm:
-
Họ tên sinh viên
-
Mã sinh viên
-
Giới tính
-
Ngày sinh
- Môn học - Lần thứ mấy - Điểm - Học khi
nào
- Tổng số điểm tích lũy, số tín chỉ tích lũy, điểm TBC, số tín chi liệt
Thông tin của môn học gồm:
-
Tên môn học
-
Mã môn học
-
Số tín chỉ
-
Điều kiện tiên quyết (dựa vào khung chương trình)
Ví dụ như một môn học thuộc KCT 2012 có tên “Trí tuệ nhân tạo” có mã
“INT340T’ được thiết kế gồm 3 tín chi và điều kiện môn tiên quyết là môn INT2203c.âu trúc d ữ liêu và g iả i thuật
3. Chuẩn hóa dữ liệu
Mục tiêu của đề tài là xây dựng hệ phát triển thử nghiệm một mô đun tự động
gợi ý môn học, lớp môn học cho sinh viên dựa trên nhiều tiêu chí như hồ sơ sinh viên,
năng lực và khả năng tiếp thu kiến thức, sở thích và định hướng nghề nghiệp, các môn
học thường được học cùng nhau, sự kế thừa và phụ thuộc lẫn nhau giữa các môn học,
tình trạng hiện tại của sinh viên (ví dụ: đang bị cảnh báo học vụ, đang bị quá tải, đang
bị nợ môn, .V.V.), và các nhóm sinh viên có sự tương đồng về học lực, về sờ thích, và
lựa chọn nghề nghiệp. Do đó, đề tài sẽ bám sát theo khung chương trình hiện hành KCT 2012 để thực hiện. Hai khung chương trình năm 2007 và 2010 sẽ được chuẩn
hóa đưa về KCT 2012 sao cho sự thay đổi là ít nhất và không làm sai lệch nội dung
chính của KCT. Việc làm này được sự tư vấn và hỗ trợ đắc lực từ Phòng Đào tạo đơn vị trực tiếp tham gia xây dựng, quản lý và thực thi các KCT này.
Cụ thể, khi áp các KCT cũ cho KCT 2012 chúng tôi thấy một số sự không đồng
nhất và đã thực hiện việc chuẩn hóa như sau:
8
•
Các môn kỹ năng mềm: Không có điểm nên được bỏ qua.
•
Thay đổi mã môn học: Thay đổi theo KCT mới.
•
Thay đổi tên môn học: Ánh xạ sang môn gần nhất với KCT mới.
•
Thay đổi số tín chi của môn học: Thay đổi theo số tín chi của KCT mới.
•
Gộp môn học: Lấy điểm trung bình chung của 2 môn học làm điểm môn học
gộp chung.
•
Tách môn học: Lấy điểm môn đó làm điểm cho các môn tách ra từ nó.
•
Thêm môn học mới, bỏ môn học đã có: Bỏ đi các môn không còn phù hợp theo
KCT mới. Một số môn học bị thay đổi tên nhưng phần nội dung gần giống
nhau nên ta đồng nhất theo môn của KCT mới.
Trong quá trình chuẩn hóa, đề tài quan tâm chính đến việc chỉnh phần lệch các
môn chuyên ngành chứ không chỉnh sửa các môn về kỹ năng mềm, các môn bắt buộc
(như môn cơ s ở ,...).
4. Bộ dữ liệu tổng họp
Từ việc chuẩn hóa KCT, đề tài đã thêm một số môn học của khác khung trước
vào khung chương trình 2012. Kêt quả thu được KCT 2012 như mô tả trong Bảng 2.
Bảng 2 - Khung chương trình năm 2012 có bỗ sung thêm môn.
STT
I
1
Mã MH
Tên MH
Khối kiến thức chung(không tính các môn học từ
10 - 15)
PHI 1004
Những nguyên lý cơ bản của chủ nghĩa
Số
Môn tiên
STC
quyết
29
2
Mác - Lênin 1
2
PHI 1005
Những nguyên lý cơ bản của chủ nghĩa
3
PHI 1004
2
PHI 1005
3
POLIOOl
Mác - Lênin 2
3
POLIOOI
Tư tường Hô Chí Minh
HIS1002
Đường lôi cách mạng của Đảng Cộng sản
4
Việt Nam
5
INT1003
Tin học cơ sờ 1
2
6
INT1006
Tin học cơ sở 4
3
9
INT1003
7
FLF1105
Tiếng Anh AI
4
8
FLF1106
Tiêng Anh A2
5
FLF1105
9
FLF1107
TiCng Anh BI
5
FLF1106
10
Giáo dục thê chât
4
11
Giáo dục quôc phòng - an ninh
8
12
Kỹ năng mêm
3
II
Khôi kiên thức chung theo lĩnh vực
20
13
MAT1093
Đại sô
4
14
MAT1094
Giải tích 1
5
15
MAT1095
Giải tích 2
5
16
PHY1100
C ơ -N h iệ t
3
17
PHY1103
Điện và Quang
3
Khối
kiến
thức
chung
của
khối
MAT1094
PHY1100
ngành
III
9/12
(CN TT& Đ TVT)
18
ELT2035
Tín hiệu và hệ thông
3
MAT1095
19
INT2203
Cấu trúc dữ liệu và giải thuật
3
INT1006
Chọn ỉhciũ 1 iiúùg 2 II1ỎU i>au
3/6
â
20
MAT1101
Xác suât thông kê
3
MAT1094
21
ELT2029
Toán trong công nghệ
3
MAT1094
Khối kiến thức chung của nhóm ngành
22
b
22
INT1050
Toán học rời rạc
4
23
INT2204
Lập trình hướng đổi tượng
3
INT1006
24
INT2205
Kiên trúc máy tính
3
INT1003
25
INT2206
Nguyên lý hệ điều hành
3
INT1006
26
INT2209
Mạng máy tính
3
INT1006
27
INT2207
Cơ sở dữ liệu
3
INT1006
28
INT2208
Công nghệ phân mêm
3
INT1006
V
Khối kiến thức ngành và bổ trợ
38
v .l
C ác môn băt buộc
18
29
INT2202
3
Lập trình nâng cao
10
ỉ
i
INT1006
30
INT3202
Hệ quản trị cơ sở dữ liệu
3
INT2207
31
rNT3110
Phân tích và thiết kê hướng đối tượng
3
INT2204
INT3306
Phát triên ứng dụng Web
INT2204 /
3
32
INT2207
33
INT3115
Thiêt kê giao diện người dùng
3
INT2204
34
INT3507
Các vân đê hiện đại Công nghệ thông tin
3
INT1003
V.2
Các môn bô trợ
5/20
MAT1093 /
MAT1099
35
MAT1100
36
Phương pháp tính
2
Tối ưu hóa
2
MAT1095
MAT1093 /
MAT1095
37
ELT2028
Chuyên nghiệp trong công nghệ
2
38
ELT2031
Mô hình hỏa và mô phỏng
2
Xừ lý tín hiệu số
3
MAT1093
ELT3044
39
/MAT1094
40
BSA2022
Nguyên lý Marketing
3
41
INE1150
Kinh tế vi mô 1
3
42
INE1151
Kinh tê vĩ mô 1
3
V.3
C ác môn học tự chọn theo các định hướng
43
INT3117
INT1006
15/78
Kiểm thử và đảm bảo chẩt lượng phần
3
INT2204
mềm
44
INT3105
Kiến trúc phần mềm
3
INT2204
45
INT3106
Phương pháp hình thức
3
INT1050
INT3108
Lập trình nhúng và thời gian thực
INT2205 /
3
46
INT2202
47
INT3109
Thu thập và phân tích yêu câu
3
INT2208
48
INT3111
Quản lý dự án phân mêm
3
INT2208
49
INT3206
Cơ sở dữ liệu phân tán
3
INT2207
50
INT3207
Kho dữ liệu
3
INT2207
51
INT3209
Khai phá dữ liệu
3
INT2207
11
52
INT3213
Nhập môn an toàn thông tin
3
INT3201
53
INT3216
Phân tích, đánh giá hiệu năng hệ thông
3
INT2207
54
INT3217
Lập trình hệ thông
3
INT2207
55
INT3301
Thực hành hệ điêu hành mạng
3
INT1006
56
INT3303
Mạng không dây
3
INT2209
57
INT3304
Lập trình mạng
3
INT2209
58
INT3305
Truyên thông đa phương tiện
3
INT2209
59
INT3307
An toàn và an ninh mạng
3
INT2209
60
INT3309
Phân tích và thiêt kê mạng máy tính
3
INT2209
61
INT3310
Quản trị mạng
3
INT2209
62
INT3501
Khoa học dịch vụ
3
INT1003
63
INT3505
Kiên trúc hướng dịch vụ
3
INT2204
64
INT3506
Các hệ thống thương mại điện tử
3
INT1003
65
INT3401
Trí tuệ nhân tạo
3
INT2203
66
INT3403
Đô họa máy tính
3
INT2203
67
INT3404
Xử lý ảnh
3
INT2203
68
1NT34U7
Tin sinh học
3
INT2202
VI
Khối kiến t lức thực tập và tốt nghiệp
10
69
INT3508
3
VI.l
70
Thực tập chuyên ngành
7
Khóa luận tốt nghiệp
INT4050
7
Khóa luận tôt nghiệp
7
VI.2 Các môn học tương đương
71
INT3509
INT1003
4
Dự án (băt buộc)
3 tín chi từ danh sách các môn tự chọn
72
3
theo các định hướng
Các môn trong KCT2010, 2007-2009 mà không có
VII
10
trong KCT2012 + Không hợp nhất được
73
INT2201
Lý thuyêt thông tin
3
74
INT3405
Học máy
3
75
INT3402
Chương trình dịch
3
12
INT1003
INT2203
76
INT3211
Tích họp hệ thống
3
INT2020
Phân tích và thiêt kê các hệ thông thông
77
INT2016/
3
INT2014
tin
Môi trường lập trình trực quan
INT2009
INT2005 /
78
2
INT2003
79
INT3212
Xử lý dữ liệu thông kê
3
80
INT3061
Xử lý ngôn ngữ tự nhiên
3
MAT1089
Phuơng pháp sô
INT3401
MAT1082 /
81
3
MAT1084
82
INT3221
Cơ sờ dữ liệu nâng cao
\
1
3
INT2207
»
Sau đó, đê tài tông hợp tạo ma trận sinh viên-điêm dựa trên k lung ở Hình 2
với các cách tính điểm như mô tả ở phần ừên. Kểt quả tổng hợp thu được 1264 bản
ghi tương ứng với dữ liệu mô tả kết quả học tập cùa 1264 sinh viên ngành Công nghệ
thông tin. Các thông tin gồm: Thông tin cá nhân của sinh viên, điểm môn học tương
ứng với mỗi lần học và thời gian học của sinh viên.
13
ĐẠI HỌC QUỐC GIA HÀ NỘI
BÁO CÁO 02
NGHIÊN CỨU VÀ ĐÈ XUẤT CÁC MÔ HÌNH PHƯƠNG
PHÁP PHÂN TÍCH VÀ KHAI PHÁ DỮ LIỆU ĐÀO TẠO
Thuộc đề tài
PHẦN TÍCH, PHAI KHÁ DỮ LIỆU DẠY HỌC VÀ THÔNG TIN PHẢN
HỒI CỦA SINH VIÊN NHẰM NÂNG CAO CHÁT LƯỢNG VÀ HIỆU
QUẢ QUẢN LÝ ĐÀO TẠO
Mã số QG.15.29
Thành viên thực hiện:
Trương Thị Minh Ngọc
Nguyễn Đức Linh
Trần Thị Oanh
Phan Xuân Hiếu
Hà Nội 2015
M ỤC LỤC
MỤC L Ụ C ........................................................................................................................................... 2
MỞ Đ Ầ U ..............................................................................................................................................3
1.
Những vấn đề quan trọng được đặt ra và giải quyết.......................................................4
2.
Những khía cạnh được đưa ra nghiên cứu và thu thập dữ liệu :................................... 4
3.
Những nhóm chức năng được phát triể n :........................................................................ 4
4.
Các phương pháp được đề xuất áp dụng...........................................................................6
K ÉT L U Ậ N ....................................................................................................................................... 11
PHỤ L Ụ C .......................................................................................................................................... 12
2
M Ở ĐẦU
Khảo sát đánh giá các hướng tiếp cận và nghiên cứu phân tích khai phá dữ liệu trên
bộ dữ liệu giáo dục là một trong những bước mở đầu quan trọng, cần thiết và yêu cầu bám
sát dữ liệu giáo dục thực tế. Với những hoạt động chính bao gồm:
-
Phân tích mối tương quan giữa các môn học, phương pháp giảng dạy, phương pháp
đánh giá, kết quả đạt được của sinh viên.
-
Phương pháp gợi ý tự động cho từng sinh viên các môn học.
Nội dung chính của báo cáo là trình bày những kết quả đạt được trong quá trình tiếp
cận bộ dữ liệu đào tạo, đưa ra những phương pháp áp dụng cho bộ dữ liệu đã thu thập được.
Báo cáo cũng chi rõ những nội dung chính được ưu tiên triển khai, cũng là những chức
năng chính được chỉ rõ những đầu vào đàu ra và phương pháp thực hiện, tiếp tới là những
chức năng phụ cũng được xem xét triển khai cùng với hệ thống.
Ngoài ra việc thực hiện triển khai cũng dựa ưên những phương pháp khoa học và phù
hợp bao gồm:
-
Làm việc với các chuyên gia trong lĩnh vực đào tạo
-
Thu thập những dữ liệu về chương trình học
-
Họp nhóm chuyên gia thường kỳ
-
Nghiên cứu tham khảo các công trình nghiên cứu những hệ thống đào tạo đã được
áp dụng
-
Nghiên cứu xác định rõ với hiện trạng tại đom vị đào tạo
3
1. Những vấn đề quan trọng được đặt ra và giải quyết.
-
Xác định các chức năng chính của hệ thống dựa trên phân tích và so sánh thực trạng
của sinh viên tại trường. Đưa ra được hai nhóm chức năng chính cần tập trung phân
tích và thiết kế ngay:
o Thống kê, chọn lọc và phân tích các số liệu thu thập được từ sinh viên để
đánh giá hiện trạng và mức độ phù h ợ p ...
o Chức năng gợi ý cho sinh viên những thông tin quan trọng giúp sinh viên
định hướng lộ trình học, xác định rõ mục tiêu nghề nghiệp và đưa ra các giải
pháp giúp phát huy tối đa khả năng của sinh v iê n ...
- Xây dựng mô hình phương pháp giải quyết cho các yêu cầu được xác định.
- Đưa ra những thông tin cần khảo sát đối với sinh viên và giảng viên về hiện trạng
học tập và nghiên cứu của sinh viên, xác định những nhu cầu thực tiễn cần thiết nhất
của sinh viên và giảng viên, để có thể xây dựng hệ thống tư vấn gợi ý phù hợp.
- Tận dụng những dữ liệu đào tạo có sẵn trong quá khứ, thu thập được từ trước tới
nay.
2. Những khía cạnh được đưa ra nghiên cứu và thu thập dữ liệu:
-
Xác định rõ những đối tượng và thông tin cần nghiên cứu:
o Đối tượng sinh viên: tìm hiểu những đặc điểm chung, xem xét các khía cạnh
định hướng nghề nghiệp, sở thích. Thu thập điểm tích lũy và các thành tích.
Khai thác các đặc điểm của nhóm sinh viên giỏi, khá, trung bình,
o Đối tượng giảng viên: Những nhiệm vụ và cách thức giao tiếp với sinh viên
-
Thống kê những định hướng nghề nghiệp của sinh viên và chia định hướng theo
lĩnh vực ứng dụng: lấy ví dụ với CNTT: CNTT cho ngân hàng, tài chính, giáo đ ụ c...
- Xác định rõ các chuyên ngành và chương trình đào tạo, các yêu cầu và ràng buộc
- Xác định cập nhật các lĩnh vực nghiên cứu đặc thù của chuyên ngành.
3. Những nhóm chức năng được phát triển:
-
Những chức năng chính được xác định để ưu tiên
4
C N 1.
Xác định và phân cụm nhóm sinh viên nghiên cứu cùng chuyên
ngành.
CN2.
Lên lộ trình học cho từng sinh viên, kiểm tra tiến độ theo từng kỳ
học, biểu diễn trực quan trên biểu đồ, xác định tỷ lệ hoàn thành. Xác định
tình trạng hiện tại của sinh viên đưa ra các cảnh báo.
CN3.
-
Gợi ý những môn học (theo kỳ, lộ trình, những môn liên quan).
N hững chức năng được phát triển tiếp theo:
CN4.
Gợi ý số điểm, số tín chỉ cần đạt được trong học kỳ (dựa trên tiêu chí
lựa chọn cho người dùng về định hướng nghề nghiệp, chuyên ngành đào tạo).
CN5.
Gợi ý môn học theo sở thích (dựa trên định hướng nghề nghiệp, sở
thích hoặc quan tâm từ các feedback).
CN6.
Dự đoán kết quả khả năng qua môn với tình trạng hiện tại.
CN7.
Kiểm ừ a sự phù họp của lộ trình sinh viên định hướng theo tình trạng
hiện tại, khuyển cáo và đưa ra gợi ý (có thể thay đổi chuyên ngành, định
hướng để phù hợp với sở trường và tình trạng hiện tại).
CN8.
Tạo các mẫu form báo cáo (thiết kế theo yêu cầu của các cấp lãnh đạo)
giúp nhà trường nắm bắt tình hình và có thể đưa ra các thay đổi phù hợp.
CN9.
Tạo dựng mẫu để khảo sát, thu thập ý kiến của sinh viên ngay trên hệ
thống. Thu thập các phản hồi về hiện trạng của sinh viên để có thể đưa ra tư
vấn hỗ trợ.
CN10.
Cập nhật và gợi ý các định hướng nghề nghiệp cho đối tượng sinh
viên chưa có lộ trình hay định hướng (theo những nguồn thị trường lao động).
CN11.
Gợi ý cho sinh viên những hướng nghiên cứu khóa luận/luận văn,
nghiên cứu khoa học và các thày hướng dẫn theo hướng nghiên cứu đó.
CN12.
Cập nhật liên tục tình trạng hiện tại của sinh viên về sửc khỏe, khóa
học ngoài hay các cảnh c áo ...
CN13.
Xây dựng CSDL theo những dữ liệu thu thập được, tích hợp vào hệ
thống CSDL chung về người học đã có.
5
Những nội dung nghiệp vụ đã thực hiện bao gồm xác định các vấn đề quan trọng cần
đạt được khi xây dựng hệ thống, tiếp tới là xác định cách thức giải quyết và tiến hành thực
hiện.
4. Các phưong pháp được đề xuất áp dụng
Báo cáo sẽ nêu lại những nội dung, lý do mục đích của chức năng, đưa ra những ph ân
tích và cách thức giải quyết, từ đó xác định được những đầu vào và đầu ra của từng m ô
đun.
Với chức năng 1 - C N 1X á c định và phân cụm nhóm sinh viên nghiên cứu cùng chuyên
ngành. Mục đích để tìm hiểu những tương quan giữa những cụm sinh viên này về m ôn học,
cùng hướng nghiên cứu. Từ đó cũng tập trung phân tích đối với đối tượng sinh viên giỏi
và trung bình, phục vụ cho việc tư vấn gợi ý môn học cho sinh viên. D ựa trên việc khảo
sát nhóm sinh viên đã có điểm, những sinh viên đã hoàn thành chương trình học, sử dụng
phướng pháp khai phá là phân cụm (Clustering) và lọc cộng tác (Collaborative Filtering),
đầu ra sẽ là những nhóm sinh viên giống nhau về chuyên ngành, hướng nghiên cứu. X em
xét một sổ giả thiết những nhóm sinh viên này khá tương đồng về sở trường, sở đoản,
những môn học và các cách tiếp cận nghiên cứu và chọn m ôn học.
CN2. Lên lộ trình học cho từng sinh viên, kiểm tra tiến độ theo từng kỳ học, biểu diên trực
quan trên biểu đồ, xác định tỷ lệ hoàn thành. Xác định tình trạng hiện tại của sinh viên
đưa ra các cảnh báo. Đây là m ột cụm chức năng hỗ trợ theo sát lộ trình học của từng sinh
viên, mục đích chính là giúp sinh viên hiểu rõ được những kế hoạch học tập của m ình qua
việc theo dõi sát tiến trình, những thống kê, biểu đồ thể hiện lộ trình kế hoạch và thực tế,
giúp sinh viên điều chinh và định hướng rõ ràng, giảm thiểu rủi ro. Từ những mục đích và
yêu cầu trên, chức năng này được thiết kế tạo ra những biểu đồ và các công thức tính toán.
B iểu đồ bao gồm: thứ nhất là biểu đồ lộ trình lý tường được thiết kế dựa trên mục tiêu định
hướng ban đầu của sinh viên và được tham khảo ý kiến chuyên gia, các giảng viên và
những đối tượng sinh viên xuất sắc giỏi... thứ hai là biểu đồ đường đi hiện trạng dựa trên
những điểm tích lũy đến thời điểm hiện tại cùa sinh viên. Ngoài ra những lộ trình được
thiết kế phụ thuộc vào ràng buộc là khung chương trình chuẩn, các điều kiện môn tiên
6
quyết, số tín chỉ yêu cầu đạt được...Với đầu vào là những điểm tích lũy của từng sinh viên;
định hirớng nghề nghiệp và nghiên cứu theo nguyện vọng của sinh viên; hoặc là gợi ý
chuyên ngành cho sinh viên. Đầu ra là các biểu đồ mô tả, những báo cáo so sánh, một số
trạng thái cảnh báo: cảnh báo học vụ, cảnh báo về tình trạng có thể lệch lộ tìn h ...
CN3. Gợi ỷ những môn học (theo kỳ, lộ ưình, những môn liên quan): Xác định những
môn học tương quan dựa theo kỳ học, lộ trình của sinh viên, những ràng buộc môn học.
Chức năng này khai thác chủ yếu những thông tin được cung cấp bời sinh viên và ban đào
tạo từ mô đun thu thập dữ liệu sinh viên. Dựa vào thông tin về sở thích cá nhân, lĩnh vực
nghiên cứu, định hướng nghề nghiệp, tình trạng hiện tại của sinh viên; đưa ra được những
môn học theo kỳ, theo lộ trình. Phương pháp và kỹ thuật được sử dụng là sử dụng lọc cộng
tác chọn nhóm sinh viên giống nhau về sở thích và định hướng, có cùng những môn học
và cùng đạt điểm số tương đồng, lựa chọn ra nhóm sinh viên giỏi và tạo lộ trình gợi ý theo
nhóm sinh viên này. Ngoài ra tham khảo thêm các kiến thức chuyên gia, những giảng viên
của chuyên ngành và sổ tay học vụ để xác định thêm tương quan chắc chắn giữa các môn
học.
CN4. Gợi ỷ số điểm, so tín chi cần đạt được trong học kỳ (dựa trên tiêu chí lựa chọn cho
người dùng về định hướng nghề nghiệp, chuyên ngành đào tạo). Chức năng này được xác
định là chức năng phụ sẽ được xây dựng kèm với chức năng 2 và 3. Những ràng buộc được
xác định là phải đạt được tối đa và tối thiểu bao nhiêu tín chỉ trong một học kỳ chính, và
phụ. Cách thức xác định là sau khi xây dựng được lộ trình học, sẽ xây dựng cận trên và cận
dưới dựa trên những đầu vào lànhững tiêu chí được đặt ra lúc đầu (có hoặc không) của sinh
viên hoặc nhà trường. Đầu ra là đưa ra khuyến nghị số tín chỉ phù hợp nhất, không quá tải
với sinh viên, phù hợp với năng lực hiện tại.
CN5. Gợi ý môn học theo sở thích (dựa trên định hướng nghề nghiệp, sở thích hoặc quan
tâm từ các feedback). Đây là chức năng được quan tâm phát triển, tuy nhiên khi ưiển khai
cần tiến hành xác định rõ những loại thông tin và dữ liệu nào có thể thu thập. Dữ liệu đầu
vào thu thập được hiện tại bao gồm những danh sách các môn tự chọn, các ràng buộc môn,
các trạng thái môn đã học của sinh viên, sở thích của sinh viên. Gợi ý môn học cũng tham
7
gia góp phần vào khâu xây dựng lộ trình học cho sinh viên, chủ yếu đối với nhóm môn học
tự chọn và bổ trợ. Chức năng này còn đang được tiếp tục xem xét và bổ sung thêm những
trường dữ liệu có thể thu thập được từ dữ liệu phản hồi. Phương pháp chính được đề xuất
là sử dụng luật kết hợp và dựa trên nội dung môn học, xác định những môn học phù hợp
cho từng sinh viên.
CN6. D ự đoán kết quả khả năng qua môn với tình trạng hiện tại. Kèm theo với chức năng
5, đây là chức năng đưa ra giải thích cho gợi ý các môn học và lộ trình, ngoài ra cũng sử
dụng như là một báo cáo để xác định tình trạng hiện tại của từng sinh viên, đều được thiết
kế và biểu diễn trực quan trên biểu đồ môn học được xây dựng ờ chức năng 2. K ỹ thuật sừ
dụng là luật kết họp xác định các ràng buộc của các môn, sử dụng lọc cộng tác khai phá ra
những nhóm học tương đương (chínhlà đầu ra của chức năng thứ nhất) để dự đoán kết quả
của sinh viên nào đó.
CN7. Kiểm tra sự phù hợp của lộ trình sinh viên định hướng theo tình trạng hiện tại,
khuyến cáo và đưa ra gợi ý (có thể thay đổi chuyên ngành, định hướng để phù hợp với sở
trường và tình trạng hiện tại). Đây là chức năng phụ đi sau chức năng 2, đưa ra các thông
báo mức độ phù hợp với lộ trình đã thiết lập trước dựa vào hiện trạng của sinh viên, điểm
tích lũy và một số phản hồi.
CN8. Tạo các mẫu báo cáo (thiết kế theo yêu cầu của các cấp lãnh đạo) giúp nhà trường
nắm bắt tình hình và có thể đưa ra các thay đổi phù hợp. Với thực trạng có những môn học
không đủ sinh viên đăng ký trong nhiều kỳ, sinh viên điểm thấp chiếm đa s ố ... hay những
môn học mới cần có thêm trong khung chương trình dựa theo nguyện vọng sờ thích nghề
nghiệp của sinh viên ... Do đó từ những dữ liệu như kết quả học tập của sinh viên, bộ môn,
khóa h ọ c...và những phản hồi, ý kiến của cá nhân thu được thông qua các cuộc khảo sát
và mạng xã h ộ i... nhằm vào khai phá trích xuất ra các thông tin báo cáo.
CN9. Tạo dựng mẫu đ ể khảo sát, thu thập ỷ kiến của sinh viên ngay trên hệ thống. Thu
thập các phản hồi về hiện trạng của sinh viên để có thể đưa ra tư vấn hỗ trợ. Đây là một
khâu quan trọng bao gồm triển khai thiết kế các mẫu bảng hỏi, nhằm luôn nắm bắt cập nhật
8
được các thông tin quan trọng nhất của sinh viên, đưa ra những gợi ý hay điều chỉnh kịp
thời. Những bước thực hiện được đề cập đến là lên danh sách những thông tin có thể khai
thác được trực tiếp từ sinh viên; khuyến khích sinh viên luôn có những phản hồi nhanh
chóng qua thông tin từ mạng xã hội; tham khảo ý kiến chuyên gia, giảng viên và những
cuộc khảo sát sinh viên trước đó. Những mẫu khảo sát này sẽ được thiết kế và tích hợp vào
hệ thống chung, giúp giảm thiểu những cuộc khảo sát qua giấy.
CN10. Cập nhật và gợi ỷ các định hướng nghề nghiệp cho đổi tượng sinh viên chưa cỏ lộ
trình hay định hướngVới những sinh viên chưa tìm được nguyện vọng hoặc nguyện vọng
không phù hợp tình trạng học hiện tại, hay có những hướng phù hợp hơn, ... tất cả được
tính độ phù hợp và đưa ra gợi ý về hướng nghề nghiệp, hay hướng nghiên cứu. Có thể kết
hợp với những chương trình liên kết giữa các doanh nghiệp (theo những nguồn thị trường
lao động) kết hợp đào tạo sẽ xác định mức độ phù hợp với sinh viên dựa vào những kết
quả hiện tại, hay nguyện vọng hiện tại của sinh viên. Đầu vào cần có là những thông tin cơ
bản của sinh viên, những đặc điểm của sinh viên thu thập được từ những cuộc khảo sát
trước đó, thu thập được từ dữ liệu điểm tích lũy môn học, từ những mạng xã hội (n lu có);
tiép theo là danh sách nghề nghiệp/hướng chuyên môn khảo sát thu thập được từ thị trường
lao động. Đầu ra được xác định là độ phù hợp của sinh viên đó với những ngành nghề này.
Đây là một chức năng cần quan tâm đến vấn đề cập nhật thường xuyên dữ liệu, do đỏ sẽ
được thiết kế để có thể thích nghi với những thay đổi có thể có trong tương lai.
C N 11. Gợi ý cho sinh viên những hướng nghiên cứu khóa luậrưluận văn, nghiên cứu khoa
học và các thầy hướng dẫn theo hướng nghiên cứu đó. Chức năng này có mục đích chính
là kết nối giữa sinh viên và giảng viên hướng dẫn, thông qua những thông tin về sở thích
hay nguyện vọng môn học yêu thích, ngành học yêu thích, đang quan tâm, những môn học
có khả năng, hay sở trường riêng biệt của từng sinh viên; những thông tin về đề tài hướng
nghiên cứu của giảng viên. Đây cũng là một chức năng càn được cập nhật dữ liệu liên tục
đưa ra gợi ý cho đối tượng sinh viên những giảng viên hướng dẫn phù hợp và gợi ý cho
đối tượng giảng viên những sinh viên đạt yêu cầu trong trường hợp các giảng viên tìm kiếm
sinh viên tham gia các đề tài nghiên cứu khoa học.
9
CN12. Cập nhật liên tục tình trạng hiện tại của sinh viên về sức khỏe, khóa học ngoài hay
các cảnh cáo .. .Chức năng này được xây dựng để cập nhật các thông tin cơ bản của sinh
viên thu được từ các nguồn kể trên bao gồm: nguồn dữ liệu đào tạo, dữ liệu phản hồi, và
mạng xã hội. Căn cứ vào đó đưa ra những thông báo cảnh báo có thể có cho sinh viên và
cho phòng đào tạo nhà trường.
CN13.Jfóy dựng CSDL theo những dữ liệu thu thập được, tích hợp vào hệ thong CSDL
chung về người học đã có. Tích hợp với hệ thống chung của nhà trường là rất quan trọng,
đây là chức năng cần có sự tham gia của bộ phận phụ trách chuyên trách, sẽ được bàn đến
và giải quyết trong pha tiếp theo.
10