CHƯƠNG 3
ÁP DỤNG KẾT QUẢ NGHIÊN CỨU
Trong phần này, tác giả tiến hành thực nghiệm ứng dụng với dữ liệu trên phần mềm
quản lý đào tạo tại trường CĐYT Đồng Tháp để đánh giá và so sánh các kết quả học
tập của sinh viên theo quy định của Bộ và các thuật toán phân cụm.
3.1 Cách tổ chức thực nghiệm
Dữ liệu được trích xuất từ cơ sở dữ liệu của hệ thống quản lý đào tạo tại trường
CĐYT Đồng Tháp, bao gồm tồn bợ KQHT sinh viên cao đẳng chính quy khóa 6, 7
ngành Dược học, Điều dưỡng, Kỹ thuật xét nghiệm, Phục hồi chức năng và cao
đẳng liên thông khóa 4, 5 ngành Dược học, Điều dưỡng, Hợ sinh và sinh viên chính
quy quốc tế Campuchia hệ trung cấp khóa 6 ngành Y sỹ đa khoa, loại trừ sinh viên
bảo lưu hoặc thơi học hoặc bị đình chỉ hoặc không đủ dữ liệu các học phần, và
không thu thập dữ liệu 2 học phần Giáo dục thể chất, Giáo dục quốc phịng an ninh.
Hình 3.1 Mơ hình cơ sở dữ liệu quan hệ trên phần mềm
Thông qua việc truy vấn T-SQL trực tiếp từ CSDL thì tác giả nhận thấy dữ liệu có
nhiều tḥc tính để quản lý kết quả học tập của sinh viên, tác giả tiến hành xử lý dữ
liệu thông qua các bước:
24
Bước 1: Kiểm tra và làm sạch dữ liệu, loại bỏ một số thông tin không cần thiết như
sinh viên nghỉ học hoặc không đủ dữ liệu, và các cột như mã đào tạo, mã lớp, tên
lớp, ngày sinh, giới tính, học kỳ, các cợt kiểm tra, thi kết thúc học phần
(HS1,HS2,HS3), TBCHS, điểm mười, điểm chữ, loại trường hợp điểm 0 (F, loại
yếu) thông qua câu truy vấn T-SQL.
Bước 2: Sau khi có kết quả dữ liệu từ truy vấn và loại bỏ mợt số tḥc tính khơng
cần thiết thì tác giả thu được 4 tḥc tính trong tập dữ liệu sau:
Tḥc tính studentID: là khố chính để lưu trữ thơng tin sinh viên.
Tḥc tính subjectID: là khố chính để lưu trữ thơng tin học phần.
Tḥc tính score4: là kết quả điểm 4 của sinh viên.
Tḥc tính result: là kết quả học tập tồn khố học của từng sinh viên.
Bước 3: Tác giả tiếp tục truy vấn để phân dữ liệu theo các điều kiện khác nhau như
theo ngành học, khoá học, đối tượng sinh viên,…kết quả thu được 15 tập dữ liệu
như sau:
Bảng 3.1 Bảng bợ dữ liệu mẫu
Ngành
Kết quả truy vấn dữ liệu
Khố
(dịng/cột)
Hệ Cao đẳng chính quy khố 6, khố 7 (Việt Nam)
Dược học
2017 – 2020 / 2018 – 2021
(289,38) / (229,38)
Điều dưỡng
2017 – 2020 / 2018 – 2021
(73,48) / (99,51)
Kỹ thuật xét nghiệm
2017 – 2020 / 2018 – 2021
(32,45) / (25,47)
Phục hồi chức năng
2017 – 2020 / 2018 – 2021
(14,44) / (19,42)
Hệ Cao đẳng liên thơng khố 4, khố 5 (Việt Nam)
Dược học
2017 – 2019 / 2018 – 2020
(236,26) / (60,26)
Điều dưỡng
2017 – 2019 / 2018 – 2020
(180,32) / (142,29)
Hộ sinh
2017 – 2019 / 2018 – 2020
(67,27) / (73,30)
Hệ Trung cấp chính quy khoá 6 (Campuchia)
Y sỹ
2018 – 2019
(79,15)
25
Bước 4: Sau đó, dữ liệu được mã hóa thành các số từ 1-4 trùng với kết quả điểm khi
truy vấn dữ liệu (theo kết quả thang điểm 4) và cợt kết quả xếp loại được mã hố
theo sắp xếp alphabet khi tiến hành train với từng tập dữ liệu, và kết quả thu được ở
hình 3.2
Hình 3.2 Tập dữ liệu sau khi xử lý
Bước 5: Sau đó, tác giả tiếp tục loại bỏ 2 cột studentID, result trong tập dữ liệu trên,
và kết quả thu được ở hình 3.3
3.2 Chuẩn bị cài đặt thực nghiệm:
-
Lựa chọn tham số mũ m=1.7 và có thể thay đổi trong q trình thực nghiệm với
từng tập dữ liệu khác nhau, do dữ liệu không đồng đều về số lượng sinh viên và
số features trong mỗi chương trình đào tạo.
-
Tiêu chuẩn hợi tụ (epsilon)=1.2.
-
Số phân cụm c=4, tương ứng với 4 nhóm kết quả của sinh viên.
26
-
Thư viện cài đặt thuật tốn: dùng thư viện có sẵn: sklearn, fuzzy-c-means
-
Sử dụng các thuật toán để trực quan hoá dữ liệu như PCA, tSNE, ISOMAP cho
3 thuật toán tương ứng với từng tập dữ liệu cụ thể. Sau đó dùng phương pháp
Confusion matrix để đánh giá kết quả dự báo cho từng thuật toán ứng với từng
tập dữ liệu đã có.
-
Cấu hình máy tính để thực nghiệm: Hệ điều hành Window 64 bit, CPU Core i7
(2.70Ghz), Ram: 8GB, ổ cứng SSD 128GB.
27
3.3 Thực nghiệm với tập dữ liệu và đánh giá kết quả:
3.3.1 Thực nghiệm với dữ liệu CĐCQ Dược học khoá 6
3.3.1.1 Data Visualization với thuật toán Kmean
Chọn 289 sinh viên (n=289), có 38 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.3 Data Visualization Kmean với dữ liệu CĐCQ Dược học khoá 6
3.3.1.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 289 sinh viên (n=289), có 38 features, được phân vào
4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.4 Data Visualization FCM với dữ liệu CĐCQ Dược học khoá 6
3.3.1.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 289 sinh viên
(n=289), có 38 features, được phân vào 4 cụm (c=4)
Thuật toán PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.5 Data Visualization εFCM với dữ liệu CĐCQ Dược học khoá 6
28
3.3.1.4 Đánh giá kết quả với dữ liệu CĐCQ Dược học khoá 6
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.2 Ghi nhận kết quả với dữ liệu CĐCQ Dược học khoá 6
Thuật toán
Kmean
Nội dung
Thuật toán đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 131 sinh viên, group 2 đạt 127 sinh viên, group 3 đạt 19
sinh viên, group 4 đạt 12 sinh viên; đây là tiêu chí để nhà trường
chọn nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 67 sinh viên, group 2 đạt 72 sinh viên, group 3 đạt 78 sinh
viên, group 4 đạt 67 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 66 sinh viên, group 2 đạt 73 sinh viên, group 3 đạt 75 sinh
viên, group 4 đạt 75 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.3 Kết quả phân loại với dữ liệu CĐCQ Dược học khoá 6
Kmean
FCM
εFCM
Mean
0.22
7.56
10.53
Std
0.11
4.10
1.64
Accuracy
0.10
0.27
0.28
29
3.3.2 Thực nghiệm với dữ liệu CĐCQ Điều dưỡng khoá 6
3.3.2.1 Data Visualization với thuật toán Kmean
Chọn 73 sinh viên (n=73), 48 features, phân vào 4 cụm (k=4)
Thuật toán PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.6 Data Visualization Kmean với dữ liệu CĐCQ Điều dưỡng khoá 6
3.3.2.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.1, chọn 73 sinh viên (n=73), có 48 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.7 Data Visualization FCM với dữ liệu CĐCQ Điều dưỡng khoá 6
3.3.2.3 Data Visualization với thuật tốn εFCM
Với tham số mũ m=1.1, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 73 sinh viên (n=73),
có 48 features, được phân vào 4 cụm (c=4)
Thuật toán PCA
Thuật toán t-SNE
Thuật toán ISOMAP
Hình 3.8 Data Visualization εFCM với dữ liệu CĐCQ Điều dưỡng khoá 6
30
3.3.2.4 Đánh giá kết quả với dữ liệu CĐCQ Điều dưỡng khoá 6
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.4 Ghi nhận kết quả với dữ liệu CĐCQ Điều dưỡng khoá 6
Nội dung
Thuật toán
Thuật toán đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
Kmean
1 đạt 36 sinh viên, group 2 đạt 33 sinh viên, group 3 đạt 2 sinh
viên, group 4 đạt 2 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
FCM
1 đạt 18 sinh viên, group 2 đạt 16 sinh viên, group 3 đạt 20 sinh
viên, group 4 đạt 19 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 19 sinh viên, group 2 đạt 18 sinh viên, group 3 đạt 2 sinh
viên, group 4 đạt 19 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.5 Kết quả phân loại với dữ liệu CĐCQ Điều dưỡng khoá 6
Kmean
FCM
εFCM
Mean
0.09
8.18
8.18
Std
0.09
0.23
0.23
Accuracy
0.04
0.26
0.23
31
3.3.3 Thực nghiệm với dữ liệu CĐCQ Kỹ thuật xét nghiệm khoá 6
3.3.3.1 Data Visualization với thuật toán Kmean
Với việc chọn 32 sinh viên (n=32), có 45 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.9 Data Visualization Kmean với dữ liệu CĐCQ KTXN khoá 6
3.3.3.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.1, chọn 32 sinh viên (n=32), có 45 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.10 Data Visualization FCM với dữ liệu CĐCQ KTXN khoá 6
3.3.3.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 32 sinh viên (n=32),
có 45 features, được phân vào 4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.11 Data Visualization εFCM với dữ liệu CĐCQ KTXN khoá 6
32
3.3.3.4 Đánh giá kết quả với dữ liệu CĐCQ KTXN khoá 6
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.6 Ghi nhận kết quả với dữ liệu CĐCQ KTXN khố 6
Thuật tốn
Kmean
Nội dung
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 1 sinh viên, group 2 đạt 25 sinh viên, group 3 đạt 4 sinh
viên, group 4 đạt 1 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 9 sinh viên, group 2 đạt 6 sinh viên, group 3 đạt 7 sinh viên,
group 4 đạt 10 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 8 sinh viên, group 2 đạt 11 sinh viên, group 3 đạt 7 sinh
viên, group 4 đạt 6 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.7 Kết quả phân loại với dữ liệu CĐCQ KTXN khoá 6
Kmean
FCM
εFCM
Mean
0.29
34.28
12.28
Std
0.11
0.70
0.91
Accuracy
0.28
0.19
0.25
33
3.3.4 Thực nghiệm với dữ liệu CĐCQ Phục hồi chức năng khoá 6
3.3.4.1 Data Visualization với thuật toán Kmean
Với việc chọn 14 sinh viên (n=14), có 44 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.12 Data Visualization Kmean với dữ liệu CĐCQ PHCN khoá 6
3.3.4.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.1, chọn 14 sinh viên (n=14), có 44 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.13 Data Visualization FCM với dữ liệu CĐCQ PHCN khoá 6
3.3.4.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.1, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 14 sinh viên (n=14),
có 44 features, được phân vào 4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.14 Data Visualization εFCM với dữ liệu CĐCQ PHCN khoá 6
34
3.3.4.4 Đánh giá kết quả với dữ liệu CĐCQ PHCN khoá 6
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.8 Ghi nhận kết quả với dữ liệu CĐCQ PHCN khố 6
Thuật tốn
Kmean
Nội dung
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 5 sinh viên, group 2 đạt 4 sinh viên, group 3 đạt 1 sinh viên,
group 4 đạt 4 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 1 sinh viên, group 2 đạt 6 sinh viên, group 3 đạt 2 sinh viên,
group 4 đạt 5 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 3 sinh viên, group 2 đạt 5 sinh viên, group 3 đạt 3 sinh viên,
group 4 đạt 3 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.9 Kết quả phân loại với dữ liệu CĐCQ PHCN khoá 6
Kmean
FCM
εFCM
Mean
0.18
14.29
29.29
Std
0.21
7.11
2.14
Accuracy
0.14
0.14
0.29
35
3.3.5 Thực nghiệm với dữ liệu CĐCQ Dược học khoá 7
3.3.5.1 Data Visualization với thuật toán Kmean
Chọn 230 sinh viên (n=230), có 38 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.15 Data Visualization Kmean với dữ liệu CĐCQ Dược học khoá 7
3.3.5.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 230 sinh viên (n=230), có 38 features, được phân vào
4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.16 Data Visualization FCM với dữ liệu CĐCQ Dược học khoá 7
3.3.5.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 230 sinh viên
(n=230), có 38 features, được phân vào 4 cụm (c=4)
Thuật toán PCA
Thuật toán t-SNE
Thuật tốn ISOMAP
Hình 3.17 Data Visualization εFCM với dữ liệu CĐCQ Dược học khoá 7
36
3.3.5.4 Đánh giá kết quả với dữ liệu CĐCQ Dược học khoá 7
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.10 Ghi nhận kết quả với dữ liệu CĐCQ Dược học khoá 7
Thuật toán
Kmean
Nội dung
Thuật toán đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 70 sinh viên, group 2 đạt 72 sinh viên, group 3 đạt 21 sinh
viên, group 4 đạt 67 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 61 sinh viên, group 2 đạt 71 sinh viên, group 3 đạt 43 sinh
viên, group 4 đạt 55 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 53 sinh viên, group 2 đạt 64 sinh viên, group 3 đạt 69 sinh
viên, group 4 đạt 44 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.11 Kết quả phân loại với dữ liệu CĐCQ Dược học khoá 7
Kmean
FCM
εFCM
Mean
0.19
39.96
1.62
Std
0.06
1.55
0.55
Accuracy
0.22
0.17
0.24
37
3.3.6 Thực nghiệm với dữ liệu CĐCQ Điều dưỡng khoá 7
3.3.6.1 Data Visualization với thuật toán Kmean
Chọn 99 sinh viên (n=99), có 51 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.18 Data Visualization Kmean với dữ liệu CĐCQ Điều dưỡng khoá 7
3.3.6.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 99 sinh viên (n=99), có 51 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.19 Data Visualization FCM với dữ liệu CĐCQ Điều dưỡng khoá 7
3.3.6.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 99 sinh viên (n=99),
có 51 features, được phân vào 4 cụm (c=4)
Thuật toán PCA
Thuật toán t-SNE
Thuật tốn ISOMAP
Hình 3.20 Data Visualization εFCM với dữ liệu CĐCQ Điều dưỡng khoá 7
38
3.3.6.4 Đánh giá kết quả với dữ liệu CĐCQ Điều dưỡng khoá 7
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.12 Ghi nhận kết quả với dữ liệu CĐCQ Điều dưỡng khoá 7
Thuật toán
Nội dung
Kmean Thuật toán đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 1 sinh viên, group 2 đạt 46 sinh viên, group 3 đạt 3 sinh
viên, group 4 đạt 49 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
FCM Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 30 sinh viên, group 2 đạt 18 sinh viên, group 3 đạt 25 sinh
viên, group 4 đạt 26 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
εFCM Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 32 sinh viên, group 2 đạt 21 sinh viên, group 3 đạt 23 sinh
viên, group 4 đạt 23 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.13 Kết quả phân loại với dữ liệu CĐCQ Điều dưỡng khoá 7
Kmean
FCM
εFCM
Mean
0.13
6.04
6.01
Std
0.11
0.14
0.41
Accuracy
0.12
0.22
0.25
39
3.3.7 Thực nghiệm với dữ liệu CĐCQ Kỹ thuật xét nghiệm khoá 7
3.3.7.1 Data Visualization với thuật toán Kmean
Chọn 25 sinh viên (n=25), có 47 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.21 Data Visualization Kmean với dữ liệu CĐCQ KTXN khoá 7
3.3.7.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.1, chọn 25 sinh viên (n=25), có 47 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.22 Data Visualization FCM với dữ liệu CĐCQ KTXN khoá 7
3.3.7.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.1, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 25 sinh viên (n=25),
có 47 features, được phân vào 4 cụm (c=4)
Thuật toán PCA
Thuật toán t-SNE
Thuật tốn ISOMAP
Hình 3.23 Data Visualization εFCM với dữ liệu CĐCQ KTXN khoá 7
40
3.3.7.4 Đánh giá kết quả với dữ liệu CĐCQ KTXN khoá 7
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.14 Ghi nhận kết quả với dữ liệu CĐCQ KTXN khố 7
Thuật tốn
Kmean
Nội dung
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 6 sinh viên, group 2 đạt 9 sinh viên, group 3 đạt 1 sinh viên,
group 4 đạt 9 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 7 sinh viên, group 2 đạt 8 sinh viên, group 3 đạt 4 sinh viên,
group 4 đạt 6 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group
1 đạt 9 sinh viên, group 2 đạt 5 sinh viên, group 3 đạt 4 sinh viên,
group 4 đạt 7 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.15 Kết quả phân loại với dữ liệu CĐCQ KTXN khoá 7
Kmean
FCM
εFCM
Mean
0.10
31.48
19.08
Std
0.16
1.66
2.02
Accuracy
0.08
0.16
0.12
41
3.3.8 Thực nghiệm với dữ liệu CĐCQ Phục hồi chức năng khoá 7
3.3.8.1 Data Visualization với thuật toán Kmean
Chọn 19 sinh viên (n=19), có 42 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.24 Data Visualization Kmean với dữ liệu CĐCQ PHCN khoá 7
3.3.8.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 19 sinh viên (n=19), có 42 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.25 Data Visualization FCM với dữ liệu CĐCQ PHCN khoá 7
3.3.8.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hợi tụ (epsilon)=1.2, chọn 19 sinh viên (n=19),
có 42 features, được phân vào 4 cụm (c=4)
Thuật toán PCA
Thuật toán t-SNE
Thuật tốn ISOMAP
Hình 3.26 Data Visualization εFCM với dữ liệu CĐCQ PHCN khoá 7
42
3.3.8.4 Đánh giá kết quả với dữ liệu CĐCQ PHCN khoá 7
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.16 Ghi nhận kết quả với dữ liệu CĐCQ PHCN khố 7
Thuật tốn
Kmean
Nội dung
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 1 sinh viên, group 2 đạt 9 sinh viên, group 3 đạt 7 sinh viên,
group 4 đạt 2 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 3 sinh viên, group 2 đạt 5 sinh viên, group 3 đạt 8 sinh viên,
group 4 đạt 3 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 6 sinh viên, group 2 đạt 5 sinh viên, group 3 đạt 2 sinh viên,
group 4 đạt 6 sinh viên; đây là tiêu chí để nhà trường chọn nhóm
phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.17 Kết quả phân loại với dữ liệu CĐCQ PHCN khoá 7
Kmean
FCM
εFCM
Mean
0.11
29.73
31.05
Std
0.15
4.85
2.52
Accuracy
0.37
0.37
0.11
43
3.3.9 Thực nghiệm với dữ liệu CĐLT Dược học khoá 4
3.3.9.1 Data Visualization với thuật toán Kmean
Với việc chọn 236 sinh viên (n=236), có 26 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.27 Data Visualization Kmean với dữ liệu CĐLT Dược học khoá 4
3.3.9.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 236 sinh viên (n=236), có 26 features, được phân vào
4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.28 Data Visualization FCM với dữ liệu CĐLT Dược học khoá 4
3.3.9.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 236 sinh viên (n=26),
có 45 features, được phân vào 4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.29 Data Visualization εFCM với dữ liệu CĐLT Dược học khoá 4
44
3.3.9.4 Đánh giá kết quả với dữ liệu CĐLT Dược học khoá 4
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.18 Ghi nhận kết quả với dữ liệu CĐLT Dược học khoá 4
Thuật toán Nội dung
Kmean Thuật toán đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 47 sinh viên, group 2 đạt 66 sinh viên, group 3 đạt 62 sinh
viên, group 4 đạt 61 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
FCM Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 58 sinh viên, group 2 đạt 53 sinh viên, group 3 đạt 66 sinh
viên, group 4 đạt 59 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
εFCM Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 67 sinh viên, group 2 đạt 61 sinh viên, group 3 đạt 46 sinh
viên, group 4 đạt 62 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.19 Kết quả phân loại với dữ liệu CĐLT Dược học khoá 4
Kmean
FCM
εFCM
Mean
0.24
12.29
11.85
Std
0.05
0.06
1.38
Accuracy
0.26
0.24
0.19
45
3.3.10 Thực nghiệm với dữ liệu CĐLT Điều dưỡng khoá 4
3.3.10.1 Data Visualization với thuật toán Kmean
Với việc chọn 180 sinh viên (n=180), có 32 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.30 Data Visualization Kmean với dữ liệu CĐLT Điều dưỡng khoá 4
3.3.10.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 180 sinh viên (n=180), có 32 features, được phân vào
4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.31 Data Visualization FCM với dữ liệu CĐLT Điều dưỡng khoá 4
3.3.10.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 180 sinh viên
(n=180), có 32 features, được phân vào 4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.32 Data Visualization εFCM với dữ liệu CĐLT Điều dưỡng khoá 4
46
3.3.10.4 Đánh giá kết quả với dữ liệu CĐLT Điều dưỡng khoá 4
Dùng phương pháp đánh giá Confusion Matrix cho 3 thuật toán trên
Thuật toán Kmean
Thuật toán FCM
Thuật toán εFCM
Bảng 3.20 Ghi nhận kết quả với dữ liệu CĐLT Điều dưỡng khoá 4
Thuật toán
Nội dung
Thuật toán đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
Kmean
đạt 46 sinh viên, group 2 đạt 43 sinh viên, group 3 đạt 47 sinh
viên, group 4 đạt 44 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
FCM
đạt 51 sinh viên, group 2 đạt 50 sinh viên, group 3 đạt 36 sinh
viên, group 4 đạt 43 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao đợng.
εFCM
Thuật tốn đã dự báo 4 nhóm kết quả tương ứng bao gồm: group 1
đạt 37 sinh viên, group 2 đạt 47 sinh viên, group 3 đạt 52 sinh
viên, group 4 đạt 44 sinh viên; đây là tiêu chí để nhà trường chọn
nhóm phù hợp giới thiệu đến đơn vị sử dụng lao động.
Bảng 3.21 Kết quả phân loại với dữ liệu CĐLT Điều dưỡng khoá 4
Kmean
FCM
εFCM
Mean
0.28
0.02
0.04
Std
0.03
0.10
0.15
Accuracy
0.23
0.23
0.31
47
3.3.11 Thực nghiệm với dữ liệu CĐLT Hộ sinh khoá 4
3.3.11.1 Data Visualization với thuật toán Kmean
Với việc chọn 67 sinh viên (n=67), có 27 features, được phân vào 4 cụm (k=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.33 Data Visualization Kmean với dữ liệu CĐLT Hợ sinh khố 4
3.3.11.2 Data Visualization với thuật toán FCM
Với tham số mũ m=1.7, chọn 67 sinh viên (n=67), có 27 features, được phân vào 4
cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.34 Data Visualization FCM với dữ liệu CĐLT Hợ sinh khố 4
3.3.11.3 Data Visualization với thuật toán εFCM
Với tham số mũ m=1.7, tiêu chuẩn hội tụ (epsilon)=1.2, chọn 67 sinh viên (n=67),
có 27 features, được phân vào 4 cụm (c=4)
Thuật tốn PCA
Thuật tốn t-SNE
Thuật tốn ISOMAP
Hình 3.35 Data Visualization εFCM với dữ liệu CĐLT Hợ sinh khố 4
48