Tải bản đầy đủ (.pdf) (27 trang)

Báo cáo nghiên cứu khoa học " ÁP DỤNG LOGIC MỜ TRONG BÀI TOÁN ĐÁNH GIÁ HỌC SINH TRÊN CƠ SỞ ĐẠI SỐ GIA TỬ " pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (242.3 KB, 27 trang )



1

ÁP DỤNG LOGIC MỜ TRONG BÀI TOÁN ĐÁNH GIÁ HỌC SINH
TRÊN CƠ SỞ ĐẠI SỐ GIA TỬ
Nguyễn Thế Dũng
Trường Đại học Sư phạm, Đại học Huế
I. MỞ ĐẦU
Đánh giá việc học tập của học sinh là một nội dung quan trọng trong giáo
dục, nhằm công khai các nhận định về năng lực, kiến thức các em đã thu nhận
được qua quá trình học.
Khi đánh giá học sinh tuy có biểu điểm và tiêu chuẩn đầy đủ, nhưng kết quả
thường vẫn không rõ ràng, chẳng hạn khi cho một bài kiểm tra 7 điểm, nhưng
trong suy nghĩ của giáo viên vẫn thường nghĩ: "Bài này khoảng 7 điểm" hoặc
"Có thể hơn 7 điểm" Tất nhiên là có các điểm lẽ đến 0,25điểm. Cũng vậy, khi
đánh giá các kết quả khác của học sinh, ta vẫn thường đánh giá "Khá" tuy trong
suy nghĩ là "Rất khá nhưng chưa Tốt" Rõ ràng việc đánh giá học sinh chứa
đựng các thông tin mờ. Nhiệm vụ của giáo viên là làm rõ các yếu tố mờ trong
quá trình đánh giá, để việc đánh giá thực sự chính xác, công bằng hơn.
Trong [9][11] đã đưa ra các phương pháp đánh giá học sinh ứng dụng tập
mờ và logic mờ nhằm làm rõ các yếu tố của quá trình đánh giá. Phương pháp


2

trong [11] của Lee và Chen thực sự là một cải tiến so với phương pháp của
Biswais [9], nhưng cho kết quả đánh giá tương tự (để cho gọn ta gọi phương
pháp trong [11] là phương pháp của Lee-Chen).
Với phương pháp của Lee-Chen [11] quá trình đánh giá các câu trong bài
làm của học sinh để thể hiện qua một trang chấm, trên trang chấm đó giáo viên


thể hiện cấp độ thỏa mãn của câu trả lời của học sinh qua 11 mức là: L
1
: EG -
extrmely good, L
2
: VVG-very very good, L
3
: VG- very good, L
4
: G - good, L
5
:
LG - less good, L
6
: F- Fair, L
7
: LB-less bad, L
8
: B-bad, L
9
: VB- very bad, L
10
:
VVB- very very bad, L
11
: EB-extremely bad. Tiếp theo các tác giả xây dựng ánh
xạ T: U  [0,1] như sau: T(EG)=1; T(VVG)=0.99; T(VG)=0.90, T(G)=0.80;
T(LG)=0.70; T(F)=0.60; T(LB)=0.50; T(B)=0.40; T(VB)=0.24 và T(VVB)=0.09,
T(EB)=0. Ở đây U={L
1

, L
2
, L
11
}. Sau đó dựa trên hàm T để chuyển đổi các
mức độ thỏa mãn của các câu trả lời trong bài làm từ các nhãn từ ngữ L
i
nói trên
về giá trị số để tích hợp lại và cho ra điểm số cụ thể của câu đó. Có thể xem kỹ
trong [11], ta thấy rằng bản chất của hàm T là việc khử mờ các biến ngôn ngữ L
i

(i=1, ,11) nói trên theo thương pháp cực đại biên phải và việc đánh giá độ thỏa
mãn của một câu về một điểm số thuộc đoạn [0,1] chính là việc khử mờ theo
phương pháp trọng tâm.
Bên cạnh phương pháp trên cũng có tính đến 4 tiêu chuẩn là: đúng đắn, rõ
ràng, đầy đủ và ngắn gọn.
Phương pháp đánh giá của Lee - Chen thực sự là một cải tiến để làm rõ các
yếu tố mờ trong việc đánh giá bài làm của học sinh. Tuy vậy, theo chúng tôi,
phương pháp nói trên còn các giới hạn sau:


3

- Việc xây dựng các hàm thuộc của các nhãn ngôn ngữ L
i
nói trên là rất khó
khăn và theo chúng tôi là nó thay đổi tùy theo từng đối tượng lớp học được đánh
giá mà không nhất thiết theo các hàm thuộc đã được xây dựng trong phương
pháp của Lee-Chen.

- Hơn nữa, việc xác định ánh xạ T nói trên là thiếu tự nhiên, áp đặt.
Chúng ta thấy rằng các nhãn ngôn ngữ U trong bài toán đánh giá là tập
nhãn sánh được, nên có thể xét chúng như là các giá trị ngôn ngữ trong đại số gia
tử đầy đủ tuyến tính AX =(X, H, G,  ) của biến ngôn ngữ thể hiện cấp độ tốt,
xấu (good, bad). Với cơ sở đại số gia tử, chúng ta có thể cải tiến các giới hạn trên
trong phương pháp đánh giá của Lee-Chen như trong phần II dưới đây.
- Cần nói thêm rằng có thể mở rộng phương pháp đánh giá trên với các tiêu
chí đánh giá học sinh một cách toàn diện như đánh giá học tập, đánh giá thái độ
học tập, kết quả học tập, ý thức chuyên cần; hoặc kết hợp đánh giá bài kiểm tra,
bài thi và bài thực hành tùy theo các cách đánh giá khác nhau do nhà trường đặt
ra như trong [7] đã làm. Nhưng theo chúng tôi cần phải cải tiến trang chấm điểm
ở đó một cách hợp lý hơn, hơn nữa trong [7] cũng chỉ dừng ở mức đánh giá dựa
trên tập mờ như phương pháp Lee-Chen, nên vẫn vướng mắc các khuyết điểm
nói trên.
Trong phần III sẽ đưa ra kết quả thực nghiệm để xem xét phương pháp đánh
giá cải tiến được nêu ra trong bài này, kết quả đánh giá sẽ được so sánh mức độ
tương quan với các kết quả đánh giá theo phương pháp của Lee-Chen qua hệ số
tương quan Pearson trong thống kê [4].


4

Đồng thời, trong [5] khi thực hiện định lượng ngữ nghĩa các giá trị ngôn
ngữ trên đại số gia tử, chúng ta cần có các tham số: , , (h
i
) và  để xây dựng
ánh xạ lượng hóa ngữ nghĩa . Trong bài này ở phần IV, chúng ta sẽ bàn đến một
phương pháp thực nghiệm để xác định các tham số nói trên.
II. CẢI TIẾN PHƯƠNG PHÁP ĐÁNH GIÁ CỦA LEE-CHEN
DỰA TRÊN CƠ SỞ ĐẠI SỐ GIA TỬ

Theo như nhận xét trên các nhãn đánh giá L
i
là các nhãn sánh được, nên có
thể xét chúng như là các giá trị ngôn ngữ trong đại số gia tử tuyến tính AX =(X,
H, G, ) của biến ngôn ngữ thể hiện cấp độ tốt, xấu (good, bad). Nói cách khác U
được nhúng vào AX. Khi đó, trên AX có thể định nghĩa ánh xạ lượng hóa ngữ
nghĩa  để lượng hóa các giá trị ngôn ngữ thành các giá trị trên đoạn [0,1] (xem
[5]).
Với quan niệm trên chúng ta có thể khắc phục các nhược điểm của phương
pháp Lee-Chen được chỉ ra trong phần trước.
Cấu trúc của một trang chấm điểm mờ như sau:
Câu Cấp độ thỏa mãn Độ
thỏa
mãn



5

L
1
L
2
L
3
L
4
L
5
L

6
L
7
L
8
L
9
L
10
L
11

Câu
1

Câu
2


Câu j
Câu
n

Phương pháp chấm điểm mờ trong bài này được trình bày theo từng bước
dưới đây:
Bước 1: Thực hiện cho điểm đánh giá
Giáo viên sẽ đánh giá từng câu trả lời thứ j của học sinh, với mỗi câu trả lời
giáo viên thể hiện ý kiến của mình đối với câu trả lời với từng cấp độ L
i


(i=1, ,11) mỗi cấp độ L
i
sẽ được đánh giá bởi một điểm mờ y
i
[0,1]. Lưu ý: y
i

không nhất thiết phải là 1.


6

Bước 2: Xác định độ thỏa mãn D(Q
j
) của câu trả lời thứ j





11
1
11
1
)(
)(
i
i
i
i

i
j
y
Ly
QD


Với (L
i
) là giá trị lượng hóa ngữ nghĩa của L
i
.
Bước 3: Tính điểm cho từng câu và toàn bài
Giả sử tổng điểm dành cho câu thứ j là S
j
.
Khi đó điểm của câu thứ j sẽ là: M
j
=D(Q
j
)*S
j
/100%.
Tổng điểm của toàn bài sẽ là:


n
i
j
M

1
.
Kết thúc: Điểm của bài làm của học sinh.
Với cách chấm điểm có quan tâm đến các tiêu chuẩn: đúng đắn, rõ ràng,
đầy đủ, ngắn gọn và có thể mở rộng thêm các tiêu chuẩn khác. Giả sử có m tiêu
chuẩn. Cấu trúc của trang chấm cho một câu sẽ là:


7


Tiêu chuẩn
Độ
thỏa
mãn
của
câu
Điểm
của
câu
Câu Nhãn
đánh
giá
TC
1
TC
2
TC
i
TC

m

L
1

L
2


L
i


L
11

Thỏa
tiêu
chuẩn

D(C
1
)

D(C
2
)




D(C
i
)



D(C
n
)



8


Với D(C
i
) được tính tương tự như D(Q
j
) nói ở phần trên.
Khi đó độ thỏa mãn câu j sẽ là





m
i
i
i

m
i
i
j
w
CDw
QD
1
1
)(
)( , với w
i
là trọng số của
tiêu chuẩn thứ i đặt ra cho câu j.
Việc tính điểm cho từng câu thứ j và toàn bài, làm tương tự như ở trên.
Nhận xét
- Phương pháp nêu ra ở trên về bản chất tương tự như phương pháp của
Lee-Chen. Nên phát huy được các yếu tố ưu điểm của nó. Tuy vậy, chúng ta đã
khắc phục được các nhược điểm của Lee-Chen như đã nêu ở phần I. Đó là:
không qua bước xây dựng hàm thuộc cho các nhãn L
i
và ánh xạ T nói trên.
Các kết quả đánh giá theo 2 phương pháp được so sánh qua thực nghiệm
được nêu ra trong phần tiếp theo.
III. KẾT QUẢ THỬ NGHIỆM SO SÁNH TƯƠNG QUAN
GIỮA HAI PHƯƠNG PHÁP


9


Chúng tôi sử dụng kết quả chấm của giáo viên trên 40 bài kiểm tra học kỳ II
của học sinh lớp 8
4
trường THCS Trần Cao Vân, Huế trong [1] dựa trên trang
chấm điểm mờ nói trên. Sau đó chúng tôi tiến hành tính toán điểm cụ thể cho các
bài làm bằng cách sử dụng phương pháp được nêu trong bài này ở phần II. Sau
đó, so sánh với kết quả tính toán điểm theo phương pháp của Lee-Chen đã được
tính trong [1], tiếp theo sử dụng phương pháp đánh giá sự tương quan giữa hai
kết quả chấm theo hai phương pháp: phương pháp của Lee-Chen và phương pháp
nêu ra trong phần II của bài này, theo hệ số tương quan Pearson [4] để tìm mối
tương quan giữa hai phương pháp.
Khi chấm câu 1 có 2 tiêu chuẩn đúng đắn và đầy đủ, với hệ số giữa hai tiêu
chuẩn là 1:3; các câu 2 và 3 quan tâm đến 3 tiêu chuẩn: đúng, rõ ràng và đầy đủ,
với hệ số giữa ba tiêu chuẩn ở câu 2 là 1:3:4 và ở câu 3 là 4:5:1. Còn điểm của
các câu 1, 2 và 3 trong điểm số toàn bài có hệ số là: 3:3:4.
Lưu ý rằng: Các bài làm của học sinh được tính toán điểm cụ thể trên cùng
một cách chấm điểm the trang chấm điểm mờ của một giáo viên, nhưng được
tính điểm cụ thể theo 2 cách khác nhau.
Kết quả cụ thể như dưới đây:
Kết quả đánh giá theo phương pháp của Lee - Chen [1].
Thỏa mãn các tiêu chuẩn





10


Câu

1


Câu 2


u
3


Điểm câu



M
ã
số
TC1

TC
2
D(C1
)
TC
1
TC
2
TC
3
D(C

2)
TC
1
TC
2
TC3

D(C3
)
Câu
1
Câu
2
Câu
3
Điể
m
toà
n
bài
1

0.24

0.2

0.24

0.4


0.1

0.1

0.16

0.0
5

0.1

0.12

0.06

0.72

0.48

0.24

1.4

2

0.81

0.8

0.8


0.6

0.8

0.6

0.71

0.8
5

0.6

0.84

0.71

2.4

2.13

2.84

7.4

3

0.81


0.9

0.85

0.6

0.6

0.3

0.53

0.5
8

0.3

0.24

0.42

2.55

1.59

1.68

5.8

4


0.95

1

0.97

0

0.1

0

0.03

0.3
7

0.1

0.5

0.24

2.91

0.09

0.96


4

5

0.54

0.7

0.62

0.7

0.7

0.6

0.70

0.1
7

0.2

0.03

0.15

1.86

2.1


0.6

4.6

6

0.94

0.8

0.81

0.7

0.8

0.8

0.77

0.6 0.7

0.7

0.7

2.43

2.31


2.8

7.5



11

9

7

0.61

0.8

0.75

0.5

0.7

0.5

0.64

0.1
2


0.6

0.39

0.36

2.25

1.92

1.44

5.6

8

0.54

0.8

0.71

0.4

0.1

0.6

0.25


0.6

0.5

0.37

0.53

2.13

0.75

2.12

5

9

1

1

0.99

1

1

1


0.98

0.9
4

1

0.96

0.95

2.97

2.94

3.8

9.7

10

0.73

0.6

0.66

0.7

0.8


0.9

0.81

0.7
5

0.6

0.73

0.65

1.98

2.43

2.6

7

11

0.16

0.5

0.38


0.5

0.6

0.8

0.64

0.7
3

0.9

0.8

0.84

1.14

1.92

3.36

6.4

12

0.8

0.9


0.88

0.7

0.9

0.7

0.82

0.5
6

0.6

0.85

0.62

2.64

2.46

2.48

7.6

13


0.75

0.7

0.74

1

1

0.8

0.97

0.8
5

0.6

0.45

0.69

2.22

2.91

2.76

7.9


14

0.69

0.6

0.65

0.5

0.7

0.5

0.62

0.4
5

0.3

0.7

0.41

1.95

1.86


1.64

5.5



12

15

0.81

0.9

0.89

0.6

0.8

0.8

0.77

0.5
9

0.2

0.32


0.35

2.67

2.31

1.4

6.4

16

0.8

0.3

0.44

0.9

0.8

0.9

0.81

0.7
4


0.8

0.89

0.78

1.32

2.43

3.12

6.9

17

0.69

0.8

0.76

0.6

0.8

0.7

0.73


0.3
7

0.1

0.45

0.22

2.28

2.19

0.88

5.4

18

0.94

0.8

0.83

0.4

0.8

0.7


0.69

0.3
6

0.2

0.6

0.28

2.49

2.07

1.12

5.7

19

0.8

0.8

0.83

0.2


0.5

0.6

0.43

0.6
4

0.6

0.9

0.67

2.49

1.29

2.68

6.5

20

0.94

1

0.96


1

0.9

0.9

0.91

0.7
9

0.9

0.84

0.86

2.88

2.73

3.44

9.1

21

0.66


0.6

0.65

0.5

0.6

0.6

0.58

0.6
4

0.3

0.32

0.44

1.95

1.74

1.76

5.5

22


0.96

1

0.96

0.6

0.9

0.8

0.8

0.6

0.6

0.45

0.59

2.88

2.4

2.36

7.6


23

0.78

0.9

0.86

0.6

0.5

0.6

0.55

0.6 0.3

0.85

0.52

2.58

1.65

2.08

6.3




13

9

24

0.79

0.7

0.69

0.5

0.4

0.6

0.46

0.9

1

0.89

0.93


2.07

1.38

3.72

7.2

25

0.7

0.7

0.67

0.5

0.5

0.4

0.47

0.5
8

0.1


0.37

0.33

2.01

1.41

1.32

4.7

26

0.96

1

0.96

0.8

0.9

0.8

0.87

1


1

0.99

1

2.88

2.61

4

9.5

27

0.54

0.4

0.47

0.1

0

0.2

0.07


0.6

0.4

0.59

0.48

1.41

0.21

1.92

3.5

28

0.79

0.9

0.87

0.8

0.2

0.1


0.26

0.5
9

0.8

0.9

0.72

2.61

0.78

2.88

6.3

29

0.74

0.4

0.52

0.2

0.1


0.2

0.12

0.0
9

0.1

0.16

0.1

1.56

0.36

0.4

2.3

30

0.68

0.9

0.81


0.5

0.2

0.2

0.24

0.6
1

0.1

0.75

0.36

2.43

0.72

1.44

4.6

31

0.99

1


1

1

1

1

1

0.7
4

0.7

0.56

0.68

3

3

2.72

8.7

32


0.85

0.7

0.7

0.6

1

0.9

0.88

0.6 0.7

0.94

0.68

2.1

2.64

2.72

7.5




14

5

33

0.69

0.5

0.51

0.7

0.8

0.8

0.79

0.6
5

0.7

0.76

0.66

1.53


2.37

2.64

6.5

34

0.84

0.6

0.67

0.9

1

1

0.95

0.6
5

0.5

0.39


0.56

2.01

2.85

2.24

7.1

35

0.84

0.8

0.77

0.6

0.9

0.8

0.85

0.5
6

0.3


0.13

0.37

2.31

2.55

1.48

6.3

36

0.08

0.1

0.09

0.7

0.7

0.9

0.73

0.7

7

0.6

0.83

0.69

0.27

2.19

2.76

5.2

37

0.37

0.1

0.17

0.6

0.5

0.1


0.43

0.6
6

0.8

0.56

0.72

0.51

1.29

2.88

4.7

38

0.49

0.4

0.42

0.5

0.7


0.1

0.5

0.1

0.7

0.68

0.45

1.26

1.5

1.8

4.6

39

0.51

0.1

0.17

0.6


0.8

0.8

0.74

0.5
5

0.1

0.54

0.32

0.51

2.22

1.28

4

40

0.92

0.8


0.84

0.6

0.6

0.7

0.61

0.6
6

0.6

0.46

0.61

2.52

1.83

2.44

6.8



15



Xét các nhãn ngôn ngữ L
i
(i=1, ,11) trong bài toán đánh giá học sinh của
Lee-Chen, nếu nhúng tập nhãn trên vào trong đại số gia tử AX=(X, H, G,  ) của
biến ngôn ngữ thể hiện cấp độ tốt, xấu (Good, Bad). Ở đây G={Bad, Good},
H
+
={Very, More}, H
-
={Less, Possible}.
Với các tham số để xác định ánh xạ lượng hóa ngữ nghĩa  như sau: =0.6;
=0.6, =0.4, (Less)=0.35, (Possible)=0.25, (More)=0.15, (Very)=0.25
(xem [5]) và đặt tương ứng các nhãn L
i
nói trên với các giá trị ngôn ngữ trong đại
số gia tử AX này như sau:
L
1
=0; L
2
=LessPossibleVery Bad với (L
2
)=0.0898; L
3
=Bad với (L
3
)=0.24;
L

4
=PosbileLessLessBad với (L
4
)=0.4054; L
5
=PossibleLessbad với (L
5
)=0.495;
L
6
=W (phần tử trung hòa) với (W)=0.6 =; L
7
=LessLessLessGood với
(L
7
)=0.7012; L
8
=PosibleGood với (L
8
)=0.7999; L
9
=VeryMoreGood với
(L
9
)=0.894; L
10
=VeryVeryGood với (L
10
)=0.99; còn L
11

=I. Với W,0, I lần
lượt là phần tử trung hòa, nhỏ nhất và lớn nhất trên AX (xem [5]).
Sử dụng kết quả chấm của giáo viên về độ thỏa mãn theo từng nhãn L
i

trong bài kiểm tra của học sinh theo phương pháp của Lee-Chen nói ở trên, ở đây
tính toán lại theo phương pháp trong bài, kết quả sẽ là:
Thỏa mãn các tiêu chuẩn




16

Câu 1

Câu 2

Câu 3

Điểm câu
M
S
H
S

TC1

TC2


D(C
1)
TC
1 TC2

TC3

D(C
2)
TC1

TC2

TC3

D(C3)

Câu
1
Câu
2
Câu
3
Điể
m
t/bài

1

0,30


0,02

0,09

0,3
1 0,1

0,19

0,16

0,07

0,1

0,2

0,10
0,27

0,48

0,4

1,2
2

0,80


0,75

0,76

0,5
5
0,7

0,65

0,66

0,85

0,68

0,77

0,76
2,28

1,98

3,04

7,3
3

0,80


0,86

0,85

0,5
5
0,6

0,45

0,56

0,54

0,3

0,37

0,4
2,55

1,68

1,6

5,8
4

0,95


0,97

0,97

0 0,1

0,11

0,08

0,4

0,1

0,4

0,25
2,91

0,24

1
4,2
5

0,55

0,69

0,66


0,5
7
0,76

0,65

0,70

0,12

0,15

0,05

0,13
1,98

2,1

0,52

4,6
6

0,95

0,75

0,8


0,6
5
0,79

0,79

0,76

0,7

0,7

0,71

0,7
2,4

2,28

2,8

7,5


17

7

0,60


0,75

0,71

0,5
6
0,71

0,56

0,65

0,11

0,55

0,4

0,36
2,13

1,95

1,44

5,5
8

0,55


0,66

0,63

0,4
4 0,1

0,6

0,27

0,62

0,5

0,36

0,53
1,89

0,81

2,12

4,8
9

0,95


1
0,99

0,9
4 0,94

0,85

0,92

0,96

0,91

0,95

0,93
2,97

2,76

3,72

9,5
10

0,72

0,64


0,66

0,6
9 0,81

0,89

0,8

0,74

0,55

0,74

0,65
1,98

2,4

2,6

7
11

0,30

0,45

0,41


0,4
9 0,65

0,81

0,65

0,76

0,94

0,79

0,85
1,23

1,95

3,4

6,6
12

0,80

0,9

0,88


0,7

0,9

0,75

0,83

0,55

0,6

0,85

0,61
2,64

2,49

2,44

7,6
13

0,75

0,75

0,75


0,9
6 1 0,85

0,96

0,85

0,6

0,46

0,69
2,25

2,88

2,76

7,9
14

0,69

0,65

0,66

0,5

0,71


0,54

0,63

0,46

0,31

0,7

0,41
1,98

1,89

1,64

5,5
15

0,81

0,9

0,88

0,6
1
0,79


0,8

0,76

0,61

0,2

0,33

0,38
2,64

2,28

1,52

6,4


18

16

0,80

0,38

0,49


0,9

0,75

0,9

0,81

0,75

0,79

0,89

0,78
1,47

2,43

3,12

7
17

0,69

0,8

0,77


0,6

0,8

0,7

0,74

0,4

0,1

0,45

0,26
2,31

2,22

1,04

5,6
18

0,95

0,8

0,84


0,4
4 0,79

0,64

0,69

0,32

0,19

0,59

0,28
2,52

2,07

1,12

5,7
19

0,80

0,85

0,84


0,2
1 0,45

0,6

0,43

0,65

0,65

0,9

0,68
2,52

1,29

2,72

6,5
20

0,94

0,95

0,95

0,9

5 0,89

0,95

0,91

0,8

0,91

0,85

0,86
2,85

2,73

3,44

9
21

0,65

0,65

0,65

0,4
5 0,6


0,65

0,58

0,64

0,31

0,32

0,44
1,95

1,74

1,76

5,5
22

0,90

0,98

0,96

0,5
5
0,9


0,8

0,81

0,6

0,6

0,45

0,59
2,88

2,43

2,36

7,7
23

0,80

0,89

0,87

0,5
7
0,49


0,78

0,56

0,2

0,32

0,84

0,32
2,61

1,68

1,28

5,6
24

0,89

0,65

0,71

0,4
5
0,5


0,55

0,5

0,9

0,95

0,9

0,93
2,13

1,5

3,72

7,4


19

25

0,70

0,66

0,67


0,5
1
0,5

0,5

0,5

0,6

0,18

0,38

0,37
2,01

1,5

1,48

5
26

0,95

0,94

0,94


0,8
5 0,9

0,81

0,87

0,91

1 0,98

0,96
2,82

2,61

3,84

9,3
27

0,55

0,44

0,47

0,2
1 0,1


0,1

0,12

0,62

0,4

0,6

0,51
1,41

0,36

2,04

3,8
28

0,79

0,89

0,87

0,8

0,2


0,08

0,3

0,6

0,8

0,92

0,73
2,61

0,9

2,92

6,4
29

0,75

0,45

0,53

0,2

0,11


0,1

0,13

0,1

0,11

0,2

0,12
1,59

0,39

0,48

2,5
30

0,69

0,85

0,81

0,4
9 0,21


0,15

0,25

0,6

0,1

0,75

0,37
2,43

0,75

1,48

4,7
31

1,00

0,96

0,97

0,9
5
1 0,9


0,97

0,76

0,65

0,55

0,68
2,91

2,91

2,72

8,5
32

0,85

0,65

0,7

0,5
5
1 0,81

0,87


0,65

0,65

0,93

0,68
2,1

2,61

2,72

7,4
33

0,75

0,45

0,53

0,7
5
0,8

0,85

0,8


0,66

0,66

0,75

0,67
1,59

2,4

2,68

6,7


20

34

0,84

0,6

0,66

0,9
1
0,95


1
0,95

0,65

0,55

0,4

0,58
1,98

2,85

2,32

7,2
35

0,84

0,75

0,77

0,6

0,95

0,85


0,86

0,55

0,37

0,15

0,42
2,31

2,58

1,68

6,6
36

0,09

0,1

0,1

0,7

0,7

0,72


0,7

0,88

0,75

0,83

0,81
0,3

2,1

3,24

5,6
37

0,39

0,1

0,17

0,6

0,49

0,2


0,45

0,65

0,8

0,55

0,72
0,51

1,35

2,88

4,7
38

0,50

0,35

0,39

0,5

0,65

0,11


0,51

0,11

0,7

0,69

0,46
1,17

1,53

1,84

4,5
39

0,51

0,1

0,2

0,6
5 0,75

0,79


0,74

0,55

0,18

0,55

0,37
0,6

2,22

1,48

4,3
40

0,90

0,81

0,83

0,6
1 0,6

0,65

0,61


0,64

0,61

0,49

0,61
2,49

1,83

2,44

6,8
Sử dụng công thức Pearson để tính độ tương quan giữa 2 phương pháp thực
nghiệm, ta được hệ số tương quan giữa hai phương pháp R=0,98%. Điều này
chứng tỏ hai phương pháp đánh giá là tương đương.
Lưu ý: Trên đây có thể xây dựng đại số gia tử của biến ngôn ngữ thể hiện
cấp độ tốt, xấu với tập gia tử H chỉ với 2 từ nhấn là Less và Very như trong các
nhãn của Lee-Chen. Tuy vậy, trong thực nghiệm chúng tôi thấy các nhãn phải
được đặt tương ứng với các giá trị ngôn ngữ có chuỗi từ nhấn quá dài.


21

IV. MỘT PHƯƠNG PHÁP THỰC NGHIỆM ĐỂ XÁC ĐỊNH
CÁC THAM SỐ TRONG ÁNH XẠ ĐỊNH LƯỢNG NGỮ NGHĨA
TRÊN ĐẠI SỐ GIA TỬ
Theo [5] khi thực hiện định lượng ngữ nghĩa các giá trị ngôn ngữ trên đại số

gia tử, chúng ta cần có các tham số: , , (h
i
) và  để xây dựng ánh xạ lượng
hóa ngữ nghĩa . Tuy nhiên, việc xác định các tham số nói trên, theo chúng tôi
chưa có cơ sở để xác định chúng.
Qua kết quả thu nhận được trong khi thực hiện bài này, chúng tôi đưa ra
một phương pháp thực nghiệm để xác định các tham số nói trên theo các bước
như sau:
B1. Lấy mẫu thực nghiệm là các bài kiểm tra của học sinh, được tổ chức
kiểm tra đánh giá nghiêm túc.
B2. Tổ chức cho các giáo viên có kinh nghiệm (chuyên gia) chấm các bài
kiểm tra nói trên theo phương pháp truyền thống.
B3. Thực hiện chấm theo phương pháp của Lee-Chen [11].
B4. Thực hiện xác định các tham số , , (h
i
) và  để định lượng ngữ
nghĩa giá trị ngôn ngữ trong đại số AX nói ở phần trên, từ đó định lượng ngữ


22

nghĩa cho các nhãn chấm L
i
theo phương pháp điểm mờ của Lee -Chen. Ở bước
này cũng cần lưu ý đến việc đặt tương ứng các nhãn L
i
với các giá trị ngôn ngữ
thích hợp trong AX, sao cho giá trị định lượng gần với các giá trị T(L
i
) trong

phương pháp của Lee-Chen.
B5. Sử dụng độ thỏa mãn với các nhãn L
i
trong cách chấm theo phương
pháp Lee-Chen ở B3, tiến hành tính toán điểm của các bài kiểm tra của học sinh
theo phương pháp trong bài này.
B6. Sử dụng công thức Pearson để đánh giá độ tương quan của các kết quả
chấm ở B2, B3, B5.
B7. Nếu: Kết quả chấm ở B2, B3, B5 có độ tương quan cao vượt một mức
nào đó cho phép trong thống kê thì các tham số để định lượng ngữ nghĩa ở B4 là
phù hợp.
Ngược lại: Điều chỉnh các tham số nói trên và điều chỉnh việc đặt tương
ứng các nhãn L
i
với các giá trị ngôn ngữ trong AX cho đến khi các kết quả
chấm ở B2, B3, B5 đạt độ tương quan cần thiết.
Mặc dù khi điều chỉnh các tham số, tưởng chừng chúng ta phải tính toán lại
một khối lượng tính toán lớn. Nhưng trong thực nghiệm cho thấy, khi đã xác định
các công thức tính rõ ràng, thì việc thay đổi tham số sẽ dẫn đến các kết quả cần
thiết thay đổi theo, nên cách làm trên là hoàn toàn khả thi.


23

Hơn nữa, nếu xem các kết quả đánh giá của Lee-Chen là phù hợp với cách
chấm của các giáo viên có kinh nghiệm (chuyên gia) thì ở B6 chỉ cần đánh giá độ
tương quan của kết quả chấm ở B3 và B5 là đủ.

V. KẾT LUẬN
Các vấn đề về xác định độ đo, các phương pháp lượng giá và các tiêu chí để

đánh giá học sinh trong giáo dục là một vấn đề hết sức thú vị nhưng rất phức tạp,
không được đi sâu trong bài này. Chúng ta chỉ giới hạn phạm vi là dựa trên cơ sở
khoa học và các ưu điểm của việc đánh giá học sinh dựa trên lý thuyết logic mờ,
đồng thời dựa trên các tiêu chí đánh giá của Lee-Chen để đưa ra một phương
pháp đánh giá mới có thể cải tiến được các nhược điểm của phương pháp của
Lee-Chen.
Bên cạnh đó, chúng ta cũng so sánh được kết quả đánh giá theo 2 phương
pháp qua số liệu thực nghiệm nhờ công thức Pearson trong lý thuyết thống kê.
Hơn nữa, chúng ta cũng đã đưa ra một phương pháp thực nghiệm để xác
định các tham số cho ánh xạ lượng hóa ngữ nghĩa  và xác định việc đặt tương
ứng các nhãn ngôn ngữ với các giá trị ngôn ngữ nào trong đại số gia tử. Điều này
theo chúng tôi là khá quan trọng khi giải bài toán mô hình mờ theo phương pháp
nội suy trên cơ sở đại số gia tử [2][10] với công cụ lượng hóa ngữ nghĩa và việc
xác định sai số của bài toán. Vì khi giải bài toán mô hình mờ, thì các vấn đề vừa
nói là phải có cơ sở để thực nghiệm trước các tham số.


24

Phương pháp trên có thể mở rộng trong bài toán tích hợp mờ để xây dựng
hệ trợ giúp ra quyết định, có thể ứng dụng trong các bài toán có tính thực tiễn
như đánh giá phân mức báo chí (evaluating grades of journals) [12].
Xét bài toán đánh giá tham gia bởi một cá nhân và thể hiện đánh giá dưới
dạng giá trị độ thuộc vào mức điểm hoặc dưới dạng các từ ngữ mang giá trị thể
hiện ý kiến đánh giá, khi đó quá trình đánh giá học tập là một bài toán ra quyết
định. Do đó, có liên quan đến tích hợp mờ, giải bài toán mô hình mờ Do đó kết
quả trong bài có thể được vận dụng trong bước lập luận xấp xỉ trên mô hình mờ,
khi xây dựng hệ hỗ trợ ra quyết định đánh giá học sinh.
Lời cảm ơn: Các tác giả xin chân thành cảm ơn TS. Vương Đình Thắng
trường ĐHSP Huế đã cho các ý kiến về bài toán đánh giá học sinh. Cảm ơn cô

giáo Nguyễn Thị Hoàng Anh trường THCS Trần Cao Vân, Huế đã cho các số
liệu thực nghiệm khi chấm 40 bài kiểm tra theo phương pháp sử dụng logic mờ.

TÀI LIỆU THAM KHẢO
1. Nguyễn Thị Hoàng Anh. Phương pháp đánh giá học sinh dựa trên lý
thuyết tập mờ, Luận văn tốt nghiệp Thạc sỹ CNTT, ĐHBK Hà Nội
(2001)
2. Nguyễn Hải Châu. Nghiên cứu điều khiển tương tranh tài nguyên
trên mạng máy tính, Luận án Tiến sỹ Toán học, Hà Nội (1999).


25

3. Griffin, Patrick and Peter Nix. Educational Assesment, Reporting, A
new approach, NSW, Australia (1991).
4. Đào Hữu Hồ. Xác suất - thống kê, NXB KHKT Hà Nội (2002).
5. Nguyen Cat Ho, Tran Thai Son, Tran Đinh Khang and Le Xuan Viet.
Fuzziness Measure, Quantified Semantic Mapping and Interpolative
Method of Approximate Reasoning in Medical Expert Systems, Tạp
chí Tin học và Điều khiển học, T.18, S.3 (2002) 237- 252.
6. Trần Bá Hoành. Đánh giá trong giáo dục, Hà Nội (1996).
7. Vũ Minh Lộc. Xây dựng các thuật toán tích hợp mờ để hình thành hệ
trợ giúp quyết định đánh giá học sinh, Tạp chí Bưu chính Viễn thông
- Các công trình nghiên cứu - triển khai Viễn thông và Công nghệ
thông tin, T10 (2003) 103 -109.
8. Owen J. M. Program evaluation. Forms and approaches, Allen &
Unwin, NSW, Australia (1993)
9. R Biswais. An application of fuzzy set in student's evaluation, Fuzzy
set and systems, No 74 (1995) 187 -194.
10. Trần Thái Sơn, Nguyễn Thế Dũng. Một phương pháp nội suy giải

bài toán mô hình mờ, trên cơ sở đại số gia tử, Báo cáo Hội nghị Tin
học Toàn quốc, Thái Nguyên (2003).

×