Tải bản đầy đủ (.pdf) (40 trang)

BÀI TẬP PHÂN TÍCH ĐỀ THI VÀ KẾT QUẢ THI Môn tiếng Anh kỳ thi tuyển sinh vào lớp 10 trường THPT chuyên Quang Trung – năm học 2010 - 2011

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.16 MB, 40 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC






BÀI TẬP
PHÂN TÍCH ĐỀ THI VÀ KẾT QUẢ THI
Môn tiếng Anh kỳ thi tuyển sinh vào lớp 10
trường THPT chuyên Quang Trung – năm học 2010 - 2011
Môn học: Mô hình Rasch và Phân tích dữ liệu bằng phần mềm QUEST


Giảng viên: TS Phạm Xuân Thanh




Học viên: Nguyễn Văn Nghiêm

Lớp Thạc sĩ Đo lường đánh giá
Khóa 3 (2010) TP. HCM



TP. Hồ Chí Minh, tháng 5/2011
Trang | 1
MỤC LỤC


MỤC LỤC 1
Chương 1. Tổng quan tiểu luận 2
1. Giới thiệu về dữ liệu đề thi 2
2. Mục đích, yêu cầu 2
3. Cấu trúc tiểu luận gồm 5 chương: 2
4. Phương pháp thực hiện 3
Chương 2. Phân tích đề thi bằng lý thuyết cổ điển 4
1. Độ khó của câu hỏi thi: 4
2. Các khả năng nhầm đáp án 5
3. Chất lượng của các phương án sai (mồi nhử) 5
4. Độ phân biệt của câu hỏi thi 8
5. Hệ số tương quan giữa điểm của câu hỏi thi với điểm toàn bài thi 9
6. Độ tin cậy của đề thi 10
7. Kết luận chương 2 10
Chương 3. Xử lý số liệu và phân tích đề thi bằng lý thuyết hiện đại 12
1. Sự phù hợp của câu hỏi thi 12
1.1. Mức độ phù hợp với mô hình: 12
1.2. Mức độ phù hợp của các câu hỏi với nhau 13
2. Phân bố độ khó câu hỏi thi và năng lực thí sinh 14
3. Các chỉ số thống kê của câu hỏi 16
4. Khảo sát các câu hỏi có tính định kiến, thiên vị 18
5. Kết luận chương 3 20
Chương 4. Kết luận & kiến nghị 22
PHỤ LỤC 24


Trang | 2
Chương 1. Tổng quan tiểu luận

1. Giới thiệu về dữ liệu đề thi

Bộ dữ liệu là kết quả làm bài đề thi tuyển vào lớp 10 trường THPT
chuyên Quang Trung năm học 2010 – 2011 môn tiếng Anh với 50 câu hỏi trắc
nghiệm (dạng 4 lựa chọn) gồm 1625 thí sinh tham gia dự thi.
File dữ liệu có 54 biến gồm: mahs, mahuyen, matruong, gioi, Cau1, Cau2,
Cau3, Cau4, Cau5, Cau6, Cau7, Cau8, Cau9, Cau10, Cau11, Cau12, Cau13,
Cau14, Cau15, Cau16, Cau17, Cau18, Cau19, Cau20, Cau21, Cau22, Cau23,
Cau24, Cau25, Cau26, Cau27, Cau28, Cau29, Cau30, Cau31, Cau32, Cau33,
Cau34, Cau35, Cau36, Cau37, Cau38, Cau39, Cau40, Cau41, Cau42, Cau43,
Cau44, Cau45, Cau46, Cau47, Cau48, Cau49, Cau50. Trong đó mahs là mã số
thí sinh (case), mahuyen là mã huyện (nơi thí sinh cư trú), matruong là mã số
trường thí sinh học lớp 9, gioi là thông tin về giới tính (0 là nữ, 1 là nam) và các
biến từ Cau1 đến Cau50 là kết quả trả lời của 50 câu trắc nghiệm (item).
2. Mục đích, yêu cầu
Tiểu luận này vận dụng lý thuyết khảo thí cổ điển và lý thuyết khảo thí
hiện đại nhằm đánh giá câu hỏi thi. Qua đó có thể trả lời các câu hỏi nghiên cứu
như:
- Đề thi có phù hợp với năng lực của nhóm thí sinh dự thi hay không? Nếu
chưa phù hợp thì cần điều chỉnh như thế nào?
- Có câu hỏi nào trong đề không phù hợp và cần chỉnh sửa hay loại bỏ hay
không?
Những phân tích này là cơ sở để lựa chọn câu hỏi đạt chất lượng xây dựng
ngân hàng câu hỏi thi cho kỳ thi tuyển đầu vào trường THPT chuyên Quang
Trung. Đồng thời đưa ra khuyến cáo cho công tác viết câu hỏi trắc nghiệm trong
những lần ra đề sau này đạt chất lượng được tốt nhất.
3. Cấu trúc tiểu luận gồm 4 chương:
Chương 1. Tổng quan tiểu luận
Chương 2. Phân tích đề thi bằng lý thuyết cổ điển
Trang | 3
Chương 3. Phân tích đề thi bằng lý thuyết hiện đại
Chương 4. Kết luận

4. Phương pháp thực hiện
Sử dụng phần mềm MS Excel, Quest, SPSS để xử lý số liệu.
Dựa trên lý thuyết khảo thí cổ điển và khảo thí hiện đại (mô hình Rasch)
để phân tích số liệu được xử lý bằng các phần mềm nói trên.

Trang | 4
Chương 2. Phân tích đề thi bằng lý thuyết cổ điển

1. Độ khó của câu hỏi thi:
Độ khó của câu hỏi thi (P) là tỷ lệ thí sinh trả lời đúng so với tổng số thí
sinh tham gia trả lời câu hỏi đó. Kết quả phân tích số liệu được thể hiện ở bảng
thống kê dưới đây:
Câu
Phương án
Sót
Độ
khó

Câu
Phương án
Sót
Độ
khó
A
B
C
D
A
B
C

D
1
13.05
9.35
6.40
70.65
0.55
0.71
26
11.88
65.35
13.85
8.12
0.80
0.65
2
67.38
4.18
18.09
9.72
0.62
0.67
27
37.42
18.58
22.34
20.18
1.48
0.37
3

5.48
15.75
55.51
21.54
1.72
0.56
28
11.26
16.62
29.60
41.54
0.98
0.42
4
51.69
27.38
8.92
11.32
0.68
0.52
29
27.45
9.91
9.42
52.12
1.11
0.52
5
19.02
37.48

30.46
11.63
1.42
0.37
30
15.75
11.69
42.77
28.62
1.17
0.43
6
24.92
16.62
14.89
42.34
1.23
0.25
31
16.98
41.17
15.57
24.86
1.42
0.41
7
14.28
13.54
61.91
9.42

0.86
0.62
32
27.94
18.28
39.82
12.31
1.66
0.40
8
38.77
19.51
18.15
20.98
2.58
0.39
33
6.71
48.00
24.86
19.63
0.80
0.48
9
12.80
52.86
18.71
14.22
1.42
0.53

34
16.68
12.43
23.02
46.46
1.42
0.46
10
13.72
52.49
14.95
18.09
0.74
0.52
35
19.57
15.69
49.42
14.15
1.17
0.49
11
16.80
8.80
12.06
61.48
0.86
0.61
36
15.75

15.20
25.66
42.52
0.86
0.43
12
21.97
22.34
36.55
17.78
1.35
0.37
37
24.00
26.22
37.91
10.34
1.54
0.38
13
11.02
60.00
9.91
18.34
0.74
0.60
38
50.03
12.74
12.80

23.32
1.11
0.50
14
56.37
12.55
19.88
9.78
1.42
0.56
39
61.23
11.14
15.88
10.65
1.11
0.61
15
32.49
19.02
21.54
26.22
0.74
0.32
40
17.29
7.63
51.45
22.46
1.17

0.51
16
21.91
25.11
30.28
21.91
0.80
0.30
41
34.03
18.95
24.55
21.23
1.23
0.34
17
15.57
48.25
24.18
11.08
0.92
0.48
42
17.42
16.74
25.42
39.75
0.68
0.40
18

21.11
16.18
34.77
26.95
0.98
0.27
43
22.46
41.91
19.26
15.51
0.86
0.42
19
50.65
10.34
16.92
21.11
0.98
0.51
44
14.95
53.54
15.32
15.38
0.80
0.54
20
4.86
3.57

3.88
87.20
0.49
0.87
45
21.54
42.46
18.65
16.49
0.86
0.42
21
19.08
16.25
47.51
16.12
1.05
0.48
46
14.03
54.77
15.45
14.95
0.80
0.55
22
20.80
13.78
27.08
36.86

1.48
0.37
47
24.31
25.97
35.94
12.43
1.35
0.36
23
11.88
60.62
12.49
13.97
1.05
0.61
48
9.42
43.57
24.98
21.42
0.62
0.44
24
51.69
32.00
7.57
8.25
0.49
0.52

49
17.72
14.71
24.43
42.03
1.11
0.42
25
21.42
45.60
17.85
14.03
1.11
0.46
50
21.66
16.31
26.09
34.71
1.23
0.35
Bảng 1. Độ khó câu hỏi thi
Độ khó
>0.8
>0.7
>0.65
>=0.6
<0.6
<0.55
<0.5

<0.45
<0.4
<0.3
<0.2
Số câu
1
2
4
9
41
39
29
23
15
2
0
(%)
2.0
4.0
8.0
18.0
82.0
78.0
58.0
46.0
30.0
4.0
0.0
Bảng 1.1. Thống kê phân bổ độ khó
Trang | 5

Theo thuyết khảo thí cổ điển, Osterlind (1989), thì giá trị độ khó càng lớn
cho thấy câu hỏi càng dễ, độ khó của câu hỏi nằm trong khoảng 0.4 đến 0.8 là
chấp nhận được. Thống kê dữ liệu cho thấy độ khó trung bình của của 50 câu
hỏi là 0.48 và rải từ 0.25 đến 0.87. Chỉ có 1 câu có độ khó lớn hơn 0.8, có đến
15 câu có độ khó p < 0.4 câu chiếm tỷ lệ 30% số câu trong đề thi, số câu có độ
khó từ 0.6 trở lên chỉ có 9 câu (chiếm 18%) và có đến 41 câu có độ khó dưới 0.6
(chiếm 82%). Như vậy, hầu hết các câu hỏi của bài test này thuộc loại khó đối
với nhóm học sinh tham gia nghiên cứu này.
Nhận xét: Đề thi có quá nhiều câu hỏi khó và thiếu các câu dễ. Cần tăng
cường, bổ sung các câu dễ mới đánh giá được năng lực của học sinh. Các câu 5,
6, 8, 12, 15, 16, 18, 22, 27, 32, 37, 41, 42, 47, 50 có độ khó < 0.4 cần được điều
chỉnh trước khi chọn vào ngân hàng câu hỏi vì là những câu này quá khó. Câu
20 có độ khó p = 0.87 là một câu hỏi quá dễ cũng cần được điều chỉnh.
2. Các khả năng nhầm đáp án
Nhầm đáp án là trường hợp đa số thí sinh tham gia làm bài chọn phương
án khác với đáp án. Trường hợp nhầm đáp án có thể xảy ra bởi các nguyên nhân:
có thể do người viết câu hỏi có sự nhầm lẫn, cũng có thể do phần lớn thí sinh
tham gia làm bài hiểu sai câu hỏi hoặc được dạy sai kiến thức, cũng có thể do
câu hỏi quá khó khiến thí sinh đoán mò và trùng hợp là phần đông thí sinh đoán
mò trùng một phương án (trường hợp này xác xuất xảy ra là rất thấp).
Bảng 1 cho thấy có 2 trường hợp nhầm đáp án. Đó là câu 6 và câu 18 .
Các câu này cần được điều chỉnh hoặc loại bỏ.
3. Chất lượng của các phương án sai (mồi nhử)
Phương án sai hay gọi là mồi nhử là các phương án ngoài đáp án. Mồi
nhử tốt là mồi nhử có tỷ lệ lựa chọn gần với tỷ lệ mong muốn được tính theo
công thức: i = (1 – P)/(k – 1) x 100%.
Trong đó: P là độ khó của câu hỏi;
Trang | 6
k là số phương án trả lời.
Ví dụ câu hỏi 4 lựa chọn có độ khó là 0.6 thì tỷ lệ mồi nhử mong muốn là

(1 – 0.6)/(4-1) x 100% = 13.33 % cho mỗi phương án. Cùng với cách tính này ở
đây ta xác định mồi nhử kém khi tỷ lệ lựa chọn nhỏ hơn 50% tỷ lệ mong muốn.
Từ dữ liệu thống kê được ta thấy bài test có đến 6 câu xuất hiện mồi nhử
kém (gồm các câu: 2, 3, 24, 33, 37, 40).
Ở bảng 2 dưới đây, khi so sánh các phương án sai giữa nhóm trên gồm
những thí sinh có kết quả điểm toàn bài thi cao nhất chiếm 27% tổng số thí sinh
(Nh. trên) với nhóm dưới gồm những thí sinh có kết quả điểm toàn bài thi thấp
nhất chiếm 27% tổng số thí sinh (Nh. dưới) cho thấy có 22 câu có độ lệch rất
thấp (trong khoảng ±0.1). Điều này cho thấy các phương án sai này không có
hiệu quả đối với cả 2 nhóm có năng lực khác nhau.
Độ lệch của các phương án là đáp án của đề thi tương đối tốt. Có 46 câu
(92%) có độ lệch đáp án >0.2, trong đó có 13 câu có độ lệch đáp án >0.5. Có 2
câu có độ lệch đáp án <0 cần phải loại bỏ hoặc chỉnh sửa, đó là câu 6 và câu 18.
Trong 22 câu có độ lệch trong khoảng ± 0.1 thì có 19 câu là câu có mồi
nhử kém đã được tính ở trên (gồm các câu: 1, 7, 8, 12, 13, 14, 15, 16, 18, 19, 20,
21, 28, 29, 30, 31, 38, 41, 48) (chiếm 38% số câu trong đề thi). Điều này có
nghĩa là cả nhóm trên và nhóm dưới đều rất ít thí sinh chọn, cho thấy những mồi
nhử ấy thật sự là mồi nhử kém.
Nhận xét: Chất lượng của các phương án sai (mồi nhử) không cao vì cả
học sinh kém và học sinh giỏi đều có tỷ lệ trả lời sai gần nhau. Có nhiều câu cả
nhóm trên và nhóm dưới đều rất ít thí sinh chọn, cho thấy những mồi nhử ấy thật
sự là mồi nhử kém, nhất định phải chỉnh sửa mồi nhử trước khi đưa vào ngân
hàng câu hỏi hoặc có thể loại bỏ.
P.án
A
B
C
D
Câu
N.Trên

N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
1.
0.06
0.16
-0.10
0.04
0.15
-0.11
0.04
0.06
-0.02
0.86
0.63
0.23
Trang | 7
P.án
A
B
C
D

Câu
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
2.
0.90
0.53
0.37
0.01
0.05
-0.05
0.05
0.24
-0.19
0.04
0.16
-0.13
3.
0.06
0.07
-0.01

0.08
0.23
-0.15
0.77
0.36
0.41
0.08
0.32
-0.24
4.
0.76
0.30
0.46
0.16
0.36
-0.19
0.04
0.14
-0.10
0.03
0.19
-0.16
5.
0.08
0.28
-0.20
0.66
0.18
0.49
0.21

0.33
-0.12
0.03
0.19
-0.15
6.
0.11
0.31
-0.19
0.06
0.22
-0.15
0.05
0.25
-0.19
0.76
0.21
0.55
7.
0.06
0.23
-0.17
0.02
0.23
-0.21
0.87
0.38
0.49
0.05
0.14

-0.10
8.
0.63
0.26
0.37
0.16
0.25
-0.09
0.10
0.19
-0.08
0.09
0.27
-0.18
9.
0.05
0.19
-0.13
0.79
0.31
0.48
0.08
0.28
-0.21
0.07
0.21
-0.14
10.
0.05
0.22

-0.17
0.79
0.30
0.49
0.07
0.24
-0.17
0.09
0.23
-0.15
11.
0.06
0.27
-0.21
0.02
0.14
-0.12
0.06
0.16
-0.10
0.85
0.41
0.45
12.
0.21
0.22
-0.01
0.15
0.27
-0.12

0.56
0.22
0.34
0.08
0.25
-0.18
13.
0.03
0.20
-0.17
0.81
0.39
0.41
0.05
0.13
-0.08
0.10
0.26
-0.16
14.
0.06
0.16
-0.10
0.04
0.15
-0.11
0.04
0.06
-0.02
0.86

0.63
0.23
15.
0.90
0.53
0.37
0.01
0.05
-0.05
0.05
0.24
-0.19
0.04
0.16
-0.13
16.
0.06
0.07
-0.01
0.08
0.23
-0.15
0.77
0.36
0.41
0.08
0.32
-0.24
17.
0.76

0.30
0.46
0.16
0.36
-0.19
0.04
0.14
-0.10
0.03
0.19
-0.16
18.
0.08
0.28
-0.20
0.66
0.18
0.49
0.21
0.33
-0.12
0.03
0.19
-0.15
19.
0.11
0.31
-0.19
0.06
0.22

-0.15
0.05
0.25
-0.19
0.76
0.21
0.55
20.
0.06
0.23
-0.17
0.02
0.23
-0.21
0.87
0.38
0.49
0.05
0.14
-0.10
21.
0.63
0.26
0.37
0.16
0.25
-0.09
0.10
0.19
-0.08

0.09
0.27
-0.18
22.
0.05
0.19
-0.13
0.79
0.31
0.48
0.08
0.28
-0.21
0.07
0.21
-0.14
23.
0.05
0.22
-0.17
0.79
0.30
0.49
0.07
0.24
-0.17
0.09
0.23
-0.15
24.

0.06
0.27
-0.21
0.02
0.14
-0.12
0.06
0.16
-0.10
0.85
0.41
0.45
25.
0.21
0.22
-0.01
0.15
0.27
-0.12
0.56
0.22
0.34
0.08
0.25
-0.18
26.
0.03
0.20
-0.17
0.81

0.39
0.41
0.05
0.13
-0.08
0.10
0.26
-0.16
27.
0.77
0.36
0.41
0.07
0.17
-0.10
0.09
0.32
-0.23
0.05
0.13
-0.08
28.
0.61
0.16
0.44
0.06
0.27
-0.21
0.16
0.24

-0.08
0.17
0.31
-0.14
29.
0.15
0.25
-0.10
0.26
0.24
0.02
0.45
0.21
0.23
0.14
0.28
-0.14
30.
0.08
0.22
-0.14
0.76
0.27
0.49
0.12
0.32
-0.20
0.04
0.18
-0.14

31.
0.14
0.25
-0.12
0.14
0.17
-0.03
0.53
0.25
0.28
0.18
0.31
-0.13
32.
0.73
0.36
0.37
0.05
0.14
-0.08
0.14
0.19
-0.05
0.07
0.30
-0.23
33.
0.01
0.11
-0.10

0.03
0.05
-0.02
0.02
0.08
-0.06
0.94
0.76
0.18
34.
0.12
0.26
-0.14
0.10
0.19
-0.09
0.67
0.30
0.37
0.10
0.23
-0.13
35.
0.07
0.30
-0.23
0.05
0.20
-0.15
0.17

0.31
-0.15
0.70
0.17
0.54
36.
0.05
0.20
-0.15
0.85
0.33
0.51
0.06
0.21
-0.15
0.05
0.25
-0.20
37.
0.80
0.24
0.56
0.10
0.50
-0.40
0.03
0.12
-0.08
0.06
0.13

-0.07
38.
0.10
0.25
-0.14
0.75
0.24
0.51
0.09
0.26
-0.16
0.05
0.24
-0.19
39.
0.05
0.19
-0.14
0.88
0.44
0.44
0.05
0.21
-0.15
0.02
0.15
-0.13
40.
0.68
0.17

0.51
0.11
0.24
-0.13
0.12
0.30
-0.18
0.09
0.27
-0.18
41.
0.03
0.18
-0.15
0.06
0.25
-0.19
0.27
0.29
-0.02
0.63
0.25
0.38
42.
0.14
0.38
-0.24
0.07
0.13
-0.07

0.03
0.17
-0.15
0.76
0.29
0.46
43.
0.13
0.19
-0.06
0.05
0.17
-0.12
0.44
0.33
0.11
0.38
0.29
0.09
Trang | 8
P.án
A
B
C
D
Câu
N.Trên
N.Dưới
Lệch
N.Trên

N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
44.
0.08
0.20
-0.12
0.64
0.27
0.37
0.06
0.21
-0.15
0.21
0.29
-0.08
45.
0.14
0.33
-0.18
0.12
0.23
-0.11
0.70
0.24

0.46
0.03
0.18
-0.14
46.
0.02
0.12
-0.10
0.82
0.23
0.60
0.09
0.34
-0.25
0.07
0.30
-0.23
47.
0.06
0.26
-0.20
0.03
0.23
-0.21
0.10
0.29
-0.19
0.81
0.21
0.61

48.
0.07
0.24
-0.17
0.06
0.23
-0.17
0.81
0.26
0.55
0.05
0.24
-0.19
49.
0.06
0.24
-0.18
0.04
0.25
-0.21
0.12
0.32
-0.20
0.78
0.18
0.60
50.
0.17
0.33
-0.15

0.13
0.32
-0.19
0.64
0.18
0.47
0.04
0.15
-0.10
Bảng 2. Độ lệch giữa nhóm trên và nhóm dưới.

>0.7
>0.6
>=0.5
>0.4
>0.3
>0.2
>0.1
>0
<0
Số câu
0
2
13
37
44
46
48
48
2

Tỷ lệ (%)
0
4
26
74
88
92
96
96
4
Bảng 2.2. Phân bổ độ lệch của đáp án
4. Độ phân biệt của câu hỏi thi
Độ phân biệt của câu hỏi thi là mức độ khác nhau về kết quả trả lời giữa
hai nhóm trên và dưới khi làm bài thi. Câu hỏi có chỉ số phân biệt nhỏ hơn hoặc
bằng 0 cần bị loại bỏ. Ebel (1956) đề xuất rằng các câu hỏi của bài test trong lớp
học nên có chỉ số phân biệt bằng 0,30 hoặc cao hơn. Một số tác giả khác cho
rằng độ phân biệt nên nằm trong khoảng 0,25-0,75. Tuy nhiên, trong các kỳ thi
có quy mô lớn, việc sử dụng một số câu hỏi thi quá dễ hoặc quá khó sẽ dẫn đến
độ phân biệt của câu hỏi thi có thể có giá trị quá thấp hoặc quá cao.
Đề thi này là một đề thi tuyển sinh đầu vào môn tiếng Anh của một
trường chuyên, là một đề thi khó đối với thí sinh dự thi nên độ phân biệt của câu
hỏi thi có thể sẽ cao. Độ phân biệt của từng câu hỏi được tính toán như Bảng 3
dưới đây.
Câu hỏi
Độ PB
Câu hỏi
Độ PB
Câu hỏi
Độ PB
Câu hỏi

Độ PB
Câu hỏi
Độ PB
1
0.23
11
0.45
21
0.37
31
0.37
41
0.43
2
0.37
12
0.34
22
0.54
32
0.46
42
0.52
3
0.41
13
0.41
23
0.51
33

0.60
43
0.48
4
0.46
14
0.41
24
0.56
34
0.61
44
0.47
5
0.49
15
0.44
25
0.51
35
0.55
45
0.47
6
-0.19
16
0.23
26
0.44
36

0.60
46
0.46
7
0.49
17
0.49
27
0.51
37
0.47
47
0.41
8
0.37
18
-0.13
28
0.38
38
0.40
48
0.52
9
0.48
19
0.37
29
0.46
39

0.45
49
0.54
10
0.49
20
0.18
30
0.11
40
0.50
50
0.46
Trang | 9
Bảng 3. Độ phân biệt câu hỏi thi
Độ phân biệt
>0.75
>0.6
>0.5
>=0.4
>=0.3
<0.25
Min
Mean
Max
Số câu:
0
2
13
37

44
6
-0.19
0.42
0.61
Tỷ lệ (%)
0
4
26
74
88
12
Bảng 3.1. Thống kê phân bổ độ phân biệt
Từ số liệu thống kê trên cho thấy các câu hỏi đều có độ phân biệt trung
bình là 0.42 rải từ -0.19 đến 0.61. Có 37 câu (chiếm 74%) đạt độ phân biệt từ 0.4
trở lên, 44 câu có độ phân biệt từ 0.30 trở lên (chiếm 88%) điều này cho thấy đề
thi có độ phân biệt rất tốt. Các câu có độ phân biệt chưa tốt (< 0.25) gồm 6 câu:
1, 6, 16, 18, 20, 30 trong đó có hai câu có độ phân biệt < 0 là câu 6, và câu 18
(cũng là 2 câu nhầm đáp án).
Nhận xét: Có 88% số câu hỏi đạt độ phân biệt trong khoảng chấp nhận
được (từ 0.25 đến 0.75) Số câu đạt độ phân biệt ở mức rất tốt chiếm 74% đề thi,
chứng tỏ độ phân biệt của đề thi là rất tốt. Tuy nhiên cần chỉnh sửa một số câu
có độ phân biệt chưa tốt như câu 1, 6, 16, 18, 20, 30.
5. Hệ số tương quan giữa điểm của câu hỏi thi với điểm toàn bài thi
Giữa kết quả điểm của từng câu hỏi thi với điểm chung của toàn bài thi
phải có mối tương quan thuận (hệ số tương quan dương). Mối tương quan chặt
chẽ giữa câu hỏi thi và toàn bài thi góp phần làm tăng độ tin cậy của bài test.
Cần giữ lại những câu hỏi thi có mối tương quan cao và loại bỏ những câu hỏi
có mối tương quan thấp hoặc dưới 0 để làm tăng độ tin cậy của đề thi. Theo
Griffin (1998), những câu hỏi tốt là những câu hỏi có hệ số tương (Pt-Biserial)

nằm trong khoảng 0.35 và 0.75.
Câu
HSTQ
Pt-
Biserial
Câu
HSTQ
Pt-
Biserial
Câu
HSTQ
Pt-
Biserial
Câu
HSTQ
Pt-
Biserial
Câu
HSTQ
Pt-
Biserial
1
0.23
11
0.35
21
0.31
31
0.32
41

0.40
2
0.35
12
0.31
22
0.48
32
0.42
42
0.47
3
0.34
13
0.35
23
0.42
33
0.48
43
0.40
4
0.38
14
0.35
24
0.43
34
0.47
44

0.39
5
0.42
15
0.44
25
0.42
35
0.46
45
0.40
6
-0.19
16
0.29
26
0.36
36
0.51
46
0.38
7
0.40
17
0.41
27
0.44
37
0.41
47

0.38
8
0.38
18
-0.13
28
0.30
38
0.34
48
0.43
Trang | 10
9
0.38
19
0.34
29
0.36
39
0.37
49
0.44
10
0.37
20
0.18
30
0.05
40
0.43

50
0.44
Bảng 4. Hệ số tương quan
Min
Mean
Max
-0.19
0.36
0.51
Bảng 4.1. Thống kê HSTQ
Bảng 4 cho thấy chỉ có 2 câu (6, 18) có hệ số tương quan giữa điểm của
câu hỏi thi với điểm toàn bài thi (point-biserial) < 0 nên cần phải loại bỏ. Các
câu còn lại có hệ số tương quan rải từ 0.05 đến 0.51 và có đến 43 câu (86%) đạt
trên 0.3 chứng tỏ các câu hỏi có mối tương quan thuận và khá mạnh với điểm
chung của bài thi.
6. Độ tin cậy của đề thi
Độ tin cậy của đề thi thể hiện được tính theo nhiều công thức khác nhau.
Tuy nhiên, độ tin cậy được xác định dựa trên tính ổn định bên trong của đề thi
thường được sử dụng. Kết quả tính toán bằng phần mềm QUEST cho thấy độ tin
cậy của đề thi đạt 0.99. Đây là một đề thi có độ tin cậy rất cao.
7. Kết luận chương 2
1. Đề thi và các câu hỏi trắc nghiệm có chất lượng tương đối tốt, độ tin
cậy của đề thi đạt rất cao (0.99) tuy nhiên có 2 trường hợp sai đáp án cần phải
loại bỏ và rút kinh nghiệm đối với công tác viết câu hỏi trắc nghiệm.
2. Đề thi quá ít những câu hỏi dễ nên không phân biệt được giữa những
học sinh có năng lực trung bình với học sinh yếu, kém. Nhìn chung đề thi này là
khó so với học sinh tham gia làm bài kiểm tra. Các câu 5, 6, 8, 12, 15, 16, 18,
22, 27, 32, 37, 41, 42, 47, 50 có độ khó p < 0.4; câu 20 có độ khó p=0.87 cần
được điều chỉnh trước khi chọn vào ngân hàng câu hỏi.
3. Chất lượng của các phương án sai (mồi nhử) không cao vì cả học sinh

kém và học sinh giỏi đều có tỷ lệ trả lời sai gần nhau. Các câu: 1, 7, 8, 12, 13,
14, 15, 16, 18, 19, 20, 21, 28, 29, 30, 31, 38, 41, 48, cả nhóm trên và nhóm dưới
đều rất ít thí sinh chọn (trong đó các câu 12, 15, 16, 18, 37, 41, 47 là những câu
có độ khó p<0.4) cho thấy những mồi nhử của các câu này thật sự là mồi nhử
Trang | 11
kém, cần phải chỉnh sửa mồi nhử trước khi đưa vào ngân hàng câu hỏi hoặc có
thể loại bỏ.
4. Có 88% số câu hỏi đạt độ phân biệt trong khoảng chấp nhận được (từ
0.25 đến 0.75) Số câu đạt độ phân biệt ở mức rất tốt chiếm 74% đề thi, chứng tỏ
độ phân biệt của đề thi là rất tốt. Tuy nhiên cần chỉnh sửa một số câu có độ phân
biệt chưa tốt như câu 1, 6, 16, 18, 20, 30.
5. Có 86% số câu hỏi đạt hệ số tương quan đạt trên 0.3 chứng tỏ các câu
hỏi có mối tương quan thuận và khá mạnh với điểm chung của bài thi. Riêng 2
câu có hệ số tương quan < 0 (tương quan nghịch với điểm toàn bài thi) cần phải
loại bỏ đó là câu 6 và câu 18.

Trang | 12
Chương 3. Xử lý số liệu và phân tích đề thi bằng lý thuyết hiện đại
Việc phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại cũng có thể đưa
ra những thông tin thống kê để phân tích câu hỏi thi như lý thuyết khảo thí cổ
điển. Tuy nhiên, việc phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại (sử
dụng phần mêm QUEST và các phần mềm chuyên dụng khác) còn có thể giúp
có được những thông tin đầy đủ hơn về đề thi và các câu hỏi thi. Để phân tích và
đánh giá đề thi này tác giả sẽ phân tích các chỉ số sau:
- Infit MNSQ
- Disc.
- Count
- Percent (%)
- Pt-Biserial
- P-value

- Mean ability
- Thresholds
- Error.
1. Sự phù hợp của câu hỏi thi
1.1. Mức độ phù hợp với mô hình:
Khi dữ liệu phù hợp với mô hình Rasch thì trị số kỳ vọng của các bình
phương trung bình (mean square) xấp xỉ bằng 1 và trị số kỳ vọng t xấp xỉ bằng
0. Từ các số liệu về giá trị trung bình Mean và độ lệch chuẩn SD có được từ file
ThiTS.map khi xử lý dữ liệu bằng phần mềm QUEST, ta thấy dữ liệu dùng để
phân tích là phù hợp với mô hình Rasch.
Trích file ThiTS.map:
Summary of item Estimates
=========================

Mean .00
SD .59
SD (adjusted) .59
Reliability of estimate .99


Fit Statistics
===============

Infit Mean Square Outfit Mean Square

Mean 1.00 Mean 1.01
SD .12 SD .17


Infit t Outfit t


Mean 46 Mean 20
SD 4.16 SD 3.29

0 items with zero scores
0 items with perfect scores

Trang | 13
1.2. Mức độ phù hợp của các câu hỏi với nhau
Trong biểu đồ Item Fit sau đây, mỗi câu trắc nghiệm biểu thị bằng dấu *.
Những câu trắc nghiệm nằm trong hai đường chấm thẳng đứng có giá trị trung
bình bình phương độ phù hợp INFIT MNSQ nằm trong khoảng (0.77;1.30) sẽ
phù hợp với mô hình Rasch. Nếu câu trắc nghiệm nào không phù hợp thì loại
bỏ.
Trong biểu đồ dưới đây ta thấy câu 6 và câu 18 có chỉ số phù hợp (INFIT
MNSQ) nằm ngoài vùng cho phép, cần loại bỏ.

INFIT
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30 1.40 1.50
1.60
+ + + + + + + + + + + +
1 item 1 . | * .
2 item 2 . * | .
3 item 3 . | * .
4 item 4 . * | .
5 item 5 . * | .
6 item 6 . | . *
7 item 7 . * | .
8 item 8 . *| .
9 item 9 . * | .

10 item 10 . *| .
11 item 11 . *| .
12 item 12 . | * .
13 item 13 . * .
14 item 14 . * .
15 item 15 . * | .
16 item 16 . | * .
17 item 17 . * | .
18 item 18 . | . *
19 item 19 . | * .
20 item 20 . |* .
21 item 21 . | * .
22 item 22 . * | .
23 item 23 . * | .
24 item 24 . * | .
25 item 25 . * | .
26 item 26 . * | .
27 item 27 . * | .
28 item 28 . | * .
29 item 29 . * .
30 item 30 . | *.
31 item 31 . | * .
32 item 32 . * | .
33 item 33 . * | .
34 item 34 . * | .
35 item 35 . * | .
36 item 36 . * | .
37 item 37 . * | .
38 item 38 . | * .
39 item 39 . * | .

40 item 40 . * | .
41 item 41 . * | .
42 item 42 . * | .
43 item 43 . * | .
44 item 44 . * | .
45 item 45 . * | .
46 item 46 . * | .
47 item 47 . * .
48 item 48 . * | .
49 item 49 . * | .
50 item 50 . * | .

Sau khi loại bỏ câu 6 và 18, dùng phần mềm Quest chạy lại thì xuất
hiện thêm câu 30 có chỉ số INFIT MNSQ = 1.33, ngoài khoảng cho phép
nên ta tiếp tục bỏ câu 30 và chạy dữ liệu lại lần thứ 3.
Sau khi loại bỏ câu 6, 18 và 30 ta còn 47 câu có chỉ số phù hợp
(INFIT MNSQ) nằm trong vùng cho phép theo mô hình Rasch được thể hiện ở
biểu đồ sau:
Trang | 14


INFIT
MNSQ .63 .67 .71 .77 .83 .91 1.00 1.10 1.20 1.30 1.40 1.50
1.60
+ + + + + + + + + + + +
1 item 1 . | * .
2 item 2 . *| .
3 item 3 . | * .
4 item 4 . * .
5 item 5 . *| .

7 item 7 . * | .
8 item 8 . | * .
9 item 9 . * .
10 item 10 . |* .
11 item 11 . |* .
12 item 12 . | * .
13 item 13 . | * .
14 item 14 . | * .
15 item 15 . * | .
16 item 16 . | * .
17 item 17 . * | .
19 item 19 . | * .
20 item 20 . |* .
21 item 21 . | * .
22 item 22 . * | .
23 item 23 . * | .
24 item 24 . * | .
25 item 25 . * | .
26 item 26 . *| .
27 item 27 . * | .
28 item 28 . | * .
29 item 29 . | * .
31 item 31 . | * .
32 item 32 . * | .
33 item 33 . * | .
34 item 34 . * | .
35 item 35 . * | .
36 item 36 . * | .
37 item 37 . * .
38 item 38 . | * .

39 item 39 . *| .
40 item 40 . * | .
41 item 41 . * .
42 item 42 . * | .
43 item 43 . * .
44 item 44 . * .
45 item 45 . * .
46 item 46 . * .
47 item 47 . | * .
48 item 48 . * | .
49 item 49 . * | .
50 item 50 . * | .


Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
Câu
INFIT
MNSQ
1

1.09
11
1.01
21
1.08
31
1.08
41
1.00
2
0.99
12
1.10
22
0.93
32
0.98
42
0.93
3
1.04
13
1.02
23
0.94
33
0.92
43
1.00
4

1.00
14
1.03
24
0.96
34
0.92
44
1.00
5
0.99
15
0.96
25
0.98
35
0.93
45
1.00
6
Bỏ
16
1.13
26
0.99
36
0.89
46
1.00
7

0.96
17
0.98
27
0.97
37
1.00
47
1.03
8
1.02
18
Bỏ
28
1.09
38
1.05
48
0.97
9
1.00
19
1.05
29
1.02
39
0.99
49
0.96
10

1.01
20
1.01
30
Bỏ
40
0.96
50
0.97
Bảng 5. Chỉ số Infit MNSQ
2. Phân bố độ khó câu hỏi thi và năng lực thí sinh
Sơ đồ phân bố độ khó câu hỏi thi và năng lực thí sinh cho thấy mức độ
phù hợp của đề thi đối với thí sinh dự thi. Kết quả xử lý bằng phần mềm QUEST
cho một bản đồ phân bố năng lực học sinh và độ khó câu hỏi thi.
Các thông tin về kết quả tính toán từ bảng Summary of case Estimates cho
thấy năng lực trung bình của mẫu thí sinh (case) tham gia bài kiểm tra (-0.02)
Trang | 15
nhỏ hơn và gần bằng so với độ khó chung của bài kiểm tra (0.00) cho thấy độ
khó của đề thi tương đối phù hợp với năng lực thí sinh.
Sử dụng lý thuyết khảo thí hiện đại, năng lực của học sinh và độ khó của
câu hỏi được đánh giá bằng thang logistic. Theo sơ đồ trên, các câu hỏi có độ
khó từ - 2.20 đến 0.92 (thang logistic). Trong khi đó, năng lực của thí sinh phân
bố từ -2.26 đến 3.96 với trung bình cộng là -0.02 và độ lệch chuẩn 0.97. Điều
này đòi hỏi phải có thêm một số câu khó hơn để đo được toàn bộ năng lực của
học sinh với những mức năng lực khác nhau.
Bảng số liệu tính toán trên thí sinh tham gia:
Summary of case Estimates
=========================
Mean 02
SD .97

SD (adjusted) .90
Reliability of estimate .87

Fit Statistics
===============
Infit Mean Square Outfit Mean Square
Mean 1.00 Mean 1.01
SD .08 SD .29

Infit t Outfit t
Mean .00 Mean .07
SD .82 SD .61

0 cases with zero scores
6 cases with perfect scores

Sơ đồ phân bổ năng lực thí sinh và độ khó câu hỏi thi (thang logistic):

Item Estimates (Thresholds) 6/ 6/11 13:53
all on 3-thits (N =1625 L = 47 Probability Level= .50)

4.0 X |
|
|
|
|
|
X |
|
3.0 |

XX |
|
|
XX |
|
XX |
|
2.0 XX |
XX |
XX |
XXXXX |
XXX |
XXX |
XXX |
XXX |
1.0 XXXX | 16
XXXXX | 15
XXX | 41 50
XXXXXXXX | 5 12 22 27 37 47
XXXXX | 8 32 42
XXXXX | 28 31 36 43 45 49
XXXXXXXXXXXXXX | 25 48
.0 XXXXXXXX | 17 21 33 34
XXXXXXXXXXXXXXXX | 19 35 38 40
XXXXXXXXXX | 4 9 10 24 29 44
XXXXXXXXXXX | 3 14 46
XXXXXXXXXXXXXXXXXXXXX |
XXXXXXXXXXX | 7 11 13 23 39
XXXXXXXXXX |
Trang | 16

XXXXXXXXXX | 2 26
-1.0 XXXXXXXXXXXXXX |
XXXXXXX | 1
XXXXX |
XXX |
XX |
|
X |
X |
-2.0 |
|
| 20
|
|
|
|
|
-3.0 |

Each X represents 8 students

Ý kiến: Đề tương đối phù hợp với năng lực của nhóm thí sinh tham gia bài
thi này, tuy nhiên cần bổ sung một số câu khó để đánh giá những thí sinh có
năng lực cao vì những thí sinh có ngưỡng năng lực (thresholds) từ 0.92 trở lên và
bổ sung một số câu dễ để đánh giá những thí sinh có năng lực thấp với ngưỡng
năng lực dưới -1.06 chưa có câu hỏi nào để đánh giá, mới chỉ có một câu 20 là
quá ít.
3. Các chỉ số thống kê của câu hỏi
Các chỉ số đã được phân tích ở trên là:
Infit MNSQ

Độ phân biệt Disc.
Count
Percent (%)
Pt-Biserial
4 chỉ số cần được phân tích tiếp là:
P-value
Mean ability
Thresholds
Error.
P-value: là giá trị thống kê cho biết hệ số tương quan (Point Biserial) tính
toán được là có ý nghĩa thống kê ở mức nào, thông thường phải nhỏ hơn hoặc
bằng 0.05 (có ý nghĩa thống kê ở mức α = 0.05).
Trong số 50 câu hỏi được phân tích trên đều có p-value đạt yêu cầu, ở
những phương án là đáp án có ý nghĩa thống kê rất cao ở mức p-value = 0.000.
Điều này cho thấy hệ số tương quan tính được giữa câu hỏi thi và điểm thi của
toàn bài có ý nghĩa thống kê cao.
Trang | 17
Mean ability: Trung bình năng lực của những thí sinh đưa ra sự lựa chọn
của mình cho từng phương án trả lời. Phương án trả lời đúng phải có Mean
ability cao hơn các phương án trả lời sai, các phương án trả lời sai (mồi nhử)
thường có Mean Ability âm . Yêu cầu này đều đạt được ở tất cả các câu hỏi khi
đã loại bỏ các câu 6, 18 và 30.
Thresholds: Là ngưỡng năng lực yêu cầu (theo thang logistic) để trả lời
đúng câu hỏi đang phân tích. Với 47 câu hỏi này ta thấy chỉ số thresholds rải từ
-2.20 đến 0.92 trong khi đó ngưỡng năng lực của thí sinh phân bố từ -2.26 đến
3.96 cho thấy đề thi này không có những câu hỏi đủ khó để đánh giá thí sinh có
ngưỡng năng lực từ trên 0.92 đồng thời thiếu những câu hỏi đủ dễ để đánh giá
thí sinh có ngưỡng năng lực từ -1.09 trở xuống.
Error: là sai số tính toán, thông số này cho thấy độ tin cậy của số liệu tính
được cho từng câu hỏi, thông thường nhỏ hơn 0.2. Yêu cầu này đều đạt được ở

tất cả các câu hỏi.
Dưới đây là trích kết quả phân tích có được từ phần mềm Quest. Câu 6,
câu 30 là câu ngoại lai, câu 20 là câu được đề nghị loại bỏ ở phần đánh giá bằng
lý thuyết cổ điển và là câu có chỉ số thresholds thấp nhất. Câu 16 là câu có độ
khó (thresholds) cao nhất trên thang logistic.
Câu 06 (trích file thiTS.ita xử lý lần 1) có Infit MNSQ quá lớn

ngoại lai đồng
thời giá trị Mean ability phương án đúng A* = -0.36 < D = 0.38.

Item 6: item 6 Infit MNSQ = 1.51
Disc = 19

Categories - A* B C D missing

Count 19 405 270 242 688 1
Percent (%) 1.2 24.9 16.6 14.9 42.4
Pt-Biserial 03 19 19 21 .46
p-value .079 .000 .000 .000 .000
Mean Ability 36 36 43 50 .38 69

Step Labels 1

Thresholds 1.15
Error .06

Câu 30 (trích file 2-thits.ita xử lý lần 2) có Infit MNSQ quá lớn (1.33)

ngoại
lai; đồng thời hệ số tương quan & độ phân biệt rất thấp (0.05) ở cả 2 lần Quest

xử lý dữ liệu.

Item 30: item 30 Infit MNSQ = 1.33
Disc = .05

Categories - A B C* D missing

Count 16 256 190 695 465 3
Percent (%) 1.0 15.8 11.7 42.8 28.7
Pt-Biserial 07 07 15 .05 .13
p-value .001 .003 .000 .028 .000
Mean Ability 72 17 40 .02 .18 20
Trang | 18

Step Labels 1

Thresholds .27
Error .06


Câu 20 (trích file 3-thiTS.ita xử lý lần 3): Tỷ lệ chọn đúng cao (87.5%), ngưỡng
năng lực thresholds thấp (-2.20), mean ability = 0.04 cho thấy câu hỏi này quá
dễ tuy nhiên theo quan điểm của thuyết khảo thí hiện đại thì 2 câu này không
cần thiết phải loại bỏ.

Item 20: item 20 Infit MNSQ = 1.01
Disc = .18

Categories - A B C D* missing


Count 2 79 58 63 1417 6
Percent (%) .1 4.9 3.6 3.9 87.5
Pt-Biserial 02 15 04 10 .18
p-value .210 .000 .058 .000 .000
Mean Ability 68 64 19 50 .04 48

Step Labels 1

Thresholds -2.20
Error .08



Câu 16 (trích file 3-thiTS.ita xử lý lần 3): Tỷ lệ chọn đúng thấp (30.3%), ngưỡng
năng lực thresholds khá cao (-0.92), mean ability = 0.40 cho thấy câu hỏi này
không dễ.

Item 16: item 16 Infit MNSQ = 1.13
Disc = .29

Categories - A B C* D missing

Count 11 356 408 492 356 2
Percent (%) .7 21.9 25.1 30.3 21.9
Pt-Biserial 03 18 .00 .29 14
p-value .120 .000 .476 .000 .000
Mean Ability 37 33 03 .40 27 61

Step Labels 1


Thresholds .92
Error .06


4. Khảo sát các câu hỏi có tính định kiến, thiên vị
Trong quá trình soạn câu hỏi thi, có thể có những câu hỏi khá dễ đối với
nhóm thí sinh này nhưng lại khó đối với nhóm thí sinh khác. Đó là các câu hỏi
có tính định kiến, thiên vị (biased). Nguyên nhân có thể do người soạn câu hỏi
thi dùng các từ ngữ địa phương, những từ ngữ không phổ biến, những kiến thức
không phổ thông, những kiến thức mà nhiều vùng học sinh không được học.
Một đề thi có chất lượng tốt phải không có các câu hỏi có tính định kiến, thiên
vị.
Trang | 19
Dữ liệu phân tích có 1625 thí sinh tham gia dự thi thuộc 11 huyện thị, các
huyện thị có mã số 7, 8, 8, 10, 11 là các trường thuộc thị trấn, thị xã gọi là nhóm
thành thị (tt) gồm 761 thí sinh; những huyện có mã số 1, 2, 3, 4, 5, 6 là những
huyện không thuộc thị trấn, thị xã và được gọi là vùng nông thôn (nt) gồm 864
thí sinh.
Trong đề thi này, câu 28 nằm ngoài vùng ±2 là câu hỏi định kiến, thiên vị
đối với 2 nhóm thí sinh tham gia kỳ thi: 1) nhóm nông thôn (nt) và 2) nhóm thị
xã (tt).
Từ biểu đồ ta thấy các câu hỏi phân bổ khá đồng đều cho cả 2 nhóm.
Riêng câu 28 dễ đối với nhóm thí sinh thành thị nhưng lại quá khó đối với nhóm
nông thôn, câu này cần phải loại bỏ hoặc điều chỉnh.

Biểu đồ phân bổ câu hỏi theo sự khác biệt giữa 2 nhóm thí sinh

THI TS 2010

Comparison of Item estimates for groups nt and tt on the thits scale

L = 50 order = input 13/ 6/11 19:14


Plot of Standardised Differences

Easier for nt Easier for tt

-3 -2 -1 0 1 2 3
+ + + + + + +
item 1 . * | .
item 2 .* | .
item 3 . | * .
item 4 . * | .
item 5 . | * .
item 6 . | * .
item 7 . * | .
item 8 . |* .
item 9 . * | .
item 10 . | * .
item 11 . * | .
item 12 . * | .
item 13 . * | .
item 14 . | * .
item 15 . | * .
item 16 . * | .
item 17 . | * .
item 18 . * .
item 19 . | * .
item 20 . * | .
item 21 . * | .

item 22 . | * .
item 23 . *| .
item 24 . | * .
item 25 . * | .
item 26 . * | .
item 27 . | * .
item 28 . | . *
item 29 . * | .
item 30 . | * .
item 31 . | * .
item 32 . | * .
item 33 . | * .
item 34 . * | .
item 35 . | * .
item 36 . * | .
item 37 . | * .
item 38 . * | .
item 39 . * | .
item 40 . * | .
item 41 . | * .
item 42 . * | .
item 43 . * | .
item 44 . * | .
item 45 . * | .
item 46 . * | .
item 47 . | * .
item 48 . | * .
item 49 . * | .
item 50 . | * .



Chạy lần 2 (bỏ câu 28)

THI TS 2010

Comparison of Item estimates for groups nt and tt on the thits scale
L = 49 order = input 13/ 6/11 19:49
Trang | 20


Plot of Standardised Differences

Easier for nt Easier for tt

-3 -2 -1 0 1 2 3
+ + + + + + +
item 1 . * | .
item 2 . * | .
item 3 . | * .
item 4 . *| .
item 5 . | * .
item 6 . | * .
item 7 . * | .
item 8 . | * .
item 9 . * | .
item 10 . | * .
item 11 . * | .
item 12 . *| .
item 13 . * | .
item 14 . | * .

item 15 . | * .
item 16 . * | .
item 17 . | * .
item 18 . |* .
item 19 . | * .
item 20 . * | .
item 21 . *| .
item 22 . | * .
item 23 . * .
item 24 . | * .
item 25 . * | .
item 26 . * | .
item 27 . | * .
item 29 . * | .
item 30 . | * .
item 31 . | * .
item 32 . | * .
item 33 . | * .
item 34 . * | .
item 35 . | * .
item 36 . * | .
item 37 . | * .
item 38 . * | .
item 39 . * | .
item 40 . * | .
item 41 . | * .
item 42 . *| .
item 43 . * | .
item 44 . * | .
item 45 . * | .

item 46 . * | .
item 47 . | * .
item 48 . | * .
item 49 . * | .
item 50 . | * .
====================================================================================================================================


5. Kết luận chương 3
1. Bộ dữ liệu phù hợp với mô hình Rasch.
2. Các câu hỏi trong đề có độ phù hợp cao, trong 50 câu có 3 câu (câu 6,
18, 30) là câu ngoại lai cần phải loại bỏ.
3. Theo phân bổ độ khó của câu hỏi thi và ngưỡng năng lực cần để vượt
qua trên thang Logistic thì đề thi này tương đối tốt. Tuy nhiên, có một số ít thí
sinh có năng lực vượt trội (15.26% thí sinh) có ngưỡng năng lực (thresholds)
trên 0.92 nên cần một số câu hỏi khó hơn để đánh giá những học sinh có năng
lực cao; đồng thời cũng cần một số câu hỏi để đánh giá các thi sinh có ngưỡng
năng lực (thresholds) dưới -1.06 đến -2.0 (5.9% thí sinh). Riêng câu 20 là câu
hỏi quá dễ, có độ khó dưới ngưỡng năng lực của thí sinh thấp nhất nên cần loại
bỏ.
4. Các chỉ số thống kê khác như P-value, Mean ability, Thresholds, Error
của từng câu hỏi trong đề (không kể các câu ngoại lai: 6, 18, 30) đều có giá trị
phù hợp.
Trang | 21
5. Câu 28 có tính thiên vị định kiến, là câu hỏi dễ đối với nhóm thí sinh
thành thị nhưng lại quá khó đối với nhóm thí sinh nông thôn nên cần loại bỏ.
Trang | 22
Chương 4. Kết luận & kiến nghị

Những phân tích ở trên đây chỉ ra những ưu điểm và tồn tại của câu hỏi và

qua đó có thể chỉnh sửa và lựa chọn các câu hỏi tốt để đưa vào ngân hàng câu
hỏi thi. Đây là thao tác cần thiết và quan trọng để lựa chọn câu hỏi xây dựng
ngân hàng câu hỏi.
Ưu điểm:
 Chất lượng đề thi tương đối tốt, phần lớn câu hỏi phù hợp với năng lực
của thí sinh.
 Đề thi có độ tin cậy cao.
 Độ phân biệt của đề thi tương đối tốt.
 Các câu hỏi trong đề có độ phù hợp cao.
 Phân bổ câu hỏi tương đối đồng đều giữa 2 nhóm thành thị và nông thôn.

Hạn chế:
 Có 2 câu nhầm đáp án. Trường hợp này cần đặc biệt lưu ý để rút kinh
nghiệm cho công tác viết câu hỏi thi.
 Đề thi thiếu những câu hỏi khó để phân biệt được giữa những thí sinh có
năng lực khá với học sinh giỏi (những học sinh có mức năng lực từ 0.92
trở lên theo thang logistic). Đồng thời cũng thiếu những câu hỏi dễ để
đánh giá những thí sinh có năng lực thấp từ -1.09 trở xuống.
 Chất lượng của các phương án sai (hay mồi nhử) không cao vì ít thu hút
thí sinh hoặc học sinh kém và học sinh giỏi đều có tỷ lệ trả lời sai gần
nhau.
 Câu 6, 18 và 30 không chấp nhận được cần được loại bỏ do ngoại lai. Câu
03 là câu quá thiên vị; câu 20 là câu quá dễ, câu 28 là câu có tính định
kiến-thiên vị cũng cần loại bỏ hoặc xem xét lại.

Trang | 23
Trong quá trình viết câu hỏi trắc nghiệm và trong quá trình tổ hợp lại
thành đề thi, xây dựng ngân hàng câu hỏi cần phải lưu ý đến chất lượng phương
án sai (mồi nhử) vì điều này tăng khả năng đoán mò hoặc dùng phương pháp
loại trừ khi làm bài của học sinh, do đó chất lượng câu hỏi thi và đề thi không

cao, đánh giá không đúng năng lực của học sinh.

1
The End.










1
Tài liệu tham khảo
[1] TS. Phạm Xuân Thanh – Tệp bài giảng môn Lý thuyết đo lường và đánh giá.
[2] TS. Phạm Xuân Thanh – Tệp bài giảng môn Mô hình Rasch và Phân tích dữ
liệu bằng phần mềm QUEST.
[3] TS. Phạm Xuân Thanh – Tiểu đề án Phân tích câu hỏi thi của các đề thi trắc
nghiệm khách quan.
[4] Nghiêm Xuân Núng biên dịch, GS. TS. Lâm Quang Thiệp hiệu đính và giới
thiệu (1996), Trắc nghiệm và đo lường cơ bản trong giáo dục (in lần thứ 2), Hà
Nội.
Trang | 24
PHỤ LỤC

Phụ lục 1. Lệnh tạo file dữ liệu data.dat cho SPSS:
write outfile='D:\data.dat'/
mahs(a8) mahuyen(f3) matruong(f2) gioi (f1) cau1 cau2

cau3 cau4 cau5 cau6 cau7 cau8 cau9 cau10 cau11 cau12 cau13
cau14 cau15 cau16 cau17 cau18 cau19 cau20 cau21 cau22
cau23 cau24 cau25 cau26 cau27 cau28 cau29 cau30 cau31
cau32 cau33 cau34 cau35 cau36 cau37 cau38 cau39 cau40
cau41 cau42 cau43 cau44 cau45 cau46 cau47 cau48 cau49
cau50(50a1).
execute.

Phụ lục 2. Lệnh tạo file dữ liệu data_diem.dat cho SPSS:
write outfile='D:\data_diem.dat'/
mahs(a8) mahuyen(a3) matruong(a2) gioi (f2) Cau1 Cau2
Cau3 Cau4 Cau5 Cau6 Cau7 Cau8 Cau9 Cau10 Cau11 Cau12 Cau13
Cau14 Cau15 Cau16 Cau17 Cau18 Cau19 Cau20 Cau21 Cau22
Cau23 Cau24 Cau25 Cau26 Cau27 Cau28 Cau29 Cau30 Cau31
Cau32 Cau33 Cau34 Cau35 Cau36 Cau37 Cau38 Cau39 Cau40
Cau41 Cau42 Cau43 Cau44 Cau45 Cau46 Cau47 Cau48 Cau49
Cau50(50f1).
execute.

Phụ lục 3. Cấu trúc file dữ liệu data.dat:
10010001 10 11BDDBAACBBCADBCDBCCDDDDBBCBDBADADABABACDDDBCBCBAABD
10020002 10 21DBDBABCDBDCBBACAADADCCBAADCBDCDBDCBCCAADCCABABCDCC
10020003 10 21DCBBBCCCBCDBDCBBCBCDACBBDCACDBDBACCCAAACACDBDBAACC

96701625 9671D CCCBDDDABADADCCDCCBBBBDBDCBDBDCDCDCDBADDDAACAD

Phụ lục 4. Cấu trúc file dữ liệu data_diem.dat:
1001000110 01 100000110100010000001011001000000000000000001010001
1002000210 02 110000010100011000111101100001100000011100001011000
1002000310 02 110001010101000000001001000101000001001111001010000


9670162509 67 110000010001011000001101011001110111110000000000001


Phụ lục 5. File điều khiển *.ctl cho chương trình QUEST xử lý file data.dat.
Header TUYEN SINH 2010
set width =132 ! page
set logon >- thiTS.log
data_file data.dat

×