Tải bản đầy đủ (.pdf) (12 trang)

phân tích câu hỏi trắc nghiệm giúp xây dựng ngân hàng câu hỏi môn tiếng anh lớp 12

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (504.95 KB, 12 trang )


ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC














TIỂU LUẬN MÔN LÝ THUYẾT ĐO LƯỜNG VÀ ĐÁNH GIÁ











Người hướng dẫn: TS. Tô Thị Thu Hương
Người thực hiện: Nguyễn Văn Nghiêm


Lớp: Cao học Đo lường & đánh giá trong giáo dục








TP.HỒ CHÍ MINH – 2011
1

MỤC LỤC

MỤC LỤC 1
1. Đặt vấn đề 2
2. Tổng quan tài liệu liên quan 2
2.1. Khái niệm phân tích câu hỏi thi kiểm tra 2
2.2. Phân tích thống kê các câu hỏi thi kiểm tra 3
2.2.1. Độ khó của câu hỏi thi kiểm tra: 4
2.2.2. Sử dụng giá trị p để phân tích câu hỏi thi kiểm tra 4
2.2.3. Nhầm đáp án 5
2.2.4. So sánh các giá trị p giữa các nhóm đạt kết quả cao và kết quả thấp 5
3. Phương pháp nghiên cứu 6
4. Kết quả phân tích số liệu và nhận định 6
4.1. Độ khó của câu hỏi thi: 6
4.2. Các khả năng nhầm đáp án 7
4.3. Chất lượng của các phương án sai (mồi nhử) 7
4.4. Độ phân biệt của câu hỏi thi 9
5. Kết luận – kiến nghị 10

Tài liệu tham khảo: 11

2

1. Đặt vấn đề
Hiện tại, việc xây dựng ngân hàng câu hỏi trắc nghiệm khách quan tại
trường THPT đang được đặc biệt quan tâm và ưu tiên tiến hành, tuy nhiên để
xây dựng được một ngân hàng câu hỏi tốt theo đúng nghĩa trắc nghiệm khách
quan nhằm đánh giá đúng năng lực của học sinh thì công việc này cần phải được
tiến hành một cách có khoa học, có phương pháp chứ không thể xây dựng theo
kiểu truyền thống là tích lũy dần theo cảm tính.
Trong quá trình học và nghiên cứu tài liệu tác giả nhận thấy rằng các lỗi
ẩn chứa trong mỗi câu hỏi không dễ phát hiện trừ khi các câu hỏi đó được phân
tích kỹ lưỡng theo phương pháp khoa học. Viết câu hỏi thi kiểm tra mới chỉ là
việc làm bước đầu, nó đòi hỏi phải được thử nghiệm trước khi sử dụng và sau
mỗi lần tổ chức thi kiểm tra cần được phân tích kỹ lưỡng để rút kinh nghiệm và
đồng thời để lý giải được kết quả làm bài của thí sinh, từ đó loại bỏ hoặc chỉnh
sửa những câu hỏi chưa đạt yêu cầu trước khi đưa vào ngân hàng câu hỏi.
Theo đề cương môn học và tệp bài giảng của TS. Tô Thị Thu Hương thì
nội dung cốt lõi của môn học Lý thuyết đo lường và đánh giá là “Những đặc
trưng cơ bản của lý thuyết đo lường đánh giá cổ điển và đo lường đánh giá hiện
đại; Phương pháp và kỹ thuật tiếp cận để đo lường và đánh giá với sự hỗ trợ của
các phần mềm vi tính”. Vì vậy tác giả vận dụng lý thuyết đo lường đánh giá cổ
điển để thực hiện đề tài “Phân tích câu hỏi trắc nghiệm giúp xây dựng ngân hàng
câu hỏi môn Tiếng Anh lớp 12” làm đề tài viết tiểu luận kết thúc môn học.
2. Tổng quan tài liệu liên quan
2.1. Khái niệm phân tích câu hỏi thi kiểm tra
Một trong những ứng dụng của lý thuyết đánh giá cổ điển là phân tích câu
hỏi thi kiểm tra. Phân tích câu hỏi thi kiểm tra là một quá trình xem xét chúng
một cách kỹ lưỡng và có phê phán. Phân tích câu hỏi thi kiểm tra nhằm làm tăng

chất lượng của chúng, loại bỏ những câu hỏi quá tồi, sửa chữa những câu hỏi có
thể sửa được và giữ lại những câu hỏi đáp ứng yêu cầu.
3

Phân tích câu hỏi thi kiểm tra có thể thực hiện bằng một trong hai phương
pháp:
- Phương pháp chuyên gia (Phương pháp bình phẩm, phê phán) bằng cách
đề nghị một số chuyên gia cho ý kiến nhận xét về những câu hỏi thi kiểm
tra cụ thể theo một số tiêu chí đề ra. Những người được hỏi có thể là các
chuyên gia môn học, chuyên gia soạn thảo văn bản, thậm chí là một số thí
sinh.
Cách tiếp cận này có hai nguyên tắc:
- Người được hỏi phải là người có khả năng bình phẩm, phê phán
các câu hỏi thi kiểm tra;
- Các câu hỏi thi kiểm tra được viết theo một nguyên tắc đã được
xác định và có các tiêu chí để bình phẩm, phê phán.
- Phương pháp định lượng (Phân tích số liệu): Phân tích thống kê kết quả
làm bài của thí sinh. Sau khi có kết quả, nhập dữ liệu để phân tích. Việc
này thường làm trong quá trình thử nghiệm các câu hỏi thi kiểm tra. Mục
đích chính của thử nghiệm là thu thập dữ liệu để phân tích các câu hỏi thi
kiểm tra, chỉ ra những câu hỏi thi kiểm tra cần phải sửa.
2.2. Phân tích thống kê các câu hỏi thi kiểm tra
Một số thống kê có thể chỉ ra những thuộc tính cụ thể của câu hỏi thi kiểm
tra, qua đó chung ta biết được những câu hỏi tốt và chưa tốt. Các nhà nghiên cứu
(Crocker & Algina, 1986) đã phân loại các chỉ số thường được sử dụng như sau:
1. Những chỉ số mô tả sự phân bố trả lời của thí sinh về một câu hỏi cụ thể
(trung bình cộng và phương sai trả lời của thí sinh).
2. Những chỉ số mô tả mức độ của mối quan hệ giữa sự trả lời của thí sinh
về một câu hỏi và những tiêu chí cụ thể đang được quan tâm.
3. Những chỉ số liên quan đến phương sai của câu hỏi thi kiểm tra và mối

liên hệ với những tiêu chí cụ thể.
Một số thống kê thường được sử dụng để mô tả các thông số trên của câu
hỏi thi kiểm tra là giá trị p, phương sai, một số chỉ số phân biệt như hệ số tương
quan point-biserial, hệ số tương quan biserial, hệ số tương quan phi. Mỗi chỉ số
4

thống kê này đều quan trọng với những mục tiêu cụ thể khi phân tích câu hỏi thi
kiểm tra. Dưới đây chỉ mới giới thiệu việc sử dụng giá trị p vào việc phân tích
câu hỏi thi kiểm tra.
2.2.1. Độ khó của câu hỏi thi kiểm tra:
Độ khó của câu hỏi (giá trị p) được sử dụng rộng rãi đối với các câu hỏi
đúng / sai, đa lựa chọn. Giá trị p là tỷ lệ thí sinh trả lời đúng so với tổng số thí
sinh tham gia trả lời câu hỏi đó.
Giá trị p của mỗi câu hỏi chưa nói lên được câu hỏi đó tốt hay không,
nhưng nó nói lên độ khó tương đối của câu hỏi đó đối với số thí sinh tham gia
làm bài test. Nếu một nhóm thí sinh khác trả lời câu hỏi đó thì giá trị p có thể
khác.
Khái niệm Sự phụ thuộc mẫu (sample dependence) thường được sử dụng
để phản ánh một số phương diện nào đó của một nhóm hay tập hợp thí sinh tham
gia làm bài thi kiểm tra. Ví dụ: một nhóm học sinh lớp ba và một nhóm khác học
sinh lớp 5 cùng làm một bài test. Kết quả cho thấy giá trị p giữa hai nhóm sẽ rất
khác nhau. Khi đó, mỗi câu hỏi sẽ có hai giá trị p, một giá trị p chỉ độ khó tương
đối so với học sinh lớp 3 và một giá trị p khác - so với học sinh lớp 5. Như vậy,
giá trị p phụ thuộc vào mẫu thí sinh tham gia làm bài test.
2.2.2. Sử dụng giá trị p để phân tích câu hỏi thi kiểm tra
Giá trị p có ý nghĩa quan trọng đối với những người viết câu hỏi thi kiểm
tra trong quá trình phân tích câu hỏi. Hiểu đúng ý nghĩa của giá trị p và lý giải
hợp lý các kết kết quả thu được, người viết câu hỏi có thể thấy được mức độ phù
hợp của các câu hỏi đó đối với nhóm thí sinh. Ngoài ra, giá trị p còn giúp xác
định một số lỗi khác của câu hỏi để kịp thời điều chỉnh, sửa đổi hoặc rút kinh

nghiệm cho lần sau. Ví dụ: lỗi do dùng từ, hành văn làm thí sinh không hiểu câu
hỏi, hiểu nhầm, bị đánh lừa hay có nhiều cách hiểu khác nhau; lỗi trong phần lựa
chọn của câu hỏi trắc nghiệm; không có phương án trả lời đúng hay có nhiều
phương án trả lời đúng Giá trị p cũng có thể cho thấy kết quả làm bài của các
nhóm thí sinh khác nhau trong cùng một tập hợp.
5

Khi phân tích câu hỏi trắc nghiệm, giá trị p được tính cho từng phương án
trả lời, bằng tỷ lệ giữa số thí sinh lựa chọn từng phương án với tổng số thí sinh.
Một câu hỏi có thể quá dễ đối với nhóm thí sinh này và quá khó đối với
nhóm thí sinh khác. Người viết câu hỏi thi kiểm tra cần quan tâm đến giới hạn
thích hợp của giá trị p đối với một nhóm thí sinh nhất định. Theo Osterlind
(1989), giá trị p nên nằm trong khoảng từ 0.40 đến 0.80. Dưới 0.4 nghĩa là câu
hỏi quá khó và trên 0.80 là quá dễ đối với nhóm thí sinh. Người viết câu hỏi thi
kiểm tra cố gắng điều chỉnh để độ khó của câu hỏi rơi vào trong khoảng 0.4-0.8
cho phù hợp với đối tượng dự thi kiểm tra.
2.2.3. Nhầm đáp án
Một thuộc tính bổ ích khác của giá trị p là giúp xác định những câu hỏi bị
nhầm đáp án. Rất tiếc, nhầm đáp án là một hiện tượng khá phổ biến trong quá
trình viết câu hỏi trắc nghiệm. Trong nhiều trường hợp, những nhầm lẫn này có
thể hiểu được. Nhiều khi, sự đơn điệu và buồn tẻ trong việc viết câu hỏi thi kiểm
tra làm các chuyên gia thiếu tập trung, dẫn đến nhầm đáp án. Những lúc khác, sự
mơ hồ, thiếu rõ ràng trong việc hành văn, diễn đạt câu hỏi đã gây khó khăn cho
việc xác định phương án trả lời đúng. Khi viết những câu hỏi để đánh giá những
kỹ năng của quá trình nhận thức phức tạp, sự phức tạp về nội dung hoặc thuật
ngữ có thể dẫn đến xác định sai đáp án.
Những câu hỏi thi kiểm tra bị nhầm đáp án thường bị phát hiện khi người
soạn câu hỏi xem bảng giá trị p và thấy có sự khác biệt lớn giữa dự định và thực
tế trả lời của thí sinh.
2.2.4. So sánh các giá trị p giữa các nhóm đạt kết quả cao và kết quả thấp

Đôi khi cũng nên so sánh các nhóm thí sinh khác nhau để xác định các
thuộc tính của câu hỏi thi kiểm tra. Nhằm mục đích đó, hai nhóm thí sinh được
chọn ra: một nhóm có kết quả cao và nhóm khác có kết quả thấp. Cụ thể, nhóm
thứ nhất bao gồm 27% số thí sinh làm bài test có tổng điểm bài test cao nhất.
Nhóm thứ hai bao gồm 27% số thí sinh làm bài test có tổng điểm bài test thấp
nhất. Kelly (1939) cho rằng con số 27 có thể cho một chỉ số ổn định về sự khác
6

nhau giữa hai nhóm có năng lực cao và thấp. Sự so sánh này nhằm làm rõ mức
độ khác biệt kết quả làm bài của hai nhóm thí sinh có năng lực khác nhau.
3. Phương pháp nghiên cứu
Phương pháp nghiên cứu được sử dụng trong tiểu luận này là Phương
pháp định lượng của lý thuyết đo lường cổ điển để phân tích câu hỏi trắc nghiệm
nhằm đưa ra nhận định về độ khó, khả năng nhầm đáp án, chất lượng mồi nhử,
độ phân biệt của câu hỏi.
Số liệu sử dụng trong tiểu luận gồm 40 câu hỏi trắc nghiệm trong đề thi
kiểm tra học kỳ 2 dành cho lớp 12 của trường THPT chuyên Quang Trung –
Bình Phước. Số lượng thí sinh tham gia dự thi là 500 học sinh trường THPT
chuyên Quang Trung.
Số liệu thô được nhập và kiểm tra bằng phần mềm bảng tính MicroSoft
Excel để phân tích, xử lý. Số liệu được phân tích theo phương pháp cơ bản của
lý thuyết đo lường và đánh giá cổ điển.
4. Kết quả phân tích số liệu và nhận định
4.1. Độ khó của câu hỏi thi:
Độ khó của câu hỏi thi (P) là tỷ lệ thí sinh trả lời đúng so với tổng số thí
sinh tham gia trả lời câu hỏi đó. Kết quả phân tích số liệu được thể hiện ở bảng
thống kê dưới đây:
Câu
Phương án
Sót

Độ
khó

Câu
Phương án
Sót
Độ
khó
A
B
C
D
A
B
C
D
1
4,60
81,20
12,40
1,40
0,40
0,81
21
88,20
5,80
2,20
3,20
0,60
0,88

2
4,20
3,20
2,40
89,80
0,40
0,90
22
1,60
13,60
79,80
4,80
0,20
0,80
3
20,20
8,00
63,40
7,60
0,80
0,63
23
8,40
24,20
59,80
5,80
1,80
0,60
4
6,20

2,60
6,00
84,80
0,40
0,85
24
3,40
21,40
16,80
57,60
0,80
0,58
5
10,00
64,20
18,00
7,60
0,20
0,64
25
6,20
48,60
38,00
6,00
1,20
0,49
6
77,00
8,60
11,20

3,00
0,20
0,77
26
10,20
3,00
76,00
10,80
0,00
0,76
7
88,00
3,80
5,80
1,80
0,60
0,88
27
2,40
7,80
77,00
12,80
0,00
0,77
8
6,60
10,60
23,00
59,00
0,80

0,59
28
16,20
62,60
14,20
6,00
1,00
0,63
9
6,20
2,60
16,40
74,60
0,20
0,75
29
1,60
11,80
2,40
84,00
0,20
0,84
10
9,60
86,00
2,60
1,80
0,00
0,86
30

78,60
3,40
2,40
15,60
0,00
0,79
11
6,40
15,60
12,80
64,80
0,40
0,65
31
15,00
12,80
59,20
11,80
1,20
0,59
12
86,40
7,00
3,20
2,80
0,60
0,86
32
44,20
17,00

23,80
14,20
0,80
0,44
13
12,20
21,40
3,60
62,60
0,20
0,63
33
3,80
83,00
4,60
7,80
0,80
0,83
7

14
69,20
6,80
17,00
5,60
1,40
0,69
34
20,00
14,40

50,20
14,00
1,40
0,50
15
2,80
73,40
3,20
19,80
0,80
0,73
35
13,00
19,00
55,80
11,00
1,20
0,56
16
4,40
84,40
5,60
4,60
1,00
0,84
36
62,20
13,20
18,60
4,80

1,20
0,62
17
21,80
54,40
5,60
16,80
1,40
0,54
37
80,40
8,20
3,00
8,00
0,40
0,80
18
4,80
77,20
4,00
13,00
1,00
0,77
38
4,00
25,20
60,60
9,40
0,80
0,61

19
2,80
21,80
2,80
72,00
0,60
0,72
39
2,00
0,80
4,00
92,60
0,60
0,93
20
1,60
4,00
87,20
7,00
0,20
0,87
40
76,20
7,40
4,60
9,80
2,00
0,76

Bảng 1.1. Phân bổ độ khó

Độ khó
>0,85
>0,8
>0,75
>0,7
>0,65
>=0,6
<0,6
<0,55
<0,5
<0,45
<0,4
Số câu
7
13
20
23
24
31
9
4
2
1
0
(%)
17,5
32,5
50
57,5
60

77,5
22,5
10
5
2,5
0

Thống kê dữ liệu cho thấy độ khó trung bình của của 40 câu hỏi là 0,72 và
rải từ 0.44 đến 0.93. Số câu có độ khó lớn hơn 0.8 là 13 câu, từ trên 7.5 là 20 câu
chiếm tỷ lệ 50% số câu trong đề thi. Theo thuyết khảo thí cổ điển, Osterlind
(1989), thì giá trị độ khó (P) càng lớn cho thấy câu hỏi càng dễ, độ khó của câu
hỏi nằm trong khoảng 0.4 đến 0.8 là chấp nhận được. Trong khi đó, bài test có
đến 13 câu có độ khó >0.8, 50% số câu có độ khó trên 7.5 và có đến 31 câu có
độ khó từ 0.6 trở lên (chiếm 77.5%), chỉ có 9 câu trong khoảng từ 0.4 đến dưới
0.6 (chiếm 22.5%). Như vậy, hầu hết các câu hỏi của bài test này thuộc loại dễ
đối với nhóm học sinh tham gia nghiên cứu này.
Nhận xét: Đề thi có quá nhiều câu hỏi dễ và thiếu các câu khó. Cần tăng
cường, bổ sung các câu khó để đánh giá đầy đủ năng lực của học sinh. Các câu
2, 7, 10, 12, 20, 21, 39 có độ khó > 0,85 có thể được loại bỏ hoặc điều chỉnh
trước khi chọn vào ngân hàng câu hỏi vì là những câu quá dễ.
4.2. Các khả năng nhầm đáp án
Bảng 1 cho thấy không xẩy ra trường hợp nhầm đáp án. Đây là một ưu
điểm lớn của bài test này.
4.3. Chất lượng của các phương án sai (mồi nhử)
Phương án sai hay gọi là mồi nhử là các phương án ngoài đáp án. Mồi
nhử tốt là mồi nhử có tỷ lệ lựa chọn gần với tỷ lệ mong muốn được tính theo
công thức (1 – P)/(k – 1) x 100 % (trong đó P là độ khó của câu hỏi, k là số
8

phương án trả lời). Ví dụ câu hỏi 4 lựa chọn có độ khó là 0.6 thì tỷ lệ mồi nhử

mong muốn là (1 – 0.6)/(4-1) x 100% = 13.33 % cho mỗi phương án. Cùng với
cách tính này ở đây ta xác định mồi nhử kém khi tỷ lệ lựa chọn nhỏ hơn 50% tỷ
lệ mong muốn.
Từ dữ liệu thống kê được ta thấy bài test có đến 24 câu xuất hiện mồi nhử
kém (gồm các câu: 1, 6, 7, 8, 9, 10, 13, 15, 17, 19, 20, 22, 23, 24, 25, 26, 27, 28,
29, 30, 36, 37, 38, 39). Trong đó, có nhiều câu có các phương án sai (mồi nhử)
quá lộ liễu nên rất ít học sinh lựa chọn (ví dụ: Phương án B của câu 39 chỉ có
0.8 % thí sinh lựa chọn). Ở những câu quá dễ (có P > 0.80) thì các phương án sai
hầu như ít có tác dụng đánh giá kiến thức của học sinh.
Ở bảng 2 dưới đây, khi so sánh các phương án sai giữa nhóm trên (27% số
thí sinh có kết quả điểm toàn bài thi cao nhất, Nh. trên) với nhóm dưới (27% số
thí sinh có kết quả điểm toàn bài thi thấp nhất, Nh. dưới) cho thấy có 26 câu có
độ lệch rất nhỏ (dưới 0.1). Điều này cho thấy các phương án sai này không có
hiệu quả đối với cả 2 nhóm có năng lực khác nhau.
Trong 26 câu có độ lệch nhỏ hơn 0.1 thì có 19 câu (gồm các câu: 1, 6, 7,
9, 10, 13, 15, 19, 20, 22, 23, 24, 26, 27, 29, 30, 37, 38, 39) là câu có mồi nhử
kém đã được tính ở trên. Điều này có nghĩa là cả nhóm trên và nhóm dưới đều
rất ít thí sinh chọn, cho thấy những mồi nhử ấy thật sự là mồi nhử kém.
Nhận xét: Chất lượng của các phương án sai (hay mồi nhử) không cao vì
cả học sinh kém và học sinh giỏi đều có tỷ lệ trả lời sai gần nhau. Có nhiều câu
cả nhóm trên và nhóm dưới đều rất ít thí sinh chọn, cho thấy những mồi nhử ấy
thật sự là mồi nhử kém, nhất định phải chỉnh sửa mồi nhử trước khi đưa vào
ngân hàng câu hỏi hoặc có thể loại bỏ.
Bảng 2.
P.án
A
B
C
D
Câu

N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
N.Trên
N.Dưới
Lệch
1.
0,00
0,13
-0,13
1,00
0,55
0,45
0,00
0,28
-0,28
0,00
0,03
-0,03
2.
0,00
0,13
-0,13
0,00

0,07
-0,07
0,00
0,06
-0,06
1,00
0,73
0,27
3.
0,07
0,28
-0,21
0,00
0,17
-0,17
0,91
0,42
0,49
0,01
0,11
-0,10
4.
0,00
0,15
-0,15
0,00
0,07
-0,07
0,00
0,16

-0,16
1,00
0,61
0,39
5.
0,01
0,24
-0,23
0,94
0,31
0,63
0,04
0,30
-0,26
0,01
0,15
-0,13
9

6.
0,93
0,59
0,35
0,01
0,19
-0,18
0,03
0,19
-0,16
0,02

0,02
0,00
7.
0,99
0,63
0,36
0,00
0,12
-0,12
0,00
0,19
-0,19
0,01
0,04
-0,04
8.
0,00
0,14
-0,14
0,01
0,23
-0,22
0,01
0,44
-0,43
0,99
0,16
0,82
9.
0,00

0,20
-0,20
0,00
0,08
-0,08
0,01
0,33
-0,31
0,99
0,39
0,60
10.
0,01
0,23
-0,22
0,99
0,64
0,34
0,00
0,08
-0,08
0,01
0,04
-0,04
11.
0,01
0,19
-0,18
0,04
0,30

-0,26
0,02
0,20
-0,18
0,93
0,30
0,63
12.
0,98
0,67
0,31
0,02
0,16
-0,13
0,00
0,08
-0,08
0,00
0,08
-0,08
13.
0,01
0,26
-0,25
0,06
0,30
-0,24
0,00
0,07
-0,07

0,93
0,36
0,58
14.
0,97
0,33
0,64
0,00
0,16
-0,16
0,03
0,33
-0,30
0,00
0,16
-0,16
15.
0,00
0,07
-0,07
0,98
0,44
0,53
0,00
0,09
-0,09
0,02
0,38
-0,36
16.

0,00
0,12
-0,12
1,00
0,60
0,40
0,00
0,16
-0,16
0,00
0,10
-0,10
17.
0,09
0,33
-0,24
0,89
0,17
0,72
0,01
0,11
-0,10
0,01
0,36
-0,34
18.
0,00
0,13
-0,13
0,99

0,42
0,56
0,00
0,13
-0,13
0,01
0,29
-0,27
19.
0,01
0,07
-0,06
0,05
0,46
-0,41
0,00
0,05
-0,05
0,94
0,40
0,54
20.
0,00
0,04
-0,04
0,01
0,13
-0,12
0,99
0,62

0,37
0,00
0,21
-0,21
21.
0,99
0,75
0,24
0,01
0,10
-0,09
0,00
0,07
-0,07
0,01
0,07
-0,06
22.
0,00
0,06
-0,06
0,01
0,32
-0,30
0,99
0,54
0,44
0,00
0,07
-0,07

23.
0,01
0,18
-0,17
0,07
0,40
-0,33
0,92
0,29
0,63
0,00
0,08
-0,08
24.
0,01
0,07
-0,05
0,18
0,23
-0,05
0,05
0,24
-0,19
0,76
0,43
0,33
25.
0,00
0,16
-0,16

0,91
0,23
0,68
0,09
0,43
-0,34
0,00
0,13
-0,13
26.
0,02
0,25
-0,23
0,00
0,05
-0,05
0,98
0,44
0,53
0,00
0,25
-0,25
27.
0,00
0,07
-0,07
0,01
0,19
-0,18
0,93

0,56
0,37
0,06
0,19
-0,13
28.
0,08
0,31
-0,23
0,90
0,30
0,60
0,01
0,24
-0,23
0,01
0,13
-0,11
29.
0,00
0,06
-0,06
0,02
0,20
-0,18
0,01
0,06
-0,05
0,97
0,68

0,29
30.
0,99
0,51
0,47
0,00
0,10
-0,10
0,00
0,06
-0,06
0,01
0,33
-0,32
31.
0,07
0,19
-0,12
0,01
0,28
-0,27
0,87
0,30
0,58
0,04
0,20
-0,16
32.
0,84
0,13

0,70
0,03
0,26
-0,23
0,10
0,40
-0,30
0,03
0,19
-0,16
33.
0,00
0,13
-0,13
1,00
0,50
0,50
0,00
0,13
-0,13
0,00
0,22
-0,22
34.
0,21
0,18
0,03
0,01
0,32
-0,30

0,75
0,23
0,52
0,03
0,24
-0,21
35.
0,01
0,28
-0,27
0,12
0,22
-0,10
0,83
0,29
0,54
0,04
0,16
-0,13
36.
0,93
0,24
0,68
0,02
0,24
-0,21
0,04
0,35
-0,30
0,01

0,13
-0,13
37.
0,97
0,57
0,40
0,02
0,16
-0,14
0,00
0,07
-0,07
0,01
0,18
-0,17
38.
0,01
0,10
-0,09
0,04
0,47
-0,44
0,94
0,21
0,73
0,01
0,19
-0,17
39.
0,00

0,04
-0,04
0,00
0,03
-0,03
0,00
0,11
-0,11
1,00
0,79
0,21
40.
0,99
0,39
0,61
0,00
0,20
-0,20
0,00
0,13
-0,13
0,01
0,24
-0,23
Bảng 2. Độ lệch giữa nhóm trên và nhóm dưới.
4.4. Độ phân biệt của câu hỏi thi
Độ phân biệt của câu hỏi thi là mức độ khác nhau về kết quả trả lời giữa
hai nhóm trên và dưới khi làm bài thi. Độ phân biệt của từng câu hỏi được tính
toán như Bảng 3 dưới đây.
Bảng 3.

10

Số câu
Độ PB
Số câu
Độ PB
Số câu
Độ PB
Số câu
Độ PB
1
0,45
11
0,63
21
0,24
31
0,58
2
0,27
12
0,31
22
0,44
32
0,70
3
0,49
13
0,58

23
0,63
33
0,50
4
0,39
14
0,64
24
0,33
34
0,52
5
0,63
15
0,53
25
0,68
35
0,54
6
0,35
16
0,40
26
0,53
36
0,68
7
0,36

17
0,72
27
0,37
37
0,40
8
0,82
18
0,56
28
0,60
38
0,73
9
0,60
19
0,54
29
0,29
39
0,21
10
0,34
20
0,37
30
0,47
40
0,61


Bảng 2.1. Thống kê phân bổ độ phân biệt
Độ phân biệt
>=0,4
<0,4
<=0,3
<0,2
Min
Mean
Max
Số câu:
28
12
4
0
0.21
0.5
0.99

Từ số liệu thống kê trên cho thấy các câu hỏi đều có độ phân biệt trung
bình là 0.5 rải từ 0.21 đến 0.99. Có 28 câu (chiếm 70%) đạt độ phân biệt từ 0.4
trở lên, điều này cho thấy đề thi có độ phân biệt rất tốt. Các câu có độ phân biệt
chưa tốt gồm 4 câu: 2, 21, 29, 39. Các câu có độ phân biệt từ trên 0.3 đến 0.4
gồm 10 câu: 4, 6, 7, 10, 12, 16, 20, 24, 27, 37.
Nhận xét: Số câu đạt độ phân biệt ở mức rất tốt chiếm 70% đề thi chứng
tỏ độ phân biệt của đề thi là rất tốt. Tuy nhiên cần chỉnh sửa một số câu có độ
phân biệt chưa tốt như câu 2, 21, 29, 39.
5. Kết luận – kiến nghị
1. Nhìn chung, đề thi và các câu hỏi trắc nghiệp có chất lượng tương đối
tốt, không có sai sót lớn, không có trường hợp náo sai đáp án.

2. Đề thi thiếu những câu hỏi khó nên không phân biệt được giữa những
học sinh khá với học sinh giỏi. Đề thi, nhìn chung là quá dễ so với học sinh tham
gia làm bài kiểm tra. Các câu 2, 7, 10, 12, 20, 21, 39 có độ khó > 0,85 có thể
được loại bỏ hoặc điều chỉnh trước khi chọn vào ngân hàng câu hỏi.
3. Chất lượng của các phương án sai (hay mồi nhử) không cao vì cả học
sinh kém và học sinh giỏi đều có tỷ lệ trả lời sai gần nhau. Các câu: 1, 6, 7, 9,
10, 13, 15, 19, 20, 22, 23, 24, 26, 27, 29, 30, 37, 38, 39 cả nhóm trên và nhóm
dưới đều rất ít thí sinh chọn, cho thấy những mồi nhử ấy thật sự là mồi nhử kém,
11

nhất định phải chỉnh sửa mồi nhử trước khi đưa vào ngân hàng câu hỏi hoặc có
thể loại bỏ.
4. Số câu đạt độ phân biệt giữa nhóm trên và nhóm dưới ở mức rất tốt
chiếm 70% đề thi chứng tỏ độ phân biệt của đề thi là rất tốt. Tuy nhiên cần chỉnh
sửa một số câu có độ phân biệt chưa tốt như câu 2, 21, 29, 39. Các câu 4, 6, 7,
10, 12, 16, 20, 24, 27, 37 cũng nên xem xét để chỉnh sửa vì có độ phân biệt <
0.4.
5. Riêng câu 29 và câu 39 là 2 câu nên loại bỏ vì vừa là câu có độ khó (P)
lớn (0.84 và 0.93), phương án sai (mồi nhử) kém (1.6 và 0.8) , độ lệnh giữa
nhóm trên và nhóm dưới nhỏ hơn 0.1, độ phân biệt cũng thấp (2.9 và 2.1).
Những phân tích ở trên đây chỉ ra những tồn tại của câu hỏi thi và qua đó
có thể chỉnh sửa và lựa chọn các câu hỏi tốt để đưa vào ngân hàng câu hỏi thi.
Đây là thao tác cần thiết và quan trọng để lựa chọn câu hỏi xây dựng ngân hàng
câu hỏi. Tuy nhiên, để phân tích và đánh giá tốt hơn các câu hỏi trắc nghiệm để
xây dựng ngân hàng đề thi thì cần áp dụng kết hợp các phương pháp đánh giá
của thuyết đo lường và đánh giá hiện đại song vì giới hạn của tiểu luận nên tác
giả chỉ dừng lại ở phương pháp phân tích cơ bản của thuyết đo lường đánh giá
cổ điển.
Trong quá trình viết câu hỏi trắc nghiệm và trong quá trình tổ hợp lại
thành đề thi, xây dựng ngân hàng câu hỏi cần phải lưu ý đến phương án sai (mồi

nhử) vì điều này tăng khả năng đoán mò hoặc dùng phương pháp loại trừ khi
làm bài của học sinh, do đó chất lượng câu hỏi thi và đề thi không cao, đánh giá
không đúng năng lực của học sinh.


Tài liệu tham khảo:
[1] Griffin, P. (2000) - Program Development and Evaluation. Asessment Research
Centre, the University of Melbourne.
[2] TS. Tô Thị Thu Hương - Slide bài giảng môn Lý thuyết đo lường và đánh giá.
[3] Nghiêm Xuân Núng biên dịch, GS. TS. Lâm Quang Thiệp hiệu đính và giới thiệu
(1996), Trắc nghiệm và đo lường cơ bản trong giáo dục (in lần thứ 2), Hà Nội.
[4] TS. Phạm Xuân Thanh – Tệp bài giảng môn Lý thuyết đo lường và đánh giá.

×