Tải bản đầy đủ (.pdf) (73 trang)

Phân tích bộ câu hỏi thi kết thúc học phần môn hóa học và sinh học di truyền bằng lý thuyết khảo thí hiện đại thông qua kết quả thi năm học 2016 2017

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (993.62 KB, 73 trang )

BỘ Y TẾ
TRƯỜNG ĐẠI HỌC ĐIỀU DƯỠNG NAM ĐỊNH

BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ

TÊN ĐỀ TÀI

PHÂN TÍCH BỘ CÂU HỎI THI KẾT THÚC
HỌC PHẦN MƠN HĨA HỌC VÀ SINH HỌC
– DI TRUYỀN BẰNG LÝ THUYẾT KHẢO
THÍ HIỆN ĐẠI THƠNG QUA KẾT QUẢ THI
NĂM HỌC 2016 - 2017

Nam Định, tháng 12 năm 2017


BỘ Y TẾ
TRƯỜNG ĐẠI HỌC ĐIỀU DƯỠNG NAM ĐỊNH

BÁO CÁO TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU KHOA HỌC CẤP CƠ SỞ

TÊN ĐỀ TÀI

PHÂN TÍCH BỘ CÂU HỎI THI KẾT THÚC
HỌC PHẦN MƠN HĨA HỌC VÀ SINH HỌC
– DI TRUYỀN BẰNG LÝ THUYẾT KHẢO
THÍ HIỆN ĐẠI THƠNG QUA KẾT QUẢ THI
NĂM HỌC 2016 - 2017

Tên chủ nhiệm đề tài: Nguyễn Mạnh Dũng


Nam Định, tháng 12 năm 2017


MỤC LỤC
DANH MỤC CÁC BẢNG .......................................................................................... 1
DANH MỤC CÁC ĐỒ THỊ ........................................................................................ 1
A. MỞ ĐẦU ................................................................................................................ 2
1. Các văn bản liên quan đến việc triển khai nghiên cứu .............................................. 2
2. Nội dung nghiên cứu ................................................................................................ 2
3. Sản phẩm đề tài........................................................................................................ 2
B. NỘI DUNG ............................................................................................................. 3
1. Đặt vấn đề: .............................................................................................................. 3
1.1. Tóm lược những nghiên cứu trong và ngồi nước liên quan đến đề tài. Tính cấp
thiết cần nghiên cứu của đề tài ..................................................................................... 3
1.2. Mục tiêu nghiên cứu .......................................................................................... 4
2. Tổng quan đề tài ...................................................................................................... 5
2.1. Tổng quan vấn đề nghiên cứu ............................................................................ 5
2.1.1. Đánh giá kết quả học tập .................................................................................... 5
2.1.2. Trắc nghiệm và trắc nghiệm khách quan ............................................................ 5
2.1.3. Một số phương pháp đánh giá bộ chất lượng đề thi ............................................ 7
2.2. Tổng quan nghiên cứu vấn đề .......................................................................... 11
2.2.1. Tình hình nghiên cứu ngồi nước liên quan tới đề tài ....................................... 11
2.2.2. Tình hình nghiên cứu trong nước liên quan tới đề tài ....................................... 11
3. Đối tượng và phương pháp nghiên cứu .................................................................. 14
3.1. Thiết kế nghiên cứu ......................................................................................... 14
3.2. Đối tượng nghiên cứu ...................................................................................... 14
3.3. Phương pháp chọn mẫu .................................................................................... 14
3.4. Phương pháp thu thập số liệu ........................................................................... 15
3.5. Phương pháp quản lý, xử lý và phân tích số liệu .............................................. 15
3.6. Các tiêu chí đánh giá đề thi .............................................................................. 16

3.7. Kiểm soát sai số ............................................................................................... 16
3.8. Đạo đức trong nghiên cứu ................................................................................ 16
4. Kết quả nghiên cứu................................................................................................ 17
4.1. Kết quả đánh giá bộ câu hỏi mơn Hóa học. ......................................................... 17
4.2. Kết quả đánh giá bộ câu hỏi môn Sinh học – Di truyền ....................................... 27
5. Bàn luận ................................................................................................................ 34
6. Kết luận và kiến nghị ............................................................................................. 38
6.1.
Kết luận ............................................................................................................38
6.2.
Kiến nghị ..........................................................................................................38
7. Tài liệu tham khảo ................................................................................................. 40
8. Phụ lục .................................................................................................................. 42


1

DANH MỤC CÁC BẢNG
Bảng 4.1. Kết quả điểm thi môn Hóa học................................................................... 17
Bảng 4.2. Bảng tổng hợp các chỉ số đánh giá câu hỏi thi mơn hóa – lớp 12.7............. 19
Bảng 4.3. Bảng tổng hợp các chỉ số đánh giá câu hỏi thi mơn hóa – lớp 12.8............. 23
Bảng 4.4: Kết quả điểm thi môn sinh học – Di truyền ................................................ 27
Bảng 4.5. Bảng tổng hợp các chỉ số đánh giá câu hỏi thi môn sinh học – lớp 12.9 ..... 29

DANH MỤC CÁC ĐỒ THỊ VÀ CÁC HÌNH

Hình 2.1. Phương pháp thu thập số liệu ..................................................................... 15
Hình 2.2. Quy trình xử lý số liệu................................................................................ 15
Đồ thị 4.1. Đồ thị dải điểm mức độ phù hợp của các câu hỏi trong đề thi với nhau. ... 18
Đồ thị 4.2. Đồ thị thân – lá thể hiện tương quan giữa độ khó của các câu hỏi thi và

năng lực của thí sinh. ................................................................................................. 19
Đồ thị 4.3. Sự phù hợp của các câu hỏi với nhau........................................................ 22
Đồ thị 4.4. Tương quan giữa độ khó của đề thi và năng lực của thí sinh..................... 22
Đồ thị 4.5. Đồ thị rải điểm mức độ phù hợp của các câu hỏi trong đề thi với nhau. .... 25
Đồ thị 4.6. Sự phù hợp của các câu hỏi với nhau........................................................ 28
Đồ thị 4.7. Tương quan của độ khó của các câu hỏi và năng lực của thí sinh. ............ 29


2
A. MỞ ĐẦU
1. Các văn bản liên quan đến việc triển khai nghiên cứu
 Quyết định công nhận chủ nhiệm đề tài.
 Quyết định phê duyệt cấp kinh phí.
 Hợp đồng khoa học và công nghệ.
2. Nội dung nghiên cứu
Nội dung nghiên cứu của đề tài là: thực trạng chất lượng bộ câu hỏi thi kết thúc
học phần mơn Hóa học và Sinh học – Di truyền.
3. Sản phẩm đề tài
Đề tài đã chỉ rõ được thực trạng chất lượng bộ câu hỏi thi kết thúc học phần mơn
Hóa học và Sinh học – Di truyền và đề xuất các giải pháp nâng cao chất lượng bộ câu
hỏi thi kết thúc học phần hai môn trên. Các kết quả trên phù hợp với kết quả dự kiến
của đề tài được trình bày tại thuyết minh đề tài.


3
B. NỘI DUNG
1. Đặt vấn đề:
1.1. Tóm lược những nghiên cứu trong và ngoài nước liên quan đến đề tài. Tính cấp
thiết cần nghiên cứu của đề tài
Bước vào thế kỷ XXI, việc cải tiến và nâng cao chất lượng giáo dục ngày càng

được quan tâm ở các cơ sở đào tạo. Trong đó, đánh giá kết quả học tập là một khâu
quan trọng nhằm xác định mức độ đạt được mục tiêu của người học. Đánh giá kết quả
học tập của người học cho thấy kết quả của quá trình dạy - học và điều tiết trở lại quá
trình dạy - học. Kết quả của việc đánh giá được thể hiện thông qua bảng điểm của
người học sau các bài thi, kiểm tra. Một vấn đề đặt ra là đề thi có thể có những thiếu
sót như: độ khó không phù hợp với người học, độ phân biệt, độ tin cậy kém. Do vậy,
các nhà quản lý, nhà giáo và những người chuyên ra đề thi đều mong muốn có ngân
hàng câu hỏi: một tập hợp lớn những câu hỏi thi, kiểm tra có chất lượng tốt, được cất
giữ và bảo mật, khi cần thì có thể rút ra những câu hỏi thích hợp và tổ hợp thành một
đề thi. Điều đó sẽ giảm đáng kể thời gian làm đề và đảm bảo rằng chỉ những câu hỏi
tốt mới được sử dụng.
Hiện nay, để kiểm tra đánh giá kết quả học tập của người học, hình thức trắc
nghiệm đã và đang được ứng dụng nhiều trong dạy học.
Trên thế giới có nhiều nghiên cứu về vấn đề chất lượng bộ câu hỏi thi kết thúc
học phần. James D. Hansen và Lee Dexter (2010) trích dẫn từ Baldwin (1984) chỉ ra
nguy cơ các ngân hàng câu hỏi có thể có chất lượng thấp. [14] Tại Việt Nam, có một
số nghiên cứu đã chỉ ra các phương pháp đánh giá chất lượng của từng câu hỏi trắc
nghiệm và chất lượng của các đề thi. Mỗi phương pháp có những ưu nhược điểm
riêng: Tác giả Nguyễn Anh Tuấn sử dụng hệ số Cronbach’s Alpha để đánh giá độ tin
cậy của đề thi. Biện pháp này có ưu điểm là có thể chỉ ra được sự thay đổi độ tin cậy
của đề thi khi thêm hoặc bớt một hay nhiều câu hỏi, qua đó chỉ ra được câu hỏi nào
nên thêm hay bớt. Tuy nhiên nhược điểm là hệ số Cronbach’s Alpha sẽ tăng khi tăng
số câu hỏi và hệ số này chỉ đánh giá được độ tin cậy của đề thi chứ không đánh giá
được các đặc trưng của từng câu hỏi riêng biệt. [10]
Nhóm tác giả Nguyễn Thị Hồng Minh, Nguyễn Đức Thiện ứng dụng phương
pháp PROX là một phương pháp hiện đại, tuy nhiên nhóm tác giả chỉ đánh giá một


4
tham số duy nhất của câu hỏi trắc nghiệm là độ khó trong khi có rất nhiều tham số

khác nhau. [4]
Đoàn Hồng Chương và cộng sự chỉ đánh giá mức độ dự đốn và năng lực của thí
sinh. Những tham số này chỉ là hai trong số rất nhiều tham số mà mơ hình RASCH
cho phép đánh giá. [2]
Tại trường Đại học Điều dưỡng Nan Định, Trung tâm KT&ĐBCLGD đã phối
hợp với các khoa, bộ môn xây dựng xong ngân hàng câu hỏi thi trắc nghiệm. Tuy
nhiên, chất lượng của ngân hàng câu hỏi chưa được kiểm định, và chưa có đề tài nào
đánh giá chất lượng ngân hàng câu hỏi này và đề xuất những biện pháp nâng cao chất
lượng ngân hàng câu hỏi.
Xuất phát từ thực tế trên, nhóm tác giả đề xuất đề tài: “Phân tích bộ câu hỏi thi
kết thúc học phần mơn Hóa học và Sinh học – Di truyền bằng Lý thuyết khảo thí hiện
đại thông qua kết quả thi năm học 2016 - 2017” để góp phần nâng cao chất lượng giáo
dục của trường.
1.2. Mục tiêu nghiên cứu
1. Mô tả thực trạng bộ câu hỏi thi kết thúc học phần bộ mơn Hóa học và Sinh vật
trường đại học Điều dưỡng Nam Định năm học 2016 - 2017.


5
2. Tổng quan đề tài
2.1. Tổng quan vấn đề nghiên cứu
2.1.1. Đánh giá kết quả học tập
Theo Bùi Hiền, đánh giá kết quả học tập là “xác định mức độ nắm được kiến
thức, kỹ năng, kỹ xảo của học sinh so với yêu cầu của chương trình đề ra. Nội dung
đánh giá là những kết quả học tập hằng ngày, cũng như những kết quả phản ánh trong
các kỳ kiểm tra định kỳ và kiểm tra tổng kết các mặt kiến thức, kỹ năng, kỹ xảo của
từng môn học. Kết quả đánh giá được thể hiện bằng số điểm cho theo thang điểm của
Bộ Giáo dục và Đào tạo hiện nay là 10 điểm”. [5]
Việc đánh giá sinh viên là một trong những yếu tố quan trọng nhất của giáo dục
đại học. Kết quả đánh giá có ảnh hưởng sâu sắc đến nghề nghiệp tương lai của sinh

viên. Việc đánh giá cịn cung cấp thơng tin cho nhà trường về hiệu quả của công việc
giảng dạy và việc hỗ trợ người học.
Quy trình đánh giá người học cần phải:
(1) Được thiết kế để đánh giá việc đạt được những kết quả học tập dự kiến cũng
như những mục tiêu khác của chương trình.
(2) Phù hợp với mục đích đánh giá, như đánh giá chẩn đốn, đánh giá q trình,
hay đánh giá tổng kết; có các tiêu chí chấm điểm được nêu rõ ràng.
(3) Được thực hiện bởi những người có hiểu biết về vai trị của đánh giá; nếu có
thể, khơng đánh giá dựa trên phán đốn của duy nhất một giám khảo.
(4) Cân nhắc xem xét mọi quy định liên quan đến thi cử để lường trước những
trường hợp có thể xảy ra liên quan đến quy định thi cử.
(5) Bảo đảm rằng việc đánh giá được tiến hành theo đúng quy trình.
(6) Chịu sự kiểm chứng của bộ phận quản lý rà sốt thường xun để bảo đảm
tính chính xác của quy trình.
2.1.2. Trắc nghiệm và trắc nghiệm khách quan
Theo Lâm Quang Thiệp (2012), trắc nghiệm là “một thao tác đo lường, bằng
cách nào đó tạo phản ứng rồi từ đó thu kết quả đo lường. Trong đó, các phương pháp
đánh giá mà thí sinh đáp ứng bằng cách viết các bài luận đủ dài được xếp vào một
nhóm thường được gọi là tự luận. Cịn các phương pháp đánh giá mà thí sinh đáp ứng
bằng cách chọn một phương án trả lời sẵn có được xếp vào một nhóm gọi là trắc
nghiệm khách quan”. [8]


6
Theo Bùi Hiền và cộng sự (2013), trắc nghiệm (test) là “bài tập chuẩn dưới dạng
các câu hỏi, hình đố … cần thực hiện để đánh giá, đo lường năng lực trí tuệ, kỹ năng,
kỹ xảo ... Các test đều phải đảm bảo 3 yêu cầu: 1) có độ tin cậy, nghĩa là đo nhiều lần
trên cùng một đối tượng thì các bộ test phải cho những kết quả giống nhau; 2) có hiệu
nghiệm, nghĩa là phải đo được đối tượng cần đo; 3) được chuẩn hóa, nghĩa là phải có
cách hướng dẫn tiến hành và xử lý kết quả theo một quy trình nhất định”. [5]

Các dạng câu hỏi trắc nghiệm khách quan: 1) câu hỏi nhiều lựa chọn; 2) câu hỏi
đúng – sai; 3) câu ghép đôi; 4) câu điền khuyết và câu trả lời ngắn.
1) Câu đúng – sai: Loại này được trình bày dưới dạng một câu phát biểu và người
học phải trả lời bằng cách lựa chọn đúng (Đ) hoặc sai (S). Loại câu hỏi này rất thơng
dụng vì nó thích hợp với những kiến thức sự kiện, có thể kiểm tra được nhiều kiến
thức trong một thời gian ngắn. Giáo viên có thể soạn một đề thi trong một thời gian
ngắn. Tuy nhiên loại câu hỏi này khó xác định điểm yếu của sinh viên do yếu tố đốn
mị, xác suất đúng - sai là 50%, có độ tin cậy thấp, đề ra thường có khuynh hướng trích
ngun văn sách giáo khoa nên khuyến khích thói quen học thuộc lịng hơn là tìm tịi
suy nghĩ.
2) Câu ghép đơi: là những câu hỏi có hai dãy thông tin, một bên là các câu hỏi,
bên kia là câu trả lời. Số câu ghép đôi càng nhiều thì xác suất may rủi càng nhỏ, do đó
càng tăng phần ghép thì độ khó của trắc nghiệm càng được nâng lên. Loại trắc nghiệm
này thích hợp với câu hỏi sự kiện, khả năng nhận biết kiến thức hay thiết lập những
mối tương quan, song khơng thích hợp cho việc áp dụng các kiến thức mang tính
nguyên lý, quy luật và khơng thích hợp cho việc đo các khả năng trí năng ở bậc cao.
3) Câu điền khuyết và câu trả lời ngắn: có ưu điểm là làm giảm xác suất đốn mị
của sinh viên, họ có cơ hội trình bày những câu trả lời khác, qua đó phát huy óc sáng
tạo. Tuy nhiên, nhược điểm của loại trắc nghiệm này là việc chấm bài mất nhiều thời
gian và giảng viên thường không đánh giá cao các câu trả lời sáng tạo tuy khác đáp án
mà vẫn có lí.
4) Câu nhiều lựa chọn: gồm hai phần: phần dẫn và phần lựa chọn. Phần dẫn là
một câu hỏi hay một câu trả lời chưa hoàn chỉnh; phần lựa chọn gồm một số phương
án (thường là 4 đến 5 phương án) để trả lời cho câu hỏi hay phần bổ sung cho câu
được hồn chỉnh. Phần lựa chọn chỉ có một phương án đúng, những phương án còn lại
gọi là phương án nhiễu. Sinh viên phải cân nhắc để chọn ra phương án trả lời đúng


7
nhất hay hợp lí nhất. Điều quan trọng là phải làm sao cho những sinh viên chưa nắm rõ

vấn đề chọn vào các phương án nhiễu.
Hiện nay, dạng câu hỏi nhiều lựa chọn được dùng nhiều do các ưu điểm:
+ Có thể đo được khả năng tư duy khác nhau. Với sự phối hợp của nhiều phương
án trả lời để chọn cho mỗi câu hỏi, giảng viên có thể dùng loại trắc nghiệm nhiều lựa
chọn để kiểm tra, đánh giá những mục tiêu giảng dạy, học tập khác nhau.
+ Độ tin cậy cao hơn. Yếu tố đốn mị may rủi giảm đi so với các loại câu hỏi trắc
nghiệm khách quan khác khi số phương án lựa chọn tăng lên. Đó cũng là lý do các nhà
soạn trắc nghiệm chuẩn thích loại câu hỏi nhiều lựa chọn hơn các loại câu hỏi khác.
+ Sinh viên phải xét đoán và phân biệt rõ ràng khi trả lời câu hỏi. Tính chất tuyệt
đối trong loại “đúng - sai” nhường chỗ cho tính chất tương đối khi sinh viên phải lựa
chọn câu trả lời đúng nhất hay hợp lý nhất trong số các phương án trả lời đã cho.
+ Tính chất giá trị tốt hơn. Loại trắc nghiệm này có độ giá trị cao hơn nhờ tính
chất có thể dùng đo những mức tư duy khác nhau. Với một bài trắc nghiệm có nhiều
câu trả lời cho sẵn để chọn, người ta có thể đo được khả năng nhớ, áp dụng các nguyên
lý, suy diễn, tổng quát hoá… rất hữu hiệu.
2.1.3. Một số phương pháp đánh giá bộ chất lượng đề thi
2.1.4.1.

So sánh trung bình, hệ số Cronbach’s Alpha và hệ số tương quan Pearson

* Hệ số Cronbach’s Alpha.
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), hệ số Cronbach’s Alpha
là một hệ số kiểm định thống kê về mức độ tin cậy và tương quan trong giữa các biến
quan sát trong thang đo. Nó cho biết sự chặt chẽ và thống nhất trong các câu trả lời
nhằm đảm bảo người được hỏi đã hiểu cùng một khái niệm.
Hệ số Cronbach’s Alpha được quy định như sau:
 Cronbach’s Alpha < 0.6: thang đo cho nhân tố là không phù hợp do thiết kế
bảng câu hỏi chưa tốt hoặc dữ liệu thu được từ khảo sát có nhiều mẫu xấu.
 0.6 < Cronbach’s Alpha < 0.7: thang đo phù hợp để thực hiện đánh giá.
 0.7 < Cronbach’s Alpha < 0.8: thang đo đạt chuẩn cho đánh giá.

 0.8 < Cronbach’s Alpha < 0.95: thang đo rất tốt: bảng câu hỏi được thiết kế trực
quan, rõ ràng, phân nhóm tốt và mẫu tốt, khơng có mẫu xấu.


8
 Cronbach’s Alpha > 0.95: thang đo có hiện tượng trùng biến do là thiết kế nội
dung các câu hỏi trong cùng nhân tố cùng phản ánh một vấn đề hoặc khơng có sự khác
biệt về mặt ý nghĩa.
Sử dụng hệ số Cronbach’s Alpha cho biết độ tin cậy của một đề kiểm tra.
* Kiểm định mối liên hệ giữa các biến.
Theo Hoàng Trọng và Chu Nguyễn Mộng Ngọc (2008), hệ số tương quan cho
biết độ mạnh của mối tương quan tuyến tính giữa hai biến số ngẫu nhiên. Có nhiều
cơng thức tính hệ số tương quan khác nhau. Hệ số tương quan được biết đến nhiều
nhất là hệ số tương quan Pearson được tính bằng cách chia hiệp phương sai của hai
biến với tích độ lệch chuẩn của chúng.
Hệ số tương quan bằng 1 trong trường hợp có tương quan tuyến tính đồng biến
và -1 trong trường hợp tương quan tuyến tính nghịch biến. Các giá trị khác trong
khoảng (-1,1) cho biết mức độ phụ thuộc tuyến tính giữa các biến. Hệ số tương quan
càng gần với -1 và 1 thì tương quan giữa các biến càng mạnh.
Giữa kết quả điểm của từng câu hỏi với điểm chung của tồn bài kiểm tra phải có
mối tương quan thuận (hệ số tương quan dương). Mối tương quan chặt chẽ giữa câu
hỏi kiểm tra và tồn bài kiểm tra góp phần làm tăng độ tin cậy của bài kiểm tra. Đánh
giá hệ số tương quan sẽ cho biết độ tin cậy và độ giá trị của đề trắc nghiệm.
2.1.4.2.

Lý thuyết khảo thí cổ điển (Classical Test Theory)

Theo Lâm Quang Thiệp (2012), giữa điểm thực của thí sinh (khó đo lường) với
điểm mà thí sinh đạt được có sai số nhất định. Phương trình cơ bản của lý thuyết khảo
thí cổ điển: xi = ti + ei (Trong đó: xi là điểm làm bài test của thí sinh i. ti là điểm

thực của thí sinh i. ei là sai số)
Sai số được giả thiết là đại lượng ngẫu nhiên. Sai số, đôi khi có thể lớn, nhỏ, có
thể có giá trị âm hoặc dương... Sai số hệ thống được bỏ qua.
Với một số lượng thí sinh lớn, trung bình cộng của sai số ngẫu nhiên bằng 0.
Trung bình cộng điểm làm bài của thí sinh bằng trung bình cộng điểm thực. Sai số
ngẫu nhiên khơng có mối tương quan với điểm thực.
Mối tương quan giữa t và e = 0. Mối tương quan của sai số giữa hai test = 0
Những bài test đồng nhất là những bài test đo cùng một đại lượng và bao gồm
những câu hỏi tương tự. Như vậy, với một số test đồng nhất:
 Điểm thực của mỗi thí sinh trong hai bài test phải tương đương nhau.


9
 Phương sai của điểm quan sát được (điểm làm bài) của thí sinh trong hai bài
test cũng phải tương đương nhau.
 Tương quan của điểm làm bài của thí sinh trong hai bài test bất kỳ phải có cùng
một giá trị.
Phương sai của điểm làm bài test của thí sinh có thể chia làm hai phần là phương
sai của điểm thực và phương sai của sai số ngẫu nhiên.
Điều đó chứng tỏ phương sai của điểm làm bài test của thí sinh phải lớn bằng
phương sai của điểm thực vì phương sai của sai số tự nhiên bằng 0. Một điều kiện để
đánh giá bài test là tỷ lệ. Tỷ lệ này gọi là độ tin cậy của bài test.
2.1.4.3.

Lý thuyết khảo thí hiện đại và mơ hình Rasch

Theo Lâm Quang Thiệp (2012): lý thuyết đánh giá hiện đại quan tâm đến xác
suất trả lời đúng đối với một câu hỏi. Xác suất đó được thể hiện là một hàm số của
năng lực thí sinh và độ khó câu hỏi và có thể có thêm một số tham biến khác. Đại
lượng cần đo là được hình dung như một đường nào đó (thẳng hoặc cong) và kết quả

đo lường được mơ tả như một điểm đặt trên đường đó. Do đó, đại lượng cần đo được
giả thiết là phân bố liên tục.
Điều kiện cốt yếu để thí sinh trả lời được câu hỏi được xem xét qua hai đại
lượng: 1) Năng lực của thí sinh; 2) Độ khó của câu hỏi. Năng lực của thí sinh và độ
khó của câu hỏi là những đại lượng được phân bố trên đường đặc trưng có tính liên tục
bao gồm các giá trị của đại lượng cần đo. Với các câu hỏi được sử dụng để định cỡ, thì
độ khó của các câu hỏi giữ vai trò thang giá trị thể hiện dọc theo đường đặc trưng của
đại lượng cần đo. Lý thuyết đánh giá hiện đại sử dụng xác suất như một hàm số của sự
khác nhau giữa tham số năng lực và tham số độ khó.
Những hàm số xác suất khác nhau (thể hiện mối quan hệ giữa năng lực thí sinh
và độ khó câu hỏi) dẫn đến những mơ hình Lý thuyết đánh giá hiện đại khác nhau, ví
dụ: Mơ hình logistic đơn giản, Mơ hình hai tham biến, Mơ hình ba tham biến của
Birnbaum, Mơ hình partial credit.
Xác suất trả lời đúng một câu hỏi được biểu thị bằng một hàm số liên quan đến
năng lực của thí sinh  (thể hiện dưới một hàm số logarit tự nhiên). Xác suất đó là hàm
P() – một đường cong đặc trưng của câu hỏi (Item Characteristic Curves - ICC).
 Đường cong tăng lên khi  tăng (năng lực của thí sinh  tăng thì xác suất trả lời
đúng P() tăng)


10
 Đường cong nằm giữa hai đường thẳng y=0 và y=1 (Hàm xác suất P() nằm
giữa 0 và 1)
 Đường cong tiệm cận đến hai đường thẳng y=0 và y=1
 P() tiến đến 0 khi   -  và P() tiến đến 1 khi   
Xác suất biểu thị hàm số độ khó câu hỏi (là  thể hiện dưới một hàm số logarit
tự nhiên) cho đường cong đặc trưng thí sinh là hàm P() (Person Characteristic Curves
- PCC). Lưu ý sự khác nhau giữa ICC và PCC.
Ở trên đã giả thiết xác suất trả lời là một hàm số đặc trưng đơn giản cho năng lực
thí sinh. Để Lý thuyết đánh giá hiện đại có thể áp dụng được với các bài test, các câu

hỏi phải là các đơn thứ nguyên (unidimensional). Không một công cụ đo lường nào là
đơn thứ ngun chính xác. ở đây có thể có một số thứ nguyên phụ (minor dimensions)
ảnh hưởng đến việc trả lời câu hỏi. Liệu có hay khơng một cơng cụ là đơn thứ ngun
thoả đáng cịn là một câu hỏi quan trọng để có thể ứng dụng Lý thuyết đánh giá hiện
đại.
Nếu năng lực  của thí sinh i đã được xác định, khi đó sự hiểu biết của thí sinh i
để trả lời câu hỏi j khơng ảnh hưởng đến khả năng có được câu trả lời đúng đối với câu
hỏi k khác.
P[ xij = 1 | , xik = 1 ] = P[ xij = 1 |  ]
Nếu điều đó sai, nghĩa là câu trả lời đối với câu hỏi j phụ thuộc vào điều gì đó
ngồi năng lực . Sự khơng phụ thuộc này được gọi là sự độc lập cục bộ hay sự độc
lập có điều kiện, và là kết quả của tính đơn thứ ngun. Điều đó cịn nghĩa là
I

P[ xij = 1, i=1,2,…,I | ] =

 P[ x

ij

 1|  ]

i 1

Hầu hết các mơ hình Lý thuyết đánh giá hiện đại sử dụng xác suất như một hàm
số của sự khác nhau giữa tham số năng lực  và tham số độ khó , tức là  - . Trong
Mơ hình logistic đơn giản (Mơ hình Rasch):
Xác suất để thí sinh i trả lời đúng câu j là
P[ xij = 1 |  ] 


exp(   )
1  exp(   )

Các kết quả làm bài của thí sinh (kết quả trả lời câu hỏi) có được sau khi tổ chức
làm một bài test được sử dụng để tính tham biến năng lực và độ khó. Phương pháp sử


11
dụng để tính các tham biến đó là phương pháp có khả năng tối đa (Maximum
likelihood).
Sự tính tốn này nhằm xác định những vị trí tương đối của các tham số, nhưng
đó khơng phải là những vị trí thực
 -  = ( + c) – ( + c)
Phương pháp đánh giá đề kiểm tra bằng lý thuyết khảo thí hiện đại có ưu điểm là
xử lý trên phần mềm chuyên dụng, mạnh, nhanh, xử lý được lượng dữ liệu lớn, lên tới
25000 lượt thí sinh trong 1 lần đánh giá, khơng u cầu máy tính cấu hình cao; trong
đề tài này, nhóm nghiên cứu áp dụng lý thuyết khảo thí hiện đại để đánh giá chất
lượng các câu hỏi thi trắc nghiệm.
2.2. Tổng quan nghiên cứu vấn đề
2.2.1. Tình hình nghiên cứu ngồi nước liên quan tới đề tài
Trên thế giới, các nghiên cứu về vấn đề đánh giá chất lượng bộ câu hỏi thi và
kiểm tra đã được tiến hành từ thế kỉ 19 với lý thuyết khảo thí cổ điển. Đến thế kỉ 20,
các nghiên cứu chủ yếu tập trung vào lý thuyết khảo thí hiện đại. một số nghiên cứu:
Gary A. Morris (2006) xem xét chất lượng các câu hỏi dựa trên việc so sánh các
đồ thị của từng câu hỏi với đường cong kỳ vọng của câu hỏi đó (phương pháp Force
Concept Inventory). Phương pháp phân tích này cho phép mơ tả các đặc trưng của một
câu hỏi bằng đồ thị. Hiện nay, phần mềm CONQUEST, một phiên bản nâng cấp của
phần mềm QUEST cho phép thực hiện phương pháp này trên cơ sở Lý thuyết khảo thí
hiện đại. [15]
Theo Amed và cộng sự (2007), một câu hỏi hay đề thi/kiểm tra thường được đặt

trong một bối cảnh thực tế. Tuy nhiên, việc này có thể gây ra các ảnh hưởng đến chất
lượng của câu hỏi. Nhóm tác giả đề xuất khái niệm "tập trung": một câu hỏi trong một
bối cảnh cụ thể được tập trung trong phạm vi mà nó giải quyết các khía cạnh của bối
cảnh, giúp kích hoạt những khái niệm có liên quan thay vì gây trở ngại cho việc hiểu
và giải quyết vấn đề. [13]
James D. Hansen và Lee Dexter (2010) trích dẫn từ Baldwin (1984) cho rằng các
ngân hàng câu hỏi trắc nghiệm có nguy có có thể có chất lượng thấp. Nhóm tác giả chỉ
ra trên tất cả các đề kiểm tra đã được sử dụng và đánh giá thì có tới 75% các câu hỏi
khơng đạt u cầu. [14]
2.2.2. Tình hình nghiên cứu trong nước liên quan tới đề tài


12
Nguyễn Anh Tuấn (2010) chỉ ra chất lượng của một đề thi trắc nghiệm khách
quan được đánh giá trên nhiều yếu tố và theo nhiều góc độ xem xét khác nhau. Tuy
nhiên, yếu tố mang tính định lượng và có ý nghĩa đặc trưng nhất có thể dùng để đánh
giá chất lượng của trắc nghiệm là độ tin cậy được tính bằng hệ số Cronbach’s Alpha.
Các trắc nghiệm cho hệ số tin cậy Cronbach’s Alpha lớn thì có chất lượng tốt và
ngược lại. các yếu tố ảnh hưởng đến chất lượng đề thi trắc nghiệm khách quan, có thể
thấy yếu tố ảnh hưởng lớn nhất đến chất lượng đề thi là việc trang bị kỹ thuật ra đề thi
trắc nghiệm khách quan cho giáo viên. [10]
Đoàn Hồng Chương và cộng sự (2016) sử dụng mơ hình IRT 3 tham số để đo
lường độ khó, độ phân biệt của các câu hỏi trong đề thi trắc nghiệm khách quan nhiều
lựa chọn, đồng thời khảo sát sự ảnh hưởng của mức độ dự đốn của thí sinh khi trả lời
câu hỏi đối với việc đo lường và đánh giá năng lực của thí sinh. Dữ liệu trong bài viết
được thu thập từ một mẫu ngẫu nhiên các bài thi cuối kì. Việc xử lí dữ liệu được thực
hiện bằng phần mềm R. Nhóm tác giả đã nêu quy trình chi tiết cho việc đo lường, đánh
giá độ khó, độ phân biệt và mức độ dự đốn của thí sinh khi trả lời các câu hỏi trắc
nghiệm khách quan nhiều lựa chọn. Và cũng đã đánh giá ảnh hưởng của các tham số
của mơ hình đến việc đánh giá năng lực của thí sinh; đồng thời so sánh và chọn lựa

được mơ hình thích hợp cho dữ liệu được khảo sát. [2]
Nguyễn Thị Hồng Minh, Nguyễn Đức Thiện (2016) tìm hiếu và triển khai thử
nghiệm phương pháp PROX - một phương pháp được phát triển dựa trên mơ hình
RASCH để định lượng độ khó của câu hỏi và khả năng của thí sinh. Nhóm tác giả cho
rằng độ khó cảu câu hỏi là thuộc tính quan trọng trong việc thành lập và bổ sung các
câu hỏi vào bộ câu hỏi. [4]
Nguyễn Trường Sơn (2010) sử dụng mơ hình Rasch để đánh giá chất lượng bộ
câu hỏi trắc nghiệm khách quan và chỉ ra đa số giảng viên ở sau khi ra đề, coi thi,
chấm thi xong hầu như khơng bao giờ phân tích câu hỏi thi cũng như bài thi. Nguyên
nhân chính của vấn đề này là do chưa được đào tạo, bồi dưỡng kiến thức, mặt khác còn
do vấn đề về thời gian và kinh phí cho vấn đề này.. Tác giả đề xuất nâng cao hiệu quả
quy trình thiết kế đề thi tại các đơn vị bằng các biện pháp như sau: Nâng cao nhận thức
của giảng viên về tầm quan trọng của việc kiểm tra đánh giá thơng qua hình thức thi
trắc nghiệm khách quan. Bồi dưỡng GV về quy trình và kỹ thuật xây dựng đề thi trắc


13
nghiệm khách quan, cách xử lý kết quả thi. Tổ chức cho giảng viên tự xây dựng và thử
nghiệm đề thi trắc nghiệm khách quan cho người học. [6]
Trong đề tài này, nhóm tác giả sử dụng mơ hình RASCH để phân tích bộ câu hỏi
thi kết thúc học phần mơn Hóa học và Sinh học – Di truyền.


14
3. Đối tượng và phương pháp nghiên cứu
3.1. Thiết kế nghiên cứu
Nghiên cứu mô tả cắt ngang, thời gian từ tháng 3 năm 2017 đến tháng 12 năm
2017.
3.2. Đối tượng nghiên cứu
- Bộ câu hỏi thi kết thúc học phần theo hình thức trắc nghiệm của bộ mơn Hố

học và Sinh vật
- Sinh viên đại học chính quy tham gia dự thi kết thúc học phần mơn Hóa học và
sinh học trong học kỳ 2 năm học 2016 - 2017
Tiêu chuẩn chọn mẫu:
- Đối với bộ câu hỏi:
+ Các câu hỏi trắc nghiệm khách quan của bộ mơn hố học và sinh học đã được
nghiệm thu và đưa vào sử dụng.
+ Các câu hỏi được lựa chọn vào đề thi và được tiến hành thi cho đối tượng đại
học chính quy trong học kỳ 2 năm học 2016 – 2017
+ Các câu hỏi trắc nghiệm thuộc các đề thi có số lượng thí sinh dự thi ≥ 30.
- Đối với sinh viên: sinh viên đại học chính quy tham gia dự thi kết thúc học
phần mơn Sinh học và hóa học trong học kỳ 2 năm học 2016 – 2017 đồng ý tham gia
nghiên cứu
Tiêu chuẩn loại trừ
 Nghiên cứu không đánh giá các câu hỏi không nằm trong bộ câu hỏi trắc
nghiệm đã nghiệm thu, những câu hỏi có số lượng thí sinh dự thi < 30.
 Đối với sinh viên: không khảo sát trên sinh viên không học và thi hai mơn Hóa
học và Sinh học, khơng đồng ý tham gia khảo sát.
3.3. Phương pháp chọn mẫu
* Số lượng câu hỏi được đưa vào đánh giá
Cỡ mẫu: chọn toàn bộ các câu hỏi được thi và đáp ứng tiêu chuẩn chọn mẫu.
Trong học kỳ 2 năm học 2016 – 2017 mỗi mơn có các lớp tham gia học tập và thi
kết thúc học phần như sau:
 Hóa học: 08 lớp học phần (các lớp HP 7, 8, 9, 10, 11, 12, 13, 14).
 Sinh vật: 07 lớp học phần (các lớp HP 7, 9, 10, 11, 12, 13, 14).


15
Bộ câu hỏi thi kết thúc học phần mơn Hóa học có 928 câu hỏi (303 câu hỏi dạng
đúng – sai, 625 câu hỏi dạng chọn câu trả lời đúng nhất). Bộ câu hỏi thi kết thúc học

phần môn Sinh vật có 575 câu hỏi (220 câu hỏi dạng đúng – sai, 225 câu hỏi dạng
chọn câu trả lời đúng nhất, 130 câu hỏi dạng ghép cặp).
Trên cơ sở số các lớp học phần dự thi trong học kỳ 2 và số lượng câu hỏi trong
bộ câu hỏi, cỡ mẫu mơn Sinh học: 300 câu hỏi, mơn Hóa học: 350 câu hỏi.
3.4. Phương pháp thu thập số liệu
Thu thập số liệu bằng cách mã hóa và nhập số liệu từ bài làm các câu trả lời của
thí sinh trên máy.

Hình 2.1. Phương pháp thu thập số liệu
3.5. Phương pháp quản lý, xử lý và phân tích số liệu
Nhập và làm sạch số liệu trên MS Excel.
Xử lý số liệu trên phần mềm QUEST và MS EXCEL.

Hình 2.2. Quy trình xử lý số liệu


16
3.6. Các tiêu chí đánh giá đề thi (theo Lý thuyết khảo thí hiện đại)
 Mức độ phù hợp của các câu hỏi với nhau (Tiêu chí Infit MNSQ). Sự phù hợp
của các câu hỏi thi thể hiện các câu hỏi thi cùng đo một đại lượng có tên gọi là INFIT
MNSQ, giá trị của đại lượng này phải nằm trong khoảng (0.77 đến 1.30)
 Phân bố độ khó câu hỏi thi và năng lực thí sinh: mức độ tương quan giữa độ
khó của đề thi và năng lực của thí sinh được thể hiện tại đồ thị thân – lá.
 Độ phân biệt (Tiêu chí Disc). Độ phân biệt phải nằm trong khoảng 0.77 – 1.30
 Tiêu chí tỷ lệ phần trăm. Phương án đúng phải có tỉ lệ thí sinh lựa chọn cao hơn
phương án sai.
 Tiêu chí hệ số tương quan point biserial. Là hệ số tương quan điểm của câu hỏi
với điểm của toàn bài thi. Hệ số này phải lớn hơn 0.
 Tiêu chí P-value: là xác suất thống kê khả năng mỗi phương án trả lời được lựa
chọn, phải nhỏ hơn hoặc bằng 0,05.

 Tiêu chí Mean ability: Là thang đo logarit năng lực của thí sinh đưa ra sự lựa
chọn của mình. Phương án trả lời đúng phải có Mean ability cao hơn các phương án
trả lời sai.
 Tiêu chí Error: Error là sự tính tốn độ tin cậy của câu hỏi, thơng thường nhỏ
hơn 0.2.
3.7. Kiểm soát sai số
Số liệu được nhập 02 và kiểm tra tính tương đương của hai lần nhập.
Làm sạch số liệu trên MS Excel.
Các câu hỏi trùng lặp được phát hiện bằng cách đối chiếu các đề thi gốc với
nhau.
3.8. Đạo đức trong nghiên cứu
Nghiên cứu được sự cho phép của Lãnh đạo nhà trường, sự đồng ý của hai bộ
mơn: Hóa học và Sinh vật.
Thơng tin cá nhân của thí sinh, các đề thi được bảo mật.


17
4. Kết quả nghiên cứu
4.1. K t qu

ánh giá b câu h i mơn Hóa h c.

4.1.1. K t qu

i m thi mơn Hố h c
Bảng 4.1. Kết quả điểm thi mơn Hóa học.

Lớp

Trung

bình

Trung
Vị

Điểm
xuất
hiện
nhiều
nhất
5.60
5.20
5.40
6.20
7.20
6.80
7.40
6.80

Độ
lệch
chuẩn

Phương
sai

hoa_12.7
6.02
6.00
1.26

1.59
hoa_12.8
5.24
5.20
0.82
0.67
hoa_12.9
6.01
6.00
0.97
0.94
hoa_12.10
5.92
6.00
1.15
1.31
hoa_12.11
6.91
7.00
0.94
0.88
hoa_12.12
7.04
7.00
0.82
0.67
hoa_12.13
7.75
7.80
0.78

0.62
hoa_12.14
7.19
7.20
0.92
0.85
Trung
6.53
6.51
7.40
1.25
1.56
bình
chung
Nhận xét: Theo bảng trên, dải điểm của mơn Hóa học trải

Điểm
thấp
nhất

Điểm cao
nhất

3.40
3.20
4.00
3.80
4.80
5.20
5.20

5.20

8.20
7.00
8.00
8.60
8.80
9.00
9.20
8.80

3.20

9.20

từ 3,20 – 9,20. Trong

đó điểm trung bình là 6,53; điểm số các sinh viên đạt được nhiều nhất là 7,40. Điểm
trội > điểm trung bình > 5,0; khoảng cách giữa điểm 0,0 và điểm thấp nhất trong dải
điểm là 3.2 trong khi khoảng cách giữa điểm 10,0 và điểm cao nhất trong dải điểm là
0,8. Như vậy đề thi dễ so với thí sinh, tuy nhiên không dễ hơn nhiều.
Kết quả thi giữa các lớp khơng có dự khác biệt nhiều, như vậy mức độ phân bố
các câu hỏi, độ khoá dễ khá phù hợp
4.1.2. K t qu phân tích câu h i thi mơn hố h c
4.1.2.1. Lớp học phần 12.7
Phân tích câu hỏi thi mơn Hóa học – lớp học phần 12.7 được đánh giá dựa vào
những tiêu chí sau:
* Mức độ phù hợp:
Mức độ phù hợp của các câu hỏi với nhau được thể hiện tại đồ thị dưới đây (tiêu
chí Infit MNSQ).

INFIT
MNSQ
.63
.67
.71
.77
.83
.91
1.00
1.10
1.20
1.30
----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+-----1 item 1
.
|*
.
2 item 2
.
|*
.
3 item 3
.
| *
.


18
4 item 4
.
|

*
.
6 item 6
.
*|
.
7 item 7
.
|
*
.
8 item 8
.
|
*
.
9 item 9
.
|
*
.
10 item 10
.
*
|
.
11 item 11
.
*
|

.
12 item 12
.
|
*
.
13 item 13
.
*
|
.
14 item 14
.
|
*
.
15 item 15
.
| *
.
16 item 16
.
* |
.
17 item 17
.
| *
.
18 item 18
.

*
|
.
19 item 19
.
|
*
.
20 item 20
.
*
|
.
21 item 21
.
*|
.
22 item 22
.
*
|
.
23 item 23
.
*
|
.
24 item 24
.
*

|
.
25 item 25
.
|*
.
26 item 26
.
|
*
.
27 item 27
.
|
*
.
28 item 28
.
|*
.
29 item 29
.
*
|
.
30 item 30
.
*
|
.

31 item 31
.
*
|
.
32 item 32
.
* |
.
33 item 33
.
*
|
.
34 item 34
.
|
*
.
35 item 35
.
*
|
.
36 item 36
.
| *
.
37 item 37
.

*
|
.
38 item 38
.
*
.
39 item 39
.
|*
.
40 item 40
.
* |
.
41 item 41
.
* |
.
42 item 42
.
|
*
.
43 item 43
.
|
*
.
44 item 44

.
|
*
.
45 item 45
.
| *
.
46 item 46
.
*|
.
47 item 47
.
* |
.
48 item 48
.
|
*
.
49 item 49
.
|
*
.
50 item 50
.
*
|

.
===========================================================================================================

Đồ thị 4.1. Đồ thị dải điểm mức độ phù hợp của các câu hỏi trong đề thi với nhau.
Theo đồ thị trên, chúng ta nhận thấy tất cả các câu hỏi đều thỏa mã tiêu chí Infit
MNSQ.
Sự tương quan giữa độ khó của các câu hỏi và năng lực của thí sinh được thể
hiện tại đồ thị thân – lá dưới đây. Trong đồ thị, phần lá bên phải là số thứ tự của các
câu hỏi, câu hỏi ở vị trí càng cao trên đồ thị thì càng khó. Cịn ở phần lá bên trái mỗi
dấu X tượng trưng cho một thí sinh. Thí sinh ở vị trí càng cao trên đồ thị thì càng có
năng lực cao.
Item Estimates (Thresholds)
---------------------------------------------------------------------------------------------2.0
|
|
|
29
|
|
1
|
X
|
30
32
XX
|
|
10
XX

|
16
XX
|
13
1.0
|
XX
|
25
48
|
36
X
|
7
31
33
XXX
|
45
XXXX
|
46
XXX
|
XX
|
17
26

34


19
XXX
XXXXXX
XXX
XX

|
14
15
20
27
38
|
19
|
21
.0
|
8
39
|
|
23
40
43
50
|

44
X
|
42
X
|
X
|
|
11
22
24
35
37
|
2
3
|
12
|
49
-1.0
|
|
4
|
|
|
|
|

18
41
47
|
|
6
9
|
|
-2.0
|
|
28
|
|
|
|
|
|
|
|
|
-3.0
|
----------------------------------------------------------------------------------------------

Đồ thị 4.2. Đồ thị thân – lá thể hiện tương quan giữa độ khó của các câu hỏi thi và
năng lực của thí sinh.
Theo đồ thị trên, đề thi dễ hơn so với năng lực của thí sinh. Đặc biệt, có một số
câu hỏi có gần 100% số thí sinh trả lời đúng. Đây là những câu hỏi quá dễ, khơng đánh

giá được thí sinh, cần được loại bỏ.
* Các chỉ số đánh giá:
Bảng 4.2. Bảng tổng hợp các chỉ số đánh giá câu hỏi thi mơn hóa – lớp 12.7
Tiêu chí
Tiêu chí Mean
tỉ lệ phần Tiêu
Tiêu
Tiêu
Tiêu
Ability
trăm
TT
Câu
chí
chí
chí Pt- chí pDisc
Error Trả lời Trả lời Trả lời Biserial value
đúng
sai
đúng
1
Câu 1
0.85
0.09
0.73
0.62
23.7
0.15
0.002
2

Câu 2
0.84
0.09
0.67
0.51
76.3
0.14
0.025
3
Câu 3
0.88
0.09
0.62
0.52
76.3
0.18
0.036
4
Câu 4
0.74
0.12
0.72
0.47
82.1
0.04
0.233
5
Câu 5 100% sinh viên trả lời đúng: quá dễ
6
Câu 6

0.82
0.23
0.61
0.48
89.7
0.12
0.051
7
Câu 7
0.59
0.03
0.81
0.41
43.6
0.11
0.075
8
Câu 8
0.81
0.04
0.69
0.51
61.5
0.11
0.012
9
Câu 9
0.59
0.23
0.94

0.44
89.7
0.11
0.068
10
Câu 10 1.03
0.06
0.66
0.7
30.8
0.32
0.157
11
Câu 11
1.1
0.07
0.44
0.58
74.4
0.4
0.174


20

TT

Câu

Tiêu

chí
Disc

12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38

39
40
41
42
43
44
45
46
47
48
49

Câu 12
Câu 13
Câu 14
Câu 15
Câu 16
Câu 17
Câu 18
Câu 19
Câu 20
Câu 21
Câu 22
Câu 23
Câu 24
Câu 25
Câu 26
Câu 27
Câu 28
Câu 29

Câu 30
Câu 31
Câu 32
Câu 33
Câu 34
Câu 35
Câu 36
Câu 37
Câu 38
Câu 39
Câu 40
Câu 41
Câu 42
Câu 43
Câu 44
Câu 45
Câu 46
Câu 47
Câu 48
Câu 49

0.72
1.02
0.63
0.87
1
0.87
1.05
0.85
1.11

0.95
1.11
1.03
1.2
0.93
0.8
0.83
0.81
0.96
0.98
1.29
0.95
1.11
0.7
1.3
0.87
1.03
0.93
0.89
0.98
0.98
0.82
0.64
0.61
0.87
0.95
0.88
0.79
0.8


Tiêu
chí
Error
0.09
0.04
0.03
0.03
0.05
0.03
0.19
0.03
0.03
0.03
0.07
0.04
0.07
0.04
0.03
0.03
0.31
0.1
0.06
0.03
0.06
0.03
0.03
0.07
0.04
0.07
0.03

0.04
0.04
0.19
0.05
0.04
0.05
0.03
0.03
0.19
0.04
0.1

Tiêu chí
tỉ lệ phần Tiêu
trăm
chí PtBiserial
Trả lời Trả lời Trả lời
đúng
sai
đúng
0.74
0.47
76.9
0.02
0.65
0.67
35.9
0.32
0.81
0.43

53.8
0.07
0.68
0.54
53.8
0.17
0.66
0.66
33.3
0.3
0.67
0.55
51.3
0.17
0.33
0.53
87.2
0.35
0.67
0.53
56.4
0.15
0.55
0.65
53.8
0.4
0.62
0.57
59
0.25

0.43
0.58
74.4
0.4
0.55
0.58
64.1
0.32
0.36
0.6
74.4
0.49
0.68
0.6
38.5
0.22
0.72
0.51
51.3
0.1
0.7
0.52
53.8
0.13
0.58
0.48
92.3
0.11
0.7
0.72

20.5
0.26
0.68
0.69
28.2
0.27
0.51
0.79
43.6
0.58
0.69
0.66
28.2
0.25
0.59
0.69
43.6
0.41
0.77
0.46
51.3
0
0.28
0.63
74.4
0.59
0.69
0.56
41
0.17

0.49
0.56
74.4
0.32
0.64
0.57
53.8
0.23
0.65
0.53
61.5
0.19
0.58
0.57
64.1
0.28
0.42
0.51
87.2
0.27
0.67
0.51
69.2
0.11
0.79
0.45
64.1
0.06
0.83
0.43

66.7
0.08
0.69
0.56
46.2
0.17
0.65
0.58
48.7
0.25
0.56
0.49
87.2
0.17
0.73
0.52
38.5
0.09
0.67
0.49
79.5
0.09
Tiêu chí Mean
Ability

Tiêu
chí pvalue
0.276
0.155
0.15

0.026
0.148
0.032
0.164
0.003
0.174
0.117
0.175
0.158
0.179
0.094
0.101
0.036
0.075
0.122
0.135
0.18
0.118
0.175
0.314
0.18
0.024
0.157
0.098
0.048
0.037
0.133
0.063
0.188
0.124

0.031
0.116
0.035
0.115
0.104


21
Tiêu chí
tỉ lệ phần Tiêu
Tiêu
Tiêu
Tiêu
trăm
TT
Câu
chí
chí
chí Pt- chí pDisc
Error Trả lời Trả lời Trả lời Biserial value
đúng
sai
đúng
50
Câu 50 1.18
0.04
0.46
0.64
64.1
0.47

0.001
Sau khi so sánh các chỉ số trong bảng với các chỉ số quy ước trong lý thuyết khảo
Tiêu chí Mean
Ability

thí hiện đại, ta nhận thấy:
 Có 8/50 câu hỏi của đề thi (chiếm 16%) khơng đảm bảo các tiêu chí Disc.
 Có 3/50 số câu hỏi của đề thi (chiếm 6%) không đảm bảo các tiêu chí Error.
 Có 16/50 số câu hỏi của đề thi (chiếm 32%) không đáp ứng tiêu chí Mean
Ability.
 Có 15/50 số câu hỏi của đề thi (chiếm 30%) khơng đáp ứng tiêu chí tỉ lệ phần
trăm.
 Có 50/50 số câu hỏi của đề thi (chiếm 100%) đáp ứng tiêu chí Pt-Biserial
 Có 35/50 số câu hỏi của đề thi (chiếm 70%) khơng đáp ứng tiêu chí p-value.
Các câu hỏi này cần được chỉnh sửa để phù hợp hơn
4.1.2.2. Lớp học phần 12.8
* Sự phù hợp của các câu hỏi với nhau:
INFIT
MNSQ
.63
.67
.71
.77
.83
.91
1.00
1.10
1.20
1.30
----------+---------+---------+---------+---------+---------+---------+---------+---------+---------+-----1 item 1

.
|
*
.
2 item 2
.
|
*
.
3 item 3
.
*
|
.
4 item 4
.
|*
.
5 item 5
.
| *
.
6 item 6
.
*
.
7 item 7
.
|
*

.
8 item 8
.
|
*
.
9 item 9
.
|
*
.
10 item 10
.
*
.
11 item 11
.
*
.
12 item 12
.
*|
.
13 item 13
.
|
*
.
14 item 14
.

*|
.
15 item 15
.
*
|
.
16 item 16
.
|*
.
17 item 17
.
*
.
18 item 18
.
*|
.
19 item 19
.
*|
.
20 item 20
.
|
*
.
21 item 21
.

*|
.
22 item 22
.
*
|
.
23 item 23
.
| *
.
24 item 24
.
* |
.
25 item 25
.
*
|
.
26 item 26
.
|
*
.
27 item 27
.
*
.
28 item 28

.
|
*
.
29 item 29
.
*
|
.
30 item 30
.
* |
.
31 item 31
.
* |
.
32 item 32
.
*
|
.
33 item 33
.
*
|
.
34 item 34
.
*

|
.
35 item 35
.
|
*
.
36 item 36
.
*
|
.
37 item 37
.
*
|
.


22
38
39
40
41
42
43
44
45
46
47

48
49
50

item 38
.
|
*
.
item 39
.
|
*
.
item 40
.
|
*
.
item 41
.
|
*
.
item 42
.
*
.
item 43
.

|
*
.
item 44
.
|*
.
item 45
.
*
|
.
item 46
.
| *
.
item 47
.
*
|
.
item 48
.
|
*
.
item 49
.
* |
.

item 50
.
* |
.
=====================================================================================================

Đồ thị 4.3. Sự phù hợp của các câu hỏi với nhau
Theo đồ thị trên, chúng ta nhận thấy tất cả các câu hỏi nào đều thỏa mã tiêu chí
Infit MNSQ.
Tương quan giữa độ khó của đề thi và năng lực của thí sinh được thể hiện trong
đồ thị thân - lá:
Item Estimates (Thresholds)
----------------------------------------------------------------------------------------------------------3.0
|
|
36
X
|
|
X
|
|
16
42
|
X
|
2.0
XXX
|

|
1
XX
|
XXXXXX
|
XXX
|
49
XXXXXXXXX
|
XXXXXXX
|
19
33
44
48
XX
|
21
22
1.0
XXXXXXXXXXXXX
|
12
XXXXXXXXX
|
15
28
XXXXX

|
20
41
XXX
|
17
45
X
|
32
XXXX
|
34
|
9
39
50
X
|
14
47
.0
|
13
31
|
2
43
|
38

46
|
3
26
30
35
|
37
|
4
25
|
7
-1.0
|
8
40
|
29
|
|
5
|
11
|
|
10
23
24
|

-2.0
|
|
|
|
|
6
27
|
|
|
-3.0
|
|
18
|
|
|
|
|
|
-4.0
|
-----------------------------------------------------------------------------------------------------------

Đồ thị 4.4. Tương quan giữa độ khó của đề thi và năng lực của thí sinh


×