Tải bản đầy đủ (.pdf) (81 trang)

(Luận văn thạc sĩ) đánh giá các yếu tố ảnh hưởng đến quá trình xây dựng bộ đề thi trắc nghiệm khách quan tại khoa công nghệ thông tin đh thái nguyên

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.4 MB, 81 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƢỢNG GIÁO DỤC

_______________________

Nguyễn Anh Tuấn

ĐÁNH GIÁ CÁC YẾU TỐ ẢNH HƢỞNG ĐẾN QUÁ TRÌNH
XÂY DỰNG CÁC BỘ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN
TẠI KHOA CÔNG NGHỆ THÔNG TIN - ĐH THÁI NGUYÊN

LUẬN VĂN THẠC SĨ

Hà Nội – 2010

1


ĐẠI HỌC QUỐC GIA HÀ NỘI
VIÊN ĐẢM BẢO CHẤT LƢỢNG GIÁO DỤC

______________________________

Nguyễn Anh Tuấn

ĐÁNH GIÁ CÁC YẾU TỐ ẢNH HƢỞNG ĐẾN QUÁ TRÌNH
XÂY DỰNG CÁC BỘ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN
TẠI KHOA CÔNG NGHỆ THÔNG TIN - ĐH THÁI NGUYÊN

Chuyên ngành: Đo lƣờng và đánh giá trong giáo dục
(Chuyên ngành đào tạo thí điểm)


LUẬN VĂN THẠC SĨ

Ngƣời hƣớng dẫn khoa học:
PGS.TS. Nguyễn Công Khanh

Hà Nội - 2010

2


MỤC LỤC
Trang
Trang phụ bìa
Lời cam đoan ............................................................................................. 1
Lời cảm ơn ................................................................................................. 2
Mục lục ...................................................................................................... 3
Danh mục các chữ viết tắt .......................................................................... 5
Danh mục bảng ......................................................................................... 6
Danh mục hình ........................................................................................... 7
MỞ ĐẦU
1. Lý do chọn đề tài............................................................................. 8
2. Mục đích nghiên cứu....................................................................... 9
3. Giới hạn nghiên cứu ........................................................................ 9
4. Phương pháp nghiên cứu ................................................................. 9
Chƣơng 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN
1.1. Các khái niệm về chất lượng bộ đề thi trắc nghiệm..................... 11
1.1.1. Các công cụ đo lường đánh giá kết quả học tập ................ 11
1.1.2. Trắc nghiệm và những vấn đề liên quan ........................... 13
1.1.3. Độ tin cậy của bộ câu hỏi trắc nghiệm .............................. 19
1.1.4. Độ giá trị (hiệu lực) của bộ câu hỏi trắc nghiệm ............... 24

1.2. Quy trình xây dựng bộ đề thi trắc nghiệm khách quan................ 26
1.2.1. Các quy tắc viết câu hỏi trắc nghiệm nhiều lựa chọn........ 26
1.2.2. Xây dựng bảng trọng số của môn học .............................. 31
1.2.3. Xây dựng ngân hàng đề thi trắc nghiệm môn học ............ 32
Chƣơng 2. PHƢƠNG PHÁP NGHIÊN CỨU
2.1. Những định hướng, trọng tâm nghiên cứu .................................. 34
2.1.1. Chuyên đề nghiên cứu thứ nhất ........................................ 34

1


2.1.2. Chuyên đề nghiên cứu thứ hai .......................................... 34
2.1.3. Chuyên đề nghiên cứu thứ ba ........................................... 35
2.2. Thiết kế mẫu phiếu điều tra đối với giáo viên............................. 35
Chƣơng 3. XỬ LÝ SỐ LIỆU KẾT QUẢ THI TRẮC NGHIỆM
3.1. Xử lý số liệu kết quả thi TNKQ ................................................. 39
3.1.1. Phân tích độ khó của item ................................................ 39
3.1.2. Phân tích độ phân biệt của item........................................ 40
3.1.3. Đánh giá độ tin cậy của bài trắc nghiệm........................... 42
3.1.4. Xử lý số liệu đề thi trên mơ hình QUEST ........................ 48
3.1.5. Kết luận về độ giá trị của các bộ đề.................................. 52
3.2. Xử lý số liệu mẫu phiếu hỏi trong giảng viên ............................. 52
3.2.1. Đánh giá độ tin cậy của công cụ đo (mẫu phiếu hỏi) ........ 52
3.2.2. Đánh giá về độ giá trị của cơng cụ đo và sự phù hợp
của mơ hình các yếu tố ảnh hưởng đến chất lượng
bộ đề thi TNKQ qua xử lý phiếu hỏi ............................... 62
3.3. Kết luận về các yếu tố ảnh hưởng đến việc xây dựng
bộ đề TNKQ .............................................................................. 62
KẾT LUẬN, ĐỀ XUẤT GIẢI PHÁP, KIẾN NGHỊ
4.1. Kết luận ...................................................................................... 71

4.2. Đề xuất giải pháp ........................................................................ 73
TÀI LIỆU THAM KHẢO...................................................................... 74
PHỤ LUC
Phụ lục 1. File dữ liệu mon01.Itn ...................................................... 75
Phụ lục 2. File dữ liệu mon01.map .................................................... 77
Phụ lục 3. Mẫu phiếu hỏi khảo sát giảng viên ................................... 81

2


DANH MỤC CÁC CHỮ VIẾT TẮT

VIẾT TẮT

TT

ĐỌC LÀ

1

ĐHTN

Đại học Thái Nguyên

2

GD

Giáo dục


3

GD – ĐT

Giáo dục - đào tạo

4

GV

Giảng viên

5

HS

Học sinh

6

KT – ĐG

Kiểm tra đánh giá

7

MCQ

Câu hỏi nhiều lựa chọn


8

NXB

Nhà xuất bản

9

SV

Sinh viên

10

TNKQ

Trắc nghiệm khách quan

3


DANH MỤC BẢNG
Trang
Bảng 1.1: Ví dụ về bảng trọng số của 1 đề thi
hết học phần gồm 60 câu trắc nghiệm ...................................................32
Bảng 3.1: Kết quả phân tích độ tin cậy (Reliability Analysis Alpha)
của toàn bài trắc nghiệm trong đề số 1 ..................................... 44
Bảng 3.2: Các thông số về độ tin cậy (Reliability Statistics) ..................... 46
Bảng 3.3: Hệ số tin cậy Alpha Cronbach’s của 50 đề trắc nghiệm ............ 46
Bảng 3.4: Phân bố tương quan giữa độ khó của đề và năng lực học sinh .. 49

Bảng 3.5: Phân bố các item trong khoảng cho phép (infit mean square) ... 50
Bảng 3.6: Các thông số đo lường của từng item trong file mon1.itn ......... 51
Bảng 3.7: Hệ số tin cậy của từng item trên mẫu 50 giáo viên (N = 50) ..... 55
Bảng 3.8: Ma trận tương quan của các item qua xử lý phiếu hỏi .............. 57
Bảng 3.9: Ma trận phân bố của các item phiếu hỏi trong file Phieu.map .. 60
Bảng 3.10: Phân bố của các item trong phiếu hỏi
trong khoảng cho phép (infit mean square) ............................. 61

4


DANH MỤC HÌNH

Trang
Hình 1.1: Sơ đồ các phương pháp kiểm tra - đánh giá ............................. 12
Hình 3.1: Thủ tục Analyze \ Scale \ Reliability trong file SPSS.sav ......... 54
Hình 3.2: Phân bố thống kê của biến “diem.ptn” ...................................... 64
Hình 3.3: Biểu đồ phân chia mức khi Recode biến “diem.ptn” ................ 65
Hình 3.4: Thủ tục Transform \ Recode \ Into Same Variables .................. 66
Hình 3.5: Thủ tục Transform \ Recode \ Into
Same Variables khi nhóm biến ................................................. 65
Hình 3.6: Biểu đồ phân bố biến “chl.de” trên mẫu
kết quả thi của 50 bộ đề TNKQ................................................................... 66
Hình 3.7: Phân bố mức của biến “chl.de” sau khi Recode ....................... 67
Hình 3.8: Thủ tục Bảng chéo (Statistics \ Summaries \ Crosstabs) ........... 68
Hình 3.9: Kết quả bảng chéo Crosstabs
giữa hai biến“diem.ptn.nhom” và “chl.de.nhom” ..................... 70

5



MỞ ĐẦU
1. Lý do chọn đề tài
Để nâng cao chất lượng giảng dạy đại học, việc đánh giá chính xác kết
quả học tập của sinh viên là một vấn đề rất quan trọng. Trong thực trạng giáo
dục đại học còn nhiều tiêu cực và bất cập như hiện nay, việc áp dụng hình
thức thi, kiểm tra trắc nghiệm khách quan là một trong những biện pháp có
hiệu quả cho phép đánh giá tương đối chính xác kết quả học tập của sinh viên.
Khoa Công nghệ thông tin - Đại học Thái Nguyên cũng như các trường đại
học khác hiện đang tích cực áp dụng hình thức thi trắc nghiệm khách quan
cho khoảng 40% tổng số các môn học, coi đây là một trong những biện pháp
nhằm đổi mới phương pháp kiểm tra đánh giá, nâng cao chất lượng giáo dục.
Tuy nhiên một thực tế xảy ra là chất lượng các bộ đề thi trắc nghiệm khách
quan chưa được bảo đảm cả về độ giá trị cũng như độ tin cậy. Do đó tơi đã lựa
chọn đề tài “Đánh giá các yếu tố ảnh hưởng đến chất lượng các bộ đề thi trắc
nghiệm khách quan tại Khoa Công nghệ thông tin - Đại học Thái Nguyên”
Thực tế hiện nay việc xây dựng các bộ đề thi trắc nghiệm khách quan
được giao cho các nhóm giáo viên phụ trách mơn học thực hiện. Các giáo
viên xây dựng bộ đề hầu hết đều theo kinh nghiệm chủ quan của mình, chưa
được trang bị đầy đủ về kiến thức và kỹ năng thiết kế đề thi trắc nghiệm. Các
đề thi do giáo viên soạn thảo được đưa vào ứng dụng trực tiếp, không qua q
trình thử nghiệm và đánh giá. Chính vì vậy phân bố điểm thi khơng thể hiện
tính chuẩn, do cịn có nhiều câu hỏi kém chất lượng. Như chúng ta biết, hiện
nay chưa có cơng trình nào nghiên cứu cụ thể về vấn đề này. Vì vậy chưa có
một kết luận chính xác về độ tin cậy, độ giá trị của các bộ đề thi trắc nghiệm
khách quan cũng như các yếu tố ảnh hưởng đến chất lượng bộ đề trắc nghiệm.
Thực hiện đề tài này, chúng tôi mong muốn sẽ đánh giá được thực chất
về độ giá trị, độ tin cậy của các bộ đề thi trắc nghiệm khách quan của Nhà

6



trường cũng như các yếu tố ảnh hưởng đến chất lượng các bộ đề thi trắc
nghiệm, từ đó chỉ ra được các giải pháp khắc phục.
2. Mục đích nghiên cứu của đề tài
Nghiên cứu này hướng đến những mục tiêu như sau:
- Đánh giá độ tin cậy của bộ đề thi trắc nghiệm khách quan.
- Đánh giá độ giá trị của bộ đề thi trắc nghiệm khách quan.
- Nghiên cứu các yếu tố ảnh hưởng đến chất lượng bộ đề trắc nghiệm.
3. Giới hạn nghiên cứu của đề tài
Đề tài giới hạn trong việc nghiên cứu, đánh giá độ tin cậy, độ giá trị của
50 bộ đề thi trắc nghiệm khách quan đã được sử dụng tại Khoa CNTT ĐHTN. Nghiên cứu các yếu tố ảnh hưởng đến việc xây dựng đề thi trắc
nghiệm của 50 giáo viên thông qua xử lý phiếu điều tra ý kiến kết hợp xử lý
số liệu kết quả thi của các môn học tương ứng.
4 . Phƣơng pháp nghiên cứu
Câu hỏi nghiên cứu / giả thiết nghiên cứu
Câu hỏi nghiên cứu được đặt ra là:
“Những yếu tố nào ảnh hưởng đến quá trình xây dựng các bộ đề trắc nghiệm”.

Các giả thiết nghiên cứu được đặt ra là các yếu tố ảnh hưởng trực tiếp
đến chất lượng các bộ đề:
1- Yếu tố thời gian đầu tư cho công việc: Là thời gian thực tế giáo viên
dùng để nghiên cứu tài liệu và biên soạn đề thi, quỹ thời gian của nhà trường
dành cho việc này.
2- Động cơ của người thực hiện: Là các yếu tố như sự say mê, hứng thú
của cá nhân các giáo viên hay đơn giản là phải hoàn thành nhiệm vụ.
3- Mức độ người ra đề được trang bị kỹ thuật thiết kế đề trắc nghiệm:
Thể hiện ở mức độ được tập huấn, tự nghiên cứu về kỹ thuật xây dựng đề thi
trắc nghiệm.


7


4- Sự quan tâm của nhà trường: Thể hiện ở sự khuyến khích, động viên
bằng tinh thần hay vật chất cụ thể.
5- Tính chất các nhóm mơn học: Là đặc thù của nhóm mơn học đến việc
ra đề trắc nghiệm (phù hợp hay khó thực hiện).
Khách thể và đối tượng nghiên cứu
Khách thể nghiên cứu là số liệu kết quả thi của 50 bộ đề trắc nghiệm
khách quan tại Khoa CNTT và các giáo viên trực tiếp xây dựng các bộ đề đó.
Đối tượng nghiên cứu là các yếu tố ảnh hưởng đến chất lượng các bộ đề
thi trắc nghiệm.
Phương pháp tiếp cận nghiên cứu
1. Phương pháp khảo cứu lý thuyết: Nghiên cứu các quy định về triển
khai thực hiện việc thi trắc nghiệm và xây dựng ngân hàng thi trắc nghiệm
của Bộ GD&ĐT; Các lý thuyết về đo lường đánh giá trong giáo dục.
2. Phương pháp điều tra khảo sát: Thực hiện qua hai bước chính là
nghiên cứu sơ bộ và nghiên cứu chính thức.
- Nghiên cứu sơ bộ: Thực hiện thơng qua phương pháp định tính, sử dụng
kỹ thuật thảo luận nhóm để bổ sung mơ hình.
- Nghiên cứu chính thức: Thực hiện thơng qua phương pháp nghiên cứu
định lượng, sử dụng kỹ thuật thu thập thông tin qua việc phỏng vấn, lấy phiếu
điều tra trên các đối tượng giáo viên. Mục đích nghiên cứu này là để sàng lọc
các biến quan sát, xác định thành phần cũng như giá trị độ tin cậy của thang
đo và kiểm định mơ hình lý thuyết.
3. Phương pháp lấy ý kiến chuyên gia: Tham khảo ý kiến của các chuyên
gia có kinh nghiệm trong giáo dục đại học và đo lường đánh giá trong giáo dục.
4. Phương pháp thống kê toán học: Thu thập và xử lý số liệu (gồm kết
quả các môn thi trắc nghiệm và phiếu điều tra đối với giáo viên ra đề thi trắc
nghiệm) trong quá trình nghiên cứu bằng các phần mềm SPSS và QUEST.


8


Chƣơng 1
CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN
Để đổi mới phương pháp dạy học theo phương châm “Lấy người học
làm trung tâm” đã có rất nhiều biện pháp, trong đó việc sử dụng các bộ đề thi
trắc nghiệm khách quan (TNKQ) như là một cơng cụ để đánh giá chính xác
kết quả học tập của sinh viên cũng như nâng cao hiệu quả của việc dạy học
tích cực, đang được áp dụng một cách có hiệu quả. Tuy nhiên chất lượng của
các bộ đề thi TNKQ lại là một vấn đề chưa được xem xét một cách hệ thống
và đầy đủ. Trên thế giới, các quy trình biên soạn đề thi TNKQ được thực hiện
một cách chặt chẽ và các bộ đề được đánh giá một cách khoa học trước khi
đem sử dụng. Đối với giáo dục đại học ở Việt Nam, việc áp dụng hình thức
thi TNKQ vẫn cịn là mới mẻ, mặc dù đã có quy định về quy trình biên soạn
các câu hỏi thi TNKQ nhưng việc biên soạn cụ thể tại các nhà trường vẫn
nặng về tính chủ quan và cũng chưa có các cơng trình nghiên cứu đánh giá
một cách cụ thể về chất lượng của các bộ đề thi TNKQ. Việc các nhà trường
tự đánh giá chất lượng các bộ đề thi TNKQ cũng như tìm các biện pháp nâng
cao chất lượng các bộ đề TNKQ là rất cần thiết trong việc nâng cao chất
lượng dạy và học của nhà trường.
Chất lượng một bộ đề thi nói chung phụ thuộc nhiều yếu tố nhưng chủ
yếu và trực tiếp là các yếu tố tác động đến chính bản thân người ra đề. Trong
điều kiện giảng dạy hiện nay, có thể khái quát thành 5 nhóm yếu tố giả thuyết
có ảnh hưởng đến người ra đề, đó là:
- Thời gian đầu tư cho cơng việc.
- Động cơ của người thực hiện.
- Mức độ được trang bị kỹ thuật.
- Sự quan tâm của nhà trường.

- Tính chất các nhóm mơn học.

9


Các nghiên cứu của đề tài sẽ thực hiện phỏng vấn trên phiếu điều tra đối
với các đối tượng là giáo viên trực tiếp ra đề thi trắc nghiệm. Kết hợp xử lý số
liệu về độ giá trị, độ tin cậy của các bộ đề thi để tìm ra tương quan thực tế
giữa các yếu tố giả thuyết và chất lượng bộ đề. Trên cơ sở đó kiểm nghiệm lại
độ tin cậy của thang đo được thiết kế trên phiếu điều tra.
1.1. Các khái niệm về chất lƣợng bộ đề thi trắc nghiệm
1.1.1. Các công cụ đo lƣờng kết quả học tập
Dựa vào hình thức diễn đạt, có thể hình dung hệ thống các phương pháp
kiểm tra - đánh giá trong dạy học qua sơ đồ sau đây:

CÁC PHƢƠNG PHÁP KIỂM TRA
QUAN SÁT

VIẾT

VẤN ĐÁP

TRẮC NGHIỆM
KHÁCH QUAN

TỰ LUẬN

Tiểu luận Cung cấp thơng tin

Ghép đơi Điền khuyết


Diễn giải

Đúng sai Nhiều lựa chọn

Hình 1.1: Sơ đồ các phương pháp kiểm tra - đánh giá.
1.1.1.1. Phƣơng pháp quan sát
Quan sát giúp xác định cử chỉ, thái độ, hành vi, sự phản ứng, thao tác
thực hành, kĩ năng thực hành và một số kĩ năng về nhận thức khác của người
được kiểm tra. Phương pháp này chủ yếu mang tính chất định tính nên thường
dùng trong đánh giá kết quả thực hành.

10


1.1.1.2. Phƣơng pháp vấn đáp
Vấn đáp (hỏi và trả lời) có thể dùng lời hoặc khơng dùng lời. Đối với
trắc nghiệm khơng dùng lời thì người hỏi dùng điệu bộ, phim, tranh ảnh..,
người trả lời có thể dùng lời hoặc không. Phương pháp dùng lời được phổ
biến hơn mà chúng ta hay gọi là kiểm tra vấn đáp. Phương pháp này vừa định
tính vừa định lượng, độ chính xác tương đối cao, có giá trị nhiều mặt. Nó
thích hợp với cả người dạy và người học, đặc biệt có lợi trong kiểm tra xử lí
tình huống, rèn phản ứng nhanh nhạy cho HS. Tuy nhiên phương pháp này
khơng thích hợp cho việc đánh giá một phổ rộng với khối lượng lớn kiến
thức, trên nhiều HS trong một thời gian ngắn. Câu hỏi để HS trả lời đa số chỉ
nằm trong một nội dung hẹp nào đó.
1.1.1.3. Phƣơng pháp kiểm tra viết
Đây là hình thức được dùng phổ biến trong dạy học. Kiểm tra theo kiểu
này có những ưu điểm sau:
- Cho phép kiểm tra nhiều HS một lần.

- Cung cấp một bản ghi rõ ràng các câu trả lời của thí sinh dùng cho việc
chấm điểm.
- Cho phép thí sinh cân nhắc trước khi trả lời các câu hỏi, do đó kiểm tra
được sự phát triển trí tuệ ở mức cao hơn.
- Dễ quản lí vì bản thân người chấm không tham gia trực tiếp trong thời
gian kiểm tra.
1.1.2. Trắc nghiệm và những vấn đề liên quan
1.1.2.1. Khái niệm về trắc nghiệm
Trắc nghiệm “test” trong tiếng Anh có nghĩa là “sự khảo sát hoặc thử các
phẩm chất của một người hoặc vật”; cịn trong tiếng Hán thì “trắc” có nghĩa là
“đo lường”, “nghiệm” có nghĩa là “suy xét, chứng thực”.

11


Theo Trần Bá Hoành: “Trắc nghiệm trong giáo dục là một phương pháp
đo để thăm dò một số đặc điểm năng lực trí tuệ của HS như chú ý, ghi nhớ,
tưởng tượng… hoặc để kiểm tra đánh giá một số kiến thức, kĩ năng, kĩ xảo,
thái độ của HS”.
Theo Dương Thiệu Tống: “Trắc nghiệm là cơng cụ hoặc quy trình có
tính hệ thống nhằm đo lường một mẫu các hành vi. Trắc nghiệm giúp ta trả
lời câu hỏi: thành tích của các cá nhân như thế nào khi so sánh với những
người khác hay so sánh với một lĩnh vực các nhiệm vụ dự kiến?”.
1.1.2.2. Trắc nghiệm tự luận và trắc nghiệm khách quan
Trắc nghiệm viết bao gồm hai loại: trắc nghiệm tự luận và trắc nghiệm
khách quan
- Trắc nghiệm tự luận (Essay test).
Trắc nghiệm tự luận bao gồm nhiều dạng khác nhau nhưng nhìn chung
HS có thể diễn đạt tư tưởng, câu văn nhờ kiến thức và kinh nghiệm học tập đã
có. Phương pháp này có thể đo được khả năng suy luận cũng như phát huy

được óc sáng tạo, khéo léo khi giải quyết vấn đề của HS, khuyến khích HS
thói quen suy diễn, phân tích, tổng hợp, khái quát hoá, tạo điều kiện cho HS
luyện cách diễn đạt, sử dụng từ ngữ. Việc soạn các câu hỏi dạng này khơng
mấy khó khăn. Tuy nhiên, nhược điểm của phương pháp này là khó chấm
điểm, tính khách quan khơng cao nên độ tin cậy thấp. Mặt khác, trong một đề
thi chỉ kiểm tra được ít nội dung kiến thức.
- Trắc nghiệm khách quan (Objective test).
Trắc nghiệm khách quan là dạng trắc nghiệm trong đó mỗi câu hỏi có
kèm theo những câu trả lời sẵn. Loại câu hỏi này cung cấp cho HS một phần
hay tất cả thông tin cần thiết và đòi hỏi HS phải chọn một câu để trả lời hoặc
chỉ cần thêm một vài từ. Đây là một phương pháp có khả năng đánh giá được
các mức độ nhận thức. Gọi là khách quan vì hệ thống cho điểm là khách quan.

12


Kết qủa của bài trắc nghiệm không phụ thuộc vào việc ai chấm bài trắc
nghiệm đó.
Thơng thường, một bài TNKQ gồm nhiều câu hỏi hơn một bài trắc nghiệm
tự luận; mỗi câu hỏi có một phương án trả lời đúng, các phương án còn lại là
phương án nhiễu. Tuy nhiên, TNKQ chỉ có việc chấm điểm là khách quan, tính
chủ quan có thể nằm ở việc lựa chọn nội dung đề kiểm tra và việc định ra câu
trả lời. Nhiều người thường gọi tắt TNKQ là “trắc nghiệm”, do vậy khi dùng từ
“trắc nghiệm” mà khơng nói gì thêm thì chúng ta ngầm hiểu đây là TNKQ.
Trong quá trình nghiên cứu, tìm hiểu, đến nay các chuyên gia về phương pháp
dạy học của nhiều nước trên thế giới đã thừa nhận việc KT - ĐG bằng trắc
nghiệm có khả năng đảm bảo tính khách quan cao.
Bên cạnh đó, thực tế việc sử dụng hình thức KT - ĐG bằng trắc nghiệm
trong dạy học cũng thu được những hiệu quả rõ rệt, đó là:
- Đối với nhà trường: Tăng uy tín của nhà trường thông qua việc nâng

cao năng lực của đội ngũ GV về các phương pháp dạy - học - đánh giá; có các
cơng cụ để kiểm tra nhanh chóng và chính xác thành quả học tập; nâng cao
hiệu quả và tiết kiệm thời gian trong việc đánh giá.
- Đối với HS: Tăng thêm lịng tin về tính khách quan của việc đánh giá
thành quả học tập; thúc đẩy tính tích cực chủ động và động cơ học tập.
- Đối với GV: Nâng cao năng lực dạy học, đánh giá, tăng hiệu quả dạy
học; có phương hướng điều chỉnh và cải tiến phương pháp dạy học.
1.1.2.3. Những nguyên tắc chung của trắc nghiệm
Với những chức năng của mình, trắc nghiệm được xem là công cụ KT ĐG kết qủa học tập trong dạy học. Đối với người dạy, sử dụng trắc nghiệm
nhằm cung cấp thông tin ngược để điều chỉnh phương pháp, nội dung cho phù
hợp, từ đó nâng cao hiệu quả giảng dạy. Đối với người học, sử dụng trắc
nghiệm có thể tăng cường tinh thần trách nhiệm trong học tập, việc học tập

13


trở nên nghiêm túc. Sử dụng trắc nghiệm giúp người học tự KT - ĐG kiến
thức, kĩ năng, phát hiện năng lực tiềm ẩn của mình, vì vậy quá trình tự học có
hiệu quả hơn. Mặt khác, sử dụng trắc nghiệm giúp người học phát triển năng
lực tư duy sáng tạo, linh hoạt vận dụng kiến thức đã học để giải quyết các tình
huống nảy sinh trong thực tế.
Song trắc nghiệm chỉ thực hiện một cách có hiệu quả khi dựa trên một số
nguyên tắc sau:
- Xác định rõ mục tiêu đo lường.
- Làm rõ nội dung cần phải đo lường.
- Lựa chọn kĩ thuật trắc nghiệm phải dựa trên mục đích đánh giá. Khơng
nên lựa chọn trắc nghiệm chỉ vì nó thuận tiện, dễ sử dụng, quen thuộc với
nhiều người. Điều quan trọng nhất trong việc lựa chọn một kĩ thuật trắc
nghiệm giáo dục là liệu nó có đo được một cách hiệu quả nhất những gì cần
đo hay khơng.

- Việc đánh giá tổng qt địi hỏi phải sử dụng nhiều kĩ thuật và phương
pháp đánh giá khác nhau vì khơng có một phương pháp đánh giá nào có thể
thực hiện được toàn bộ những yêu cầu đánh giá.
- Muốn sử dụng một cách thích hợp và hiệu quả hình thức trắc nghiệm
thì phải hiểu được những ưu điểm cũng như hạn chế của nó. Trắc nghiệm
cũng như các phương pháp đánh giá khác ln có những sai số cho nên không
thể gắn cho những kết quả trắc nghiệm giá trị tuyệt đối được.
- Trắc nghiệm chỉ là một phương tiện được sử dụng để thu thập thông tin
trong q trình dạy học. Khơng nên quan niệm là chỉ cần thông qua trắc
nghiệm mà chất lượng dạy và học đương nhiên được cải thiện.
1.1.2.4. Các loại câu TNKQ
TNKQ có bốn hình thức chủ yếu, mỗi hình thức đều có những ưu và
nhược điểm riêng.

14


- Câu đúng-sai (True-false items)
Loại này được trình bày dưới dạng một câu phát biểu và HS phải trả lời
bằng cách lựa chọn đúng (Đ) hoặc sai (S). Loại câu hỏi này rất thơng dụng vì
nó thích hợp với những kiến thức sự kiện, có thể kiểm tra được nhiều kiến
thức trong một thời gian ngắn. Giáo viên có thể soạn một đề thi trong một
thời gian ngắn. Tuy nhiên loại câu hỏi này khó xác định điểm yếu của HS do
yếu tố đốn mị, xác suất đúng - sai là 50%, có độ tin cậy thấp, đề ra thường
có khuynh hướng trích nguyên văn sách giáo khoa nên khuyến khích thói
quen học thuộc lịng hơn là tìm tịi suy nghĩ.
- Câu ghép đơi (Matching items)
Là những câu hỏi có hai dãy thông tin, một bên là các câu hỏi, bên kia là
câu trả lời. Số câu ghép đôi càng nhiều thì xác suất may rủi càng nhỏ, do đó
càng tăng phần ghép thì độ khó của trắc nghiệm càng được nâng lên. Loại trắc

nghiệm này thích hợp với câu hỏi sự kiện, khả năng nhận biết kiến thức hay
thiết lập những mối tương quan, song khơng thích hợp cho việc áp dụng các
kiến thức mang tính nguyên lý, quy luật và khơng thích hợp cho việc đo các
khả năng trí năng ở bậc cao.
- Câu điền khuyết (Completion items).
Loại này có hai dạng. Chúng có thể là những câu hỏi với câu trả lời ngắn
(short answer) hay là những câu phát biểu với một hay nhiều chỗ để trống, HS
phải điền vào chỗ trống bằng một từ hay một nhóm từ cần thiết. Ưu điểm của
nó là làm mất khả năng đốn mị của HS, họ có cơ hội trình bày những câu trả
lời khác, qua đó phát huy óc sáng tạo. Đối với GV, dạng câu hỏi này phù hợp
với việc soạn các câu hỏi cho các môn tự nhiên, đồng thời có thể đánh giá
mức hiểu biết về các nguyên lý, giải thích các sự kiện, khả năng diễn đạt ý
kiến cũng như thái độ của HS đối với vấn đề đặt ra. Tuy nhiên, nhược điểm

15


của loại trắc nghiệm này là việc chấm bài mất nhiều thời gian và GV thường
không đánh giá cao các câu trả lời sáng tạo tuy khác đáp án mà vẫn có lí.
- Câu nhiều lựa chọn (Multiple choice question- MCQ)
Dạng câu hỏi này gồm hai phần: phần dẫn và phần lựa chọn. Phần dẫn là
một câu hỏi hay một câu trả lời chưa hoàn chỉnh; phần lựa chọn gồm một số
phương án (thường là 4 đến 5 phương án) để trả lời cho câu hỏi hay phần bổ
sung cho câu được hồn chỉnh. Phần lựa chọn chỉ có một phương án đúng,
những phương án còn lại gọi là phương án “nhiễu”. HS phải cân nhắc để chọn
ra phương án trả lời đúng nhất hay hợp lí nhất. Điều quan trọng là phải làm
sao cho những HS chưa nắm rõ vấn đề chọn vào các phương án “nhiễu”.
Hiện nay, loại câu hỏi MCQ được dùng nhiều hơn vì nó có một số ưu
điểm sau:
- Có thể đo được khả năng tư duy khác nhau. Với sự phối hợp của nhiều

phương án trả lời để chọn cho mỗi câu hỏi, GV có thể dùng loại trắc nghiệm
MCQ để KT - ĐG những mục tiêu giảng dạy, học tập khác nhau.
- Độ tin cậy cao hơn. Yếu tố đốn mị may rủi giảm đi so với các loại
TNKQ khác khi số phương án lựa chọn tăng lên. Đó cũng là lý do các nhà
soạn trắc nghiệm chuẩn thích loại câu hỏi MCQ hơn các loại câu hỏi khác.
- HS phải xét đoán và phân biệt rõ ràng khi trả lời câu hỏi. Tính chất
tuyệt đối trong loại “đúng - sai” nhường chỗ cho tính chất tương đối khi HS
phải lựa chọn câu trả lời đúng nhất hay hợp lý nhất trong số các phương án trả
lời đã cho.
- Tính chất giá trị tốt hơn. Loại trắc nghiệm này có độ giá trị cao hơn nhờ
tính chất có thể dùng đo những mức tư duy khác nhau. Với một bài trắc
nghiệm có nhiều câu trả lời cho sẵn để chọn, người ta có thể đo được khả
năng nhớ, áp dụng các nguyên lý, suy diễn, tổng quát hoá… rất hữu hiệu.

16


- Có thể phân tích được tính chất mỗi câu hỏi. Dùng phương pháp phân
tích tính chất câu hỏi (items analysis), chúng ta có thể xác định câu hỏi nào
quá dễ, câu hỏi nào quá khó, câu nào mơ hồ hay khơng có giá trị đối với các
mục tiêu cần trắc nghiệm. Bên cạnh đó, chúng ta có thể xét xem câu trả lời
cho sẵn nào khơng ích lợi hoặc làm giảm giá trị câu hỏi. Phương pháp phân
tích này không thực hiện được với loại câu hỏi tự luận hay khó thực hiện đối
với các loại trắc nghiệm khác.
- Tính chất khách quan khi chấm. Cũng như các loại TNKQ khác, trong
loại trắc nghiệm MCQ điểm số không phụ thuộc vào các yếu tố như: phẩm
chất chữ viết, khả năng diễn đạt…
- Có thể ứng dụng cơng nghệ thơng tin trong quá trình thu thập và xử lý
kết quả.
1.1.3. Độ tin cậy của bộ câu hỏi trắc nghiệm

Trong các nghiên cứu khoa học, giá trị khoa học của các số liệu thu được
phụ thuộc chủ yếu vào độ tin cậy và độ giá trị của bộ công cụ đo dùng để đo
lường. Tuy nhiên không phải lúc nào cũng có sẵn những bộ cơng cụ đã được
chuẩn hố, đặc biệt là trong những nghiên cứu đòi hỏi phải thiết kế ra các bộ công
cụ đo mới phù hợp với lĩnh vực đang nghiên cứu. Do đó bắt buộc nhà nghiên cứu
phải đánh giá độ tin cậy và độ giá trị của công cụ đo, trước khi sử dụng các số liệu
thu được từ bộ cơng cụ đó nhằm rút ra các kết luận hoặc suy đốn.
1.1.3.1. Xem xét mơ hình lý thuyết về độ tin cậy
Để xác định độ tin cậy của một phép đo, ta phải xuất phát từ một tiền đề
có tính giả thiết rằng phép đo sẽ đo lường một đặc tính tương đối ổn định và
bản thân phép đo phải có tính ổn định tương đối, ít hoặc khơng thay đổi giữa
các lần đo khác nhau. Bởi vì sẽ khơng có một phương pháp đo đạc nào có giá
trị nếu khơng đo một cái gì đó có tính ổn định tương đối và bản thân phép đo
phải có tính ổn định, ít hoặc khơng thay đổi giữa các lần đo khác nhau. Như

17


vậy, một thang đo có độ tin cậy tốt được xác định như là một phép đo trên đó
mọi người đạt số điểm tương tự ở những lần đo khác nhau.
Các lý thuyết về trắc nghiệm đều cho rằng điểm số của trắc nghiệm đo
lường một đặc tính, phẩm chất hay năng lực nào đó ở một cá nhân bằng điểm
thực của cá nhân đó cộng với điểm sai số của sự đo lường.
X=T+E
X: Điểm trắc nghiệm
T: Điểm thực
E: Điểm sai số của phép đo
Điểm thực được xác định như là điểm trung bình của vơ số những lần
đo của trắc nghiệm trên một cá nhân. Còn điểm sai số của phép đo là sự khác
biệt ở mỗi lần đo do các yếu tố cá nhân (động cơ, xúc cảm, tâm lý...) do các

yếu tố tình huống, hồn cảnh ảnh hưởng (môi trường, tiếng ồn, lời hướng
dẫn...), nhưng chúng ta chưa bao giờ đo được điểm thực ở cá nhân một cách
thực chính xác. Như vậy, để phân tích độ tin cậy của trắc nghiệm người ta
phải dựa vào kết quả làm trắc nghiệm của một nhóm người (điểm trắc nghiệm
của mẫu) nhằm nhận diện tỷ lệ thành phần của điểm thực và điểm sai số trong
kết quả điểm trắc nghiệm của cả nhóm. Nói cách khác, phân tích độ tin cậy là
tìm cách xác định mức độ trên đó sự khác biệt điểm số trắc nghiệm phản ánh
sự khác biệt điểm thực ở nhóm người làm trắc nghiệm. Do vậy để đánh giá độ
tin cậy của trắc nghiệm, người ta phải giả thiết rằng phương sai của những
điểm số đo được bằng trắc nghiệm ở một nhóm đối tượng (mẫu) phải bằng
phương sai của những điểm số thực cộng với phương sai của những điểm sai
số của mỗi lần đo theo công thức
σ2X = σ2T + σ2E
σ2X: Giá trị phương sai của điểm trắc nghiệm
σ2T : Giá trị phương sai của điểm thực

18


σ2E : Giá trị phương sai điểm sai số của phép đo
Khi đó độ tin cậy của trắc nghiệm được xác định như là hệ số tương quan
(RXX) biểu thị tỷ lệ hay phần trăm giữa phương sai của điểm trắc nghiệm theo
công thức
R XX

 T2
 T2
 2  2
 X  T   E2


Một trắc nghiệm có độ tin cậy phải có một tỷ lệ lớn hơn của phương sai
điểm trắc nghiệm thuộc về sự khác biệt ở điểm thực (ngược laị, một trắc
nghiệm khơng có độ tin cậy sẽ có một tỷ lệ lớn hơn của phương sai điểm trắc
nghiệm thuộc về sự khác biệt ở điểm sai số của phép đo) [4].
1.1.3.2. Các phƣơng pháp đánh giá độ tin cậy của phép đo
Theo lý thuyết đánh giá, có bốn phương pháp cơ bản để đánh giá độ tin
cậy của phép đo.
- Nhóm phương pháp đánh giá mức độ kiên định về điểm số giữa hai lần
đo (test-retest methods).
- Nhóm phương pháp sử dụng form thay thế tương đương (alternate form
methods).
- Nhóm phương pháp phân đơi số item của trắc nghiệm (split-half
methods).
- Nhóm phương pháp đánh giá độ phù hợp của từng item (internal
consistency methods).
Đối với nhóm phương pháp thứ nhất: Để đánh giá độ tin cậy của trắc
nghiệm người ta thường so sánh tương quan điểm giữa hai lần đo của cùng
một trắc nghiệm trên cùng một đối tượng (test-retest correlation). Một trắc
nghiệm có độ tin cậy phải có tính ổn định, tức là có sự tương quan chặt giữa
hai lần đo. Nếu trắc nghiệm được thiết kế theo thang định khoảng hay thang
tỷ lệ và mối quan hệ điểm số trắc nghiệm giữa hai lần đo là quan hệ tuyến

19


tính, thì áp dụng tương quan Pearson (Pearson correelation coeficient) để
đánh giá hệ số tin cậy của trắc nghiệm. Nếu trắc nghiệm được thiết kế theo
thang định hạng hoặc mối quan hệ điểm số trắc nghiệm giữa hai lần đo khơng
tuyến tính thì ta dùng tương quan Spearman (Spearman rank correlation
coefficent) để đánh giá hệ số tin cậy của trắc nghiệm.

Đối với nhóm phương pháp thứ hai: Trong cùng một trắc nghiêm, sử
dụng hai form tương đương có hình thức, câu chữ khác nhau nhưng có nội
dung giống nhau hoặc tương đương và có những đặc tính thống kê như nhau
hoặc tương đương. Tương quan điểm số giữa lần đo thứ nhất (ứng với form
A) và lần đo thứ hai (ứng với form B) được xem là hệ số tin cậy của trắc
nghiệm. Phương pháp này rất tốn kém và khó thiết kế một trắc nghiệm có
nhiều form hồn tồn tương đương.
Nhóm phương pháp thứ ba: Thường dùng để đánh giá độ tin cậy của một
trắc nghiệm khi ta không có điều kiện đo trắc nghiệm hai lần trên cùng một
đối tượng và cũng không thiết kế được các trắc nghiệm tương đương, là
phương pháp phân đôi số item của trắc nghiệm thành hai phần (thường chia
theo số chẵn và số lẻ) rồi so sánh tương quan điểm giữa hai nửa trắc nhiệm.
Đây gọi là phương pháp tính độ tin cậy phân đôi trắc nghiệm (split-half
reliablity). Về lý thuyết, hai nửa trắc nghiệm có thể được xem là hai form
tương đương của cùng một trắc nghiệm. Do vậy tương quan điểm số của hai
nửa này được xem là hệ số tin cậy của trắc nghiệm. Cơng thức tính như sau.
R XOXE 

  

(XOXE) - XO X E
( XO )( XE )

XO: Các item số lẻ
XE: Các item số chẵn
Tất nhiên khi sử dụng công thức này hệ số tin cậy sẽ giảm đi so với hệ số
tin cậy thật của trắc nghiệm vì trắc nghiệm vốn có số item gấp hai lần (trắc

20



nghiệm càng có nhiều item thì độ tin cậy càng cao). Ta có thể sử dụng cơng
thức chuyển hệ số độ tin cậy phân đôi thành hệ số độ tin cậy của tồn trắc
nghiệm gọi là cơng thức Spearman - Brown prophesy.
R

( N )( R XX )
1  ( N  1)( R XX )

N=2
R: Hệ số tin cậy mới (đã được điều chỉnh)
RXX Hệ số tin cậy hiện tại (hệ số tin cậy phân nửa trắc nghiệm, chưa
điều chỉnh)
Nhóm phương pháp thứ tư: Thường dùng để đánh giá độ tin cậy của
trắc nghiệm là các phương pháp đánh giá độ phù hợp của từng item (internal
consistency methods) sử dụng mơ hình hệ số tương quan alpha (Cronbach’s
Coeficient Alpha). Mơ hình này đánh giá độ tin cậy của phép đo dựa trên sự
tính tốn phương sai của từng item trong tồn phép đo và tính tương quan
điểm của từng item với điểm của tổng các item còn lại của phép đo. Phương
pháp này thích hợp với các loại trắc nghiệm được thiết kế với điểm số theo
thang định khoảng hay thang tỷ lệ. Cơng thức được tính là
R XX   

 2
K
(1  2i )
K 1
X

RXX Hệ số tương quan α

K - Số các item của trắc nghiệm
σ2i - Giá trị của phương sai của từng item cụ thể của trắc nghiệm
σ2X - Giá trị của phương sai của toàn bộ trắc nghiệm
Σσ2i - Tổng các giá trị phương sai của tất cả các item của trắc nghiệm.

21


1.1.3.3. Những yếu tố ảnh hƣởng đến độ tin cậy trắc nghiệm
Có thể phân loại các yếu tố này thành các lĩnh vực sau:
- Các yếu tố gây ra kết quả điểm trắc nghiệm không ổn định qua các lần
đo: Điểm số trắc nghiệm khơng ổn định có thể là do người làm trắc nghiệm có
sự thay đổi thực lực về kiến thức, hiểu biết, kỹ năng giữa hai lần đo, do đó kết
quả điểm trắc nghiệm giữa hai lần đo khác nhau. Sự khơng ổn định cũng có
thể là do những thay đổi ở phía người làm trắc nghiệm như mệt mỏi, xúc cảm
không ổn định, thiếu tập trung...hoặc câu hỏi trắc nghiệm q khó, phải phán
đốn dẫn đến sai lệch điểm giữa các lần đo.
- Các yếu tố liên quan đến item, câu hỏi của trắc nghiệm: Các trắc
nghiệm chỉ là một tập hợp có giới hạn các item nhằm đo một mẫu hành vi đại
diện cho đặc tính được nghiên cứu mà khơng đo tất cả các biểu hiện của đặc
tính đó. Một trắc nghiệm càng có nhiều item thì độ tin cậy của trắc nghiệm
càng tăng, vì càng nhiều item, trắc nghiệm sẽ có nhiều cơ hội để cung cấp một
mẫu rộng hơn những hiểu biết về đặc tính cần đo. Trắc nghiệm khơng thể q
dài gây mệt mỏi, thiếu tập trung cho nghiệm thể nhưng mặt khác các item của
trắc nghiệm lại phải có tính đại diện, đủ bao quát hết miền cần đo.
- Các yếu tố liên quan đến thống kê: Khi phạm vi điểm trắc nghiệm càng
bị thu hẹp thì tương quan càng giảm, vì vậy độ tin cậy của trắc nghiệm sẽ
giảm. Ngược lại phạm vi điểm trắc nghiệm càng được mở rộng thì tương quan
càng tăng, do đó độ tin cậy của trắc nghiệm sẽ tăng.
1.1.4. Độ giá trị (hiệu lực) của bộ câu hỏi trắc nghiệm

Độ giá trị là một trong những đặc trưng quan trọng nhất khi đánh giá
một trắc nghiệm. Mỗi trắc nghiệm khơng chỉ có một độ giá trị duy nhất mà
có nhiều kiểu giá trị (hiệu lực) khác nhau. vì vậy độ giá trị được hiểu như
là những dữ liệu điều tra một cách khoa học về ý nghĩa của trắc nghiệm khi
đo lường.

22


Độ giá trị của một phép đo thường được đánh giá như là độ giá trị nội
dung (Content validity), độ giá trị cấu trúc ( Structure validity), độ giá trị tiêu
chuẩn (Criterion validity) và độ giá trị dự báo (Predictitive validity). Độ giá
trị nội dung do những chuyên gia về lĩnh vực được trắc nghiệm phản biện và
kết luận. Độ giá trị cấu trúc được quy về các khu vực đo lường, các iterm hội
tụ về một vấn đề, tương quan giữa các item trong nhóm phải tốt hơn tương
quan giữa các item ngồi nhóm. Độ giá trị tiêu chuẩn là những so sánh tương
quan của trắc nghiệm với một trắc nghiệm chuẩn tương đương đã có sẵn trên
một mẫu đơng người, độ giá trị tiêu chuẩn rất khó đánh giá và trong thực tế
thường bỏ qua. Độ giá trị dự báo là những kết luận sau khi xử lý, đánh giá số
liệu có so sánh với kết quả thực tế kết hợp phỏng vấn tại chỗ. Có nhiều quan
điểm cho rằng những kiểu giá trị khác nhau được dùng trong trong những
mục đích khác nhau. Đặc biệt đối với các trắc nghiệm nhằm đánh giá chất
lượng giáo dục, người ta tập trung vào độ giá trị nội dung, còn những trắc
nghiệm về nhân cách người ta coi trọng độ giá trị dự báo. Tuy nhiên lý thuyết
đánh giá gần đây đều cho rằng các kiểu giá trị này không phải là những kiểu
giá trị tách biệt theo những mục đích khác nhau, mà chúng chỉ là những cách
tiếp cận đại diện cho những chiến lược khác nhau cùng chung một mục đích
là hiểu ý nghĩa của điểm số trắc nghiệm và đều nhằm hiệu lực hoá những kết
luận, suy đoán được rút ra từ điểm số của trắc nghiệm [4]. Với các trắc
nghiệm thông thường ta quan tâm nhất đến hai kiểu độ giá trị là độ giá trị nội

dung và độ giá trị cấu trúc.
Các phương pháp cơ bản để đánh giá độ giá trị của một trắc nghiệm
Mặc dù độ giá trị nội dung và độ giá trị cấu trúc đều nói lên mức độ hiệu
lực của phép đo lường nhưng việc đánh giá một trắc nghiệm có độ giá trị nội
dung tốt hay khơng người ta lại xem xét nội dung của trắc nghiệm, phân tích
quá trình thiết kế các item và hiệu lực hố các item của trắc nghiệm. Trong

23


×