Tải bản đầy đủ (.pdf) (47 trang)

thiết kế và sử dụng trắc nghiệm khách quan trong môn tin học thpt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (550.78 KB, 47 trang )


ĐẠI HỌC HUẾ
TRƯỜNG ĐẠI HỌC SƯ PHẠM





Nguyễn Thế Dũng




THIẾT KẾ VÀ SỬ DỤNG
TRẮC NGHIỆM KHÁCH QUAN
TRONG MÔN TIN HỌC THPT
















HUẾ 2-2006

THIẾT KẾ VÀ SỬ DỤNG TRẮC NGHIỆM KHÁCH QUAN
TRONG MÔN TIN HỌC THPT

I. Một số vấn đề về kiểm tra và đánh giá kết quả học tập
I.1. Kiểm tra, đánh giá là một bộ phận quan trọng của quá trình giáo dục.
Bất kỳ một quá trình giáo dục nào mà một con người tham gia cũng nhằm tạo ra
những biến đổi nhất định trong con người đó. Muốn biết những biến đổi đó xảy ra ở mức
độ nào phải đánh giá hành vi của người đó trong một tình huống nhất định. Sự đánh giá
cho phép chúng ta xác định, một là mục tiêu giáo dục được đặt ra có phù hợp hay không
và có đạt được hay không, hai là việc giảng dạy có thành công hay không, người học có
tiến bộ hay không.
Trước hết xin đưa ra đây một số khái niệm cơ bản của đánh giá trong giáo dục [34].
Lượng giá
Assesment (tạm dịch là lượng giá) bao gồm các việc phán xét thí sinh theo các hệ
thống quy tắc hoặc tiêu chuẩn nào đó. Lượng giá có thể thực hiện đầu quá trình giảng dạy
để giúp tìm hiểu và chẩn đoán (diagnostic) về đối tượng giảng dạy, có thể triển khai trong
tiến trình (formative) giảng dạy để tạo những thông tin phản hồi giúp điều chỉnh quá trình
dạy và học, cũng có thể thực hiện lúc kết thúc (summmative) để tổng kết. Trong giảng
dạy ở nhà trường, các đo lường trong tiến trình thường gắn chặt với người dạy, tuy nhiên
các đo lường kết thúc thường bám sát vào mục tiêu DH đã được đề ra, và có thể tách khỏi
người dạy.
Đo lường
Measurement (đo lường) là một cách lượng giá, là việc gán các con số hoặc thứ bậc
theo một hệ thống qui tắc nào đó.
Test:
Tests (trắc nghiệm) là các PP thường dùng để lượng giá trong giáo dục. Trắc nghiệm
thường có các dạng thức sau đây:
Trắc nghiệm thành quả (achievement) dùng để đo lường mức độ học được sau một

thời kỳ giảng dạy nào đó.
Trắc nghiệm năng khiếu (aptitude) dùng để dự báo việc thực hiện của một người
trong tương lai, bao gồm việc giải quyết các vấn đề nằm bên ngoài sự trải nghiệm trực
tiếp của người học.
PP trắc nghiệm có thể là khách quan (objective) hoặc chủ quan (subjective).
Đánh giá
Evaluation (đánh giá) là việc nhận định sự xứng đáng của một cái gì đó, chẳng hạn
việc đánh giá một chương trình, một nhà trường, một chính sách. Lượng giá người học
thường là các thành tố của đánh giá giáo dục. Đánh giá có thể là định lượng (quantitative)
dựa vào các con số hoặc định tính (qualitative) dựa vào các ý kiến và giá trị.
Trong các tài liệu về khoa học đo lường và đánh giá, những định nghĩa và phân loại
nêu trên đây chưa phải thật thống nhất và rạch ròi.
Dù sao, việc đánh giá nói chung phải được xem là một bộ phận quan trọng và hợp
thành một thể thống nhất của quá trình giáo dục.
I.2. Ý nghĩa và các yêu cầu đối với kiểm tra đánh giá [39]
Chất lượng Giáo dục thể hiện qua năng lực người học sau khi hoàn thành khoá học
hay bậc học. Bốn thành tố tạo nên chất lượng năng lực đó là: 1- Khối lượng, nội dung và
trình độ kiến thức được học; 2- Kỹ năng kỹ xảo được huấn luyện; 3- Năng lực nhận thức
và năng lực tư duy được đào tạo và 4 - Phẩm chất nhân văn được rèn luyện.
Khoa học đo lường và đánh giá giáo dục thường phân các cuộc thi theo 3 loại:
Loại thứ 1- Thi để xác nhận mức độ tiếp thu môn học (thi kết thúc môn học). Đề thi
khi đó tập trung kiểm tra kiến thức để đánh giá xem người học có năng lực nhận thức
hoặc kỹ năng kỹ xảo thuộc môn học đạt đến mức độ nào (theo Bloom), về nhận thức có 6
bậc: nhớ, hiểu, vận dụng, phân tích, tổng hợp và đánh giá; về kỹ năng kỹ xảo có 5 bậc:
bắt chước, hoàn thành, chuẩn hoá, phối hợp và tự động hoá.
Loại thứ 2- Thi để chứng nhận trình độ học vấn (thi hết khoá). Đề thi khi đó mang
tính chất tổng hợp, nhiều môn, bao quát toàn bộ chương trình hoá học. Tuỳ theo trình độ
và bậc học, tuỳ theo yêu cầu chất lượng mà nhằm đánh giá kiến thức là chính (tốt nghiệp
phổ thông) hay đánh giá năng lực là chính (tốt nghiệp khoá huấn luyện).
Loại thứ 3- Thi để tuyển chọn (thi học giỏi, thi tuyển sinh, thi tuyển nhân sự). Đề thi

khi đó nhằm đánh giá năng lực theo đúng các tiêu chí tuyển chọn dự kiến. Không phải
một cuộc thi lúc nào cũng chỉ nhằm một mục tiêu, mà có thể nhằm đồng thời hai, ba mục
tiêu. Khi đó đương nhiên đề thi phải ra như thế nào để đáp ứng cùng một lúc các mục tiêu
của cuộc thi đó.
Một đề thi, có thể bao gồm một vài câu hỏi (thường là câu tự luận) hoặc từ vài chục
đến hơn một trăm câu hỏi (thường là câu trắc nghiệm) và luôn có bốn chỉ số chính liên
quan mật thiết với nhau, dùng để đánh giá đề thi đạt hay không đạt yêu cầu, đó là độ khó,
độ phân biệt, độ giá trị và độ tin cậy. Độ khó thường được tính qua tỷ lệ thí sinh làm
đúng. Độ phân biệt thường được tính qua hiệu số giữa tỷ lệ thí sinh khá làm đúng và tỷ lệ
thí sinh kém làm đúng (phân biệt giữa thí sinh khá và thí sinh kém). Tuỳ theo mục tiêu
cuộc thi mà yêu cầu cao hay thấp về hai chỉ số này. Thi để đánh giá tiếp thu môn học và
trình độ học vấn thì độ khó và độ phân biệt không cần cao và thang điểm đánh giá khi đó
không cần quá chi tiết (thang điểm 4 mức: A,B,C và D, hay thang điểm 10 mức như trước
đây nước ta đã dùng là đủ). Nhưng thi để tuyển chọn thì lại cần độ khó và độ phân biệt
cao và thang điểm phải chi tiết (thang điểm 100 hay 800 điểm, như nhiều nước hiện nay
đang sử dụng).
Có hai cách điều chỉnh độ khó và độ phân biệt cho phù hợp với mục tiêu cuộc thi.
Một là phải xây dựng ngân hàng câu hỏi thi chuẩn, có độ khó và độ phân biệt phù hợp
với mục tiêu qua các cuộc thi thăm dò các nhóm người thi tiêu biểu rồi mới lấy ra làm đề
thi. Hai là không cần ngân hàng câu hỏi thi chuẩn, ra đề và cho thi rồi thay đổi đáp án cho
có độ khó và độ phân biệt phù hợp với những người dự thi.
Trong thực tế, chúng ta áp dụng cách thứ hai vì nó dễ tiến hành, hơn nữa về mặt
biểu kiến thì thấy trước mắt ít tốn kém hơn cách thứ nhất mà vẫn đạt mục đích của cuộc
thi. Tuy nhiên với các cuộc thi dùng đề thi tự luận như hiện nay kéo theo những bất cập
của đề thi tự luận, đó là độ giá trị và độ tin cậy thấp (vì đánh giá kém chính xác), tốn
công sức và thời gian chấm (đấy mới là tốn kém thực và rất lớn thì lại không thấy). Cũng
vì vậy, lâu nay đã có nhiều khuyến cáo nên dùng ngay đề thi trắc nghiệm khách quan để
giảm bớt các bất cập của các đề thi tự luận như đã nêu trên.
Mặt khác do không nắm vững thang bậc chất lượng của sản phẩm giáo dục nên phần
lớn đề thi đánh giá tiếp thu môn học trong nhà trường hiện nay chủ yếu nhằm đánh giá ở

mức nhận thức thấp, tức là kiểm tra thuộc kiến thức là chính (biết, hiểu và vận dụng) nên
người học có thể quay cóp mà không cần tư duy để trả lời (nói một cách khác là dạy và
học đều không cần tư duy). Điều đó lý giải vì sao tiêu cực trong thi cử nhiều, điểm số cao
nhưng năng lực không cao, sản phẩm giáo dục và đào tạo chất lượng còn thấp. Do đó,
chúng ta cần nhanh chóng đổi mới mục tiêu của đề thi nhằm đánh giá năng lực nhận thức
(mang tính chất lượng) chứ đừng chỉ đánh giá thuộc kiến thức (mang tính số lượng) của
người học làm chính như hiện nay.
I.3. Phân loại các hình thức trắc nghiệm [35]
Về cách chuẩn bị đề trắc nghiệm, có thể phân chia thành trắc nghiệm tiêu chuẩn hoá
và trắc nghiệm dùng ở lớp học.
- Trắc nghiệm tiêu chuẩn hoá thường do các chuyên gia trắc nghiệm soạn thảo, thử
nghiệm, tu chỉnh, mỗi câu trắc nghiệm được gắn với các chỉ số cho biết thuộc tính và chất
lượng của nó (độ khó, độ phân biệt, nội dung và mức độ kỹ năng phản ánh), mỗi đề thi
trắc nghiệm có gắn với một độ tin cậy xác định, ngoài ra có những chỉ dẫn cụ thể về cách
triển khai trắc nghiệm và giải thích kết quả trắc nghiệm.
- Trắc nghiệm dùng ở lớp học (hoặc trắc nghiệm do GV soạn) là trắc nghiệm do GV
tự viết để sử dụng trong quá trình giảng dạy, có thể chưa được thử nghiệm và tu chỉnh
công phu, thường chỉ sử dụng trong các kỳ kiểm tra với số lượng học sinh không lớn và
không thật quan trọng.
Về việc đảm bảo thời gian để làm trắc nghiệm, có thể phân chia loại trắc nghiệm
theo tốc độ và trắc nghiệm không theo tốc độ.
- Trắc nghiệm theo tốc độ thường hạn chế thời gian, chỉ một ít thí sinh làm nhanh
mới có thể làm hết số câu của bài trắc nghiệm, nhằm đánh giá khả năng làm nhanh của
thí sinh.
- Trắc nghiệm không theo tốc độ thường cung cấp đủ thời gian cho phần lớn sinh có
thể kịp suy nghĩ để làm hết bài trắc nghiệm.
Về phương hướng sử dụng kết quả trắc nghiệm, có thể phân chia ra trắc nghiệm
theo chuẩn (norm-referrenced test) và trắc nghiệm theo tiêu chí (criterion-referrenced
test)
- Trắc nghiệm theo chuẩn: là trắc nghiệm được sử dụng để xác định mức độ thực

hiện của một cá nhân nào đó so với các các nhân khác cùng làm một bài trắc nghiệm.
- Trắc nghiệm theo tiêu chí: là trắc nghiệm được sử dụng để xác định mức độ thực
hiện của một cá nhân nào đó so với một tiêu chí xác định nào đó cho trước.
I.4. Các PP đánh giá trong chương trình phổ thông [35]
Trắc nghiệm theo nghĩa rộng là một hoạt động để đo lường năng lực của các đối
tượng nào đó nhằm những mục đích xác định. Trong giáo dục trắc nghiệm được tiến hành
thường xuyên ở các kỳ thi, kiểm tra để đánh giá kết quả học tập, giảng dạy đối với một
phần của môn học, toàn bộ môn học, đối với cả một cấp học hoặc để tuyển chọn một số
người có năng lực nhất vào học một khoá học.
Có thể phân chia các PP trắc nghiệm ra làm 3 loại: loại quan sát, loại vấn đáp và
loại viết.







I.4.1. Loại quan sát giúp xác định những thái độ, những kỹ năng thực hành hoặc
một số kỹ năng về nhận thức, chẳng hạn cách giải quyết vấn đề trong một tình huống
đang được nghiên cứu.
I.4.2. Loại vấn đáp thường được dùng khi tương tác giữa người chấm và người học
là quan trọng, chẳng hạn cần xác định thái độ phản ứng khi phỏng vấn, thường dùng để
kiểm tra miệng,…
I.4.3. Loại viết thường được sử dụng nhiều nhất, vì nó có những ưu điểm sau:
- Cho phép kiểm tra nhiều học sinh một lúc.
- Cho phép học sinh cân nhắc nhiều hơn khi trả lời.
- Đánh giá được một vài loại tư duy ở mức độ cao.
- Cung cấp bản ghi rõ ràng các câu trả lời của thí sinh để dùng khi chấm.
- Người ra đề không nhất thiết phải tham gia chấm bài.

Trắc nghiệm viết được chia thành 2 nhóm chính
Nhóm các câu hỏi trắc nghiệm buộc trả lời theo dạng mở, thí sinh phải tự trình bày
ý kiến trong một bài viết dài để giải quyết vấn đề mà câu hỏi nêu ra. Người ta gọi trắc
nghiệm theo kiểu này là kiểu tự luận (essay). Thi, kiểm tra tự luận rất quen biết với tất cả
Quan sát
Vấn đáp
Viết
Trắc nghiệm tự luận
Nhiều
lựa chọn
Trắc nghiệm khách quan
Trả lời
ngắn
Điền
khuyết
Đúng
sai
Tiểu
luận
Giải đáp vấn
đề đặt ra

Các phương pháp kiểm tra đánh giá
Ghép
đôi
học sinh. Các bài kiểm tra thực hành trên máy vi tính rất đặc thù của môn Tin học -
THPT có thể được xem là hình thức trắc nghiệm tự luận.
Nhóm các câu trắc nghiệm mà trong đó đề thi thường gồm rất nhiều câu hỏi, mỗi
câu nêu ra một vấn đề cùng với những thông tin cần thiết sao cho thí sinh chỉ phải trả lời
vắn tắt cho từng câu. Người ta thường gọi nhóm các câu trắc nghiệm này là trắc nghiệm

khách quan (objective test). Trắc nghiệm khách quan tuy còn mới trong nhà trường ở
nước ta nhưng đã khá phổ biến trong xã hội.
PP tự luận thường được dùng trong các trường hợp sau:
1. Khi thí sinh không quá đông.
2. Khi muốn khuyến khích và đánh giá cách diễn đạt.
3. Khi muốn tìm hiểu ý tưởng của thí sinh hơn là khảo sát kết quả học tập.
4. Khi có thể tin tưởng khả năng chấm bài tự luận của GV là chính xác.
5. Khi không có nhiều thời gian soạn đề nhưng có đủ thời gian để chấm bài.
Còn PP trắc nghiệm khách quan nên dùng trong những trường hợp sau:
1. Khi thí sinh rất đông (chẳng hạn thi tốt nghiệp, thi tuyển sinh toàn quốc).
2. Khi muốn chấm bài nhanh.
3. Khi muốn có điểm số đáng tin cậy, không phụ thuộc vào người chấm bài.
4. Khi phải coi trọng yếu tố công bằng, vô tư, chính xác và muốn ngăn chặn sự gian
lận trong thi cử.
5. Khi muốn kiểm tra một phạm vi hiểu biết rộng, muốn ngăn ngừa nạn học tủ, học
vẹt và giảm thiểu sự may rủi.
II. Trắc nghiệm khách quan trong kiểm tra - đánh giá môn tin học THPT
Trong các phần dưới đây chúng ta sẽ thảo luận các loại câu hỏi trắc nghiệm khách
quan, ưu nhược điểm của từng loại và các kỹ thuật viết các loại câu hỏi đó thông qua các
ví dụ minh họa là các câu hỏi trong môn Tin học THPT. Nếu không có sự nhầm lẫn,
chúng ta sẽ gọi tắt trắc nghiệm thay cho trắc nghiệm khách quan (TNKQ).
Trắc nghiệm khách quan có thể chia làm 4 loại chính [24]:
II.1. Loại câu hỏi trắc nghiệm "đúng - sai".
Loại này được trình bày dưới dạng một câu phát biểu và học sinh phải trả lời bằng
cách lựa chọn một trong hai phương án thường là: đúng (Đ) hay sai (S). Có thể thay chữ
"đúng" , "sai" bằng cách chữ "giống nhau" - "khác nhau", mạnh" - "yếu" hoặc "lớn hơn' -
"nhỏ hơn".
Ví dụ:
Câu 2:Máy tính hỗ trợ vào việc phóng tàu vũ trụ có phải là tự động hoá không?
A-Đúng B- Sai.

Câu 3:Hệ điều hành là phần mềm ứng dụng đúng hay sai ?
A-Đúng B - Sai.
Câu 4: Truy cập vào các trang Web không lành mạnh có bị phạm tội không ?
A- Có B-Không.
Câu 5: Dùng nhiều thời gian chơi game trên mạng có bị phạm tội không?
A-Có B-Không.
a. Ưu điểm:
- Đây là loại câu hỏi đơn giản nhất để trắc nghiệm kiến thức về những sự kiện. Có
thể đạt được nhiều câu hỏi trong một bài trắc nghiệm trong thời gian được cố định. Do đó
có thể làm tăng độ tin cậy của bài trắc nghiệm, nếu các câu trắc nghiệm được soạn kỹ
càng, không tối nghĩa và tránh được sự đoán mò.
- Viết các câu trắc nghiệm đúng sai trông có vẻ dễ dàng vì người soạn không cần
phải tìm ra thêm nhiều câu phát biểu khác nữa để học sinh so sánh và lựa chọn. Loại câu
hỏi trắc nghiệm đúng sai có cấu trúc đơn giản hơn, do đó ít phạm những lỗi lầm hơn về
mặt kỹ thuật so với các loại câu hỏi trắc nghiệm khác. Ngoài ra, cũng giống như các loại
trắc nghiệm khách quan khác, loài câu hỏi này còn có các ưu điểm là mang tính chất
khách quan khi chấm điểm.
b. Khuyết điểm:
- Có thể khuyến kích học sinh đoán mò. Mặc dù GV có thể áp dụng công thức hiệu
chỉnh nhưng học sinh vẫn có khuynh hướng đoán may rủi để có 50% hy vọng trả lời
đúng.
- Loại trắc nghiệm đúng sai có độ tin cậy thấp. Học sinh có thể được điểm cao nhờ
đoán ra câu trả lời.
- Nếu đề thi là những câu có sẵn trong sách giáo khoa, sẽ tập cho học sinh thói
quen học thuộc lòng hơn là phải tìm hiểu, suy nghĩ.
- Có những câu hỏi thoạt tiên trông có vẻ như là đúng hoặc sai, theo nhận xét của
người soạn nhưng khi đem ra sử dụng thì lại gặp những thắc mắc nhiều khi rất chính
đáng của học sinh về tính cách đúng hoặc sai của các câu phát biểu ấy.
- Việc chỉ chọn đúng hay sai có thể làm cho học sinh giỏi khó chịu hay thất vọng
khi họ thấy phải có điều kiện rõ ràng hơn mới quyết định xem câu phát biểu đúng hoặc

sai hoặc có thể có những trường hợp ngoại lệ chứ không phải chỉ có hoàn toàn đúng hay
hoàn toàn sai.
Do tồn tại những ưu điểm và khuyết điểm như trên. Nên khi sử dụng cần lưu ý một
số điểm sau:
Chỉ nên sử dụng loại này một cách dè dặt, nhất là đối với các GV chưa có nhiều
kinh nghiệm về trắc nghiệm. Trong nhiều trường hợp, có thể điều chỉnh những loại câu
"đúng - sai" ra thành những loại câu có nhiều lựa chọn mà vẫn không làm giảm đi tính
chất chính xác của việc đo lường .
Những câu phát biểu cần phải dựa trên những ý niệm cơ bản mà tính cách đúng
sai phải chắc chắn, không tùy thuộc vào quan điểm từng GV. Cần lựa chọn những câu
phát biểu nào mà học sinh trung bình cần phải suy nghĩ đôi chút mới nhận ra được câu trả
lời đúng hay sai.
Mỗi câu trắc nghiệm chỉ nên diễn tả một ý tưởng, tránh những câu phức tạp quá
nhiều chi tiết.
Không nên chép nguyên văn những câu trích từ sách giáo khoa, vì làm như vậy
chỉ khuyến kích học sinh học thuộc lòng một cách máy móc.
II.2. Loại câu hỏi có nhiều câu chọn (Multiple choice question - MCQ)
Loại này gồm một câu phát biểu căn bản gọi là câu dẫn dắt hay câu hỏi đi với nhiều
câu trả lời để thí sinh lựa chọn khi trả lời. Các câu trả lời cho mỗi câu hỏi có dạng giống
nhau, gồm một từ, một cụm từ hay một câu hoàn chỉnh. Thí sinh phải chọn một câu trả
lời đúng nhất hay hợp lý nhất.
Câu dẫn dù là câu hỏi hay câu bỏ lững, phải tạo cơ bản cho sự lựa chọn bằng cách
đặt ra một vấn đề hay đưa ra một ý tưởng rõ ràng giúp cho người làm bài có thể hiểu rõ
câu trắc nghiệm ấy muốn hỏi điều gì để lựa chọn câu trả lời thích hợp.
Phần lựa chọn gồm nhiều lời giải đáp có thể lựa chọn, trong số đó có một lựa chọn
được cho là đúng hay đúng nhất gọi là "phương án đúng", còn những phần còn lại được
gọi là những "phương án nhiễu". Chúng tác động như là các câu nhiễu đối với học sinh
có năng lực tốt và tác động như các ý thu hút học sinh năng lực kém.
Ví dụ:
Câu 1: Ngôn ngữ dùng để viết chương trình để máy tính trực tiếp hiểu và thực hiện

được gọi là
A-Ngôn ngữ lập trình B-Ngôn ngữ máy
C-Ngôn ngữ bậc cao D-Hợp ngữ
Câu 2:Ngôn ngữ được viết gần với ngôn ngữ tự nhiên gọi là
A-Ngôn ngữ máy B-Hợp ngữ
C-Ngôn ngữ lập trình bậc cao D-A và B đều đúng.
Câu 3: Chương trình dịch có chức năng gì ?
A-Chạy chương trình B-Dịch ngôn ngữ khác sang ngôn ngữ máy.
C-Thể hiện giải thuật. D-Tất cả đều sai.
Câu 4: Nhược điểm của ngôn ngữ máy là gì?
A-Giao diện xấu B-Không thể hiện tường minh
C- Chương trình chạy chậm D- A và C
Câu 5: Pascal là ngôn ngữ gì?
A-Ngôn ngữ máy B- Hợp ngữ
C-Ngôn ngữ bậc cao D- Tất cả đều sai
Loại câu hỏi MCQ cho phép người soạn thoải mái hơn, so với loại câu "Đúng -
Sai", trong việc lựa chọn các khái niệm khảo sát, tùy theo mục tiêu mà ta đặt ra cho bài
trắc nghiệm. Hình thức này có ưu điểm là rất linh động, có thể được trình bày dưới nhiều
dạng khác nhau. Các câu dẫn có thể là một câu hỏi, hay một câu bỏ lửng, tiếp theo là một
số chọn lựa. Câu dẫn cũng có thể là vẽ hình, đồ thị và tiếp theo là một loạt các câu hỏi.
Đây là loại trắc nghiệm để thẩm định trí nhớ, mức hiểu biết, khả năng áp dụng, phân tích
tổng hợp hay ngay cả khả năng phán đoán cao hơn. Khi viết các câu hỏi loại này cần lưu
ý những điểm sau:
Câu dẫn phải ngắn gọn, rõ ràng tránh các từ phủ định. nếu không tránh được thì
những từ phủ định phải được nhấn mạnh.
Câu dẫn phải là câu hỏi trọn vẹn, không đòi hởi học sinh đọc các câu chọn mới
biết mình đang được hỏi vấn đề gì.
Nội dung của câu hỏi phải nêu rõ ràng, tránh sự mơ hồ, phát biểu trong mỗi câu
cần phải bằng lời lẽ đơn giản, sáng sủa.
Những từ buộc phải nhắc lại nhiều lần trong các câu chọn thì đưa vào câu dẫn.

Câu chọn phải có cùng loại quan hệ với câu dẫn, cần có cấu trúc song song, nghĩa là
chúng phải phù hợp về mặt ngữ nghĩa với câu dẫn.
Câu kiểm tra không được chứa một đầu mối nào để đoán ra câu trả lời và câu đúng
phải đúng một cách không tranh cãi được. Điều này có nghĩa là một và chỉ một câu được
xác định từ trước là đúng.
Các phương án nhiễu phải không đúng song vẫn có vẻ hợp lý đối với học sinh kém
hơn.
Để thực hiện đều này ta có thể sử dụng những quan niệm sai hoặc những lầm lẫn
thường gặp của học sinh để làm câu nhiễu, hoặc làm câu nhiễu tương tự câu đúng về kích
thước, số trị kết quả hoặc mức độ phức tạp trong cách phát biểu.
+ Không nên dùng câu chọn "tất cả đều đúng" hay "tất cả đều sai". Khi dùng câu
"tất cả đều sai" thì đôi khi câu này phải là câu đúng ở một vài câu kiểm tra trong toàn bộ
bài kiểm tra. Nếu dùng câu "tất cả đều đúng" thì nó phải đúng một cách thực sự.
+ Tránh có sự tương tự về từ trong câu dẫn và câu đúng. Không được đưa vào hai
câu trả lời cùng một ý nghĩa, và mỗi câu kiểm tra chỉ viết xoay quanh một nguyên tắc hay
nguyên lý mà thôi.
+ Không nên đặt những câu kiểm tra đòi hỏi học sinh phải nhớ những sự kiện vụn
vặt không quan trọng và ngược lại cũng không được bắt học sinh phải tính toán dài dòng.
II.3. Trắc nghiệm loại ghép đôi (Trắc nghiệm kết hợp)
Trắc nghiệm loại ghép đôi cũng khá thông dụng. Trong loại này có hai cột gồm
những chữ, nhóm chữ hay câu. Dựa trên một tiêu chuẩn nào đó định trước ở câu dẫn, học
sinh sẽ ghép mỗi chữ, nhóm chữ hay câu của cột thứ nhất (cột câu hỏi) với một phần tử
tương ứng của cột thứ hai (cột trả lời). Số phần tử trong hai cột có thể bằng nhau hay
khác nhau. Mỗi phần tử trong cột trả lời có thể dùng một hay nhiều lần để ghép với các
phần tử trong cột câu hỏi.
Để đo lường kiến thức về các mối tương quan, học sinh có thể ghép các từ với ý
nghĩa tương ứng. Chẳng hạn: các thao tác với các lệnh tương ứng; các chữ, tên với các
phần khác nhau của một sơ đồ thuật toán, một tên của hệ điều hành, hệ quản trị cơ sở dữ
liệu. Người ta cũng có thể cho học sinh sắp các chữ, các câu thành từng loại dựa trên câu
chỉ dẫn và các kiến thức căn bản nào đó cho trước. Thí dụ như phần các kiến trúc hệ cơ

sở dữ liệu được phân loại theo cách tổ chức, sắp các câu lệnh trong ngôn ngữ lập trình
Pascal theo tiến trình thực hiện một bước nào đó trong thuật toán
Ví dụ:
Câu 1:
Hãy ghép mỗi hệ điều hành sau phù hợp với chức năng của nó.
1. Windows A. Đa nhiệm, nhiều người sử dụng
2. MS-DOS B. Đa nhiệm, một người sử dụng
3. Mạng C. Đơn nhiệm, một người sử dụng
D. Giao tiếp tự do.
Câu 2:
Hãy ghép các bộ phận máy tính với các tên gọi thích hợp.
1. CPU A. Bộ nhớ trong
2. RAM, ROM B. Mainboard
3. Đĩa cứng C. Bộ nhớ ngoài
D. Bộ xử lý trung tâm
a. Ưu điểm của trắc nghiệm loại ghép đôi: (xem [24])
Trắc nghiệm loại ghép đôi rất thích hợp với các câu hỏi bắt đầu bằng những chữ
"ai", "ở đâu", "khi nào", "cái gì". Các GV có thể dùng loại này cho học sinh ghép một số
từ ghi trong một cột với ý nghĩa trong cột thứ hai.
Các câu hỏi ghép đôi dễ viết và dễ dùng, rất thích hợp với việc thẩm định các mục
tiêu ở mức năng lực thấp và phần lớn học sinh ở tuổi phổ thông cơ sở rất thích hợp với
loại câu hỏi ghép đôi này, tuy nhiên việc lựa chọn loại câu hỏi trắc nghiệm nào để dùng
nên dựa vào mục tiêu cần kiểm tra hơn là sở thích học sinh.
Khi được soạn kỹ, loại câu hỏi ghép đôi đòi hỏi học sinh phải chuẩn bị tốt trước khi
kiểm tra vì yếu tố đoán mò giảm đi nhiều, nhất là khi ghép những cột ít nhất tám đến
mười phần tử giống nhau. Nếu số phần tử ở cột câu hỏi và cột trả lời khác nhau, yếu tố
may rủi càng giảm đi nhiều.
Người ta có thể dùng loại trắc nghiệm ghép đôi để đo các mức trí năng khác nhau.
Loại ghép đôi được xem như hữu hiệu nhất trong việc đánh giá khả năng nhận biết các hệ
thức hay lập những mối tương quan. Tuy nhiên, nếu được soạn thảo khéo léo loại trắc

nghiệm này có thể được dùng như loại câu hỏi MCQ để trắc nghiệm những mức trí năng
cao hơn.
b. Khuyết điểm:
Nếu muốn soạn câu hỏi dạng ghép đôi để đo các mức kiến thức cao thường đòi hỏi
nhiều công phu, nên thường các GV chỉ dùng loại câu hỏi này để trắc nghiệm những kiến
thức như: ngày tháng, tên, định nghĩa, biến cố, công thức dụng cụ hoặc để lập các hệ
thức, phân loại.
Trắc nghiệm loại ghép đôi cũng không thích hợp cho việc thẩm định các khả năng
như sắp đặt và áp dụng các kiến thức, nguyên lý.
Nếu danh sách trong mỗi cột quá dài, học sinh sẽ mất nhiều thời gian để đọc cả cột
mỗi lần muốn ghép đôi.
Khi xây dựng câu hỏi loại ghép đôi cần lưu ý những điểm sau: (xem [24])
Số câu đáp ứng phải đủ nhiều để câu đầu tiên đến câu cuối cùng vẫn còn nhiều khả
năng để lựa chọn.
Phải chỉ dẫn kỹ lưỡng cho việc kết hợp các câu hỏi và câu đáp ứng, đồng thời cần
nói rõ là một đáp ứng chỉ được sử dụng một lần hay nhiều hơn hoặc cho tất cả khả năng.
II.4. Trắc nghiệm loại điền khuyết hay có câu trả lời ngắn.
Trắc nghiệm điền khuyết là loại câu hỏi gồm một mệnh đề hỏi được bỏ đi một hay
nhiều bộ phận và thí sinh phải điền thêm vào đó. Trắc nghiệm điền khuyết hay trắc
nghiệm có câu trả lời ngắn thực ra chỉ là một loại, chỉ khác nhau về dạng thức. Nếu được
trình bày dưới dạng câu hỏi, chúng ta gọi là loại câu có câu trả lời ngắn, nếu được trình
bày dưới dạng một câu phát biểu chưa đầy đủ, chúng ta gọi là câu điền khuyết. Đây là
loại trắc nghiệm khách quan có câu trả lời tự do.
Ví dụ:
Câu 12: Trường là một . . . . . của bảng để thể hiện 1 thuộc tính cần quản lí.
A. Cột B. Hàng
C. Ô D. Bản ghi.
Câu 13: File dữ liệu của MS Access có tên với phần mở rộng ngầm định là

a. Ưu điểm:

Học sinh có được cơ hội trình bày những câu trả lời khác thường, phát huy óc sáng
kiến.
PP chấm điểm nhanh hơn, đáng tin cậy hơn với trắc nghiệm tự luận, mặc dầu việc
cho điểm có phần rắc rối hơn so với loại trắc nghiệm khách quan khác.
Thí sinh mất cơ hội đoán mò câu trả lời như trong trường hợp các loại trắc nghiệm
khách quan khác. Thí sinh phải nghĩ ra cách trả lời thay vì chỉ chọn lựa câu trả lời đúng
trong các câu hỏi cho sẵn.
Loại trắc nghiệm điền khuyết hay có câu trả lời ngắn dễ soạn hơn loại ghép đôi hoặc
MCQ. Tuy nhiên, không nên lấy nguyên văn từ sách giáo khoa (SGK) rồi chỉ bỏ bớt vài
chữ hoặc sửa thành dạng câu hỏi. Loại trắc nghiệm điền khuyết thích hợp hơn loại tự luận
khi dùng để kiểm tra những điều đòi hỏi trí nhớ. Nhờ vào câu trả lời ngắn, số câu hỏi có
thể ra thi trong thời gian có hạn sẽ được nhiều hơn so với loại tự luận, do đó loại trắc
nghiệm điền khuyết có độ tin cậy cao hơn và việc chấm điểm cũng khách quan hơn.
Nhưng các câu hỏi tự luận lại có thể đánh giá khả năng lý luận và sắp đặt ý tưởng hữu
hiệu hơn.
Các câu hỏi điền khuyết hay có câu trả lời ngắn thích hợp cho những vấn đề như
tính toán, cân bằng phương trình hóa học, nhận biết các vùng trên bản đồ hay giản đồ,
đánh giá mức hiểu biết các nguyên lý, giải thích sự kiện, diễn đạt ý kiến, thái độ. Bên
cạch đó nó còn giúp học sinh luyện trí nhớ. Tất nhiên sự ghi nhớ ở đây không chỉ căn cứ
hoàn toàn trên trí nhớ mà ghi nhớ ở đây là nhớ những điều căn bản để suy luận hay áp
dụng vào các trường hợp khác cũng là một điều cần thiết.
b. Nhược điểm:
GV thường có khuynh hướng trích nguyên văn các câu từ SGK. Điều này làm cho
học sinh trở nên học "vẹt" và mất đi tính sáng tạo.
GV có thể hiểu sai hay đánh giá thấp giá trị các câu trả lời sáng tạo, khác với ý GV
nhưng vẫn hợp lý, nhất là khi học sinh đọc thêm sách và tài liệu ngoài giáo trình như
trong các môn khoa học nhân văn, khoa học xã hội chẳng hạn.
Nhiều câu hỏi loại điền khuyết ngắn và gọn, có xu hướng đề cập các vấn đề không
quan trọng hoặc không liên quan với nhau. Phạm vi khảo sát thường chỉ giới hạn vào chi
tiết, các sự kiện vụn vặt.

Việc chấm bài mất nhiều thời gian so với loại trắc nghiệm "đúng - sai" hoặc trắc
nghiệm MCQ.
Khi có nhiều chỗ chừa trống trong một câu hỏi, học sinh có thể rối trí. Kết quả điểm
số thường có sự tương quan cao với mức thông minh hơn là với thành quả học tập của
học sinh. Do đó độ giá trị của bài thi giảm.
Thiếu yếu tố khách quan lúc chấm điểm. Mặc dầu phương pháp chấm điểm loại trắc
nghiệm "điền khuyết" có tính chất khách quan hơn loại tự luận, GV vẫn gặp nhiều phiền
phức hơn khi chấm các câu trắc nghiệm "điền khuyết" vì giới hạn câu trả lời đúng rộng
rãi hơn. GV có thể phải chấm một phần hay toàn phần cho một câu trả lời khác với đáp
án để chấm bài. Do đó các nhân viên phụ việc không thể chấm giúp, cũng như không thể
dùng phương pháp chấm bằng máy.
Khi xây dựng câu hỏi loại điền khuyết hay có câu trả lời ngắn cần lưu ý những điều
sau:
Câu kiểm tra phải được đặt sao cho chỉ có thể có một câu trả lời ngắn ngọn, giản
đơn.
Câu hỏi phải trực tiếp và câu kiểm tra với các khoảng trống phải có đủ ý để cho
học sinh hiểu được họ phải làm gì.
Câu hỏi phải có quan hệ với điểm chính của câu nhận định, đặt vấn đề trống ở
cuối câu.
Ngoài ra còn có thể kể thêm loại trắc nghiệm đòi hỏi sắp thứ tự các phương án theo
một trật tự nào đó.
Ví dụ:
Hãy sắp xếp thứ tự thực hiện các thao tác sau, khi tiến hành soạn thảo văn bản trên
Word.
A. Lưu file văn bản lên đĩa
B. Mở chương trình WORD.
D. Thoát khỏi chương trình WORD.
C. Soạn văn bản.
II.5. Ưu và khuyết điểm của PP trắc nghiệm khách quan
a. Ưu điểm:

Do số lượng câu hỏi nhiều, phân bố khắp các nội dung chương trình học cần kiểm
tra, nên đòi hỏi học sinh học kỹ tất cả nội dung kiến thức. Như vậy, không chỉ yêu cầu
học sinh bao quát toàn chương trình mà còn hiểu sâu sắc các vấn đề của môn học.
Kiểm tra trắc nghiệm đòi hỏi học sinh học tự giác và chủ động tích cực học tập.
Điều này chống được tình trạng học lệch, học tủ, ít bị may rủi nên làm cho việc học
nghiêm túc hơn.
Thời gian làm mỗi câu từ 1 đến 3 phút. Hạn chế nạn chép tài liệu và quay cóp.
Khi làm bài thi trắc nghiệm khách quan, học sinh sử dụng nhiều hơn thời gian để
đọc và suy nghĩ, có tác dụng rèn luyện kỹ năng nhanh nhẹn, phát triển tư duy học sinh.
Do số câu hỏi nhiều, có sẵn trong ngân hàng đề thi nên có thể tiến hành kiểm tra
theo từng học phần ở nhiều nơi, nhiều lớp trong cùng một lúc.
GV đỡ căng thẳng trong coi thi, hỏi thi, chấm thi dồn dập ở cuối mỗi học kỳ.
Rất ít tốn công sức chấm bài, nhiều người (thậm chí khác môn) đều có thể chấm bài
đựơc. Đặc biệt, có thể chấm bằng máy rất nhanh, rất thuận lợi khi có số lượng thí sinh
đông.
Việc chấm điểm hoàn toàn khách quan, không phụ thuộc vào trạng thái tâm lý của
người giám khảo, không có sự chênh lệch điểm số đối với giám khảo khác nhau. Một bài
thi đều được đánh giá cùng một số điểm đối với những thời điểm chấm khác nhau. PP
này được gọi là trắc nghiệm khách quan là vì vậy.
Kiểm tra bằng trắc nghiệm khách quan có độ may rủi thấp hơn rất nhiều so với tự
luận, không có trường hợp trúng tủ đối với học sinh yếu kém, nên không kích thích học
sinh đoán mò, học lệch.
Điểm thi của bài thi trắc nghiệm hầu như do khả năng thực sự của học sinh quyết
định, hạn chế tác động bên ngoài. Với sự hỗ trợ của máy tính, có thể soạn đề thi tương
đương có cùng nội dung bằng cách xáo trộn thứ tự các câu hỏi và phương án trả lời. Thí
sinh ngồi gần nhau sẽ nhận các đề thi khác nhau về hình thức, phải đánh dấu các câu trả
lời theo các cách khác nhau nên khó xảy ra tình trạng quay cóp người bên cạnh.
b. Nhược điểm:
Việc ra những câu hỏi đúng chuẩn là công việc khó khăn, yêu cầu người ra đề phải
có chuyên môn khá tốt, có kinh nghiệm và thời gian đầu tư làm đề. Điều khó nhất là phải

tìm cho được một câu trả lời đúng nhất trong lúc các phương án trả lời khác để chọn cũng
phải có vẻ hợp lý. Thêm vào đó, các câu hỏi phải đo được các mục tiêu cao hơn chỉ ở
mức trí nhớ. Những câu hỏi được chọn phải có quả trình thử nghiệm với số lượng học
sinh đông đảo và được hiệu chỉnh nhiều lần mới có độ tin cậy cao.
Do có sẵn phương án trả lời nên khó đánh giá được khả năng phán đoán tinh vi và
khả năng giải quyết vấn đề khéo léo một cách hiệu nghiệm bằng câu hỏi tự luận soạn kỹ.
Bên cạnh đó, do các câu trả lời có sẵn nên không giúp học sinh phát triển khả năng viết
văn, trình bày bài làm, không đánh giá được khả năng tư duy trừu tượng, cảm xúc văn
học nghệ thuật. Nếu số lượng đề thi không đủ lớn thì không bảo mật được và học sinh sẽ
dựa vào câu dẫn trong đề kiểm tra cũ để chuẩn bị các phương án trả lời.
Do số lượng câu hỏi nhiều và trải đều cho cả chương trình nên nội dung câu hỏi
thường ngắn gọn, kiến thức yêu cầu không khó giải quyết do đó hạn chế việc phát triển tư
duy cao của các học sinh khá giỏi. Thí sinh nào có sáng kiến có thể tìm ra câu hay hơn
phương án đúng đã cho, nên họ không thỏa mãn hay cảm thấy khó chịu. Các câu trắc
nghiệm MCQ có thể không đo lường được khả năng phán đoán tinh vi và khả năng giải
quyết vấn đề khéo léo một cách hiệu nghiệm bằng câu hỏi tự luận soạn kỹ.
Ngoài ra các khuyết điểm nhỏ khác là tốn nhiều giấy để in loại câu hỏi này so với
các loại câu hỏi khác và học sinh cần nhiều thời gian để đọc câu hỏi.
III. Qui trình chuẩn bị và triển khai một kỳ thi trắc nghiệm khách quan.
Người ta có thể áp dụng PP trắc nghiệm để tổ chức thi, kiểm tra ở các lớp học thông
thường với số thí sinh không đông lắm; cũng có thể áp dụng ở các kỳ thi quy mô lớn
hàng nghìn, hàng vạn thí sinh. Trong trường hợp thứ hai, bất kỳ một sơ suất nhỏ nào cũng
có thể dẫn đến những hậu quả xấu và những phản ứng xã hội bất lợi. Do đó, để triển khai
một kỳ thi quy mô lớn người ta phải chuẩn bị hết sức cẩn thận về đề thi, quy trình thi, thể
thức chấm điểm, cách công bố kết quả Quá trình chuẩn bị đó hết sức công phu và tốn
kém mà một kỳ thi thông thường ở lớp học không thể làm nổi. Kỳ thi được chuẩn bị công
phu như vậy được gọi là kỳ thi tiêu chuẩn hóa. Đặc biệt, các câu hỏi trong một đề thi tiêu
chuẩn hóa là các câu đã được thử nghiệm, phân tích, gọt giũa trau chuốt và định cỡ (tức
là xác định được độ khó, độ phân biệt của từng câu và độ tin cậy, độ giá trị của cả bài).
Quy trình tổ chức một kỳ thi trắc nghiệm tiêu chuẩn hóa rất phức tạp. Có thể mô tả

tóm tắt các bước của quy trình đó như sau [34]:
1. Xác định các môn thi và những nội dung tổng quát cần kiểm tra đối với từng
môn. Đồng thời, định ra yêu cầu về các mức kỹ năng, chẳng hạn: nhớ, hiểu, biết vận
dụng, phân tích, tổng hợp Để thực hiện bước này người ta thường lập một ma trận 2
chiều: các dòng phân theo các phần nội dung, các cột phân theo các mức kỹ năng, trong
mỗi ô ghi số câu hỏi cần thiết (hoặc tỷ lệ phần trăm) của phần nội dung và mức kỹ năng
tương ứng.
2. Phân công cho các GV, mỗi người viết một số câu trắc nghiệm theo các yêu cầu
cụ thể về nội dung và mức kỹ năng đã xác định.
3. Trao đổi trong nhóm đồng nghiệp. Kinh nghiệm cho thấy quá trình trao đổi này
rất quan trọng, giúp tác giả phát hiện và sửa chữa được nhiều sai sót mà bản thân không
cảm thấy;
4. Biên tập và đưa các câu trắc nghiệm vào "ngân hàng" lưu trong máy tính. Phụ
trách biên tập phải là người am hiểu cả về chuyên môn lẫn kỹ thuật viết trắc nghịêm.
Ngân hàng câu hỏi được quản lý bằng các phần mềm chuyên dụng.
5. Lập đề thi và tổ chức thi thử trên một số nhóm thí sinh; các nhóm này là "mẫu"
đại diện cho đối tượng thí sinh chung của bài trắc nghiệm.
6. Chấm thi và phân tích thống kê các kết quả thi thử. PP thống kê cho phép xác
định các đặc trưng của mỗi câu trắc nghiệm như độ khó, độ phân biệt, qua đó có thể đánh
giá độ tin cậy của bài trắc nghiệm, phân loại chất lượng các câu trắc nghiệm.
7. Gia công các câu hỏi kém chất lượng và thay các câu đã được gia công vào ngân
hàng đề thi.
8. Ra đề thi chính thức: căn cứ vào dàn bài (phân bố câu theo nội dung và mức độ
kỹ năng tương ứng với bảng đặc trưng hai chiều), nhờ phần mềm để chọn một cách ngẫu
nhiên từ ngân hàng số câu hỏi cần thiết với các đặc trưng xác định (độ khó, độ phân cách,
mức kỹ năng) để lập nên một đề thi.
Các phần mềm có thể tạo ra các đề thi tương đương có cùng nội dung nhưng khác
nhau về hình thức bằng cách đảo lộn thứ tự các câu hỏi (khi có thể đảo lộn) và các
phương án trả lời A, B, C, D
9. In đề thi và tổ chức thi: đề thi được in sẵn, phát cho từng thí sinh trong phòng thi.

10. Chấm và phân tích thống kê các kết quả thi: ngày nay người ta có thể chấm bài
trắc nghiệm trên các hệ thống tự động gồm một máy quét quang học và một máy tính có
phần mềm hỗ trợ việc chấm thi. Cũng có phần mềm cho phép thực hiện các phép phân
tích thật tỉ mỉ về chất lượng các câu trắc nghiệm và nhiều yếu tố liên quan đến bài làm
của thí sinh.
11. Công bố kết quả thi.
Trong toàn bộ quy trình, các bước từ 2 đến 7 phải lặp lại nhiều lần để hoàn thiện
dần và tăng số lượng các câu trắc nghiệm trong ngân hàng. Qua đó có thể thấy rằng ngân
hàng các câu trắc nghiệm không phải là kho lưu trữ bất động mà như một cơ thể sống,
luôn được bổ sung, loại bỏ, hoàn thiện và phát triển.
Cần phải nhấn mạnh rằng các câu trắc nghiệm tiêu chuẩn hoá trong ngân hàng và đề
thi trắc nghiệm phải được bảo mật trước khi đem ra sử dụng. Những đề thi và những câu
hỏi đã được dùng chính thức thường được công bố ở các tài liệu dùng cho tham khảo
hoặc luyện thi.
Một tác dụng hết sức quan trọng của các kỳ thi đại trà bằng trắc nghiệm tiêu chuẩn
hóa là: những thông tin thu được qua việc phân tích thống kê toàn bộ bài làm của thí sinh
qua các kỳ thi là những số liệu hết sức quý báu để đánh giá định lượng về tình hình giáo
dục của từng khu vực, từng cộng đồng, từng nhóm thí sinh và đánh giá xu thế phát triển
của chất lượng giáo dục theo thời gian.
Ngoài các bài trắc nghiệm chuẩn hóa, do các nhà chuyên môn soạn và được nhà
xuất bản phân phối trên thị trường, chủ yếu để trắc nghiệm về trí thông minh, khả năng,
nhân cách, sở thích. Trong trường hợp kiểm tra đánh giá thành tích học tập vẫn có những
bài trắc nghiệm chuẩn, nhưng thường thì chúng không đáp ứng nhu cầu của GV, vì nó
không phù hợp các mục tiêu giảng dạy của họ. Dưới đây là các bước và các kỹ thuật căn
bản để soạn một bài trắc nghiệm. Một số ví dụ cũng được đưa ra, nhưng xin thú thật là
thật ra chúng chưa hẳn đã chuẩn vì chúng chưa được kiểm chứng qua thực nghiệm.
III.1. Qui trình biên soạn đề thi trắc nghiệm.
Bước 1: XÁC ĐỊNH MỤC ĐÍCH YÊU CẦU.
Đề kiểm tra là phương tiện để đánh giá kết quả học tập sau khi học xong một chủ
đề, một chương, một học kỳ hay toàn bộ chương trình hay một cấp học. Ngoài ra còn là

phương tiện để dự đoán khả năng của người được trắc nghiệm trong tương lai. Người GV
qua bài trắc nghiệm để đánh giá học sinh nhưng không chỉ đơn thuần phân loại học sinh
mà còn qua đó đánh giá lại kết quả dạy và học của cả Thầy và Trò, để định hướng cho
việc dạy tiếp theo tốt hơn.
Bước 2: XÁC ĐỊNH MỤC TIÊU GIẢNG DẠY.
Để một đề trắc nghiệm đo được cái cần đo, tức là đo được mức độ đạt các mục tiêu
cụ thể của môn học, cần phải thiết kế và viết đề thi trắc nghiệm bám sát mục tiêu của
môn học. Một đề thi tốt kết hợp với việc tổ chức kỳ thi tốt sẽ làm cho kỳ thi đạt được độ
giá trị cao. Trước hết, cần xác định mục tiêu muốn kiểm tra đánh giá cho rõ ràng. Để
giảng dạy tốt một môn học cần có một danh mục chi tiết về các mục tiêu giảng dạy, thể
hiện ở năng lực hay hành vi cần phát triển của người học qua quá trình giảng dạy. Để viết
một bài trắc nghiệm tốt cho môn học đó cần dựa vào các mục tiêu đã đề ra cho môn học.
Vì vậy việc làm rõ mối quan hệ giữa mục tiêu môn học và đánh giá thành tích học
tập của học sinh, đặc biệt là việc cụ thể hóa mục tiêu môn học thành các thao tác có thể
đo lường gọi là các tiêu chí đánh giá là một vấn đề quan trọng trong việc dạy và học,
cũng như kiểm tra và đánh giá thành quả học tập của học sinh.
Mục tiêu môn học là kết quả dự kiến tối thiểu mà học sinh phải đạt được sau khi
quá trình học tập, nó được thể hiện bởi các yêu cầu khái quát về kiến thức, kỹ năng và
thái độ của học sinh. Các mục tiêu môn học phải được cụ thể hóa để xác định các chuẩn
và các tiêu chí đánh giá đối với một môn học. Quá trình thao tác hóa mục tiêu được chia
thành 4 cấp độ sau:
Hệ thống mục tiêu môn học toàn cấp.
Hệ thống mục tiêu môn học từng lớp.
Hệ thống mục tiêu từng chương, từng phần.
Hệ thống mục tiêu từng bài.
Các mục tiêu lại được phân chia thành ba lĩnh vực: kiến thức, kỹ năng và thái độ
xuyên suốt cả 4 cấp độ nói trên.
Chúng ta có thể sử dụng một ma trận 2 chiều, trong đó các bài học có các tiêu chí cụ
thể và các chuẩn cần đạt của bài đó. Các bài ghép lại thành một chủ đề, nhiều chủ đề
ghép thành một chương, nhiều chương ghép thành một phân môn và tổng hợp các phân

môn chính là hệ thống mục tiêu của một lớp. Ma trận trên được gọi là bảng mục tiêu môn
học. Dựa vào bảng các mục tiêu môn học, tùy thuộc vào mức độ quan trọng của từng
mục tiêu của từng phân trong môn học, thời gian làm bài để đưa ra số câu hỏi cho mỗi
mục tiêu. Từ đó, có thể xây dựng được đề thi cho bài, chương hay một môn học.
Trong thực tế các mục tiêu giảng dạy môn học không phải bao giờ cũng có sẵn đủ
chi tiết để có thể soạn thảo một bài trắc nghiệm. Trong trường hợp đó cần xây dựng lại
chi tiết danh mục các mục tiêu đó. Việc xây dựng mục tiêu thường được triển khai trong
một nhóm những người cùng giảng dạy môn học đó phối hợp với một chuyên gia hiểu
biết về cách viết các câu hỏi trắc nghiệm. Trước hết cần liệt kê các mục tiêu cụ thể liên
quan đến các năng lực cần đo lường đối với từng phần của môn học, sau đó tuỳ thuộc
mức độ quan trọng của từng mục tiêu ứng với từng phần của môn học mà quyết định là
cần bao nhiêu câu hỏi.
Ví dụ: (xem [36],[37])
Chương
Bài
Mục tiêu
Chương I -
Tin học 12
THPT.
Khái niệm về
cơ sở dữ liệu
(CSDL) và hệ
quản trị
CSDL.
+ Khái niệm CSDL.
- Kiến thức: Nắm được các vấn đề thường giải
quyết trong một bài toán quản lý và sự cần
thiết phải có CSDL, khái niệm CSDL và hệ
CSDL cùng các đặc trưng của nó.
- Kỹ năng: chưa đòi hỏi các thao tác cụ thể.

- Thái độ: nhìn nhận vấn đề lưu trữ và xử lý
hồ sơ có hệ thống hơn.
+ Hệ quản trị CSDL.
- Kiến thức: Nắm được các chức năng của một
hệ quản trị CSDL.
- Kỹ năng: chưa đòi hỏi thao tác cụ thể.
- Thái độ: Xác định vai trò của mình với một
hệ CSDL, là người sử dụng, quản trị CSDL
hay lập trình ứng dụng.
Bảng mục tiêu môn học của chương 1 - Tin học lớp 12 THPT.
Có thể cụ thể hóa các mục tiêu DH thành các mức độ chi tiết hơn về các mức nhận
thức của học sinh. Hệ thống phân chia được biết tới nhiều nhất là: "Nguyên tắc phân loại
Giáo dục" của B.S.Bloom. Nguyên tắc này cung cấp sự phân loại các mục tiêu giáo dục
trong các lĩnh vực về nhận thức theo 3 lĩnh vực của hoạt động giáo dục sau đây:
Lĩnh vực về nhận thức (cognitive domain).
Lĩnh vực về hoạt động (psychomator domain)
Lĩnh vực về cảm xúc, thái độ (affective domain).
Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận, bao gồm việc thu thập
các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự đánh giá có phê
phán.
Lĩnh vực hành động liên quan đến những kỹ năng đòi hỏi sự khéo léo về chân tay,
sự phối hợp các cơ bắp từ đơn giản đến phức tạp.
Lĩnh vực cảm xúc liên quan đến những đáp ứng về mặt tình cảm, bao hàm cả những
mối quan hệ như yêu ghét, thái độ nhiệt tình, thờ ơ, cũng như sự cam kết với một nguyên
tắc và sự tiếp thu các lý tưởng.
Các lĩnh vực nêu trên không hoàn toàn tách biệt hoặc loại trừ lẫn nhau. Phần lớn
việc phát triển tâm linh và tâm lý đều bao hàm cả 3 lĩnh vực nói trên.
Bloom và những người cộng tác với ông ta cũng xây dựng nên các cấp độ của các
mục tiêu giáo dục, thường được gọi là cách phân loại Bloom, trong đó lĩnh vực nhận thức
được chia thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất như sau:

- Nhớ (Knowledge): được định nghĩa là sự nhớ lại các dữ liệu đã học được trước
đây. Điều đó có nghĩa là một người có thể nhắc lại một loạt dữ liệu, từ các sự kiện đơn
giản đến các lý thuyết phức tạp, tái hiện trong trí nhớ những thông tin cần thiết. Đây là
cấp độ thấp nhất của kết quả học tập trong lĩnh vực nhận thức.
- Hiểu (Comprehention): được định nghĩa là khả năng nắm được ý nghĩa của tài liệu.
Điều đó có thể thể hiện bằng việc chuyển tài liệu từ dạng này sang dạng khác (từ các từ
sang số liệu), bằng cách giải thích tài liệu (giải thích hoặc tóm tắt) và bằng cách ước
lượng xu hướng tương lai (dự báo các hệ quả hoặc ảnh hưởng). Kết quả học tập ở cấp độ
này cao hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật.
- Áp dụng (Application): được định nghĩa là khả năng sử dụng các tài liệu đã học
vào một hoàn cảnh cụ thể mới. Điều đó có thể bao gồm việc áp dụng các quy tắc, PP,
khái niệm, nguyên lý, định luật và lý thuyết. Kết quả học tập trong lĩnh vực này đòi hỏi
cấp độ thấu hiểu cao hơn so với cấp độ hiểu trên đây.
- Phân tích (Analysis): được định nghĩa là khả năng phân chia một tài liệu ra thành
các phần của nó sao cho có thể hiểu được các cấu trúc tổ chức của nó. Điều đó có thể bao
gồm việc chỉ ra đúng các bộ phận, phân tích mối quan hệ giữa các bộ phận, và nhận biết
được các nguyên lý tổ chức được bao hàm. Kết quả học tập ở đây thể hiện một mức độ trí
tuệ cao hơn so với mức hiểu và áp dụng vì nó đòi hỏi một sự thấu hiểu cả nội dung và
hình thái cấu trúc của tài liệu.
- Tổng hợp (Synthesis): được định nghĩa là khả năng sắp xếp các bộ phận lại với
nhau để hình thành một tổng thể mới. Điều đó có thể bao gồm việc tạo ra một cuộc giao
tiếp đơn nhất (chủ đề hoặc bài phát biểu), một kế hoạch hành động (dự án nghgiên cứu),
hoặc một mạng lưới các quan hệ trừu tượng (sơ đồ để phân lớp thông tin). Kết quả học
tập trong lĩnh vực này nhấn mạnh các hành vi sáng tạo, đặc biệt tập trung chủ yếu vào
việc hình thành các mô hình hoặc cấu trúc mới.
- Đánh giá (Evaluation): là khả năng xác định giá trị của tài liệu. Việc đánh giá dựa
trên các tiêu chí nhất định. Đó có thể là các tiêu chí bên trong (cách tổ chức) hoặc các tiêu
chí bên ngoài (phù hợp với mục đích), và người đánh giá phải tự xác định hoặc được
cung cấp các tiêu chí. Kết quả học tập trong lĩnh vực này là cao nhất trong các cấp bậc
nhận thức vì nó chứa các yếu tố của mọi cấp bậc khác.

Các vấn đề về quá trình cụ thể hóa mục tiêu môn học, có thể xem một cách chi tiết
trong các tài liệu [24],[27],[33],[34].
Ví dụ: Mức độ nhận thức đơn giản của chương I - Tin học 12 - THPT.
Chương
Mạch kiến thức
Nhớ
Hiểu
Áp dụng
Chương I
- Tin học
12.
Khái niệm
Các vấn đề thường
giải quyết trong một
bài toán quản lý.

Hiểu được các
vấn đề như tạo
lập, cập nhật hồ


về CSDL
và hệ
quản trị
CSDL.
Sự cần thiết phải có
CSDL.


Các bài toán dẫn

đến sự cần thiết
phải cso CSDL
Khái niệm CSDL.

CSDL là gì?
Cho ví dụ
Nắm được các chức
năng hệ QTCSDL.

Hệ QTCSDL?
Cho ví dụ về các
chức năng.
Hệ CSDL cùng các
đặc trưng của nó.

Hệ CSDL bao
gồm cái gì?
Các yêu cầu cơ bản
của một hệ CSDL
như tính cấu trúc,
toàn vẹn
Bước 3: THIẾT LẬP MA TRẬN PHÂN BỐ CÂU HỎI CỦA ĐỀ THI.
Từ bảng các mục tiêu môn học như đã nói ở trên, khi muốn ra đề kiểm tra một bài,
một chương hay toàn bộ môn học, ta đi thiết lập một ma trận tạm gọi là ma trận phân bố
câu hỏi của đề thi. Ma trận này bao gồm các hàng là các mục kiến thức, kĩ năng và thái
độ của mục tiêu môn học của bài, chương, môn cần kiểm tra và các cột là các mức độ
nhận thức cần đánh giá. Khi đó các ô của ma trận sẽ là số câu hỏi và trọng số điểm dành
cho các câu hỏi trong ô đó.
Các mức kiến thức, kỹ năng và thái độ của các mục tiêu môn học ta sẽ gọi là các
mạch kiến thức.

Dựa vào tầm quan trọng của từng mục tiêu và mức độ nhận thức, thời gian ấn định
để làm bài thi, trọng số điểm cho từng mục tiêu, từng mức độ nhận thức để quyết định số
câu hỏi có trong từng ô của ma trận.
Cụ thể các bước như sau:
- Xác định tỷ lệ thời gian của từng phần và trọng số điểm cho từng phần, căn cứ dựa
trên số tiết quy định trong phân phối chương trình và mức độ quan trọng của mục tiêu đó
trong chương trình.
- Xác định trọng số điểm cho từng hình thức câu hỏi nếu có kết hợp trắc nghiệm
khách quan và trắc nghiệm tự luận.
- Xác định trọng số điểm cho từng mức độ nhận thức.
Quyết định số lượng câu hỏi cho từng mục tiêu tùy thuộc vào mức độ quan trọng
của mục tiêu đó, thời gian làm bài kiểm tra và trọng số điểm cho từng mục kiến thức
trong mục tiêu, từng mức độ nhận thức.
Ví dụ: Ma trận phân bố câu hỏi của đề thi kiểm tra chương I - Khái niệm về CSDL
và hệ quản trị CSDL - Tin học lớp 12 - THPT. (chỉ đánh giá 3 mức nhận thức cơ bản là:
nhớ, hiểu và áp dụng và đề thi có kết hợp TNKQ và TNTL)
Mạch kiến thức
Nhớ
Hiểu
Áp dụng
Tổng
TN
TL
TN
TL
TN
TL

Các vấn đề thường giải quyết trong
một bài toán quản lý.

2
1

1
1




Sự cần thiết phải có CSDL.
1
0.5



1 1


Khái niệm CSDL.
1
0.5


1
0.5

1
0.5

Hệ CSDL cùng các đặc trưng của nó.

1
0.5
1
0.5
1
0.5




Nắm được các chức năng hệ
QTCSDL.
1
0.5


1
1



Phương thức hoạt động của hệ
QTCSDL.
1
0.5
1
0.5


2

1


Tổng
9 4.5
4 3
4 2.5
17 10
Chữ số ở bên phải hoặc ở góc phải của các ô là trọng số điểm của các câu hỏi trong
mỗi ô đó, còn số còn lại là số câu hỏi của mỗi phần.
Trong môn Tin học ở THPT có những phần nếu kiểm tra thực hành trên máy vi tính
sẽ có hiệu quả tốt hơn. Ở lớp 12, Chương II - Hệ quản trị CSDL Access - Tin học 12, ở
lớp 11 chương trình tập trung vào ngôn ngữ lập trình PASCAL ngoài mục tiêu rèn luyện
ngôn ngữ, rèn luyện tư duy thuật toán, còn có mục tiêu rèn luyện kỹ thuật lập trình cho
học sinh. Các phần nói trên, nếu có điều kiện tổ chức kiểm tra trên máy tính sẽ rất có hiệu
quả. Lúc này,người GV cũng sẽ vẫn phải lập bảng mục tiêu môn học để giảng dạy được
tốt hơn và điều này cũng giúp cho họ xác định được rõ ràng các tiêu chí đánh giá sẽ được
yêu cầu ở bài kiểm tra thực hành.
Hình thức kiểm tra thực hành có thể thực hiện bởi nhiều cách khác nhau như:
+ Đánh giá kỹ năng, thao tác, kỹ thuật lập trình của học sinh qua các giờ thực hành.
+ Đánh giá qua các đề tài thực hành đã giao trước cho học sinh theo cá nhân hay
theo nhóm.
+ Đánh giá qua bài thi thực hành và tất cả lớp cùng thực hành ngay trên máy tính,
sau đó GV sẽ chấm sản phẩm
Các hình thức trên được xem như là hình thức TNTL. Cũng có thể tiến hành chấm
tự động bằng máy tính một cách khách quan nhờ lập sẵn các bộ test kết quả để test
chươngtrình của học sinh lập ra. Cách làm trên cũng có thể xem là một hình thức của
TNKQ. Tuy vậy, cách làm này chỉ đánh giá được kết quả thực hiện chương trình của học
sinh, chứ rất khó đánh giá được rất nhiều yếu tố cần đánh giá khác như: khả năng ngôn
ngữ, cách trình bày, thao tác đúng hay sai, thuật toán, các ý tưởng sáng tạo của học sinh

Thường thì chúng ta thường bỏ qua hoặc không làm tốt việc xây dựng ma trận phân
bố câu hỏi và xây dựng thang điểm cho bài kiểm tra thực hành. Mặc dù đây là bài kiểm
tra hết sức đặc trưng của bộ môn Tin học ở THPT. Tuy vậy, các vấn đề nói trên dành cho
bài kiểm tra thực hành, rất tiếc nó không nằm trong chủ đề về trắc nghiệm khách quan
của tài liệu này.
Bước 4: BIÊN SOẠN CÂU HỎI.
Mức độ đo đạc, nội dung kiến thức và hình thức câu hỏi được biên soạn dựa trên hệ
thống mục tiêu đã xác định ở bước 2 và 3.
Căn cứ vào xác suất đoán mò của mỗi dạng câu hỏi để đưa ra số dạng câu hỏi hỏi
với số lượng câu hỏi của từng dạng hợp lý.
Một số khuyến khích cần lưu ý:
Ma trận phân bố câu hỏi phải được chuẩn bị trước và có thảo luận với tổ nhóm
chuyên môn về các mục tiêu của bài kiểm tra. Nên chuẩn bị số câu hỏi nhiều hơn dự kiến
cần dùng.
Các câu hỏi nên đặt ở dạng xác định hơn phủ định và tránh dùng nguyên văn những
câu trích từ trong sách khi soạn các câu hỏi có dạng đúng/sai hay điền khuyết vì như vậy
là khuyến khích học sinh học "vẹt". Cũng nên tránh các câu hỏi mẹo, hỏi mang tính "lừa
gạt" thí sinh, tránh các câu mà học sinh có thể trả lời được nhờ dữ kiện cho bởi một câu
hỏi khác.
Về mặt tâm lý thì nên sắp câu hỏi theo độ khó, đặt các câu hỏi cùng loại hơn là các
câu hỏi về cùng một chủ đề cần kiểm tra về một chỗ.
Tránh sắp gần nhau các câu hỏi trả lời đúng cùng một kiểu, chẳng hạn như các
phương án đúng theo một qui luật nào đó, hoặc trong câu hỏi đúng/sai thì GV hay đưa ra
các câu hỏi mà câu trả lời phần nhiều là "đúng" hay phần nhiều là "sai" học sinh nhanh trí
có thể đoán ra được.
Các chỗ chừa trống để điền khuyết nên dài bằng nhau, không phụ thuộc vào câu trả
lời cần điền.
Nên cho học sinh trả lời trên một tờ trả lời riêng biệt để dễ chấm hơn.
Các câu hỏi phải viết thế nào để chỉ có một câu trả lời đúng. Thoạt nghe thì có vẻ
hiển nhiên, nhưng GV rất hay vấp phải điều này.

Bước 5: XÂY DỰNG ĐÁP ÁN VÀ BIỂU ĐIỂM.
a) Biểu điểm với hình thức TNKQ.
Cách 1: Điểm toàn bài là 10 điểm được chia đều cho số lượng câu hỏi trong toàn
bài, hoặc chia theo độ khó của câu hỏi.
Cách 2: Điểm tối đa của toàn bài bằng số câu hỏi (trả lời đúng 1 điểm và sai 0
điểm). Sau đó qui về thang điểm 10 theo công thức: 10x/y, với x=số điểm đạt được và y
là số điểm tối đa của đề. Lưu ý điểm cho theo thang điểm chỉ là điểm thô, còn có các loại
điểm khác như điểm hiệu chỉnh, điểm dẫn xuất xin xem thêm các phần dưới.
b) Sự phân phối điểm theo từng phần TNKQ hay trắc nghiệm tự luận hay các phần
trong đề thi tuân theo nguyên tắc:
- Tỷ lệ thuận với thời gian dự định học sinh làm bài phần đó.
- Mỗi câu TNKQ nếu trả lời đúng nên có số điểm như nhau.
c) Biểu điểm của đề thi có kết hợp trắc nghiệm tự luận và trắc nghiệm khách quan.
Cách 1: Điểm tối đa của toàn bài là 10. Sự phân phối điểm cho từng phần phụ thuộc
theo thời gian ước định học sinh hoàn thành theo từng phần. Mỗi câu TNKQ nếu đúng có
số điểm như nhau.
Cách 2: Điểm tối đa của toàn bài phụ thuộc vào số lượng câu hỏi của đề thi. Sự
phân phối điểm theo nguyên tắc:
+ Tỷ lệ thuận với thời gian dự định học sinh hoàn thành từng phần.
+ Mỗi câu TNKQ đúng được 1 điểm, sai 0 điểm.
+ Tính điểm của phần TNKQ trước, sau đó tính điểm tối đa của TN tự luận theo
công thức: D
tl
= (D
kq
*T
tl
)/T
kq
.

Với: D
tl
= Điểm tự luận, D
kq
=Điểm TNKQ, T
tl
và T
kq
là thời gian dành cho các phần
đó.
Sau đó, chuyển về thang điểm 10 theo công thức: 10X/X
max
với X=Điểm của học
sinh và X
max
là tổng điểm tối đa của đề.
Bước 6. XÂY DỰNG NGÂN HÀNG CÂU HỎI TRẮC NGHIỆM.
Rõ ràng là không nên sử dụng một bài trắc nghiệm trong nhiều năm, nhưng một câu
hỏi trắc nghiệm tốt có thể được sử dụng lại trong nhiều năm, chừng nào mà nó còn phù
hợp với nội dung và mục đích của chương trình giảng dạy. Tập hợp các câu hỏi tốt sẽ tạo
thành một ngân hàng câu hỏi.
Để bảo đảm tính khách quan và bảo mật của đề thi, cũng như tránh để học sinh học
"vẹt", học sinh biết trước các câu hỏi hay các câu dẫn nên học tủ, học thuộc một cách
máy móc phương án đúng trước, nên các câu hỏi trong ngân hàng được giữ kín. Đó là lý
do các đề thi TNKQ thường được giữ lại sau khi thí sinh thi xong. Tuy vậy, nếu các câu
hỏi trong ngân hàng là chuẩn và có một lượng đủ lớn, trải đều khắp các tiêu chí đánh giá
của môn học, các tiêu chí ấy là chuẩn mực cho tất cả các trường các lớp có cùng chuẩn
đánh giá, thì một ngân hàng đề thi như thế sẽ trở thành một chuẩn kiến thức mà học sinh
cần phải đạt được trong quá trình học bộ môn. Vì vậy theo chúng tôi lúc này có thể công
bố ngân hàng câu hỏi ấy cho học sinh theo đó để học tập và thi cử.

Khi xây dựng một ngân hàng câu hỏi như thế và lưu trữ nó trên máy tính cần có lưu
ý sau: xây dựng mã câu hỏi phải bao hàm các thông tin gồm chương mục, nội dung và kỹ
năng nào mà câu hỏi cần kiểm tra, đáp án đúng để tiện chọn lựa và sắp đặt trong các đề
thi trắc nghiệm khác nhau.
Ví dụ: Khi lưu các câu hỏi TNKQ trên một file cơ sở dữ liệu, một câu hỏi sẽ là một
bản ghi có thể gồm các trường sau: nội dung, chương - bài trong môn học tương ứng, đáp
án, các phương án chọn, độ khó, độ phân biệt
III.2. Thực hành các bước ra đề trắc nghiệm khách quan.
1) Sử dụng sách Tin học lớp 12, sách dành cho GV, hãy lập bảng mục tiêu môn học
cho các chương 2, 3, 4 của chương trình Tin học lớp 12 THPT.
2) Hãy lập bảng mục tiêu môn học cho toàn bộ môn học Tin học lớp 12 THPT.
3) Xây dựng ma trận phân bố câu hỏi cho đề thi kiểm tra các chương 2,3, và 4 Tin
học lớp 12 THPT.
4) Trong chương trình Tin học lớp 12 được phân bố 2 tiết kiểm tra học kỳ, 1 dành
cho học kỳ 1 và 1 dành cho học kỳ 2. Theo chúng tôi, nếu bố trí dạy chương III trước
chương II (theo sách hướng dẫn GV Tin học 12 thì điều này là được phép) là hợp lý hơn.
Trong trường hợp này
+ Hãy xây dựng ma trận phân bố câu hỏi cho chương I và chương III để xây dựng 1
đề kiểm tra học kỳ 1, gồm TNKQ và TNTL.
+ Hãy xây dựng bảng mục tiêu môn học cho chương II và chương IV, để xây dựng
1 đề kiểm tra học kỳ bao gồm 1 phần TNKQ cho chương IV và kiểm tra thực hành trên
máy tính đối với chương II.
Sau khi biên soạn đề thi, quá trình tiếp theo trong đánh giá thành quả học tập của
học sinh là: tổ chức cho học sinh thi¸ đánh giá kết quả dạy và học, cũng như đánh giá chất
lượng đề thi qua kết quả thi của học sinh. Các phần này sẽ được bàn bạc trong các phần
dưới đây.
IV. Sử dụng trắc nghiệm trong dạy và học môn tin học THPT
Các bài trắc nghiệm trước hết là sự xác định các mục tiêu giảng dạy cho học sinh.
Đừng để học sinh xem bài trắc nghiệm là một sự đe dọa hơn là sự hỗ trợ, bầu không khí
căng thẳng gắn với trắc nghiệm sẽ ức chế việc học tập và cũng đừng để học sinh xem bài

trắc nghiệm là một phương tiện duy nhất để phân loại họ, thậm chí là "đánh giá thấp" họ.
Lúc này các bảng báo cáo kết quả học tập và mối quan tâm về bộ môn của học sinh, đôi
khi không đáng tin cậy lắm trong việc đánh giá phân loại nhưng cũng có ích khi học sinh
quyết định việc học có dẫn đến hành vi mong muốn hay không. Hơn nữa nó còn giúp học
sinh xác định điều gì đang đợi họ phải đạt được, ngoài ra lúc này học sinh phải có khả
năng đánh giá, thẩm định các kết quả đã học, cũng có thể cao hơn là mức sáng tạo.
Bài trắc nghiệm còn được xem như là một phương tiện cung cấp thông tin phản hồi,
GV và học sinh nên cùng nhau thảo luận các câu hỏi khó của bài trắc nghiệm. Không nên
phản đối việc tiến hành nhiều trắc nghiệm trong một môn học, mỗi khi nó không trở nên
nhàm chán, căng thẳng. Nhiều GV than phiền "Tôi không có thời gian để trắc nghiệm và
thảo luận các câu trắc nghiệm, vì như thế sẽ không đủ thời gian hoàn thành nội dung phải
giảng dạy". Như vậy, họ có thể chưa hiểu hết ý nghĩa của trắc nghiệm và các PP giảng
dạy tích cực hóa hoạt động của người học. Không có gì đảm bảo việc chạy theo nội dung
DH thông qua việc giảng giải một cách hình thức sẽ đạt hiệu quả tốt. Vì vậy, khi thiết kế
một chương trình TNKQ ở trường học, cầm lưu ý ngoài việc cho học sinh trả lời các câu
hỏi, cho điểm đơn thuần, nên có thêm chức năng thống kê các câu trả lời của học sinh đối
với từng câu hỏi, kể cả câu đúng hay câu nhiễu. Điều này giúp cho GV biết có thể câu
hỏi chưa tốt, bị nhiễu do cách dùng từ ngữ, câu hỏi chưa sát với tiêu chí cần đánh giá và
quan trọng là học sinh của họ chưa làm tốt câu hỏi đó do đâu, phần đông bị nhầm lẫn
kiến thức đó vì sao để có hướng khắc phục những lệch lạc đó ngay cho học sinh.
IV.1. Sử dụng trắc nghiệm để đánh giá phân loại học sinh
Các bài trắc nghiệm là một công cụ để đánh giá thành tích học tập của học sinh, có
nhiều cách tiếp cận đối với việc cho điểm hay xếp hạng. Dưới đây, chúng ta sẽ thảo luận
về việc cho điểm và xếp hạng thế nào đối với các kết quả trắc nghiệm của học sinh.
IV.1.1. Phân loại theo đường cong phân bố
Đường cong phân bố thường được dựa vào là đường cong phân bố chuẩn có hình
quả chuông - với giả định dựa vào các kết quả nghiên cứu cho thấy rằng các đặc tính thể
chất của con người khi đo lường các kết quả có phân bố chuẩn.
GV có thể dựa vào tỷ lệ phần trăm số câu trả lời đúng để xếp hạng.
Tỷ lệ % câu trả lời đúng Xếp hạng

95-100 A
85 - 94 B
75 - 84 C
65 - 74 D
Dưới 65 F
Hoặc dựa vào điểm số của học sinh để xếp hạng cho các em dựa vào đường cong
chuẩn nói trên.
Điểm cao nhất 7% A
Tiếp đến 23% B
Ở giữa 40% C
Tiếp đến 23% D
Điểm thấp nhất 7% F
Nhìn chung việc xếp hạng theo đường cong phân bố dẫn đến sự cạnh tranh không
tích cực vì một học sinh làm tốt thì kéo theo thứ hạng của nhiều người khác giảm xuống
và họ mong người khác làm trắc nghiệm kém đi, đây có lẽ là một thái độ không tốt trong
giáo dục.
IV.1.2. Đánh giá dựa trên nhóm chuẩn và tiêu chí thành quả
Việc đánh giá dựa trên nhóm chuẩn là những phép đo để lượng giá thành quả của
thí sinh so với các thí sinh khác cùng dự thi một bài trắc nghiệm. Ý nghĩa điểm số của
mỗi cá nhân đạt được xuất phát từ so sánh ấy. Do mỗi thí sinh được so sánh với những
người khác trong một nhóm dùng làm chuẩn nên thường gọi là đánh giá dựa trên nhóm
chuẩn. Đánh giá dựa trên nhóm chuẩn thường được dùng trong các kỳ thi tuyển chọn, xếp
học bổng
Các đánh giá dựa trên tiêu chí thành quả là những phép đo dùng để xác định vị trí
của mỗi cá nhân đối với các tiêu chí định trước, chứ không so sánh với các thí sinh khác.
Trong đánh giá này chúng ta muốn xác định mỗi học sinh làm được gì, có khả năng thế
nào so với các tiêu chí môn học đặt ra, chứ không quan tâm đến khả năng của các cá nhân
khác. Việc trắc nghiệm này được dùng để đánh giá lại quá trình dạy và học của thầy và
trò trong một bộ môn, một học kỳ
Lúc này, GV phải lập ra các tiêu chuẩn mà theo đó học sinh đạt được các tiêu chí

mà bài trắc nghiệm đặt ra kiểm tra nội dung và các kỹ năng cần đạt của chương trình học.
Bên cạnh đó, GV cũng phải ước lượng số lượng câu trả lời đúng tối thiểu đối với một
thành tích xếp hạng nào đó. Học sinh trả lời được bao nhiêu câu đó thì đạt loại đó. Khó
khăn gặp phải khi đưa ra các tiêu chuẩn là: GV không ước định được độ khó của bài trắc
nghiệm. Nên nếu bài quá khó thì nhiều học sinh không đạt và quá dễ thì ngược lại thì hầu
hết mọi người đạt điểm quá cao.
Một điều lưu ý là đường cong phân bố điểm của trắc nghiệm quy về tiêu chí thành
quả thường có dạng lệch, trong khi trắc nghiệm dựa trên nhóm chuẩn thường có dạng
chuẩn hay gần chuẩn.
Bên cạnh đó, khi viết câu hỏi để trắc nghiệm dựa trên nhóm chuẩn, ta thường chú
trọng đến độ phân biệt, các câu hỏi quá khó hay quá dễ thường được loại ra. Ngược lại,
khi trắc nghiệm dựa trên thành quả thì mỗi câu hỏi phải nhắm đến có phản ánh đúng tính
chất dùng làm tiêu chí đánh giá hay không. Tính chất khó hay dễ, độ phân biệt cao hay
thấp không quan trọng bằng việc biểu thị đúng tiêu chí thành quả cần phải đạt được trong
môn học.
Hơn nữa khi trắc nghiệm dựa trên nhóm chuẩn đòi hỏi phải dùng cùng một bài trắc
nghiệm cho tất cả thí sinh khác nhau, ngược lại khi cần đánh giá kết quả giảng dạy, trắc
nghiệm tiêu chí thành quả được sử dụng và các thí sinh không nhất thiết phải làm cùng
một bài trắc nghiệm. Người ta thường phân chia bài trắc nghiệm ra thành các bài trắc
nghiệm ngắn hơn và chia lớp học ra thành các nhóm thí sinh nhỏ hơn bằng PP lấy mẫu
ngẫu nhiên hay ngẫu nhiên có phân lớp. Thường thì câu hỏi được phân lớp theo tiêu chí,
mục tiêu giảng dạy và mức độ khó của câu hỏi. Các mục tiêu giảng dạy phải được cụ thể
hóa thành các tiêu chí rõ ràng và có các điểm số cho từng phần.
Dưới đây là một số so sánh tính chất giữa hai loại trắc nghiệm nói trên.
TRẮC NGHIỆM DỰA TRÊN
NHÓM CHUẨN
TRẮC NGHIỆM DỰA TRÊN
TIÊU CHÍ THÀNH QUẢ
Dùng để so sánh khả năng giữa các thí
Xác định vị trí khả năng của mỗi cá nhân so

sinh
với tiêu chí thành quả học tập
Dùng để tuyển chọn, phân loại, xét vị
thứ
Có những quyết định liên quan đến cá nhân và
đánh giá việc dạy và học, đánh giá chương
trình.
Điểm của thí sinh phải phân tán thì bài
trắc nghiệm mới có ý nghĩa
Không coi trọng độ phân biệt của các câu hỏi.
Các PP cổ điển xác định độ tin cậy, độ
giá trị sử dụng được.
Các PP cổ điển xác định các chỉ số này không
sử dụng được vì điểm số không có độ phân tán
ngẫu nhiên.
Phân tích câu hỏi để loại bỏ câu quá dễ
hay quá khó.
Câu hỏi dễ hay quá khó không quan trọng, nên
việc phân tích câu hỏi chỉ để bỏ đi các câu hỏi
soạn quá dở
Điểm số dựa trên nhóm chuẩn đánh giá.
Kết quả báo cáo dạng điểm số.
Điểm số nói lên mức độ đạt các tiêu chí thành
quả ở mức nào. Kết quả báo cáo dạng đạt hay
không đạt ở mức nào.
Một PP xếp hạng nữa đó là xếp hạng dựa trên mức độ thành tích của học sinh liên
quan đến tiềm năng của họ. Với PP này, học sinh có tiềm năng cao hơn được trông chờ
làm công việc cao hơn và ngược lại. Cách tiếp cận này giúp vạch ra các mục tiêu hợp lý
dựa trên năng lực của học sinh. Nhưng nó làm cho học sinh và phụ huynh lúng túng vì
các điểm xếp hạng không thể xem là liên quan trực tiếp đến các thành tích thực tế ở lớp.

Bên cạnh đó một khó khăn đặt ra là việc đo lường tiềm năng của học sinh. Hơn nữa lâu
nay chúng ta đã quá quen với cách đánh giá dựa trên tính "bình đẳng" của học sinh.
Một công cụ hữu hiệu cho PP đánh giá xếp hạng này là các mô hình đo lường dựa
trên IRT (Item Response Theory - Lý thuyết ứng đáp câu hỏi).
IRT xây dựng các mô hình toán để xử lý dữ liệu dựa trên việc nghiên cứu mọi cặp
tương tác nguyên tố “thí sinh – câu hỏi” khi triển khai một bài thi TNKQ. Mỗi thí sinh
đứng trước một câu hỏi sẽ ứng đáp như thế nào, điều đó phụ thuộc vào năng lực tiềm ẩn
của thí sinh và các đặc trưng của câu hỏi.
Hiện nay có 3 mô hình toán phổ biến nhất trong IRT: mô hình 1 tham số (mô hình
Rasch) chỉ xét đến độ khó của câu hỏi, mô hình 2 tham số có xét đến độ phân biệt của câu
hỏi, và mô hình 3 tham số xét thêm mức độ đoán mò của thí sinh khi trả lời câu hỏi.
Theo cách phân tích thống kê thì độ khó, độ phân biệt của các câu hỏi tính được sẽ
phụ thuộc vào mẫu thí sinh được chọn để thử nghiệm và năng lực xác định được của thí
sinh phụ thuộc vào đề trắc nghiệm mà thí sinh làm.
Với IRT là các tham số đặc trưng của câu hỏi (như độ khó, độ phân biệt, mức độ
đoán mò) không phụ thuộc mẫu thử để định cỡ câu hỏi (sample-free), và năng lực đo
được của thí sinh không phụ thuộc vào bài trắc nghiệm cụ thể (item-free) được lấy từ
ngân hàng câu hỏi đã được định cỡ.
Như vậy, theo IRT, mỗi câu hỏi có các thuộc tính đặc trưng cho nó, và mỗi thí sinh
ở một trình độ nào đó có một năng lực tiềm ẩn xác định, các thuộc tính và đặc trưng này
không phụ thuộc vào phép đo, hoặc nói cách khác, chúng là các bất biến (invariance).
Cũng tương tự như trong phép đo độ dài: mỗi cái thước dùng để đo có kích thước và
kiểu khắc độ xác định, mỗi vật để đo có chiều dài xác định, phép đo là sự so sánh cái

×