Tải bản đầy đủ (.doc) (13 trang)

Thiết kế, tổ chức thi và giám sát

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (317.88 KB, 13 trang )

Cải thiện Thiết kế, Phát triển và Giám sát các Bài kiểm tra
Anthony J. Nitko, Ph.D.
Chuyên gia đánh giá chất lượng học tập
Dự án phát triển THCSII
Giới thiệu
Các tỉnh tự biên soạn đề thi và tổ chức các kỳ thi cho các trường THCS trong phạm vi của tỉnh một cách độc lập.
Đề thi và tiêu chí thi sẽ được xây dựng theo các chuẩn chương trình khác nhau giữa các tỉnh vì vậy không thể so sánh
được kết quả các kỳ thi và tiêu chí tốt nghiệp của các tỉnh với nhau. Khi điều này xảy ra, các tỉnh khác nhau sẽ có các
tiêu chí xét duyệt tốt nghiệp THCS khác nhau.
Thiết kế , Tổ chức thi và Giám sát Considerations
Bảng yêu cầu chi tiết về bài kiểm tra (Specification grid)
Nên lập ra một bảng tiêu chí kiểm tra trước mỗi bài kiểm tra, đánh giá chất lượng học tập của học sinh, tạo cơ sở
phát triển các bài kiểm tra này. Đối với mỗi môn học sẽ có một bảng tiêu chí riêng biệt. Các bảng tiêu chí này cũng sẽ
được sử dụng vào việc giám sát chất lượng của các bài kiểm tra.
Bảng tiêu chí là một bảng “2 chiều” hay là một ma trận. Hình 1 là một ví dụ về Bảng tiêu chí cho các bài kiểm tra.
Các cột thể hiện cấp độ tư duy/mức độ nhận thức mà các bài kiểm tra sẽ đánh giá, dòng tiêu đề là nội dung kiến thức
chính về môn học sẽ được đánh giá. Phần tạo ra bởi sự giao nhau giữa các cột và các dòng được gọi là ô. Các ô đó thể
hiện nội dung (từ các dòng) và cấp độ tư duy/mức độ nhận thức (từ các cột) sẽ được đánh giá qua các bài kiểm tra.
Điều này có nghĩa, các nội dung kiến thức giống nhau sẽ được đánh giá thông qua các câu hỏi ở mức độ khác nhau của
kỹ năng tư duy. Tôi không biết rõ tiêu chí nào trong Bảng tiêu chí đang được áp dụng cho các bài kiểm tra tuy nhiên tôi
biết rằng một số địa phương đã áp dụng các tiêu chí đó.


Improving Examinations
Anthony J. Nitko

Hình 1. Ví dụ về Bảng yêu tiêu chỉ của một bài kiểm tra

Chủ đề
A. Nhớ và miêu tả nhân vật trong
các câu truyện ngắn.


B. Tóm tắt lại truyền ngắn bằng
ngôn ngữ của mình.
C. Tường thuật lại một truyện ngắn
với chủ đề một tình huống thực
tế của cá nhân.
D. Xác định các cách truyền đạt
cảm xúc, tâm trạng …của một
tác giả truyện ngắn tới người
đọc.
E. Phân tích chủ đề của một câu
chuyện ngắn để xác định được
điều mà các nhân vật mong
muốn thực hiện, so sánh sự
giống và khác nhau giữa các
truyện ngắn của các tác giả khác
nhau
F. Xây dựng tiêu chí đánh giá riêng
đối với đặc điểm và chất lượng
của các câu truyện ngắn.
TỔNG SỐ CÂU HỎI
TỔNG SỐ ĐIỂM
% ĐIỂM

Nhận biết
(Recognition
)
Câu 1, điểm=2
điểm =2

Thông hiểu

(Comprehensio
n)

Vận dụng: ở cấp
độ thấp hơn
(Reproduction)

Vận dụng: ở cấp
độ cao hơn
(Application)

Câu 3, điểm =4
Câu 4, điểm=5
Câu 5, điểm =5

Câu 6, điểm=8

Câu 7, điểm=8
2
4
12%

1
4
12%

2
10
29%


2
16
47%


Improving Examinations
Anthony J. Nitko

Việc tạo ra một bảng tiêu chí và thông qua chúng trước khi biên soạn các câu hỏi trong đề kiểm tra là một hoạt
động quan trọng của các cán bộ ra đề. Bảng tiêu chí là một kế hoạch cho các bài kiểm tra. Nó chỉ ra số lượng các câu
hỏi được đánh giá trong mỗi nội dung kiến thức, cấp độ tư duy và sự kết hợp giữa các nội dung kiến thức và cấp độ tư
duy đó.
Bảng chi tiết các kỹ năng tư duy/mức độ nhận thức sau đây có thể được sử dụng do tính phù hợp của chúng đối
với chương trình giáo dục THCS mới. Bảng tiêu chí mẫu vận dụng các kỹ năng này.
Hình 2. Mô tả cấp độ tư duy/nhận thức
Nhận biết – Học sinh nhớ các khái niệm cơ bản của môn học, có thể nêu lên hoặc nhận ra chúng khi được yêu cầu.
Thông hiểu – Học sinh hiểu các khái niệm cơ bản của môn học và có thể vận dụng chúng khi chúng được thể hiện
theo các cách tương tự như cách giáo viên đã giảng dạy hoặc, hoặc theo các ví dụ tiêu biểu về các khái niệm đó.
Vận dụng ở cấp độ thấp hơn – Học sinh có thể hiểu được khái niệm ở một cấp độ cao “thông hiểu”, tạo ra được sự
liên kết logic giữa các khái niệm cơ bản của môn học và có thể vận dụng chúng để tổ chức lại các thông tin đã được
trình bày giống với bài giảng của giáo viên hoặc sách giáo khoa.
Vận dụng ở cấp độ cao hơn –Học sinh có thể sử dụng các khái niệm về môn học-chủ đề để giải quyết các vấn đề
mới, không giống với những điều đã được học hoặc trình bày trong sách giáo khoa nhưng phù hợp khi được giải
quyết với kỹ năng và kiến thức được giảng dạy ở mức độ nhận thức này. Đây là những vấn đề giống với các tình
huống học sinh sẽ gặp phải ngoài xã hội.
Các cấp độ tư duy/nhận thức nêu trên có thể được chỉnh sửa để phù hợp hơn với các nội dung chương trình. Hơn
nữa, không phải tất cả các nội dung giảng dạy sẽ được đánh giá theo tất cả cấp độ nhận thức nêu trên. Tuy nhiên, mỗi
bài kiểm tra của mỗi môn học nên được đánh giá theo một vài cấp độ nhất định. (Hai cấp độ suy nghĩ đơn giản là: Nhận
biết và Thông hiểu các kiến thức đã được truyền đạt).
Cần lưu ý rằng, cấp độ tư duy cuối cùng trong bảng Mô tả trên hàm ý về các yêu cầu đánh giá “thực hiện”. Trong yêu

cầu về đánh giá “thực hiện”, học sinh phải tiến hành một hoạt động nhằm tạo ra sản phẩm để chứng minh với giám thị


Improving Examinations
Anthony J. Nitko

cách thức áp dụng quy trình của học sinh là hoàn toàn đúng. Một tiêu chí chấm điểm xác thực, được gọi là một “đề mục
điểm” được sử dụng để chấm điểm việc tiến hành hoạt động của học sinh. Một “đề mục điểm” thường tập trung vào cả
chất lượng của sản phẩm và tính chính xác của quy trình tạo ra sản phẩm.
Đánh giá thông qua các hoạt động phù hợp với mục tiêu chương trình mới-chương trình lấy học sinh làm trung tâm,
khuyến khích học sinh vận dụng các kiến thức đã lĩnh hội được để giải quyết các khó khăn trong cuộc sống.
% điểm (điểm số, câu hỏi) trong bất kỳ một bài kiểm tra nào gắn với mỗi cấp độ tư duy là một vấn đề chính sách.
Không có một tiêu chí khoa học nào được áp dụng hạn chế vào việc xác định % của bài kiểm tra bao gồm các kỹ năng
này. Thực hành, tuy nhiên, chiếm gần 20% của bài kiểm tra về kỹ năng tư duy ở cấp độ cao.
Sử dụng các câu hỏi đánh giá tư duy ở cấp độ cao hơn
Khi các bài thi của giáo viên và các bài kiểm tra của tỉnh không đánh giá kỹ năng tư duy ở cấp độ cao hơn sẽ tạo
ra ảnh hưởng tiêu cực tới việc thực hiện đổi mới chương trình và triển khai chương trình mới. Các dạng câu hỏi đơn giản
thường dễ dàng biên soạn và cũng cho điểm. Chúng sẽ giảm thời gian và công sức cho việc phát triển đánh giá tuy
nhiên lại đòi hỏi chi phí cao. Các dạng câu hỏi trắn nghiệm “đúng-sai”, trắc nghiệm điền khuyết, trắc nghiệm đối chiếu
cặp đôi chỉ đánh giá được các kỹ năng tư duy ở mức độ đơn giản mà không đánh giá được các kỹ năng tư duy phức
tạp, kỹ năng giải quyết vấn đề, kỹ năng vận dụng, và kỹ năng đánh giá. Nếu như học sinh không được đánh giá các kỹ
năng ở cấp độ cao hơn, bản thân chúng và ngay cả các giáo viên sẽ sớm nhận thấy rằng không cần phải giảng dạy và
học tập các kiến đó học vì chúng sẽ không được kiểm tra tới. Việc thực hành đánh giá không đầy đủ làm suy yếu việc
thực hiện và đổi mới chương trình-một lần nữa minh họa cho mức độ quan trọng của sự kết nối chặt chẽ giữa đánh giá
và nâng cao chất lượng trường THCS. Các bài kiểm tra phải thống nhất với mục tiêu và triết lý giáo dục.
Sử dụng các đề kiểm tra khách quan
Một vấn đề rất đáng quan tâm đó là các cán bộ ra đề thi cấp huyện, tỉnh thường đưa ra các câu hỏi thiếu căn cứ,
không chính xác hoặc không cần thiết có thể ảnh hưởng xấu tới việc đạt được các mục tiêu của chương trình mới. Qua
chuyến đi khảo sát thực tế tại địa phương, chúng tôi nhận thấy rằng:
o


Các cán bộ giáo dục có thẩm quyền không nêu rõ các cơ sở hợp lý của việc sử dụng các câu hỏi khách quan hoặc giải thích
các hạn chế của dạng câu hỏi khách quan này.

o

Các cán bộ ra đề không được tập huấn giám sát và thực hành về biên soạn các câu khách quan mà chỉ đơn giản là đọc tài
liệu và thảo luận sơ lược về các tài liệu này với các thành viên trong nhóm (phương pháp chủ đạo giúp cán bộ làm quen với


Improving Examinations
Anthony J. Nitko

các đề kiểm tra khách quan), vì vậy không thể đạt được mục tiêu của các câu hỏi khách quan có chất lượng cao. [Dự án
PTGD THCSII có kế hoạch cử một số cán bộ ra đề kiểm tra tham gia các khóa tập huấn chuyên môn tại nước ngoài].
o

Các cán bộ ra đề kiểm tra cần phải được thực hành giám sát nghiêm túc về soạn thảo các câu hỏi khách quan: Các câu hỏi
mà họ đưa ra phải được các chuyên gia có chuyên môn xem xét. Họ phải được thực hành về cách thức đánh giá chất lượng
các câu hỏi mà họ đưa ra, chỉnh sửa và bổ sung để có được các câu hỏi đáp ứng tiêu chuẩn. Hoạt động đánh giá của quốc tế
đã có các tiêu chuẩn rất nổi tiếng và được công nhận về biên soạn câu hỏi làm tiêu chí cho các giáo viên và cán bộ liên
quan dựa vào đó đánh giá chất lượng các câu hỏi mà họ đưa ra. [Dự án PTGD THCSII có kế hoạch cử một số cán bộ ra đề
kiểm tra tham gia các khóa tập huấn chuyên môn tại nước ngoài].

o

Rất nhiều cán bộ ra đề kiểm tra không nhận thức được rằng câu hỏi khách quan:
Không thực sự phù hợp để đánh giá kết quả học tập của học sinh đã được thể-yếu tố thể hiện rõ ràng về chương trình mới
như kỹ năng chiến lược, kỹ năng học tập, kỹ năng giải quyết vấn đề, kỹ năng đánh giá và kỹ năng áp dụng kiến thức được
học vào thực tế cuộc sống.

 Sẽ làm giảm đi tính hợp lệ của đánh giá khi được sử dụng không hợp lý hoặc có thể dẫn tới các quyết định sai lầm về kết
quả học tập của học sinh khi sử dụng thông tin từ các câu hỏi này.
 Đòi hỏi kỹ năng ra đề ở mức độ cao trước khi đề kiểm tra được chính thức sử dụng.
Sử dụng các quy trình kỹ thuật để tinh chế và chon lọc các Đề kiểm tra

Sử dụng chuẩn (standards) soạn thảo đề kiểm tra
Các trung tâm khảo thí ở hầu hết các nước trên thế giới sử dụng kỹ thuật phân tích đề kiểm tra để nâng cao chất
lượng của các bài kiểm tra. Có 2 cấp độ phân tích đề kiểm tra: Thẩm định (judgmental) và thống kê (statistical). Phân
tích thẩm định nhằm nâng cao chất lượng phương pháp ra đề kiểm tra. Các tiêu chuẩn được thế giới công nhận tồn tại
với mục đích xem xét các câu hỏi trước khi đưa chúng vào đề kiểm tra. Các câu hỏi không đáp ứng được các tiêu chuẩn
này sẽ bị loại hoặc được chỉnh sửa cho tới khi chúng đáp ứng được các tiêu chuẩn đó. Trong chuyến đi khảo sát thực tế,
tôi thấy rằng các cán bộ ra đề thi của tỉnh không nhận thức được hoặc không sử dụng các tiêu chuẩn này.
Hình 3 là một ví dụ về các tiêu chí của đề kiểm tra với loại câu hỏi có nhiều lựa chọn.


Improving Examinations
Anthony J. Nitko

Hình 3. Những vấn đề cần lưu ý về chất lượng của loại đề kiểm tra với câu hỏi có nhiều lựa chọn.
Đặt ra các câu hỏi này đối với mỗi đề kiểm tra mà bạn biên soạn. Nếu câu trả lời là “không” đối với 1 hoặc nhiều câu hỏi, hãy xem
xét đề kiểm tra.
1. Đề kiểm tra có đánh giá những nội dung quan trọng của mục tiêu chương trình giảng dạy?
2. Câu hỏi có phù hợp với tiêu chí đề kiểm tra về phương diện yêu cầu thực hiện, nội dung cần nhấn mạnh và số điểm cho từng câu
hỏi hay không?
3. Đề kiểm tra có đưa ra những câu hỏi trực tiếp hay đặt ra các vấn đề cụ thể?
4. Các câu hỏi được đưa ra có dựa trên các lời diễn giải hơn là chỉ đơn thuần trích dẫn các từ ngữ/câu trong sách Giáo khoa hay
không?
5. Cách diễn đạt và cấu trúc của câu hỏi có đơn giản dễ hiểu hay không?
6. Câu trả lời sai trong các lựa chọn có được diễn đạt hợp lý để ngay cả học sinh trung bình cũng không nhận thấy lựa chọn này vô
lý rõ ràng hay không?

7. Mỗi lựa chọn sai dựa trên lỗi thông thường học sinh hay mắc phải hoặc dựa trên nhận thức/quan niệm sai?
8. Lựa chọn đúng của một câu hỏi có có độc lập với lựa chọn đúng của các câu hỏi khác hay không?
9. Tất cả các lựa chọn có đồng nhất và phù hợp với nội dung của câu hỏi hay không?
10. Người ra đề đã cố gắng hạn chế sử dụng câu trả lời “tất cả các câu đều đúng” hay “không có câu nào đúng” hay chưa?
11. Đề kiểm tra có đánh giá những nội dung quan trọng của mục tiêu chương trình giảng dạy?
Nguồn: Adapted from Teacher’s Guide to Better Classroom Testing: A Judgmental Approach (p.35) by A. J. Nitko and T-C Hsu,
1987, Pittsburgh, PA: Institute for Practice and Research in Education, School of Education, University of Pittsburgh. Adapted by
Permission.
Hình 4: Những vấn đề cần lưu ý khi soạn các câu hỏi tự luận
Hình 4. Những vấn đề cần lưu ý về chất lượng của loại đề về câu hỏi tự luận
Đặt ra các câu hỏi này đối với mỗi đề kiểm tra mà bạn biên soạn. Nếu câu trả lời “không” đối với một hoặc nhiều câu
hỏi, hãy xem lại đề kiểm tra.
1. Câu hỏi có đánh giá những nội dung quan trọng của mục tiêu chương trình giảng dạy (kiến thức, kỹ năng…)?
2. Câu hỏi có phù hợp với tiêu chí đề kiểm tra về phương diện yêu cầu thực hiện, nội dung cần nhấn mạnh và số điểm
cho từng câu hỏi hay không?
3. Bài luận có đòi hỏi học sinh phải vận dụng kiến thức vào một tình huống mới hay hoặc một tình huống giả định nào


Improving Examinations
Anthony J. Nitko

đó hay không?
4. Xét trong mối quan hệ với các câu hỏi khác của bài kiểm tra, câu hỏi tự luận có thể hiện nội dung và cấp độ tư duy đã
nêu rõ trong tiêu chí kiểm tra hay không?
5. Nội dung câu hỏi có cụ thể không? Trong câu hỏi có nêu rõ yêu cầu và hướng dẫn cụ thể hơn là ra một đề bài quá
rộng để bất cứ câu trả lời nào cũng có thể đáp ứng được?
6. Yêu cầu của câu hỏi có nằm trong phạm vi kiến thức và nhận thức phù hợp của học sinh hay không?
7. Để đạt điểm cao, học sinh có đòi hỏi phải thể hiện quan điểm của mình hơn là chỉ nhờ lại các khái niệm, thông tin, ý
kiến…đã đọc hay không?
8. Câu hỏi có được diễn đạt để học sinh dễ hiểu và không bị lạc đề hay không?

9. Câu hỏi có được diễn đạt để học sinh hiểu được yêu cầu về: :
Số lượng từ/độ dài của bài luận?
Mục đích của bài luận?
Thời gian để viết bài luận?
Tiêu chí đánh giá câu trả lời?
10. Nếu câu hỏi yêu cầu học sinh cần nêu ý kiến và chứng minh cho quan điểm của mình về một vấn đề đang gây tranh
cãi nào đó, câu hỏi có nêu rõ rằng bài làm của học sinh sẽ được đánh giá dựa trên những lập luận logic hợp lý cho
quan điểm của mình thay vì học sinh sẽ chọn theo quan điểm nào?
Source: Nitko, A.J. (2004). Educational Assessment of Students (4th edition). Upper Saddle River, NJ: PrenticeHall/Merrill Education.

Hình 5: Lưu ý khi soạn đề kiểm tra với yêu cầu thực hiện
1.
2.
3.
4.

Đề kiểm tra có đánh giá những nội dung quan trọng của mục tiêu chương trình giảng dạy?
Câu hỏi có phù hợp với tiêu chí đề kiểm tra về phương diện yêu cầu thực hiện, nội dung cần nhấn mạnh và số điểm
cho từng câu hỏi hay không?
Nhiệm vụ đặt ra có thực sự yêu cầu học sinh phải thực hiện một việc ví đó chứ không đơn thuần là viết về cách
thực hiện công việc đó hay chỉ đơn giản là sao chép các thông tin?
Các học sinh có đủ thời gian để hoàn thành các yêu câu theo điều kiện cụ thể mà anh/chị đưa ra?


Improving Examinations
Anthony J. Nitko

5.

Nếu đây là một câu hỏi mở, từ ngữ và hướng dẫn trong yêu cầu của anh/chị có truyền đạt chính xác và đầy đủ tới

học sinh rằng các em có thể sử dụng các cách thức khác nhau để thực hiện công việc, không chỉ có một đáp án
đúng đối với câu hỏi này?

6.

Nếu nhiệm vụ mang tính thực tế, anh chị có trình bày về một tính huống mà với khả năng nhận thức của mình, các
em học sinh có thể nhận ra đây là một tình huống thực trong cuộc sống?

7.

Nếu yêu cầu đòi hỏi phải được thực hiện dựa trên các nguồn trong và ngoài lớp học, tất cả học sinh đều có cơ hội
công bằng để tiếp cận với các nguồn mà các em mong muốn?

8.

Hướng dẫn hay từ ngữ anh/chị sử dụng có:
a.
b.

9.

Xác định yêu cầu phù hợp với trình độ nhận thức của học sinh?
Hướng các em học sinh, cả học sinh dân tộc thiểu số và học sinh từ các nền văn hóa khác nhau, thực hiện yêu
cầu theo cách mà anh/chị mong muốn?
c.
Làm sáng tỏ mục đích và mục tiêu của nhiệm vụ/yêu cầu?
d.
Nêu rõ độ dài và mức độ chi tiết của câu trả lời?
e.
Nêu rõ cơ sở của việc đánh giá các câu trả lời?

Các bản vẽ, đồ thị, biểu đồ, tài liệu có được vẽ một các rõ ràng phù hợp với việc thực hiện các yêu cầu?

10. Nếu học sinh không có khả năng tham gia các kỳ thi/kiểm tra? Anh/chị có thay đổi để nhiệm vụ đó phù hợp với
nhu cầu của các em?
Nguồn: Nitko, A. J. (2004). Educational Assessment of Students (4th edition). Upper saddle River, NJ: PrenticeHall/Merrill Education.
Các cán bộ ra đề nên sử dụng những tiêu chí như trên để đánh giá chất lượng của mỗi câu hỏi thuộc các dạng khác
nhau.
Phân tích số liệu để nâng cao chất lượng các đề kiểm tra
Phân tích số liệu (thống kê) đề thi cần được sử dụng liên tục để đánh giá chất lượng các bài kiểm tra.
Một hình hình thức phân tích của câu hỏi có nhiều lựa chọn được gọi là phân tích “khả năng”, “câu


ImprovingExaminations
AnthonyJ.Nitko

nhiu, cõu sai. Cỏc kh nng ca cõu hi la chn l cỏc la chn t ú hc sinh cú th tỡm ra cõu tr
li. Mt kh nng s l cõu tr li ỳng cũn cỏc kh nng cũn li l sai hoc cõu nhiu.
tin hnh c cỏc phõn tớch ny, cỏc cõu hi phi c th nghim vi mt nhúm hc sinh mu.
Sau khi kt thỳc th nghim, cỏn b ra kim tra s thc hin cỏc cụng vic sau õy:
(1) Ghi l c la chn v im s ca hc sinh
(2) Hc sinh c sp loi da trờn im s t mc cao nht n mc thp nht.
(3) Sau ú, hc sinh c phõn thnh 02 nhúm: Nhúm cú im s cao hn v nhúm cú im s thp hn.
(4) Sau ú i vi mi cõu hi v mi kh nng, mt hc sinh s m s lng cỏc hc sinh thuc nhúm
cao hn chn la mi kh nng mi cỏc cõu hi.
(5) Thc hin tng t i vi nhúm hc sinh cú im s thp hn. (6) Cui cựng, vi mi cõu hi, so sỏnh
la chn cỏc kh nng ca nhúm im cao v nhúm im thp
Mụ hỡnh tt: Vớ d 1 di õy th hin
Vớ d 1: l mt vớ d v cõu hi cú cht lng
vỡ tt c cỏc ỏp ỏn khụng chớnh xỏc (A, C v D)
u c ớt nht mt hc sinh thuc nhúm im

thp la chn, khụng cú hc sinh no thuc nhúm
im cao la chn cỏc cõu nhiu.
Mô hình kém: Phơng án lựa chọn kém chất lợng

Vớ d 1
Vớ d v d liu phõn tớch cõu hi th hin ú l
cõu hi cú cht lng

Cỏc ỏp ỏn
A
*B
C
D

Nhúm im cao Nhúm im
thp
0
30
0
0

3
21
3
3

Nếu nh không có học sinh nào thuộc nhóm dới
lựa chọn một phơng án nhiễu cụ thể nào đó, thì
phơng án nhiễu đó có thể là có chất lợng kém. Ví dụ 2 là mô hình câu trả lời cho thấy rằng phơng án
nhiễu B có thể là phơng án nhiễu kém.

.


ImprovingExaminations
AnthonyJ.Nitko

Ví dụ 2
Ví dụ mô hình phân tích câu trả lời
cho thấy phơng án B cần phảI đợc xem
xét lai vì có thể phơng án đó có chất lợng kém.

Phơng
án

Nhóm trên

*A
B
C
D

Nhóm dới

30
0
0
0

21
0

6
3

Câu trắc nghiệm này cần đợc xem lại và cần xác định tại sao điều này lại xảy ra. Có thể phơng án đó
có một sai sót kỹ thuật đợc mô tả trong bảng 1 mà bạn đã sử dụng trong hoạt động nhóm xem xét đánh
giá. Nếu tất cả hoặc gần nh tất cả học sinh nhận thấy một phơng án cụ thể nào đó rõ ràng là sai thì
ngời biên soạn đề thi sẽ cần phải (a) loại luôn phơng án đó (nh vậy sẽ giảm số phơng án lựa chọn trong
câu), (b) thay phơng án đó bằng một phơng án hoàn toàn mới hoặc (c) sửa lại phơng án đó.
Mô hình kém : Phơng án trả lời mơ hồ

Ví dụ 3
Ví dụ một mô hình câu trả lời của nhóm trên thể
hiện phơng án trả lời không rõ ràng

Thành phố Pittsburgh,
Pennsylvania ở gần sông
nào?
A
B
C
D

Sông
Sông
Sông
Sông

Delaware
Ohio
Monongahela

Susquehanna

Nhóm
trên

Nhóm
dới

0
15
12
3

9
9
3
9

không rõ ràng
Nếu học sinh nhóm trên không thể phân
biệt phơng án đúng với các phơng án còn lại
thì có thể phơng án đó không rõ ràng
hoặc khó hiểu (những câu trắc nghiệm
khó hiểu không có giá trị và dẫn đến đề
thi kém chất lợng). Mô hình thể hiện sự


ImprovingExaminations
AnthonyJ.Nitko


không rõ ràng của câu hỏi là mô hình trong đó nhóm trên có xu hớng lựa chọn phơng án sai với tần xuất
tơng đơng với phơng án đúng. Ví dụ 3 minh hoạ mô hình câu trả lời mơ hồ không rõ ràng này. .
Sông Allegheny hợp nhất với sông Monongahela thành sông Ohio River ở Pittsburgh. Trong ví dụ,
nhóm trên chọn B và C với tần xuất tơng đơng nhau, nh vậy phản ánh sự bối rối của học sinh trong việc
lựa chọn chỉ một trong hai phơng án làm câu trả lời. Câu hỏi này cần phải soạn lại để chỉ một câu trả
lời là rõ ràng đúng.
Thông thờng câu trả lời của nhóm dới đợc chia thành hai hoặc hơn hai phơng án. Điều này thờng
không phảI hàm ý rằng câu này cần phảI biên soạn lại. Mà điều này th ờng có nghĩa là học sinh với kiến
thức kém hơn sẽ thấy nhiều phơng án hợp lý nh nhau và vì vậy câu hỏi đó trở nên không rõ ràng đối với
họ. Nguyên nhân của sự bối rối của những học sinh này chỉ là do kiến thức của họ không đầy đủ.
Mô hình kém: Câu hỏi có đáp án sai
Những ngời biên soạn đề có thể nhận thấy một câu hỏi có đáp án sai nếu một số lợng lớn học sinh
chọn một phơng án sai cụ thể nào đó. Khi điều này xảy ra, phảI kiểm tra để đảm bảo rằng đáp án đ a
ra là đúng. Ví dụ 4 cho thấy loại lỗi này của ngời biên soạn đề.


ImprovingExaminations
AnthonyJ.Nitko

Trong ví dụ 4, James Madison, phơng án C, là câu trả lời đúng nhng ngời biên soạn đề lại tình cờ dùng D
làm đáp án. Mô hình câu trả lời trong ví dụ là điển hình của loại lỗi này. Ngời biên soạn đề cần chữa
Ví dụ 4
Ví dụ về mô hình câu trả lời của nhóm trên cho
thấy một câu hỏi có thể có đáp án sai

Ai là tổng thống thứ t của
Hoa Kỳ?

A John Quincy Adams
B Thomas Jefferson

Madison
đáp án cho câu hỏi này và chấm lại tất CcảJames
các bài
thi.

Nhóm

điểm
số cao

Nhóm

điểm
số
thấp

0
3
27

3
2
3

Mô hình kém: Có thể đoán ngẫu nhiên

Mô hình câu trả lời của nhóm trên có thể cung cấp bằng chứng chứng tỏ rằng học sinh đang đoán
một cách ngẫu nhiên. Nếu mô hình cho thấy rằng nhiều phơng án có vẻ hợp lý đối với học sinh nhóm trên,
điều này có thể chứng tỏ rằng học sinh đang đoán ngẫu nhiên.Nếu học sinh nhóm trên đoán ngẫu
nhiên, thì mỗi phơng án có xu hớng đợc chọn với tần xuất xấp xỉ bằng nhau. Ví dụ 5 minh hoạ mô hình

câu trả lời này.


ImprovingExaminations
AnthonyJ.Nitko

Ví dụ 5
Ví dụ mô hình câu trả lời của nhóm trên cho
thấy việc dự đoán ngẫu nhiên hoặc sự phân vân của học sinh

Hoa kỳ tham gia chiến tranh
thế giới thứ hai vào năm nào?
A
B
C
*D

1913
1915
1916
1917

Nhóm có
điểm số
cao

Nhóm có
điểm số thấp

7

7
8
8

9
6
9
6

Ngời biên soạn đề cần xem xét mô hình câu trả lời của nhóm trên chứ không phảI nhóm d ới để
tìm những câu mà học sinh đang dự đoán ngẫu nhiên. Dự đoán ngẫu nhiên của những học sinh khá
nhất có thể là dấu hiệu sự phân vân về đề bài của học sinh. Học sinh có số điểm thấp có thể cũng dự
đoán ngẫu nhiên nhng điều đó chỉ chứng tỏ rằng cần phảI dạy lại những học sinh này hơn là soạn lại
câu hỏi. Việc dự đoán ngẫu nhiên làm tăng thêm lỗi đo đạc vào điểm số và nh vậy làm giảm giá trị và
độ tin cậy của đề thi.



×