Tải bản đầy đủ (.doc) (99 trang)

XÂY DỰNG , THỬ NGHIỆM ĐỀ THI BAO GỒM CÁC CÂU HỎI TRẮC NGHIỆM VÀ TỰ LUẬN MÔN TOÁN LỚP 8 VÀ PHÂN TÍCH THEO MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.98 MB, 99 trang )


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THĂNG LONG
---------------------------------------

Họ và tên học viên:
Nguyễn Thị Phương Thư

XÂY DỰNG , THỬ NGHIỆM ĐỀ THI BAO GỒM CÁC CÂU
HỎI TRẮC NGHIỆM VÀ TỰ LUẬN MÔN TOÁN LỚP 8 VÀ
PHÂN TÍCH THEO MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN

LUẬN VĂN THẠC SĨ TOÁN HỌC

Hà Nội – Năm 2015
1


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC THĂNG LONG
---------------------------------------

Họ và tên học viên:
Nguyễn Thị Phương Thư

XÂY DỰNG , THỬ NGHIỆM ĐỀ THI BAO GỒM CÁC CÂU
HỎI TRẮC NGHIỆM VÀ TỰ LUẬN MÔN TOÁN LỚP 8 VÀ
PHÂN TÍCH THEO MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN

LUẬN VĂN THẠC SĨ TOÁN HỌC
CHUYÊN NGÀNH : PHƯƠNG PHÁP TOÁN SƠ CẤP


MÃ SỐ: 60460113
NGƯỜI HƯỚNG DẪN KHOA HỌC :
GS.TSKH Lâm Quang Thiệp

Hà Nội – Năm 2015
2

Thang Long University Libraty


5. Kết quả thí sinh làm đề chính thức
…………………………...
MỤC
LỤC
NỘI DUNG

96
TRANG

Mở đầu ………………………………………………………

5

Chương 1: Tổng quan về các phương pháp đo lường trong giáo
dục và mô hình định giá từng phần ………………………………..

6

I. Các loại phương pháp đo lường trong giáo dục……………….


6

II. Mô hình định giá từng phần ………………………………….

25

Chương 2: Xây dựng và triển khai một đánh giá tiêu chuẩn hóa..

30

1. Hai loại hình đánh giá cơ bản trong hệ thống giáo dục……….

30

2. Đánh giá trong tiến trình và đánh giá tổng kết….…………….

31

3.Các công đoạn xây dựng và triển khai đánh giá tiêu chuẩn hóa

32

Chương 3: Thực hành đánh giá môn toán học kỳ 1 lớp 8 bằng đề
kiểm tra hỗn hợp trắc nghiệm và tự luận. ……

37

1. Giới thiệu chương trình toán lớp 8 …………………………...

37


2. Đánh giá thí sinh ……………………………………………...

38

3. Xây dựng bảng đặc trưng câu hỏi cho đề kiểm tra dự kiến bao
gồm câu hỏi tự luận và trắc nghiệm ………………………………….

38

4. Thử nghiệm đề kiểm tra dự kiến ……………………………...

44

5. Xây dựng đề kiểm tra chính thức ……………………………..

48

Kết luận và khuyến nghị ……………………………………………

63

Tài liệu tham khảo ………………………………………………….

64

Phụ lục ……………………………………………………………….

65


1.Đề kiểm tra môn toán học kỳ 1 lớp 8 năm học 2014-2015(Dự
kiến)…………………………………………………………………..

65

2.Đề kiểm tra môn toán học kỳ 1 lớp 8 năm học 2014-2015
(Chính thức) ………………………………………………………….

70

3. Dữ liệu kết quả làm bài của thí sinh với đề chính thức ………

75

4. Kết quả phân tích câu hỏi của đề chính thức …………………

81

43

Thang Long University Libraty



LUẬN VĂN THẠC SĨ

MỞ ĐẦU
1. Lý do chọn đề tài
Khi thực hiện các đánh giá trong giáo dục, hiện nay người ta thường tách
biệt phương pháp trắc nghiệm với phương pháp tự luận. Tuy nhiên quá trình phát

triển lý luận làm cho hai phương pháp hội tụ vào nhau: có thể xem trắc nghiệm
(nhị phân) là trường hợp riêng của tự luận (đa phân). Mô hình định giá từng phần
(partial credit model - PCM) giúp phân tích kết hợp trắc nghiệm với tự luận.
Chính vì những lý do trên mà em chọn đề tài "Xây dựng, thử nghiệm đề
thi bao gồm các câu hỏi trắc nghiệm và tự luận môn Toán lớp 8 và phân tích
theo mô hình định giá từng phần (PCM)", nhằm áp dụng PCM vào thực tế
giảng dạy.
2. Mục đích nghiên cứu: Thử nghiệm kiểm tra , đánh giá được trình độ
của học sinh , đo được năng lực tiềm ẩn đơn chiều của học sinh bằng đề kiểm tra
bao gồm các câu hỏi nhị phân và các câu hỏi tự luận có kiểu ứng đáp đa phân.
3. Đối tượng và phạm vi nghiên cứu: Học sinh khối lớp 8 trường THCS
Lê Chân – Quận Lê Chân – Thành phố Hải Phòng . Học sinh được làm đề kiểm
tra đánh giá môn Toán lớp 8 học kỳ 1 năm học 2014-2015.
4. Phương pháp nghiên cứu:
- Nghiên cứu tài liệu để hiểu các vấn đề liên quan phương pháp đo lường
và đánh giá được sử dụng.
- Xây dựng công cụ để đo lường năng lực toán học của học sinh lớp 8 theo
một quy trình công nghệ tiêu chuẩn hóa.
- Đo lường năng lực của học sinh bằng công cụ được soạn thảo và phân
tích kết quả bằng một phần mềm chuyên dụng.
5


Chương 1
TỔNG QUAN
VỀ CÁC PHƯƠNG PHÁP ĐO LƯỜNG TRONG GIÁO DỤC
VÀ MÔ HÌNH ĐỊNH GIÁ TỪNG PHẦN
Từ buổi sơ khai của lịch sử loài người, trong quá trình lao động và giao
tiếp, con người đã phải thực hiện các phép đo lường. Đo lường là phép so sánh
một đại lượng nào đó với một vật chuẩn đã biết, và kết quả là đưa ra các con số

để đánh giá. Khi khoa học còn sơ khai thì phép đo cũng thô thiển. Với sự phát
triển của một khoa học nào đó, độ chính xác của phép đo trong khoa học ấy cũng
ngày càng được nâng cao. Trong giáo dục cũng vậy, việc đánh giá học sinh phải
được thực hiện một cách chính xác, đánh giá đúng năng lực học sinh.
Sau đây là tổng quan một số phương pháp đánh giá thường dùng trong giáo
dục.
I. CÁC LOẠI PHƯƠNG PHÁP ĐO LƯỜNG TRONG GIÁO DỤC
Ngày nay người ta thường phân chia các phương pháp đo lường trong giáo
dục thành 4 nhóm: đánh giá kiểu lựa chọn trả lời (selected response assessment),
đánh giá bằng bài viết đủ dài (extended-written response assessment), đánh giá
bằng thực hành (performance assessment) và đánh giá qua giao tiếp (personal
communication assessment). Sau đây chỉ trình bày hai nhóm phương pháp đầu là
các phương pháp có liên quan đến luận văn.
1. Phương pháp đánh giá kiểu lựa chọn trả lời (trắc nghiệm khách quan)
1.1 Các dạng câu hỏi trắc nghiệm khách quan
Trong nhóm trắc nghiệm khách quan có 5 dạng câu hỏi chính:
a. Câu nhiều lựa chọn:
Câu nhiều lựa chọn đưa ra một nhận định và một số phương án trả lời, thí
sinh phải chọn để đánh dấu vào một phương án đúng hoặc phương án tốt nhất.
Câu trắc nghiệm nhiều lựa chọn có hai phần, phần đầu được gọi là câu dẫn, nêu
6

Thang Long University Libraty


vẫn đề,Hai
cung
loại
cấp
điền

thông
khuyết
tin cần
và trả
thiết
lờihoặc
ngắnnêu
được
một
ghép
câu với
hỏi;nhau
phầnvìsau
chúng
là các
cùng là
phương
câu
hỏi mở,
án chọn,
nhưng
thường
được trả
được
lờiđánh
bằngdấu
mộtbằng
từ hoặc
các cụm
chữ cái

từ rất
A, ngắn,
B, C, chỉ
D,..thể
hoặc
hiện
các
chữ số
một
ý nào
1, 2,đó3,chứ
4, ....
không
Kiểucó
câu
cấu
hỏitrúc
nhiều
bố cục
lựa chọn
như bài
đơntựgiản
luận.nhất
Loại
quy
câuđịnh
hỏi trong
này có
các được
thể

phương
quan
án niệm
chọn như
chỉ có
phần
mộtgiao
phương
nhauán
giữa
đúng
trắcduy
nghiệm
nhất hoặc
kháchmột
quan
phương
và tự luận.
án
đúng nhất;
e. Câu
cácthíphương
sinh tựán
tạokhác
đáp gọi
án là phương án nhiễu, được đưa vào để gây
nhiễu đối
Là loại
với những
câu hỏithí

cósinh
đáp không
án bằng
nắm
số chắc
mà trắc
vấnnghiệm
đề.
SAT cải tiến mới đưa
b. Câu
vào
vàođúng/
năm 2005
sai để giảm bớt sự lệ thuộc của thí sinh vào cái khung trả lời định
sẵn. Thí
Câu
sinh
đúng/
có thể
saitôđưa
giáratrịmột
trả nhận
lời bằng
định,
số thí
vàosinh
phiếu
phải
trảlựa
lờichọn

có dạng
mộtthức
trongxác
hai
phương
định,
do án
đótrả
có lời
thểđể
chấm
khẳng
bằng
định
máy.
nhận định đó là đúng hay sai, hoặc có hay
không.
dàng
thấy rằng
khi một
người
hoàn
toàn
khôngkhách
có hiểu
biết chỉ đánh
1.2.
KhiDễ
nào
thì đánh

giá bằng
phương
pháp
trắc
nghiệm
quan?
dấu húMức
họa để
mục
trảtiêu
lời một
học tập
câucụ
hỏithể
nhiều
phù lựa
hợpchọn
nhấtvới
để đánh
n phương
giá bằng
án trả
phương
lời thì pháp
xác
trắc nghiệm khách quan là mức làm 1chủ kiến thức, và sau đó là trình độ suy luận.
suất để làm đúng câu hỏi đó là
; còn để trả lời một câu hỏi đúng/sai thì xác suất
Phương pháp trắc nghiệm khách quan có thể sử dụng rất tốt để đánh giá một
n

để làm đúng là 50%.
lượng yếu tố kiến thức lớn phân tán và phủ kín cả các mục tiêu học tập cần đánh
c. Câu ghép đôi
giá. Phương pháp này cũng cho phép đánh giá kiểu suy luận hoàn toàn tự do, vì
Câu ghép đôi đòi hỏi thí sinh phải ghép một dòng ở cột bên trái với một
dù sao việc trả lời các câu hỏi trắc nghiệm khách quan cũng được giới hạn trong
dòng ở cột bên phải sao cho phù hợp theo một yêu cầu nào đó. Như vậy câu ghép
các khung định sẵn.
đôi gồm 3 phần: phần nêu yêu cầu ghép đôi, phần mở ở cột bên trái và phần đóng
Một điều kiện cần thiết để có thể áp dụng phương pháp trắc nghiệm khách
ở cột bên phải.
quan là thí sinh phải có trình độ đọc tối thiểu để hiểu và trả lời các câu hỏi.
Đối với câu hỏi ghép đôi , người ta thường cho số phương án ở cột bên trái
Thế mạnh của phương pháp trắc nghiệm khách quan là có thể triển khai
không bằng số phương án ở cột bên phải, vì rằng khi số dòng ở hai cột bằng nhau
đánh giá trên một qui mô lớn thí sinh, với đề kiểm tra gồm nhiều câu hỏi bao phủ
thì hai dòng cuối cùng sẽ mặc nhiên được ghép với nhau mà không phải lựa
nhiều yếu tố kiến thức, được yêu cầu trả lời trong một thời gian tương đối ngắn.
chọn.
Ngoài ra, việc sử dụng công nghệ chấm điểm tự động, sử dụng các công nghệ đo
d. Câu điền khuyết và câu trả lời ngắn
lường hiện đại để thử nghiệm, tu chỉnh câu hỏi và thiết kế các đề kiểm tra phù
Câu điền khuyết là câu nêu một mệnh đề với một bộ phận để khuyết, thí
hợp cũng là một ưu thế lớn của phương pháp này.
sinh phải nghĩ ra nội dung thích hợp để điền vào chỗ trống.
Phương pháp trắc nghiệm khách quan chỉ thể hiện tính khách quan ở khâu
Câu trả lời ngắn là câu đòi hỏi trả lời bằng một từ hoặc cụm từ chỉ một khái
chấm điểm, thường bằng cách so sánh các đáp án có sẵn với bài làm của thí sinh,
niệm nào đó, rất ngắn.
người chấm điểm không cần có phán xét chủ quan nào, chính vì vậy có thể chấm

điểm bằng máy.
87

Thang Long University Libraty



Lậpkếkếvàhoạch
nhờgiá
bảng
đặc
trưng
đề kiểm
traquan
có tác dụng thực sự
1.3. Thiết
triển chi
khaitiết
đánh
bằng
trắc
nghiệm
khách
a. Vạch
giúp
chokế
việc
hoạch
học đánh
tập vàgiá

đánh giá. Trước hết có thể xem đó là sự công bố tường
minh cho
Đểhọc
xâysinh
dựnghiểu
kế hoạch
rõ họ phải
đánhđạt
giánăng
cần trả
lựclời
cụ 4thể
câunào,
hỏi:và1)cũng
Vì sao
xácđánh
địnhgiá?,
giáo
2) Đánh
viên
phảigiá
làmcáigìgì?,
khi 3)
giảng
Đánh
dạy
giáđểnhư
đạt thế
được
nào?,

các và
mục
4) tiêu
Mứcđó.
độNgoài
quan trọng
ra, bảng
củađặc
từng
nội dung
trưng
đề kiểm
và mục
tra tiêu
còn học
cho tập
phép
cụxây
thể?.
dựng các đề tương đương để sử dụng các lần
đánh giá1)khác
Vì sao
nhau
đánh
vớigiá?
mộtMục
yêu đích
cầu thống
của việc
nhất.

đánh giá là gì? Nếu đánh giá nhằm
điều
b.
Xây
chỉnh
dựng
cảicông
tiến cụ
việc
đánh
họcgiá
tập thì là để chẩn đoán hay lập kế hoạch cho ai: giáo
viên, người
Tronghọc
giaihay
đoạn
ai khác?
này cần
Nếu
xáclàđịnh:
đánh1)
giáĐánh
bản thân
giá cái
việc
gì?học
2) Chế
tập thì
tácdùng
loại câu

kết
quả nào?
hỏi
để giải
và trình
3) Cách
cho kết
ai hoặc
hợp thành
để quyết
mộtđịnh
đề trắc
gì? nghiệm.
Kết quả đánh giá sẽ giúp cho
người học?
1) Lựa chọn mẫu nội dung cụ thể cần đánh giá. Tuy đã xác định các mảng
nội dung,
2) Đánh
mục tiêu
giá học
cái gì?
tập Phải
cụ thể
nêu
cầnrõđánh
các nội
giá dung
và mức
họcđộtập
quan

tổngtrọng
quát của
và mục
từngtiêu
học tập
mục
tiêucụvàthể
từng
cầnmảng
đượcnội
đánh
dung,
giá, nhưng
các nộimột
dung
môn
và học
mụcthường
tiêu đóbao
là các
gồm
nguyên
rất nhiều
liệu
đượcdung
nội
sử dụng
nên cần
để thiết
chọnkế

một
công
mẫu
cụnội
đánh
dung
giá.cụMột
thể biện
nào để
pháp
đánh
được
giá.sửĐây
dụng
là có
công
hiệu
quả đểcần
đoạn
thiết
lựakế
chọn
công
thận
cụ đánh
trọng.giá
Tuy
là rằng
lập bảng
mọi đặc

người
trưng
thường
của một
gọi phương
đề kiểmpháp
tra. đang
xét là trắc
3) Đánh
nghiệm
giákhách
như thế
quan,
nào?
nhưng
Cần khẳng
công đoạn
định này
lại việc
mang
sửtính
dụng
chủ
phương
quan của
pháp
trắc nghiệm
người
lựa chọn:
khách

chọn
quan
mảng
là thích
nội dung,
hợp trong
chọntrường
sách giáo
hợpkhoa,
này. Sau
chọnđónhà
xem
xuất
xétbản...
các
loại câu
Tính
chủhỏi
quan
nàonày
trong
sẽ không
các kiểu
ảnhcâu
hưởng
hỏi trắc
nhiều
nghiệm
đến độ
khách

giá trị
quan
của được
đề trắc
sửnghiệm
dụng là
thíchmục
nếu
hợptiêu
nhấthọc
để tập
đánh
được
giá.xác định cẩn thận và rõ ràng.
Mỗi
4) Mức
mộtđộ
nộiquan
dungtrọng
cụ thể
củacần
loại
đánh
nội giá
dung
được
và mục
viết ra
tiêu
thành

học một
tập? câu
Xácthiết
địnhkế.
mức thiết
Câu
độ quan
kế làtrọng
các phát
của từng
biểu ôvềnội
cácdung
sự việc,
và mục
kháitiêu
niệm
họchoặc
tập hiểu
cụ thể
biết
để đòi
phân
hỏibốhọc
các con
sinh
phảisốnắm
trong
được
bảng
vàđặc

do đó
trưng.
cần Các
trắc hàng
nghiệm.
của Có
bảng
haiđặc
loạitrưng
câu thiết
đượckế:
ghicâu
cácthiết
phần
nộiliên
kế
dung
quan
mônđến
học.
cácCác
yếucột
tố của
nội dung
bảng đặc
quantrưng
trọngđược
và câu
ghithiết
các mục

kế liên
tiêuquan
họcđến
tập loại
cụ
thể luận
lập
muốncần
đánh
thểgiá.
hiện.
Các
Mỗi
concâu
sốthiết
trongkếmỗi
là một
ô nêu
đơn
mức
vị để
quan
có trọng
thể dựa
củavào
nộiđó
dung
chế và
tác
mục loại

một
tiêu câu
học hỏi
tập trắc
đó trong
nghiệm
đề kiểm
kháchtra,
quan
chúng
xác cũng
định. phải
Cần dựa
tương
vào
thích
các với
bảng
thời
đặcgian
và công
trưng
để sức
liệt dành
kê ra để
cácgiảng
ý cầndạy
viếtcũng
câu thiết
như khối

kế, và
lượng
số câu
phần
thiết
nộikếdung
nên xây
tương
dựng
ứng
trong giáo
nhiều
hơn số
trình.
lượng
Cácđược
con số
ghinày
trong
cũng
mỗibiểu
ô, vì
diễn
trong
số câu
tương
hỏilaittrong
cần xây
mộtdựng
đề trắc

các đề
nghiệm
trắc
nghiệm
khách
tương
quanđương
hoặc số
vàđiểm
cũng số
códự
thểđịnh
phảiphân
chế tác
bố các
cho câu
các hỏi
mụctheo
tiêuphương
và nội
dung khác.
pháp
tươngCần
ứng lưu
với ýcác
rằng
ô đó.
để đánh giá trình độ lập luận, nên đưa ra các tình

10

9

Thang Long University Libraty



huống
c.
Xemkhác
xét lại
vớicông
tình cụ
huống
đánhthí
giásinh đã thực hiện trong quá khứ, vì nếu như vậy sẽ
chỉ đánh
Việc
giánhận
đượcxét,
khảphê
năng
phán
nhớcông
lại các
cụ lập
đánh
luận
giácũ
được
trước

triển
đây.
khai từ hai phương
diện: 1)Đối
nó với
có đáp
câu ứng
hỏi nhiều
tốt kế lựa
hoạch
chọn,
đánh
một
giátrong
thiếtnhững
kế haykhó
không;
khănvàlớn
2)của
chấtngười
lượng
viết câu
các
là tìm
hỏiđược
đượccác
chếphương
tác nhưán
thếnhiễu
nào. “ hợp lý”. Khó khăn này có thể giải quyết

nhờ
d.
Thực
phương
hiện pháp
việc đánh
trình giá,
bày ở
xem
cuối
xétmục
cáctiếp
vấntheo.
đề và điều chỉnh nếu cần
Khi
2) Chế
thực
táchiện
cácviệc
loại đánh
câu hỏi:
giá,Khi
dù vạch
đã cókế
cáchoạch
câu thiết
sát sao
kế,như
có thể
thếdựa

nàovào
cũng
các
câu thiết
không
khỏi
kế nảy
để chế
sinhtácvấn
thành
đề. Có
mộthai
loạiloại
câuvấn
hỏiđề
trắc
thường
nghiệm
xảykhách
ra khiquan
thựcnào
hiện:
đấy.
-3)Thí
Kếtsinh
hợpcó
các
đủcâu
thờihỏi
gian

thành
để làm
mộtmọi
đề trắc
câunghiệm:
hỏi không;
Nênnếu
bố không
trí các đủ
câuthời
hỏi dễ
ở đầuđểđềlàm
gian
trắcmọi
nghiệm
câu hỏi,
để nâng
điểmcao
số của
độ tự
họtin
không
của thí
phản
sinh
ánh
khinhững
bắt đầu
điều
làm

họbài.
đã học
Chú ý
phân bố các câu hỏi theo từng loại câu hỏi hoặc từng loại mục tiêu học tập. Nên
được.
cho thí-sinh
Lưu biết
ý những
điểmcâu
dự định
hỏi mà
đốithí
vớisinh
câuyêu
hỏicầu
để họ
giảiưuthích
tiên do
chúkhông
ý các hiểu
câu hỏi
để
điểm cao.
chỉnh
lý nhằm
Khi in
sửđề
dụng
kiểm
lạitra,

saucác
này.phần của một câu hỏi nên bố trí nằm trên cùng
một trang.
Chế tác các câu hỏi trắc nghiệm phục vụ cho việc giảng dạy và đánh giá
môn học
Vềlàthời
mộtgian
việctrắc
làmnghiệm
tốn nhiều
khách
công
quan
sức.nghiệm:
Năng lực chuyên môn là quan trọng
để có thể
Cầnchế
ước
táclượng
các câu
đúng
hỏithời
trắcgian
nghiệm
tối thiểu
có nội
cần
dung
thiếttốt,
để nhưng

hoàn thành
đó mới
bàichỉ
trắclà
nghiệm
điều
kiệnkhách
cần chứ
quan
chưa
nghiệm.
đủ. Muốn
Thông
chế
thường
tác cácđối
câu
vớihỏi
học
trắc
sinh
nghiệm
phổ thông,
tốt cầnmột
làmlần
kiểm tra
nhiều
để không
thu được
quánhiều

45’. Học
kinh sinh
nghiệm.
có thể
Khi
trảviết
lời xong
25-90một
câu câu
hỏi hỏi
mộttrắc
lần nghiệm
thi tùy theo
sự phức
đừng
nghĩ
tạplàcủa
công
câuviệc
hỏi.đãCác
xong,
câudù
hỏibạn
nhiều
vừalựa
lòng
chọn
vớicần
câu30-60
hỏi đãgiây

viết.để
Sau
trảmột
lời.
thời gian
Nếu
đọc
thời
lại,gian
bạnquy
sẽ phát
địnhhiện
để làm
những
bài thiếu
khôngsót.
đủ,Do
có đó
thểcó
điều
người
chỉnh
chobằng
rằngcách
viết
biệnhỏi
câu
pháp
trắcsau:
nghiệm phải tỉ mỉ như người thợ thủ công, phải cân nhắc từng câu

chữ như
- Chuyển
người làm
mộtthơ.
số loại câu hỏi cần nhiều thời gian thành các câu hỏi đúng/
sai.

Tuy nhiên, khi bạn đã xây dựng cho môn học của mình một tập hợp câu hỏi

trắc nghiệm
- Chỉ kiểm
kháchtra
quan
mộttốt
sốthì
mục
bạntiêu
sẽ học
đượctập
đền
bằng
đáp:cách
việcchọn
giảngngẫu
dạynhiên.
và đánh giá
của bạn- Tích
trở nên
hợphết
các

sức
mục
thuận
tiêulợi.
học tập thành một nhóm mục tiêu.
Các
Đảmchuyên
bảo đủ gia
thờiđánh
giangiá
để cho
mọi rằng
học sinh
phương
có thể
pháp
làmtrắc
hếtnghiệm
mọi câukhách
hỏi trong
quanđề
kiểmdùng
nên
tra làtrong
một những
yêu cầutrường
rất quan
hợptrọng
sau: đối với các đề kiểm tra thông thường. Nếu
không Khi

đủ thời
số thí
gian
sinh
thìrất
kếtđông;
quả đánh giá sẽ sai lệch. Do đó, trừ khi có nhu cầu đo
tốc độ Khi
sử lýmuốn
bằng chấm
các đềbài
trắc
nhanh;
nghiệm tốc độ, thông thường cần tính toán để đảm
bảo đủKhi
thờimuốn
gian cho
có điểm
mọi thí
số đáng
sinh làm
tin cậy,
hết các
không
câuphụ
hỏi thuộc
trong đề
vàokiểm
người
tra.chấm bài;

11
12

Thang Long University Libraty



Khi phải coi trọng yếu tố công bằng, vô tư, chính xác và muốn ngăn chặn
sự gian lận khi thi;
Khi muốn đề thi có độ an toàn cao về nội dung và đảm bảo tính bí mật;
Khi muốn kiểm tra một phạm vi hiểu biết rộng, muốn ngăn ngừa nạn học
tủ, học vẹt và giảm thiểu sự may rủi.

2. Phương pháp đánh giá nhờ bài viết đủ dài (tự luận)
2.1. Khi nào thì đánh giá bằng phương pháp tự luận
a. Các mục tiêu học tập thích hợp
Hai loại mục tiêu học tập cụ thể phù hợp nhất để đánh giá bằng phương
pháp tự luận là mức độ nắm vững kiến thức và trình độ suy luận.
- Đối với mục tiêu nắm vững kiến thức, nếu phương pháp trắc nghiệm
khách quan phù hợp với việc đánh giá các hiểu biết đơn lẻ tách biệt thì phương
pháp tự luận thuận lợi hơn khi đánh giá một gói bao gồm nhiều kiến thức gắn kết
với nhau, các ý tưởng có quan hệ với nhau.
- Phương pháp tự luận có thể được sử dụng thuận lợi để đánh giá trình độ
suy luận, và đây chính là thế mạnh của phương pháp này. Chúng ta không thể
nhìn thấy quá trình suy luận trong đầu thí sinh như thế nào, nhưng có thể buộc họ
viết ra suy nghĩ của họ hoặc những lí lẽ khi họ trả lời.
- Để đánh giá năng lực thực hành, phương pháp tự luận chỉ đánh giá được
việc nắm vững các kiến thức phức tạp, thậm chí trình độ giải quyết vấn đề là tiên
quyết để thực hành, chứ không đánh giá được trực tiếp kỹ năng thực hành.
- Để đánh giá khả năng tạo sản phẩm, phương pháp tự luận cũng chỉ cho

phép đánh giá việc thí sinh nắm vững kiến thức và có trình độ suy luận như là các
đòi hỏi tiên quyết để tạo sản phẩm, nhưng đây chỉ là điều kiện cần chứ không đủ
để tạo sản phẩm. Muốn đánh giá khả năng thực hành tạo sản phẩm phải sử dụng
phương pháp đánh giá thực hành.
Riêng đối với sản phẩm viết của thí sinh, tự luận là một phương pháp đánh
giá phù hợp. Tuy nhiên, ở đây cần phân biệt hai mặt: nội dung và hình thức. về
13


nội dung, cần xây dựng tiêu chí đánh giá mức độ nắm vững kiến thức và chất
lượng suy luận của thí sinh. Về hình thức, cần có tiêu chí đánh giá cách chọn từ,
diễn đạt câu, bố cục,...
Bảng 1.2.1. Nêu tóm tắt về sự phù hợp của phương pháp đánh giá bằng
tự luận với các mục tiêu học tập cụ thể nêu trên đây
Mục tiêu học tập cụ thể

Đánh giá bằng phương pháp tự luận
Tự luận có thể nhấn mạnh đánh giá

Biết và hiểu

việc hiểu các mối quan hệ giữa các yếu
tố kiến thức.
Bài viết mô tả cách giải quyết các vấn
đề phức tạp có thể giúp đánh giá trình

Trình độ suy luận

độ suy luận. Đây là thế mạnh của
phương pháp.

Tự luận có thể đánh giá sự nắm vững
các kiến thức tiên quyết cần cho kĩ

Kĩ năng thực hành

năng thực hành, nhưng không đánh giá
được trực tiếp kĩ năng thực hành.
Tự luận có thể đánh giá trình độ viết vầ
Năng lực tạo sản phẩm

sự nắm vững các kiến thức cần thiết để
tạo nên sản phẩm.
Bảng 1.2.1

b. Các điều kiện cụ thể khác cần để áp dụng phương pháp tự luận
Các điều kiện sau đây là cần thiết và phù hợp để áp dụng phương pháp tự
luận:
- Thí sinh phải có trình độ viết tối thiểu;
- Giáo viên có đủ thời gian để chấm bài;
14

Thang Long University Libraty


- Các bài tự luận đòi hỏi việc chấm bài phải nhất quán, cho nên chỉ nên
dùng phương pháp này khi các hướng dẫn chấm bài được chuẩn bị tốt và các
bảng điểm được qui định là nhất quán.
1.2. Thiết kế đánh giá bằng phương pháp tự luận
a. Vạch kế hoạch đánh giá
Cũng như đối với phương pháp trắc nghiệm khách quan, để xây dựng kế

hoạch đánh giá bằng phương pháp tự luận cũng cần phải trả lời 4 câu hỏi: 1) Vì
sao đánh giá? 2) Đánh giá cái gì? Đánh giá như thế nào? và 4) Quan trọng như
thế nào?
- Vì sao đánh giá? Thiết kế đánh giá phải đáp ứng nhu cầu xác định của
người sử dụng thông tin. Dù sao trước hết cần xác định là việc đánh giá nằm điều
chỉnh cải tiến việc học tập hay đánh giá bản thân việc học tập. Nếu là đánh giá
nhằm điều chỉnh cải tiến việc học tập, thì cần xem xét việc đánh giá đó chỉ giúp
giáo viên ra quyết định hay giúp cả học sinh?
- Đánh giá cái gì? Phải nêu rõ các nội dung cần được đánh giá, kể cả các
mối liên hệ giữa chúng. Về trình độ suy luận, cần chú ý cách suy luận nào? Danh
mục các nội dung và mục tiêu học tập đó là các nguyên liệu được sử dụng để
thiết kế công cụ đánh giá.
- Đánh giá như thế nào? Cần khẳng định lại các mục tiêu học tập muốn
đánh giá là phù hợp với phương pháp tự luận.
- Mức độ quan trọng? Xác định mức độ quan trọng của từng ô nội dung và
mục tiêu học tập để phân bố các con số trong bảng đặc trưng. Lưu ý là mức độ
quan trọng này phải tương thích với thời gian và công sức dành để giảng dạy.
Các con số này phù hợp với tổng điểm được chấm sẽ phân bố theo các ô ứng với
nội dung và mục tiêu học tập đã cho.
b. Xây dựng công cụ đánh giá
Công cụ đánh giá theo phương pháp tự luận gồm hai phần: các câu hỏi của
đề tự luận và thang điểm, cách cho điểm.
* Xây dựng một câu hỏi tự luận
15


Để có một câu hỏi tự luận tốt cần phải:
1) Mô tả rõ tình huống mà từ đó nảy sinh yêu cầu giải quyết;
2) Xác định rõ thể loại lập luận cần sử dụng (phân tích, suy diễn, so
sánh,...);

3) Chỉ rõ cách viết một bài bám sát yêu cầu (có thể nêu rõ tiêu chí đánh giá
các phần của bài tự luận).
* Xác định thang điểm và qui trình chấm bài
Qua bài làm của học sinh, cần đánh giá bài làm đó có thể hiện được ba chất
lượng khác nhau: 1) hiểu biết vững vàng; 2) lập luận chặt chẽ; 3) diễn đạt tốt. cần
lưu ý rằng không thể thả nổi tiêu chí để đánh giá bài tự luận sau khi xem các bài
làm của học sinh mới xây dựng mà phải xác định trước.
Mỗi đề tự luận có một thang điểm và qui trình chấm bài riêng, tuy nhiên
cũng có thể đưa ra các tiêu chí chung làm mẫu để có thể áp dụng với nhiều nội
dung khác nhau. Chẳng hạn thang điểm để đánh giá việc thí sinh hiểu một gói
kiến thức nào đó có thể theo bảng 1.2.2 sau đây.
Cần lưu ý là các hướng dẫn tiêu chí cho điểm phải tính đến nhiều mặt chất
lượng, không nên soạn thảo các hướng dẫn theo kiểu đếm ý để tính điểm, vì làm
như vậy có thể biến một đề tự luận tốt thành một đề trắc nghiệm khách quan tồi.
Bảng 1.2.2. Tiêu chí mẫu cho thang điểm về mức độ hiểu vẫn đề
Điểm

Tiêu chí mẫu
Trả lời rõ ràng, tập trung, chính xác.

3

Các ý bổ sung hỗ trợ tốt. Rút ra được
các mối quan hệ tốt và hiểu rõ bản
chất. Sử dụng ngữ pháp đúng.
Trả lời rõ ràng, tương đối tập trung

2

nhưng không đầy đủ. Các ý bổ sung hỗ

trợ hạn chế. Nêu các mối quan hệ mờ
nhạt, không giúp nhận thức được bản
16

Thang Long University Libraty


chất. Sử dụng ngữ pháp có chỗ đúng,
có chỗ sai.
Trả lời lạc đề, chứa các thông tin
không chính xác, đôi khi chứng tỏ
1

không nắm vững dữ liệu. Không có các
ý bổ sung, không hỗ trợ được hoặc
không gắn với bản chất. Sử dụng ngữ
pháp thường không đúng.

Trong trường hợp muốn đánh giá trình độ lập luận của học sinh với các
kiến thức đã cho trong đầu bài thì tiêu chí mẫu phải phản ánh khả năng lập luận.
Chẳng hạn, để đánh giá khả năng khái quát hóa có thể sử dụng tiêu chí mẫu ở
bảng 1.2.3 sau đây.
Bảng 1.2.3. Tiêu chí mẫu cho thang điểm về khả năng khái quát hóa
Điểm

Tiêu chí mẫu
Phát biểu là đúng đối với nội dung đã

Vững


cung cấp và mở rộng áp dụng một cách
logic đối với các mảng trường hợp
rộng hơn.
- Phát biểu là đúng đối với nội dung đã
cung cấp nhưng các áp dụng mở quá
rộng, không phù hợp tốt với nội dung

Trung bình

đã cung cấp.
- Phát biểu là đúng đối với nội dung đã
cung cấp nhưng áp dụng đối với các
trường hợp khác ít thuyết phục.
- Phát biểu là đúng đối với nội dung đã

17


cung cấp nhưng không mở rộng ra các
Yếu
(sơ đẳng)

trường hợp khác ngoài nội dung đã
cung cấp
- Phát biểu là đúng đối với nội dung đã
cung cấp nhưng không mở rộng ra các
trường hợp khác không liên quan.
- Phát biểu là không đúng đối với nội
dung đã cung cấp.


c. Xem xét lại các công cụ đánh giá
Khi đã soạn thảo xong sơ bộ công cụ đánh giá, cần xem lại và nhận xét, phê
phán công cụ đánh giá đó. Muốn vậy, một trong những cách tốt nhất là giáo viên
thử dựa vào đề tự luận và thang điểm để đưa ra một dàn ý cho bài viết, xem thử
có vướng mắc ở đâu không. Có thể tóm tắt các ý cần xem xét trong bảng hướng
dẫn để kiểm tra chất lượng của một công cụ đánh giá bằng phương pháp tự luận
như ở bảng 1.2.2.
d. Thực hiện đánh giá, phát hiện thiếu sót và cải tiến
Khi triển khai việc đánh giá, cần đảm bảo cho thí sinh giữ được tâm trạng
thoải mái để tập trung suy nghĩ làm bài. Chấm bài tự luận là công đoạn dễ bị ảnh
hưởng bởi chủ quan của người chấm, do đó mọi người chấm cần trao đổi cẩn
thận về tiêu chí và thang điểm. Để đảm bảo sự nhất quán và công bằng, trong quá
trình chấm bài nên triển khai chấm từng câu hoặc từng chủ đề của câu hỏi đồng
thời đối với mọi thí sinh. Sau khi triển khai đánh giá, cho điểm và giải thích các
kết quả, nếu phát hiện thấy các thiếu sót thì cần xem xét kĩ để điều chỉnh công cụ
đánh giá và cải tiến việc giảng dạy trong tương lai.

18

Thang Long University Libraty


Bảng 1.2.4. Hướng dẫn kiểm tra chất lượng của công cụ đánh giá bằng
phương pháp tự luận
Chất lượng các câu hỏi trong đề tự luận
 Có đúng tự luận là phương pháp đánh giá tốt nhất cho các mục tiêu học
tập mong muốn không?
 Các câu hỏi có gợi ra các câu trả lời nhanh chóng và tập trung không?
 Các kiến thức muốn thể hiện có rõ ràng không?
 Các cách lập luận cần thiết có được nêu rõ không?

 Các câu hỏi có đòi hỏi kỹ năng viết quá mức tối thiểu hay không?
 Có câu hỏi nào gây khó khăn cho các nhóm học sinh bị thiệt thòi khi họ đủ
kiến thức và khả năng lập luận?
 Để tự luận có đủ câu hỏi để đảm bảo đánh giá được kiến thức và khả năng
lập luận cần thiết của học sinh không?
Chất lượng của thang điểm qui định
 Các chuyên gia giỏi về lĩnh vực đề cập có đồng ý với việc xác định chất
lượng của bài làm hay không?
 Về lĩnh vực kiến thức, tiêu chí đánh giá có rõ ràng hay không?
 Về khả năng lập luận, bảng hướng dẫn tổng quát có thể hiện được bản chất
của suy luận có chất lượng hay không?
 Thang điểm có phù hợp với đề tự luận hay không?
Điều kiện chấm bài
 Số người chấm có bảo đảm để đánh giá công bằng mọi bài làm của thí
sinh hay không?
 Có đủ thời gian dành cho mỗi người chấm bài để đọc và đánh giá mọi bài
làm hay không?
 Mọi người chấm bài có được tập huấn như nhau hay không – họ có nhất
trí với cách chấm bài hay không?
19


Nhiều khi thang điểm không chỉ thuần túy là chỉ đếm ý để tính điểm mà
còn mở cho người chấm một khoảng tự do để đánh giá về hình thức bài viết và
mức độ sáng tạo của học sinh. Kết quả đánh giá này phần lớn phụ thuộc chủ quan
của người chấm điểm; người chấm có trình độ càng cao thì việc đánh giá càng
chính xác.
2.3.Một số nguyên nhân làm giảm chất lượng đánh giá bằng tự luận và cách
khắc phục
Bảng 1.2.3 dưới đây sẽ nêu tóm tắt những lý do làm giảm chất lượng việc

đánh giá bằng phương pháp tự luận và cách khắc phục.
Nguyên nhân làm giảm chất lượng

Cách khắc phục

Không xác định rõ mục tiêu học tập
- Kiến thức làm nên không rõ

Nghiên cứu kỹ tài liệu cần nắm vững
và phác họa các cấu trúc kiến thức cần
đánh giá.

- Không nói rõ kiểu suy luận

Xác định kiểu suy luận được đánh giá
bằng thuật ngữ rõ ràng.

Mục tiêu học tập không thích hợp với Chỉ nên sử dụng tự luận để đánh giá
phương pháp tự luận

việc nắm vững cấu trúc kiến thức (khi
có một yếu tố kiến thức gắn kết với
nhau) và trình độ suy luận phức tạp.

Trình độ viết của thí sinh kém

Chọn phương pháp đánh giá khác hoặc
giúp thí sinh viết tốt hơn.

Số lượng các câu hỏi không phù hợp


Chọn một mẫu đại diện có độ dài tài
liệu vừa đủ để giúp thí sinh có thể trả
lời đạt yêu cầu về nội dung và hình
thức.

20

Thang Long University Libraty


Các câu hỏi tự luận có chất lượng kém

Soạn thảo theo đúng hướng dẫn.

Hướng dẫn chấm điểm có chất lượng
kém
- Tiêu chí không phù hợp

Điều chỉnh tiêu chí cho phù hợp với

- Tiêu chí không rõ

nội dung và trình độ suy luận mong
muốn.

- Người chấm không được tập huấn

Viết rõ ra các kỳ vọng đối với thí sinh.


- Không đủ tời gian để đọc và cho Tập huấn dùng đúng tiêu chí chấm
điểm

điểm cho mọi người tham gia chấm.
Tìm thêm người chấm hoặc sử dụng
phương pháp khác.
Bảng 1.2.3
Tóm lại tự luận là một phương pháp tốt để đánh giá các gói kiến thức liên

kết với nhau và các trình độ suy luận phức tạp. Tuy nhiên, đánh giá bằng tự luận
dễ mang tính chủ quan. Để giảm tính chủ quan, cần phải thiết kế các câu hỏi tự
luận theo một qui trình hợp lý, thiết kế các hướng dẫn tiêu chí chấm điểm cẩn
thận, và làm cho mọi người chấm hiểu rõ cách áp dụng các tiêu chí đó.
Các chuyên gia đánh giá cho rằng phương pháp tự luận nên dùng trong
những trường hợp sau:
Khi thí sinh không quá đông;
Khi muốn khuyến khích và đánh giá cách diễn đạt;
Khi muốn tìm hiểu ý tưởng của thí sinh hơn là khảo sát thành quả học tập;
Khi có thể tin tưởng khả năng chấm tự luận của giáo viên là chính xác;
Khi không có nhiều thời gian soạn đề nhưng có đủ thời gian để chấm bài.

3. Khái quát về Lý thuyết Ứng đáp Câu hỏi (Item Response Theory – IRT)
và mô hình Rasch

21


Các nghiên cứu về đánh giá bằng trắc nghiệm phát triển từ khoảng đầu thế
kỷ 20, đến thập niên 1970 thì hoàn thiện trong một lý thuyết mà ngày nay người
ta gọi là lý thuyết trắc nghiệm cổ điển. Tuy đóng góp rất nhiều cho phát triển giáo

dục, lý thuyết trắc nghiệm có nhiều thiếu sót, đặc biệt là sự phụ thuộc lẫn nhau
giữa công cụ đánh giá (đề thi) và đối tượng được đánh giá (mẫu thí sinh). Từ thập
niên 1970 đến nay một lý thuyết đo lường mới được xây dựng, dựa trên mô hình
toán học, được gọi là Lý thuyết Ứng đáp Câu hỏi (IRT).
IRT dựa trên hai giả thiết:
- Sự ứng đáp của một thí sinh đối với một câu hỏi có thể được tiên đoán
bằng năng lực tiềm ẩn của thí sinh;
- Quan hệ giữa sự ứng đáp câu hỏi của thí sinh và năng lực tiềm ẩn làm cơ
sở cho sự ứng đáp đó có thể mô tả bằng một hàm đặc trưng câu hỏi đồng biến.
Để xây dựng một mô hình toán diễn tả một mối quan hệ phải xuất phát từ
một tiền đề nào đó. Nhà toán học Đan Mạch, George Rasch, đã xây dựng được
một mô hình hàm đặc trưng câu hỏi đơn giản nhất nhưng cho đến nay cũng được
sử dụng nhiều nhất trong công nghệ trắc nghiệm. Để biểu diễn câu hỏi, Rasch chỉ
chọn một tham số: độ khó của câu hỏi. Trong mô hình này thì xác suất để một thí
sinh trả lời đúng một câu hỏi nào đó phụ thuộc vào tương quan giữa năng lực của
thí sinh và độ khó của câu hỏi. Chúng ta chọn  để biểu diễn năng lực của thí
sinh, và  để biểu diễn độ khó của câu hỏi. Theo Rasch, xác xuất P để trả lời
đúng câu hỏi phụ thuộc vào tương quan giữa  và , tức là ta có thể biểu diễn:
Θ
f(P)= β

(1.3.1)

trong đó f là một hàm nào đó của xác suất trả lời đúng.
Vấn đề là chọn hàm f(P) như thế nào để có biểu diễn hợp lý nhất. Trước
hết, vì mối quan hệ cộng trừ đơn giản hơn mối quan hệ về nhân chia nên Rasch
lấy logarit tự nhiên của (1.3.1):
Θ
lnf(P)= ln[ ] = ln - ln =  - b
β


(1.3.2)
22

Thang Long University Libraty


Trong
Tiếp đến
cácđể
môđơn
hình
giản,
trắckhi
nghiệm
xét mô
đahình
phân,trắc
mônghiệm
hình định
nhịgiá
phân,
từng
Rasch
phầnchọn
(partial credit
-PCM)làđược
P model
hàm f chính
 đặc biệt chú ý vì tính tổng quát và khả năng

1- P  , bằng biểu thức mức được thua (odds) hoặc khả năng thực
ứng dụng rộng rãi của nó.
hiện đúng (likelyhood ratio), tức là tỷ số của khả năng xảy ra sự kiện khẳng định
so với khả năng xảy ra sự kiện phủ định. Như vậy:
P ln 
1- P   θ - b ,

(1.3.3)

P ln 
1- P  được gọi là logit (log odds unit).
P  ( - b)Từ đó có thể viết: 
1- P  = e
Qua một vài biến đổi đơn giản, ta thu được:
eθ-b 
(1.3.4)
P() =
1+ eθ-b
trong đó P() là xác suất trả lời đúng câu hỏi của thí sinh,  là năng lực thí sinh, b
độ khó của câu hỏi.
Biểu thức (1.3.4) là hàm đặc trưng của mô hình ứng đáp câu hỏi một tham
số, hay còn gọi là mô hình Rasch.

4. Trắc nghiệm nhị phân và đa phân
Một mô hình trắc nghiệm được sử dụng phổ biến trong quá khứ là mô hình
các câu hỏi có kiểu ứng đáp nhị phân (dichotomous), tương ứng hai mức điểm là
0 và 1, để đo lường chỉ một năng lực tiềm ẩn, hoặc nói cách khác, đo lường năng
lực tiềm ẩn đơn chiều.
Ngoài mô hình các câu hỏi có đáp ứng nhị phân, người ta còn sử dụng
nhiều loại câu hỏi có ứng đáp đa phân (polytomous), tức là thí sinh có thể ứng

đáp không chỉ theo hai mức điểm 0 và 1, mà theo nhiều mức điểm khác nhau. Có
thể nêu ví dụ đơn giản về các mô hình ứng đáp đa phân ở các bảng hỏi với các
mức trả lời : rất không đồng ý, không đồng ý, không có ý kiến, đồng ý, rất đồng ý.

23
24

Thang Long University Libraty



×