Một số khía cạnh tâm lí trong đánh giá kết quả học tập của học sinh

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (105.55 KB, 13 trang )

MỘ
T S ỐKHÍA C Ạ
NH TÂM LÝ
TRONG ĐÁ NH GIÁ K Ế
T QU ẢH Ọ
C TẬ
P CỦ
A HỌ
C SINH
Đào Thị Oanh – Viện Nghiên cứu Sư
phạm

Khi đánh giá tình hình học tập của một học sinh, chúng ta chủ
yếu tham khảo kết quả kiểm tra, thi cử của em đó. Kết quả
bài kiểm tra hay bài thi cung cấp thông tin phản hồi cho giáo
viên và học sinh về tình hình học tập của học sinh.
Giả sử trong một kì thi,một học sinh được điểm môn Văn là 7,
điểm môn Toán là 8, thì liệu chúng ta có thể nói được rằng,
kết quả học Toán của em đó khá hơn kết quả học Văn được
không? Và, liệu chúng ta có thể căn cứ vào đó mà suy ra rằng,
tình hình học Văn của em học sinh đó tồi hơn học môn Toán?
Thật ra, để có một cái nhìn toàn diện thì cần phải nhìn nhận
điểm số một cách khoa học hơn. Có nhiều khía cạnh cần được
lưu ý song ở đây chỉ đề cập đến yếu tố tâm lí ở người chấm
bài.
Từ những năm cuối thế kỉ 20, một số chuyên gia đánh giá
người Pháp và Thụy Sĩ (Jacques Lecomte, Henri Piéron, Jean
Cardinet, Georges Noizet...) đã có những nghiên cứu về vấn
đề này và đưa ra những bằng chứng cho sự “may rủi của việc
thi cử”.
Henri Pieron – chuyên gia Tâm lí học Thực nghiệm của

Pháp đã công bố kết quả cuộc điều tra về 100 bài thi tú tài
được rút ra một cách ngẫu nhiên. Chúng được phân thành 6
nhóm cho 6 môn thi, gồm: Tập làm văn; Dịch tiếng Latinh;
1

Anh văn; Triết học; Toán học và Vật lí), với mỗi nhóm gồm 5
giám khảo chấm bài độc lập với nhau. Kết quả là: với thang
điểm 20, cùng một bài tập làm văn, số điểm chênh lệch nhau
là 13; đối với môn La tinh và Anh văn, số điểm chênh lệch là
12; đối với khoa học tự nhiên, khoảng cách về điểm số có
giảm hơn: Toán là 9 điểm còn Vật lí là 8 điểm.
Trong một cuộc thử nghiệm khác, 78 giáo viên đã chấm 3
bài Tập làm văn. Qua bảng điểm của 1 bài, kết quả thật là
khó hiểu: 36 giáo viên đã cho từ 6-7 điểm; 20 người cho từ 4-5
điểm; 6 người chỉ cho từ 2-3 điểm; thậm chí 1 người đã cho 1
điểm. Số còn lại: 10 người cho từ 8-9 điểm; 3 người cho từ 1011 điểm; 2 người cho từ 12-13 điểm. Sự khác biệt trên đây
khiến H.Piéron nói đại ý rằng,nếu muốn dự đoán điểm của
một thí sinh, thì tốt nhất nên hiểu rõ về giáo viên chấm hơn là
về bản thân thí sinh. J. Cardinet – chuyên gia của Viện Nghiên
cứu và Học liệu Sư phạm Thụy Sĩ đã nhận xét đại ý rằng, có
bao nhiêu giáo viên thì có thể có bằng ấy cách cho điểm.
Không những cá tính của giáo viên ảnh hưởng tới việc cho
điểm, mà qua trắc nghiệm của G. Noizet, những thông tin
khác liên quan đến học sinh cũng có thể ảnh hưởng tới bài
chấm, như: là học sinh của trường tiên tiến hay trường bình
thường;là học sinh của lớp giỏi hay lớp kém; nghề nghiệp của
cha mẹ; tên học sinh...
Ngoài những thông tin về học sinh, còn hai hiện tượng tâm lí
rất quan trọng thường tác động đến sự cân nhắc, tính toán

của giáo viênkhi chấm bài là “sự tương phản” và “sự đồng
nhất”.
Sự tương phản.
2

Các nghiên cứu cho thấy, nhiều giáo viên xác nhận rằng có sự
chênh lệch về điểm mà họ đã cho giữa những bài chấm đầuvà
những bài chấm sau. Điều đó đã thể hiện qua thử nghiệm
sau: có 3 bài thi được điểm 12/20 được đưa xen kẽ vào với 12
bài kém, rồi sau đó người ta lại kẹp chúng với 12 bài tốt. Có 5
người chấm riêng biệt. Kết quả là 3 bài đó khi nằm ở tập bài
kém đã được điểm trung bình là 16/20, còn khi ở tập bài tốt
đã được điểm dưới 10/20. Có thể kết luận rằng các giáo viên
đã chấm điểm bằng cách so sánh bài này với bài kia.
Qua một thử nghiệm khác người ta thấy những bài chấm
đầu tiên bao giờ cũng được chấm nghiêm túc nhất, sát với
barem nhất. Những bài về cuối thường bị đánh giá sai lệch. G.
Noizet giải thích rằng, việc đánh giá bằng cho điểm là một
hoạt động so sánh giữa một sản phẩm của học sinh với một
mẫu được dùng để tham chiếu. Đối với những bài đầu, giám
khảo lấy barem để đối chiếu, tham khảo. Về sau người ta
không so sánh với mẫu tham chiếu nữa, mà so sánh giữa các
bài với nhau.
Sự đồng nhất.
Qua thử nghiệm người ta đã xác định được rằng, khi cho
điểm, giáo viên thường lưu ý tới những kết quả điểm số trước
đó của học sinh. Người ta đã đưa một bài kiểm tra môn Anh
văn cho nhiều giáo viên cùng chấm, kèm theo điểm số của vài
bài kiểm tra trước đây. Kết quả là, điểm trung bình của các

giáo viên chấm chỉ xê xích 2 điểm so với điểm của bài trước.
Yếu tố “ngẫu nhiên” ở đây chỉ chiếm 5/1000 (5 phần nghìn).
G. Noizet giải thích hiện tượng đồng nhất này là do giáo viên

3

muốngiảm thiểu những rủi rotiềm tàng có thể xẩy ra, nên họ
căn cứ vào các thông tin đã biết (ở đây là điểm số các bài cũ).
Những cải tiến trong cách cho điểm.
Các chuyên gia đánh giá xem việc cho điểm chính xác là
rất khó thực hiện cho nên họ đã nghiên cứu đề xuất những cải
tiến phù hợp cho phương pháp đánh giá và lượng giá (cho
điểm) kết quả học tập. Dưới đây chỉ là một số ví dụ:
- “Chấm kép”. Cách chấm này khá phổ biến nhưng cũng
chỉ có tính tương đối. Thực tế chứng minh rằng, việc ghép 2
giáo viên một cách tính cờ chỉ có một tác dụng rõ nhất: đây là
dịp để họ đấu tranh với nhau về quan điểm và cuối cùng đi
đến một sự đánh giá tối ưu. Song cũng có thể xảy ra khả năng
là tập hợp hai giám khảo cùng dễ dãi, hoặc ngược lại, đều
“khắt khe”, thì kết quả sẽ vẫn còn gây nhiều bất ngờ.
- Điều chỉnh theo điểm trung bình. Yêu cầu những giáo viên
khắt khe liệt kê lại toàn bộ điểm số và điều chỉnh lại theo
điểm số trung bình mà các giáo viên khác nhau đã cho đối với
bộ môn đó. Cách này ít khi được áp dụng vì các giáo viên viện
lí do rằng, họ đã chấm một cách rất khách quan, đúng chất
lượng của bài thi.
- Đánh giá thường xuyên. Nhiều giáo viên cho rằng những
điểm kiểm tra trong năm học là sự phản ánh tốt nhất về từng
học sinh và nên giảm thiểu việc tùy tiện cho một điểm duy

nhất. Dù sao người ta cũng không quên những yếu tố có thể
tác động đến giáo viên. Vì thế, G. Noizet cho rằng phương
pháp này có thể tin cậy được nếu người cho điểm không biết
“tác giả” của bài thi là ai. Nói một cách khác, người chấm bài

4

không phải là người dạy học sinh mà chỉ biết kết quả học tập
trong năm qua điểm số của học sinh.
- Trắc nghiệm (nhiều lựa chọn). Mỗi câu hỏi sẽ có nhiều đáp
án, nhưng chỉ có một đáp án là đúng còn các đáp án khác sẽ
bị gạch đi. Nhờ vậy, giáo viên có những đáp án để áp dụng,
không cần phải suy xét nhiều. Tuy nhiên, mặt trái của cách
làm này là: học sinh gạch bừa và có khi để lại câu trả lời đúng
do ngẫu nhiên mà vẫn được điểm. Có học sinh muốn chắc ăn,
chỉ đánh dấu những câu trả lời nào mà họ tin là đúng, nhưng
không xóa các câu khác. Vì thế, cách này chỉ có tác dụng tìm
hiểu trình độ hiểu biết của học sinh mà chưa đánh giá được
khả năng sáng tạo của các em.
Những kết quả nghiên cứu trong lĩnh vực đánh giá thường
được cơ quan quản lí tiếp thu một cách dè dặt, vì đây là một
vấn đề không đơn giản. Thực tế cho thấy, nhiều giáo viên dạy
giỏi nhưng lại là người chấm thi dở vì thiếu sự huấn luyện, đào
tạo chu đáo.Việc chấm điểm chính xác sẽ giúp học sinh hiểu
đúng về kết quả học tập của mình, tự đánh giá phù hợp, thấy
được những điểm yếu của bản thân để điều chỉnh phương
pháp học tập, đồng thời xác định cho mình mục tiêu phấn đấu
mới và nâng cao tính tích cực học tập. Vì vậy, trong công tác
đào tạo giáo viên ở nước ngoài, nội dung về đánh giá giáo dục

và việc xử lí những vấn để nảy sinh trong đánh giá giáo dục
được hết sức coi trọng. Hiện nay đây cũng là vấn đề đang
được quan tâm đặc biệt trong chương trình đổi mới căn bản
toàn diện giáo dục và đào tạo ở nước ta.

5

LI ỆU BÀI VI ẾT KHOA H ỌC CÓ ĐÁNG TIN C ẬY H ƠN BÀI VI ẾT BÁO CHÍ?

Tác giả Ivan Oransky, Đại học New York
Người dịch: Xuân Toàn

Tạp chí Rolling Stone đã phải gỡ một bài báo gây xôn xao dư
luận do sai lầm trong quy trình biên tập, bài báo này cáo buộc
một vụ hiếp dâm tập thể được cho là diễn ra ở khuôn viên của
đại học Virginia. Đây quả là một sai lầm đáng được liệt vào
danh sách những lỗi biên tập ngớ ngẩn nhất của nghề báo
chí. Rolling Stone đã thông báo về việc gỡ bài và lỗi biên tập
một cách rất chi tiết và công khai. Và việc một hãng tin tức
như Rolling Stone lại phơi bày lỗi lầm của mình theo cách quá
công khai như vậy đúng là hiếm có – dù không phải là chưa
từng có tiền lệ.
Từ lỗi lầm này, xuất hiện ý kiến cho rằng báo chí nên được
biên tập giống cách biên tập và bình duyệt các bài cáo khoa
học hơn nữa, vì khoa học được cho là một ví dụ điển hình về
khả năng tự hiệu chỉnh. Thời báo New York đã có bài viết về
việc gỡ bài của Rolling Stone, trong đó có thuật lại rằng
Nicolas Lemann, cựu Chủ nhiệm Trường Báo chí Columbia, dạy
sinh viên của mình rằng “phương pháp làm báo chí” rất giống

phương pháp làm khoa học: tất cả đều xoay quanh việc kiểm
định các giả thuyết một cách hết sức nghiêm ngặt, xoáy vào
các câu hỏi: Giả thuyết của tôi là gì và tôi sẽ bác bỏ nó bằng

6

cách nào? Đó là những câu hỏi mà các nhà báo của Rolling
Stone đã không đặt ra khi viết bài báo trên.
Hai lĩnh vực khoa học và báo chí có phương pháp làm việc khá
tương đồng – nhưng phương pháp khoa học cũng không phải
là lý tưởng.
Sai lầm trong quy trình biên tập
Steve Coll, người kế nhiệm vị trí của Lemann ở Trường Báo chí
Columbia, và các đồng nghiệp đã công bố một bản báo cáo
điều tra chính thức dài 12.700 từ về vụ việc. Theo báo cáo
này, một điều chắc chắn là Sabrina Rubin Erdely, tác giả bài
báo về vụ việc trên, đã không cố gắng phản biện lại giả
thuyết của cô ấy bằng cách phỏng vấn các bị cáo được cho là
hãm hại cô gái. Các biên tập viên của Rolling Stone cũng
không yêu cầu Sabrina Rubin Erdely quay trở lại thực hiện
một cuộc phỏng vấn trước khi xuất bản bài viết.
Chúng tôi đánh giá việc này giống với việc thiếu bình duyệt
các công trình khoa học, vốn là quy trình mà qua đó các
chuyên gia có thể tìm ra các vấn đề trong phương pháp luận,
từ đó dẫn tới sự sai lệch trong các kết luận của tác giả. Khi
bạn không ép chính mình hay người khác phải tìm kiếm các
vấn đề, thì một khả năng có thể xảy ra là bạn sẽ diễn đạt
thông tin theo chiều hướng phù hợp với định kiến của bản
thân. Đây là khuynh hướng tự nhiên rất mạnh mẽ khi chúng

ta tìm kiếm các dẫn chứng để ủng hộ cho lý thuyết hay câu
chuyện mà chúng ta tin là đúng.

7

Một thực tế nữa trong báo cáo trên là hai trong ba lý do chủ
yếu dẫn tới việc gỡ bỏ các bài báo của các phương tiện truyền
thông – như miêu tả trong thời báo New York – rất giống trong
khoa học: đó là hoàn toàn bịa đặt và đạo văn (loại lí do thứ ba
thuộc về sai lầm của Rolling Stone, liên quan tới việc thiếu sự
hoài nghi khi biên tập, chúng ta sẽ quay lại yếu tố thứ ba này
sau).
Chuẩn mực trong quy trình công bố khoa học rất đáng
để noi theo
Nhưng sự tương đồng giữa hai lĩnh vực này chỉ dừng lại ở 2 lí
do trên.
Khoa học và công bố khoa học hiếm khi trình bày kết quả từ
một sự kiện đơn lẻ. Các công trình khoa học đã được công bố,
đặc biệt trong lĩnh vực Y Sinh, có đặc trưng là liên hệ tới
những kết quả của các thí nghiệm bao gồm rất nhiều các bài
kiểm tra (test). Điều mà Lemann thực sự miêu tả chỉ là một
khía cạnh nhỏ, mặc dù thiết yếu, của phương pháp khoa học;
đó là nỗ lực để xác định và loại bỏ yếu tố thiên kiến chủ quan
trong suy nghĩ con người hoặc trong việc kiểm định một giả
thuyết.
Khi một nghiên cứu khoa học được thực hiện đúng như yêu
cầu, thì các khám phá từ nghiên cứu đó sẽ bổ sung thêm,
thay đổi hoặc bác bỏ hoàn toàn nghiên cứu trước. Khi kiến
thức mới xuất hiện khiến chúng ta phải sửa đổi các kiến thức

đang thịnh hành, các nhà khoa học có thể và thường xuyên

8

chữa lại các tài liệu bằng cách gỡ bỏ các kết quả nghiên cứu
trước đó của họ.
Tuy nhiên, thực tế làm khoa học lại không như “chuẩn
mực”
Vấn đề là trong khoa học – chính xác hơn là trong công bố
khoa học – quy trình thực hiện lại hiếm khi đạt được như yêu
cầu.
Qua công việc của chúng tôi tại Retraction Watch (chuyên
theo dõi việc gỡ bài của các tạp chí), chúng tôi thấy các tạp
chí khoa học – ngay cả khi họ gỡ bài xuống (vốn phải là
chuyện thường gặp trong thực tế) – hiếm khi họ đưa ra một
thông báo đầy đủ và rõ ràng về nguyên nhân và quy trình bài
báo ấy bị làm sai chuẩn mực. Các thông báo gỡ bài trên tạp
chí khoa học thông thường không có sự thuyết minh rõ ràng
và chi tiết như trong các thông báo gỡ bài của báo chí – và
không bao giờ các thông báo gỡ bài khoa học lại kèm theo
một báo cáo chi tiết như báo cáo về vụ việc của Rolling Stone,
một vụ việc được thừa nhận là trường hợp hy hữu. Một vài tạp
chí khoa học thậm chí còn khuyên người đọc liên hệ với các
tác giả của bài viết gốc để biết thêm chi tiết – việc này theo
một cách nào đó khiến người đọc nghĩ rằng đó là một câu trả
lời hợp lí – hơn là đăng tải chi tiết tới tất cả mọi người để họ
nhìn thấy các vấn đề đã dẫn tới việc gỡ bài.
Hiện nay, nhà quan sát truyền thông Craig Silverman đang kì
công lên danh mục các hiệu chỉnh báo chí, mà theo như

chúng tôi được biết là chưa một ai có được danh sách đầy đủ
9

về các vụ gỡ bài của báo chí, và dường như các trường hợp
này lại không phổ biến bằng các vụ gỡ bài tạp chí khoa học.
Mặc dù, chính các tạp chí khoa học cũng rất hiếm khi gỡ bài:
chỉ khoảng 400 đến 500 bài trong khoảng 1,4 triệu bài được
công bố mỗi năm.
Điều đó khiến chúng tôi quay trở lại với vấn đề thiếu sự hoài
nghi. Giống như một câu chuyện cuốn hút trên truyền thông,
một bài báo khoa học muốn có sức nặng thì cũng phải có luận
điểm thuyết phục. Các tạp chí khoa học thường có xu hướng
công bố các khám phá tích cực hơn là các kết quả tiêu cực. Và
theo xu hướng nghiên cứu gần đây thì sẽ không có gì lạ nếu
có những công bố khoa học không hề chính xác. Và nguyên
nhân lại là xu hướng thiên kiến khẳng định, xu hướng này
được trợ giúp và thúc đẩy qua phương pháp sử dụng thống kê
của nhiều nhà khoa học. Nói một cách đơn giản là nếu bạn
làm 20 thí nghiệm, và chỉ có một trong số chúng có kết quả
có thể xứng đáng được công bố. Nhưng chỉ công bố riêng kết
quả đó sẽ không làm cho những phát hiện trong nghiên cứu
của bạn có giá trị. Thực tế lại hoàn toàn ngược lại, công bố đó
hoàn toàn không có giá trị.
Tại sao việc công bố như vậy vẫn xảy ra? Bởi vì toàn bộ cộng
đồng khoa học, từ các nhà nghiên cứu trẻ cho tới tổng biên
tập, có chung điểm yếu là ít nhiều sự cả tin, và đây là điều đã
khiến các biên tập viên của Rolling Stone trả giá, sự cả tin
cũng là một dạng đặc trưng của xu hướng thiên kiến khẳng
định. Và hậu quả - ít nhất là trong ngành khoa học Sinh Hóa –

chính là sự khủng hoảng về nghiên cứu kế thừa. Tóm lại, phần
10

nhiều nếu không muốn nói là hầu hết những bài báo khoa học
được công bố ngày nay ở các tạp chí khoa học chỉ có chút ít
khả năng đứng vững nếu phòng thí nghiệm khác tiến hành
kiểm tra lại kết quả và thậm chí khả năng đứng vững còn
không được một chút ít đó.

Tất cả mọi người đều có thể làm và nên làm tốt hơn
Tạp chí khoa học cũng như báo chí phổ thông, nên đề ra tiêu
chuẩn cao hơn đối với các bài viết của họ. Cũng giống như
việc họ được xếp hạng dựa trên tần suất các bài viết của họ
được trích dẫn (còn gọi là hệ số ảnh hưởng – impact factor);
họ phải được đánh giá cả về tần suất bài viết bị gỡ và thời
gian nhanh chậm các thông báo gỡ bài được đưa ra. Họ cũng
nên được đánh giá dựa trên số lượng các khám phá được kế
thừa trong các nghiên cứu tương lai, điều mà chúng tôi gọi là
chỉ số khả năng tái sử dụng.
Ngoài ra còn có những hệ quả khác trong đời sống thực, như
là: sau khi báo cáo của Steve Soll được đưa ra, hội sinh viên
của đại học Virginia, nơi được cho là xảy ra vụ cáo buộc, đã
thông báo việc khởi kiện Rolling Stone vì đã làm sai lệch tin
tức. Các luật sư cũng có thể đóng một vai trò lớn trong khoa
học; chúng ta đã chứng kiến một số vụ kiện gần đây mà
những người đại diện đầy quyền uy này đã cố gắng ngăn chặn
sự thật khỏi các thông báo gỡ bài – và khỏi sự chú ý của công
chúng.

11

Tuy nhiên, các vụ kiện không chỉ là phản ứng nhằm che dấu
những sai sót và gian lận. Một nghiên cứu năm 2013 cho thấy
các nhà khoa học bị gỡ bài báo do gian lận sẽ gặp phải điều
mà chính bạn cũng có thể nghĩ tới: đó là những bài báo khác
của họ theo đó cũng ít được trích dẫn. Trên thực tế, toàn bộ
các lĩnh vực liên quan đều có thể nhận ra sự việc này. Nhưng
điều đáng khích lệ trong nghiên cứu năm 2013 là thống kê
cho thấy khi các nhà khoa học tình nguyện gỡ các bài báo của
họ vì các sai sót có thật, điều đó thực sự giúp họ gia tăng
thêm một ít số lượng các trích dẫn ở các bài báo khác. Nếu
các nhà khoa học, vô tình hoặc hữu ý đang tán thưởng hành
vi tốt (bằng cách trích dẫn), thì chắc cũng hợp lí nếu người
đọc báo chí phổ thông cũng sẽ cư xử tương tự?
Nếu như xem tạp chí khoa học và báo chí phổ thông là hai
hoạt động trong cùng một lĩnh vực (báo chí) nhưng có tiêu chí
và phương pháp tiếp cận khác nhau, chúng ta thấy rõ một
thực tế là bài viết báo chí và bài viết khoa học đều bị ảnh
hưởng bởi những yếu điểm của con người giống như bất kì
hoạt động nào khác, và không rõ lĩnh vực nào có khả năng tự
hiệu chỉnh tốt hơn. Cả hai lĩnh vực có thể học hỏi lẫn nhau. Họ
cũng có thể học từ các lĩnh vực khác như là phẫu thuật, mà từ
thực tiễn trong các buồng mổ đã cho thấy rằng cần phải phân
quyền cho tất cả thành viên trong kíp mổ, chứ không chỉ riêng
các bác sĩ phẫu thuật chính, là những người có lúc có thể
không muốn thừa nhận các sai lầm của mình; và việc trao
quyền cho tất cả mang lại sự an toàn hơn cho người bệnh.
Thật là khó khăn khi phải chấp nhận một thực tế rằng chúng

12

ta là con người nên khó tránh các sai lầm, nhưng khi thừa
nhận được như thế thì chúng ta có thể tạo nên sự thay đổi.
Bài báo có đồng tác giả là Adam Marcus. Tác giả Oransky và
Marcus cũng là những nhà đồng sáng lập của trang
mạng Refractionwatch.com

13

Một số khía cạnh tâm lí trong đánh giá kết quả học tập của học sinh

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về