ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC
______________________________
NGUYỄN TRƯỜNG SƠN
ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI
TRẮC NGHIỆM KHÁCH QUAN
TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI
ĐẠI HỌC THÁI NGUYÊN
LUẬN VĂN THẠC SĨ
Hà Nội – 2010
ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC
______________________________
NGUYỄN TRƯỜNG SƠN
ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI
TRẮC NGHIỆM KHÁCH QUAN
TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI
ĐẠI HỌC THÁI NGUYÊN
Chuyên ngành: Đo lường và đánh giá trong giáo dục
(Chuyên ngành đào tạo thí điểm)
LUẬN VĂN THẠC SĨ
Người hướng dẫn khoa học:
PGS.TS Lê Đức Ngọc
Hà Nội – 2010
LỜI CẢM ƠN
Với lòng biết ơn sâu sắc, tôi xin chân thành cảm ơn thầy giáo –
PGS.TS Lê Đức Ngọc, người đã định hướng khoa học và giúp đỡ tôi trong
suốt quá trình thực hiện luận văn này.
Tôi xin bày tỏ lòng biết ơn tới:
Ban giám đốc Viện Đảm bảo chất lượng Giáo dục, các thầy cô giáo
tham gia giảng dạy khóa đào tạo Thạc sỹ Đo lường và Đánh giá trong
Giáo dục, cùng các anh chị và các bạn đang công tác và học tập tại Viện
Đảm bảo chất lượng Giáo dục – Đại học Quốc gia Hà Nội;
Ban giám hiệu trường Đại học Khoa học – Đại học Thái Nguyên,
các giảng viên tại các Khoa, Bộ môn, các bạn bè và đồng nghiệp;
Người thân và gia đình đã luôn giúp đỡ, động viên tôi hoàn thành
luận văn này.
Hà Nội, ngày 30 tháng 05 năm 2010
Tác giả
Nguyễn Trường Sơn
LỜI CAM ĐOAN
Tôi là: Nguyễn Trường Sơn
Là học viên lớp cao học Đo lường và Đánh giá trong giáo dục Khóa
2006 – 2009 (theo Quyết định công nhận học viên cao học số 1803/SĐH ngày
7/11/2006 của Giám đốc Đại học Quốc gia Hà Nội).
Tôi xin cam đoan danh dự về công trình khoa học này là của tôi.
Nếu sai tôi xin hoàn toàn chịu trách nhiệm.
Hà Nội, ngày 30 tháng 05 năm 2010
Tác giả
Nguyễn Trường Sơn
MỤC LỤC
Trang
MỞ ĐẦU 1
1. Lý do chọn đề tài 1
2. Mục đích nghiên cứu của đề tài 3
3. Nhiệm vụ nghiên cứu của đề tài 3
4. Giới hạn, phạm vi nghiên cứu 3
5. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài 3
5.1. Câu hỏi nghiên cứu 3
5.2. Giả thuyết nghiên cứu 4
6. Khách thể và đối tượng nghiên cứu 4
6.1. Khách thể nghiên cứu 4
6.2. Đối tượng nghiên cứu 4
7. Phương pháp nghiên cứu 4
7.1. Nghiên cứu lý thuyết 4
7.2. Nghiên cứu thực nghiệm 4
7.3. Phương pháp Toán học 4
8. Cấu trúc của luận văn 5
CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN 6
1.1. Lịch sử vấn đề nghiên cứu 6
1.1.1. Trên thế giới 6
1.1.2. Việt Nam 8
1.2. Các khái niệm cơ bản về đo lường và đánh giá trong giáo dục 11
1.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá 15
1.3.1. Kiểm tra đánh giá kết quả học tập 15
1.3.2. Mục đích, ý nghĩa của việc kiểm tra, đánh giá KQHT 16
1.3.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá 18
1.4. Quy trình xây dựng đề thi và ngân hàng câu hỏi TNKQ 22
1.4.1. Quy trình xây dựng đề thi TNKQ 22
i
1.4.2. Ngân hàng câu hỏi TNKQ 26
1.5. Kỹ thuật xây dựng các câu hỏi TNKQ 27
1.5.1. Loại đúng – sai (True or False) 27
1.5.2. Loại ghép đôi (Matching items) 29
1.5.3. Loại điền khuyết (Supply item) 30
1.5.4. Loại nhiều lựa chọn (Multi choice questions - MCQ) 31
1.5.5. So sánh trắc nghiệm khách quan và trắc nghiệm tự luận 35
1.6. Phân tích đánh giá câu hỏi và bài trắc nghiệm 37
1.6.1. Mục đích phân tích câu hỏi và bài trắc nghiệm 37
1.6.2. Phương pháp phân tích câu hỏi theo lý thuyết khảo thí hiện đại 38
1.6.3. Một số yêu cầu thống kê đối với câu hỏi và bài TNKQ 45
1.7. Kết luận chương 1 50
CHƯƠNG 2. THỰC TRẠNG QUY TRÌNH THIẾT KẾ ĐỀ THI TNKQ
TẠI TRƯỜNG ĐẠI HỌC KHOA HỌC – ĐHTN 51
2.1. Vài nét về trường Đại học Khoa học – Đại học Thái Nguyên 51
2.2. Thông tin chung về các giảng viên tham gia khảo sát 52
2.3. Thực trạng quy trình thiết kế đề thi TNKQ tại đơn vị 54
2.3.1. Thực trạng sử dụng các phương pháp KTĐG 54
2.3.2. Thực trạng quy trình thiết kế đề thi TNKQ 56
2.3.3. Thực trạng phân tích và xử lý kết quả thi 62
2.3.4. Thực trạng chất lượng đề thi 65
2.4. Kết luận chương 2 73
CHƯƠNG 3: MỘT SỐ BIỆN PHÁP NÂNG CAO HIỆU QUẢ QUY TRÌNH
THIẾT KẾ ĐỀ THI TNKQ TẠI TRƯỜNG ĐẠI HỌC KHOA HỌC - ĐHTN 74
3.1. Nguyên tắc đề xuất biện pháp 74
3.2. Một số biện pháp nâng cao hiệu quả quy trình thiết kế đề thi TNKQ
tại đơn vị 74
3.3. Tổ chức thử nghiệm biện pháp 75
ii
3.4. Đánh giá chung của GV về tính khả thi và hiệu quả của các
biện pháp đã triển khai 91
3.5. Kết luận chương 3 93
KẾT LUẬN VÀ KIẾN NGHỊ 95
TÀI LIỆU THAM KHẢO 99
PHỤ LỤC 102
iii
CÁC CHỮ CÁI VIẾT TẮT TRONG LUẬN VĂN
CNTT Công nghệ thông tin
Disc Chỉ số độ phân biệt
ĐHKH Đại học Khoa học
ĐHQG HN Đại học Quốc gia Hà Nội
ĐHTN Đại học Thái Nguyên
ĐLĐG Đo lường đánh giá
ĐBCLĐT&NCPTGD Đảm bảo chất lượng đào tạo
và nghiên cứu phát triển giáo dục
GV Giảng viên
GD&ĐT Giáo dục và Đào tạo
IRT Lý thuyết hồi đáp
IRF Hàm đáp ứng câu hỏi
KĐCL Kiểm định chất lượng
KHKT Khoa học kỹ thuật
KQHT Kết quả học tập
KT, ĐG Kiểm tra, đánh giá
MCQ Câu hỏi nhiều lựa chọn
NCKH Nghiên cứu khoa học
NHCH Ngân hàng câu hỏi
NXB Nhà xuất bản
TL Tự luận
TNKQ Trắc nghiệm khách quan
SV Sinh viên
iv
DANH MỤC CÁC BẢNG
Tên bảng Trang
Bảng chương 1
Bảng 1.1 Bảng trọng số cho các nội dung cần đánh giá 25
Bảng 1.2 So sánh phương pháp TNKQ và TNTL 36
Bảng chương 2
Bảng 2.1 Tỷ lệ các phương pháp mà GV sử dụng 54
Bảng 2.2 Nhận thức của GV về hiệu quả các phương pháp KTĐG 55
Bảng 2.3 Tỷ lệ GV phân tích độ khó 63
Bảng 2.4 Tỷ lệ GV phân tích độ phân biệt 63
Bảng 2.5
Thông tin về kết quả tính toán các câu hỏi học phần
KHMTĐC
69
Bảng 2.6 Thông tin về kết quả tính toán năng lực của thí sinh 70
Bảng chương 3
Bảng 3.1 Bảng trọng số của học phần “Sinh lý thực vật” 78
Bảng 3.2 Kết quả thi thử nghiệm học phần “Sinh lý thực vật” 79
Bảng 3.3 Thông tin về kết quả tính toán các câu hỏi 83
Bảng 3.4 Thông tin về kết quả tính toán năng lực của thí sinh 86
Bảng 3.5 Kết quả phân tích câu hỏi số 3 88
v
DANH MỤC CÁC HÌNH
Tên hình Trang
Hình chương 1
Hình 1.1 Tóm lược các phương pháp trắc nghiệm 19
Hình 1.2 Quy trình xây dựng đề thi TNKQ 23
Hình 1.3 Các loại câu hỏi TNKQ 27
Hình 1.4 Hàm đáp ứng câu hỏi (IRF) 41
Hình 1.5 Đường cong trả lời theo mô hình Rasch 43
Hình chương 2
Hình 2.1 Số lượng và tỷ lệ giảng viên tham gia khảo sát 53
Hình 2.2 Số năm kinh nghiệm giảng dạy của các giảng viên 53
Hình 2.3 Khó khăn khi thiết kế câu hỏi TNKQ chuẩn 59
Hình 2.4 Thời gian soạn câu hỏi TNKQ 60
Hình 2.5 Tỷ lệ GV phân tích câu hỏi thi 62
Hình 2.6 Tỷ lệ GV được bồi dưỡng phân tích câu hỏi thi 64
Hình 2.7 Sự phân bố năng lực chuẩn của 50 thí sinh 66
Hình 2.8 Kết quả thi học phần Xã hội học đại cương 66
Hình 2.9 Kết quả thi học phần Giải tích A1 67
Hình 2.10
Sự phân bố năng lực của các thí sinh với độ khó của bộ câu
hỏi tốt
69
Hình 2.11 Sự phân bố của 50 câu hỏi trong học phần KHMTĐC 71
Hình 2.12
Ma trận so sánh năng lực thí sinh với độ khó của các câu
hỏi thi
72
Hình chương 3
Hình 3.1 Kết quả thi thử nghiệm học phần “Sinh lý thực vật” 80
Hình 3.2
Sự phân bố của 50 câu hỏi đo năng lực của thí sinh trong
học phần “Sinh lý thực vật”
82
Hình 3.3 Ma trận so sánh năng lực thí sinh với độ khó câu hỏi 84
vi
DANH MỤC CÁC PHỤ LỤC
Tên phụ lục Trang
Phụ lục chương 2
Phụ lục 2.1
Phiếu điều tra khảo sát thực trạng quy trình thiết kế
đề thi TNKQ
102
Phụ lục 2.2 Đề thi kết thúc học phần Xã hội học đại cương 105
Phụ lục 2.3 Đề thi kết thúc học phần Giải tích A1 114
Phụ lục 2.4
Đề thi kết thúc học phần Khoa học môi trường đại
cương
118
Phụ lục chương 3
Phụ lục 3.1
Danh sách báo cáo viên và các CBGV tham dự bỗi
dưỡng về quy trình và kỹ thuật xây dựng đề thi
TNKQ, cách xử lý kết quả thi
125
Phụ lục 3.2
Danh sách nhóm GV tham gia xây dựng và thiết kế
đề thi thử nghiệm (sau khi tập huấn)
125
Phụ lục 3.3 Đề thi kết thúc học phần “Sinh lý thực vật” 126
Phụ lục 3.4 Chương trình chạy phần mềm Quest 131
vii
MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay chất lượng giáo dục đang trở thành mối quan tâm chung của toàn
xã hội, đặc biệt là chất lượng giáo dục đại học. Trong khi nguồn lực tại các cơ sở
đào tạo còn hạn chế, chưa đủ đáp ứng kịp thời việc tăng nhanh quy mô và các loại
hình đào tạo thì vấn đề chất lượng đào tạo trong giáo dục đại học hiện đang là điểm
nóng rất cần được quan tâm.
Một trong những nội dung quan trọng nhằm nâng cao chất lượng giáo dục
đại học chính là việc đổi mới phương pháp giảng dạy, trong đó có việc đổi mới về
phương pháp kiểm tra đánh giá kết quả học tập của người học. Có thể nói việc kiểm
tra đánh giá là hoạt động không thể thiếu của quá trình dạy và học. Thông qua kiểm
tra đánh giá trình độ nhận thức, kỹ năng, kỹ xảo của người học sẽ phát hiện những
sai sót, những lỗ hổng về kiến thức… từ đó giúp giáo viên và học sinh tự điều chỉnh
hoạt động dạy và hoạt động học.
Theo cách thức thực hiện hệ thống các câu hỏi của quá trình dạy học, lý luận
giáo dục xem xét kiểm tra và đánh giá như là một nhóm phương pháp dạy học. Từ
xưa tới nay kiểm tra đánh giá kết quả học tập của người học nói chung thường sử
dụng 2 hình thức thi chủ yếu là: thi viết (tự luận) và thi vấn đáp. Thực tế, hai hình
thức này chưa kiểm tra, đánh giá đầy đủ kiến thức đã học của người học một cách
nhanh gọn, toàn diện và khách quan. Thi viết (tự luận) và thi vấn đáp, phạm vi đề ra
còn hạn chế về kiến thức, nhất là đối với kỳ thi học kỳ hoặc thi tốt nghiệp thì nội
dung đề ra không thâu tóm, không bao quát hết chương trình môn học và không
đánh giá được chính xác năng lực của người học. Mặt khác, hai hình thức thi này
còn hạn chế về tính khách quan, giáo viên thường huy động kiến thức của một bài
hoặc một chương để ra đề thi, dễ dẫn đến học sinh học tủ, học lệch, quay cóp…
Hướng tới yêu cầu kiểm tra đánh giá công bằng, khách quan kết quả học tập
của người học, để đổi mới phương pháp kiểm tra đánh giá người ta bổ sung các hình
thức đánh giá khác như sử dụng hình thức thi trắc nghiệm khách quan; chú ý tới
việc đánh giá quá trình lĩnh hội tri thức của người học; quan tâm tới việc tích cực
1
hoá hoạt động học tập của người học… Trên cơ sở nắm chắc kiến thức đo lường và
đánh giá trong giáo dục, cần tiến hành xây dựng ngân hàng câu hỏi trắc nghiệm
(gồm cả câu hỏi TNKQ và tự luận) chuẩn hoá cho từng môn học. Sử dụng ngân
hàng này, người học có thể tự ôn tập kiểm tra kiến thức, giáo viên có thể sử dụng để
kiểm tra đánh giá học sinh. Để làm được điều này, phải bắt đầu từ việc đào tạo đội
ngũ chuyên gia về đánh giá trong giáo dục và bồi dưỡng các kiến thức về khoa học
đo lường đánh giá trong giáo dục cho giáo viên ở mọi cấp học, bậc học.
Công cuộc đổi mới phương pháp giảng dạy ở trường đại học hiện nay đang
được đặc biệt quan tâm, các giảng viên được tập huấn về đổi mới phương pháp
giảng dạy, các phương pháp kiểm tra đánh giá, tuy nhiên hiệu quả chưa cao. Sử
dụng ngân hàng câu hỏi và thi trắc nghiệm khách quan hiện đang được các trường
khuyến khích, tuy nhiên đa số các câu hỏi trắc nghiệm khách quan do giảng viên tự
biên soạn chưa theo đúng quy trình, đặc biệt các câu hỏi sau khi sử dụng không
được phân tích, đánh giá nên các đề thi/ kiểm tra hiện nay là chưa chuẩn và chất
lượng không cao.
Trước tình hình như vậy, tôi chọn đề tài luận văn: “Đánh giá quy trình thiết
kế đề thi trắc nghiệm khách quan tại Khoa Khoa học Tự nhiên và Xã hội
(nay là trường Đại học Khoa học) – Đại học Thái Nguyên”. Kết quả nghiên cứu
của luận văn sẽ là tài liệu cần thiết góp phần vào quá trình nâng cao chất lượng và
hiệu quả của việc biên soạn và thiết kế đề thi trắc nghiệm khách quan tại đơn vị,
đồng thời giúp đưa ra những giải pháp nhằm nâng cao kỹ năng của giảng viên trong
việc thiết kế câu hỏi TNKQ dùng để kiểm tra đánh giá kết quả học tập của sinh
viên.
2. Mục đích nghiên cứu của đề tài
• Đánh giá quy trình và hiệu quả của việc thiết kế và sử dụng các đề thi trắc
nghiệm khách quan hiện nay của Nhà trường;
• Đưa ra quy trình chuẩn thiết kế các đề thi trắc nghiệm khách quan.
• Đưa ra những giải pháp nhằm nâng cao kỹ năng thiết kế đề thi TNKQ của
giảng viên.
2
3. Nhiệm vụ nghiên cứu của đề tài
Để thực hiện mục đích trên, đề tài có các nhiệm vụ sau:
- Khảo sát thực trạng về quy trình, cách thức thiết kế đề thi trắc nghiệm khách
quan của các giảng viên trong Trường.
- Phân tích các câu hỏi trắc nghiệm khách quan của các đề thi đã được sử dụng
(căn cứ vào kết quả trả lời trắc nghiệm của sinh viên).
- Đưa ra quy trình chuẩn thiết kế đề thi trắc nghiệm khách quan.
4. Giới hạn, phạm vi nghiên cứu
• Đề tài nghiên cứu phương pháp, cách thức thiết kế đề thi trắc nghiệm khách
quan của các giảng viên trong Trường;
• Nghiên cứu, đánh giá các câu hỏi trắc nghiệm khách quan của một số đề thi
TNKQ đã được sử dụng trong Trường, từ đó đề xuất quy trình chuẩn thiết kế
đề thi TNKQ.
5. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài.
5.1. Câu hỏi nghiên cứu
• Hiện nay các giảng viên trong Trường thiết kế đề thi TNKQ trên cơ sở nào?
Theo quy trình nào?
• Các giảng viên có nắm được quy trình thiết kế một đề thi TNKQ hay không?
• Đề thi của các giảng
viên có đáp ứng yêu cầu kiểm tra đánh giá thành quả
học tập hay không?
5.2. Giả thuyết nghiên cứu
• Việc thiết kế đề thi TNKQ trong Nhà trường hiện nay hoàn toàn theo tính chủ
quan của các giảng viên.
• Chất lượng của các câu hỏi, đề thi TNKQ do các giảng viên biên soạn không
cao, không đánh giá chính xác năng lực của sinh viên.
6. Khách thể và đối tượng nghiên cứu
6.1. Khách thể nghiên cứu
• Các giảng viên đang giảng dạy tại Trường và đang áp dụng hình thức thi
TNKQ cho các kỳ thi của Nhà trường.
3
• Các bài thi TNKQ (kết quả thi TNKQ do sinh viên làm)
6.2. Đối tượng nghiên cứu
• Nghiên cứu cách thức, quy trình thiết kế đề thi TNKQ của các giảng viên
trong Trường hiện nay.
7. Phương pháp nghiên cứu
7.1. Nghiên cứu lý thuyết
• Nghiên cứu các tài liệu về đo lường đánh giá trong giáo dục.
7.2. Nghiên cứu thực nghiệm
• Quan sát: quan sát quá trình thực hiện đổi mới kiểm tra đánh giá của
giảng
viên, quá trình thử nghiệm xây dựng ngân hàng câu hỏi TNKQ.
• Điều tra: bằng phiếu hỏi và phỏng vấn để tìm hiểu quy trình thiết kế đề thi
TNKQ của các giảng viên trong Trường.
• Phân tích và tổng kết kinh nghiệm
7.3. Phương pháp Toán học
• Sử dụng phần mềm SPSS phân tích số liệu thống kê.
• Sử dụng phần mềm chuyên dụng Quest, ConQuest.
8. Cấu trúc của luận văn
Mở đầu
Chương 1. Cơ sở lý luận và tổng quan về quy trình thiết kế đề thi.
Chương 2. Thực trạng quy trình thiết kế đề thi TNKQ tại trường Đại học
Khoa học – Đại học Thái Nguyên.
Chương 3. Một số biện pháp nâng cao hiệu quả quy trình thiết kế đề thi
TNKQ tại trường Đại học Khoa học.
Kết luận và kiến nghị
Tài liệu tham khảo
Phụ lục
4
CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN
1.1. Lịch sử vấn đề nghiên cứu
1.1.1. Trên thế giới
Ở Châu Âu và Mỹ khoa học đo lường trong giáo dục phát triển rất mạnh vào
thời kì trước và sau chiến tranh thế giới thứ hai (mặc dù khoa học đo lường trong
giáo dục có thể xem như bắt đầu cách đây một thế kỉ).
Để đánh dấu một bước phát triển rất mạnh, lĩnh vực đo lường trong giáo dục
có các dấu mốc quan trọng, một loạt các trắc nghiệm và kĩ thuật ra đời như: Trắc
nghiệm trí tuệ Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập
tổng hợp đầu tiên Stanford Achievement Test ra đời vào 1923. Với việc đưa vào
chấm trắc nghiệm bằng máy của IBM năm 1935, việc thành lập National Council on
Measurement in Education (NCME) vào thập niên 1950 và ra đời Educational
Testing Services (ETS) năm 1947, một ngành công nghiệp trắc nghiệm đã hình
thành ở Mỹ. Từ đó đến nay khoa học về đo lường trong tâm lý và giáo dục đã phát
triển liên tục. Quá trình phát triển của khoa học đo lường trong giáo dục không phải
không có những phản hồi mà quá trình phát triển này phải chịu những phê bình chỉ
trích một cách thường xuyên, nhưng sự phê bình chỉ trích này không đánh đổ được
khoa học đo lường trong giáo dục, mà làm cho khoa học đo lường trong giáo dục có
cơ sở điều chỉnh những cái còn thiếu sót và khuyết điểm, những cái chưa làm được
để cho khoa học đo lường đánh giá trong giáo dục phát triển mạnh mẽ hơn [18].
Ngành công nghiệp trắc nghiệm ở Mỹ hiện nay ước tính mỗi năm số lượt trắc
nghiệm tiêu chuẩn hoá cỡ 1/4 tỉ và trắc nghiệm do giáo viên soạn lên đến con số 5
tỉ. Ngành công nghiệp trắc nghiệm phát triển nhanh kéo theo một loạt ngành liên
quan phát triển theo như: ngành công nghệ thông tin, lí thuyết đo lường trong tâm lí
phát triển giáo dục. Từ đó việc nâng cao độ chính xác trắc nghiệm ra đời, đó là công
nghệ trắc nghiệm nhờ máy tính (Computer Adaptive Test – CAT).
Một số nước trên thế giới dùng ngân hàng câu hỏi TNKQ để thi tuyển sinh
đại học.
5
Ở Mỹ các trường đại học không tổ chức thi tuyển mà dựa vào kết quả của
các kỳ thi do các công ty ngoài nhà nước tổ chức để xét tuyển. Có dịch vụ thi phục
vụ công việc này, đó là SAT (Scholastic Assesment Test) do công ty ETS tổ chức,
và ACT do Chương trình ACT (American College Testing Program) triển khai.
SAT cho thi 2 môn: Anh ngữ và Toán, còn ACT cho thi 4 môn: ngoài Anh ngữ và
Toán còn thi thêm đọc hiểu và suy luận khoa học.
Còn Nhật Bản, “Trung tâm quốc gia về Tuyển sinh đại học” được thành lập
năm 1977 tổ chức kỳ thi tuyển chung cho hầu hết các trường đại học công và tư của
Nhật Bản hàng năm. Đề thi được soạn cho 31 môn cụ thể, mỗi thí sinh có thể lựa
chọn thi 5 môn của 5 nhóm nào đó tuỳ theo quy định của trường đại học mà thí sinh
dự định dự tuyển. Để tổ chức mỗi năm một kỳ thi, Trung tâm này chi tiêu hàng năm
cỡ 100 triệu USD.
Với Thái Lan, kỳ thi tuyển sinh đại học liên kết được tổ chức cho hầu hết các
trường đại học công và tư từ hơn 30 năm nay. Với kết quả kỳ thi, thí sinh có thể xin
dự tuyển vào 5 ngành khác nhau của các trường đại học. Từ năm 1998, Thái Lan bắt
đầu cải tiến kỳ thi liên kết bằng cách xét thêm điểm trung bình học ở trường phổ
thông (với trọng số 10%) và cho thi mỗi năm 2 lần.
Ở Trung Quốc, từ năm 1989, việc tổ chức kỳ thi tốt nghiệp phổ thông trung
học được giao cho các địa phương, còn kỳ thi tuyển đại học được tổ chức thống
nhất trên cả lục địa Trung Quốc vào đầu tháng 7 hàng năm và đề thi chủ yếu bằng
ngân hàng câu hỏi TNKQ [18].
1.1.2. Việt Nam
Khoa học về đo lường và đánh giá trong giáo dục ở nước ta trước đây trong
tình trạng khá lạc hậu và chậm phát triển. Trước năm 1975, ở Miền Nam nước ta có
một vài người được đào tạo về khoa học này từ các nước phương Tây, trong đó có
giáo sư Dương Thiệu Tống. Ông đã đưa test vào ngành giáo dục để thực hiện nhưng
không thành công. Sau đó ông chỉ áp dụng ngân hàng câu hỏi vào việc thi kiểm tra
đánh giá và đặc biệt áp dụng vào việc thi tuyển sinh đại học. Trường Đại học áp
dụng mô hình thi trắc nghiệm đầu tiên ở nước ta là trường Đại học Đà Lạt. Vào năm
6
1974, kỳ thi tú tài lần đầu tiên được tổ chức ở Miền Nam bằng phương pháp TNKQ.
Vào những năm sau 1975, ở miền Bắc có một số cán bộ nghiên cứu về khoa học đo
lường trong tâm lý. Đến năm 1993, Bộ GD & ĐT đã mời một số chuyên gia nước
ngoài phổ biến về khoa học này, đồng thời cử cán bộ ra nước ngoài học tập. Từ đó
một số trường đại học có tổ chức các nhóm nghiên cứu áp dụng các phương pháp đo
lường trong giáo dục để thiết kế các công cụ đánh giá, soạn thảo các phần mềm hỗ
trợ, mua máy quét quang học chuyên dụng (OMR) để chấm thi. Kỳ thi tuyển đại học
thí điểm được tổ chức tại trường Đại học Đà Lạt vào tháng 7 năm 1996 bằng
phương pháp TNKQ. Kỳ thi này có 7200 thí sinh dự tuyển, 2 loại đề TNKQ và TL
được sử dụng để thí sinh tự chọn. Có khoảng 70% lượt thí sinh chọn đề TNKQ, bài
thi được chấm bằng máy Opscan-7, trong khoảng 60 trường hợp vi phạm kỷ luật thi
do quay cóp thì chỉ có 4 thí sinh từ nhóm làm đề TNKQ. [18]
Năm 1997, tác giả Nguyễn Phụng Hoàng đã cho ra đời cuốn sách: “Phương
pháp trắc nghiệm trong kiểm tra và đánh giá thành quả học tập”. Cuốn sách viết đại
cương về các vấn đề đo lường, đánh giá, các phương pháp đo, cách soạn một bài
trắc nghiệm khách quan,… tài liệu này rất bổ ích đối với các giáo viên và những
người quan tâm đến việc đánh giá kết quả học tập của sinh viên [2].
Ngày 02/03/1995, Trung tâm Đảm bảo chất lượng đào tạo và Nghiên cứu
phát triển giáo dục của Đại học Quốc gia Hà Nội được thành lập. Đây là đơn vị đầu
tiên ở Việt Nam nghiên cứu chuyên sâu về đảm bảo chất lượng giáo dục, đo lường
và đánh giá. Trung tâm đã và đang thực hiện nhiều đề tài nghiên cứu khoa học, các
dự án trong nước và quốc tế về các lĩnh vực: khảo thí, đo lường và đánh giá, phương
pháp giảng dạy và học tập tích cực, xử lý phân tích số liệu… Trung tâm hiện là đơn
vị đầu tiên trong cả nước tổ chức đào tạo Thạc sĩ Đo lường và Đánh giá trong Giáo
dục (Measurement and Evaluation in Education), theo quyết định số 307/SĐH của
Giám đốc Đại học Quốc gia Hà Nội. Nội dung chính của Khóa đào tạo Thạc sĩ là
cung cấp kiến thức và sự hiểu biết chuyên sâu về khoa học đo lường, đánh giá như:
các mô hình lý thuyết đo lường đánh giá trong giáo dục, các phương pháp và công
cụ đo lường đánh giá phù hợp cho từng lĩnh vực chuyên môn, kiến thức về xử lý,
7
phân tích các thông tin/ số liệu trong từng lĩnh vực thông qua việc sử dụng các phần
mềm chuyên dụng…
Năm 2002, Bộ Giáo dục và Đào tạo đã tổ chức kỳ thi tuyển đại học theo hình
thức “3 chung” và ngày 18/7/2003, Cục Khảo thí và Kiểm định chất lượng giáo dục
được thành lập theo Nghị định số 85/2003/NĐ-CP. Quyết định thành lập Cục Khảo
thí và Kiểm định chất lượng giáo dục đánh dấu một thời kỳ mới của sự phát triển hệ
thống đảm bảo chất lượng và kiểm định chất lượng giáo dục ở Việt Nam.
Năm 2003, Khoa Sư phạm Đại học Quốc gia Hà Nội đã xuất bản cuốn “Giáo
dục học Đại học”. Đây là cuốn tài liệu dùng để bồi dưỡng các lớp Giáo dục học đại
học và Nghiệp vụ sư phạm đại học. Trong phần 1 của cuốn sách, tác giả Lâm Quang
Thiệp đã có bài viết về Đo lường và đánh giá thành quả học tập. Tác giả đã đề cập
đến rất nhiều nội dung như: đánh giá và đánh giá giáo dục; các phương pháp trắc
nghiệm; chất lượng của các câu trắc nghiệm và của đề thi trắc nghiệm; đánh giá
thành quả học tập ở trường đại học; và việc áp dụng khoa học đo lường trong giáo
dục trên thế giới và ở Việt Nam. Đây là một nội dung rất hữu ích cho các sinh viên,
học viên cao học và các nghiên cứu sinh ngành đo lường đánh giá trong giáo dục
tham khảo [18].
Năm 2004, tác giả Nguyễn Công Khanh đã viết cuốn “Đánh giá và đo lường
trong khoa học xã hội” do NXB Chính trị Quốc gia xuất bản. Nội dung cuốn sách
trình bày các phương pháp luận, quy trình, các nguyên tắc và thiết kế công cụ đo
lường, các phương pháp phân tích item, cách chọn mẫu, đánh giá độ tin cậy, độ hiệu
lực… Cuốn sách đã và đang là tài liệu bổ ích về các kỹ năng thực hành nghiên cứu
cho những ai quan tâm [3].
Trong cuốn Giáo dục đại học, tác giả Lê Đức Ngọc đã tổng hợp các bài tham
luận tuyển chọn từ các hội thảo trong nước và quốc tế, trình bày các quan điểm và
giải pháp về giáo dục đại học cho giai đoạn 1995-2010. Trong cuốn sách này có đề
cấp một số vấn đề như: Cải tiến thi tuyển sinh đại học – một yêu cầu cấp thiết để
nâng cao chất lượng đào tạo; Một số giải pháp nhằm nâng cao chất lượng dạy và
học. Tháng 5/2005, tác giả Lê Đức Ngọc đã viết tiếp cuốn sách “Đo lường và đánh
8
giá thành quả học tập”, trong đó tác giả có nhấn mạnh các phương pháp đo lường,
các loại câu hỏi trắc nghiệm, cấu trúc đề thi…
Năm 2005, Trung tâm ĐBCLĐT&NCPTGD thuộc ĐHQGHN đã xuất bản
cuốn “Giáo dục đại học - chất lượng và đánh giá”. Cuốn sách gồm có 3 phần: Phần
1: Đánh giá hoạt động giảng dạy và nghiên cứu khoa học của giảng viên; Phần 2:
Đánh giá hoạt động học tập và nghiên cứu khoa học của sinh viên và học viên cao
học; Phần 3: Đánh giá chương trình đào tạo và chương trình giảng dạy. Đây là cuốn
sách với rất nhiều nội dung phong phú bao chứa các vấn đề được xã hội rất quan
tâm về chất lượng giáo dục đại học. Cuốn sách này sẽ là một tài liệu tham khảo rất
hữu ích cho các nhà quản lý giáo dục, các giảng viên, sinh viên, học viên cao học và
tất cả những ai quan tâm đến việc nâng cao chất lượng giáo dục đại học Việt Nam
[23].
Cũng trong thời gian này có nhiều công trình nghiên cứu của các tác giả:
PGS.TS Nguyễn Phương Nga, PGS.TS Lê Đức Ngọc, TS Phạm Xuân Thanh và
một số tác giả khác đã nghiên cứu về đề tài đo lường và đánh giá trong giáo dục.
Với việc ngày càng chú trọng vào công tác đánh giá chất lượng giáo dục, Bộ
GD & ĐT đã có nhiều biện pháp nhằm đổi mới quá trình đánh giá kết quả học tập
cho học sinh, sinh viên nhằm đảm bảo tính khách quan, công bằng và đánh giá
chính xác năng lực người học.
1.2. Các khái niệm cơ bản về đo lường và đánh giá trong giáo dục
• Đo lường (Measurement)
Đo lường là quá trình thu thập thông tin một cách định lượng (số đo) về các
đại lượng đặc trưng của quá trình giáo dục (nhận thức, tư duy, kỹ năng và phẩm chất
nhân văn). Nói một cách cụ thể hơn, đo lường là hoạt động thông qua việc thi kiểm
tra để xác định mức độ người học nắm được kiến thức một môn học hoặc mức độ
hiểu biết về một vấn đề nào đó. Kết quả đo lường thể hiện dưới dạng một đại lượng
định lượng. Trong đánh giá, đo lường là so sánh một sự vật hiện tượng với một
chuẩn mực nào đó. Khi sử dụng khái niệm này chúng ta muốn khẳng định tính định
lượng, tính chính xác, tính đơn nhất của kết quả đánh giá. [11]
9
• Đánh giá (Evaluation)
Có rất nhiều khái niệm về đánh giá trong giáo dục, tùy thuộc vào các cấp độ
đánh giá, vào đối tượng, vào mục đích đánh giá mà mỗi định nghĩa đều nhấn mạnh
về lĩnh vực cần đánh giá.
Theo Jean Marie De Ketele, “đánh giá” có nghĩa là:
+ Thu thập thông tin đủ thích hợp, có giá trị và đáng tin cậy.
+ Xem xét mức độ phù hợp giữa tập hợp thông tin này với một tập hợp các
tiêu chí phù hợp với mục tiêu định ra ban đầu hay đã điều chỉnh trong quá trình thu
thập thông tin.
+ Nhằm ra một quyết định.
Theo Ralph tyler: “Quá trình đánh giá chủ yếu là quá trình xác định mức độ
thực hiện các mục tiêu trong các chương trình giáo dục.”
Theo E.Beeby: “Đánh giá giáo dục là sự thu thập lí giải một cách hệ thống
những bằng chứng, như một phần của quá trình, dẫn tới sự phán xét về giá trị theo
quan điểm hoạt động.”
Theo Robert F.mager: “Đánh giá là việc miêu tả tình hình của học sinh và
giáo viên để dự đoán công việc phải tiếp tục và giúp học sinh tiến bộ.”
Từ các định nghĩa trên chúng ta thấy khái niệm đánh giá trong giáo dục phần
lớn được xem xét dựa trên sự phù hợp giữa mục tiêu đề ra với việc thực hiện mục
tiêu đó.
Vấn đề đo lường và đánh giá trong giáo dục thường được người ta quan tâm
đến việc thông qua quá trình đánh giá để xem xét các mục tiêu giáo dục đề ra đạt
được như thế nào. Bởi vậy: “Đánh giá là một khái niệm để chỉ việc thu thập thông
tin một cách hệ thống, xử lý, phân tích dữ liệu làm cơ sở để đưa ra các quyết định
nhằm nâng cao chất lượng giáo dục”. Đánh giá là quá trình thu thập và xử lý kịp
thời có hệ thống thông tin về hiện trạng, khả năng hay nguyên nhân của chất lượng
và hiệu quả giáo dục căn cứ vào mục tiêu giảng dạy, mục tiêu đào tạo làm cơ sở cho
những chủ trương, biện pháp và hành động giáo dục tiếp theo nhằm phát huy kết
quả, sửa chữa những thiếu sót.
10
• Lượng giá (Assessment)
Lượng giá là việc đưa ra thông tin có tính ước lượng về một vấn đề nào đó.
Trong giáo dục, lượng giá là ước lượng năng lực hoặc phẩm chất của sản phẩm đào
tạo trong quá trình giáo dục theo các hệ thống quy tắc hoặc tiêu chuẩn nào đó, căn
cứ vào các thông tin định tính hoặc định lượng (số đo). Lượng giá có thể thực hiện
đầu quá trình giảng dạy để giúp tìm hiểu và chẩn đoán (diagnostic) về đối tượng
giảng dạy, có thể triển khai trong tiến trình (formative) giảng dạy để tạo những
thông tin phản hồi giúp điều chỉnh quá trình dạy và học, cũng có thể thực hiện lúc
kết thúc (summative) để tổng kết. Trong giảng dạy ở nhà trường, các đo lường trong
tiến trình thường gắn chặt với người dạy, tuy nhiên các đo lường kết thúc thường
bám sát vào mục tiêu dạy học đã được đề ra, và có thể tách khỏi người dạy. [11]
• Kiểm tra (testing)
Theo khoa học giáo dục: Kiểm tra là phương tiện và hình thức của đánh giá.
Trong kiểm tra người ta xác định được trước các tiêu chí và không thay đổi chúng
trong quá trình kiểm tra cũng như không quan tâm đến quyết định đề ra. Như vậy,
kiểm tra là quá trình hẹp hơn đánh giá, hay nói cách khác kiểm tra là một khâu của
quá trình đánh giá.
Trong quá trình dạy học, kiểm tra – đánh giá là một thành phần của quá trình
dạy học, đảm nhận một chức năng lí luận dạy học cơ bản, chủ yếu không thể thiếu
được trong quá trình này. Kiểm tra có 3 chức năng bộ phận liên kết, thống nhất,
thâm nhập vào nhau và bổ sung cho nhau đó là: đánh giá, phát hiện lệch lạc và điều
chỉnh.
Về mặt lí luận dạy học: Kiểm tra có vai trò thông tin ngược trong dạy học, nó
cho biết những thông tin, kết quả về quá trình dạy của thầy và quá trình học của trò
để từ đó có những quyết định cho sự điều khiển tối ưu của cả thầy và trò. Học sinh
sẽ học tốt hơn nếu thường xuyên được kiểm tra và được đánh giá một cách nghiêm
túc, công bằng với kĩ thuật tốt và hiệu nghiệm.
• Thi (Examination)
11
Thi: Làm bài theo đề đã ra nhằm kiểm tra kiến thức hoặc tay nghề để công
nhận đạt trình độ, tiêu chuẩn nào đã có sẵn.
Theo khoa học giáo dục: Thi cũng là kiểm tra nhưng có tầm quan trọng hơn,
được dùng khi kết thúc một giai đoạn đào tạo. Nếu trong kiểm tra, tính chất “tổng
kết” (summative) có thể nổi trội hoặc không nổi trội so với tính chất “quá trình”
(formative) thì trong thi, tính chất tổng kết luôn luôn là tính chất nổi trội so với tính
chất quá trình.
• Kết quả học tập (Study achievement):
Trong khoa học và trong thực tế thì KQHT được hiểu theo hai nghĩa sau đây:
+ Thứ nhất: KQHT là mức độ người học đạt được so với các mục tiêu đã xác
định (dựa vào các tiêu chí).
+ Thứ hai: KQHT là mức độ mà người học đạt được so sánh với những
người cùng học khác (theo chuẩn).
Dù hiểu theo cách nào thì KQHT đều thể hiện ở mức độ đạt được mục tiêu
của việc dạy học. Mục tiêu của việc dạy học gồm có mục tiêu về: kiến thức, kỹ
năng và thái độ. Ở bậc đại học, việc đánh giá KQHT bao gồm 2 loại đánh giá khác
nhau tùy theo mục tiêu đánh giá:
+ Đánh giá quá trình (Formative assessment): Loại đánh giá này được tiến
hành nhiều lần trong quá trình đào tạo nhằm cung cấp các thông tin ngược để giảng
viên và học viên kịp thời điều chỉnh quá trình đào tạo. Kiểu đánh giá này được tiến
hành sau khi kết thúc một nội dung học tập, sau một bài học hay sau một đơn vị học
trình hoặc thậm chí là một chương để thu thập sự phản hồi nhanh của sinh viên để
giảng viên có thể kịp thời bổ sung những phần kiến thức còn thiếu hụt của họ, đồng
thời bổ sung thêm phần tài liệu còn thiếu và điều chỉnh nội dung, chương trình và
phương pháp giảng dạy cho phù hợp với người học ở các giai đoạn khác nhau. Loại
đánh giá này cũng giúp sinh viên điều chỉnh hoạt động học tập của mình và nó cũng
cung cấp các số liệu chứng minh sự tiến bộ của sinh viên. Bởi vậy loại đánh giá này
nên được sử dụng thường xuyên.
12
+ Đánh giá tổng kết (Summative assessment): Được tiến hành khi kết thúc
quá trình đào tạo nhằm cung cấp các thông tin về chất lượng đào tạo. Loại đánh giá
này nhằm xếp loại sinh viên được học tiếp hay không hoặc nó còn để cấp các văn
bằng hay chứng chỉ. Đánh giá tổng kết cho số liệu để thừa nhận hay bác bỏ sự hoàn
thành hoặc chưa hoàn thành một chương trình học, nó chỉ tiến hành sau khi kết thúc
một giai đoạn học tập nhất định như kết thúc môn học, kết thúc khóa học. Do vậy,
loại đánh giá này không được tiến hành thường xuyên. Với một học phần cụ thể thì
đánh giá tổng kết chỉ ra mức độ mà sinh viên đạt được như thế nào trong các mục
tiêu cụ thể trong môn học đó.
1.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá
1.3.1. Kiểm tra đánh giá kết quả học tập:
Là quá trình đo lường mức độ đạt được của học sinh về các mục tiêu và
nhiệm vụ của quá trình dạy học, là mô tả một cách định tính và định lượng: tính đầy
đủ, tính đúng đắn, tính chính xác, tính vững chắc của kiến thức; mối liên hệ của kiến
thức với đời sống, các khả năng vận dụng kiến thức vào thực tiễn, mức độ thông
hiểu, khả năng diễn đạt bằng lời nói, bằng văn viết, bằng chính ngôn ngữ chuyên
môn của học sinh… và cả thái độ của học sinh trên cơ sở phân tích các thông tin
phản hồi từ việc quan sát, kiểm tra, đánh giá mức độ hoàn thành nhiệm vụ được
giao, đối chiếu với những chỉ tiêu, yêu cầu dự kiến, mong muốn đạt được của môn
học.
Quy trình kiểm tra đánh giá gồm những công đoạn sau:
1- Phân tích mục tiêu học tập qua các kiến thức, kĩ năng trang bị cho người
học.
2- Đặt ra các yêu cầu về mức độ đạt được các kiến thức, kĩ năng dựa trên
những dấu hiệu có thể đo lường hoặc quan sát được.
3- Tiến hành đo lường các dấu hiệu đó để đánh giá mức độ đạt được về các
yêu cầu đặt ra, biểu thị bằng điểm số.
13
4- Phân tích, so sánh các thông tin nhận được với các yêu cầu đặt ra rồi đánh
giá, xem xét kết quả học tập của học sinh, xem xét mức độ thành công của phương
pháp giảng dạy của giáo viên để từ đó cải tiến, khắc phục những nhược điểm.
Điều quan trọng trong kiểm tra đánh giá là quán triệt nguyên tắc vừa sức,
bám sát yêu cầu của chương trình. Kiểm tra đánh giá kết quả học tập dựa trên tiêu
chí của mục tiêu dạy học sẽ nhận những thông tin phản hồi chính xác nhằm bổ sung,
hoàn thiện quá trình dạy học.
1.3.2. Mục đích, ý nghĩa của việc kiểm tra, đánh giá KQHT:
Kiểm tra, đánh giá là một yếu tố quan trọng của giáo dục, nó có mối quan hệ
khăng khít với sự phát triển của xã hội. Mục đích của việc KTĐG là nhằm xác định
mức độ tiếp thu của sinh viên và mức độ truyền thụ kiến thức của giáo viên so với
mục tiêu đề ra. Tuy KT, ĐG là hai công việc khác nhau nhưng có mối quan hệ mật
thiết và hữu cơ với nhau. Kiểm tra nghiêm túc thì sẽ dẫn đến việc đánh giá chính
xác. Đánh giá chính xác sẽ là nguồn động lực thúc đẩy quá trình học tập của sinh
viên. Do vậy, quá trình KT, ĐG không chỉ quan trọng và có ý nghĩa quyết định đối
với sinh viên và giáo viên mà còn có ý nghĩa rất lớn đối với những người làm công
tác quản lý.
+ Đối với giáo viên:
Thông qua KT, ĐG, giáo viên thu được những thông tin về hoạt động nhận
thức của sinh viên trong quá trình học, dự đoán xem sinh viên có đủ điều kiện để
tiếp thu kiến thức mới hay không, từ đó định hướng cụ thể cho việc bồi dưỡng, điều
chỉnh, bổ sung kiến thức cho phù hợp với từng đối tượng.
Thông qua đó giáo viên tự điều chỉnh nội dung, phương pháp, hình thức tổ
chức sư phạm cho phù hợp với từng nội dung bài giảng và từng đối tượng cụ thể.
+ Đối với sinh viên:
Việc KT, ĐG có hệ thống và thường xuyên cung cấp kịp thời thông tin về kết
quả học tập của sinh viên. Từ đó, sinh viên tự điều chỉnh, tự hoàn thiện quá trình
học tập của mình cho phù hợp.
14