Tải bản đầy đủ (.docx) (169 trang)

Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.82 MB, 169 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC GIÁO DỤC
------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN LỚP
12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU HỎI NHỊ PHÂN,
ĐA PHÂN VÀ ĐA CHIỀU

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC

Hà Nội - 2017


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC GIÁO DỤC
------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN
LỚP 12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU
HỎI NHỊ PHÂN, ĐA PHÂN VÀ ĐA CHIỀU

CHUYÊN NGÀNH: ĐO LƢỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC

Mã số: 8140115

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC


Ngƣời hƣớng dẫn khoa học: GS.TSKH. LÂM QUANG THIỆP

Hà Nội - 2017


LỜI CAM ĐOAN
Tôi xin cam đoan, Luận văn Thạc sĩ Đo lƣờng và đánh giá trong giáo dục với
đề tài: “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề tổng
hợp với các câu hỏi nhị phân, đa phân và đa chiều” là công trình nghiên cứu riêng
của tôi, dƣới sự hƣớng dẫn của GS.TSKH. LÂM QUANG THIỆP.
Tôi xin cam đoan:
- Luận văn là sản phẩm nghiên cứu của tôi
- Các thông tin, số liệu, kết quả nghiên cứu trong luận văn là trung thực và chƣa

từng đƣợc ai công bố trong bất kỳ phƣơng tiện thông tin đại chúng nào trƣớc
đây. Tôi xin chịu trách nhiệm về kết quả nghiên cứu của mình
Tác giả luận văn

Trần Văn Thanh

i


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn trân trọng đến những ngƣời đã giúp đỡ tôi hoàn thành
luận văn này.
Trƣớc hết, tôi xin trân trọng cảm ơn các lãnh đạo Trƣờng Đại Học Giáo dục,
Bộ môn Đo lƣờng và đánh giá, các thầy, cô của trƣờng Đại Học Giáo dục đã tận
tình giảng dạy, hƣớng dẫn và giúp đỡ tôi trong quá trình học tập, nghiên cứu và làm
luận văn.

Tôi xin bày tỏ sự biết ơn sâu sắc đến: GS.TSKH. Lâm Quang Thiệp, thầy đã
tận tâm giúp đỡ, hƣớng dẫn tôi trong quá trình nghiên cứu, thực hiện đề tài. Đặc
biệt trong những lúc tôi gặp khó khăn về định hƣớng, động lực nghiên cứu, thầy đã
động viên và hƣớng dẫn tôi cặn kẽ.
Tôi xin chân thành cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động
viên, khuyến khích tôi trong suốt quá trình học tập và nghiên cứu.
Xin chân thành cảm ơn
Tác giả luận văn

Trần Văn Thanh

ii


MỤC LỤC
LỜI CAM ĐOAN
LỜI CÁM ƠN
MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TĂT ………………………………………….
DANH MỤC CÁC HÌNH VẼ ……………………………………………….
DANH MỤC CÁC BẢNG BIỂU ……………………………………………
MỞ ĐẦU ……………………………………………………………………
1.

Lý do chọn đề tài ………………………………………………………….

2. Mục đích nghiên cứu ……………………………………………………...
3.

Đối tƣợng và khách thể nghiên cứu ……………………………………….


4.

Câu hỏi nghiên cứu và giả thuyết nghiên cứu …………………………….

5. Phƣơng pháp nghiên cứu ……………………………………………………
6.

Giới hạn và phạm vi nghiên cứu ………………………………………….

7.

Cấu trúc của luận văn ……………………………………………………

Chƣơng 1: Cơ sở lý luân và tổng quan vấn đề nghiên cứu ………………….
1.

1. Tổng quan về đo lƣờng trong giáo dục …………………………………

1.1.1. Các khái niệm cơ bản về đo lƣờng đánh giá ………………………….
1.1.2. Các phƣơng pháp đo lƣờng trong giáo dục ……………………………
1.1.3. Đánh giá kết quả học tập của học sinh ………………………………..
1.1.4. Công cụ đo lƣờng kết quả học tập …………………………………….
1.1.5. Sơ lƣợc về khoa học đo lƣờng đánh giá trên thế giới và Việt Nam …..
1.2. Lý thuyết đánh giá cổ điển ………………………………………………
1.2.1. Các tham số đặc trƣng của câu hỏi trắc nghiệm và phân tích đề trắc
nghiệm ……………………………………………………………………….
1.2.2. Điểm số học tập ……………………………………………………….
1.3. Lý thuyết ứng đáp câu hỏi ………………………………………………


iii


1.3.1 Tổng quan về lý thuyết ứng đáp câu hỏi ………………………………
1.3.2. Hàm đặc trƣng câu hỏi ………………………………………………..
1.3.3. Điểm thực và đƣờng cong đặc trƣng đề trắc nghiệm ……………........
1.3.4. Hàm thông tin của câu hỏi và của đề trắc nghiệm …………………….
1.3.5. Ƣớc lƣợng năng lực thí sinh và tham số câu hỏi ……………………...
1.3.6. So bằng và kết nối các đề trắc nghiệm ……………………………. …
1.3.7. Về trắc nghiệm đa phân và trắc nghiệm đa chiều …………………. …
1.3.8. Ví dụ về ƣớc lƣợng tham số câu hỏi ………………………………. …
Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi …………………………...
2.1.

Đặt vấn đề …………………………………………………………

2.2.

Quy trình xây dựng một đề thi, đề kiểm tra ………………………

2.2.1. Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan ……...
2.2.2. Quy trình triển khai một kỳ thi trắc nghiệm khách quan ……………..
2.3.

Xây dựng đề thi môn toán …………………………………………

2.3.1. Chuẩn bị ……………………………………………………………….
2.3.2. Xây dựng bảng ma trận trọng số ………………………………………
2.3.3. Biên soạn câu hỏi thi ………………………………………………….
2.4.


Thử nghiệm đề thi …………………………………………………

2.4.1. Chọn mẫu nghiên cứu …………………………………………………
2.4.2. Kế hoạch thực hiện ……………………………………………………
2.4.3. Kết quả thử nghiệm ……………………………………………………
Chƣơng 3: Kết quả nghiên cứu ………………………………………………
3.1.

Giới thiệu …………………………………………………………

3.2.

Phân tích tham số câu hỏi thi ………………………………………

3.2.1. Phân tích câu hỏi thi bằng CTT ……………………………………….
3.2.2. Phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại ………………..
3.2.3. Phân tích câu hỏi thi đa chiều …………………………………………
3.2.4. Phân tích câu hỏi thi đa phân …………………………………………
3.3.

Một số kết quả phân tích câu hỏi thi ………………………………

iv


3.3.1. Quy trình hiệu chuẩn đề kiểm tra ……………………………………..
3.3.2. Các đặc trƣng về các đề thử nghiệm ………………………………….
KẾT LUẬN ……………………………………………………………….....
KHUYẾN NGHỊ ………………………………………………………….....

DANH MỤC TÀI LIỆU THAM KHẢO ……………………………………
PHỤ LỤC ……………………………………………………………………
Phụ lục 1: Phân phối chƣơng trình toán Lớp 12 ……………………………
Phụ lục 2: Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến
thức kĩ năng bộ giáo dục ban hành. ………………………………………….
Phụ lục 3: Định dạng biên soạn câu hỏi thi. …………………………………
Phụ lục 4: Đặc tả nội dung kiến thức từng câu hỏi theo ma trận trọng số
trong đề thi. ………………………………………………………………….
Phụ lục 5: Đề thi thử nghiệm 01 . ……………………………………………

v


DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt
BGD
CH
CTT
ĐKVP
ĐTCH
ĐTN
HS
IRT
ICF
NHCH
PCM
THPT
TL
TNKQ
TN

TS

vi


DANH MỤC CÁC BẢNG BIỂU
STT
1

Bảng 1.1 So sánh ƣu nhƣợc điểm của

2

Bảng 1.2 Hình thức thi TNKQ và tự lu

3

Bảng 1.3 Mô tả câu nhóm các câu hỏi

4

Bảng 1.4 Dữ liệu thử nghiệm của câu h

5

Bảng 1.5 Dữ liệu tính toán ƣớc lƣợng

6

Bảng 1.6 Dữ liệu tính toán ƣớc lƣợng


7

Bảng 2.1 Quy trình xây dựng đề thi

8

Bảng 2.2 Ma trận đề thi môn toán 12

9

Bảng 2.3 Bảng mô tả chi tiết từng câu

10

Bảng 2.4 Quy trình biên soạn câu hỏi t

11

Bảng 2.5 Bảng xây dựng câu hỏi thi

12

Bảng 2.6

13

Bảng 3.1

14


Bảng 3.2

15

Bảng 3.3

vii


DANH MỤC CÁC HÌNH VẼ
STT
1
2

3

4

5

6

7
8
9

Tên hình vẽ
Hình 1.1. Đƣờng cong ĐTCH một tham số


Hình 1.2. Các đƣờng cong ĐTCH hai tham s
nhau
Hình 1.3. Các đƣờng cong ĐTCH 3 tham số
0,2.

Hình 1.4. Đƣờng cong đặc trƣng của ĐTN g
cong ĐTCH tƣơng ứng.
Hình 1.5. Các đồ thị hàm thông tin của 5 CH
ĐTN do 5 CH đó hợp thành

Hình 1.6. Các đƣờng cong ĐTCH trắc nghiệm
suất trả lời sai

Hình 1.7. Các đƣờng cong ĐTCH của một C
(với δ1<δ2).

Hình 1.8. Mặt ĐTCH với 2 chiều năng lực θ1

Hình 1. 9. Hai kiểu biểu hiện tính đa chiều củ
nghiệm.

10

Hình 1.10. Mô tả đáp ứng câu hỏi

11

Hình 1.11. Hàm đặc trƣng câu hỏi

12


Hình 1.12. Ƣớc lƣợng hàm đặc trƣng của câ

13

Hình 1.13. Tham số ƣớc lƣợng của câu hỏi

14

Hình 1.14. Đồ thị hàm đặc trƣng của câu hỏi

15

Hình 1.15. Đồ thị của hàm đặc trƣng câu hỏi

16

17

Hình 1.16. Hình ảnh ƣớc lƣợng tham số câu
năng lực thấp
Hình 1.17. Hình ảnh ƣớc lƣợng tham số câu
năng lực cao


viii


18


Hình 1.18. Hình ảnh ƣớc lƣợng tham số câu
năng lực phổ quát

19 Hình 3.1. Đồ thị hàm đặc trƣng câu hỏi số 4.

20 Hình 3.2. Đồ thị hàm đặc trƣng câu hỏi số 21

21 Hình 3.3. Đồ thị hàm đặc trƣng câu hỏi số 39

22 Hình 3.4. Đồ thị hàm đặc trƣng câu hỏi số 40
23 Hình 3.5. Bản đồ phân bố độ khó câu hỏi thi

24 Hình 3.6. Đƣờng cong đặc trƣng của đề thi s
25 Hình 3.7. Hàm thông tin của đề thi số 1.
26 Hình 3.8. Hàm thông tin của đề thi số 2.
27 Hình 3.9. Hàm thông tin của đề thi số 3.
28 Hình 3.10. Hàm thông tin của đề thi số 4.
29 Hình 3.11. Năng lực giải tích của TS
30 Hình 3.12. Năng lực đại số của TS
31 Hình 3.13. Năng lực hình học của TS
32

33

34

35

Hình 3.14. Biểu đồ tƣơng quan giữa năng lực
của đề thi 01


Hình 3.15. Biểu đồ tƣơng quan giữa năng lực
của đề thi 02

Hình 3.16. Biểu đồ tƣơng quan giữa năng lực
của đề thi 03

Hình 3.17. Biểu đồ tƣơng quan giữa năng lực
của đề thi 04


ix


MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay có hai hình thức thi cử kiểm tra chủ yếu trong các cơ sở giáo dục là
trắc nghiệm khách quan và tự luận.
Việc kiểm tra đánh giá ở các nhà trƣờng từ trƣớc đến nay phần lớn đều sử dụng
phƣơng pháp kiểm tra bằng hình thức tự luận. Phƣơng pháp này có ƣu điểm nổi bật là
ít tốn thời gian ra đề; đánh giá đƣợc khả năng trình bày, diễn đạt của học sinh; khuyến
khích học sinh rèn luyện khả năng tƣ duy logic, khả năng suy diễn, tổng quát hóa, phát
huy óc sáng tạo của học sinh. Tuy vậy kiểm tra bằng tự luận cũng tồn tại nhiều hạn chế
nhƣ không thể kiểm tra đƣợc một cách đầy đủ các kiến thức và kỹ năng của học sinh
dẫn đến tình trạng học tủ, học lệch. Kết quả kiểm tra đánh giá không đảm bảo tính
chính xác, khách quan mà phụ thuộc nhiều vào đánh giá chủ quan của ngƣời chấm.
Hơn nữa, việc chấm điểm tốn rất nhiều thời gian và công sức, đặc biệt là với số lƣợng
lớn.
Hình thức kiểm tra trắc nghiệm cũng đƣợc triển khai trên thế giới từ những
năm đầu thế kỷ 20, và đƣợc du nhập vào nƣớc ta tại một số thời điểm trƣớc năm 75 ở

miền Nam. Đặc biệt bộ giáo dục (BGD) đã bắt đầu đƣa vào kì thi Quốc gia với các
môn Lí, Hóa, Sinh, Ngoại ngữ từ năm 2007 và các môn Toán, Sử, Địa từ năm 2017
hình thức thi trắc nghiệm khách quan. Các ƣu điểm nổi bật của kì thi đã đƣợc chứng
minh nhƣ khách quan, công bằng, tiết kiệm thời gian, tiền bạc. Tuy vậy việc đƣa kì thi
vào tƣơng đối vội vàng, chƣa có chuẩn bị đào tạo một cách bài bản nên gây nhiều khó
khăn cho giáo viên, học sinh trong các khâu kiểm tra, đánh giá. Đặc biệt hơn do chƣa
có kinh nghiệm nên các đề thi trắc nghiệm khách quan đƣợc biên soạn chủ yếu với đo
đƣợc kiến thức ở mức nhận biết, thông hiểu, còn các thang kiến thức ở mức áp dụng,
phân tích, tổng hợp chƣa đo lƣờng một cách chính xác. Điều đó là một phần khó khăn
cho việc phân loại học sinh với các môn tƣ duy logic cao nhƣ môn toán.
Việc học và thi trên thế giới đã diễn ra hàng nghìn năm trƣớc đây, nhƣng một
khoa học về đo lƣờng trong giáo dục thật sự có thể xem nhƣ bắt đầu từ thế kỉ XX, tại
châu Âu và phát triển mạnh khi du nhập vào Hoa Kỳ [3, tr. 51].
Trong đo lƣờng giáo dục, hai hệ lý thuyết đánh giá cơ bản đang đƣợc sử dụng:
1


Lý thuyết đánh giá cổ điển (Classical Test Theory - CTT)
Lý thuyết đánh giá hiện đại (Modern Test Theory)
Hiện nay cách thức xây dựng đề thi đa số dựa theo lý thuyết đánh giá cổ điển,
nhƣng cách phân tích đánh giá câu hỏi thi, đề thi thƣờng kết hợp cả lý thuyết đánh giá cổ
điển lẫn lý thuyết đánh giá hiện đại. Hai hình thức đánh giá này thƣờng bổ xung các ƣu
nhƣợc điểm cho nhau nên chúng thƣờng đƣợc sử dụng đồng thời. Một trong những trở
ngại của lý thuyết khảo thí cổ điển là vấn đề chọn mẫu, chuẩn hóa và so bằng. Lý thuyết
khảo thí hiện đại, thƣờng đƣợc gọi là lý thuyết ứng đáp câu hỏi (IRT) hoàn toàn dễ dàng
khắc phục các khó khăn này nhƣng lại có những tính toán ƣớc lƣợng phức tạp. Khoảng
hai chục năm gần đây, các nghiên cứu sâu về IRT diễn ra ở nhiều nơi trên thế giới đặc biệt
là Hoa Kì. Tuy vậy các bài viết về IRT chủ yếu mang tính lí thuyết, nặng nề về các công
thức toán học nên việc triển khai, ứng dụng IRT trong công tác xây dựng đề là chƣa
nhiều, chủ yếu sử dụng IRT trong công việc phân tích đánh giá đề thi.


Lý thuyết đo lƣờng hiện đại đã dần chứng tỏ các ƣu điểm của nó so với lý
thuyết đo lƣờng cổ điển. Hiện nay các công cụ hỗ trợ tính toán phức hợp (máy tính
điện tử, phần mềm chuyên dụng,…) đƣợc phổ biến thì nhu cầu ứng dụng các kết quả
nghiên cứu của lý thuyết khảo thí hiện đại vào thực tế ra đề thi trong các kì thi quốc
gia hay trong các nhà trƣờng phổ thông càng trở nên bức thiết. Với mong muốn lý
thuyết IRT sớm đƣợc phổ biến trong công tác khảo thí đo lƣờng ở Việt Nam, tôi chọn
nghiên cứu đề tài “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề
tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều” nhằm thiết kế bộ đo năng
lực môn toán của học sinh phổ thông, kiểm tra đánh giá đƣợc một cách hệ thống và
toàn diện kiến thức và kỹ năng của học sinh sau khi học xong môn toán lớp 12. Đồng
thời đƣa ra một quy trình xây dựng đề thi có ứng dụng lý thuyết khảo thí hiện đại vào
quá trình xây dựng đề. Từ đó có thể đánh giá ƣu nhƣợc điểm của các hình thức và
cách thức ra đề. Xem xét hai hình thức đo lƣờng đánh giá này có bổ xung, tồn tại cùng
nhau hay loại trừ nhau. Điều này làm cho các kì thi kiểm tra, đánh giá năng lực của
học sinh trở nên đơn giản và chính xác hơn.
2.Mục đích nghiên cứu

2


Nghiên cứu tập chung tìm hiểu cách xây dựng, thiết kế một đề thi môn toán lớp
12 và phân tích đánh giá đề thi theo lý thuyết đánh giá hiện đại (IRT).
3. Đối tƣợng và khách thể nghiên cứu
Đối tƣợng nghiên cứu: Cơ sở lý luận của việc kiểm tra đánh giá kết quả học tập
của học sinh ở nhà trƣờng phổ thông, phƣơng pháp soạn thảo, phân tích hệ thống câu
hỏi thi theo lý thuyết đánh giá hiện đại.
Khách thể nghiên cứu: Nội dung và các yêu cầu về kiến thức, kĩ năng môn toán
lớp 12. Học sinh đã hoàn thành chƣơng trình toán 12.
4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu

Việc xây dựng đề thi nói chung và đề thi THPT quốc gia nói riêng cho đến nay
vẫn đang diễn ra chủ yếu dựa trên cơ sở của lý thuyết đánh giá cổ điển, phụ thuộc
nhiều vào các chuyên gia (cảm tính) ra đề. Mức độ khó dễ, phân biệt, giá trị, tin cậy
của câu hỏi trong các đề thi phụ cảm tính nhiều vào hội đồng ra đề thi (tuổi tác, giới
tính, vùng miền, trình độ,…) nên việc chỉnh sửa những câu hỏi thi không tốt trong các
đề thi thử nghiệm là rất khó khăn. Xây dựng ngân hàng câu hỏi một cách khách quan,
tin cậy, giá trị luôn đƣợc đặt lên hàng đầu trong mỗi kì thi. Mặc dù có nhiều khó khăn
khi tiếp cận IRT (các nghiên cứu về IRT chủ yếu là lí thuyết chƣa có nhiều triển khai
mang tính ứng dụng, các công thức tính toán nhiều, cần phần mềm chuyên dụng, …)
nhƣng lý thuyết IRT sẽ phần nào đáp ứng đƣợc việc xây dựng một ngân hàng câu hỏi,
ngân hàng đề theo sát các tiêu chí của một đề thi quốc gia trung học phổ thông. Do vậy
việc xây dựng ngân hàng câu hỏi thi theo định dạng câu hỏi nhị phân, đa phân, đa
chiều đang là bài toán đƣợc tập chung nghiên cứu nhiều gần đây không chỉ ở trên thế
giới mà ở Việt Nam cũng đang đƣợc quan tâm.
Câu hỏi nghiên cứu:
Câu hỏi 1: Việc xây đề thi môn toán lớp 12 ứng dụng theo lý thuyết đánh giá
hiện đại cần thực hiện nhƣ thế nào?
Câu hỏi 2: Phân tích các câu hỏi thi nhị phân, đa phân, đa chiều trong một đề thi
có giúp nâng cao chất lƣợng đề thi hay không?

3


Giả thuyết nghiên cứu: Dựa trên mục đích của kì thi, nguyên tắc viết câu hỏi
thi, ta có ma trận chi tiết của đề thi từ đó xây dựng đề thi. Thử nghiệm và xác định
tham số đặc trƣng của câu hỏi thi từ đó đánh giá chất lƣợng câu hỏi thi, tiến đến chuẩn
hóa đề thi.

4



5. Phƣơng pháp nghiên cứu
Nghiên cứu sử dụng cả phƣơng pháp định tính và định lƣợng trong việc thu
thập và xử lí thông tin. Nghiên cứu dự định tiến hành thông qua ba giai đoạn: Nghiên
của cơ sở lý thuyết, xây dựng mô hình nghiên cứu và các thử nghiệm. Các phƣơng
pháp nghiên cứu đƣợc sử dụng kết hợp phù hợp trong từng giai đoạn nghiên cứu.
Nghiên cơ sở lý thuyết: Cơ sở lý luận của kiểm tra đánh giá trong dạy học, lý
thuyết ứng đáp câu hỏi. Nghiên cứu những tài liệu về kĩ thuật viết câu hỏi thi. Nghiên
cứu về các phần mềm phân tích đánh giá kết quả thi đặc biệt là phần mềm Conquest.
Xây dựng mô hình nghiên cứu: Nghiên cứu cơ sở lý thuyết của lý thuyết khảo
thí hiện đại (IRT). Xây dựng ma trận đề thi và viết các câu hỏi thi. Dùng phần mềm
Conquest để phân tích các câu hỏi thi.Từ đó định chuẩn một đề thi mẫu và có các đánh
giá phân tích sơ bộ các tham số đặc trƣng: Độ khó, độ sai biệt, độ tin cậy.
Thực nghiệm: Thực nghiệm lấy mẫu, nhằm đánh giá đề kiểm tra trắc nghiệm
khách quan về độ tin cậy, độ giá trị và tính khả thi của nó. Phân tích đánh giá chất
lƣợng của đề thi.
6. Giới hạn và phạm vi nghiên cứu
Xây dựng và phân tích một đề thi môn toán lớp 12 và phân tích một đề thi môn
toán bằng phần mềm Conquest.
7. Cấu trúc của luận văn
Ngoài phần mở đầu, phần kết luận, khuyến nghị, luận văn gồm 3 phần sau:
Chƣơng 1: Cơ sở lý luận và tổng quan vấn đề nghiên cứu
Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi
Chƣơng 3: Kết quả nghiên cứu

5


CHƢƠNG 1
CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU

1.1. Tổng quan về đo lƣờng trong giáo dục
Cùng với xu hƣớng chung là đổi mới nội dung và phƣơng pháp giảng dạy trong
nhà trƣờng. Đo lƣờng, đánh giá trong giáo dục là một quá trình quan trọng, quyết định
sự thành bại của quá trình đổi mới đó. Đo lƣờng trong giáo dục là công cụ để xác định
năng lực nhận thức ngƣời học, điều chỉnh quá trình dạy học, điều chỉnh nội dung,
phƣơng tiện hỗ trợ quá trình dạy học nhằm đạt đƣợc đƣợc các mục tiêu, mục đích
giáo dục đề ra. Đổi mới phƣơng pháp, nội dung dạy học đƣợc chú trọng để đáp ứng
những yêu cầu mới của mục tiêu giáo dục. Do vậy việc kiểm tra, đánh giá phải phải
theo sát quá trình giảng dạy và mục tiêu giáo dục đề ra.
Hầu hết các đại lƣợng tâm lý là các thuộc tính của tƣ duy, mà tƣ duy thì không
thể quan sát trực tiếp (đại lƣợng ẩn), nhƣng vẫn có thể đo một cách gián tiếp thông
qua các hành vi có thể quan sát đƣợc của con ngƣời. Ví dụ: để biết một học sinh có
nắm đƣợc nội dung của môn học hay không sau khi học xong môn học đó, một bài
kiểm tra có thể cho chúng ta biết một cách chính xác: học sinh đó hiểu đến mức nào
(chỉ nhận biết khái niệm một cách máy móc hay còn có khả năng đánh giá, chuyển
giao nhận thức của mình). Các công cụ đo lƣờng, quan sát (ví dụ bài kiểm tra) cần
đƣợc thiết kế cẩn thận, có độ tin cậy cao để ghi nhận chính xác các hành vi, làm cơ sở
để xác định đại lƣợng ẩn. Đo lƣờng nói chung đòi hỏi độ chính xác và chính xác, vì
kết quả đƣợc hỗ trợ để có ý nghĩa đủ để cung cấp thông tin đáng tin cậy cho các hình
thức ra quyết định khác nhau.
1.1.1. Các khái niệm cơ bản về đo lường đánh giá
Đo lƣờng là quá trình mô tả mức độ cá nhân đạt đƣợc (hay đã có) một đặc điểm
nào đó (nhƣ khả năng, thái độ,…) đƣợc ƣớc lƣợng bằng những con số cụ thể. Ví dụ: Học
sinh X làm bài kiểm tra đạt điểm 8. Học sinh Y làm đƣợc 3/4 số điểm tối đa của bài thi
trắc nghiệm Toán. Bài của học sinh M đƣợc xếp hạng k trong lớp. Các điểm số 8, 3/4 hay
thứ hạng k là những ký hiệu gián tiếp chỉ ra khả năng của học sinh về mặt định tính hay
định hạng [4, tr. 352 - 353]. Đo lƣờng thành quả học tập là lƣợng giá
6



mức độ đạt đƣợc các mục tiêu cuối cùng (terminal) hay tiêu chí (criterion) trong một
khóa học, một giai đoạn học.
Trắc nghiệm là một dụng cụ hay một phƣơng thức hệ thống nhằm đo lƣờng
thành tích của một cá nhân so với các cá nhân khác hay so với những yêu cầu, nhiệm
vụ học tập đã đƣợc dự kiến. Trong lĩnh vực giáo dục, thƣờng dùng chữ “trắc nghiệm
thành quả học tập” hay “trắc nghiệm thành tích”. Trong trƣờng học, từ “trắc nghiệm”
đƣợc dùng nhƣ là một hình thức kiểm tra, đánh giá học sinh. “Trắc nghiệm khách
quan”, không phải hiểu theo nghĩa đối lập với một đo lƣờng chủ quan nào, mà nên
hiểu là hình thức kiểm tra này có tính khách quan cao hơn cách kiểm tra, đánh giá
bằng luận đề (hình thức kiểm tra tự luận) chẳng hạn. Các điểm số thu thập đƣợc từ
một bài trắc nghiệm thành tích có thể cung cấp hai loại thông tin: (1) loại thứ nhất là
mức độ ngƣời học thực hiện đƣợc tiêu chí đã đƣợc ấn định, chẳng hạn nhƣ giải đƣợc
đúng một bài Toán thông kê mô tả, giải thích đúng các kết xuất (output) của một
chƣơng trình thống kê v.v., không cần biết ngƣời ấy làm giỏi hơn hay kém hơn những
ngƣời khác, (2) loại thứ hai là sự xếp hạng tƣơng đối của các cá nhân liên quan đến
mức độ thực hiện của họ về bài trắc nghiệm đã ra, chẳng hạn học viên A có thể giải các
bài toán nhanh hơn, hoặc giỏi hơn học viên B. – [4, tr. 364 - 366].
Kiểm tra là một hoạt động nhằm cung cấp những số liệu, những thông tin làm
cơ sở cho việc giám sát, đánh giá. Kiểm tra là một phần của quá trình dạy học và có
ảnh hƣởng đến cuộc đời của tất cả học sinh. Vì vậy giáo viên cần quan tâm đến những
yếu tố ảnh hƣởng đến việc kiểm tra nhƣ: đề thi phải rõ ràng, phù hợp với mục đích
kiểm tra, phải đọc và kiểm tra nhiều lần để không có những sai sót; phía học sinh
không bị mất tập trung chú ý trong suốt thời gian làm bài.
Lƣợng giá là đƣa ra những thông tin ƣớc lƣợng về trình độ, năng lực, phẩm
chất của một cá nhân, một sản phẩm, v.v, dựa trên các số đo cụ thể hoặc quan sát
đƣợc. Trong dạy học, dựa vào các điểm số một học sinh đạt đƣợc, ngƣời thầy giáo
(hay nhà quản lý giáo dục) có thể ƣớc lƣợng trình độ kiến thức, kỹ năng kỹ xảo của
học sinh đó. Ví dụ: học sinh A hoàn thành xong 2/3 bài thi toán đại số đƣợc lƣợng giá
là thuộc loại trung bình.


7


Đánh giá là quá trình thu thập, điều tra, phân tích và giải thích thông tin một
cách có chủ đích, hệ thống nhằm xác định mức độ đạt đến các mục tiêu đã đề ra. Nhƣ
vậy, số đo cung cấp cho ta số liệu dùng để đánh giá, còn việc suy đoán, diễn giải
những con số này biến chúng thành sự đánh giá. Ta có thể nói thêm về đánh giá nhƣ
sau: Đánh giá là một quá trình trong đó ta đƣa ra những giá trị hoặc ấn định những giá
trị cho một cái gì dó. Đặc điểm quan trọng của sự đánh giá đó là khả năng xét đoán.
Đánh giá thƣờng mang tính định lƣợng. Nó dựa trên những con số hoặc các tỉ lệ phần
trăm. Sự xét đoán khi đánh giá gắn với một giá trị (định lƣợng) hay sự mô tả định tính
căn cứ vào số đo trên một bài kiểm tra. Đánh giá là một quá trình gồm hai bƣớc. Bƣớc
thứ nhất đó là kiểm tra, trong đó số liệu thu thập từ việc sử dụng một hoặc một chuỗi
các bài kiểm tra. Khi việc kiểm tra đƣợc thực hiện thì sự xét đoán cũng đƣợc thực
hiện về trình độ, thƣờng là trong bối cảnh các mục đích có hƣớng dẫn.
Tin cậy: Độ tin cậy của một dụng cụ đo là khái niệm cho biết mức độ ổn định,
vững chãi của các kết quả đo đƣợc khi tiến hành đo vật thể đó nhiều lần. Thí dụ có
một gói mứt khi đặt lên cân, lần đầu báo 750 gam sang lần thứ hai báo 735 gam, lần
thứ ba báo 765 gam, v.v… Ta nói cái cân này tin cậy. Tƣơng tự một bài trắc nghiệm
đƣợc gọi là tin cậy khi một học sinh làm nhiều lần bài trắc nghiệm này vào những thời
điểm cách xa nhau thì các kết quả điểm số thu đƣợc đều khá ổn định (các điểm số của
các lần đo không chênh lệch qua nhiều). Độ tin cậy thƣờng đƣợc biểu hiện bằng một
con số trong khoảng từ 0 đến 1. Độ lớn càng gần với 1 thì dụng cụ càng tin cậy. Ví dụ:
nếu từ 0.80 trở lên thì độ tin cậy đƣợc gọi là cao từ 0.40 đến 0.79 thì tƣơng đối tin cậy,
dƣới 0.40 là tin cậy thấp.
Giá trị: Độ giá trị của một dụng cụ đo là một khái niệm chỉ ra rằng dụng cụ này có
khả năng đo đúng đƣợc cái cần đo. Thí dụ: Một vật có trọng lƣợng thực là 800 gam. Nếu
khi bỏ lên cân thấy báo trị số 800 gam, ta nói cái cân này giá trị. Còn thấy báo là

700 gam, cân sẽ không giá trị vì không đo đúng đƣợc trọng lƣợng cần đo. Đặt vật lên,

xuống đế cân nhiều lần, lần nào kết quả cũng không xê dịch khỏi 700 gam, ta nói cân
đó tin cậy nhƣng không giá trị.
1.1.2. Các phương pháp đo lường trong giáo dục

8


Hiện nay ở Việt Nam đã biết đến một hệ thống phƣơng pháp và kỹ thuật đánh
giá khá phong phú. Về phƣơng pháp đánh giá có thể kể ra: quan sát, vấn đáp, viết.
Trong viết còn bao gồm nhiều hình thức nhƣ: trắc nghiệm tự luận (tự luận), trắc
nghiệm khách quan hay còn gọi là trắc nghiệm.
Theo [3] và ý kiến của các chuyên gia về đo lƣờng đánh giá, ta nên sử hình
thức kiểm tra tự luận để khảo sát thành quả học tập trong những trƣờng hợp dƣới đây:
(1)

Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ đƣợc

sử dụng một lần, không dùng lại nữa.
(2)
khen

Khi thầy cô giáo cố gắng tìm mọi cách có thể đƣợc để khuyến khích và

thƣởng sự phát triển kỹ năng diễn tả bằng văn viết.
(3) Khi thầy giáo muốn thăm dò thái độ hay tìm hiểu tƣ tƣởng của học sinh về
một vấn đề nào đó hơn là khảo sát thành quả học tập của chúng.
(4)
Khi giáo viên tin tƣởng vào tài năng phê phán và chấm bài luận đề
một cách
vô tƣ và chính xác hơn là khả năng soạn thảo những câu trắc nghiệm thật tốt.

(5) Khi thời gian soạn thảo bài khảo sát không nhiều .
Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trƣờng hợp sau:
(1)

Khi ta cần khảo sát kết quả học tập của một số lƣợng lớn học sinh, hay

muốn rằng bài khảo sát ấy có thể sử dụng lại vào một lúc khác.
(2)
Khi ta những điểm số chính xác khách quan, công bằng và nhanh
chóng.
(3)

Khi ta cần kiểm tra toàn diện kiến thức, ngăn ngừa gian lận thi cử.

Cả trắc nghiệm lẫn tự luận đều có thể sử dụng để:
(1)
Đo lƣờng mọi thành quả học tập mà học sinh thu nhận đƣợc ở các
mức độ
nhận thức.
(2)
Khảo sát đƣợc các khả năng hiểu, suy nghĩ có phê phán, giải quyết
các vấn
đề mới, phân tích, tổng hợp.
(3) Khuyến khích, gợi động cơ học tập để nắm vững kiến thức.


1.1.3. Đánh giá kết quả học tập của học sinh
9



Với từng môn học thì các mục tiêu trên đƣợc cụ thể hóa thành các mục tiêu về
kiến thức, kỹ năng và thái độ. Mục đích của giáo dục là sự tiến bộ của học sinh. Đây
chính là kết quả cuối cùng của quá trình học tập nhằm thay đổi hành vi của học sinh.
Khi nhìn nhận mục tiêu giáo dục theo hƣớng kết quả học tập, cần phải lƣu tâm rằng
chúng ta đang đề cập đến những sản phẩm của quá trình học tập chứ không phải bản
thân quá trình đó. Mối liên hệ giữa mục tiêu giáo dục (sản phẩm) và kinh nghiệm học
tập (quá trình) đƣợc thiết kế nhằm hƣớng tới những thay đổi hành vi theo nhƣ mong
muốn. Vậy đánh giá kết quả học tập là quá trình phản hồi thông tin, chất lƣợng giảng
dạy tới ngƣời quản lý, ngƣời dạy và ngƣời học.
Khoa học đánh giá ngày càng phát triển, các loại hình đánh giá kết quả học tập
của học sinh đƣợc phân loại theo các quan điểm tiếp cận mà có các loại hình đánh giá
sau: đánh giá trên diện rộng và đánh giá trên lớp học, đánh giá chẩn đoán, đánh giá ban
đầu, đánh giá trong tiến trình và đánh giá tổng kết. Ngoài ra xét theo mục tiêu học tập
sẽ có hai loại đánh giá là Assessment for Learning (Đánh giá để cải tiến việc học tập)
và Assessment of Learning (Đánh giá kết thúc giai đoạn học tập). Mỗi loại đánh giá sẽ
có mục đích đánh giá, phƣơng pháp đánh giá, công cụ đánh giá và các khuyến nghị
khác nhau.
1.1.4. Công cụ đo lường kết quả học tập
Hoạt động đánh giá đào tạo đƣợc ra đời và phát triển song song cùng với hoạt
động đào tạo. Việc lƣợng hóa giá trị kết quả học tập nhờ sử dụng hình thức thi trắc
nghiệm (test) là một công đoạn quan trọng trong quá trình dạy học. Trắc nghiệm theo
nghĩa rộng là một hoạt động đƣợc thực hiện để đo lƣờng năng lực của các đối tƣợng
nào đó nhằm những mục đích xác định, chẳng hạn, phân loại thí sinh, tìm ra thí sinh
nổi trội, sàng lọc ra những thí sinh chƣa đạt chuẩn. Trong giáo dục trắc nghiệm đƣợc
tiến hành thƣờng xuyên ở các kỳ thi, kiểm tra hay sát hạch nhằm đánh giá kết quả học
tập và giảng dạy đối với một phần của môn học hoặc toàn bộ môn học hay đối với cả
một cấp học. Ngoài ra trắc nghiệm cũng có thể đƣợc sử dụng nhằm lọc chọn một số
ngƣời có năng lực cao nhất vào học một khoá học nào đó. Hiện nay trong giáo dục
phổ thông có hai hình thức chủ yếu đo lƣờng kết quả học tập của học sinh là câu hỏi
trắc nghiệm tự luận gọi tắt là câu hỏi tự luận và câu hỏi trắc khách quan (TNKQ). Ta

xem xét hai hình thức thi dƣới bảng so sánh sau:
10


11


×