Tải bản đầy đủ (.pdf) (134 trang)

Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (4.1 MB, 134 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC GIÁO DỤC
------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN LỚP
12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU HỎI NHỊ PHÂN,
ĐA PHÂN VÀ ĐA CHIỀU

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC

Hà Nội - 2017


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC GIÁO DỤC
------------    ------------

TRẦN VĂN THANH

TRIỂN KHAI ĐÁNH GIÁ KẾT QUẢ HỌC TẬP MÔN TOÁN
LỚP 12 BẰNG MỘT ĐỀ TỔNG HỢP VỚI CÁC CÂU
HỎI NHỊ PHÂN, ĐA PHÂN VÀ ĐA CHIỀU

CHUYÊN NGÀNH: ĐO LƢỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC

Mã số: 8140115

LUẬN VĂN THẠC SĨ NGÀNH GIÁO DỤC HỌC


Ngƣời hƣớng dẫn khoa học: GS.TSKH. LÂM QUANG THIỆP

Hà Nội - 2017


LỜI CAM ĐOAN
Tôi xin cam đoan, Luận văn Thạc sĩ Đo lƣờng và đánh giá trong giáo dục với
đề tài: “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề tổng
hợp với các câu hỏi nhị phân, đa phân và đa chiều” là công trình nghiên cứu
riêng của tôi, dƣới sự hƣớng dẫn của GS.TSKH. LÂM QUANG THIỆP.
Tôi xin cam đoan:
- Luận văn là sản phẩm nghiên cứu của tôi
- Các thông tin, số liệu, kết quả nghiên cứu trong luận văn là trung thực và chƣa
từng đƣợc ai công bố trong bất kỳ phƣơng tiện thông tin đại chúng nào trƣớc đây.
Tôi xin chịu trách nhiệm về kết quả nghiên cứu của mình
Tác giả luận văn

Trần Văn Thanh

i


LỜI CẢM ƠN
Tôi xin gửi lời cảm ơn trân trọng đến những ngƣời đã giúp đỡ tôi hoàn thành
luận văn này.
Trƣớc hết, tôi xin trân trọng cảm ơn các lãnh đạo Trƣờng Đại Học Giáo dục,
Bộ môn Đo lƣờng và đánh giá, các thầy, cô của trƣờng Đại Học Giáo dục đã tận
tình giảng dạy, hƣớng dẫn và giúp đỡ tôi trong quá trình học tập, nghiên cứu và làm
luận văn.
Tôi xin bày tỏ sự biết ơn sâu sắc đến: GS.TSKH. Lâm Quang Thiệp, thầy

đã tận tâm giúp đỡ, hƣớng dẫn tôi trong quá trình nghiên cứu, thực hiện đề tài. Đặc
biệt trong những lúc tôi gặp khó khăn về định hƣớng, động lực nghiên cứu, thầy đã
động viên và hƣớng dẫn tôi cặn kẽ.
Tôi xin chân thành cảm ơn đồng nghiệp, gia đình và bạn bè đã luôn động
viên, khuyến khích tôi trong suốt quá trình học tập và nghiên cứu.
Xin chân thành cảm ơn
Tác giả luận văn

Trần Văn Thanh

ii


MỤC LỤC
Trang
LỜI CAM ĐOAN
LỜI CÁM ƠN
MỤC LỤC
DANH MỤC CÁC TỪ VIẾT TĂT ………………………………………….

vi

DANH MỤC CÁC HÌNH VẼ ……………………………………………….

vii

DANH MỤC CÁC BẢNG BIỂU ……………………………………………

viii


MỞ ĐẦU ……………………………………………………………………

1

1. Lý do chọn đề tài ………………………………………………………….

1

2. Mục đích nghiên cứu ……………………………………………………...

2

3. Đối tƣợng và khách thể nghiên cứu ……………………………………….

3

4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu …………………………….

3

5. Phƣơng pháp nghiên cứu ……………………………………………………

4

6. Giới hạn và phạm vi nghiên cứu ………………………………………….

4

7. Cấu trúc của luận văn ……………………………………………………


4

Chƣơng 1: Cơ sở lý luân và tổng quan vấn đề nghiên cứu ………………….

5

1. 1. Tổng quan về đo lƣờng trong giáo dục …………………………………

5

1.1.1. Các khái niệm cơ bản về đo lƣờng đánh giá ………………………….

5

1.1.2. Các phƣơng pháp đo lƣờng trong giáo dục ……………………………

7

1.1.3. Đánh giá kết quả học tập của học sinh ………………………………..

8

1.1.4. Công cụ đo lƣờng kết quả học tập …………………………………….

9

1.1.5. Sơ lƣợc về khoa học đo lƣờng đánh giá trên thế giới và Việt Nam …..

12


1.2. Lý thuyết đánh giá cổ điển ………………………………………………

15

1.2.1. Các tham số đặc trƣng của câu hỏi trắc nghiệm và phân tích đề trắc
nghiệm ……………………………………………………………………….

16

1.2.2. Điểm số học tập ……………………………………………………….

20

1.3. Lý thuyết ứng đáp câu hỏi ………………………………………………

24

iii


1.3.1 Tổng quan về lý thuyết ứng đáp câu hỏi ………………………………

24

1.3.2. Hàm đặc trƣng câu hỏi ………………………………………………..

25

1.3.3. Điểm thực và đƣờng cong đặc trƣng đề trắc nghiệm ……………........


29

1.3.4. Hàm thông tin của câu hỏi và của đề trắc nghiệm …………………….

30

1.3.5. Ƣớc lƣợng năng lực thí sinh và tham số câu hỏi ……………………...

33

1.3.6. So bằng và kết nối các đề trắc nghiệm ……………………………. …

33

1.3.7. Về trắc nghiệm đa phân và trắc nghiệm đa chiều …………………. …

34

1.3.8. Ví dụ về ƣớc lƣợng tham số câu hỏi ………………………………. …

38

Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi …………………………...

47

2.1. Đặt vấn đề ………………………………………………………………

47


2.2. Quy trình xây dựng một đề thi, đề kiểm tra …………………………….

47

2.2.1. Qui trình xây dựng ngân hàng câu hỏi trắc nghiệm khách quan ……...

49

2.2.2. Quy trình triển khai một kỳ thi trắc nghiệm khách quan ……………..

50

2.3. Xây dựng đề thi môn toán ………………………………………………

52

2.3.1. Chuẩn bị ……………………………………………………………….

53

2.3.2. Xây dựng bảng ma trận trọng số ………………………………………

53

2.3.3. Biên soạn câu hỏi thi ………………………………………………….

60

2.4. Thử nghiệm đề thi ……………………………………………………….


66

2.4.1. Chọn mẫu nghiên cứu …………………………………………………

66

2.4.2. Kế hoạch thực hiện ……………………………………………………

66

2.4.3. Kết quả thử nghiệm ……………………………………………………

66

Chƣơng 3: Kết quả nghiên cứu ………………………………………………

68

3.1. Giới thiệu ………………………………………………………………..

68

3.2. Phân tích tham số câu hỏi thi ……………………………………………

69

3.2.1. Phân tích câu hỏi thi bằng CTT ……………………………………….

70


3.2.2. Phân tích câu hỏi thi bằng lý thuyết khảo thí hiện đại ………………..

71

3.2.3. Phân tích câu hỏi thi đa chiều …………………………………………

80

3.2.4. Phân tích câu hỏi thi đa phân …………………………………………

85

3.3. Một số kết quả phân tích câu hỏi thi …………………………………….

85

iv


3.3.1. Quy trình hiệu chuẩn đề kiểm tra ……………………………………..

85

3.3.2. Các đặc trƣng về các đề thử nghiệm ………………………………….

86

KẾT LUẬN ……………………………………………………………….....

91


KHUYẾN NGHỊ ………………………………………………………….....

92

DANH MỤC TÀI LIỆU THAM KHẢO ……………………………………

93

PHỤ LỤC ……………………………………………………………………

94

Phụ lục 1: Phân phối chƣơng trình toán Lớp 12 ……………………………

94

Phụ lục 2: Phụ lục 2: Mẫu đặc tả kiến thức môn toán 12 theo chuẩn kiến
thức kĩ năng bộ giáo dục ban hành. ………………………………………….
Phụ lục 3: Định dạng biên soạn câu hỏi thi. …………………………………
Phụ lục 4: Đặc tả nội dung kiến thức từng câu hỏi theo ma trận trọng số
trong đề thi. ………………………………………………………………….
Phụ lục 5: Đề thi thử nghiệm 01 . ……………………………………………

v

95
100
101
106



DANH MỤC CÁC TỪ VIẾT TẮT
Từ viết tắt

Ý nghĩa

BGD

Bộ giáo dục

CH

Câu hỏi

CTT

Classical Test Theory

ĐKVP

Độ khó vừa phải

ĐTCH

Đặc trƣng câu hổi

ĐTN

Đề ttrắc nghiệm


HS

Học sinh

IRT

Item response theory

ICF

Item Curve Function

NHCH

Ngân hàng câu hỏi

PCM

Partial Credit Model

THPT

Trung học phổ thông

TL

Tự luận

TNKQ


Trắc nghiệm khách quan

TN

Trắc nghiệm

TS

Thí sinh

vi


DANH MỤC CÁC BẢNG BIỂU
STT

Tên bảng

Trang

1

Bảng 1.1 So sánh ƣu nhƣợc điểm của đề thi TNKQ và tự luận

10

2

Bảng 1.2 Hình thức thi TNKQ và tự luận


10

3

Bảng 1.3 Mô tả câu nhóm các câu hỏi trắc nghiệm

19

4

Bảng 1.4 Dữ liệu thử nghiệm của câu hỏi thi

41

5

Bảng 1.5 Dữ liệu tính toán ƣớc lƣợng hàm đặc trƣng câu hỏi

43

6

Bảng 1.6 Dữ liệu tính toán ƣớc lƣợng hàm đặc trƣng câu hỏi

43

7

Bảng 2.1 Quy trình xây dựng đề thi


52

8

Bảng 2.2 Ma trận đề thi môn toán 12

54

9

Bảng 2.3 Bảng mô tả chi tiết từng câu hỏi trong đề thi

55

10

Bảng 2.4 Quy trình biên soạn câu hỏi thi

60

11

Bảng 2.5 Bảng xây dựng câu hỏi thi

61

12

Bảng 2.6 Mẫu lƣu kết quả câu hỏi thi


67

13

Bảng 3.1 Độ khó P của một câu hỏi trắc nghiệm số 1.

70

14

Bảng 3.2 Bảng tham số các hỏi thi về mức độ phù hợp

71

15

Bảng 3.3 Phân tích đa chiều năng lực của TS với đề thi 01.

81

vii


DANH MỤC CÁC HÌNH VẼ
STT
1
2
3
4

5
6
7
8
9

Tên hình vẽ
Hình 1.1. Đƣờng cong ĐTCH một tham số
Hình 1.2. Các đƣờng cong ĐTCH hai tham số với các giá trị a khác
nhau
Hình 1.3. Các đƣờng cong ĐTCH 3 tham số với a = 2, c = 0,1 và
0,2.
Hình 1.4. Đƣờng cong đặc trƣng của ĐTN gồm 5 CH và 5 đƣờng
cong ĐTCH tƣơng ứng.
Hình 1.5. Các đồ thị hàm thông tin của 5 CH trắc nghiệm và của
ĐTN do 5 CH đó hợp thành
Hình 1.6. Các đƣờng cong ĐTCH trắc nghiệm nhị phân ứng với xác
suất trả lời sai
Hình 1.7. Các đƣờng cong ĐTCH của một CH PCM có 3 hạng điểm
(với δ1<δ2).
Hình 1.8. Mặt ĐTCH với 2 chiều năng lực θ1,θ2
Hình 1. 9. Hai kiểu biểu hiện tính đa chiều của các câu hỏi trắc
nghiệm.

Trang
26
27
28
30
31

36
36
37
37

10

Hình 1.10. Mô tả đáp ứng câu hỏi

39

11

Hình 1.11. Hàm đặc trƣng câu hỏi

40

12

Hình 1.12. Ƣớc lƣợng hàm đặc trƣng của câu hỏi

41

13

Hình 1.13. Tham số ƣớc lƣợng của câu hỏi

42

14


Hình 1.14. Đồ thị hàm đặc trƣng của câu hỏi

42

15

Hình 1.15. Đồ thị của hàm đặc trƣng câu hỏi

44

16
17

Hình 1.16. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có
năng lực thấp
Hình 1.17. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có
năng lực cao

viii

45
45


18

Hình 1.18. Hình ảnh ƣớc lƣợng tham số câu hỏi với tập mẫu có
năng lực phổ quát


45

19

Hình 3.1. Đồ thị hàm đặc trƣng câu hỏi số 4.

73

20

Hình 3.2. Đồ thị hàm đặc trƣng câu hỏi số 21

73

21

Hình 3.3. Đồ thị hàm đặc trƣng câu hỏi số 39

74

22

Hình 3.4. Đồ thị hàm đặc trƣng câu hỏi số 40

74

23

Hình 3.5. Bản đồ phân bố độ khó câu hỏi thi và năng lực thí sinh


75

24

Hình 3.6. Đƣờng cong đặc trƣng của đề thi số 1.

77

25

Hình 3.7. Hàm thông tin của đề thi số 1.

78

26

Hình 3.8. Hàm thông tin của đề thi số 2.

78

27

Hình 3.9. Hàm thông tin của đề thi số 3.

79

28

Hình 3.10. Hàm thông tin của đề thi số 4.


79

29

Hình 3.11. Năng lực giải tích của TS

82

30

Hình 3.12. Năng lực đại số của TS

83

31

Hình 3.13. Năng lực hình học của TS

84

32
33
34
35

Hình 3.14. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó
của đề thi 01
Hình 3.15. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó
của đề thi 02
Hình 3.16. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó

của đề thi 03
Hình 3.17. Biểu đồ tƣơng quan giữa năng lực của thí sinh và độ khó
của đề thi 04

ix

87
88
89
90


MỞ ĐẦU
1. Lý do chọn đề tài
Hiện nay có hai hình thức thi cử kiểm tra chủ yếu trong các cơ sở giáo dục là
trắc nghiệm khách quan và tự luận.
Việc kiểm tra đánh giá ở các nhà trƣờng từ trƣớc đến nay phần lớn đều sử dụng
phƣơng pháp kiểm tra bằng hình thức tự luận. Phƣơng pháp này có ƣu điểm nổi bật là
ít tốn thời gian ra đề; đánh giá đƣợc khả năng trình bày, diễn đạt của học sinh; khuyến
khích học sinh rèn luyện khả năng tƣ duy logic, khả năng suy diễn, tổng quát hóa, phát
huy óc sáng tạo của học sinh. Tuy vậy kiểm tra bằng tự luận cũng tồn tại nhiều hạn chế
nhƣ không thể kiểm tra đƣợc một cách đầy đủ các kiến thức và kỹ năng của học sinh
dẫn đến tình trạng học tủ, học lệch. Kết quả kiểm tra đánh giá không đảm bảo tính
chính xác, khách quan mà phụ thuộc nhiều vào đánh giá chủ quan của ngƣời chấm.
Hơn nữa, việc chấm điểm tốn rất nhiều thời gian và công sức, đặc biệt là với số lƣợng
lớn.
Hình thức kiểm tra trắc nghiệm cũng đƣợc triển khai trên thế giới từ những năm
đầu thế kỷ 20, và đƣợc du nhập vào nƣớc ta tại một số thời điểm trƣớc năm 75 ở miền
Nam. Đặc biệt bộ giáo dục (BGD) đã bắt đầu đƣa vào kì thi Quốc gia với các môn Lí,
Hóa, Sinh, Ngoại ngữ từ năm 2007 và các môn Toán, Sử, Địa từ năm 2017 hình thức

thi trắc nghiệm khách quan. Các ƣu điểm nổi bật của kì thi đã đƣợc chứng minh nhƣ
khách quan, công bằng, tiết kiệm thời gian, tiền bạc. Tuy vậy việc đƣa kì thi vào tƣơng
đối vội vàng, chƣa có chuẩn bị đào tạo một cách bài bản nên gây nhiều khó khăn cho
giáo viên, học sinh trong các khâu kiểm tra, đánh giá. Đặc biệt hơn do chƣa có kinh
nghiệm nên các đề thi trắc nghiệm khách quan đƣợc biên soạn chủ yếu với đo đƣợc
kiến thức ở mức nhận biết, thông hiểu, còn các thang kiến thức ở mức áp dụng, phân
tích, tổng hợp chƣa đo lƣờng một cách chính xác. Điều đó là một phần khó khăn cho
việc phân loại học sinh với các môn tƣ duy logic cao nhƣ môn toán.
Việc học và thi trên thế giới đã diễn ra hàng nghìn năm trƣớc đây, nhƣng một
khoa học về đo lƣờng trong giáo dục thật sự có thể xem nhƣ bắt đầu từ thế kỉ XX, tại
châu Âu và phát triển mạnh khi du nhập vào Hoa Kỳ [3, tr. 51].
Trong đo lƣờng giáo dục, hai hệ lý thuyết đánh giá cơ bản đang đƣợc sử dụng:
1


Lý thuyết đánh giá cổ điển (Classical Test Theory - CTT)
Lý thuyết đánh giá hiện đại (Modern Test Theory)
Hiện nay cách thức xây dựng đề thi đa số dựa theo lý thuyết đánh giá cổ điển,
nhƣng cách phân tích đánh giá câu hỏi thi, đề thi thƣờng kết hợp cả lý thuyết đánh giá
cổ điển lẫn lý thuyết đánh giá hiện đại. Hai hình thức đánh giá này thƣờng bổ xung các
ƣu nhƣợc điểm cho nhau nên chúng thƣờng đƣợc sử dụng đồng thời. Một trong những
trở ngại của lý thuyết khảo thí cổ điển là vấn đề chọn mẫu, chuẩn hóa và so bằng. Lý
thuyết khảo thí hiện đại, thƣờng đƣợc gọi là lý thuyết ứng đáp câu hỏi (IRT) hoàn toàn
dễ dàng khắc phục các khó khăn này nhƣng lại có những tính toán ƣớc lƣợng phức tạp.
Khoảng hai chục năm gần đây, các nghiên cứu sâu về IRT diễn ra ở nhiều nơi trên thế
giới đặc biệt là Hoa Kì. Tuy vậy các bài viết về IRT chủ yếu mang tính lí thuyết, nặng
nề về các công thức toán học nên việc triển khai, ứng dụng IRT trong công tác xây
dựng đề là chƣa nhiều, chủ yếu sử dụng IRT trong công việc phân tích đánh giá đề thi.
Lý thuyết đo lƣờng hiện đại đã dần chứng tỏ các ƣu điểm của nó so với lý
thuyết đo lƣờng cổ điển. Hiện nay các công cụ hỗ trợ tính toán phức hợp (máy tính

điện tử, phần mềm chuyên dụng,…) đƣợc phổ biến thì nhu cầu ứng dụng các kết quả
nghiên cứu của lý thuyết khảo thí hiện đại vào thực tế ra đề thi trong các kì thi quốc
gia hay trong các nhà trƣờng phổ thông càng trở nên bức thiết. Với mong muốn lý
thuyết IRT sớm đƣợc phổ biến trong công tác khảo thí đo lƣờng ở Việt Nam, tôi chọn
nghiên cứu đề tài “Triển khai đánh giá kết quả học tập môn toán lớp 12 bằng một đề
tổng hợp với các câu hỏi nhị phân, đa phân và đa chiều” nhằm thiết kế bộ đo năng lực
môn toán của học sinh phổ thông, kiểm tra đánh giá đƣợc một cách hệ thống và toàn diện
kiến thức và kỹ năng của học sinh sau khi học xong môn toán lớp 12. Đồng thời đƣa ra
một quy trình xây dựng đề thi có ứng dụng lý thuyết khảo thí hiện đại vào quá trình xây
dựng đề. Từ đó có thể đánh giá ƣu nhƣợc điểm của các hình thức và cách thức ra đề.
Xem xét hai hình thức đo lƣờng đánh giá này có bổ xung, tồn tại cùng nhau hay loại
trừ nhau. Điều này làm cho các kì thi kiểm tra, đánh giá năng lực của học sinh trở nên
đơn giản và chính xác hơn.
2. Mục đích nghiên cứu

2


Nghiên cứu tập chung tìm hiểu cách xây dựng, thiết kế một đề thi môn toán lớp
12 và phân tích đánh giá đề thi theo lý thuyết đánh giá hiện đại (IRT).
3. Đối tƣợng và khách thể nghiên cứu
Đối tƣợng nghiên cứu: Cơ sở lý luận của việc kiểm tra đánh giá kết quả học tập
của học sinh ở nhà trƣờng phổ thông, phƣơng pháp soạn thảo, phân tích hệ thống câu
hỏi thi theo lý thuyết đánh giá hiện đại.
Khách thể nghiên cứu: Nội dung và các yêu cầu về kiến thức, kĩ năng môn toán
lớp 12. Học sinh đã hoàn thành chƣơng trình toán 12.
4. Câu hỏi nghiên cứu và giả thuyết nghiên cứu
Việc xây dựng đề thi nói chung và đề thi THPT quốc gia nói riêng cho đến nay
vẫn đang diễn ra chủ yếu dựa trên cơ sở của lý thuyết đánh giá cổ điển, phụ thuộc
nhiều vào các chuyên gia (cảm tính) ra đề. Mức độ khó dễ, phân biệt, giá trị, tin cậy

của câu hỏi trong các đề thi phụ cảm tính nhiều vào hội đồng ra đề thi (tuổi tác, giới
tính, vùng miền, trình độ,…) nên việc chỉnh sửa những câu hỏi thi không tốt trong các
đề thi thử nghiệm là rất khó khăn. Xây dựng ngân hàng câu hỏi một cách khách quan,
tin cậy, giá trị luôn đƣợc đặt lên hàng đầu trong mỗi kì thi. Mặc dù có nhiều khó khăn
khi tiếp cận IRT (các nghiên cứu về IRT chủ yếu là lí thuyết chƣa có nhiều triển khai
mang tính ứng dụng, các công thức tính toán nhiều, cần phần mềm chuyên dụng, …)
nhƣng lý thuyết IRT sẽ phần nào đáp ứng đƣợc việc xây dựng một ngân hàng câu hỏi,
ngân hàng đề theo sát các tiêu chí của một đề thi quốc gia trung học phổ thông. Do vậy
việc xây dựng ngân hàng câu hỏi thi theo định dạng câu hỏi nhị phân, đa phân, đa
chiều đang là bài toán đƣợc tập chung nghiên cứu nhiều gần đây không chỉ ở trên thế
giới mà ở Việt Nam cũng đang đƣợc quan tâm.
Câu hỏi nghiên cứu:
Câu hỏi 1: Việc xây đề thi môn toán lớp 12 ứng dụng theo lý thuyết đánh giá
hiện đại cần thực hiện nhƣ thế nào?
Câu hỏi 2: Phân tích các câu hỏi thi nhị phân, đa phân, đa chiều trong một đề thi
có giúp nâng cao chất lƣợng đề thi hay không?

3


Giả thuyết nghiên cứu: Dựa trên mục đích của kì thi, nguyên tắc viết câu hỏi
thi, ta có ma trận chi tiết của đề thi từ đó xây dựng đề thi. Thử nghiệm và xác định
tham số đặc trƣng của câu hỏi thi từ đó đánh giá chất lƣợng câu hỏi thi, tiến đến chuẩn
hóa đề thi.

4


5. Phƣơng pháp nghiên cứu
Nghiên cứu sử dụng cả phƣơng pháp định tính và định lƣợng trong việc thu

thập và xử lí thông tin. Nghiên cứu dự định tiến hành thông qua ba giai đoạn: Nghiên
của cơ sở lý thuyết, xây dựng mô hình nghiên cứu và các thử nghiệm. Các phƣơng
pháp nghiên cứu đƣợc sử dụng kết hợp phù hợp trong từng giai đoạn nghiên cứu.
Nghiên cơ sở lý thuyết: Cơ sở lý luận của kiểm tra đánh giá trong dạy học, lý
thuyết ứng đáp câu hỏi. Nghiên cứu những tài liệu về kĩ thuật viết câu hỏi thi. Nghiên
cứu về các phần mềm phân tích đánh giá kết quả thi đặc biệt là phần mềm Conquest.
Xây dựng mô hình nghiên cứu: Nghiên cứu cơ sở lý thuyết của lý thuyết khảo
thí hiện đại (IRT). Xây dựng ma trận đề thi và viết các câu hỏi thi. Dùng phần mềm
Conquest để phân tích các câu hỏi thi.Từ đó định chuẩn một đề thi mẫu và có các đánh
giá phân tích sơ bộ các tham số đặc trƣng: Độ khó, độ sai biệt, độ tin cậy.
Thực nghiệm: Thực nghiệm lấy mẫu, nhằm đánh giá đề kiểm tra trắc nghiệm
khách quan về độ tin cậy, độ giá trị và tính khả thi của nó. Phân tích đánh giá chất
lƣợng của đề thi.
6. Giới hạn và phạm vi nghiên cứu
Xây dựng và phân tích một đề thi môn toán lớp 12 và phân tích một đề thi môn
toán bằng phần mềm Conquest.
7. Cấu trúc của luận văn
Ngoài phần mở đầu, phần kết luận, khuyến nghị, luận văn gồm 3 phần sau:
Chƣơng 1: Cơ sở lý luận và tổng quan vấn đề nghiên cứu
Chƣơng 2: Tổ chức và thực hiện xây dựng đề thi
Chƣơng 3: Kết quả nghiên cứu

5


CHƢƠNG 1
CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN VẤN ĐỀ NGHIÊN CỨU
1.1. Tổng quan về đo lƣờng trong giáo dục
Cùng với xu hƣớng chung là đổi mới nội dung và phƣơng pháp giảng dạy trong
nhà trƣờng. Đo lƣờng, đánh giá trong giáo dục là một quá trình quan trọng, quyết định

sự thành bại của quá trình đổi mới đó. Đo lƣờng trong giáo dục là công cụ để xác định
năng lực nhận thức ngƣời học, điều chỉnh quá trình dạy học, điều chỉnh nội dung,
phƣơng tiện hỗ trợ quá trình dạy học nhằm đạt đƣợc đƣợc các mục tiêu, mục đích giáo
dục đề ra. Đổi mới phƣơng pháp, nội dung dạy học đƣợc chú trọng để đáp ứng những
yêu cầu mới của mục tiêu giáo dục. Do vậy việc kiểm tra, đánh giá phải phải theo sát
quá trình giảng dạy và mục tiêu giáo dục đề ra.
Hầu hết các đại lƣợng tâm lý là các thuộc tính của tƣ duy, mà tƣ duy thì không
thể quan sát trực tiếp (đại lƣợng ẩn), nhƣng vẫn có thể đo một cách gián tiếp thông qua
các hành vi có thể quan sát đƣợc của con ngƣời. Ví dụ: để biết một học sinh có nắm
đƣợc nội dung của môn học hay không sau khi học xong môn học đó, một bài kiểm tra
có thể cho chúng ta biết một cách chính xác: học sinh đó hiểu đến mức nào (chỉ nhận
biết khái niệm một cách máy móc hay còn có khả năng đánh giá, chuyển giao nhận
thức của mình). Các công cụ đo lƣờng, quan sát (ví dụ bài kiểm tra) cần đƣợc thiết kế
cẩn thận, có độ tin cậy cao để ghi nhận chính xác các hành vi, làm cơ sở để xác định
đại lƣợng ẩn. Đo lƣờng nói chung đòi hỏi độ chính xác và chính xác, vì kết quả đƣợc
hỗ trợ để có ý nghĩa đủ để cung cấp thông tin đáng tin cậy cho các hình thức ra quyết
định khác nhau.
1.1.1. Các khái niệm cơ bản về đo lường đánh giá
Đo lƣờng là quá trình mô tả mức độ cá nhân đạt đƣợc (hay đã có) một đặc điểm
nào đó (nhƣ khả năng, thái độ,…) đƣợc ƣớc lƣợng bằng những con số cụ thể. Ví dụ:
Học sinh X làm bài kiểm tra đạt điểm 8. Học sinh Y làm đƣợc 3/4 số điểm tối đa của
bài thi trắc nghiệm Toán. Bài của học sinh M đƣợc xếp hạng k trong lớp. Các điểm số
8, 3/4 hay thứ hạng k là những ký hiệu gián tiếp chỉ ra khả năng của học sinh về mặt
định tính hay định hạng [4, tr. 352 - 353]. Đo lƣờng thành quả học tập là lƣợng giá
6


mức độ đạt đƣợc các mục tiêu cuối cùng (terminal) hay tiêu chí (criterion) trong một
khóa học, một giai đoạn học.
Trắc nghiệm là một dụng cụ hay một phƣơng thức hệ thống nhằm đo lƣờng

thành tích của một cá nhân so với các cá nhân khác hay so với những yêu cầu, nhiệm
vụ học tập đã đƣợc dự kiến. Trong lĩnh vực giáo dục, thƣờng dùng chữ “trắc nghiệm
thành quả học tập” hay “trắc nghiệm thành tích”. Trong trƣờng học, từ “trắc nghiệm”
đƣợc dùng nhƣ là một hình thức kiểm tra, đánh giá học sinh. “Trắc nghiệm khách
quan”, không phải hiểu theo nghĩa đối lập với một đo lƣờng chủ quan nào, mà nên
hiểu là hình thức kiểm tra này có tính khách quan cao hơn cách kiểm tra, đánh giá
bằng luận đề (hình thức kiểm tra tự luận) chẳng hạn. Các điểm số thu thập đƣợc từ một
bài trắc nghiệm thành tích có thể cung cấp hai loại thông tin: (1) loại thứ nhất là mức
độ ngƣời học thực hiện đƣợc tiêu chí đã đƣợc ấn định, chẳng hạn nhƣ giải đƣợc đúng
một bài Toán thông kê mô tả, giải thích đúng các kết xuất (output) của một chƣơng
trình thống kê v.v., không cần biết ngƣời ấy làm giỏi hơn hay kém hơn những ngƣời
khác, (2) loại thứ hai là sự xếp hạng tƣơng đối của các cá nhân liên quan đến mức độ
thực hiện của họ về bài trắc nghiệm đã ra, chẳng hạn học viên A có thể giải các bài
toán nhanh hơn, hoặc giỏi hơn học viên B. – [4, tr. 364 - 366].
Kiểm tra là một hoạt động nhằm cung cấp những số liệu, những thông tin làm
cơ sở cho việc giám sát, đánh giá. Kiểm tra là một phần của quá trình dạy học và có
ảnh hƣởng đến cuộc đời của tất cả học sinh. Vì vậy giáo viên cần quan tâm đến những
yếu tố ảnh hƣởng đến việc kiểm tra nhƣ: đề thi phải rõ ràng, phù hợp với mục đích
kiểm tra, phải đọc và kiểm tra nhiều lần để không có những sai sót; phía học sinh
không bị mất tập trung chú ý trong suốt thời gian làm bài.
Lƣợng giá là đƣa ra những thông tin ƣớc lƣợng về trình độ, năng lực, phẩm
chất của một cá nhân, một sản phẩm, v.v, dựa trên các số đo cụ thể hoặc quan sát
đƣợc. Trong dạy học, dựa vào các điểm số một học sinh đạt đƣợc, ngƣời thầy giáo
(hay nhà quản lý giáo dục) có thể ƣớc lƣợng trình độ kiến thức, kỹ năng kỹ xảo của
học sinh đó. Ví dụ: học sinh A hoàn thành xong 2/3 bài thi toán đại số đƣợc lƣợng giá
là thuộc loại trung bình.

7



Đánh giá là quá trình thu thập, điều tra, phân tích và giải thích thông tin một
cách có chủ đích, hệ thống nhằm xác định mức độ đạt đến các mục tiêu đã đề ra. Nhƣ
vậy, số đo cung cấp cho ta số liệu dùng để đánh giá, còn việc suy đoán, diễn giải
những con số này biến chúng thành sự đánh giá. Ta có thể nói thêm về đánh giá nhƣ
sau: Đánh giá là một quá trình trong đó ta đƣa ra những giá trị hoặc ấn định những giá
trị cho một cái gì dó. Đặc điểm quan trọng của sự đánh giá đó là khả năng xét đoán.
Đánh giá thƣờng mang tính định lƣợng. Nó dựa trên những con số hoặc các tỉ lệ phần
trăm. Sự xét đoán khi đánh giá gắn với một giá trị (định lƣợng) hay sự mô tả định tính
căn cứ vào số đo trên một bài kiểm tra. Đánh giá là một quá trình gồm hai bƣớc. Bƣớc
thứ nhất đó là kiểm tra, trong đó số liệu thu thập từ việc sử dụng một hoặc một chuỗi
các bài kiểm tra. Khi việc kiểm tra đƣợc thực hiện thì sự xét đoán cũng đƣợc thực hiện
về trình độ, thƣờng là trong bối cảnh các mục đích có hƣớng dẫn.
Tin cậy: Độ tin cậy của một dụng cụ đo là khái niệm cho biết mức độ ổn định,
vững chãi của các kết quả đo đƣợc khi tiến hành đo vật thể đó nhiều lần. Thí dụ có một
gói mứt khi đặt lên cân, lần đầu báo 750 gam sang lần thứ hai báo 735 gam, lần thứ ba
báo 765 gam, v.v… Ta nói cái cân này tin cậy. Tƣơng tự một bài trắc nghiệm đƣợc gọi
là tin cậy khi một học sinh làm nhiều lần bài trắc nghiệm này vào những thời điểm
cách xa nhau thì các kết quả điểm số thu đƣợc đều khá ổn định (các điểm số của các
lần đo không chênh lệch qua nhiều). Độ tin cậy thƣờng đƣợc biểu hiện bằng một con
số trong khoảng từ 0 đến 1. Độ lớn càng gần với 1 thì dụng cụ càng tin cậy. Ví dụ:
nếu từ 0.80 trở lên thì độ tin cậy đƣợc gọi là cao từ 0.40 đến 0.79 thì tƣơng đối tin cậy,
dƣới 0.40 là tin cậy thấp.
Giá trị: Độ giá trị của một dụng cụ đo là một khái niệm chỉ ra rằng dụng cụ này
có khả năng đo đúng đƣợc cái cần đo. Thí dụ: Một vật có trọng lƣợng thực là 800 gam.
Nếu khi bỏ lên cân thấy báo trị số 800 gam, ta nói cái cân này giá trị. Còn thấy báo là
700 gam, cân sẽ không giá trị vì không đo đúng đƣợc trọng lƣợng cần đo. Đặt vật lên,
xuống đế cân nhiều lần, lần nào kết quả cũng không xê dịch khỏi 700 gam, ta nói cân
đó tin cậy nhƣng không giá trị.
1.1.2. Các phương pháp đo lường trong giáo dục


8


Hiện nay ở Việt Nam đã biết đến một hệ thống phƣơng pháp và kỹ thuật đánh
giá khá phong phú. Về phƣơng pháp đánh giá có thể kể ra: quan sát, vấn đáp, viết.
Trong viết còn bao gồm nhiều hình thức nhƣ: trắc nghiệm tự luận (tự luận), trắc
nghiệm khách quan hay còn gọi là trắc nghiệm.
Theo [3] và ý kiến của các chuyên gia về đo lƣờng đánh giá, ta nên sử hình thức
kiểm tra tự luận để khảo sát thành quả học tập trong những trƣờng hợp dƣới đây:
(1) Khi nhóm học sinh dự thi hay kiểm tra không quá đông và đề thi chỉ đƣợc
sử dụng một lần, không dùng lại nữa.
(2) Khi thầy cô giáo cố gắng tìm mọi cách có thể đƣợc để khuyến khích và khen
thƣởng sự phát triển kỹ năng diễn tả bằng văn viết.
(3) Khi thầy giáo muốn thăm dò thái độ hay tìm hiểu tƣ tƣởng của học sinh về
một vấn đề nào đó hơn là khảo sát thành quả học tập của chúng.
(4) Khi giáo viên tin tƣởng vào tài năng phê phán và chấm bài luận đề một cách
vô tƣ và chính xác hơn là khả năng soạn thảo những câu trắc nghiệm thật tốt.
(5) Khi thời gian soạn thảo bài khảo sát không nhiều .
Mặt khác, ta nên sử dụng trắc nghiệm khách quan trong những trƣờng hợp sau:
(1) Khi ta cần khảo sát kết quả học tập của một số lƣợng lớn học sinh, hay
muốn rằng bài khảo sát ấy có thể sử dụng lại vào một lúc khác.
(2) Khi ta những điểm số chính xác khách quan, công bằng và nhanh chóng.
(3) Khi ta cần kiểm tra toàn diện kiến thức, ngăn ngừa gian lận thi cử.
Cả trắc nghiệm lẫn tự luận đều có thể sử dụng để:
(1) Đo lƣờng mọi thành quả học tập mà học sinh thu nhận đƣợc ở các mức độ
nhận thức.
(2) Khảo sát đƣợc các khả năng hiểu, suy nghĩ có phê phán, giải quyết các vấn
đề mới, phân tích, tổng hợp.
(3) Khuyến khích, gợi động cơ học tập để nắm vững kiến thức.
1.1.3. Đánh giá kết quả học tập của học sinh

9


Với từng môn học thì các mục tiêu trên đƣợc cụ thể hóa thành các mục tiêu về
kiến thức, kỹ năng và thái độ. Mục đích của giáo dục là sự tiến bộ của học sinh. Đây
chính là kết quả cuối cùng của quá trình học tập nhằm thay đổi hành vi của học sinh.
Khi nhìn nhận mục tiêu giáo dục theo hƣớng kết quả học tập, cần phải lƣu tâm rằng
chúng ta đang đề cập đến những sản phẩm của quá trình học tập chứ không phải bản
thân quá trình đó. Mối liên hệ giữa mục tiêu giáo dục (sản phẩm) và kinh nghiệm học
tập (quá trình) đƣợc thiết kế nhằm hƣớng tới những thay đổi hành vi theo nhƣ mong
muốn. Vậy đánh giá kết quả học tập là quá trình phản hồi thông tin, chất lƣợng giảng
dạy tới ngƣời quản lý, ngƣời dạy và ngƣời học.
Khoa học đánh giá ngày càng phát triển, các loại hình đánh giá kết quả học tập
của học sinh đƣợc phân loại theo các quan điểm tiếp cận mà có các loại hình đánh giá
sau: đánh giá trên diện rộng và đánh giá trên lớp học, đánh giá chẩn đoán, đánh giá
ban đầu, đánh giá trong tiến trình và đánh giá tổng kết. Ngoài ra xét theo mục tiêu học
tập sẽ có hai loại đánh giá là Assessment for Learning (Đánh giá để cải tiến việc học
tập) và Assessment of Learning (Đánh giá kết thúc giai đoạn học tập). Mỗi loại đánh
giá sẽ có mục đích đánh giá, phƣơng pháp đánh giá, công cụ đánh giá và các khuyến
nghị khác nhau.
1.1.4. Công cụ đo lường kết quả học tập
Hoạt động đánh giá đào tạo đƣợc ra đời và phát triển song song cùng với hoạt
động đào tạo. Việc lƣợng hóa giá trị kết quả học tập nhờ sử dụng hình thức thi trắc
nghiệm (test) là một công đoạn quan trọng trong quá trình dạy học. Trắc nghiệm theo
nghĩa rộng là một hoạt động đƣợc thực hiện để đo lƣờng năng lực của các đối tƣợng
nào đó nhằm những mục đích xác định, chẳng hạn, phân loại thí sinh, tìm ra thí sinh
nổi trội, sàng lọc ra những thí sinh chƣa đạt chuẩn. Trong giáo dục trắc nghiệm đƣợc
tiến hành thƣờng xuyên ở các kỳ thi, kiểm tra hay sát hạch nhằm đánh giá kết quả học
tập và giảng dạy đối với một phần của môn học hoặc toàn bộ môn học hay đối với cả
một cấp học. Ngoài ra trắc nghiệm cũng có thể đƣợc sử dụng nhằm lọc chọn một số

ngƣời có năng lực cao nhất vào học một khoá học nào đó. Hiện nay trong giáo dục phổ
thông có hai hình thức chủ yếu đo lƣờng kết quả học tập của học sinh là câu hỏi trắc
nghiệm tự luận gọi tắt là câu hỏi tự luận và câu hỏi trắc khách quan (TNKQ). Ta xem
xét hai hình thức thi dƣới bảng so sánh sau:
10


11


Bảng 1.1 So sánh ưu nhược điểm của đề thi TNKQ và tự luận
Ƣu điểm

Chỉ mục

TNKQ Tự luận

Ít tốn công ra đề thi

x

Đánh giá đƣợc khả năng diễn đạt, đặc biệt là diễn đạt tƣ duy
hình tƣợng

x

Đề thi phủ kín nội dung môn học

x


Ít may rủi do “học tủ”

x

Ít tốn công chấm thi

x

Khách quan trong chấm thi

x

Áp dụng đƣợc công nghệ mới trong việc nâng cao chất lƣợng
kỳ thi, giữ bí mật đề thi, hạn chế quay cóp khi thi, hạn chế
tiêu cực trong chấm thi và giúp phân tích kết quả thi.

x

Nắm vững bản chất từng phƣơng pháp cùng điều kiện cơ sở vật chất và công
nghệ triển khai cụ thể, để sử dụng hợp lí, tối ƣu mỗi phƣơng pháp. Theo [3, tr. 29 – 36]
ta có bảng so sánh ƣu nhƣợc điểm của các hình thức thi TL và TN nhƣ sau.
Bảng 1.2 Hình thức thi TNKQ và tự luận
Vấn đề

Đề thi TNKQ

Đề thi tự luận

Một bộ câu hỏi trong đó mỗi
câu hỏi đều kèm theo các

Hình thức câu
phƣơng án trả lời cho sẵn để
hỏi / đề thi
học sinh lựa chọn phƣơng án
trả lời.
Khó soạn câu hỏi.

Một bộ câu hỏi trong đó mỗi
câu hỏi không kèm theo các
phƣơng án trả lời mà học sinh
phải tự luận để đƣa ra câu trả
lời.
Dễ soạn câu hỏi

Dễ sai về diễn đạt, nội dung
Mức độ phức
câu hỏi thiếu chính xác (vì có
tạp khi viết câu
nhiều câu hỏi nên khó rà soát).
hỏi và tổ hợp
đề
Dễ chuẩn bị đáp án, hƣớng dẫn
chấm.
12

Ít bị sai sót về diễn đạt, nội
dung rõ ràng.
Khó xây dựng đáp án, hƣớng
dẫn chấm, xây dựng đáp án
phức tạp.



Có nhiều câu hỏi nên khó nhớ, Khó bảo mật đề thi do có ít
dễ bảo mật.
câu hỏi.
Tốn ít thời gian làm bài, đề Phải dành nhiều thời gian cho
kiểm tra có thể phủ toàn bộ học sinh làm bài, khó kiểm tra
chƣơng trình.
toàn bộ chƣơng trình.

Mức độ phức
tạp khi tổ chức Tốn nhiều thời gian cho việc Không tốn nhiều công sức in
thikiểm tra
in ấn, nhân đề.
ấn đề.
Học sinh khó sử dụng tài liệu, Học sinh dễ quay cóp sử dụng
loại trừ tiêu cực trong thi cử.
tài liệu, tiêu cực trong thi cử.
Vấn đề đoán
mò phƣơng án Học sinh có thể đoán mò.
trả lời đúng

Học sinh không đoán đƣợc câu
trả lời đúng.

Độ tin cậy của
Độ tin cậy cao.
đề thi

Độ tin cậy thấp.


Có thể đánh giá đầy đủ các Dễ đánh giá đƣợc các mức
mức nhận thức nếu các câu hỏi nhận thức cao (phân tích, tổng
hợp, đánh giá).
Tính giá trị của đƣợc soạn kỹ.
đề thi
Bao quát toàn bộ chƣơng trình Không bao quát toàn bộ
nên đánh giá chính xác hơn, có chƣơng trình nên độ giá trị có
thể có độ giá trị cao hơn.
thể không cao.
Sự phức tạp
Chấm điểm khách quan, công Chấm điểm phụ thuộc vào ý
của việc chấm
bằng
chủ quan của ngƣời chấm.
điểm
Mức độ phức
tạp khi phân
tích, đánh giá
câu hỏi thi

Có nhiều phần mềm để phân
tích, đánh giá câu hỏi, lựa Khó phân tích, đánh giá câu
chọn những câu hỏi có chất hỏi.
lƣợng.

13


1.1.5. Sơ lược về khoa học đo lường đánh giá trên thế giới và Việt Nam.

1.1.5.1. Sơ lược về khoa học đo lường đánh giá trên thế giới
Lý thuyết trắc nghiệm đã đƣợc xây dựng và đƣa vào ứng dụng trong các trƣờng
đại học ở Mỹ và một số nƣớc khác từ khá sớm (bắt đầu từ những năm 1920). Lý thuyết
trắc nghiệm là cơ sở khoa học giúp đánh giá chất lƣợng của bài thi trắc nghiệm (thông
qua đánh giá các câu hỏi) và ƣớc lƣợng năng lực thí sinh (thông qua việc thí sinh trả
lời các câu hỏi). Lĩnh vực khoa học đo lƣờng phát triển mạnh ở Mĩ vào thời kỳ từ
trƣớc và sau thế chiến thứ hai với những dấu mốc quan trọng nhƣ trắc nghiệm trí tuệ
Stanford-Binet xuất bản năm 1916, bộ trắc nghiệm thành quả học tập tổng hợp đầu
tiên Stanford Achievement Test ra đời vào năm 1923. Cho đến nay có hai hệ lý luận
chính dùng trong lý thuyết đo lƣờng giáo dục, đó là: lý thuyết trắc nghiệm cổ điển
(Classical Test Theory - CTT); lý thuyết ứng đáp câu hỏi (Item Response Theory IRT). IRT ra đời sau CTT và hiện nay trên thế giới IRT đƣợc áp dụng rộng rãi trong
các hệ thống đánh giá giáo dục, đặc biệt là ở Mỹ, Australia và một số nƣớc phát triển
khác.
Hai cách tiếp cận thống kê về lý thuyết đo lƣờng, thƣờng đƣợc gắn nhãn nhƣ là
"cổ điển" và "hiện đại" (lý thuyết ứng đáp câu hỏi) (Gustaffson 1977, Crocker và
Algina 1986). Mặc dù chúng tƣơng đối khác nhau, nhƣng không nên xem chúng nhƣ
các đối thủ bởi chúng bổ sung các ƣu nhƣợc điểm cho nhau. Có lẽ vấn đề khác biệt có
thể đƣợc hiểu là sự phụ thuộc vào mẫu và so bằng của bài kiểm tra cổ điển. Điểm số
đƣợc tính trên cơ sở các thủ tục phân tích cổ điển cung cấp thông tin về khả năng của
thí sinh chỉ ở một mức độ hạn chế. Ngoài ra, vì kiểm tra các đặc tính của thí sinh đƣợc
xác định trên cơ sở hồi đáp của một tập hợp học sinh, chỉ có thể đƣợc tái sử dụng với
cùng một tập học sinh đó hoặc với một tập học sinh mới có những đặc điểm tƣơng
đồng với tập học sinh đã cho - một trở ngại lớn trong cách hiệu quả xây dựng ngân
hàng câu hỏi.
Bên cạnh về sự nghiên cứu và phát triển của lý thuyết khảo thí cổ điển (CTT)
những năm đầu thế kỉ 20 ở châu Âu và Mỹ, từ thập niên 50 những công trình đầu tiên
về lý thuyết khảo thí hiện đại (IRT) đã đƣợc công bố. Allen Birnbaum đã viết một loạt
các báo cáo kỹ thuật về các mô hình và mô hình kiểm tra đánh giá tham số vào năm
14



×