Tải bản đầy đủ (.pdf) (14 trang)

ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI TRẮC NGHIỆM KHÁCH QUAN TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI ĐẠI HỌC THÁI NGUYÊN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (246.86 KB, 14 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
VIỆN ĐẢM BẢO CHẤT LƯỢNG GIÁO DỤC

––––––––––––––––––––––

NGUYỄN TRƯỜNG SƠN

ĐÁNH GIÁ QUY TRÌNH THIẾT KẾ ĐỀ THI
TRẮC NGHIỆM KHÁCH QUAN
TẠI KHOA KHOA HỌC TỰ NHIÊN VÀ XÃ HỘI
ĐẠI HỌC THÁI NGUYÊN

Chuyên ngành: Đo lường và đánh giá trong Giáo dục
(Chuyên ngành đào tạo thí điểm)

TÓM TẮT LUẬN VĂN THẠC SĨ

Hà Nội - 2010


Công trình được hoàn thành tại: Viện Đảm bảo chất lượng giáo dục,
Đại học Quốc gia Hà Nội

Người hướng dẫn khoa học: PGS. TS LÊ ĐỨC NGỌC

Phản biện 1: ………………………………………………
Phản biện 2: ………………………………………………

Luận văn sẽ được bảo vệ trước Hội đồng chấm Luận văn Thạc sĩ họp
tại: Viện Đảm bảo chất lượng giáo dục, Đại học Quốc gia Hà Nội
Vào hồi … giờ … ngày … tháng … năm 2010



Có thể tìm hiểu luận văn tại:
- Viện Đảm bảo chất lượng Giáo dục - ĐHQGHN.
- Trung tâm thông tin - Thư viện, ĐHQGHN.


MỤC LỤC

quy trình và kỹ thuật xây dựng câu hỏi TNKQ, GV có thể tự thiết kế

Trang

các đề thi TNKQ theo quy trình và đảm bảo được chất lượng của đề
thi. Đồng thời cũng giúp các GV đọc kết quả phân tích và xử lý kết

MỞ ĐẦU

1

quả thi, dựa trên kết quả đó, GV có những điều chỉnh để nâng cao

1. Lý do chọn đề tài

1

chất lượng đề thi nói riêng và chất lượng dạy học nói chung.

2. Mục đích nghiên cứu của đề tài

2


3. Nhiệm vụ nghiên cứu của đề tài

3

hiện được mục đích, nhiệm vụ nghiên cứu và giả thuyết bước đầu đã

4. Giới hạn, phạm vi nghiên cứu

3

được kiểm nghiệm.

5. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài

3

2. KIẾN NGHỊ

6. Khách thể và đối tượng nghiên cứu

3

7. Phương pháp nghiên cứu

4

8. Cấu trúc của luận văn

4


CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN

5

1.1. Lịch sử vấn đề nghiên cứu

5

1.2. Các khái niệm cơ bản về đo lường và đánh giá trong GD

9

TNKQ, lý thuyết khảo thí hiện đại nói riêng và lý thuyết đánh giá nói

1.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá

13

chung, qua đó hình thành đội ngũ GV có trình độ kiến thức, kỹ năng

1.4. Quy trình xây dựng đề thi và NHCH TNKQ

19

và kinh nghiệm trong lĩnh vực khoa học mới này.

1.5. Kỹ thuật xây dựng các câu hỏi TNKQ

23


1.6. Phân tích đánh giá câu hỏi và bài trắc nghiệm

33

xây dựng ngân hàng câu hỏi TNKQ, tiếp tục tổ chức các lớp tập huấn

1.7. Kết luận chương 1

44

về thiết kế đề thi để nâng cao hiệu quả chất lượng thiết kế đề thi

CHƯƠNG 2. THỰC TRẠNG QUY TRÌNH THIẾT KẾ ĐỀ THI

TNKQ cho GV và cách phân tích các kết quả thi một cách nghiêm túc

TNKQ TẠI TRƯỜNG ĐẠI HỌC KHOA HỌC – ĐHTN

45

và khoa học.

2.1. Vài nét về trường Đại học Khoa học – ĐHTN

45

2.2. Thông tin chung về các giảng viên tham gia khảo sát

46


2.3. Thực trạng quy trình thiết kế đề thi TNKQ tại đơn vị

47

2.4. Kết luận chương 2

64

Từ kết quả thử nghiệm có thể khẳng định rằng luận văn đã thực

Từ những kết luận đã nêu trên, chúng tôi đề xuất một số kiến nghị
để nâng cao hiệu quả biên soạn và thiết kế đề thi TNKQ như sau:
1. Tiếp tục nâng cao nhận thức cho cán bộ, giảng viên và sinh viên
về tầm quan trọng của việc KTĐG thông qua hình thức thi TNKQ.
2. Tạo điều kiện cho GV học tập bồi dưỡng về phương pháp

3. Trường nên có kế hoạch đầu tư cho các giảng viên trong việc

24

1


CHƯƠNG 3: MỘT SỐ BIỆN PHÁP NÂNG CAO HIỆU QUẢ
QUY TRÌNH THIẾT KẾ ĐỀ THI TNKQ TẠI TRƯỜNG

1.2. Về mặt thực tiễn
Luận văn đã làm sáng tỏ thực trạng quy trình thiết kế đề thi TNKQ


ĐẠI HỌC KHOA HỌC - ĐHTN

65

tại trường Đại học Khoa học - Đại học Thái Nguyên, từ đó có thể rút

3.1. Nguyên tắc đề xuất biện pháp

65

ra một số kết luận sau:
- Thực trạng biên soạn, thiết kế đề thi TNKQ tại đơn vị còn rất

3.2. Một số biện pháp nâng cao hiệu quả quy trình thiết kế
đề thi TNKQ tại đơn vị

65

3.3. Tổ chức thử nghiệm biện pháp

66

3.4. Đánh giá chung của GV về tính khả thi và hiệu quả

nhiều bất cập, chưa đảm bảo độ tin cậy do nhiều lý do khác nhau: đề
thi được thiết kế chưa đảm bảo chất lượng do GV chưa có hoặc thiếu
kinh nghiệm ra đề. GV ít khi xác định mục tiêu đánh giá hoặc chưa
phù hợp với mục tiêu đề ra. Việc xây dựng bảng trọng số chưa hợp lý

của các biện pháp đã triển khai


80

và chưa được coi trọng đúng mức. Đề thi chưa bao phủ hết nội dung

3.5. Kết luận chương 3

82

chương trình đào tạo, thậm chí vẫn có những đề thi không phù hợp

KẾT LUẬN VÀ KIẾN NGHỊ

84

mục tiêu đề ra.

TÀI LIỆU THAM KHẢO

87

- Kết quả điều tra cũng cho thấy thực trạng hiện nay ở trường

PHỤ LỤC

90

ĐHKH là phần lớn giảng viên sau khi ra đề, chấm thi xong hầu như
không phân tích và xử lý kết quả thi. Đồng thời, có nhiều GV chưa


MỞ ĐẦU

được bồi dưỡng về việc biên soạn đề thi TNKQ cũng như cách phân
tích, xử lý kết quả thi. Họ cũng mong muốn nhà trường tổ chức tập

1. Lý do chọn đề tài

huấn bồi dưỡng cho họ về vấn đề này.

Hiện nay chất lượng giáo dục đang trở thành mối quan tâm chung
của toàn xã hội, đặc biệt là chất lượng giáo dục đại học. Trong khi
nguồn lực tại các cơ sở đào tạo còn hạn chế, chưa đủ đáp ứng kịp thời
việc tăng nhanh quy mô và các loại hình đào tạo thì vấn đề chất

Từ thực trạng trên chúng tôi thấy rằng cần phải có những biện
pháp cụ thể để nâng cao chất lượng biên soạn và thiết kế đề thi
TNKQ, góp phần đổi mới và nâng cao chất lượng đào tạo trong
Nhà trường.

lượng đào tạo trong giáo dục đại học hiện đang là điểm nóng rất cần
được quan tâm.
Một trong những nội dung quan trọng nhằm nâng cao chất lượng
giáo dục đại học chính là việc đổi mới phương pháp giảng dạy, trong

cao chất lượng cũng như hiệu quả của việc thiết kế đề thi TNKQ và

đó có việc đổi mới về phương pháp kiểm tra đánh giá kết quả học tập
của người học. Công cuộc đổi mới phương pháp giảng dạy ở trường

cao nhận thức về tầm quan trọng của hình thức thi TNKQ, nắm rõ các


2

23

Với thực trạng trên, Luận văn đã đề xuất 3 biện pháp nhằm nâng
đã tiến hành thử nghiệm thành công.
Với kết quả thử nghiệm, các biện pháp này đã giúp cho GV nâng


3.5. Kết luận chương 3
Dựa vào các nguyên tắc cơ bản, tác giả đã đưa ra 3 biện pháp
nhằm nâng cao hiệu quả quy trình thiết kế đề thi TNKQ tại đơn vị:
Biện pháp 1: Nâng cao nhận thức của GV về tầm quan trọng của
việc KTĐG thông qua hình thức thi TNKQ.
Biện pháp 2: Bồi dưỡng GV về quy trình và kỹ thuật xây dựng
đề thi TNKQ, cách xử lý kết quả thi.
Biện pháp 3: Tổ chức cho GV tự xây dựng và thử nghiệm đề thi
TNKQ cho SV.
Sau khi đề xuất biện pháp, chúng tôi tiến hành thử nghiệm nhằm
kiểm tra tính khả thi của các biện pháp đã đề xuất. Qua tổ chức thử
nghiệm chúng tôi thấy rằng việc tổ chức cho giảng viên tự xây dựng
bộ đề thi TNKQ sau đó thử nghiệm đề thi do chính các GV tự biên
soạn là rất cần thiết.

KẾT LUẬN VÀ KIẾN NGHỊ

đại học hiện nay đang được đặc biệt quan tâm, các giảng viên được
tập huấn về đổi mới phương pháp giảng dạy, các phương pháp kiểm
tra đánh giá, tuy nhiên hiệu quả chưa cao. Sử dụng ngân hàng câu hỏi

và thi trắc nghiệm khách quan hiện đang được các trường khuyến
khích, tuy nhiên đa số các câu hỏi trắc nghiệm khách quan do giảng
viên tự biên soạn chưa theo đúng quy trình, đặc biệt các câu hỏi sau
khi sử dụng không được phân tích, đánh giá nên các đề thi/ kiểm tra
hiện nay là chưa chuẩn và chất lượng không cao.
Trước tình hình như vậy, tôi chọn đề tài luận văn: “Đánh giá quy trình
thiết kế đề thi trắc nghiệm khách quan tại Khoa Khoa học Tự nhiên và
Xã hội (nay là trường Đại học Khoa học) - Đại học Thái Nguyên”.
Kết quả nghiên cứu của luận văn sẽ là tài liệu cần thiết góp phần vào
quá trình nâng cao chất lượng và hiệu quả của việc biên soạn và thiết
kế đề thi trắc nghiệm khách quan tại đơn vị, đồng thời giúp đưa ra
những giải pháp nhằm nâng cao kỹ năng của giảng viên trong việc
thiết kế câu hỏi.

1. KẾT LUẬN

2. Mục đích nghiên cứu của đề tài

1.1. Về mặt lý luận

• Đánh giá quy trình và hiệu quả của việc thiết kế và sử dụng các đề

Luận văn đã tổng hợp và hệ thống được phần nào các vấn đề
nghiên cứu về đo lường và đánh giá trong giáo dục nói chung. Lịch
sử vấn đề nghiên cứu trên thế giới và ở Việt Nam được trình bày theo
từng giai đoạn phát triển của ngành khoa học này.
Luận văn đã hệ thống hóa được các vấn đề lý luận có liên quan
như: các khái niệm cơ bản, mục đích ý nghĩa của khoa học đo lường
đánh giá; các phương pháp và kỹ thuật xây dựng công cụ ĐLĐG
thông qua hình thức TNKQ; quy trình xây dựng và thiết kế một đề

thi TNKQ chuẩn cũng như cách phân tích, xử lý và đánh giá một bài
trắc nghiệm.

22

thi trắc nghiệm khách quan hiện nay của Nhà trường;
• Đưa ra quy trình chuẩn thiết kế các đề thi trắc nghiệm khách quan.
• Đưa ra những giải pháp nhằm nâng cao kỹ năng thiết kế đề thi
TNKQ của giảng viên.
3. Nhiệm vụ nghiên cứu của đề tài
Để thực hiện mục đích trên, đề tài có các nhiệm vụ sau:
- Khảo sát thực trạng về quy trình, cách thức thiết kế đề thi trắc
nghiệm khách quan của các giảng viên trong Trường.

3


- Phân tích các câu hỏi trắc nghiệm khách quan của các đề thi đã
được sử dụng (căn cứ vào kết quả trả lời trắc nghiệm của SV).
- Đưa ra quy trình chuẩn thiết kế đề thi trắc nghiệm khách quan.
4. Giới hạn, phạm vi nghiên cứu
• Đề tài nghiên cứu phương pháp, cách thức thiết kế đề thi trắc
nghiệm khách quan của các giảng viên trong Trường;
• Nghiên cứu, đánh giá các câu hỏi trắc nghiệm khách quan của một
số đề thi TNKQ đã được sử dụng trong Trường, từ đó đề xuất quy
trình chuẩn thiết kế đề thi TNKQ.
5. Câu hỏi nghiên cứu/ giả thuyết nghiên cứu của đề tài.

yêu cầu tiêu chuẩn về kỹ thuật, về độ phù hợp với mô hình, độ khó,
độ phân biệt, độ giá trị của bài test…

3.4. Đánh giá chung của GV về tính khả thi và hiệu quả của các
biện pháp đã triển khai
Sau khi thử nghiệm, so sánh đề thi TNKQ thử nghiệm với đề thi
TNKQ do GV tự thiết kế trước đây, chúng tôi đã tiến hành khảo sát
lấy ý kiến của GV về tính khả thi đối với việc áp dụng quy trình
chuẩn để thiết kế đề thi TNKQ, kết quả thu được:
100% giảng viên cho rằng cần phải có một quy trình chuẩn để biên
soạn và thiết kế đề thi TNKQ;
100% giảng viên cho rằng cần phải được tập huấn đầy đủ và được
thử nghiệm thiết kế đề thi;

5.1. Câu hỏi nghiên cứu
• Hiện nay các giảng viên trong Trường thiết kế đề thi TNKQ trên
cơ sở nào? Theo quy trình nào?
• Các giảng viên có nắm được quy trình thiết kế đề thi TNKQ?
• Đề thi của các giảng viên có đáp ứng yêu cầu kiểm tra đánh giá
thành quả học tập hay không?

92% giảng viên cho rằng cần phải xác định đúng mục đích của
kỳ thi/ kiểm tra và cần phải xây dựng bảng trọng số khi thiết kế đề
thi TNKQ;
74% giảng viên khẳng định kỹ năng thiết kế đề thi TNKQ của họ
được nâng lên rõ rệt sau khi được tập huấn;
70% giảng viên cho rằng họ có thể tự xây dựng đề thi TNKQ cho

5.2. Giả thuyết nghiên cứu

các học phần mà họ giảng dạy theo quy trình chuẩn được tập huấn;

• Việc thiết kế đề thi TNKQ trong Nhà trường hiện nay hoàn toàn

theo tính chủ quan của các giảng viên.
• Chất lượng của các câu hỏi, đề thi TNKQ do các giảng viên biên
soạn không cao, không đánh giá chính xác năng lực của sinh viên.

35% giảng viên cho rằng việc phân tích đề thi là rất cần thiết và
phải được thực hiện liên tục;
100% giảng viên trong Khoa Sinh học cho rằng: đề thi TNKQ
được xây dựng theo quy trình chuẩn vừa được thử nghiệm đã đảm

6. Khách thể và đối tượng nghiên cứu

bảo được yêu cầu thống kê như đã phân tích ở trên; bảo đảm bao trùm

6.1. Khách thể nghiên cứu

nội dung môn học mà giảng viên giảng dạy, có khả năng chống được

• Các giảng viên đang giảng dạy tại Trường và đang áp dụng hình

hiện tượng học tủ, học lệch, gian lận trong thi cử; đề thi có thời gian

thức thi TNKQ cho các kỳ thi của Nhà trường.

hợp lý, phù hợp với trình độ của sinh viên và đảm bảo được tính
khách quan, công bằng khi chấm thi;

4

21



Tuy nhiên có một số câu cần xem lại các phương án lựa chọn (vì

• Các bài thi TNKQ (kết quả thi TNKQ của sinh viên).

số thí sinh lựa chọn các phương án nhiễu đó rất ít, hoặc thậm chí

6.2. Đối tượng nghiên cứu

không có thí sinh nào lựa chọn), cụ thể như sau:

• Nghiên cứu cách thức, quy trình thiết kế đề thi TNKQ của các

+ Câu 4 nên viết lại hoặc bỏ câu lựa chọn số 4;
+ Câu 10 nên viết lại hoặc bỏ lựa chọn số 2, 3;
+ Câu 12 nên viết lại hoặc bỏ lựa chọn số 1, 2;
+ Câu 20 nên viết lại hoặc bỏ lựa chọn số 1;
Kết luận 4 câu này nếu sửa được các phương án nhiễu trên thì sẽ
có được các câu hỏi tốt, đồng thời độ tin cậy của bài test sẽ tăng lên.
c. Dựa vào độ giá trị của bài trắc nghiệm
Nói đến độ giá trị của bài trắc nghiệm là nói đến độ giá trị về mặt
nội dung của nó, nghĩa là các câu hỏi trong bài trắc nghiệm có khả
năng bao trùm được nội dung của môn học. Đề thi trên bao gồm 50

giảng viên trong Trường hiện nay.
7. Phương pháp nghiên cứu
7.1. Nghiên cứu lý thuyết
• Nghiên cứu các tài liệu về đo lường đánh giá trong giáo dục.
7.2. Nghiên cứu thực nghiệm
• Quan sát: quan sát quá trình thực hiện đổi mới KTĐG của giảng

viên, quá trình thử nghiệm xây dựng ngân hàng câu hỏi TNKQ.
• Điều tra: bằng phiếu hỏi và phỏng vấn để tìm hiểu quy trình thiết
kế đề thi TNKQ của các giảng viên trong Trường.

câu hỏi được phân bổ đều trong các chương của môn học với các mục

• Phân tích và tổng kết kinh nghiệm

tiêu đã được thể hiện ở bảng trọng số, điều này chứng tỏ đề thi đã đạt

7.3. Phương pháp Toán học

được độ giá trị.

• Sử dụng phần mềm SPSS phân tích số liệu thống kê.

Bước 10: Tập hợp các câu hỏi thi:

• Sử dụng phần mềm chuyên dụng Quest, ConQuest.

Sau khi phân tích và đề xuất chỉnh sửa một số câu hỏi, các GV

8. Cấu trúc của luận văn

khoa Sinh học đều đồng ý rằng cần phải chỉnh sửa các câu hỏi trên để

Mở đầu

bộ câu hỏi được tốt hơn.


Chương 1. Cơ sở lý luận và tổng quan.

Sau khi xây dựng và thử nghiệm đề thi TNKQ học phần Sinh lý

Chương 2. Thực trạng quy trình thiết kế đề thi TNKQ tại trường
Đại học Khoa học - Đại học Thái Nguyên.

thực vật cho sinh viên, chúng tôi rút ra một số kết luận sau:
- Qua tập huấn, các GV đã bám sát vào mục tiêu môn học để biên

Chương 3. Một số biện pháp nâng cao hiệu quả quy trình thiết kế
đề thi TNKQ tại trường Đại học Khoa học - ĐHTN

soạn 50 câu hỏi trắc nghiệm đa lựa chọn. Bộ câu hỏi bao trùm toàn bộ
nội dung của học phần Sinh lý thực vật.
- Đề thi TNKQ cho học phần Sinh lý thực vật đã được thiết kế và
thử nghiệm thành công. Qua phân tích, bộ câu hỏi TNKQ này đạt các

20

Kết luận và kiến nghị
Tài liệu tham khảo
Phụ lục

5


CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ TỔNG QUAN

Những câu có độ khó < 20% là những câu rất khó, chỉ dùng để đo

thí sinh có năng lực cao, trong đề thi có 2 câu là câu 14 và 41 (tương

1.1. Lịch sử vấn đề nghiên cứu

ứng với P = 15.3% và P = 10.2%).

1.1.1. Trên thế giới

Bước 8: Xem lại câu hỏi thi lần 2: Khi có số liệu phân tích cần

1.1.2. Việt Nam

kiểm tra lại các câu hỏi xem có vấn đề gì không? Nếu do câu hỏi chưa

1.2. Các khái niệm cơ bản về đo lường và đánh giá trong giáo dục

tốt cần chỉnh sửa hoặc loại bỏ.

• Đo lường (Measurement)

Bước 9: Chỉnh sửa câu hỏi:

• Đánh giá (Evaluation)

- Xác định những câu hỏi cần sửa chữa và đề xuất cách sửa:

• Lượng giá (Assessment)

a. Dựa vào độ phân biệt:


• Kiểm tra (Testing)

Dựa vào độ phân biệt (Disc) xác định những câu hỏi cần sửa chữa sau:
Disc < 0.2: có 8 câu (chiếm 16%)

• Thi (Examination)
• Kết quả học tập (Study achievement):
1.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá
1.3.1. Kiểm tra đánh giá kết quả học tập
1.3.2. Mục đích, ý nghĩa của việc kiểm tra, đánh giá KQHT
1.3.3. Phương pháp trắc nghiệm trong kiểm tra đánh giá
1.4. Quy trình xây dựng đề thi và ngân hàng câu hỏi TNKQ
1.4.1. Quy trình xây dựng đề thi TNKQ
Bước 1: Xác định mục đích sử dụng đề thi/ kiểm tra
Bước 2: Chọn mẫu
Bước 3: Xác định mục tiêu, phân tích nội dung chi tiết và xây
dựng bảng trọng số
Bước 4: Viết câu hỏi thi
Bước 5: Xem lại câu hỏi thi lần 1
Bước 6: Thử nghiệm
Bước 7: Phân tích câu hỏi và bài thi
Bước 8: Xem lại câu hỏi thi lần 2
Bước 9: Chỉnh sửa câu hỏi

6

Các câu này phần lớn rơi vào các câu khó hoặc rất khó, để lập
ngân hàng đề thi cũng cần phải sử dụng các câu hỏi này nên không
cần loại bỏ.
b. Dựa vào độ khó của câu hỏi:

Phân tích độ khó của câu trắc nghiệm cho ta thấy giá trị P của mỗi
câu chưa khẳng định được câu hỏi đó tốt hay không, nhưng nó nói lên
độ khó tương đối của câu hỏi đó đối với số thí sinh tham gia làm bài
trắc nghiệm.
Những câu có độ khó < 20% là những câu rất khó, chỉ dùng để đo
thí sinh có năng lực cao, trong đề thi có 2 câu là câu 14 và 41 (tương
ứng với P = 15.3% và P = 10.2%).
Như đã phân tích ở trên nên các câu hỏi quá khó hoặc quá dễ đều
có thể giữ lại vì để đo thí sinh có năng lực khác nhau. Do vậy các câu
hỏi trong bộ đề trên nhìn chung là đảm bảo yêu cầu về độ khó nên
không cần chỉnh sửa.

19


Độ khó của câu hỏi là một trong những đặc tính quan trọng của
câu hỏi bởi vì nó nói lên độ tin cậy và độ giá trị của từng câu hỏi
trong bài thi/ kiểm tra. Đồng thời nó cũng cho phép chúng ta so sánh
độ khó của câu hỏi so với năng lực của thí sinh. Để có thể phân tích
được độ khó của câu hỏi thì phần mềm Quest cung cấp cho chúng ta
một ma trận (biểu đồ) so sánh năng lực của các thí sinh với độ khó
của các câu hỏi trong bài trắc nghiệm.
Nhận xét: Ma trận trên cho thấy sự phân bố giữa độ khó của câu
hỏi với năng lực của các thí sinh là phân bố chuẩn hay độ khó của các
câu hỏi phù hợp với hầu hết năng lực của các thí sinh.
- Các thí sinh có năng lực ở các mức khác nhau.
c. Các chỉ số thống kê khác
- Độ phân biệt:
Có 18% (9/50) câu hỏi có độ phân biệt Disc ≥ 0.4, đây là những
câu rất tốt, bao gồm các câu hỏi số 7, 24, 27, 28, 35, 36, 38, 43, 49.

Có gần 60% (29/50) câu hỏi có Disc ≥ 0.2, đây là những câu tốt và
khá tốt, thỏa mãn về độ phân biệt.
- Độ khó:
Những câu có độ khó P > 70% là những câu trắc nghiệm dễ.
Trong đề thi có 10 câu (5, 9, 10, 12, 15, 16, 18, 20, 31, 43), chiếm
20% tuy nhiên không cần điều chỉnh lại câu này vì có một số thí sinh
có năng lực thấp.

Bước 10: Tập hợp các câu hỏi thi
1.4.2. Ngân hàng câu hỏi TNKQ
1.5. Kỹ thuật xây dựng các câu hỏi TNKQ
1.5.1. Loại đúng - sai (True or False)
1.5.2. Loại ghép đôi (Matching items)
1.5.3. Loại điền khuyết (Supply item)
1.5.4. Loại nhiều lựa chọn (Multi choice questions)
1.5.5. So sánh trắc nghiệm khách quan và trắc nghiệm tự luận
1.6. Phân tích đánh giá câu hỏi và bài trắc nghiệm khách quan
1.6.1. Mục đích phân tích câu hỏi và bài trắc nghiệm khách quan
1.6.2. Phương pháp phân tích câu hỏi theo lý thuyết khảo thí
hiện đại
1.6.3. Một số yêu cầu thống kê đối với câu hỏi và bài TNKQ
• Độ khó và độ phân biệt của câu trắc nghiệm
• Độ tin cậy
• Độ giá trị
• Độ phù hợp với mô hình của bài trắc nghiệm khách quan
1.7. Kết luận chương 1
Trong chương 1 đã trình bày các vấn đề sau:
- Khái quát các vấn đề nghiên cứu trên thế giới và Việt Nam;
- Một số vấn đề lý luận cơ bản về đo lường và đánh giá trong GD;
- Quy trình xây dựng đề thi TNKQ;

- Các kỹ thuật xây dựng câu hỏi TNKQ;
- Cách phân tích đánh giá câu hỏi và bài thi TNKQ.

Những câu có độ khó vừa phải (40% ≤ P ≤ 70%), gồm 27 câu hỏi.
Những câu có độ khó P < 40% là những câu trắc nghiệm khó,
trong đề thi có 6 câu, chiếm 12% (là các câu 4, 22, 27, 32, 37, 39).

18

7


CHƯƠNG 2. THỰC TRẠNG QUY TRÌNH

THIẾT KẾ ĐỀ THI TNKQ TẠI TRƯỜNG ĐẠI HỌC
KHOA HỌC - ĐHTN

- Thời gian làm bài trung bình 1,2 phút/ 01 câu.
- Câu trả lời đúng tính theo thang điểm quy định, câu trả lời sai 0 điểm.
Phân tích, đánh giá câu hỏi và bài thi trắc nghiệm
Sau khi thu lại toàn bộ bài làm của thí sinh, chúng tôi tiến hành

2.1. Vài nét về trường Đại học Khoa học - Đại học Thái Nguyên
2.2. Thông tin chung về các giảng viên tham gia khảo sát
2.3. Thực trạng quy trình thiết kế đề thi TNKQ tại đơn vị
2.3.1. Thực trạng sử dụng các phương pháp KTĐG
Về số lượng các phương pháp:
Theo kết quả điều tra từ các giảng viên, để kiểm tra đánh giá KQHT
của sinh viên trong trường, các giảng viên đã sử dụng các phương pháp
KTĐG để đánh giá KQHT của sinh viên như: Viết (tự luận), vấn đáp,

thực hành, tiểu luận và trắc nghiệm khách quan. Trong tổng số 163 đề thi
kết thúc học phần được khảo sát thì có tới 129 đề thi giảng viên đã sử
dụng phương pháp thi tự luận và vấn đáp (chiếm 79%, trong đó: tự luận
là 46,6%, vấn đáp là 32,4%). Một số ít giảng viên sử dụng phương pháp
trắc nghiệm khách quan (gần 10%) để đánh giá KQHT cho sinh viên.
Nhận thức của GV về hiệu quả của các phương pháp:
Tất cả các GV đều cho rằng khi họ lựa chọn một phương pháp
KTĐG nào đó đều có liên quan đến nội dung và mục tiêu môn học mà

làm các bước sau:
- Nhập số liệu vào SPSS.
- Làm sạch số liệu: kiểm tra lại xem có nhập sai hoặc bỏ sót số
liệu hay không.
- Lựa chọn phần mềm chuyên dụng: Sử dụng phần mềm QUEST.
Phân tích dữ liệu bằng mô hình Rasch: Sau khi sử dụng phần mềm
Quest, ta có các báo cáo thống kê về đặc tính của bài test như sau:
a. Độ phù hợp với mô hình của các câu hỏi và độ tin cậy của bài test.
- Độ phù hợp với mô hình:
Một trong những dẫn chứng quan trọng để nói rằng bộ câu hỏi do
các GV biên soạn là tốt khi xác định được tất cả các câu hỏi đều tạo
thành một cấu trúc. Kết quả phân tích bằng phần mềm Quest dựa trên
mô hình Rasch cho thấy tất cả các câu hỏi đều có Infit MNSQ nằm
trong khoảng từ 0.77 đến 1.30.

họ đảm nhận và họ đều nhận thức được hiệu quả của phương pháp đó,

Kiểm tra sự phù hợp trong thống kê với mô hình Rasch của các

nếu muốn đánh giá kỹ năng người học thì nên chọn phương pháp thực


câu hỏi (Fit statistics) Infit Mean Square có Mean = 1.00 (Rất tốt) và

hành; nếu muốn kết quả đánh giá khách quan, chấm bài nhanh, xử lý kết

SD = .08 (Tốt)

quả thuận lợi và đề thi bao phủ chương trình học thì sử dụng phương
pháp TNKQ; muốn đánh giá khả năng diễn giải thì ra đề tự luận…
2.3.2. Thực trạng quy trình thiết kế đề thi TNKQ
Để biết thực trạng thiết kế đề thi TNKQ như thế nào, ta cần nghiên

Kết luận: Dựa vào số liệu thu được ở bảng 3.3 và hình 3.2 trên rút
ra kết luận rằng, dữ liệu của 50 câu hỏi trắc nghiệm là hoàn toàn phù
hợp với mô hình Rasch và độ tin cậy của đề thi là đạt yêu cầu (0.87).
b. Độ khó của các câu hỏi

cứu những vấn đề sau:

8

17


Bước 1: Xác định mục đích sử dụng đề thi/ kiểm tra:
Bước 3: Xác định mục tiêu, phân tích nội dung chi tiết và xây
dựng bảng trọng số:
Các GV khoa Sinh học đã cùng xây dựng cấu trúc đề thi trắc
nghiệm học phần Sinh lý thực vật gồm 50 câu hỏi bao phủ các nội
dung chính của các chương trong học phần. Thời gian thi dự kiến là
60 phút (trung bình 1,2 phút/ 1 câu) và với thang điểm 10 (tương

đương 0,2 điểm/ câu).
Bước 4: Viết câu hỏi thi:
Bước 5: Xem lại câu hỏi thi lần 1:
Bước 6: Thử nghiệm: Tổ chức thử nghiệm đề thi, yêu cầu:
- 59 sinh viên chia làm 02 phòng, mỗi phòng có 02 cán bộ coi thi
giám sát việc làm bài của thí sinh.
- Những quy định và yêu cầu làm bài thi được cán bộ coi thi
hướng dẫn cụ thể, rõ ràng.

Xác định mục tiêu đánh giá, phân tích nội dung và xây dựng
bảng trọng số
Có nhiều GV không xác định rõ mục tiêu của đề thi/ kiểm tra
trong học phần đã dạy. Nói cách khác, các GV thường không lập
bảng trọng số về mục tiêu kiến thức và nội dung của học phần để ra
đề thi, dẫn đến có những nội dung đề cập nhiều và ngược lại, làm ảnh
hưởng đến độ giá trị của đề thi.
Phỏng vấn sâu các GV được biết, họ ít khi xác định mục tiêu đánh
giá và xây dựng bảng trọng số trước khi viết câu hỏi thi, các GV cho
rằng điều đó là không cần thiết vì trong quá trình dạy học và biên
soạn đề họ đã biết được phần nào quan trọng hơn. Có nhiều GV cho
rằng, việc xây dựng bảng trọng số chỉ cần thiết đối với các GV trẻ, ít
kinh nghiệm.
Về độ bao phủ, độ khó, độ phân biệt, độ tin cậy, độ giá trị và
thời gian thi, kiểm tra

- Mỗi sinh viên được bố trí ngồi 1 bàn và được phát 1 đề trắc
nghiệm và 1 phiếu trả lời.

Trong các bài thi kiểm tra, các câu hỏi thường ở mức độ nhận thức
biết và hiểu là chính, câu hỏi ở mức độ vận dụng ít, nhưng lại có


- Hết giờ thi, toàn bộ đề và phiếu trả lời được thu về nhằm tránh bị
lộ ra ngoài.

những bài thi có ít câu hỏi lại thường đánh giá người học ở mức độ
vận dụng nhiều. Bởi vậy việc ĐGKQHT chưa thật sự khoa học và

Bước 7: Phân tích câu hỏi và bài thi:

công bằng, đồng thời độ chính xác là không cao. Bài thi với những

- Với số lượng 50 câu hỏi cho thấy số lượng câu hỏi vừa đủ lớn để

câu hỏi ở mức độ vận dụng mà không có câu hỏi ở mức độ biết và

đảm bảo độ tin cậy và hợp lý.

hiểu, nếu sinh viên đạt kết quả không cao thì chúng ta không đánh giá

- Số lượng câu hỏi đã phân bố đều cho tất cả các chương và ở tất

chính xác khả năng và năng lực của sinh viên có đạt mục tiêu về kiến

cả các mục tiêu cần đánh giá. Sinh viên không thể xem nhẹ phần nào,

thức và kỹ năng của học phần đề ra hay không? Nếu GV thiết kế các

không thể học tủ, học lệch.

câu hỏi chỉ đo mức độ nhớ và hiểu thì nếu sinh viên nào học tủ hoặc


- Số lượng câu hỏi trên phạm vi kiến thức rộng nên sinh viên
không có cơ hội và thời gian quay cóp hoặc trao đổi bài trong khi thi.

học theo kiểu ghi nhớ máy móc thì sẽ được điểm cao, các sinh viên
học theo kiểu tư duy lại chỉ được điểm trung bình.

- Đề phát ra cho SV, không cho SV nhìn bài và trao đổi.

16

9


Theo kết quả điều tra có nhiều GV nhận thức rằng việc biên soạn
đề thi TNKQ sẽ cho kết quả đánh giá khách quan và công bằng, tuy
nhiên vì những lý do khác nhau mà GV vẫn hiếm khi sử dụng phương
pháp TNKQ để đánh giá KQHT của sinh viên.
Lý do GV hiếm khi sử dụng phương pháp TNKQ.

CHƯƠNG 3: MỘT SỐ BIỆN PHÁP NÂNG CAO

HIỆU QUẢ QUY TRÌNH THIẾT KẾ ĐỀ THI TNKQ
TẠI TRƯỜNG ĐHKH - ĐHTN
3.1. Nguyên tắc đề xuất biện pháp

- GV gặp khó khăn khi thiết kế câu hỏi TNKQ đạt yêu cầu kỹ thuật

3.2. Một số biện pháp nâng cao hiệu quả quy trình thiết kế đề thi


GV ở mỗi Khoa khác nhau gặp khó khăn khi biên soạn câu hỏi

TNKQ tại đơn vị

TNKQ chuẩn là khác nhau. Có 66% GV ở các khoa gặp khó khăn và

Trong khuôn khổ luận văn này chúng tôi đề xuất một số biện pháp sau:

34% GV không gặp khó khăn khi biên soạn bộ câu hỏi TNKQ chuẩn.

Biện pháp 1: Nâng cao nhận thức của GV về tầm quan trọng của

- GV chưa được bồi dưỡng về cách xây dựng đề thi TNKQ

việc KTĐG thông qua hình thức thi TNKQ.

Thực tế nhà trường chưa tổ chức được các buổi tập huấn cho GV

Biện pháp 2: Bồi dưỡng GV về quy trình và kỹ thuật xây dựng đề

về kỹ thuật xây dựng đề thi TNKQ, qua phiếu điều tra và phỏng vấn

thi TNKQ, cách xử lý kết quả thi.
Biện pháp 3: Tổ chức cho GV tự xây dựng và thử nghiệm đề thi
TNKQ cho SV.
3.3. Tổ chức thử nghiệm biện pháp

sâu cho thấy rằng nếu được tập huấn và tiếp cận với hình thức thi
TNKQ sớm thì họ sẽ áp dụng hình thức thi này để ĐGKQHT cho SV.
Mặt khác, có nhiều GV trẻ mới về trường công tác, chưa có kiến thức

và kinh nghiệm nhiều nên đây cũng chính là lý do mà các GV này
không lựa chọn phương pháp TNKQ.
- Thiếu thời gian soạn bộ câu hỏi TNKQ
Phần lớn các GV đều cho rằng để biên soạn bộ đề thi TNKQ cần
rất nhiều thời gian, cho nên chỉ có khoảng 21% GV cho rằng có thời
gian biên soạn câu hỏi TNKQ. Giải thích cho tỷ lệ trên là do một đề
thi TNKQ bao gồm rất nhiều câu hỏi, các câu hỏi đòi hỏi bao phủ
toàn bộ nội dung chương trình môn học, hơn nữa, để soạn được từng
câu hỏi TNKQ, GV phải nắm vững kỹ thuật viết: cách lựa chọn dạng
câu hỏi, độ khó, độ phân biệt, thời gian thi… sao cho phù hợp với nội
dung chương trình của từng học phần. Bởi vậy để soạn được 1 bộ đề
thi TNKQ mất rất nhiều công sức và thời gian.
- Thiếu kỹ năng phân tích, ngại thay đổi:

10

Tiến trình thử nghiệm cụ thể như sau:
Thứ nhất: Nâng cao nhận thức của GV về tầm quan trọng của việc
KTĐG thông qua hình thức thi TNKQ (biện pháp 1):
Thứ hai: Bồi dưỡng GV về quy trình và kỹ thuật xây dựng đề thi
TNKQ, cách xử lý kết quả thi (biện pháp 2).
- Tổ chức bồi dưỡng cho 12 CBGV của các Khoa Toán Tin, Sinh
học, Khoa học môi trường (xem chi tiết phụ lục 3.1).
Thứ ba: Tổ chức cho GV tự xây dựng và thử nghiệm đề thi TNKQ
cho SV (biện pháp 3).
Tổ chức cho các giảng viên Khoa Sinh học xây dựng và thử nghiệm
bộ câu hỏi TNKQ cho học phần “Sinh lý thực vật” (phụ lục 3.2).
Để thiết kế được một bộ đề thi TNKQ chuẩn cần phải đảm bảo
đúng quy trình (xem mục 1.4.1), gồm 10 bước sau:


15


là quá lớn, không đạt. Reliability of estimate = 0.63 là hơi thấp. Infit
Mean Square có SD = 0.28 là không tốt.

Một số GV cho rằng họ không có kỹ năng phân tích đề thi cũng
như phân tích kết quả thi. Một số GV khác thì lại có tâm lý ngại thay

Căn cứ vào sự phân bố của 50 câu hỏi cho thấy: có 15/50 câu hỏi

đổi, họ cho rằng các đề thi tự luận hiện nay của họ hoàn toàn có thể

không cùng một mô hình do chúng không tạo thành một cấu trúc. Các

đánh giá chính xác năng lực của SV nên họ không muốn và không

câu hỏi có độ khó nằm trong khoảng -3.5 đến 3.2 trên thang logit còn

cần phải thiết kế các đề thi TNKQ…

năng lực của thí sinh nằm trong khoảng -0.8 đến 2.8 trên thang logit.

Có những GV mặc dù đã tự nghiên cứu về xây dựng đề thi TNKQ,

Có 19 câu hỏi: 3, 15, 21, 2, 6, 10, 30, 7, 8, 16, 48, 12, 40, 36, 34, 23,

nhưng do chưa có kinh nghiệm thiết kế nên họ không chắc chắn vào

28, 9 và 46 là quá dễ so với năng lực của thí sinh (chiếm 38%)). Cần


chất lượng biên soạn đề thi của mình.

bổ sung thêm các câu hỏi có độ khó nằm trong khoảng từ 0 đến 1.8
trên thang logit (vì có nhiều thí sinh có năng lực trong khoảng này.)
Qua việc phân tích đề thi TNKQ học phần Khoa học môi trường
đại cương bằng lý thuyết khảo thí hiện đại, chúng tôi thấy rằng đề thi
này chưa phù hợp với năng lực của các thí sinh, các câu hỏi thi chưa
tạo thành một cấu trúc do có quá nhiều cá thể ngoại lai. Độ tin cậy
của đề thi này không cao, dẫn đến độ giá trị của đề thi thấp, hay nói
cách khác, đề thi này chưa đạt yêu cầu của một đề thi TNKQ.
2.4. Kết luận chương 2
Việc phân tích thực trạng quy trình thiết kế đề thi TNKQ tại
trường ĐHKH đã tồn tại những vấn đề cơ bản sau:
- Đề thi khó có khả năng bao phủ chương trình học, tiêu chí đánh giá
chưa rõ ràng, quy trình chấm điểm chưa đảm bảo. Thậm chí có đề thi còn
chưa phù hợp với chương trình học (về nội dung, độ khó, thời gian thi…).
- Các đề thi được biên soạn phần lớn dựa theo kinh nghiệm chủ
quan cá nhân, chưa đúng theo quy trình.
- Chưa chú trọng đến chất lượng của đề thi.

14

Như vậy, qua các phân tích ở trên chúng ta có thể thấy rằng với quy
trình thiết kế đề thi TNKQ như hiện nay ở phần lớn các khoa bộ môn
trong trường ĐHKH sẽ không đánh giá chính xác được năng lực của SV.
2.3.3. Thực trạng phân tích và xử lý kết quả thi
• Phân tích kết quả thi
Kết quả điều tra cho thấy rằng khoảng 34% GV cho rằng họ có
phân tích câu hỏi thi sau khi chấm bài và 66% không phân tích. Đây

là một điều rất đáng quan tâm vì sau khi chấm thi hầu như các GV
không bao giờ quan tâm xem đề thi của mình có phù hợp với mục tiêu
của học phần đề ra hay không? Có bao phủ nội dung chương trình
đào tạo? Có đảm bảo khách quan công bằng và phù hợp với năng lực
của SV không? Thực trạng này cho thấy việc ra đề và việc kiểm tra
đánh giá cho SV còn nhiều bất cập.
• Phân tích độ khó
Có tới 70% GV hiếm khi và không bao giờ phân tích độ khó sau khi
thi, tương ứng với 30% GV thường xuyên hoặc thỉnh thoảng phân tích
độ khó của đề thi. Điều này chứng tỏ các GV vẫn coi nhẹ việc phân tích
đề thi, họ cho rằng đây là việc làm không cần thiết và tốn thời gian.
• Phân tích độ phân biệt
Có khoảng 60% giáo viên hiếm khi hoặc không bao giờ phân tích
độ phân biệt của đề thi. Điều này được giải thích bởi khi chấm thi

11


xong GV thường không quan tâm xem với những SV khá giỏi và SV
trung bình yếu có kết quả thi ra sao.
Kết hợp với phỏng vấn sâu chúng tôi thu được một số lý do sau:
Thứ nhất, do GV hiện nay đang phải dạy quá nhiều giờ. Thứ hai, một
số GV cho rằng đề thi của họ chắc chắn đạt chất lượng nên không cần
phải phân tích đề thi. Thứ ba, một số GV cho rằng việc này không có
trong quy định nên họ không làm.
• Phân tích, xử lý câu hỏi và bài thi
Kết quả điều tra trên cho thấy thực trạng hiện nay đa số GV ở
trường ĐHKH sau khi ra đề, coi thi, chấm thi xong hầu như không
bao giờ phân tích câu hỏi thi cũng như bài thi. Nguyên nhân chính
của vấn đề này là do chưa được đào tạo, bồi dưỡng kiến thức, mặt

khác còn do vấn đề về thời gian và kinh phí cho vấn đề này.
2.3.4. Thực trạng chất lượng đề thi

không khó lắm tuy nhiên nội dung quá nhiều, thời gian làm bài không
đủ. Có thể kết luận rằng thời gian thi không phù hợp với số lượng và
nội dung của câu hỏi thi. Với những sinh viên có năng lực cao chỉ làm
được 70% số lượng câu hỏi thi đã hết thời gian làm bài.
Đề thi học phần Giải tích A1:
Với 20 câu hỏi TNKQ dạng MCQ, đề thi học phần Giải tích A1 có
thời gian làm bài là 90 phút (xem thông tin chi tiết tại phụ lục 2.3).
Kết quả phân tích cho thấy đa số sinh viên cho rằng đây là đề thi vừa
phải, tuy nhiên do thời gian làm bài tương đối nhiều (90 phút) nên
hầu hết sinh viên làm được hết các câu hỏi của bài thi. Điều này cho
thấy thời gian thi không cân đối với độ khó và số lượng câu hỏi (4,5
phút/1 câu).
Có 60% sinh viên đạt điểm khá (7 đến 8 điểm), 18% sinh viên đạt

Để biết chất lượng các đề thi như thế nào, ngoài việc nghiên cứu

điểm giỏi (9 đến 10 điểm) và chỉ có 22% sinh viên đạt điểm trung

các đề thi đã sử dụng, cần phân tích kết quả bài làm của SV. Trong

bình (5 và 6 điểm). Điểm thấp nhất của sinh viên trong học phần này

khuôn khổ luận văn này, chúng tôi tập trung nghiên cứu và phân tích

là 5 điểm và điểm cao nhất là 10 điểm. Kết quả trên cho thấy đề thi có

một vài đề thi TNKQ để phần nào minh họa chất lượng đề thi hiện


quá nhiều câu dễ cho nên không đánh giá được năng lực của các sinh

nay ở trường.

viên khá giỏi và không phân loại được sinh viên.

Đề thi Xã hội học đại cương:
Theo kết quả thi TNKQ, học phần Xã hội học đại cương với 60

Phân tích đề thi TNKQ của học phần “Khoa học môi trường đại cương”
bằng lý thuyết khảo thí hiện đại:

câu hỏi MCQ với thời gian thi là 60 phút (xem thông tin chi tiết trong

Đây là đề thi TNKQ do giảng viên Khoa Khoa học Môi trường tự

Phụ lục 2.2) với một lớp 50 thí sinh. Trung bình thời gian trả lời câu

biên soạn để đánh giá KQHT của sinh viên năm thứ nhất ngành Cử

hỏi là 1phút/ 1câu. Theo kết quả thu được, có 26% sinh viên đạt điểm

nhân KHMT, trong học kỳ II năm học 2008-2009.

dưới trung bình và 66% sinh viên đạt điểm trung bình. Có 2 sinh viên

Đề thi kết thúc học phần Khoa học môi trường đại cương bao gồm

đạt điểm thấp nhất là 3 điểm và có 4 sinh viên đạt điểm cao nhất là 7


50 câu hỏi, thời gian thi là 60 phút (xem chi tiết ở phụ lục 2.4). Sau

điểm. Như vậy có thể thấy rằng đề thi này không phù hợp so với năng

khi chấm thi, nhập số liệu và phân tích kết quả bằng phần mềm Quest,

lực của sinh viên. Điều này phù hợp với thông tin thu được khi tiến

căn cứ vào mục 1.6.3 trong chương 1, chúng tôi thấy rằng: SD = 1.53

hành phỏng vấn sâu sinh viên, các sinh viên đều cho rằng đề thi này

12

13



×