Một nghiên cứu về việc sử dụng phần mềm thống kê trong việc so bằng bằng đề kiểm tra trắc nghiệm khách quan

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (936.49 KB, 22 trang )

MỘT NGHIÊN CỨU VỀ VIỆC SỬ DỤNG PHẦN MỀM THỐNG KÊ TRONG
VIỆC SO BẰNG ĐỀ KIỂM TRA TRẮC NGHIỆM KHÁCH QUAN CHƯƠNG
NGUYÊN HÀM – TÍCH PHÂN VÀ ỨNG DỤNG LỚP 12
1. ĐẶT VẤN ĐỀ
Trắc nghiệm khách quan (TNKQ) là một hình thức kiểm tra đánh giá kết quả học
tập được sử dụng ngày càng phổ biến những năm gần đây ở nước ta. Hơn thế nữa, kể
từ năm 2017, trong kì thi Trung học phổ thông quốc gia (THPTQG), môn Toán đã thi
theo hình thức TNKQ. Dù hình thức thi TNKQ có nhiều ưu điểm nhưng hạn chế lớn
nhất của nó là không thể đánh giá được một cách chính xác khả năng lập luận, phán xét,
tư duy của học sinh (HS). Mặc khác thi THPT mỗi học sinh làm một mã đề, do đó vấn
đề đặt ra liệu các mã đề đó có độ khó tương đương nhau hay không? Có đảm bảo công
bằng cho các thí sinh khi làm các đề kiểm tra đó hay không? Bài viết trình bày quy trình
so bằng đề kiểm tra (ĐKT) dựa trên cơ sở lý thuyết so bằng dưới sự hỗ trợ của phần
mền IATA.
2. SƠ LƯỢC VỀ IRT
Lý thuyết Ứng đáp Câu hỏi (Item Response Theory - IRT) là một lý thuyết của
khoa học về đo lường trong giáo dục, ra đời từ nửa sau thế kỷ 20 và phát triển mạnh mẽ
cho đến nay. Trước đó, Lý thuyết Trắc nghiệm cổ điển (Clasical Test Theory – CTT)
đã có nhiều đóng góp quan trọng cho các hoạt động đánh giá trong giáo dục nhưng
cũng thể hiện một số hạn chế. Xuất phát từ lý do đó các nhà tâm trắc học
(psychometricians) cố gắng xây dựng một lý thuyết hiện đại sao cho khắc phục được
các hạn chế đó. Lý thuyết trắc nghiệm hiện đại được xây dựng dựa trên mô hình toán
học, đòi hỏi nhiều tính toán, nhưng nhờ sự tiến bộ vượt bậc của công nghệ tính toán
bằng máy tính điện tử vào cuối thế kỷ 20 – đầu thế kỷ 21, nên nó đã phát triển nhanh
chóng và đạt được những thành tựu quan trọng. Để đánh giá đối tượng nào đó, CTT tiếp
cận ở cấp độ một đề kiểm tra, còn lý thuyết trắc nghiệm hiện đại tiếp cận ở cấp độ từng
câu hỏi, do đó lý thuyết này thường được gọi là Lý thuyết Ứng đáp Câu hỏi.
3. LÝ THUYẾT SO BẰNG
3.1 Một số khái niệm so bằng
Theo Lâm Quang Thiệp (2011): “So bằng là qui trình tìm một hàm nào đó để
chuyển điểm của thí sinh (TS) thu được từ một đề khảo sát nào đó sang một thang điểm

1

của đề quy ước làm gốc”.
Ở nước ngoài, có học giả đã nghiên cứu chuyên sâu về so bằng đó là Finch, W.H
and French, B.F (2019) đã trình bày về các lý thuyết so bằng, so bằng về điểm thô và
so bằng điểm năng lực  theo lý thuyết Ứng đáp câu hỏi (IRT). Ở Việt Nam, Lâm
Quang Thiệp (2011) đã trình bày cơ bản về việc so bằng hai đề trắc nghiệm (ĐTN)
tiếng Việt năm 2001 (VIỆT01) và năm 2007 (VIỆT07).
Có hai phương pháp so bằng (equating) ĐTN đó là so bằng trong Lý thuyết trắc
nghiệm cổ điển (CTT) và so bằng kết nối - xác lập thang đo theo (Lý thuyết ứng đáp
câu hỏi) IRT. Chúng tôi chọn phương pháp so bằng kết nối - xác lập thang đo theo IRT
vì hiện nay hầu như các nhà nghiên cứu về đo lường và đánh giá đều sử dụng IRT. Theo
IRT, so bằng chủ yếu là về điểm thô. Như vậy, phương tiện so bằng hai ĐKT là so bằng
về điểm thô.
Câu hỏi (CH) neo là CH chung của hai đề kiểm đề kiểm tra.
3.2 Thiết kế kết nối tạo lập thang đo
Theo Lâm Quang Thiệp (2011) có 4 cách thiết kế kết nối để tạo lập thang đo các
tham số CH:
- Thiết kế đơn nhóm;
- Thiết kế các nhóm tương đương;
- Thiết kế các ĐTN có các CH neo;
- Thiết kế có các TS chung.
Trong các thiết kế được mô tả trên đây, theo Lâm Quang Thiệp (2011)“thiết kế
ĐTN có các CH neo là khả thi nhất”.
Trong các thiết kế ĐTN có các CH neo, các tham số, và các giá trị ước lượng của
chúng (không kể sai số chọn mẫu) trong hai ĐTN có quan hệ tuyến tính, đó là
bYc   bXc  
aYc  a Xc 

Trong đó bXc và bYc là các độ khó của các CH neo tương ứng trong các ĐTN X và
ĐTN Y, khi các hằng số  và  đã được xác định, các giá trị ước lượng tham số đối
với mỗi CH trong ĐTN X có thể được đặt trên cùng thang đo với ĐTN Y. Các giá trị
ước lượng tham số CH đối với các CH neo trong ĐTN X và trong ĐTN Y sẽ không như
nhau (vì có sai số ước lượng), do đó sẽ được lấy trung bình.
2

Trong việc sử dụng cách thiết kế ĐTN có các CH neo thì số lượng CH neo và các
đặc trưng của chúng đóng vai trò quan trọng đối với chất lượng của việc kết nối. Do đó,
một điều rất quan trọng là các CH neo đều nằm ở khoảng độ khó có thể chấp nhận đối
với cả hai nhóm và thông thường số CH neo chiếm khoảng từ 20% đến 25% của số
lượng CH trong các ĐTN.
3.3 Xác định các hằng số khi so bằng điểm thô
Theo Finch, W.H and French, B.F (2019), để chuyển điểm của TS từ ĐKT B
sang ĐKT A ta sử dụng công thức sau đây:
xA  a( xB  c)  d

a

2
2
2
s A2  bAZ
1  s z  s z1 

2
2
2
sB2  bBZ

2  sz  sz 2 

2
c  xB  bBZ
2  xz  xz 2 
2
d  x A  bAZ
1  x z  x z1 

Trong đó:
xA : điểm thô chuyển từ ĐKT B sang ĐKT A
xB : điểm thô của ĐKT B
a, c, d : các tham số thang đo chung của hai ĐKT

s A2 : phương sai điểm thô toàn CH của ĐKT A

sB2 : phương sai điểm thô toàn CH của ĐKT B
xA : trung bình điểm thô toàn CH của ĐKT A
xB : trung bình điểm thô toàn CH của ĐKT B

sZ2 : phương sai điểm thô CH neo của ĐKT A và ĐKT B
sZ21 : phương sai điểm thô CH neo của ĐKT A
3

1.1

sZ2 2 : phương sai điểm thô CH neo của ĐKT B
xZ : trung bình điểm thô CH neo của ĐKT A và ĐKT B
xZ 1 : trung bình điểm thô CH neo của của ĐKT A

xZ 2 : trung bình điểm thô CH neo của của ĐKT B
bAZ 1 : hệ số góc của hàm hồi quy tuyến tính giữa điểm thô toàn CH và điểm thô

CH neo trong ĐKT A
bBZ 2 : hệ số góc của hàm hồi quy tuyến tính giữa điểm thô toàn CH và điểm thô

CH neo trong ĐKT B.
4 PHẦN MỀM IATA
IATA (Item and Test Analysis) là một phần mềm (được cung cấp miễn phí bởi
Fernando Cartwright) dùng để phân tích dữ liệu trong đánh giá giáo dục và tâm lý học.
Nó thực hiện phân tích các câu hỏi TNKQ cũng như toàn bộ bài kiểm tra dựa trên IRT,
từ đó giúp xây dựng được các câu hỏi TNKQ có chất lượng phù hợp với năng lực người
học và mục đích kiểm tra đánh giá.
4.1 Hướng dẫn cài đặt và sử dụng phần mềm IATA
Phần mềm IATA có thể cài đặt và sử dụng theo các bước sau:
Bước 1: Truy cập vào địa chỉ:
/>để tải file cài đặt phần mềm
Bước 2: Tiến hành cài đặt ứng dụng bình thường

4

Hình 1. Giao diện khi khởi động phần mền IATA
Bước 3: Phần mềm IATA tự động khởi động sau khi cài đặt hoặc người dùng có
thể tự khởi động phần mềm. Giao diện khi khởi động của phần mềm như Hình 1. Để sử
dụng phần mềm, người dùng không bắt buộc phải đăng kí tài khoản. Họ có thể thay đổi
ngôn ngữ sang Tiếng Việt tại bảng chọn “Select language for IATA”. Để bắt đầu phân
tích dữ liệu, người dùngnhấn vào Main Menu (Menu chính).
Bước 4: Menu chính của phần mềm gồm các lựa chọn như sau:

5

Hình 2. Màn hình chính của phần mềm IATA
4.2 Hướng dẫn phân tích dữ liệu câu trả lời
Bước 1: Tại Menu chính của phần mềm, ta chọn mục Response data analysis
(phân tích dữ liệu câu trả lời) .
Bước 2: Chúng ta nhập tập tin Dữ liệu câu trả lời của TS, tập tin này chứa các câu
trả lời của từng TS cho từng câu hỏi. Tập tin này được nhập bằng Excel, ví dụ như sau:

Hình 3. Bảng dữ liệu câu trả lời của thí sinh
Nhấn vào nút “Open file (mở tập tin)” và chọn đường dẫn thư mục chứa tập tin Dữ liệu
câu trả lời của học sinh (có thể đặt tên khác cho tập tin này). Sau đó nhấn OK

6

“Next”.

Bước 3: Người dùng nhập tập tin Dữ liệu câu hỏi, tập tin này chứa đáp án của từng
câu hỏi, mức độ nhận thức, nội dung kiểm tra. Tập tin này được nhập bằng Excel, ví dụ
như sau:

Hình 4. Bảng dữ liệu câu hỏi
Nhấn vào nút “Open file (mở tập tin)” và chọn đường dẫn thư mục chứa tập tin Dữ
liệu câu hỏi (có thể đặt tên khác cho tập tin này). Sau đó nhấn OK

“Next”.

Bước 4: Mục này nhập các thông số dùng để phân tích cũng như cách chấm điểm

cho từng câu hỏi, cách xử lý với những câu hỏi lỗi (không có đáp án, chọn hai đáp án,
chọn đáp án khác…). Ta có thể nhấn “Next” để bỏ qua bước này nếu điểm số cho từng
câu hỏi là bằng nhau và tất cả các đáp án không đúng quy định đều được chấm là sai.
Các trang còn lại là kết quả phân tích câu hỏi và bài kiểm tra, tùy vào mục đích nghiên
cứu mà ta sẽ xem xét kĩ những trang tương ứng.
4.3 Những ưu điểm của phần mềm IATA so với một số phần mền khác
Gần đây, trên thế giới cũng như ở Việt Nam, các nhà nghiên cứu sử dụng nhiều
phần mềm thống kê khác nhau để phân tích các câu hỏi TNKQ, hầu hết các phần mềm
này đều dựa trên IRT. Chẳng hạn, Sudol và Studer (2010) sử dụng phần mềm R để phân
7

tích câu hỏi TNKQ, Trần Thị Anh Đào (2008) dùng phần mềm Quest, Đặng Thị Hương
(2012) và Lâm Quang Thiệp (2011) dùng phần mềm Vitesta, Lê Ngọc và Đào Thị Trang
(2017) dùng phần mềm IATA… Phần mềm IATA có một số ưu điểm vượt trội hơn so
với các phần mềm phân tích ĐKT TNKQ
khác như sau:
- Phần mềm IATA được cung cấp hoàn toàn miễn phí, nên rất tiện lợi trong việc
phổ biến cho các giáo viên (GV) và không lo ngại vấn đề bản quyền của phần mềm.
- Ngôn ngữ hiển thị là Tiếng Việt nên dễ sử dụng.
- Các file dữ liệu đầu vào được nhập bằng file Excel, gần gũi, dễ sử dụng đối với
GV (phần mềm Vitesta yêu cầu GV nhập thủ công file dữ liệu từ file text).
- Có giao diện trực quan, sử dụng bằng bảng chọn và chuột nên dễ sử dụng (phần
mềm Quest yêu cầu người dùng phải viết các câu lệnh).
- Có đầy đủ các tính năng cần thiết của một phần mềm thống kê trong việc phân
tích ĐKT TNKQ, chẳng hạn như độ khó, độ phân biệt của mỗi câu hỏi… và đặc biệt là
phần mềm IATA cho phép ước lượng được năng lực thực sự của mỗi học sinh, từ đó có
thể đánh giá học sinh một cách chính xác hơn dựa vào năng lực thực sự của họ.
Từ những ưu điểm trên, phần mềm IATA được lựa chọn để giới thiệu cho GV
sử dụng trong việc phân tích các câu hỏi TNKQ của một ĐKT để đồng thời xây dựng

được thang đo chung giữa các ĐKT, từ đó so sánh điểm thô của TS khi làm ĐTN khác
nhau, cũng như đánh giá đúng năng lực thực sự của HS ở trường THPT.
5 QUY TRÌNH BIÊN SOẠN VÀ SO BẰNG ĐỀ KIỂM TRA TRẮC NGHIỆM
KHÁCH QUAN
Qua nghiên cứu các tài liệu tập huấn Kỹ thuật viết câu hỏi TNKQ, Công văn số
8773/BGDĐT-GDTrH ngày 30/12/2010 về việc hướng dẫn biên soạn đề kiểm tra….,
bài viết trình bày việc biên soạn, so bằng đề kiểm tra TNKQ chương Nguyên hàm –
Tích phân và ứng dụng lớp 12 theo một quy trình như sau:
Bước 1: Xác định mục đích của đề kiểm tra
ĐKT là một công cụ dùng để đánh giá kết quả học tâp của HS sau khi học xong
một chủ đề, một chương, một học kỳ, một lớp hay một cấp học nên người biên soạn
ĐKT cần căn cứ vào mục đích yêu cầu cụ thể của việc kiểm tra, căn cứ chuẩn kiến thức
kĩ năng của chương trình và thực tế học tập của HS để đề ra mục tiêu của ĐKT cho pù
8

hợp.
Bước 2: Thiết lập ma trận ĐKT
Dựa vào chuẩn kiến thức và kĩ năng, phân phối chương trình, thời gian làm bài
kiểm tra, số lượng câu hỏi, mục đích kiểm tra đánh giá… mà GV thiết lập một ma trận
đề cho phù hợp.
Bước 3: Biên soạn câu hỏi theo ma trận ĐKT
Dựa vào ma trận ĐKT, GV biên soạn lời dẫn cho các câu hỏi, đáp án đúng và các
đáp án nhiễu. Giải thích lý do xây dựng đáp án nhiễu. Các câu hỏi cần đảm bảo nội
dung, hình thức và mục đích kiểm tra đánh giá.
Bước 4: Xây dựng bảng đáp án và thang điểm
Dựa vào ĐKT đã biên soạn, GV xây dựng bảng đáp án và thang điểm cho từng
câu hỏi (nếu cần thiết).
Bước 5: Kiểm tra, chỉnh sửa ĐKT trước khi so bằng
Rà soát, kiểm tra, thẩm định nội dung, từ ngữ, kí hiệu, hình thức của từng câu hỏi

và bảng đáp án trước khi cho HS làm kiểm tra.
Bước 6: Chuyển điểm thô từ ĐKT này sang ĐKT kia
Dựa vào kết quả phân tích từng ĐKT từ phần mềm IATA, tiến hành nghiên cứu,
chuyển điểm thô từ ĐKT này sang ĐKT kiểm tra kia.
Bước 7: Kết luận về độ khó giữa hai ĐKT
Dựa vào kết quả chuyển điểm thô từ đó kết luận độ khó giữa hai ĐKT, từ đó có
những đề xuất, khắc phục làm sao cho hai ĐKT không lệch nhau quá lớn (nếu hai ĐKT
lệch nhau quá lớn).
6 DÙNG PHẦN MỀM IATA ĐỂ SO BẰNG HAI ĐỀ KIỂM TRA CHƯƠNG
NGUYÊN HÀM – TÍCH PHÂN VÀ ỨNG DỤNG LỚP 12
Bài viết chỉ giới thiệu cách phân tích, so bằng ĐKT được biên soạn và thẩm định
từ hai ĐKT chương Nguyên hàm – Tích phân và ứng dụng. ĐKT này gồm 30 CH TNKQ
và thời gian làm bài là 54 phút (lấy theo mốc thời gian của Bộ Giáo dục và Đào tạo 1,8
phút/câu). Theo Bộ Giáo dục và Đào tạo (2009), ma trận chi tiết mô tả chuẩn kiến thức,
kĩ năng, mục tiêu kiểm tra của hai ĐKT TNKQ được trình bày như sau:

9

Bảng 1. Ma trận đề kiểm tra chương nguyên hàm – tích phân và ứng dụng
Nhận
thức

Vận dụng
Nhận biết

Thông hiểu

Cấp độ
thấp

thức
Chủ đề

Cấp độ
cao

- Nhớ khái

- Tìm được

- Sử dụng

- Giải

niệm

nguyên hàm

được

quyết được

nguyên hàm

của một số

phương

bài toán

pháp đổi

thực tế

của một hàm hàm tương
số.

đối đơn giản biến số

- Biết các

dựa vào

tính chất cơ

bảng nguyên rõ cách đổi

bản của

hàm và cách

biến số

nguyên

tính nguyên

và không

hàm.

hàm từng

đổi biến số

phần.

quá một

Chủ đề 1
Nguyên
hàm

Tổng cộng

(khi đã chỉ

lần) để tính
nguyên
hàm.
- Tìm một
hàm số cụ
thể nhờ
xác định
nguyên
hàm.

8 câu
[2 câu]

[3 câu]

[2 câu]

[1 câu]

26,7%

[0,7 điểm]

[1 điểm]

[0,7 điểm]

[0,3 điểm]

[2,7 điểm]

10

- Nhớ định - Tính được - Sử dụng
nghĩa

tích tích

phân

của của một số pháp

hàm số liên hàm

tương tích

tính
phân

tục

bằng đối đơn giản. từng phần

công

thức

Niu-tơn

Chủ đề 2
Tích
phân

phân phương

và phương

–

pháp

đổi

Lai-bơt-nit.

biến số (khi

- Nhớ các

đã chỉ rõ

tính chất của

cách

tích phân.

biến số và

đổi

không đổi
biến số quá
một lần) để
tính

tích

phân

của

một

hàm

số.

9 câu

[2 câu]

[3 câu]

[4 câu]

30%

[0,7 điểm]

[1 điểm]

[1,3 điểm]

[3 điểm]

11

- Biết các - Tính được - Tính được công

thức diện tích, thể diện

tích, quyết được

tính diện tích tích của một thể
hình phẳng,
Chủ đề 3
thể tích vật
Ứng
dụng của thể, thể tích
tích phân khối
tròn
xoay

Giải

tích bài

toán

số hình giới một số hình thực

tế

hạn bởi các phải

xác bằng cách

hàm số đơn định

các sử

giản.

cận.

dụng

tích phân

nhờ

tích phân.

13 câu

[3 câu]

[2 câu]

[3 câu]

[5 câu]

43,3%

[1 điểm]

[0,7 điểm]

[1 điểm]

[1,7 điểm]

[4,4 điểm]

8 câu

9 câu

6 câu

30 câu

26,7%

30%

20%

100%

[2,7 điểm]

[3 điểm]

[2 điểm]

[10 điểm]

7 câu
Tổng tỉ lệ
23,3%
Điểm
[2,3 điểm]

Mỗi ĐKT gồm 30 CH TNKQ, trong đó có 6 CH neo (Câu 17, 18, 23, 25, 26, 30),
trong mỗi CH gồm 4 phương án lựa chọn và chỉ có duy nhất một đáp án đúng. Các CH
trong mỗi đề được sắp xếp theo mức độ nhận thức tăng dần từ nhận biết đến vận dụng
(ở cấp độ). Trong mỗi mức độ, các CH được sắp xếp theo từng chủ đề (thứ tự như trong
ma trận của ĐKT).
Trong mỗi CH, các phương án nhiễu được chúng tôi cân nhắc, dự đoán những sai
lầm mà HS có thể gặp phải trong quá trình sử dụng kiến thức hoặc trong quá trình giải
bài tập.
Toàn bộ quá trình thực nghiệm được thực hiện trên 544 HS thuộc 17 lớp khối 12
đang học tại 6 trường THPT ở các tỉnh Bạc Liêu, Sóc Trăng và Kiên Giang.

12

Đề kiểm tra A

Đề kiểm tra B

Hình 5. Kết quả phân tích 30 câu hỏi của hai ĐKT
13

Chúng tôi thống kê lại số câu theo màu sắc, kí hiệu như sau:
Bảng 2. Kết quả phân tích 30 CH TNKQ của ĐKT B

Màu sắc

Biểu tượng

ĐKT A

ĐKT B

24 câu

26 câu

Xanh

Ý nghĩa
Các thông số đều ở mức độ an
toàn, có thể xem xét lại CH nếu
muốn.
Một hoặc một vài thông số ở

Vàng

5 câu

3 câu

mức độ cảnh báo, cần xem xét
lại CH.
Một hoặc nhiều thông số ở mức

Đỏ

1 câu

1 câu

độ báo động, cần chỉnh sửa hoặc
thay đổi CH.

6.1 Đề kiểm tra A
Bảng 3. Bảng điểm thô toàn CH và điểm thô CH neo của ĐKT A
Câu
17

18

23

25

26

30

1
1
1
1
1
1

1
1
1
1
1
1
1
1
1
1

1
1
1
1
1
0
1
1
1
1
1
1
1
0
1
0

1
1

1
0
1
1
1
1
1
0
0
1
0
1
0
0

1
1
1
1
1
1
1
1
1
1
1
0
1
1
0

1

1
1
0
1
1
1
1
0
1
0
1
1
0
1
0
1

1
0
0
1
1
1
1
1
1
1
1

1
1
0
0
1

ID
1001
1002
1003
1004
1005
1006
1007
1008
1009
1010
1011
1012
1013
1014
1015
1016

14

Tổng
số CH
neo
đúng

6
5
4
5
6
5
6
5
6
4
5
5
4
4
2
4

Điểm thô
CH neo
(%)

Điểm thô
toàn CH
(%)

100
83,33
66,67
83,33
100

83,33
100
83,33
100
66,67
83,33
83,33
66,67
66,67
33,33
66,67

76,67
63,33
66,67
70
66,67
66,67
80
76,67
80
66,67
70
70
66,67
66,67
60
73,33

1017
1
1
0
1
0
1
4
66,67
76,67
1018
1
1
0
1
1
0
4
66,67
76,67
1019
1
1
1
0
1
1
5
83,33
70

1020
1
1
1
1
1
0
5
83,33
66,67
1021
1
1
1
1
1
1
6
100
83,33
1022
1
0
1
1
1
1
5
83,33
60

1023
1
1
1
1
0
1
5
83,33
83,33
1024
1
1
1
1
1
1
6
100
86,67
1025
0
0
0
0
0
0
0
0
33,33

………………………………………………………………………………..
30
1248
1
0
0
0
0
0
1
16,67
43,33
1249
0
1
0
1
1
0
3
50
40
1250
0
1
0
1
0
0
2

33,33
26,67
1251
0
1
0
0
1
0
2
33,33
30
1252
0
0
0
0
0
0
0
0
53,33
1253
0
1
0
1
0
1
3

50
63,33
1254
1
0
1
1
1
1
5
83,33
63,33
1255
1
0
1
1
1
0
4
66,67
26,67
1256
0
0
0
1
0
0
1

16,67
40
1257
0
0
0
0
1
0
1
16,67
63,33
1258
0
1
1
0
0
0
2
33,33
66,67
1259
1
0
1
1
1
0
4

66,67
40
1260
0
0
0
1
0
0
1
16,67
36,67
1261
0
0
1
0
1
0
2
33,33
43,33
1262
0
0
1
0
0
1
2

33,33
26,67
1263
0
0
0
0
0
0
0
0
13,33
1264
0
0
0
0
1
0
1
16,67
30
1265
0
0
0
0
0
1
1

16,67
43,33
1266
0
1
0
1
1
0
3
50
23,33
1267
0
0
0
0
0
0
0
0
20
1268
0
0
0
0
0
0
0

0
20
1269
0
0
0
1
1
0
2
33,33
40
1270
0
1
1
0
0
0
2
33,33
10
1271
0
0
1
1
0
0
2

33,33
36,67
1272
0
0
0
1
0
0
1
16,67
Từ bảng trên chúng tôi tính được trung bình điểm thô CH neo là 46,56863, phương
sai điểm thô CH neo là 881,99117 và hệ số góc của hàm hồi quy tuyến tính giữa điểm
thô toàn CH và điểm thô CH neo của ĐKT A là 0,52888.

15

6.2 Đề kiểm tra B
Bảng 4. Bảng điểm thô toàn CH và điểm thô CH neo của ĐKT B
Tổng
Điểm thô Điểm thô
số CH
17 18 23 25 26 30
CH neo toàn CH
neo
ID
(%)
(%)
đúng

2001 0
0
0
1
0
0
1
16,67
23,33
2002 1
1
0
0
0
0
2
33,33
33,33
2003 1
0
0
0
0
0
1
16,67
26,67
2004 1
1
1

1
1
1
6
100
83,33
2005 1
1
0
0
0
0
2
33,33
40
2006 1
1
1
0
1
0
4
66,67
66,67
2007 1
1
1
0
1
1

5
83,33
70
2008 1
1
0
1
1
0
4
66,67
73,33
2009 0
0
0
0
1
0
1
16,67
40
2010 0
1
1
0
0
0
2
33,33
36,67

2011 1
0
0
0
0
0
1
16,67
26,67
2012 1
1
1
1
1
1
6
100
73,33
2013 1
1
0
0
1
0
3
50
36,67
2014 1
0
1

1
0
0
3
50
70
2015 1
0
0
1
0
1
3
50
70
2016 1
1
1
1
1
1
6
100
76,67
2017 1
0
1
1
0
1

4
66,67
70
2018 1
0
0
1
1
0
3
50
70
2019 1
0
0
1
1
1
4
66,67
80
2020 1
0
1
1
1
1
5
83,33
70

2021 1
1
1
1
1
0
5
83,33
83,33
2022 1
0
1
0
0
1
3
50
63,33
2023 1
1
0
1
1
1
5
83,33
86,67
2024 1
1
0

1
1
0
4
66,67
86,67
2025 1
1
1
1
1
0
5
83,33
83,33
………………………………………………………………………………
60
2248 0
1
1
0
0
0
2
33,33
56,67
2249 1
1
1
0

0
0
3
50
70
2250 0
1
1
1
1
0
4
66,67
63,33
2251 0
0
0
0
1
1
2
33,33
33,33
2252 0
0
0
0
0
0
0

0
46,67
2253 1
0
0
0
1
0
2
33,33
40
2254 1
0
0
1
0
0
2
33,33
33,33
2255 1
0
0
1
0
1
3
50
33,33
2256 0

0
0
0
1
0
1
16,67
Câu

16

2257
2258
2259
2260
2261
2262
2263
2264
2265
2266
2267
2268
2269
2270
2271
2272

0

0
0
1
0
0
0
0
1
0
0
0
1
0
0
0

0
1
0
1
1
0
0
0
1
0
1
0
1
0

1
0

0
1
0
1
1
0
1
0
0
0
1
0
0
0
1
0

0
0
0
0
1
1
1
1
1
1

1
1
1
0
1
1

0
1
0
1
0
0
0
1
1
1
0
0
0
1
0
0

0
0
1
1
0
0

0
0
0
0
1
0
0
0
1
1

0
3
1
5
3
1
2
2
4
2
4
1
3
1
4
2

0
50

16,67
83,33
50
16,67
33,33
33,33
66,67
33,33
66,67
16,67
50
16,67
66,67
33,33

36,67
66,67
43,33
80
73,33
46,67
23,33
40
70
50
73,33
40
40
36,67
66,67

46,67

Từ bảng trên chúng tôi tính được trung bình điểm thô CH neo là 43,93382, phương
sai điểm thô CH neo là 917,35026 và hệ số góc của hàm hồi quy tuyến tính giữa điểm
thô toàn CH và điểm thô CH neo của ĐKT B là 0,538623.
6.3 Thống kê các CH neo của hai ĐKT gộp chung
Bảng 5. Bảng điểm thô CH neo của hai ĐKT gộp chung
Câu
TT
1
2
3
4
5
6
7
8
9
10
11
12
13
14

ID
1001
1002
1003
1004
1005

1006
1007
1008
1009
1010
1011
1012
1013
1014

17

18

23

25

26

30

1
1
1
1
1
1
1
1

1
1
1
1
1
1

1
1
1
1
1
0
1
1
1
1
1
1
1
0

1
1
1
0
1
1
1
1

1
0
0
1
0
1

1
1
1
1
1
1
1
1
1
1
1
0
1
1

1
1
0
1
1
1
1
0

1
0
1
1
0
1

1
0
0
1
1
1
1
1
1
1
1
1
1
0

17

Tổng số
câu
đúng
6
5
4

5
6
5
6
5
6
4
5
5
4
4

Điểm thô
CH neo
(%)
100
83,33
66,67
83,33
100
83,33
100
83,33
100
66,67
83,33
83,33
66,67
66,67

15
1015
1
1
0
0
0
0
2
33,33
16
1016
1
0
0
1
1
1
4
66,67
17
1017
1
1
0
1
0
1
4

66,67
18
1018
1
1
0
1
1
0
4
66,67
19
1019
1
1
1
0
1
1
5
83,33
20
1020
1
1
1
1
1
0
5

83,33
21
1021
1
1
1
1
1
1
6
100
22
1022
1
0
1
1
1
1
5
83,33
23
1023
1
1
1
1
0
1
5

83,33
24
1024
1
1
1
1
1
1
6
100
25
1025
0
0
0
0
0
0
0
0
………………………………………………………………………………………..
520
2248
0
1
1
0
0
0

2
33,33
521
2249
1
1
1
0
0
0
3
50
522
2250
0
1
1
1
1
0
4
66,67
523
2251
0
0
0
0
1
1

2
33,33
524
2252
0
0
0
0
0
0
0
0
525
2253
1
0
0
0
1
0
2
33,33
526
2254
1
0
0
1
0
0

2
33,33
527
2255
1
0
0
1
0
1
3
50
528
2256
0
0
0
0
1
0
1
16,67
529
2257
0
0
0
0
0
0

0
0
530
2258
0
1
1
0
1
0
3
50
531
2259
0
0
0
0
0
1
1
16,67
532
2260
1
1
1
0
1
1

5
83,33
533
2261
0
1
1
1
0
0
3
50
534
2262
0
0
0
1
0
0
1
16,67
535
2263
0
0
1
1
0
0

2
33,33
536
2264
0
0
0
1
1
0
2
33,33
537
2265
1
1
0
1
1
0
4
66,67
538
2266
0
0
0
1
1
0

2
33,33
539
2267
0
1
1
1
0
1
4
66,67
540
2268
0
0
0
1
0
0
1
16,67
541
2269
1
1
0
1
0
0

3
50
542
2270
0
0
0
0
1
0
1
16,67
543
2271
0
1
1
1
0
1
4
66,67
544
2272
0
0
0
1
0
1

2
33,33
Từ bảng trên chúng tôi tính được trung bình điểm thô CH neo của hai ĐKT gộp
lại là 45,25123 và phương sai của điểm thô CH neo của hai ĐKT gộp lại là 899,75261.

18

6.4 Xác lập thang đo chung và chuyển điểm thô
Bảng 6. Các tham số thang đo chung của hai ĐKT
Các tham số

Kết quả

Kết quả

S A2

378,3025

xA

54,25

SB2

398,8009

xB

52,37

S Z21

881,99117

xZ 1

46,56863

SZ2 2

917,35026

xZ 2

43,93382

2
Z

899,75261

xZ

45,25123

0,52888
0,98667
53,88150

bBZ 2
c

0,53862
52,75220

S
bAZ 1
a
d

Thay

Các tham số

a  0,98667, c  52,75220, d  53,88150

vào

công

thức

xA  a( xB  c)  d 1.1 chúng tôi thu được kết quả chuyển điểm thô (%) của TS từ ĐKT
B sang ĐKT A của 50 TS như sau:
Bảng 7. Kết quả chuyển điểm thô của TS từ ĐKT B sang ĐKT A

ID

2001
2002
2003
2004
2005
2006
2007
2008
2009
2010
2011
2012
2013
2014
2015

Điểm thô
ĐKT B
(%)
23,33
33,33
26,67
83,33
40
66,67
70
73,33
40
36,67
26,67

73,33
36,67
70
70
19

Điểm thô
chuyển từ
ĐKT B sang
ĐKT A
(%)
24,854
34,721
28,144
84,055
41,299
67,611
70,899
74,188
41,299
38,011
28,144
74,188
38,011
70,899
70,899

76,67
77,478

2016
70
70,899
2017
70
70,899
2018
80
80,766
2019
70
70,899
2020
83,33
84,055
2021
63,33
64,321
2022
86,67
87,344
2023
86,67
87,344
2024
83,33
84,055
2025
………………………………………
60

2248
61,033
56,67
57,744
2249
70
70,899
2250
63,33
64,321
2251
33,33
34,721
2252
46,67
47,877
2253
40
41,299
2254
33,33
34,721
2255
33,33
34,721
2256
36,67
38,011
2257
66,67

67,611
2258
43,33
44,588
2259
80
80,766
2260
73,33
74,188
2261
46,67
47,877
2262
23,33
24,854
2263
40
41,299
2264
70
70,899
2265
50
51,166
2266
73,33
74,188
2267
40

41,299
2268
40
41,299
2269
36,67
38,011
2270
66,67
67,611
2271
46,67
47,877
2272
Từ kết quả chuyển điểm thô từ ĐKT B sang ĐKT A, chúng tôi thấy rằng hầu hết
điểm thô (%) tăng khi chuyển điểm thô từ ĐKT B sang ĐKT A. Ví dụ như TS có ID
2019 điểm thô khi làm ĐKT B là 80 điểm và khi chuyển điểm sang ĐKT A là 80,766
20

điểm tăng lên 0,766 điểm, TS có ID 2254 điểm thô khi làm ĐKT B là 40 điểm và khi
chuyển điểm sang ĐKT A là 41,299, tăng lên 1,299 điểm, điều đó chứng tỏ ĐKT B khó
hơn ĐKT A. Tuy nhiên, độ khó chênh lệch là không lớn.
7. KẾT LUẬN VÀ ĐỀ XUẤT
Qua quá trình thực hiện nghiên cứu, chúng tôi thấy rằng để so bằng hai ĐKT với
nhau thì hai ĐKT đó phải được biên soạn tốt và độ tin cậy của hai ĐKT phải ở mức độ
cho phép và tương đương nhau. Bên cạnh đó, để khai thác tối đa và hiệu quả hết các
tính năng của phần mềm IATA cũng như nắm được nhiều thông tin nâng cao hơn về
ĐKT, chúng ta cần có những nghiên cứu chuyên sâu, chi tiết và quy mô hơn.
Do công trình nghiên cứu có giới hạn, nên việc thực nghiệm chưa thực sự mang

tính quy mô lớn. Tuy nhiên, các kết quả thực nghiệm cho thấy giả thuyết khoa học của
vấn đề nghiên cứu đã được kiểm nghiệm và bước đầu có các kết quả khả quan về việc
so bằng ĐKT TNKQ dưới sự hỗ trợ của phần mềm IATA và Excel.
So bằng hai ĐKT với sự hỗ trợ của phần mềm IATA là một phương pháp mới để
đánh giá về mặc độ khó của hai ĐKT từ đó tạo sự công bằng cho HS khi làm các ĐKT
khác nhau và cũng là công cụ tốt giúp xác định và so sánh năng lực của HS ở trường
THPT. Ngoài ra, công trình còn có thể phát triển lên so bằng ba hay bốn ĐKT chứ
không chỉ dừng lại trong việc so bằng hai ĐKT. Chúng tôi hy vọng rằng trong tương lai
với sự hỗ trợ của phần mềm IATA hoặc những phần mềm tương tự sẽ được ứng dụng
rộng rãi trong việc so bằng ĐKT góp phần đưa ngành giáo dục nói chung và chất lượng
giáo dục môn Toán nói riêng có nhiều thành tựu mới.
TÀI LIỆU THAM KHẢO
Tiếng việt
[1] Bộ Giáo dục và Đào tạo (2009), Hướng dẫn thực hiện chuẩn kiến thức kĩ năng môn
Toán - lớp 12, NXB Giáo dục, Hà Nội.
[2] Bộ Giáo dục và Đào tạo (2010), Hướng dẫn biên soạn đề kiểm tra, Công văn số
8773/BGDĐT-GDTrH, Hà Nội.
[3] Bộ Giáo dục và Đào tạo (2017), Hướng dẫn thực hiện Quy chế thi THPT quốc gia
và xét công nhận tốt nghiệp THPT năm 2017, Công văn số Số 417/BGDĐTKTKĐCLGD, Hà Nội.
21

[4] Trần Thị Anh Đào (2008), Sử dụng phần mềm Quest để phân tích câu hỏi trắc
nghiệm dùng trong kiểm tra đánh giá kết quả học tập ở học sinh lớp 10, Tuyển tập Báo
cáo Hội nghị Sinh viên Nghiên cứu Khoa học lần thứ 6 Đại học Đà Nẵng, ngày
28/5/2008, Đà nẵng, 237-250.
[5] Đặng Thị Hương (2012), Xây dựng hệ thống câu hỏi trắc nghiệm khách quan
chương động học chất điểm với sự hỗ trợ của phần mềm Vitesta, (Tuyển tập Báo cáo
Hội nghị Sinh viên Nghiênn cứu Khoa học lần thứ 8 Đại học Đà Nẵng), Hội nghị Sinh
viên Nghiên cứu Khoa học lần thứ 8, ngày 22/05/2012, Đại học Đà Nẵng, Đà Nẵng, 21

– 32.
[6] Lê Ngọc và Đào Thị Trang (2017), Áp dụng phần mềm IATA để phân tích, đánh giá
đề thi trắc nghiệm khách quan môn Toán cao cấp A1, Kỷ yếu hội thảo Dạy học Toán
và Đào tạo giáo viên đáp ứng yêu cầu đổi mới giáo dục hiện nay. ĐHSP Huế, 3-2017,
33-39.
[7] Lâm Quang Thiệp (2011), Đo lường trong giáo dục – Lý thuyết và ứng dụng, NXB
Đại học Sư phạm, Hà Nội.
Tiếng Anh
[8] Sudol, L.A. and Studer, C. (2010), March. Analyzing test items: using
itemresponse theory to validate assessments, In Proceedings of the 41st ACM
technical symposium on Computer science education (SIGCSE 1010), March 10 – 13,
2010Linacre, J.M, 1994. Sample Size and Item
[9] Finch, W.H. and French, B.F. (2019), Educational and Psychological
Measurement, Routledge, New York and LonDon

22

Một nghiên cứu về việc sử dụng phần mềm thống kê trong việc so bằng bằng đề kiểm tra trắc nghiệm khách quan

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về