Tải bản đầy đủ (.doc) (63 trang)

Xây dựng và sử dụng câu TNKQ nhiều lựac chọn trong đánh giá kết quả học tập học phần Giáo dục học đại cương

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (916.67 KB, 63 trang )

MỞ ĐẦU
1. LÝ DO CHỌN ĐỀ TÀI
Kiểm tra - đánh giá (KT-ĐG) kết quả học tập (KQHT) của sinh viên là một khâu rất
quan trọng trong công tác đào tạo, nó cho biết những thông tin, kết quả về quá trình dạy của
thầy và quá trình học của trò để từ đó có những quyết định cho sự điều khiển tối ưu của cả
thầy lẫn trò [28]. Kết quả không chỉ phản ảnh năng lực học của sinh viên, mà còn có vai trò to
lớn trong việc thúc đẩy động cơ, thái độ tích cực của người học, hoàn thiện quá trình dạy học,
kiểm định chất lượng, hiệu quả dạy học và trình độ nghề nghiệp của người dạy . Học sinh se
học tốt hơn nếu thường xuyên được kiểm tra và được đánh giá một cách nghiêm túc, công
bằng với kỹ thuật tốt và hiệu nghiệm. Ðối với nhà trường - khoa, cán bộ quản lý đào tạo, qua
kiểm tra - đánh giá có thể rút ra được những giai đoạn, công cụ hoặc thiết bị thích hợp hỗ trợ
cho giảng viên hoàn thành tốt việc giảng dạy của họ và quan trọng hơn nữa là hoàn thiện mục
tiêu đào tạo của mình [3], [8], [11].
Nghị quyết lần thứ II - BCH TW Đảng khóa VIII đã nêu rõ để “đổi mới mạnh me
phương pháp giáo dục - đào tạo” thì vấn đề đổi mới kiểm tra-đánh giá phải được tiến hành
đồng bộ [29]. Bộ trưởng Nguyễn Thiện Nhân cũng nhấn mạnh, đổi mới phương pháp giáo
dục gắn với đổi mới cách đánh giá phải coi là giải pháp căn bản, tích cực nhất, vừa góp phần
nâng cao chất lượng đào tạo sư phạm, vừa góp phần chống tiêu cực trong giáo dục [7].
Học phần Giáo dục học (GDH) đại cương được giảng dạy trong trường cao đẳng sư
phạm (CĐSP) nhằm cung cấp cho sinh viên phương pháp luận và những tri thức lý luận cơ
bản và hiện đại về GDH. Trang bị cho sinh viên những kĩ năng sư phạm để họ có thể vận
dụng thực hiện tốt các họat động dạy học và giáo dục ở nhà trường phổ thông. Đồng thời hình
thành ở các em khả năng tự bồi dưỡng, rèn luyện tay nghề và không ngừng nâng cao năng lực
sư phạm đáp ứng đòi hỏi ngày càng cao của sự nghiệp đào tạo con người [1], [2], [27].
Với ý nghĩa và tầm quan trọng như vậy, đòi hỏi công cụ đánh giá KQHT môn GDH phải
đảm bảo đo lường một cách khách quan và tòan diện các mục tiêu mà môn GDH đã xác định.
Phương pháp kiểm tra-đánh giá (KT-ĐG) kết quả học tập bằng kĩ thuật trắc nghiệm khách
quan (TNKQ) là một trong những phương pháp kiểm tra hiện đại và có nhiều ưu điểm như
đảm bảo độ tin cậy, tính khách quan, tính hiệu quả của quá trính đánh giá, tiết kiệm hơn và
tốn ít thời gian làm bài của thí sinh cũng như thời gian chấm điểm của hội đồng [14], [23].
Hơn nữa, với khả năng bao quát nội dung chương trình, do vậy TNKQ có thể khắc phục việc


học tủ, học vẹt của sinh viên [14]. Trong các lọai câu hỏi TNKQ, câu hỏi dạng nhiều lựa chọn
(NLC) được xem là rất hiệu quả trong việc đánh giá các mức độ nhận thức khác nhau như
1


nhận biết, hiểu và vận dụng [12], [14], [24], [35] và được xem là một trong những công cụ đo
lường và đánh giá có hiệu quả nhất trong quá trình dạy học [35].
Với mong muốn từng bước cải tiến phương pháp KT-ĐG kết quả học tập của sinh viên
trường CĐSP Bình Dương bằng kĩ thuật TNKQ, nhóm nghiên cứu chúng tôi chọn đề tài:
“Xây dựng và sử dụng câu trắc nghiệm khách quan nhiều lựa chọn trong kiểm tra đánh giá
kết quả học tập học phần Giáo dục học đại cương của sinh viên trường Cao Đẳng Sư Phạm
Bình Dương”

2. LỊCH SỬ VẤN ĐỀ NGHIÊN CỨU
2.1.Trên thế giới
Công cụ đánh giá kết quả học tập bằng trắc nghiệm (test) đã có một quá trình phát triển
lâu dài. Cụ thể, từ những năm 2000 trước công nguyên, theo Trần Trọng Thủy, người Trung
Hoa đã dùng trắc nghiệm trí tuệ để chọn người hầu và thê thiếp [20]. Tại châu Âu, các
phương pháp trắc nghiệm (TN) đo lường thành quả học tập đầu tiên được tiến hành vào thế kỷ
XVII - XVIII ở khoa Vật lý -Tâm Lý và sau đó mở rộng sang ngành Động vật học [12].
Francis Galton đã vận dụng những nguyên tắc của Darwin trong tác phẩm “Nguồn gốc các
lòai” để khảo sát sự khác biệt giữa những cá thể về tính chất sinh lý và tâm lý liên quan đến
yếu tố di truyền. Nhằm chọn lọc những người có thể làm cha mẹ tốt nhất, Galton đã triển khai
các TNKQ để đo những đặc điểm con người liên quan đến trí tuệ [12]. Thuật ngữ trắc nghiệm
được sử dụng rộng rãi sau khi nhà tâm lý học Mỹ J. M. Cattell cho xuất bản cuốn sách “Các
trắc nghiệm đo lường trí tuệ” vào năm 1890 tại NewYork. Trong cuốn sách này, ông cho rằng
các chức năng trí tuệ được đo bằng trắc nghiệm khách quan [21].
Cuối thế kỷ 19 và đầu thể kỉ XX, lĩnh vực khoa học về trắc nghiệm phát triển mạnh ở
châu Âu và đặc biệt là ở Mỹ [19]. Có thể kể những dấu mốc quan trọng trong tiến trình phát
triển như trắc nghiệm trí tuệ Simon - Binet được xây dựng bởi hai nhà tâm lý học người Pháp

Alfred Binet và Theodore Simon vào năm 1904. Năm 1916, tại Đại học Stanford của Mỹ,
Lewis Terman đã dịch và soạn các bài trắc nghiệm này ra tiếng Anh, từ đó trắc nghiệm trí
thông minh được gọi là trắc nghiệm Stanford - Binet. Bộ trắc nghiệm thành quả học tập tổng
hợp đầu tiên Standford Achievement Test cũng ra đời vào năm 1923 ở Mỹ [19]. Vào đầu thế
kỷ XX, E. Thorm Dike là người đầu tiên đã dùng TNKQ như là phương pháp "khách quan và
nhanh chóng" để đo trình độ học sinh, bắt đầu dùng với môn Số học và sau đó là một số môn
khác [12], [19]. Việc đưa vào chấm TN bằng máy của IBM năm 1935 và thành lập Hội quốc
gia về đo lường trong giáo dục (National Council on Measurement in Education-NCME) vào
2


thập niên 1950, cùng với sự ra đời hai tổ chức tư nhân Educational Testing Service (ETS) năm
1947 và American College Testing (ACT) năm 1959 , hai tổ chức làm dịch vụ trắc nghiệm lớn
thứ nhất và thứ hai ở Hoa Kỳ, một ngành công nghiệp về trắc nghiệm đã được hình thành
[19].
Các thành tựu lý luận quan trọng của khoa học về đo lường trong giáo dục cũng đã phát
triển, cho đến thập niên 1970 thì hoàn chỉnh trong khuôn khổ của “lý thuyết trắc nghiệm cổ
điển” (classical test theory). Đặc biệt từ thập niên 1970 đến nay một “lý thuyết trắc nghiệm
hiện đại” còn gọi là “lý thuyết đáp ứng câu hỏi” (Item Response Theory - IRT) ra đời và phát
triển dựa trên các mô hình toán học. IRT đã đạt được những thành tựu quan trọng trong việc
nâng cao độ chính xác của trắc nghiệm, và trên cơ sở lý thuyết đó, công nghệ trắc nghiệm
thích ứng nhờ máy tính (Computer adaptive Test-CAT) ra đời [19].
Ở Liên Xô cũ, một số nhà sư phạm tại Matxcơva, Kiep, Lêningơrát đã thử dùng TNKQ
để chẩn đóan tâm lý nhân dân và kiểm tra kiến thức học sinh. Song do sử dụng TNKQ mà
không thấy được nhược điểm của chúng nên ngày 04/09/1936, ban chấp hành Trung Ương
Đảng Cộng sản Liên xô đã phê phán việc sử dụng TN. Cho đến năm 1963, Nhà nước Liên xô
mới cho phép sử dụng TNKQ trong đánh giá kết quả học tập. Công trình đáng chú ý nhất là
của Viện hàn lâm khoa học Liên xô do E.I.Monetzen chủ trì [12]. Từ năm học 2001-2005, Bộ
Giáo dục Nga tiến hành cho thí điểm “kỳ thi quốc gia hợp nhất” chủ yếu bằng phương pháp
TNKQ với sự tham gia tự nguyện của 5 chủ thể trong Liên bang Nga. Bộ trưởng Giáo dục

Nga Filipôp lúc đó đã kiên trì mở rộng dần phạm vi thí điểm vì ông cho rằng nó tiết kiệm
ngân sách cho các trường Đại học và cả thí sinh, tạo cơ hội bình đẳng cho thí sinh từ mọi
vùng xa xôi của Liên bang được dự thi [19].
Ngày nay, kĩ thuật TNKQ đã được sử dụng rộng rãi ở các nước trên thế giới. Có rất
nhiều nghiên cứu về kĩ thuật đo lường trong giáo dục bằng TNKQ như công trình nghiên cứu
của Q.Stodola, B. L Howard, L. L. Moris và C. Taylor…Các công trình này nghiên cứu kĩ
thuật xây dựng câu hỏi TNKQ, ưu và nhược điểm của chúng. Đồng thời, cũng nghiên cứu
việc xây dựng và sử dụng các trắc nghiệm theo chuẩn nhằm so sánh thành tích giữa các sinh
viên để phân lọai và lựa chọn sinh viên theo các mục đích nhất định [10]. Riêng với trắc
nghiệm theo tiêu chí phải kể đến W. J. Popham, với công trình nghiên cứu về lọai trắc nghiệm
theo tiêu chí đầu tiên do ông chủ biên. Trong công trình này, ông nghiên cứu các ưu điểm của
trắc nghiệm theo tiêu chí, phân tích các nguyên tắc và kĩ thuật xây dựng lọai trắc nghiệm này,
tính tóan độ giá trị, độ tin cậy của câu TN, bài TN cũng như giải thích điểm số của bài TN
[12], [14], [21], [22].
3


2.2. Ở Việt Nam
TNKQ được sử dụng từ rất sớm trên thế giới song ở Việt Nam thì xuất hiện muộn hơn.
Cụ thể, sau 1954 TNKQ được sử dụng ở miền Nam. Từ năm 1956 đến những năm 1960 trong
các trường học đã sử dụng rộng rãi hình thức thi TNKQ ở bậc trung học [12], [19], [21], [23].
Năm 1963, “Trắc nghiệm Vạn vật lớp 12” của Lê Quang Nghĩa và năm 1964, “Phương pháp
học và thi Vạn vật lớp 12” của Phùng Văn Hướng được xuất bản [12]. Vào năm 1969, Dương
Thiệu Tống đã giảng dạy “Trắc nghiệm thành quả học tập” cho các lớp Cao học và Tiến sĩ
Giáo dục tại Đại học Sư phạm Sài Gòn. Cũng trong khỏang thời gian đó, Dương Thiệu Tống
lần đầu tiên đã cho xuất bản cuốn sách “Trắc nghiệm đo lường thành quả học tập”, đã đánh
dấu bước đầu phát triển của phương pháp TNKQ. Đây là một trong những tài liệu tham khảo
rất bổ ích cho giáo viên và học sinh thời ấy [12], [19].
Năm 1974, tại kỳ thi Tú tài ở miền Nam Việt Nam, phương pháp TNKQ tiêu chuẩn hóa
đã được áp dụng. Kết quả điểm thi được chấm bằng máy quét IBM 1230 Optical Mark Sense

Reader và xử lý kết quả trên máy tính điện tử IBM 360/50. Đây là một kỳ thi được chuẩn bị
rất lâu dài và cẩn thận [19]. Cho đến năm 1976, tác giả Nguyễn Như An dùng phương pháp
TNKQ trong việc thực hiện đề tài “Bước đầu nghiên cứu nhận thức tâm lí của sinh viên Đại
học Sư phạm” và năm 1978 là đề tài “Vận dụng phương pháp test và phương pháp kiểm tra
truyền thống trong dạy học tâm lí học”. Cũng gần thời điểm đó, tác giả Nguyễn Hữu Long,
cán bộ giảng dạy khoa tâm lí giáo dục trường Đại học Sư phạm Hà Nội đã nghiên cứu TNKQ
với đề tài “Test trong dạy học”.
Từ thập niên 1990, TNKQ thực sự được quan tâm và được ứng dụng ở nhiều cấp học.
Năm 1990, Bộ Y tế với sự giúp đỡ của đề án “Hỗ trợ hệ thống đào tạo” của chương trình hợp
tác Việt Nam-Thụy Điển đã mở những khóa tập huấn cho tòan bộ giảng viên các trường Y tế,
và cũng đã xây dựng được bộ công cụ đánh giá bằng TNKQ các chuyên khoa [12]. Năm
1994, Bộ GD - ĐT đã phối hợp với Viện công nghệ Hòang gia Melbourne của Australia, tổ
chức các cuộc hội thảo với chủ đề “Kỹ thuật xây dựng câu hỏi TNKQ” tại các thành phố lớn ở
Việt nam. Năm 1995, với sự tài trợ của UNESCO, Đại học Tổng hợp Hà Nội đã mở những
lớp tập huấn về phương pháp xây dựng TNKQ cho nhiều giảng viên [12], [19]. Một số tổ
chức tư nhân, như Công ty Công nghệ Giáo dục và Xử lý Dữ liệu (EDTECH) cũng đã chuẩn
bị về mặt công nghệ và triển khai xây dựng ngân hàng câu hỏi TN. Những năm gần đây, nhằm
nâng cao chất lượng đào tạo ở các trường Đại học, Bộ GD - ĐT tạo và các trường Đại học đã
tổ chức các cuộc hội thảo trao đổi về việc cải tiến hệ thống các phương pháp kiểm tra, đánh

4


giá KQHT của sinh viên trong nước và trên thế giới, các khoá huấn luyện và cung cấp những
hiểu biết cơ bản về lượng giá giáo dục và các phương pháp TNKQ [12], [19], [21].
Trong những năm vừa qua, vấn đề đánh giá giáo dục nói chung và đánh giá kết quả học
tập bằng phương pháp TNKQ nói riêng được nhiều tác giả quan tâm nghiên cứu. Trong các
cuốn sách “Trắc nghiệm và đo lường thành quả học tập-phương pháp thực hành”, tập 1 xuất
bản năm 1995, tập 2 năm 1998 và mới đây là cuốn vừa được chỉnh sửa, bổ sung năm 2005,
Dương Thiệu Tống đã trình bày những nguyên lý căn bản về đo lường, các phương pháp thực

hành việc sọan thảo và thử nghiệm các câu hỏi trắc nghiệm chuẩn và trắc nghiệm tiêu chí.
Những nội dung này đã giúp giáo viên có thể xây dựng và sử dụng TNKQ trong kiểm tra đánh
giá KQHT của học sinh và sinh viên một cách khoa học [22], [23], [24]. Các tác giả Trần
Trọng Thủy, Nguyễn Phụng Hòang, Trần Bá Hòanh và Lê Đức Ngọc cũng đã nghiên cứu
phương pháp trắc nghiệm trong đánh giá kết quả học tập, đã nêu lên phương pháp phân tích
câu trắc nghiệm, các lọai câu hỏi trắc nghiệm, các phương pháp phỏng định độ tin cậy của bài
TNKQ [5], [6], [16], [20], [21]. Mới nhất hiện nay, năm 2008, trong cuốn sách “Trắc nghiệm
và ứng dụng”, Giáo sư tiến sĩ khoa học Lâm Quang Thiệp đã giới thiệu nhiều khái niệm sâu
sắc về khoa học đo lường trong giáo dục và các công nghệ hiện đại để phân tích, xử lý câu
trắc nghiệm khách quan. Đồng thời, ông cũng đưa ra những chỉ dẫn thiết thực về việc áp dụng
TNKQ trong các cơ sở giáo dục [19].
Ở nước ta, thí điểm thi tuyển sinh đại học bằng phương pháp TNKQ đã được tổ chức lần
đầu tiên tại trường Đại học Đà Lạt tháng 7 năm 1996 và đã thành công. Tuy nhiên cho đến
gần 10 năm sau, năm 2005 - 2006 Bộ Giáo dục và Đào tạo mới quyết định chính thức chủ
trương thi TNKQ môn ngọai ngữ trên cả nước trong kì thi tốt nghiệp PTTH và tuyển sinh Đại
học, Cao đẳng; năm 2007 thêm ba môn Lý, Hóa, Sinh [8], [10], [15]. Mặc dù tương đối mới,
song Giáo sư Hòang Tụy cho rằng việc sử dụng phương pháp KT-ĐG này đã thể hiện sự
mạnh dạn cải tiến trong thi cử, đó chính là một khâu đột phá, một cuộc cách mạng đầu tiên
trong chiến lược cải cách giáo dục nói chung ở Việt Nam [26].
Gần đây, nhiều công trình nghiên cứu Thạc sĩ và Nghiên cứu sinh của các tác giả đã tiến
hành theo hướng xây dựng và sử dụng câu hỏi TNKQ trong dạy học, kiểm tra đánh giá và tự
kiểm tra đánh giá ở trường ĐHSP, CĐSP như Nguyễn Thị Kim Giang (1997), Đỗ Thị Lí
(1998), Nguyễn kì Loan (2000), Trần Thị Tuyết Oanh (2000), Vũ Đình Luận (2005) [12],
[21]. Tác giả Trần Thị Tuyết Oanh, trong luận án Tiến sĩ giáo dục của mình, đã có một số đề
xuất về quy trình xây dựng, sử dụng câu hỏi TNKQ và câu tự luận ngắn trong kiểm tra đánh
giá KQHT môn GDH [12]. Riêng tác giả Vũ Đình Luận trong luận án Tiến sĩ giáo dục “Xây
5


dựng và sử dụng câu hỏi TNKQ MCQ để nâng cao chất lượng dạy học môn Di truyền học ở

trường Cao đẳng sư phạm”, đã nghiên cứu về tiêu chuẩn của một bài KTĐG trong môn Di
truyền học ở trường CĐSP, đặc biệt là nghiên cứu việc sử dụng câu trắc nghiệm NLC trong
dạy kiến thức mới trong môn Di truyền học ở trường CĐSP [12].
Trường cao đẳng sư phạm Bình Dương (CĐSP BD) những năm vừa qua đã có một số đề
tài nghiên cứu khoa học tiến hành theo hướng xây dựng và sử dụng câu TNKQ trong dạy học
nhằm cải tiến phương pháp kiểm tra đánh giá KQHT của sinh viên. Có thể kể đến đề tài “Cải
tiến phương pháp kiểm tra đánh giá kết quả học tập môn GDH của sinh viên trường CĐSP
BD bằng TNKQ” của hai tác giả Phạm Thị Mai - Vũ Xuân Vượng [14], và đề tài “Xây dựng
và sử dụng câu hỏi TNKQ trong kiểm tra đánh giá kết quả học tập học phần TLH đại cương
của sinh viên trường CĐSP BD” của tác giả Tô Thị Hồng Thúy [21]. Qua hai đề tài, các tác
giả đã đưa ra kết luận về tính khách quan, tính hiệu quả cũng như những ưu điểm của phương
pháp KT - ĐG bằng TNKQ trong việc khắc phục hiện tượng học vẹt, học tủ của sinh viên và
trong việc kích thích tính tích cực học tập, góp phần hình thành động cơ, thái độ học tập đúng
đắn, đồng thời phát huy khả năng tự đánh gía của sinh viên.
Như vậy cho đến nay, vấn đề xây dựng và sử dụng TNKQ nói chung và TNKQ dạng
NLC nói riêng trong đánh giá KQHT của sinh viên đã được rất nhiều tác giả quan tâm nghiên
cứu. Với học phần GDH, phần lớn các tác giả nghiên cứu việc kết hợp giữa trắc nghiệm khách
quan và tự luận hoặc sử dụng kết hợp các lọai TNKQ khác nhau trong kiểm tra đánh giá
KQHT của sinh viên. Song nghiên cứu việc xây dựng và sử dụng câu TNKQ dạng NLC trong
đánh giá KQHT học phần GDH đại cương của sinh viên trường CĐSP dường như vẫn còn
đang bỏ ngõ.
Với mong muốn góp phần từng bước nâng cao chất lượng dạy và học ở trường CĐSP
Bình Dương, nhóm nghiên cứu tổ Bộ môn Tâm Lý - Giáo dục chúng tôi chọn đề tài: “Xây
dựng và sử dụng câu trắc nghiệm khách quan nhiều lựa chọn trong kiểm tra đánh giá kết quả
học tập học phần Giáo dục học đại cương của sinh viên trường Cao Đẳng Sư Phạm Bình
Dương”

3. MỤC TIÊU NGHIÊN CỨU
Xây dựng và sử dụng câu TNKQ dạng NLC trong đánh giá KQHT học phần GDH đại
cương cho sinh viên năm I và năm II hệ đào tạo chính quy trường CĐSP Bình Dương, nhằm

góp phần nâng cao chất lượng cũng như hiệu quả quá trình dạy và học bộ môn GDH ở trường
CĐSP.
6


4. NHIỆM VỤ VÀ PHẠM VI NGHIÊN CỨU
4.1. Nhiệm vụ nghiên cứu
4.1.1. Nghiên cứu cơ sở lý thuyết làm căn cứ cho việc xây dựng, sử dụng TNKQ dạng
NLC trong đánh giá KQHT học phần GDH đại cương.
4.1.2. Xây dựng và thử nghiệm hệ thống câu TNKQ dạng NLC để đánh giá KQHT học
phần GDH đại cương ở trường CĐSP.
4.1.3. Thực nghiệm sử dụng câu TNKQ dạng NLC trong đánh giá KQHT học phần
GDH đại cương của sinh viên nhằm đánh giá chất lượng câu hỏi TNKQ.
4.1.4. Kết luận và khuyến nghị về việc sử dụng câu TNKQ trong kiểm tra đánh giá
KQHT học phần GDH đại cương.

4.2. Phạm vi nghiên cứu
Đề tài tập trung vào vấn đề xây dựng và sử dụng lọai câu trắc nghiệm khách quan viết
dạng nhiều lựa chọn, lọai trắc nghiệm theo tiêu chí để đánh giá KQHT (lĩnh vực nhận thức)
học phần GDH đại cương của sinh viên năm I và năm II thuộc hệ CĐSP chính quy, trường
CĐSP Bình Dương.

5. KHÁCH THỂ VÀ ĐỐI TƯỢNG NGHIÊN CỨU
5.1. Khách thể nghiên cứu: quá trình kiểm tra đánh giá KQHT của sinh viên năm I khoa
Tiểu học mầm non (THMN), sinh viên năm II khoa Tự nhiên và Xã hội thuộc hệ CĐSP chính
quy trường CĐSP Phạm Bình Dương.

5.2. Đối tượng nghiên cứu: quy trình xây dựng và sử dụng câu TNKQ dạng NLC trong
việc đánh giá KQHT học phần GDH đại cương cho sinh viên năm I khoa Tiểu học mầm non
(THMN), sinh viên năm II khoa Tự nhiên và Xã hội thuộc hệ CĐSP chính quy trường CĐSP

Bình Dương.

6. GIẢ THUYẾT KHOA HỌC
Câu trắc nghiệm khách quan nếu được xây dựng có chất lượng tốt và sử dụng theo quy
trình hợp lý để kiểm tra đánh giá KQHT học phần GDH đại cương se nâng cao hiệu quả đánh
giá KQHT của sinh viên ở môn học này, góp phần nâng cao chất lượng dạy và học ở trường
CĐSP Bình Dương.

7. PHƯƠNG PHÁP NGHIÊN CỨU
7.1. Các phương pháp nghiên cứu lý luận:
Đọc sách, phân tích, tổng hợp, và hệ thống hóa các tài liệu lý luận có liên quan đến
vấn đề nghiên cứu.
7


7.2. Các phương pháp nghiên cứu thực tiễn
7.2.1. Phương pháp điều tra
 Mục đích: nhằm thu thập ý kiến nhận xét và đánh gía của sinh viên năm I và năm
II hệ cao đẳng chính quy trường CĐSP Bình Dương về câu hỏi TNKQ dạng NLC được sử
dụng đánh giá KQHT học phần GDH đại cương.
 Đối tượng điều tra: giai đọan 1 là 120 sinh viên năm thứ II thuộc các khoa Xã Hội
và Tự Nhiên trường CĐSP Bình Dương; giai đọan 2 là 100 sinh viên năm I hệ chính quy,
khoa THMN trường CĐSP Bình Dương.
 Công cụ điều tra: phiếu trưng cầu ý kiến sinh viên [phụ lục 4].
 Xử lý kết quả điều tra: các số liệu thu thập được xử lý bằng phương pháp thống kê
tóan học như tính %, trung bình cộng, kiểm nghiệm t với sự hỗ trợ của phần mềm SPSS [25].
7.2.2. Phương pháp thực nghiệm
 Mục đích thực nghiệm: kiểm nghiệm chất lượng các câu hỏi TNKQ và bài TN
dạng NLC đã xây dựng, chứng minh tính hiệu quả và khả năng ứng dụng của hệ thống câu
TNKQ dạng NLC trong đánh giá KQHT học phần GDH đại cương.

 Đối tượng thực nghiệm: 245 sinh viên năm I hệ chính quy, khoa Tiểu học Mầm
non trường CĐSP Bình Dương.
 Nội dung thực nghiệm: sử dụng câu TNKQ để đánh giá KQHT học phần GDH đại
cương của sinh viên.
 Thời gian tổ chức thực nghiệm: tổ chức vào kì thi hết học phần môn GDH đại
cương năm học 2008-2009.
7.2.3. Phương pháp nghiên cứu sản phẩm họat động: Sản phẩm thu được là các bài
trắc nghiệm của sinh viên, dùng để đánh giá kết quả thực nghiệm.
7.2.4. Phương pháp quan sát: Quan sát sinh viên làm trắc nghiệm và quan sát sinh viên
trong quá trình học tập học phần Giáo dục học đại cương nhằm thu thập các thông tin để làm
rõ thêm kết quả nghiên cứu. Bảng hướng dẫn quan sát [phụ lục 5].
7.2.5. Phương pháp trò chuyện: trò chuyện với sinh viên để tìm hiểu thêm về nhận thức
cũng như thái độ các em đối với hình thức KT-ĐG KQHT bằng TNKQ.
7.2.6. Phương pháp lấy ý kiến chuyên gia: Nhằm mục đích hòan chỉnh bộ công cụ điều
tra, sửa chữa, bổ sung và hòan thiện câu trắc nghiệm.

7.3. Các phương pháp thống kê tóan học: Nhằm xác định độ tin cậy và độ khó của bài
TN; độ khó, độ phân biệt của các câu trắc nghiệm; xử lý kết quả điều tra và kết quả thực
nghiệm.
8


CHƯƠNG 1: CƠ SỞ LÝ LUẬN CỦA ĐỀ TÀI
1.1. NHỮNG VẤN ĐỀ CHUNG VỀ KIỂM TRA, ĐÁNH GIÁ KẾT QUẢ HỌC TẬP

1.1.1. Các khái niệm cơ bản
1.1.1.1. Kiểm tra
Theo từ điển tiếng Việt của Viện ngôn ngữ học, “kiểm tra là xem xét tình hình thực tế để
đánh giá, nhận xét” [14]. Trần Bá Hòanh cho rằng “kiểm tra cung cấp những dữ kiện, những
thông tin làm cơ sở cho việc đánh giá” [5]. Theo Hòang Thị Tuyết, “kiểm tra là thuật ngữ chỉ

cách thức hoặc họat động giáo viên sử dụng để thu thập thông tin về biểu hiện kiến thức, kĩ
năng và thái độ của học sinh trong học tập nhằm cung cấp dữ kiện làm cơ sở cho việc đánh
giá” [28]. Như vậy, kiểm tra, đánh giá là hai công việc có thứ tự đan xen nhằm miêu tả và tập
hợp những bằng chứng về thành tích học tập của học sinh. Kiểm tra là phương tiện để đánh
gía, quá trình đánh giá được tiến hành bằng các hình thức kiểm tra và thu thập thông tin khác.
1.1.1.2. Đo lường
Đo lường là khái niệm chung dùng để chỉ sự so sánh một vật hay một hiện tượng với
một thước đo hoặc một chuẩn mực, có khả năng trình bày kết quả về mặt định lượng [17].
Đo lường trong giáo dục chỉ việc ghi nhận và mô tả kết quả bài làm kiểm tra của mỗi
học sinh bằng một số đo, dựa theo những quy tắc đã định [28]. Theo nghĩa rộng là “dùng một
phương tiện để thu thập dữ liệu về đặc tính, hành vi của con người một cách có hệ thống rồi
sau đó phân tích các dữ liệu ấy, làm cơ sở cho những dữ liệu thích hợp” [17] hay còn được
hiểu là “một phương thức dùng bài trắc nghiệm hay một dụng cụ để đạt một mức đo định
lượng và tương đối khách quan về một hay nhiều tính chất nào đó” [4].
Chúng tôi cho rằng đo lường trong giáo dục là quá trình sử dụng các công cụ và một tập
hợp các quy tắc để phân lọai kết quả quan sát được về mặt định tính và định lượng kết quả
học tập của học sinh.
1.1.1.3. Lượng giá
Lượng giá là đưa những thông tin ước lượng trình độ kiến thức, kĩ năng của người học
bằng cách dựa vào các số đo đã có. Có hai hướng lượng giá: lượng giá theo chuẩn và lượng
giá theo tiêu chí [17], [28]. Lượng giá theo chuẩn (Norm referenced assessment) là sự so sánh
tương đối kết quả đo lường được với chuẩn chung của một tập hợp học sinh. Lượng giá theo
tiêu chí (Criteria referenced assessment): là sự đối chiếu kết quả đo lường được với những
tiêu chí đã đề ra.
1.1.1.4. Đánh giá kết quả học tập
9


Kết quả học tập được hiểu là mức độ mà người học phải đạt được so với các mục tiêu đã
xác định hay là mức độ mà người học đạt được so sánh với những người cùng học khác [14].

Đánh giá kết quả học tập là quá trình đo lường mức độ đạt được của sinh viên về các
mục tiêu và nhiệm vụ của quá trình dạy học. Cụ thể đó là quá trình mô tả một cách định tính
và định lượng tính đầy đủ, đúng đắn, chính xác và tính vững chắc của kiến thức, mối liên hệ
của kiến thức với đời sống, các khả năng vận dụng kiến thức vào thực tiễn và cả thái độ của
sinh viên trên cơ sở phân tích các thông tin phản hồi từ việc quan sát, kiểm tra, đánh giá mức
độ hoàn thành nhiệm vụ được giao, đối chiếu với những chỉ tiêu, yêu cầu dự kiến, mong
muốn đạt được của môn học [28].
Như vậy, đánh giá KQHT chỉ quá trình hình thành những nhận định, rút ra những kết
luận hoặc phán đóan về trình độ, phẩm chất của người học, hoặc đưa ra những quyết định về
việc dạy học dựa trên cơ sở những thông tin đã thu thập được một cách hệ thống trong quá
trình kiểm tra.

1.1.2. Mục đích và ý nghĩa của việc đánh giá kết quả học tập
Việc kiểm tra - đánh giá KQHT của người học cung cấp cho giáo viên những thông tin
liên hệ ngược ngoài từ đó giáo viên có thể nhận biết quá trình dạy học có phù hợp với sinh
viên hay không, có đáp ứng mục tiêu dạy học; KQHT của sinh viên phản ánh việc giảng dạy
đáng tin cậy ở mức nào. Trên cơ sở này, giáo viên có thể đưa ra những phán đóan về người
học và quyết định điều chỉnh hoặc cải tiến họat động dạy học. Bên cạnh đó, kiểm tra - đánh
giá tạo cơ hội cho giáo viên xem xét hiệu quả của những cải tiến nội dung, phương pháp, hình
thức tổ chức dạy học mà mình theo đuổi [28].
Việc kiểm tra - đánh giá có hệ thống và thường xuyên cung cấp kịp thời những thông
tin liên hệ ngược trong giúp người học tự điều chỉnh hoạt động học. Nó giúp sinh viên kịp
thời nhận thấy mức độ đạt được những kiến thức của mình, còn lỗ hổng kiến thức nào cần
được bổ sung trước khi bước vào phần mới của chương trình học tập, có cơ hội để nắm chắc
những yêu cầu cụ thể đối với từng phần của chương trình. Ngoài ra, thông qua kiểm tra - đánh
giá sinh viên có điều kiện tiến hành các hoạt động trí tuệ: ghi nhớ, tái hiện, chính xác hóa,
khái quát hóa, hệ thống hóa kiến thức. Việc kiểm tra - đánh giá được tổ chức nghiêm túc, công
bằng se giúp sinh viên nâng cao tinh thần trách nhiệm trong học tập, có ý chí vươn lên đạt kết
quả cao hơn, củng cố lòng tin vào khả năng của mình, nâng cao ý thức tự giác, khắc phục tính
chủ quan tự mãn [4], [5], [12], [28].


10


Như vậy, đánh giá nhất thiết phải góp phần nâng cao việc học tập và khả năng tự học, tự
giáo dục của sinh viên. Sinh viên có thể học từ những đánh giá của giáo viên. Từ đó sinh viên
có thể tự điều chỉnh hành vi học tập của bản thân.

1.1.3. Những yêu cầu sư phạm của việc đánh giá kết quả học tập
Quá trình kiểm tra, đánh giá KQHT của sinh viên cần được thực hiện dựa trên các
nguyên tắc sau [1], [4], [14], [17], [28]:
1.1.3.1. Nguyên tắc đảm bảo mục tiêu dạy học.
Trong quá trình dạy học, đánh giá kết quả học tập của sinh viên chủ yếu là đo xem
những mục tiêu dạy học đạt được đến đâu. Những mục tiêu đã xác định phải là cái quan sát
được, đo lường được. Mục tiêu dạy học là những gì mà sinh viên cần đạt được sau khi học
xong môn học, nó bao gồm: hệ thống kiến thức khoa học và cả phương pháp nhận thức
chúng; hệ thống các kĩ năng, khả năng vận dụng vào thực tế; thái độ, tình cảm đối với khoa
học và xã hội.
Mục tiêu dạy học chính là cơ sở cho việc xác định nội dung dạy học, phương pháp và
phương tiện dạy học, do đó nó cũng là cơ sở để lựa chọn phương pháp và chương trình kiểm
tra - đánh giá kết quả học tập. Đánh giá là một quá trình tiến hành có hệ thống, nó phải đựợc
xuất phát từ mục tiêu dạy học. Vì vậy điều kiện tiên quyết là phải xác định rõ mục tiêu đánh
giá cái gì. Đánh giá KQHT tập dựa trên tiêu chí của mục tiêu dạy học se nhận được những
thông tin phản hồi chính xác nhằm bổ sung, hoàn thiện quá trình dạy học.
1.1.3.2. Nguyên tắc khách quan.
Đánh giá KQHT cần đảm bảo nguyên tắc khách quan. Đó là những quy tắc cần được
thực hiện trong khi kiểm tra và đánh giá nhằm đảm bảo cho kết quả thu được ít chịu sự ảnh
hưởng từ những yếu tố khác với mục tiêu và nội dung cần đánh giá.
Một số quy tắc khi thực hiện nguyên tắc khách quan như bảo đảm môi trường, cơ sở vật
chất không ảnh hưởng đến việc thực hiện các bài tập đánh giá của sinh viên. Kiểm sóat các

yếu tố có thể ảnh hưởng đến kết quả làm bài của sinh viên như: trạng thái sức khỏe, tâm lý khi
làm bài; ngôn ngữ diễn đạt trong bài kiểm tra; độ dài của bài kiểm tra; sự quen thuộc với bài
kiểm tra; việc được chuẩn bị kĩ trước khi làm bài kiểm tra. Tạo điều kiện để mỗi sinh viên bộc
lộ thực chất khả năng và trình độ của mình. Ngăn ngừa được tình trạng thiếu trung thực khi
làm bài kiểm tra. Việc đánh giá phải sát với hoàn cảnh và điều kiện dạy học.
1.1.3.3. Nguyên tắc đảm bảo tính tòan diện.
Đảm bảo tính tòan diện là hệ thống các quy tắc cần được thực hiện trong quá trình đánh
giá thành quả học tập của sinh viên, nhằm bảo đảm kết quả sinh viên đạt được qua kiểm tra
11


phản ánh các mặt đức, trí, thể, mỹ cũng như các mức độ nhận thức khác nhau trong học tập
của họ. Tính hệ thống và tòan diện của đánh giá đảm bảo cho các thông tin thu được se đầy đủ
và rõ ràng hơn về mức độ đạt được các mục tiêu của người học.
Để đảm bảo tính tòan diện, nội dung kiểm tra cần bao quát được các trọng tâm của phần
học, phần chương trình hay bài học ta muốn đánh giá. Các bài tập hoặc họat động đánh giá
không chỉ đánh giá kiến thức, kĩ năng môn học mà còn đánh giá các phẩm chất trí tuệ, tình
cảm cũng như những kĩ năng xã hội. Hơn nữa, công cụ đánh giá cần đa dạng và mục tiêu
đánh giá cần bao quát các kết quả học tập với những mức độ nhận thức từ đơn giản đến phức
tạp: nhớ/nhận biết, hiểu, vận dụng, phân tích, tổng hợp, đánh giá.
1.1.3.4. Nguyên tắc đảm bảo tính công khai.
Đánh giá là một tiến trình công khai, do vậy khi đánh giá cần đảm bảo các tiêu chuẩn và
yêu cầu đánh giá, nhiệm vụ hay bài tập, bài thi cần được công bố đến sinh viên trước khi họ
thực hiện bằng thông báo miệng hoặc được thông báo chính thức qua những văn bản hướng
dẫn làm bài. Ngòai ra, sinh viên cần biết cách tiến hành các nhiệm vụ để đạt được tốt các tiêu
chuẩn và yêu cầu đã định. Việc công khai các yêu cầu hoặc tiêu chí đánh giá các họat động
hoặc bài tập tạo điều kiện cho người học nhận ra rõ hướng phấn đấu để thực hiện thành công
các nhiệm vụ học tập.
1.2. TRẮC NGHIỆM – CÔNG CỤ ĐO LƯỜNG KẾT QUẢ HỌC TẬP


1.2.1. Khái niệm trắc nghiệm
Trắc nghiệm là một trong những công cụ đo lường cơ bản trong giáo dục. Theo tiếng
Anh, trắc nghiệm (test) nghĩa là “thử” hay “phép thử”, “sát hạch”. Theo nghĩa chữ Hán, "trắc"
có nghĩa là "đo lường", "nghiệm" là "suy xét", "chứng thực" [19], [23].
Các nhà tâm lý học và giáo dục học đã có nhiều định nghĩa khác nhau về thuật ngữ trắc
nghiệm. Theo Hòang Thị Tuyết, trắc nghiệm được hiểu là công cụ hoặc quy trình có tính hệ
thống được dùng để đo lường các hành vi học tập hoặc kết quả học tập cụ thể [28]. Dương
Thiệu Tống cho rằng, trắc nghiệm là “một dụng cụ hay phương thức hệ thống nhằm đo lường
một mẫu các động thái để trả lời câu hỏi: thành tích của cá nhân như thế nào khi so sánh với
những người khác hay so sánh với một lĩnh vực các nhiệm vụ dự kiến” [22]. Theo Trần Bá
Hoành, trắc nghiệm là hình thức đặc biệt để thăm dò một số đặc điểm về năng lực, trí tuệ của
học sinh (thông minh, trí nhớ, tưởng tượng, chú ý) hoặc để kiểm tra một số kiến thức, kĩ năng,
kĩ xảo của học sinh thuộc một chương trình nhất định [5]. Như vậy, trắc nghiệm luôn mang
đến những thông tin trực tiếp về một vấn đề cần nghiên cứu, là một công cụ để đánh giá thông
qua những vấn đề cần giải quyết hoặc hệ thống những câu hỏi cần phải trả lời.
12


1.2.2. Các chức năng của trắc nghiệm.
1.2.2.1. Chức năng dạy học
Đối với người dạy, sử dụng TN nhằm cung cấp thông tin ngược để điều chỉnh phương
pháp, nội dung cho phù hợp, nắm bắt được trình độ của người học và quyết định nên bắt đầu
từ đâu, tìm ra khó khăn để giúp đỡ người học, tổng kết để thấy mục tiêu đạt hay chưa, có nên
cải tiến phương pháp dạy học hay không và cải tiến theo hướng nào, như vậy trắc nghiệm
nâng cao được hiệu quả giảng dạy. Ngòai ra, kiểm tra - đánh giá bằng trắc nghiệm tạo cơ hội
cho giáo viên xem xét hiệu quả của những cải tiến nội dung, phương pháp, hình thức tổ chức
dạy học mà mình theo đuổi [12], [14].
Đối với người học, sử dụng TN có thể tăng cường tinh thần trách nhiệm trong học tập,
học tập trở nên nghiêm túc. Sử dụng trắc nghiệm giúp người học tự kiểm tra, đánh giá kiến
thức, kĩ năng, phát hiện năng lực tiềm ẩn của mình. Sử dụng trắc nghiệm giúp cho quá trình tự

học có hiệu quả hơn. Mặt khác, giúp người học phát triển năng lực tư duy sáng tạo, linh họat
vận dụng kiến thức đã học để giải quyết các tình huống nảy sinh trong thực tế [12], [14].
1.2.2.2. Chức năng quản lý
Trắc nghiệm cung cấp những thông tin về chất lượng giáo dục đào tạo của nhà trường,
giúp cho các cấp quản lý chỉ đạo kịp thời về mục tiêu, nội dung chương trình, phương pháp,
hình thức tổ chức dạy học [14].
1.2.2.3. Chức năng hướng dẫn
Trắc nghiệm có giá trị trong việc chẩn đóan khả năng, năng lực đặc biệt của cá nhân,
định hướng cho cá nhân trong khóa học một cách thích hợp, giúp cho việc phát hiện những
năng lực còn tiềm ẩn [14]. Như vậy, để thực hiện tốt các chức năng trên, trắc nghiệm phải
được xây dựng như một công cụ đo lường có hiệu quả kết quả học tập của sinh viên.

1.2.3. Các lọai trắc nghiệm trong kiểm tra, đánh giá kết quả học tập.
Theo một số tác giả thì công cụ chính để đo lường KQHT trong giáo dục là bài trắc
nghiệm (bài thi, bài kiểm tra) [4], [12], [28]. Có thể phân lọai trắc nghiệm theo sơ đồ sau:
Các kiểu trắc nghiệm
Quan sát

Vấn đáp

Trắc nghiệm tự luận

Viết
Trắc nghiệm khách quan

Diễn giải Tiểu luận Luận văn Đúng-sai Ghép đôi Điền khuyết Nhiều lựa chọn
13


1.2.3.1. Trắc nghiệm quan sát:

Quan sát là một phương tiện đánh giá người học theo hướng định tính, cung cấp một
nguồn thông tin có tác dụng hỗ trợ rất lớn cho phương pháp đánh giá định lượng bằng bài
kiểm tra [28]. Quan sát thích hợp cho thu thập thông tin để đánh giá về thái độ học tập, đạo
đức, tư cách của người học.
1.2.3.2. Trắc nghiệm vấn đáp:
TN vấn đáp là một phương tiện đánh giá người học theo hướng vừa định tính vừa định
lượng, có độ chính xác tương đối cao và có giá trị đào tạo nhiều mặt: bổ sung kiến thức, rèn
luyện năng lực tư duy và khả năng diễn giải tức thời [28].
1.2.3.3. Trắc nghiệm viết:
TN viết là lọai trắc nghiệm dùng phổ biến trong dạy học. Trắc nghiệm viết bao gồm hai
lọai: TN tự luận và TNKQ. Tùy theo kiểu lọai trắc nghiệm viết mà chúng có giá trị khác nhau.
 Trắc nghiệm tự luận
TN tự luận là dạng TN dùng những câu hỏi mở đòi hỏi người học tự xây dựng câu trả
lời. Câu trả lời có thể là một đọan văn ngắn, một bài tóm tắt, một bài diễn giải hoặc tiểu luận.
Dạng này còn gọi là TN chủ quan vì việc đánh giá cho điểm câu trả lời có thể tùy thuộc rất
nhiều vào chủ quan người chấm, từ khâu xây dựng đáp án, biểu điểm, xác định các tiêu chí
đánh giá đến khâu đối chiếu bài trả lời với đáp án biểu điểm, các tiêu chí đã định [28]. Dạng
TN tự luận giống như các câu hỏi kiểm tra truyền thống.
 Trắc nghiệm khách quan
TNKQ là phương pháp kiểm tra - đánh giá kết quả học tập của học sinh bằng hệ thống
câu hỏi kín (closed questiions) đòi hỏi thí sinh trả lời có giới hạn (restricted questions). Trắc
nghiệm được gọi là khách quan vì cách cho điểm hoàn toàn không phụ thuộc vào chủ quan
của người chấm [23]. Câu hỏi trắc nghiệm khách quan có thể chia làm 4 loại chính, mỗi lọai
đều có ưu nhược điểm riêng [19], [22], [23], [24], [28]:
 Câu trắc nghiệm đúng sai
Trắc nghiệm đúng - sai là kiểu trắc nghiệm bao gồm hai phần. Phần đầu là một câu hỏi
hay một phát biểu, còn gọi là phần đề. Phần hai là phương án lựa chọn đúng - sai. Yêu cầu của
trắc nghiệm này là lựa chọn một trong hai phương án.
Trắc nghiệm đúng - sai có ưu điểm là dễ xây dựng vì đây là loại câu hỏi đơn giản dùng
để trắc nghiệm kiến thức về những sự kiện. Có thể ra nhiều câu một lúc vì mất ít thời gian cho

mỗi câu, nhờ vậy khả năng bao quát chương trình lớn hơn. Tuy nhiên, với lọai trắc nghiệm

14


này, người làm bài có thể đoán mò vì vậy có độ tin cậy thấp. Thường chỉ dùng kiểm tra ở mức
độ biết và hiểu đơn giản do vậy dễ tạo điều kiện cho học sinh thuộc lòng hơn là hiểu.
 Câu trắc nghiệm trả lời ngắn
Trắc nghiệm trả lời ngắn là kiểu TN đòi hỏi người làm tự cung cấp câu trả lời. Hình thức
là một câu hỏi hoặc là một phát biểu chưa hòan chỉnh. Người làm bài phải viết câu trả lời cho
câu hỏi hoặc điền thêm vào câu phát biểu chưa hòan chỉnh bằng một từ hay cụm từ, một kí
hiệu, một công thức, một con số…. Kiểu điền hòan thành câu chưa hòan chỉnh còn gọi là TN
điền khuyết.
Ưu điểm của TN trả lời ngắn là người học không thể đóan mò mà phải nhớ ra, nghĩ ra,
tìm ra câu trả lời. Loại này dễ xây dựng hơn loại câu hỏi nhiều lựa chọn. Tuy vậy, khi soạn
thảo loại câu hỏi này thường dễ mắc sai lầm là trích nguyên văn các câu từ trong sách giáo
khoa. Phạm vi kiểm tra của loại câu hỏi này thường chỉ giới hạn vào chi tiết vụn vặt. Thường
chỉ dùng để kiểm tra mức độ biết và hiểu đơn giản. Đôi khi khó đánh giá đúng nội dung câu
trả lời khi sinh viên viết sai chính tả, hoặc khi câu TN gợi ra nhiều hướng đáp án đúng.
 Câu trắc nghiệm ghép đôi
Trắc nghiệm đối chiếu cặp đôi bao gồm hai phần: phần thông tin ở bảng truy và phần
thông tin ở bảng chọn. Hai phần này thường được thiết kế bằng hai cột. Yêu cầu của bài trắc
nghiệm đối chiếu cặp đôi là chọn lựa yếu tố tương đương hoặc có sự tương hợp của mỗi cặp
thông tin từ bảng truy và bảng chọn. Giữa các cặp ở hai bảng có mối liên hệ trên một cơ sở đã
định. Có hai hình thức: đối chiếu hòan tòan (số lượng các mục ở bảng truy bằng số lượng các
mục ở bảng chọn) và đối chiếu cặp đôi không hòan tòan (số lượng các mục ở bảng truy lớn
hơn số lượng các mục ở bảng chọn). Đây là loại hình đặc biệt của loại câu hỏi nhiều lựa chọn,
trong đó học sinh tìm cách ghép các câu trả lời ở trong cột này với câu hỏi ở cột khác sao cho
phù hợp.
Ưu điểm của trắc nghiệm đối chiếu cặp đôi là dễ xây dựng và có thể hạn chế sự đóan mò

bằng cách làm cho số lượng thông tin ở bảng chọn nhiều hơn ở bảng truy. Song, lọai trắc
nghiệm này không thích hợp cho việc thẩm định các khả năng như sắp đặt và vận dụng các
kiến thức. Muốn soạn loại câu hỏi này để đo mức trí năng cao đòi hỏi nhiều công phu. Ngoài
ra, nó chỉ chủ yếu kiểm tra khả năng nhận biết. Hơn nữa, thông tin có tính dàn trải, không
nhấn mạnh được những điều quan trọng hơn.
 Câu trắc nghiệm nhiều lựa chọn
Câu trắc nghiệm nhiều lựa chọn hay còn gọi là câu đa phương án. Câu trắc nghiệm loại
này gồm hai phần: phần nêu vấn đề dưới dạng câu chưa hòan thành hoặc câu hỏi và phần nêu
15


các phương án lựa chọn, thường là 4 hoặc 5 phương án. Yêu cầu là chọn một phương án trả
lời tốt nhất hoặc đúng nhất trong số các phương án cho sẵn, những phương án còn lại là câu
trả lời sai hay còn gọi là câu nhiễu.
Ưu điểm của loại câu hỏi NLC là có thể kiểm tra - đánh giá những mục tiêu dạy học
khác nhau như biết, hiểu và vận dụng. Độ tin cậy cao hơn vì yếu tố đoán mò hay may rủi
giảm đi nhiều so với các loại TNKQ khác. Với nhiều phương án lựa chọn, có thể nhận ra phản
ứng của người làm bài đối với các mồi nhử, do vậy có thể biết được khả năng của người làm
bài thi. Câu TNKQ dạng NLC được sử sụng chủ yếu trong dạy học và có khả năng chuyển
thành các dạng TN khác một cách dễ dàng.
Tuy nhiên, loại câu hỏi NLC khó soạn vì phải tìm câu trả lời đúng nhất, còn những câu
còn lại gọi là câu nhiễu thì cũng có vẻ hợp lý. Hơn nữa, khó biên sọan các câu hỏi để đánh giá
những kĩ năng nhận thức bậc cao. Ngòai ra, các câu hỏi NLC có thể không đo được khả năng
giải quyết vấn đề khéo léo, sáng tạo một cách hiệu nghiệm bằng loại câu hỏi TNTL soạn kỹ.
 Mối quan hệ giữa trắc nghiệm tự luận và trắc nghiệm khách quan
Giữa câu hỏi tự luận và câu hỏi TNKQ có mối quan hệ mật thiết với nhau như cái tòan
thể và cái bộ phận. Câu hỏi tự luận khái quát tổng hợp thực chất là tập hợp của nhiều câu hỏi
tự luận trả lời ngắn. Câu hỏi tự luận trả lời ngắn tương đương với câu dẫn của câu trắc nghiệm
khách quan nhưng khác phần hỏi, còn câu trả lời đúng là phương án lựa chọn, các câu nhiễu
là câu trả lời chưa chính xác hoặc sai. Do vậy, có thể viết câu TNKQ bằng cách lấy chính câu

hỏi trả lời ngắn đó sửa chữa thành câu dẫn, các câu trả lời là phương án chọn và phương án
nhiễu. Chính mối quan hệ này giúp giáo viên biết sử dụng kết hợp câu hỏi tự luận và câu hỏi
TNKQ để tích cực hóa họat động nhận thức ở người học [12].
1.3. KĨ THUẬT XÂY DỰNG TNKQ TRONG ĐÁNH GIÁ KẾT QUẢ HỌCTẬP.

1.3.1. Các cách tiếp cận để xây dựng và sử dụng câu trắc nghiệm khách quan.
Căn cứ vào mục đích sử dụng kết quả trắc nghiệm, có hai cách tiếp cận về trắc nghiệm,
từ mỗi cách tiếp cận se dẫn đến sự khác nhau trong việc xây dựng phân tích câu trắc nghiệm,
giải thích kết quả trắc nghiệm. Có hai cách tiếp cận như sau :
1.3.1.1. Trắc nghiệm theo chuẩn
Trắc nghiệm theo chuẩn (TNC) là một công cụ đo lường cho phép so sánh thành tích
của mỗi cá nhân đối chiếu với thành tích của một nhóm được dùng làm chuẩn về một nội
dung giảng dạy nào đó. Các câu hỏi của bài trắc nghiệm được tuyển chọn dựa trên cơ sở khả
năng phân biệt được các thí sinh. Thông thường nội dung bài TNC có tính chất bao quát và
rộng, và nhóm chuẩn là một nhóm đại diện cho các học viên thuộc một lớp tuổi hay cấp học
16


nào đó trong phạm vi rộng: một vùng, một tỉnh hoặc cả nước. Kỹ thuật xây dựng và sử dụng
đã phát triển cao và được chấp nhận rộng rãi; độ tin cậy của bài trắc nghiệm cao. Khi phân
tích câu hỏi, vấn đề cần quan tâm là giá trị nội dung và độ phân cách của câu hỏi. Phần lớn
những bài TNC về kết quả học tập và các bài trắc nghiệm về trí thông minh là dựa vào cách
tiếp cận này [17], [19], [22], [23].
1.3.1.2. Trắc nghiệm theo tiêu chí
Trắc nghiệm theo tiêu chí (TNTC) được các chuyên gia đo lường giáo dục chú ý từ cuối
thập niên 60 của thế kỷ XX và đã không ngừng được nghiên cứu và cải tiến. W.J.Popham cho
rằng “trắc nghiệm theo tiêu chí là trắc nghiệm được xây dựng nhằm cho phép giải thích thành
tích của người được khảo sát liên quan đến một tập hợp các khả năng đã được xác định rõ
ràng” [17] Trắc nghiệm tiêu chí nhằm mục đích xác định khả năng hay kết quả của mỗi cá
nhân đối với một tiêu chí đã định nào đó chứ không cần thiết phải biết khả năng của mỗi cá

nhân đó so với những cá nhân khác. Nói cách khác, bài TNTC thể hiện mức độ thành thạo của
người học về một bộ phận kiến thức nào đó gắn liền với những mục tiêu chuyên biệt của
chương trình học hơn là thứ hạng của người học ấy so với nhóm chuẩn. Thông thường mức
độ thành thạo được biểu thị bởi tỉ lệ phần trăm số câu trắc nghiệm trả lời đúng. Các câu trắc
nghiệm được lựa chọn sao cho chúng bao trùm được nội dung học tập bất kể là câu hỏi đó dễ
hay khó. Trong một bài TNTC, có nhiều câu hỏi mà tất cả sinh viên đều trả lời đúng nhưng
vẫn được giữ lại vì chúng phản ánh mức độ thành thạo mà người học phải đạt được sau một
thời gian học tập. Nội dung bài TNTC thường chi tiết, rành mạch và tưong đối hẹp [19], [24].
Lọai TNTC, với những đặc điểm của nó, đòi hỏi người gíao viên phân tích và xác định
thật rõ ràng, cụ thể mục tiêu của một chương trình gỉang dạy và nội dung bài trắc nghiệm. Kĩ
thuật xây dựng và sử dụng lọai trắc nghiệm này đang phát triển; độ tin cậy có thể cao nhưng
đôi khi khó xác định. Khi phân tích các câu hỏi, yếu tố cần quan tâm chính là giá trị nội dung;
thường có nhiều câu hỏi cho mỗi mục tiêu hay lĩnh vực [19], [24].
Như vậy điểm khác biệt chính ở hai lọai trắc nghiệm này là ở mục đích sử dụng kết quả
trắc nghiệm. Trắc nghiệm mà chúng tôi đang tiến hành xây dựng là TNTC, vì mục đích của
chúng tôi là xây dựng và sử dụng câu TNKQ nhiều lựa chọn nhằm đánh giá mức độ mà sinh
viên đạt được các mục tiêu cụ thể của môn học.

1.3.2. Xác định mục tiêu đánh giá kết quả học tập.
Mỗi môn học đều có những mục tiêu giáo dục nhất định. Đánh giá KQHT môn học
chính là quá trình xác định mức độ đạt được mục tiêu giáo dục của môn học ở sinh viên. Do
vậy, các mục tiêu này cần được xác định dưới dạng những hành vi có thể quan sát và đo lường
17


được. Trước hết đó là những mục tiêu để người dạy và người học hướng tới và sau đó là
những tiêu chí để đánh gía.
Năm 1948, B. S. Bloom đã chủ trì xây dựng một hệ thống phân loại các mục tiêu của
quá trình giáo dục. Ba lĩnh vực của các hoạt động giáo dục đó là lĩnh vực về nhận thức
(cognitive domain), lĩnh vực về hoạt động (psychomator domain) và lĩnh vực về cảm xúc, thái

độ (affective domain) [3], [19]. Lĩnh vực nhận thức thể hiện ở khả năng suy nghĩ, lập luận,
bao gồm việc thu thập các sự kiện, giải thích, lập luận theo kiểu diễn dịch và quy nạp và sự
đánh giá có phê phán. Lĩnh vực hành động liên quan đến những kỹ năng đòi hỏi sự khéo léo
về chân tay, sự phối hợp các cơ bắp từ đơn giản đến phức tạp. Lĩnh vực cảm xúc liên quan
đến những đáp ứng về mặt tình cảm, bao hàm cả những mối quan hệ như yêu ghét, thái độ
nhiệt tình, thờ ơ, cũng như sự cam kết với một nguyên tắc và sự tiếp thu các lý tưởng.
Phần lớn việc đánh giá KQHT tập trung khảo sát về mặt nhận thức, tuy vậy các lĩnh vực
nêu trên không hoàn toàn tách biệt hoặc loại trừ lẫn nhau. Ở đây chúng tôi đi vào phân tích
sâu lĩnh vực mục tiêu nhận thức mà B. S. Bloom đã phân lọai, nhằm giúp xác định các mục
tiêu của môn học và mục tiêu đánh giá KQHT ở sinh viên. Lĩnh vực nhận thức được chia
thành các mức độ hành vi từ đơn giản nhất đến phức tạp nhất bao gồm:
1. Nhận biết (nhớ)

4. Phân tích

2. Thông hiểu

5. Tổng hợp

3. Ứng dụng

6. Đánh giá

Cách phân lọai của B. S. Bloom là cơ sở cần thiết cho giáo viên xây dựng câu TNKQ.
Tuy nhiên, khi sử dụng hệ thống phân lọai này điều hạn chế lớn nhất chính là sự phức tạp của
nó. Các chuyên gia về trắc nghiệm cho rằng, hệ thống phân lọai càng đơn giản và cụ thể thì
càng dễ sử dụng. Căn cứ vào cách phân lọai của B. S. Bloom, chúng tôi xác định ba mức độ
mục tiêu trong lĩnh vực nhận thức - nhận biết, hiểu và áp dụng. Nội dung ba mục tiêu thể hiện
như sau:
 Nhận biết: là sự nhớ lại các dữ liệu đã học được trước đây. Điều đó có nghĩa là một

người có thể nhắc lại một loạt dữ liệu, từ các sự kiện đơn giản đến các lý thuyết phức tạp, tái
hiện trong trí nhớ những thông tin cần thiết. Đây là cấp độ thấp nhất của kết quả học tập trong
lĩnh vực nhận thức.
 Hiểu: là khả năng nắm được ý nghĩa của tài liệu, bao gồm cả nhận biết nhưng ở mức
độ cao hơn. Hiểu được thể hiện ở ba dạng. Thứ nhất là khả năng chuyển dịch - người học có
thể truyền đạt lại thông tin thu nhận bằng các thuật ngữ khác hay bằng một hình thức khác của
18


thông tin. Thứ hai, người học có thể giải thích tài liệu (giải thích hoặc tóm tắt) và hiểu được
mối quan hệ giữa các ý tưởng chính trong tài liệu, có thể xếp lại ý tưởng thành một dạng mới,
có khả năng nhận ra những cái cơ bản và phân biệt chúng với cái khác. Thứ ba, người học có
khả năng đưa ra những kết luận bằng sự suy luận, khả năng tiên đóan dựa trên sự hiểu biết
khuynh hướng hay điều kiện được mô tả trong thông tin. Kết quả học tập ở cấp độ này cao
hơn so với nhớ, và là mức thấp nhất của việc thấu hiểu sự vật.
 Áp dụng: là khả năng sử dụng các tài liệu đã học vào một hoàn cảnh cụ thể mới. Điều
đó có thể bao gồm việc áp dụng các quy tắc, phương pháp, khái niệm, nguyên lý, định luật và
lý thuyết. Kết quả học tập trong lĩnh vực này đòi hỏi cấp độ thấu hiểu cao hơn so với cấp độ
hiểu trên đây.
Cách phân lọai mục tiêu trên là căn cứ quan trọng để xác định các mục tiêu giáo dục ở
từng môn học cụ thể. Đồng thời, công cụ đánh giá có hiệu quả phải giúp xác định được kết
quả học tập ở ba cấp độ mục tiêu nói trên để đưa ra một nhận định chính xác về năng lực của
người được đánh giá về chuyên môn liên quan.

1.3.3. Phân tích và đánh giá bài trắc nghiệm, câu trắc nghiệm khách quan dạng
nhiều lựa chọn.
1.3.3.1. Phân tích và đánh giá câu hỏi trắc nghiệm khách quan.
Phân tích câu TN là phương thức nhằm gia tăng tính tin cậy và giá trị của bài TN. Phân
tích câu TN nhằm mục đích giữ lại những câu TN đạt yêu cầu, sửa chửa hòan thiện những câu
có thể sửa chữa được và lọai bỏ những câu trắc nghiệm chưa đạt yêu cầu [23].

Việc phân tích câu TN và bài TN phục thuộc vào mục đích trắc nghiệm, do vậy các đặc
trưng thống kê phải phản ánh được mục đích này. Nếu bài TN có mục đích so sánh giữa các
sinh viên với nhau thì chỉ số về độ khó và độ phân biệt cần được nhấn mạnh và quan tâm hơn.
Nếu bài TN có mục đích đo lường để xác định được sinh viên đã đạt được các mục tiêu của
môn học như thế nào thì những thông tin về độ phân biệt và độ khó cũng không nhất thiết
phải lọai bỏ câu trắc nghiệm [24].
Với TNKQ nhiều lựa chọn, phân tích câu TN cần chú ý ba chỉ số cơ bản: độ khó
(dificulty), độ phân biệt (discrimination) và mồi nhử (distractors).
 Độ khó của câu trắc nghiệm
 Khái niệm
Độ khó câu TN căn cứ vào số người trả lời đúng của câu hỏi đó. Nếu như tất cả mọi
người chọn giải pháp đúng, thì đó là một câu TN dễ; nếu ít người trả lời đúng thì câu TN đó
được coi là quá khó.
19


 Cách tính độ khó của câu trắc nghiệm
Theo lý thuyết TN cổ điển, độ khó (p) của một câu hỏi TNKQ được đo bằng tỉ lệ phần
trăm số người trả lời đúng câu TN ấy. Trị số P của câu i được tính bằng công thức:

Pi =

Ri
(R: số người trả lời đúng câu i; n: số người làm bài TN)
n

Một bài TN đáng tin cậy và có giá trị khi tất cả những câu TN trong bài có độ khó gần
bằng hoặc bằng độ khó trung bình (vừa phải). Độ khó vừa phải của câu TN là trung bình cộng
giữa tỉ lệ may rủi kì vọng (expected chance proportion) & 100%. Tỉ lệ may rủi thay (T) được
tính như sau:


T=

100
n

(n: số lựa chọ mỗi câu)

 Thang phân lọai độ khó của câu trắc nghiệm khách quan được thể hiện
như sau:
• Câu trắc nghiệm quá khó: p ≤ 0.19
• Câu trắc nghiệm hơi khó: 0.20 ≤ p ≤ 0.50
• Câu trắc nghiệm có độ khó trung bình: 0.51 ≤ p ≤ 0.70
• Câu trắc nghiệm hơi dễ: 0.71 ≤ p ≤ 0.90
• Câu trắc nghiệm quá dễ: p ≥ 0.91
 Cách tính độ khó của bài trắc nghiệm
Độ khó của bài TN được tính bằng cách đối chiếu điểm số trung bình (mean) của bài TN
ấy với điểm trung bình lý tưởng của nó. Điểm trung bình được dùng để xác định mức độ khó
hay dễ của bài TN là vì điểm trung bình bị chi phối hòan tòan bởi độ khó trung bình của các
câu hỏi tạo thành bài TN ấy.
Điểm trung bình lý tưởng là trung bình cộng giữa điểm tối đa có thể có được và điểm
may rủi kì vọng của nó (expected chance score). Điểm may rủi kỳ vọng (H) được tính theo
công thức:
H=

N
n

(N: số câu hỏi TN; n: số lựa chọn cho mỗi câu TN)


Ví dụ bài TN có 50 câu, mỗi câu 4 lựa chọn, thì điểm may rủi kì vọng T se là 12,5. Như
vậy, trung bình lý tưởng của bài TN là (12,5 + 50)/2 = 31,22. Nếu trung bình quan sát (tức
trung bình tính được từ một mẫu sinh viên làm bài TN ấy) trên hay dưới 31,22 quá xa thì bài
TN có thể quá dễ hoặc quá khó.
20


 Độ phân biệt
 Khái niệm
Độ phân biệt (ĐPB) của câu hỏi TNKQ là khả năng phân biệt được sinh viên giỏi và
sinh viên kém theo mục đích đặt ra cho bài trắc nghiệm, hay là phân biệt được phản ứng của
người giỏi và người kém khi trả lời câu hỏi TNKQ. ĐPB kí hiệu là D.
Một câu hỏi TNKQ có độ phân biệt cao (dương) khi số người trả lời đúng (nằm trong
nhóm người đạt điểm cao ở tòan bài TN) nhiều hơn so với số người trả lời sai (nằm trong
nhóm người đạt thấp ở tòan bài TN) theo một tiêu chí của bài TN đó.
 Cách tính độ phân biệt của câu trắc nghiệm
Cách 1: Lấy tần số câu trả lời đúng ở nhóm cao trừ cho tần số câu trả lời đúng ở nhóm thấp,
rồi chia cho số sinh viên ở mỗi nhóm.
D=

NH − NL
n

• NH : Số sinh viên trả lời đúng của nhóm cao (gồm những sinh viên đạt điểm cao của
tòan bài TN, chiếm 27% tổng số sinh viên)
• NL: Số sinh viên trả lời đúng của nhóm thấp (gồm những sinh viên đạt điểm thấp ở
tòan bài TN, chiếm 27% tổng số sinh viên)
• n : số sinh viên của mỗi nhóm
Các nhà nghiên cứu đã chứng minh rằng lựa chọn ra 27% là con số có thể khẳng định
chắc chắn rằng những người trong nhóm cao có khả năng cao hơn những người trong nhóm

thấp. Tuy nhiên con số này có thể dao động từ 25% đến 35%, nhưng 27% là tốt nhất [23].
Cách 2: Tính hệ số tương quan câu hỏi-tổng điểm (item-total correlation).
Ngòai cách tính ĐPB như cách 1, có thể tính ĐPB của một câu TN theo hệ số tương
quan câu hỏi - tổng điểm (item-total correlation) hay còn gọi là tương quan điểm - nhị phân
(point-biserial correlation) [19], [23], [24].
Tương quan (correlation) là một số đo lường mối liên hệ giữa hai biến số. Tương quan
ấy có thể là dương, âm hay 0. Tương quan dương khi các trị số thấp của một biến số (x) có
liên hệ với các trị số thấp của một biến số khác (y) và các trị số cao của x có liên hệ với các trị
số cao của y. Tương quan âm khi các trị số thấp của x có liên hệ với các trị số cao của y và các
trị số cao của x có liên hệ với các trị số thấp của y. Khi không có sự liên hệ hệ thống nào cả
giữa x và y thì đó là tương quan 0 [24].

21


Có thể xem hệ số tương quan nhị phân như là hệ số tương quan cặp Pearson, tương quan
giữa tổng điểm (điểm tòan bài TN) với điểm số của mỗi câu TN xét trên mọi sinh viên làm bài
TN ấy. Hệ số tương quan (r) này được tính theo công thức như sau:

r=

N ∑xy −∑x ∑y

[N ∑x 2 −(∑x )2][N ∑y 2 −(∑y )2]

Trong đó:
• x: điểm số của mỗi câu TN
• y: tổng điểm của tòan bài TN
• N: số sinh viên làm bài TN
 Quy ước chỉ số phân cách

Tương quan câu hỏi - tổng điểm (item - total correlation) được giải thích giống như chỉ số
phân cách D.


Một hệ số tương quan câu hỏi - tổng điểm dương (+) cho biết rằng câu TN ấy phân

biệt được sinh viên làm giỏi và sinh viên làm kém. Quan trọng hơn nó cho thấy câu TN ấy và
bài TN cùng đo lường một thứ.


Một hệ số tương quan câu hỏi - tổng điểm âm (-) cho biết câu TN và tổng điểm không

tương hợp với nhau, những người làm đúng câu TN ấy là những người làm kém trong tòan
bài TN.


Một hệ số tương quan zero (0) có nghĩa câu TN ấy không phân biệt giữa các điểm số

cao và thấp.
 Mồi nhử
 Khái niệm: là tấn số của các đáp ứng sai cho mỗi câu hỏi.
 Nguyên tắc phân tích
Mỗi câu trả lời đúng phải tương quan thuận với tiêu chí đã định. Nghĩa là, với câu trả lời
đúng, số sinh viên trong nhóm cao phải trả lời đúng nhiều hơn số sinh viên trong nhóm thấp.
Mỗi câu trả lời sai phải tương quan nghịch với tiêu chí. Với câu trả lời sai (mồi nhử), số sinh
viên trong nhóm cao lựa chọn câu này phải ít hơn số sinh viên lựa chọn câu này trong nhóm
thấp [23].

1.3.3.2. Phân tích và đánh giá bài trắc nghiệm
 Độ giá trị của bài trắc nghiệm

 Khái niệm :
Độ giá trị (ĐGT) là khái niệm cho biết mức độ mà bài trắc nghiệm đo được đúng cái mà
22


nó định đo. Nói đến độ giá trị là nói đến tính hiệu quả của một bài trắc nghiệm trong việc đạt
được những mục đích đã xác định [19], [22], [23], [24].
 Các lọai độ giá trị :
Có rất nhiều ĐGT như ĐGT đồng thời, ĐGT tiên đóan, ĐGT yếu tố, ĐGT nội dung,
ĐGT khái niệm tạo lập…Trong đề tài này chúng tôi đề cập đến các lọai xác định giá trị thông
dụng với trắc nghiệm tiêu chí: ĐGT nội dung, ĐGT tiên đoán và ĐGT khái niệm tạo lập.
• Độ giá trị nội dung
Giá trị nội dung là đặc tính quan trọng nhất của bài trắc nghiệm tiêu chí. Một bài TNKQ
được coi là có giá trị nội dung khi các câu hỏi trong bài là một mẫu tiêu biểu của tổng thể các
kiến thức, kĩ năng, mục tiêu dạy học. Mức độ giá trị nội dung được ước lượng bằng cách so
sánh nội dung của bài TNKQ với nội dung của chương trình học. Điều này được thể hiện
trong quá trình xác định mục tiêu kiểm tra và bảng đặc trưng để phân bố câu hỏi, lựa chọn câu
hỏi. Việc xác định tính giá trị nội dung của bài TNTC đòi hỏi sự phân tích bằng lý luận và
phán xét cho nên tính biến thiên của điểm số không phải là vấn đề quan trọng [23], [24].
• Độ giá trị tiên đoán
Trong một số lĩnh vực như hướng nghiệp, tuyển chọn từ điểm số của bài TNKQ của
từng người, chúng ta có thể tiên đoán mức độ thành công trong tương lai của người đó. Muốn
tính giá trị tiên đoán chúng ta cần phải làm hai bài TN: một bài TN dự báo để có được những
số đo về khả năng, tính chất của nhóm đối tượng khảo sát, một bài TN đối chứng để có biến
số cần tiên đoán. Hệ số tương quan giữa hai bài TN đó là giá trị tiên đoán [23], [24].
• Độ giá trị khái niệm tạo lập
Trong trường hợp sử dụng trắc nghiệm tiêu chí trong lớp học, cần phải chú trọng nhiều
đến giá trị nội dung của bài trắc nghiệm và các phương thức xác định giá trị khác tương đối
đơn giản. Song khi sử dụng TNTC cho những mục đích quan trọng như thi lên lớp, cấp phát
văn bằng, thì cần phải thực hiện những cuộc nghiên cứu nhằm xác định giá trị tạo lập

(construct validity) của bài trắc nghiệm. Công việc này gồm cả việc xác định ĐGT nội dung,
ĐGT tiên đóan và các lọai bằng chứng khác nữa, tất cả đều nhằm làm rõ ý nghĩa của các điểm
số trắc nghiệm. Vì hàng số (range) các điểm số trên bài TNTC thường hạn hẹp (điểm số của
người học ít phân tán), cho nên để xác định ĐGT của lọai trắc nghiệm này, cần phải sử dụng
lối phân tích bằng lý luận và vận dụng sự phán xét hơn là thực hiện những nghiên cứu bằng
hệ số tương quan [23], [24].
Qua phân tích về hai lọai ĐGT, chúng tôi thấy ĐGT nội dung được quan tâm nhiều nhất
trong lĩnh vực dạy học. Đó là đặc điểm chủ yếu của bài trắc nghiệm đánh giá KQHT. Chúng
23


tôi cho rằng bài trắc nghiệm tổng kết đánh giá KQHT ở từng môn học cần phải quan tâm đến
ĐGT nội dung, vì để đánh giá được chính xác mức độ mà sinh viên đạt được các mục tiêu của
môn học, thì bài trắc nghiệm phải đại diện cho môn học đó.
 Độ tin cậy của bài trắc nghiệm khách quan.
 Khái niệm
Độ tin cậy (ĐTC) của một phép đo cho biết mức độ chính xác, sự ổn định khi thực hiện phép
đo với công cụ đo đã dùng. Do đó, độ tin cậy của bài TNKQ là đại lượng biểu thị mức độ chính xác
khi thực hiện phép đo với dụng cụ đo đã dùng [16]. Tính tin cậy liên quan đến tính vững chãi
(stability) hay nhất quán (consistency) của các điểm số trên bài trắc nghiệm ấy [23]. Vì thế
một bài TNKQ thật sự có ích khi bài TNKQ đó có độ tin cậy cao.
 Cách tính độ tin cậy
ĐTC của bài trắc nghiệm được đo bằng hệ số tin cậy. Trong khoa học thống kê có nhiều
phương pháp để đo lường độ tin cậy như phương pháp trắc nghiệm - trắc nghiệm lại (test retest), phương pháp về các dạng trắc nghiệm tương đương (equivalent forms), phương pháp
phân đôi bài trắc nghiệm (split halves method) hoặc phương pháp phù hợp nội tại…Mỗi
phương pháp trên đều có một công thức tính tóan riêng biệt và có những ưu điểm và khuyết
điểm riêng [19], [23], [24].
Trong phạm vi đề tài này, chúng tôi xin trình bày phương pháp Kuder-Richardson,
phương pháp xác định độ tin cậy dựa vào mức độ thuần nhất của câu hỏi và mối quan hệ nội
tại của chúng trong bài TNKQ. Đây là một phương pháp phỏng định hệ số tin cậy thông dụng

đã được tác giả Kuder và Richardson đưa ra vào năm 1937, và ngày nay được sử dụng phổ
biến rộng rãi trong hầu hết sách giáo khoa về trắc nghiệm trên thế giới. Theo Kuder Richardson, đối với các bài TN thuần nhất về mặt nội dung thì có mối quan hệ tóan học rất
gần gũi giữa mức độ khó của câu hỏi với độ tin cậy của bài TN [19], [24].
Nếu thông tin về độ khó của mỗi câu TN dạng NLC trong bài TN khác nhau thì độ tin
cậy được tính theo công thức Kuder-Richardson 20 (K.R.20) như sau :

r=

K  ∑ pq 
1−
K − 1 
σ 2 

Nếu thông tin về độ khó của mỗi câu TN dạng NLC trong bài TN gần bằng nhau thì độ
tin cậy được tính theo công thức Kuder-Richardson 21 (K.R.21) như sau :

24



 M
M 1 −

K
K
1 − 
r=
K −1 
σ2











Trong đó:
• p = tỉ lệ số trả lời đúng cho mỗi câu
• q = tỉ lệ số trả lời sai cho mỗi câu
• K= số câu trắc nghiệm
• M= điểm trung bình của bài trắc nghiệm tổng thể
• σ = phương sai bài TN, biến lượng các tổng điểm của cá nhân về tòan thể bài TN.
 Những yếu tố ảnh hưởng đến độ tin cậy của bài trắc nghiệm.


Thứ nhất, yếu tố may rủi có ảnh hưởng tới ĐTC của bài TN. Với lọai câu hỏi đúng

- sai thì yếu tố may rủi cao hơn lọai câu hỏi ĐPA. Nếu nhiều sinh viên đóan mò không cần
suy nghĩ khi làm bài thì hệ số tin cậy se thấp và các điểm số trên một bài TN như vậy se
không đáng tin cậy.


Thứ hai, tính chất khó dễ của bài TN cũng ảnh hưởng đến ĐTC của bài TN. Nếu

sinh viên làm một bài TN quá dễ, các điểm số có khuynh hướng tập trung vào đầu cao của
thang điểm, như vậy khó phân biệt được trình độ khác nhau của sinh viên. Ngược lại, nếu bài
TN quá khó, các điểm số se tập trung vào đầu mút thấp của thang điểm, điểm số không trải

rộng nên khó thấy được sự khác biệt trong KQHT của sinh viên.


Ngòai ra, chiều dài bài TN cũng ảnh hưởng đến ĐTC. Một bài TN quá ngắn khiến

cho điểm số không được trải rộng ra đủ để cho ra những kết quả vững chãi, do thế bài TN
càng dài thì ĐTC càng cao.
 Những yêu cầu để gia tăng độ tin cậy của bài trắc nghiệm
Muốn đảm bảo tính tin cậy tối đa của một bài TN, cần phải:


Hạn chế sử dụng các câu hỏi có ít lựa chọn để giảm tối đa các yếu tố may rủi.



Bài TN nên có độ dài phù hợp, tuy vậy bài TN cũng không nên quá dài vì yếu tố

mệt mỏi cũng ảnh hưởng đến ĐTC của bài TN.


Các câu TN cần đảm bảo yêu cầu về độ khó và độ phân biệt.



Chỉ dẫn cho việc làm bài TN cần rõ ràng để sinh viên khỏi nhầm lẫn khi làm bài.

ĐGT và ĐTC có liên quan với nhau, một bài TN muốn có giá trị phải có ĐTC, ngược
lại, một bài TN có ĐTC cao chưa hẳn đã có gía trị cao. Tính tin cậy liên quan đến sự vững
25



×