Tải bản đầy đủ (.doc) (36 trang)

đo lường và đánh giá trong giáo dục

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (279.15 KB, 36 trang )

ĐO LƯỜNG VÀ ĐÁNH GIÁ TRONG GIÁO DỤC
PGS.TS Trần Khánh Đức
Đại học quốc gia Hà nội
Đặt vấn đề
Một vấn đề sôi động trong thực tiễn và lý luận dạy học và quản lý giáo dục
hiện nay là vấn đề nghiên cứu - ứng dụng các phương pháp đánh giá - kiểm tra quá
trình và kết quả dạy-học, quá trình quản lý giáo dục một cách khách quan, chính xác
và nhanh chóng. Trong hoạt động dạy- học, việc kiểm tra - đánh giá không chỉ đơn
thuần chú trọng vào kết quả học tập của học sinh mà còn có vai trò to lớn hơn trong
việc thúc đẩy động cơ, thái độ tích cực, chủ động và sáng tạo trong học tập của người
học, hoàn thiện quá trình dạy - học và kiểm chứng chất lượng - hiệu quả giờ học và
trình độ nghề nghiệp của giáo viên.Trong hoạt động quản lý kiểm tra-đánh giá cũng
không chỉ đơn thuần hướng vào đánh giá kết quả công việc mà còn có tác động thúc
đẩy, hỗ trợ và nâng cao chất lượng, hiệu quả hoạt động của tổ chức và cong tác quản
lý của tổ chức.
Các hình thức kiểm tra, đánh giá truyền thống trong hoạt động dạy - học nặng
về đánh giá khả năng ghi nhớ, trình bày lại những nội dung mà người dạy truyền thụ
như kiểm tra vấn đáp bài học cũ, kiểm tra viết trong thời gian ngắn hoặc dài theo
chương, mục bài giảng v.v đã và đang bộc lộ nhiều hạn chế nâng cao tính tích cực
học tập và khả năng vận dụng linh hoạt - sáng tạo các kiến thức - kỹ năng của người
học trong các tình huống thực tế đa dạng. Để khắc phục các hạn chế trên, ở nhiều
nước trên thế giới đã nghiên cứu và vận dụng các phương pháp đánh giá bằng các trắc
nghiệm (test) khách quan. Các bộ trắc nghiệm (test) được nghiên cứu thử nghiệm cho
từng loại hình dạy - học và mục đích khác nhau rất công phu (Trắc nghiệm trí thông
minh IQ; Trắc nghiệm kiểm tra tiếng Anh; Trắc nghiệm kiểm tra luật giao thông
v.v ). Cũng có những loại trắc nghiệm đánh giá đơn giản để đáp ứng yêu cầu đánh
giá kiến thức hoặc kỹ năng trong một bài dạy lý thuyết hoặc thực hành. Trong quản lý
giáo dục còn có các loại hình đánh giá giáo dục khác như đánh giá giáo viên; đánh
giá nhà trường, đánh giá chất lượng giáo dục vv với nhiều phương pháp, quy trình
và bộ công cụ đánh giá khác nhau.
I. MỘT SỐ THUẬT NGỮ THƯỜNG DÙNG TRONG ĐO LƯỜNG VÀ ĐÁNH


GIÁ.
1.1.Kiểm tra
Theo từ điển tiếng Việt thuật ngữ kiểm tra được định nghĩa như sau : “ Kiểm
tra là xem xét tình hình thực tế để đánh giá, nhận xét “ (Hoàng Phê- Từ điển Tiếng
Việt. NXB khoa học xã hội, H.1998 )
Theo Tự điển Giáo dục học -NXB Tự điểm Bách khoa 2001 thuật ngữ Kiểm
tra được định nghĩa như sau : “ Là bộ phận hợp thành của quá trình hoạt động dạy-
học nhằm nắm được thông tin về trạng thái và kết quả học tập của học sinh, về những
nguyên nhân cơ bản của thực trạng đó để tìm ra những biện pháp khắc phục những lỗ
1
hổng, đồng thời củng cố và tiếp tục nâng cao hiệu quả của hoạt động dạy- học. Như
vậy trong lĩnh vực giáo dục, kiểm tra là một thuật ngữ chỉ sự đo lường, thu thập thông
tin để có được những phán đoán, xác định xem mỗi người học sau khi học đã nắm
được gì (kiến thức), làm được gì (kỹ năng) và bộc lộ thái độ ứng xử ra sao ,đồng thời
có được những thông tin phản hồi để hoàn thiện quá trình dạy-học
2.2. Đo lường: ( Measurement)
Theo Hoàng Phê- Từ điển Tiếng Việt. NXB khoa học xã hội, H.1998 , thuật ngữ
“ Đo lường” được định nghĩa là : xác định độ lớn của một đại lượng bằng cách so
sánh với một đại lượng cùng loại được chọn làm đơn vị “ Đo lường trong tiếng Anh
( Measurement ) là một khái niệm chuyên dùng để chỉ sự so sánh một vật hay hiện
tượng với một thước đo hay chuẩn mực, có khả năng trình bày kết quả về mặt định
lượng .Nói cách khác đo lường là một cách lượng giá với mục đích gán con số hoặc
thứ bậc cho đối tượng đo ( nghiên cứu ) theo một hệ thống quy tắc hay chuẩn mực
nào đó.
Trong lĩnh vực giáo dục có nhiều định nghĩa khác nhau về đo lường
- Theo K.D.Hopkins và J.C.Stalay : Đo lường là quá trình mà với nó, sự việc được
phân biệt .
- Theo Q. Stodola và K.Stordahl : Đo lường trong giáo dục là phương tiện để thu
thập, phân tích dữ liệu về đặc tính, hành vi con người một cách có hệ thống làm cơ sở
cho những hành động thích hợp .

Trong đo lường, các loại thang đo có vai trò cực kỳ quan trọng. Những công cụ
đo lường trong nghiên cứu giáo dục có các loại sau :
- Thang đo định danh : ( nominal scale ) là kiểu đo lường đánh giá sự vật , hiện
tượng hay đặc tính theo tên gọi ( định danh ) theo giói tính nam-nữ; theo vùng miền
( bắc, nam ,trung) ; theo nhóm tuổi ( trẻ em, người lớn ); theo trình độ học lực ( kém,
trung bình , khá, giỏi ) hoặc khi cần phân loại theo đặc trưng mầu sắc ( xanh, dỏ,
vàng vv)
Thang định danh là phép đo khái quát không nhằm cung cấp thông tin cụ thể,
chính xác về đặc tính và sự khác biệt của các đối tượng đo.
- Thang định hạng : ( ordinal scale ) là kiểu đo lường đánh giá sự vật , hiện
tượng hay đặc tính theo thứ bậc hay trật tự của chúng. Ví dụ khi muốn phân loại năng
lực học tập một môn nào đó ( như môn Toán chẳng hạn ) của một nhóm học sinh
theo thứ hạng điểm thi hoặc tổng kết từ điểm cao nhất đến điểm thấp nhất hoặc muốn
phân loại đồ vật theo kích cỡ, trọng lượng từ to nhất, nặng nhất đến bé nhất, nhẹ nhất
vv.
Thang định hạng cũng là phép đo khái quát không nhằm cung cấp thông tin cụ
thể, chính xác về đặc tính và mức độ khác biệt giữa các đối tượng mà chỉ nhằm chỉ ra
vị trí, mối tương quan thứ bậc của các đối tượng đo.
- Thang định khoảng : ( interval scale ) là kiểu đánh giá, phân loại các sự vật,
hiện tượng hay đặc tính theo những đơn vị phân loại bằng nhau ở bất kỳ khoảng nào
2
trên thang đo . Vị dụ cụ thể nhất là các phép đo bằng thước mét. Phép đo chiều cao
bằng thước mét là một kiểu đo theo thang định khoảng : sự khác biệt giữa người cao
175 cm-170cm và người cao 160 cm -155 cm đều ở một khoảng như nhau là 5 cm.
Hay các thang đo định khoảng về điểm đánh giá theo thang 10 điểm, 100 điểm vv .
Cần lưu ý một số đối tượng đo do tính chất đặc thù ( khác với các phép đo cơ học )
có sự khác biệt giữa các khoảng tuyệt đối ở các mức khác nhau . Ví dụ khi đo vượt
xà ở mức cao thì chênh 1-2 cm là khó đạt hơn khi còn ở mức xà thấp ; những người
có chỉ số IQ tưong ứng là 110 và 120 ( cách nhau 10 điểm) không có nghĩa giống sự
cách biệt 10 điểm ở các mức 80-90 và như vậy ở đây mang tính chát của phép đo định

hạng.
- Thang định tỷ lệ ( Ratio scale ) là lại thang đo khi cần phân loại các sự vật,
hiện tượng hay đặc tính với thang đo khoảng mà thang đo có điểm không thực sự . Ví
dụ khi dùng thang đo vận tốc ( km/giờ ). Số km/giờ nói lên tốc độ chuyển động của
một vật ( ví dụ ôtô có vận tốc 50 km/giờ ) . Mỗi km/giờ chỉ sự gia tăng tốc độ theo
khoảng còn ở okm/giờ ôtô đứng yên. Trong lĩnh vực đo đánh giá nhận thức , thái độ,
năng lực, hành vi của một cá nhân trên thực tế không có điểm o thực sự mà là điểm o
tự đặt ( Arbitrary zero point )
Người ta cho rằng ít nhất là có năm trình độ/bậc chất lượng cần được định rõ
trong một thang đánh giá tốt với nhiều bậc, với những mô tả về ít nhất là 3 trong 5
bậc đó. Thêm vào, có 3 loại chủ yếu của thang đánh giá nhiều bậc để lựa chọn: số, đồ
hoạ và đồ hoạ mô tả.
Thang đánh giá bằng số: Ví dụ
5. Ưu tú, đạt được tất cả các tiêu chuẩn
4. Rất tốt, đạt được hầu hết các tiêu chuẩn
3. Tốt, đạt được một số tiêu chuẩn
2. Đạt, đạt được một số ít tiêu chuẩn
1. Kém, Không đạt tiêu chuẩn.
Trong thang đánh giá theo đồ hoạ
Mỗi tính chất được chia theo trên một đờng nằm ngang với s phân loại trả lời
được vạch trên đó. Các mức độ được tạo ra bằng cách đặt sự kiểm tra vào vị trí thích
hợp trên đờng kẻ trên nh trong ví dụ được chỉ ra sau đây.

Kém (Poor) Đạt ( Pass) Khá Tốt (Good) Ưu tú (Excellent)
Thang chia độ đồ thị mô tả cũng giống như đồ hoạ, ngoại trừ những sự mô tả
trên đó là những phác thảo ngắn gọn về hành vi của người học ở mỗi trình độ trên
thang. Ví dụ:
Cát viền rách Cắt viền đúng Cắt viền rất
3
hoàn toàn

hoặc không
phẳng, lệch
nống vân.
nống vải phẳng
nhng bị vài chỗ
không phẳng
hay tông nhẹ
mượt và phẳng
không rách
viền hay lệch
nống vải
1.3. Đánh giá ( Assesssment)
Đánh giá là quá trình thu thập thông tin, chứng cứ về đối tượng đánh giá và
đưa ra những phán xét, nhận định về mức độ đạt được theo các tiêu chí đã được đưa
ra trong các tiêu chuẩn hay kết quả học tập. Đánh giá có thể là đánh giá định
lượng( quantitative )dựa vào các con số hoặc định tính ( qualitative)dự vào các ý kiến
và giá trị
Đánh giá là sự phán xét trên cơ sở đo lường, kiểm tra, bao giờ cũng đi liền với
kiểm tra. Trong đánh giá, ngoài sự đo lường một cách khách quan dựa trên kiểm tra
(hay trắc nghiệm), còn có ý kiến bình luận, nhận xét, phê phán mang tính chủ quan để
tiến tới sự phán xét. Theo Tự điển Giáo dục học –NXB Tự điểm Bách khoa 2001
thuật ngữ đánh giá kết quả học tập được định nghĩa như sau: “ Xác định mức độ nắm
được kiến thức, kỹ năng, kỹ xảo của học sinh so với yêu cầu của chương trình đề ra “
Ta có thể hiểu kiểm tra đánh giá kết quả học tập là sự so sánh, đối chiếu kiến
thức, kỹ năng, thái độ thực tế đạt được ở người học để tìm hiểu và chuẩn đoán
( diagnostic ) trước và trong quá trình dạy-hoc (formative ) hoặc sau một quá trình
học tập với các kết quả mong đợi đã xác định trong mục tiêu dạy học( đánh giá kết
tthúc – summative )
Sản phẩm của hoạt động dạy- học, của lao động sư phạm trên lớp học, trong
phòng thí nghiệm, xưởng trường, bãi tập, vv rất đa dạng và phức tạp , rất khó xác

định. Bởi vì những sản phẩm dó là những người học đã thay đổi ít hoặc nhiều trong
phẩm chất và năng lực của họ sau một thời gian học tập nhất định hay nói cách khác
là đã có các giá trị ra tăng. Đó chính là kết quả học tập của người học, thành tố chủ
yếu tạo nên chất lượng của hoạt động dạy học trong nhà trường.
2.4. Trắc nghiệm
-Trắc nghiệm là một phép thử ( kiểm tra ) để nhận dạng, xác định, thu nhận
những thông tin phản hồi về những khả năng, thuộc tính, đặc tính ,tính chất của một
sự vật hay hiện tượng nào đó. ví dụ : trắc nghiệm đo chỉ số thông minh ( IQ ); trắc
nghiệm do thị lực mắt; trắc nghiệm do nồng độ cồn ở người lái xe; vv
Trắc nghiệm trong giảng dạy cũng là là một phép thử (một phương pháp kiểm
tra đánh giá ) nhằm đánh giá khách quan trình độ , năng lực cũng như kết quả học tập
của ngưòi học trước, trong quá trình và khi kết thúc một giai đoạn học tập nhất định (
phần hoặc bài giảng lý thuyết hoặc thực hành ); một chương hoặc một chương trình
đào tạo vv
Trắc nghiệm thường có các dạng thức sau : trắc nghiệm thành quả
( achievêmnt ) để đo lường kết quả, thành quả học tập của người học; trắc nghiệm
4
năng khiếu hoặc năng lực (aptitude ) để đo lưòng khả năng và dự báo tương lai.
Phương pháp trắc nghiệm có thể là khách quan ( objective ) hoặc chủ quan
( subjective )
II . VAI TRÒ, VỊ TRÍ VÀ MỤC ĐÍCH CỦA KIỂM TRA ĐÁNH GIÁ TRONG
QUÁ TRÌNH DẠY HỌC VÀ QUẢN LÝ GIÁO DỤC
2.1. Kiểm tra đánh giá quá trình dạy-học
Chất lượng và hiệu quả dạy -học phụ thuộc và nhiều yếu tố trước, trong và sau
quá trìnhđạy-học . Có thể nói rằng, quá trình dạy-học sẽ đạt được kết quả tốt nếu
người quản lý nhà trường và đội ngũ giảng viên nắm vững các quy luật vận động của
quá trình dạy học và giải quyết tốt mối quan hệ biện chứng giữa các nhân tố cấu
thành quá trình dạy-học như một chỉnh thể trọn vẹn. Với vị trí là một khâu của quá
trình dạy học, kiểm tra- đánh giá xác định mức độ đạt được mục tiêu của quá trình
dạy học và góp phần trực tiếp thúc đẩy và hoàn thiện quá trình dạy học ( xem hình 1)

Mục tiêu dạy học

Nội dung Phương pháp

Hình thức tổ chức Phương tiện
Kiểm tra- dánh giá
Hình 1. Cấu trúc các nhân tố của quá trình đào tạo
Mục đích của đánh giá trong quá trình dạy -học là :
1. Xác định kiến thức, kỹ năng và thái độ hiện có ở mỗi người học trước khi vào học.
Nhờ kiểm tra đánh giá, giáo viên biết được trình độ người học, những điểm
yếu của người trước khi vào học. Điều này rất quan trọng đối với các khoá học ngắn
hạn, bồi dưỡng nâng cao vì nó giúp giáo viên xác định được nhu cầu của người học
để có thể đề ra mục tiêu học tập sát hợp.
2. Thúc đẩy người học học tập, thông báo kịp thời cho ngưòi học biết tiến bộ của họ
trong quá trình dạy học.
- Trước hết là có tác dụng thúc bách người học học tập. Không có kiểm tra, thi
cử chắc là nhiều người học “không học” thật sự .
- Động viên, khích lệ người học học nhiều hơn, tốt hơn
5
- Chỉ cho người học thấy họ học tốt nội dung nào chưa tốt, nội dung nào cần
học thêm, học lại, v.v
3. Cải tiến việc dạy và việc học
Giáo viên cần biết rõ là nội dung đã được dạy và học đủ chưa, cần bổ sung cái
gì, phương pháp dạy học đã phù hợp chưa, cần hỗ trợ thêm cho ngưòi học nào, cần
được giúp thêm ở nội dung nào? Muốn biết rõ những điều đó và để có những quyết
định phù hợp, giáo viên phải căn cứ vào kiểm tra kết quả học tập.
.4. Xác nhận hoặc chứng nhận trình độ, năng lực của ngưòi học( đánh giá quá trình
và kết quả học tập )
Kiểm tra đánh giá nhằm khẳng định năng lực của ngưòi học có tương xứng với
bằng cấp, chứng chỉ, đặc biệt là với chức năng, nhiệm vụ mà người học tốt nghiệp sẽ

phải đảm nhận hay không.
Để chứng nhận trình độ, năng lực của người tốt nghiệp, trong kiểm tra đánh giá
theo lối truyền thống lâu nay, người ta thường chú trọng kiểm tra đánh giá bằng một
kỳ thi cuối khoá. Làm như vậy cho kết quả không chính xác. Điều quan trọng là phải
xác định được một hệ thống kiểm tra đánh giá phù hợp bao gồm từ quy chế thi và
kiểm tra, tiêu chí kiểm tra đánh giá, hình thức kiểm tra đánh giá, loại công cụ, câu hỏi
thích hợp, số lượng câu hỏi, cách xác định điểm đạt, mức đạt, v.v
2.2. Quản lý và kiểm tra đánh giá trong quản lý giáo dục.
Kiểm tra-đánh giá cũng là một khâu quan trọng của quá trình quản lý nói
chung và quản lý giáo dục nói riêng. Theo từ điển Tiếng Việt thông dụng- NXB Giáo
dục-1998 thuật ngữ quản lý được định nghĩa là : "Tổ chức, điều khiển hoạt động của
một đơn vị, cơ quan"
Quản lý là một hoạt động có chủ đích , được tiến hành bởi một chủ thể quản lý
nhằm tác động lên khách thể quản lý để thực hiện các mục tiêu xác định của công tác
quản lý . Trong mỗi chu trình quản lý chủ thể tiến hành những hoạt động theo các
chức năng quản lý như xác định mục tiêu, các chu trương, chính sách; hoạch định kế
hoạch , tổ chức chỉ đạo thực hiện, điều hoà, phối hợp , kiểm tra, đánh giá và huy
động, sử dụng các nguồn lực cơ bản như tài lực, vật lực, nhân lực vv để thực hiện
các mục tiêu, mục đích mong muốn trong bối cảnh và thời gian nhất định
Chung quanh khái niệm quản lý còn có rất nhiều định nghĩa khác nhau.
- F.W TayLor cho rằng: “ Quản lý là biết chính xác điều bạn muốn người khác
làm và sau đó thấy rằng họ đã hoàn thành công việc một cách tốt nhất và rẻ nhất”.
- Còn H.Koontz thì lại khẳng định : “Quản lý là một hoạt động thiết yếu, nó
đảm bảo phối hợp những nỗ lực hoạt động cá nhân nhằm đạt được các mục đích của
nhóm (tổ chức). Mục tiêu của quản lý là hình thành một môi trường mà trong đó con
người có thể đạt được các mục đích của nhóm với thời gian, tiền bạc, vật chất và sự
bất mãn cá nhân ít nhất.” .v.v
6
Từ quan niệm của các học giả đã nêu, chúng ta có thể khái quát lại: "Quản lý
là hoạt động có ý thức của con người nhằm phối hợp hành động của một nhóm người

hay một cộng động người để đạt được các mục tiêu đề ra một cách hiệu quả nhất”.
Trong quản lý có các hoạt động tác nghiệp cụ thể được gọi là quản trị. Khái
niện Quản trị ( Administation) được hiểu là : “ Những hoạt động phát sinh từ sự tập
hợp của nhiều người một cách có ý thức để nhằm hoàn thành những mục tiêu chung “
.Sự tập hợp con người thành tổ chức là môi trường và đối tượng của công việc quản
trị . Như vậy , bất kỳ một tổ chức nào : văn hoá, xã hội, giáo dục, quân sự , hành
chính vv đều cần có sự quản lý nói chung và quản trị trong đó có nhiều chức năng,
nhiệm vụ cần được vạch ra cụ thể và có sự điều hành, phân công, phân nhiệm cho
từng bộ phận, cho tưng thành viên trong tổ chức. Như vậy khái niệm quản trị có thể
hiểu là một khâu, một thành phần của quản lý gắn cụ thể với một tổ chức và nặng về
thừa hành , tác nghiệp, điều hành các hoạt động cụ thể của một tổ chức. Quản lý có
tầm rộng và bao quát hơn cả về mô hình tổ chức, tầm nhìn và chiến lược phát triển
của tổ chức vv
Theo Gulích và Urwich công tác quản trị có 7 chức năng chủ yếu sau ( viết tắt
là POSCORB : Planning ( kế hoạch); organizing (Tổ chức ) ;Staffing ( nhân sự );
Coordinating ( Phối hợp) ; Reviewing ( Kiểm tra); Budgetting ( Tài chính )
Những chức năng trên là phổ biến với mọi nhà quản lý, quản trị của một tổ
chức song có sự khác nhau ở mức độ tầng cấp quản lý . Sự phân phối thời gian và
công sức cho các chức năng quản trị của các cấp được thể hiện trong bảng sau :
STT Cấp quản lý Kế hoạch Tổ chức Điều
khiển
Kiểm tra Ghi chú
1 Cao cấp 28% 36% 22% 14%
2 Trung gian 18% 33% 36% 13%
3 Cơ sở 15% 24% 51% 10%
Nguồn : Quản trị học. Đào Duy Huân- NXB Thống kê, 1996.
III. CÁC LOẠI VÀ YÊU CẦU CỦA KIỂM TRA ĐÁNH GIÁ KẾT QUẢ
HỌC TẬP
3.1. Phân loại kiểm tra đánh giá
- Về mặt hình thức, đánh giá kết quả học tập có hai loại là:

a/ Đánh giá hình thành (Formative Assessment) (còn được gọi là Kiểm tra đánh giá
thường xuyên)
Đây là loại hình là kiểm tra đánh giá từng bước một cách chính thức hoặc cũng
có thể không chính thức, "đi kèm" với quá trình hình thành kiến thức, kỹ năng, kỹ xảo
7
và thái độ ở người học , cung cấp những thông tin phản hồi nhanh để kịp thời bổ cứu
ở mỗi giai đoạn cần thiết của sự phát triển trong suốt quá trình học tập. Kiểm tra đánh
giá hình thành được thực hiện thường xuyên trong quá trình dạy học và định kỳ cuối
mỗi chương, phần hoặc cuối học kỳ, cuối năm học vv
Lợi ích của loại hình kiểm tra này là :
- Do có nhiều lần kiểm tra nên sai sót trong một giai đoạn được bổ cứu kịp thời,
đảm bảo ngưòi học đạt được kết quả học tập chung cuối cùng
- Loại bỏ được những lo âu, căng thẳng trong một kỳ thi cuối khoá duy nhất
- Thúc đẩy người học nỗ lực học tập thường xuyên trong cả khoá
- Giáo viên có cơ sở để điều chỉnh phương pháp dạy học và giúp đỡ người học
kịp thời.
B/ Đánh giá kết thúc (Summative Assessment). (còn được gọi là Kiểm tra đánh giá
tổng kết)
Được thực hiện vào cuối môn học lý thuyết, thực hành hoặc một môđun và
cuối khoá học
- Dựa vào mục tiêu học tập của môn học hoặc môđun và mục tiêu đào tạo của
khoá học
- Phải kiểm định được toàn bộ mục tiêu đã đật ra, phản ánh đúng năng lực
thực sự của người học
- Nếu thực hiện việc đánh giá một cách thường xuyên trong suốt cả khoá học
thì đánh giá kết thúc trở nên nhẹ nhàng hơn.
- Về tính chất, có hai loại kiểm tra đánh giá:
a/ Kiểm tra đánh giá đối chiếu hay theo chuẩn tương đối
(Norm Referenced Assessment)
Đây là loại kiểm tra đánh giá có tính chất tương đối, chủ yếu là so sánh kết quả

học tập giữa các ngưòi học với nhau. Loại này phù hợp với việc thi tuyển, lựa chọn
một số lượnh nhất định những người tốt nhất trong số người học dự thi.
B/ Kiểm tra đánh giá theo tiêu chí (Criterion Referenced Assessment)
Đây là loại kiểm tra đánh giá có tính chất tuyệt đối, đánh giá kết quả học tập của
từng người học đạt được thực tế so với các tiêu chí đã đề ra. Dù người học chỉ không
đạt được một tiêu chí nào đó thôi thì người học vẫn phải học lại bài đó, môđun đó để
thi, kiểm tra lại.
3.2. Những yêu cầu của kiểm tra đánh giá
3.2.1. Độ tin cậy (Reliability)
Độ tin cậy được sử dụng để nói về sự chính xác (Precision) của việc đo
đạc.Chúng liên quan đến việc đo cái gì và đã đo như thế nào, thông tin đem lại có
đúng mục đích đo đạc đã nêu ra không. Nói đơn giản, độ tin cậy chỉ cho ta biết
8
khoảng cách, sai số hay sai lệch giữa kết quả với mục đích đo đạc nêu ra. Độ tin cậy
của bài trắc nghiệm chính là đại lượng biểu thị mức độ chính xác của phép đo nhờ
bài trác nghiệm.
Kiểm tra đánh giá để giúp cho nhận định, phán xét về kết quả học tập của
người học không thể chỉ căn cứ vào một vài câu hỏi của bài kiểm tra mà còn phải
nhận định, đánh giá hay phán xét về sự phát triển trong quá trình hoặc khả năng của
người học bởi vì những bài làm và câu hỏi kiển tra đó có thể được sao chép hoặc học
thuộc lòng từ một bài làm có sẵn. Do đó cần phải tập hợp đầy đủ những quan sát
tương tự để tăng thêm độ tin cậy của việc đo lường, đánh giá .
Độ tin cậy phụ thuộc vào sai số của đo đạc, càng hạn chế được sai số thì càng
làm tăng độ tin cậy. Sai số này có thể là do sinh viên, do sử dụng bài kiểm tra, do
công cụ đo, do quản lý kiểm tra - đánh giá. Cần tìm cách biết được sai số này để làm
tăng giá trị của thông tin đánh giá.
- Sai số nảy sinh từ người học do họ thiếu động lực khi làm bài kiểm tra, do
những kinh nghiệm trước đó đã không giúp ích gì cho họ, do lo lắng về kết quả kiểm
tra, do tình trạng tâm sinh lý không ổn định, bất thường chẳng hạn như buồn bực, ốm
đau hoặc do không được chuẩn bị làm bài kiểm tra.

- Sai số do công cụ kiểm tra. Ví dụ trong trắc nghiệm đa phương án có các câu
hỏi chứa đựng các từ mơ hồ, không rõ ràng, không sáng sủa có thể hiểu theo nhiều
cách, những thông tin không được liên hệ với nhau, thang phân loại không rõ hoặc
không đúng với tên gọi, những câu hỏi nêu ra so với mục tiêu chưa phải là đặc trưng,
thích hợp.
Những nội dung bài giảng, những điều giải thích, hướng dẫn có ý nghĩa khác
nhau đối với từng người học . Một câu hỏi về dòng điện chạy qua dây dẫn có yêu cầu
khác nhau giữa môn vật lý và môn kỹ thuật điện, dẫn đến điểm kiểm tra khác nhau
đối với bài kiểm tra hai môn này. Vì vậy từng câu hỏi, từng câu hướng dẫn cần được
lựa chọn cẩn thận trong từng bài kiểm tra.
Những phần về cảm xúc trong mục tiêu giáo dục thường không rõ ràng và khó
đo đạc, do đó khi đo sẽ phạm sai số lớn hơn khi đo phần nhận thức trong môn học.
Sự khác nhau về độ tin cậy cũng có thể liên quan đến sự đo đạc nội dung môn
học. Trong thực tiễn, các mục tiêu của quốc gia thường là mờ và khó đo đạc bằng các
phương pháp kiểm tra đánh giá.
Sai số cũng có thể do điều kiện quản lý bài kiểm tra về cả thủ tục lẫn sản
phẩm. Các nhà nghiên cứu giáo dục mong muốn không có sự khác nhau về điều kiện
quản lý vì đó là nguyên nhân làm nhiễu các kết quả học tập, tác động rất xấu đến
động lực học tập của sinh viên và tác hại đến kết quả giảng dạy.
Các dạng độ tin cậy
Có bốn dạng độ tin cậy khi xem xét tổng quan các dụng cụ đo đã được tiêu
chuẩn hoá:
9
- Dạng thứ nhất: Tin cậy về tính ổn định (Stability) của kết quả kiểm tra hàng
năm. Nếu như lặp lại kiểm tra với cùng một loại sinh viên thì kết quả điểm số của nó
cũng tương tự như điểm số kiểm tra trước đó một thời gian ngắn. Cả trắc nghiệm theo
chuẩn và theo tiêu chí, xét về tính ổn định đều có thể cho kết quả với độ tin cậy cao.
- Dạng thứ hai: Tin cậy về sự tương đương (Equivalence). Kết quả kiểm tra
đối với một tập hợp sinh viên sẽ tương đương nếu ta thay bằng đề thi khác nhau trong
cùng một bộ đề được soạn theo cùng bảng đặc tính.

- Dạng thứ ba: Tin cậy về sự đồng nhất (Homogeneity). Kết quả kiểm tra đánh
giá sẽ tương tự cho cùng đối tượng nếu ta thay đổi bài kiểm tra.
- Dạng thứ tư: Tin cậy cùng loại (Interrater Reliability). Công việc của người
học phù hợp với độ đo cùng thang kiểu đánh giá nghệ thuật hay thang phân loại kiểu
đánh giá tác phẩm văn chương.
Trong thống kê, độ tin cậy được gọi là hệ số tin cậy. Nếu kết quả đo có độ tin
cậy 1 thì có nghĩa là hoàn toàn tin tưởng, và có độ tin cậy 0 nghĩa là không tin tưởng
một chút nào. Khi tiến hành kiểm tra, đề kiểm tra nếu đạt độ tin cậy từ 0,6 trở lên là
có thể chấp nhận được, đối với cá nhân đòi hỏi độ tin cậy cao hơn, từ 0,7 trở lên.
Khi tính toán độ tin cậy cho phù hợp, chúng ta sử dụng hai công thức khác
nhau. Nếu trong các câu hỏi ta yêu cầu sinh viên trả lời riêng biệt là đúng hay sai thì
ta áp dụng công thức Kuder- Richardson số 20 mà nhiều tài liệu đã nói đến (xem Trắc
nghiệm và đo lường cơ bản trong giáo dục của Patric-Griffin, 1995) để tính độ tin cậy
nội tại. Nếu trong các phương án trả lời có nhiều hơn một câu đúng thì ta tính hệ số
tin cậy theo công thức của Cronbach.
Các phương pháp xác định độ tin cậy
Có nhiều phương pháp để xác định độ tin cậy của bài kiểm tra.
Thứ nhất: Phương pháp kiểm tra – kiểm tra lại
Phương pháp này đòi hỏi hai lần tiến hành cùng một bài kiểm tra cho cùng một
nhóm học sinh và tính toán độ tương quan giữa hai bộ điểm số thu được. Tuỳ thuộc
vào bản chất của bài kiểm tra và khoảng thời gian giữa hai lần kiểm tra mà độ tin cậy
có thể sẽ bị ảnh hưởng ở một mức độ nào đó bởi các nhân tố thuộc về người học
(thay đổi về động cơ, tích luỹ thêm hay quên bớt một số điều v.v…). Nhược điểm
chính của phương pháp này là phụ thuộc vào khoảng thời gian giữa hai lần kiểm tra.
Thứ hai: Phương pháp dùng bài kiểm tra tương đương
Đòi hỏi tiến hành hai bài kiểm tra có dạng tương đương nhau trên cùng một
nhóm sinh viên và tính toán hệ số tương quan giữa hai bộ điểm số thu được. Cả hai
bài kiểm tra này được tiến hành trong những thời điểm gần nhau nên độ tương quan
thu được ít bị ảnh hưởng bởi các yếu tố thuộc về người học nói trên.
Phương pháp dùng bài tương đương thông dụng hơn phương pháp kiểm tra lại,

tuy nhiên việc xây dựng được hai bài kiểm tra tương đương về nội dung, về các đặc
điểm của câu hỏi thì khó hơn.
10
Thứ ba: Phương pháp phân nhỏ (phương pháp phù hợp nội tại)
Phương pháp này đòi hỏi ước lượng hệ số tin cậy từ việc phân tích các điểm
chấm của một lần kiểm tra, do vậy việc đánh giá độ tin cậy không phải tính đến các
nhân tố thay đổi theo thời gian. Một trong những cách để thực hiện phương pháp này
là phân chia bài kiểm tra thành hai phần tương đương nhau về tính chất, nội dung, độ
khó của câu hỏi. Thông thường các câu hỏi đánh số chẵn được ghép thành một bộ,
các câu hỏi đánh số lẻ được ghép thành một bộ, tính hệ số tương quan giữa hai bộ
điểm số của hai nửa bài kiểm tra theo phương pháp thông thường.
Một trong những khó khăn của cách tính này là do sự phân đôi theo cách khác
nhau nên giá trị thu được có thể khác nhau về hệ số tương quan, mặt khác hệ số tương
quan này thực ra là hệ số tương quan của nửa bài kiểm tra.
Những yếu tố ảnh hưởng đến độ tin cậy
Quá trình kiểm tra chịu ảnh hưởng của rất nhiều yếu tố, những yếu tố cơ bản
ảnh hưởng đến độ tin cậy là:
- Những yếu tố may rủi:
Đối với những câu hỏi loại đúng – sai (2 lựa chọn) thì yếu tố may rủi cao hơn
so với loại câu nhiều lựa chọn. Tuy nhiên, nhiều chuyên gia cho rằng không nên áp
dụng công thức sửa chữa việc đoán mò vì công thức này thường chỉ dùng đối với loại
trắc nghiệm tốc độ.
- Tính chất khó dễ của bài kiểm tra:
Bài quá dễ, các điểm số có khuynh hướng tập trung vào đầu cao của thang
điểm; bài quá khó, các điểm số sẽ tập trung vào phía đầu thấp của thang điểm. Điểm
số không trải rộng nên khó thấy được sự khác biệt trong kết quả học tập.
- Độ dài bài kiểm tra:
Bài càng dài thì độ tin cậy càng cao (trong giới hạn chưa gây mệt mỏi và chán ngán).
Những yêu cầu để gia tăng độ tin cậy
Cùng với việc đưa ra các yếu tố ảnh hưởng đến độ tin cậy, một số tác giả có đề

cập tới những điều cần thiết có thể làm gia tăng độ tin cậy cho bài kiểm tra. Đó là:
- Hạn chế sử dụng các câu hỏi có ít lựa chọn để giảm các yếu tố may rủi đến
mức tối đa.
- Bài kiểm tra nên có độ dài phù hợp.
- Các câu hỏi cần đảm bảo được yêu cầu về độ khó và độ phân biệt.
- Các chỉ dẫn cho việc làm bài cần rõ ràng để sinh viên khỏi nhầm lẫn.
3.2.2. Độ giá trị (Validity)
Độ giá trị nói lên rằng các phương pháp và dụng cụ đo đạc cho phép thu được
những thông tin cần phải có, đo được cái ta định đo, tức là mức độ đạt được mục đích
đó. Việc đo chỉ có giá trị khi ta biết rõ ta đo lường cái gì, ở nhóm người nào. Phép đo
11
bằng bài trắc nghiệm đạt được mục đích đo lường là phép đo có giá trị. Đội giá trị của
bàI trắc nghiệm là đại lượng biểu thị mức độ đạt được mục tiêu đề ra cho phép đo nhờ
bàI trắc nghiệm.
Độ giá trị của kiểm tra đánh giá không thể đi vay mượn mà phải phù hợp với
nội dung và phải có phương pháp thích hợp, nghĩa là không thể có phương pháp đúng
cho tất cả mọi trường hợp mà chỉ đúng tùy người sử dụng nó. Một bài kiểm tra có thể
là chứng cứ về giá trị cho kết quả dạy học của trường đại học này mà không thể là
chứng cứ cho một trường đại học khác. Chẳng hạn Toán thống kê dùng trong trường
Đại học Kinh tế có yêu cầu khác với Toán thống kê của trường Đại học Bách khoa.
Theo truyền thống người ta nói đến:
1. Các độ giá trị bề mặt;
2. Độ giá trị liên quan đến tiêu chí;
3. Độ giá trị về nội dung;
4. Độ giá trị về cấu trúc
Năm 1989, Messick nêu ra 6 loại độ giá trị:
Loại thứ nhất: Giá trị thích hợp và tiêu biểu về nội dung. Đó là giá trị về mức
độ bao trùm nội dung của môn học, bài học cần kiểm tra. Các câu hỏi trong bài kiểm
tra phải là mẫu tiêu biểu cho tổng thể nội dung chương trình. Về mặt này thì với một
số câu hỏi kiểm tra theo dạng tự luận sẽ khó đạt được độ giá trị cao so với một số

lượng lớn các câu hỏi theo dạng trắc nghiệm lựa chọn đa phương án.
Để chứng minh về độ giá trị này người ta phải lập bảng miêu tả chúng, trong
đó chỉ ra ở bài kiểm tra chúng ta kiểm tra sự nắm vững môn học qua những câu hỏi
nào.
Loại thứ 2: Giá trị những chứng cứ cấu trúc trong của bài kiểm tra chỉ ra các
câu hỏi kiểm tra đã bao phủ hầu hết nội dung giảng dạy cũng như mức độ bao phủ
của các câu hỏi kiểm tra ở các trình độ từ dễ đến khó.
Loại thứ 3: Giá trị của những chứng cứ về cấu trúc ngoài của bài kiểm tra.
Đây là điều rất cần thiết để so sánh điểm của bài kiểm tra với các cách đo khác có liên
quan.
Loại thứ 4: Giá trị của những chứng cứ về sự trung thực trong quá trình kiểm
tra nói lên điểm và thang phân loại qua kiểm tra có phản ánh đúng thực chất. Khi đó
người xây dựng bài kiểm tra tin tưởng rằng sinh viên ít có điều kiện gian dối khi làm
bài kiểm tra.
Loại thứ 5: Giá trị của những chứng cứ về sự tương tự cũng như sự khác
nhau qua nhiều lần tiến hành và với các nhóm người làm bài kiểm tra.
Loại thứ 6: Giá trị chứng cứ về những mối liên quan của kiểm tra đánh giá
với hệ quả xã hội mà việc thi cử, kiểm tra gây ra.
Đây là những cơ sở giúp cho việc xây dựng qui trình kiểm tra.
12
Trong quá trình lựa chọn các phương pháp cũng như các công cụ kiểm tra, bên
cạnh sự quan tâm đến mục tiêu của chương trình, kiểm tra đánh giá còn phải chú ý
đến sự công bằng và bình đẳng giữa các sinh viên, thể hiện ở độ tin cậy và độ giá trị.
Theo truyền thống, độ tin cậy phải được xem xét trước hết bởi vì giá trị của
kiểm tra đánh giá bị giới hạn bởi sự chính xác của nó. Mặt khác độ giá trị lại bị hạn
chế bởi độ tin cậy của kiểm tra. Một bài kiểm tra muốn có giá trị thì phải có độ tin
cậy. Nếu bài kiểm tra, bài thi có độ tin cậy thấp thì việc kiểm tra đó không thể dẫn
đến một kết quả gì cả về nội dung cũng như dự báo. Vì vậy, khi kiểm tra kết quả học
tập cần quan tâm đến độ tin cậy.
IV. CÁC KIỂU DẠY HỌC VÀ PHƯƠNG PHÁP KIỂM TRA ĐÁNH GIÁ

4.1. Đặc điểm các kiểu dạy-học
Việc kiểm tra đánh giá phải theo cách thức giảng dạy và học tập. Quá trình
phát triển của giáo dục cho thấy có ba cách dạy và học: Kiểu sao chép, kiểu học tập
có phân tích, phê phán và kiểu học tập có tìm hiểu, sáng tạo (bảng 1)
Bảng 1: Đánh giá theo các kiểu dạy - học
KIỂU SAO CHÉP KIỂU PHÂN TÍCH KIỂU SÁNG TẠO
Phươn
g pháp
Đọc bài và ghi chép.
Giải quyết các bài
toán mang tính giả
định.
Cung cấp thông tin.
Thảo luận nhóm.
Giao bài tập và nhiệm
vụ cho từng cá nhân.
Khảo sát điển hình.
Học xử lý theo tình
huống.
Thảo luận, nêu và giải
quyết những vấn đề mới.
Nghiên cứu, tìm tòi, thử
nghiệm, khám phá, tự đề
xuất các phương pháp và
các phương án, giả thiết.
Các
hoạt
động
Tóm tắt, mô tả, phân
tích, xác định và áp

dụng những công
thức và thông tin đã
có.
Chất vấn, đánh giá, kiểm
tra, chứng minh quyết
định và tổng hợp các ý
kiến và thông tin thành
những cơ sở lập luận.
Tìm tòi, thu thập, lập
luận, giả thiết tổng hợp,
đánh giá và sáng tạo ra
các ý kiến và thông tin
mới.
Các
câu hỏi
đặc
trưng
Cái gì?
Như thế nào?
Tại sao? Trên cơ sở nào?
Mức độ quan trọng.
Tại sao? Cái gì? Xảy ra
nếu ? Có cái gì khác
nữa không? Tại sao lại
không?
13
Kiểm
tra kết
quả
Những năng lực và

kỹ năng về nhớ và
sao chép lại.
Nhớ, bắt chước, sao
chép.
Những kỹ năng về phê
phán và các năng lực
phân tích. ứng biến, cách
tân.
Những kỹ năng để đổi
mới và những năng lực
cần thiết để tự phát triển.
Tự tìm hiểu những
phương thức, giải pháp.
Sáng tạo và phát minh.
Thái
độ
được
hình
thành
Có khuynh hướng
sao chép và giữ
nguyên hiện trạng
chấp nhận những mô
hình có sẵn.
Có khuynh hướng thể
hiện cá nhân một cách
đơn giản và xử lý các tư
liệu sẵn có theo các hình
thức khác nhau. Có xu
hướng thích ứng và hoàn

thiện các mô hình hiện
có.
Có xu hướng thể hiện
sáng tạo trong suy nghĩ
tạo ra những ý kiến độc
đáo và cách tiếp cận hoàn
toàn mới. Có xu hướng
triển khai các mẫu hình
mới.
4.2. Các phương pháp đánh giá kết quả học tập
(Xem sơ đồ sau)
. Các loại câu hỏi trắc nghiệm sau đây được xem là khách quan:
- Lựa chọn đa phương án
- Ghép đôi
- Điền khuyết
- Đúng - sai
Việc cho điểm các câu hỏi này là khách quan vì người cho điểm là giáo viên
không cần phải dùng sự lượng giá nào để xác định xem liệu người học trả lời như
14
Các phương pháp KT-ĐG
Quan sát Viết
Vấn đáp
TN tự luận TN khách quan
Diễn
giải
Tiểu
luận
Luận
văn
MCQ

Đ-S
Điền
khuyết
Ghép
đôi
vậy là đúng hay sai. Các câu trả lời của người học có thể chỉ đơn giản được so sánh
với đáp án có sẵn.
Các loại trắc nghiệm khác được gọi là chủ quan vì chúng đòi hỏi sử dụng số l-
ợng giá, phán xét và diễn giải trong việc cho điểm. Đó là các loại câu hỏi trắc
nghiệm:
- Tự luận
- Trả lời miệng.
Có sự khác biệt cơ bản trong các câu hỏi trắc nghiệm. Một số câu đòi hỏi người
học phải cung cấp câu trả lời lấy từ trí nhớ của họ (tài liệu). Cả hai loại trắc nghiệm
chủ quan nói trên đều là trắc nghiệm cung cấp chỉ có một loại trắc nghiệm điền
khuyết là loại đòi hỏi người học phải điền vào chỗ trống hoặc trả lời ngắn (từ, số, ký
hiệu ) lấy từ trí nhớ (tái hiện).
Các loại trắc nghiệm khách quan khác đều là loại lựa chọn, người học phải lựa
chọn câu trả lời đúng từ 2 hay nhiều phương án có thể cho trước . Các loại trắc
nghiệm này kiểm tra khả năng của người học trong việc nhận ra những thông tin
đúng, trong khi đó các kiểu trắc nghiệm cung cấp kiểm tra khả năng trong việc tái
hiện, nhớ lại thông tin đúng.
4.3. So sánh các phương pháp đánh giá
STT Phương pháp đánh giá Mức độ phán xét
( Judgement )
Thời gian cần thiết để
thiết kế bài đánh giá
(The time required )
1 Câu hỏi lựa chọn (Multiple
choice )

Rất ít phán xét Cần rất nhiều thời gian
2 Bài kiểm tra hoàn thành
câu ( Sentence completion
test )
ít phán xét Cần nhiều thời gian
3 Bài kiểm tra trả lời ngắn
( Short answer test )
Một vài phán xét thời gian vừa phải
4 Bài viết có chủ đề chặt chẽ
(Structrured essay )
Nhiều phán xét Cần ít thời gian
5 Bài kiểm tra mở ( Open-
ended esay
Rất nhiều phán xét Cần rất ít thời gian
4.4. So sánh đánh giá trắc nghiệm và tự luận
STT Đánh giá bằng câu hỏi Đánh giá bằng
15
tự luận trắc nghiệm
1 Câu hỏi áp đặt : Trình bày; Nêu;
là gì ? Thế nào ?
Câu hỏi hành động : Lựa chọn; Hãy quan
sát và nhận dạng; Tìm mối quan hệ vv
2 Thời gian dài : 5; 10; 15 phút Thời gian ngắn 1,2,5 phút
3 Yêu cầu chủ yếu học sinh phải
nghi nhớ, trình bày theo bài học;
thụ động
Yêu cầu học sinh hiều và vận dụng là chủ
yếu; tạo cơ hội bộc lộ cá tính; sáng tạo; chủ
động
4 Nội dung đơn giản; bó hẹp trong

bài giảng
Nội dung đa dạng; phong phú
5 Đánh giá được ít học sinh
trong thời gian ngắn
Đánh giá được nhiều học sinh trong thời
gian ngắn
6 Không có khả năng đoán mò Dễ xẩy ra đoán mò ( Xác xuất đoán mò tuỳ
theo loại trắc nghiệm )
7 Dễ ra các câu hỏi kiểm tra Cần nghiên cứu, thử nghiệm trắc nghiệm
8 Không kích thích tâm lý tích
cực; sáng tạo của học sinh
Có khả năng kích thích tính sáng tạo; hứng
thú của học sinh
9 Chủ yếu kiểm tra, đánh giá theo
cá nhân .Không tạo cơ hội làm
việc theo nhóm
Tạo nhiều cơ hội thảo luận, làm việc, làm
bài kiểm tra theo nhóm
4.5. Các yêu cầu làm trắc nghiệm
1. Trắc nghiệm kiểm tra đánh giá là một bộ phận cấu thành nội dung của quá
trình đào tạo nói chung và bài giảng nói riêng
2. Trắc nghiệm kiểm tra đánh giá được thực hiện liên tục thường xuyên trước,
trong và kết thúc quá trình dạy- học hay bài giảng .
3. Trắc nghiệm kiểm tra đánh giá mang tính tự thực hiện việc kiểm tra - đánh
giá và tự điều chỉnh quá trình học tập của người học .
4. Trắc nghiệm kiểm tra đánh giá hướng tới việc khuyến khích và giúp người
học củng cố , nắm vững nội dung học tập., tự đánh giá kết quả học tập
5. Trắc nghiệm kiểm tra đánh giá mang tính đơn mục tiêu . Mỗi một Trắc
nghiệm kiểm tra - đánh giá chỉ nhằm xác định được mức độ nhận thức ( kiến thức )
hoặc mức độ hình thành kỹ năng với một nội dung cụ thể .

16
6. Trắc nghiệm kiểm tra đánh giá phải có khả năng đo đếm, lượng giá, quan
sát hoặc mô tă được ( Định tính và định lượng )
7. Kết quả trắc nghiệm là nguồn thông tin phản hồi để đánh giá, nhận xét điều
chỉnh, hoàn thiện hoạt đông dạy học.
4.6. Các nguyên tắc và căn cứ để thiết kế trắc nghiệm
1. Việc lựa chọn kiểu, loại dạng trắc nghiệm và độ khó của nó phụ thuộc vào
mục tiêu học tập ( mục tiêu thực hiện ) của từng bài học, phần học ; vào quỹ thời gian
để đánh giá ; vào tính chất , đặc điểm nội dung học tập ; vào trình độ và năng lực của
chính giáo viên và học sinh.
2. Thiết kế trắc nghiệm để dánh giá xác định ( đo ) mức độ đạt được của người
học về kiến thức, kỹ năng và thái độ có thể theo thang phân loại sau :
CÁC MỨC ĐỘ NẮM VỮNG KIẾN THỨC
Trình độ Định nghĩa Sự thực hiện Ghi
chú
1. Biết Nhắc lại các sự kiện, khái
niệm, tri thức
-Có thể nhắc lại một định luật, nói
lại, mô tả các thuộc tính, tính chất
của một sự vật, hiện tượng
2 Hiểu Nắm được bản chất; đặc
tính ; nguyên lý , quy luật
- Có thể so sánh, đối chiếu, thực
hiện các tính tính toán theo công
thức
3.Vận dụng thể hiện khả năng sử dụng
hiểu biết, tri thức vào các
tình huống cụ thể
- Tính toán theo công thức
- Đọc được bản vẽ

- Giải thích được hiện tượng, biết
được nguyên nhân
- Lựa chọn, tìm mối quan hệ
4.Phân
tích/tổng
hợp
thể hiện khả năng phân tích
các sự kiện , hiện tượng và
khái quá hoá, tổng hợp hoá
- Phân tích mạch điện
- Phân tích các đặc tính của một
loại vật liệu
-Hệ thống hoá và phân loại vật
loệu
5. Đánh giá Vận dụng tri thức vào thực
tế một cách sâu sắc . Làm
chủ tri thức
- Đánh giá chất lượng vật liệu, sản
phẩm
- Đánh giá tính hợp lý của các hoạt
động, quy trình
6.Sáng tạo Phát triển hệ thống tri thức
trong các điều kiện và hoàn
17
cảnh mới
CÁC MỨC ĐỘ HÌNH THÀNH KỸ NĂNG
Trình độ Đặc trưng Khả năng thực hiện Ghi
chú
1. Bắt chước Quan sát hình thành
biểu tượng và sao

chép, dập khuôn
Thực hiện các thao động tác theo
như thao tác mẫu
-Thụ động, kém tự tin
2.Làm được ( kỹ
năng cơ bản bước
đầu )
Quan sát và có khả
năng thực hiện công
việc độc lập như
chậm., cần có sự hỗ
trợ
-Tự chủ, tự tin khi thao tác, thực
hiện các kỹ năng.
-thực hiện được các kỹ năng cơ
bản, không phức tạp
-Chưa tạo được mói liên hệ, phối
hợp giữa các kỹ năng
3. Làm chính xác
( kỹ năng thực hiện
độc lập )
Quan sát và có khả
năng thực hiện công
việc độc lập chính
xác
-Thao , động tác chuẩn mực, chính
xác
-Tạo được sự liên tục khi thực
hiện công việc
4.Làm biến hoá ( kỹ

xảo tổng hợp )
Quan sát và có khả
năng thực hiện công
việc độc lập nhanh
và chính xác
- Bảo đảm tốc độ làm việc
- . Thao tác và động tác chuản mực
- Xử lý linh hoạt tìmh huống
-Kết hợp nhiều loại kỹ năng
5.Làm thuần thục,
tự động hoá ( kỹ
xảo bậc cao )
- Thực hiện công việc không
cần sự kiểm soát thường
xuyên của ý thức ( Tự động
hoá )
- Mang tính sáng tạo
- Kiểm tra đánh giá kiến thức
Mục đích kiểm tra đánh giá kiến thức là xác định xem hoc sinh đã biết gì, ở
mức độ nào trong các nội dung đã học.Tuỳ theo mục tiêu học tập mà có những mức
độ yêu cầu khác nhau từ đơn giản nhất là tái hiện được (kể được, mô tả được, trình
bày được), đến áp dụng được, so sánh, phân tích, giải thích, Trong thực tế nghiên
cứu xã hội nói chung và nghiên cứu giáo dục nói riêng còn có nhiều nội dung cần đo
lường và đánh giá như đo lường, đánh giá năng lực trí tuệ , trí thông minh ( IQ ) vv
- Kiểm tra đánh giá kỹ năng
18
Mục đích kiểm tra đánh giá kỹ năng là xác định xem người học đã làm được
gì ở mức độ nào trong các nội dung đã học.Mức độ yêu cầu người học làm được
cũng từ đơn giản nhất là bắt chớc được đến làm đúng, chuẩn xác rồi đến làm nhanh
và thành thạo.

- Kiểm tra đánh giá thái độ
Kiểm tra đánh giá thái độ nhằn xem xét ngưòi học có cách ứng xử, cách biểu lộ
tình cảm, hứng thú, cách bộc lộ những phẩm chất nhân cách như thế nào trước một sự
kiện, hiện tượng, trước công việc, trước đồng nghiệp,
Kiểm tra đánh giá thái độ là khó nhất vì điều mà giáo viên biết được chỉ là
“phần nổi của tảng băng”. Còn “giá trị thực” của người học thì được xác định một
cách chính xác không thể qua vài lần kiểm tra đánh giá mà phải qua cả quá trình t-
ương đối lâu dài. Vì vậy, giáo viên cần kết hợp giữa việc theo dõi, giám sát thường
xuyên với kết quả của những đợt kiểm tra đánh giá định kỳ hay cuối khoá.
4.7. Xây dựng bảng trọng số
Trên cơ sở xãc định rõ các mục tiêu dạy học ( Chương, mục, bài ) cần phân
tích mục tiêu dạy-học ( kiến thức, kỹ năng, thái độ ) . Hệ thống tri thức bao gồm các
thành tố cơ bản sau : ( Xem hình 2 )
- Tri lý : Các quy luật, nguyên lý, khái niệm khoa học v.v
- Tri sự : Các hiểu biết về các sự kiện, hiện tượng trong tự nhiên, xã hội, thực
tiễn cuộc sống .v.v
-Tri hành : Các tri thức hướng dẫn hành động như quy trình, hướng dẫn, các
chuẩn mức v.v
- Tri nhân : Hiểu biết về con ngưòi, quan hệ xã hội, hệ thống giá trị v.v
Tri lý Tri sự

Tri hành Tri nhân
Hình 2. Cơ cấu các thành tố tri thức
Hệ thống các kỹ năng bao gồm :
- Các kỹ năng tư duy : Phân tích; tổng hợp; so sánh ; khái quát; dự đoán; chuẩn
đoán vv.
- Các kỹ năng quản lý: Lập kế hoạch; tổ chức chỉ đạo; phối hợp; kiểm tra &
đánh giá
19
CƠ CẤU CÁC THÀNH TỐ

TRI THỨC
- Các kỹ năng giao tiếp : Sử dụng ngôn ngữ, tiếp xúc; hướng dẫn; trình bày vv
-Các kỹ năng thông tin : Thu thập, lựa chọn; xử lý thông tin vv
-Các kỹ năng thực hành & tác nghiệp : thiết kế; vận hành; sửa chữa; thí
nghiệm, giải quyết vấn đề vv
- Các kỹ năng hành chính.vv…
Các kỹ năng trên được hình thành và phát triển thông qua quá trình đào tạo và
hành nghề thực tế. Trong quá trình đào tạo, học tập là một quá trình nhận thức và
hành động của người học nhằm thu nhận kiến thức mới, hình thành và phát triển các
kỹ năng trí tuệ và hành động trong một lĩnh vực cụ thể (khoa học-công nghệ, xã hội
hoặc nghề nghiệp) góp phần hình thành và phát triển nhân cách, tạo ra thái độ và giá
trị đúng đắn trong cuộc sống và lao động nghề nghiệp của mỗi cá nhân trong xã hội
khi vận dụng thang đo Blool cần xây dựng bảng trong số ( ma trận hai chiều ) để xác
định và cân đối các mức độ đo đối với từng mục ( chủ đề , bài giảng ) trong nội dung
dạy học và phù hợp với mục tiêu dạy học
STT CHỦ ĐỀ
CÁC MỨC ĐỘ ĐÁNH GIÁ TRỌNG
SỐ (%)
BIẾT HIỂU VẬN
DỤNG
ĐÁNH
GIÁ
A
B
C
TỔN
G
SỐ
100
Các căn cứ để xác định trọng số là :

- Vai trò , vị trí và tầm quan trọng của chủ đề
- Kế hoạch, thời lưọng dành cho giảng dạy và học tập từng chủ đề
- Mục tiêu dạy học của từng chủ đề
V. ĐÁNH GIÁ CÂU HỎI TRẮC NGHIỆM :
20
5.1. Xử lý câu hỏi trắc nghiệm
a. Độ khó (FV)
Độ khó FV được tính bằng tỷ số phần trăm TS làm đúng trên tổng số TS tham
gia làm câu trắc nghiệm đó
FV = (Số TS làm đúng)/(Tổng số TS tham gia làm CH)
Chỉ số FV thường trong khoảng >25% và < 75%. Nếu FV =0 –Câu hỏi quá
khó còn FV =1 –Câu trác nghiệm quá dễ.
Thang phân loại độ khó đực quy ước như sau :
- Câu dễ : có 70 đến 100 % thí sinh trả lời đúng
- Câu trung bình : từ 30% đến 70% thí sinh trả lời đúng
- Câu khó : từ 0% đến 30% thí sinh trả lời đúng
b. Độ phân biệt (DI)
Khi ra một câu hoặc một ĐTN cho một nhóm TS nào đó, người ta thường
muốn phân biệt trong nhóm ấy những người có năng lực khác nhau: giỏi, trung bình,
kém Khả năng của câu trắc nghiệm thực hiện được sự phân biệt ấy được gọi là độ
phân biệt
Một câu hỏi gọi là phân biệt được nghĩa là nhóm HS khá giỏi sẽ có xu hướng
làm tốt câu hỏi đó hơn các HS trung bình, kém. Phân bố tỷ lệ thí sinh trả lời đúng
hoặc sai của các thí sinh thuộc nhóm khá, nhóm trung bình, nhóm kém cho ta số đo
tương đối về sự phân biệt của câu hỏi.
Độ phân biệt được xác định dựa trên sự phân tích câu hỏi, trong đó các câu hỏi
được sử dụng là câu trả lời đúng của thí sinh thuộc hai nhóm: Nhóm thí sinh đạt điểm
cao nhất, nhóm thí sinh đạt điểm thấp nhất (dựa trên điểm tổng số của bài trắc
nghiệm).
Số thí sinh khá làm đúng - Số thí sinh yếu làm đúng

DI = X 100% (2)
Tổng số thí sinh khá và yếu
Để chọn nhóm cao và nhóm thấp, có thể lấy từ 25% -> 35% tổng số thí sinh
tham gia làm bài tuỳ từng trường hợp, song chỉ số 27% là tỷ lệ lớn nhất cho nhóm cao
và nhóm thấp để xác định chỉ số phân biệt. Bởi vì “27% là sự dung hoà tốt nhất giữa
hai mục đích mà ta mong muốn đạt được nhưng không nhất quán với nhau: Một mặt
ta muốn có hai nhóm cao và thấp càng đông càng tốt, mặt khác ta lại muốn cho hai
nhóm ấy càng khác biệt nhau về khả năng lại càng hay. Các nhà nghiên cứu đã chứng
minh rằng khi ta sử dụng hai nhóm cao thấp, mỗi nhóm gần xấp xỉ 27% của toàn
nhóm, thì ta có thể nói một cách chắc chắn rằng: Những người trong nhóm cao có khả
năng cao hơn là những người trong nhóm thấp”.
21
Số CTL đúng của nhóm giỏi (27%) - số CTL đúng của các nhóm kém (27%)
DI =
27% tổng số thí sinh
Quy ước thang phân loại độ phân biệt:
+ DI < 0: Không đạt yêu cầu (loại bỏ).
+ 0

DI < 0,2: Kém cần loại bỏ hoặc điều chỉnh.
+ 0,2

DI < 0,3: Tạm được, có thể phải sửa đổi để hoàn thiện thêm.
+ 0,3

DI < 0,4: Khá tốt, nhưng có thể làm cho tốt hơn.
+ 0,4

DI < 1: Rất tốt.
Độ phân biệt liên quan mật thiết với độ khó và số lượng câu hỏi trong đề thi

trắc nghiệm. Nếu FV trong khoảng 25% < FV <75% thì DI khoảng 10% là bài trắc
nghiệm có độ phân biệt tốt. Để đánh giá bộ câu hỏi trắc nghiệm theo tiêu chuẩn trên,
các nhà nghiên cứu cho rằng tối thiểu phải có 30 câu hỏi cho 30 thí sinh gồm 3 nhóm:
10 thí sinh yếu, 10 thí sinh trung bình và 10 thí sinh khá
5.2. Đánh giá bài trắc nghiệm khách quan
a. Độ tin cậy ( R)
Độ tin cậy cho biết kết quả đo của một bài trắc nghiệm đáng tin đến đâu, ổn
định đến mức nào. Một bài trắc nghiệm có độ tin cậy cao khi dùng cho những nhóm
đối tượng giống nhau trong hoàn cảnh giống nhau sẽ cho kết quả như nhau hoặc với
sai số cho phép.
Trong các phép đo lường đặc biệt là đo lường thành quả học tập, một tất yếu
xảy ra là phải có mức độ sai sót. Những sai sót trong phạm vi cho phép ở mức độ thấp
gọi là sự ổn định của phép đo hay gọi là độ tin cậy của nó. Độ tin cậy biểu thị mức độ
chính xác của phép đo.
Độ tin cậy của tổng thể bộ câu hỏi trắc nghiệm MCQ được tính:
21
2
( )
1
1
chung K chung
K
KR
K K
µ µ
δ
 

= −
 


 

Trong đó :
K: Số lượng câu hỏi trắc nghiệm;
µ
chung: Điểm trung bình của bài trắc nghiệm;
2
δ
: Phương sai tổng thể của bài trắc nghiệm;
Độ tin cậy nằm trong khoảng từ 0->1, thang phân loại độ tin cậy được quy ước
như sau: + Độ tin cậy từ 0-> 0,6: Bài trắc nghiệm có độ tin cậy thấp;
+ Độ tin cậy từ 0,6-> 0,9: Bài trắc nghiệm có độ tin cậy trung bình ;
22
+ Độ tin cậy từ 0,9-> 1: Bài trắc nghiệm có độ tin cậy cao ;
Để có được giá trị độ tin cậy, chúng tôi thực hiện tính toán qua các thông số sau
đây:
* Xác định điểm trung bình của trắc nghiệm tổng thể từ 5 bài trắc nghiệm
(
µ
chung)
Điểm trung bình của bài trắc nghiệm tổng thể từ một bài trắc nghiệm là:
.
i
i
i
K X
k
µ
=


Trong đó:
+
i
µ
: Là điểm trung bình của trắc nghiệm tổng thể từ bài trắc nghiệm i;
+ K: Là số câu hỏi trong bài trắc nghiệm tổng thể;
+
i
X
: Điểm trung bình của bài trắc nghiệm i;
+ k
i
: Số câu hỏi trong bài trắc nghiệm i;
Trong công thức trên, việc xác định
i
X
được chúng tôi áp dụng bởi công thức

n
i
i
i
X
X
n
=


(

Trong đó:
+ X
i
: điểm thi của mỗi thí sinh ở bài trắc nghiệm i.
+ n
i
: số thí sinh tham gia khảo sát bài trắc nghiệm i.
* Xác định phương sai của bài trắc nghiệm tổng thể từ 5 bài trắc nghiệm (
δ
chung)
2
2
( 1) ( )
( 1)( 1)
i
k
i i i i
i i i
n K K S K k V
k k n
δ
− − −
=
− −

(7)
Trong đó:
+
2
δ

: Phương sai tổng thể từ bài trắc nghiệm i;
+ S
i
2
: Phương sai bài trắc nghiệm i;
+
ki
Vi

: Tổng phương sai của từng câu hỏi trên từng bài trắc nghiệm i;
+ K: Số câu hỏi trong bài trắc nghiệm tổng thể;
+ k
i
: Số câu hỏi trong bài trắc nghiệm i;
+ n
i
: Số thí sinh dự thi bài thi trắc nghiệm i;
23
Theo công thức trên, việc xác định:
+ Phương sai của tổng từng bài trắc nghiệm (S
i
2
) được tính theo công thức:
2
2
( )
n
i i
i
X X

S
ni

=


+ Tổng phương sai của từng câu hỏi trong bài trắc nghiệm i (
ki
Vi

)
Các loại câu hỏi chỉ có hai loại điểm (điểm cho câu đúng và điểm cho câu sai)
nên phương sai điểm số ứng với câu hỏi j sẽ bằng Pj (1-Pj) . Trong đó, P
j
là tổng số
thí sinh trả lời câu hỏi đúng câu hỏi j. Vì vậy (
ki
Vi

) được tính theo công thức:
(1 )
ki
j
Vi Pj P
= −
∑ ∑

b. Độ giá trị :
Theo các tác giả Stodola và Stordahl thì độ giá trị phản ảnh mức độ mà một
bàI trắc nghiệm đo được đúng cái mà nó định đo. Độ giá trị nói đến tính hiệu quả của

một bàI trắc nghiệm trong việc đạt được những mục đích xác định.
c. Độ khó của bài trắc nghiệm ( FVB )
Độ khó của bài trắc nghiệm phụ thuộc vào trình độ học sinh và đựoc tính theo
công thức sau :
FBV = X / K
- X : Điểm trung bình của bài trắc nghiệm
- K : Tổng số câu trắc nghiệm bằng điểm tối đa của bài trắc nghiệm
( mỗi câu trắc nghiệm đúng tính 1 điểm )
1. Xử lý câu hỏi trắc nghiệm
1.1. Độ khó (FV)
Độ khó FV được tính bằng tỷ số phần trăm TS làm đúng trên tổng số TS
tham gia làm câu trắc nghiệm đó
FV = (Số TS làm đúng)/(Tổng số TS tham gia làm CH)
Chỉ số FV thường trong khoảng >25% và < 75%. Nếu FV =0 –Câu hỏi
quá khó còn FV =1 –Câu trác nghiệm quá dễ.
Thang phân loại độ khó đực quy ước như sau :
- Câu dễ : có 70 đến 100 % thí sinh trả lời đúng
- Câu trung bình : từ 30% đến 70% thí sinh trả lời đúng
24
- Câu khó : từ 0% đến 30% thí sinh trả lời đúng
1.2. Độ phân biệt (DI)
Khi ra một câu hoặc một ĐTN cho một nhóm TS nào đó, người ta
thường muốn phân biệt trong nhóm ấy những người có năng lực khác nhau:
giỏi, trung bình, kém Khả năng của câu trắc nghiệm thực hiện được sự phân
biệt ấy được gọi là độ phân biệt
Một câu hỏi gọi là phân biệt được nghĩa là nhóm HS khá giỏi sẽ có xu
hướng làm tốt câu hỏi đó hơn các HS trung bình, kém. Phân bố tỷ lệ thí sinh trả
lời đúng hoặc sai của các thí sinh thuộc nhóm khá, nhóm trung bình, nhóm kém
cho ta số đo tương đối về sự phân biệt của câu hỏi.
Độ phân biệt được xác định dựa trên sự phân tích câu hỏi, trong đó các

câu hỏi được sử dụng là câu trả lời đúng của thí sinh thuộc hai nhóm: Nhóm thí
sinh đạt điểm cao nhất, nhóm thí sinh đạt điểm thấp nhất (dựa trên điểm tổng số
của bài trắc nghiệm).
Số thí sinh khá làm đúng - Số thí sinh yếu làm đúng
DI = X 100% (2)
Tổng số thí sinh khá và yếu
Để chọn nhóm cao và nhóm thấp, có thể lấy từ 25% -> 35% tổng số thí
sinh tham gia làm bài tuỳ từng trường hợp, song chỉ số 27% là tỷ lệ lớn nhất
cho nhóm cao và nhóm thấp để xác định chỉ số phân biệt. Bởi vì “27% là sự
dung hoà tốt nhất giữa hai mục đích mà ta mong muốn đạt được nhưng không
nhất quán với nhau: Một mặt ta muốn có hai nhóm cao và thấp càng đông càng
tốt, mặt khác ta lại muốn cho hai nhóm ấy càng khác biệt nhau về khả năng lại
càng hay. Các nhà nghiên cứu đã chứng minh rằng khi ta sử dụng hai nhóm cao
thấp, mỗi nhóm gần xấp xỉ 27% của toàn nhóm, thì ta có thể nói một cách chắc
chắn rằng: Những người trong nhóm cao có khả năng cao hơn là những người
trong nhóm thấp”.
Số CTL đúng của nhóm giỏi (27%) - số CTL đúng của các nhóm kém (27%)
DI =
27% tổng số thí sinh
Quy ước thang phân loại độ phân biệt:
25

×