Tải bản đầy đủ (.pdf) (62 trang)

Ứng dụng mạng bayes xây dựng hệ thống trắc nghiệm thích nghi

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.94 MB, 62 trang )

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

TRẦN THỊ TỐ LOAN

ỨNG DỤNG MẠNG BAYES XÂY DỰNG
HỆ THỐNG TRẮC NGHIỆM THÍCH NGHI

LUẬN VĂN THẠC SĨ KỸ THUẬT

Đà Nẵng - Năm 2017


1

ĐẠI HỌC ĐÀ NẴNG
TRƯỜNG ĐẠI HỌC BÁCH KHOA

TRẦN THỊ TỐ LOAN

ỨNG DỤNG MẠNG BAYES XÂY DỰNG
HỆ THỐNG TRẮC NGHIỆM THÍCH NGHI

Chuyên ngành: Khoa học máy tính
Mã số: 60.48.01.01

LUẬN VĂN THẠC SĨ KỸ THUẬT

Người hướng dẫn khoa học: TS. ĐẶNG HOÀI PHƯƠNG

Đà Nẵng - Năm 2017




i

LỜI CAM ĐOAN
Tôi xin cam đoan đề tài “Ứng dụng mạng Bayes xây dựng hệ thống trắc nghiệm
thích nghi” này là cơng trình nghiên cứu của riêng tơi dưới sự hướng dẫn của TS.
Đặng Hoài Phương.
Các nội dung nghiên cứu, kết quả trong đề tài này là trung thực.
Tác giả

Trần Thị Tố Loan


ii

TÓM TẮT LUẬN VĂN
ỨNG DỤNG MẠNG BAYES XÂY DỰNG HỆ THỐNG TRẮC NGHIỆM
THÍCH NGHI
Trần Thị Tố Loan, học viên cao học khóa 31, chun ngành Khoa học máy tính, mã
số: 60.48.01, trường Đại học Bách Khoa - Đại học Đà Nẵng
Tóm tắt - Hệ thống trắc nghiệm thích nghi (TNTN) đã được nghiên cứu, hiện thực hóa
và ứng dụng rộng rải nhờ tính chính xác và khách quan trong quá trình đánh giá
năng lực, kiến thức của thí sinh. Tuy nhiên, những mơ hình và hệ thống TNTN đã tồn
tại vẫn còn một số nhược điểm nhất định. Nghiên cứu này được đề xuất nhằm khắc
phục, mở rộng tính tốn cho hệ thống TNTN có câu hỏi chứa nhiều tham số, chọn lựa
câu hỏi phù hợp với mức độ kiến thức hiện tại của thí sinh. Luận văn đã khái quát về
TNTN, giới thiệu các hệ thống TNTN đã tồn tại. Từ lý thuyết mạng Bayes, lý thuyết
đáp ứng câu hỏi tác giả đã thiết kế và xây dựng hệ thống TNTN. Các phân tích đánh
giá hệ thống cũng được giới thiệu trong luận văn. Tác giả đã tóm tắt các kết quả đạt

được và đưa ra hướng phát triển tiếp theo.
Từ khóa – Trắc nghiệm thích nghi; mạng Bayes; lý thuyết đáp ứng câu hỏi; thuật toán
ước lượng năng lực.
BAYESIAN NETWORK APPLICATIONS FOR BUILDING COMPUTERIZED
ADAPTIVE TESTING SYSTEMS
Abstract - Computerized Adaptive Testing (CAT) has been research, actualize and
wide apply because of their accuracy and objective in process of testing ability and
knowledge of the candidate. However existing CAT system model still have some
limitation. This research was proposed inorder to resolve; expand the calculation
ability of CAT sytem which have many parameters; select the suitable question depend
on candidate’s current knowledge level. The thesis is generaly describle about CAT;
introduce about existing CAT model. From Bayesian Network theory; Item Response
Theory adapt to question which designes and created the CAT system. Among these,
the fuzzy controller to optimized the calculation for the ability estimatation agrorithm
of student. The review and analysis for te system also mention in the Thesis. The
author was summarize the successful result and given the improvement direction next
step.
Key words - Computerized Adaptive Testing; Bayesian Network; Item Response
Theory; the ability estimatation agrorithm of student.


iii

MỤC LỤC

LỜI CAM ĐOAN ......................................................................................................i
TÓM TẮT LUẬN VĂN .......................................................................................... ii
MỤC LỤC .............................................................................................................. iii
DANH MỤC CÁC CHỮ VIẾT TẮT ....................................................................... v
DANH MỤC CÁC KÝ HIỆU .................................................................................vi

DANH MỤC CÁC BẢNG .................................................................................... vii
DANH MỤC CÁC HÌNH..................................................................................... viii
DANH MỤC CÁC BIỂU ĐỒ .................................................................................ix
MỞ ĐẦU .................................................................................................................. 1
1. Lý do chọn đề tài .............................................................................................. 1
2. Mục đích và ý nghĩa đề tài ................................................................................ 1
3. Mục tiêu và nhiệm vụ ....................................................................................... 2
4. Đối tượng và phạm vi nghiên cứu .................................................................... 2
5. Phương pháp nghiên cứu .................................................................................. 2
6. Kết quả dự kiến ................................................................................................. 3
CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN ................................................. 4
1.1. Tổng quan về trắc nghiệm thích nghi ............................................................ 4
1.1.1. Khái niệm trắc nghiệm thích nghi .......................................................... 4
1.1.2. Lịch sử TNTN .......................................................................................... 4
1.2. Các thành phần của mơ hình TNTN .............................................................. 5
1.2.1. Ngân hàng câu hỏi .................................................................................. 5
1.2.2. Thuật toán lựa chọn câu hỏi ................................................................... 5
1.2.3. Đánh giá năng lực của thí sinh ............................................................... 5
1.2.4. Điều kiện dừng ........................................................................................ 6
1.3. Hoạt động của mơ hình TNTN ...................................................................... 6
1.4. Phân tích các mơ hình TNTN ........................................................................ 7
CHƯƠNG 2. XÂY DỰNG MƠ HÌNH TRẮC NGHIỆM THÍCH NGHI ............... 9
2.1. Lý thuyết mạng Bayes ................................................................................... 9
2.1.1. Giới thiệu ................................................................................................ 9
2.1.2. Định nghĩa mạng Bayes .......................................................................... 9
2.1.3. Mạng Bayes nhân quả........................................................................... 10
2.1.4. Học cấu trúc.......................................................................................... 10
2.1.5. Học tham số .......................................................................................... 10
2.1.6. Suy luận trong mạng Bayes .................................................................. 11
2.1.7. Ứng dụng .............................................................................................. 11



iv
2.2. Lý thuyết đáp ứng câu hỏi ........................................................................... 12
2.2.1. Giới thiệu .............................................................................................. 12
2.2.2. Mơ hình IRT 2 tham số ......................................................................... 12
2.3. Xây dựng mơ hình TNTN dựa trên mạng Bayes kết hợp IRT 2 tham số ........... 14
2.3.1. Mơ hình TNTN ...................................................................................... 14
2.3.2. Ngân hàng câu hỏi ................................................................................ 15
2.3.3. Thuật toán TNTN .................................................................................. 16
2.3.4. Thuật toán lựa chọn câu hỏi ................................................................. 17
2.3.5. Ước lượng năng lực thí sinh ................................................................. 17
2.3.6. Thuật toán dừng .................................................................................... 25
CHƯƠNG 3. XÂY DỰNG VÀ TRIỂN KHAI HỆ THỐNG ................................. 26
3.1. Phân tích chức năng của hệ thống TNTN .................................................... 26
3.1.1. Biểu đồ đặc tả chức năng của thí sinh .................................................. 26
3.1.2. Biểu đồ đặc tả chức năng của giáo viên ............................................... 27
3.1.3. Biểu đồ đặc tả chức năng của hệ thống ................................................ 28
3.2. Biểu đồ use case của hệ thống TNTN.......................................................... 28
3.2.1. Các tác nhân của hệ thống ................................................................... 28
3.2.2. Use case thí sinh ................................................................................... 28
3.2.3. Use case giáo viên ................................................................................ 29
3.3. Biểu đồ trạng thái của hệ thống TNTN........................................................ 29
3.3.1. Biểu đồ trạng thái của giáo viên ........................................................... 29
3.3.2. Biểu đồ trạng thái của thí sinh ............................................................. 30
3.3.3. Biểu đồ trạng thái của hệ thống ........................................................... 31
3.4. Biểu đồ tuần tự của hệ thống TNTN............................................................ 32
3.5. Biểu đồ hoạt động của hệ thống TNTN ....................................................... 33
3.5.1. Biểu đồ hoạt động của thí sinh ............................................................. 33
3.5.2. Biểu đồ hoạt động của giáo viên .......................................................... 34

3.5.3. Biểu đồ hoạt động của hệ thống ........................................................... 35
3.6. Thiết kế cơ sở dữ liệu................................................................................... 36
3.7. Triển khai hệ thống TNTN .......................................................................... 36
3.8. Đánh giá hệ thống TNTN ............................................................................ 37
TÀI LIỆU THAM KHẢO ...................................................................................... 42
PHỤ LỤC
QUYẾT ĐỊNH GIAO ĐỀ TÀI.
BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC
PHẢN BIỆN.


v

DANH MỤC CÁC CHỮ VIẾT TẮT
TNTN
TNKQ
CSDL
NHCH

Trắc nghiệm thích nghi
Trắc nghiệm khách quan
Cơ sở dữ liệu
Ngân hàng câu hỏi


vi

DANH MỤC CÁC KÝ HIỆU
a
b

P(i)
θ

Độ phân biệt câu hỏi
Độ khó câu hỏi
Xác suất trả lời đúng câu hỏi thứ i
Năng lực thí sinh


vii

DANH MỤC CÁC BẢNG

Số
bảng

Tên bảng

Trang

1.1

Bảng đánh giá các thuật toán lựa chọn MI, KL và MEI
(+: có, -: khơng)

7

2.1

Thiêt kế giả định môn Mathematics


19

2.2

Phân cấp chi tiết môn Mathematics

19

2.3

Xác suất trả lời đúng câu hỏi

25

3.1

Bộ câu hỏi ước lượng tham số theo IRT 2 tham số

37

3.2.

Kết quả đánh giá năng lực của thí sinh

40


viii


DANH MỤC CÁC HÌNH

Số hiệu
1.1.
2.1.
2.2.
2.3.
2.4.
2.5.
2.6.
2.7.
3.1.
3.2.
3.3.
3.4.
3.5.
3.6.
3.7.
3.8.
3.9.
3.10.
3.11.
3.12.

Tên hình
Mơ hình hoạt động của hệ thống TNTN
Mơ hình TNTN
Thuật tốn TNTN
Các phương án của mơ hình quan hệ nhân quả
BN mơ phỏng mối quan hệ giữa chủ đề và các khái

niệm của nó
Mạng Bayes cho TNTN
Chuyển đổi ICC
Sử dụng G(x) để tính các xác suất
Biểu đồ đặc tả chức năng của thí sinh
Biểu đồ đặc tả chức năng của giáo viên
Biểu đồ đặc tả chức năng của hệ thống
Biểu đồ Use case thí sinh
Biểu đồ Use case giáo viên
Biểu đồ trạng thái của giáo viên
Biểu đồ trạng thái của thí sinh
Biểu đồ trạng thái của hệ thống
Biểu đồ tuần tự của hệ thống
Biểu đồ hoạt động của thí sinh
Biểu đồ hoạt động của giáo viên
Biểu đồ hoạt động của hệ thống

Trang
6
14
16
21
22
23
23
24
26
27
28
28

29
29
30
31
32
33
34
35


ix

DANH MỤC CÁC BIỂU ĐỒ
Số hiệu
biểu đồ
Biểu đồ 3.1
Biểu đồ 3.2

Tên bảng
Biểu đồ biểu diễn lựa chọn câu hỏi cho thí sinh có θ= 0.5
Biểu đồ biểu diễn lựa chọn câu hỏi cho thí sinh có θ= 1.5 và θ= 1.5

Trang
38
39


1

MỞ ĐẦU

1. Lý do chọn đề tài
Đánh giá kết quả học tập là một khâu quan trọng trong quá trình đào tạo, là một
trong những yếu tố quyết định chất lượng giáo dục. Các phương pháp đánh giá truyền
thống như: vấn đáp, tự luận, … thường mất nhiều thời gian, khó chính xác và khơng
khách quan. Để khắc phục những hạn chế trên thì kiểm tra bằng hình thức trắc nghiệm
đã được đề xuất. Nhờ vào đặc điểm ln có sự rõ ràng của đáp án, tính khách quan
trong đánh giá kết quả học tập của người học mà hình thức đánh giá này đã được áp
dụng ở hầu khắp hệ thống giáo dục trên thế giới.
Một trong những hệ thống trắc nghiệm đang được sử dụng phổ biến là trắc
nghiệm khách quan (Objective test) [4]. Tuy nhiên mơ hình trắc nghiệm này vẫn chưa
thực sự đưa ra kết quả đúng đắn hoặc công bằng do một số nguyên nhân: bộ câu hỏi
trong một bài kiểm tra được lựa chọn một cách ngẫu nhiên nên sẽ có bài kiểm tra quá
khó hoặc quá dễ, điều này dẫn đến gây nhàm chán cho thí sinh khi làm tồn câu hỏi dễ
hoặc gây ức chế nếu gặp phải câu hỏi quá khó. Để q trình đánh giá mức năng lực
của thí sinh được chính xác và khách quan hơn, một mơ hình trắc nghiệm đã và đang
được nghiên cứu hiện nay là trắc nghiệm thích nghi (TNTN) đặc biệt là mơ hình thích
nghi trên máy tính (Computerized Adaptive Testing - CAT) [14]. Mơ hình này cho
phép lựa chọn câu hỏi tiếp theo phù hợp với mức kiến thức và năng lực hiện tại của thí
sinh. Hệ thống TNTN trên máy tính cho phép tự động đánh giá mỗi thí sinh với tập
hợp câu hỏi trắc nghiệm là khác nhau về số lượng và nội dung câu hỏi. Năng lực thí
sinh được cập nhật thường xuyên trong quá trình đánh giá, và quá trình đánh giá sẽ kết
thúc khi đưa ra được chính xác mức kiến thức và năng lực thực sự của thí sinh.
Ngày nay, với sự phát triển vượt bậc của khoa học máy tính nên vấn đề triển khai
các hệ thống TNTN dựa trên cơ sở các mơ hình tốn học là hồn tồn khả thi. Một số
mơ hình TNTN đã được nghiên cứu và hiện thực hóa như: mơ hình TNTN trên cơ sở
lý thuyết đáp ứng câu hỏi [19], mơ hình TNTN trên cơ sở [15], … Tuy nhiên các mơ
hình TNTN kể trên vẫn cịn tồn tại một số nhược điểm

2. Mục đích và ý nghĩa đề tài
a. Mục đích

Xây dựng mơ hình TNTN trên cơ sở mạng Bayes.
Xây dựng hệ thống TNTN dựa trên mơ hình đề xuất và triển khai ứng dụng cho
việc đánh giá kiến thức và kỹ năng của sinh viên ở Trường ĐH Sư phạm Kỹ
thuật Vĩnh Long đối với học phần Lập trình Web.

b. Ý nghĩa khoa học
Xây dựng mơ hình TNTN ứng dụng mạng Bayes.


2

c. Ý nghĩa thực tiễn
Hiện thực hóa hệ thống TNTN trên cơ sở mơ hình đề xuất nhằm nâng cao hiệu
quả đánh giá năng lực người học một cách tự động hóa.

3. Mục tiêu và nhiệm vụ
a. Mục tiêu
Nghiên cứu mơ hình TNTN;
Tìm hiểu mạng Bayes;
Xây dựng mơ hình TNTN trên cơ sở mạng Bayes;
Hiện thực hóa hệ thống Website đánh giá dựa trên mơ hình đề xuất.

b. Nhiệm vụ
Đưa ra vấn đề và phân tích vấn đề;
Phát biểu, phân tích và xây dựng mơ hình TNTN để giải quyết bài toán đặt ra;
Triển khai thực tế và đánh giá kết quả đạt được của hệ thống.

4. Đối tượng và phạm vi nghiên cứu
a. Đối tượng nghiên cứu
Các mơ hình và thuật tốn TNTN;

Các hệ thống TNTN hiện có;
Lý thuyết mạng Bayes.

b. Phạm vi nghiên cứu
Ứng dụng mạng Bayes xây dựng hệ thống TNTN cho học phần Lập trình Web
tại Trường Đại học Sư phạm Kỹ thuật Vĩnh Long.

5. Phương pháp nghiên cứu
a. Phương pháp lý thuyết
Phân tích và đánh giá các mơ hình, thuật tốn và hệ thống TNTN hiện có và khả
năng ứng dụng đối với giáo dục ở Việt Nam;ây
Đưa ra kết luận và cơ sở cho việc lựa chọn mạng Bayes làm nền tảng để xây
dựng mơ hình TNTN;
Nghiên cứu và áp dụng mạng Bayes xây dựng hệ thống TNTN.

b. Phương pháp thực nghiệm
Xây dựng ngân hàng câu hỏi làm dữ liệu đầu vào cho chương trình (bao gồm
việc thiết lập các tham số đặc trưng cho từng câu hỏi);
Xây dựng Website TNTN trên cơ sở mơ hình đề xuất;
Triển khai và đánh giá hệ thống.


3

6. Kết quả dự kiến
a. Kết quả của đề tài
Xây dựng mơ hình TNTN trên cơ sở mạng Bayes và Lý thuyết đáp ứng câu hỏi;
Hiện thực hóa hệ thống TNTN trên cơ sở mơ hình đề xuất và triển khai thực tế
đối với học phần Lập trình Web tại Trường Đại học Sư phạm Kỹ thuật Vĩnh
Long.


b. Hướng phát triển của đề tài
Tối ưu hóa mơ hình TNTN đề xuất;
Hoàn thiện hệ thống TNTN.


4

CHƯƠNG 1. CƠ SỞ LÝ LUẬN VÀ THỰC TIỄN
Chương này giới thiệu tổng quan về TNTN, các thành phần cơ bản, hoạt động
chung của một mơ hình TNTN; Phân tích các mơ hình TNTN đã tồn tại, từ đó đưa ra lý
do để xây dựng TNTN trên cơ sở mạng Bayes.

1.1.

Tổng quan về trắc nghiệm thích nghi

1.1.1. Khái niệm trắc nghiệm thích nghi
Trắc nghiệm thích nghi (TNTN), tiếng Anh gọi là “Adaptive Test” là thuật ngữ để
chỉ một phương pháp đánh giá thí sinh bằng hình thức kiểm tra trắc nghiệm nhưng
đánh giá theo hướng năng lực của thí sinh bằng bộ câu hỏi tương ứng với mức năng lực
đó.
Hệ thống trắc nghiệm thích nghi trên máy tính (CAT-Computerized Adaptive
Testing) là phần mềm quản lý tự động với những câu hỏi có độ khó phù hợp với thí
sinh dựa trên năng lực hiện thời của thí sinh. Trái ngược với trắc nghiệm khách quan
trên máy tính - hệ thống đưa ra bộ các câu hỏi theo trình tự đã được xác định trước
hoặc ngẫu nhiên, hệ thống CAT đưa ra câu hỏi thích ứng với thí sinh. Nếu thí sinh trả
lời chính xác một câu hỏi thì câu hỏi trắc nghiệm tiếp theo khó hơn câu hỏi hiện thời.
Do đó, nếu thí sinh trả lời sai câu hỏi hiện thời thì câu hỏi tiếp theo sẽ dễ hơn. Vì vậy,
những sinh viên khác nhau sẽ nhận được các tập các câu hỏi trắc nghiệm khác nhau

dựa trên câu trả lời của họ về các câu hỏi.
Quy trình đánh giá với khả năng thích nghi có các ưu điểm sau:
- Quy trình đánh giá trở nên động và riêng rẽ, vì nó được thích ứng với mỗi sự
thực hiện của thí sinh.
- Tránh được việc thí sinh phải làm bài thi trên những câu hỏi không
phù hợp với năng lực của mình.
- Số lượng các câu hỏi đã yêu cầu để ước lượng mức hiểu biết của thí sinh là
giảm đi đáng kể, kết quả dẫn tới quy trình đánh giá bớt nhàm chán.

1.1.2. Lịch sử TNTN
TNTN đã xuất hiện từ rất lâu và được ứng dụng nhiều trong thực tế cuộc sống
như trắc nghiệm thông minh, trắc nghiệm tâm lý, Elearing, … Ý tưởng ban đầu của
TNTN là của nhà Tâm lý học người Pháp Alfred Binet (1859- 1911). Năm 1905, ông
đã phát triển một thử nghiệm tư duy trên trẻ em. Các thử nghiệm đối với nhiều độ tuổi
khác nhau với những bộ câu hỏi phù hợp cho từng lứa tuổi. Từ những thông tin của
mỗi đợt kiểm tra, ông đưa đưa ra kết luận năng lực cho từng ứng viên. Phương pháp
của Binet là đơn giản và có thể thực hiện bằng máy vi tính.
Năm 1980, Lord đưa ra phương pháp đánh giá có tên là Flexilevel. Sau đó có một
số biến thể của phương pháp này như phương pháp Step của Henning (1987), phương


5
pháp Testle của Lewis và Sheehan (1990). Những phương pháp này là sự sàng lọc từ
phương pháp của Binet. Các câu hỏi được phân loại theo cấp độ độ khó khác nhau, mỗi
cấp độ gồm nhiều câu hỏi. Việc đánh giá sau đó sẽ được tiến hành với một bộ các câu
hỏi thuộc một cấp nào đó tùy thuộc vào tỷ lệ thành công của mỗi cấp độ mà quyết định
di chuyển lên hay xuống một cấp. Sau khi thực hiện một số tập con, có thể ước lượng
được khả năng thực sự của một số thí sinh. Với tốc độ phát triển chóng mặt của máy
tính điện tử thì ngày nay các hệ thống TNTN đã trở nên phổ biến và giúp cho việc đánh
giá năng lực (kiến thức) thí sinh ngày càng trở nên chính xác và hiệu quả hơn. Một số

thử nghiệm đã được công nhận như: Graduate Record Test, Graduate Management
Admission Test, Scholastic Aptitude Test, ….

1.2.

Các thành phần của mơ hình TNTN

Về cơ bản, mơ hình TNTN có các thành phần: ngân hàng câu hỏi (Calibrated item
bank), thuật toán lựa chọn câu hỏi (Item selection algorithm), thuật toán đánh giá
(Scoring algorithm) và điều kiện dừng (Termination criterion) [7], [13], [14]. Tuy
nhiên, các thành phần này có những điểm khác so với trắc nghiệm khách quan.

1.2.1. Ngân hàng câu hỏi
Là tập hợp câu hỏi đã được ước lượng các tham số đặc trưng như độ khó, độ phân
biệt. Ngân hàng câu hỏi được sử dụng để làm cơ sở đánh giá năng lực thí sinh. Do đó,
ngân hàng câu hỏi tốt địi hỏi phải có số lượng tương đối lớn và phong phú.

1.2.2. Thuật toán lựa chọn câu hỏi
Việc đánh giá năng lực của thí sinh trong TNTN phụ thuộc rất lớn vào thuật toán
lựa chọn câu hỏi. Nếu câu hỏi được chọn quá dễ so với năng lực hiện tại của thí sinh thì
thí sinh có thể dễ dàng trả lời và ngược lại. Điều này dễ dẫn tới việc đánh giá năng lực
thí sinh khơng chính xác. Thuật tốn này được sử dụng để lựa chọn câu hỏi tốt nhất từ
ngân hàng câu hỏi để đưa vào bài kiểm tra. Câu hỏi được cho là tốt nhất là câu phù hợp
nhất với năng lực hiện tại của thí sinh, nghĩa là câu hỏi hỏi này có các tham số câu hỏi
tương ứng với tham số năng lực hiện tại của thí sinh.
Thuật tốn lựa chọn câu hỏi gồm các bước sau:
- Dựa trên tham số năng lực hiện tại, tính tốn giá trị của hàm thơng tin cho các
câu hỏi chưa đưa ra cho thí sinh trả lời;
- Tìm và chọn câu hỏi phù hợp nhất với năng lực hiện tại của thí sinh (câu hỏi có
hàm thơng tin lớn nhất).


1.2.3. Đánh giá năng lực của thí sinh
Sau khi nhận kết quả trả lời câu hỏi của thí sinh, hệ thống sẽ tính tốn lại mức
năng lực của thí sinh. Việc tính tốn này sẽ đưa ra giá trị mới cho tham số năng lực.
Thông thường giá trị này không thay đổi nhiều so với lần đánh giá trước đó và sẽ tiến
dần đến mức năng lực thực sự của thí sinh.


6

1.2.4. Điều kiện dừng
Vì mơ hình TNTN hoạt động theo thuật toán lặp các thao tác lựa chọn câu hỏi, thí
sinh trả lời, đánh giá năng lực nên cần có điều kiện dừng để làm căn cứ kết thúc quá
trình trắc nghiệm. Điều kiện dừng có thể là một hoặc một số tiêu chí như: độ sai lệch
năng lực thấp, thời gian làm bài vượt quá thời gian quy định, số lượng câu hỏi vượt quá
mức quy định, …

1.3. Hoạt động của mơ hình TNTN
Bắt đầu

Khởi tạo mức năng lực

Đúng

Điều kiện dừng
Sai
Lựa chọn câu hỏi
phù hợp

Đánh giá lại

mức năng lực

Báo cáo kết quả
mức năng lực

Kết thúc
Hình 1.1. Mơ hình hoạt động của hệ thống TNTN
Hoạt động chung của mơ hình TNTN là một thuật toán lặp gồm các bước sau:
Bước 1: Khởi tạo giá trị mức năng lực ban đầu của thí sinh.
Bước 2: Dựa vào mức năng lực hiện tại của thí sinh, lựa chọn câu hỏi phù
hợp nhất từ các câu hỏi chưa được chọn.
Bước 3: Tính tốn lại mức năng lực mới dựa vào kết quả trả lời câu hỏi của
thí sinh.
Bước 4: Quay lại bước 2 nếu điều kiện dừng chưa thỏa mãn.


7
Trong mơ hình TNTN, thuật tốn lựa chọn câu hỏi tiếp theo phù hợp với năng lực
hiện tại của thí sinh là khó khăn vì phải được tính tốn một cách phức tạp. Ngày nay
với sự phát triển của khoa học máy tính thì vấn đề trên đã được giải quyết một cách tốt
hơn, giúp hệ thống đánh giá năng lực của thí sinh một cách chính xác, nhanh chóng và
giảm bớt thời gian cũng như chi phí của quá trình đánh giá.

1.4. Phân tích các mơ hình TNTN
Như đã đề cập ở trên, thuật toán lựa chọn câu hỏi tiếp theo là phần quan trọng
nhất trong mơ hình TNTN. Cho đến hiện nay, tồn tại các mơ hình TNTN sử dụng một
số thuật toán lựa chọn câu hỏi tiếp theo phù hợp với năng lực của thí sinh như: thuật
tốn lựa chọn câu hỏi theo tiêu chuẩn thơng tin tối đa (Maximum Information - MI),
thuật toán lựa chọn câu hỏi theo thơng tin tồn cục (Kullback-Leibler – KL), thuật tốn
lựa chọn câu hỏi dựa trên sự phân tích tiên đốn theo tiêu chí tối đa thơng tin

(Maximum Expected Information - MEI).
Thuật toán lựa chọn câu hỏi theo tiêu chuẩn thơng tin tối đa (MI) [12] là thuật
tốn phổ biến được sử dụng trong các mơ hình TNTN. Câu hỏi thứ n+1 được
lựa chọn cho thí sinh là câu hỏi cung cấp thông tin tối đa cho phép ước lượng
khả năng của thí sinh ( n) dựa trên n câu hỏi trước đó mà thí sinh đã trả lời.
Thuật tốn lựa chọn câu hỏi theo thơng tin tồn cục (KL) là thuật toán lựa
chọn câu hỏi dựa trên phương pháp thông tin tổng thể được đề xuất bởi
Chang and Ying (1996) [11]. Thuật toán này sử dụng độ đo Kullback-Leibler
để tính tốn ước lượng trong việc lựa chọn câu hỏi.
Thuật tốn lựa chọn câu hỏi dựa trên sự phân tích tiên đốn theo tiêu chí tối
đa thơng tin (MEI) là thuật toán lựa chọn câu hỏi dựa trên việc phân tích tiên
đốn các tiêu chí tối đa thơng tin dự kiến được đề xuất bởi van der Linden
(1998) [19].
Thuật toán MI, KL và MEI sẽ dừng khi tiêu chuẩn lỗi (SE) đủ nhỏ. Khi đó có thể
nói đã xác định được mức năng lực của thí sinh.
Bảng 1.1. Bảng đánh giá các thuật toán lựa chọn MI, KL và MEI (+: có, -:
khơng)
Thuật tốn lựa
chọn câu hỏi
Thuật tốn MI

Đánh giá
Khả năng thích Số câu hỏi để Thời gian tính
thơng số câu ứng liên tục với xác định tiêu toán hàm thơng
hỏi
tham số năng lực
chuẩn
tin
lỗi+/(SE)
+/-


Thuật tốn KL

-

-

+/-

+/-

Thuật tốn MEI

-

-

+/-

+/-

Phân tích các mơ hình TNTN sử dụng các thuật tốn lựa chọn câu hỏi kể trên
khơng tính tốn đến thơng số của câu hỏi sẽ ảnh hưởng như thế nào đến việc lựa chọn


8
(ví dụ như độ khó của câu hỏi), khơng có khả năng thích ứng liên tục với tham số năng
lực của thí sinh. Ngồi ra, khi tiêu chuẩn lỗi được đặt cố định ở mức thấp đòi hỏi phải
cần nhiều câu hỏi cho bài kiểm tra và thời gian tính tốn hàm thơng tin phụ thuộc nhiều
vào ngân hàng câu hỏi. Từ phân tích trên thì các mơ hình và hệ thống TNTN hiện có

cịn tồn tại nhiều hạn chế, vì vậy nên định hướng và nghiên cứu đề tài: “Ứng dụng
mạng Bayes xây dựng mơ hình trắc nghiệm thích nghi” là cần thiết để khắc phục các
tồn tại nêu trên.


9

CHƯƠNG 2. XÂY DỰNG MƠ HÌNH TRẮC NGHIỆM
THÍCH NGHI
Chương này trình bày nội dung nghiên cứu chính của đề tài đó là xây dựng mơ
hình TNTN dựa trên mạng Bayes.

2.1.

Lý thuyết mạng Bayes

2.1.1. Giới thiệu
Mạng Bayes (tiếng Anh: Bayesian network hoặc Bayesian belief network hoặc
belief network) là một mơ hình xác suất dạng đồ thị.
Một mạng Bayes được biểu diễn bởi một đồ thị, trong đó các nút đại diện cho các
biến còn các cung đại diện cho các phụ thuộc có điều kiện. Phân phối xác suất có điều
kiện phụ thuộc (joint probability distribution) của các biến được xác định bởi cấu trúc
đồ thị của mạng. Cấu trúc đồ thị của một mạng Bayes dẫn tới các mơ hình dễ giải thích
và tới các thuật tốn học và suy luận hiệu quả. Các nút có thể đại diện cho đủ loại biến,
một tham số đo được, một biến ẩn (latent variable) hay một giả thuyết chứ không nhất
thiết phải đại diện cho các biến ngẫu nhiên.

2.1.2. Định nghĩa mạng Bayes
Một mạng Bayes là một đồ thị có hướng phi chu trình mà trong đó:
Các nút biểu diễn các biến;

Các cung biểu diễn các quan hệ phụ thuộc thống kê giữa các biến và phân
phối xác suất địa phương cho mỗi giá trị nếu cho trước giá trị của các cha của
nó.
Nếu có một cung từ nút A tới nút B, thì biến B phụ thuộc trực tiếp vào biến A, và
A được gọi là cha của B. Nếu với mỗi biến trong mạng là Xi, i ∈{1,..,N} và Pa(Xi) là
tập hợp các biến cha của nút Xi thì phân phối xác suất có điều kiện phụ thuộc của các
biến là tích của các phân phối xác suất địa phương.
𝑛

𝑃(𝑋1 , … , 𝑋𝑛 ) = ∏ 𝑃(𝑋𝑖 | Pa(𝑋𝑖 ))
𝑖=1

Như vậy, để xác định một mạng Bayesian chúng ta cần cung cấp:
Tập các biến: X1, X2, ..., Xn.
Tập hợp các mối quan hệ (ảnh hưởng nhân quả) giữa các biến đó. Các mối
quan hệ được đại diện bởi các liên kết trực tiếp trong mạng, và dĩ nhiên là
mạng khơng có chứa bất kỳ chu trình nào.
Với mỗi biến, sự phân phối có điều kiện {P(Xi| Pa(Xi)), i=1, …, n}. Nếu Xi
khơng có cha, ta nói rằng phân phối xác suất địa phương của nó là khơng có


10
điều kiện, ngược lại, nó là có điều kiện. Nếu biến được biểu diễn bởi một nút
được quan sát, thì ta nói rằng nút đó là một nút hiển nhiên (evidence node).
Các câu hỏi về sự phụ thuộc không tương đẳng giữa các biến có thể được trả lời
bằng cách nghiên cứu đồ thị. Có thể chứng minh rằng trong đồ thị, tính độc lập có điều
kiện được biểu diễn bởi tính chất đồ thị: cho trước một số nút hiển nhiên cụ thể, các nút
X và Y là d-separated (d-tách rời) trong đồ thị khi và chỉ khi các biến và Y là độc lập,
biết trước các biến hiển nhiên tương ứng. Tập hợp gồm tất cả các nút khác mà X có thể
phụ thuộc trực tiếp được cho bởi Markov blanket của X.

Một ưu điểm của mạng Bayes là về mặt trực quan, con người có thể hiểu các quan
hệ phụ thuộc trực tiếp và các phân phối địa phương dễ dàng hơn là phân phối có điều
kiện phụ thuộc hoàn chỉnh.

2.1.3. Mạng Bayes nhân quả
Một mạng Bayes nhân quả là một mạng Bayes mà trong đó các cung có hướng
của đồ thị được hiểu là các quan hệ nhân quả trong một miền xác định có thực nào đó.
Các cung có hướng khơng nhất thiết phải được hiểu là các quan hệ nhân quả; Tuy
nhiên, trong thực tiễn, tri thức về các quan hệ nhân quả rất hay được dùng để hướng
dẫn vẽ các đồ thị mạng Bayes, kết quả là có được các mạng Bayes nhân quả.

2.1.4. Học cấu trúc
Trong trường hợp đơn giản nhất, một mạng Bayes được xây dựng bởi một chuyên
gia và rồi được dùng để thực hiện việc suy luận. Trong các ứng dụng khác, công việc
xây dựng mạng quá phức tạp đối với con người. Trong trường hợp này, cấu trúc và các
tham số mạng của các phân bố địa phương phải được học từ dữ liệu.
Học cấu trúc của một mạng Bayes (nghĩa là học đồ thị) là một phần rất quan trọng
của ngành học máy. Giả thiết rằng dữ liệu được sinh từ một mạng Bayes và tất cả các
biến là thấy được trong mọi lần lặp, việc tối ưu hóa dựa trên phương pháp tìm kiếm có
thể được dùng để tìm cấu trúc mạng. Việc này địi hỏi một hàm tính điểm (scoring
function) và một chiến lược tìm kiếm. Một hàm tính điểm thơng dụng là xác suất hậu
nghiệm (posterior probability) của cấu trúc khi cho trước dữ liệu huấn luyện. Q trình
tìm kiếm duyệt tồn bộ để trả về một cấu trúc có số điểm tối ưu đòi hỏi thời gian cấp
siêu lũy thừa (superexponential) theo số lượng biến. Một chiến lược tìm kiếm địa
phương thực hiện các thay đổi tăng dần hướng tới việc nâng cao điểm số của cấu trúc.
Một thuật tốn tìm kiếm tồn cục như Phương pháp Monte Carlo xích Markov
(Markov chain Monte Carlo) có thể tránh việc bị bẫy trong một cực tiểu địa phương.

2.1.5. Học tham số
Để cụ thể hóa mạng Bayes và biểu diễn đầy đủ các phân bố xác suất phụ thuộc có

điều kiện, đối với mỗi biến X, cần phải chỉ ra phân bố xác suất X theo các cha của X.
Phân bố của X theo các cha của nó có thể có hình thức bất kỳ. Người ta thường dùng


11
các phân bố rời rạc hay phân bố Gauss, do các phân bố này làm đơn giản việc tính
tốn. Đơi khi chỉ biết được các ràng buộc của các phân số người ta có thể dùng nguyên
lý entropy cực đại để xác định một phân bố đơn, phân bố với entropy cực đại thỏa mãn
các ràng buộc đó. Tương tự, trong ngữ cảnh cụ thể của một mạng Bayes động, người ta
thường lấy phân bố có điều kiện cho sự phát triển theo thời gian của trạng thái ẩn để
cực đại hóa hệ số entropy (entropy rate) của q trình ngẫu nhiên được nói đến.
Thơng thường, các phân bố có điều kiện này bao gồm các tham số chưa biết và
phải được ước lượng từ dữ liệu, đôi khi bằng cách tiếp cận khả năng cực đại (maximum
likelihood). Việc cực đại hóa trực tiếp khả năng (hay xác suất hậu nghiệm) thường
phức tạp khi có các biến khơng được quan sát. Một cách tiếp cận truyền thống đối với
vấn đề này là thuật tốn cực đại hóa kỳ vọng (expectation-maximization algorithm),
thuật tốn này ln phiên giữa việc tính tốn các giá trị mong đợi của các biến không
được quan sát theo dữ liệu quan sát được, với việc cực đại hóa khả năng (hay hậu
nghiệm) hồn chỉnh với giả thuyết rằng các giá trị mong đợi đã tính được là đúng đắn.
Dưới các điều kiện chính quy và vừa phải, quá trình này hội tụ về các giá trị khả năng
cực đại (hay hậu nghiệm cực đại) cho các tham số. Một cách tiếp cận Bayes đầy đủ hơn
đối với việc học tham số là coi các tham số như là các biến khơng quan sát được khác
và tính một phân bố hậu nghiệm đầy đủ trên toàn bộ các nút theo dữ liệu quan sát được,
sau đó tách các tham số ra. Cách tiếp cận này có thể có chi phí cao và dẫn đến các mơ
hình có số chiều.

2.1.6. Suy luận trong mạng Bayes
Do mạng Bayes là một mơ hình hồn chỉnh cho các biến và các quan hệ giữa
chúng, có thể dùng mạng Bayes để trả lời các truy vấn xác suất về các biến này. Ví dụ,
mạng Bayes có thể được dùng để tìm tri thức mới nhất về trạng thái của một tập con

gồm các biến khi các biến khác (các biến hiển nhiên) được quan sát. Q trình tính
phân bố hậu nghiệm này của các biến khi cho trước các biến hiển nhiên được gọi là suy
luận xác suất. Quá trình hậu nghiệm cho ra một thống kê đủ phổ quát (universal
sufficient statistic) cho các ứng dụng phát hiện, khi người ta muốn chọn các giá trị cho
một tập con các biến nhằm mục đích cực tiểu hóa một hàm phí tổn nào đó, chẳng hạn
xác suất của lỗi quyết định. Do đó, có thể coi mạng Bayes là một cơ chế cho việc xây
dựng tự động các mở rộng của định lý Bayes cho các bài toán phức tạp hơn.

2.1.7. Ứng dụng
Mạng Bayes được dùng cho việc mơ hình hóa tri thức trong các mạng điều hòa
gene (gene regulatory network), trong các hệ thống y học, kỹ thuật, phân tích văn bản,
xử lý ảnh, dung hợp dữ liệu, và các hệ hỗ trợ quyết định (decision support system).


12

2.2.

Lý thuyết đáp ứng câu hỏi

2.2.1. Giới thiệu
Lý thuyết ứng đáp câu hỏi (Item Response Theory - IRT) là một lý thuyết của
khoa học về đo lường trong giáo dục. Được Lord phát minh vào đầu những năm 1950
và phát triển mạnh mẽ cho đến ngày nay.
Trước đó, Lý thuyết trắc nghiệm cổ điển (Clasical Test Theory – CTT) ra đời từ
khoảng cuối thế kỷ 19 và hoàn thiện vào khoảng thập niên 1970, đã có nhiều đóng góp
quan trọng cho hoạt động đánh giá trong giáo dục, nhưng cũng thể hiện một số hạn
chế.
Các nhà tâm trắc học đã xây dựng một lý thuyết hiện đại dựa trên mô hình tốn
học, địi hỏi nhiều tính tốn, nhưng nhờ sự tiến bộ vượt bậc của cơng nghệ tính tốn

bằng máy tính điện tử vào cuối thế kỷ 20 – đầu thế 20 kỷ 21 nên nó đã phát triển nhanh
chóng và đạt được những thành tựu quan trọng trong quá trình đáng giá và kiểm định
năng lực.
Để đánh giá đối tượng nào đó, lý thuyết trắc nghiệm cổ điển tiếp cận ở cấp độ
một đề kiểm tra còn lý thuyết trắc nghiệm hiện đại tiếp cận ở cấp độ từng câu hỏi, do
đó lý thuyết này thường được gọi là “Lý thuyết ứng đáp câu hỏi”.
IRT xây dựng mơ hình tính tốn để xử lý dữ liệu dựa trên việc nghiên cứu mọi
cặp tương tác giữa “Thí sinh” và “Câu hỏi” khi triển khai một bài thi trắc nghiệm. Mỗi
thí sinh đứng trước một câu hỏi sẽ trả lời như thế nào, điều đó phụ thuộc vào năng lực
của thí sinh và một số đặc trưng của câu hỏi. Thông thường có 3 tham số đặc trưng cho
một câu hỏi đó là: độ khó, độ phân biệt và độ dự đốn. Trong đó, độ khó là tham số
quan trọng nhất thể hiện độ lệch của câu hỏi so với trình độ của thí sinh, tham số độ
phân biệt nhằm mục đích phân biệt sự đáp ứng như thế nào giữa các thí sinh có trình độ
khác nhau với câu hỏi và độ dự đoán là tham số chỉ định tỷ lệ dự đốn của thí sinh khi
đứng trước một câu hỏi.
Hiện nay có 3 mơ hình tính tốn phổ biến trong IRT, các mơ hình này được phân
loại theo số tham số đặc trưng mà nó sử dụng. Mơ hình 1 tham số (Rasch) chỉ xét đến
độ khó của câu hỏi, mơ hình 2 tham số (Birnbaum) xét thêm độ phân biệt của câu hỏi
và mơ hình 3 tham số xét thêm mức dự đốn của thí sinh khi trả lời câu hỏi.

2.2.2. Mơ hình IRT 2 tham số
Trong mơ hình IRT 2 tham số được sử dụng các tham số độ khó (b) và độ phân
biệt (a). Khi đó xác suất trả lời đúng câu hỏi thứ i của thí sinh j được tính theo cơng
thức sau:
𝑃(𝑢𝑖 = 1|𝜃𝑗 , 𝑎𝑖 , 𝑏𝑖 ) =

𝑎 (𝜃 −𝑏 )
𝑒 𝑖 𝑗 𝑖
𝑎 (𝜃 −𝑏 )
1+𝑒 𝑖 𝑗 𝑖


(1.1)

Trong đó:
ui là kết quả đánh giá trả lời câu hỏi i (ui = 1 nếu trả lời đúng câu hỏi thứ i và


13
ui= 0 trong trường hợp ngược lại);
ai, bi là tập hợp các tham số của câu hỏi i: độ phân biệt, độ khó của câu hỏi i;
θj là mức năng lực hiện tại của thí sinh j.
Lựa chọn câu hỏi phù hợp với mức năng lực hiện tại của thí sinh là rất quan trọng.
Nếu câu hỏi đưa ra là q khó hay q dễ đối với thí sinh thì sẽ mang lại ít thơng tin về
mức năng lực thí sinh. Để đánh giá được chính xác mức năng lực thí sinh cần thiết phải
đưa ra câu hỏi với bộ tham số mang lại thông tin tối đa trong việc đánh giá mức năng
lực thí sinh.
Theo Birnbaum, mỗi câu hỏi trắc nghiệm cung cấp một lượng thơng tin nào đó về
mức năng lực của thí sinh. Birnbaum đề xuất hàm thơng tin Ii(θ) của câu hỏi i được
tính tốn phụ thuộc vào năng lực θ của thí sinh theo cơng thức sau:
𝐼𝑖 (𝜃) =

(𝑝𝑖 ′ (𝑢𝑘 =1|𝜃,𝑎𝑖 ,𝑏𝑖 ))

2

𝑝𝑖 (𝑢𝑘 =1|𝜃,𝑎𝑖 ,𝑏𝑖 )(1−𝑝𝑖 (𝑢𝑘 =1|𝜃,𝑎𝑖 ,𝑏𝑖 ))

(1.2)

Trong đó:

pi(uk = 1|θ, ai, bi) là xác suất trả lời đúng câu hỏi i với tập hợp tham số ai, bi;
pi’(uk = 1|θ, ai, bi) là đạo hàm bậc nhất của xác suất trả lời đúng câu hỏi i
theo mức năng lực.
Như vậy, giá trị hàm thơng tin Ii(θ) được tính cho tập hợp các câu hỏi chưa đưa ra
cho thí sinh. Phương pháp phổ biến nhất trong việc lựa chọn câu hỏi tiếp theo phù hợp
với mức năng lực hiện tại của thí sinh là sử dụng hàm thơng tin lớn nhất.
Sau khi trả lời mỗi câu hỏi thì vấn đề đặt ra là làm sao đánh giá lại mức năng lực
của thí sinh vì giá trị mức năng lực mới này sẽ được sử dụng để lựa chọn câu hỏi tiếp
theo phù hợp với thí sinh. Sử dụng phương pháp Maximum likelihood [17] để đánh giá
mức năng lực của thí sinh sau mỗi câu trả lời, tức là tìm một giá trị mức năng lực mà
hàm sau đây là tối đa:
𝑓 (𝑢1 , 𝑢2 , … , 𝑢𝑛 , 𝜃) = 𝑝𝑖 (𝑢1 = 1, 𝜃)𝑢1 . 𝑝𝑖 (𝑢1 = 0, 𝜃)1−𝑢1 .

𝑝𝑖 (𝑢2 = 1, 𝜃)𝑢2 . 𝑝𝑖 (𝑢2 = 0, 𝜃)1−𝑢2 .
𝑢
1−𝑢
𝑝𝑖 (𝑢𝑛 = 1, 𝜃) 𝑛 . 𝑝𝑖 (𝑢𝑛 = 0, 𝜃) 𝑛 → 𝑚𝑎𝑥
Hay nói cách khác:
𝑓 (𝑢1 , 𝑢2 , … , 𝑢𝑛 , 𝜃) = ∏𝑛𝑘=1 𝑝𝑖 (𝑢𝑘 , 𝜃) → 𝑚𝑎𝑥
(1.3)
Trong đó:
u1, u2, …, un là tập hợp câu trả lời của thí sinh đối với các câu hỏi đã đưa ra;
pi(u, θ) là xác suất trả lời đúng câu hỏi i của thí sinh có mức năng lực θ, được
tính theo cơng thức (1.1).
Trắc nghiệm được bắt đầu với mức năng lực của thí sinh là θs, từ cơng thức (1.3)
có thể tiến hành đánh giá lại mức năng lực thí sinh là θs+1 sau khi trả lời một câu hỏi
theo công thức sau:


14



𝜃𝑠+1 = 𝜃𝑠 + ∑𝑖𝜖𝑛

𝑆𝑖 (𝜃𝑠 )

(1.4)

𝑖𝜖𝑛 𝐼𝑖 (𝜃𝑠 )

Trong đó:
n là tập hợp bộ câu hỏi thí sinh đã trả lời;
Si(θs) được tính theo cơng thức:
𝑆𝑖 (𝜃𝑠 ) =

(𝑢𝑖 −𝑝𝑖 (𝑢𝑖 =1|𝜃𝑠 ,𝑎𝑖 ,𝑏𝑖 )).𝑝𝑖 ′ (𝑢𝑖 =1|𝜃𝑠 ,𝑎𝑖 ,𝑏𝑖 )
𝑝𝑖 (𝑢𝑖 =1|𝜃𝑠 ,𝑎𝑖 ,𝑏𝑖 )(1−𝑝𝑖 (𝑢𝑖 =1|𝜃𝑠 ,𝑎𝑖 ,𝑏𝑖 ))

(1.5)

Với pi(ui = 1|θs, ai, bi) và pi’(ui = 1|θs, ai, bi) là xác suất trả lời đúng câu hỏi i
và đạo hàm bậc nhất tương ứng của xác suất đó
Ii(θs) là hàm thơng tin của câu hỏi i được tính theo cơng thức (1.2).
Q trình trắc nghiệm đánh giá mức năng lực của mỗi thí sinh kết thúc khi đã đưa
ra được chính xác mức năng lực của thí sinh đó. Trong q trình trắc nghiệm thích nghi
theo mơ hình đề xuất, sau mỗi câu trả lời mức năng lực thí sinh sẽ được đánh giá lại.
Nếu sự chênh lệch mức năng lực thí sinh giữa hai lần đánh giá liên tiếp là rất nhỏ thì có
thể xem đó là kết quả đánh giá cuối cùng về mức năng lực thí sinh. Bởi vì nếu thí sinh
có trả lời thêm các câu hỏi nữa thì mức năng lực thí sinh gần như khơng đổi và đó cũng
chính là kết quả đánh giá mức năng lực cuối cùng của thí sinh.


2.3. Xây dựng mơ hình TNTN dựa trên mạng Bayes kết hợp IRT 2 tham số
2.3.1. Mơ hình TNTN
Một mơ hình tổng thể TNTN cần có các thành phần sau:
Ngân hàng câu hỏi (Item banking)
Các thuật toán: Khởi tạo, lựa chọn câu hỏi, đánh giá kết quả, tính tốn, dừng
và báo cáo
Thuật toán TNTN
θs

Module lựa chọn câu
hỏi tiếp theo
Module đánh giá
năng lực thí sinh
Module quản lý
câu hỏi

Ngân hàng
câu hỏi

Hình 2.1. Mơ hình TNTN

θf


×