Xây dựng website đánh giá độ tin cậy của bộ đề trắc nghiệm và công cụ tìm kiếm dựa trên ontology

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.28 MB, 58 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NHA TRANG

NGÔ THANH TÙNG

XÂY DỰNG WEBSITE ĐÁNH GIÁ ĐỘ TIN CẬY
CỦA BỘ ĐỀ TRẮC NGHIỆM VÀ
CƠNG CỤ TÌM KIẾM ĐỰA TRÊN ONTOLOGY

LUẬN VĂN THẠC SĨ

KHÁNH HÒA – 2020

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƢỜNG ĐẠI HỌC NHA TRANG

NGÔ THANH TÙNG

XÂY DỰNG WEBSITE ĐÁNH GIÁ ĐỘ TIN CẬY
CỦA BỘ ĐỀ TRẮC NGHIỆM VÀ
CƠNG CỤ TÌM KIẾM ĐỰA TRÊN ONTOLOGY
LUẬN VĂN THẠC SĨ
Ngành:

Công Nghệ Thông Tin

Mã số:

8480201

Quyết định giao đề tài:

1244/QĐ-ĐHNT ngày 25/9/2019

Quyết định thành lập HĐ:
Ngày bảo vệ:

07/06/2020

Ngƣời hƣớng dẫn khoa học:

TS. PHẠM THỊ THU THÚY

Chủ tịch Hội đồng:

TS. NGUYỄN ĐỨC THUẦN

Khoa Sau Đại học:

KHÁNH HÒA - 2020

LỜI CAM ĐOAN
Tôi xin cam đoan mọi kết quả của đề tài: “Xây dựng website đánh giá độ tin cậy
của bộ đề trắc nghiệm và cơng cụ tìm kiếm đựa trên ontology” là cơng trình nghiên
cứu của cá nhân tơi và chƣa từng đƣợc công bố trong bất cứ công trình khoa học nào
khác cho tới thời điểm này.
Khánh Hịa, ngày 20 tháng 4 năm 2020
Tác giả luận văn

Ngô Thanh Tùng

iii

LỜI CẢM ƠN
Trong suốt thời gian thực hiện đề tài, tơi đã nhận đƣợc sự giúp đỡ của q phịng
ban Trƣờng Đại học Nha Trang, Khoa CNTT và Phòng Đào tạo Sau Đại học đã tạo
điều kiện tốt nhất cho tơi đƣợc hồn thành đề tài. Đặc biệt là sự hƣớng dẫn tận tình của
TS. Phạm Thị Thu Thúy đã giúp tơi hồn thành tốt đề tài. Qua đây, tơi xin gửi lời cảm
ơn sâu sắc đến sự giúp đỡ này.
Cuối cùng tôi xin gửi lời cảm ơn chân thành đến gia đình và tất cả bạn bè đã giúp
đỡ, động viên tơi trong suốt q trình học tập và thực hiện đề tài.
Tơi xin chân thành cảm ơn!
Khánh Hịa, ngày 20 tháng 4 năm 2020
Tác giả luận văn

Ngô Thanh Tùng

iv

MỤC LỤC
LỜI CAM ĐOAN ................................................................................................. iii
LỜI CẢM ƠN ....................................................................................................... iv
MỤC LỤC ..............................................................................................................v
DANH MỤC CHỮ VIẾT TẮT ........................................................................... vii
DANH MỤC BẢNG .......................................................................................... viii
DANH MỤC HÌNH .............................................................................................. ix
TRÍCH YẾU LUẬN VĂN .....................................................................................x

MỞ ĐẦU ................................................................................................................1
CHƢƠNG 1: TỔNG QUAN VỀ ONTOLOGY .....................................................2
1.1 Giới thiệu Ontology ......................................................................................2
1.1.1 Tổng quan về Ontology.........................................................................2
1.1.2 Phƣơng thức xây dựng Ontology ..........................................................2
1.1.3 Ngôn ngữ để diễn đạt Ontology ............................................................3
1.2 Truy vấn dữ liệu RDF...................................................................................4
1.2.1 Mơ hình RDF cơ bản.............................................................................4
1.2.2 RDF Schema .........................................................................................4
1.2.3 SPARQL ...............................................................................................5
1.3 Công cụ và phần mềm xây dựng Ontology .................................................6
1.3.1 Protégé...................................................................................................6
1.3.2 Plugin Ontop .........................................................................................6
CHƢƠNG 2. MỘT SỐ PHƢƠNG PHÁP TÍNH ĐỘ TIN CẬY CỦA MỘT BÀI
KIỂM TRA ...........................................................................................................10
2.1 Phƣơng pháp cổ điển (CTT) .......................................................................10
2.1.1 Phƣơng trình cơ bản trong lý thuyết khảo thí cổ điển [2] ...................10
2.1.2 Cơng thức khác tính độ tin cậy ...........................................................12
2.2 Phƣơng pháp hiện đại (Lý thuyết hồi đáp) [1] ...........................................13
2.3 Mối quan hệ giữa Lý thuyết hồi đáp và Lý thuyết đánh giá cổ điển ..........15
2.4 Ƣu nhƣợc điểm của các phƣơng pháp đánh giá .........................................15
2.4.1 Lý thuyết đánh giá cổ điển ..................................................................15
2.4.2 Lý thuyết hồi đáp ................................................................................16
CHƢƠNG 3.PHÂN TÍCH THIẾT KẾ HỆ THỐNG KIỂM TRA TRẮC
NGHIỆM...............................................................................................................17
3.1 Phân tích hệ thống ......................................................................................17
v

3.2 Xây dựng CSDL .........................................................................................18

3.2.1 Quản lý tài khoản ................................................................................18
3.2.2 Quản lý bài kiểm tra online .................................................................18
3.2.3 Quản lý bài kiểm tra trên giấy .............................................................19
3.3 Mơ hình hóa các chức năng của trang web kiểm tra trắc nghiệm ..............20
3.3.1 Chức năng của giáo viên .....................................................................20
3.3.2 Chức năng của học sinh ......................................................................21
3.3.3 Chức năng chung của ngƣời dùng.......................................................21
3.4 Mơ hình hóa một số quy trình hoạt động của trang web ............................22
3.4.1 Đăng nhập vào hệ thống......................................................................22
3.4.2 Quy trình thiết kế bài kiểm tra của giáo viên ......................................23
CHƢƠNG 4. XÂY DỰNG TRANG WEB KIỂM TRA TRẮC NGHIỆM .........26
4.1 Các công cụ hỗ trợ tạo lập trang web kiểm tra trắc nghiệm .......................26
4.2 Thiết kế chức năng chấm bài kiểm tra trắc nghiệm trên giấy ....................27
4.2.1 Chấm điểm bằng điện thoại di động ...................................................27
4.2.2 Chấm điểm bằng máy scanner ............................................................34
4.3 Sử dụng các phần mềm tạo lập chức năng tìm kiếm bằng Ontology .........36
4.3.1 Sử dụng Protégé để xây dựng cấu trúc Ontology ...............................36
4.3.2 Sử dụng plugin Ontop mapping dữ liệu từ MySql vào Ontology.......37
4.3.3 Sử dụng Server Tomcat và Rdf4j-workbench tạo Endpoint giúp thực
hiện các câu truy vấn bằng SPARQL. .................................................37
4.3.4 Thiết kế chức năng tìm kiếm câu hỏi trắc nghiệm trên hệ thống ........39
4.4 Một số chức năng đặc trƣng của trang web ...............................................42
4.4.1 Tổng quan về trang web ......................................................................42
4.4.2 Chức năng tạo đề trắc nghiệm .............................................................42
4.4.3 Chức năng kiểm tra trắc nghiệm trực tuyến ........................................42
4.4.4 Chức năng kiểm tra trắc nghiệm trên giấy ..........................................43
CHƢƠNG 5. KẾT LUẬN VÀ HƢỚNG PHÁT TRIỂN .....................................44
TÀI LIỆU THAM KHẢO ....................................................................................47

vi

DANH MỤC CHỮ VIẾT TẮT
Tên viết tắt

Tên đầy đủ tiếng Việt

Tên đầy đủ tiếng Anh

CNTT

Công nghệ thông tin

CSDL

Cơ sở dữ liệu

CSDLQH

Cơ sở dữ liệu quan hệ

VAR

Phƣơng sai

Variance

COV

Đồng phƣơng sai

Covariance

CTT

Phƣơng pháp đánh giá độ
tin cậy cổ điển

Classical Test Theory

ICC

Đƣờng cong đặc trƣng

Item Characteristic Curves

IRT

Lý thuyết hồi đáp

Item Response Theory

OBDA

Truy cập dữ liệu dựa trên
Ontology

Ontology-based data access

OWL

Ngôn ngữ đánh dấu dùng để
xuất bản và chia sẻ dữ liệu trên
Web Ontology Language
Internet thông qua những mơ
hình dữ liệu Ontology

RDF

Framework mơ tả tài
ngun

Resource Description
Framework

RDFS

Lƣợc đồ RDF

Resource Description
Framework Schema

SPARQL

Giao thức SPARQL và ngôn
ngữ truy vấn RDF

SPARQL Protocol and RDF
Query Language

URI

Định danh tài nguyên thống
nhất

Uniform Resource Identifier

URL

Định vị tài nguyên thống
nhất

Uniform Resource Locator

W3C

Tổ chức mạng toàn cầu

World Wide Web Consortium

XML

Ngôn ngữ đánh dấu mở
rộng

eXtensible Markup Language

vii

DANH MỤC BẢNG
Bảng 2.1 Mối quan hệ giữa IRT và CCT ..............................................................15
Bảng 3.1 Cấu trúc của bài kiểm tra.......................................................................23
Bảng 4. 1 Một số lệnh javascrip và jQuery giúp quản lý camera .........................28

viii

DANH MỤC HÌNH
Hình 1.1 Kiến trúc của Ontop. ................................................................................7
Hình 1.2 Giao diện mapping CSDL của plugin Ontop...........................................8
Hình 1.3 Giao diện chạy thử query SPARQL của plugin Ontop ..........................8
Hình 1.4 Sesame OpenRDF Workbench ................................................................9
Hình 2.1 Đƣờng cong đặc trƣng của câu hỏi ........................................................13
Hình 3.1 Table quản lý tài khoản..........................................................................18
Hình 3.2 Mơ hình CSDL quản lý bài kiểm tra online ..........................................18
Hình 3.3 Mơ hình CSDL quản lý bài kiểm tra trên giấy ......................................19
Hình 3.4 Chức năng của giáo viên ........................................................................20
Hình 3.5 Chức năng của học sinh. ........................................................................21
Hình 3.6 Chức năng chung của ngƣời dùng .........................................................21
Hình 3.7 Đăng nhập vào hệ thống ........................................................................22
Hình 3.8 Quy trình làm bài kiểm tra của học sinh ................................................22
Hình 3.9 Tạo bài kiểm tra trực tuyến trên trang web............................................23
Hình 3.10 Quy trình thiết kế bài kiểm tra trên giấy của giáo viên .......................25
Hình 4.1 Một số giao diện chức năng chấm bài qua mạng...................................27
Hình 4.2 Ảnh đƣợc chụp từ điện thoại ................................................................29
Hình 4.3 Ảnh sau bƣớc tiền xử lý (ảnh xám và làm nhịe) ...................................29
Hình 4.4 Tìm cạnh trong hình ...............................................................................30
Hình 4.5 Trang giấy đƣợc cắt ra từ ảnh gốc .........................................................30
Hình 4.6 Giúp nhận diện câu trả lời, mã đề, mã học sinh ...................................31

Hình 4.7 Giao diện chấm bài bằng máy scanner ..................................................34
Hình 4. 8 Kết quả sau khi upload các file ảnh lên máy chủ .................................35
Hình 4.9 Cấu trúc Ontology..................................................................................36
Hình 4.10 Mapping dữ liệu từ MySql vào Ontology............................................37
Hình 4.11 Rdf4j-workbench .................................................................................37
Hình 4.12 Tạo kết nối đến file Ontology ..............................................................38
Hình 4.13 Thơng tin SPARQL Endpoint ..............................................................38
Hình 4.14 giao diện tìm kiếm câu hỏi...................................................................39
Hình 4.15 Kết quả nhận đƣợc sau khi thực hiện chức năng tìm kiếm..................39
ix

TRÍCH YẾU LUẬN VĂN
Luận văn “Xây dựng website đánh giá độ tin cậy của bộ đề trắc nghiệm và công
cụ tìm kiếm đựa trên ontology” Nghiên cứu cấu trúc Ontology và các công cụ giúp
ánh xạ CSDLQH vào cấu trúc ontology để hỗ trợ cho việc tìm kiếm, thống kê dữ liệu.
Nghiên cứu các cách thức, phƣơng pháp đánh giá độ tin cậy của bộ đề kiểm tra trắc
nghiệm khách quan. Nghiên cứu cách thức tạo lập một trang web có sử dụng CSDL
ontology, bƣớc đầu tạo lập, thiết kế đƣợc trang web ngữ nghĩa. Nghiên cứu cách thức
trích xuất thông tin từ các file ảnh và cập nhật những thông tin thu thập đƣợc vào
CSDL. Luận văn đã xây dựng đƣợc một trang web giúp tạo lập, quản lý, đánh giá một
bộ đề kiểm tra trắc nghiệm. Hỗ trợ giáo viên đánh giá đƣợc nội dung của một bài kiểm
tra trắc nghiệm. Tuy nhiên luận văn vẫn còn một số hạn chế nhƣ: Vẫn chƣa nhận diện
hiệu quả hình chụp từ điện thoại, chức năng tìm kiếm cịn hạn chế chƣa xử lý đƣợc
ngơn ngữ tự nhiên để tìm kiếm theo hƣớng ngữ nghĩa.
Từ khóa: Ontology, ontop, đánh giá độ tin cậy bài kiểm tra trắc nghiệm, opencv

x

MỞ ĐẦU
1. Lý do chọn đề tài
Việc đẩy mạnh ứng dụng CNTT trong giảng dạy và đánh giá đang là mục tiêu
của ngành giáo dục. Đánh giá học sinh bằng hình thức kiểm tra trắc nghiệm đã và
đang đƣợc áp dụng khá nhiều ở các trƣờng THPT. Trong đó, chất lƣợng của bộ đề
kiểm tra trắc nghiệm luôn là yếu tố đƣợc quan tâm nhất.
Giáo viên thƣờng rất băn khoăn về các câu hỏi trong bộ đề kiểm tra trắc nghiệm.
Họ thƣờng phải tự tìm lời giải đáp cho các câu hỏi nhƣ sau:
- Câu hỏi trong bộ đề có đáng tin cậy:
o Câu hỏi có đƣợc phân đúng vào nhóm câu hỏi theo 4 cấp độ tƣ duy
(nhận biết, thông hiểu, vận dụng thấp, vận dụng cao).
o Đáp án đúng và đáp án gây nhiễu có đáng tin cậy.
- Bộ đề kiểm tra có đáng tin cậy:
o Số lƣợng câu hỏi đƣợc chọn trong các nhóm câu hỏi theo 4 cấp độ có
hợp lý để đánh giá năng lực của học sinh.
o Bài kiểm tra có giúp phân loại năng lực của tất cả học sinh
Chính vì vậy trong đề tài này tôi nghiên cứu xây dựng trang web hỗ trợ giáo viên
tạo bộ đề kiểm tra trắc nghiệm và đánh giá đƣợc độ tin cậy của bộ đề kiểm tra.
2. Mục tiêu đề tài
- Xây dựng trang web kiểm tra trắc nghiệm trong đó có cơng cụ:
o Hỗ trợ giáo viên xây dựng bộ đề trắc nghiệm.
o Giúp giáo viên kiểm tra trắc nghiệm online trên trang web hoặc
offline tại lớp học.
o Đánh giá đƣợc độ tin cậy của bộ đề và các câu hỏi trong bộ đề đó.
- Xây dựng bộ đề kiểm tra trắc nghiệm dựa trên Ontology nhằm hỗ trợ việc tìm
kiếm câu hỏi trắc nghiệm theo hƣớng ngữ nghĩa.
3. Nội dung thực hiện
Xây dựng trang web có chức năng kiểm tra trắc nghiệm trực tuyến và kiểm tra
trên giấy tại trƣờng THPT Chuyên Thăng Long – Đà Lạt và trƣờng THPT Trần Phú –
Đà Lạt. Thu thập kết quả kiểm tra để phục vụ cho việc nghiên cứu các thuật tốn, cơng

thức tính độ tin cậy của bài kiểm tra. Xây dựng công cụ trên trang web để tìm kiếm
bằng ontology và đánh giá độ tin cậy của bộ đề kiểm tra.

1

CHƢƠNG 1: TỔNG QUAN VỀ ONTOLOGY
1.1 Giới thiệu Ontology
1.1.1 Tổng quan về Ontology
Ontology là một mơ hình dữ liệu đƣợc dùng để mô tả một lĩnh vực cụ thể và
đƣợc sử dụng để suy luận về các đối tƣợng trong lĩnh vực đó cùng với các mối quan hệ
giữa chúng. Ontology bao gồm các khái niệm, thuộc tính và định nghĩa về một vấn đề,
đối tƣợng nào đó. Nó tạo lập ngữ nghĩa cho các vấn đề, đối tƣợng và tạo ra các mối
quan hệ, thuộc tính cho các đối tƣợng đó.
o Ontology có bốn thành phần:
− Lớp (classes)
− Quan hệ (relations)
− Thuộc tính (attributes)
− Các mối quan hệ (relationships)
o Phân loại Ontology:
− Top-level Ontology: Dùng để diễn tả khái niệm trừu tƣợng, tổng quan.
− Domain Ontology: lấy tri thức từ trong những lĩnh vực xác định.
− Task Ontology: lấy tri thức về một tác vụ riêng biệt.
− Application Ontology.
1.1.2 Phƣơng thức xây dựng Ontology
Các nguyên tắc cơ bản để xây dựng Ontology đƣợc thực hiện thông qua các công
đoạn sau:
Xác định domain và phạm vi của Ontology
Tìm kiếm các Ontology có sẵn để tham khảo hoặc nâng cấp thêm
Đƣa ra các thuật ngữ chính trong Ontology

Xây dựng cấu trúc chính của Ontology
Thiết lập các thuộc tính và quan hệ của lớp
Xây dựng các luật và ràng buộc cho các lớp
Tạo các đối tƣợng cho lớp
2

Bổ sung các thể hiện cho các lớp
Xây dựng các tập luật suy dẫn hoặc biểu thức truy vấn (nếu có)
1.1.3 Ngơn ngữ để diễn đạt Ontology
Để diễn đạt Ontology ngƣời ta thƣờng dùng một ngôn ngữ gần với ngôn ngữ
XML (eXtensible Markup Language). Ngôn ngữ Ontology đƣợc sử dụng nhiều nhất
gần đây là OWL từ tổ chức W3C. Xây dựng dựa trên RDF và RDFS. OWL giúp thể
hiện các kiểu quan hệ trong RDF bằng cách sử dụng một tập từ vựng XML để đƣa ra
các mối quan hệ và cấp dữ liệu của các tài nguyên trong Ontology.
OWL đƣợc phát triển bởi nó có nhiều tiện lợi để biểu diễn ý nghĩa và ngữ nghĩa
hơn so với XML, RDF và RDFS, và vì OWL ra đời sau các ngơn ngữ này nên nó có
khả năng biểu diễn các nội dung trên web mà máy có thể hiểu đƣợc.
OWL đƣợc chia làm ba phiên bản ngôn ngữ con: OWL Lite, OWL DL và OWL
Full.
−

OWL lite: Là phiên bản đơn giản nhất của OWL, với phiên bản này ngƣời
dùng chỉ có thể sử dụng để tạo các lớp tài nguyên riêng rẽ và những ràng
buộc hay quan hệ đơn giản.

−

OWL DL: Là phiên bản có những tính năng phức tạp trong tính tốn và xử
lý thơng tin và cung cấp công cụ để tạo ra các ràng buộc chặt chẽ. Tuy vậy

OWL DL vẫn còn hạn chế về việc kế thừa giữa các class với nhau

−

OWL full : Là phiên bản cung cấp đầy đủ các tính năng của OWL và không
bị ràng buộc bởi cấu trúc ngữ pháp phức tạp. OWL full có cấu giống với
RDF, ví dụ : một lớp trong OWL full có thể đồng thời đƣợc coi nhƣ là một
tập các thể hiện hoặc là một thể hiện của chính lớp đó

Các thành phần cơ bản của OWL Ontology:
−

Lớp (Classes): Dùng để tạo lập các nhóm có chung nhiều thuộc tính.

−

Thể hiện (Individuals): Là các thành viên của lớp.

−

Thuộc tính (Properties): Tạo liên kết giữa lớp, trong Ontology có thuộc tính
nghịch đảo.

3

Miền (Domain) và phạm vi (Range) của thuộc tính
Mỗi một thuộc tính có thể có domain và range riêng. Các thuộc tính liên kết các
thực thể thuộc domain đến các thực thể thuộc range. Domain của một thuộc tính là
range của thuộc tính nghịch đảo của nó và ngƣợc lại.

Các kiểu thuộc tính OWL
Có hai kiểu thuộc tính chính.
− Object: Thể hiện các mối quan hệ giữa hai lớp, tạo ra liên kết giữa hai lớp
với nhau.
− Datatype: Mô tả giá trị dữ liệu của một thuộc tính trong lớp.
OWL cịn có kiểu thuộc tính thứ ba là thuộc tính Annotation đƣợc sử dụng để
thêm thông tin vào lớp, vào thực thể hoặc thực thể khác thuộc hai kiểu trên: object và
datatype.
1.2 Truy vấn dữ liệu RDF
RDF cung cấp một framework hỗ trợ việc mô tả các siêu dữ liệu về tài nguyên
trên web. RDF kế thừa cú pháp XML. Vì vậy, RDF giúp các ứng dụng kết nối và trao
đổi thông tin trên nền web. Đối với RDF, tài nguyên thông tin từ trang web đƣợc xác
định thông qua các URI.
1.2.1 Mơ hình RDF cơ bản
RDF gồm ba đối tƣợng sau:
-

Tài nguyên (Resource): Là các URI tồn tại trên mạng.

-

Thuộc tính (Property): Là các thơng tin về một đối tƣợng trên web đƣợc định

danh thông qua các URI.
-

Phát biểu (Statement): Mỗi phát biểu có ba thành phần cơ bản: “Chủ thể”,

“Thuộc tính” và “Đối tƣợng”.
1.2.2 RDF Schema

Là một tập hợp các lớp với các thuộc tính sử dụng mơ hình dữ liệu RDF, cung
cấp các yếu tố cơ bản cho mơ tả về Ontology, hay cịn gọi là từ vựng RDF, xác định

4

cấu trúc tài nguyên RDF. Các tài nguyên này có thể đƣợc lƣu trong bộ ba để tiếp cận
chúng với ngơn ngữ truy vấn SPARQL.
Lớp trong RDFS
Các lớp nhóm các tài ngun có liên quan với nhau trên web.
Thuộc tính trong RDFS
Thuộc tính trong RDFS chính là quan hệ giữa các chủ thể và đối tƣợng trong
RDF.
1.2.3 SPARQL
SPARQL, là viết tắt của Giao thức SPARQL và ngôn ngữ truy vấn RDF
(SPARQL Protocol And RDF Query Language), cho phép những ngƣời sử dụng truy
vấn thông tin từ các cơ sở dữ liệu hoặc bất kỳ nguồn dữ liệu nào có thể đƣợc ánh xạ
tới RDF.
SPARQL cho phép ngƣời sử dụng truy xuất và sửa đổi dữ liệu trong các cơ sở dữ
liệu đồ họa NoSQL nhƣ GraphDB.
Một truy vấn SPARQL có thể đƣợc thực thi thông qua phần mềm trung gian. Ví
dụ, CSDLQH có thể đƣợc u cầu truy vấn với SPARQL bằng việc sử dụng phần
mềm J4RDF
Các truy vấn SPARQL không bị ràng buộc phải làm việc bên trong một cơ sở dữ
liệu vì vậy SPARQL có thể ứng dụng cho việc tìm kiếm dữ liệu từ nhiều nguồn khác
nhau dựa trên các điểm truy cập cuối URL (endpoint).
SPARQL đƣợc thiết kế cho Dữ liệu Liên kết (Linked Data) và Web Ngữ nghĩa
(Semantic Web). Nhằm hỗ trợ cho việc làm giàu dữ liệu giúp khai thác tài nguyên
thông tin trên mạng.
SPARQL có 4 dạng truy vấn:

ASK (Hỏi) trả về giá trị dạng True/False đơn giản cho các câu truy vấn
SELECT (Chọn) liệt kê các giá trị thỏa câu truy vấn.
CONSTRUCT (Xây dựng) trích xuất thơng tin và trả về kết quả là một file
RDF.
5

DESCRIBE (Mơ tả) trích xuất một đồ thị RDF từ SPARQL endpoint.
1.3 Công cụ và phần mềm xây dựng Ontology
1.3.1 Protégé
Protégé là một bộ phần mềm mã nguồn mở giúp ngƣời dùng thao tác trên các
CSDL Ontology.
Các ƣu điểm của Protégé:
- Hỗ trợ đầy đủ ba phiên bản của ngôn ngữ OWL là OWL-Full, OWL-Lite và

OWL-DL.
- Giao diện thiết kế trực quan có tính tƣơng tác cao.
- Biểu diễn Ontology dƣới dạng các sơ đồ trực quan.
- Giúp phát hiện lỗi trên CSDL, đảm bảo tính đầy đủ và nhất quán của

Ontology.
- Cho phép kế thừa Ontology khác thông các URL.
- Hỗ trợ suy luận trực tiếp trên Ontology dựa trên giao diện chuẩn.
- Hỗ trợ sinh mã tự động. Các mã này có thể đƣợc nhúng trực tiếp vào ứng

dụng.
1.3.2 Plugin Ontop
1.3.2.1 Tổng quan về Ontop
Ontop là một Hệ thống OBDA (Ontology-based data access) mã nguồn mở,
đƣợc phát hành theo giấy phép Apache, đƣợc phát triển tại Đại học Tự do BozenBolzano.

Ontop ánh xạ CSDL bằng cách liên kết các lớp và thuộc tính trong Ontology từ
CSDL quan hệ. Ontop biến CSDL quan hệ thành một RDF ảo. Từ đó ta có thể thực
hiện các truy vấn bằng SPARQL. Ontop sẽ tự chuyển câu truy vấn bằng SPARQL
thành câu truy vấn SQL.
Dƣới đây là kiến trúc của Ontop.

6

Hình 1.1 Kiến trúc của Ontop.
1.Inputs: Ontology, Mappings, Queries, and Databases
Ontop là hệ thống OBDA hỗ trợ tất cả các khuyến nghị của W3C liên quan đến
OBDA: OWL2QL, R2RML, SPARQL, SWRL và chế độ ký gửi OWL2QL trong
SPARQL
Ontop sử dụng RDFS và OWL2QL làm ngôn ngữ Ontology. OWL2QL dựa trên
họ DLLite đảm bảo rằng các truy vấn trên Ontology có thể đƣợc viết lại thành các truy
vấn tƣơng đƣơng trên dữ liệu quan hệ.
Ontop hỗ trợ khá tốt các tính năng của SPARQL 1.0, SPARQL 1.1 và OWL2QL
2. Ontop Core
Cốt lõi của Ontop là Quest, chịu trách nhiệm chuyển đổi các truy vấn SPARQL
trên biểu đồ RDF ảo và Ontology vào các câu truy vấn SQL trên cơ sở dữ liệu quan hệ
3.API Layer
Ngƣời dùng có thể sử dụng Ontop nhƣ là một thƣ viện Java:
OWL-API dùng để tạo, thao tác và tuần tự hóa các Ontology OWL.
- Sesame là một framework dùng để xử lý dữ liệu RDF. (the Sesame Storage
And Inference Layer) (SAIL) hỗ trợ các câu truy vấn trên cơ sở dữ liệu quan hệ.

7

4. Lớp ứng dụng (Application Layer)

Hình 1.2 Giao diện mapping CSDL của plugin Ontop

Hình 1.3 Giao diện chạy thử query SPARQL của plugin Ontop
8

Sử dụng trong Protégé: Ontop là một plugin cho Protégé dựa trên API OWL.
Plugin này cung cấp một giao diện đồ họa có nhiều chức năng liên quan đến OBDA:
chỉnh sửa ánh xạ, thực hiện truy vấn SPARQL, kiểm tra tính nhất quán của các
Ontology, bootstrapping Ontology và ánh xạ từ các cơ sở dữ liệu, nhập hoặc trích xuất
ánh xạ R2RML.

Hình 1.4 Sesame OpenRDF Workbench
Sesame OpenRDF Workbench: là một ứng dụng web để quản trị dữ liệu đƣợc
ánh xạ từ CSDLQH đến Ontology. Nó đƣợc sử dụng nhƣ là một điểm truy cập cuối
(endpoint SPARQL) để có thể truy vấn dữ liệu bằng SPARQL.
Việc sử dụng SQLPAR để truy vấn CSDL Ontology giúp tìm kiếm dữ liệu dựa
trên các suy luận, giúp tăng thêm tính logic cho thơng tin. Các ràng buộc trong
Ontology biểu diễn đƣợc các ràng buộc trong thế giới thực.
Sử dụng plugin ontop giúp ánh xạ CSDL quan hệ vào Ontology chính vì vậy ta
có thể sử dụng đƣợc các điểm mạnh của 2 CSDL Ontology và CSDLQH.

9

CHƢƠNG 2. MỘT SỐ PHƢƠNG PHÁP TÍNH ĐỘ TIN CẬY CỦA MỘT BÀI
KIỂM TRA
2.1 Phƣơng pháp cổ điển (CTT)

2.1.1 Phƣơng trình cơ bản trong lý thuyết khảo thí cổ điển [2]
di = ti + ei

(1)

Trong đó: di là điểm bài kiểm tra của học sinh i
ti là điểm thực của học sinh i
ei là sai số
Sai số là một số thực có giá trị ngẫu nhiên. Trong CTT sai số hệ thống đƣợc loại
bỏ.
Vì sai số là đại lƣợng ngẫu nhiên nên:

 Trung bình cộng sai số sẽ tiệm cận đến giá trị 0 nếu xét trên một số lƣợng lớn các
bài kiểm tra.
̄

∑

(2)

Vì vậy, trung bình cộng điểm bài làm của học sinh tƣơng đƣơng với trung bình
cộng điểm thực của họ, tức là ̄

̄

 Sai số ngẫu nhiên là độc lập với điểm thực
Để tìm điểm thực của học sinh ta có cơng thức nhƣ sau:
Với k bài tập có độ khó nhƣ nhau thì
∑

∑

(3)

Với k đủ lớn
∑

(4)

10

Nhƣ vậy:
a. Điểm thực của học sinh trong hai bài kiểm tra tƣơng đƣơng là bằng nhau.
b. Phƣơng sai trong các bài kiểm tra tƣơng đƣơng phải bằng nhau
c. Điểm làm bài của học sinh trong hai bài kiểm tra tƣơng đƣơng bất kỳ phải có
cùng một giá trị.
Từ các phƣơng trình ở trên ta có:
(5)
Phƣơng sai của điểm làm bài kiểm tra của học sinh đƣợc chia làm hai phần:
Phƣơng sai của điểm thực, và phƣơng sai của sai số ngẫu nhiên.
Từ đó ta có thể suy ra phƣơng sai của điểm làm bài kiểm tra của học sinh phải
lớn bằng phƣơng sai của điểm thực vì phƣơng sai của sai số lớn hơn hoặc bằng 0.
(6)

Tỷ lệ trên đƣợc gọi là độ tin cậy của bài kiểm tra.
Ví dụ: Với hai bài kiểm tra 1 và 2 đồng nhất về độ khó
di1 = ti1 + ei1
di2 = ti2 + ei2
và ti1 = ti2.

Đồng phƣơng sai (covariance) của di1 và di2 là tổng của 4 phần:
a

Đồng phƣơng sai giữa ti1 và ti2, chính là var(t)

b

Đồng phƣơng sai giữa ti1 và ei2, bằng 0

c

Đồng phƣơng sai giữa ei1 và ti2, bằng 0

d

Đồng phƣơng sai giữa ei1 và ei2, bằng 0

Do đó cov(d1, d2) = var(t)
Mối tƣơng quan giữa d1 và d2 = độ tin cậy của bài kiểm tra.

11

2.1.2 Cơng thức khác tính độ tin cậy
 Cơng thức dự báo của Spearman – Brown
(7)
Với y là độ tin cậy của bài kiểm tra
 là độ tin cậy của bài kiểm tra đƣợc kéo dài k lần
 Công thức Kuder – Richardson: (với những câu hỏi đúng/sai, đa lựa chọn)
K-R 20

∑

(

)

(8)

Trong đó, pi là tỷ lệ số học sinh trả lời đúng câu hỏi i
 c2 là phƣơng sai chung của cả bài kiểm tra

n là số câu hỏi của bài kiểm tra
K-R 21
(

Trong đó,

)

(9)

 c là trung bình cộng của cả bài kiểm tra

 c2 là phƣơng sai chung của cả bài kiểm tra

n là số câu hỏi của bài kiểm tra
Hệ số  Crombach
(

∑

)

Trong đó,  i2 là phƣơng sai của kết quả trả lời câu hỏi i
 c2 là phƣơng sai chung của kết quả cả bài kiểm tra

n là số câu hỏi trong bài kiểm tra
12

(10)

2.2 Phƣơng pháp hiện đại (Lý thuyết hồi đáp) [1]
Lý thuyết Trắc nghiệm cổ điển đã có nhiều đóng góp quan trọng cho hoạt động
đánh giá trong giáo dục, nhƣng cũng thể hiện một số hạn chế. Để khắc phục những
hạn chế đó các nhà nghiên cứu về khảo thí đã nghiên cứu và xây dựng một lý thuyết
mới.
Lý thuyết hồi đáp (Item Response Theory - IRT) là một lý thuyết của khoa học
về đo lƣờng trong giáo dục, ra đời từ nửa sau của thế kỷ 20 và phát triển mạnh mẽ cho
đến nay.
Lý thuyết trắc nghiệm hiện đại đƣợc xây dựng dựa trên mơ hình tốn học, địi hỏi
nhiều tính tốn, nhƣng nhờ sự tiến bộ vƣợt bậc của cơng nghệ tính tốn bằng máy tính
điện tử vào cuối thế kỷ 20 – đầu thế kỷ 21 nên nó đã phát triển nhanh chóng và đạt
đƣợc những thành tựu quan trọng.
Năng lực của học sinh và độ khó của câu hỏi là những đại lƣợng chính trong lý
thuyết hồi đáp. Những đại lƣợng này có miền giá trị đi từ -∞ đến +∞.
Lý thuyết hồi đáp quan tâm đến xác suất trả lời đúng đối với một câu hỏi. Xác
suất đó đƣợc thể hiện là một hàm số của năng lực học sinh và độ khó câu hỏi và có thể
có thêm một số tham biến khác (ví dụ: mức độ đốn mị).
Những hàm số xác suất khác nhau (thể hiện mối quan hệ giữa năng lực học sinh

và độ khó câu hỏi) dẫn đến những mơ hình lý thuyết hồi đáp khác nhau,
Xác suất trả lời đúng một câu hỏi đƣợc biểu thị bằng một hàm số liên quan đến:
năng lực của học sinh  (thể hiện dƣới một hàm số logarit tự nhiên). Xác suất đó là
hàm P() – một đƣờng cong đặc trƣng của câu hỏi (Item Characteristic Curves - ICC).

Hình 2.1 Đƣờng cong đặc trƣng của câu hỏi
13

a. Đƣờng cong tăng lên khi  tăng (năng lực của học sinh tăng thì xác
suất trả lời đúng P() tăng)
b. Đƣờng cong nằm giữa hai đƣờng thẳng y=0 và y=1 (Hàm xác suất P()
nằm giữa 0 và 1)
c. Đƣờng cong tiệm cận đến hai đƣờng thẳng y=0 và y=1
P() tiến đến 0 khi   -  và P() tiến đến 1 khi   
Xác suất biểu thị hàm số độ khó câu hỏi (là  thể hiện dƣới một hàm số logarit tự
nhiên) cho đƣờng cong đặc trƣng học sinh là hàm P() (Person Characteristic Curves PCC). Lƣu ý sự khác nhau giữa ICC và PCC.
Ở trên đã giả thiết xác suất trả lời là một hàm số đặc trƣng đơn giản cho năng lực
thí sinh. Để Lý thuyết hồi đáp có thể áp dụng đƣợc với các bài kiểm tra, các câu hỏi
phải là các đơn thứ nguyên (unidimensional). Không một công cụ đo lƣờng nào là đơn
thứ ngun chính xác. Ở đây có thể có một số thứ nguyên phụ (minor dimensions) ảnh
hƣởng đến việc trả lời câu hỏi. Liệu có hay khơng một cơng cụ là đơn thứ nguyên thỏa
đáng còn là một câu hỏi quan trọng để có thể ứng dụng Lý thuyết hồi đáp.
Nếu năng lực  của học sinh i đã đƣợc xác định, khi đó sự hiểu biết của học sinh
i để trả lời câu hỏi j không ảnh hƣởng đến khả năng có đƣợc câu trả lời đúng đối với
câu hỏi k khác.
P[ xij = 1 | , xik = 1 ] = P[ xij = 1 |  ]

(11)

Nếu điều đó sai, nghĩa là câu trả lời đối với câu hỏi j phụ thuộc vào điều gì đó
ngồi năng lực . Sự không phụ thuộc này đƣợc gọi là sự độc lập cục bộ hay sự độc
lập có điều kiện, và là kết quả của tính đơn thứ ngun. Điều đó cịn nghĩa là
P[ xij = 1, i=1,2,…,I | ] = ∏

(12)

Hầu hết các mơ hình lý thuyết hồi đáp sử dụng xác suất nhƣ một hàm số của sự
khác nhau giữa tham số năng lực  và tham số độ khó , tức là  - . Trong Mơ hình
logistic đơn giản (Mơ hình Rasch):
14

Xác suất để học sinh i trả lời đúng câu j là
P[ xij = 1 |  ] 

exp(   )

(13)

1  exp(   )

Các kết quả làm bài của học sinh (kết quả trả lời câu hỏi) có đƣợc sau khi tổ chức
làm một bài kiểm tra đƣợc sử dụng để tính tham biến năng lực và độ khó. Phƣơng
pháp sử dụng để tính các tham biến đó là phƣơng pháp có khả năng tối đa (Maximum
likelihood).
Sự tính tốn này nhằm xác định những vị trí tƣơng đối của các tham số, nhƣng
đó khơng phải là những vị trí thực
 -  = ( + c) – ( + c)

(14)

Sai số chuẩn (standard errors) của sự tính tốn này có thể tính đƣợc.
2.3 Mối quan hệ giữa Lý thuyết hồi đáp và Lý thuyết đánh giá cổ điển
Bảng 2.1 Mối quan hệ giữa IRT và CCT
Lý thuyết đánh giá
cố điển

Lý thuyết hồi
đáp

Đo năng lực

Điểm thực t

Tham biến
năng lực 

Đo độ khó

Mức độ khó

Tham biến độ
khó 

Đo độ phân
biệt

Point biserial

Tham biến
phân biệt

Đo độ chính
xác

Phƣơng sai của sai số
độ tin cậy, var(x|t)

Sai số chuẩn

Cơng thức tính
∑

∑

2.4 Ƣu nhƣợc điểm của các phƣơng pháp đánh giá
2.4.1 Lý thuyết đánh giá cổ điển
Ƣu điểm:
− Dễ tính tốn và ứng dụng trong thực tế
− Hỗ trợ khá tốt trong việc đánh giá một câu hỏi, một bộ đề kiểm tra trong
thực tế

15

Xây dựng website đánh giá độ tin cậy của bộ đề trắc nghiệm và công cụ tìm kiếm dựa trên ontology

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về