Tải bản đầy đủ (.pdf) (17 trang)

Ứng dụng dữ liệu mở liên kết trong việc nâng cao chất lượng các nguồn tài nguyên giáo dục mở

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (351.52 KB, 17 trang )

ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO
CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
Nguyễn Danh Minh Trí*
1

Tóm tắt: Tài ngun giáo dục mở (Open Educational Resources
- OER) đã trở thành một phần quan trọng trong giáo dục hiện
đại. Trong xu hướng sử dụng OER ngày càng tăng, việc xây dựng
và nâng cao chất lượng của các OER nổi bật lên như là một trong
những nhu cầu quan trọng và có ý nghĩa thực tiễn cao. OER được
xây dựng dựa trên cơ chế chia sẻ và mở rộng mạng lưới kết nối của
các cộng đồng tri thức khắp nơi trên thế giới. Nguồn dữ liệu mở mà
họ tạo ra sẽ ngày càng đa dạng và phong phú hơn, địi hỏi có một
giải pháp liên kết hiệu quả nhằm phát huy giá trị và chất lượng của
các OER này. Sử dụng dữ liệu mở liên kết (Linked Open Data - LOD)
sẽ trở thành một lựa chọn tốt. Bài viết trình bày khái quát và tầm
quan trọng của LOD, các hướng ứng dụng LOD trong việc xây dựng
và nâng cao chất lượng của các OER phục vụ cho các mục tiêu giáo
dục và phổ biến tri thức trên quy mơ tồn cầu.
Từ khóa: Linked Open Data; Open Educational Resources;
Dữ liệu mở liên kết; Tài nguyên giáo dục mở.

1. DẪN NHẬP
Dữ liệu mở là các tập dữ liệu được thu thập và chia sẻ theo một
giấy phép mở cho bất kỳ ai cũng có thể sử dụng được. Với tính chất
mở, dữ liệu mở ln ở trạng thái sẵn sàng cung cấp cho người dùng
trên môi trường trực tuyến. Dữ liệu mở thường được liên kết với nhau
Thạc sĩ, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Tp. Hồ

*


Chí Minh.


406

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

nên còn được gọi là dữ liệu mở liên kết. Tận dụng ưu thế về tính mở và
liên kết, chúng ta có thể xây dựng các nguồn dữ liệu mở phong phú, từ
đó bổ sung và nâng cao chất lượng của các kho dữ liệu. Ứng dụng các
nguồn dữ liệu mở liên kết nhằm xây dựng và nâng cao chất lượng các
nguồn tài nguyên giáo dục mở là một hướng đi phù hợp với nhiều cơ
hội phát triển cũng như thách thức mới.

2. KHÁI QUÁT VỀ DỮ LIỆU MỞ LIÊN KẾT VÀ TÀI NGUYÊN GIÁO DỤC MỞ
2.1. Dữ liệu mở liên kết (Linked Open Data – LOD)
Dữ liệu mở mang tính chất tương tự như các loại dữ liệu khác [19].
Dữ liệu mở có thể là các tập dữ liệu được thu thập của chính phủ (như
data.gov, data.gov.uk…), dữ liệu từ các nghiên cứu và tạp chí khoa
học (open access journals), dữ liệu văn bản hoặc dữ liệu đa phương
tiện được cộng đồng đóng góp (như wikipedia, wikihow...). Đặc điểm
chung của tất cả những nguồn dữ liệu đó là chúng đều được liên kết
với nhau và được xây dựng dựa trên các đóng góp của cộng đồng
người dùng thông qua giấy phép chia sẻ tương tự. Theo đó, dữ liệu mở
là các dữ liệu điện tử hoặc dữ liệu số phải được tự do sẵn có cho mọi
người sử dụng và tái xuất bản theo ý muốn mà không bị hạn chế bởi
bản quyền, bằng sáng chế hoặc các cơ chế kiểm sốt khác [13][42]. Các
tính năng chính của dữ liệu mở bao gồm [34]:
Tính sẵn sàng và sự truy cập: dữ liệu mở phải sẵn sàng một cách
tổng thể và khơng nhiều hơn chi phí tái sinh hợp lý, được tải về qua

Internet. Dữ liệu đó cũng phải là sẵn sàng ở dạng thuận tiện và có khả
năng tùy biến được.
Tính tái sử dụng và phân phối lại: dữ liệu mở phải được cung cấp
theo các điều khoản cho phép sử dụng lại và phân phối lại, bao gồm cả
việc trộn lẫn với các tập hợp dữ liệu khác.
Tính cộng đồng: đề cập đến sự tham gia tồn cầu của người
dùng. Mọi người phải có khả năng sử dụng, sử dụng lại và phân phối
lại. Khơng có sự phân biệt giữa các lĩnh vực của đời sống hoặc giữa con
người hoặc các nhóm người.


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ

Theo xu thế phát triển mới, các nguồn dữ liệu mở sẽ khơng ngừng
được phát sinh và hịa vào dịng chảy dữ liệu lớn đa dạng cả về quy mô
và chất lượng. Rất nhiều hệ thống khác nhau sẽ tham gia vào quá trình
lưu trữ và phân phối dữ liệu mở [26]. Điều này đã tạo ra dòng chảy dữ
liệu mở đang gia tăng một cách nhanh chóng trên tồn cầu. Về cơ bản,
dữ liệu mở không cần phải liên kết với nhau. Tuy nhiên, dữ liệu mở
sẽ phát huy tối đa lợi thế và giá trị của nó khi được liên kết với những
nguồn dữ liệu khác, nhất là trong việc xây dựng các nguồn tài nguyên
giáo dục hay những kho tri thức mở trực tuyến. Do vậy, dữ liệu liên kết
đã dần trở nên khá phổ biến.
Dữ liệu liên kết (Linked Data – LD) là tập hợp dữ liệu có ý nghĩa
được xác định rõ ràng, được xây dựng dựa trên các nguyên tắc thiết kế
để chia sẻ các dữ liệu được kết nối với nhau trên môi trường Web mà
máy có thể đọc được [2][27][36][41]. Các liên kết này tồn tại thơng qua
kết nối mạng và đều có ứng dụng hỗ trợ máy có thể đọc và xử lý tự
động [40]. Nhờ có dữ liệu liên kết mà rất nhiều nội dung trên Web đã
được xây dựng một cách phong phú, đa dạng tạo điều kiện cho Web

ngữ nghĩa phát triển mạnh mẽ.
Dữ liệu được lưu trữ trong các hệ thống hiện nay có khối lượng rất
lớn và đa dạng [22], trong đó dữ liệu mở liên kết chiếm một vai trò khá
quan trọng. Dữ liệu mở liên kết (Linked Open Data – LOD) là sự pha trộn
của dữ liệu liên kết và dữ liệu mở. Do vậy, có thể nói LOD là tập các dữ
liệu vừa được liên kết với nhau và được xây dựng dựa trên các nguồn dữ
liệu mở. Để có được những nguồn LOD chất lượng sẽ cần có sự đầu tư
bài bản và khả năng truy cập hiệu quả về mặt công nghệ, nhất là truy cập
mở. Xây dựng chính sách truy cập mở là điều kiện cần thiết để phát triển
các nguồn OER chất lượng [10]. Sự phát triển nhanh chóng của công nghệ
Web, đặc biệt là công nghệ Web ngữ nghĩa (Semantic Web - SW) đã và
đang thay đổi cách thức lưu trữ và phổ biến thơng tin, trong số đó có LOD
[18][35]. LOD sẽ tạo nên các kết nối dữ liệu có cấu trúc trên SW, từ đó hỗ
trợ quá trình xuất bản thơng tin được nhanh chóng và hiệu quả.
LOD có nhiều lợi ích và được ứng dụng rộng rãi trên thực tế. Một
ví dụ phổ biến của LOD là cơ sở dữ liệu Dbpedia. Dbpedia là một dự

407


408

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

án tận dụng nguồn lực cộng đồng để trích xuất thơng tin có cấu trúc
từ Wikipedia và làm cho các thông tin này sẵn sàng trên Web để cung
cấp cho các ứng dụng khác. LOD trong Dbpedia rất đa dạng và sẽ còn
nhiều cơ hội phát triển hơn nữa trong tương lai.

2.2. Tài nguyên giáo dục mở (Open Educational Resources - OER)

Trên thế giới đã có rất nhiều nguồn OER được xây dựng dựa trên
nền tảng dữ liệu mở [1] và phần lớn chúng được đóng góp bởi các cộng
đồng tri thức thơng qua mơi trường Web [7][28]. OER là các nội dung
kỹ thuật số với mục đích giáo dục, được cung cấp sẵn sàng để nhà
nghiên cứu, giáo viên và người học có thể sử dụng lại một cách tự do
[29]. Theo đó, có thể hiểu OER là các tài nguyên giảng dạy, học tập và
nghiên cứu nằm trong miền công cộng hoặc đã được phát hành theo
giấy phép mở cho phép người khác sử dụng miễn phí và tái sử dụng
lại các nguồn tài nguyên này. Xu hướng sử dụng OER đang ngày càng
tăng lên một cách nhanh chóng trên thế giới. Ứng dụng OER để cải
thiện chất lượng quá trình dạy và học đã được khuyến khích bởi các tổ
chức lớn, ví dụ như UNESCO trong tuyên bố năm 2012 [7][16], Ủy ban
châu Âu và các sáng kiến chính phủ mở [4][5].
OER có một tầm ảnh hưởng lớn trong giáo dục, đặc biệt là giáo
dục mở. Trong đó, tính mở của các nguồn dữ liệu có ảnh hưởng lớn
đến chất lượng đào tạo [20][21]. Tính mở của các OER khơng chỉ tác
động đến việc dạy và học, mà nó cịn ảnh hưởng đến q trình nghiên
cứu và chính sách của các tổ chức giáo dục. Các nhà cung cấp OER có
thể là các trường đại học, tổ chức học thuật và nghiên cứu, các sáng
kiến của chính phủ và cộng đồng giáo dục, nơi xuất bản các tài nguyên
giáo dục theo giấy phép mở trên phạm vi công cộng thông qua môi
trường Web.
OER cung cấp tri thức dưới dạng các thành phần nội dung kỹ
thuật số đa dạng đến nhiều đối tượng học tập (Learning Object – LO)
nhằm mục đích giáo dục. LO được định nghĩa là bất kỳ thực thể nào,
tồn tại dưới dạng kỹ thuật số hoặc không phải kỹ thuật số có thể được
dùng và tái sử dụng cho việc học tập, đào tạo và huấn luyện. Theo đó,


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ


OER có thể được xem như là một dạng LO. LO được thu thập và tổ
chức lưu trữ trong Kho lưu trữ Đối tượng Học tập (Learning Object
Repositories). Kho này lưu trữ cả LO và siêu dữ liệu (Metadata) của
chúng. Siêu dữ liệu nhằm mục đích mơ tả LO một cách thống nhất và
ổn định, thông qua một số chức năng mơ tả quan trọng.
OER có thể được phân loại theo 2 tiêu chí: một là theo loại tài
nguyên được cung cấp bởi các trang Web OER và hai là vị trí của kho
lưu trữ tài nguyên. Theo tiêu chí thứ nhất thì OER bao gồm 4 loại là:
học liệu mở (Open Courseware – OCW), sáng kiến nội dung sáng tạo
(Content Creation Initiatives), Subject-Specific OCW OER và các Website/ kho lưu trữ OER. Theo tiêu chí thứ hai, có 3 loại OER gồm: các
trang Web OER truy cập nội dung được lưu trữ trong kho lưu trữ cục
bộ (loại A), các trang Web OER cung cấp quyền truy cập vào nội dung
được lưu trữ trên các kho lưu trữ bên ngoài, chủ yếu thông qua siêu dữ
liệu không đồng nhất (loại B), và các trang Web OER cung cấp quyền
truy cập vào kho lưu trữ cục bộ cũng như các kho lưu trữ bên ngoài,
đây là những trang Web lai (loại C) [29].
Việc xây dựng các nguồn OER chất lượng đòi hỏi thời gian và tầm
nhìn chiến lược lâu dài. OER cần phải được xây dựng và lưu trữ sao
cho tối ưu và hiệu quả nhất. Hơn nữa, hệ thống cần hỗ trợ việc tìm
kiếm, định vị tài nguyên một cách hợp lý và dễ dàng truy cập khi cần
thiết. Một số thách thức đang tồn tại bao gồm: khả năng tương tác giữa
các kho lưu trữ OER thuộc loại riêng biệt vẫn cịn rất yếu, siêu dữ liệu
(Metadata) khơng được tiêu chuẩn hóa trong các kho lưu trữ và vấn
đề gán sai nhãn tài nguyên vẫn còn xảy ra. Vẫn cần nhiều thời gian để
khắc phục dần các nhược điểm còn tồn tại trong các kho lưu trữ OER
nhằm nâng cao chất lượng các nguồn tài nguyên này.

2.3. Giới thiệu một số nguồn OER phổ biến
2.3.1. Wikipedia

Wikipedia là một Website cung cấp thơng tin dưới dạng bách khoa
tồn thư mở. Các nội dung được lưu trữ trên Wikipedia rất phong phú
và đa dạng, là các nguồn OER bao trùm hầu hết lĩnh vực trong đời

409


410

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

sống con người. Bài viết và nội dung trên Wikipedia thường được phát
hành theo giấy phép sáng tạo chung (Creative Commons-CC) với các
yêu cầu Ghi công-Chia sẻ tương tự nghĩa là bất kỳ ai cũng có quyền
tham gia chỉnh sửa và đóng góp cho các nội dung trên Website này
[38]. Điều này vừa là lợi thế khi tận dụng được nguồn lực cộng đồng
để xây dựng nội dung [39], nhưng cũng vừa là khuyết điểm vì khả năng
kiểm duyệt còn hạn chế trong khi một khối lượng nội dung khơng phù
hợp vẫn cịn tồn tại trong hệ thống và cần được chỉnh sửa.

2.3.2. WikiHow
WikiHow là một trang Web chia sẻ cách thức làm mọi việc rất phổ
biến, giúp người dùng có thể tìm ra giải pháp cho những vấn đề gặp
phải trong cuộc sống một cách dễ dàng và nhanh chóng [24][37]. Cũng
như Wikipedia, phần lớn bài viết trên WikiHow đều được chia sẻ theo
giấy phép CC và cho phép người dùng có thể tham gia chỉnh sửa và
đóng góp. WikiHow có thể được xem như một công cụ hiệu quả trong
việc xây dựng các nguồn OER [24]. Mặc dù WikiHow tiếng Việt chưa
được phổ biến, cộng đồng người dùng ở Việt Nam vẫn đang có nhiều
nỗ lực nhằm xây dựng và khuyến khích sự phát triển của Website hữu

ích này. Tính đến năm 2018, WikiHow đã có sẵn trong 18 ngơn ngữ với
hơn 200.000 bài báo hướng dẫn cách thức bằng tiếng Anh, hơn 3.000 bài
viết bằng tiếng Việt [24] và vẫn đang còn tiếp tục phát triển nhiều hơn.

2.3.3. VOER
Chương trình Tài nguyên Giáo dục Mở Việt Nam (Vietnam Open
Educational Resources – VOER) được hỗ trợ bởi Quỹ Việt Nam (the
Vietnam Foundation) với mục tiêu xây dựng kho tài nguyên giáo dục
mở cho người Việt sử dụng và truy nhập miễn phí nguồn tài liệu hữu
ích phục vụ giảng dạy, học tập và nghiên cứu, cũng như phục vụ cho
toàn xã hội [32]. VOER xây dựng các nguồn tài nguyên dựa trên cơ chế
huy động đóng góp từ cộng đồng người dùng là các giảng viên trong
các trường đại học, các viện nghiên cứu... [20][25]. Người dùng có thể
đóng góp nội dung dưới dạng các module nhỏ [23], từ đó thì các nguồn
OER sẽ được liên kết lại để có một kho tri thức đồ sộ, phủ kín các lĩnh


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ

vực và sẵn sàng cho việc tạo ra các tài liệu phục vụ cho việc học tập,
giảng dạy và nghiên cứu một cách hiệu quả.

2.3.4. Hệ tri thức Việt số hóa [9]
Hệ tri thức Việt số hóa (itrithuc.vn) là một hệ thống tổng hợp các tài
liệu được số hóa và lưu trữ nhằm phổ biến tri thức cho toàn xã hội. Đây
là một trong những nguồn lực chiến lược quốc gia quan trọng. Hệ thống đã
thu hút một lượng lớn người dùng tham gia với vai trị vừa khai thác,
vừa đóng góp để làm giàu các nguồn OER và kho tri thức mở của Việt
Nam. Hệ tri thức Việt số hóa được tổng hợp từ hai nguồn chính: nguồn
tri thức cơ bản có sẵn được xây dựng từ nhiều chuyên gia giáo dục đến

từ các lĩnh vực như chính trị, kỹ thuật, khoa học, công nghệ... và nguồn
tri thức cộng đồng được thu thập và liên tục cập nhật gồm các tri thức
khoa học thường thức trong đời sống xã hội như: chăm sóc sức khỏe, y
tế, phịng chống dịch bệnh, trồng trọt, chăn nuôi.

3. ỨNG DỤNG LOD TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN OER
Như đã trình bày ở mục 1.1, Web ngữ nghĩa (SW) là Web của dữ
liệu [3][6][43]. SW cung cấp một khung tiêu chuẩn chung cho phép tích
hợp một lượng lớn dữ liệu ngữ nghĩa vào mơi trường Web. Tuy nhiên,
để xây dựng được SW thì chúng ta cần có một lượng lớn dữ liệu có liên
quan đến từ nhiều nguồn khác nhau, đặc biệt là LOD. Lượng dữ liệu
này cần được lưu trữ ở định dạng chuẩn để có thể truy cập và quản lý
bằng các cơng cụ của SW.
Có nhiều phương án nhằm nâng cao chất lượng các nguồn OER.
Một trong những hướng đi phổ biến trong xây dựng các nguồn OER là
sử dụng LOD để liên kết các nguồn dữ liệu mở đã và đang được thu
thập [14]. LOD mô tả phương pháp xuất bản dữ liệu để máy có thể đọc được và
cho phép dữ liệu từ các nguồn khác nhau được kết nối và truy vấn thông qua việc
sử dụng các công nghệ được liên kết như SPARQL và RDF [2][11][29][31][33].
Kế hoạch 5 Sao (5 Stars scheme) triển khai LOD dần dần theo giấy phép
sẽ góp phần xây dựng các nguồn dữ liệu mở, giúp cho các nguồn thông
tin trở nên công khai và phù hợp để sử dụng với LOD. Từ đó có thể nâng
cao khả năng truy cập, tái sử dụng và phối lại các nguồn OER thông qua
công nghệ LOD.

411


412


PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

Tim Berners-Lee, người phát minh World Wide Web, đã nêu lên
một hướng đi mới thông qua việc thiết kế LOD vào năm 2006 [31]. Ông
cũng đồng thời cung cấp các chỉ dẫn về việc sử dụng các cơng nghệ
Web được chuẩn hóa để thiết lập các liên kết ở cấp độ dữ liệu giữa các
nguồn dữ liệu khác nhau. Trên cơ sở đó, chúng ta sẽ tận dụng khả năng
liên kết ngữ nghĩa và các nguồn lực cộng đồng để làm phong phú thêm
các nguồn OER đang được lưu trữ trong những hệ thống hiện tại.

3.1. Các nguyên tắc xây dựng nguồn LOD
Để xây dựng được Web của LOD, cần có các điều kiện tiên quyết
như: dữ liệu có thể được tham chiếu trên Web, và người dùng có thể
cung cấp các đường liên kết Web tới dữ liệu này từ bên trong dữ liệu
của riêng họ [8]. Tim Berners-Lee đã đề xuất bốn nguyên tắc của LOD
nhằm xuất bản dữ liệu trên Web dưới dạng LOD [2][11][29][31][33]:
Sử dụng URI làm tên cho mọi thứ. Mã nhận diện tài nguyên
thống nhất (Uniform Resource Identifier – URI), còn gọi là mã nhận
diện mở, là nhận diện duy nhất cho tất cả mọi thứ được kết nối sao
cho chúng ta có thể phân biệt được giữa các thứ đó, tích hợp chúng
mà khơng bị lẫn lộn với nhau. URI là một hệ thống nhận dạng toàn
cầu duy nhất [6][11][12][17] được sử dụng để đặt tên duy nhất cho bất
kỳ thứ gì – từ những nội dung kỹ thuật số có sẵn trên Web đến các đối
tượng trong thế giới thực và các khái niệm trừu tượng.
Sử dụng các URI HTTP để người dùng có thể tra cứu những
tên đó. Giao thức HTTP cung cấp một cơ chế đơn giản để truy xuất tài
nguyên, khi các nguồn dữ liệu mở có thể được xác định bởi URI kết
hợp với giao thức này. Điều này sẽ làm cho các nguồn dữ liệu trở nên
dễ tìm hơn. Kết quả của quá trình này sẽ cho phép chúng ta xuất bản
bất kỳ loại dữ liệu nào và thêm nó vào khơng gian dữ liệu tồn cầu.

Khi ai đó tra cứu URI, chúng ta cần cung cấp thơng tin hữu ích sử
dụng các tiêu chuẩn RDF và SPARQL [15][30]. Khung Mô tả Tài ngun
(Resource Description Framework – RDF) là mơ hình tiêu chuẩn, một
định dạng biểu diễn dựa trên đồ thị cho việc xuất bản và trao đổi dữ liệu
trên Web được tổ chức W3C phát triển. RDF là tiêu chuẩn được sử dụng


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ

trong cơ sở dữ liệu đồ thị ngữ nghĩa, còn được tham chiếu tới như là bộ
3 RDF (RDF triplestore). Không giống như cơ sở dữ liệu quan hệ, bộ ba
này là một công nghệ được phát triển để lưu trữ dữ liệu được kết nối với
nhau và có khả năng hỗ trợ việc suy ra các dữ kiện mới từ những dữ liệu
hiện có. Bên cạnh đó, SPARQL là ngơn ngữ truy vấn được W3C chuẩn
hóa để lấy và thao tác dữ liệu được lưu trữ ở định dạng RDF. Như vậy, nó
cho phép chúng ta có thể tìm kiếm trên Web dữ liệu (SW hoặc bất kỳ cơ
sở dữ liệu nào) và tìm ra các mối liên kết hữu dụng. Từ đó có được khả
năng làm giàu các nguồn dữ liệu hiện có của mình.
Bao gồm các liên kết đến các URI khác để người dùng có thể
khám phá được nhiều thứ hơn. Tương tự với Web siêu văn bản, các liên
kết đến các URI khác làm cho dữ liệu được kết nối với nhau và cho phép
chúng ta tìm thấy những thứ đang cần. Bằng cách liên kết thơng tin mới
với các tài ngun hiện có, chúng ta sẽ tối đa hóa việc tái sử dụng và liên
kết lẫn nhau giữa các dữ liệu hiện có và tạo ra một mạng lưới liên kết
phong phú có ý nghĩa có thể xử lý bằng các hệ thống máy tính.

Hình 1. Mối liên hệ của bốn nguyên tắc thiết kế dữ liệu liên kết
đề xuất bởi Tim Berners-Lee vào năm 2006 [27]
Sau khi có được Web của LOD, bước tiếp theo chúng ta sẽ ứng
dụng mơ hình 5 Sao nhằm phát triển đa dạng các nguồn dữ liệu mở.

Từ đó sẽ có nền tảng tốt để ứng dụng LOD nâng cao chất lượng các
nguồn OER.

413


414

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

3.2. Triển khai mơ hình 5 Sao cho LOD và cấp phép cho dữ liệu mở
Tim Berners-Lee đã đề xuất một kế hoạch triển khai 5 Sao áp dụng
cho LOD. Phương pháp này mô tả cách thơng tin có thể được cơng khai
nhằm xây dựng các nguồn LOD trong đó dữ liệu sẽ được kết nối và
làm phong phú thêm mối quan hệ với các tập dữ liệu khác. Việc triển
khai kế hoạch 5 Sao không cung cấp các khía cạnh kỹ thuật mà nhằm
mục tiêu khuyến khích các chủ sở hữu dữ liệu tuân thủ các nguyên tắc
của LOD. Bảng 1 [29] cho thấy các ngôi sao và mô tả tương ứng của
chúng về mức độ tuân thủ.

Bảng 1. Kế hoạch triển khai 5 Sao của dữ liệu mở
Kế hoạch triển khai 5 Sao chỉ dành cho dữ liệu mở, vì vậy tính mở
của nguồn dữ liệu đóng vai trị rất quan trọng. Tính mở của dữ liệu đề
cập đến khả năng truy cập, sử dụng, sửa đổi và chia sẻ dữ liệu tự do theo
một giấy phép mở. Theo đó, giấy phép CC đã trở nên khá phổ biến vì nó
đảm bảo các đặc điểm của “Mở” theo định nghĩa ở trên và các nguồn dữ
liệu mở chỉ nên có một trong các giấy phép được thể hiện trong Bảng 2.

Bảng 2. Giấy phép Creative Commons (CC) [29]



ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ

CC cung cấp siêu dữ liệu để máy có thể đọc được và thể hiện lên
các trang tài liệu, cho phép phần mềm hiểu rằng chúng ta đã áp dụng
giấy phép cho tài nguyên và có thể lấy lại một số siêu dữ liệu được mã
hóa trong RDF. Sau khi đã đảm bảo về mặt tuân thủ giấy phép, chúng
ta sang bước kế tiếp rất quan trọng đó là ứng dụng các nguồn LOD đã
được cấp phép để nâng cao chất lượng các nguồn OER.

3.3. Sử dụng LOD để nâng cao chất lượng các nguồn OER
Các nguồn dữ liệu mở rất đa dạng và chúng ta hồn tồn có thể
tận dụng lợi thế về tính mở của chúng để tạo nên các mối liên kết hiệu
quả giữa các nguồn dữ liệu đang được lưu trữ ở những kho khác nhau.
Các ứng dụng có thể tập trung vào việc cho phép người dùng truy cập
và truy vấn LOD trong mối tương quan với các OER như sau:
Sử dụng URI làm tên cho OER và đây là con số nhận dạng duy
nhất. Ví dụ: URI dùng cho: người tạo OER, lĩnh vực kiến thức của OER,
cấp độ đối tượng của OER, định dạng chính của OER và các mơ tả khác.
Các OER tương ứng có thể được tìm thấy thơng qua URL (bằng
cách truy cập).
Khi ai đó tra cứu một URI mà URI này xác định một OER, ứng
dụng có thể cung cấp khả năng tích hợp với các OER khác.
OER nên được làm phong phú hơn trong mối quan hệ với
những OER khác, từ đó làm tăng khả năng kết nối giữa nhiều nguồn
OER và mở rộng hệ thống.
Bên cạnh đó, một khía cạnh quan trọng của OER là khả năng định
vị lại. Điều này có nghĩa là, người dùng có thể sử dụng tài ngun mà
khơng cần sửa đổi. Họ có thể trích xuất một phần nội dung, sau đó thay
đổi và sửa đổi lại với những phần nội dung riêng biệt. Chúng ta có thể

triển khai kế hoạch 5 Sao của LOD cho OER thông qua các bước sau:
Bước 1 (): Thực hiện cấp phép mở (Open License). Dữ liệu
phải có sẵn trên Web ở bất kỳ định dạng nào (kể cả pdf và HTML)
nhưng phải được cấp phép mở bởi vì OER được xuất bản theo giấy
phép mở.

415


416

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

Bước 2 (): Cần đảm bảo khả năng máy đọc được (Machine
Readable). Dữ liệu được chia sẻ dưới các định dạng mà máy có thể đọc
và xử lý được nội dung mà nó chứa đựng.
Chúng ta thường khơng có tiêu chuẩn cho tên dạng tài ngun,
do đó cùng một dạng tài nguyên có thể xuất hiện với nhiều tên khác
nhau trên các trang Web. Hình 2 cho thấy các tên dạng tài nguyên cho
OER Commons, ở phía bên trái và MERLOT, ở phía bên phải. Chúng
ta thấy đối với OER Commons có: HTML 84%, tài liệu có thể tải xuống
(chủ yếu là pdf) 13%; đối với MERLOT, hầu hết các định dạng tiêu biểu
là: HTML 48%, Video 38%, PDF 6% [29].

Hình 2. Lựa chọn định dạng cho tài nguyên trong OER Commons và MERLOT
(Nguồn: www.merlot.org/, OER Commons (www.oercommons.org/)
Bên cạnh đó, OER có thể bao gồm dữ liệu khơng có cấu trúc. Ví
dụ, các bảng chứa dữ liệu có thể được chèn vào các trang HTML dưới
dạng hình ảnh, do đó máy khơng thể đọc được văn bản chứa trong đó,
hoặc là bản trình chiếu khi được lưu ở định dạng pdf sẽ gây khó khăn cho

việc trích xuất hoặc sửa đổi. Với những định dạng khơng có cấu trúc
này, chúng ta cần có giải pháp lưu trữ dữ liệu sao cho có thể hỗ trợ tối
đa khả năng đọc hiểu nội dung của máy.
Bước 3 (): Hai yếu tố trên cộng với yếu tố về sử dụng định
dạng khơng độc quyền. Theo đó, chúng ta cần lưu trữ và xuất bản theo


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ

định dạng mở (Open Format), nghĩa là dữ liệu được chia sẻ dưới các
định dạng theo tiêu chuẩn mở (không bị phụ thuộc vào một nhà cung
cấp dịch vụ phần mềm ứng dụng).
Bước 4 (): Tất cả những yếu tố trên cộng thêm khả năng sử
dụng các tiêu chuẩn mở từ W3C (RDF và SPARQL) để xác định mọi thứ.
Bước 5 (): Tất cả những điều trên cộng thêm khả năng
liên kết dữ liệu của mình với dữ liệu của người khác để cung cấp ngữ
cảnh. Nó cho phép các bộ dữ liệu có thể tham chiếu lẫn nhau thơng
qua các thuật ngữ dùng chung được định nghĩa dưới dạng của một từ
điển dữ liệu. Đây là đặc điểm quan trọng nhất bởi nó cho phép dữ liệu
được tạo ra trong một tổ chức có thể tham chiếu tới dữ liệu được tạo ra
bởi một tổ chức khác (tức là không gian của dữ liệu sẽ không bị hạn chế
ở trong một tổ chức). Để đạt được cấp độ này của kế hoạch triển khai
LOD 5 Sao, chúng ta cần phải làm phong phú thêm các siêu dữ liệu, tức
là sử dụng siêu dữ liệu có cấu trúc và chính thức, đồng thời liên kết nó
với các từ vựng và bộ dữ liệu LOD đã được thiết lập trên SW.
Sau khi đã triển khai kế hoạch 5 Sao của LOD cho OER, kết hợp
với Web của LOD đã được định hình, chúng ta sẽ có nền tảng vững
chắc để nâng cao chất lượng của các OER. Vấn đề còn lại nằm ở chiến
lược xây dựng và duy trì cộng đồng đóng góp nhằm tối ưu hóa phương
thức thu thập và xử lý các dữ liệu đã được thay đổi hoặc mới phát sinh.

Quá trình xây dựng này cần nhiều thời gian và những bước đi đúng
đắn, phù hợp với mục tiêu phát triển của từng nguồn OER khác nhau.
Khuynh hướng ứng dụng LOD sẽ trở nên ngày càng phổ biến
không chỉ ở các nước phát triển mà sẽ còn lan rộng ra nhiều quốc gia
khác trên toàn cầu. Nguồn LOD sẽ góp phần quan trọng trong định
hướng xây dựng nhiều nguồn OER chất lượng nhằm phục vụ mục tiêu
giáo dục bền vững, nhất là ở các quốc gia nghèo, nơi mà việc trang bị
các phương tiện học tập còn nhiều hạn chế.

4. KẾT LUẬN
OER đã và đang góp phần quan trọng trong việc tạo dựng một
xã hội học tập rộng khắp và nâng tầm giáo dục. Nâng cao chất lượng

417


418

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

và làm phong phú các nguồn OER là một địi hỏi cấp thiết có tính
thực tiễn cao. Ứng dụng LOD là một trong những phương pháp
hiệu quả nhằm nâng cao chất lượng các nguồn OER. LOD được xây
dựng dựa trên các nguồn dữ liệu mở được liên kết với nhau trong
một mạng lưới Web ngữ nghĩa đang được mở rộng và hồn thiện
khơng ngừng theo thời gian. Triển khai kế hoạch 5 Sao nhằm ứng
dụng LOD có ý nghĩa đặc biệt quan trọng, nhất là trong bối cảnh các
kho lưu trữ và nguồn dữ liệu mở vẫn còn ở trạng thái rất rời rạc và
cần được định hình lại để phù hợp hơn trong việc tạo ra các OER.
Quá trình xây dựng và nâng cao chất lượng các nguồn OER khơng

thể tách rời q trình tạo ra các nguồn LOD ngày càng đa dạng hơn.
Theo đó, để có được các nguồn LOD chất lượng cần rất nhiều sự
đầu tư cơng sức khơng chỉ về khía cạnh kỹ thuật, giấy phép mà cịn
bao gồm một tầm nhìn chiến lược lâu dài cộng thêm sự kết nối từ
cộng đồng giáo dục khắp nơi trên thế giới.

TÀI LIỆU THAM KHẢO
1.

Atenas, J., & Havemann, L. (Eds.). (2015), “Open Data as Open Educational Resources: Case studies of emerging practice”, London: Open
Knowledge, Open Education Working.

2.

C. Bizer, T. Heath and T. Berners-Lee (2009), “Linked Data - The Story so
far”, International Journal on Semantic Web and Information Systems (IJSWIS),
vol. 5, pp. 1-22.

3.

D. Dicheva and C. Dichev (2013), “Leveraging Domain Specificity to Improve Findability in OER Repositories”, Research and Advanced Technology
for Digital Libraries, Springer, pp. 466-469.

4.

(truy cập vào 15/9/2020).

5.

(truy cập vào 15/9/2020).


6.

E. Rajabi, M.-A. Sicilia and S. Sanchez-Alonso (2015), “Interlinking Educational Resources to Web of Data through IEEE LOM”, Computer Science
and Information Systems, vol. 12, no. 1, pp. 233–255.

7.

Gajaraj Dhanarajan and David Porter (2013), “Open Educational Resources:
An Asian Perspective”, Commonwealth of Learning and OER Asia, Vancouver.


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ
8.

Giáo dục mở. “Bài 13 - Liên kết lên Web dữ liệu”. Truy cập tại: https://
giaoducmo.avnuc.vn/du-lieu-mo/bai-13-lien-ket-len-Web-du-lieu-152.
html (truy cập vào 15/9/2020).

9.

Hệ sinh thái tri thức việt số hóa, “Dữ liệu mở”. Truy cập tại: (truy cập vào 15/9/2020).

10. Lê Trung Nghĩa (2018), “Giáo dục mở ở Việt Nam: Thách thức và giải
pháp”. Tạp chí Tia sáng, Số ra ngày 14/4/2018.
11. Lê Trung Nghĩa (2019), “Hai điều kiện tiên quyết cho dữ liệu mở”, Tạp chí
Tia sáng, Số 16 ra ngày 20/08/2019, tr. 14-17.
12. Librarycarpentry, “Linked Open Data”. Truy cập tại: (truy cập vào 15/9/2020).
13. Lori Bowen Ayre & Jim Craner (2017), “Open Data: What It Is and
Why YouShould Care”, Public Library Quarterly, 36:2, 173-184, DOI:

10.1080/01616846.2017.1313045.
14. Martin Kaltenböck, Mag. Florian Bauer, Mag. Andreas Blumauer (2016),
“Linked Open Data: The Essentials, A Quick Start Guide for Decision Makers”, edition mono/monochrom, Vienna, Austria, ISBN: 978-3-902796-05-9.
15. M. d’Aquin, A. Adamou and S. Dietze (2013), “Assessing the educational
linked data landscape”, Proceedings of the 5th Annual ACM Web Science
Conference, New York, USA.
16. Neil Butcher (2015), “A Basic Guide to Open Educational Resources
(OER)”, UNESCO and COL.
17. Ngomo AC.N., Auer S., Lehmann J., Zaveri A. (2014), “Introduction to
Linked Data and Its Lifecycle on the Web”, In: Koubarakis M. et al. (eds)
Reasoning Web. Reasoning on the Web in the Big Data Era. Reasoning Web
2014. Lecture Notes in Computer Science, vol 8714. Springer, Cham.
18. Nelson Piedra; Janneth Chicaiza; Jorge López; Edmundo Tovar (2013), “Using linked open data to improve the search of open educational resources
for engineering students”, 2013 IEEE Frontiers in Education Conference (FIE).
19. Nguyễn Danh Minh Trí (2019), “Vai trị và cơ hội của các thư viện trong
việc lưu trữ và quản lý dữ liệu mở phục vụ cộng đồng”, Tạp chí Thư viện
Việt Nam, Số 1-2019, tr. 24-29.
20. Nguyễn Danh Minh Trí (2017), “Vai trị của tài ngun giáo dục mở và
truy cập mở trong việc nâng cao chất lượng giáo dục đại học Việt Nam”,
Tạp chí Thư viện Việt Nam, Số 1-2017, tr. 48-53.

419


420

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM
21. Nguyễn Danh Minh Trí (2017), “Tổng quan về ảnh hưởng của tính mở
trong giáo dục đại học”, Tạp chí Thư viện Việt Nam, Số 4-2017, tr. 13-19, 44.
22. Nguyễn Danh Minh Trí (2018), “Tổng quan về Khoa học dữ liệu”, Tạp chí

Thơng tin Tư liệu, Số 6-2018, tr. 16-23.
23. Nguyễn Danh Minh Trí (2018), “Phân tích các kỹ năng cốt lõi nhằm sử
dụng và phát triển tài nguyên giáo dục mở”, Tạp chí Thư viện Việt Nam,
Số 4-2018, tr. 8-12.
24. Nguyễn Danh Minh Trí (2018), “Xây dựng các nguồn tài nguyên giáo dục
mở dựa trên nền tảng Wikihow tiếng Việt”, Tạp chí Thư viện Việt Nam, Số
2-2018, tr. 22-27.
25. Nguyễn Huy Chương, Nguyễn Tiến Hùng (2011), “Học liệu mở và hướng
phát triển tài nguyên số tại các thư viện đại học Việt Nam”, Bài viết giới
thiệu về học liệu mở, truy cập mở và những lợi ích của học liệu mở và truy cập
mở đối với công tác đào tạo và nghiên cứu khoa học, từ đó đề xuất hướng phát
triển kho tài nguyên số cho thư viện điện tử tại các đại học Việt Nam.
26. Nguyễn Thế Hùng (2019), “Giá trị của Dữ liệu mở là gì, vì sao Chính phủ nên
mở dữ liệu?”. Truy cập tại: (truy cập vào 15/9/2020).
27. Ontotext, “What are Linked Data and Linked Open Data?”. Truy cập tại:
(truy cập vào 15/9/2020).
28. P. G. West and L. Victor (2011), “Background and action paper on OER”,
The William and Flora Hewett Foundation.
29. Rosa Navarrete, Sergio Luján-Mora (2015), “Use of Linked Data to Enhance Open Educational Resources”, 14th International Conference on Information Technology Based Higher Education and Training (ITHET 2015), pp. 1-6.
30. S. Dietze, S. Sanchez-Alonso, H. Ebner, H. Qing Yu, D. Giordano, I.
Marenzi and B. Pereira Nunes (2013), “Interlinking educational resources
and the Web of data: A survey of challenges and approaches”, Program,
vol. 47, no. 1, pp. 60-91.
31. TED, “Tim Berners-Lee: The next Web of open, linked data”. Truy cập tại:
(truy cập vào 15/9/2020).
32. Thư viện học liệu mở Việt Nam, (truy cập vào
15/9/2020).


ỨNG DỤNG DỮ LIỆU MỞ LIÊN KẾT TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ

33. Tim Berners Lee, “Linked Data”. Truy cập tại: (truy cập vào 15/9/2020).
34. Trần Minh (2017), “Báo cáo tổng quan về dữ liệu mở”, Viện công nghiệp
phần mềm và nội dung số Việt Nam, Bộ Thông tin và Truyền thông.
35. W3C, “Linking Open Data on the Semantic Web”. Truy cập tại: http://
www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/
CommonVocabularies (truy cập vào 15/9/2020).
36. W3C, “Linked Data”. Truy cập tại: (truy cập vào 15/9/2020).
37. Wikihow, (truy cập vào 15/9/2020).
38. Wikipedia, (truy cập vào 15/9/2020).
39. Wikipedia, Crowdsourcing. Truy cập tại: />Crowdsourcing (truy cập vào 15/9/2020).
40. Wikipedia, “Dữ liệu liên kết”. Truy cập tại: />Dữ_liệu_liên_kết (truy cập vào 15/9/2020).
41. Wikipedia, “Linked Data”. Truy cập tại: />Linked_data (truy cập vào 15/9/2020).
42. Wikipedia, “Open Data”. Truy cập tại: />Open_data (truy cập vào 15/9/2020).
43. Yoose, B., & Perkins, J. (2013). “The linked open data landscape in libraries and beyond”. Journal of Library Metadata, 13(2-3), pp. 197-211.

421



×