Tải bản đầy đủ (.pdf) (17 trang)

Ứng dụng dữ liệu mở liên kết trong việc nâng cao chất lượng các nguồn tài nguyên giáo dục mở

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (351.52 KB, 17 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

<b>CHẤT LƯỢNG CÁC NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ</b>



<b>Nguyễn Danh Minh Trí</b>

<b>1</b>

<b>*</b>


<b>Tóm tắt: Tài ngun giáo dục mở (Open Educational Resources </b>


<i>- OER) đã trở thành một phần quan trọng trong giáo dục hiện </i>
<i>đại. Trong xu hướng sử dụng OER ngày càng tăng, việc xây dựng </i>
<i>và nâng cao chất lượng của các OER nổi bật lên như là một trong </i>
<i>những nhu cầu quan trọng và có ý nghĩa thực tiễn cao. OER được </i>
<i>xây dựng dựa trên cơ chế chia sẻ và mở rộng mạng lưới kết nối của </i>
<i>các cộng đồng tri thức khắp nơi trên thế giới. Nguồn dữ liệu mở mà </i>
<i>họ tạo ra sẽ ngày càng đa dạng và phong phú hơn, địi hỏi có một </i>
<i>giải pháp liên kết hiệu quả nhằm phát huy giá trị và chất lượng của </i>
<i>các OER này. Sử dụng dữ liệu mở liên kết (Linked Open Data - LOD) </i>
<i>sẽ trở thành một lựa chọn tốt. Bài viết trình bày khái quát và tầm </i>
<i>quan trọng của LOD, các hướng ứng dụng LOD trong việc xây dựng </i>
<i>và nâng cao chất lượng của các OER phục vụ cho các mục tiêu giáo </i>
<i>dục và phổ biến tri thức trên quy mơ tồn cầu.</i>


<b>Từ khóa: Linked Open Data; Open Educational Resources; </b>
<i>Dữ liệu mở liên kết; Tài nguyên giáo dục mở.</i>


<b>1. DẪN NHẬP</b>


Dữ liệu mở là các tập dữ liệu được thu thập và chia sẻ theo một
giấy phép mở cho bất kỳ ai cũng có thể sử dụng được. Với tính chất
mở, dữ liệu mở luôn ở trạng thái sẵn sàng cung cấp cho người dùng
trên môi trường trực tuyến. Dữ liệu mở thường được liên kết với nhau
*<sub> Thạc sĩ, Trường Đại học Khoa học Xã hội & Nhân văn, Đại học Quốc gia Tp. Hồ </sub>


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

nên còn được gọi là dữ liệu mở liên kết. Tận dụng ưu thế về tính mở và


liên kết, chúng ta có thể xây dựng các nguồn dữ liệu mở phong phú, từ
đó bổ sung và nâng cao chất lượng của các kho dữ liệu. Ứng dụng các
nguồn dữ liệu mở liên kết nhằm xây dựng và nâng cao chất lượng các
nguồn tài nguyên giáo dục mở là một hướng đi phù hợp với nhiều cơ
hội phát triển cũng như thách thức mới.


<b>2. KHÁI QUÁT VỀ DỮ LIỆU MỞ LIÊN KẾT VÀ TÀI NGUYÊN GIÁO DỤC MỞ</b>


<b>2.1. Dữ liệu mở liên kết (Linked Open Data – LOD)</b>


Dữ liệu mở mang tính chất tương tự như các loại dữ liệu khác [19].
Dữ liệu mở có thể là các tập dữ liệu được thu thập của chính phủ (như
data.gov, data.gov.uk…), dữ liệu từ các nghiên cứu và tạp chí khoa
học (open access journals), dữ liệu văn bản hoặc dữ liệu đa phương
tiện được cộng đồng đóng góp (như wikipedia, wikihow...). Đặc điểm
chung của tất cả những nguồn dữ liệu đó là chúng đều được liên kết
với nhau và được xây dựng dựa trên các đóng góp của cộng đồng
người dùng thông qua giấy phép chia sẻ tương tự. Theo đó, dữ liệu mở
là các dữ liệu điện tử hoặc dữ liệu số phải được tự do sẵn có cho mọi
người sử dụng và tái xuất bản theo ý muốn mà không bị hạn chế bởi
bản quyền, bằng sáng chế hoặc các cơ chế kiểm sốt khác [13][42]. Các
tính năng chính của dữ liệu mở bao gồm [34]:


 <i>Tính sẵn sàng và sự truy cập</i>: dữ liệu mở phải sẵn sàng một cách
tổng thể và không nhiều hơn chi phí tái sinh hợp lý, được tải về qua
Internet. Dữ liệu đó cũng phải là sẵn sàng ở dạng thuận tiện và có khả
năng tùy biến được.


 <i>Tính tái sử dụng và phân phối lại</i>: dữ liệu mở phải được cung cấp
theo các điều khoản cho phép sử dụng lại và phân phối lại, bao gồm cả
việc trộn lẫn với các tập hợp dữ liệu khác.



</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

Theo xu thế phát triển mới, các nguồn dữ liệu mở sẽ không ngừng
được phát sinh và hòa vào dòng chảy dữ liệu lớn đa dạng cả về quy mô
và chất lượng. Rất nhiều hệ thống khác nhau sẽ tham gia vào quá trình
lưu trữ và phân phối dữ liệu mở [26]. Điều này đã tạo ra dòng chảy dữ
liệu mở đang gia tăng một cách nhanh chóng trên tồn cầu. Về cơ bản,
dữ liệu mở không cần phải liên kết với nhau. Tuy nhiên, dữ liệu mở
sẽ phát huy tối đa lợi thế và giá trị của nó khi được liên kết với những
nguồn dữ liệu khác, nhất là trong việc xây dựng các nguồn tài nguyên
giáo dục hay những kho tri thức mở trực tuyến. Do vậy, dữ liệu liên kết
đã dần trở nên khá phổ biến.


Dữ liệu liên kết (Linked Data – LD) là tập hợp dữ liệu có ý nghĩa
được xác định rõ ràng, được xây dựng dựa trên các nguyên tắc thiết kế
để chia sẻ các dữ liệu được kết nối với nhau trên môi trường Web mà
máy có thể đọc được [2][27][36][41]. Các liên kết này tồn tại thơng qua
kết nối mạng và đều có ứng dụng hỗ trợ máy có thể đọc và xử lý tự
động [40]. Nhờ có dữ liệu liên kết mà rất nhiều nội dung trên Web đã
được xây dựng một cách phong phú, đa dạng tạo điều kiện cho Web
ngữ nghĩa phát triển mạnh mẽ.


Dữ liệu được lưu trữ trong các hệ thống hiện nay có khối lượng rất
lớn và đa dạng [22], trong đó dữ liệu mở liên kết chiếm một vai trò khá
quan trọng. Dữ liệu mở liên kết (Linked Open Data – LOD) là sự pha trộn
của dữ liệu liên kết và dữ liệu mở. Do vậy, có thể nói LOD là tập các dữ
liệu vừa được liên kết với nhau và được xây dựng dựa trên các nguồn dữ
liệu mở. Để có được những nguồn LOD chất lượng sẽ cần có sự đầu tư
bài bản và khả năng truy cập hiệu quả về mặt công nghệ, nhất là truy cập
mở. Xây dựng chính sách truy cập mở là điều kiện cần thiết để phát triển
các nguồn OER chất lượng [10]. Sự phát triển nhanh chóng của công nghệ


Web, đặc biệt là công nghệ Web ngữ nghĩa (Semantic Web - SW) đã và
đang thay đổi cách thức lưu trữ và phổ biến thông tin, trong số đó có LOD
[18][35]. LOD sẽ tạo nên các kết nối dữ liệu có cấu trúc trên SW, từ đó hỗ
trợ q trình xuất bản thơng tin được nhanh chóng và hiệu quả.


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

án tận dụng nguồn lực cộng đồng để trích xuất thơng tin có cấu trúc
từ Wikipedia và làm cho các thơng tin này sẵn sàng trên Web để cung
cấp cho các ứng dụng khác. LOD trong Dbpedia rất đa dạng và sẽ còn
nhiều cơ hội phát triển hơn nữa trong tương lai.


<b>2.2. Tài nguyên giáo dục mở (Open Educational Resources - OER)</b>


Trên thế giới đã có rất nhiều nguồn OER được xây dựng dựa trên
nền tảng dữ liệu mở [1] và phần lớn chúng được đóng góp bởi các cộng
đồng tri thức thông qua môi trường Web [7][28]. OER là các nội dung
kỹ thuật số với mục đích giáo dục, được cung cấp sẵn sàng để nhà
nghiên cứu, giáo viên và người học có thể sử dụng lại một cách tự do
[29]. Theo đó, có thể hiểu OER là các tài nguyên giảng dạy, học tập và
nghiên cứu nằm trong miền công cộng hoặc đã được phát hành theo
giấy phép mở cho phép người khác sử dụng miễn phí và tái sử dụng
lại các nguồn tài nguyên này. Xu hướng sử dụng OER đang ngày càng
tăng lên một cách nhanh chóng trên thế giới. Ứng dụng OER để cải
thiện chất lượng quá trình dạy và học đã được khuyến khích bởi các tổ
chức lớn, ví dụ như UNESCO trong tuyên bố năm 2012 [7][16], Ủy ban
châu Âu và các sáng kiến chính phủ mở [4][5].


OER có một tầm ảnh hưởng lớn trong giáo dục, đặc biệt là giáo
dục mở. Trong đó, tính mở của các nguồn dữ liệu có ảnh hưởng lớn
đến chất lượng đào tạo [20][21]. Tính mở của các OER khơng chỉ tác
động đến việc dạy và học, mà nó cịn ảnh hưởng đến q trình nghiên


cứu và chính sách của các tổ chức giáo dục. Các nhà cung cấp OER có
thể là các trường đại học, tổ chức học thuật và nghiên cứu, các sáng
kiến của chính phủ và cộng đồng giáo dục, nơi xuất bản các tài nguyên
giáo dục theo giấy phép mở trên phạm vi công cộng thông qua môi
trường Web.


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

OER có thể được xem như là một dạng LO. LO được thu thập và tổ
chức lưu trữ trong Kho lưu trữ Đối tượng Học tập (Learning Object
Repositories). Kho này lưu trữ cả LO và siêu dữ liệu (Metadata) của
chúng. Siêu dữ liệu nhằm mục đích mơ tả LO một cách thống nhất và
ổn định, thông qua một số chức năng mô tả quan trọng.


OER có thể được phân loại theo 2 tiêu chí: một là theo loại tài
nguyên được cung cấp bởi các trang Web OER và hai là vị trí của kho
lưu trữ tài nguyên. Theo tiêu chí thứ nhất thì OER bao gồm 4 loại là:
học liệu mở (Open Courseware – OCW), sáng kiến nội dung sáng tạo
(Content Creation Initiatives), Subject-Specific OCW OER và các
Web-site/ kho lưu trữ OER. Theo tiêu chí thứ hai, có 3 loại OER gồm: các
trang Web OER truy cập nội dung được lưu trữ trong kho lưu trữ cục
bộ (loại A), các trang Web OER cung cấp quyền truy cập vào nội dung
được lưu trữ trên các kho lưu trữ bên ngồi, chủ yếu thơng qua siêu dữ
liệu không đồng nhất (loại B), và các trang Web OER cung cấp quyền
truy cập vào kho lưu trữ cục bộ cũng như các kho lưu trữ bên ngoài,
đây là những trang Web lai (loại C) [29].


Việc xây dựng các nguồn OER chất lượng đòi hỏi thời gian và tầm
nhìn chiến lược lâu dài. OER cần phải được xây dựng và lưu trữ sao
cho tối ưu và hiệu quả nhất. Hơn nữa, hệ thống cần hỗ trợ việc tìm
kiếm, định vị tài nguyên một cách hợp lý và dễ dàng truy cập khi cần
thiết. Một số thách thức đang tồn tại bao gồm: khả năng tương tác giữa


các kho lưu trữ OER thuộc loại riêng biệt vẫn còn rất yếu, siêu dữ liệu
(Metadata) khơng được tiêu chuẩn hóa trong các kho lưu trữ và vấn
đề gán sai nhãn tài nguyên vẫn còn xảy ra. Vẫn cần nhiều thời gian để
khắc phục dần các nhược điểm còn tồn tại trong các kho lưu trữ OER
nhằm nâng cao chất lượng các nguồn tài nguyên này.


<b>2.3. Giới thiệu một số nguồn OER phổ biến</b>
<i><b>2.3.1. Wikipedia</b></i>


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

sống con người. Bài viết và nội dung trên Wikipedia thường được phát
hành theo giấy phép sáng tạo chung (Creative Commons-CC) với các
yêu cầu Ghi công-Chia sẻ tương tự nghĩa là bất kỳ ai cũng có quyền
tham gia chỉnh sửa và đóng góp cho các nội dung trên Website này
[38]. Điều này vừa là lợi thế khi tận dụng được nguồn lực cộng đồng


<i>để xây dựng nội dung</i> [39], nhưng cũng vừa là khuyết điểm vì khả năng
kiểm duyệt còn hạn chế trong khi một khối lượng nội dung khơng phù
hợp vẫn cịn tồn tại trong hệ thống và cần được chỉnh sửa.


<i><b>2.3.2. WikiHow</b></i>


WikiHow là một trang Web chia sẻ cách thức làm mọi việc rất phổ
biến, giúp người dùng có thể tìm ra giải pháp cho những vấn đề gặp
phải trong cuộc sống một cách dễ dàng và nhanh chóng [24][37]. Cũng
như Wikipedia, phần lớn bài viết trên WikiHow đều được chia sẻ theo
giấy phép CC và cho phép người dùng có thể tham gia chỉnh sửa và
đóng góp. WikiHow có thể được xem như một cơng cụ hiệu quả trong
việc xây dựng các nguồn OER [24]. Mặc dù WikiHow tiếng Việt chưa
được phổ biến, cộng đồng người dùng ở Việt Nam vẫn đang có nhiều
nỗ lực nhằm xây dựng và khuyến khích sự phát triển của Website hữu


ích này. Tính đến năm 2018, WikiHow đã có sẵn trong 18 ngơn ngữ với
hơn 200.000 bài báo hướng dẫn cách thức bằng tiếng Anh, hơn 3.000 bài
viết bằng tiếng Việt [24] và vẫn đang còn tiếp tục phát triển nhiều hơn.
<i><b>2.3.3. VOER</b></i>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

vực và sẵn sàng cho việc tạo ra các tài liệu phục vụ cho việc học tập,
giảng dạy và nghiên cứu một cách hiệu quả.


<i><b>2.3.4. Hệ tri thức Việt số hóa [9]</b></i>


Hệ tri thức Việt số hóa (itrithuc.vn)<i> là một hệ thống tổng hợp các tài </i>
<i>liệu được số hóa và lưu trữ </i>nhằm phổ biến tri thức cho toàn xã hội. <i>Đây </i>
<i>là một trong những nguồn lực chiến lược quốc gia quan trọng</i>. Hệ thống đã
thu hút một lượng lớn người dùng tham gia với vai trị vừa khai thác,
vừa đóng góp để làm giàu các nguồn OER<i> và </i>kho tri thức mở của Việt
Nam. Hệ tri thức Việt số hóa được tổng hợp từ hai nguồn chính: nguồn
tri thức cơ bản có sẵn được xây dựng từ nhiều chuyên gia giáo dục đến
từ các lĩnh vực như chính trị, kỹ thuật, khoa học, công nghệ... và nguồn
tri thức cộng đồng được thu thập và liên tục cập nhật gồm các tri thức
khoa học thường thức trong đời sống xã hội như: chăm sóc sức khỏe, y
tế, phịng chống dịch bệnh, trồng trọt, chăn nuôi.


<b>3. ỨNG DỤNG LOD TRONG VIỆC NÂNG CAO CHẤT LƯỢNG CÁC NGUỒN OER</b>



Như đã trình bày ở mục 1.1, Web ngữ nghĩa (SW) là Web của dữ
liệu [3][6][43]. SW cung cấp một khung tiêu chuẩn chung cho phép tích
hợp một lượng lớn dữ liệu ngữ nghĩa vào môi trường Web. Tuy nhiên,
để xây dựng được SW thì chúng ta cần có một lượng lớn dữ liệu có liên
quan đến từ nhiều nguồn khác nhau, đặc biệt là LOD. Lượng dữ liệu
này cần được lưu trữ ở định dạng chuẩn để có thể truy cập và quản lý


bằng các công cụ của SW.


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

Tim Berners-Lee, người phát minh World Wide Web, đã nêu lên
một hướng đi mới thông qua việc thiết kế LOD vào năm 2006 [31]. Ông
cũng đồng thời cung cấp các chỉ dẫn về việc sử dụng các công nghệ
Web được chuẩn hóa để thiết lập các liên kết ở cấp độ dữ liệu giữa các
nguồn dữ liệu khác nhau. Trên cơ sở đó, chúng ta sẽ tận dụng khả năng
liên kết ngữ nghĩa và các nguồn lực cộng đồng để làm phong phú thêm
các nguồn OER đang được lưu trữ trong những hệ thống hiện tại.
<b>3.1. Các nguyên tắc xây dựng nguồn LOD</b>


Để xây dựng được Web của LOD, cần có các điều kiện tiên quyết
như: dữ liệu có thể được tham chiếu trên Web, và người dùng có thể
cung cấp các đường liên kết Web tới dữ liệu này từ bên trong dữ liệu
của riêng họ [8]. Tim Berners-Lee đã đề xuất bốn nguyên tắc của LOD
nhằm xuất bản dữ liệu trên Web dưới dạng LOD [2][11][29][31][33]:


 Sử dụng URI làm tên cho mọi thứ. Mã nhận diện tài nguyên
thống nhất (Uniform Resource Identifier – URI), còn gọi là mã nhận
diện mở, là nhận diện duy nhất cho tất cả mọi thứ được kết nối sao
cho chúng ta có thể phân biệt được giữa các thứ đó, tích hợp chúng
mà không bị lẫn lộn với nhau. URI là một hệ thống nhận dạng toàn
cầu duy nhất [6][11][12][17] được sử dụng để đặt tên duy nhất cho bất
kỳ thứ gì – từ những nội dung kỹ thuật số có sẵn trên Web đến các đối
tượng trong thế giới thực và các khái niệm trừu tượng.


 Sử dụng các URI HTTP để người dùng có thể tra cứu những
tên đó. Giao thức HTTP cung cấp một cơ chế đơn giản để truy xuất tài
nguyên, khi các nguồn dữ liệu mở có thể được xác định bởi URI kết
hợp với giao thức này. Điều này sẽ làm cho các nguồn dữ liệu trở nên


dễ tìm hơn. Kết quả của quá trình này sẽ cho phép chúng ta xuất bản
bất kỳ loại dữ liệu nào và thêm nó vào khơng gian dữ liệu tồn cầu.


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

trong cơ sở dữ liệu đồ thị ngữ nghĩa, còn được tham chiếu tới như là bộ
3 RDF (RDF triplestore). Không giống như cơ sở dữ liệu quan hệ, bộ ba
này là một công nghệ được phát triển để lưu trữ dữ liệu được kết nối với
nhau và có khả năng hỗ trợ việc suy ra các dữ kiện mới từ những dữ liệu
hiện có. Bên cạnh đó, SPARQL là ngơn ngữ truy vấn được W3C chuẩn
hóa để lấy và thao tác dữ liệu được lưu trữ ở định dạng RDF. Như vậy, nó
cho phép chúng ta có thể tìm kiếm trên Web dữ liệu (SW hoặc bất kỳ cơ
sở dữ liệu nào) và tìm ra các mối liên kết hữu dụng. Từ đó có được khả
năng làm giàu các nguồn dữ liệu hiện có của mình.


 Bao gồm các liên kết đến các URI khác để người dùng có thể
khám phá được nhiều thứ hơn. Tương tự với Web siêu văn bản, các liên
kết đến các URI khác làm cho dữ liệu được kết nối với nhau và cho phép
chúng ta tìm thấy những thứ đang cần. Bằng cách liên kết thông tin mới
với các tài nguyên hiện có, chúng ta sẽ tối đa hóa việc tái sử dụng và liên
kết lẫn nhau giữa các dữ liệu hiện có và tạo ra một mạng lưới liên kết
phong phú có ý nghĩa có thể xử lý bằng các hệ thống máy tính.


Hình 1. Mối liên hệ của bốn nguyên tắc thiết kế dữ liệu liên kết
đề xuất bởi Tim Berners-Lee vào năm 2006 [27]


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

<b>3.2. Triển khai mơ hình 5 Sao cho LOD và cấp phép cho dữ liệu mở</b>


Tim Berners-Lee đã đề xuất một kế hoạch triển khai 5 Sao áp dụng
cho LOD. Phương pháp này mô tả cách thơng tin có thể được cơng khai
nhằm xây dựng các nguồn LOD trong đó dữ liệu sẽ được kết nối và
làm phong phú thêm mối quan hệ với các tập dữ liệu khác. Việc triển


khai kế hoạch 5 Sao khơng cung cấp các khía cạnh kỹ thuật mà nhằm
mục tiêu khuyến khích các chủ sở hữu dữ liệu tuân thủ các nguyên tắc
của LOD. Bảng 1 [29] cho thấy các ngôi sao và mô tả tương ứng của
chúng về mức độ tuân thủ.


Bảng 1. Kế hoạch triển khai 5 Sao của dữ liệu mở


Kế hoạch triển khai 5 Sao chỉ dành cho dữ liệu mở, vì vậy tính mở
của nguồn dữ liệu đóng vai trị rất quan trọng. Tính mở của dữ liệu đề
cập đến khả năng truy cập, sử dụng, sửa đổi và chia sẻ dữ liệu tự do theo
một giấy phép mở. Theo đó, giấy phép CC đã trở nên khá phổ biến vì nó
đảm bảo các đặc điểm của “Mở” theo định nghĩa ở trên và các nguồn dữ
liệu mở chỉ nên có một trong các giấy phép được thể hiện trong Bảng 2.


</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

CC cung cấp siêu dữ liệu để máy có thể đọc được và thể hiện lên
các trang tài liệu, cho phép phần mềm hiểu rằng chúng ta đã áp dụng
giấy phép cho tài nguyên và có thể lấy lại một số siêu dữ liệu được mã
hóa trong RDF. Sau khi đã đảm bảo về mặt tuân thủ giấy phép, chúng
ta sang bước kế tiếp rất quan trọng đó là ứng dụng các nguồn LOD đã
được cấp phép để nâng cao chất lượng các nguồn OER.


<b>3.3. Sử dụng LOD để nâng cao chất lượng các nguồn OER</b>


Các nguồn dữ liệu mở rất đa dạng và chúng ta hồn tồn có thể
tận dụng lợi thế về tính mở của chúng để tạo nên các mối liên kết hiệu
quả giữa các nguồn dữ liệu đang được lưu trữ ở những kho khác nhau.
Các ứng dụng có thể tập trung vào việc cho phép người dùng truy cập
và truy vấn LOD trong mối tương quan với các OER như sau:


 Sử dụng URI làm tên cho OER và đây là con số nhận dạng duy


nhất. Ví dụ: URI dùng cho: người tạo OER, lĩnh vực kiến thức của OER,
cấp độ đối tượng của OER, định dạng chính của OER và các mơ tả khác.


 Các OER tương ứng có thể được tìm thấy thơng qua URL (bằng
cách truy cập).


 Khi ai đó tra cứu một URI mà URI này xác định một OER, ứng
dụng có thể cung cấp khả năng tích hợp với các OER khác.


 OER nên được làm phong phú hơn trong mối quan hệ với
những OER khác, từ đó làm tăng khả năng kết nối giữa nhiều nguồn
OER và mở rộng hệ thống.


Bên cạnh đó, một khía cạnh quan trọng của OER là khả năng định
vị lại. Điều này có nghĩa là, người dùng có thể sử dụng tài nguyên mà
khơng cần sửa đổi. Họ có thể trích xuất một phần nội dung, sau đó thay
đổi và sửa đổi lại với những phần nội dung riêng biệt. Chúng ta có thể
triển khai kế hoạch 5 Sao của LOD cho OER thông qua các bước sau:


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

 Bước 2 (): Cần đảm bảo khả năng máy đọc được (Machine
Readable). Dữ liệu được chia sẻ dưới các định dạng mà máy có thể đọc
và xử lý được nội dung mà nó chứa đựng.


Chúng ta thường khơng có tiêu chuẩn cho tên dạng tài nguyên,
do đó cùng một dạng tài nguyên có thể xuất hiện với nhiều tên khác
nhau trên các trang Web. Hình 2 cho thấy các tên dạng tài nguyên cho
OER Commons, ở phía bên trái và MERLOT, ở phía bên phải. Chúng
ta thấy đối với OER Commons có: HTML 84%, tài liệu có thể tải xuống
(chủ yếu là pdf) 13%; đối với MERLOT, hầu hết các định dạng tiêu biểu
là: HTML 48%, Video 38%, PDF 6% [29].



Hình 2. Lựa chọn định dạng cho tài nguyên trong OER Commons và MERLOT
(Nguồn: www.merlot.org/, OER Commons (www.oercommons.org/)
Bên cạnh đó, OER có thể bao gồm dữ liệu khơng có cấu trúc. Ví
dụ, các bảng chứa dữ liệu có thể được chèn vào các trang HTML dưới
dạng hình ảnh, do đó máy khơng thể đọc được văn bản chứa trong đó,
hoặc là bản trình chiếu khi<i> được lưu ở định dạng pdf sẽ gây khó khăn </i>cho
việc trích xuất hoặc sửa đổi. Với những định dạng khơng có cấu trúc
này, chúng ta cần có giải pháp lưu trữ dữ liệu sao cho có thể hỗ trợ tối
đa khả năng đọc hiểu nội dung của máy.


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

định dạng mở (Open Format), nghĩa là dữ liệu được chia sẻ dưới các
định dạng theo tiêu chuẩn mở (không bị phụ thuộc vào một nhà cung
cấp dịch vụ phần mềm ứng dụng).


 Bước 4 (): Tất cả những yếu tố trên cộng thêm khả năng sử
dụng các tiêu chuẩn mở từ W3C (RDF và SPARQL) để xác định mọi thứ.


 Bước 5 (): Tất cả những điều trên cộng thêm khả năng
liên kết dữ liệu của mình với dữ liệu của người khác để cung cấp ngữ
cảnh. Nó cho phép các bộ dữ liệu có thể tham chiếu lẫn nhau thơng
qua các thuật ngữ dùng chung được định nghĩa dưới dạng của một từ
điển dữ liệu. Đây là đặc điểm quan trọng nhất bởi nó cho phép dữ liệu
được tạo ra trong một tổ chức có thể tham chiếu tới dữ liệu được tạo ra
bởi một tổ chức khác (tức là không gian của dữ liệu sẽ không bị hạn chế
ở trong một tổ chức). Để đạt được cấp độ này của kế hoạch triển khai
LOD 5 Sao, chúng ta cần phải làm phong phú thêm các siêu dữ liệu, tức
là sử dụng siêu dữ liệu có cấu trúc và chính thức, đồng thời liên kết nó
với các từ vựng và bộ dữ liệu LOD đã được thiết lập trên SW.



Sau khi đã triển khai kế hoạch 5 Sao của LOD cho OER, kết hợp
với Web của LOD đã được định hình, chúng ta sẽ có nền tảng vững
chắc để nâng cao chất lượng của các OER. Vấn đề còn lại nằm ở chiến
lược xây dựng và duy trì cộng đồng đóng góp nhằm tối ưu hóa phương
thức thu thập và xử lý các dữ liệu đã được thay đổi hoặc mới phát sinh.
Quá trình xây dựng này cần nhiều thời gian và những bước đi đúng
đắn, phù hợp với mục tiêu phát triển của từng nguồn OER khác nhau.


Khuynh hướng ứng dụng LOD sẽ trở nên ngày càng phổ biến
không chỉ ở các nước phát triển mà sẽ còn lan rộng ra nhiều quốc gia
khác trên tồn cầu. Nguồn LOD sẽ góp phần quan trọng trong định
hướng xây dựng nhiều nguồn OER chất lượng nhằm phục vụ mục tiêu
giáo dục bền vững, nhất là ở các quốc gia nghèo, nơi mà việc trang bị
các phương tiện học tập còn nhiều hạn chế.


<b>4. KẾT LUẬN</b>



</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

và làm phong phú các nguồn OER là một địi hỏi cấp thiết có tính
thực tiễn cao. Ứng dụng LOD là một trong những phương pháp
hiệu quả nhằm nâng cao chất lượng các nguồn OER. LOD được xây
dựng dựa trên các nguồn dữ liệu mở được liên kết với nhau trong
một mạng lưới Web ngữ nghĩa đang được mở rộng và hoàn thiện
không ngừng theo thời gian. Triển khai kế hoạch 5 Sao nhằm ứng
dụng LOD có ý nghĩa đặc biệt quan trọng, nhất là trong bối cảnh các
kho lưu trữ và nguồn dữ liệu mở vẫn còn ở trạng thái rất rời rạc và
cần được định hình lại để phù hợp hơn trong việc tạo ra các OER.
Quá trình xây dựng và nâng cao chất lượng các nguồn OER khơng
thể tách rời q trình tạo ra các nguồn LOD ngày càng đa dạng hơn.
Theo đó, để có được các nguồn LOD chất lượng cần rất nhiều sự
đầu tư công sức không chỉ về khía cạnh kỹ thuật, giấy phép mà cịn


bao gồm một tầm nhìn chiến lược lâu dài cộng thêm sự kết nối từ
cộng đồng giáo dục khắp nơi trên thế giới.


<b>TÀI LIỆU THAM KHẢO</b>



1. Atenas, J., & Havemann, L. (Eds.). (2015), “Open Data as Open


Edu-cational Resources: Case studies of emerging practice”, <i>London: Open </i>


<i>Knowledge, Open Education Working</i>.


2. C. Bizer, T. Heath and T. Berners-Lee (2009), “Linked Data - The Story so
far”, <i>International Journal on Semantic Web and Information Systems (IJSWIS)</i>,
vol. 5, pp. 1-22.


3. D. Dicheva and C. Dichev (2013), “Leveraging Domain Specificity to


Im-prove Findability in OER Repositories”, <i>Research and Advanced Technology </i>


<i>for Digital Libraries</i>, Springer, pp. 466-469.
4. (truy cập vào 15/9/2020).
5. (truy cập vào 15/9/2020).


6. E. Rajabi, M.-A. Sicilia and S. Sanchez-Alonso (2015), “Interlinking


Edu-cational Resources to Web of Data through IEEE LOM”, <i>Computer Science </i>


<i>and Information Systems</i>, vol. 12, no. 1, pp. 233–255.


7. Gajaraj Dhanarajan and David Porter (2013), “Open Educational Resources:



</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

8. Giáo dục mở. “Bài 13 - Liên kết lên Web dữ liệu”. Truy cập tại: https://
giaoducmo.avnuc.vn/du-lieu-mo/bai-13-lien-ket-len-Web-du-lieu-152.
html (truy cập vào 15/9/2020).


9. Hệ sinh thái tri thức việt số hóa, “Dữ liệu mở”. Truy cập tại:
(truy cập vào 15/9/2020).


10. Lê Trung Nghĩa (2018), “Giáo dục mở ở Việt Nam: Thách thức và giải
pháp”. <i>Tạp chí Tia sáng</i>, Số ra ngày 14/4/2018.


11. Lê Trung Nghĩa (2019), “Hai điều kiện tiên quyết cho dữ liệu mở”, <i>Tạp chí </i>


<i>Tia sáng</i>, Số 16 ra ngày 20/08/2019, tr. 14-17.


12. Librarycarpentry, “Linked Open Data”. Truy cập tại:
(truy cập vào 15/9/2020).
13. Lori Bowen Ayre & Jim Craner (2017), “Open Data: What It Is and


Why YouShould Care”, <i>Public Library Quarterly</i>, 36:2, 173-184, DOI:


10.1080/01616846.2017.1313045.


14. Martin Kaltenböck, Mag. Florian Bauer, Mag. Andreas Blumauer (2016),
“Linked Open Data: The Essentials, A Quick Start Guide for Decision


Mak-ers”, <i>edition mono/monochrom</i>, Vienna, Austria, ISBN: 978-3-902796-05-9.


15. M. d’Aquin, A. Adamou and S. Dietze (2013), “Assessing the educational
linked data landscape”, <i>Proceedings of the 5th Annual ACM Web Science </i>



<i>Conference</i>, New York, USA.


16. Neil Butcher (2015), “A Basic Guide to Open Educational Resources
(OER)”, UNESCO and COL.


17. Ngomo AC.N., Auer S., Lehmann J., Zaveri A. (2014), “Introduction to


Linked Data and Its Lifecycle on the Web”, <i>In: Koubarakis M. et al. (eds) </i>


<i>Reasoning Web. Reasoning on the Web in the Big Data Era. Reasoning Web </i>


<i>2014. Lecture Notes in Computer Science</i>, vol 8714. Springer, Cham.


18. Nelson Piedra; Janneth Chicaiza; Jorge López; Edmundo Tovar (2013),
“Us-ing linked open data to improve the search of open educational resources
for engineering students”, <i>2013 IEEE Frontiers in Education Conference (FIE)</i>.
19. Nguyễn Danh Minh Trí (2019), “Vai trị và cơ hội của các thư viện trong


việc lưu trữ và quản lý dữ liệu mở phục vụ cộng đồng”, <i>Tạp chí Thư viện </i>


<i>Việt Nam</i>, Số 1-2019, tr. 24-29.


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

21. Nguyễn Danh Minh Trí (2017), “Tổng quan về ảnh hưởng của tính mở
trong giáo dục đại học”, <i>Tạp chí Thư viện Việt Nam</i>, Số 4-2017, tr. 13-19, 44.


22. Nguyễn Danh Minh Trí (2018), “Tổng quan về Khoa học dữ liệu”, <i>Tạp chí </i>


<i>Thơng tin Tư liệu</i>, Số 6-2018, tr. 16-23.



23. Nguyễn Danh Minh Trí (2018), “Phân tích các kỹ năng cốt lõi nhằm sử


dụng và phát triển tài nguyên giáo dục mở”, <i>Tạp chí Thư viện Việt Nam</i>,


Số 4-2018, tr. 8-12.


24. Nguyễn Danh Minh Trí (2018), “Xây dựng các nguồn tài nguyên giáo dục


mở dựa trên nền tảng Wikihow tiếng Việt”, <i>Tạp chí Thư viện Việt Nam</i>, Số


2-2018, tr. 22-27.


25. Nguyễn Huy Chương, Nguyễn Tiến Hùng (2011), “Học liệu mở và hướng


phát triển tài nguyên số tại các thư viện đại học Việt Nam”, <i>Bài viết giới </i>


<i>thiệu về học liệu mở, truy cập mở và những lợi ích của học liệu mở và truy cập </i>
<i>mở đối với công tác đào tạo và nghiên cứu khoa học, từ</i> đó đề xuất hướng phát
triển kho tài nguyên số cho thư viện điện tử tại các đại học Việt Nam.
26. Nguyễn Thế Hùng (2019), “Giá trị của Dữ liệu mở là gì, vì sao Chính phủ nên


mở dữ liệu?”. Truy cập tại:
(truy cập vào 15/9/2020).
27. Ontotext, “What are Linked Data and Linked Open Data?”. Truy cập tại:



(truy cập vào 15/9/2020).


28. P. G. West and L. Victor (2011), “Background and action paper on OER”,



<i>The William and Flora Hewett Foundation</i>.


29. Rosa Navarrete, Sergio Luján-Mora (2015), “Use of Linked Data to


En-hance Open Educational Resources”, <i>14th International Conference on </i>


<i>Infor-mation Technology Based Higher Education and Training (ITHET 2015)</i>, pp. 1-6.


30. S. Dietze, S. Sanchez-Alonso, H. Ebner, H. Qing Yu, D. Giordano, I.
Marenzi and B. Pereira Nunes (2013), “Interlinking educational resources


and the Web of data: A survey of challenges and approaches”, <i>Program, </i>


<i>vol. 47</i>, no. 1, pp. 60-91.


31. TED, “Tim Berners-Lee: The next Web of open, linked data”. Truy cập tại:
(truy cập vào 15/9/2020).


32. Thư viện học liệu mở Việt Nam, (truy cập vào


</div>
<span class='text_page_counter'>(17)</span><div class='page_container' data-page=17>

33. Tim Berners Lee, “Linked Data”. Truy cập tại:
(truy cập vào 15/9/2020).


34. Trần Minh (2017), “Báo cáo tổng quan về dữ liệu mở”, <i>Viện công nghiệp </i>


<i>phần mềm và nội dung số Việt Nam</i>, Bộ Thông tin và Truyền thông.


35. W3C, “Linking Open Data on the Semantic Web”. Truy cập tại: http://
www.w3.org/wiki/TaskForces/CommunityProjects/LinkingOpenData/
CommonVocabularies (truy cập vào 15/9/2020).



36. W3C, “Linked Data”. Truy cập tại:
(truy cập vào 15/9/2020).


37. Wikihow, cập vào 15/9/2020).


38. Wikipedia, cập vào 15/9/2020).


39. Wikipedia, Crowdsourcing. Truy cập tại: />Crowdsourcing (truy cập vào 15/9/2020).


40. Wikipedia, “Dữ liệu liên kết”. Truy cập tại: />Dữ_liệu_liên_kết (truy cập vào 15/9/2020).


41. Wikipedia, “Linked Data”. Truy cập tại: />Linked_data (truy cập vào 15/9/2020).


42. Wikipedia, “Open Data”. Truy cập tại: />Open_data (truy cập vào 15/9/2020).


</div>

<!--links-->

×