Tải bản đầy đủ (.pdf) (7 trang)

Lập chỉ mục cho nguồn tài nguyên giáo dục mở (OER)

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (258.54 KB, 7 trang )

LẬP CHỈ MỤC CHO NGUỒN TÀI NGUYÊN GIÁO DỤC MỞ (OER)


Nguyễn Thị Minh Phượng1

MỞ ĐẦU

Việc sử dụng máy tính cho đào tạo đã dẫn đến một sự thay đổi đáng
kể trong giảng dạy. Sự phát triển này đã dẫn đến sự gia tăng nguồn tài
nguyên học tập kỹ thuật số. Để tìm kiếm nguồn tài nguyên này một cách
đầy đủ và chính xác cần có thêm sự hỗ trợ của các chuyên gia thông
tin – thư viện bởi họ sẽ là người giúp cho nguồn tài nguyên này được
sắp xếp, lưu trữ và phổ biến dễ dàng nhất đến người sử dụng. Trong quá
trình tìm kiếm, sử dụng nguồn tài nguyên OER, để kiểm soát nội dung,
để tránh nội dung trùng lặp hay để tìm một khía cạnh trong nội dung
trong OER, cần thiết phải tạo cho chúng một bảng chỉ mục. Bảng chỉ
mục giúp người dùng lựa chọn lĩnh vực, nội dung cần tìm.
1. KHÁI NIỆM LẬP CHỈ MỤC

Lập chỉ mục hay index là thuật ngữ được sử dụng để diễn tả về quá
trình thu thập, thu dữ liệu từ máy tìm kiếm đối với các trang web hiện
nay. Sau khi thu thập được dữ liệu từ các trang này, máy tìm kiếm sẽ bắt
đầu đưa ra những đánh giá cũng như là lưu chúng lại trong cơ sở dữ liệu
mà mỗi cơng cụ tìm kiếm. Khi chỉ mục đã được lập, thông tin đã được
lưu trữ, lúc này khi người dùng họ tìm kiếm với các từ khóa, các kết
quả sẽ được hiển thị và những kết quả này sẽ được truy xuất từ nguồn
dữ liệu đã được lưu trữ, lập chỉ mục trước đó.
Theo Viện Cơng nghệ Thông tin, trong Thuyết minh tiểu chuẩn
kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài liệu toàn văn) [1]:
1Thư viện Học viện Hành chính Quốc gia.



356

XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ

“Thuật ngữ tạo lập chỉ mục trong ngôn ngữ của ngành thông tin – thư
viện được gọi là định chỉ mục. Định chỉ mục là một quy trình xử lý nội
dung tài liệu được áp dụng rộng rãi trong các thư viện và cơ quan thông
tin nhằm tạo ra các bảng chỉ mục cho phép người dùng có thể truy cập
thơng tin và có thể tìm kiếm, thu thập thơng tin có nghĩa theo chủ đề và
từ khóa” (tr.5).
2. TẠI SAO CẦN LẬP CHỈ MỤC TÀI NGUYÊN GIÁO DỤC MỞ?

Tài nguyên giáo dục mở là nguồn tài nguyên được sử dụng trong quá
trình giảng dạy, đào tạo, học tập. Tài nguyên này có những đặc điểm sau:
- Tự do mở (trên web)
- Tái sử dụng
- Dễ thích nghi, độ tin cậy cao, dễ quản lý
- Có thể hốn đổi, đánh giá, tái sử dụng
- Được mô tả bởi các siêu dữ liệu
Đối với các OER có kích thước vừa và nhỏ, việc lập chỉ mục (index)
là khơng cần thiết, thậm chí càng làm cho tài liệu thêm rắc rối, phức tạp.
Thế nhưng trong các OER có khối lượng văn bản lớn, khi muốn tìm đọc
lại một chi tiết liên quan đến chủ đề nào đó ta sẽ phải lật qua lật lại dị
tìm rất tốn thời gian. Vì thế, để dễ dàng tìm kiếm, cần tổ chức một bảng
chỉ mục mà ở đó các đề mục, các từ chun mơn được sắp xếp theo vần
ABC, kèm theo những chỉ dẫn cho biết được đề cập ở trang nào.
Tại sao phải lập chỉ mục tài nguyên giáo dục? Câu trả lời là để tìm
thấy chúng. OER có sẵn một cách tự do trên web. Việc sử dụng chúng
là rất quan trọng nhưng cũng đặt ra một số vấn đề: Làm thế nào để tìm

ra nguồn tài ngun này? Đây có phải là nguồn OER mới được cập nhật
hay khơng? v.v... Chính những mô tả về OER thông qua lập chỉ mục mà
người dùng có thể nhận biết được. Lập chỉ mục đảm bảo khả năng tiếp
cận thông qua trao đổi, khả năng tương tác giữa các hệ thống. Việc lập
chỉ mục cho OER giúp:
- Lập chỉ mục nhằm quy định các nguồn OER;
- Xác định vai trò, đặc điểm của OER trong việc phân phối, tái sử dụng;


PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở

357

- Lập chỉ mục giúp việc quản lý nguồn OER dễ dàng, có độ tin cậy cao;
- Bảo đảm tính bền vững, khả năng tương tác và cởi mở của các
nguồn OER.
- Quản lý và thực hiện tốt việc học tập, giáo dục và đào tạo.
Do đó mà việc lập chỉ mục cho OER là cần thiết.
3. THỰC HIỆN VIỆC LẬP CHỈ MỤC CHO OER

Chỉ mục là bảng dữ liệu hay cấu trúc dữ liệu dùng để xác định vị
trí của các dịng tệp theo điều kiện nào đó hay nói cách khác chỉ mục
là một cách tìm kiếm thông tin. Xây dựng chỉ mục là một trong những
nhiệm vụ quan trọng nhất khi xây dựng một CSDL. Trong đó, mỗi tài
liệu chứa một thuật ngữ chỉ mục và mỗi một thuật ngữ chỉ mục xuất
hiện ở một dòng. Việc sử dụng các tiêu chuẩn là bắt buộc. Do đó, OER
phải được xây dựng theo chuẩn và phải có chỉ dẫn để dễ dàng tìm
ra, trong đó bắt buộc các siêu dữ liệu phải tuân theo tiêu chuẩn. Tiêu
chuẩn cụ thể cho phép dễ dàng tìm kiếm các nguồn tài ngun giáo dục
chính là việc mơ tả siêu dữ liệu theo Dublin Core hay Learning Object

Metadata (LOM). Dù mô tả theo tiêu chuẩn nào, tài nguyên giáo dục
mở cũng phải đề cập đến các yếu tố:
- Nguồn gốc OER
- Phiên bản khác nhau của OER
- Mối quan hệ với các nguồn khác
- Các tính năng giáo dục khái qt của đối tượng có liên quan
Một ví dụ đơn giản. Cần tìm một bài giảng dưới dạng PowerPoint.
Điều gì sẽ xảy ra nếu bài giảng này biến mất? Có thể do phiên bản đang
thay đổi hoặc tài liệu không cịn có thể đọc được hoặc đã bị mất. Nếu dữ
liệu nguồn vẫn được giữ, nội dung bài giảng vẫn truy cập được ngay cả
khi màn hình bị mất. Tương tự như vậy, để chỉ mục tồn tại trong phần
mềm và phần cứng nó phải theo nền tảng tiêu chuẩn. Tiêu chuẩn giúp
duy trì tính bền vững của tài ngun. Chỉ mục đảm bảo khả năng tiếp
cận và thông qua trao đổi, khả năng tương tác giữa các hệ thống. Tài
nguyên sau đó có thể được tái sử dụng và thích nghi.


358

XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ

Trong một thế giới mở, nơi khả năng tương tác là cần thiết, trong
đó tổng hợp các nguồn tài nguyên được yêu cầu, việc sản xuất các siêu
dữ liệu là điều cần thiết để có thể tìm ra nguồn lực. Chỉ mục tìm kiếm
chứa thơng tin từ tất cả các nguồn OER đó.
Chỉ mục tìm kiếm được xây dựng bằng cách tìm kéo nội dung trên
mỗi nguồn OER. Trình tìm kéo chọn nội dung và siêu dữ liệu từ các tài
liệu trong biểu mẫu được tìm kéo thuộc tính. Để lấy nội dung và siêu dữ
liệu từ các tài liệu được chỉ mục tìm kiếm, các thuộc tính được tìm kéo
phải được ánh xạ thuộc tính được quản lý. Thuộc tính được quản lý chỉ

được giữ trong chỉ mục. Điều này có nghĩa là người dùng chỉ có thể tìm
kiếm trên thuộc tính được quản lý. Điều đó giúp người dùng thuận tiện
trong việc cập nhật nguồn OER mới hay cũ, đã được cập nhật hay chưa.
Khi đã thay đổi thuộc tính được quản lý, hoặc khi đã thay đổi việc
tìm kéo và được quản lý thuộc tính, trang phải được tìm kéo lại trước
khi thay đổi và sẽ được phản ánh trong chỉ mục tìm kiếm. Vì các thay
đổi được thực hiện trong lược đồ tìm kiếm, chứ khơng phải cho trang
thực tế, trình tìm kéo sẽ khơng tự động lại lập chỉ mục cho nguồn OER.
Để đảm bảo rằng các thay đổi được tìm kéo và đầy đủ lại chỉ mục, phải
yêu cầu một lập lại chỉ mục của trang. Nội dung trang được tìm kéo lại
và lại chỉ mục sao cho có thể bắt đầu sử dụng các thuộc tính được quản
lý trong truy vấn, quy tắc truy vấn và hiển thị mẫu.
“Nếu tạo một Index trên cột khóa chính và sau đó tìm kiếm một
dịng dữ liệu dựa trên một trong các giá trị của cột này:
- Đầu tiên SQL Server sẽ tìm giá trị này trong Index.
- Sau đó sử dụng Index để nhanh chóng xác định vị trí của dịng
dữ liệu cần tìm.
Các loại Index gồm có:
Clustered Index: lưu trữ và sắp xếp dữ liệu vật lý trong table hoặc
view dựa trên các giá trị khóa của chúng. Các cột khóa này được chỉ
định trong định nghĩa index. Mỗi table hoặc view chỉ có duy nhất một
Clusterd Index vì bản thân các dịng dữ liệu được lưu trữ và sắp xếp
theo thứ tự vật lý dựa trên các cột trong loại Index này.


PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở

359

Khi dữ liệu trong table hoặc view cần được lưu trữ và sắp xếp theo

một thứ tự nhất định chính là lúc cần dùng đến Clustered Index. Một
bảng có một Clusted Index thì table được gọi là Clustered Table. Nếu
khơng, các dịng dữ liệu của bảng được lưu trong một cấu trúc không
được sắp xếp gọi là HEAP.
Non-Clustered: có một cấu trúc tách biệt với dịng dữ liệu trong
table hoặc view. Mỗi một Index loại này chứa các giá trị của các cột
khóa trong khai báo của Index, và mỗi một bản ghi giá trị của khóa
trong index này chứa một con trỏ tới dòng dữ liệu tương ứng của nó
trong table. Mỗi con trỏ từ một dịng của Non-Clustered Index tới một
dòng dữ liệu trong table được gọi là “row locator”. Cấu trúc của row
locator phụ thuộc vào việc các trang dữ liệu được lưu trong HEAP hay
trong một Clustered Table. Đối với HEAP, row locator là một con trỏ
tới dòng dữ liệu, với clustered table, row locator chính là khóa index
của clustered index.
Unique Index: Là kiểu Index dùng để đảm bảo tính duy nhất trong
các cột được tạo Index. Nếu Index loại này được tạo dựa trên nhiều cột,
thì tính duy nhất của giá trị được tính trên tất cả các cột đó, khơng chỉ
riêng rẽ từng cột.
Composite Index: Là kiểu Index có nhiều hơn 1 cột. Trong SQL
Server 2005 và 2008, có thể có đồng thời tối đa 16 cột trong một Index,
miễn là kích thước của Index không vượt quá giới hạn 900 byte. Cả hai
kiểu index cơ sở là Clustered Index và Non Clustered Index cũng có thể
đồng thời là là kiểu Composite Index.” (xem slide bài giảng thiết kế cơ
sở dữ liệu, Đỗ Thị Mai Hường).
Lập chỉ mục cho các từ khi chúng xuất hiện chính xác trong tìm
kiếm. Chỉ ra và nhập các lĩnh vực trên chỉ mục. Do đó cần sử dụng các
từ vựng có kiểm sốt. Khơng sử dụng các tiền tố và hậu tố. Ví dụ như
trong tiếng Anh, không dùng các mạo từ như: a, an, the... Trong tiếng
Pháp không dùng: un, une, des, le, la, les... trong các từ chỉ mục. Vì
vậy, cần thiết phải lập từ điển hỗ trợ nhằm bảo đảm tính thống nhất.

Với tài liệu tiếng nước ngoài, hiện nay nhiều thư viện trên thế giới đang
sử dụng công nghệ Rosette Linguistics Platform để xử lý việc tách từ


360

XÂY DỰNG VÀ KHAI THÁC TÀI NGUYÊN GIÁO DỤC MỞ

tự động cho các ngôn ngữ. Đây là công nghệ được thiết kế cho các hệ
thống quy mô lớn để xác định, phân loại, phân tích, lập chỉ mục và tìm
kiếm văn bản bằng các ngôn ngữ châu Á, châu Âu.

Mô hình Rosette Linguistics Platform

Nguồn truy cập ngày 30/07/2017/

4. MỘT SỐ VẤN ĐỀ TRONG LẬP CHỈ MỤC OER

Trong một số trường hợp khi đặt chỉ mục, mô tả, định dạng tập
tin... sẽ gặp phải một số vấn đề liên quan đến việc chuyển dữ liệu.
Nhắc đến việc lập chỉ mục đối với OER, ta sẽ nghĩ ngay đến google
bởi google đang là cơng cụ hỗ trợ tìm kiếm mạnh nhất hiện nay. Index
google là quá trình lưu lại số liệu, dữ liệu từ các website được các máy
nhện thu thập, lưu lại trong cơ sở dữ liệu của google. Nếu lập chỉ mục
trên google, các chỉ mục này được thống kê thành danh sách và khi tìm
kiếm sẽ dễ dàng nhận được kết quả. Tuy nhiên, máy nhện chỉ làm nhiệm
vụ thu thập về, nên kết quả tìm thường khơng chính xác hoặc khơng như
mong muốn của người tìm.
Tóm lại, OER vẫn là chủ đề đang được nghiên cứu để đưa vào ứng
dụng trong giảng dạy tại Việt Nam. Để OER đi vào thực tiễn, rất cần



PHẦN 3. Công nghệ và công cụ cho tài nguyên giáo dục mở

361

sự quan tâm, nghiên cứu của nhiều tổ chức ở mọi lĩnh vực và trong đó
khơng thể thiếu ngành thông tin – thư viện. Ngành thông tin – thư viện
cần nghiên cứu để việc xử lý, sắp xếp nguồn tài nguyên này, tạo thuận
lợi cho người dùng trong việc khai thác và sử dụng hiệu quả để từ đó
khơng ngừng nâng cao chất lượng giảng dạy và học tập.
TÀI LIỆU THAM KHẢO
1. Viện Công nghệ Thông tin - Đại học Quốc gia (2017), Thuyết minh tiêu
chuẩn kỹ thuật tạo lập chỉ mục (dùng cho metadata và tài liệu toàn văn)
2. Đỗ Thị Mai Hường (2016), Tập bài giảng thiết kế cơ sở dữ liệu, Khoa
Thông tin, Học viện Kỹ thuật Quân sự.
3. Bourda Yolaine (2004), Pourquoi indexer les resources pedagogiques
numériques?,
4. Commonwealth (2015), Lignes directrices pour les resources éducatives
libres (REL) dans l’enseignement supérieure
5. Grégoire, Robert (2016), Référentiel de compétences REL (resources
éducatives libres), Paris, 2016.



×