Tải bản đầy đủ (.pdf) (15 trang)

Tổng quan về quản trị dữ liệu, kiến thức dữ liệu và quản lý chất lượng dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (215.48 KB, 15 trang )

Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

TỔNG QUAN VỀ QUẢN TRỊ DỮ LIỆU, KIẾN THỨC DỮ LIỆU VÀ
QUẢN LÝ CHẤT LƯỢNG DỮ LIỆU
Ths. Nguyễn Lê Phương Hồi
Viện Thơng tin Khoa học xã hội

Tóm tắt: Quản trị dữ liệu và kiến thức dữ liệu là hai khối quan trọng trong nền
tảng kiến thức của các chuyên gia thông tin liên quan đến việc hỗ trợ nghiên cứu chuyên
sâu về dữ liệu, cả về chất lượng dữ liệu và quản lý dữ liệu nghiên cứu. Áp dụng quản trị
dữ liệu để nghiên cứu quy trình quản lý dữ liệu và đào tạo kiến thức dữ liệu giúp phác
họa các phạm vi quyết định và xác định trách nhiệm giải trình cho việc ra quyết định.
Quản trị dữ liệu là một dịch vụ dựa trên các quy trình chuẩn, lặp lại và được thiết kế để
cho phép minh bạch các quá trình liên quan đến dữ liệu. Quản trị dữ liệu đề cập đến các
quy tắc, chính sách, tiêu chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp
thực thi. Dù đã nhận được nhiều sự quan tâm trong các tổ chức thư viện, các cán bộ thư
viện đã có một số kỹ năng về quản trị dữ liệu, song kiến thức về quản trị dữ liệu vẫn là
nền tảng cho các dịch vụ dữ liệu nghiên cứu, nhất là khi nó xuất hiện ở tất cả các mức độ
của dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu có thể áp dụng cho dữ liệu lớn.
Từ khóa: Quản trị dữ liệu, Kiến thức dữ liệu, Dịch vụ dữ liệu nghiên cứu
Khoa học chuyên sâu về dữ liệu, cùng với các nhiệm vụ cho kế hoạch quản lý dữ
liệu và dữ liệu mở từ các nhà tài trợ nghiên cứu, đã làm tăng sự chú trọng về quản lý dữ
liệu nghiên cứu trong cả các thư viện nghiên cứu và các thư viện đại học. Các cán bộ thư
viện đại học thường được lồng ghép vào quá trình nghiên cứu, trước tiên là trong các dịch
vụ dữ liệu nghiên cứu (research data service - RDSs). Do đó, việc hỗ trợ nghiên cứu
chuyên sâu về dữ liệu là xu hướng hàng đầu trong hoạt động thư viện đại học. Đó là tâm
điểm đặc biệt vì nó tạo cơ hội để thay đổi thực tế là các giảng viên và các nhà nghiên cứu
coi thư viện không phải là nơi hỗ trợ nghiên cứu theo thời gian thực, mà chỉ là một trung
tâm phân phối tài liệu.


1


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

Theo Koltay 1 và McMillan 2, hai yếu tố quan trọng của cơ sở tri thức có ý nghĩa
quyết định đối với các chun gia thơng tin tham gia vào việc hỗ trợ nghiên cứu chuyên
sâu về dữ liệu gồm: quản trị dữ liệu và kiến thức dữ liệu. Quản trị dữ liệu (data
governance - DG) cho phép cung cấp dịch vụ dữ liệu nghiên cứu tốt hơn. Kiến thức dữ
liệu, liên quan chặt chẽ đến các dịch vụ dữ liệu nghiên cứu mà bao gồm quản trị dữ liệu
nghiên cứu (research data management - RDM). Khái niệm dịch vụ dữ liệu nghiên cứu
và đào tạo kiến thức dữ liệu đang được các nhà nghiên cứu bàn đến, cho nên mối quan hệ
của chúng với quản trị dữ liệu cần được xem xét. Bài viết tổng quan các quan niệm của
các nhà nghiên cứu trên thế giới về ba thuật ngữ chính: Quản trị dữ liệu, Chất lượng dữ
liệu, Kiến thức dữ liệu và mối quan hệ giữa quản trị dữ liệu với chất lượng dữ liệu và
kiến thức dữ liệu.
1. Quản trị dữ liệu
Khái niệm Quản trị dữ liệu ít được đề cập trong các tài liệu khoa học thông tin –
thư viện. Một số ít tài liệu cho rằng lĩnh vực học thuật, thông tin – thư viện cần quan tâm
đến quản trị dữ liệu. Điều này được DosSantos nhận định: “Vai trò của nhà quản trị dữ
liệu phải thay đổi giống như một nhân viên dữ liệu để làm cho việc quản trị dữ liệu trở
thành động lực đằng sau sự đổi mới kinh doanh, thay vì là trở ngại đối với dữ liệu. Mục
tiêu này có thể đạt được bằng cách cung cấp công nghệ thông tin như là một dịch vụ và
cho phép các quá trình định vị và tổ chức các dữ liệu có sẵn tốt nhất” 3.
“Quản trị dữ liệu có thể ám chỉ các cơ quan tổ chức; các quy tắc, chính sách, tiêu
chuẩn; quyền quyết định; trách nhiệm giải trình và phương pháp thực thi. Quản trị dữ liệu
cho phép đưa ra quyết định tốt hơn và bảo vệ nhu cầu của các bên liên quan. Nó khuyến
khích áp dụng các cách tiếp cận phổ biến đối với các vấn đề dữ liệu. Quản trị dữ liệu
cũng giúp xây dựng các quy trình chuẩn, lặp lại, giảm chi phí và tăng hiệu quả” 4.


1

Koltay T (2015a), “Data literacy: In search of a name and identity”, Journal of Documentation,

71(2): 401–415
2

MacMillan D (2014), “Data sharing and discovery: What librarians need to know”, Journal of Academic

Librarianship, 40(5): 541–549
3

DosSantos J (2015), “What librarians can teach us about managing Big Data”, InFocus.

/>4

DGI (2015a), “Definitions of Data Governance”,

/>
2


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

Các tác giả Khatri & Brown 5 và Weill & Ross 6 cùng cho rằng quản trị dữ liệu mô
tả các lĩnh vực quyết định, tức là những quyết định phải được thực hiện để đảm bảo quản
lý hiệu quả và sử dụng nguồn lực của tổ chức. Quản trị dữ liệu cũng xác định phạm vi
trách nhiệm đối với việc ra quyết định bằng cách xác định người có quyền quyết định

trong tổ chức và người chịu trách nhiệm về quyết định liên quan đến nguồn lực dữ liệu.
Seiner cho biết thêm rằng: “Quản trị dữ liệu hợp lệ có thể yêu cầu xác định những người
có trách nhiệm về dữ liệu, họ xác định, tạo ra và sử dụng để hồn thành cơng việc hoặc
chức năng của họ. Việc quản trị đúng đắn và hiệu quả phụ thuộc nhiều vào công nghệ
cũng như về văn hố tổ chức” 7.
Trách nhiệm, các thành phần chính của quản lý và tiêu chuẩn hóa, được định nghĩa
theo cách thức kiểm tra và cân bằng giữa các nhóm khác nhau, giữa những người tạo ra
và thu thập thông tin, những người quản lý, những người sử dụng và những người đưa ra
các tiêu chuẩn và yêu cầu tuân thủ. “Quản lý dữ liệu liên quan đến việc đảm bảo các dữ
liệu không thuộc quyền quản lý của người sở hữu. Do đó các nhà quản lý dữ liệu đại diện
cho mối quan tâm của người dùng và đảm bảo rằng các công việc liên quan đến dữ liệu
được thực hiện theo các chính sách và quy định đã được xác định. Ngược lại, quản trị dữ
liệu là một q trình tổng thể nhằm kết hợp các nhóm chức năng (bao gồm cả người quản
lý dữ liệu) để tạo ra các quy tắc phụ thuộc lẫn nhau hoặc để giải quyết các vấn đề và cung
cấp dịch vụ cho các bên liên quan dữ liệu” 8.
Quản trị dữ liệu hiệu quả cần phải xác định được mục tiêu, xây dựng quy trình và
tiêu chuẩn riêng. Đồng thời xác định trách nhiệm, vai trò của từng nhân viên quản trị dữ
liệu. Theo nghĩa quản lý, giám sát và đo lường các khía cạnh khác nhau của một tổ chức,
quản trị có thể liên quan đến việc quản lý cơng nghệ thơng tin, nhân lực và các nguồn lực
hữu hình khác. Dữ liệu ở khắp mọi nơi, do đó quản trị dữ liệu theo chiều rộng. Các định
nghĩa về dữ liệu và cách sử dụng dữ liệu là một phần của quá trình quản lý dữ liệu, trong

5

Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–

152.
6

Weill P, Ross JW (2004), IT Governance: How Top Performers Manage IT Decision Rights for


Superior Results, Boston, MA: Harvard Business School Press.
7

Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest

Success, Basking Ridge, NJ: Technics Publications
8

Rosenbaum S (2010), “Data governance and stewardship: Designing data stewardship entities and

advancing data access”, Health Services Research, 45(5): 1442–1455.

3


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

khi tích hợp dữ liệu và xác định các cá nhân giám sát việc quản lý các quá trình dữ liệu
gắn liền với quản trị dữ liệu. Quản trị dữ liệu cũng phải bao gồm siêu dữ liệu, dữ liệu phi
cấu trúc, đăng ký, phân loại…
Các nguyên tắc truyền thống của quản trị dữ liệu cũng áp dụng cho dữ liệu lớn.
Trong số các loại dữ liệu lớn, dữ liệu từ Web và từ truyền thông xã hội, hay dữ liệu từ
máy tính đến máy tính đều đáng chú ý. Quản trị dữ liệu lớn đặc biệt quan trọng đối với
việc sử dụng dữ liệu được chấp nhận. Mặc dù tích hợp dữ liệu lớn khác với tích hợp dữ
liệu truyền thống theo nhiều yếu tố, song nó cho thấy sự phức tạp và tầm quan trọng của
quản trị dữ liệu. Tích hợp dữ liệu có thể hiểu là sự kết hợp các quy trình kỹ thuật để tổng
hợp dữ liệu từ các nguồn khác nhau thành thơng tin có ý nghĩa và có giá trị. Tích hợp dữ
liệu giúp làm rõ, làm sạch, giám sát, chuyển đổi và cung cấp dữ liệu, do đó nó cung cấp

dữ liệu đáng tin cậy từ nhiều nguồn khác nhau. Tích hợp dữ liệu giải quyết các vấn đề
liên quan đến việc kết hợp dữ liệu có xuất xứ đa dạng bằng cách thể hiện một quan điểm
thống nhất về những dữ liệu này.
Trong môi trường nghiên cứu, các bên liên quan của quản trị dữ liệu là các nhà
nghiên cứu, các viện nghiên cứu, các nhà tài trợ, các nhà xuất bản và cơng chúng nói
chung. Am hiểu về quản trị dữ liệu giúp các nhà nghiên cứu yên tâm về các quyền và lợi
ích. Các cơ cấu quản trị cũng cần thiết cho việc quản lý các dữ liệu liên quan đến con
người, bởi vì việc đảm bảo những thơng tin cá nhân địi hỏi khơng chỉ phải thiết lập các
tiêu chuẩn và các quy tắc thực tiễn mà cịn thúc đẩy sự thay đổi văn hố theo hướng quản
lý dữ liệu tốt hơn. Ngoài các chức năng này, quản trị dữ liệu trong môi trường nghiên cứu
cho phép truy cập và chia sẻ hợp lý ngay cả khi quyền sở hữu dữ liệu thường không rõ
ràng, bởi vì người có đóng góp trong các dữ liệu nghiên cứu không chắc là chủ sở hữu dữ
liệu. Nhiều kỹ năng của quản trị dữ liệu như xử lý các điều khoản và thỏa thuận cấp phép,
cũng như kiến thức về bản quyền đã được các cán bộ thư viện sở hữu.
Tựu chung lại, quản trị dữ liệu là điểm khởi đầu cho việc quản lý dữ liệu. Một
chương trình quản lý dữ liệu chính thức phải cung cấp câu trả lời cho các câu hỏi về khả
năng sẵn có, khả năng truy cập, nguồn, giá trị và độ tin cậy. Là một phần trách nhiệm
trong toàn bộ các thành phần của một tổ chức, quản trị dữ liệu bắt buộc phải cung cấp các
cách tiếp cận phối hợp, liên chức năng và tạo điều kiện thực hành tốt nhất. Quản trị dữ
liệu ngăn chặn việc lạm dụng tài sản dữ liệu của tổ chức và khuyến khích sử dụng hiệu
quả hơn các tài sản dữ liệu tương tự của chính tổ chức này. Am hiểu về bản chất của quản
trị dữ liệu là cơ sở cho dịch vụ dữ liệu nghiên cứu và quản trị dữ liệu phát triển tốt là một
trong những điều kiện cần thiết cho dữ liệu mở.
4


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

2. Quản lý chất lượng dữ liệu và chất lượng dữ liệu

Quản trị dữ liệu "đảm bảo rằng dữ liệu đáng tin cậy và rằng mọi người có thể phải
chịu trách nhiệm cho bất kỳ sự bất lợi nào xảy ra vì chất lượng kém" 9. Quan niệm tương
tự, Khatri và Brown nhấn mạnh: “Quản trị bao gồm việc xác định người trong tổ chức có
quyền đặt ra các tiêu chuẩn về chất lượng dữ liệu” 10. Quản lý dữ liệu liên quan đến việc
xác định các tiêu chuẩn thực tế được áp dụng cho chất lượng dữ liệu, trong khi quản trị
dữ liệu chỉ định người nên đưa ra những tiêu chuẩn này. Theo Seiner, “Quản trị dữ liệu
chính thức hóa khơng chỉ hành vi liên quan đến định nghĩa, tổ chức và sử dụng dữ liệu,
mà còn về chất lượng” 11. Tương tự, Báo cáo của Information Builders cho rằng quản trị
dữ liệu là một thành phần quan trọng của bất kỳ chiến lược quản lý chất lượng dữ liệu
nào. Một báo cáo khác có tựa đề Quản trị thơng tin thành cơng thơng qua dữ liệu chất
lượng cao nhấn mạnh sự thành công của một chương trình quản trị thơng tin phụ thuộc
vào chất lượng dữ liệu có thể đạt được nếu chúng ta giảm sự gia tăng của dữ liệu khơng
chính xác hoặc khơng nhất qn bằng việc phân tích và giám sát liên tục.
Chất lượng dữ liệu là một trong những nền tảng của mơ hình chun sâu về dữ
liệu của nghiên cứu khoa học. Việc đánh giá dữ liệu đòi hỏi kiến thức chuyên ngành sâu
và đánh giá theo cách truyền thống các bộ dữ liệu rất tốn thời gian và tốn kém, trong khi
các phương pháp tiếp cận tự động đang ở giai đoạn sơ khai. Trong lĩnh vực học thuật, vấn
đề về chất lượng dữ liệu đã được xây dựng tương đối tỉ mỉ, do đó việc xử lý sâu hơn là
không cần thiết. Tuy nhiên, các yếu tố đáng chú ý nhất, đó là khả năng sẵn có, khả năng
khám phá, độ tin cậy và tính xác thực, khả năng chấp nhận, tính chính xác (bao gồm tính
đúng đắn và nhất qn), khả năng áp dụng, tồn vẹn, đầy đủ, dễ hiểu và khả năng sử
dụng. Rõ ràng là các dịch vụ dữ liệu nghiên cứu được cung cấp bởi các thư viện đại học
có thể đóng vai trò quan trọng như là các trung tâm dữ liệu chất lượng trong trường đại
học, bằng cách cung cấp các dịch vụ kiểm tra và kiểm định chất lượng dữ liệu cho các
cộng đồng nghiên cứu. Mặc dù mối quan tâm cho tính sẵn có của dữ liệu là một yêu cầu
rõ ràng, song việc hướng đến các nhân viên dữ liệu, hiểu biết về cách đánh giá tính xác

9

Sarsfield S (2009), The Data Governance Imperative: A Business Strategy for Corporate Data, Ely: IT


Governance
10

Khatri V, Brown CV (2010), “Designing data governance”, Communications of the ACM, 53(1): 148–

152
11

Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and Greatest Success,

Basking Ridge, NJ: Technics Publications.

5


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

thực, tính tồn vẹn và tính chính xác của các đối tượng số theo thời gian cũng sẽ có ích.
Gần đây, Zilinski và Nelson đã xác định một số yếu tố khác của chất lượng dữ liệu như là
phạm vi và sự liên quan đến câu hỏi và định dạng nghiên cứu, bao gồm các trường và các
đơn vị được sử dụng, các quy ước đặt tên, ngày tạo và cập nhật. Chúng cũng hướng sự
chú ý của người dùng đến một tập hợp các thuộc tính kiểm sốt chất lượng tương tự như
quản trị dữ liệu để trả lời câu hỏi rằng kiểm soát chất lượng được nêu rõ hay khơng bằng
cách tìm hiểu người kiểm tra chất lượng và những quy trình kiểm tra 12
Theo Smith, “Quản trị dữ liệu thành công không chỉ phụ thuộc vào các quy định
liên quan đến vai trò nói chung mà cịn các trách nhiệm liên quan đến các tiêu chuẩn dữ
liệu thích hợp và các mơi trường siêu dữ liệu được quản lý. Do đó, quản lý siêu dữ liệu là
một trong những quá trình quản trị dữ liệu quan trọng liên quan đến chất lượng, cho phép

ghi lại nguồn gốc dữ liệu đảm bảo chất lượng được đảm bảo” 13.
3. Quản trị dữ liệu, chất lượng dữ liệu và kiến thức dữ liệu
Mặc dù kiến thức dữ liệu đang trải qua giai đoạn phát triển, song kiến thức dữ liệu
mới bắt đầu được chấp nhận rộng rãi như là một khả năng quan trọng cho các chuyên gia
thông tin tham gia vào việc hỗ trợ nghiên cứu chuyên sâu về dữ liệu. Mặt khác, các thuật
ngữ trong lĩnh vực kiến thức dữ liệu vẫn chưa được chuẩn hóa. Có kiến thức dữ liệu khoa
học và kiến thức dữ liệu nghiên cứu. Carlson tranh luận về kiến thức dữ liệu thông tin
khác với ý nghĩa hạn chế của kiến thức dữ liệu, tức là khả năng đọc đồ thị và biểu đồ
thích hợp, rút ra kết luận chính xác từ dữ liệu và nhận dạng khi dữ liệu được sử dụng theo
cách gây hiểu nhầm hoặc không thích hợp 14
Mặc dù các thuật ngữ khác nhau, song định nghĩa cho thấy có điểm chung thống
nhất. Nhìn vào sự phát triển của các định nghĩa về kiến thức dữ liệu, Fosmire và Miller
đã nói đơn giản về kiến thức thông tin trong thế giới dữ liệu. Hai năm sau, kiến thức dữ

12

Zilinski LD, Nelson MS (2014), “Thinking critically about data consumption: Creating the data

credibility checklist”, Proceedings of the American Society for Information Science and Technology,
51(1): 1–4
13

Smith AM (2007), “Data governance best practices: The beginning”, EIMInsight (1)1.

/>14

Carlson J, Fosmire M, Miller C, . (2011), “Determining data information literacy needs: A study of

students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657


6


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

liệu được định nghĩa rõ ràng là khả năng hiểu, sử dụng và quản lý dữ liệu. Theo định
nghĩa của Calzada Prado và Marzal, “kiến thức dữ liệu cho phép các cá nhân truy cập,
diễn giải, đánh giá, quản lý, xử lý và sử dụng hợp lý dữ liệu” 15
Như đã đề cập ở trên, Johnson mô tả kiến thức dữ liệu chi tiết hơn, xác định nó
như là khả năng xử lý, sắp xếp và lọc số lượng lớn thơng tin, việc này địi hỏi phải biết
cách tìm kiếm, lọc và xử lý để tạo ra và tổng hợp thông tin 16. Rõ ràng rằng các thuộc tính
này về cơ bản giống với các đặc điểm của kiến thức thông tin khi chúng xuất hiện trong
định nghĩa phổ biến và được thừa nhận rộng rãi về kiến thức thông tin, bao gồm khả năng
nhận biết nhu cầu thông tin, xác định, định vị, đánh giá và sử dụng thông tin để giải quyết
một vấn đề cụ thể.
Một số tác giả nhấn mạnh những điểm tương đồng với kiến thức thông tin. Khung
kiến thức thông tin của Australia và New Zealand, cho thấy những người có kiến thức
thơng tin có thể thu thập, lưu trữ và phổ biến không chỉ văn bản mà cả dữ liệu nữa 17.
Andretta đã xác định việc trình bày, đánh giá và diễn giải các dữ liệu định tính và định
lượng như là một kết quả học tập của kiến thức thông tin 18. Theo Hunt, việc đào tạo kiến
thức dữ liệu cần phải vay mượn từ đào tạo kiến thức thông tin, ngay cả khi lĩnh vực kiến
thức dữ liệu phổ biến hơn lĩnh vực kiến thức thông tin 19. Schneider cũng xác định kiến
thức dữ liệu như là một phần của kiến thức thông tin 20.

15

Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs:

Core competencies and contents”, Libri, 63(2): 123–134

16

Johnson CA (2012), The Information Diet: A Case for Conscious Consumption, Sebastopol,

CA: O’Reilly Media
17

Bundy A (ed.) (2004), Australian and New Zealand Information Literacy Framework,

Adelaide: Australian and New Zealand Institute for Information Literacy.
18

Andretta S, Pope A, Walton G (2008), “Information Literacy Education in the UK”, Communications in

Information Literacy, 2(1): 36–51
19

Hunt K (2004), “The challenges of integrating data literacy into the curriculum in an undergraduate

institution”, IASSIST Quarterly, 28(2): 12–15, />20

Schneider R (2013), “Research data literacy”, In: Kurbanoglu S, . (eds) Worldwide Commonalities and

Challenges in Information Literacy Research and Practice, Cham: Springer International, pp. 134–140

7


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018


Cả hai mơ hình Bảy trụ cột của kiến thức thông tin SCONUL 21 và thấu kính kiến
thức thơng tin về Khung phát triển của các nhà nghiên cứu Vitae 22 đều nhấn mạnh rằng
để xác định thơng tin nào có thể cung cấp tư liệu tốt nhất nhằm đáp ứng nhu cầu tin, tìm
kiếm, tạo ra và xử lý với dữ liệu nghiên cứu là rất quan trọng, vì kiến thức thơng tin hiện
nay khơng chỉ bao gồm các thông tin được công bố và các dữ liệu cơ bản. Điều này phù
hợp với cách giải thích thơng tin rộng hơn, thừa nhận rằng khái niệm thông tin bao gồm
dữ liệu nghiên cứu. Carlson nhấn mạnh rằng mở rộng phạm vi kiến thức thông tin bao
gồm quản lý dữ liệu là một sự phát triển hợp lý. Si cho rằng các dịch vụ liên quan đến dữ
liệu cần được hỗ trợ bởi các chuyên gia giỏi về kiến thức thông tin 23.
Calzada Prado và Marzal cho biết “Kiến thức thông tin và kiến thức dữ liệu là một
phần của sự liên tục giáo dục về khoa học, một quá trình đào tạo bắt đầu ở trường học
được hoàn thiện và trở nên chuyên sâu trong đào tạo đại học và trở thành một phần của
quá trình học tập suốt đời” 24. Hai tác giả cũng xác định được một số tiêu chí về kiến thức
thơng tin và tiêu chuẩn năng lực kiến thức thông tin cho giáo dục đại học gồm: Xác định
dữ liệu cần thiết; Truy cập các nguồn dữ liệu phù hợp với các thông tin cần thiết; Nhận
biết giá trị, phân loại và định dạng dữ liệu nguồn; Đánh giá dữ liệu và nguồn của nó; Lựa
chọn và tổng hợp dữ liệu và kết hợp dữ liệu với các nguồn thông tin khác và kiến thức
sẵn có; Sử dụng dữ liệu một cách có đạo đức; Áp dụng kết quả để học tập, ra quyết định
hoặc giải quyết vấn đề.
Họ cũng nhấn mạnh đến khả năng xác định bối cảnh trong đó dữ liệu được tạo ra
và tái sử dụng. Bằng cách đề cập đến hai thành phần chính trong vịng đời dữ liệu, chúng
phù hợp với quan điểm hiện tại về kiến thức thông tin kết hợp sự hiểu biết về cách thức
tạo ra thông tin.
21

SCONUL (2011), The SCONUL Seven Pillars of Information Literacy. Core Model for Higher

Education, London: Society of College, National and University Libraries Working Group on
Information Literacy. />22


Vitae (2011), Researcher Development Framework. Cambridge: Careers Research and Advisory

Centre.
/>23

Si L, Zhuang X, Xing W, . (2013), “The cultivation of scientific data specialists”, Library Hi Tech,

31(4): 700–724
24

Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information literacy programs:

Core competencies and contents”, Libri, 63(2): 123–134.

8


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

Mandinach và Gummer xác định “Kiến thức dữ liệu là khả năng am hiểu và sử
dụng dữ liệu hiệu quả để đưa ra quyết định, kiến thức dữ liệu có vai trị hỗ trợ ra quyết
định, do đó kiến thức dữ liệu gắn liền với quản trị dữ liệu” 25
Theo Hiệp hội Thư viện đại học và nghiên cứu (Association of College and
Research Libraries), “Kiến thức dữ liệu tập trung vào việc tìm hiểu cách tìm và đánh giá
dữ liệu, nhấn mạnh đến phiên bản của tập dữ liệu nhất định và người chịu trách nhiệm về
nó, các trích dẫn và sử dụng dữ liệu có đạo đức” 26
Xem xét tất cả các định nghĩa này, kiến thức dữ liệu có thể được định nghĩa là một
bộ kỹ năng và kiến thức cơ bản, trao quyền cho các cá nhân biến dữ liệu thành thông tin

và thành kiến thức có thể thực hiện bằng cách cho phép họ truy cập, giải thích, đánh giá,
quản lý và sử dụng dữ liệu một cách có đạo đức.
Searle xác định kiến thức dữ liệu là một trong các hoạt động dịch vụ dữ liệu
nghiên cứu hỗ trợ các nhà nghiên cứu xây dựng các kỹ năng và kiến thức cần thiết để
quản lý dữ liệu hiệu quả 27. Do đó, có thể nói rằng kiến thức dữ liệu có liên quan thực tế
đến tất cả các quy trình được dịch vụ dữ liệu nghiên cứu quy định, và xây dựng khung
chính cho sự tham gia của các thư viện trong việc hỗ trợ mơ hình nghiên cứu chun sâu
về dữ liệu. Các dịch vụ dữ liệu nghiên cứu chắc chắn là tồn diện, do đó bao gồm các
khía cạnh của chúng làm cho kiến thức dữ liệu rộng khắp và toàn diện.
Khi đặt kiến thức dữ liệu gần với kiến thức thông tin, cần xem xét đến kiến thức
thông tin tổng quát. Theo Carlson, các chương trình dữ liệu thông tin phải phù hợp với
thực tiễn chuyên ngành và văn hố hiện nay 28. Một nghiên cứu phân tích của Pinto cho
thấy kiến thức thông tin cả trong khoa học y tế và khoa học xã hội đều có 'nhân cách' cụ

25

Mandinach E, Gummer E (2013), “A systemic view of implementing data literacy in educator

preparation”, Educational Researcher, 42(1): 30–37
26

ACRL (2013), Intersections of Scholarly Communication and Information Literacy: Creating Strategic

Collaborations for a Changing Academic Environment, Chicago, IL: Association of College and
Research Libraries. />27

Searle S, Wolski M, Simons N, . (2015), “Librarians as partners in research data service development at

Griffith University”, Program, 49(4): 440–460.
28


Carlson J, Fosmire M, Miller C, . (2011), “Determining data information literacy needs: A study of

students and research faculty”, portal: Libraries and the Academy, 11(2): 629–657.

9


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

thể riêng 29. Nói chung, các phương pháp tiếp cận mới hơn đối với kiến thức thông tin
nhấn mạnh rằng thông tin được sử dụng trong các bối cảnh chuyên ngành khác nhau.
Farrell và Badke nhấn mạnh: “Để đáp ứng nhu cầu của thời đại thông tin đối với những
người xử lý thơng tin có trình độ, việc đào tạo kiến thức thông tin phải nằm trong phạm
vi thực tiễn văn hoá xã hội của các ngành bằng việc tập trung mở rộng vào nhận thức
luận và siêu diễn ngôn. Kiến thức thông tin thực sự sẽ đòi hỏi các cán bộ thư viện hoặc
các giảng viên mời gọi sinh viên vào các ngành học. Vì vậy, kiến thức thông tin phải
được hiểu là thực hành thông tin thuộc về một ngành học.” 30
Kỹ năng kiến thức dữ liệu cũng được xem là một ngành học cụ thể. Về kỹ năng và
khả năng cần thiết, những người có kiến thức dữ liệu biết cách chọn và tổng hợp dữ liệu
và kết hợp nó với các nguồn thơng tin khác và kiến thức đã có. Họ cũng phải nhận ra giá
trị dữ liệu nguồn và làm quen với các loại và định dạng dữ liệu. Các kỹ năng khác bao
gồm xác định, thu thập, tổ chức, phân tích, tóm tắt và ưu tiên dữ liệu. Xây dựng các giả
thuyết, xác định các vấn đề, giải thích dữ liệu, xác định, lập kế hoạch, thực hiện, cũng
như giám sát các quá trình hành động cũng gắn liền với các kỹ năng cần thiết và bổ sung
thêm cho nhu cầu biến đổi dữ liệu cho các mục đích sử dụng cụ thể.
Ridsdale thiết lập một ma trận về năng lực kiến thức dữ liệu với ý định thúc đẩy
một cuộc đối thoại liên tục về các tiêu chuẩn về kiến thức dữ liệu và kết quả học tập trong
đào tạo kiến thức dữ liệu. Hoạt động có lẽ quan trọng nhất trong ma trận này là đánh giá

chất lượng, bao gồm việc đánh giá các nguồn dữ liệu cho độ tin cậy và sai sót hoặc các
vấn đề. Việc đánh giá xuất hiện trong quá trình thu thập dữ liệu và giải thích dữ liệu rõ
ràng cho thấy các cơ chế cũng đặc trưng cho kiến thức thông tin. Ngay cả việc hiển thị dữ
liệu bao gồm đánh giá các biểu thị đồ họa về dữ liệu. 31
Một chương trình học về kiến thức dữ liệu thí điểm tại Đại học Purdue được xây
dựng dựa trên các kỹ năng lập kế hoạch; mơ hình vịng đời; khám phá và thu nhận; mô tả

29

Pinto M, Pulgarin A, Escalona M (2014), “Viewing information literacy concepts: A comparison of two

branches of knowledge”, Scientometrics, 98(3): 231–232.
30

Farrell R, Badke W (2015), “Situating information literacy in the disciplines”, Reference Services

Review, 43(2): 319–340.
31

Ridsdale C, Rothwell J, Smit M, . (2015), “Strategies and Best Practices for Data Literacy Education

Knowledge Synthesis Report”, Halifax, NS: Dalhousie University.
/>
10


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

và siêu dữ liệu; an ninh và lưu trữ; bản quyền và cấp phép; chia sẻ; quản lý và tài liệu; mô

tả; kho tàng; bảo quản; xuất bản và quản lý 32.
Thực tế là chất lượng dữ liệu đóng vai trị đặc biệt trong kiến thức dữ liệu cũng đã
được Carlson minh chứng. Các trách nhiệm chính và thiếu sót trong quản lý dữ liệu của
sinh viên sau đại học bao gồm việc đảm bảo chất lượng. Đảm bảo chất lượng được xem
như một sự pha trộn các kỹ năng kỹ thuật giúp cụ thể hóa trong sự hiểu biết với thiết bị,
kiến thức ngành học và một q trình siêu nhận thức địi hỏi sự tổng hợp. Mặc dù đã bị
thay thế một phần bởi Khung kiến thức thông tin cho giáo dục đại học, song kiến thức dữ
liệu có thể được nhìn qua lăng kính của Các tiêu chuẩn năng lực kiến thức thơng tin cho
giáo dục đại học. Tiêu chuẩn 3 của các tiêu chuẩn này (đánh giá thông tin) bao gồm yêu
cầu phải hiểu và đánh giá nghiêm các nguồn bằng cách xác định xem liệu dữ liệu có đáng
tin cậy và/hoặc kho dữ liệu hay thành phần của nó cung cấp mức độ kiểm sốt chất lượng
cho nội dung của nó hay không.
Như đã đề cập ở trên, quản lý siêu dữ liệu là một trong những quy trình quản trị dữ
liệu quan trọng liên quan đến chất lượng. Đồng thời, việc đánh giá siêu dữ liệu là một
phần của việc đảm bảo chất lượng nên được đưa vào các chương trình kiến thức dữ liệu.
Bảo đảm chất lượng trong bối cảnh này bao gồm việc sử dụng siêu dữ liệu để tạo điều
kiện hiểu rõ các vấn đề tiềm ẩn với dữ liệu.
Đào tạo kiến thức dữ liệu có hai mục đích. Mục đích thứ nhất là tự giải thích, tức
là đảm bảo rằng sinh viên, giảng viên và nhà nghiên cứu trở thành những cán bộ khoa
học kiến thức dữ liệu. Như Carlson và Johnston nhấn mạnh, phải nâng cao nhận thức về
kiến thức dữ liệu cho các giảng viên, sinh viên và các quản trị viên bằng cách gửi thông
điệp rõ ràng đến nhu cầu của các bên liên quan. Việc truyền tải thơng điệp thậm chí có
thể tăng cường độ tin cậy của các thông điệp như vậy. Mục đích thứ hai là để giáo dục
các chuyên gia thông tin 33
Kết luận: Quản trị dữ liệu và kiến thức dữ liệu là hoạt động không thể thiếu trong
quản lý chất lượng dữ liệu. Việc sử dụng chúng là điều kiện tiên quyết để quản lý dữ liệu
hiệu quả, và triển khai các dịch vụ dữ liệu nghiên cứu. Việc phân định các lĩnh vực quyết
định và xác định trách nhiệm giải trình cho việc ra quyết định, tuân thủ các quy tắc trong

32


Carlson J, Stowell Bracke MS (eds) (2015), “Planting seeds for data literacy: Lessons learned from a

student-centered education program”, International Journal of Digital Curation, 10(1): 95–110.
33

Carlson J, Johnston LR (2015), Data Information Literacy: Librarians, Data, and the Education of a

New Generation of Researchers. West Lafayette, IN: Purdue University Press.

11


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

quản trị dữ liệu có thể cải thiện công tác quản lý dữ liệu trong thư viện. Quản trị dữ liệu
là một dịch vụ dựa trên các quy trình chuẩn, lặp lại và được thiết kế để cho phép minh
bạch các quá trình liên quan đến dữ liệu và giảm chi phí, do đó nó có thể được sử dụng
trong thư viện đại học. Quản trị dữ liệu đề cập đến các quy tắc, chính sách, tiêu chuẩn;
quyền quyết định; trách nhiệm giải trình và phương pháp thực thi, nó sẽ như là một quy
chuẩn về chất lượng dữ liệu của thư viện. Thực tiễn quản trị dữ liệu cũng sẽ hữu ích trong
việc quản lý thay đổi và đàm phán các vấn đề dữ liệu lớn. Chú ý đến quản lý chất lượng
dữ liệu song song với quản lý dữ liệu là việc làm quan trọng giúp thư viện cung cấp các
dịch vụ dữ liệu nghiên cứu.
TÀI LIỆU THAM KHẢO

1. ACRL (2013), Intersections of Scholarly Communication and Information Literacy:
Creating Strategic Collaborations for a Changing Academic Environment, Chicago,
IL: Association of College and Research Libraries. />2. Andretta S, Pope A, Walton G (2008), “Information Literacy Education in the UK”,

Communications in Information Literacy, 2(1): 36–51
3. Bawden D, Robinson L (2015), “An intensity around information’: The changing face
of chemical information literacy”, Journal of Information Science.
4. Boyd D, Crawford K (2012), “Critical questions for big data. Information”,
Communication and Society, 15(5): 662–669.
5. Bundy A (ed.) (2004), Australian and New Zealand Information Literacy Framework,
Adelaide: Australian and New Zealand Institute for Information Literacy.
6. Calzada Prado JC, Marzal MÁ (2013), “Incorporating data literacy into information
literacy programs: Core competencies and contents”, Libri, 63(2): 123–134
7. Carlson J, Fosmire M, Miller C, . (2011), “Determining data information literacy
needs: A study of students and research faculty”, portal: Libraries and the Academy,
11(2): 629–657
8. Carlson J, Johnston LR (2015), Data Information Literacy: Librarians, Data, and the
Education of a New Generation of Researchers. West Lafayette, IN: Purdue
University Press.

12


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

9. Carlson J, Stowell Bracke MS (eds) (2015), “Planting seeds for data literacy: Lessons
learned from a student-centered education program”, International Journal of Digital
Curation, 10(1): 95–110.
10. DGI
(2015a),
“Definitions
of
Data

/>
Governance”,

11. DosSantos J (2015), “What librarians can teach us about managing Big Data”,
InFocus. />12. Duncan J, Clement K, Rozum B (2013), “Teaching our faculty. developing copyright
and scholarly communication outreach programs”. In: Davis-Kahl S, Hensley
MK (eds) Common Ground at the Nexus of Information Literacy and Scholarly
Communication, Chicago IL: Association of College & Research Libraries, pp. 269–
286.
13. Exner N (2014), “Research information literacy: Addressing original researchers’
needs”, Journal of Academic Librarianship, 40(5): 460–466.
14. Farrell R, Badke W (2015), “Situating information literacy in the disciplines”,
Reference Services Review, 43(2): 319–340.
15. Fosmire M, Miller C (2008), “Creating a culture of data integration and
interoperability: Librarians and Earth Science Faculty collaborate on a geoinformatics
course”, In: Proceedings of the IATUL conferences, Paper 16.
/>16. Hunt K (2004), “The challenges of integrating data literacy into the curriculum in an
undergraduate
institution”,
IASSIST
Quarterly,
28(2): 12–15,
/>17. Johnson CA (2012), The Information Diet: A Case for Conscious Consumption,
Sebastopol, CA: O’Reilly Media
18. Khatri V, Brown CV (2010), “Designing data governance”, Communications of the
ACM, 53(1): 148–152.
19. Koltay T (2015a), “Data literacy: In search of a name and identity”, Journal of
Documentation, 71(2): 401–415
20. Koltay T. (2016), “Datagovernance, data literacy and the management of data
quality”, IFLA Journal, Vol. 2, Issue 4.

13


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

21. MacMillan D (2014), “Data sharing and discovery: What librarians need to know”,
Journal of Academic Librarianship, 40(5): 541–549
22. Mandinach E, Gummer E (2013), “A systemic view of implementing data literacy in
educator preparation”, Educational Researcher, 42(1): 30–37
23. Martell C (2009), “sAccess: The social dimension of a new paradigm for academic
librarianship”, Journal of Academic Librarianship, 35(3): 205–206.
24. Maybee C, Zilinski L (2015), “Data informed learning: A next phase data literacy
framework for higher education”, In: 78th ASIS&T annual meeting: Information
science with impact: Research in and for the community, St Louis, MS, USA,
pp. 108–111.
25. Pinto M, Pulgarin A, Escalona M (2014), “Viewing information literacy concepts: A
comparison of two branches of knowledge”, Scientometrics, 98(3): 231–232.
26. Ridsdale C, Rothwell J, Smit M, . (2015), “Strategies and Best Practices for Data
Literacy Education Knowledge Synthesis Report”, Halifax, NS: Dalhousie University.
/>27. Rosenbaum S (2010), “Data governance and stewardship: Designing data stewardship
entities and advancing data access”, Health Services Research, 45(5): 1442–1455
28. Sarsfield S (2009), The Data Governance Imperative: A Business Strategy for
Corporate Data, Ely: IT Governance
29. Schneider R (2013), “Research data literacy”, In: Kurbanoglu S, . (eds) Worldwide
Commonalities and Challenges in Information Literacy Research and
Practice, Cham: Springer International, pp. 134–140.
30. SCONUL (2011), The SCONUL Seven Pillars of Information Literacy. Core Model
for Higher Education, London: Society of College, National and University Libraries
Working

Group
on
Information
Literacy.
/>31. Searle S, Wolski M, Simons N, . (2015), “Librarians as partners in research data
service development at Griffith University”, Program, 49(4): 440–460.
32. Seiner RS (2014), Non-Invasive Data Governance: The Path of Least Resistance and
Greatest Success, Basking Ridge, NJ: Technics Publications
33. Si L, Zhuang X, Xing W, . (2013), “The cultivation of scientific data specialists”,
Library Hi Tech, 31(4): 700–724
14


Hội thảo “Tác động của cách mạng công nghiệp lần thứ 4 tới hoạt động thông tin khoa học và
công nghệ", do Hội Thông tin KH&CN Việt Nam tổ chức tại Hà Nội, ngày 18/12/2018

34. Smith AM (2007), “Data governance best practices: The beginning”, EIMInsight
(1)1.
/>35. Soares S (2012), Big Data Governance: An Emerging Imperative, Boise, ID: MC
Press.
36. Vitae (2011), Researcher Development Framework. Cambridge: Careers Research
/>Advisory
Centre.
related/researcher-development-framework-rdf-vitae.pdf.
37. Wang M (2013), “Supporting the research process through expanded library data
services”, Program, 47(3): 282–303
38. Weill P, Ross JW (2004), IT Governance: How Top Performers Manage IT Decision
Rights for Superior Results, Boston, MA: Harvard Business School Press.
39. Zilinski LD, Nelson MS (2014), “Thinking critically about data consumption:
Creating the data credibility checklist”, Proceedings of the American Society for

Information Science and Technology, 51(1): 1–4.

15



×