Tải bản đầy đủ (.pdf) (8 trang)

Lưu trữ và thư viện số - nền tảng xây dựng nhân văn số thức

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (187.38 KB, 8 trang )

LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC
Cam Anh Tuấn* - Đỗ Thu Hiền**
1

Tóm tắt: Cơng nghệ thơng tin là một trong những động lực quan
trọng nhất và là giải pháp hàng đầu cho sự phát triển, góp phần
biến đổi một cách tích cực nhiều lĩnh vực của đời sống xã hội, trong
đó có hoạt động lưu trữ - thư viện và hoạt động nghiên cứu khoa
học nói chung, nghiên cứu khoa học xã hội và nhân văn nói riêng.
Vai trị và mối liên hệ mật thiết giữa tài liệu lưu trữ và tư liệu với
lĩnh vực nghiên cứu khoa học xã hội và nhân văn đã được khẳng
định và chứng minh. Nếu tài liệu lưu trữ và tư liệu đóng vai trị là
chất liệu, là “bột” thì các kết quả nghiên cứu khoa học xã hội và
nhân văn là “hồ”. Dưới tác động của cuộc cách mạng công nghệ
4.0, hai nhân tố này chắc chắn có những sự ảnh hưởng nhất định.
Bài tham luận này đề cập đến sự tác động của công nghệ số, đặc
biệt là công cụ của Nhân văn số thức đối với mối quan hệ nói trên.
Từ khóa: Lưu trữ số; Thư viện số; Nhân văn số thức; Khai thác dữ liệu.

1. QUAN NIỆM VỀ LƯU TRỮ, THƯ VIỆN SỐ VÀ NHÂN VĂN SỐ THỨC
(DIGITAL HUMANITIES)
Trong bối cảnh của cuộc cách mạng công nghệ 4.0, ngành thư viện
và lưu trữ học chịu nhiều tác động khi việc ứng dụng công nghệ thông
tin, trở thành cơ hội nhưng cũng là thách thức. Ngành lưu trữ và thư
viện số xuất hiện một cách tất yếu trước sự phát triển như vũ bão của
công nghệ thông tin và nhu cầu sử dụng tài liệu lưu trữ, tư liệu của xã
*





**



Tiến sĩ, Khoa Lưu trữ học và Quản trị Văn phòng, Trường Đại học Khoa học
Xã hội & Nhân văn, Đại học Quốc gia Hà Nội.
Thạc sĩ, Khoa Lưu trữ học và Quản trị Văn phòng, Trường Đại học Khoa học
Xã hội & Nhân văn, Đại học Quốc gia Hà Nội.


LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC

hội ngày một gia tăng. Từ số hóa tài liệu lưu trữ đến tài liệu lưu trữ điện
tử (born-digital archives) là một sự thay đổi lớn, đánh dấu sự xuất hiện
của một dạng thức lưu trữ mới – Lưu trữ số. Sự thay đổi mang tính
cách mạng này của ngành Lưu trữ cùng với sự phát triển trước đó của
Thư viện số đã khiến việc sử dụng tài liệu lưu trữ, tư liệu khơng bị bó
hẹp trong các phòng đọc “vật lý” mà được mở rộng trong một không
gian số rộng lớn vô cực. Thời gian tra tìm dữ liệu có thể tính bằng giây
mà kết quả đem lại vô cùng phong phú, đa dạng và tồn diện. Tài liệu
lưu trữ sẽ khơng cịn nằm “lặng im” trong các kho lưu trữ mà sẽ có một
“đời sống sôi động” cùng với vô số nguồn tư liệu khác như một tất yếu.
Sẽ còn quá sớm để khẳng định những điều tích cực đem lại, những
rủi ro tiềm ẩn… nhưng tựu chung lại, lưu trữ số sẽ là bước ngoặt quan
trọng đối với Lưu trữ học và cộng đồng những người làm nghề lưu trữ
không chỉ ở Việt Nam mà tất cả các nước trên thế giới.
Là hệ quả ra đời bởi sự kết hợp giữa những người làm công nghệ
thông tin và các nhà nghiên cứu khoa học xã hội và nhân văn, Nhân
văn số thức đã xuất hiện và có sự phát triển vượt bậc trong một thập kỷ
gần đây và trở thành “đối tác” quan trọng của nhiều ngành khoa học

như lịch sử, văn học – nghệ thuật, ngôn ngữ, thông tin – thư viện, lưu
trữ… Sự kết hợp giữa Nhân văn số thức và các ngành này đều hướng
tới mục đích nâng cao hiệu quả làm việc của người nghiên cứu trong
bối cảnh công nghệ số chi phối đời sống xã hội một cách căn bản. Nhân
văn số thức (Digital humanities) là thuật ngữ mô tả lĩnh vực liên ngành
nghiên cứu sự tác động và mối quan hệ giữa cơng nghệ máy tính và công việc
của những người nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn (Borgan,
Friedlander, Presner, 2009). Tại Úc, nhân văn số thức được nghiên cứu
ở hai khía cạnh: Một là, phát triển các công cụ phần mềm và ứng dụng
các chức năng của nó trong việc thực hiện các phương pháp nghiên
cứu của khoa học xã hội và nhân văn. Hai là, nghiên cứu về cách thức
mà các công cụ phần mềm làm thay đổi việc thực hiện nghiên cứu
khoa học xã hội và nhân văn. Hay nói cách khác, một mặt, nhân văn
số thức phát triển các công cụ phục vụ nghiên cứu khoa học xã hội và
nhân văn (dưới góc độ cơng nghệ thơng tin). Mặt khác, nhân văn số
thức nghiên cứu mọi khía cạnh liên quan đến quản lý: cách thức tạo ra
các dự án nhân văn số thức, cách thức biến đổi một cách căn bản việc
thực hiện nghiên cứu.

423


424

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

Nhân văn số thức được coi là công cụ xử lý tất cả các dữ liệu đầu
vào, bao gồm các dữ liệu khoa học, dữ liệu xã hội, dữ liệu pháp lý; dữ
liệu quá khứ, dữ liệu hiện hành…, được thể hiện ở nhiều dạng thức
khác nhau. Đầu ra của Nhân văn số thức sẽ là các kết quả nghiên cứu

phục vụ cho các nhà khoa học xã hội và nhân văn. Bản chất của các
nghiên cứu xã hội và nhân văn là dựa trên kết quả xử lý các dữ liệu đa
dạng để tìm thấy quy luật vận động của xã hội và con người. Trong khi,
khoa học tự nhiên đi tìm các quy luật vận động của tự nhiên. Khoa học
tự nhiên có thể thực nghiệm các giả thuyết nghiên cứu trong phịng
thí nghiệm để tìm ra câu trả lời chính xác cho các sự vật, hiện tượng tự
nhiên. Đối với khoa học xã hội và nhân văn, gần như là không thể tiến
hành các thực nghiệm, do vậy, kết quả nghiên cứu của họ phụ thuộc
vào khối lượng và chất lượng của các dữ liệu thu thập được.

Hình 1: Mối quan hệ của 03 yếu tố: Dữ liệu đầu vào – Nhân văn số thức –
Kết quả nghiên cứu

2. MỐI QUAN HỆ GIỮA LƯU TRỮ, THƯ VIỆN SỐ VÀ NHÂN VĂN SỐ THỨC
Tài liệu lưu trữ là nguồn dữ liệu quan trọng hình thành trong
hoạt động của các tổ chức, cá nhân, có giá trị và khả năng phục vụ đắc
lực cho các nghiên cứu trong lĩnh vực khoa học xã hội và nhân văn,
trong đó đặc biệt phải kể đến các ngành khoa học như lịch sử, luật,
văn hoá, xã hội… Những dữ liệu này cũng như các dạng tư liệu của
các thư viện khi tồn tại ở dạng số sẽ là một trong những đầu vào quan
trọng của Nhân văn số thức. Đến lượt mình, Nhân văn số thức xử lý
các dữ liệu từ tài liệu lưu trữ số, tích hợp kết quả xử lý các dạng tư
liệu khác và nhờ đó chiết xuất các kết quả đầu ra phục vụ các nhu cầu
khác nhau của những người nghiên cứu trong lĩnh vực khoa học xã


LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC

hội và nhân văn. Như vậy, Lưu trữ số với nguyên liệu là các loại hình
tài liệu lưu trữ và tư liệu số hoá hoặc tài liệu số (born-digital) phong

phú, có độ tin cậy cao, được cấu trúc chặt chẽ, quy chuẩn về mặt dữ
liệu… sẽ đóng vai trị là một trong những nguồn dữ liệu số đầu vào
quan trọng của Nhân văn số thức. Lưu trữ số có thể được đánh giá là
một trong những nguồn dữ liệu đầu vào chất lượng nhất đối với hoạt
động của Nhân văn số thức. Ở một góc tiếp cận khác, nếu xét Nhân
văn số thức là sự tổng hồ giữa cơng nghệ, kỹ thuật, phần cứng, phần
mềm, các dữ liệu, siêu dữ liệu hay dữ liệu lớn…, thì Lưu trữ số và thư
viện số là hai trong những phân hệ quan trọng của Nhân văn số thức.
Như vậy, Lưu trữ số là một bước tiến quan trọng, cùng với thư viện số
để phát huy giá trị thông tin của tài liệu lưu trữ và tư liệu khác trong
các cơng trình nghiên cứu khoa học xã hội và nhân văn. Để làm được
điều này, Lưu trữ và Thư viện số cần được kết nối một cách mạnh mẽ
với Nhân văn số thức.
Tại Hoa Kỳ, sự thành công của dự án Kho lưu trữ Rossetti và The
William Blake Archive (2006) đã đặt Nhân văn số thức đứng trên một
góc độ mới đa chiều hơn. Đồng thời, việc xuất bản cuốn A Companion
to Digital Humanities là một bước ngoặt đối với nghiên cứu Nhân văn
số thức, và đưa Nhân văn số thức trở về với đúng tiềm năng của nó,
khơng chỉ đơn thuần là số hóa tài liệu hay một ngành chỉ hỗ trợ về mặt
máy móc đối với người nghiên cứu. Có thể nói, Nhân văn số thức xuất
phát từ một vị trí thấp, là một cơng cụ hỗ trợ phục vụ nghiên cứu trở
thành một ngành khoa học với tiềm năng lớn tạo nên cuộc cách mạng
trong nghiên cứu khoa học xã hội và nhân văn thông qua việc thay đổi
phương thức nghiên cứu của các nhà khoa học.
Xét dưới góc độ lợi ích của việc vận dụng thành tựu Nhân văn số
thức trong nghiên cứu khoa học xã hội và nhân văn thì Nhân văn số
thức cung cấp các cơng cụ tìm kiếm thơng tin đối với một khối lượng dữ
liệu lớn, hỗ trợ người nghiên cứu trong tìm kiếm và xử lý một khối lượng
lớn dữ liệu phục vụ cho quá trình nghiên cứu của mình. Một dự án nhân
văn số thức có thể quy mơ như hình thức phịng đọc ảo/ phịng đọc trực

tuyến (độc giả có thể truy cập, khai thác tài liệu lưu trữ và tư liệu của
một hoặc nhiều kho lưu trữ, thư viện), triển lãm trực tuyến không gian
ba chiều được tổ chức tại nhiều quốc gia phát triển như Hoa Kỳ, Anh,

425


426

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

Úc, Pháp… hoặc có thể đơn giản là một tập hợp các dữ liệu có chủ đề cụ
thể dưới dạng số (độc giả có thể truy cập, tiếp cận các dữ liệu dưới nhiều
dạng khác nhau như văn bản, hình ảnh 3D, biểu đồ, bản vẽ liên quan
cùng một chủ đề cụ thể). Với những ứng dụng như vậy, có thể khẳng
định rằng, ưu điểm lớn nhất của Nhân văn số thức khi được áp dụng
trong các ngành khoa học xã hội và nhân văn, trong đó có lưu trữ học
khoa học thư viện, khơng phải chỉ ở sự thuận lợi trong tìm kiếm, tiếp cận
dữ liệu mà là việc tạo ra mối tương quan trong dữ liệu. Sự tương quan,
liên kết dữ liệu trong một hoặc nhiều kho dữ liệu lớn mà nhân văn số
thức tạo ra đã giúp ngành khoa học mới này có thể mang tính cách mạng
trong nghiên cứu khoa học xã hội và nhân văn.
Theo GS. Paul Arthur, Trưởng khoa Nhân văn số thức và Khoa học
xã hội, Trường Đại học Edith Cowan (Úc), tại các quốc gia phát triển
trên thế giới, ngành Nhân văn số thức thường ra đời sau sự thành cơng
của nhiều dự án số hóa tài liệu, tư liệu ở các ngành, lĩnh vực. Sự ra đời
của Nhân văn số thức là tất yếu sau khi số hóa tài liệu, tư liệu trở nên
phổ biến. Trong lĩnh vực thư viện và lưu trữ, các dự án số hóa sách, tạp
chí và tài liệu lưu trữ đã được triển khai ở Úc và nhiều quốc gia phát
triển khác.

Tại Đài Loan, Thư viện số Lịch sử Đài Loan (Taiwan History
Digital Library) là cơ quan được Hội đồng các vấn đề văn hóa (CCA)
thuộc Chính phủ Đài Loan giao nhiệm vụ thực hiện hai dự án quan
trọng về Kho tàng quốc gia về di sản văn hóa (2003): Số hóa tài liệu
triều đình nhà Minh – Thanh về Đài Loan và số hóa các bản khế ước
địa phương liên quan. Năm 2005, Trung tâm Nghiên cứu Nhân văn số
thức thuộc Đại học Quốc gia Đài Loan tham gia dự án với vai trò tăng
số lượng tài liệu, tư liệu liên quan được thu thập từ nhiều tổ chức khác
nhau. Tổng số hơn 100.000 tài liệu và tư liệu lưu trữ (chứa 180 triệu ký
tự) được thu thập từ 170 nguồn và được số hóa, hồn chỉnh siêu dữ liệu
(metadata). Trung tâm đã xây dựng công cụ Nhân văn số thức hỗ trợ
các nhà khoa học trong việc tra tìm và xử lý khối dữ liệu lớn phục vụ
nghiên cứu. Một trong những ưu điểm của các công cụ này trong xử lý
dữ liệu là các kết quả truy xuất dữ liệu thơng qua trực quan hóa dữ liệu
bằng bản đồ, biểu đồ, đồ thị… Chẳng hạn, phân bổ theo thời gian của
toàn bộ tài liệu được ban hành bởi triều đình sẽ cho thấy những thời


LƯU TRỮ VÀ THƯ VIỆN SỐ - NỀN TẢNG XÂY DỰNG NHÂN VĂN SỐ THỨC

điểm mà số lượng tài liệu liên quan đến Đài Loan tăng rất nhiều. Các
điểm thuộc đồ thị phản ánh những năm số lượng tài liệu tăng, giảm
hoặc thậm chí khơng có Sắc lệnh nào được ban hành. Điều này sẽ phản
ánh sự kiện nào đó liên quan đến bối cảnh lịch sử Đài Loan. Nếu tra
cứu tư liệu lịch sử, chúng ta sẽ nhận thấy sự kiện Pháp xâm lược miền
Bắc Đài Loan năm 1844 và cuộc chiến tranh Trung – Pháp, tương ứng
với các mốc thời gian khơng có dữ liệu thể hiện trên đồ thị, đồng nghĩa
với việc khơng có tài liệu, tư liệu được lưu trữ ở giai đoạn này.
Một ví dụ khác minh chứng cho tính ưu việt của cơng cụ Nhân
văn số thức trong hai dự án đề cập ở trên là trải nghiệm tra cứu từ “bạc”

xuất hiện trong các giao dịch trao đổi đất đai được thực hiện bởi các
chuyên gia thuộc Trung tâm Nghiên cứu Nhân văn số thức thuộc Đại
học Quốc gia Đài Loan. Công cụ máy tính có thể truy xuất hơn 20.000
từ “bạc” có các từ đứng kèm trước. Trong đó, 9.127 từ “Phật bạc” xuất
hiện và nghiên cứu sâu hơn đã cho thấy những tài liệu lưu trữ này
đều có nội dung đề cập tới bạc Mexico. Điều này phản ánh bạc Mexico
được dùng nhiều trong các giao dịch đất đai ở Đài Loan vào cuối triều
Thanh. Các chuyên gia Nhân văn số thức và công nghệ thông tin thuộc
Trung tâm đã trao đổi với các nhà sử học có thẩm quyền nghiên cứu các
vấn đề Đài Loan vào thời kỳ nhà Thanh, đặc biệt là lịch sử kinh tế. Kết
quả cho thấy, dựa trên kết quả trực quan hóa dữ liệu, các chun gia
thuộc Trung tâm đã nhận xét chính xác tình hình trong khi một trong
số các nhà sử học nói trên thừa nhận rằng có thể kết luận về điều này
sau khoảng 10 năm nghiên cứu. [1]
Như vậy, sự phát triển của Nhân văn số thức nói chung và các cơng
trình khoa học, dự án với sự cộng tác của lưu trữ, thư viện số nói riêng đã
hình thành rõ nét tại các quốc gia phát triển. Lưu trữ, thư viện số đóng
vai trị quan trọng trong việc xây dựng cơ sở dữ liệu (gồm siêu dữ liệu) và
công cụ tra cứu tích hợp phân tích mối tương quan bên trong một khối
lượng lớn dữ liệu. Tất cả tạo nên các dự án Nhân văn số thức ở nhiều cấp
độ khác nhau, phục vụ nghiên cứu khoa học xã hội và nhân văn. Điều
này đã được khẳng định bởi Arjun Sabharawal (2015): Sử dụng những
dữ liệu định lượng trong các mơ hình trực quan hóa, dịng thời gian và
các biểu đồ… có thể mang đến nhiều hiệu quả hơn khi kết hợp sử dụng
với các thông tin về địa điểm, thời gian, tiêu đề/ trích dẫn văn bản của

427


428


PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

tài liệu… (siêu dữ liệu). Tuy nhiên, những cơng nghệ này cần phải làm
cho chúng thích hợp với các dữ liệu định tính mà các học giả nhân văn
thường sử dụng cho phân tích, giải thích và trình bày. [3]
Trên đây là một số dự án về Lưu trữ số và Nhân văn số thức của một
số quốc gia trên thế giới. Qua các ví dụ này, chúng tơi khẳng định về vai
trị của Lưu trữ, Thư viện số đối với việc xây dựng các dự án Nhân văn
số thức ở Việt Nam. Cùng với sự khởi động của dự án Hệ tri thức Việt số
hoá ngày 01 tháng 01 năm 2018 là việc Thủ tướng Chính phủ ban hành
Quyết định 458/QĐ-TTG ngày 03 tháng 4 năm 2020 phê duyệt Đề án
“Lưu trữ tài liệu điện tử của các cơ quan nhà nước giai đoạn 2020-2025”.
Những đề án nói trên chính là cơ sở pháp lý quan trọng trong lộ trình
xây dựng Lưu trữ, Thư viện số và Nhân văn số thức ở Việt Nam. Chúng
tôi hi vọng tham luận đã gợi ý được cho các nhà quản lý, những người
làm lưu trữ, thư viện về trách nhiệm của mình trước một nền tri thức số
mới sẽ trở thành hiện thực ở Việt Nam trong tương lai.

TÀI LIỆU THAM KHẢO
1.

Jieh Hsiang (2017), “Xây dựng hệ thống lưu trữ cho Nhân văn số thức”, Kỷ
yếu Hội thảo khoa học quốc tế Digital Humanities, Viện Hàn lâm Khoa học và
Công nghệ Việt Nam.

2.

Paul Arthur (2017), “Nhân văn số thức ở Australia và thế giới”, Kỷ yếu Hội
thảo khoa học quốc tế Digital Humanities, Viện Hàn lâm Khoa học và Công

nghệ Việt Nam.

3.

Arjun Sabharawal (2015), Digital Curation in the Digital Humanities, Chandos Publishing – Elsevier.


Phần 3
CÁC VẤN ĐỀ VỀ THƯ VIỆN HIỆN ĐẠI



×