Tải bản đầy đủ (.pdf) (16 trang)

Tác động của Big Data tới hoạt động của thư viện tại Trung tâm Thông tin - Thư viện, ĐHQGHN

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (369.95 KB, 16 trang )

<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>

Trung tam Thong tin Thu vien, DHQGHN


<b>Trương Thị Hồng Quyên*</b>


<b>Phạm Thị Thu**</b>


<i><b>Tóm tắt: Với sự phát triển không ngừng của mạng xã hội, sự ra đời của </b></i>


<i>các thiết bị mới tiên tiến, mọi hoạt động thường ngày đang dần được </i>
<i>internet hóa.Dẫn đến lượng thông tin ngày càng đa dạng, đã đặt ra </i>
<i>thách thức cho các nền cơng nghiệp khác nhau phải tìm một phương </i>
<i>pháp khác để xử lý dữ liệu. Big data có thể hiểu là “Dữ liệu lớn” đã ra đời </i>
<i>để giải quyết vấn đề đó.Vậy, Dữ liệu lớn thực chất là gì?Và nó b́t nguồn </i>
<i>từ đâu? Nó tác động như thế nào tới một số hoạt động của Trung tâm </i>
<i>Thông tin - Thư viện, ĐHQGHNN (VNU-LIC) trong thời đại cách mạng </i>
<i>công nghiệp 4.0 đang phát triển như vũ bão hiện nay.</i>


<i><b>Từ khóa: Dữ liệu lớn; Công nghiệp 4.0; Thư viện; VNU-LIC.</b></i>
<b>Đặt vấn đề</b>


Thư viện là nơi lưu giữ và cung cấp tri thức, là kho tàng tri thức của
nhân loại. Đồng thời, là trung tâm của môi trường giáo dục và nghiên
cứu, là cầu nối trung gian giữa người tạo ra tri thức và những người sử
dụng tri thức phục vụ cho q trình học tập, nghiên cứu và sáng tạo…
Chính những vai trị quan trọng đó đã một lần nữa khẳng định thư viện
là bộ phận quan trọng không thể thiếu trong các cơ sở giáo dục và đào
tạo. Thư viện đại học của thế kỷ 21 đã và đang chịu sự tác động mạnh
mẽ của cuộc Cách mạng Công nghiệp 4.0 (CMCN 4.0).


* Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội.


</div>
<span class='text_page_counter'>(2)</span><div class='page_container' data-page=2>

Trung tam Thong tin Thu vien, DHQGHN



449



TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


Ngày nay, CMCN 4.0 dẫn đến việc áp dụng công nghệ thông tin
và truyền thơng trong hoạt động thư viện là sự địi hỏi tất yếu. Với
sự phát triển không ngừng của mạng xã hội, sự ra đời của các thiết bị
mới tiên tiến, mọi hoạt động thường ngày đang dần được Internet hóa.
Lượng thơng tin ngày càng đa dạng đã đặt ra thách thức cho các nền
công nghiệp khác nhau, phải tìm phương pháp để xử lý khối lượng dữ
liệu khổng lồ và đa dạng về chủng loại. Dữ liệu lớn ra đời là giải pháp
cho vấn đề trên.


Dữ liệu lớn là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và
rất phức tạp mà những công cụ, ứng dụng xử lý dữ liệu truyền thống
không thể nào đảm đương được. Tuy nhiên, Dữ liệu lớn chứa rất nhiều
thông tin q giá mà nếu trích xuất thành cơng, nó sẽ giúp rất nhiều cho
việc kinh doanh, nghiên cứu khoa học, dự đoán các dịch bệnh sắp phát
sinh và thậm chí là cả việc xác định điều kiện giao thơng theo thời gian
thực. Chính vì thế, những dữ liệu này phải được thu thập, tổ chức, lưu
trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường.


<b>1. Dữ liệu lớn là gì?</b>


Thế giới đang ngày càng trở nên thông minh hơn, khả năng tiếp
cận với khối lượng lớn dữ liệu - từ đó dẫn đến sự hình thành Dữ liệu
lớn. Có nhiều vấn đề xoay quanh các khối dữ liệu lớn này. Chúng ta đều
cần phải biết nó là gì và hoạt động như thế nào?


Có nhiều định nghĩa, nhiều góc nhìn về Dữ liệu lớn, theo Wikipediea


<i>Dữ liệu lớn “là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và rất </i>
<i>phức tạp mà những công cụ, ứng dụng xử lý dữ liệu truyền thống không </i>
<i>thể nào đảm đương được”.</i>


</div>
<span class='text_page_counter'>(3)</span><div class='page_container' data-page=3>

Trung tam Thong tin Thu vien, DHQGHN



lần thứ tư và thế giới dịch vụ thơng minh (smart service world), Dữ liệu
lớn có thể được đề cập đến dưới dạng 6C: Connection - Kết nối (cảm
biến và mạng); Cloud - Đám mây (tính tốn và theo u cầu); Cyber -
Khơng gian ảo (mơ hình và bộ nhớ); Content - Nội dung/ Bối cảnh (ý
nghĩa và tương quan); Community - Cộng đồng (chia sẻ và cộng tác);
Custom - Tuỳ chỉnh (cá nhân hoá và giá trị) [10].


Tên gọi “Dữ liệu lớn” khiến đa số chúng ta chỉ hình dung tính chất
lớn mà khơng hình dung về độ phức tạp, nhưng về cơ bản thì hai tính
chất này ở Dữ liệu lớn ln đi cùng nhau. Trong đó, tính chất phức tạp
còn đặc trưng và thách thức hơn vấn đề độ lớn của dữ liệu. Dữ liệu là
nguồn chứa hầu hết mọi thông tin của con người, nhưng những thông
tin này không hiển thị trực tiếp ra cho chúng ta dùng ngay mà chỉ có
thể tìm ra chúng khi phân tích (xử lý) được dữ liệu. Đây là một thách
thức lớn, là bài toán khó cho hầu khắp các lĩnh vực mà Dữ liệu lớn tác
động đến.


<b>2. Những tác động của Dữ liệu lớn đối với đời sống xã hội nói chung </b>
<b>và hoạt động thơng tin thư viện nói riêng</b>


CMCN 4.0 đang làm thay đổi cách thức sản xuất, chế tạo và hình
thành kết nối của hàng tỷ người trên thế giới thông qua các thiết bị di
động và khả năng tiếp cận với cơ sở Dữ liệu lớn. Trong thế giới tồn
cầu hóa ngày nay, các hoạt động hàng ngày của chúng ta đã tạo ra các


dữ liệu một cách liên tục. Nhờ những công nghệ đột phá của cách mạng
công nghiệp lần thứ tư, lượng dữ liệu này ngày một khổng lồ, liên tục
thay đổi và có những tác động trở lại đến hầu hết các lĩnh vực và mọi
mặt của đời sống xã hội.


</div>
<span class='text_page_counter'>(4)</span><div class='page_container' data-page=4>

Trung tam Thong tin Thu vien, DHQGHN


451



TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


<i><b>2.1. Đối với mọi mặt của đ̀i sống xã hội </b></i>


Với mọi mặt: kinh tế, chính trị, giáo dục… Dữ liệu lớn chứa rất
nhiều thơng tin q giá mà nếu trích xuất thành công sẽ giúp rất nhiều
cho việc kinh doanh, nghiên cứu khoa học, điều hành đất nước.


Việc sử dụng Dữ liệu lớn sẽ dần phổ biến hơn với mọi người, từ
những người nông dân cho đến kỹ sư hay các nhà hoạch định chính
sách kinh tế của quốc gia. Theo Ankur Jain, nhà sáng lập và CEO của
Humin (một công ty công nghệ của Mỹ) cho rằng, chúng ta sẽ bắt đầu
định tuyến dữ liệu vào các đối tượng, sự vật, sự việc trong đời thực và
giúp chúng ta xử lý công việc tốt hơn.


Nếu để ý một chút, chúng ta sẽ thấy khi mua sắm online trên eBay,
Amazon hoặc những trang tương tự, trang này cũng sẽ đưa ra những sản
phẩm gợi ý tiếp theo cho khách hàng. Ví dụ khi xem điện thoại, nó sẽ
gợi ý cho bạn mua thêm ốp lưng, pin dự phòng; hoặc khi mua áo thun
thì sẽ có thêm gợi ý quần jean, dây nịt... Do đó, nghiên cứu được sở
thích, thói quen của khách hàng cũng gián tiếp giúp doanh nghiệp bán
được nhiều hàng hóa hơn. Vậy những thơng tin về thói quen, sở thích


này có được từ đâu? Chính là từ lượng dữ liệu khổng lồ mà các doanh
nghiệp thu thập trong lúc khách hàng ghé thăm và tương tác với trang
web của mình. Chỉ cần doanh nghiệp biết khai thác một cách có hiệu
quả Dữ liệu lớn thì nó khơng chỉ giúp tăng lợi nhuận cho chính họ mà
cịn tăng trải nghiệm mua sắm của người dùng, chúng ta có thể tiết kiệm
thời gian hơn nhờ những lời gợi ý so với việc phải tự mình tìm kiếm [6].


</div>
<span class='text_page_counter'>(5)</span><div class='page_container' data-page=5>

Trung tam Thong tin Thu vien, DHQGHN



<i><b>2.2. Đối với hoạt động thư viện </b></i>


Hiện nay, thư viện đại học trên thế giới đang có những chuyển biến
tích cực cùng với sự đổi mới của giáo dục đại học và sự phát triển của
CMCN 4.0. Thư viện đại học của thế kỷ 21 sẽ bị ảnh hưởng bởi ba yếu
tố quan trọng, đó là: sự phát triển của công nghệ, đổi mới giáo dục và
sự thay đổi không ngừng của xã hội. Thư viện đang thay đổi để đóng
vai trị mới, rộng và đầy đủ hơn, theo hướng làm tất cả những gì có thể
để thích ứng và đáp ứng cao nhất nhu cầu về thông tin khoa học phục
vụ học tập, nghiên cứu và giảng dạy.


Trong lĩnh vực công nghệ số, liên quan trực tiếp đến lĩnh vực thông
tin - thư viện, sự phát triển và ứng dụng của các công nghệ Dữ liệu lớn,
Internet vạn vật (Internet of Things) hay Trí tuệ nhân tạo (AI) hứa hẹn
mang lại nhiều thay đổi trong việc phát triển và cung cấp các dịch vụ
thông tin tới người dùng. Thư viện là môi trường ứng dụng các công
nghệ số từ rất sớm. Từ năm 2004, khái niệm “thư viện không tường”
đã được các nhà nghiên cứu sử dụng để chỉ các thư viện ứng dụng
công nghệ thông tin để cung ứng các sản phẩm và dịch vụ thư viện ảo
mà không phụ thuộc vào các thư viện vật lý. Những đổi mới về vai trò
và hoạt động của thư viện ngày nay diễn ra rất nhanh chóng, trên một


phạm vi rộng lớn và hết sức sâu sắc. Thư viện nhìn nhận thực trạng hoạt
động tại đơn vị mình để từ đó rút ra kinh nghiệm nhằm thúc đẩy và có
hướng xây dựng, phát triển thích ứng với thời đại.


<i><b>2.3. Dữ liệu lớn tác động đến VNU-LIC</b></i>


<i>- Hạ tầng trang thiết bị công nghệ thông tin</i>


</div>
<span class='text_page_counter'>(6)</span><div class='page_container' data-page=6>

Trung tam Thong tin Thu vien, DHQGHN


453



TáC đỘng CỦA Big dATATỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


Line 500Mb, 20 IP thực, 15 máy chủ cấu hình cao, 100TB bộ lưu trữ và
Backup, 5 LAN...); Cổng an ninh Hibrid; 2 hệ thống số hóa ScanRobot
Treventus 2500 trang/giờ đảm bảo cho VNU-LIC vận hành thường
xuyên và liên tục hệ thống 24/24h. Giai đoạn tới VNU-LIC đang có kế
hoạch bổ sung một số trang thiết bị hiện đại khác như giá sách thông
minh cùng với một số phần mềm đồng bộ với URD2 như: Aleph (Quản
trị hệ thống thư viện tài liệu in tích hợp hiện có hơn 2300 thư viện lớn
trên thế giới đang sử dụng); Rosetta (là công cụ để phát triển kho tài sản
số, bao gồm: tạo lập, quản lý, bảo quản, chia sẻ và chuyển giao các bộ
sưu tập số),… với định hướng tạo nên một VNU-LIC Dữ liệu lớn (Dữ
liệu lớn Center) hướng tới mô hình thư viện số dùng chung cho các thư
viện đại học ở Việt Nam. Với hạ tầng công nghệ hiện đại, phần mềm
quản trị thư viện số, công cụ tìm kiếm đám mây URD2 hiện đại số 1 thế
giới và hệ thống CSDL học thuật đỉnh cao, VNU-LIC luôn giữ vị thế
hàng đầu trong hệ thống các thư viện đại học Việt Nam, đáp ứng nhu
cầu tài liệu học thuật cho nghiên cứu và đào tạo của ĐHQGHN.



Để có một cơng cụ khai thác tài nguyên thông tin khoa học hiệu
quả và chuyên nghiệp, cùng một lệnh tìm kiếm có thể truy vấn đến
các kho tài liệu trong thư viện và trên thế giới, VNU-LIC đã trang bị
sản phẩm cổng giao diện tích hợp kiến thức tìm kiếm tập trung URD2
(Uniied Resource Discovery and Delivery)[5]; phần mềm Bookworm
(mượn trả tài liệu số trực tuyến trên thiết bị thông minh smartphone;
điện thoại di động…).


<i><b>- Nguồn nhân lực </b></i>


</div>
<span class='text_page_counter'>(7)</span><div class='page_container' data-page=7>

Trung tam Thong tin Thu vien, DHQGHN



điều kiện cần và đủ nào?... Do đó, vấn đề đào tạo nguồn nhân lực số có
trình độ tham gia vào hệ thống công nghệ số là một nhu cầu cấp thiết
hàng đầu. Nguồn nhân lực của VNU-LIC hiện nay có đặc điểm nổi bật
là: số lượng cán bộ làm công tác thư viện ngày càng gia tăng do quy mô
đào tạo của VNU và mạng lưới phục vụ ngày càng được mở rộng; cơ
cấu trẻ hơn, năng động, sáng tạo và nhiệt huyết hơn…


Hiện nay, đội ngũ cán bộ thư viện của VNU-LIC bên cạnh việc
xử lý thơng tin đối với các loại hình tài liệu, đồng thời chủ động tham
gia các lớp đào tạo nâng cao về năng lực chuyên môn, tiếp cận các loại
hình tài liệu trực tuyến, gắn kết chặt chẽ với đội ngũ cán bộ giảng dạy
và nghiên cứu, chủ động tìm hiểu về các ngành nghề mà VNU đang đào
tạo để có những tư vấn phù hợp.


<i>- Nguồn lực thông tin</i>


VNU-LIC là một đơn vị trực thuộc VNU, được giao nhiệm vụ đảm
bảo tài nguyên thông tin khoa học và công nghệ chất lượng cao, phục vụ


đội ngũ cán bộ, giảng viên, nhà nghiên cứu và người học trong và ngồi
VNU. Vì vậy để hồn thành nhiệm vụ chính trị quan trọng đó, vượt qua
khó khăn, phát huy tính chủ động sáng tạo của mình, VNU-LIC đã định
<i>hướng “Xây dựng Thư viện số nghiên cứu phục vụ đại học định hướng </i>
<i>nghiên cứu” và có những bước đi quan trọng đầu tiên như: chuẩn bị </i>
nguồn lực thông tin số, hạ tầng công nghệ, các trang thiết bị thư viện
chuyên dụng mới, ứng dụng các phần mềm tiên tiến, phát triển các dịch
vụ thông tin - thư viện hiện đại kết hợp với đào tạo nâng cao trình độ
chuyên môn cho đội ngũ cán bộ.


</div>
<span class='text_page_counter'>(8)</span><div class='page_container' data-page=8>

Trung tam Thong tin Thu vien, DHQGHN


455



TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


liệu Born Digital và Digitization lên đến trên 50.000 đối tượng. Trong
đó: gần 5.000 sách giáo trình và tài liệu tham khảo của nhà xuất bản
VNU; Khoảng 1.000 tài liệu Thông tin địa chất và Tài nguyên địa chất
Việt Nam; Gần 1.500 đề tài nghiên cứu khoa học cấp Nhà nước và cấp
VNU; Khoảng 10.000 Thư tịch cổ Hán Nôm; 26.000 đề tài luận án, luận
văn; 4.500 bài báo thuộc Tạp chí nghiên cứu khoa học VNU; 5.000 bài
thuộc Kỷ yếu các Hội thảo khoa học,...


Ngoài ra, VNU-LIC cũng chú trọng đầu tư kinh phí nâng cấp và
mua cơ sở dữ liệu điện tử như: E-book và E-journal, đây là loại hình tài
liệu khơng thể thiếu trong một thư viện đại học nghiên cứu. Bên cạnh
đó, VNU-LIC đang phục vụ CSDL MathSciNet của Hội Toán học Mỹ,
ScienceDirect của Nhà xuất bản Elsevier, sách điện tử của Springer và
hàng nghìn tạp chí truy cập mở khác,... Đặc biệt, giai đoạn 2017-2020
VNU-LIC đã có kế hoạch bổ sung thêm các CSDL nổi tiếng khác như


Nature, Springer Journal - Ebooks, ACM, Emerald, IG Publishing,... để
đạt độ phủ cao cho tất cả các ngành / chuyên ngành đào tạo và nghiên
cứu của VNU. Với nhiều hình thức như: sử dụng kinh phí thường
xuyên, kinh phí dự án, tham gia các consortium, liên hệ với đối tác và
nhà xuất bản để dùng thử. Hiện nay, VNU-LIC có một đội ngũ cán bộ
thường xuyên tìm kiếm, khai thác các nguồn cơ sở dữ liệu mở. Có thể
nói, nguồn Dữ liệu lớn của VNU-LIC là một loại “tài sản tri thức” vô
giá, góp phần khơng nhỏ vào những thành cơng, cũng như các yêu cầu
nghiên cứu và đào tạo của VNU [9].


<i><b>- Sản phẩm và dịch vụ thông tin</b></i>


Tăng cường xây dựng các sản phẩm và dịch vụ thông tin mới là
một nhiệm vụ được VNU-LIC đặc biệt quan tâm và đẩy mạnh. Sản
<i>phẩm thông tin “Hướng dẫn học tập và nghiên cứu theo chủ đề” cho </i>
khoảng 100 ngành đã được hồn thiện, giúp định hướng thơng tin, tìm
tài liệu nhanh chóng, rút ngắn q trình nghiên cứu… được đông đảo
bạn đọc sử dụng và đánh giá cao.


</div>
<span class='text_page_counter'>(9)</span><div class='page_container' data-page=9>

Trung tam Thong tin Thu vien, DHQGHN



điện tử; hỗ trợ trực tuyến Online Chat, Hotline, Email phục vụ miễn
phí; dịch vụ đăng ký thành viên của thư viện; dịch vụ số hóa tài liệu;
dịch vụ đào tạo kiến thức thông tin; dịch vụ photocopy & scan tài liệu...
<b>3. Cơ hội và thách thức đối với VNU-LIC</b>


Sự bùng nổ dữ liệu trong thời đại số đã mang đến nhiều thách thức.
Khi dữ liệu ngày càng lớn thì nó như một hịn đá tảng, người bê nó sẽ
khơng nhìn thấy đường. Việc tập trung xử lý, phân tích các tập Dữ liệu
lớn liên quan thì nhận được nhiều thơng tin hơn việc phân tích các tập


dữ liệu nhỏ lẻ, đồng thời mở ra hướng sáng tạo mới thay vì chỉ giải
quyết các vấn đề được đặt ra trước đó. Bởi vậy, vai trò của Dữ liệu lớn
trong các xu hướng cơng nghệ là rất quan trọng. Nó được xem là một
trong các công nghệ lõi trong CMCN 4.0, là một trong bốn thành phần
chính của Internet kết nối vạn vật (IoT).


Dữ liệu lớn được mô tả như loại hàng hóa mới cho nền kinh tế thế
kỷ 21. Tuy nhiên, Dữ liệu lớn cũng có thể bị kẻ xấu lợi dụng để gây ra
các ảnh hưởng tiêu cực. Do vậy, Dữ liệu lớn đặt ra những cơ hội và các
thách thức lớn cả về quản lý và quản trị trong tiến trình tận dụng tiềm
năng của nó để mang lại lợi ích to lớn và tích cực cho mọi mặt của đời
sống xã hội [1].


Tại chiến lược phát triển VNU đến năm 2020 tầm nhìn năm 2030
<i>đã khẳng định “Trở thành đại học định hướng nghiên cứu, đa ngành, </i>
<i>đa lĩnh vực có tính hội nhập cao, trong đó một số trường đại học, viện </i>
<i>nghiên cứu thành viên thuộc các lĩnh vực khoa học cơ bản, công nghệ </i>
<i>cao và kinh tế - xã hội mũi nhọn đạt trình độ tiên tiến châu Á”.</i>


Bên cạnh những kết quả, thành tựu, những cơ hội mà VNU-LIC đã
kịp thời nắm bắt và đạt được, vẫn còn tồn tại một số hạn chế, thách thức
và khó khăn [3] Cụ thể như sau:


<i><b>3.1. Thách thức về phần mềm phân tích, xử lý vàlưu trữ Dữ liệu lớn</b></i>


</div>
<span class='text_page_counter'>(10)</span><div class='page_container' data-page=10>

Trung tam Thong tin Thu vien, DHQGHN


457



TáC đỘng CỦA Big dATA TỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...



Để có thể nghiên cứu về Dữ liệu lớn, trước tiên cần phải có dữ liệu
(data) thật lớn (big), cần chỗ để lưu trữ (acquire). Đây chính là thách
thức lớn nhất mà VNU-LIC đang đối mặt. Hạ tầng công nghệ thông tin
của VNU-LIC chưa đủ mạnh để có thể lưu trữ Dữ liệu lớn. Phần mềm
lưu trữ Dữ liệu lớn chỉ có thể có ở các công ty lớn như FPT, VCCorp,
ACB, CoopMart khi mà họ có số lượng các transaction rất lớn. Do đó
ở đây xuất hiện một nghịch lí, đó là các đơn vị nghiên cứu như trường
đại học thì lại khơng có dữ liệu thực để nghiên cứu, trong khi các đơn vị
có dữ liệu thì lại khơng có đủ chuyên gia. Với sự tăng trưởng theo cấp
số nhân của số lượng dữ liệu, các hệ thống thư viện truyền thống không
thể đáp ứng được nhu cầu tin của người dùng hiện đại [4].


Việc phân tích Dữ liệu lớn khơng đúng cách có thể nảy sinh nhiều
vấn đề: truy cập dữ liệu, chính sách, bảo mật... Với khối lượng dữ liệu
khổng lồ mà VNU-LIC đang có, rõ ràng việc lưu trữ và xử lý nó là một
thách thức không hề nhỏ, bao gồm thu thập dữ liệu, hiệu chỉnh, lọc
nhiễu, mơ hình hóa, phân tích đầu ra. Hiện tại, hai nền tảng được dùng
phổ biến để xử lý Dữ liệu lớn là Hadoop và Spark.Bên cạnh đó, việc
quản lý dữ liệu, liên quan đến các vấn đề truy xuất, tính riêng tư, bảo
mật cũng là một vấn đề, nhằm chắc chắn rằng dữ liệu đó được sử dụng
chính xác, giám sát dữ liệu, quản lý vịng đời của nó.


Việc phân tích và xử lý Dữ liệu lớn tại VNU-LIC đang đối mặt với
nhiều thách thức:


<i>- Cơ sở hạ tầng và công nghệ</i>


</div>
<span class='text_page_counter'>(11)</span><div class='page_container' data-page=11>

Trung tam Thong tin Thu vien, DHQGHN



<i>- Tốc độ xử lý trong các yêu cầu thời gian thực</i>



Vì là đơn vị phục vụ cho môi trường đào tạo đa ngành, đa lĩnh vực
nên số lượng dữ liệu nội sinh của VNU-LIC tăng nhanh chóng, gây ra
một thách thức rất lớn đối với các ứng dụng thời gian thực. Việc tìm ra
các phương pháp hiệu quả trong suốt luồng dữ liệu là cần thiết để đáp
ứng yêu cầu về thời gian thực.


<i>- Truyền dữ liệu</i>


Đây là “nút cổ chai” của việc tính tốn Dữ liệu lớn. Tuy nhiên,
truyền dữ liệu là không thể tránh khỏi và là yếu tố bắt buộc trong các ứng
dụng Dữ liệu lớn.Vì, nâng cao hiệu quả truyền Dữ liệu lớn là một yếu
tố quan trọng để nâng cao tính tốn Dữ liệu lớn.Việc truyền Dữ liệu lớn
thường địi hỏi nguồn tài chính phải vững mạnh, vìchi phí để thực hiện
và duy trì hoạt động này là rất cao, trong khi đó kinh phí hàng năm mà
VNU-LIC nhận về cung ứng cho hoạt động của tồn Trung tâm cịn hạn
chế nên việc truyền dữ liệu đang gặp phải cản trở lớn. Có thể nói, đây là
một thách thức rất lớn đối với VNU-LIC trong giai đoạn hiện nay.


<i>- Tạo một mơ hình dữ liệu để lưu trữ, bảo quản tài liệu số</i>


Hỗ trợ cấu trúc và siêu dữ liệu để bảo quản lâu dài; Hỗ trợ nhiều
định dạng và dữ liệu trong cùng một mơ hình; Hỗ trợ được nhiều tổ
chức như thư viện, bảo tàng, trung tâm lưu trữ; Phù hợp với các chuẩn
quốc tế và chuẩn mở; Một hệ thống bảo quản dữ liệu số ngồi việc lưu
trữ số tất nhiên cịn lưu trữ hệ thống mô tả siêu dữ liệu biên mục.


<i>- Bảo mật dữ liệu và quyền riêng tư</i>


Một số ví dụ trong thực tế cho thấy, khơng chỉ thơng tin cá nhân


người tiêu dùng, thông tin mật của các tổ chức mà ngay cả các bí mật
an ninh quốc gia cũng có thể bị xâm phạm.


<i>- Hệ thống phải đáp ứng hoặc cho ph́p can thiệp bởi các ứng dụng </i>
<i>phát triển khác</i>


</div>
<span class='text_page_counter'>(12)</span><div class='page_container' data-page=12>

Trung tam Thong tin Thu vien, DHQGHN


459



TáC đỘng CỦA Big dATATỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


mặt là hệ thống không bị độc quyền bởi nhà cung cấp trước. Một số
trường hợp chúng ta cần đến ứng dụng thứ 3 để có thể đáp ứng được yêu
cầu mới của đơn vị mà không bị lệ thuộc vào phần mềm.


<i><b>3.2. Thách thức về ngùn nhân lực số và đội ngũ chuyên gia số</b></i>


Phát triển công cụ quản trị Dữ liệu lớn, nghiên cứu về các kỹ thuật
hiển thị Dữ liệu lớn, về mối quan hệ phức tạp trong chúng đều là những
thách thức không nhỏ, nhưng thách thức chính của Dữ liệu lớn mà
VNU-LIC đang gặp phải là thiếu nhân lực trình độ cao để tận dụng sức
mạnh của Dữ liệu lớn; nhân lực còn thiếu kiến thức chuyên sâu về thống
kê, học máy, khai phá dữ liệu. Cũng như các công nghệ mới khác, cơng
nghệ phân tích Dữ liệu lớn cần thời gian để phát triển và dễ sử dụng.


Để giải quyết được bài tốn Dữ liệu lớn, địi hỏi cần tổng hợp nhiều
công nghệ và kỹ thuật khác nhau. Mỗi công nghệ và kỹ thuật cần có thời
gian nghiên cứu và phát triển để hoàn thiện. Để xây dựng được một thư
viện thông minh, chia sẻ và phục vụ thông tin dễ dàng, đáp ứng được
đa dạng đối tượng sử dụng, đảm bảo vấn đề bản quyền, những vấn đề


riêng của VNU-LIC và bảo quản, lưu trữ số được lâu dài, sử dụng được
trong tương lai đang là thách thức lớn. Ngồi ra kinh phí đầu tư hạ tầng
ban đầu, phát triển tài nguyên thông tin, vận hành, duy trì là những vấn
đề rất lớn đặt ra cho các thư viện Việt Nam nói chung, VNU-LIC nói
riêng hướng đến mục tiêu xây dựng một thư viện thông minh, hệ thống
lưu trữ và bảo quản số có thể tổng kết lại là: xác định u cầu ban đầu;
xây dựng mơ hình dữ liệu thích hợp; xác định các định dạng dữ liệu;
tích hợp hệ thống với hạ tầng hiện có; đảm bảo an toàn và lâu dài cho
hệ thống dữ liệu.


<b>4. Đề xuất các giải pháp</b>


</div>
<span class='text_page_counter'>(13)</span><div class='page_container' data-page=13>

Trung tam Thong tin Thu vien, DHQGHN



trang thiết bị hiện đại như: không gian thư viện, các loại phần mềm tạo
nên thư viện thơng minh, thiết bị số hố - scanner, hệ thống máy móc kỹ
thuật,... ln cần nguồn tài trợ lớn về mặt tài chính. Tiếp sau q trình
đầu tư về phương diện vật chất, là quá trình đầu tư về công nghệ, cách
thức quản lý, vận hành, duy trì hệ thống một cách hiệu quả. Chính sách
đầu tư phải toàn diện và đồng bộ. Nghĩa là không thể chỉ đầu tư về trang
thiết bị mà không quan tâm đầu tư hay chuẩn bị các tiền đề quan trọng
khác như con người vận hành, lựa chọn công nghệ, các chuẩn nghiệp vụ
phù hợp, xây dựng các quy trình quản lý thư viện hiện đại.


<i>- Thứ hai, cần lựa chọn ứng dụng công nghệ phù hợp</i>


Từ công nghệ thông dụng đến công nghệ hiện đại nhất một cách
đồng bộ.Tổ chức thử nghiệm và đánh giá công nghệ trên cơ sở đảm bảo
các yếu tố có thể duy trì hệ thống phát triển đồng bộ từ cơ sở vật chất,
con người đến quy trình thực hiện, tổ chức dịch vụ.



<i><b>- Thứ ba, cần có chính sách, lộ trình cụ thể về phát triển nguồn </b></i>


<i>nhân lực có chất lượng</i>


Tham gia cơng tác thông tin thư viện, xây đựng đội ngũ người làm
thư viện năng động, sáng tạo và hiểu các vấn đề cơng nghệ, có kỹ năng
tốt. Ngồi việc trau dồi các kiến thức chuyên môn nghiệp vụ trong quá
trình làm việc, người làm cơng tác thư viện trong thời đại công nghệ số
hiện nay cần trang bị thêm kỹ năng chuyên môn hiện đại, cập nhật, kỹ
năng sống và giao tiếp với bạn đọc trẻ - những người có trình độ và có
xu hướng sử dụng cơng nghệ trong khai thác tìm tin.


<i>- Thứ tư, ưu tiên phát triển nguồn tài liệu điện tử song song với </i>
<i>các giải pháp số hoá và xây dựng các bộ sưu tập số trong thư viện các </i>
<i>trường đại học</i>


</div>
<span class='text_page_counter'>(14)</span><div class='page_container' data-page=14>

Trung tam Thong tin Thu vien, DHQGHN


461



TáC đỘng CỦA Big dATATỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


mức độ phù hợp với các chuyên ngành đào tạo, chủ đề môn học, tổ chức
các dịch vụ sử dụng nguồn tài liệu điện tử.


<i>- Thứ năm, cần đổi mới cách thức tổ chức, giới thiệu và quảng bá </i>
<i>các dịch vụ thơng tin thư viện tiện ích đến bạn đọc</i>


Ứng dụng web là một cách tiếp cận mới, như là một nền tảng nơi
mà người làm công tác thư viện cung cấp và phản hồi thông tin cho


người dùng tin và cùng nhau tham gia vào việc tạo lập, chỉnh sửa, xuất
bản thông tin thông qua những công cụ sáng tạo nội dung trên nền web.
Hiện nay, VNU-LIC đã ứng dụng Web 2.0, Web 3.0 nhằm nâng cao
dịch vụ tra cứu, kết nối tư vấn thông tin cho sinh viên một cách thân
thiện, gần gũi...; đã chú trọng vào vấn đề ứng dụng công nghệ thông tin,
đặc biệt là mạng Internet trong việc chủ động tiếp cận người sử dụng
thông tin, tăng khả năng tương tác giữa người dùng tin và thư viện -
người dùng tin cùng trao đổi đánh giá và phản hồi lại các vấn đề nhằm
cải thiện chất lượng dịch vụ. Bên cạnh đó, sử dụng các ứng dụng web
trong việc tăng cường quảng bá hình ảnh thư viện và các sản phẩm dịch
vụ hiện đại thông qua công nghệ truyền thông đa phương tiện.


<i>- Thứ sáu, phải xây dựng hành lang pháp lý đặc thù cho Dữ liệu lớn</i>
Ở Việt Nam, trong lĩnh vực ICT hiện đang có 109 quy chuẩn kỹ
thuật quốc gia, song vẫn còn thiếu vắng các quy chuẩn đặc thù của Dữ
liệu lớn. Vì vậy, Việt Nam vẫn cần nỗ lực để tạo dựng hành lang pháp
lý cho Dữ liệu lớn phát triển lành mạnh hơn. Mục tiêu là đem lại lợi ích
thiết thực cho tất cả các bên liên quan, bảo vệ quyền và lợi ích hợp pháp
về dữ liệu của cơng dân, bảo đảm dữ liệu không bị lạm dụng cũng như
bảo đảm an tồn, an ninh thơng tin của đất nước.


<b>Kết luận</b>


</div>
<span class='text_page_counter'>(15)</span><div class='page_container' data-page=15>

Trung tam Thong tin Thu vien, DHQGHN



4.0 là sản xuất thông minh nhờ vào tiến bộ của công nghệ số trong hai
thế giới kết nối với nhau trong đó ta đang và sẽ sống: thế giới các thực
thể và thế giới các phiên bản số của các thực thể (thế giới số). Điều chắc
chắn là các cơng nghệ số sẽ tự động hóa nhiều việc làm trong hầu hết
các ngành nghề. Điều chưa chắc chắn là công nghệ số sẽ tự động hóa


các ngành nghề được đến mức nào. Có hai mặt của chuyện này: công
nghệ số sẽ lấy đi nhiều việc nhưng cũng mở ra cơ hội cho rất nhiều loại
việc mới [7].


Dữ liệu lớn là một trong những xu hướng công nghệ trong tương
lai. Tuy nhiên nguồn nhân lực và các nghiên cứu ở VN nói chung,
VNU-LIC nói riêng vẫn cịn nhiều vấn đề bất cập và hạn chế. Địi hỏi
cần phải có sự đầu tư của nhà nước để xây dựng các trung tâm điện toán
đám mây (kiểu như cloud computing mà đại học Hokkaido đã xây dựng
cho giới nghiên cứu ở Nhật). Trên cơ sở đó có các chương trình đào
tạo chuyên sâu, đặc biệt trong các lĩnh vực về hệ thống, an ninh thông
tin, và thuật tốn. Có như vậy, mới có thể hi vọng Việt Nam sẽ nắm bắt
được các cơ hội mà Dữ liệu lớn mang lại trong tương lai.


<b>Tài liệu tham khảo</b>


<b>Tiếng Việt</b>


<i>1. Hồ Tú Bảo (2017), Hiểu và đi trong cách mạng công nghiệp lần thứ tư, truy </i>
cập từ
ngày 22/8/2018.


<i>2. Dữ liệu lớn là gì? Tất cả những điều bạn cần biết, truy cập tại (https://techtalk.</i>
vn/big-data-la-gi-tat-ca-nhung-dieu-ban-can-biet.html) ngày 22/8/2018.
3. Đại học Quốc gia Hà Nội (2014), Chiến lược phát triển Đại học Quốc gia
Hà Nội đến năm 2020, tầm nhìn chiến lược 2030.


<i>4. Lương Thanh Hải (2017), Thời đại của dữ liệu lớn đối với công tác cảnh </i>


<i>sát: Một đánh giá tổng quan về sử dụng dữ liệu lớn của lực lượng Cảnh sát </i>


<i>Vương Quốc Anh, Kỷ yếu hội thảo “Cuộc cách mạng 4.0 và những vấn đề đặt </i>


</div>
<span class='text_page_counter'>(16)</span><div class='page_container' data-page=16>

Trung tam Thong tin Thu vien, DHQGHN


463



TáC đỘng CỦA Big dATATỚi hoẠT đỘng THƯ VIỆN TẠI TRuNg TÂM THôNg TIN - THƯ VIỆN, ...


<i>5. Lê Bá Lâm (2016), Xây dựng thư viện số và một số thách thức trong lưu </i>


<i>trữ - bảo quản tài liệu số, truy cập từ ( />


VNU_123/17727 ) ngày 25/8/2018.


<i>6. Duy Luân (2018), Dữ liệu lớn (Big Data) là gì? Tổng quan, khai thác, ứng </i>


<i>dụng ra sao? truy cập từ </i>


ngày 25/8/2018;


7. Bernard Marr (2017), Big Data - Dữ liệu lớn, Nxb Công Thương, Hà Nội.
<i>8. Đỗ, Thu Thơm (2017),“Những vấn đề đặt ra đối với hoạt động thư viện </i>


<i>trong các trường Công an Nhân dân thời kỳ Cách mạng 4.0’’, Kỷ yếu hội thảo </i>


“Cuộc cách mạng 4.0 và những vấn đề đặt ra đối với công tác giáo dục đào tạo
trong công an nhân dân’’.


<i>9. Trung tâm Thông tin - Thư viện, Đại học Quốc gia Hà Nội (2017), Cẩm </i>


<i>nang VNU-LIC Thông tin - Thư viện 2017, Nxb ĐHQGHN, Hà Nội.</i>



<b>Tiếng Anh</b>


10. Nilesh Jaiswal (2015), “Handling of Big Data by using Big Table”,
Inter-national Journal of Computer Science and Information Technology.


</div>

<!--links-->

×