Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (318.14 KB, 15 trang )
<span class='text_page_counter'>(1)</span><div class='page_container' data-page=1>
<b>*</b>
<b>Tóm tắt: Sự phát triển nhanh chóng của cơng nghệ dữ liệu lớn, trí </b>
<i>tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong </i>
<i>cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện. </i>
<i>Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin </i>
<i>thơng qua việc phân tích HVTT trong mơi trường dữ liệu lớn là vô </i>
<i>cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các </i>
<i>thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thơng tin, </i>
<i>giải thích sự cần thiết và vai trị của phân tích hành vi thơng tin của </i>
<i>người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết </i>
<i>đề xuất kế hoạch phân tích hành vi thơng tin của người dùng tin </i>
<i>trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam.</i>
<b>Từ khóa: Hành vi thơng tin; Phân tích hành vi thông tin; Dữ liệu </b>
<i>lớn; Người dùng tin; Nhu cầu tin; Thông tin – thư viện.</i>
Trong những năm gần đây, sự phát triển của công nghệ thông tin,
sự kết nối của mạng viễn thơng tồn cầu và cơng nghệ lưu trữ điện
tốn đám mây đã thúc đẩy nhanh quá trình sản xuất dữ liệu lớn dẫn
tới khối lượng dữ liệu, đặc biệt là dữ liệu điện tử tại các thư viện không
ngừng gia tăng. Theo đó, dữ liệu hành vi thông tin (HVTT) có cấu
trúc và phi cấu trúc cũng tăng trưởng không ngừng khiến lý thuyết về
HVTT và nghiên cứu phân tích HVTT trở nên đặc biệt quan trọng. Vì
thế phân tích HVTT của người dùng tin thông qua dữ liệu lớn đang là
bài toán đầy thách thức cho các thư viện trong bối cảnh xã hội thông
tin. Thông qua việc phân tích những dữ liệu HVTT, thư viện có thể
phân tích, khai thác sâu về nhu cầu, ý định và tâm lý của người dùng
tiềm năng, đồng thời đưa ra những sản phẩm, dịch vụ thông tin dự
kiến có giá trị, cung cấp “đúng” và “trúng” nhu cầu tin của người dùng
tin. Rõ ràng phân tích HVTT trong mơi trường dữ liệu lớn đóng một
vai trò quan trọng, định hướng sự phát triển của các thư viện trong
tương lai. Chính vì vậy, bài viết này xem xét vai trị của việc phân tích
HVTT của người dùng tin trong môi trường dữ liệu lớn một cách hệ
thống và đề xuất xây dựng kế hoạch chiến lược phân tích HVTT trong
các thư viện ở Việt Nam.
<b>1.1. Khái niệm "hành vi thông tin"</b>
nghiên cứu hành vi của người dùng đã phát triển và ngày nay cơ sở
dữ liệu được đưa vào nghiên cứu hành vi của người tiêu dùng. Dữ liệu
nghiên cứu hành vi người tiêu dùng chủ yếu đến từ thông tin nhật ký
người dùng, thông tin chủ thể người dùng và thông tin môi trường bên
ngồi. Trong q trình phát triển, nhiều mơ hình nghiên cứu về hành
vi người tiêu dùng đã được phát triển, đầu tiên là để phân tích và sau
đó là để dự đoán hành vi của người tiêu dùng. Kết quả là, khái niệm
“dữ liệu lớn” (big data) được phát triển và bằng cách áp dụng nó hiện
nay, các công ty đang cố gắng hiểu và dự đoán hành vi của người tiêu
dùng của họ.
Cùng với các nghiên cứu về hành vi của người tiêu dùng thì
nghiên cứu HVTT trong mơi trường thư viện được bắt đầu từ rất sớm
<b>1.2. Dữ liệu lớn và mối quan hệ giữa phân tích hành vi thông tin của người dùng tin </b>
<b>với dữ liệu lớn</b>
Theo định nghĩa Tổ chức Tư vấn công nghệ Gartner, “dữ liệu lớn”
(big data) là tài sản thông tin mà những thơng tin này có khối lượng dữ
liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có cơng nghệ mới
để xử lý hiệu quả nhằm đưa ra được những quyết định hiệu quả, khám
phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hố được q trình
xử lý dữ liệu. Như vậy, ba khía cạnh quan trọng của dữ liệu lớn đó là:
- Tốc độ xử lý (velocity): Dữ liệu đảm bảo xử lý các thao tác như
truy xuất, cập nhật, chỉnh sửa, chia sẻ,… với tốc độ nhanh.
- Sự đa dạng (variety): Dữ liệu khơng cần tn theo một cấu trúc
và có thể lưu trữ nhiều định dạng khác nhau như văn bản, hình ảnh,…
Sự khác biệt của dữ liệu truyền thống với dữ liệu lớn thể hiện rõ
qua ba khía cạnh có thể được hình ảnh hố như sau (xem hình 1):
Hình 1. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống
Trong bối cảnh kinh doanh, phân tích dữ liệu lớn là q trình kiểm
tra các tập hợp “dữ liệu lớn” để phát hiện ra các mẫu ẩn, mối tương
quan chưa biết, xu hướng thị trường, sở thích của khách hàng và các
thơng tin kinh doanh hữu ích khác. Trong mơi trường thư viện, phân
tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn
đã và đang giúp các thư viện xây dựng chế độ xem thơng tin người
dùng và tìm ra các quy tắc về HVTT của người dùng từ dữ liệu hành
vi lớn của người dùng tin. Nó giúp thư viện hiểu rõ hơn về sở thích
của người dùng tin, phát triển giá trị của người dùng và cuối cùng là
mang lại nhiều hiệu quả cao cho hoạt động cung cấp thơng tin của thư
viện. Một ví dụ điển hình cho tính hiệu quả của việc phân tích HVTT
của người dùng tin trong môi trường dữ liệu lớn là thành công của
hệ thống bán lẻ Amazon. Lý do mà Amazon có thể giành được lợi thế
trong ngành sách là nó khai thác và phân tích rất sâu thông tin về hành
vi của người dùng. Phân tích HVTT của người dùng giúp Amazon tìm
hiểu thêm về sở thích của người dùng và cung cấp nhiều dịch vụ được
nhắm mục tiêu hơn. Chính điều này đã tạo nên sự tin tưởng của khách
hàng đối với các sản phẩm, dịch vụ mà Amazon cung cấp, dẫn đến sự
quay lại và trung thành của khách hàng gia tăng [4].
<b>2.1. Phân tích hành vi thơng tin của người dùng tin thông qua dữ liệu lớn giúp thư viện </b>
<b>tự động điều chỉnh chế độ dịch vụ và hỗ trợ ra quyết định</b>
Trong môi trường dữ liệu lớn, bằng cách phân tích dữ liệu lịch sử
về thói quen sử dụng thơng tin của người dùng tin, sở thích, mối quan
<b>2.2. Phân tích hành vi thơng tin của người dùng tin thông qua dữ liệu lớn giúp thư viện </b>
<b>tránh sự gián đoạn của người dùng và gia tăng lợi thế cạnh tranh </b>
Hiện nay thư viện đang đối mặt với một loạt các vấn đề lớn như:
câu hỏi về giá trị thông tin, chất lượng dịch vụ thư viện, các rào cản kỹ
thuật và nhân viên khơng thích ứng được với những thách thức trong
thời đại chuyển đổi số. Điều này làm ảnh hưởng nghiêm trọng đến
sự phát triển của thư viện, dần dần làm suy yếu giá trị tồn tại của thư
viện, khiến người sử dụng mất dần đi niềm tin vào các giá trị thông
tin, tri thức mà thư viện cung cấp [5]. Chính vì vậy, trong thời đại dữ
liệu lớn, thư viện cần tập trung phân tích và khai thác dữ liệu người
<b>2.3. Phân tích hành vi thơng tin của người dùng tin thông qua dữ liệu lớn giúp thư viện </b>
<b>xác định danh tính và giám sát hành vi của người dùng theo thời gian thực</b>
đồng thời khám phá và theo dõi các mối quan tâm của người dùng tin
từ đó cung cấp giới thiệu về các chủ đề liên quan mới nhất và các dịng
thơng tin cập nhật cho người dùng, giúp họ có được hướng nghiên cứu
mới nhất và công nghệ tiên tiến nhất của các ngành liên quan một cách
nhanh chóng và hiệu quả (xem hình 2)[9].
Hình 2: Cải thiện trải nghiệm của người tiêu dùng
(Cá nhân hóa thời gian thực sử dụng dữ liệu lớn)
Ngoài ra, bằng cách cung cấp dữ liệu thời gian thực, dữ liệu lớn có
thể được sử dụng để cải thiện thời gian phản hồi của người dùng tin
cuối cùng và sẽ làm tăng sự hài lòng của khách hàng, giành được lòng
trung thành của khách hàng và nhận được mức độ quay lại của người
dùng tin cao hơn.
<b>2.4. Phân tích hành vi thơng tin của người dùng tin thông qua dữ liệu lớn giúp thư viện </b>
<b>xây dựng kế hoạch tiếp thị thông tin hiệu quả </b>
phân tích, so sánh các số liệu trong quá khứ, so sánh với các trang cung
cấp thơng tin bên ngồi để đưa đến cho người dùng sự trải nghiệm
tuyệt vời ngay từ lần đầu. Trên cơ sở đó, thư viện có thể xây dựng các
chính sách ưu đãi, lên kế hoạch quảng cáo hiệu quả với từng nhóm đối
tượng người dùng. Đây chính là yếu tố quan trọng quyết định tới sự
trung thành của người sử dụng các sản phẩm và dịch vụ thư viện trong
bối cảnh tràn ngập các nguồn tin trong xã hội thông tin hiện nay.
Với những vai trị quan trọng như trên, việc phân tích HVTT
của người dùng tin trong môi trường dữ liệu lớn tại các thư viện cần
được xây dựng thành các quy trình, ứng dụng các phương pháp,
cơng nghệ giúp thư viện nắm bắt, trích xuất những kiến thức, thơng
tin hữu ích tiềm ẩn trong nguồn dữ liệu về HVTT. Mục đích chính
của phân tích HVTT là tạo ra cái nhìn chi tiết và chính xác về người
dùng tin, từ đó thư viện có thể đề xuất ra các sản phẩm, dịch vụ
thông tin phù hợp, các quyết định chính xác về nội dung thơng tin,
các chiến lược tiếp thị hiệu quả để thu hút người dùng tin và “giữ
chân” họ lâu dài trước sự cạnh tranh của các tổ chức cung cấp thông
tin bên ngoài thị trường.
Phân tích HVTT của người dùng tin là tâm điểm của cuộc cách
mạng dữ liệu lớn. Xây dựng kế hoạch phân tích HVTT của người dùng
tin tại các thư viện cần được tiến hành qua các quy trình sau:
(1) Quy trình thu thập và lưu trữ HVTT của người dùng tin trong
môi trường dữ liệu lớn.
(2) Quy trình phân tích, trích xuất HVTT của người dùng tin từ dữ
liệu lớn tiến tới phân khúc người dùng tin.
(3) Quy trình xây dựng chiến dịch marketing và sản phẩm mục
tiêu hướng tới từng đối tượng người dùng tin thơng qua phân tích
HVTT trong mơi trường dữ liệu lớn.
<b>3.1. Quy trình thu thập và lưu trữ HVTT của người dùng tin</b>
Trước khi phân tích HVTT của người dùng tin, trước tiên thư viện
phải thu thập tất cả dữ liệu do người dùng tạo ra trong quá trình sử
dụng thư viện và các dữ liệu liên quan khác có thể suy ra nhu cầu của
người dùng đối với thư viện. Mục đích chính là để dự đốn những gì
sẽ xảy ra trong tương lai hoặc nhu cầu tiềm năng của người dùng bằng
cách biết những gì người dùng đã làm trong quá khứ. Sau đó, dữ liệu
thu thập được phân loại hợp lý, định nghĩa hành vi và đối sánh nhân
tạo được sử dụng để xây dựng cơ sở dữ liệu lưu trữ dữ liệu HVTT
người dùng lớn với chức năng lưu trữ hàng loạt, quản lý và truy xuất
hiệu quả. Trong thời đại dữ liệu lớn, phạm vi thu thập dữ liệu HVTT
của người dùng tin thường là các gói dữ liệu mạng khổng lồ được tạo
bởi tất cả người dùng trong vùng phủ sóng của nền tảng, tệp nhật ký
được tạo bởi máy chủ, thơng tin chính của người dùng và thơng tin
mơi trường bên ngồi. Thường có hai cách thu thập dữ liệu:
<i>- Truy cập vào các tệp nhật ký máy chủ.</i> Tệp nhật ký máy chủ thư viện
có thể ghi lại tất cả các yêu cầu được máy chủ Web thu nhận: địa chỉ IP
của khách hàng, thời gian đăng nhập, thời gian cư trú, trang truy cập,
loại trình duyệt của người dùng,…
<i>- Việc thu được nhận thức về hành vi của người dùng tin.</i> Nhận thức
hành vi của người dùng liên quan đến sự tương tác giữa con người với
con người, con người và công nghệ tương tác với nhau trên nhiều khía
cạnh, những yếu tố này ảnh hưởng đến nhu cầu dịch vụ và nhận thức
hành vi của người dùng. Nó có thể được chia thành bốn cấp độ: nhận
thức về tư thế cơ thể cá nhân, hành động và hành vi cảm xúc khác; nhận
thức về hành vi của quỹ đạo trong một chiều thời gian và chiều không
gian nhất định để định vị chính xác khơng gian - thời gian; nhận thức
về hành vi học tập, nghiên cứu khoa học, công việc và cuộc sống trong
không gian vật chất và không gian ảo nhất định; nhận thức hành vi xã
hội của mạng kết hợp với trạng thái tình huống của người dùng.
thiết bị đầu cuối di động. Với việc các thiết bị công nghệ thông minh và
cảm biến ngày càng tiếp xúc gần với cơ thể con người, nhận thức hành vi
của người dùng sẽ phong phú và có chiều sâu hơn. Việc tích hợp nhiều
dữ liệu trong lớp dữ liệu, lớp tính năng hoặc lớp quyết định được thực
hiện bằng công nghệ tương tác ba yếu tố, đó là tồn thời gian và không
gian và đa kênh, để những người dùng riêng lẻ là trung tâm của các dữ
liệu khác nhau bổ sung cho nhau và hoàn thiện liên tục, tăng độ tin cậy
và uy tín của việc thu thập dữ liệu HVTT của người dùng tin.
<b>3.2. Quy trình phân tích, trích xuất hành vi thơng tin của người dùng tin</b>
Cái gọi là phương pháp phân tích quỹ đạo hành vi của người
dùng, đề cập đến một loạt theo dõi HVTT mà người dùng tin để lại khi
sử dụng các sản phẩm, dịch vụ của thư viện, theo dõi này về cơ bản
phản ánh nhu cầu cốt lõi của người dùng. Trong thời đại của dữ liệu
lớn, thư viện chủ yếu thông qua các quy tắc và phân tích đặc điểm lưu
thông của người dùng trên trang Web và phần mềm quản trị, để tìm
của người dùng tin như: yêu thích, hài lòng, thận trọng, tin tưởng, tẩy
chay,… Những dữ liệu về tâm lý của người sử dụng thông tin sẽ là thông
tin cần thiết để thư viện phát triển các hoạt động tiếp thị, ví dụ quảng
cáo đánh vào tâm lý sử dụng thư viện, đặc biệt là cơ sở để thư viện có thể
tìm hiểu sâu hơn về nhu cầu, mong muốn bên trong của người sử dụng.
Trong môi trường dữ liệu lớn, chỉ cần nắm bắt được nhu cầu và
tâm lý của người sử dụng thì thư viện mới thực sự phát triển bền vững
và có sức sống mới. Do đó, trong phân tích HVTT, thư viện cần phân
tích sâu hơn thông qua việc nghiên cứu các đặc điểm của những người
dùng tin tích cực nhất, chẳng hạn như các thuộc tính cơ bản, thói quen
lướt Web của người dùng, nền tảng học vấn, hướng nghiên cứu, hành
vi của người dùng trang Web,… thư viện phân tích đặc điểm nhóm của
người dùng tích cực trang Web, để cung cấp dữ liệu quan trọng nhằm
tối ưu hóa các dịch vụ thư viện.
<b>3.3. Quy trình xây dựng chiến dịch marketing và sản phẩm mục tiêu hướng tới từng </b>
<b>đối tượng người dùng tin </b>
lượt truy cập trang Web, fanpage thư viện của người dùng tin sau khi
Trong phân tích HVTT thơng qua dữ liệu lớn, thư viện có thể nhận
ra mối liên hệ kiến thức về thói quen sử dụng của người dùng và thói
quen của người dùng khác; mối quan hệ giữa thói quen đọc của người
dùng và thói quen sử dụng mạng hoặc các thuộc tính tự nhiên của người
dùng như tuổi, giới tính, nghề nghiệp và thói quen sử dụng mạng đã
được phân tích liên kết. Ví dụ, thơng qua phân tích liên kết kiến thức về
dữ liệu hành vi đọc tiềm ẩn của độc giả (nhu cầu đọc, điểm hấp dẫn đọc,
mức độ liên quan đến hành vi đọc, v.v.), thư viện có thể tìm ra mối quan hệ
giữa các hành vi khác nhau của độc giả trong thời gian thực và thói quen
đọc của độc giả và các yêu cầu dịch vụ. Dữ liệu này có tầm quan trọng lớn
đối với sự phát triển của các dịch vụ cá nhân hóa và chính xác trong các
thư viện. Điều này được gọi là phân tích liên kết tri thức là khám phá mức
độ liên quan hoặc mối tương quan tồn tại trong một số lượng lớn các tập
dữ liệu từ dữ liệu khổng lồ mô tả các quy tắc và mẫu của sự xuất hiện đồng
thời của các thuộc tính nhất định trong một sự vật.
người dùng và cải thiện khả năng cung cấp nội dung, tính dễ sử dụng và
khả năng đáp ứng của các sản phẩm, dịch vụ. Các nghiên cứu phản ánh
rằng sau năm 2017, kỹ thuật phân tích dữ liệu HVTT sẽ là nhu cầu cạnh
tranh cần thiết, vì vậy các thư viện cần bắt đầu thích ứng với xu hướng để
tồn tại trong thị trường năng động và số hóa. Phân tích HVTT trên nền
tảng dữ liệu lớn là một phương pháp phân tích dữ liệu được nghiên cứu
và ứng dụng trong nhiều lĩnh vực có ứng dụng nền tảng công nghệ thông
tin và truyền thơng xã hội. Hay nói cách khác dữ liệu lớn là cơng cụ hồn
hảo để nghiên cứu HVTT của người dùng tin trong thời đại số. Tuy nhiên,
kỷ nguyên dữ liệu lớn đã dẫn đến những thách thức mới cho q trình
phân tích dữ liệu HVTT tại các thư viện số. Phân tích HVTT trên nền tảng
dữ liệu lớn đòi hỏi đầu tư lớn về mặt cơng nghệ khiến chi phí áp dụng
cơng nghệ phân tích dữ liệu lớn khơng phù hợp với nhiều thư viện vừa
và nhỏ. Hơn nữa các quy trình phân tích HVTT trong mơi trường dữ liệu
lớn cũng đặt ra những yêu cầu cao về trình độ đội ngũ cán bộ thư viện, sự
am hiểu về các ứng dụng phân tích dữ liệu, khả năng hoạch định và xây
dựng chiến lược tiếp thị nội dung,… bài toán này địi hỏi các thư viện cần
có sự chuẩn bị kỹ lưỡng để có thể triển khai hiệu quả q trình phân tích
HVTT trong mơi trường dữ liệu lớn, đáp ứng tốt hơn những yêu cầu tin
ngày càng cao của người dùng tin.
1. Case, D. O. <b>(</b>2007),<b> Looking for information</b>: <i>A survey of research on information </i>
<i>seeking, needs, and behavior</i>, San Diego: Academic Press.
2. Cristina, S. (2015), <i>Big Data, the perfect instrument to study today’ s consumer </i>
<i>behavior, Database Systems Journal </i>vol. VI, no. 3/2015.
3. Danielle, C. M., Ashley C. Adiel T. A., R, V. (2019), <i>Group Decision and </i>
<i>Negotiation: Behavior, Models, and Support</i>, 19th International Conference,
Loughborough, UK, June 11–15, 2019, Proceedings.
4. Duy, N. A., Như, N. P. Q. (2019), Dữ liệu lớn: cách thức khai thác cơ hội từ
dữ liệu? trường hợp Amazon. Truy cập tại: />newsimg/tap-chi-uef/2019-05-06-46/9.pdf.
6. Lu, J. (2014), Review and Prospect of Library Big Data Research in China,
<i>Library Journal</i>, (1):20-25.
7. Thảo, N. T. (2014), "Nghiên cứu hành vi thông tin: thực trạng và xu
hướng", Tạp chí <i>Thư viện Việt Nam,</i> Số 6, tr. 26-29.
8. Ying, G., (2017), <i>Research on Library Users’ Information Behavior in Big </i>
<i>Data Environment,</i> 3rd International Symposium on Mechatronics and
Industrial Informatics (ISMII 2017) ISBN: 978-1-60595-501-8.