Tải bản đầy đủ (.pdf) (15 trang)

Vai trò của việc phân tích hành vi thông tin của người dùng tin trong môi trường dữ liệu lớn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (318.14 KB, 15 trang )

VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN
CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
Bùi Thị Thanh Diệu*
1

Tóm tắt: Sự phát triển nhanh chóng của cơng nghệ dữ liệu lớn, trí
tuệ nhân tạo và vạn vật kết nối đã đem đến nhiều thay đổi trong
cách thức tiếp cận nguồn tin và phục vụ thông tin tại các thư viện.
Tăng cường khả năng nhận biết nhu cầu tin của người dùng tin
thơng qua việc phân tích HVTT trong môi trường dữ liệu lớn là vô
cùng quan trọng để cải tiến chất lượng phục vụ thông tin tại các
thư viện. Vì vậy, bài viết giới thiệu định nghĩa về hành vi thơng tin,
giải thích sự cần thiết và vai trị của phân tích hành vi thơng tin của
người dùng tin trong môi trường dữ liệu lớn. Trên cơ sở đó, bài viết
đề xuất kế hoạch phân tích hành vi thông tin của người dùng tin
trong môi trường dữ liệu lớn tại các thư viện ở Việt Nam.
Từ khóa: Hành vi thơng tin; Phân tích hành vi thơng tin; Dữ liệu
lớn; Người dùng tin; Nhu cầu tin; Thông tin – thư viện.

MỞ ĐẦU
Trong những năm gần đây, sự phát triển của công nghệ thông tin,
sự kết nối của mạng viễn thơng tồn cầu và cơng nghệ lưu trữ điện
tốn đám mây đã thúc đẩy nhanh quá trình sản xuất dữ liệu lớn dẫn
tới khối lượng dữ liệu, đặc biệt là dữ liệu điện tử tại các thư viện không
ngừng gia tăng. Theo đó, dữ liệu hành vi thơng tin (HVTT) có cấu
trúc và phi cấu trúc cũng tăng trưởng không ngừng khiến lý thuyết về
HVTT và nghiên cứu phân tích HVTT trở nên đặc biệt quan trọng. Vì
thế phân tích HVTT của người dùng tin thơng qua dữ liệu lớn đang là
*

Tiến sĩ, Trường Đại học Khánh Hòa.




490

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

bài toán đầy thách thức cho các thư viện trong bối cảnh xã hội thông
tin. Thông qua việc phân tích những dữ liệu HVTT, thư viện có thể
phân tích, khai thác sâu về nhu cầu, ý định và tâm lý của người dùng
tiềm năng, đồng thời đưa ra những sản phẩm, dịch vụ thông tin dự
kiến có giá trị, cung cấp “đúng” và “trúng” nhu cầu tin của người dùng
tin. Rõ ràng phân tích HVTT trong mơi trường dữ liệu lớn đóng một
vai trị quan trọng, định hướng sự phát triển của các thư viện trong
tương lai. Chính vì vậy, bài viết này xem xét vai trị của việc phân tích
HVTT của người dùng tin trong môi trường dữ liệu lớn một cách hệ
thống và đề xuất xây dựng kế hoạch chiến lược phân tích HVTT trong
các thư viện ở Việt Nam.

1. HIỂU VỀ PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG
DỮ LIỆU LỚN CỦA THỜI ĐẠI CHUYỂN ĐỔI SỐ
1.1. Khái niệm "hành vi thông tin"
"Hành vi thông tin" là thuật ngữ dùng để mô tả cách thức con
người tương tác với thơng tin, từ cách con người tìm kiếm, khai thác,
chọn lọc, sử dụng, chia sẻ và tái tạo thơng tin. HVTT là tồn bộ hành
vi con người liên quan đến thông tin, bao gồm hành vi thụ động và vô
ý như ngẫu nhiên gặp thông tin, cũng như hành vi có mục đích mà
khơng liên quan đến tìm kiếm, như chủ động tránh thơng tin [1]. Như
vậy, HVTT là một thuật ngữ với nghĩa rộng bao trùm các khía cạnh
khác nhau của hành vi con người liên quan đến thơng tin. Có thể hiểu
HVTT đề cập đến một loạt hoạt động của người dùng tin như: nhấp,

tìm kiếm, duyệt, sao chép, lưu trữ, nhận xét, phản hồi,… trong khi
truy cập trang Web hoặc sử dụng dịch vụ tìm kiếm thơng tin tại thư
viện, thậm chí bao gồm đánh giá liên quan, đánh giá người tham gia
và tương tác với bạn bè trong các trang Web của các tổ chức bên ngoài.
Nghiên cứu HVTT bắt nguồn từ những nghiên cứu ban đầu về
hành vi người tiêu dùng. Đó là một ngành khoa học liên ngành và
mới nổi, được phát triển vào những năm 1960. Các nguồn thơng tin
chính để nghiên cứu đến từ kinh tế học, tâm lý học, xã hội học, nhân
chủng học và trí tuệ nhân tạo. Đồng thời, các công cụ được sử dụng để


VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN

nghiên cứu hành vi của người dùng đã phát triển và ngày nay cơ sở
dữ liệu được đưa vào nghiên cứu hành vi của người tiêu dùng. Dữ liệu
nghiên cứu hành vi người tiêu dùng chủ yếu đến từ thông tin nhật ký
người dùng, thông tin chủ thể người dùng và thơng tin mơi trường bên
ngồi. Trong q trình phát triển, nhiều mơ hình nghiên cứu về hành
vi người tiêu dùng đã được phát triển, đầu tiên là để phân tích và sau
đó là để dự đốn hành vi của người tiêu dùng. Kết quả là, khái niệm
“dữ liệu lớn” (big data) được phát triển và bằng cách áp dụng nó hiện
nay, các công ty đang cố gắng hiểu và dự đoán hành vi của người tiêu
dùng của họ.
Cùng với các nghiên cứu về hành vi của người tiêu dùng thì
nghiên cứu HVTT trong môi trường thư viện được bắt đầu từ rất sớm
với những cơng trình nghiên cứu về “tìm kiếm và thu thập thông tin”
hoặc về “nhu cầu tin và sử dụng thông tin”. Dần dần thuật ngữ nghiên
cứu việc “tìm tin” hay “hành vi tìm tin” được sử dụng để chỉ tất cả các
nghiên cứu về sự tương tác của con người với thơng tin. Tuy nhiên, sau
đó một số nhà nghiên cứu nhận thấy rằng thuật ngữ “hành vi tìm tin”

chỉ đề cập những nỗ lực tìm kiếm thông tin và không bao gồm những
cách tương tác khác giữa con người với thông tin. Đến những năm
1990, thuật ngữ “hành vi thông tin” bắt đầu được sử dụng rộng rãi để
thay thế cho thuật ngữ “hành vi tìm tin” và trở thành thuật ngữ thơng
dụng nhất hiện nay [7].

1.2. Dữ liệu lớn và mối quan hệ giữa phân tích hành vi thơng tin của người dùng tin
với dữ liệu lớn
Theo định nghĩa Tổ chức Tư vấn công nghệ Gartner, “dữ liệu lớn”
(big data) là tài sản thông tin mà những thơng tin này có khối lượng dữ
liệu lớn, tốc độ cao và dữ liệu đa dạng, đòi hỏi phải có cơng nghệ mới
để xử lý hiệu quả nhằm đưa ra được những quyết định hiệu quả, khám
phá được các yếu tố ẩn sâu trong dữ liệu và tối ưu hố được q trình
xử lý dữ liệu. Như vậy, ba khía cạnh quan trọng của dữ liệu lớn đó là:
- Khối lượng (volume): Dữ liệu có khối lượng lớn có thể lên đến
hàng ngàn tỉ Gigabyte hoặc thậm chí lớn hơn.

491


492

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

- Tốc độ xử lý (velocity): Dữ liệu đảm bảo xử lý các thao tác như
truy xuất, cập nhật, chỉnh sửa, chia sẻ,… với tốc độ nhanh.
- Sự đa dạng (variety): Dữ liệu không cần tuân theo một cấu trúc
và có thể lưu trữ nhiều định dạng khác nhau như văn bản, hình ảnh,…
Sự khác biệt của dữ liệu truyền thống với dữ liệu lớn thể hiện rõ
qua ba khía cạnh có thể được hình ảnh hố như sau (xem hình 1):


Hình 1. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống
Có thể thấy dữ liệu lớn là thuật ngữ chỉ tập hợp các tập dữ liệu lớn
và phức tạp đến mức khó xử lý bằng các công cụ và kỹ thuật khai thác
dữ liệu thông thường. Gần đây, tầm quan trọng của việc phân tích dữ
liệu lớn đã thu hút sự chú ý của các nhà khoa học vì nó mang lại cho
các doanh nghiệp/tổ chức những thơng tin hữu ích và cái nhìn sâu sắc
hơn về cả dữ liệu có cấu trúc và khơng có cấu trúc, có thể dẫn đến việc
ra quyết định sáng suốt hơn. Mục tiêu chung của phân tích dữ liệu lớn
là trích xuất thơng tin hữu ích từ một tập dữ liệu khổng lồ và chuyển
nó thành một cấu trúc dễ hiểu để sử dụng thêm. Các quy trình chính
của dữ liệu lớn bao gồm thu thập, quản lý, lưu trữ, tìm kiếm, chia sẻ,
chuyển giao, phân tích và trực quan hóa.


VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN

Trong bối cảnh kinh doanh, phân tích dữ liệu lớn là quá trình kiểm
tra các tập hợp “dữ liệu lớn” để phát hiện ra các mẫu ẩn, mối tương
quan chưa biết, xu hướng thị trường, sở thích của khách hàng và các
thơng tin kinh doanh hữu ích khác. Trong mơi trường thư viện, phân
tích HVTT của người dùng tin tại các thư viện thông qua dữ liệu lớn
đã và đang giúp các thư viện xây dựng chế độ xem thông tin người
dùng và tìm ra các quy tắc về HVTT của người dùng từ dữ liệu hành
vi lớn của người dùng tin. Nó giúp thư viện hiểu rõ hơn về sở thích
của người dùng tin, phát triển giá trị của người dùng và cuối cùng là
mang lại nhiều hiệu quả cao cho hoạt động cung cấp thông tin của thư
viện. Một ví dụ điển hình cho tính hiệu quả của việc phân tích HVTT
của người dùng tin trong mơi trường dữ liệu lớn là thành công của
hệ thống bán lẻ Amazon. Lý do mà Amazon có thể giành được lợi thế

trong ngành sách là nó khai thác và phân tích rất sâu thơng tin về hành
vi của người dùng. Phân tích HVTT của người dùng giúp Amazon tìm
hiểu thêm về sở thích của người dùng và cung cấp nhiều dịch vụ được
nhắm mục tiêu hơn. Chính điều này đã tạo nên sự tin tưởng của khách
hàng đối với các sản phẩm, dịch vụ mà Amazon cung cấp, dẫn đến sự
quay lại và trung thành của khách hàng gia tăng [4].

2. VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN
TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
HVTT của người dùng tin đang thay đổi khi nhu cầu tin của người
dùng tin tại các thư viện ngày càng chuyên sâu và hướng đến sản phẩm
và dịch vụ thư viện có giá trị cao hơn. Phân tích HVTT của người dùng
tin tại các thư viện thông qua dữ liệu lớn giúp thư viện có thể hiểu rõ
hơn sở thích của người dùng thơng qua việc theo dõi và tìm hiểu hành
vi của người dùng và sau đó họ có thể hình thành các giải pháp tương
ứng để phân phối tốc độ dịng chảy thơng tin hợp lý hơn và cung cấp
nội dung phù hợp hơn. Hơn nữa, yêu cầu của người dùng tin đối với
chất lượng dịch vụ của thư viện ngày càng cao, vì vậy cần phải phân
tích đặc điểm của nhóm người dùng và các sở thích khác nhau của
người dùng tin. Do đó, việc phân tích và nghiên cứu HVTT trong môi
trường dữ liệu lớn tại các thư viện ngày càng trở nên quan trọng hơn.

493


494

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

2.1. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện

tự động điều chỉnh chế độ dịch vụ và hỗ trợ ra quyết định
Trong môi trường dữ liệu lớn, bằng cách phân tích dữ liệu lịch sử
về thói quen sử dụng thơng tin của người dùng tin, sở thích, mối quan
hệ xã hội, nền tảng kỷ luật và thời gian hoạt động trực tuyến,… thư
viện có thể khám phá được các sở thích tin, yêu cầu tin của người dùng
tin và mơ tả các khía cạnh khác nhau của nhu cầu của người dùng tin,
từ đó thư viện có thể điều chỉnh và tối ưu hóa chế độ phục vụ thông tin
một cách linh hoạt và kịp thời. Đồng thời, dựa theo đặc điểm cá nhân,
lòng trung thành và nhu cầu cá nhân, thư viện có thể phân chia người
dùng tin thành các nhóm người dùng khác nhau, trên cơ sở đó có thể
đề xuất chính xác nội dung thông tin dựa trên HVTT của người dùng
mục tiêu. Hơn nữa, các thư viện thường triển khai một không gian ảo
cá nhân như “thư viện của tôi” (my library) để lưu trữ những thay đổi
động này của dữ liệu HVTT của người dùng tin, nó có thể cung cấp cơ
sở ra quyết định cho mơ hình dịch vụ thơng tin của thư viện. Ngồi
ra, đối với việc sử dụng và biến động đột ngột của các tài nguyên khác
nhau (tài nguyên phần cứng và phần mềm, tài nguyên kỹ thuật số, tài
nguyên dịch vụ và tài nguyên tri thức,…) chẳng hạn như các cuộc tấn
công mạng, vi rút, lọc rác và các rào cản yêu cầu dịch vụ thơng tin,…
với kết quả phân tích HVTT của người dùng thơng qua dữ liệu lớn, thư
viện có thể đưa ra các chiến lược đối phó hợp lý mà khơng bị chậm trễ.

2.2. Phân tích hành vi thơng tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
tránh sự gián đoạn của người dùng và gia tăng lợi thế cạnh tranh
Trong môi trường dữ liệu lớn thường lưu trữ lại các dấu vết HVTT
của người dùng vô cùng đa dạng. Việc phân tích các dấu vết HVTT này
từ nguồn dữ liệu lớn về thói quen tìm kiếm, sử dụng, khai thác, chia sẻ
thông tin,… giúp các thư viện có thể dự đốn được tại từng nhóm đối
tượng người dùng tin khác nhau, sản phẩm, dịch vụ thư viện nào sẽ
có nhu cầu cao trong thời gian tới, chuẩn bị thông tin, tài liệu ngay từ

khi người dùng cịn chưa có ý định sử dụng và tạo thế chủ động cho
mình trong các chiến dịch cạnh tranh với các tổ chức cung cấp thơng
tin bên ngồi.


VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN

Hiện nay thư viện đang đối mặt với một loạt các vấn đề lớn như:
câu hỏi về giá trị thông tin, chất lượng dịch vụ thư viện, các rào cản kỹ
thuật và nhân viên khơng thích ứng được với những thách thức trong
thời đại chuyển đổi số. Điều này làm ảnh hưởng nghiêm trọng đến
sự phát triển của thư viện, dần dần làm suy yếu giá trị tồn tại của thư
viện, khiến người sử dụng mất dần đi niềm tin vào các giá trị thông
tin, tri thức mà thư viện cung cấp [5]. Chính vì vậy, trong thời đại dữ
liệu lớn, thư viện cần tập trung phân tích và khai thác dữ liệu người
dùng, nắm vững thời gian thực về phân phối thông tin tới người dùng,
ý định của người dùng, nhu cầu kinh doanh, khả năng đáp ứng thông
tin và chất lượng dịch vụ thông tin,… Hơn nữa, thư viện nên tận dụng
cơng nghệ dữ liệu lớn để phân tích tổn thất và giá trị của người dùng,
tìm ra nguyên nhân thực sự của việc mất người dùng tin và đưa ra các
biện pháp khắc phục khả thi, tránh mất đi sự tin cậy và trung thành
người dùng trong quá trình chuyển giao các giá trị thơng tin, tri thức
của thư viện.

2.3. Phân tích hành vi thơng tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
xác định danh tính và giám sát hành vi của người dùng theo thời gian thực
Giám sát HVTT của người dùng tin là một loại giám sát đối với
hành vi truy cập nguồn, duyệt, truy cập trở lại và sử dụng các trang
Web khác của người dùng, để có được các dữ liệu cơ bản khác nhau về
lưu lượng truy cập trang Web. Sau khi phân tích hành vi của cá nhân

người dùng, thư viện có thể xác định chính xác tính tồn vẹn và bảo
mật của hành vi đọc của độc giả, đồng thời phát hiện kịp thời hành vi
lừa dối, phá hoại và tấn công của người dùng bất hợp pháp trong q
trình đọc, đảm bảo an tồn cho tài nguyên cơ sở hạ tầng của thư viện,
hệ thống dịch vụ và quy trình dịch vụ [6]. Ví dụ, thơng qua dữ liệu lớn,
thư viện phân tích hành vi trực tuyến hàng ngày của người dùng, từ
đó có thể xác định và theo dõi lưu lượng truy cập bất thường trong thời
gian thực. Sau đó, mơ hình người dùng bình thường được tổng hợp,
và các cuộc tấn cơng nguy hiểm, truy cập bất thường và hành vi tải
xuống bất hợp pháp được lọc hoặc chặn. Ngoài ra, thư viện có thể theo
dõi hành vi của người dùng theo thời gian thực thông qua dữ liệu lớn,

495


496

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

đồng thời khám phá và theo dõi các mối quan tâm của người dùng tin
từ đó cung cấp giới thiệu về các chủ đề liên quan mới nhất và các dịng
thơng tin cập nhật cho người dùng, giúp họ có được hướng nghiên cứu
mới nhất và công nghệ tiên tiến nhất của các ngành liên quan một cách
nhanh chóng và hiệu quả (xem hình 2)[9].

Hình 2: Cải thiện trải nghiệm của người tiêu dùng
(Cá nhân hóa thời gian thực sử dụng dữ liệu lớn)
Ngoài ra, bằng cách cung cấp dữ liệu thời gian thực, dữ liệu lớn có
thể được sử dụng để cải thiện thời gian phản hồi của người dùng tin
cuối cùng và sẽ làm tăng sự hài lòng của khách hàng, giành được lòng

trung thành của khách hàng và nhận được mức độ quay lại của người
dùng tin cao hơn.

2.4. Phân tích hành vi thông tin của người dùng tin thông qua dữ liệu lớn giúp thư viện
xây dựng kế hoạch tiếp thị thông tin hiệu quả
Hiện nay, yếu tố quan trọng nhất để thu hút người dùng tin tìm
đến các Website và dịch vụ thông tin của thư viện là thư phải thường
xun có những nguồn tài ngun thơng tin mới, đa dạng và phù hợp
với nhu cầu sử dụng của người dùng. Bên cạnh đó, thư viện cũng phải
ln xây dựng những kế hoạch truyền thông cho các sản phẩm dịch
vụ thơng tin thư viện của mình để người dùng tin biết đến và sử dụng.
Thơng thường, người dùng tin thích những nguồn tin đáng tin cậy và
dễ dàng truy cập sử dụng một cách miễn phí. Vì vậy, thư viện sẽ phân
tích HVTT của người dùng tin thơng qua nguồn dữ liệu lớn để có thể


VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN

phân tích, so sánh các số liệu trong quá khứ, so sánh với các trang cung
cấp thơng tin bên ngồi để đưa đến cho người dùng sự trải nghiệm
tuyệt vời ngay từ lần đầu. Trên cơ sở đó, thư viện có thể xây dựng các
chính sách ưu đãi, lên kế hoạch quảng cáo hiệu quả với từng nhóm đối
tượng người dùng. Đây chính là yếu tố quan trọng quyết định tới sự
trung thành của người sử dụng các sản phẩm và dịch vụ thư viện trong
bối cảnh tràn ngập các nguồn tin trong xã hội thông tin hiện nay.
Với những vai trị quan trọng như trên, việc phân tích HVTT
của người dùng tin trong môi trường dữ liệu lớn tại các thư viện cần
được xây dựng thành các quy trình, ứng dụng các phương pháp,
công nghệ giúp thư viện nắm bắt, trích xuất những kiến thức, thơng
tin hữu ích tiềm ẩn trong nguồn dữ liệu về HVTT. Mục đích chính

của phân tích HVTT là tạo ra cái nhìn chi tiết và chính xác về người
dùng tin, từ đó thư viện có thể đề xuất ra các sản phẩm, dịch vụ
thông tin phù hợp, các quyết định chính xác về nội dung thông tin,
các chiến lược tiếp thị hiệu quả để thu hút người dùng tin và “giữ
chân” họ lâu dài trước sự cạnh tranh của các tổ chức cung cấp thông
tin bên ngoài thị trường.

3. ĐỀ XUẤT XÂY DỰNG KẾ HOẠCH PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI
DÙNG TIN TẠI CÁC THƯ VIỆN Ở VIỆT NAM
Phân tích HVTT của người dùng tin là tâm điểm của cuộc cách
mạng dữ liệu lớn. Xây dựng kế hoạch phân tích HVTT của người dùng
tin tại các thư viện cần được tiến hành qua các quy trình sau:
(1) Quy trình thu thập và lưu trữ HVTT của người dùng tin trong
môi trường dữ liệu lớn.
(2) Quy trình phân tích, trích xuất HVTT của người dùng tin từ dữ
liệu lớn tiến tới phân khúc người dùng tin.
(3) Quy trình xây dựng chiến dịch marketing và sản phẩm mục
tiêu hướng tới từng đối tượng người dùng tin thơng qua phân tích
HVTT trong mơi trường dữ liệu lớn.
Có thể hiểu cụ thể các quy trình đó như sau:

497


498

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

3.1. Quy trình thu thập và lưu trữ HVTT của người dùng tin
Trước khi phân tích HVTT của người dùng tin, trước tiên thư viện

phải thu thập tất cả dữ liệu do người dùng tạo ra trong quá trình sử
dụng thư viện và các dữ liệu liên quan khác có thể suy ra nhu cầu của
người dùng đối với thư viện. Mục đích chính là để dự đốn những gì
sẽ xảy ra trong tương lai hoặc nhu cầu tiềm năng của người dùng bằng
cách biết những gì người dùng đã làm trong q khứ. Sau đó, dữ liệu
thu thập được phân loại hợp lý, định nghĩa hành vi và đối sánh nhân
tạo được sử dụng để xây dựng cơ sở dữ liệu lưu trữ dữ liệu HVTT
người dùng lớn với chức năng lưu trữ hàng loạt, quản lý và truy xuất
hiệu quả. Trong thời đại dữ liệu lớn, phạm vi thu thập dữ liệu HVTT
của người dùng tin thường là các gói dữ liệu mạng khổng lồ được tạo
bởi tất cả người dùng trong vùng phủ sóng của nền tảng, tệp nhật ký
được tạo bởi máy chủ, thơng tin chính của người dùng và thơng tin
mơi trường bên ngồi. Thường có hai cách thu thập dữ liệu:
- Truy cập vào các tệp nhật ký máy chủ. Tệp nhật ký máy chủ thư viện
có thể ghi lại tất cả các yêu cầu được máy chủ Web thu nhận: địa chỉ IP
của khách hàng, thời gian đăng nhập, thời gian cư trú, trang truy cập,
loại trình duyệt của người dùng,…
- Việc thu được nhận thức về hành vi của người dùng tin. Nhận thức
hành vi của người dùng liên quan đến sự tương tác giữa con người với
con người, con người và công nghệ tương tác với nhau trên nhiều khía
cạnh, những yếu tố này ảnh hưởng đến nhu cầu dịch vụ và nhận thức
hành vi của người dùng. Nó có thể được chia thành bốn cấp độ: nhận
thức về tư thế cơ thể cá nhân, hành động và hành vi cảm xúc khác; nhận
thức về hành vi của quỹ đạo trong một chiều thời gian và chiều khơng
gian nhất định để định vị chính xác khơng gian - thời gian; nhận thức
về hành vi học tập, nghiên cứu khoa học, công việc và cuộc sống trong
không gian vật chất và không gian ảo nhất định; nhận thức hành vi xã
hội của mạng kết hợp với trạng thái tình huống của người dùng.
Hiện tại, việc thu thập dữ liệu HVTT của người dùng tin chủ yếu
được lấy từ việc nhấp chuột, duyệt, tìm kiếm và tải xuống máy tính hoặc



VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN

thiết bị đầu cuối di động. Với việc các thiết bị công nghệ thông minh và
cảm biến ngày càng tiếp xúc gần với cơ thể con người, nhận thức hành vi
của người dùng sẽ phong phú và có chiều sâu hơn. Việc tích hợp nhiều
dữ liệu trong lớp dữ liệu, lớp tính năng hoặc lớp quyết định được thực
hiện bằng cơng nghệ tương tác ba yếu tố, đó là tồn thời gian và không
gian và đa kênh, để những người dùng riêng lẻ là trung tâm của các dữ
liệu khác nhau bổ sung cho nhau và hoàn thiện liên tục, tăng độ tin cậy
và uy tín của việc thu thập dữ liệu HVTT của người dùng tin.

3.2. Quy trình phân tích, trích xuất hành vi thơng tin của người dùng tin
Cái gọi là phương pháp phân tích quỹ đạo hành vi của người
dùng, đề cập đến một loạt theo dõi HVTT mà người dùng tin để lại khi
sử dụng các sản phẩm, dịch vụ của thư viện, theo dõi này về cơ bản
phản ánh nhu cầu cốt lõi của người dùng. Trong thời đại của dữ liệu
lớn, thư viện chủ yếu thơng qua các quy tắc và phân tích đặc điểm lưu
thông của người dùng trên trang Web và phần mềm quản trị, để tìm
chế độ đường dẫn truy cập thường xun, tinh chỉnh đường dẫn chính
của các nhóm người dùng cụ thể, dự đốn nhu cầu của người dùng, để
mơ tả các tính năng duyệt nhóm cụ thể,… để cung cấp dữ liệu đầu tay
cho việc tối ưu hóa trang Web thư viện và điều chỉnh dịch vụ tri thức.
Ví dụ: trong dữ liệu hành vi nhật ký của trang Web thư viện, thư viện
phân tách theo dõi hành vi của người dùng phù hợp với nhấp chuột,
duyệt, tải lên, tải xuống, đăng ký, chú thích, tin nhắn, cung cấp tài
liệu,… và sau đó phân loại người dùng tin (được chia thành danh mục
duyệt, danh mục tương tác,…).
Dựa trên phân tích thống kê về quỹ đạo HVTT cơ bản, chúng ta

có thể nhận được tổng dữ liệu của từng loại hành vi và tổng dữ liệu
liên quan về HVTT của người dùng tin. Những tổng hợp dữ liệu về
HVTT của người dùng tin được trích xuất ra sẽ trả lời cho các câu hỏi:
Lý do người dùng tin sử dụng thư viện, tần suất sử dụng thư viện? thời
điểm sử dụng thư viện, khối lượng thông tin người dùng tin tiếp cận
được, thời gian quay trở lại sử dụng thư viện,… Kết quả của các phân
tích HVTT này sẽ giúp thư viện phát hiện ra dữ liệu tâm lý (tính cách)

499


500

PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

của người dùng tin như: yêu thích, hài lịng, thận trọng, tin tưởng, tẩy
chay,… Những dữ liệu về tâm lý của người sử dụng thông tin sẽ là thông
tin cần thiết để thư viện phát triển các hoạt động tiếp thị, ví dụ quảng
cáo đánh vào tâm lý sử dụng thư viện, đặc biệt là cơ sở để thư viện có thể
tìm hiểu sâu hơn về nhu cầu, mong muốn bên trong của người sử dụng.
Trong môi trường dữ liệu lớn, chỉ cần nắm bắt được nhu cầu và
tâm lý của người sử dụng thì thư viện mới thực sự phát triển bền vững
và có sức sống mới. Do đó, trong phân tích HVTT, thư viện cần phân
tích sâu hơn thơng qua việc nghiên cứu các đặc điểm của những người
dùng tin tích cực nhất, chẳng hạn như các thuộc tính cơ bản, thói quen
lướt Web của người dùng, nền tảng học vấn, hướng nghiên cứu, hành
vi của người dùng trang Web,… thư viện phân tích đặc điểm nhóm của
người dùng tích cực trang Web, để cung cấp dữ liệu quan trọng nhằm
tối ưu hóa các dịch vụ thư viện.


3.3. Quy trình xây dựng chiến dịch marketing và sản phẩm mục tiêu hướng tới từng
đối tượng người dùng tin
Để xây dựng các chiến lược tiếp thị nhắm trúng khách hàng mục
tiêu, thư viện cần phải phân khúc nhóm đối tượng người dùng tin. Sử
dụng các thông tin mô tả về đặc điểm HVTT của từng nhóm đối tượng
người dùng một cách hợp lý để đề xuất các quyết định phát triển. Để
làm được điều này trong môi trường dữ liệu lớn, trước hết thư viện cần
thu thập và phân tích dữ liệu nhân khẩu học (demographic analysis)
như: độ tuổi, giới tính, trình độ, nghề nghiệp,… của người dùng tin.
Sau khi thu thập và phân tích các dữ liệu nhân khẩu học thì có thể
tiến hành phân khúc người dùng tin thành các nhóm khác nhau theo
từng đặc điểm nhân khẩu học, ví dụ: nhóm người dùng tin là sinh
viên, nhóm người dùng tin là giảng viên, nhóm người dùng tin là nhà
nghiên cứu,… Bước cuối cùng là xác định các chiến dịch marketing,
chiến lược sản phẩm, dịch vụ thơng tin nhắm mục tiêu chính xác đến
từng nhóm người dùng tin, sau đó kiểm tra xem thơng tin đã thoả mãn
từng nhóm người dùng tin thế nào? Nếu người dùng tin khơng hài
lịng thì cần đưa ra giải pháp gì? Ví dụ thu thập, phân tích dữ liệu về


VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN

lượt truy cập trang Web, fanpage thư viện của người dùng tin sau khi
giao dịch lần đầu để tìm hiểu khả năng họ có quay lại tìm kiếm thơng
tin nữa hay khơng. Quy trình này đóng một vai trị hết sức quan trọng
bởi nếu khơng có chiến lược tiếp thị thơng tin hiệu quả thư viện sẽ mất
đi người dùng tin và cơ hội truyền thơng, quảng bá hình ảnh của thư
viện thông qua các chia sẻ của người dùng tin sẽ khơng được tạo lập.
Nếu quy trình này làm tốt, thư viện sẽ xác định được kênh nào tiếp
thị, truyền thơng thu hút người dùng nhất; nhóm người dùng tin nào

đánh giá tốt nhất về giá trị và hiệu quả sử dụng thư viện; những tính
năng nào của sản phẩm, dịch vụ thư viện đem đến trải nghiệm cho
người dùng tin một cách tốt nhất; người dùng tin có trung thành với
các dịch vụ mà thư viện cung cấp hay khơng,…
Trong phân tích HVTT thơng qua dữ liệu lớn, thư viện có thể nhận
ra mối liên hệ kiến ​​thức về thói quen sử dụng của người dùng và thói
quen của người dùng khác; mối quan hệ giữa thói quen đọc của người
dùng và thói quen sử dụng mạng hoặc các thuộc tính tự nhiên của người
dùng như tuổi, giới tính, nghề nghiệp và thói quen sử dụng mạng đã
được phân tích liên kết. Ví dụ, thơng qua phân tích liên kết kiến ​​thức về
dữ liệu hành vi đọc tiềm ẩn của độc giả (nhu cầu đọc, điểm hấp dẫn đọc,
mức độ liên quan đến hành vi đọc, v.v.), thư viện có thể tìm ra mối quan hệ
giữa các hành vi khác nhau của độc giả trong thời gian thực và thói quen
đọc của độc giả và các yêu cầu dịch vụ. Dữ liệu này có tầm quan trọng lớn
đối với sự phát triển của các dịch vụ cá nhân hóa và chính xác trong các
thư viện. Điều này được gọi là phân tích liên kết tri thức là khám phá mức
độ liên quan hoặc mối tương quan tồn tại trong một số lượng lớn các tập
dữ liệu từ dữ liệu khổng lồ mô tả các quy tắc và mẫu của sự xuất hiện đồng
thời của các thuộc tính nhất định trong một sự vật.

KẾT LUẬN
Thư viện luôn là trung tâm của việc ứng dụng công nghệ mới và thời
đại dữ liệu lớn cũng không ngoại lệ. Là trung tâm cung cấp thông tin tư
liệu và nguồn dữ liệu, các thư viện phải đối mặt với áp lực của những thay
đổi bên trong và bên ngồi. Các thư viện phải thích ứng với yêu cầu của

501


502


PHÁT TRIỂN MƠ HÌNH TRUNG TÂM TRI THỨC SỐ CHO CÁC THƯ VIỆN VIỆT NAM

người dùng và cải thiện khả năng cung cấp nội dung, tính dễ sử dụng và
khả năng đáp ứng của các sản phẩm, dịch vụ. Các nghiên cứu phản ánh
rằng sau năm 2017, kỹ thuật phân tích dữ liệu HVTT sẽ là nhu cầu cạnh
tranh cần thiết, vì vậy các thư viện cần bắt đầu thích ứng với xu hướng để
tồn tại trong thị trường năng động và số hóa. Phân tích HVTT trên nền
tảng dữ liệu lớn là một phương pháp phân tích dữ liệu được nghiên cứu
và ứng dụng trong nhiều lĩnh vực có ứng dụng nền tảng công nghệ thông
tin và truyền thông xã hội. Hay nói cách khác dữ liệu lớn là cơng cụ hồn
hảo để nghiên cứu HVTT của người dùng tin trong thời đại số. Tuy nhiên,
kỷ nguyên dữ liệu lớn đã dẫn đến những thách thức mới cho quá trình
phân tích dữ liệu HVTT tại các thư viện số. Phân tích HVTT trên nền tảng
dữ liệu lớn địi hỏi đầu tư lớn về mặt cơng nghệ khiến chi phí áp dụng
cơng nghệ phân tích dữ liệu lớn khơng phù hợp với nhiều thư viện vừa
và nhỏ. Hơn nữa các quy trình phân tích HVTT trong mơi trường dữ liệu
lớn cũng đặt ra những yêu cầu cao về trình độ đội ngũ cán bộ thư viện, sự
am hiểu về các ứng dụng phân tích dữ liệu, khả năng hoạch định và xây
dựng chiến lược tiếp thị nội dung,… bài toán này địi hỏi các thư viện cần
có sự chuẩn bị kỹ lưỡng để có thể triển khai hiệu quả quá trình phân tích
HVTT trong mơi trường dữ liệu lớn, đáp ứng tốt hơn những yêu cầu tin
ngày càng cao của người dùng tin.

TÀI LIỆU THAM KHẢO
1.

Case, D. O. (2007), Looking for information: A survey of research on information
seeking, needs, and behavior, San Diego: Academic Press.


2.

Cristina, S. (2015), Big Data, the perfect instrument to study today’ s consumer
behavior, Database Systems Journal vol. VI, no. 3/2015.

3.

Danielle, C. M., Ashley C. Adiel T. A., R, V. (2019), Group Decision and
Negotiation: Behavior, Models, and Support, 19th International Conference,
Loughborough, UK, June 11–15, 2019, Proceedings.

4.

Duy, N. A., Như, N. P. Q. (2019), Dữ liệu lớn: cách thức khai thác cơ hội từ
dữ liệu? trường hợp Amazon. Truy cập tại: />newsimg/tap-chi-uef/2019-05-06-46/9.pdf.

5.

Fan, W., Li, C., Zhang, X. (2012), What kind of Big Data Do Libraries
Need? Library Magazine, 2012 (11):63-68, 77.


VAI TRỊ CỦA VIỆC PHÂN TÍCH HÀNH VI THƠNG TIN CỦA NGƯỜI DÙNG TIN TRONG MÔI TRƯỜNG DỮ LIỆU LỚN
6.

Lu, J. (2014), Review and Prospect of Library Big Data Research in China,
Library Journal, (1):20-25.

7.


Thảo, N. T. (2014), "Nghiên cứu hành vi thơng tin: thực trạng và xu
hướng", Tạp chí Thư viện Việt Nam, Số 6, tr. 26-29.

8.

Ying, G., (2017), Research on Library Users’ Information Behavior in Big
Data Environment, 3rd International Symposium on Mechatronics and
Industrial Informatics (ISMII 2017) ISBN: 978-1-60595-501-8.

9.

Ying, X., Sun, J. (2014), Research on Users’ Retrieval Behavior Based on
Big Data, Journal of Intelligence, (2):140-143, 176.

503



×