Tải bản đầy đủ (.pdf) (31 trang)

Khóa luận phát triển công cụ phân tích dữ liệu với mô hình trong khoa học xã hội tính toán để hiểu hành vi con người

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.15 MB, 31 trang )

ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CƠNG NGHỆ THƠNG TIN
KHOA CƠNG NGHỆ PHẦN MỀM

NGUYỄN KIM THIÊN

KHĨA LUẬN TỐT NGHIỆP

PHÁT TRIỂN CƠNG CỤ PHÂN TÍCH DỮ LIỆU VỚI MƠ
HÌNH TRONG KHOA HỌC XÃ HỘI TÍNH TỐN ĐỂ
HIỂU HÀNH VI CON NGƯỜI
Developing data analysis tools with models in
Computational Social Sciences to understand human behavior

KỸ SƯ/ CỬ NHÂN NGÀNH KỸ THUẬT PHẦN MỀM


TP. HỒ CHÍ MINH, 2023


ĐẠI HỌC QUỐC GIA TP. HỒ CHÍ MINH

TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN
KHOA CÔNG NGHỆ PHẦN MỀM

NGUYỄN KIM THIÊN – 17521078

KHĨA LUẬN TỐT NGHIỆP

PHÁT TRIỂN CƠNG CỤ PHÂN TÍCH DỮ LIỆU VỚI


MƠ HÌNH TRONG KHOA HỌC XÃ HỘI TÍNH TOÁN
ĐỂ HIỂU HÀNH VI CON NGƯỜI
Developing data analysis tools with models in
Computational Social Sciences to understand human behavior

KỸ SƯ/ CỬ NHÂN NGÀNH KỸ THUẬT PHẦN MỀM

GIẢNG VIÊN HƯỚNG DẪN
THS. NGUYỄN THỊ THANH TRÚC


TP. HỒ CHÍ MINH, 2023


THƠNG TIN HỘI ĐỒNG CHẤM KHĨA LUẬN TỐT NGHIỆP

Hội đồng chấm khóa luận tốt nghiệp, thành lập theo Quyết định số ……………………
ngày ………………….. của Hiệu trưởng Trường Đại học Công nghệ Thông tin.


LỜI CẢM ƠN
Em xin gửi lời cảm ơn chân thành đến những người đã đóng góp và hỗ
trợ em trong q trình thực hiện khóa luận tốt nghiệp này. Sự giúp đỡ của mọi
người đã là nguồn động lực không thể thiếu để em hoàn thành nhiệm vụ này.

Đầu tiên, em muốn bày tỏ lòng biết ơn sâu sắc đến Ths. Nguyễn Thị Thanh
Trúc. Cô đã dành thời gian, kiến thức và kinh nghiệm để chỉ dẫn và hỗ trợ em trong
suốt q trình hiện khóa luận tốt nghiệp. Sự chỉ bảo của cô đã giúp em hiểu sâu hơn
về lĩnh vực này và phát triển kỹ năng nghiên cứu của mình.


Em cũng gửi lời cảm ơn đến khoa Cơng nghệ phần mềm và trường Công
nghệ thông tin đã tạo điều kiện cho em thực hiện khóa luận tốt nghiệp này. Bằng
cách cung cấp chương trình đào tạo chất lượng, tài liệu tham khảo và cơ sở vật chất
hiện đại, khoa và nhà trường đã tạo ra môi trường học tập và nghiên cứu một cách
đáng kính. Em cảm nhận được sự quan tâm sâu sắc và đầu tư từ khoa và nhà trường
trong việc phát triển năng lực và kiến thức của sinh viên.


MỤC LỤC

CHƯƠNG 1.

GIỚI THIỆU ..........................................................................................................................2

1.1.

TỔNG QUAN VỀ ĐỀ TÀI ...................................................................................................................2

1.2.

MỤC TIÊU NGHIÊN CỨU ..................................................................................................................3

1.2.1.

Xây dựng một cơng cụ phân tích dữ liệu mạnh mẽ ...............................................................3

1.2.2.

Hiểu hành vi người dùng trên Youtube .................................................................................3


1.2.3.

Đóng góp vào lĩnh vực khoa học xã hội tính tốn .................................................................4

1.3.

Ý NGHĨA NGHIÊN CỨU ....................................................................................................................4

1.3.1.

Ý nghĩa học thuật ................................................................................................................4

1.3.2.

Ý nghĩa ứng dụng ................................................................................................................4

1.3.3.

Ý nghĩa xã hội ......................................................................................................................5

1.4.

PHẠM VI VÀ GIỚI HẠN CỦA NGHIÊN CỨU .............................................................................................6

1.4.1.

Phạm vi nghiên cứu .............................................................................................................6

1.4.2.


Giới hạn của nghiên cứu ......................................................................................................7

CHƯƠNG 2.

LÝ THUYẾT VÀ PHƯƠNG PHÁP............................................................................................9

2.1.

PHÂN TÍCH DỮ LIỆU TRONG KHOA HỌC XÃ HỘI TÍNH TỐN........................................................................9

2.1.1.

Giới thiệu về phân tích dữ liệu trong khoa học xã hội tính tốn.............................................9

2.1.1.1.

Định nghĩa phân tích dữ liệu trong khoa học xã hội tính tốn ................................................... 9

2.1.1.2.

Vai trị của phân tích dữ liệu trong khoa học xã hội tính tốn ................................................... 9

2.1.1.3.

Lợi ích và thách thức của phân tích dữ liệu trong khoa học xã hội tính tốn ........................... 10

2.1.2.

Các phương pháp phân tích dữ liệu phổ biến ..................................................................... 12


2.1.2.1.

Phân tích mạng xã hội (Social Network Analysis – SNA) .......................................................... 12

2.1.2.2.

Phân tích tương tác xã hội (Social Interaction Analysis).......................................................... 13

2.1.2.3.

Phân tích ngữ liệu (Text Analysis) .......................................................................................... 15

2.1.2.4.

Phân tích tư duy (Opinion Mining/Sentiment Analysis) .......................................................... 16

2.1.2.5.

Phân tích dữ liệu địa lý (Geospatial Analysis) ......................................................................... 17

CHƯƠNG 3.
3.1.

ĐẶC TẢ CÔNG CỤ PHẦN MỀM VÀ KẾT QUẢ ......................................................................19
ĐẶC TẢ PHẦN MỀM ..................................................................................................................... 19

3.1.1.

Mục tiêu ............................................................................................................................ 19


3.1.2.

Yêu cầu chức năng............................................................................................................. 19

3.1.3.

Yêu cầu phi chức năng ....................................................................................................... 19

3.1.4.

Kiến trúc hệ thống ............................................................................................................. 19

3.1.5.

Công cụ và công nghệ sử dụng........................................................................................... 19


3.1.6.
3.2.

Giao diện người dùng ........................................................................................................ 19
TRIỂN KHAI PHẦN MỀM ................................................................................................................. 19

3.2.1.

Mơi trường triển khai ........................................................................................................ 19

3.2.2.

Quy trình triển khai............................................................................................................ 19


3.2.3.

Cấu hình phần mềm và các bước cài đặt ............................................................................ 19

3.3.

KẾT QUẢ THỰC HIỆN .................................................................................................................... 19

3.3.1.

Thu thập dữ liệu ................................................................................................................ 19

3.3.2.

Kết quả phân tích và trực quan hóa dữ liệu ........................................................................ 19

3.3.3.

Đánh giá hiệu suất phần mềm ........................................................................................... 19

3.4.
3.4.1.

KHẢ NĂNG MỞ RỘNG VÀ TÙY CHỈNH ................................................................................................ 19
Tính năng mở rộng ............................................................................................................ 19

3.5.

KIỂM THỬ VÀ ĐÁNH GIÁ ................................................................................................................ 19


3.6.

HẠN CHẾ VÀ HƯỚNG PHÁT TRIỂN TIẾP THEO ....................................................................................... 19


DANH MỤC HÌNH
Hình 1.1: Tên hình 1................................................................................................ 8


DANH MỤC BẢNG
Bảng 1.1: Tên bảng 1............................................................................................... 8
Bảng 2.1: Tên bảng 1............................................................................................. 18


DANH MỤC TỪ VIẾT TẮT


TÓM TẮT KHÓA LUẬN

1


Chương 1. GIỚI THIỆU
1.1. Tổng quan về đề tài
Trong thời đại số hóa ngày nay, mạng xã hội đã trở thành một phần quan
trọng trong cuộc sống hàng ngày của chúng ta. Trong số các mạng xã hội, YouTube
là một nền tảng phổ biến cho việc chia sẻ video và tương tác xã hội. Với hàng tỉ
người dùng và triệu video được tải lên hàng ngày, YouTube trở thành một nguồn
thông tin quý giá về hành vi con người, những xu hướng, sự phát triển của xã hội và

văn hóa.
Tuy nhiên, việc hiểu và phân tích hành vi con người trên YouTube là một
thách thức lớn. Để làm điều này, cần phải áp dụng các phương pháp và công cụ
phân tích dữ liệu mạnh mẽ để xác định, tìm hiểu và giải thích hành vi con người
trong một quy mơ lớn. Trong lĩnh vực khoa học xã hội tính tốn, mơ hình hóa hành
vi con người đã trở thành một phương pháp quan trọng để hiểu và dự đoán các xu
hướng và hành vi trong xã hội.
Đề tài nghiên cứu của em tập trung vào phát triển một công cụ phân tích dữ
liệu dựa trên mơ hình trong khoa học xã hội tính tốn để hiểu hành vi con người
trên nền tảng YouTube. Việc sử dụng công cụ này sẽ giúp em thu thập và phân tích
các dữ liệu từ YouTube để khám phá các mẫu, xu hướng và sự biến đổi trong hành
vi người dùng, từ đó đưa ra những thơng tin giá trị về xã hội, văn hóa và tư duy của
con người.

Bằng cách áp dụng mơ hình trong khoa học xã hội tính tốn, em hy vọng rằng
cơng cụ phân tích dữ liệu sẽ cung cấp một cái nhìn tổng quan về hành vi con người
trên YouTube, nhằm cung cấp thơng tin hữu ích cho các nhà nghiên cứu, nhà quản
lý và nhà hoạch định chính sách. Đồng thời, nghiên cứu này cũng đóng góp vào sự
phát triển của lĩnh vực khoa học xã hội tính tốn, mở ra các cơ hội mới cho việc áp

2


dụng mơ hình và cơng cụ phân tích dữ liệu trong các lĩnh vực khác như tiếp thị,
quảng cáo và nghiên cứu thị trường.
Phần giới thiệu này cung cấp một cái nhìn tổng quan về đề tài nghiên cứu của em.
Bằng việc áp dụng cơng cụ phân tích dữ liệu dựa trên mơ hình trong khoa học xã
hội tính tốn, em mong muốn tiến xa hơn trong việc hiểu và khám phá hành vi con
người trên nền tảng YouTube, đóng góp vào việc xây dựng một cộng đồng trực
tuyến thơng minh và bền vững.


1.2. Mục tiêu nghiên cứu
1.2.1.

Xây dựng một cơng cụ phân tích dữ liệu mạnh mẽ

Mục tiêu đầu tiên của nghiên cứu là phát triển một công cụ phân tích dữ liệu
đáng tin cậy và hiệu quả. Cơng cụ này sẽ có khả năng thu thập dữ liệu từ YouTube,
tiền xử lý dữ liệu và áp dụng mô hình trong khoa học xã hội tính tốn để phân tích
hành vi người dùng. Mục tiêu là tạo ra một công cụ mạnh mẽ và linh hoạt, cho phép
nhận diện các mẫu, xu hướng và sự biến đổi trong hành vi con người trên YouTube.

1.2.2.

Hiểu hành vi người dùng trên Youtube

Mục tiêu thứ hai là sử dụng công cụ phân tích dữ liệu để hiểu rõ hơn về hành
vi người dùng trên YouTube. Em muốn phân tích các yếu tố như lượt xem, lượt
tương tác, nhận xét và chia sẻ để xác định các xu hướng, sự tương tác và tư duy của
người dùng trên nền tảng này. Mục tiêu là khám phá và phân tích các mẫu và hành
vi khác nhau của người dùng trong việc tiêu thụ và tương tác với nội dung trên
YouTube.

3


1.2.3.

Đóng góp vào lĩnh vực khoa học xã hội tính tốn


Mục tiêu cuối cùng của nghiên cứu là đóng góp vào lĩnh vực khoa học xã hội
tính tốn. Em muốn cung cấp một cái nhìn mới và đáng tin cậy về việc áp dụng mơ
hình và cơng cụ phân tích dữ liệu trong lĩnh vực khoa học xã hội tính toán. Mục tiêu
là phát triển và ứng dụng một phương pháp tiên tiến để hiểu và phân tích hành vi
con người trên nền tảng YouTube, đóng góp vào việc mở rộng kiến thức và cung
cấp các cơng cụ hữu ích cho các nhà nghiên cứu, nhà quản lý và nhà hoạch định
chính sách.

1.3. Ý nghĩa nghiên cứu
1.3.1.

Ý nghĩa học thuật

Nghiên cứu này đóng góp vào lĩnh vực khoa học xã hội tính tốn bằng cách
áp dụng các mơ hình và cơng cụ phân tích dữ liệu tiên tiến để hiểu hành vi con
người trên nền tảng YouTube. Việc phát triển cơng cụ phân tích dữ liệu dựa trên mơ
hình trong khoa học xã hội tính tốn giúp cung cấp một phương pháp tiên tiến cho
việc nghiên cứu và phân tích hành vi người dùng trong môi trường trực tuyến.
Nghiên cứu này mở ra những cơ hội mới để khai thác và hiểu rõ hơn về dữ liệu
người dùng trên nền tảng YouTube, từ đó cung cấp thơng tin quan trọng về tư duy,
thái độ và hành vi của con người trong thế giới kỹ thuật số. Điều này có thể đóng
góp vào việc nâng cao kiến thức về xã hội học, tâm lý học và lĩnh vực liên quan.

1.3.2. Ý nghĩa ứng dụng
Nghiên cứu này có ý nghĩa ứng dụng trong nhiều lĩnh vực khác nhau. Cơng
cụ phân tích dữ liệu dựa trên mơ hình trong khoa học xã hội tính tốn có thể được
áp dụng trong các hoạt động tiếp thị và quảng cáo trên YouTube. Những thông tin
được thu thập và phân tích từ cơng cụ này có thể giúp nhà quảng cáo và nhà tiếp thị

4



hiểu rõ hơn về khách hàng tiềm năng, từ đó đưa ra các chiến lược tiếp thị hiệu quả
và tăng cường tương tác và gắn kết với khách hàng.
Ngoài ra, cơng cụ phân tích dữ liệu này cũng có thể hỗ trợ các nhà nghiên
cứu và nhà hoạch định chính sách trong việc hiểu và đánh giá tác động của nội dung
trên YouTube đến cộng đồng và xã hội. Việc hiểu rõ hơn về hành vi người dùng và
tương tác trên YouTube có thể cung cấp thơng tin quan trọng để đưa ra quyết định
chính sách liên quan đến việc quản lý và giám sát nền tảng này.
Nghiên cứu này cũng mang lại ý nghĩa ứng dụng trong lĩnh vực nghiên cứu
thị trường và phân tích dữ liệu khách hàng. Cơng cụ phân tích dữ liệu dựa trên mơ
hình trong khoa học xã hội tính tốn có thể giúp các doanh nghiệp hiểu rõ hơn về sự
tiêu thụ và tương tác của khách hàng trên YouTube, từ đó tối ưu hóa chiến lược
kinh doanh và phát triển sản phẩm và dịch vụ phù hợp với nhu cầu của khách hàng.

1.3.3.

Ý nghĩa xã hội

Nghiên cứu này có ý nghĩa xã hội trong việc hiểu và đánh giá tác động của
YouTube đến xã hội và cộng đồng trực tuyến. Việc phân tích hành vi người dùng và
tương tác trên YouTube giúp chúng ta nhìn nhận rõ hơn về ảnh hưởng của nền tảng
này đến quan điểm, ý kiến, và hành vi của mọi người.
Thông qua việc hiểu rõ hơn về hành vi người dùng trên YouTube, nghiên
cứu này có thể đóng góp vào việc xây dựng một mơi trường trực tuyến tích cực,
thông minh và bền vững. Các kết quả và thông tin từ nghiên cứu này có thể hỗ trợ
việc tạo ra các chính sách và quy định phù hợp để đảm bảo an toàn, đa dạng và chất
lượng của nội dung trên YouTube, từ đó tạo điều kiện thuận lợi cho sự phát triển
của cộng đồng trực tuyến và xã hội tồn cầu.
Tóm lại, nghiên cứu này mang lại ý nghĩa học thuật, ứng dụng và xã hội

bằng cách cung cấp cơng cụ và phương pháp phân tích dữ liệu dựa trên mơ hình
trong khoa học xã hội tính tốn để hiểu và đánh giá hành vi con người trên nền tảng
YouTube. Đồng thời, nghiên cứu này cũng đóng góp vào việc mở rộng kiến thức về

5


hành vi người dùng trực tuyến và cung cấp những thơng tin giá trị về xã hội, văn
hóa và tư duy của con người trong thế giới kỹ thuật số.
Nghiên cứu này có thể tạo ra những đóng góp quan trọng cho lĩnh vực khoa
học xã hội tính tốn và công nghệ thông tin. Việc phát triển và áp dụng các phương
pháp phân tích dữ liệu trong lĩnh vực này giúp tăng cường khả năng nắm bắt và
đánh giá sự phức tạp của hành vi con người trong môi trường trực tuyến.
Ngồi ra, nghiên cứu này cịn cung cấp những thông tin quan trọng cho các nhà
quản lý và quyết định chính sách. Việc hiểu rõ hơn về hành vi người dùng trên nền
tảng YouTube giúp các nhà quản lý đưa ra các quyết định thông minh và hiệu quả
về quản lý, an ninh, quảng cáo và trải nghiệm người dùng trên nền tảng này.
Cuối cùng, nghiên cứu này cũng có tầm quan trọng đối với người dùng cuối.
Việc phân tích hành vi và tương tác người dùng trên YouTube có thể cung cấp
thơng tin hữu ích để người dùng tự nhận biết và điều chỉnh hành vi của mình, từ đó
tạo ra một mơi trường trực tuyến an tồn, tích cực và mang lại lợi ích cho mọi
người.
Tổng kết lại, nghiên cứu này mang ý nghĩa học thuật, ứng dụng và xã hội
bằng cách đóng góp vào việc hiểu và phân tích hành vi con người trên nền tảng
YouTube thông qua phát triển công cụ và áp dụng các mơ hình trong khoa học xã
hội tính tốn. Nghiên cứu này cung cấp thông tin quan trọng cho lĩnh vực khoa học
xã hội, doanh nghiệp, nhà quản lý và người dùng cuối, góp phần vào sự phát triển
và quản lý bền vững của môi trường trực tuyến.

1.4. Phạm vi và giới hạn của nghiên cứu

1.4.1.

Phạm vi nghiên cứu

Nghiên cứu này tập trung vào việc phát triển cơng cụ phân tích dữ liệu dựa
trên mơ hình trong khoa học xã hội tính tốn để hiểu hành vi con người trên nền
tảng YouTube. Nghiên cứu sẽ sử dụng dữ liệu từ YouTube để xây dựng mơ hình và
thực hiện phân tích hành vi người dùng.

6


Phạm vi nghiên cứu bao gồm việc thu thập dữ liệu từ YouTube và áp dụng
các phương pháp và công cụ phân tích dữ liệu để hiểu hành vi con người. Nghiên
cứu sẽ tập trung vào các yếu tố như lượt xem, bình luận, đánh giá, tương tác xã hội
và các đặc điểm của nội dung để tìm hiểu cách con người tương tác trên nền tảng
này.

1.4.2.

Giới hạn của nghiên cứu

Mặc dù nghiên cứu này có mục tiêu quan trọng và tiềm năng trong việc hiểu
hành vi con người trên nền tảng YouTube, nhưng cũng tồn tại một số giới hạn:


Giới hạn dữ liệu: Nghiên cứu sẽ sử dụng dữ liệu từ YouTube nhưng sẽ giới

hạn trong một khoảng thời gian nhất định và một số kênh/cơng cụ phân tích cụ thể.
Do đó, kết quả của nghiên cứu có thể khơng phản ánh tồn diện hành vi của tất cả

người dùng trên YouTube.


Giới hạn mơ hình: Nghiên cứu sẽ xây dựng một mơ hình trong khoa học xã

hội tính tốn dựa trên dữ liệu từ YouTube, tuy nhiên, sự chính xác và hiệu quả của
mơ hình có thể bị ảnh hưởng bởi sự hạn chế của các phương pháp và cơng cụ phân
tích dữ liệu sử dụng.


Giới hạn nguồn dữ liệu: Dữ liệu từ YouTube có thể chứa các rào cản về

quyền riêng tư và khả năng truy cập. Một số nguồn dữ liệu có thể khơng được cơng
khai hoặc bị giới hạn về quyền truy cập, dẫn đến việc hạn chế khả năng thu thập dữ
liệu tồn diện.


Giới hạn thời gian: Do tính chất của đề tài nghiên cứu, có thể sẽ khơng thể

phân tích và đánh giá tồn bộ quá trình phát triển và biến đổi của hành vi con người
trên YouTube. Nghiên cứu sẽ giới hạn trong một khoảng thời gian cụ thể và tập
trung vào các khía cạnh quan trọng.


Giới hạn lý thuyết và phương pháp: Nghiên cứu này dựa trên mơ hình trong

khoa học xã hội tính tốn, tuy nhiên, có thể có các lý thuyết và phương pháp khác
trong lĩnh vực này chưa được khám phá hoặc không được áp dụng trong nghiên cứu

7



này. Do đó, nghiên cứu sẽ tập trung vào mơ hình đã chọn và khơng đi sâu vào các
lĩnh vực khác.


Giới hạn địa lý và ngơn ngữ: Nghiên cứu này có thể hạn chế trong việc sử

dụng dữ liệu từ một số khu vực địa lý cụ thể hoặc bị giới hạn bởi ngôn ngữ của nội
dung trên YouTube. Điều này có thể ảnh hưởng đến khả năng tổng quát hóa và áp
dụng kết quả nghiên cứu cho các mơi trường khác nhau.

Tuy nhiên, dù có những giới hạn nêu trên, nghiên cứu này vẫn mang lại
những thông tin quan trọng và có giá trị đối với việc hiểu hành vi con người trên
nền tảng YouTube và cung cấp cơ sở cho các nghiên cứu tương lai trong lĩnh vực
này.

Hình 1.1: Tên hình 1

Bảng 1.1: Tên bảng 1

8


Chương 2. LÝ THUYẾT VÀ PHƯƠNG PHÁP
2.1. Phân tích dữ liệu trong khoa học xã hội tính tốn
2.1.1.

Giới thiệu về phân tích dữ liệu trong khoa học xã hội tính tốn


2.1.1.1. Định nghĩa phân tích dữ liệu trong khoa học xã hội tính tốn
1. Phân tích dữ liệu trong khoa học xã hội tính tốn là q trình sử dụng các
phương pháp và cơng cụ tính tốn để khám phá, xử lý và hiểu các dữ liệu số
hóa trong lĩnh vực khoa học xã hội. Nó bao gồm việc áp dụng các kỹ thuật từ
khoa học dữ liệu, thống kê, máy học và lý thuyết mạng xã hội để trích xuất
thơng tin, tạo mơ hình dữ liệu, và phân tích hành vi và tương tác của con
người.
2. Phân tích dữ liệu trong khoa học xã hội tính tốn giúp chúng ta hiểu sâu hơn
về mối quan hệ xã hội, tương tác giữa con người, và ảnh hưởng của các yếu
tố xã hội đến hành vi con người. Nó cho phép chúng ta khám phá xu hướng,
phân loại và dự đoán hành vi, và tạo ra hiểu biết cần thiết để đưa ra quyết
định và chiến lược thông minh trong nhiều lĩnh vực như tiếp thị, quản lý
nguồn lực, nghiên cứu xã hội, chính sách cơng,…

2.1.1.2. Vai trị của phân tích dữ liệu trong khoa học xã hội tính tốn
Phân tích dữ liệu trong khoa học xã hội tính tốn đóng vai trị quan trọng trong
việc cung cấp thơng tin và hiểu biết về các hiện tượng xã hội và hành vi con người.
Với sự phát triển của công nghệ và việc số hóa dữ liệu, chúng ta có sẵn một lượng
lớn thông tin về hành vi, ý kiến, tương tác và mối quan hệ giữa con người.
Các phương pháp và cơng cụ phân tích dữ liệu trong khoa học xã hội tính tốn
cho phép chúng ta:
1. Khám phá và khai phá dữ liệu: Chúng ta có thể tìm hiểu và khám phá các
mẫu, xu hướng và cấu trúc trong dữ liệu xã hội. Điều này giúp chúng ta hiểu
rõ hơn về cách con người tương tác, hành vi và phản ứng trong môi trường

9


kỹ thuật số và xã hội trực tuyến. Ví dụ, thơng qua phân tích dữ liệu từ nền
tảng mạng xã hội, chúng ta có thể tìm hiểu được những mối quan hệ xã hội,

sự lan truyền thông tin và sự phản hồi của người dùng trên mạng xã hội.
2. Phân loại và dự đốn hành vi: Phân tích dữ liệu trong khoa học xã hội tính
tốn cho phép chúng ta xây dựng các mơ hình dữ liệu và áp dụng các thuật
toán máy học để phân loại và dự đoán hành vi của con người. Ví dụ, chúng ta
có thể xây dựng mơ hình để phân loại ý kiến của người dùng dựa trên dữ liệu
từ các bình luận hoặc đánh giá trên các trang web, giúp hiểu được ý kiến
công chúng và tư duy xã hội.
3. Định hướng quyết định và chính sách: Phân tích dữ liệu trong lĩnh vực này
cung cấp thông tin cần thiết cho việc đưa ra quyết định thông minh và định
hướng chiến lược trong nhiều lĩnh vực. Ví dụ, phân tích dữ liệu trong lĩnh
vực tiếp thị giúp chúng ta hiểu rõ hơn về đối tượng khách hàng, xu hướng
tiêu dùng và hiệu quả của chiến dịch tiếp thị, từ đó giúp cải thiện kế hoạch và
chiến lược tiếp thị.
2.1.1.3. Lợi ích và thách thức của phân tích dữ liệu trong khoa học xã
hội tính tốn
1. Lợi ích:


Cung cấp thơng tin và hiểu biết: Phân tích dữ liệu trong khoa học xã hội tính

tốn giúp chúng ta có được thơng tin và hiểu biết sâu hơn về hành vi con người, xu
hướng xã hội và tương tác giữa các cá nhân. Điều này có thể đóng góp quan trọng
trong việc nắm bắt sự thay đổi xã hội và đưa ra quyết định thơng minh.


Hỗ trợ quyết định và chiến lược: Phân tích dữ liệu trong khoa học xã hội tính

tốn cung cấp thơng tin quan trọng cho quá trình ra quyết định và lập kế hoạch
chiến lược. Nó giúp hiểu rõ hơn về nhóm đối tượng, khách hàng và người dùng, từ
đó đưa ra các chiến lược tiếp thị, quản lý tài nguyên, hoặc chính sách cơng hiệu quả

hơn.


Dự đốn và ứng phó với xu hướng: Phân tích dữ liệu trong khoa học xã hội

tính tốn cho phép chúng ta dự đốn và ứng phó với các xu hướng xã hội, tư duy và

10


hành vi của con người. Điều này có thể hỗ trợ trong việc thiết kế sản phẩm, dịch vụ
hoặc chính sách phù hợp với nhu cầu và mong đợi của người dùng.

2. Thách thức:
 Quản lý dữ liệu và bảo mật: Phân tích dữ liệu trong khoa học xã hội tính tốn
địi hỏi sự quản lý và bảo mật dữ liệu nhạy cảm của người dùng. Điều này
đặt ra thách thức trong việc đảm bảo tính riêng tư và an toàn của dữ liệu,
đồng thời tuân thủ các quy định và quyền riêng tư liên quan.
 Độ tin cậy và khả năng mơ hình hóa: Phân tích dữ liệu trong lĩnh vực này đòi
hỏi sự đảm bảo về độ tin cậy của kết quả phân tích. Điều này đặt ra thách
thức trong việc xác định mơ hình phù hợp, đảm bảo độ tin cậy và khả năng
áp dụng cho các tình huống khác nhau.
 Dữ liệu có tính thiên vị: Khi phân tích dữ liệu xã hội, có nguy cơ xảy ra hiện
tượng thiên vị trong việc thu thập và xử lý dữ liệu. Dữ liệu từ dấu chân kỹ
thuật số khơng phản ánh hồn tồn một tập thể nào đó. Ví dụ: dữ liệu dấu
chân kỹ thuật số thu thập từ mạng xã hội không phản ánh đúng về người già,
bởi họ có thể đa phần khơng tiếp xúc nhiều với các thiết bị điện tử
 Khả năng mở rộng và tương thích: Khi xây dựng phần mềm hoặc cơng cụ
phân tích dữ liệu trong khoa học xã hội tính tốn, cần xem xét khả năng mở
rộng và tương thích với các nguồn dữ liệu và cơng nghệ khác nhau. Điều này

đảm bảo tính linh hoạt và khả năng tương tác với các hệ thống và nguồn dữ
liệu khác nhau.
 Hiểu biết về lĩnh vực xã hội: Để hiểu và phân tích dữ liệu xã hội một cách
hiệu quả, cần có kiến thức về lĩnh vực xã hội đang được nghiên cứu. Điều
này bao gồm hiểu biết về các yếu tố xã hội, tâm lý, văn hóa và ngữ cảnh xã
hội để có thể diễn giải đúng và hiểu rõ hơn về kết quả phân tích dữ liệu.
 Xử lý dữ liệu lớn và tính tốn hiệu suất cao: Phân tích dữ liệu xã hội thường
đối mặt với quy mô lớn và tốc độ tăng trưởng nhanh của dữ liệu. Điều này

11


đòi hỏi khả năng xử lý dữ liệu lớn và tính tốn hiệu suất cao để đảm bảo khả
năng phân tích nhanh chóng và chính xác.

2.1.2.

Các phương pháp phân tích dữ liệu phổ biến

2.1.2.1. Phân tích mạng xã hội (Social Network Analysis – SNA)
Phân tích mạng xã hội (Social Network Analysis - SNA) là một phương pháp
phân tích dữ liệu xã hội tập trung vào việc nghiên cứu cấu trúc và mối quan hệ giữa
các thành viên trong một mạng xã hội. Mạng xã hội có thể được biểu diễn dưới
dạng đồ thị, trong đó các thành viên của mạng được biểu thị bằng các đỉnh (nodes),
và mối quan hệ giữa các thành viên được biểu diễn bằng các cạnh (edges) kết nối
các đỉnh.
Trong phân tích mạng xã hội, có một số khái niệm quan trọng:
1. Bậc (Degree): Bậc của một đỉnh trong mạng xã hội là số lượng các cạnh kết
nối đến đỉnh đó. Bậc có thể thể hiện mức độ tương tác hoặc quan hệ của một
thành viên trong mạng.

2. Trung tâm (Centrality): Trung tâm là một đặc trưng để đo đạc mức độ quan
trọng của một đỉnh trong mạng xã hội. Có nhiều độ đo trung tâm khác nhau
như trung tâm bậc (degree centrality), trung tâm trung gian (betweenness
centrality), và trung tâm gần nhất (closeness centrality).
3. Cộng đồng (Community): Cộng đồng trong mạng xã hội là một nhóm các
thành viên có mối quan hệ mạnh với nhau và ít mối quan hệ với các thành
viên khác trong mạng. Phân tích cộng đồng giúp hiểu rõ hơn về sự tổ chức và
cấu trúc của mạng xã hội.
Một nghiên cứu đã được thực hiện sử dụng phân tích mạng xã hội là "A
Study of Online Social Networks" của Lada A. Adamic và Eytan Adar (2003).
Nghiên cứu này tập trung vào việc phân tích cấu trúc và tính chất của mạng xã hội
trực tuyến.

12


Trong nghiên cứu này, các tác giả đã thu thập dữ liệu từ một trang web xã
hội và xây dựng một mạng xã hội bằng cách biểu diễn các thành viên dưới dạng
đỉnh và các mối quan hệ kết nối dưới dạng cạnh. Sau đó, họ đã áp dụng các phương
pháp phân tích mạng xã hội để khám phá cấu trúc, bao gồm một số phân tích chính:
1. Bậc (Degree): Tác giả đã tính tốn bậc của mỗi đỉnh trong mạng, tức là số
lượng các kết nối mà mỗi thành viên có với những thành viên khác trong
mạng. Bậc được sử dụng để đo đạc mức độ tương tác của mỗi thành viên.
2. Trung tâm trung gian (Betweenness Centrality): Trung tâm trung gian được
sử dụng để xác định các thành viên có vai trị quan trọng trong việc truyền tải
thơng tin giữa các thành viên khác trong mạng. Tác giả đã tính tốn trung
tâm trung gian của mỗi đỉnh để xác định các thành viên có ảnh hưởng cao
trong việc truyền thơng tin trong mạng.
3. Phân tích cộng đồng (Community Analysis): Tác giả đã sử dụng các thuật
toán phân cụm để phân chia mạng xã hội thành các cộng đồng nhỏ hơn. Việc

phân tích cộng đồng giúp xác định các nhóm thành viên có mối quan hệ
mạnh với nhau và ít mối quan hệ với nhóm thành viên khác. Tác giả đã sử
dụng thuật toán phân cụm Girvan-Newman để xác định cấu trúc cộng đồng
trong mạng.
Kết quả của nghiên cứu này cung cấp thông tin về cấu trúc mạng xã hội trực
tuyến, bao gồm sự phân bố bậc của các thành viên, các thành viên có trung tâm
trung gian cao, và các cộng đồng trong mạng. Những phân tích này giúp hiểu rõ hơn
về mơ hình tương tác xã hội và cấu trúc của mạng xã hội trực tuyến.

2.1.2.2. Phân tích tương tác xã hội (Social Interaction Analysis)
Phân tích tương tác xã hội là một phương pháp phân tích dữ liệu xã hội tập
trung vào việc nghiên cứu và phân tích các hoạt động tương tác xã hội trong mơi

13


trường kỹ thuật số. Dưới đây là một số phương pháp và kỹ thuật phân tích tương tác
xã hội:
1. Phân tích bình luận: Phương pháp này tập trung vào việc phân tích các bình
luận, đánh giá hoặc phản hồi từ người dùng trên các nền tảng mạng xã hội
hoặc các trang web có tính tương tác. Bằng cách áp dụng các kỹ thuật xử lý
ngôn ngữ tự nhiên và các phương pháp phân loại, có thể phân tích và hiểu ý
kiến, tư duy và thái độ của người dùng.
2. Phân tích thảo luận: Phương pháp này tập trung vào việc phân tích các thảo
luận hoặc tranh luận giữa các thành viên trong một nhóm, cộng đồng hoặc
mạng xã hội. Các kỹ thuật phân tích thảo luận có thể giúp xác định các mẫu
giao tiếp, quan điểm đối lập và vai trị của các thành viên trong thảo luận.
3. Phân tích hành vi trên mạng xã hội: Phương pháp này tập trung vào việc
phân tích hành vi của người dùng trên mạng xã hội, bao gồm việc theo dõi
hoạt động, tương tác và sự tương tác giữa các thành viên. Phân tích hành vi

trên mạng xã hội có thể giúp hiểu rõ hơn về sự lan truyền thông tin, sự tương
tác và mẫu hành vi của người dùng trên nền tảng xã hội.
4. Phân tích ảnh hưởng xã hội: Phương pháp này tập trung vào việc phân tích
ảnh hưởng xã hội của các thành viên trong mạng. Các chỉ số và độ đo được
sử dụng để xác định sức mạnh của mối quan hệ và vai trò của mỗi thành viên
trong việc lan truyền thông tin, tác động lên nhau và tạo ra ảnh hưởng trong
mạng.
Các nghiên cứu trong lĩnh vực này thường tập trung vào các khía cạnh như
tương tác giữa các thành viên trong mạng xã hội, sự lan truyền thơng tin và ảnh
hưởng xã hội, mơ hình hóa hành vi xã hội, phát hiện cộng đồng và mạng lưới, phân
tích bình luận và thảo luận, và nhiều khía cạnh khác của tương tác xã hội trên các
nền tảng mạng xã hội và trang web có tính tương tác.

14


×