Tải bản đầy đủ (.docx) (9 trang)

Báo cáo về BIG DATA

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (328.73 KB, 9 trang )

HỌC VIỆN BÁO CHÍ VÀ TUYÊN TRUYỀN
VIỆN BÁO CHÍ

BÀI BÁO CÁO
Môn: Kỹ thuật và công nghệ Truyền thông đại chúng
GV: ThS. Vũ Thế Cường
Đề tài: Tìm hiểu về dữ liệu lớn (Big Data), ứng dụng trong BC – TT trong
tương lai


Họ và tên: Nguyễn Hương Giang
Lớp:
Mã SV:

Năm học: 2020 – 2021


I.
1.

KHÁI NIỆM BIG DATA
Định nghĩa

“Dữ liệu lớn (Big Data) là một thuật ngữ cho việc xử lý một tập hợp dữ liệu
rất lớn và phức tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được.
Dữ liệu lớn bao gồm các thách thức như phân tích, thu thập, giám sát dữ liệu, tìm
kiếm, chia sẻ, lưu trữ, truyền nhận, trực quan, truy vấn và tính riêng tư. Thuật ngữ
này thường chỉ đơn giản đề cập đến việc sử dụng các phân tích dự báo, phân tích
hành vi người dùng, hoặc một số phương pháp phân tích dữ liệu tiên tiến khác trích
xuất giá trị từ dữ liệu mà ít khi đề cập đến kích thước của bộ dữ liệu.”
Những tập hợp dữ liệu lớn này có thể bao gồm các dữ liệu có cấu trúc


(structured data), dữ liệu không cấu trúc (unstructured data) và dữ liệu nửa cấu trúc
(semistructured data), mỗi tập hợp có chút khác biệt.
Dữ liệu tạo thành các kho dữ liệu lớn có thể đến từ các nguồn bao gồm các
trang web, phương tiện truyền thông xã hội, ứng dụng dành cho máy tính để bàn,
ứng dụng trên thiết bị di động, các thí nghiệm khoa học, thiết bị cảm biến ngày
càng tăng và các thiết bị khác trong mạng lưới thiết bị kết nối Internet (IoT –
Internet of things).
Khái niệm Big Data đi kèm với các thành phần có liên quan cho phép các tổ
chức đưa dữ liệu vào sử dụng thực tế và giải quyết một số vấn đề trong kinh doanh,
bao gồm cơ sở hạ tầng IT cần để hỗ trợ Big Data, các phân tích áp dụng với dữ
liệu, công nghệ cần thiết cho các dự án Big Data, các bộ kỹ năng liên quan và các
trường hợp thực tế có ý nghĩa đối với Big Data.
Về cơ bản, sự phát triển của khoa học kỹ thuật, đặc biệt là Internet đã liên
tục kết nối và thu thập thông tin người sử dụng đưa lên. Những dữ liệu khổng lồ ấy
chính là Big Data.
2.

Tính chất

Dựa trên khái niệm mới về Big Data 2014 của Gartner về mơ hình “5Vs” –
năm tính chất quan trọng nói lên Big Data:






Volume (Số lượng lưu trữ): Nó là tập hợp dữ liệu có dung lượng lưu trữ vượt
mức đảm đương của những ứng dụng và cơng cụ truyền thống. Kích cỡ của
Big Data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm

trong khoảng vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024
terabyte) chỉ cho một tập hợp dữ liệu.
Velocity (Tốc độ xử lý)

Dung lượng gia tăng của dữ liệu rất nhanh và tốc độ xử lý đang tiến tới realtime. Công nghệ xử lý dữ liệu lớn ngày một tiên tiến cho phép chúng ta xử lý tức
thì trước khi chúng được lưu trữ vào cơ sở dữ liệu.


Variety (Đa dạng chủng loại)

Hình thức lưu trữ và chủng loại dữ liệu ngày một đa dạng hơn. Trước đây
chúng ta hay nói đến dữ liệu có cấu trúc thì ngày nay hơn 80% dữ liệu trên thế giới
được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, video, voice...). Cơng nghệ
Big Data cho phép chúng ta ngày nay liên kết và phân tích đa dạng chủng loại dữ
liệu với nhau như comments/ post của một nhóm người dùng nào đó trên Facebook
với thơng tin video được chia sẻ từ Youtube và Twitter.


Veracity (Độ chính xác)

Một trong những tính chất phức tạp nhất của Big Data là độ chính xác của
dữ liệu. Với xu hướng Social Media và Social Network ngày nay và sự gia tăng
mạnh mẽ tính tương tác và chia sẻ của người dùng Mobile làm cho bức tranh xác
định về độ tin cậy & chính xác của dữ liệu ngày một khó khăn hơn. Bài tốn phân
tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính chất quan trọng của
BigData.


Value (Giá trị thơng tin)


Giá trị thơng tin là tính chất quan
trọng nhất của xu hướng cơng nghệ Big
Data. Ở đây doanh nghiệp phải hoạch
định được những giá trị thơng tin hữu ích
của BigData cho vấn đề, bài toán hoặc


mơ hình hoạt động kinh doanh của mình. Có thể nói việc đầu tiên là phải xác định
được tính chất “Value” thì mới nên bắt tay vào BigData.
3.

Ứng dụng trong cuộc sống

Big Data thu thập các thông tin quy mô lớn từ website, các doanh nghiệp có
thể dùng cơng cụ phân tích dữ liệu này để phục vụ cho cơng việc phân tích thị
trường giúp đưa ra các chiến lược nâng cao chất lượng sản phẩm, dịch vụ hiện tại
hay tìm hiểu về hành vi khách hàng đề ra mắt các sản phẩm mới.
Đối với các tổ chức, doanh nghiệp thì họ có thể tận dụng Big Data để xây
dựng một nội dung trang web thu hút người truy cập hơn, có được cái nhìn tồn
cảnh và sâu sắc về hành vi mua hàng. Dữ liệu càng nhiều thì những phân tích càng
chính xác. Các doanh nghiệp cũng nên cung cấp nội dung trên nhiều kênh xã hội
để thu thập dữ liệu từ nhiều nguồn hơn.
Tại Việt Nam:
FPT cho biết, doanh thu năm 2013 từ S.M.A.C (Mạng xã hội/ Bảo mật),
Mobility (Cơng nghệ di động), Analytics Big Data (Phân tích dữ liệu lớn), Cloud
(Điện toán đám mây) đạt 95 tỷ đồng.
II.

ỨNG DỤNG BIG DATA TRONG BÁO CHÍ – TRUYỀN THƠNG


“Trong lĩnh vực báo chí truyền thơng, những tác động dữ liệu lớn có thể mang lại
là gì?”


1.

Trải nghiệm truyền thông thay đổi

Truyền thông xã hội đã thay đổi hệ sinh thái truyền thông trong thời đại của
chúng ta, đặc biệt đã làm thay đổi thói quen tiêu dùng thông tin của công chúng.
Năm 2018, thời gian bình quân một người Việt dành cho truyền hình truyền thống
mỗi ngày là 2 giờ 31 phút, trong khi đó, thời gian bình quân họ dành cho internet là
6 giờ 42 phút. Khán giả tiếp nhận truyền hình trên nhiều nền tảng khác nhau, trong
nhiều thời điểm khác nhau, ở nhiều khơng gian khác nhau. Cơng chúng truyền hình
hiện đại khơng cịn thụ động nghe/xem mà được tham gia bàn luận, góp ý, sáng
tạo, thậm chí thành “đồng chủ thể” ngay trong thời điểm “phát sóng” chương trình
thơng qua mơi trường truyền thông xã hội. Hiện nay, rất nhiều nền tảng và cơng cụ
giúp họ tự tìm “kênh”, vừa xem truyền hình vừa có thể chơi game, bàn luận thơng
tin (kể cả thông tin mua hàng, dịch vụ), tham gia bình chọn...
Tất cả những trải nghiệm ấy đã góp phần tạo nên Big Data.
Theo định luật Metcalfe, khi ta kết nối hai hay nhiều máy tính thành một
mạng, mỗi máy sẽ trở nên hữu ích hơn. Định luật Metcalfe cũng chỉ ra rằng, giá trị
(sức mạnh) của một mạng lưới gia tăng tỷ lệ với bình phương số thiết bị được kết
nối đến mạng đó.
Khi chúng ta sử dụng mạng xã hội Facebook hay YouTube, bất cứ hành vi
truyền thông nào từ chia sẻ, thể hiện cảm xúc thái độ bằng các biểu tượng, đến việc
xuất bản hình ảnh, văn bản, video, tham gia trò chơi đều lưu lại dấu vết số. Hàng tỷ


người dùng với các hành vi ấy trở thành cơ sở Dữ liệu lớn (Big Data) và các thuật

toán của Facebook có thể phân tích, nhà cung cấp dịch vụ có thể khai thác, thậm
chí kinh doanh kết quả phân tích ấy. Khơng phải ngẫu nhiên mà trên tường của
thành viên mạng xã hội Facebook luôn hiện các quảng cáo, các thơng tin báo chí
hay nội dung của bạn bè rất phù hợp với mối quan tâm của chính họ. Khơng chỉ
YouTube hay Facebook mà nhiều dịch vụ miễn phí khác - hàng loạt “ông lớn”
công nghệ thông tin - lâu nay đã âm thầm làm chuyện đó.
Rõ ràng, mạng xã hội, trí tuệ nhân tạo, internet vạn vật, dữ liệu lớn... đã và
đang tác động tới hệ sinh thái truyền thơng. Và ở một khía cạnh khác, hệ sinh thái
truyền thông mới trao quyền lực cho công chúng: tất cả đều làm truyền thông, công
chúng không chỉ thụ hưởng thơng tin từ cơ quan báo chí mà họ cịn trực tiếp tạo ra
thông tin. Đặc điểm nổi bật trong hệ sinh thái truyền thông mới là sự tham gia bình
đẳng của nhiều bên vào những q trình truyền thơng. Mơi trường truyền thơng đa
chiều, đa hình thái, đa nền tảng, đa tiếp nhận. Nội dung có thể được chuyển tiếp,
chia sẻ và tương tác giữa những người dùng mà không cần bộ lọc, kiểm chứng
thông tin của bên thứ ba. Cơng chúng khơng cịn đơn thuần là khách hàng của báo
chí chính thống mà là một khâu quan trọng trong sáng tạo sản phẩm truyền thông.
2. Ứng dụng trong lĩnh vực Báo chí – Truyền thơng trong tương lai

Người làm báo hồn tồn có thể khai thác, sử dụng và sàng lọc nhiều dữ liệu
hơn, thay vì cố gắng chọn ra những dữ liệu tuy chính xác nhưng ít ỏi về dung
lượng.
Bên cạnh đó, Dữ liệu lớn hỗ trợ cho người làm báo và cơ quan báo chí điều
chỉnh thông điệp và cách truyền thông điệp phù hợp nhất, đưa ra những khuyến
cáo trong thời gian thực. Từ đó, cơ quan báo chí có thể tương tác, truyền tải thông
điệp, và thiết kế đúng giá trị phù hợp cho đối tượng công chúng khán giả vào đúng
thời điểm quan trọng với họ để làm tăng giá trị, nâng cao sự hài lòng và trung
thành của họ. Tốc độ xử lý dữ liệu giúp cho cơ quan báo chí có thể nhanh chóng
đưa ra được dự báo về xu hướng phát triển của dịng chảy thơng tin, về mối quan
tâm của công chúng đối với từng sản phẩm truyền thông. Quan sát hành vi tiếp
cận, truy cập của mỗi cá nhân độc giả sẽ giúp cơ quan báo chí có thể cải thiện được

chất lượng sản phẩm tin bài. Nhờ có năng lực xử lý nội dung thơng tin ở cấp độ
cao, cơ quan báo chí sẽ có cơ hội phát triển mới, khi không chỉ sản xuất ra một sản
phẩm duy nhất dành cho đại chúng, mà có thể sáng tạo những nội dung mới đáp
ứng nhu cầu rất riêng biệt của từng cá nhân.


Một trong những tính chất phức tạp nhất của dữ liệu lớn và cũng là cơ hội
cho hoạt động báo chí, đó là độ chính xác của dữ liệu. Dữ liệu lớn thực hiện phân
tích loại bỏ dữ liệu thiếu chính xác và dữ liệu “nhiễu”, trích xuất thơng tin mang
tính chính xác cao. Trong xu thế tồn cầu hóa và Internet vạn vật, báo chí sẽ phải
gắn liền với dữ liệu lớn như một xu thế tất yếu, vì bằng cách này, báo chí mới biết
một cách chính xác và cụ thể cơng chúng khán giả đang nghĩ gì và cần gì, điều mà
những cách thức thu thập thơng tin truyền thống lâu nay (bằng bảng câu hỏi, phiếu
thăm dị) khơng cịn đáp ứng được trong bối cảnh hiện nay.
Ví dụ: Mỗi giây, VnExpress thu thập trên 1 MB dữ liệu từ tất cả các hoạt động trực
tuyến trên các dịch vụ bao gồm nội dung, quảng cáo, các giao dịch phát sinh. Để
có thể sử dụng tốt lượng dữ liệu này, Trung tâm kỹ thuật VnExpress đã áp dụng
Big Data vào hoạt động nghiên cứu và đưa ra bốn giải pháp tối ưu mang đến những
trải nghiệm tốt nhất cho người dùng và đội ngũ biên tập:


Hệ thống khuyến nghị: Phân tích xu hướng, sở thích người đọc, từ đó gợi
ý những bài viết, chủ đề độc giả có thể quan tâm;



Cá nhân hố;




Tự động hố sản xuất nội dung: Ứng dụng CMS;



Hệ thống giám sát hiệu năng: Chịu được tốc độ truy cập lớn và đưa ra kết
quả tìm kiếm nhanh chóng.

Đối với khía cạnh truyền thơng và giải trí, các cơng ty, doanh nghiệp truyền
thơng có thể làm hài lòng khách hàng bằng cách thu thập thơng tin về thói quen, sở
thích, phân tích ra insight (những mong muốn ẩn sâu bên trong) của người dùng để
sáng tạo ra những nội dung phù hợp với họ, đảm bảo lượt truy cập. Một khi nhận
thức được sở thích của khách hàng, họ có thể dự đốn một cách hiệu quả dịch vụ
nào họ cần cung cấp trong tương lai gần. Điều này cũng tối đa hóa doanh thu của
họ, đặc biệt trong việc chạy quảng cáo.
Case study: The Weather Channel
The Weather Channel (TWC), một kênh TV phải trả tiền tại Mỹ đồng sở hữu
bởi IBM. IBM, một trong những người tiên phong trong thế giới Big Data, trao
quyền cho TWC với phân tích Big Data để hiểu hành vi của khách hàng trong điều
kiện thời tiết cụ thể.


Khi đạt hiểu biết trong thị trường này, họ đã phát triển một thị trường có tên
Weather FX, nổi lên như một nền tảng để người bán quảng cáo sản phẩm của họ,
có ưu tiên được bán cao hơn trong điều kiện thời tiết cụ thể.
Đây là thành công lớn của TWC khi khoảng 50% doanh thu được tạo ra với
sự hỗ trợ của phân tích Big Data.


TÀI LIỆU THAM KHẢO
1.


“Big Data là gì? Tất cả những điều bạn cần biết về Big Data”

/>2.

“Big Data là gì? Big Data trong kĩ thuật và trong cuộc sống”

/>3.

“Khái niệm Big Data là gì? Tầm quan trọng của nó như thế nào?”

/>4.

“Báo chí trong hệ sinh thái truyền thơng mới”

/>5.

“Cơ hội mới cho báo chí trong kỉ nguyên Big Data”

/>6.

“Báo chí điện tử trong kỉ nguyên số”

/>7.

“Ứng dụng Big Data trong ngành truyền thơng và giải trí”

/>



Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×