133
TỔNG QUAN VỀ DỮ LIỆU LỚN (BIG DATA) VÀ HIỆU QUẢ ỨNG DỤNG
TRONG KINH TẾ VÀ KINH DOANH THƯƠNG MẠI ĐIỆN TỬ
ThS. Lê Triệu Tuấn
Đại học Công nghệ thông tin và truyền thơng
TS. Phạm Minh Hồn
Viện Cơng nghệ thơng tin và Kinh tế số, Trường Đại học Kinh tế Quốc dân
TĨM TẮT
Trong bối cảnh cuộc cách mạng cơng nghiệp 4.0, dữ liệu lớn (big data) đóng vai trị
cốt lõi, là chìa khóa dẫn tới thành cơng của các doanh nghiệp và được ứng dụng rộng rãi
trong nhiều lĩnh vực khoa học, công nghệ, kinh tế và xã hội. Trên thế giới cũng như ở Việt
Nam, đã có nhiều cơng ty, tổ chức ứng dụng thành công big data với hiệu quả rất cao. Vậy
dữ liệu lớn là gì, cơng nghệ gì xử lý dữ liệu lớn hiện nay và hiệu quả ứng dụng dữ liệu lớn
trên thế giới, ở Việt Nam như thế nào. Bài báo trình bày nội dung nghiên cứu tổng quan
về dữ liệu lớn, ứng dụng và hiệu quả ứng dụng của nó, đặc biệt vai trị định hướng của dữ
liệu lớn trong nền kinh tế nói chung và đối với bài toán thương mại điện tử cũng như phát
triển khách hàng nói riêng.
Từ khóa: Dữ liệu lớn, Xử lý dữ liệu lớn, Dữ liệu khách hàng, Kinh tế số.
1. GIỚI THIỆU
Trong thời đại nền kinh tế số hiện nay, dữ liệu đang được sinh ra theo cấp số nhân,
có khoảng 40 zettabytes tức 43 nghìn tỉ gigabytes dữ liệu sẽ được tạo ra vào năm 2020.
Con số này tăng 300 lần so với số liệu thống kê được vào năm 2005 (McKinsey Global,
2011). Dữ liệu được sinh ra từ các nguồn như: sự phổ biến của điện thoại thông minh, mạng
xã hội, mạng kết nối vạn vật (Internet Of Things), … nói cách khác chúng là dữ liệu được
sản sinh qua q trình chia sẻ thơng tin liên tục của các thiết bị, người sử dụng hay còn gọi
là dữ liệu lớn (big data). Thuật ngữ big data đã được sử dụng từ những năm 1990 và chỉ
thực sự bùng nổ trong khoảng 10 năm trở lại đây nhưng trên thế giới đã có rất nhiều ứng
dụng trong các lĩnh vực mang lại hiệu quả to lớn (Graham, 2012). Như nhà bán lẻ Target
của Hoa Kỳ có thể dự đốn gần như chính xác thời điểm một khách hàng của họ mong
muốn sinh em bé, để giới thiệu, cung cấp các sản phẩm phù hợp (Denis Guyadeen, 2012).
Công ty Sociometric Solutions (Hoa Kỳ) đặt cảm biến vào tấm huy hiệu tên nhân viên để
có thể phát hiện các động lực xã hội tại nơi làm việc. Các cảm biến sẽ báo cáo về cách nhân
134
viên di chuyển xung quanh nơi làm việc, nói chuyện, và thậm chí cả cách giao tiếp trong
cơng việc của họ. ResearchKit - ứng dụng chăm sóc sức khỏe của Apple, đã biến điện thoại
di động thành một thiết bị nghiên cứu y sinh học, phục vụ cho các nghiên cứu về sức khỏe
thông qua việc theo dõi số bước đi thực hiện trong một ngày, hoặc yêu cầu bạn trả lời các
câu hỏi về cảm giác sau khi hóa trị, hay theo dõi căn bệnh Parkinson đang tiến triển như
thế nào (Hồ Thị Hạnh, 2019).
Tại Việt Nam, nhiều doanh nghiệp cũng đã nghiên cứu và ứng dụng big data vào kinh
doanh, quản lý để nâng cao năng suất hoạt động của cơng ty mình. Lazada đã sử dụng dữ
liệu thu thập được để xác định sản phẩm phù hợp với từng phân khúc khách hàng. Ví dụ,
khách hàng Thái Lan thích mua tã giấy trong hộp đặc biệt, trong khi người Malaysia thích
hàng được đóng trong từng gói nhỏ. Lazada dự định sử dụng khoa học dữ liệu để giúp các
nhà cung ứng của mình tùy chỉnh các dịch vụ cung cấp cho các nhóm khách hàng cụ thể
dựa trên tuổi, giới tính và các sở thích khác. Hay như trang bán lẻ Sendo.Vn trực thuộc Tập
đoàn FPT, Sendo.Vn đã vận dụng phân tích dữ liệu lớn trên 5 triệu sản phẩm được bán bởi
80.000 shop đòi hỏi sự chuyên nghiệp trong quá trình xử lý, nhằm đảm bảo loại trừ chính
xác hàng giả, hàng nhái; và kiểm tra độ tin cậy về giá bán cuối cùng của các shop trong lễ
hội mua sắm trực tuyến ngày 2/12/2018 (Trịnh Thu Trang, 2019).
Big Data chứa rất nhiều thông tin quý giá mà nếu trích rút thành cơng, sẽ hỗ trợ đắc
lực cho việc kinh doanh, nghiên cứu khoa học, dự đốn các dịch bệnh sắp phát sinh và
thậm chí có thể đưa ra những khuyến nghị chính xác về điều kiện giao thông, thời tiết…
theo thời gian thực (Sameera, 2014).
2. KHÁI NIỆM, ĐẶC TRƯNG CỦA DỮ LIỆU LỚN
Big data được định nghĩa là dữ liệu vượt quá khả năng xử lý của hệ thống xử lý dữ
liệu thông thường do khối lượng, vận tốc và tính biến đổi của nó (Dumbill, 2012).
Theo Gartner, big data có 5 đặc trưng (5V) như sau:
Khối lượng dữ liệu (Volume): Đây là đặc trưng cơ bản nhất của big data, khối lượng
của big data đang tăng lên từng ngày, năm 2013 cứ mỗi 11 giây trôi qua 1 petabyte dữ liệu
được tạo ra trên toàn thế giới, tương đương với một đoạn video HD dài 13 năm (Stephen,
2012). Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa mềm, đĩa cứng. Nhưng với
big data thì ta phải dùng cơng nghệ mới như cơng nghệ điện tốn đám mây thì mới đáp ứng
khả năng lưu trữ.
135
Tốc độ (Velocity): Tốc độ có thể được hiểu theo 2 khía cạnh: thứ nhất, khối lượng
dữ liệu ra tăng rất nhanh (mỗi giây có tới 72.9 triệu các yêu cầu truy cập tìm kiếm trên web
bán hàng của Amazon); thứ hai, xử lý dữ liệu nhanh ở mức thời gian thực (real-time), có
nghĩa dữ liệu được xử lý ngay tức thời ngay sau khi chúng phát sinh (tính bằng mili giây).
Các ứng dụng phổ biến trên lĩnh vực Internet, tài chính, ngân hàng, hàng khơng, qn sự,
y tế… như hiện nay phần lớn dữ liệu được xử lý real-time.
Đa dạng (Variety): Các dữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh,
video, bài hát, dữ liệu từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe…), big data
cho phép liên kết và phân tích nhiều dạng dữ liệu khác nhau.
Độ chính xác (Veracity): Bài tốn phân tích và loại bỏ dữ liệu thiếu chính xác và
nhiễu đang là tính chất quan trọng của big data. Với xu hướng phương tiện truyền thông
xã hội (Social Media) và mạng xã hội (Social Network) ngày nay và sự gia tăng mạnh mẽ
tính tương tác và chia sẻ của người dùng mobile làm cho bức tranh xác định về độ tin cậy
và chính xác của dữ liệu ngày càng khó khăn hơn.
Giá trị (Value): Giá trị là một đặc trưng quan trọng của big data, nó cho chúng ta
thơng tin để ra quyết định xem có nên triển khai big data hay không. Nếu chúng ta có big
data mà chỉ nhận được % lợi ích rất nhỏ từ nó thì khơng nên đầu tư phát triển.
3. CÔNG NGHỆ XỬ LÝ DỮ LIỆU LỚN
Big data đem lại lợi ích rất lớn cho xã hội nhưng cũng đặt ra thách thức không nhỏ
về mặt công nghệ để xử lý, địi hỏi các mơ hình xử lý, lưu trữ và phân tích phải hiện đại.
Để đáp ứng được yêu cầu cho các tính chất của big data thì các mơ hình này được xây dựng
trên mơi trường phân tán. Công nghệ cho dữ liệu lớn được chia thành 3 giai đoạn chính
như hình dưới:
Cơng nghệ
lưu trữ
- HDFS
- NoSQL
Cơng nghệ xử
lý
- MapReduce
Cơng nghệ
hiển thị
- Tableau
- Pentahoo
- SAS
Hình 1. Mơ hình công nghệ xử lý dữ liệu lớn.
(Nguồn: Tác giả đề xuất)
136
Công nghệ lưu trữ: Công nghệ lưu trữ giải quyết bài toán dữ liệu khổng lồ và tốc độ
xử lý cao bằng cách phân tán dữ liệu trên nhiều máy trạm. Khi truy xuất dữ liệu thì cho
phép truy xuất đồng thời cùng lúc. Hệ thống tập tin phân tán HDFS (Hadoop Distributed
File System) là hệ thống quản lý tập tin được thiết kế để tối ưu cho bài toán lưu trữ các tập
tin có kích thước lớn hàng Gigabyte, thậm chí Terabyte. Để giải quyết bài tốn này, dữ liệu
của các tập tin lớn sẽ được chia nhỏ thành các khối lớn (ví dụ 64MB) và phân tán trên các
nút lưu trữ. So với các hệ thống tập tin khác, HDFS khơng tối ưu cho bài tốn lưu trữ hàng
tỉ tập tin nhỏ với kích thước mỗi tập tin chỉ vài KB. Ưu điểm của thiết kế tập tin lớn là giảm
tải cho hệ thống quản lý không gian tập tin, giảm thời gian thao tác trên các thư mục hay
tìm kiếm tập tin. Cơ sở dữ liệu phi quan hệ, NoSQL, đáp ứng lưu trữ dữ liệu với lược đồ
mơ hình dữ liệu linh hoạt, đa dạng định dạng dữ liệu, tính mở cao, loại bỏ các tính chất
không thực sự cần thiết của cơ sở dữ liệu quan hệ truyền thống. Mơ hình cở dữ liệu phi
quan hệ NoSQL được sử dụng rộng rãi tại các công ty Internet lớn, như Google, Yahoo,
Facebook, Amazon (Trần Việt Trung, 2015).
Công nghệ xử lý: Phương pháp xử lý dữ liệu lớn là kết tập, phối hợp năng lực xử lý
của nhiều máy tính vào giải quyết một bài tốn chung. Công nghệ xử lý dữ liệu lớn phổ
biến là mô hình tính tốn MapReduce, được Google đưa ra vào năm 2004 (Jimmy, 2010).
Với mơ hình tính tốn này, các máy tính này sẽ hoạt động song song nhưng độc lập với
nhau, mục đích là làm rút ngẵn thời gian xử lý tồn bộ dữ liệu. Tính tốn MapReduce được
phân tán trên các nút lưu trữ. So với các mơ hình tính tốn khác mà dữ liệu được sao chép
đến các nút tính tốn và thực hiện trên các nút đó, mơ hình tính tốn MapReduce khác biệt
ở chỗ mã chương trình được sao chép tới các nút lưu trữ để thực thi. Đây là một trong
những điểm mấu chốt tiên tiến của MapReduce vì quan điểm di chuyển mã chương trình
thì tiết kiệm và hiệu quả hơn di chuyển dữ liệu (Jeffrey và Ghemawat, 2008).
Công nghệ hiển thị: Hiển thị trực quan lượng dữ liệu khổng lồ và các tri thức khai
thác được từ dữ liệu là đòi hỏi cần thiết khi làm việc với dữ liệu lớn. Việc hiển thị dữ liệu
dưới dạng trực quan giúp người khai thác có cái nhìn tồn cảnh về dữ liệu và tri thức mang
lại từ dữ liệu. Các công cụ cho phép hiển thị và tương tác trực quan với dữ liệu lớn hiện
nay phổ biến là các công cụ như Tableau, Pentahoo, SAS (Trần Việt Trung, 2015).
4. NHỮNG ỨNG DỤNG PHỔ BIẾN CỦA BIG DATA
Phân tích mục tiêu của khách hàng: Đây là một trong những lĩnh vực lớn nhất của việc
ứng dụng cơng nghệ big data, nó giúp các cơ quan, tổ chức hiểu rõ hơn về nhu cầu khách hàng
cũng như hành vi và sở thích của họ. Các công ty mở rộng bộ dữ liệu truyền thống của họ, kết
137
hợp với dữ liệu truyền thông, xã hội và phân tích văn bản. Ví dụ, nhà bán lẻ Target của Hoa
Kỳ có thể dự đốn gần như chính xác thời điểm một khách hàng của họ mong muốn sinh em
bé, để giới thiệu, cung cấp các sản phẩm phù hợp. Sử dụng Big Data, các cơng ty viễn thơng
có thể dự đoán tốt hơn việc thay đổi mong muốn của khách hàng; công ty bảo hiểm xe hơi
hiểu rõ khách hàng của họ lái xe như thế nào (Yongyang Nen, 2014).
Chăm sóc sức khỏe cộng đồng: Cơng nghệ big data hỗ trợ đắc lực cho bác sỹ trong
việc phát hiện và đưa ra phác đồ điều trị riêng cho từng bệnh nhân, phù hợp với đặc tính di
truyền của họ. Ví dụ bác sĩ sẽ biết những gì sẽ xảy ra khi tất cả dữ liệu cá nhân từ đồng hồ
và thiết bị đeo thông minh được sử dụng để theo dõi sức khỏe từ xa cho hàng triệu người,
giúp sớm phát hiện ra các bệnh họ mắc phải; Vòng tay thơng minh Jawbone giúp thu thập
dữ liệu, từ đó nhận biết và đo đạc một cách chính xác mức độ tiêu thụ calo trong các hoạt
động mà người đeo thực hiện, cũng như theo dõi giấc ngủ của họ vào ban đêm để phân
tích những dấu hiệu bất thường; ResearchKit - ứng dụng chăm sóc sức khỏe của Apple, đã
biến điện thoại di động thành một thiết bị nghiên cứu y sinh học, phục vụ cho các nghiên
cứu về sức khỏe thông qua việc theo dõi số bước đi thực hiện trong một ngày, hoặc yêu
cầu bạn trả lời các câu hỏi về cảm giác sau khi hóa trị, hay theo dõi căn bệnh Parkinson
đang tiến triển như thế nào (Couldry, 2014).
Nâng cao hiệu suất thể thao: Trong lĩnh vực thể thao, big data được ứng dụng rất
nhiều để nâng cao hiệu quả quản lý giải đấu hay hiệu suất thi đâu của các vận động viên.
Ví dụ như công cụ IBM SlamTracker dành cho các giải đấu quần vợt; sử dụng phân tích
video theo dõi hiệu suất của người chơi trong bóng đá hoặc bóng chày; cơng nghệ cảm
biến trong thiết bị thể thao như bóng rổ hoặc gậy golf cho phép nhận phản hồi, giúp cải
thiện những thao tác chưa đúng; Nhiều đội thể thao sử dụng công nghệ big data để theo
dõi vận động viên trong giờ nghỉ để điều chỉnh chế độ dinh dưỡng, vận động và cả giấc
ngủ, cũng như phân tích các cuộc trị chuyện trên phương tiện truyền thơng xã hội để theo
dõi mức độ hạnh phúc, tình cảm của các vận động viên. Như World Cup năm 2014 các
cầu thủ của đội tuyển Đức đã sử dụng bộ trang phục được trang bị hệ thống MiCoach của
Adidas ở những buổi luyện tập trước và trong quá trình giải đấu diễn ra. Đây là dịch vụ
giám sát sinh lý, thu thập và truyền tải thông tin trực tiếp từ cơ thể các cầu thủ (bao gồm
nhịp tim, quãng đường đã di chuyển, tốc độ, gia tốc và năng lượng…), rồi gửi về một
chiếc iPad của ban huấn luyện, phục vụ cho việc giám sát, phân tích, đánh giá điểm rơi
phong độ (Dumbill, 2012).
138
Cải thiện an ninh và thực thi pháp luật: Ngày nay, big data được ứng dụng nhiều để
phát hiện và ngăn chặn các cuộc tấn công trên mạng; lực lượng cảnh sát sử dụng các công
cụ big data để bắt tội phạm và dự đoán hoạt động của các tổ chức tội phạm; các cơng ty tín
dụng sử dụng big data để phát hiện các giao dịch gian lận. Ví dụ Cơ quan An ninh quốc
gia Hoa Kỳ (NSA) sử dụng các phân tích dữ liệu lớn dự đốn sớm về các cuộc khủng bố
(Graham, 2012).
Xây dựng thành phố thông minh: Big data được sử dụng để cải thiện nhiều khía cạnh
của các thành phố và quốc gia. Trong tương lai, big data sẽ giữ vai trò chủ đạo đối với các
thành phố, hướng tới xử lý dữ liệu ở những phạm vi, cấp độ siêu nhỏ và truyền tải thơng
tin tới cả chính phủ lẫn người dân trong khung thời gian giới hạn. Nó cho phép các thành
phố tối ưu hóa những hoạt động dựa trên lưu lượng truy cập thông tin giao thông theo thời
gian thực, cũng như phân tích dữ liệu truyền thơng để đánh giá các vấn đề về xã hội. Ví
dụ, nhiều thành phố đang thử nghiệm các mơ hình big data với mục đích chuyển đổi sang
thành phố thông minh, nơi mà tất cả các quy trình, cơ sở hạ tầng giao thơng và tiện ích đều
được kết nối với nhau (McGuire, 2013). Thành phố Long Beach, California (Hoa Kỳ) đang
sử dụng đồng hồ nước thông minh để phát hiện mất trộm nước theo thời gian thực, giúp
một số chủ nhà cắt giảm tới 80% lượng nước sử dụng. Los Angeles sử dụng dữ liệu từ cảm
biến và 4.500 camera lắp đặt trên các đường phố để kiểm sốt đèn giao thơng, giúp giảm
tắc nghẽn giao thông lên đến 16% (Puneet và Sanchita, 2013).
Hoạt động tài chính, ngân hàng: Đặc thù của hoạt động trong lĩnh vực tài chính là
tạo ra một lượng dữ liệu khổng lồ đến từ cả bên trong và bên ngồi. Bằng việc ứng dụng
cơng nghệ big data, những cơng ty hoạt động trong lĩnh vực thị trường tài chính có thể cải
thiện các hoạt động giám sát giao dịch và phát hiện được những hành vi giao dịch bất
thường, hành vi phạm pháp trước khi chúng được thực hiện. Cải thiện độ tin cậy để ra
quyết định, cung cấp câu trả lời nhanh, chính xác cho các câu hỏi kinh doanh; truy cập
thơng tin nhanh chóng, dễ dàng; hiểu biết sâu sắc về hành vi của khách hàng; tạo ra tri thức
mới… Từ những dữ liệu có cấu trúc như lịch sử giao dịch, hồ sơ khách hàng tới những dữ
liệu phi cấu trúc như hoạt động của khách hàng trên website, ứng dụng mobile banking hay
trên mạng xã hội…, Big Data sẽ đem lại những lợi thế cạnh tranh và hiệu quả to lớn cho
lĩnh vực này (Hồ Thị Hạnh, 2019).
139
5. VAI TRÒ CỦA BIG DATA TRONG NỀN KINH TẾ VÀ BÀI TOÁN PHỤC VỤ
KHÁCH HÀNG
Giá trị thị trường của big data. Ứng dụng big data trong nhiều lĩnh vực cụ thể là rất
rõ ràng và sức ảnh hưởng của big data thể hiện rõ nhất là trong lĩnh vực kinh tế. Việc xử lý
thông tin, nhất là thông tin có liên quan tới khách hàng, cho phép các doanh nghiệp cải
thiện rõ rệt các chiến lược kinh doanh và quảng bá sản phẩm, hình ảnh, chăm sóc khách
hàng. Nó cho phép dự đốn các xu hướng tương lai, thói quen của người tiêu dùng cải thiện
quan hệ với khách hàng, tăng chất lượng tuyển dụng một cách hiệu quả. Và hiện nay, big
data đang có tốc độ phát triển rất nhanh. Theo thống kê năm 2010, ngành công nghiệp big
data trên thế giới có giá trị hơn 100 tỷ USD và đang tăng nhanh mỗi năm (D.Fisher và
Drucker, 2012). Đến năm 2022, con số lợi nhuận mà thị trường big data trên tồn cầu có
thể mang lại khoảng 260 tỷ USD ( 2018).
Big data có thể thay đổi cách vận hành nền kinh tế. Với việc ứng dụng big data vào
rất nhiều lĩnh vực của nền kinh tế hiện nay, như: lĩnh vực ngân hàng, big data thể hiện vai
trị khơng thể thay thế của mình trong mọi hoạt động của ngân hàng, từ thu tiền mặt đến
quản lý tài chính. Các ứng dụng của big data đã giúp giảm bớt rắc rối của khách hàng và
tạo doanh thu cho các ngân hàng; Trong lĩnh vực y tế, big data đang dần khẳng định vai
trị của mình trong việc cải thiện sức khỏe ngày nay. Big data không những được ứng dụng
để xác định phương hướng điều trị, cải thiện q trình chăm sóc sức khỏe bệnh nhân mà
nó cịn có nhiều tác động lớn trong việc giảm lãng phí tiền bạc và thời gian (Guan và Liao,
2014); Lĩnh vực thương mại điện tử, việc ứng dụng big data có thể tạo ra lợi ích cạnh tranh
cho doanh nghiệp bằng cách cung cấp thông tin chuyên sâu và các bản báo cáo phân tích
xu hướng tiêu dùng (Jelinek và Bergey, 2013); Trong quản lý thiên tai, các nhà khoa học
khơng thể dự đốn khả năng xảy ra thảm họa và đề xuất đủ biện pháp phịng ngừa cho
chính phủ nếu khơng có sự giúp đỡ của big data, giúp cho các nhà khí tượng học dự báo
điều kiện thời tiết chính xác hơn (Davenport và Patil, 2012); Lĩnh vực giáo dục, big data
có thể tạo ra các phương pháp tiếp cận dựa trên dữ liệu sáng tạo để dạy học sinh. Big data
có thể lưu trữ, quản lý, phân tích các bộ dữ liệu lớn bao gồm hồ sơ của sinh viên. Duy trì
bảo mật bằng cách sử dụng hệ thống quản lý big data có khả năng trích xuất phân cấp
(Davenport và Barth, 2012); Ngành bán lẻ, big data có thể giúp phân tích thị trường cạnh
tranh và sự quan tâm của khách hàng. Giúp xác định hành trình trải nghiệm, xu hướng mua
sắm và sự hài lịng của khách hàng bằng cách thu thập dữ liệu đa dạng. Từ những dữ liệu
thu thập được có thể cải thiện hiệu suất và hiệu quả bán hàng; Trong lĩnh vực marketing,
140
big data đã tiếp sức cho Digital Marketing phát triển thực sự mạnh mẽ, và nó đã trở thành
một phần không thể thiếu của bất kỳ doanh nghiệp nào. Không chỉ các cơng ty lớn có thể
điều hành các hoạt động quảng cáo tiếp thị mà cả các doanh nhân nhỏ cũng có thể chạy các
chiến dịch quảng cáo thành công trên các nền tảng truyền thông xã hội và quảng bá sản
phẩm của họ; Lĩnh vực truyền thông, giải trí, các cơng ty truyền thơng và người hoạt động
trong lĩnh vực giải trí cần thúc đẩy chuyển đổi kỹ thuật số để phân phối sản phẩm và nội
dung của họ nhanh nhất có thể tại thị trường hiện tại. Đối với những người ảnh hưởng trên
các phương tiện truyền thơng đại chúng, Big Data có thể giúp tìm ra quan điểm hoặc lượt
thích của một nghệ sĩ để đo lường mức độ phổ biến trong lĩnh vực truyền thông kỹ thuật
số (Ueda, 2012).
Ở thời đại số, kỹ thuật khai thác dữ liệu và xử lý hình ảnh đang giúp big data trở nên
hữu ích hơn bao giờ hết. Nó tạo những chuyển biến ấn tượng, giúp tăng hiệu quả và năng
suất của doanh nghiệp.
Việt Nam là nước có tốc độ phát triển công nghệ thông tin và truyền thông rất nhanh,
là một thị trường rất tiềm năng cho các công ty, tổ chức triển khai và khai thác các lợi ích
từ big data. Đã có nhiều cơng ty, tập đoàn, tổ chức thành lập các dự án về big data và đã
mang lại thành cơng ngồi mong đợi, như: tập đồn FPT, cơng ty VCCorp, cơng ty VNG,
tập đồn Viettel…Big data ảnh hưởng tới các tổ chức, doanh nghiệp ở mức chiến lược và
điều hành, giúp tạo ra lợi thế cạnh tranh so với các đối thủ.
Big data ảnh hưởng tới sự phát triển của xã hội. Big data đã được nhiều nước trên
thế giới, đặc biệt tại các nước phát triển ứng dụng thành công trong vấn đề nâng cao chất
lượng quản lý và các vấn đề xã hội. Tại Mỹ ứng dụng big data để cải thiện tỷ lệ tử vong ở
trẻ sơ sinh. Theo đó, bang Indiana là một trong những bang có tỷ lệ tử vong trẻ sơ sinh cao
nhất trong cả nước Mỹ. Đặc biệt, trẻ em da đen có tỷ lệ tử vong trẻ sơ sinh (14,4) - cao hơn
gấp đôi tỷ lệ trẻ em da trắng (6.4). Do tỷ lệ tử vong ở trẻ sơ sinh thường được sử dụng như
một chỉ số về mức độ sức khỏe ở một quốc gia, một thống kê đáng ngạc nhiên, nếu ví bang
Indiana là một quốc gia, thì tỷ lệ tử vong ở trẻ sơ sinh của Indiana sẽ cao hơn Kuwait (7,0)
và đối với trẻ em da đen sẽ cao hơn Colombia (13,6), vùng lãnh thổ giữa Israel-Palestine
(14,1) và Jordan (14,2). Chính quyền bang Indiana đã thiết lập một nền tảng văn hóa mạnh
mẽ về quyết định dựa trên dựa trên dữ liệu trong các cơ quan của bang và các nhà nghiên
cứu đã tìm ra được gốc rễ của tỷ lệ tử vong ở trẻ sơ sinh và đã phát triên lộ trình giải quyết
vấn đề. Hoặc giải quyết vấn đề dịch bệnh Opioid – một loại bệnh được tạo ra do lạm dụng
141
thuốc giảm đau có tính chất gây nghiện, năm 2016 thống đốc Pence đã ký ban hành thành
lập một lực lượng đặc nhiệm về thực thi, điều trị và phòng ngừa dịch bệnh nói trên. Lực
lượng này kết hợp và phân tích các bộ dữ liệu, với hy vọng rằng các sự kiện tương lai như
vậy có thể được dự đoán và ngăn chặn. Ngăn chặn tội phạm tái phạm tội. Mỗi năm,
hơn 700.000 tù nhân được thả ra khỏi các nhà tù ở Hoa Kỳ. Nhà tù ờ Indiana định nghĩa
tái phạm tội là một sự trở lại tù giam trong vòng 3 năm kể từ ngày người phạm tội được
thả ra khỏi một cơ quan cải tạo của Bang. Trong năm 2016, tỷ lệ tái phạm của Bang là
37%, với gần một nửa số tù nhân trở về đã bị kết tội mới. Để cải thiện vấn đề này, chính
quyền Hoa Kỳ đã phân tích thơng tin tập trung vào cá nhân, xem xét các đặc điểm và lịch
sử phạm tội của cá nhân từ đó đưa ra các giải pháp để giảm thiểu tình trạng tái phạm tội tại
bang (Ryan, 2018). Theo (Tuấn Anh, 2017) hiện nay, cả nhà nước và doanh nghiệp đều
mong muốn sử dụng hiệu quả các tiến bộ khoa học công nghệ mới nhất trong xử lý big
data để cung cấp dịch vụ ngày càng tốt hơn, đáp ứng nhu cầu của người sử dụng, hướng
tới mục tiêu phát triển xã hội ngày càng tốt hơn. Các nhà hoạch định chính sách và các nhà
nghiên cứu đã nhận diện được tiềm năng của việc sử dụng big data để xử lý, chắt lọc ra
được các thơng tin có giá trị thực tiễn nhằm nâng cao chất lượng cuộc sống của người dân,
nâng cao chất lượng quản lý, điều hành theo cách mà trước đây chưa từng được thực hiện.
Big data ảnh hưởng lớn đến định hướng mục tiêu của thị trường. Big data có thể thay
đổi cách thức xác định thị hiếu khách hàng của các công ty, đẩy mạnh và thay đổi cách
thức tiếp thị khách hàng có hiệu quả hơn so với cách thức truyền thống. Chiến lược thâm
nhập thị trường có thể tận dụng dữ liệu lớn để tạo ra các thông tin quảng bá giúp giữ chân
khách hàng hiện có và nâng cao doanh số. Tương tự như vậy đối với khách hàng mới, giúp
cải thiện được mức độ tin tưởng. Dữ liệu lớn không những làm thay đổi cách chúng ta tiếp
cận thị trường với một sản phẩm hoặc dịch vụ, mà còn thay đổi cách chúng ta thết kế và
sáng tạo ra các sản phẩm, dịch vụ. Dựa vào dữ liệu lớn, người ta có thể dự đoán xu hướng
của khách hàng và sáng tạo ra các sản phẩm theo sở thích, yêu cầu riêng của họ.
Big data tác động tới sự hiểu biết và mong muốn của khách hàng. Đây là một trong
những lĩnh vực lớn nhất và được công bố công khai nhất cách dữ liệu lớn được sử dụng
ngày nay. Dữ liệu lớn được sử dụng để hiểu rõ hơn về khách hàng và hành vi cũng như sở
thích của họ. Các cơng ty đều mong muốn mở rộng tập dữ liệu truyền thống với các dữ liệu
truyền thơng xã hội, trình duyệt web để có được một bức tranh hồn chỉnh hơn về khách
hàng của họ. Ví dụ về nhà bán lẻ Target (Mỹ), những người có thể dự đốn rất chính xác
khi nào một khách hàng của họ sẵn sàng mua. Sử dụng dữ liệu lớn, các công ty viễn thông
142
có thể dự đốn tốt hơn về việc khách hàng rời mạng. Hay WalMart có thể dự đốn sản
phẩm gì sẽ được bán ra, và các công ty bảo hiểm xe hơi hiểu khách hàng của họ lái xe như
thế nào. Interactions Marketing, một cơng ty tiếp thị theo hình thức tận dụng ngay chính
khách hàng của mình, đã tiến hành kiểm soát dữ liệu lớn bằng cách sử dụng dữ liệu giao
dịch điểm bán hàng và dữ liệu thông tin thời tiết khu vực từ nhiều nguồn khác nhau để có
được những hiểu biết nhanh nhất về hành vi mua sắm của khách hàng. Phương pháp này,
sử dụng một dịch vụ web để phân tích sự tương tác của các bộ dữ liệu cực lớn và cơng cụ
phân tích hình ảnh Tableau để nhanh chóng kiểm tra số lượng lớn thông tin cho phép
Interactions cắt giảm thời gian phân tích từ một vài tuần xuống cịn một vài giờ hay thậm
chí vài phút. Chương trình phân tích này giúp các nhà bán lẻ và các nhà sản xuất lên kế
hoạch chương trình khuyến mãi tại cửa hàng trước khi những sự kiện này xảy ra (Kenneth
và Viktor, 2013).
Như vậy, khơng thể phủ nhận vai trị của big data đối với nền kinh tế nói chung và
hiệu quả trong kinh doanh thương mại điện tử. Trong thời đại thông tin hiện nay thì dữ liệu
lớn đang ngày càng trở thành công cụ quan trọng và hữu hiệu thúc đẩy phát triển các lĩnh
vực của nền kinh tế và thực hiện các chiến dịch quảng cáo, phát triển cũng như giữ chân
khách hàng giao dịch thương mại điện tử.
6. KẾT LUẬN
Cuộc cách mạng công nghiệp 4.0 cùng với các vấn đề trong phát triển kinh tế - xã
hội, bao gồm cả việc sử dụng Internet ngày càng tăng; sự suy giảm chi phí thu thập, truyền
tải, lưu trữ và phân tích dữ liệu… dẫn đến việc tạo ra những khối lượng dữ liệu khổng lồ big data. Đây chính là nguồn lực để thúc đẩy hình thành các ngành cơng nghiệp, các quy
trình sản xuất kinh doanh và tạo ra sản phẩm mới. Quan trọng hơn, big data đang mở ra
những cơ hội lớn trong yêu cầu chuyển dịch sang mô hình phát triển kinh tế dựa trên dữ
liệu. Big data không chỉ là là công cụ phát triển trong từng khía cạnh của kinh doanh, phát
triển khách hàng mà cịn có vai trị to lớn để định hướng phát triển nền kinh tế của một
quốc gia, là tài sản cốt lõi để tạo ra lợi thế cạnh tranh, chi phối hoạt động đổi mới sáng tạo,
tăng trưởng, đóng vai trị rất lớn trong phát triển kinh tế - xã hội.
143
TÀI LIỆU THAM KHẢO
Couldry, N., & Turow, J. (2014). Advertising, big data and the clearance of the public
realm: marketers' new approaches to the content subsidy. International Journal of
Communication, 8, 1710-1726.
Davenport, T. H., and Patil, D. J., (2012), "Data scientist: the sexiest job of the 21st
century," Harvard business review, 90(10), 70-77.
Davenport, T. H., Barth, P., and Bean, R., 2012, “How „Big Data‟ is Different,” MIT
Sloan Management Review, 54(1), 22-24.
Denis Guyadeen, Rob Peglar (2012), “Introduction to Analytics and Big dataHadoop”, SNIA Education Committee.
Dean, Jeffrey, and Sanjay Ghemawat (2008), "MapReduce: simplified data
processing on large clusters" Communications of the ACM 51.1: 107-113.
D.Fisher, R.Deline, M.Czerwinski and S. Drucker (2012), “Interaction with big data
analytics”, Volume 19, No.3.
Dumbill, E (2015), What is big data? An introduction to the big data landscape. Xem
trên />Graham, M (2012), Big data and the end of theory? The Guardian.
Han Hu, Yongyang Nen, Tat Seng Chua, Xuelong Li (2014), “Towards Scalable
System for Big Data Analytics: A Technology Tutorial”, IEEE Access, Volume 2, Page
No 653.
Hồ Thị Hạnh (2019), Công nghệ big data và xu hướng ứng dụng, xem trên https://
/>Kenneth Cukier and Viktor Mayer-Schonberger (2013), Big Data: A Revolution That
Will Transform How We Live, Work, and Think, Hachette UK.
Jelinek, M., and Bergey, P., (2013), “Innovation as the strategic driver of
sustainability: big data knowledge for profit and survival,” IEEE Engineering Management
Review, 41(2), 14–22.
Jimmy Lin and Chris Dyer (2010), Data-Intensive Text Processing with MapReduce,
University of Maryland.
McKinsey (2011), Big data: The next frontier for innovation, competition, and
productivity, Global.
McGuire, T (2013), Making data analytics work: Three key challenges. Xem trên
on
the 17th April 2015.
Puneet Singh Duggal, Sanchita Paul (2013), “Big Data Analysis: Challenges and
Solutions”, International Conference On Cloud.
144
Ueda, N., (2012), “Communication science for the big data era,” NTT Technical
Review.
Available
from:
review.jp/archive/ntttechnical.php?contents=ntr201211fa1.html.
Ryan (2018), Solving Wicked Problems With Predictive Analytics, xem trên
Stephen Oliver (2012), From 48 V direct to Intel VR12.0: Saving ‘Big Data’ $500,000
per data center, per year, VI Chip Product Line.
Sameera Siddiqui, Deepa Gupta (2014), “Big Data Process and Analytics: A Survey”,
International Journal Of Emerging Research in Management & Technology, ISSN: 22789359, Volume 3, Issue 7.
Tổng quan về big data trên toàn cầu trong năm 2018, xem trên
/>Trịnh Thu Trang (2019), Nghiên cứu về lợi ích của dữ liệu lớn – big data với doanh
nghiệp thương mại điện tử trong nước và trên thế giới, xem trên
/>Trần Việt Trung (2015), Dữ liệu lớn và làm chủ công nghệ dữ liệu lớn tại Việt Nam,
ĐHBK – HN.
Tuấn Anh (2017), Xử dụng hiệu quả Big Data để phát triển xã hội thông tin, xem trên
/>Y.Guan and H. Liao (2014), Is Big Data the Next Big Thing in Performance
Measurement Systems? Proceedings of the 2014 Industrial and Systems Engineering
Research Conference, Brazil.