Tải bản đầy đủ (.pdf) (43 trang)

Dữ Liệu Lớn (Big Data.pdf

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.85 MB, 43 trang )

lOMoARcPSD|38784156

HỌC VIỆN NGÂN HÀNG
KHOA HỆ THỐỐNG THỐNG TIN QUẢN LÝ

BÁO tài
CÁO BÀI
Đề TẬP DATA VÀ ỨNG DỤNG TRONG
BIG LỚN THƯƠNG MẠI ĐIỆN TỬ

Giảng viên hướng dẫn : Giang Thị Thu Huyền

Sinh viên thực hiện : Nhóm 12

Lớp : KTDNB

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

Hà nội, ngày tháng năm 2022

BẢNG PHÂN CỐNG NHIỆM VỤ

STT Họ tên Mã SV Vai trị Nhiệm vụ được phân cơng Thời gian Đánh giá

hoàn thành mức độ

hoàn thành

1 Nguyễn Như Nhóm - CHƯƠNG I: TỔNG



Quỳnh 24A4020402 trưởng QUAN VỀ BIG DATA

I, Tổng quan về dữ liệu lớn

2 Lý Như Quỳnh 24A4022385 Thành - CHƯƠNG I: TỔNG
viên QUAN VỀ BIG DATA
II, Bức tranh tổng thể ứng
dụng dữ liệu lớn
- CHƯƠNG 2. ỨNG DỤNG
DỮ LIỆU LỚN TRONG
THƯƠNG MẠI ĐIỆN TỬ
I. Khái quát về thương mại
điện tử

3 Lê Phương Linh 24A4021915 Thành - Lời Mở Đầu
viên - CHƯƠNG 2. ỨNG DỤNG

DỮ LIỆU LỚN TRONG

THƯƠNG MẠI ĐIỆN TỬ

II. Ứng dụng của Big data

trong thương mại điện tử

- Word

4 Trần Thị Mai 24A4021928 Thành - CHƯƠNG 2. ỨNG DỤNG


Linh viên DỮ LIỆU LỚN TRONG

THƯƠNG MẠI ĐIỆN TỬ

III. Nêu 1 ví dụ cụ thể về 1

doanh nghiệp đã ứng dụng

Big data

- CHƯƠNG 3. KẾT LUẬN

5 Phạm Thị Thu 24A4022577 Thành - Power Point

Thuỷ viên

Page | 1

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

MỤC LỤC

BIG DATA VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ
CHƯƠNG 1 : TỔNG QUAN VỀ BIG DATA

I. Tổng quan về dữ liệu lớn
1. Khái niệm
2. Nguồn hình thành dữ liệu lớn

3. Phương pháp khai thác và quản lý dữ liệu lớn ( Hadoop ecosystem)
4. Đặc trưng 5V của dữ liệu lớn
5. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyền thống

II. Bức tranh tổng thể ứng dụng dữ liệu lớn
1. Ứng dụng dữ liệu lớn trong giáo dục và đào tạo
2. Ứng dụng dữ liệu lớn trong giao thông
3. Ứng dụng dữ liệu lớn trong y tế
4. Ứng dụng dữ liệu lớn trong thể thao
5. Ứng dụng dữ liệu lớn trong tài chính
6. Ứng dụng dữ liệu lớn trong thống kê

CHƯƠNG 2 : ỨNG DỤNG DỮ LIỆU LỚN TRONG THƯƠNG MẠI ĐIỆN TỬ
I. Khái quát về thương mại điện tử
1. Cái nhìn chung về thương mại điện tử
2. Những điều kiện để khai thác big data hiệu quả trong thương mại điện tử, cơ sở hạ tầng để tiếp
cận big data
II. Ứng dụng của bigdata trong thương mại điện tử
1. Lợi ích của Big Data đem lại đối với ngành thương mại điện tử
2. Ứng dụng Big Data của một số trang bán hàng trực tuyến trên thế giới, Đông Nam Á và Việt
Nam như thế nào?
3. Những lợi ích và thách thức mà Big-Data mang lại với doanh nghiệp thương mại điện tử Việt
Nam hiện nay
III. Liên hệ thực tiễn về doanh nghiệp đã ứng dụng Big data

CHƯƠNG 3 : KẾT LUẬN
I. Những cơ hội khi ứng dụng Bigdata
II. Thách thức khi ứng dụng Bigdata
III. Giải pháp……………………………………………………………………………………….40


BIG DATA VÀ ỨNG DỤNG TRONG THƯƠNG MẠI ĐIỆN TỬ

Page | 2

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

A, Lời mở đầầu

Trước đây, chúng ta mới chỉ biết đến dữ liệu có cấu trúc ( structure data), ngày nay, với
sự kết hợp của dữ liệu và internet, đã xuất hiện một dạng khác của dữ liệu, đó là Big data
( dữ liệu lớn). Dữ liệu này có thể từ các nguồn như: hồ sơ hành chính, giao dịch điện tử,
dịng trạng thái, chia sẻ hình ảnh, bình luận, nhắn tin… của chính chúng ta, nói cách khác
chúng là dữ liệu được sản sinh qua quá trình chia sẻ thông tin trực tuyến liên tục của
người sử dụng.Trong bối cảnh cuộc cách mạng công nghiệp 4.0, dữ liệu lớn (big data)
đóng vai trị cốt lõi, là chìa khóa dẫn tới thành công của các doanh nghiệp và trên thực tế
big data đang được ứng dụng vào rất nhiều lĩnh vực của nền kinh tế, tạo những chuyển
biến ấn tượng, giúp tăng hiệu quả và năng suất của doanh nghiệp. Chúng ta có thể
kể đến một số lĩnh vực như: Ngành ngân hàng, ngành Y tế, thương mại điện tử, ngành
bán lẻ, Digital Marketing,..Điển hình là trong ngành thương mại điện tử, doanh nghiệp
nào sở hữu và ứng dụng tốt Big Data sẽ tạo ra lợi thế cạnh tranh lớn trên thị trường. Big
Data giúp nhà quản lý xác định được sản phẩm nào được xem nhiều nhất để tối ưu thời
gian hiển thị, tự gửi mã ưu đãi cho những sản phẩm khách hàng bỏ vào giỏ hàng nhưng
không mua. Đặc biệt, Big Data có thể phân tích hành vi, sở thích, sự quan tâm của khách
hàng, giúp nhà quản lý hiểu hơn về khách hàng để cung cấp các sản phẩm theo đúng xu
hướng, nhu cầu thị trường. Vì vậy mà big data đã được ứng dụng một cách rộng rãi trong
thương mại điện tử.
Bài báo cáo dưới đây trình bày nội dung nghiên cứu tổng quan về dữ liệu lớn, ứng dụng
và hiệu quả ứng dụng của nó, đặc biệt vai trị định hướng của dữ liệu lớn trong nền kinh

tế nói chung và đối với bài toán thương mại điện tử cũng như phát triển khách hàng nói
riêng.

B, Nội dung

Page | 3

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

CHƯƠNG 1 : TỔNG QUAN VỀỀ BIG DATA
I. Tổng quan vềề dữ liệu lớn

1. Khái niệm
Dữ liệu lớn (Big data) là một thuật ngữ cho việc xử lý một tập hợp dữ liệu rất lớn và phức
tạp mà các ứng dụng xử lý dữ liệu truyền thống không xử lý được. Dữ liệu lớn bao gồm
các thách thức như phân tích, thu thập, giám sát dữ liệu, tìm kiếm, chia sẻ, lưu trữ, truyền
nhận, trực quan, truy vấn và tính riêng tư. Thuật ngữ này thường chỉ đơn giản đề cập đến
việc việc sử dụng các phân tích dự báo, phân tích hành vi người dùng, hoặc một số
phương pháp phân tích dữ liệu tiên tiến khác trích xuất giá trị từ dữ liệu mà ít khi đề cập
đến kích thước của bộ dữ liệu. Tuy nhiên, Big Data lại chứa trong mình rất nhiều thơng
tin q giá, nếu trích xuất thành cơng, nó sẽ giúp rất nhiều cho việc kinh doanh, nghiên
cứu khoa học, dự đoán các dịch bệnh sắp phát sinh và thậm chí là cả việc xác định điều
kiện giao thông theo thời gian thực. Chính vì thế, những dữ liệu này phải được thu thập,
tổ chức, lưu trữ, tìm kiếm, chia sẻ theo một cách khác so với bình thường. Vì khối dữ liệu
quá lớn nên việc triển khai Big Data sẽ gặp những trở ngại bao gồm thu nhận dữ liệu, lưu
trữ dữ liệu, tìm kiếm, chia sẻ, chuyển giao, cập nhật…

1.1. Bigdata thường có mặt ở đâu

 Dữ liệu trong hộp đen: đây là dữ liệu được tạo ra bởi máy bay, gồm có máy bay
phản lực và trực thăng. Hộp đen dữ liệu này gồm có thơng tin tạo ra bởi giọng
nói của phi hành đồn, các bản thu âm và tất cả thơng tin chuyến bay.
 Dữ liệu trên mạng xã hội: Cụ thể như trên facebook đi, tất cả những gì người
dùng đăng lên như các dịng trạng thái, hình ảnh, video, lượt like, lượt share,
lượt comment,… đều được ghi lại. Đương nhiên nó đủ điều kiện để trở thành
big data.
 Dữ liệu của các máy tìm kiếm: Cụ thể như google đi, các kết quả hiện ra sau
khi bận nhấn nút “tìm kiếm” đều được trích xuất từ các cơ sở dữ liệu khổng lồ,
kết quả trả về cũng nhiều thể loại như danh sách các trang web, video, hình
ảnh.

Page | 4

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

 Dữ liệu từ các camera quan sát: Các camera quan sát ở các ngã tư thành phố,
ghi lại hoạt động của đường phố suốt ngày đêm.

 Dữ liệu giao dịch chứng khốn: đây chính là số liệu từ thị trường chứng khoán đối
với quyết định mua và bán cổ phiếu được thực hiện bởi khách hàng.

 Dữ liệu điện lực: đây là dữ liệu tạo ra bởi điện lực. Nó bao gồm các nội dung nhất
định từ các điểm giao nhau của các nút nội dung sử dụng.

 Dữ liệu giao thơng: dữ liệu này gồm có sức chứa và các mẫu phương tiện giao
thông, độ sẵn sàng và khoảng cách đã đi được của từng phương tiện giao thông.


1.2. Các thành phâần của dữ liệu lớn

 Nguồn dữ liệu (Data Sources): nơi dữ liệu được sinh ra, bao gồm dữ liệu có cấu
trúc (structure), dữ liệu phi cấu trúc (un-structure) cũng như dữ liệu bán cấu trúc
(semi-structure). Dữ liệu có thể đến từ rất nhiều nguồn khác nhau như dữ liệu từ
các ứng dụng, cơ sở dữ liệu quan hệ ,hoặc dữ liệu file được tạo ra bởi các log của
ứng dụng , hay dữ liệu thời gian thực từ các thiết bị IoT (Internet of Things)

 Lưu trữ dữ liệu (Data Storage): thành phần này được thiết kế để lưu trữ lại khối
lượng rất lớn các loại dữ liệu với các định dạng khác nhau được sinh ra bởi nguồn
dữ liệu (Data Source) trong mơ hình xử lý dữ liệu theo lô ( Batch Processing)

 Xử lý dữ liệu theo lô (Batch Processing): thành phần này cho phép xử lý một
lượng lớn dữ liệu thông qua việc đọc dữ liệu từ các file nguồn, lọc dữ liệu theo các
điều kiện nhất định, tính toán trên dữ liệu và ghi kết quả xuống 1 file đích. Trong
thành phần này có thể sử dụng Spark, Hive, MapReduce,.. với nhiều ngôn ngữ lập
trình khác như Java, Scala hoặc Python.

 Thu thập dữ liệu thời gian thực (Real-time Message Ingestion): dữ liệu được sinh
ra từ nguồn (Data Source) có thể bao gồm dữ liệu thời gian thực (ví dụ từ các thiết
bị IoT) do đó thành phần này cho phép một hệ thống Big Data có thể thu thập và

Page | 5

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

lưu trữ các loại dữ liệu trong thời gian thực phục vụ cho việc xử lý dữ liệu theo
luồng (Streaming Processing).

 Xử lý dữ liệu theo luồng (Stream Processing): tương tự như việc xử lý dữ liệu
theo lô (Batch Processing), sau khi thu thập dữ liệu thời gian thực, dữ liệu cũng
cần phải được lọc theo các điều kiện nhất định, tính toán trên dữ liệu, và ghi kết
quả dữ liệu sau khi được xử lý.
 Lưu trữ dữ liệu phân tích (Analytical Data Store): chịu trách nhiệm lưu trữ dữ liệu
đã được xử lý theo định dạng có cấu trúc để phục vụ cho các cơng cụ phân tích dữ
liệu (BI Tools). Dữ liệu có thể được lưu trữ dưới dạng OLAP trong thiết kế
Kimball hoặc dữ liệu có thể lưu trữ bằng các cơng nghệ NoQuery như HBase,
Cassandra, …
 Lớp phân tích và báo cáo (Analysis and Reporting): thành phần này đáp ứng việc
tự khai thác dữ liệu data self-service. Cho phép người dùng cuối trực quan hóa dữ
liệu (data visualization), phân tích dữ liệu, cũng như kết xuất các báo cáo khác
nhau. Chúng ta có thể nhắc đến Apache Storm, Spark Streaming….
 Điều phối (Orchestration): thành phần này có nhiệm vụ điều phối các công việc
trong một hệ thống Big Data để đảm bảo luồng xử lý dữ liệu được thông suốt, từ
việc thu thập dữ liệu, lưu trữ dữ liệu đến lọc, tính tốn trên dữ liệu

2. Nguồền hình thành dữ liệu lớn
Qua thống kê và tổng hợp, dữ liệu lớn được hình thành chủ yếu từ 6 nguồn:

 Dữ liệu hành chính (phát sinh từ chương trình của một tổ chức, có thể là chính phủ
hay phi chính phủ). Ví dụ, hồ sơ y tế điện tử ở bệnh viện, hồ sơ bảo hiểm, hồ sơ
ngân hàng.

 Dữ liệu từ hoạt động thương mại (phát sinh từ các giao dịch giữa hai thực thể). Ví
dụ, các giao dịch thẻ tín dụng, giao dịch trên mạng, bao gồm cả các giao dịch từ
các thiết bị di động….

 Dữ liệu từ các thiết bị cảm biến như thiết bị chụp hình ảnh vệ tinh, cảm biến
đường, cảm biến khí hậu.


Page | 6

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

 Dữ liệu từ các thiết bị theo dõi, ví dụ theo dõi dữ liệu từ điện thoại di động, GPS.
 Dữ liệu từ các hành vi, ví dụ như tìm kiếm trực tuyến (tìm kiếm sản phẩm, dịch vụ

hay thông tin khác), đọc các trang mạng trực tuyến…
 Dữ liệu từ các thông tin về ý kiến, quan điểm của các cá nhân, tổ chức, trên các

phương tiện thông tin xã hội.

3. Phương pháp khai thác và quản lý dữ liệu lớn ( Hadoop ecosystem)

3.1. Phương pháp khai thác dữ liệu lớn
 Phân loại (Classification): Là phương pháp dự báo, cho phép phân loại một
đối tượng vào một hoặc một số lớp cho trước.
 Hồi quy (Regression): Khám phá chức năng học dự đoán, ánh xạ một mục
dữ liệu thành biến dự đoán giá trị thực.
 Phân nhóm (Clustering): Một nhiệm vụ mơ tả phổ biến trong đó người ta
tìm cách xác định một tập hợp hữu hạn các cụm để mô tả dữ liệu.
 Tổng hợp (Summarization): Một nhiệm vụ mô tả bổ sung liên quan đến
phương pháp cho việc tìm kiếm một mô tả nhỏ gọn cho một bộ (hoặc tập
hợp con) của dữ liệu.
 Mơ hình ràng buộc (Dependency modeling): Tìm mơ hình cục bộ mơ tả các
phụ thuộc đáng kể giữa các biến hoặc giữa các giá trị của một tính năng
trong tập dữ liệu hoặc trong một phần của tập dữ liệu.

 Dị tìm biến đổi và độ lệch (Change and Deviation Detection): Khám phá
những thay đổi quan trọng nhất trong bộ dữ liệu.
 Nâng cao hiểu biết về các thị trường mới và tiềm năng
 Tạo ra sản phẩm dựa trên data-driven
 Xây dựng doanh nghiệp dựa trên dữ liệu mở
 Hiểu rõ hơn về đối thủ cạnh tranh và nhà cung cấp
 Xây dựng lợi thế cạnh tranh
 Giảm chi phí

Page | 7

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

3.2. Quản lý dữ liệu lớn
Quản lý dữ liệu là quá trình thu nhập, lưu trữ, tổ chức và duy trì dữ liệu trong một tổ
chức. QLDL hiệu quả vô cùng quan trọng trong việc triển khai các hệ thống CNTT
thông qua các ứng dụng kinh doanh, cung cấp thơng tin phân tích để thúc đẩy quá trình ra
quyết định vận hành và hoạch định chiến lược trong doanh nghiệp. Quy trình QLDL là
kết hợp các chức năng khác nhau, nhằm đảm bảo dữ liệu trong các hệ thống doanh
nghiệp chính xác, có sẵn và có thể truy cập được.
Một số lợi ích của việc quản lý dữ liệu tốt

 Thực hiện QLDL tốt giúp các tổ chức, doanh nghiệp đạt được lợi thế cạnh
tranh tiềm năng so với các đối thủ kinh doanh của họ bằng cách cải thiện hiệu
quả hoạt động và cho phép ra quyết định tốt hơn. Các tổ chức có dữ liệu được
quản lý tốt có thể trở nên linh hoạt hơn, nhanh chóng phát hiện xu hướng thị
trường để tận dụng các cơ hội kinh doanh nhanh chóng.


 QLDL tốt cũng hỗ trợ doanh nghiệp rất nhiều trong công tác đánh giá, nghiên
cứu thị trường: đánh giá hài lòng khách hàng, đánh giá năng lực nhân viên,
nghiên cứu đối thủ cạnh tranh,..

4. Đặc trưng 5V của dữ liệu lớn

Page | 8

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

4.1. Khốối lượng dữ liệu (Volume)
Đây là đặc điểm tiêu biểu nhất của dữ liệu lớn, khối lượng dữ liệu rất lớn. Kích cỡ của
Big data đang từng ngày tăng lên, và tính đến năm 2012 thì nó có thể nằm trong khoảng
vài chục terabyte cho đến nhiều petabyte (1 petabyte = 1024 terabyte) chỉ cho một tập
hợp dữ liệu. Dữ liệu truyền thống có thể lưu trữ trên các thiết bị đĩa mềm, đĩa cứng.
Nhưng với dữ liệu lớn chúng ta sẽ sử dụng công nghệ “đám mây” mới đáp ứng khả năng
lưu trữ được dữ liệu lớn.

4.2. Tốốc độ (Velocity)
Tốc độ có thể hiểu theo 2 khía cạnh: (a) Khối lượng dữ liệu gia tăng rất nhanh (mỗi giây
có tới 72.9 triệu các yêu cầu truy cập tìm kiếm trên web bán hàng của Amazon); (b) Xử lý
dữ liệu nhanh ở mức thời gian thực (real-time), có nghĩa dữ liệu được xử lý ngay tức thời
ngay sau khi chúng phát sinh (tính đến bằng mili giây). Các ứng dụng phổ biến trên lĩnh
vực Internet, Tài chính, Ngân hàng, Hàng khơng, Quân sự, Y tế – Sức khỏe như hiện nay
phần lớn dữ liệu lớn được xử lý real-time. Công nghệ xử lý dữ liệu lớn ngày nay đã cho
phép chúng ta xử lý tức thì trước khi chúng được lưu trữ vào cơ sở dữ liệu.
Ví dụ: Có hơn 3,5 tỷ lượt tìm kiếm mỗi ngày trên Google. Ngồi ra, người dùng
FaceBook đang tăng khoảng 22% hàng năm.


4.3. Đa dạng ( Variety)
Đối với dữ liệu truyền thống chúng ta hay nói đến dữ liệu có cấu trúc, thì ngày nay hơn
80% dữ liệu được sinh ra là phi cấu trúc (tài liệu, blog, hình ảnh, vi deo, bài hát, dữ liệu
từ thiết bị cảm biến vật lý, thiết bị chăm sóc sức khỏe…). Big data cho phép liên kết và
phân tích nhiều dạng dữ liệu khác nhau. Ví dụ, với các bình luận của một nhóm người
dùng nào đó trên Facebook với thơng tin video được chia sẻ từ Youtube và Twitter.
Nó đề cập đến bản chất của dữ liệu là dữ liệu có cấu trúc, bán cấu trúc và dữ liệu phi cấu
trúc.Nó cũng đề cập đến các nguồn không đồng nhất.
Sự đa dạng về cơ bản là sự xuất hiện của dữ liệu từ các nguồn mới cả bên trong và bên
ngoài doanh nghiệp. Nó có thể có cấu trúc, bán cấu trúc và không cấu trúc.

Page | 9

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

o Dữ liệu có cấu trúc: Dữ liệu này về cơ bản là dữ liệu có tổ chức, tức là dữ liệu đã
xác định độ dài và định dạng của dữ liệu.

o Dữ liệu bán có cấu trúc: Dữ liệu này về cơ bản là dữ liệu nửa có tổ chức. Nó
thường là một dạng dữ liệu khơng phù hợp với cấu trúc chính thức của dữ liệu.
Các tệp nhật ký là ví dụ của loại dữ liệu này.

o Dữ liệu phi cấu trúc: Dữ liệu này về cơ bản là dữ liệu không được tổ chức. Nó là
dữ liệu khơng vừa khít với cấu trúc hàng và cột truyền thống của cơ sở dữ liệu.
Văn bản, hình ảnh, video, v.v. là những ví dụ về dữ liệu phi cấu trúc không thể
được lưu trữ ở dạng hàng và cột.


4.4. Độ tin cậy/ chính xác (Veracity)
Một trong những tính chất phức tạp nhất của Dữ liệu lớn là độ tin cậy/chính xác của dữ
liệu. Với xu hướng phương tiện truyền thông xã hội (Social Media) và mạng xã hội
(Social Network) ngày nay và sự gia tăng mạnh mẽ tính tương tác và chia sẻ của người
dùng Mobile làm cho bức tranh xác định về độ tin cậy & chính xác của dữ liệu ngày một
khó khăn hơn. Bài tốn phân tích và loại bỏ dữ liệu thiếu chính xác và nhiễu đang là tính
chất quan trọng của Big data.
Ví dụ: Dữ liệu hàng loạt có thể tạo ra nhầm lẫn trong khi lượng dữ liệu ít hơn có thể
truyền tải một nửa hoặc thơng tin khơng đầy đủ.

4.5. Giá trị (Value)
Đặc điểm quan trọng nhất của dữ liệu lớn, vì khi bắt đầu triển khai xây dựng dữ liệu lớn
thì việc đầu tiên chúng ta cần phải làm đó là xác định được giá trị của thông tin mang lại
như thế nào, khi đó chúng ta mới có quyết định có nên triển khai dữ liệu lớn hay khơng.
Nếu chúng ta có dữ liệu lớn mà chỉ nhận được 1% lợi ích từ nó, thì khơng nên đầu tư phát
triển dữ liệu lớn. Kết quả dự báo chính xác thể hiện rõ nét nhất về giá trị của dữ liệu lớn
mang lại.
Ví dụ, từ khối dữ liệu phát sinh trong quá trình khám, chữa bệnh sẽ giúp dự báo về sức
khỏe được chính xác hơn, sẽ giảm được chi phí điều trị và các chi phí liên quan đến y tế.

Page | 10

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

5. Sự khác biệt giữa dữ liệu lớn và dữ liệu truyềền thồống
- Dữ liệu đa dạng hơn: Khi khai thác dữ liệu truyền thống (dữ liệu có cấu trúc), chúng
ta thường phải trả lời các câu hỏi: Dữ liệu lấy ra kiểu gì? định dạng dữ liệu như thế
nào? Đối với dữ liệu lớn, không phải trả lời các câu hỏi trên. Hay nói khác, khi khai

thác, phân tích dữ liệu lớn chúng ta không cần quan tâm đến kiểu dữ liệu và định dạng
của chúng; điều quan tâm là giá trị mà dữ liệu mang lại có đáp ứng được cho cơng
việc hiện tại và tương lai hay không.
- Lưu trữ dữ liệu lớn hơn: Lưu trữ dữ liệu truyền thống vô cùng phức tạp và luôn đặt
ra câu hỏi lưu như thế nào? dung lượng kho lưu trữ bao nhiêu là đủ? gắn kèm với câu
hỏi đó là chi phí đầu tư tương ứng. Cơng nghệ lưu trữ dữ liệu lớn hiện nay đã phần
nào có thể giải quyết được vấn đề trên nhờ những công nghệ lưu trữ đám mây, phân
phối lưu trữ dữ liệu phân tán và có thể kết hợp các dữ liệu phân tán lại với nhau một
cách chính xác và xử lý nhanh trong thời gian thực.
- Truy vấn dữ liệu nhanh hơn: Dữ liệu lớn được cập nhật liên tục, trong khi đó kho dữ
liệu truyền thống thì lâu lâu mới được cập nhật và trong tình trạng khơng theo dõi
thường xuyên gây ra tình trạng lỗi cấu trúc truy vấn dẫn đến khơng tìm kiếm được
thông tin đáp ứng theo yêu cầu.
- Độ chính xác cao hơn: Dữ liệu lớn khi đưa vào sử dụng thường được kiểm định lại
dữ liệu với những điều kiện chặt chẽ, số lượng thông tin được kiểm tra thông thường
rất lớn, và đảm bảo về nguồn lấy dữ liệu khơng có sự tác động của con người vào thay
đổi số liệu thu thập.

II. Bức tranh tổng thể ứng dụng dữ liệu lớn

1. Ứng dụng dữ liệu lớn trong giáo dục và đào tạo
Ứng dụng dữ liệu lớn mang lại những lợi ích lớn trong giáo dục, như chương trình giảng
dạy tùy chỉnh, cải thiện hệ thống đánh giá, định hướng nghề nghiệp cho sinh viên và đề
xuất phương pháp học phù hợp...

Page | 11

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156


 Thiết kế hệ thống giáo dục phù hợp: giúp các tổ chức giáo dục xây dựng một cấu
trúc học tập chung cho mọi học sinh sinh viên nhưng vẫn đáp ứng được về năng
lực và điểm mạnh khác nhau của học viên.

 Cải thiện hệ thống đánh giá: các trường có thể theo dõi năng lực của học viên
thông qua nhiều môn học khác nhau cả trên phương diện cá nhân và tập thể, từ đó
phát triển các giải pháp phù hợp nhằm hỗ trợ học viên. Phân tích thống kê điểm số
của học viên qua các môn học khác nhau cũng giúp định hướng tốt hơn và xây
dựng lộ trình học tập phù hợp.

 Giúp định hướng nghề nghiệp cho học viên: phần lớn các trường học hiện nay
khơng có hướng dẫn cụ thể và định hướng gì cho nghề nghiệp tương lai của học
viên. Dữ liệu lớn sẽ giúp giải quyết những tình huống khó xử thơng qua việc phân
tích dữ liệu học viên và tạo báo cáo thành tích. Nếu báo cáo đó chỉ ra rằng bạn là
nhà văn sáng tạo, thì bạn được khuyên là nên theo đuổi những nghề nghiệp liên
quan đến lĩnh vực đó. Những tư vấn này thường được thực hiện bởi cố vấn thông
qua các buổi phỏng vấn ngắn và đánh giá cho điểm. Nhưng ngày nay với sự phát
triển của dữ liệu lớn, q trình đó đã được cải thiện rất nhiều. Qua việc phân tích
dữ liệu lớn, các nhà phân tích sẽ chỉ ra rằng bên cạnh là một nhà văn sáng tạo, bạn
cũng giỏi về khoa học, điều này sẽ giúp bạn đưa ra quyết định nghề nghiệp đúng
đắn hơn.

 Đề xuất phương pháp học mới: một số học viên thường học bằng phương pháp
đọc và ghi nhớ, nhưng một số có thể nắm bắt mọi thứ qua việc viết ra, hay một số
ít hiểu bài tốt hơn bằng việc xem video hay sử dụng các phương pháp khác. Tuy
nhiên, học viên thường phải làm quen với các phương pháp cụ thể mà đôi khi
phương pháp này không phù hợp và cản trở việc phát triển của học viên. Điều đó
cũng ảnh hưởng đến kết quả học của học viên. Vậy tại sao không thiết kế các
phương pháp học tập khác nhau và để học viên tự lựa chọn phương pháp học phù

hợp. Dữ liệu lớn sẽ giúp ích cho việc này. Thơng qua phân tích dữ liệu lớn, các
trường có thể xây dựng phương pháp học khác nhau, giúp việc học trở nên thú vị

Page | 12

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

hơn. Qua đó cũng giúp học viên hiểu thêm về thế mạnh, điểm yếu của bản thân và
cung cấp cho họ những tài liệu học tập hữu ích.

2. Ứng dụng dữ liệu lớn trong giao thồng
Sử dụng số liệu CDR trong quá khứ để ước lượng các dòng giao thông trong thành phố
vào các giờ giao điểm, từ đó có những kế hoạch phân luồng giao thơng chi tiết, hợp lý
giúp giảm thiểu kẹt xe. ngồi ra cịn đưa ra thông tin cho người tham gia giao thông được
biết nếu muốn đi từ nơi này sang nơi khác thì nên đi vào giờ nào để tránh kẹt xe hoặc đi
đường nào thì ngắn hơn... Ngồi ra dữ liệu lớn cịn giúp phân tích định vị người dùng
thiết bị di động, ghi nhận chi tiết cuộc gọi trong thời gian thực và giảm thiểu tình trạng ùn
tắc giao thơng

3. Ứng dụng dữ liệu lớn trong y tềố
Trong y học các bác sĩ dựa vào số liệu trong các bệnh án ddeer đưa ra dự đoán về nguy
cơ mắc bệnh. Đồng thời cũng đưa ra được xu hướng lây lan của bệnh. Ví dụ: ứng dụng
của Google Flu Trend là một trong những ứng dụng thành cơng của Google ứng dụng này
dựa trên một từ khóa tìm kiếm ở một khu vực nào đó, sau đó bộ máy phân tích của
google sẽ phân tích và đối chiếu kết quả tìm kiếm đó, sau cùng là đưa ra dự báo về xu
hướng dịch cúm tại khu vực đó. Qua đó cho biết tình hình cúm tại khu vực đó sẽ diễn ra
như thế nào để đưa ra các giải pháp phòng tránh. Những kết quả mà Google Flu Trend
đưa ra, hoàn toàn phù hợp với báo cáo Tổ chức y tế thế giới WHO về tình hình bệnh cúm

tại các khu vực đó.

4. Ứng dụng dữ liệu lớn trong thể thao
Phân tích mơ hình hệ thống cấu trúc sơ đồ chiến thuật của đội tuyển Đức đã đưa ra những
điểm bất hợp lý trong cấu trúc của đội tuyển Đức, từ đó giúp cho đội tuyển khắc phục
được yếu điểm và dành được World cup 2014.

5. Ứng dụng dữ liệu lớn trong tài chính
Từ những dữ liệu chính xác, kịp thời thu thập được thông qua các giao dịch của khách
hàng, tiến hành phân tích, xếp hàng và quản lý các rủi ro trong đầu tư tài chính, tín dụng.

Page | 13

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

6. Ứng dụng dữ liệu lớn trong thồống kề
Trong thương mại dữ liệu lớn giúp cho chúng ta thực hiện được được một số công việc
sau: Phân khúc thị trường và khách hàng; phân tích hành vi khách hàng tại cửa hàng; tiếp
thị trên mảng trên mảng định vị; phân tích tiếp thị chéo kênh, tiếp thị đa kênh; quản lý
các chiến dịch tiếp thị và khách hàng thân thiết; So sánh giá; Phân tích và quản lý chuỗi
cung ứng; Phân tích hành vi, thói quen người tiêu dùng.

CHƯƠNG 2 : ỨNG DỤNG DỮ LIỆU LỚN TRONG THƯƠNG MẠI ĐIỆN TỬ
I. Khái quát vềề thương mại điện tử
1. Cái nhìn chung vềề thương mại điện tử

Hiện nay có rất nhiều những định nghĩa về thương mại điện tử đã được đặt ra. Theo định
nghĩa của tổ chức WTO thì “Thương mại điện tử bao gồm việc sản xuất, phân phối, tiếp

thị, bán hoặc giao hàng hóa và dịch vụ bằng phương tiện điện tử”. Còn tại Việt Nam
cũng đã có nghị định của Chính Phủ về thương mại điện tử. Trong đó có định nghĩa giới
thiệu về thương mại điện tử là:
“Hoạt động thương mại điện tử là việc tiến hành một phần hoặc tồn bộ quy trình của
hoạt động thương mại bằng phương tiện điện tử có kết nối với mạng Internet, mạng viễn
thông di động hoặc các mạng mở khác”
Hiểu theo một nghĩa rộng thì bất cứ một hoạt động thương mại nào được triển khai trên
các phương tiện điện tử thì đều được gọi là thương mại điện tử. Tuy nhiên, đối với nhiều
người dùng hiện nay thì thương mại điện tử được hiểu theo nghĩa hẹp hơn, đơn giản hơn
tức là mua bán trao đổi hàng hóa và dịch vụ thơng qua các phương tiện điện tử và
internet.
Thương mại điện tử được thực hiện đối với các hoạt động truyền thống (chăm sóc sức
khỏe, giáo dục,…), thương mại dịch vụ (dịch vụ pháp lý, dịch vụ tài chính,….) và đặc
biệt thương mại hàng hóa (hàng gia dụng, quần áo,….). Tóm lại, thương mại điện tử đang
dần trở thành một cuộc cách mạng có thể thay đổi hoàn toàn cách thức mua sắm của con
người trong tương lai.

Page | 14

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

2. Những điềều kiện để khai thác big data hiệu quả trong thương mại điện
tử, cơ sở hạ tầềng để tiềốp cận big data

Muốn sử dụng và khai thác Big Data một cách hiệu quả đối với doanh nghiệp thương mại
điện tử thì điều cần thiết là phải xây dựng cơ sở hạ tầng đủ để thu thập và lưu trữ dữ liệu,
cung cấp quyền truy cập và bảo mật thông tin trong khi lưu trữ và chuyển tiếp, bao gồm
các hệ thống lưu trữ và máy chủ, phần mềm quản lý, tích hợp dữ liệu, phần mềm phân

tích dữ liệu và một số thành phần khác. Điều này có thể được hiện thực hóa bởi các data
center lớn, các dịch vụ điện toán đám mây cũng góp phần giải quyết bài tốn này.
II. Ứng dụng của bigdata trong thương mại điện tử

Big data đang ngày càng phố biến và trở nên quan trọng với tất cả các doanh nghiệp
thương mại điện tử, là công cụ phân tích, hỗ trợ các doanh nghiệp từ marketing đến bán
hàng, chăm sóc khách hàng.

1. Lợi ích của Big Data đem lại đồối với ngành thương mại điện tử

Page | 15

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

Trong cuộc cách
mạng 4.0 hiện nay,
doanh nghiệp nào
nắm giữ được chiếc
chìa khóa cơng nghệ
thì doanh nghiệp đó
thành công. Không
ngồi xu thế đó,
doanh nghiệp thương
mại điện tử muốn
thành cơng thì việc
ứng dụng cơng nghệ để thành cơng là yếu tố tất yếu.Đối với các công ty hoạt động trong
lĩnh vực thương mại điện tử,chiến lược thu hút, giữ chân khách hàng là chiến lược quan
trọng nhất. Để phát triển một chiến lược hiệu quả và hợp lý thì việc đầu tiên là xây dựng

hệ thống thu thập dữ liệu khách hàng và xử lý, triển khai các thuật tốn phân tích để dự
báo khách hàng nào có nguy cơ rời dịch vụ, khách hàng nào là khách hàng tiềm năng, để
đề ra các giải pháp trong thời gian thực, qua đó tăng doanh số. Các ứng dụng mà Big
Data sẽ đem lại nhằm đạt được mục tiêu trên bao gồm :
 Cung cấp sản phẩm, dịch vụ mang tính cá nhân hóa, tùy chỉnh theo khách
hàng :
Người tiêu dùng có thể sử dụng nhiều kênh bán hàng từ một nhà bán lẻ, vì vậy các công
ty phải thu nhập từ nhiều nguồn khác nhau. Bằng cách sử dụng các phân tích trong thời
gian thực, các cơng ty có thể thiết kế các dịch vụ được cá nhân hóa và các chương trình
khuyến mãi cụ thể cho khách hàng trung thành và những khách hàng mới.
Với sự cạnh tranh khốc liệt trong ngành thương mại điện tử, cá nhân hóa(Personalization)
khơng cịn là một trong những lợi thế cạnh tranh nhất định mà nó đã trở thành yếu tố then
chốt, phải được thực hiện đối với mỗi công ty trong lĩnh vực này, theo nghiên cứu của
Ajnnex Cloud về lòng trung thành của khách hàng trong năm 2017 thì có tới 86% khách
hàng cho rằng cá nhân hóa có tác động quan trọng đến việc mua hàng của họ.

Page | 16

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

Big Data có thể cung cấp thơng tin chuyên sâu về hành vi và nhân khẩu học của khách
hàng, rất hữu ích trong việc tạo ra trải nghiệm cá nhân hóa. Giả sử, bạn tìm kiếm trên
Lazada hoặc Tiki một sản phẩm nào đó, thì dữ liệu về những gì bạn gõ ở mục “ tìm
kiếm”, tần suất bạn tìm kiếm, số lần bạn tham khảo danh mục sản phẩm cùng loại theo
mức giá, mỗi lần bạn xem mô tả sản phẩm, mỗi lần thêm giỏ hàng vào sản phẩm,... Tất cả
hoạt động, hành vi tương tự sẽ được thu nhập và phân tích để tối ưu trải nghiệm, tạo cơ
hội lớn để thu hút, giữ chân khách hàng thơng qua cá nhân hóa. Đặc biệt với các cơng cụ
phân tích dự báo, các cơng ty sẽ nắm được sở thích, nhu cầu chính xác để gợi ý sản

phẩm, dịch vụ mà khách hàng muốn mua trong thời gian thực. Ví dụ từ kết quả phân tích,
cơng ty có thể triển khai các hoạt động cá nhân hóa như:

 Gửi email với giá sản phẩm được tùy chỉnh phù hợp và đưa ra các ưu đãi đặc biệt
để thu hút khách hàng

 Các chiến lược marketing nhắm mục tiêu khách hàng tiềm năng sẽ hiệu quả hơn,
đặc biệt với các quảng cáo trên mạng xã hội thiết kế cho một bộ phận số lượng
khách hàng nhất định có nhu cầu về một sản phẩm cụ thể nào đó, sẽ tăng khả năng
mua hàng cao hơn.

 Xây dựng hệ thống giá cả linh hoạt để thu hút khách hàng:
Giá cả là yếu tố cạnh tranh quyết định giữa các công ty triển khai thương mại điện tử, và
các hoạt động kinh doanh trên những nền tảng thương mại điện tử. Việc khách hàng tham
khảo nhiều kênh mua hàng khác nhau cũng xuất phát từ sự khác biệt của giá cả. Sử dụng

Page | 17

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

dữ liệu khách hàng nhiều công ty thương mại điện tử có thể đầu tư phát triển hệ thống giá
cả linh hoạt hoặc năng động, dựa trên các yếu tố bên ngoài như nhu cầu của người tiêu
dùng, giá của đối thủ cạnh tranh kết hợp các yếu tố bên trong như mục tiêu lợi nhuận, chi
phí hoạt động kinh doanh,....

Hay hệ thống giá linh hoạt được Điển hình là Walmart đã sử dụng
Amazon sử dụng để theo dõi giá từ dữ liệu mua sắm trực tuyến của
đối thủ và gửi thông báo cứ sau 15 khách hàng để xác định các mơ

giây, giúp Amazon có các giải pháp về hình bán hàng, chiến lược giá lợi
giá nhanh chóng hơn trong thời gian nhuận cao hơn. Ví dụ, một sản
thực, giúp họ tăng doanh thu (ngoài ra phẩm bán riêng lẻ một mình có thể
Amazon cịn đẩy mạnh xử lý, phân không tạo ra nhiều lợi nhuận so với
việc ghép nó với một loại hàng hóa
khác với giá bán phù hợp hơn.

Page | 18

Downloaded by Lan Nguyen ()

lOMoARcPSD|38784156

tích dữ liệu của đối thủ cạnh tranh như giá, doanh số, hành động của khách hàng, sở
thích, ưu tiên vị trí địa lý)

 Quản lý hệ thống chăm sóc khách hàng một cách chủ động
Theo thống kê Help Scout, 91% khách hàng không hài lịng sẽ khơng mua hàng nếu cơng
ty có các dịch vụ chăm sóc khách hàng yếu kém. Tập trung vào dịch vụ khách hàng là rất
quan trọng đối với sự thành công của tất cả các doanh nghiệp thương mại điện tử. Hiểu
được khách hàng là rất quan trọng, nhưng thậm chí quan trọng hơn là giúp khách hàng dễ
dàng liên hệ với doanh nghiệp, công ty, để giải quyết các vấn đề hoặc tìm câu trả lời cho
những thắc mắc, nhu cầu của chính họ. Big Data hỗ trợ các cơng ty trong việc hình thành
một hệ thống chăm sóc khách hàng linh hoạt, tạo ra giá trị từ quá trình xây dựng mối
quan hệ thân thiết với khách hàng.
Sự ra đời của Chatbot (hệ thống trả lời tự động không cần sự trợ giúp của con người)
cung cấp các tính năng thu thập dữ liệu khách hàng từ các đoạn đối thoại, qua đó cơng ty
sẽ tiến hành phân tích để nắm bắt được nhu cầu, mong muốn của khách hàng để đưa ra
các phản hồi thích hợp, xây dựng mối quan hệ lâu dài với họ. Đặc biệt Chatbot giúp công
ty chủ động hỗ trợ 24/7, tăng trải nghiệm tối đa cho khách hàng mọi lúc.


Page | 19

Downloaded by Lan Nguyen ()


Tài liệu bạn tìm kiếm đã sẵn sàng tải về

Tải bản đầy đủ ngay
×