ĐẠI HỌC QUỐC GIA THÀNH PHỐ HỒ CHÍ MINH
TRƯỜNG ĐẠI HỌC KINH TẾ - LUẬT
KHOA QUẢN TRỊ KINH DOANH
NGHIÊN CỨU MARKETING
Đề tài: SỰ TRỖI DẬY CỦA BIG DATA TRONG NGHIÊN CỨU
MARKETING
GVHD: ThS. VÕ THỊ NGỌC TRINH
Thành phố Hồ Chí Minh, tháng 11 năm 2021
i
MỤC LỤC
CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA ......................................................................... 2
1.1. Khái niệm ................................................................................................................. 2
1.2. Phân loại................................................................................................................... 3
1.3. Các giả định của Big Data ...................................................................................... 4
1.4. Thách thức khi sử dụng Big Data ........................................................................... 6
CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING ............................. 8
2.1. Khái niệm nghiên cứu Marketing ........................................................................... 8
2.2. Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big
Data................................................................................................................................... 8
2.3. Mơ hình trích xuất thơng tin từ Big Data cho nghiên cứu marketing ................ 9
2.3.1. Thu thập và lưu trữ dữ liệu ............................................................................ 10
2.3.2. Xử lý làm sạch dữ liệu ..................................................................................... 10
2.3.3. Tổng hợp, đối chiếu dữ liệu............................................................................. 11
2.3.4. Mơ hình hóa và phân tích dữ liệu................................................................... 11
2.3.5. Trình bày, diễn giải dữ liệu ............................................................................. 12
2.4. Phân tích Big Data và mơ hình 5Ps ...................................................................... 12
2.4.1. Phân tích kết hợp (Association analysis) ....................................................... 13
2.4.2. Phân tích gộp nhóm (Clustering analysis) ..................................................... 14
2.4.3. Phương pháp phân loại (Classification analysis) .......................................... 14
2.4.4. Mơ hình chủ đề (Topic modelling) ................................................................. 14
2.4.5. Lọc tương tác (Collaborative filtering) .......................................................... 15
2.4.6. Phân tích hồi quy (regression analysis) ......................................................... 15
CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN CỨU
MARKETING CỦA AMAZON ...................................................................................... 17
3.1. Hệ thống giới thiệu cá nhân................................................................................... 17
3.1.1. Nguồn thông tin cần thu thập ......................................................................... 17
3.1.2. Cách xử lý nguồn thông tin ............................................................................. 17
3.1.3. Vận dụng những thông tin đã xử lý ............................................................... 18
ii
3.2. Mơ hình giao hàng dự đốn................................................................................... 19
3.2.1. Nguồn thơng tin cần thu thập ......................................................................... 19
3.2.2. Cách xử lý nguồn thông tin ............................................................................. 19
3.2.3. Vận dụng những thông tin đã xử lý ............................................................... 19
3.3. Tối ưu giá ................................................................................................................ 19
3.3.1. Nguồn thông tin cần thu thập ......................................................................... 19
3.3.2. Cách xử lý nguồn thông tin ............................................................................. 20
3.3.3. Vận dụng những thông tin đã xử lý ............................................................... 20
3.4. Dịch vụ khách hàng Alexa ..................................................................................... 20
3.4.1. Nguồn thông tin cần thu thập ......................................................................... 20
3.4.2. Cách xử lý nguồn thông tin ............................................................................. 21
3.4.3. Vận dụng những thông tin đã xử lý ............................................................... 21
CHƯƠNG 4: NHỮNG CƠ HỘI VIỆC LÀM MỞ RA ĐỐI VỚI MẢNG DATA
LĨNH VỰC MARKETING ............................................................................................. 23
4.1. Marketing Insight and Analysis. (1000 - 3000 USD) .......................................... 23
4.2. Chuyên viên phân tích chỉ số Marketing (1000 - 2500 USD) ............................. 23
4.3 Social Data Analysis (700 - 2000 USD) .................................................................. 23
KẾT LUẬN ....................................................................................................................... 25
TÀI LIỆU THAM KHẢO ................................................................................................ 26
iii
DANH MỤC BẢNG
Bảng 1.1. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc................................................ 4
Bảng 2.1. So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử dụng
Big Data ................................................................................................................................ 9
Bảng 2.2. 5Ps and Big Data Analytics ............................................................................... 12
Bảng 3.1. Tóm tắt các ứng dụng Big Data trong nghiên cứu Marketing của Amazon ...... 21
DANH MỤC HÌNH
Hình 2.1. Process for Extracting Insights From Big Data ................................................. 10
iv
DANH SÁCH THÀNH VIÊN
STT
Mức độ hoàn
Họ tên
MSSV
Nhiệm vụ cụ thể
1
Phan Văn Đức
K194070896
Nội dung + Thuyết trình
100%
2
Dương Thị Hồng Hạ
K194070898
Nội dung + Thuyết trình
100%
thành
(Nhóm trưởng)
3
Ngũn Thị Hờng Ḥ
K194070904
Nội dung + Thuyết trình
100%
4
Võ Hồng Nhật Vy
K194070957
Nội dung + Slide
100%
1
LỜI MỞ ĐẦU
Cuộc Cách mạng công nghiệp lần thứ tư đã đi qua được một thập kỷ, tuy còn những
bất cập mà chúng ta chưa giải quyết được nhưng tầm quan trọng và lợi ích mà nó mang
lại là điều không thể chối cãi. Mặc dù không phải là một khái niệm mới nhưng đến giai
đoạn này, thế giới mới thực sự chứng kiến sự bùng nổ của kỷ nguyên Big data. Big Data
thể hiện vai trị của mình trong mọi lĩnh vực từ y tế, viễn thông, sản xuất, hàng khơng, tài
chính, ngân hàng, điện tử, giải trí, ... Có thể thấy, dữ liệu là vũ khí hết sức quan trọng, ai
nắm được thơng tin, người đó sẽ vượt lên dẫn đầu và bỏ xa những đối thủ còn lại.
Thật vậy, trong thế giới phẳng như hiện nay, việc nắm bắt tâm lý và hành vi của
khách hàng cũng ngày càng khó khăn hơn. Doanh nghiệp muốn bắt kịp xu hướng chung
và phát triển bền vững cần tập trung vào chuyển đổi số, đầu tư vào công nghệ, đặc biệt là
trong lĩnh vực Marketing. Nhằm thấu hiểu khách hàng, tạo ra trải nghiệm mua hàng tốt
nhất. Kết hợp với Big Data, doanh nghiệp sẽ nắm được nhiều thông tin hơn, thấu hiểu
khách hàng hơn, từ đó gia tăng trải nghiệm khách hàng và giúp doanh nghiệp nắm được
lợi thế cạnh tranh so với các đối thủ. Đó cũng chính là lý do nhóm chúng em chọn đề tài
“Sự bùng nổ của Big data trong Nghiên cứu Marketing” để tiến hành tìm hiểu và nghiên
cứu.
Chúng em xin cảm ơn Cơ Võ Thị Ngọc Trinh đã cho nhóm những kiến thức bổ ích
cũng như cơ hội để tiến hành đề tài này.
Với thời gian và năng lực còn hạn chế sẽ khơng thể tránh những sai sót. Chúng em
rất mong cơ thơng cảm và được nhận những nhận xét, góp ý từ cô.
Một lần nữa chúng em chân thành cảm ơn.
2
CHƯƠNG 1: SƠ LƯỢC VỀ BIG DATA
1.1. Khái niệm
Big Data được xem là xu hướng công nghệ xuất hiện trong thời đại Cách mạng
công nghiệp 4.0 và hứa hẹn là lời giải cho rất nhiều bài tốn kinh doanh hóc búa không
chỉ đối với các doanh nghiệp trên thế giới mà còn cả với các doanh nghiệp Việt Nam
trong bối cảnh hội nhập sâu và rộng vào nền kinh tế quốc tế. Các tổ chức hàng đầu đang
chuyển đổi tư duy của họ về dữ liệu, từ việc coi dữ liệu như một chi phí hoạt động cần
được giảm thiểu sang nuôi dưỡng dữ liệu như một tài sản chiến lược cần được mua lại,
làm sạch, được chuyển đổi, làm giàu và phân tích để mang lại thơng tin chi tiết hữu ích.
Vậy, Dữ liệu lớn (Big data) là một thuật ngữ về việc xử lý một tập dữ liệu rất
lớn và phức tạp khác với cách truyền thống. Dữ liệu này bao gồm các hoạt động khác
nhau như: thu thập, tìm kiếm, giám sát, dự báo, phân tích hành vi người dùng, hoặc
một số phương pháp phân tích dữ liệu tiên tiến khác nhằm trích xuất những giá trị từ
dữ liệu mà ít khi đề cập đến kích thước dữ liệu này. Cụ thể, nó có thể truy vấn những
tập tin phi cấu trúc (unstructured files) như video kỹ thuật số, hình ảnh, dữ liệu cảm biến,
tập tin lưu nhật ký, thực sự bất cứ dữ liệu nào không có trong hờ sơ với các phạm vi tìm
kiếm khác.
Năm 2014, Gartner đưa ra một khái niệm mới về Big Data với mơ hình “5Vs”
tương ứng với năm tính chất quan trọng, như sau:
Volume: là sự tăng trưởng về mặt khối lượng. Dữ liệu trong các hệ thống thông
tin luôn ln và khơng ngừng tăng lên về mặt kích thước (khối lượng). Chúng ta có thể
tìm thấy dữ liệu trong các định dạng video, music, image lớn trên các kênh truyền thông
xã hội. Khối lượng dữ liệu của một hệ thống thơng tin có thể lên đến hàng Terabyte và
Petabyte. Theo tài liệu của Intel hồi tháng 9/2013, cứ mỗi 11 giây, 1 PB1 dữ liệu được
tạo ra trên toàn thế giới, tương đương với một đoạn video HD dài 13 năm. Facebook phải
xử lý khoảng 500 TB2 dữ liệu mỗi ngày.
Velocity: là sự tăng trưởng về mặt tốc độ xử lý. Bên cạnh sự tăng trưởng về khối
lượng, tốc độ tăng trưởng của dữ liệu cũng tăng lên một cách chóng mặt. Các ứng dụng
được sử dụng phổ biến trên các lĩnh vực Internet, tài chính, ngân hàng, hàng không, quân
sự, y tế - sức khỏe ngày nay phần lớn đều được xử lý trong thời gian thực thông qua hệ
3
thống Big Data. Đơn cử, trên các mạng xã hội, đơi khi các thơng báo cách đó vài giây
(tweet, status….) đã là cũ và không được người dùng quan tâm. Người dùng thường loại
bỏ các tin nhắn cũ và chỉ chú ý đến các cập nhật gần nhất. Sự chuyển động của dữ liệu
giờ đây hầu như là tức thời (real time), và tốc độ cập nhật thông tin đã giảm xuống đơn vị
hàng mili giây.
Variety: là sự tăng lên về tính đa dạng của dữ liệu. Dữ liệu khơng chỉ ở dạng có
cấu trúc, mà cịn bao gờm rất nhiều kiểu dữ liệu phi cấu trúc nữa (như video, hình ảnh, dữ
liệu cảm biến, giọng nói, blog, ...). Big Data cho phép chúng ta phân tích và liên kết đa
dạng các chủng loại dữ liệu với nhau ví dụ như các bình luận, bài đăng của một nhóm
người dùng nào đó trên Facebook với thơng tin các video đã được chia sẻ từ các kênh xã
hội khác nhau như YouTube, Twitter.
Veracity: là tính xác thực của dữ liệu. Với xu hướng “Social” ngày nay và sự gia
tăng mạnh mẽ tính tương tác và chia sẻ của người dùng di động đã làm cho khả năng xác
định về độ tin cậy và tính chính xác của dữ liệu ngày một khó khăn hơn. Bài tốn phân
tích và loại bỏ dữ liệu thiếu chính xác và gây nhiễu đang là một trong những tính chất
quan trọng của Big data.
Value: Giá trị thơng tin mang tính chất quan trọng nhất của xu hướng công nghệ
Big Data. Thật vậy, doanh nghiệp phải hoạch định được những giá trị thơng tin hữu ích
của Big Data một cách phù hợp nhằm giải quyết cho những vấn đề, bài toán mà doanh
nghiệp đang gặp phải hoặc mơ hình hoạt động kinh doanh của mình. Có thể nói việc đầu
tiên các doanh nghiệp cần làm trước khi bắt tay vào thực hiện Big Data là phải làm sao
xác định được tính chất “Value” của nó.
1.2. Phân loại
Dữ liệu đến từ nhiều nguồn và thuộc các định dạng khác nhau nên chúng rất đa
dạng. Chính vì vậy, việc phân loại dữ liệu cũng có nhiều cách. Và một trong những cách
cơ bản nhất và thể hiện được sự khác biệt giữa các loại dữ liệu là phân loại dựa vào cấu
trúc của chúng: Dữ liệu có cấu trúc và Dữ liệu phi cấu trúc.
Dữ liệu có cấu trúc là những thông tin được thể hiện trong các cột và hàng có tiêu
đề, có thể dễ dàng đặt hàng và xử lý bằng các cơng cụ tìm kiếm dữ liệu. Chúng ta có thể
4
xem chúng như một tủ hồ sơ được tổ chức hoàn hảo, các dữ liệu được xác định, dán nhãn
và dễ dàng truy cập.
Dữ liệu phi cấu trúc là những thơng tin khơng được tổ chức thơng qua các mơ
hình hoặc lược đồ dữ liệu được xác định trước.
Bảng 1.1. So sánh Dữ liệu cấu trúc và Dữ liệu phi cấu trúc
Dữ liệu có cấu trúc
Dữ liệu phi cấu trúc
Ví dụ
- Ngày tháng
- SĐT, Số thẻ tín dụng
- Tên khách hàng, địa chỉ
- Tên sản phẩm, số lượng
- Các thông tin giao dịch
- Các file văn bản (text), file PDF
- Báo cáo
- Tin nhắn, Email
- File Audio, Video, ảnh
- Các nội dung truyền thơng trên
mạng xã hội
Đặc trưng
- Mơ hình dữ liệu được xác
định trước (thường chỉ có
dạng văn bản)
- Dễ tìm kiếm
- Khơng có mơ hình dữ liệu được
xác định trước
- Có thể là dạng văn bản, hình ảnh,
video, âm thanh hoặc định dạng
khác
- Khó tìm kiếm
Ứng dụng chính
- Kiểm sốt hàng tờn kho
- Hệ thống CRM, ERP
- Hệ thống đặt vé máy bay
- Xử lý văn bản
- Phần mềm trình chiếu
- Email
- Các cơng cụ hiển thị và chỉnh sửa
truyền thơng
Được tạo bởi
Con người và máy móc
Con người và máy móc
(Nguồn: Internet)
1.3. Các giả định của Big Data
N = All
5
Nếu thu thập thông tin dựa trên mẫu nhỏ, thậm chí những kết quả được thu thập
“một cách khoa học” thì thơng tin đó cũng khơng đáng tin cậy (phương sai cao trên các
mẫu lặp lại), khơng mang tính đại diện và không đủ sức mạnh về mặt thống kê (tức là,
các suy luận hợp lý bị hạn chế). Một số nhà nghiên cứu cho rằng Big Data có thể khắc
phục những hạn chế này và sẵn sàng cung cấp các bài kiểm tra về các thông số dân số vì
nó tương đối rẻ, tương đối đại diện, được bổ sung liên tục và dễ dàng sao chép. Tuy
nhiên, một lưu ý quan trọng liên quan đến giả định này: Big Data loại trừ những người
không sử dụng internet hoặc công nghệ xử lý thông tin kỹ thuật số. Việc tham gia vào
nền tảng trực tuyến, cho dù thương mại hay khơng, thì cũng có sự khác biệt đáng kể theo
vị trí địa lý, tuổi tác, giới tính, chủng tộc và các yếu tố xã hội học khác
(www.statista.com).
Today = Tomorrow
Bởi vì nó di động và có mặt khắp nơi, cuộc sống kỹ thuật số năng động hơn nhiều
so với cuộc sống thực. Người tiêu dùng liên tục chuyển đổi, thử và từ bỏ sự hiện diện kỹ
thuật số của họ. Các dấu vết của hành vi đó có thể trở thành đối tượng của cuộc điều tra.
Ban đầu, Facebook giới hạn thành viên cho người dùng trong ngành giáo dục; do đó, chỉ
cần đăng ký một tài khoản email edu. Khi Facebook mở rộng, nó đã được mở cho cả
những người dùng phi giáo dục.
Online behavior = Offline behavior
Người tiêu dùng có thể hiện các mơ hình hành vi giống nhau cả trên trực tuyến và
ngoại tuyến không? Điều này rất phức tạp và các nhà tiếp thị phải tìm hiểu cách người
tiêu dùng biểu hiện trong cả hai mô hình hành vi mua hàng đối với các sản phẩm cụ thể.
Behavior of all today = Behavior of all tomorrow
Giả định này tổng hợp ba giả định nói trên. Big Data là sự phản ánh số hóa khơng
hồn hảo về cuộc sống trực tuyến và ngoại tuyến của con người. Các mơ hình mơ tả hành
vi của người tiêu dùng đang thay đổi để giải thích cho ảnh hưởng của cơng nghệ và
internet.
Những giả định này giúp kiểm sốt những thơng tin có được từ việc phân tích Big
Data. Nhiều nhà tiếp thị tin rằng tất cả người tiêu dùng của họ đều có mặt trực tuyến và
6
sẽ cư xử giống nhau cho dù trực tuyến hay ngoại tuyến. Tuy nhiên, việc không đặt câu
hỏi hoặc không quan tâm các giả định nói trên có thể cản trở khả năng tờn tại của các
phân tích Big Data đối với doanh nghiệp.
1.4. Thách thức khi sử dụng Big Data
Big Data là bước ngoặt đánh dấu sự phát triển của Cách mạng Công nghiệp 4.0,
việc ứng dụng công nghệ này mang lại tiềm năng phát triển tuyệt vời cho doanh nghiệp.
Tuy nhiên việc ứng dụng Big Data một cách hiệu quả thì khơng phải là điều dễ dàng và
cịn rất nhiều thách thức mà các doanh nghiệp cần phải đối mặt.
Sự đa dạng thông tin: Trước khi tiến hành phân tích dữ liệu, doanh nghiệp cần
đảm bảo ng̀n dữ liệu là chính xác và có định dạng phù hợp cho việc phân tích. Trên
thực tế thì sự tờn tại của một dữ liệu đờng nhất và có cấu trúc tốt với cùng kích thước và
cấu trúc là rất cần thiết. Chính vì vậy, việc làm sạch và xử lý các lỗi từ các nguồn dữ liệu
không đầy đủ hay các dữ liệu gây nhiễu là tối quan trọng và khơng thể thiếu. Tuy nhiên,
điều đó địi hỏi doanh nghiệp cần đầu tư một khoản chi phí (thời gian, ngân sách) lớn để
có được kết quả mang giá trị cao.
Quy mô: Thực tế cho thấy rằng khối lượng dữ liệu đang gia tăng khá lớn và gần
như đã vượt qua khả năng sức mạnh xử lý và lưu trữ của máy tính. Bên cạnh đó, việc
truyền dữ liệu lớn thường phải gánh chịu chi phí cao. Đây là “nút cổ chai” của việc tính
tốn Big Data.
Yếu tố thời gian: Khi số lượng dữ liệu tăng nhanh chóng, các kết quả phân tích thì
cần phải được đưa ra một cách tức thì nghĩa là trong thời gian thực nên cần phải có sự
phát triển các quy trình xử lý dựa vào sự gia tăng của các cấu trúc dữ liệu nhằm đạt được
mục đích cuối cùng đó là đáp ứng u cầu truy cập thơng tin một cách tức thì của người
sử dụng.
Tính cá nhân và Bảo mật dữ liệu: Các yếu tố luật pháp liên quan đến các hạn chế
về quyền cá nhân hiện đang trở thành một mối đe dọa vì nó có thể hạn chế các ích lợi
tiềm năng. Chính vì lý do đó mà các chính sách an ninh mạng hay cụ thể là an ninh thông
7
tin chia sẻ các dữ liệu liên quan đến người dùng cá nhân cần phải được xem xét một cách
thận trọng và nghiêm túc. Bên cạnh đó, một số ví dụ trong thực tế cho thấy, không chỉ
thông tin cá nhân người tiêu dùng, thông tin mật của các tổ chức mà ngay cả bí mật an
ninh quốc gia cũng có thể bị xâm phạm. Do đó, giải quyết các vấn đề an ninh dữ liệu
bằng các công cụ kỹ thuật và các chính sách trở nên vơ cùng cấp bách.
Thiếu chuyên gia công nghệ: Dù là thời đại công nghệ 4.0, hoạt động bằng máy
móc chiếm ưu thế, nhưng nếu khơng có con người vận hành, quản lý thì dù máy móc có
hiện đại đến đâu cũng khó có thể mang đến hiệu quả tốt nhất. Công nghệ Big Data cũng
vậy. Các đánh giá của chuyên gia là hết sức cần thiết để có thể hiểu các ng̀n dữ liệu và
để khai thác một cách tối ưu các tiềm năng của nó địi hỏi sự phối hợp nhịp nhàng và
nhuần nhũn giữa máy móc và con người.
Địi hỏi thay đổi văn hóa doanh nghiệp: Văn hóa doanh nghiệp được xây dựng và
phát triển không phải chỉ trong ngày một ngày hai. Chính vì vậy, để một doanh nghiệp
thay đổi văn hóa làm việc của mình, đặc biệt là từ truyền thống sang hiện đại, không phải
là điều đơn giản. Theo khảo sát của New Vantage, chỉ có 32.4% doanh nghiệp thành cơng
trong việc thay đổi văn hóa doanh nghiệp theo hướng hiện đại mới.
8
CHƯƠNG 2: BIG DATA TRONG NGHIÊN CỨU MARKETING
2.1. Khái niệm nghiên cứu Marketing
Theo Philip Kotler (2003) “Nghiên cứu marketing là xác định một cách có hệ
thống những tư liệu cần thiết do tình huống marketing đặt ra cho một cơng ty, thu thập,
phân tích chúng và báo cáo kết quả”.
Theo Hiệp hội Marketing Mỹ (AMA): Nghiên cứu marketing là quá trình thu thập
và phân tích có hệ thống những dữ liệu về các vấn đề liên quan đến các hoạt động
marketing của doanh nghiệp.
Tư tưởng chủ đạo của Marketing là “Mọi quyết định kinh doanh đều xuất phát từ
thị trường”. Muốn thực hiện được tư tưởng chủ đạo này thì phải có đầy đủ thơng tin về
thị trường, về mơi trường kinh doanh. Căn cứ vào các thông tin thu được qua nghiên cứu
Marketing, các nhà quản lý sẽ vạch ra chiến lược, chính sách kinh doanh phù hợp nhắm
vào thị trường mục tiêu.
2.2. Nghiên cứu Marketing truyền thống và Nghiên cứu Marketing sử dụng Big
Data
Nhìn chung mục đích của nghiên cứu marketing là để chuyển đổi dữ liệu thu thập
được thành thơng tin có giá trị và hiểu biết hữu ích cho việc ra quyết định. Mặc dù khái
niệm và mục tiêu của nghiên cứu marketing vẫn không thay đổi trong bối cảnh Big Data,
nhưng với lợi ích ngày càng lớn của việc phân tích big data như hiện nay thì địi hỏi cần
có một quan điểm nghiên cứu marketing rộng hơn.
Nhóm chúng tơi đưa ra một số điểm khác biệt giữa nghiên cứu Marketing truyền
thống và nghiên cứu Marketing sử dụng Big Data, các tiêu chí so sánh chủ yếu là về thu
thập và phân tích dữ liệu. Nghiên cứu Marketing truyền thống theo nhóm là nghiên cứu
thường dựa trên sự giả định dữ liệu ngẫu nhiên và sử dụng các phương pháp thống kê
truyền thống, còn Nghiên cứu Marketing sử dụng Big Data giả định dữ liệu có độ phức
tạp cao và sử dụng thêm các phương pháp thống kê nâng cao bên cạnh các phương pháp
thống kê truyền thống đã được cải tiến. Đặc biệt, trong quá khứ chưa có sự bùng nổ của
tiến bộ khoa học kỹ thuật như hiện nay.
9
Bảng 2.1. So sánh nguyên cứu Marketing truyền thống và nghiên cứu Marketing sử
dụng Big Data
Tiêu chí
Nghiên cứu Marketing truyền
thống
Nghiên cứu Marketing sử dụng Big Data
Khối
lượng dữ
liệu
Chỉ thu được dữ liệu hạn chế Thu thập được lượng dữ liệu khổng lồ mô tả
mô tả theo khoảng thời gian theo thời gian thực phong phú hơn.
nhất định.
Nguồn dữ Chủ yếu là khảo sát trực tiếp Từ các thiết bị lưu trữ dữ liệu người dùng
liệu
khách hàng qua phỏng vấn, như điện thoại thông minh, phương tiện
bảng câu hỏi… và các trang truyền thông xã hội, các thiết bị cảm biến,…
cung cấp dữ liệu thứ cấp.
Lưu trữ Thiết bị lưu trữ, quản lý có Cơng nghệ điện tốn đám mây cung cấp kỹ
và quản lý dung lượng lưu nhỏ.
thuật lưu trữ, quản lý với lưu lượng lớn và
dữ liệu
hiệu quả. Một số nền tảng lưu trữ đám mây
hiện nay gồm: Google Store, Amazon,
Microsoft Azure, IBM Blue Cloud.
Phương
pháp phân
tích dữ
liệu
Phương pháp phân tích dữ
liệu truyền thống bắt nguồn
từ thống kê và khoa học máy
tính như phân tích cụm, phân
tích nhân tố, phân tích tương
quan, phân tích hời quy…
Phương pháp phân tích big data là các mơ
hình thuật tốn cũng dựa trên thống kê và
khoa học máy tính hiện đại hơn cho phép
trích xuất thơng tin và tạo ra các mơ hình dự
đốn hiệu quả cao. ví dụ như mơ hình thuật
tốn MapReduce do Google đề xuất, kỹ thuật
phân tích và giải mã NLP…
(Nguồn: Nhóm tự tổng hợp)
Thực tế hiện nay chưa có nhiều phương pháp phân tích dữ liệu big data được phát
triển vì khối lượng và tốc độ của nó q lớn. Tuy nhiên trong thời đại công nghiệp 4.0
như hiện nay, việc doanh nghiệp biết cách phân tích dữ liệu big data sẽ là một lợi thế rất
lớn.
2.3. Mơ hình trích xuất thông tin từ Big Data cho nghiên cứu marketing
Điều thực sự mang lại giá trị cho việc sử dụng big data là phân tích dữ liệu. Nếu
khơng có phân tích, big data chỉ là một tập dữ liệu với việc sử dụng hạn chế.
10
Khi mà sự xuất hiện của big data đang dần định hình lại q trình nghiên cứu
marketing. Mơ hình dưới đây trình bày năm giai đoạn chính của nghiên cứu marketing sử
dụng big data. Trong đó, năm giai đoạn này được nhóm thành quản lý dữ liệu (data
management) và phân tích (analytics). Quản lý dữ liệu là những quy trình và công nghệ
hỗ trợ được thiết kế và sử dụng để thu thập, lưu trữ và trích xuất dữ liệu cho việc phân
tích ở giai đoạn sau. Cịn Phân tích là tập hợp các kỹ thuật được sử dụng để phân tích,
phác họa và tạo ra những thơng tin có giá trị từ ng̀n dữ liệu big data.
Hình 2.1. Process for Extracting Insights From Big Data
(Nguồn: Gandomi & Haider, 2015; Japkowicz & Stefanowski, 2016; Labrinidis &
Jagadish, 2012)
2.3.1. Thu thập và lưu trữ dữ liệu
Để có dữ liệu thì đầu tiên cần phải thu thập, vấn đề chính gây khó khăn cho việc
thu thập dữ liệu từ big data đó là sự phân tán của dữ liệu ở nhiều nguồn khác nhau. Các
công cụ thu thập dữ liệu từ thiết bị cảm biến người dùng (cảm biến là sự đo lường và biến
đổi đại lượng vật lý thành tín hiệu số có thể đọc được, dữ liệu cảm biến có thể là sóng âm
thanh, giọng nói, rung động…), thiết bị có định vị vị trí, các phương tiện truyền thơng xã
hội, giao dịch tài chính, điện thoại thơng minh,…
Dữ liệu sẽ được ghi lại và lưu trữ trên nhiều thiết bị lưu trữ như kho dữ liệu truyền
thống, data lakes hay điện toán đám mây.
Dữ liệu được thu thập và lưu trữ ở giai đoạn này là dữ liệu thô, chưa có giá trị sử
dụng cao.
2.3.2. Xử lý làm sạch dữ liệu
Thông thường dữ liệu từ các nguồn công khai thường khơng đầy đủ, khơng có cấu
trúc nhất qn (dữ liệu ở nhiều kiểu khác nhau như: văn bản, âm thanh, video…), bị lỗi
định dạng hay đơn giản là sai. Ví dụ, những người tham gia khảo sát có thể trả lời sai hay
dữ liệu thu được từ các thiết bị theo dõi trên điện thoại thông minh (các app được hỗ trợ
11
GPS) có thể sai do thiết bị đó bị hỏng…. Để biến những dữ liệu thô này thành dữ liệu có
giá trị chúng ta cần tiến hành xử lý dữ liệu.
Xử lý dữ liệu là quá trình xác định và sửa lỗi dữ liệu để đảm bảo chất lượng của
dữ liệu bằng các thuật tốn. Ví dụ khi xác định được với dữ liệu bị lỗi định dạng thì tiến
hành thay đổi về định dạng phù hợp, hay tiến hành xóa bỏ những dữ liệu bị sai.
Đây là bước quan trọng cần thiết để đảm bảo các tệp dữ liệu đáp ứng các tiêu
chuẩn về chất lượng và có giá trị sử dụng.
2.3.3. Tổng hợp, đối chiếu dữ liệu
Để tiến hành phân tích dữ liệu cần hợp nhất các tệp dữ liệu khơng đờng nhất với
kích thước đa dạng ở bước trên thành một tập dữ liệu tích hợp phù hợp với nhu cầu
nghiên cứu.. Sau đó, tiến hành đối chiếu dữ liệu, tìm những dữ liệu giống nhau, bị trùng
lặp để loại bỏ. Sự trùng lặp dữ liệu là rất phổ biến trong các tệp dữ liệu từ các nguồn khác
nhau, việc loại bỏ những dữ liệu bị lặp nhằm tránh lãng phí khơng gian lưu trữ cũng như
để có cơ sở phân tích chính xác. Ví dụ như một cơng ty thẻ tín dụng và một nhà bán lẻ có
thể ghi lại các giao dịch giống nhau của một khách hàng.
2.3.4. Mơ hình hóa và phân tích dữ liệu
Có rất nhiều loại phân tích được sử dụng để tìm ra các mẫu thơng tin có ý nghĩa
trong ng̀n dữ liệu big data. Phân tích văn bản có thể chuyển đổi văn bản như các tweet
đánh giá thương hiệu của người tiêu dùng thành bản tóm tắt các ý chính có ý nghĩa. Phân
tích âm thanh để trích xuất thơng tin từ âm thanh khơng có cấu trúc, chẳng hạn như tệp
âm thanh cuộc gọi phàn nàn của khách hàng. Tương tự, phân tích nội dung video để trích
xuất thơng tin từ video, ví dụ như các unboxing video do người tiêu dùng tạo. Phân tích
nội dung hình ảnh cho phép các nhà nghiên cứu trích xuất những dữ liệu từ những từ
được in trong một bức ảnh của người tiêu dùng, chẳng hạn trên Twitter bị giới hạn 5000
ký tự nên người tiêu dùng thường chuyển dữ liệu văn bản vào ảnh. Phương tiện truyền
thông xã hội và phân tích mạng để khám phá nội dung mà người tiêu dùng tạo trên các
nền tảng truyền thông xã hội và chuyển các nội dung đó thành âm thanh, video hay các
phân tích khác.
Sau khi phân tích các kiểu dữ liệu trên thì nhà nghiên cứu đã có thể xây dựng một
mơ hình về hành vi, thái độ và tình cảm của khách hàng.
12
2.3.5. Trình bày, diễn giải dữ liệu
Những nhà nghiên cứu marketing phải có khả năng hiểu và diễn giải kết quả từ
bước phân tích và mơ hình hóa dữ liệu. Cụ thể là phải biết cách trình bày, truyền đạt kết
quả nghiên cứu cho những người ra quyết định để họ nắm vững tình huống và đưa ra
quyết định phù hợp, ít rủi ro nhất.
2.4. Phân tích Big Data và mơ hình 5Ps
Dựa vào lượng thơng tin có được sau khi phân tích Big Data, doanh nghiệp có thể
xây dựng được mơ hình 5Ps như bảng dưới (theo Fan, Leu & Zheo, 2015).
Bảng 2.2. 5Ps and Big Data Analytics
Phân
tích Big
People
Product
Promotion
Price
Place
Ng̀n
-Nhân khẩu
-Đặc điểm
- Dữ liệu
- Dữ liệu
- Các nền tảng
thông tin
thu thập
-Xã hội
-Review của
khách hàng
-Phân loại
-Review của
khách hàng
tiếp thị
- Dữ liệu
khảo sát
giao dịch
- Dữ liệu
khảo sát
kết nối mạng xã
hội
-Dữ liệu khảo
-Dữ liệu khảo sát
-Khảo sát
Data
Phương
pháp
phân
tích
-Sử dụng phương - Phân tích gộp
sát
- Phân tích
- Phân tích
- Phân tích hời
kết hợp
- Phân tích
hời quy
quy
-Sử dụng
phương pháp
pháp phân loại
(classification)
-Phân tích gộp
nhóm
- Mơ hình chủ
đề (topic
hời quy
- Lọc tương
tác
nhóm
modelling)
- Phân tích kết
- Phân tích
kết hợp
phân loại
hợp
Ứng
dụng
-Phân khúc
-Gợi ý sản
khách hàng
phẩm
-Phân tích dự
- Đo lường sự
đốn hành vi của phổ biến biến
khách hàng
của của sản
- Hệ thống
- Chiến lược
-Tìm các nền
gợi ý
- Phân tích
hiệu quả
về giá
- Phân tích
đối thủ cạnh
tảng chạy
marketing hiệu
quả
tiếp thị
tranh
13
-Phân tích dự
đốn ưu tiên
phẩm
- Phân tích dự
khách hàng tiềm
năng
đốn để cung
cấp sản phẩm
- Phân tích động
cơ cộng đờng
phù hợp cho
từng thị trường
(Nguồn: Fan, Leu & Zheo, 2015)
Theo đó, dựa trên những thông tin cần cho mỗi chiếc lược P khác nhau cùng với
việc ứng dụng các thuật toán thống kê và khoa học máy tính đã cho ra các dự đoán về
tương lai với xác suất cao. Đặc biệt, phân tích dự đốn dựa trên dữ liệu đang được áp
dụng rộng rãi trong nghiên cứu Marketing. Trong đó, có các dạng phân tích phổ biến sau.
Phân tích dự đốn hành vi khách hàng. Đưa ra các mơ hình tương quan trong
hành vi của khách hàng, từ đó dự đốn xu hướng mua hàng trong tương lai.
Phân tích dự đốn ưu tiên khách hàng tiềm năng. Ở đây, các thông điệp truyền
thơng sẽ được tối ưu hóa cho từng nhóm khách hàng tiềm năng, và đưa ra call-to-action
chính xác cho họ.
Phân tích dự đốn để cung cấp sản phẩm phù hợp cho từng thị trường. Trong
trường hợp này, trực quan hóa dữ liệu giúp nhóm tiếp thị đưa ra quyết định đúng đắn về
sản phẩm hoặc dịch vụ nào nên được phân phối ra thị trường.
Phân tích dự đốn để nhắm mục tiêu khách hàng. Các mơ hình được sử dụng để
xác định nhóm khách hàng nào có giá trị cao nhất, từ đó cung cấp cho họ những ưu đãi
phù hợp trước thời điểm họ ra quyết định mua hàng.
2.4.1. Phân tích kết hợp (Association analysis)
Phân tích kết hợp là một kỹ thuật cho phép tìm thấy các mẫu trong bộ sưu tập dữ
liệu lớn. Phân tích kết hợp giúp tạo ra các thơng tin có giá trị bằng cách khám phá các
mối quan hệ có liên quan giữa các biến khác nhau trong cơ sở dữ liệu quy mơ lớn. Việc
giải thích các mối quan hệ giữa các mẫu khơng dễ dàng vì số lượng mẫu thường rất lớn
hoặc các mối quan hệ khi tìm ra thường vơ nghĩa. Tuy nhiên phương pháp phân tích này
giúp giảm thiểu yếu tố “nhiễu” dữ liệu nhiều nhất có thể.
Các chuỗi cửa hàng bán lẻ và siêu thị thường sử dụng phân tích kết hợp để tạo hờ
sơ về hành vi mua sắm chung của khách hàng. Dựa trên đó, người quản lý cửa hàng có
14
thể đề ra các chiến lược sắp xếp các sản phẩm theo trình tự cụ thể nhằm tăng trưởng
doanh số.
2.4.2. Phân tích gộp nhóm (Clustering analysis)
Phân tích gộp nhóm hay phân tích cụm là một kỹ thuật để mơ tả dữ liệu và tìm ra
các mẫu chung. Qua đó, tập dữ liệu sẽ được phân thành nhiều nhóm khác nhau, trong mỗi
nhóm thì các điểm dữ liệu hay các quan sát sẽ giống nhau, và giữa các nhóm thì có sự
khác biệt.
Kỹ thuật phân cụm được ứng dụng rất nhiều trong tiếp thị nơi mà kỹ thuật này
được sử dụng để khám phá các nhóm khách hàng có nhu cầu tương tự, để từ đó xây dựng
các chiến lược tiếp thị cho sản phẩm hoặc dịch vụ nhắm vào nhóm khách hàng mục tiêu
hiệu quả.
2.4.3. Phương pháp phân loại (Classification analysis)
Phương pháp phân loại là một trong những phương pháp khoa học dữ liệu được áp
dụng nhiều nhất và nổi tiếng nhất. Trong phương pháp này, chúng ta sẽ dự đoán các quan
sát mới (dữ liệu mới) thu thập sẽ thuộc về loại nào. Điều này được thực hiện bằng cách
phân tích các quan sát các danh mục lịch sử đã biết. Các mơ hình khác nhau có thể được
sử dụng để phân loại dữ liệu và một trong những mơ hình được biết đến nhiều nhất đó là
“cây quyết định” (decision tree), thường được sử dụng với các tập dữ liệu lớn. Cây quyết
định là một quá trình mà nhiều câu hỏi có hoặc khơng được trả lời để xác định danh mục
mà dữ liệu mới sẽ thuộc về.
Phương pháp phân loại thường được sử dụng kết hợp với phương pháp hời quy để
cải thiện hiệu suất dự đốn của mơ hình thống kê.
Một ví dụ về cách phân loại được sử dụng trong chăm sóc sức khỏe, nơi dữ liệu
lịch sử của bệnh nhân được sử dụng để phân tích các triệu chứng nhằm xác định (phân
loại) tình trạng bệnh nhân mới có thể mắc phải. Điều này đã được sử dụng để dự đoán
ung thư và xác định các nhóm nguy cơ cao.
2.4.4. Mơ hình chủ đề (Topic modelling)
Mơ hình chủ đề là mơ hình để phân tích các dữ liệu Big Data đầu vào thành các
loại chủ đề khác nhau. Mơ hình chủ đề gờm có mơ hình có giám sát và khơng giám sát.
15
Trong mơ hình chủ đề có giám sát, người dùng có thể chỉ định một số đặc điểm cho trước
của chủ đề để hệ thống lọc theo những đặc điểm đó. Cịn mơ hình khơng giám sát thì các
thơng tin văn bản từ Big Data được thu thập tự động và tự phân chia chủ đề thông minh.
Theo mặc định, Mơ hình chủ đề tự động loại bỏ các từ dừng và các từ tần số cao xuất
hiện trong hầu hết các tài liệu vì chúng thường khơng giúp xác định ranh giới giữa các
chủ đề.
Như vậy, trong chiến lược Product của marketing, mơ hình chủ đề được vận dụng
để phân tích các Big Data văn bản. Từ đó có thể phân loại các sản phẩm theo những chủ
đề khác nhau. Nhờ đó, doanh nghiệp có thể biết đến các loại sản phẩm mà khách hàng
quan tâm để từ đó đề ra chiến lược sản phẩm phù hợp.
2.4.5. Lọc tương tác (Collaborative filtering)
Hay còn gọi là lọc tương tác, sử dụng sự tương tác qua lại trong hành vi mua sắm
giữa các khách hàng để tìm ra sở thích của một khách hàng đối với một sản phẩm. Hầu
hết các hành vi hoặc sở thích của mọi người đều có những đặc điểm chung và có thể
nhóm lại thành các nhóm tương đờng. Một phụ nữ A nếu đến siêu thị mua dầu ăn thường
mua thêm nước tương và nước mắm. Hành vi này lặp lại đối với 100 lượt mua sắm là 90
lần thì khả năng cao một phụ nữ B nếu mua dầu ăn cũng sẽ mua thêm nước tương và
nước mắm. Từ đó sẽ khuyến nghị sản phẩm cho khách hàng dựa trên hành vi của các
khách hàng khác liên quan nhất.
2.4.6. Phân tích hồi quy (regression analysis)
Phân tích hời quy là kỹ thuật thống kê dùng để ước lượng phương trình phù hợp
nhất với các tập hợp kết quả quan sát của biến phụ thuộc và biến độc lập.Trong
marketing, phân tích hời quy được sử dụng rất phổ biến.
Trong chiến lược Promotion, phân tích hời quy được sử dụng để nghiên cứu nhu
cầu của người tiêu dùng thay đổi theo từng biến độc lập khác nhau.
Trong chiến lược Price, người ta có thể thực hiện các cơng trình nghiên cứu về các
yếu tố ảnh hưởng đến giá sản phẩm của họ. Khi đó giá sẽ là biến phụ thuộc và một số yếu
tố như lượng hàng còn lại, nhu cầu sản phẩm, đối thủ cạnh tranh… tác động đến giá
16
chính là biến độc lập. Thơng qua đó, các nhà quản trị Marketing có thể biết được mức giá
phù hợp cho sản phẩm dịch vụ của mình mà điều chỉnh để tối ưu giá.
Trong chiến lược Place, người ta có thể tiến hành phân tích các yếu tố của một
kênh bán hàng có ảnh hưởng đến sự hấp dẫn mua hàng của người tiêu dùng. Big Data cần
thu thập cho các biến độc lập có thể là cách bày trí, âm nhạc, nhân viên… Từ đó, người ta
có thể thực hiện các cơng tác cải tiến, hồn thiện các kênh bán hàng của mình
17
CHƯƠNG 3: ỨNG DỤNG CỦA BIG DATA TRONG NGHIÊN
CỨU MARKETING CỦA AMAZON
Amazon là một trong những công ty về thương mại điện tử lớn hàng đầu thế giới.
Công ty đã vận dụng tối ưu nguồn tài nguyên dữ liệu khổng lờ mà mình thu thập được để
đem lại lợi thế cạnh tranh. Cụ thể, tính đến năm 2005, Amazon từng sở hữu 3 cơ sở dữ
liệu Linux lớn nhất thế giới với dung lượng 7.8TB, 18.5TB và 24.7TB. Theo nghiên cứu
của IDC, nhờ Big Data, năm 2013 Amazon đạt doanh thu tới 74 tỷ USD. Bằng việc sử
dụng dữ liệu lớn mà Amazon đang ngày càng tiến xa hơn trên con đường thấu hiểu khách
hàng và đem đến trải nghiệm mua hàng tuyệt vời cho người dùng của mình. Amazon đã
vận dụng công nghệ Big Data vào một số dự án nổi bật dưới đây.
3.1. Hệ thống giới thiệu cá nhân
3.1.1. Nguồn thông tin cần thu thập
Để phát triển hệ thống giới thiệu cá nhân của mình, Amazon đã thu thập các thông
tin trực tiếp từ người dùng về các sản phẩm mà khách hàng đã mua, các món được thêm
vào trước đây, các danh mục mong đợi, các loại sản phẩm đang được xem xét và đánh giá
hay các sản phẩm đang được tìm kiếm nhiều nhất.
3.1.2. Cách xử lý nguồn thơng tin
Phân tích đường đi (path analytics): Amazon có thể lấy dữ liệu từ q trình di
chuyển các thao tác trên trang thương mại điện tử của mình để xác định xem điểm đích
về loại sản phẩm cuối cùng mà khách hàng thực sự cần làm gì. Lấy ví dụ, khi khách hàng
di chuyển qua các shop bán cùng ngành hàng và thêm nhiều sản phẩm vào giỏ hàng của
mình nhưng vẫn chưa thực hiện thao tác đặt hàng. Như vậy, Amazon có thể phân tích
được đích đến cuối cùng của khách hàng là những sản phẩm trong giỏ hàng. Từ đó có thể
gợi ý các sản phẩm tương tự cho khách hàng.
Phân tích văn bản (text analytics): bằng việc thu thập các từ khóa tìm kiếm của
khách hàng tại các thời điểm gần nhau, Amazon có thể hiểu được nhu cầu hiện tại của
khách hàng. Phân tích văn bản ở đây là việc phân tích cấu trúc từ khóa và giải mã ý nghĩa
để chuyển hóa thành các thơng tin phục vụ cho việc phân tích chun sâu, xác định được
sản phẩm mà khách hàng muốn mua. Kỹ thuật phân tích và giải mã phổ biến được sử
18
dụng đó là kỹ thuật NLP (Natural Language Processing). Kỹ thuật phân tích này được
chia làm 4 cấp độ phân tích từ cơ bản đến chun sâu. Có thể ví dụ về một từ khóa tìm
kiếm đơn giản là: “Áo sơ mi tay ngắn nữ giá rẻ”. Nếu sử dụng kỹ thuật NLP thì sẽ được
phân tích như sau:
+ Lexical analytics: là kiểm tra các thuộc tính riêng biệt của từ khóa tìm kiếm này
như chủ ngữ, vị ngữ, bổ ngữ. Như vậy trong từ khóa này ta có thể phân tích được chủ ngữ
chính là “Áo sơ mi”, khuyết động từ và vị ngữ và có thể xem cụm từ phía sau “tay ngắn
nữ giá rẻ” là bổ nghĩa cho chủ ngữ.
+ Syntactic analytics: là bước phân tích kết hợp từ ngữ với ngữ cảnh để giải nghĩa.
Trong từ khóa này thiếu nhiều thành phần của một câu và khơng có câu cảm thán nào nên
khơng cần bước phân tích này.
+ Semantic analytics: phân tích các ý nghĩa có thể xảy ra, phân tích những từ tối
nghĩa, phát hiện những ngụ ý sử dụng từ của người dùng để phân tích giải nghĩa. Để ý
thấy cụm từ “giá rẻ” trong từ khóa. Có thể hiểu là khách hàng sẽ ưu tiên chọn những sản
phẩm đang giảm giá.
+ Discourse – level analytics: cắt nghĩa câu văn để hiểu được nhu cầu của người
tìm kiếm. Trong cụm từ này ta có thể phân tích về loại sản phẩm mà khách hàng tìm kiếm
là áo, chất liệu sơ mi, kiểu dáng tay ngắn, đối tượng sử dụng là nữ.
Cuối cùng, sau khi phân tích và giải mã các từ khóa tìm kiếm của khách hàng,
Amazon có thể hiểu khách hàng đang cần gì để từ đó đưa ra các gợi ý sản phẩm về kiểu
dáng, màu sắc tương ứng. Điều này góp phần dẫn dắt khách hàng tìm được sản phẩm phù
hợp nhất với mình.
3.1.3. Vận dụng những thơng tin đã xử lý
Các thơng tin được xử lý giúp cho Amazon hình dung rõ hơn chân dung khách
hàng của mình. Biết được nhu cầu thực sự của khách hàng tại một thời điểm để cá nhân
hóa trải nghiệm mua hàng của khách hàng. Mỗi khách hàng có một mong muốn khác
nhau đối với sản phẩm của mình. Do đó, Amazon đã áp dụng hàng loạt cơng nghệ phân
tích Big Data để đưa ra những lời gợi ý sản phẩm phù hợp nhất đến người dùng. Thơng
qua việc tối ưu hóa trải nghiệm mua hàng này, Amazon đã “móc túi” khách hàng của
19
mình khơng ít. Hệ thống giới thiệu cá nhân này đã đem lại ng̀n doanh thu khổng lờ cho
Amazon. Nó giúp tạo ra khoảng 35% doanh thu bán hàng mỗi năm của cơng ty.
3.2. Mơ hình giao hàng dự đốn
3.2.1. Nguồn thơng tin cần thu thập
Để hồn thành mơ hình này, Amazon cần phải có một Big Data về các từ khóa
khách hàng tìm kiếm, sản phẩm trong giỏ hàng, các shop đã ghé qua, các đơn hàng đặt
gần đây, các đơn hàng đặt vào cùng thời điểm trong quá khứ. Ngồi ra cịn có các đặc
điểm khác về nhân khẩu, địa lý, chính trị của từng khu vực.
3.2.2. Cách xử lý nguồn thơng tin
Phân tích dự báo (Predictive analytics): kết hợp những thông tin thu được từ Big
Data mua hàng của khách hàng trong lịch sử rồi tiến hành phân tích dự báo cho tương lai.
Theo Eckerson, phân tích dữ báo kiểu Amazon trong mơ hình này thuộc loại mơ hình học
có giám sát (giám sát dữ liệu lịch sử để dự báo cho tương lai) và sử dụng phương pháp
phân loại (classification). Bằng phương pháp này, Amazon sẽ phân chia các đối tượng
khách hàng của mình theo từng khu vực địa lý, nơi gần các kho hàng của Amazon. Sau
khi phân chia như vây, Amazon tiến hành phân tích sâu nhu cầu của khách hàng và dự
báo những mặt hàng nào mà khách hàng có thể mua trong khu vực đó.
3.2.3. Vận dụng những thơng tin đã xử lý
Sau khi có được dữ liệu khách hàng của các khu vực nhờ phương pháp phân tích
dự báo, Amazon sẽ tiến hành nhập các mặt hàng này vào kho để thuận tiện giao hàng cho
khách hàng. Khi khách hàng trong khu vực đặt hàng, công ty sẵn sàng hàng để giao cho
khách hàng tại kho hàng của Amazon gần nhất. Bằng cách này, cơng ty ln đảm bảo tối
thiểu hóa thời gian giao hàng cho khách hàng. Như vậy, Amazon khơng những tiết kiệm
được chi phí vận chuyển mà cịn tạo được thiện cảm sâu sắc vì thời gian giao hàng siêu
nhanh của mình.
3.3. Tối ưu giá
3.3.1. Nguồn thơng tin cần thu thập
20
Để thực hiện tối ưu về giá, Amazon đã tiến hành thu thập một kho dữ liệu khổng
lồ về các hoạt động của khách hàng trên web, chiến lược của đối thủ, sự sẵn có của sản
phẩm, mức độ ưa thích sản phẩm, lịch sử đơn hàng, lợi nhuận kỳ vọng...Các nguồn thông
tin này phải luôn được cập nhật liên tục để Amazon tối ưu hóa giá liên tục. Thơng thường
giá sản phẩm được Amazon cập nhật liên tục mỗi 10 phút vì những dữ liệu Big Data này
được cập nhật gần như là liên tục.
3.3.2. Cách xử lý nguồn thơng tin
Amazon có thể thực hiện phân tích dự báo theo mơ hình học khơng giám sát. Khác
với mơ hình học giám sát lấy dữ liệu quá khứ để dự báo tương lai cùng một số đối tượng
thì mơ hình này không dùng những dữ liệu lịch sử mà lấy ngay những dữ liệu mới được
cập nhật. Mơ hình này giúp tìm được mối liên hệ giữa các yếu tố quan sát. Sử dụng kỹ
thuật phân tích hời quy đa biến, cho Amazon biết được mối tương quan của giá sản phẩm
với các yếu tố cịn lại. Ở đây, cơng ty có thể thực hiện một số phân tích hời quy với biến
giá là biến phụ thuộc và các biến như chiến lược đối thủ, mức độ sẵn có của sản phẩm,
mức độ ưa thích... là những biến độc lập. Như vậy, Amazon có thể xác định được mức
giá hợp lý khi các biến độc lập này thay đổi mỗi khi được cập nhật.
3.3.3. Vận dụng những thông tin đã xử lý
Sau khi xác định mức giá hợp lý tại một thời điểm nhờ vào các kỹ thuật dự báo,
Amazon sẽ tiến hành cập nhật thường xuyên mức giá trên các trang thương mại điện tử
của mình. Cơng ty ln luôn phải giữ mức giá hấp dẫn đối với khách hàng. Nhờ vậy,
Amazon ngày càng thu hút được nhiều đơn hàng hơn, giúp doanh thu tăng trung bình
25% mỗi năm. Đối với các sản phẩm bán chạy, công ty sẽ cung cấp nhiều dịch vụ giảm
giá để kích cầu. Từ đó kiếm được lợi nhuận từ số lượng nhiều. Đối với các sản phẩm bán
chậm, Amazon thực hiện chính sách giá nhỉnh hơn đối thủ một ít để thu được nhiều lợi
nhuận hơn trên mỗi sản phẩm bán ra.
3.4. Dịch vụ khách hàng Alexa
3.4.1. Nguồn thông tin cần thu thập