Tải bản đầy đủ (.pdf) (93 trang)

Phân tích hành vi khách hàng hướng đến phân khúc thị trường từ dữ liệu bigdata trường hợp của sacombank

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.97 MB, 93 trang )

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH

--------------PHẠM VĂN HẬU

PHÂN TÍCH HÀNH VI KHÁCH HÀNG HƯỚNG ĐẾN PHÂN
KHÚC THỊ TRƯỜNG TỪ DỮ LIỆU BIGDATA
TRƯỜNG HỢP CỦA SACOMBANK

LUẬN VĂN THẠC SĨ KINH TẾ

Thành Phố Hồ Chí Minh – Năm 2019


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ THÀNH PHỐ HỒ CHÍ MINH

---------------

PHẠM VĂN HẬU

PHÂN TÍCH HÀNH VI KHÁCH HÀNG HƯỚNG ĐẾN PHÂN
KHÚC THỊ TRƯỜNG TỪ DỮ LIỆU BIGDATA
TRƯỜNG HỢP CỦA SACOMBANK

Chuyên ngành: Quản trị kinh doanh
Hướng đào tạo: Hướng ứng dụng
Mã số: 8340101
LUẬN VĂN THẠC SĨ KINH TẾ
NGƯỜI HƯỚNG DẪN KHOA HỌC:
PGS.TS. TỪ VĂN BÌNH



Thành Phố Hồ Chí Minh – Năm 2019


LỜI CAM ĐOAN

Tôi xin cam đoan rằng những nội dung tôi viết trong bài báo cáo này là do tôi thực
hiện trên cơ sở tham khảo các tài liệu liên quan đến đề tài và số liệu trong bài báo cáo
là hoàn toàn trung thực. Tôi xin chịu hoàn toàn trách nhiệm về lời cam đoan này.

Người thực hiện đề tài


MỤC LỤC
TRANG PHỤ BÌA
LỜI CAM ĐOAN
MỤC LỤC DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT
DANH MỤC CÁC BẢNG BIỂU DANH MỤC CÁC BIỂU ĐỒ
TÓM TẮT
ABSTRACT
LỜI MỞ ĐẦU ........................................................................................................... 1
CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN CỨU ........... 4
1.1. Lý do chọn đề tài ............................................................................................... 4
1.2. Mục tiêu nghiên cứu .......................................................................................... 5
1.3. Phương pháp nghiên cứu ................................................................................. 6
1.3.1. Đối với số liệu phục vụ nghiên cứu ............................................................... 6
1.3.2. Các khái niệm tiếp cận trong nghiên cứu .................................................... 7
1.3.3. Phạm vi nghiên cứu của luận văn ................................................................. 8
1.3.4. Kết cấu của luận văn ...................................................................................... 9
CHƯƠNG 2: CƠ SỞ LÝ LUẬN ............................................................................ 10

2.1. Big Data ............................................................................................................ 10
2.2. Khai phá dữ liệu (Data Mining) ..................................................................... 10
2.3. Hành vi tiêu dùng ............................................................................................ 13
2.3.1. Định nghĩa ..................................................................................................... 13
2.3.2. Hành vi tiêu dùng đƣợc phân khúc theo RFM .......................................... 19


2.4. Phân khúc thị trường ...................................................................................... 20
2.4.1. Định nghĩa phân khúc thị trường ................................................................ 20
2.4.2. Lựa chọn thị trường mục tiêu……............................................................... 22
2.4.3. Định vị sản phẩm trên thị trường mục tiêu ................................................ 24
2.5. Một số khái niệm khác..................................................................................... 25
2.5.1. Mô hình ma trận giá trị khách hàng (Custumer Value Matrix Model…...25
2.5.2. Phương pháp RFM ....................................................................................... 26
2.5.3. Giá trị vòng đời khách hàng (Custumer Lifetime Value - CLV) ............. 27
2.5.4. Thuật toán phân cụm (Clustering) .............................................................. 27
2.5.5. Thuật toán K-means ..................................................................................... 30
2.6. Quy trình nghiên cứu ...................................................................................... 31
CHƯƠNG 3: BIG DATA VÀ ỨNG DỤNG BIG DATA TẠI SACOMBANK…33
3.1. Big Data và ứng dụng của Big data trong lĩnh vực ngân hàng .................... 33
3.1.1. Big data ......................................................................................................... 33
3.1.2. Ứng dụng của Big data trong lĩnh vực ngân hàng ..................................... 33
3.2. Ứng dụng big data tại Sacombank ................................................................. 40
3.2.1. Giới thiệu về Sacombank ............................................................................. 40
3.2.2. Ứng dụng big data tại Sacombank .............................................................. 43
CHƯƠNG 4: PHÂN TÍCH DỮ LIỆU BIG DATA .............................................. 46
4.1. Số liệu phục vụ nghiên cứu ............................................................................. 46
4.2. Thông tin giao dịch khách hàng ..................................................................... 46
4.2.1. Đối với khách hàng tiền gửi ......................................................................... 46



4.2.2. Đối với khách hàng sử dụng thẻ tín dụng ................................................... 48
4.2.3. Đối với khách hàng tiền vay ......................................................................... 49
4.3. Phân tích hành vi và phân khúc khách hàng ................................................ 51
CHƯƠNG 5: KẾT LUẬN VÀ XÂY DỰNG CHIẾN LƯỢC .............................. 58
ĐỀ XUẤT CHIẾN LƯỢC KINH DOANH .......................................................... 58
5.1. Chiến lược kinh doanh đề xuất theo phân khúc khách hàng ...................... 60
5.1.1. Chiến lược cho nhóm khách hàng tốt nhất (Best) ...................................... 60
5.1.2. Chiến lược cho nhóm khách hàng mới (New) ............................................ 65
5.2. Chiến lược phản hồi của khách hàng (feelback) ........................................... 67
KẾT LUẬN ............................................................................................................. 70
TÀI LIỆU THAM KHẢO
PHỤ LỤC


DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT

Nguyên nghĩa

Từ viết tắt
SACOMBANK

Ngân hàng Thương Mại Cổ Phần Sài Gòn Thương
Tín

CLV

Customer Lifetime Value
(Giá trị đóng góp của khách hàng theo thời
gian)


RFM

Recency, Frequency, Monatery


DANH MỤC CÁC BẢNG BIỂU
Bảng 1.1 Thông tin khách hàng từ tháng 10/2018 đến tháng 10/2019
Bảng 2.1. Các bước trong quá trình khai thác dữ liệu
Bảng 2.2. Ứng dụng của khai thác dữ liệu
Bảng 2.3. Bảng mô tả điểm theo RFM
Bảng 2.4. Mô tả ma trận giá trị khách hàng
Bảng 2.5. Các tham số của ma trận quan hệ khách hàng
Bảng 2.6. Chuyển đổi dữ liệu
Bảng 2.7. Các phương pháp cơ bản của thuật toán phân cụm
Bảng 2.8. Các bước cơ bản của thuật toán K-means
Bảng 4.1. Thông tin loại thẻ tín dụng được sử dụng bởi khách hàng
Bảng 5.1. Khung điểm xếp hạng đề xuất
Bảng 5.2. Chính sách ưu đãi đề xuất cho khách hàng sapphire
Bảng 5.3. Kế hoạch phân bổ nguồn lực cho nhóm khách hàng tốt nhất
Bảng 5.4. Chiến lược đề xuất dành cho nhóm khách hàng mới
Bảng 5.5. Kế hoạch xây dựng chiến lược feelback


DANH MỤC CÁC BIỂU ĐỒ
Biểu đồ 2.1. Quy trình khai thác dữ liệu
Biểu đồ 2.2. Mô hình ma trận giá trị khách hàng
Biểu đồ 2.3. Ví dụ về các thuật toán phâm cụm cổ điển
Biểu đồ 2.4. Ví dụ về phân cụm bằng phương pháp K-means
Biểu đồ 2.5. Quy trình nghiên cứu

Biểu đồ 3.1. Tổng tài sản của Sacombank giao đoạn 2014-2018
Biểu đồ 3.2. Tổng nguồn vốn huy động của Sacombank giao đoạn 2014-2018
Biểu đồ 3.3. Tổng cho vay khách của Sacombank giao đoạn 2014-2018
Biểu đồ 3.4. Lợi nhuận trước thuế của Sacombank giao đoạn 2014-2018
Biểu đồ 4.1. Thông tin tiền gửi theo thời gian của khách hàng
Biểu đồ 4.2. Thông tin nhóm thẻ tín dụng khách hàng quan tâm
Biểu đồ 4.4. Thông tin vay của khách hàng
Biểu đồ 4.5. Thông tin vay theo giá trị và thời gian vay
Biểu đồ 4.6. Mô hình ma trận khách hàng
Biểu đồ 4.7. Phân khúc thị trường dựa vào mô hình RFM
Biểu đồ 4.8. Thông tin vay vốn theo nhóm phân khúc khách hàng
Biểu đồ 4.9. Phân khúc thị trường và mối quan hệ với khách hàng
Biểu đồ 4.10. Thông tin phân khúc thị trường theo dịch vụ tham gia và số dư nợ thẻ


TÓM TẮT
Đề tài “Phân tích hành vi khách hàng hướng đến phân khúc thị trường từ dữ
liệu bigdata: Trường hợp của Sacombank” với mục đích phân tích hành vi khách
hàng, đặc điểm lựa chọn dịch vụ của khách hàng, việc phân tích hành vi khách hàng
từ nguồn dữ liệu big data. Điều này không những góp phần vào việc xác định lại phân
khúc thị trường để ngân hàng có hướng tiếp cận phù hợp, trên cơ sở để phát triển
thêm vào các dịch vụ hướng đến phục vụ khách hàng một cách hiệu quả nhằm giữ
chân khách hàng cũ, hạn chế sự rời dịch vụ của khách hàng và tạo tiếng vang lôi kéo
khách hàng mới.
Đề tài áp dụng vào mô hình CLV (customer lifetime value) - giá trị đóng góp
của khách hàng theo thời gian để tính RFM (Recency, Frequency, Monetary) trước
khi hướng đến phân khúc thị trường. Việc phân khúc dựa trên hành vi tiêu dùng của
khách hàng cụ thể là các khách hàng sử dụng thẻ tín dụng, khách hàng tiền gửi và
lịch sử giao dịch tiền gửi, và khách hàng tiền vay một số phương pháp phân cụm
(cluster) và phân cụm theo RFM (thời gian mua hàng gần nhất, tần suất giao dịch của

khách hàng tổng giá trị giao dịch dựa trên nguồn dữ liệu big data của Sacombank).
Việc nghiên cứu này được ban lãnh đạo phía ngân hàng kỳ vọng rất lớn, vì kết
quả nghiên cứu từ tài nguyên dữ liệu là việc làm thực tế, giúp Sacombank phân khúc
hệ khách hàng của mình thành từng nhóm từ đó có các giải pháp chiến lược hướng
vào từng phân khúc khách hàng cụ thể và các chiến lược được đề xuất từ nghiên cứu
là một áp dụng chính thức cho năm 2020.


ABSTRACT

Topic "Analyzing customer behavior towards market segments from big data: The
case of Sacombank" with the purpose of analyzing customer behavior, characteristics
of customer service selection, and analyzing the behavior of customers. vi customers
from big data. This not only contributes to redefining the market segment so that the
bank can take an appropriate approach, on the basis of further development of
services aimed at customer service effectively to retain customers. old customers,
restricting customer service and creating a buzz to attract new customers. The project
applies to CLV model (customer lifetime value) - the value of customer contributions
over time to calculate RFM (Recency, Frequency, Monetary) before moving to the
market segment. Segmentation is based on specific consumer behavior of credit card
customers, deposit customers and deposit transaction history, and borrowers some
clustering methods. and clustered by RFM (latest purchase time, frequency of
customer transactions total transaction value based on big data data of Sacombank).
This research is highly expected by the bank's management, because the research
results from data resources are practical work, helping Sacombank to segment its
customer segment into groups from which there are awards. Strategies that target
specific customer segments and the strategies proposed by the study are an official
application for 2020.



1

LỜI MỞ ĐẦU
Nền kinh tế thế giới nói chung và thị trường kinh tế Việt Nam nói riêng trong
những năm vừa qua đều có sự chuyển dịch mạnh mẽ, ảnh hưởng không nhỏ đến các
đối tượng kinh tế và ngành Ngân hàng cũng không phải là trường hợp ngoại lệ mà
điển hình là hoạt động của các Ngân hàng thương mại. Nguồn thu lãi từ tín dụng được
biết đến như là kim chỉ nam hoạt động của Ngân hàng thương mại, tuy nhiên những
năm gần đây khi nhắc đến tổng lợi nhuận sau thuế của Ngân hàng thương mại thì
không thể không kể đến nguồn thu từ hoạt động dịch vụ, đặc biệt là sự tăng trưởng
vượt bậc của mảng bancassurance.
Theo nhận định của các chuyên gia kinh tế, nhờ tín dụng tăng trưởng mạnh
nên không chỉ thu nhập lãi thuần, mà nguồn thu từ các hoạt động dịch vụ của ngân
hàng cũng đã cải thiện rõ nét trong năm qua. Điều này minh chứng rằng, lợi nhuận
sau thuế của các ngân hàng thương mại đang giảm dần sự phụ thuộc vào hoạt động
tín dụng nhờ nỗ lực đẩy mạnh nguồn thu từ dịch vụ, tuy nguồn thu từ dịch vụ có
những bước chuyển mình rõ rệt, nhưng hoạt động chính của ngành ngân hàng nước
ta hiện nay vẫn phụ thuộc nhiều vào hoạt động tín dụng, nhất là đối với các ngân hàng
nhỏ. Chính vì lý do này, các ngân hàng cần chú trọng đẩy mạnh hơn nữa việc phát
triển dịch vụ trên nền tảng công nghệ số, công nghiệp 4.0...để phân tán rủi ro. Để giải
đáp bài toán về chuyển đổi cơ cấu nguồn thu, các ngân hàng cần quan tâm và chú
trọng hơn nữa trong việc đưa ra các giải pháp tài chính hiệu quả, đa dạng hóa sản
phẩm dịch vụ.
Dữ liệu khách hàng hay “customer data” được coi là tài sản, nguồn thông tin
vô giá đối với mọi công ty thuộc nhiều lĩnh vực kinh doanh khác nhau. Việc triển
khai các quy trình khai thác, dự án nghiên cứu phân tích dữ liệu khách hàng với mục
đích tìm hiểu, nắm bắt mong muốn, nhu cầu thầm kín của khách hàng và chuyển nó
thành những giá trị cụ thể thông qua từng chiến lược, kế hoạch hoạt động chính là
chìa khóa cạnh tranh của mỗi tổ chức ngày nay. Đặc biệt so với 10 năm trước đây, thì
hiện tại với sự phát triển của khoa học công nghệ, kỹ thuật qua đó nâng cao khả năng



2

của các công ty trong việc tiếp cận gần hơn với khách hàng, tiếp cận gần hơn với mỗi
dữ liệu chứa đựng thông tin về sở thích, hành vi của khách hàng.
Tuy nhiên để đạt được các mục tiêu đề ra khi sử dụng dữ liệu khách hàng, hỗ
trợ những chiến lược kinh doanh một cách hiệu quả thì không phải là điều đơn giãn
hay dễ dàng, mà nó chứa đựng muôn vàng thách thức, khó khăn khác nhau thậm chí
cả rủi ro, ví dụ trường hợp công ty bị tin tặc tấn công hệ thống mạng, hệ thống dữ
liệu, bị rò rỉ, đánh cắp dữ liệu là thông tin cá nhân của khách hàng. “Hãy tiến gần hơn
đến với các khách hàng của bạn, gần đến nổi bạn có thể nói cho họ biết họ cần gì
trước khi họ nhận ra.” – Steve Jobs. Câu nói của Steve Jobs càng thích hợp để nói về
khuynh hướng tiếp cận khách hàng ngày nay của đa số các công ty. Trong thị trường
cạnh tranh khóc liệt hiện tại, việc chủ động tìm kiếm và xác định, lôi kéo khách hàng
tiềm năng bằng những chiến lược marketing, chiến lược sản phẩm thích hợp sẽ giúp
một công ty có cơ hội vượt lên trên đối thủ của mình. Dĩ nhiên để thực hiện mục đích
trên, công ty phải biết được khách hàng mình cần thu hút là ai, khách hàng nào sẽ
đem lại giá trị lợi nhuận, khách hàng nào có thể mua sản phẩm dịch vụ, tất cả thông
tin có được phải dựa trên nguồn dữ liệu lớn (hay còn gọi là big data) mà công ty sẽ
được thu thập, quản lý và phân tích.
Đã có nhiều công trình nghiên cứu rất thành công trong việc sử dụng Big Data
để phân tích mức độ tiêu dùng của khách hàng. Tuy nhiên, điểm chung của các nghiên
cứu này đều chỉ ra rằng Big Data luôn cho phép tổ chức kinh doanh thao tác quản lý
các tập dữ liệu cực kỳ lớn và phức tạp mà không một ứng dụng xử lý dữ liệu truyền
thống nào có thể hỗ trợ.
Theo Forbes, 87% các công ty coi Big Data sẽ tạo ra những thay đổi lớn cho
ngành công nghiệp của chính mình cho đến cuối thập kỷ thứ 2 của thế kỷ 21. Ngay
cả bản thân các công ty cũng có chung một suy nghĩ rằng nếu không chú trọng trong
công tác phân tích dữ liệu lớn và đưa ra các chiến lược cụ thể dựa trên phân tích thực

nghiệm sẽ khiến công ty rơi vào tình trạng kinh doanh bất ổn định.
Ngày nay, hầu hết các tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm đang
nỗ lực để áp dụng một cách tiếp cận mới theo hướng khai thác dữ liệu để phát triển


3

và đổi mới các dịch vụ mà họ cung cấp cho khách hàng. Giống như hầu hết các ngành
công nghiệp khác phân tích dữ liệu lớn (big data analytics) sẽ là một trong những
thay đổi lớn, quan trọng trong cuộc chiến giữa các tổ chức cùng ngành.
Mặc dù nhiều tổ chức ngân hàng, dịch vụ tài chính và bảo hiểm đang thay đổi
cách thức khai thác dữ liệu bằng cách thu thập một khối lượng dữ liệu khổng lồ và
tiến hành phân tích, nhưng đó chỉ là những bước tổng quát, những bước riêng lẻ ở
từng giai đoạn trong quy trình khai thác dữ liệu big data. Trong tất các trường hợp,
các dự án big data được hình thành đều hướng đến mục tiêu ban đầu là trả lời cho câu
hỏi: “những dữ liệu này có thể giúp chúng ta giải quyết các vấn đề kinh doanh như
thế nào?”
Khi khối lượng khách hàng tăng lên, nó ảnh hưởng đáng kể đến mức độ, khả
năng cung cấp dịch vụ của từng tổ chức. Thực tiễn cho thấy việc phân tích dữ liệu
hiện tại đã đơn giản hóa quá trình theo dõi và đánh giá khách hàng tín dụng của các
ngân hàng và các tổ chức tài chính, dựa trên khối lượng dữ liệu như thông tin, hồ sơ
cá nhân và các thông tin bảo mật khác. Nhưng với sự giúp đỡ của big data, các ngân
hàng có thể khai thác để liên tục theo dõi hành vi của khách hàng trong thời gian thực,
xác định các nguồn dữ liệu cần thiết để thu thập phục vụ cho việc đưa ra giải pháp.


4

CHƯƠNG 1: GIỚI THIỆU TỔNG QUAN VỀ ĐỀ TÀI NGHIÊN
CỨU

1.1. Lý do chọn đề tài
Nhu cầu ngày càng cao của khách hàng là bài toán thách thức cần lời giải đáp
của doanh nghiệp nói chung và ngành ngân hàng nói riêng. Điều này đòi hỏi ngân
hàng hay doanh nghiệp phải thay đổi chiến lược phát triển theo hướng đa dạng hóa
tiện ích của các dòng sản phẩm, dịch vụ và chú trọng công tác chăm sóc khách hàng.
Thực tiễn chỉ ra rằng nguồn dữ liệu hiện hữu của một tổ chức kinh doanh là một tài
nguyên quan trọng, việc phân tích nguồn tài nguyên này phần nào giúp việc đơn giản
hóa quá trình giám sát và tìm hiểu nhu cầu khách hàng một cách hiệu quả. Với nguồn
dữ liệu lớn sẵn có, cụ thể là nguồn số liệu từ big data (tạm dịch là dữ liệu lớn), các
ngân hàng có thể tự khai thác thông tin để tiếp tục theo dõi hành vi tiêu dùng của
khách hàng trong tương lai, từ đó đưa ra chiến lược, chính sách phù hợp. Quá trình
theo dõi đánh giá hồ sơ khách hàng dựa vào thông tin hiện có hoặc đặc điểm khách
hàng sẽ giúp ngân hàng giảm thiểu được rủi ro đến mức nhỏ nhất. Điều này góp phần
trong khai thác hiệu quả đối tượng khách hang, đảm bảo vị thế cạnh tranh trên thị
trường.
Ngân hàng Thương Mại Cổ Phần Sài Gòn Thương Tín (Sacombank) được biết
đến là một trong những ngân hàng thương mại nằm trong top đầu của hệ thống Ngân
hàng Việt Nam. Với lịch sử 28 năm thành lập và phát triển, Sacombank tiếp tục giữ
vững chiến lược phát triển là ngân hàng bán lẻ với mục tiêu rõ ràng “kinh doanh hiệu
quả - hoạt động an toàn – tăng trưởng bền vững” phù hợp trong bối cảnh nền kinh tế
thị trường đầy khó khăn. Sacombank không ngừng nỗ lực trong việc đẩy mạnh phát
triển công nghệ số, nâng cao chất lượng dịch vụ, đa dạng hóa sản phẩm với tính bảo
mật cao, cung cấp các giải pháp tài chính hiệu quả, chuyên nghiệp hóa công tác chăm
sóc khách hàng. Bên cạnh những cơ hội phát triển, Sacombank cũng phải đối mặt với
nhiều bài toán thách thức của thị trường. Mức độ cạnh tranh ngày càng gay gắt giữa
các ngân hàng là một trong những thách thức đầu tiên và đầy khó khăn mà không chỉ
Sacombank phải tìm cách giải quyết. Đặc biệt, sự liên kết và sát nhập giữa Ngân hàng


5


ngoại với Ngân hàng nội sẽ gây thêm nhiều khó khăn hơn trong việc cạnh tranh, bởi
sự liên kết này sẽ chiếm ưu thế hơn với sản phẩm dịch vụ có chất lượng cao, kinh
nghiệm chuyên nghiệp, năng lực quản trị tốt và mạng lưới toàn cầu cùng sự am hiểu
đặc thù kinh tế tại địa phương. Hai là, nhu cầu của khách hàng ngày một tăng cao,
đòi hỏi Ngân hàng phải đáp ứng thường xuyên việc tối ưu hóa các sản phẩm dịch vụ,
nâng cao chất lượng dịch vụ, quy trình, thủ tục đơn giải, nhanh chóng và hướng về
mục tiêu chất lượng trong kinh doanh.
Trong những năm gần đây, Sacombank đã chi ra một khoảng không nhỏ đầu
tư hệ thống lưu trữ dữ liệu. Đến thời điểm hiện tại, nguồn dữ liệu lưu trữ trong các
data warehouse đã trở thành một nguồn big data. Tuy nhiên việc khai thác dữ liệu từ
nguồn big data đang là bài toán không dễ cho các bộ phận có liên quan. Để ngân hàng
hiểu hơn về hành vi khách hàng, đặc điểm lựa chọn dịch vụ của khách hàng, việc
phân tích hành vi khách hàng từ nguồn dữ liệu big data là cực kỳ quan trọng. Điều
này không những góp phần vào việc xác định lại phân khúc thị trường để ngân hàng
có hướng tiếp cận phù hợp, trên cơ sở để phát triển thêm vào các dịch vụ hướng đến
phục vụ khách hàng một cách hiệu quả nhằm giữ chân khách hàng cũ, hạn chế sự rời
dịch vụ của khách hàng và tạo tiếng vang lôi kéo khách hàng mới. Đây là lý do nghiên
cứu của đề tài sẽ hướng đến chủ đề “Phân tích hành vi khách hàng hướng đến phân
khúc thị trường từ dữ liệu big data: Trường hợp của Sacombank”. Đề tài này có thể
nói rằng, là việc làm mới trong lĩnh vực nghiên cứu tại ngân hàng. Việc nghiên cứu
này rất được ban lãnh đạo phía ngân hàng kỳ vọng, vì kết quả nghiên cứu từ tài nguyên
dữ liệu là việc làm thực tế. Các chiến lược được đề xuất từ nghiên cứu là một áp dụng
chính thức cho năm 2020.
1.2. Mục tiêu nghiên cứu
Phân tích hành vi tiêu dùng thông qua lịch sử giao dịch của khách hàng tham
tham gia dịch vụ tiền gửi, sử dụng thẻ và tiền vay từ đó hướng đến thực hiện phân
khúc thị trường theo các nhóm tiêu dùng.



6

Phát triển các giải pháp kinh doanh hạn chế rủi ro rời dịch vụ của khách hàng,
tăng cường các chiến lược kinh doanh giúp giữ chân khách hàng hiện tại, khai thác
khách hàng mới.
1.3. Phương pháp nghiên cứu
1.3.1. Đối với số liệu phục vụ nghiên cứu
Nguồn dữ liệu phục vụ nghiên cứu luận văn được chiết xuất từ nguồn dữ liệu Big
Data của ngân hàng. Nguồn này được chứa trong các hệ thống lưu trữ của Sacombank.
Việc xuất dữ liệu là dựa vào thống core T24 (hệ thống lõi của ngân hàng sacombank),
CRM (hệ thống thu thập và quản lý thông tin khách hàng), mis (data warehouse),
portal... Đây là những nguồn dữ liệu cực kỳ quan trọng bởi độ tin cậy lớn và ghi lại
chính xác hành vi tiêu dùng của khách hàng trong quá trình tham gia giao dịch cũng
như sử dụng sản phẩm dịch vụ của Sacombank. Mặc dù số liệu không thuộc dạng
khảo sát, tuy nhiên việc sử dụng nguồn dữ liệu Big Data này được xem như là một
xu hướng mới trong việc nghiên cứu các vấn đề kinh tế trong kỷ nguyên công nghệ
thông tin phát triển. Nguồn tài nguyên từ Big Data phản ánh một cách trung thực nhất
về hành vi và lịch sử tiêu dùng của khách hàng theo thời gian. Qua đó, kết quả của
quá trình nghiên cứu sẽ mang độ tin cậy cao hơn. Tuy nhiên, nguồn tài nguyên này
được cung cấp từ phía Ngân hàng nên cần có tính bảo mật cao, nên nghiên cứu này
tác giả đề xuất phần dữ liệu sẽ không được công bố rộng rãi.
Số liệu được tập hợp từ các nguồn khác nhau theo loại khách hàng, trong đó
có khách hàng sử dụng thẻ tín dụng, khách hàng tiền gửi và lịch sử giao dịch tiền gửi,
và khách hàng tiền vay. Để hạn chế những thông tin nhiễu, các khách hàng được chọn
đưa vào nghiên cứu có thời gian tham gia dịch vụ trên 12 tháng. Thời gian nghiên
cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày 01/10/2018 đến ngày
30/10/2019. Thời gian đưa vào nghiên cứu mỗi mã khách hàng có nhiều dòng thông
tin, nói cách khác mỗi một dòng là một giao dịch của khách hàng. Việc xác định số
lần giao dịch của mỗi khách hàng dựa vào mã khách hàng thống kê từ hệ thống báo
cáo. Các đối tượng khách hàng trong nghiên cứu là khách hàng có tham gia giao dịch



7

trong thời gian nghiên cứu trên, công cụ được sử dụng hỗ trợ phục vụ phân tích là
SPSS Modeler 18. Thông tin các nhóm khách hàng có thể thấy ở bảng 1.1.
Bảng 1.1. Thông tin khách hàng từ tháng 10/2018 đến tháng 10/2019
Thông tin khách hàng

Số dòng

Khách hàng sử dụng thẻ 4.642 dòng là số dòng giao dịch
tín dụng

của khách hàng với ngân hàng

Khách hàng tiền vay

2.349 dòng là số dòng giao dịch

Số khách hàng
4.642

1.421

trực tiếp với ngân hàng của
khách hàng
Khách hàng tiền gửi và 130.150 dòng là số dòng giao
giao dịch tiền gửi


59.650

dịch tiền gửi của khách hàng với
ngân hàng

Nguồn: Tổng hợp từ big data
Mặc dù theo bảng 1.1 số khách hàng tham gia các loại dịch vụ nêu trên có sự
khác biệt về số lượng khách hàng. Tuy nhiên một khi các nhóm khách hàng này được
hợp thành một phai (được merged) số khách hàng có tham gia sử dụng thẻ tín dụng,
tham gia dịch vụ tiền vay, tham gia dịch vụ tiền gửi trong thời gian nghiên cứu của
12 tháng là 1.421 khách hàng.
1.3.2. Các khái niệm tiếp cận trong nghiên cứu
Khái niệm được sử dụng trong nghiêu cứu là phân khúc thị trường và giá trị
đóng góp của khách hàng theo thời gian (customer lifetime value). Việc phân khúc
thị trường đã được nhiều nghiên cứu trước đây thực hiện trong lĩnh vực ngân hàng
(Doğan, Ayçin, & Bulut, 2018) đã thực hiện phân khúc thị trường dựa vào các khái
niệm của RFM dựa trên nguồn dữ liệu big data của một công ty, trong đó R là
Recency, tức là thời gian mua hàng gần nhất tính đến thời điểm nghiên cứu. F là
Frequency là tần suất giao dịch của khách hàng trong thời gian mà nghiên cứu đang
thực hiện, chẳng hạn thời gian nghiên cứu là 6 tháng hoặc 12 tháng, tần suất giao dịch
hoặc mua hàng sẽ được tính toán. M là Monetary tức đo lường tổng giá trị mà khách
hàng mua sắm trong khoảng thời gian nghiên cứu. Tượng tự, (Khajvand & Tarokh,


8

2011) đã sử dụng mô hình RFM như nêu trên để hướng đến phân phúc thị trường
trong lĩnh vực ngân hàng bán lẻ. Sau khi xác định được từng giá trị của R, F, M, tác
giả thực hiện phân thành bốn phân khúc thị trường. Dựa vào RFM, Khajvad & Tarokh
đã xác định CLV của từng khách hàng.

Một cách khác biệt, để đo lường giá trị đóng góp của khách hàng theo thời
gian (CLV) trong lĩnh vực ngân hàng, (Kahreh, Tive, Babania, & Hesan, 2014) đã sử
dụng các giá trị doanh thu và chi phí hoạt động để các định giá trị đóng của khách
theo thời gian tham gia dịch vụ của khách hàng tại một ngân hàng. Tuy nhiên loại số
liệu sử dụng trong trường hợp này dựa vào nguồn khảo sát trực tiếp của tác giả.
Ở một trường khác, (Kim, Jung, Suh, & Hwang, 2006) đã sử dụng nguồn số
liệu từ big data trong lĩnh vực viễn thông với 200 biến và 16.384 dòng ghi lại hành vi
giao dịch của khách hàng để xác định CLV. Bước tiếp theo của việc tính toán CLV,
tác giả đã hướng đến phân khúc thị trường, trong đó phương pháp phân tích cây quyết
định (decision tree) được sử dụng để hướng đến nhóm các hành vi tiêu dùng.
Xuất phát từ các nhận định trên, nghiên cứu của luận văn lần này sẽ áp dụng
vào mô hình của (Khajvand & Tarokh, 2011) để tính RFM trước khi hướng đến phân
khúc thị trường. Việc tính toán CLV cũng sẽ được luận văn đề cập trong phần tiếp
theo.
1.3.3. Phạm vi nghiên cứu của luận văn
Nguồn dữ liệu chính là từ big data để khai thác hành vi tiêu dùng của khách
hàng, thời gian nghiên cứu của số liệu đối với khách hàng là 12 tháng, tính từ ngày
01/10/2018 đến ngày 30/10/2019. Mặc dù hệ thống ngân hàng Sacombank có mặt tất
cả các vùng trong cả nước, nhưng trong nghiên cứu này, số khách hàng được nghiên
cứu chỉ tập trung và khách hàng cá nhân và tham gia giao dịch tại thành phố Hồ Chí
Minh.
Mô hình ứng dụng trong nghiên cứu dựa vào các thuật toán. Đề tài không vận
dụng phương pháp định tính. Việc nghiên cứu này được thực hiện dựa trên sự đề xuất
của ban lãnh đạo tại ngân hàng. Đây là một nghiên cứu thực tế, kết quả nghiên cứu
để cho ra các chiến lược sẽ được triển khai vào đầu năm 2020.


9

1.3.4. Kết cấu của luận văn

Luận văn được chia làm 5 chương, với các nội dung sau:
Chương 1: Giới thiệu tổng quan về đề tài nghiên cứu
Chương 2: Cơ sở lý luận
Chương 3: Big data và ứng dụng của Big data tại Sacombank
Chương 4: Phân tích dữ liệu big data
Chương 5: Kết luận và đề xuất chiến lược


10

CHƯƠNG 2: CƠ SỞ LÝ LUẬN
2.1. Big Data
Dữ liệu lớn có thể bao gồm cả dữ liệu cấu trúc và không cấu trúc hay bán cấu
trúc. Các hoạt động được tạo lập trong hệ thống đều được Big Data ghi lại. Đối với
hoạt động kinh doanh, dữ liệu này sẽ ghi lại tất cả lịch sử tiêu dùng của khách hàng
trong suốt thời gian giao dịch, dữ liệu này sẽ ngày càng phong phú, đa dạng hơn theo
thời gian. Đây là nguồn dữ liệu hữu ích mà các tổ chức có thể sử dụng trong việc truy
vấn thông tin để phát triển chiến lược kinh doanh, hay tạo lập môi trường quản lý
chuyên nghiệp.
Hiểu được tầm quan trọng và “cơ hội kinh doanh” từ Big Data, hiện nay các
ngân hàng nước ngoài đang khai thác nguồn dữ liệu để xây dựng chiến lược kinh
doanh trên nhiều lĩnh vực chuyên môn và ngoài chuyên môn, từ phân tích tâm lý
khách hàng đến phân tích cơ hội kinh doanh trong việc bán chéo sản phẩm hay quản
lý doanh nghiệp.
Big Data đóng vai trò quan trọng trong việc truy xuất dữ liệu và hỗ trợ con
người đưa ra quyết định tốt hơn với cơ hội thành công cao hơn nhiều.
2.2. Khai thác dữ liệu (Data Mining)
Theo báo cáo của Markets and Markets thị trường Data Mining dự báo sẽ tăng
từ 591,2 triệu USD năm 2018 lên 1.039 triệu USD trong năm 2023. Đây chính là
minh chứng cho thấy xu hướng tiếp cận Data mining phục vụ cho khai thác giá trị từ

dữ liệu ở các công ty trên toàn cầu ngày càng mạnh mẽ.
Khai thác dữ liệu là một tập hợp, một hệ thống các phương pháp tính toán,
thuật toán được áp dụng cho các cơ sở dữ liệu lớn và phức tạp, mục đích loại bỏ các
chi tiết ngẫu nhiên, chi tiết ngoại lệ, khám phá các mẫu, mô hình, quy luật tìm ẩn, các
thông tin có giá trị trong bộ dữ liệu. Khai thác dữ liệu là thành quả công nghệ tiên
tiến ngày ngay, là quá trình khám phá các kiến thức vô giá bằng cách phân tích khối
lượng lớn dữ liệu đồng thời lưu trữ chúng ở nhiều cơ sở dữ liệu khác nhau (DataFlair).


11

Nguồn:
Biểu đồ 2.1. Quy trình khai thác dữ liệu
Dựa trên mô hình được trình bày tại biểu đồ 2.1 có thể phân quy trình khai
thác dữ liệu thành 2 quá trình: chuẩn bị dữ liệu (data preparation) và khai thác dữ liệu
(data mining) và 7 bước được mô tả chi tiết trong bảng 2.1.
Bảng 2.1. Các bước trong quá trình khai thác dữ liệu
Bước
1

2

3

Chức năng

Diễn giải

Làm sạch dữ liệu


Loại bỏ các dữ liệu nhiễu và dữ liệu không liên

(Cleaning)

quan, không đầy đủ thông tin

Tích hợp dữ liệu

Tổng hợp và lưu trữ dữ liệu từ nhiều nguồn khác

(Integration)

nhau trong một hệ cơ sở dữ liệu

Lựa chọn dữ liệu

Chọn ra những dữ liệu liên quan, có giá trị phân tích

(Selection)
4

Chuyển đổi dữ liệu

Chuyển đổi và hợp nhất dữ liệu theo các loại biến,

(Transformation)

định dạng khác nhau để phù hợp và dễ dàng cho việc
phân tích.



12

5

Khai thác dữ liệu

Xây dựng các thuật toán, phương pháp, các model

(Data mining)

phân tích khác nhau nhằm mục đích phát hiện, trích
xuất các thông tin hữu ích, giá trị tiềm năng từ
những mẫu dữ liệu.

Đánh giá mẫu dữ liệu Xác định mức độ chính xác, khả năng đem lại giá

6

(Evaluation)
7

trị thực sự và triển khai thực tế không.

Trình bày kết quả thu Thể hiện kết quả bằng các công cụ trực quan hóa,
được

sử dụng đồ thị, bảng, biểu đồ để diễn giải kết quả

(Knowledge)


đến người xem

Mặt khác, dựa trên các tiêu chí đặc điểm của một tổ chức, Xin-an Lai (2009)
đưa ra mô hình về quy trình khai thác dữ liệu bằng cách sử dụng mô hình phân khúc
khách hàng được mô tả trong biểu đồ 2.1
Khai thác dữ liệu là một trong những lợi thế các công ty trong ngành sản xuất,
kinh doanh, marketing nếu họ biết cách ứng dụng hợp lý để tăng cường hiệu quả hoạt
động. Các lợi ích cơ bản của khai thác dữ liệu như sau: hỗ trợ ra quyết định tự động,
hỗ trợ đưa ra dự báo chính xác, hỗ trợ giảm thiểu chi phí và hỗ trợ khả năng thấu hiểu
khách hàng. Đồng thời việc khai thác dữ liệu cũng được ứng dụng rộng rãi trong
nhiều lĩnh vực kinh doanh và ngành nghề và được phân theo từng chức năng nhiệm
vụ.
Bảng 2.2. Ứng dụng của khai thác dữ liệu
Phân theo chức năng nhiệm vụ
- Phân tích và quản lý thị trường

Phân theo ngành và lĩnh vực
- Tài chính ngân hàng

- Phân tích bên trong công ty và quản lý - Y tế chăm sóc sức khỏe
rủi ro

- Viễn thông

- Phát hiện và ngăn chặn hành vi phạm - Sales và Marketing
tội và lừa đảo

- E-ecommerce
- Bán lẻ và một số ngành nghề khác



13

2.3. Hành vi tiêu dùng
2.3.1. Định nghĩa
Hành vi người tiêu dùng là loại hình nghiên cứu hướng đến các đối tượng là
cá nhân hoặc tổ chức và cách mà các đối tượng chủ thể trên quyết định lựa chọn và
sử dụng sản phẩm, dịch vụ để thỏa mãn nhu cầu của bản thân, cũng như sự tác động
của quá trình đưa ra quyết định đó tới tâm lý số đông người tiêu dùng và xã hội.
Những tác nhân gây ảnh hưởng tới hành vi tiêu dùng chủ yếu là các tác động nội tại
và ngoại vi (Solomon, 2004). Điều này có thể do con người muốn trốn thoát khỏi
guồng công việc thường nhật, cải thiện chất lượng sống, tự thưởng công sức
(Danziger, 2004a), đẩy mạnh niềm tin vào bản thân, tìm kiếm trải nghiệm đáng nhớ,
trở nên đặc biệt và độc nhất (Danziger, 2004b), thể hiện cá tính, thể hiện địa vị xã hội
hoặc đáp ứng các nhu cầu tâm lý (Nia và Judith, 2000).
Một số các giả thuyết đã được đề xuất nhằm giải thích tại sao và bằng cách
nào mà người tiêu dùng chọn một loại sản phẩm nhất định (Bettman, 1970; Fishben,
1963; Fishbein và Ajzen, 1975; Mitchel và Olson, 1981; Rosenberg, 1950). Trong số
những nỗ lực lập ra để tạo nên số giả thuyết đó, các nhà nghiên cứu đã tập trung mạnh
vào cách thức mà người tiêu dùng phát triển thái độ bản thân đối với 1 sản phẩm, vì
thái độ với sản phẩm được cho rằng là mối liên kết giữa hành vi và sự chi tiêu. Ví dụ
cụ thể: dựa theo nghiên cứu của Fishbein và Ajzen (1975), có hai cấu kiện quan trọng
gây ảnh hưởng tới thái độ hướng tới sản phẩm: cấu trúc niềm tin và tiêu chí đánh giá
(Lee và Um, 1992). Đầu tiên, một người tiêu dùng có thể sẽ tin rằng ở mỗi một sản
phẩm sở hữu một vài các tính chất nhất định biết được là do tác động trực tiếp từ kinh
nghiệm bản thân hoặc gián tiếp thông qua các nhân vật đại diện cho thương hiệu hoặc
nguồn truyền thông công chúng. Thứ hai, người tiêu dùng có thể đánh giá một sản
phẩm chỉ với một số tính chất sản phẩm nhất định mà họ cảm thấy là đủ để áp đặt cho
việc đưa ra quyết định mua sản phẩm. Điều này cấu thành nên tiêu chí đánh giá chủ

đạo cho thái độ người mua hướng tới sản phẩm. Trong trường hợp như vậy, chúng ta
thường hay tranh cãi rằng khách hàng đưa ra quyết định là dựa vào nền tảng nhận xét,
cũng như có kiến thức về, tính chất sản phẩm (Geistfeld, và một số khác, 1977; Peter


14

và Olson, 1996; Wahlers, 1982). Trong một số trường hợp, người tiêu dùng có thể so
sánh giữa những lựa chọn có thể thay thế nhau tùy theo những tính chất của chúng và
chọn ra thứ họ ưa thích nhất. Trong một số khác, người tiêu dùng lại có thể đánh giá
riêng từng lựa chọn có mặt và đi theo hướng phù hợp nhất (Stephen và Simonson,
1997).
Tiêu chí đánh giá chủ yếu có thể sẽ khách quan, như giá cả, hoặc chủ quan,
như lợi ích cảm tính có từ việc sử dụng sản phẩm (Lee và Um, 1992). Tuy vậy, tiêu
chí đánh giá chính lại thường chỉ được đưa ra dưới dạng ý tưởng bởi vì các xúc tác
thông tin lọt vào 2 phạm trù lớn: nội tại và tác động ngoại vi (Lee và Lou, 1996;
Monroe và Dodds, 1988; Peter và Olson, 1996; Rao và Monroe, 1989; Richardson và
một số khác, 1994; Schelinck, 1983). Xúc tác nội tại là những tính chất có liên quan
đặc thù tới một 1 sản phẩm nhất định, có thể bao gồm các tính vật lý như hình dạng,
thiết kế, phong cách và nguyên, vật liệu (Lee và Lou, 1996; Ulgado và Lee, 1993).
Mặt khác, xúc tác ngoại vi không được coi là một phần vật chất của sản phẩm (mặc
dù vẫn liên quan đến nó). Nghiên cứu trước đây cho thấy rằng người tiêu dùng vận
dụng cả xúc tác nội tại và ngoại vi trong quá trình đánh giá sản phẩm (Lee và Lou,
1996; Monroe và Dodds, 1988; Peter và Olson, 1996; Rao và Monroe, 1989;
Richardson và một số khác, 1994; Schellinck, 1983). Có một quan điểm hay được
bàn đến đó là các xúc tác ngoại vi phổ biến hơn trong thực tế và có thể bao gồm
thương hiệu, giá, bao bì và xuất xứ (xem vd. Lee và Lou, 1996; Richardson và một
số khác, 1994). Nghiên cứu trước cũng cho rằng người tiêu dùng dễ nhận biết sự có
mặt của xúc tác ngoại vi hơn nên vì thế dựa vào chúng hơn khi đánh giá sản phẩm
nếu như đem so với các xúc tác nội tại (xem vd. Bettman và Park, 1980; Dodds và

một số khác, 1991; Han và Terpstra, 1988; Lee và Lou, 1996). Trong nghiên cứu của
Richardson và một số khác năm 1994 chẳng hạn, có xem xét về sự tương quan trong
độ quan trọng giữa xúc tác nội tại và ngoại vi trong việc nhận biết về chất lượng
thương hiệu trong 5 sản phẩm ở Mỹ (khoai tây cắt lát ăn liền thông thường, khoai tây
cắt lát ăn chấm kem kiểu Pháp, bánh quy hạt choco, phô mai cắt lát và thạch nho).


×