Tải bản đầy đủ (.pdf) (73 trang)

NGHIÊN CỨU HOẠT ĐỘNG KHAI PHÁ DỮ LIỆU TRONG MARKETING (DATA-MINING) CỦA CÁC HÃNG BÁN LẺ TRÊN THẾ GIỚI VÀ BÀI HỌC CHO CÁC DOANH NGHIỆP BÁN LẺ VIỆT NAM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.78 MB, 73 trang )

TRƢỜNG ĐẠI HỌC NGOẠI THƢƠNG
KHOA KINH TẾ VÀ KINH DOANH QUỐC TẾ
---------***---------

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

KHÓA LUẬN TỐT NGHIỆP
Chuyên ngành: Kinh tế đối ngoại

NGHIÊN CỨU HOẠT ĐỘNG KHAI PHÁ DỮ LIỆU
TRONG MARKETING (DATA-MINING) CỦA CÁC
HÃNG BÁN LẺ TRÊN THẾ GIỚI VÀ BÀI HỌC CHO
CÁC DOANH NGHIỆP BÁN LẺ VIỆT NAM


Họ và tên sinh viên : Nguyễn Văn Hải
Mã sinh viên: 1111110265
Lớp: Anh10 – Khối 3 KT
Khóa: 50

Ngƣời hƣớng dẫn khoa học: Ths. Trần Hải Ly

Hà Nội, tháng 5 năm 2015


MỤC LỤC

LỜI MỞ ĐẦU
CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU TRONG MARKETING ........................ 4

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu

aann
i iCC
HHoo

1.1 Giới thiệu chung về khai phá dữ liệu (Data-mining) ........................................................... 4
1.1.1 Tiền đề của khai phá dữ liệu ............................................................................................. 4
1.1.2 Khái niệm khai phá dữ liệu .............................................................................................. 7
1.1.3 Ứng dụng của khai phá dữ liệu trong các hoạt động kinh tế-xã hội ...................................... 7
1.2 Giới thiệu về khai phá dữ liệu trong Marketing ................................................................ 10
1.2.1 Khái niệm khai phá dữ liệu trong Marketing ................................................................... 10
1.2.2 Những điều kiện cho việc triển khai khai phá dữ liệu trong Marketing hiện nay.................. 10
1.2.3 Các bước của khai phá dữ liệu trong Marketing ............................................................... 13
1.2.4 Ứng dụng của khai phá dữ liệu trong Marketing .............................................................. 21
CHƢƠNG 2: HOẠT ĐỘNG KHAI PHÁ DỮ LIỆU CỦA MỘT SỐ HÃNG BÁN LẺ TRÊN THẾ
GIỚI .................................................................................................................................... 26
2.1 Giới thiệu chung về hoạt động khai phá dữ liệu trong ngành công nghiệp bán lẻ .............. 26
2.1.1 Sự gia tăng khối lượng dữ liệu ........................................................................................ 26
2.1.2 Sự tăng cường đầu tư công nghệ cho khai phá dữ liệu của các hãng bán lẻ ........................ 27
2.1.3 Xu hướng cá nhân hóa trải nghiệm mua sắm trong thương mại điện tử .............................. 27
2.1.4 Khó khăn trong nhận diện nhóm khách hàng giá trị ........................................................ 29
2.2 Phân tích hoạt động khai phá dữ liệu của một số hãng bán lẻ điển hình trên thế giới ....... 29
2.2.1 Hoạt động khai phá dữ liệu của Amazon ......................................................................... 29
2.2.2 Hoạt động khai phá dữ liệu của Kroger……………………………………………………....40
2.2.3 Hoạt động khai phá dữ liệu của Walmart ......................................................................... 44
2.2.4 Hoạt động khai phá dữ liệu của Tesco.............................................................................. 47
2.3 Đánh giá lợi ích khai phá dữ liệu mang lại cho hoạt động Marketing của một số hãng bán
lẻ trên thế giới. ................................................................................................................. 51


2.3.1 Tăng cường cá nhân hóa trong Marketing ........................................................................ 51

2.3.2 Cải thiện hệ thống phân phối, thu nhận đơn hàng.............................................................. 52
2.3.3 Quản lý nhà cung cấp tốt hơn ......................................................................................... 52
CHƢƠNG 3: BÀI HỌC CHO CÁC DOANH NGHIỆP BÁN LẺ VIỆT NAM TRONG VIỆC ÁP
DỤNG KHAI PHÁ DỮ LIỆU TRONG MARKETING ....................................................... 54

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

3.1 Thực trạng áp dụng hoạt động khai phá dữ liệu trong các doanh nghiệp bán lẻ Việt Nam
hiện nay ………................................................................................................................. 54
3.2 Một số bài học rút ra cho các doanh nghiệp bán lẻ Việt Nam trong việc triển khai áp dụng
khai phá dữ liệu. ............................................................................................................... 58
3.2.1 Các cách thức để thu thập thông tin khách hàng..................................................................... 59
3.2.2 Xây dựng đội ngũ Marketer lấy dữ liệu làm trung tâm ..................................................... 63

KẾT LUẬN ................................................................................................................................ 68
TÀI LIỆU THAM KHẢO


LỜI MỞ ĐẦU
1. Lý do chọn đề tài
Những tiến bộ trong thông tin liên lạc, giao thông vận tải và các công nghệ khác
đã làm cho thế giới ngày càng nhỏ lại. Xu hướng toàn cầu hóa đã và đang diễn ra

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

trên toàn thế giới, nền kinh tế của các nước ngày càng mở cửa và hội nhập sâu rộng.
Trong một môi trường cạnh tranh và ngày càng ảnh hưởng bởi các yếu tố quốc tế

như vậy, có lẽ sẽ không còn cơ hội cho những doanh nghiệp mà lợi nhuận, lợi ích
của công ty luôn được đặt lên hàng đầu trên cả lợi ích của khách hàng – những
“thượng đế” của họ. Ngày nay, những công ty thành công, đ ạt được vị trí vững chắc
trong lĩnh vực của mình không chỉ trên thế giới như: Amazon, Walmart…mà còn cả
ở Việt Nam như: Vinamilk, Viettel… đều có một điểm chung. Đó là họ đều chú
trọng và tập trung tối đa tới việc tạo ra giá trị cho khách hàng và xây dựng quan hệ
với họ thông hoạt động Marketing c ủa mình. Sự cạnh tranh giữa các doanh nghiệp
đã trở thành cuộc đua về thấu hiểu tâm lý, hành vi khách hàng. Trong bối cảnh đó,
các công ty ngày càng nhận ra rằng thông tin về khách hàng là một trong những tài
sản quan trọng mà các công ty nắm giữ bởi ẩn chứa trong đó là những tri thức,
những hiểu biết mới về khách hàng – điều mà các doanh nghiệp luôn luôn tìm kiếm.
Trong những năm gần đây với xu hướng áp dụng công nghệ trong hoạt động
Marketing, khai phá dữ liệu đã nổi lên như là một công cụ hữu ích giúp các doanh
nghiệp có cái nhìn toàn diện hơn về khách hàng của mình. Có thể nói, khai phá dữ
liệu như là một bộ máy giúp doanh nghiệp sàng lọc nguồn dữ liệu khổng lồ mà họ
đang nắm giữ nhưng chưa biết cách tận dụng để tìm ra những thông tin có ích,
những khám phá mới về khách hàng, từ đó tạo điều kiện cho doanh nghiệp có
những hành động phù hợp mang lại nhiều giá trị cho khách hàng hơn nữa. Qua việc
được học môn Marketing ở trường Đại học Ngoại Thương cộng với sự hứng thú mà
khai phá dữ liệu đem lại, em đã quyết định lựa chọn mảng đề tài về khai phá dữ liệu
trong Marketing để thực hiện bài khóa luận của mình.
2. Mục tiêu nghiên cứu

1


Một trong những lí do cơ bản khái niệm khai phá dữ liệu vẫn còn khá xa lạ trong
hoạt động Marketing đó là hoạt động này liên quan tới rất nhiều vấn đề kỹ thuật,
công nghệ thông tin với các khái niệm thuật toán…rất khó hiểu với một nhà kinh
doanh thông thường. Tuy nhiên trong thời đại ngày nay, khi mà việc chăm sóc

khách hàng và xây dựng quan hệ với khách hàng quyết định sự thành công của

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

doanh nghiệp hơn bao giờ hết cùng với việc khai phá dữ liệu ngày càng chứng tỏ
được lợi ích của mình trong việc giúp doanh nghiệp tạo lập và duy trì quan hệ với
khách hàng thì việc có những hiểu biết nhất định về khai phá dữ liệu sẽ giúp cho
các doanh nghiệp có được sự thuận lợi trong việc xây dựng hoạt động Marketing
hiện đại và hiệu quả. Vì thế, khóa luận sẽ tiếp cận hoạt động khai phá dữ liệu với
việc hạn chế đi sâu vào các thuật ngữ, khái niệm…liên quan đến công nghệ thông
tin với mục tiêu giúp người đọc có được cái nhìn khái quát về khai phá dữ liệu và
không còn cảm thấy đây là một khái niệm xa lạ và mang nặng tính toán học, kỹ
thuật. Cùng với đó là các ví dụ về sự thành công trong việc áp dụng khai phá dữ liệu

của một số hãng bán lẻ lớn trên thế giới đồng thời góp ý, kiến nghị một số giải pháp
cho các doanh nghiệp bán lẻ Việt Nam vốn vẫn đang đứng ngoài cuộc chơi mang
tên khai phá dữ liệu.

3. Phạm vi nghiên cứu

Phạm vi nghiên cứu của khóa luận là hoạt động khai phá dữ liệu trong Marketing
đang được áp dụng tại các hãng bán lẻ lớn trên thế giới như Amazon, Kroger,
Walmart…từ đó có những liên hệ và đưa ra một số kiến nghị giúp các doanh nghiệp
bán lẻ Việt Nam có được sự chuẩn bị cần thiết để triển khai khai phá dữ liệu.
4. Kết cấu của khóa luận

Ngoài phần mở đầu, phần kết luận và phần phụ lục, khóa luận được chia thành 3
chương:
Chương 1: Tổng quan về khai phá dữ liệu trong Marketing
Chương 2: Hoạt động khai phá dữ liệu của một số hãng bán lẻ trên thế giới

2


Chương 3: Bài học cho các doanh nghiệp bán lẻ Việt Nam trong việc áp
dụng khai phá dữ liệu trong Marketing.
5. Lời cảm ơn
Em xin chân thành c ảm ơn sự hướng dẫn và chỉ bảo tận tình của Ths. Trần Hải Ly

UU
FFTT
SSuu
aann
i iCC

HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

giảng viên môn Marketing, cô đã giúp đỡ em rất nhiều trong suốt quá trình viết bài
khóa luận tốt nghiệp này.

Do hạn chế về tài liệu và khả năng của người viết, khóa luận sẽ không tránh khỏi
những sai sót, rất mong nhân được ý kiến đóng góp quý báu của thầy cô, bạn bè và
độc giả.

Xin chân thành cảm ơn!

Hà nội, ngày 22 tháng 4 năm 2015
Sinh viên thực hiện

3

Nguyễn Văn Hải



CHƢƠNG 1: TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU TRONG
MARKETING
1.1 Giới thiệu chung về khai phá dữ liệu (Data-mining)
1.1.1 Tiền đề của khai phá dữ liệu

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

Sự phát triển của công nghệ thông tin và việc ứng dụng công nghệ thông tin trong
nhiều lĩnh vực của đời sống, kinh tế xã hội trong nhiều năm qua cũng đồng nghĩa
với lượng dữ liệu đã được các công ty, tổ chức thu thập và lưu trữ ngày một tích luỹ
nhiều lên. Ngày nay, chúng ta đang sống trong thời đại mà dòng chảy của thông tin
luôn luôn được tạo ra và thu thập một cách liên tục. Khi bạn nhấc điện thoại đặt

hàng một món hàng quảng cáo trên tivi, chi tiết cuộc gọi sẽ ngay lập tức được công
ty viễn thông lưu giữ: thời gian gọi, số máy gọi đến…Những thông tin này cùng với
tên, địa chỉ…sẽ làm cơ sở cho công ty viễn thông tính phí. Khi nhân viên c ủa công
ty rao bán sản phẩm nhấc máy, tiếp tục một loạt các thông tin được tạo ra và lưu giữ
khi họ hỏi về tên, địa chỉ, chi tiết đơn đặt hàng: số lượng sản phẩm, màu sắc, mẫu
mã, mã thẻ thanh toán…của bạn. Chưa dừng lại ở đó, khi mã số thẻ thanh toán được
chuyển tới ngân hàng phát hành thẻ để xác nhận, hệ thống thông tin của ngân hàng
lại tiếp tục lưu giữ một loạt các thông tin về hoạt động thanh toán bạn đã thực hiện.
Khi hàng được giao đến tay bạn qua công ty chuyển phát, thông tin lại tiếp tục được
tạo ra và lưu trữ. Những thông tin giao dịch này trước hết được lưu trữ nhằm đáp
ứng nhu cầu hoạt động thường ngày của các công ty, tổ chức để theo dõi hoạt động
kinh doanh. Tuy nhiên, chúng còn có thể trở thành “mỏ vàng” nơi mà các thông tin
quý giá về khách hàng còn chưa được hé lộ. Ví dụ, doanh nghiệp bán hàng dựa trên
dữ liệu mua hàng có thể biết được những loại mặt hàng nào bạn hay mua từ đó điều
chỉnh chính sách khuyến mãi phù hợp, tương tự với ngân hàng, công ty viễn
thông… Một trong những công cụ hữu ích giúp khai thác những thông tin đó chính
là khai phá dữ liệu. Khai phá dữ liệu có thể hiểu như là một hoạt động khám phá ra
những tri thức mới, tiềm ẩn trong một kho dữ liệu khổng lồ, muốn hoạt động khai
phá dữ liệu diễn ra đầu tiên phải có dữ liệu (Data). Quá trình chuẩn bị dữ liệu cho

4


khai phá dữ liệu trải qua 2 bước Thu thập dữ liệu và Tổ chức dữ liệu. Mối quan hệ
này được thể hiện qua Hình 1.1:
Hình 1.1 Các bƣớc tiền đề cho khai phá dữ liệu

Thu thập dữ liệu

Khai phá dữ liệu


Tổ chức dữ liệu

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

Nguồn: Michael J.A.Berry and Gordon S.Linoff , 2004, Data-mining techniques

1.1.1.1 Thu thập dữ liệu

Mỗi lần doanh nghiệp tương tác, giao dịch với khách hàng chính là lúc mà
thông tin, dữ liệu về khách hàng được tạo ra và sự phát triển của công nghệ thông
tin càng làm cho việc thu thập thông tin này trở lên dễ dàng và tự động. Thông
thường, một doanh nghiệp khi xây dựng kho dữ liệu khách hàng thường cần thu

thập các loại thông tin sau:


Thông tin cơ bản về khách hàng bao gồm: tên tuổi, địa chỉ, trình độ, gia
đình, mối quan hệ, cuộc sống, cá tính, kinh nghiệm và những thông tin
bổ sung khác liên quan đến khách hàng.



Thông tin tài chính: hình thức thanh toán trả trực tiếp bằng tiền mặt hay
thông qua tài kho ản nếu bàng tài khoản thì là loại hình tài khoản nào
v.v...



Thông tin về hành vi khách hàng: thông tin này cho biết chi tiết các giao
dịch với khách hàng, mỗi lần mua những gì, bao nhiêu, tần suất mua
hàng như thế nào, thời gian mua sắm vào lúc nào v.v..., ngoài ra, nó còn
bao gồm các thông tin như phản ứng của khách hàng đối với hoạt động
điều tra…

Các thông tin về khách hàng thường được thu thập qua các phương thức sau:


Qua đơn đặt hàng, hóa đơn thanh toán: Đây là phương thức cơ bản giúp
doanh nghiệp thu thập thông tin khách hàng. Nếu giao dịch bằng hình

5



thức online, doanh nghiệp có thể đề nghị khách hàng cho biết thông tin
chi tiết qua gợi ý: “Nhằm giúp chúng tôi hiểu hơn, đưa đến những sản
phẩm phù hợp hơn với nhu cầu của bạn xin hãy điền một số thông tin
sau…”


Qua khảo sát: khảo sát giúp doanh nghiệp có được môt lượng thông tin

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

đáng kể về khách hàng. Tuy một số người được hỏi sẽ nghi ngại khi cung
cấp thông tin cá nhân nhưng sẽ vẫn có nhiều khách hàng sẵn sàng cung
cấp đặc biệt những người thực sự quan tâm về sản phẩm. Điều này cũng

giúp doanh nghiệp có được cái nhìn rõ hơn về đối tượng khác hàng của
mình.



Qua các cuộc thi: tổ chức các cuộc thi với yêu cầu khách hàng cung c ấp
thông tin cá nhân như: tên tuổi, địa chỉ email…cũng là một cách thu thập
dữ liệu phổ biến đặc biệt hiệu quả với nhóm khách hàng trẻ.



Qua các công c ụ online như Google Analytics có thể giúp doanh nghiệp
theo dõi thói quen mua sắm, sở thích của khách hàng bằng cách theo dõi
lịch sử ghé thăm website, các thông tin tìm kiếm..mà khách hàng thực
hiện.



Ngoài ra các bài nghiên cứu, thống kê đã được tiến hành bởi các tổ chức,
công ty chuyên về thu thập, thống kê và phân tích dữ liệu cũng là một
nguồn quan trọng giúp doanh nghiệp có được bức tranh chi tiết hơn về
khách hàng của mình.

1.1.1.2 Tổ chức dữ liệu

Một doanh nghiệp lấy khách hàng làm trung tâm sẽ thu thập mọi thông tin qua
các lần tiếp xúc với khách hàng. Tuy nhiên, việc tìm hiểu khách hàng đòi hỏi nhiều
hơn đơn thuần là thu thập dữ liệu. Thực tế, rất nhiều công ty thu thập hàng trăm
gigabyte thậm chí tetrabyte dữ liệu về khách hàng nhưng những gì họ “học” được
gần như bằng không. Để quá trình khai phá dữ liệu được diễn ra, dữ liệu từ nhiều

nguồn – thông tin thanh toán, hóa đơn, thông tin cuộc gọi, thông tin khuyến mãi,
các cuộc điều tra, khảo sát…tất cả phải được tập hợp lại và được tổ chức theo một

6


cách thống nhất và thuận tiện cho việc tiếp cận dữ liệu. Đó chính là bản chất của Tổ
chức dữ liệu nhằm tạo ra một Kho dữ liệu (Data Warehouse) phục vụ khai phá dữ
liệu. Một kho dữ liệu tốt sẽ cho phép truy cập vào các thông tin thu thập được từ các
giao dịch trong một phương thức thân thiện hơn nhiều so với cách nó được lưu trữ
trong hệ thống riêng rẽ từ các bộ phận như: bộ phận kế toán đến bộ phận sales… .

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo


Lý tưởng nhất, dữ liệu sẽ được thu thập từ nhiều nguồn khác nhau, phân loại, sát
nhập, gắn với các khách hàng cụ thể.
1.1.2 Khái niệm khai phá d ữ liệu

Sau khi quá trình thu thập và tổ chức dữ liệu được diễn ra, cơ sở dữ liệu được
tạo ra đóng vai trò như là bộ nhớ của doanh nghiệp, tuy nhiên chỉ có bộ nhớ thôi
chưa đủ, doanh nghiệp phải biết cách sàng lọc bộ nhớ của mình để có thể nhận biết,
học hỏi được những tri thức mới về khách hàng từ đó nâng cao hiệu quả kinh doanh.
Và khai phá dữ liệu chính là công cụ để tiến hành. Sau đây là một số số định nghĩa
mang tính mô tả của nhiều tác giả khái niệm về khai phá dữ liệu (Data-mining).
Định nghĩa của Parsaye: “Khai phá dữ liệu là quá trình trợ giúp quyết định, trong
đó chúng ta tìm kiếm các mẫu thông tin chưa biết và bất ngờ trong cơ sở dữ liệu lớn”
Định nghĩa của Ferruzza: “Khai phá dữ liệu là tập hợp các phương pháp được
dùng trong tiến trình khám phá tri thức để chỉ ra sự khác biệt các mối quan hệ và
các mẫu chưa biết bên trong dữ liệu”

Định nghĩa của Fayyad: “Khai phá dữ liệu (data mining) là quá trình khám phá
các tri thức mới và các tri thức có ích ở dạng tiềm năng trong nguồn dữ liệu đã có”.
1.1.3 Ứng dụng của khai phá dữ liệu trong các hoạt động kinh tế-xã hội
Khai phá dữ liệu có thể được ứng dụng trong nhiều lĩnh vực tùy thuộc vào mục
tiêu của doanh nghiệp, tổ chức. Hiện nay, nhiều ngành có thể áp dụng công nghệ
khai thác dữ liệu để nâng cao hiệu quả hoạt động như sản xuất, tài chính ngân hàng,
y tế, bảo hiểm, viễn thông, bán lẻ …

7


1.1.3.1 Ứng dụng của khai phá dữ liệu trong sản xuất
Khai phá dữ liệu có thể được áp dụng trong các ngành công nghiệp sản xuất để

mô hình hóa hệ thống sản xuất, kiểm soát quá trình s ản xuất, đánh giá an toàn, lập
kế hoạch và tiến trình lập kế hoạch. Khai phá dữ liệu giúp máy móc và thiết bị trở

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

nên thông minh và độc lập hơn. Ví dụ, khai phá dữ liệu được sử dụng để vận hành
xe hơi tự lái của Google hay mẫu xe Toyota Prius được trang bị máy ảnh, GPS cũng
như các máy tính mạnh mẽ và bộ cảm biến để lái xe an toàn trên đường mà không
có sự can thiệp của con người. Khai phá dữ liệu cũng được sử dụng để tối ưu hóa
lượng điện năng sử dụng dữ liệu từ công-tơ thông minh.

1.1.3.2 Ứng dụng của khai phá dữ liệu trong tài chính ngân hàng
Khai phá dữ liệu được sử dụng trong ngân hàng các tổ chức tài chính khác để

phân tích thanh toán tiền vay, phân tích chính sách tín dụng của khách hàng, mục
tiêu tiếp thị, phát hiện rửa tiền và tội phạm tài chính khác… Một ví dụ từ ngân hàng
China Merchants Bank (CMB), Trung Quốc cho thấy hiệu quả của việc ứng dụng
khai phá dữ liệu để thu hút khách hàng, ngân hàng sử dụng dịch vụ tích điểm và đổi
điểm. Ngân hàng cũng sử dụng mô hình cảnh báo khả năng người dùng ngưng sử
dụng dịch vụ để xây dựng các gói dịch vụ tín dụng lãi suất cao nhằm giữ chân
khách hàng đồng thời, thông qua việc phân tích dữ liệu các giao dịch, các khách
hàng tiềm năng là các doanh nghiệp nhỏ cũng được xác định một cách hiệu quả.
Hoạt động quản lý rủi ro đã được cải thiện đáng kể nhờ những tác động của khai
phá dữ liệu. Trước đây, hoạt động phân tích các tình huống rủi ro chủ yếu phụ thuộc
vào việc phân tích khách hàng, các danh mục đầu tư, độ tin cậy tín dụng. Hiện nay,
với những nguồn dữ liệu từ các phương tiện truyền thông xã hội cho phép tạo ra
những hiểu biết mới về các danh mục rủi ro của khách hàng. Các dữ liệu thu được
từ nhiều nguồn làm tăng khả năng phát hiện các hoạt động gian lận sớm hơn so với
các phương pháp hiện hành.
1.1.3.3 Ứng dụng của khai phá dữ liệu trong y tế

8


Tài nguyên dữ liệu của các bệnh viện đến từ nhiền nguồn khác nhau như thông
tin bệnh nhân, lịch sử bệnh án, dữ liệu về máy móc, vật tư, thông tin nhà cung cấp,
dữ liệu hoạt động của các phòng ban… Những nguồn dữ liệu này nếu được lưu trữ
và phân tích hợp lý sẽ tạo ra nguồn thông tin có giá trị về bệnh nhân, về nhà cung
cấp và hoạt động của các bộ phận giúp các bác sĩ xác định phương pháp điều trị phù

UU
FFTT
SSuu
aann

i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

hợp, hiệu quả nhất và những bệnh nhân nhận được dịch vụ chăm sóc sức khỏe tốt
hơn và giá cả phải chăng hơn.

1.1.3.4 Ứng dụng của khai phá dữ liệu trong viễn thông

Khai phá dữ liệu được ứng dụng vào việc phân tích dữ liệu, thói quen, tâm lý,
nhu cầu của khách hàng để làm cơ sở cho các hoạt động kinh doanh của các doanh
nghiệp viễn thông. Ngoài ra có thể áp dụng khai phá dữ liệu để duy trì khách hàng,
để xác định mô hình viễn thông, bắt các hoạt động gian lận, phát hiện xâm nhập, tận
dụng tốt hơn nếu các nguồn lực và nâng cao chất lượng dịch vụ.

1.1.3.5 Ứng dụng của khai phá dữ liệu trong khoa học, kĩ thuật máy tính
Khai phá dữ liệu được ứng dụng trong khoa học, kỹ thuật máy tính để nâng cao
hiệu quả của hệ thống giám sát, cải thiện hiệu năng hệ thống, phân tích lỗi hệ thống
máy tính, phát hiện xâm nhập mạng và nhận ra trục trặc hệ thống, cô lập lỗi phần

mềm, phần mềm phát hiện đạo văn…UPS, công ty chuyển phát hàng lớn nhất thế
giới, từ lâu đã dựa vào dữ liệu để cải thiện hoạt động. Trong năm 2009, công ty đã
bắt đầu cài đặt các thiết bị cảm biến trong các xe giao hàng để chụp tốc độ của xe
hay kiểm tra xem người lái xe có thắt dây an toàn đúng cách. Các thông tin về lộ
trình được tải lên một trung tâm dữ liệu của UPS vào cuối ngày và chúng sẽ được
phân tích ngay trong đêm. Bằng cách kết hợp thông tin GPS và dữ liệu từ các thiết
bị cảm biến trên hơn 46.000 xe, trong năm 2011, UPS giảm tiêu thụ nhiên liệu đến
8,4 triệu gallon và cắt giảm 85 triệu dặm trên các tuyến đường.
1.1.3.6 Ứng dụng của khai phá dữ liệu trong ngành công nghiệp bán lẻ

9


Trong ngành công nghiệp bán lẻ, khai phá dữ liệu có thể được sử dụng để giới
thiệu và tư vấn sản phẩm phù hợp cho khách hàng, xác định khách hàng mang lại
giá trị cao cho doanh nghiệp để nâng cao chất lượng phục vụ cho họ, phân tích hiệu
quả của các chiến dịch bán hàng….Những ứng dụng này sẽ được làm rõ ở phần sau
của chương.

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC

HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

1.2 Giới thiệu về khai phá dữ liệu trong Marketing
1.2 .1 Khái niệm khai phá dữ liệu trong Marketing

Marketing là quá trình mà doanh nghiệp tạo ra giá trị cho khách hàng và xây
dựng mối quan hệ vững mạnh với khách hàng để thu lại được giá trị từ họ. Mục tiêu
hàng đầu của Marketing chính là nhằm thỏa mãn các nhu cầu của khách hàng. Vì
thế, theo định nghĩa của Parsaye hoạt động khai phá dữ liệu trong Marketing có thể
hiểu chính là quá trình khám phá các tri thức mới và các tri thức có ích ở dạng tiềm
năng trong nguồn dữ liệu đã có nhằm mục đích cải thiện hoạt động Marketing của
doanh nghiệp. Khai phá dữ liệu mang đến cho doanh nghiệp những tri thức mới,
những hiểu biết mới về khách hàng của mình. Việc doanh nghiệp thấu hiểu khách
hàng một cách sâu hơn sẽ tạo điều kiện lập và triển khai những hành động phù hợp
và hiệu quả nhằm thỏa mãn nhu cầu của khách hàng, mang lại giá trị cho họ.
1.2.2 Những điều kiện cho việc triển khai khai phá dữ liệu trong Marketing hiện
nay

Hầu hết các kỹ thuật khai thác dữ liệu được mô tả trong khóa luận đã tồn tại từ
lâu, ít nhất là trong lĩnh vực toán học, trong nhiều năm hoặc nhiều thập kỷ. Tuy
nhiên, chỉ trong khoảng một thập kỷ gần đây việc khai phá dữ liệu thương mại mới
được triển khai với sự đầu tư quy mô lớn. Điều này là do các hội tụ của nhiều yếu tố,
trong đó phải kể đến:


1.2.2.1 Khối lượng dữ liệu được tạo ra ngày càng lớn
Khai phá dữ liệu ý nghĩa nhất khi có khối lượng lớn dữ liệu. Trong thực tế, hầu
hết các thuật toán khai phá dữ liệu đòi hỏi một lượng lớn dữ liệu để xây dựng và

10


chạy các mô hình mà sau đó sẽ được sử dụng để thực hiện các chức năng như P hân
loại (Classification), Dự đoán (Prediction) , Ước lượng (Estimation) hoặc các chức
năng khai phá dữ liệu khác. Đặc biệt, khai phá dữ liệu có vai trò rất quan
trọng trong ngành công nghiệp bán lẻ do dữ liệu thu thập từ lĩnh vực này rất lớn từ
doanh số bán hàng, lịch sử mua hàng của khách hàng, vận chuyển hàng hóa, tiêu thụ

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC

HHoo

và dịch vụ. Những năm gần đây, sự tự động hóa trong việc thu thập dữ liệu đã diễn
ra mạnh mẽ trong ngành công nghiệp bán lẻ với sự gia tăng sử dụng các máy quét
thanh toán tại các điểm siêu thị, thẻ tín dụng và thẻ ghi nợ, mua sắm trực tuyến,
chuyển tiền điện tử, xử lý đơn hàng tự động, bán vé điện tử, và các phương tiện
khác làm cho dữ liệu đang được sản xuất và thu thập ở mức chưa từng có. Điều tự
nhiên là khối lượng dữ liệu từ ngành công nghiệp này sẽ tiếp tục tăng lên nhanh
chóng và dễ dàng thu thập bởi tính sẵn có trên môi trường Web.
1.2.2.2 Dữ liệu được tổ chức hợp lý

Không chỉ là một số lượng lớn các dữ liệu đang được sản xuất, mà việc thu thập
chúng từ các hoạt động riêng lẻ như: thanh toán, đ ặt hàng, hỗ trợ khách hàng… để
đưa vào một kho dữ liệu chung cũng ngày càng phổ biến. Nói cách khác việc tổ
chức dữ liệu đang ngày càng phổ biến trong các doanh nghiệp. Kho dữ liệu tập hợp
dữ liệu từ nhiều nguồn khác nhau trong một định dạng phổ biến với và phù hợp với
từng nhóm, lĩnh vực..sẽ làm đơn giản hóa và nâng cao độ tin cậy của khai phá dữ
liệu.

1.2.2.3 Khả năng của máy tính được nâng cao

Các thuật toán khai phá dữ liệu thông thường cần một lượng lớn dữ liệu được tính
toán, xử lý. Việc tiếp tục giảm mạnh trong giá của bộ nhớ và sự tăng cường sức
mạnh xử lý của máy tính đã tạo điều kiện cho việc áp dụng các kỹ thuật mà trước
đây chỉ có thể tiến hành trong một số phòng thí nghiệm do chính phủ tài trợ vào các
doanh nghiệp thông thường.
1.2.2.4 CRM (Customer Relationship Management: Quản lý quan hệ khách
hàng) ngày càng được các doanh nghiệp quan tâm.
11



Để tạo ra giá trị cho khách hàng và xây dựng quan hệ thân thiết với họ, doanh
nghiệp trước tiên cần có được sự hiểu biết sâu sắc về nhu cầu và ước muốn của
khách hàng. Đó chính là chìa khóa t ạo ra lợi thế cạnh tranh. Có thể nói, trong thị
trường đầy tính cạnh tranh như hiện nay, cuộc đua giành lợi thế cạnh tranh thực
chất chính là cuộc đua xem ai là người thấu hiểu khách hàng hơn. Để làm được điều

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

đó, doanh nghiệp cần phải biết tận dụng được nguồn thông tin khách hàng mà mình
đang nắm giữ. Một doanh nghiệp thông minh sẽ lưu giữ thông tin của mọi giao dịch,
tương tác với khách hàng bao gồm: hoạt động mua hàng, liên hệ với đội ngũ bán
hàng, trung tâm tư vấn, các lần khách hàng ghé thăm website, thông tin t ừ các cuộc

khảo sát độ hài lòng, các nghiên cứu về tiêu dùng khác… Tuy nhiên, điều này cũng
khiến cho doanh nghiệp có thể bị “ngập lụt” trong lượng thông tin khổng lồ mà
mình đang nắm giữ, giờ đây cái họ cần hơn cả chính là làm sao để tận dụng tối ưu
được nguồn thông tin mà mình đang có, sàng lọc ra được những thông tin có giá trị
chứ không phải càng nhiều thông tin càng tốt. Làm sao để có thể phân tích, sử dụng
thông tin về khách hàng đã trở thành một vấn đề ngày càng được các doanh nghiệp
quan tâm. Để giải quyết được bài toán này, nhiều doanh nghiệp đã tìm đến
CRM (Customer Relationship Management: Quản lý quan hệ khách hàng) để quản
lí các thông tin chi tiết về từng khách hàng cũng như các giao dịch, tương tác với
khách hàng nhằm tối đa hóa lòng trung thành c ủa khách hàng. CRM chính là một
phương pháp giúp các doanh nghiệp tiếp cận và giao tiếp với khách hàng một cách
có hệ thống và hiệu quả thông qua việc quản lý các thông tin c ủa khách hàng như
thông tin về tài khoản, nhu cầu, liên lạc… nhằm phục vụ khách hàng tốt hơn. CRM
mới chỉ thực sự bùng nổ và được ứng dụng rông rãi trong đầu những năm 2000.
Trong năm 2011, các công ty trên toàn thế giới đã sử dụng 7.8 tỷ USD cho triển
khai ứng dụng CRM và trong năm 2012, con số này đã tăng lên thành 13.3 tỷ USD.
Về cơ bản, CRM bao gồm 2 thành phần chính là kho cơ sở dữ liệu và các công cụ
phân tích dữ liệu. Khai phá dữ liệu đại diện cho một cú nhảy vọt trong công cuộc
cải tiến các công cụ phân tích dữ liệu. Những phần mềm khai phá dữ liệu hiện đại
nhất có khả năng khám phá ra những quy luật, mối liên kết trong một kho dữ liệu
chỉ trong vài giờ trong khi với các công cụ phân tích khác phải mất hàng năm.

12


Chính điều này đã mang lại các cơ hội marketing cho doanh nghiệp. Tóm lại, với
việc các doanh nghiệp ngày càng tỏ ra quan tâm tới việc sử dụng CRM để hiểu
khách hàng của mình sâu hơn thì khai phá dữ liệu với vai trò như là lòng cốt của
CRM càng nhận được sự quan tâm của các doanh nghiệp và có cơ hội được đón
nhận rộng rãi.


UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

1.2.2.5 Sự ra đời của các phần mềm phục vụ cho khai phá dữ liệu
Luôn luôn có một độ trễ giữa thời gian khi các thuật toán mới lần đầu xuất hiện
trên các tạp chí học thuật hay các cuộc thảo luận tại các hội nghị và thời gian khi
phần mềm thương mại kết hợp với những thuật toán đó trở nên có sẵn. Còn có một
độ trễ giữa sự ra đời ban đầu của các phần mềm này và thời gian mà nó đạt được
chấp nhận rộng rãi. Đối với khai thác dữ liệu, độ trễ trên ngày càng được rút ngắn.
Nhiều kỹ thuật được thảo luận trong khóa luận này bắt đầu trong lĩnh vực toán học
thống kê, chế tạo máy. Trước đây, chúng chỉ được sử dụng các trường đại học và
các phòng thí nghiệm của chính phủ, sau đó mới bắt đầu được sử dụng bởi các công
ty trong lĩnh vực thương mại nhằm phục vụ cho mục đích thương mại. Tuy nhiên,

tại thời điểm này, trong sự phát triển của thời đại công nghệ, các phần mềm sau khi
được một vài người tiên phong thành công với một kỹ thuật mới, thời gian nó trở
thành sản phẩm thực sự và được sử dụng rộng rãi ngày càng được rút ngắn. Việc
giới thiệu thành công của phần mềm khai phá dữ liệu bởi các nhà cung cấp lớn như
Oracle, Teradata, và IBM... đã mang lại sức mạnh xử lý cũng như tăng cường khả
năng ứng dụng khai phá dữ liệu cho các doanh nghiệp.

1.2.3 Các bước của khai phá d ữ liệu trong Marketing

Dữ liệu có vai trò cốt lõi trong mọi quá trình kinh doanh của công ty. Thêm vào
khối lượng dữ liệu nội bộ khổng lồ đó là các nguồn dữ liệu bên ngoài liên quan tới
nhân khẩu học, lối sống…các thông tin liên quan tới tín dụng, tài chính,
marketing…. Mục tiêu của khai phá dữ liệu là để tìm ra mô hình, quy luật,xu
hướng.. thú vị ẩn trong những cơ sở dữ liệu lên tới tỷ và nghìn tỷ byte. Chỉ việc tìm
kiếm mô hình, quy luật là không đủ. Doanh nghiệp phải có những hành động cụ thể

13


nhằm đáp lại những mô hình thu được để biến dữ liệu thành thông tin, thông tin
thành hành động và hành động thành giá trị. Để đạt được điều này, khai phá dữ liệu
thường trải qua 4 bước. Bốn bước này tạo thành một vòng tuần hoàn nối tiếp nhau
và được mô hình như trong Hình 1.2.

UU
FFTT
SSuu
aann
i iCC
HHoo

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

Hình 1.2 Bốn bƣớc của khai phá dữ liệu trong Marketing

M ô hình hóa dữ liệu

Xác định cơ hội

Hành động dựa trên thông

kinh doanh

tin thu được

Đo lường kết quả

Nguồn: Michael J.A.Berry and Gordon S.Linoff , 2004, Data-mining techniques

1.2.3.1 Xác định các cơ hội kinh doanh


Công đoạn đầu tiên của khai phá dữ liệu là việc nhận diện cơ hội kinh doanh. Thật
không may, có rất nhiều các nhà thống kê và phân tích mà sau khi tiến hành khai
phá dữ liệu kết quả thu được là lãng phí vì họ đang giải quyết vấn đề mà không giúp
đỡ các doanh nghiệp. Để tránh lãng phí, đầu tiên khai phá dữ liệu phải đi kèm với

14


một sự sẵn sàng hành động trên các kết quả mà khai phá dữ liệu đem lại. Nhiều hoạt
động Marketing rất phù hợp với khai phá dữ liệu như:


Lập kế hoạch cho việc giới thiệu sản phẩm mới



Lập kế hoạch cho các chiến dịch Marketing trực tiếp (direct marketing



UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu

aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

campaigns)

Nghiên cứu độ trung thành của khách hàng

1.2.3.2 Mô hình hóa dữ liệu

Khai phá dữ liệu biến đổi dữ liệu thành các thông tin ý nghĩa về mặt kinh doanh.
Trong giai đoạn này, các thuật toán sẽ được sử dụng để giải các bài toán nhằm tìm
kiếm những qui tắc bí ẩn và chưa biết. Các bài toán được phân loại vào một trong
những nhóm bài toán chính trong khai phá dữ liệu. Đó là Phân lớp (Classification),
Dự đoán (Prediction), Tìm luật liên kết (Association Rule), Phân c ụm (Clustering).
 Phân lớp (Classification)

Bài toán thông dụng nhất trong khai phá dữ liệu là Phân lớp (Classification). Phân
loại là một trong những hoạt động thiết yếu với con người. Để hiểu và giao tiếp với
thế giới xung quanh, chúng ta không ngừng phân loại, phân chia các đối tượng khác
nhau vào những nhóm, những loại khác nhau. Ví dụ như các cơ thể sống vào các
giới động vật, thực vật. Tương tự, bài toán Phân lớp (Classification) trong khai phá
dữ liệu bao gồm việc sử dụng các thuật toán nhằm xem xét các đ ặc điểm của một
đối tượng cụ thể để phân loại nó vào trong các nhóm, loại đã định sẵn. Ví dụ đơn

giản: một ngân hàng muốn phân tích dữ liệu để biết khách hàng nào có mức độ rủi
ro cao, khách hàng nào cho vay sẽ an toàn. Ta có một cơ sở dữ liệu như Bảng 1.1.
Bảng 1.1 Cơ sở dữ liệu về khách hàng của một ngân hàng
Tên khách hàng
A
B
C
D

Tuổi
Trẻ
Trẻ
Trung niên
Già

Thu nhập
thấp
cao
thấp
thấp

Phân loại

Nguồn: Michael J.A.Berry and Gordon S.Linoff , 2004, Data-mining techniques

15


Đầu tiên, mô hình phân lo ại sẽ được xây dựng, có thể nói mô hình này đóng vai
trò như một chiếc phễu, khi „rót‟ dữ liệu qua ta sẽ thu được dữ liệu đã được phân

loại. Một mô hình sẽ bao gồm các thuật toán nhằm xây dựng các quy tắc phân loại,
mà trong ví dụ trên ta có thể xây dựng như sau :

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

Hình 1.3 Mô hình bài toán Phân l ớp

Mô hình phân loại

Nếu Tuổi = „Trẻ‟ thì Phân loại = „ Rủi ro‟

Nếu Tuổi = “Trung niên” và Thu nhập = „Thấp‟ thì
Phân loại = „Rủi ro‟


Nguồn: Michael J.A.Berry and Gordon S.Linoff , 2004, Data-mining techniques

Sau khi chạy dữ liệu ta thu được một bảng dữ liệu đã được phân loại như sau :
Bảng 1.2 Dữ liệu sau khi đƣợc phân loại
Tên khách hàng
A
B
C
D

Tuổi
Trẻ
Trẻ
Trung niên
Già

Thu nhập
thấp
cao
thấp
thấp

Phân loại
Rủi ro
Rủi ro
Rủi ro
An toàn

Nguồn: Michael J.A.Berry and Gordon S.Linoff , 2004, Data-mining techniques


Nếu như có một khách hàng mới là E với các đặc điểm : Trung niên, thu nhập cao
ta sẽ có E được phân loại vào Nhóm An toàn. Bài toán Phân loại được đặc trưng bởi
việc xây dựng một một mô hình phân loại tốt, với các thuật toán sao cho phân loại
dữ liệu một cách chính xác nhất. Các ví dụ về các hoạt động có thể áp dụng bài toán
Phân loại có thể kể đến :

16




Lựa chọn nội dung hiển thị trên một Website sao cho phù hợp với từng
khách hàng vào xem.



Một doanh nghiệp cần phân tích để đoán xem người tiêu dùng với những đặc
điểm nào sẽ có khả năng mua sản phẩm của mình, hay loại đối tượng nào sẽ
có khả năng cao phản ứng với một chiến dịch Marketing cụ thể.

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu

aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

 Dự đoán (Prediction)

Dự đoán về cơ bản tương tự như phân lo ại, trừ trường hợp dữ liệu được phân loại
theo việc dự đoán hành vi xảy ra trong tương lai. Trong bài toán dự đoán, cách duy
nhất để kiểm tra tính chính xác của bài toán là chờ xem liệu đối tượng dự đoán
những hành vi như đã được dự đoán.

Những ví dụ về bài toán Dự đoán có thể được áp dụng là :


Dự đoán khách hàng nào sẽ rời đi trong vòng một khoảng thời gian nhất định
ví dụ 6 tháng dựa trên các dữ liệu về khách hàng liên quan đến: kênh khách
hàng tìm đến với doanh nghiệp, hóa đơn cao hoặc thấp bất thường, thanh
toán muộn...



Dự đoán số tiền khách hàng sẽ chi cho một đợt khuyến mãi dựa trên thông
tin về sản phẩm khách hàng thường mua, khả năng tài chính, phản ứng đối
với các sự thay đổi giá cả...


 Tìm thuật liên kết (Association rules)

Nhiệm vụ của Tìm thuật liên kết (Association rules) là để xác định mối quan hệ
giữ các đối tượng với nhau ví dụ những thứ nào hay đi cùng nhau. Ví dụ điển hình
là việc xác định các thứ hay đi cùng nhau trong một giỏ hàng mua sắm tại các siêu
thị. Tìm thuật liên kết (Association rules) là một phương pháp đơn giản để rút ra các
quy luật từ dữ liệu. Nếu hai mặt hàng, ví dụ sữa và bánh mì thường được mua cùng
nhau, chúng ta có thể tạo ra hai quy luật kết hợp:


Những người mua sữa cũng mua bánh mì xác suất P1.



Những người mua bánh mì cũng mua sữa với xác suất P2.

17


Dựa trên những kiến thức thu được, chuỗi bán lẻ có thể sử dụng kết quả của Tìm
thuật liên kết (Association rules) để có kế hoạch bố trí các mặt hàng trên các kệ
hàng hoặc trong một cửa hàng để các mặt hàng thường xuyên được mua cùng nhau
sẽ được nhìn thấy cùng nhau. Tìm thuật liên kết (Association rules) còn được sử
dụng nhằm thiết kế các gói hàng hấp dẫn kết hợp với nhau hoặc kết hợp các nhóm

UU
FFTT
SSuu
aann

i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

sản phẩm và dịch vụ.

 Phân cụm (clustering)

Nhiệm vụ của Phân cụm (clustering) là phân khúc một nhóm dữ liệu không đồng
nhất thành các nhóm nhỏ đồng nhất hơn (gọi là cụm). Nói cách khác là nhóm các
đối tượng dữ liệu có tính chất giống nhau vào cùng một nhóm. Điểm khác biệt giữa
Phân cụm (clustering) và Phân lớp (Classification) đó là Phân cụm (clustering)
không dựa vào các lớp, hay các điều kiện phân loại đã được xác định trước. Trong
Phân cụm (clustering) không có các lớp, loại đã được xác định trước và không có
ví dụ. Các đối tượng dữ liệu được nhóm lại với nhau trên cơ sở sự tương tự, giống
nhau. Ví dụ cụm dữ liệu về triệu chứng có thể chỉ ra các bệnh khác nhau. Cụm dữ
liệu về các thuộc tính của khách hàng có thể cho thấy các phân khúc thị trường khác
nhau. Clustering thường được thực hiện như bước đầu cho một số hình thức khác
của khai thác dữ liệu. Ví dụ Clustering có thể là bước đầu tiên trong việc phân đoạn

thị trường hoặc thay vì cố gắng đưa ra một chiến dịch xúc tiến theo kiểu "loại
khuyến mãi nào để khách hàng phản hồi tốt nhất", trước tiên, ta sẽ chia khách hàng
thành từng cụm nhỏ ví dụ những người có thói quen mua sắm tương tự và sau đó
thiết kế các chương trình xúc tiến phù hợp nhất cho mỗi cụm.
1.2.3.3 Hành động dựa trên thông tin thu được

Đưa đến hành động là mục đích cốt lõi của khai phá dữ liệu. Như đã đề cập, hành
động có thể có nhiều hình thức. Khai phá dữ liệu sẽ dẫn tới những quyết định sáng
suốt hơn dẫn đến kết quả tốt hơn. Ví dụ trong Marketing, khai phá dữ liệu có thể trợ
giúp trong việc đưa ra quyết định liên quan tới:

18




Gửi tin nhắn, thư cho khách hàng và khách hàng tiềm năng thông qua thư
trực tiếp, email, qua điện thoại…



Ưu tiên nhóm khách hàng được phục vụ…



Điều chỉnh mức hàng tồn kho

UU
FFTT
SSuu

aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

Các kết quả của việc khai phá dữ liệu cần phải được đưa vào chiến lược
Marketing sao cho có thể chạm tới khách hàng nhằm nâng cao đến các mối quan hệ
khách hàng.

1.2.3.4 Đo lường kết quả

Mặc dù tầm quan trọng của nó, nhưng đây lại là giai đoạn dễ bị bỏ qua nhất. Có
rất nhiều trường hợp sau khi những chương trình hành động được thực hiện, nhưng
không có ai nhìn lại để đánh giá xem liệu kết quả đạt được đã phù hợp với kế hoạch.
Thời gian để bắt đầu nghĩ về giai đoạn này cũng chính là ngay từ đầu- giai đoạn 1:
xác định các cơ hội, vấn đề kinh doanh. Làm thế nào có thể đo được kết quả? Một
công ty gửi đi rất nhiều phiếu giảm giá để khuyến khích việc mua các sản phẩm của
họ sẽ lấy tỷ lệ phiếu giảm giá được khách hàng sử dụng làm thước đo hiệu quả. Một
thước đo thích hợp nữa là sự tăng doanh số bán hàng trong các cửa hàng hoặc một

khu vực cụ thể nếu mục đích của hành động đã thực hiện là để tăng doanh số bán
hàng. Nói cách khác cần phải có một thước đo rõ ràng, trực tiếp.

Lầy một ví dụ, chúng ta hãy bắt đầu với một chiến dịch Marketing nhằm thu hút
thêm khách hàng, để đánh giá được hiệu quả có rất nhiều câu hỏi cần trả lời:


Chiến dịch này đã tới được và mang về những khách hàng tạo ra lợi nhuận
hay chưa?




Lòng trung thành của những khách mới này có kéo dài được như dự kiến?
Các đặc điểm của các khách hàng trung thành nhất mà chiến dịch này mang
lại là gì? Liệu có thể áp dụng cho các khách hàng tiềm năng trong tương lai.

19


Một thước đo lường phổ biến khác là giá trị vòng đời khách hàng (lifetime customer
value). Như tên gọi của nó, đây là một ước tính giá trị của một khách hàng mang lại
trong toàn bộ quá trình doanh nghiệp có quan hệ với họ.
Như vậy, chúng ta đã sơ lược 4 bước cơ bản của khai phá dữ liệu, bây giờ để minh

UU
FFTT
SSuu
aann
i iCC

HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

họa rõ ta sẽ đi vào một ví dụ cụ thể hãng Ô-tô SUV Detroit đã sử dụng khai phá dữ
liệu để nâng cao hiệu quả hoạt động Marketing của mình.


Bước 1: nhận diện vấn đề kinh doanh

Thách thức mà Detroit gặp phải là làm sao để cải thiện phản ứng của khách hàng
với một chiến dịch Marketing gửi thư trực tiếp cho một mẫu xe sắp giới thiệu.
Chiến dịch liên quan đến việc gửi một thư đến khách hàng tiềm năng mời họ đến lái
thử mẫu xe mới. Bất cứ ai chấp nhận lời mời sẽ được tặng một cặp miễn kính mát
tại các đại lý. Vấn đề là rất ít người trả lời thư xác nhận sẽ tới hoặc gọi số điện thoại
hỗ trợ miễn phí để biết thêm thông tin và chỉ vài trong số những người được gửi
quyết định mua xe. Công ty này đã biết mình có thể tiết kiệm rất nhiều tiền bằng
cách không gửi lời đề nghị cho những người không có khả năng mua, nhưng họ
không biết người đó là những ai. Khai phá dữ liệu trong trường hợp này sẽ giải
quyết bài toán trên: Làm sao để tăng hiệu quả của hoạt động Marketing trực tiếp?



Bước 2: mô hình hóa dữ liệu

Trong trường hợp này, dữ liệu cần cho khai phá dữ liệu được thu thập từ nhiều
nguồn khác nhau, thách thức đầu tiên là phải thu thập, tổ chức dữ liệu để tạo ra
được cơ sở dữ liệu phù hợp. Dữ liệu về khách hàng đầu tiên sẽ được lấy ở các tập
tin chứa tên và địa chỉ của hàng triệu khách hàng đã nhận được thư quảng cáo trước
đây (các tập tin thư). Tuy nhiên, t ập tin này chứa it thông tin hữu ích cho khai phá
dữ liệu ngoài tên và địa chỉ. Sau đó, các tập tin thư này sẽ được gắn với tệp dữ liệu
PRIZM (đây là tập dữ liệu thượng mại có sẵn chứa các thông tin về nhân khẩu học,
xã hội học của các khu vực dân cư theo mã vùng địa lý (mã zip code)). Tiếp đến là
hai tập tin bổ sung có chứa thông tin về những người đã trả lời lại thư quảng cáo

20


thông qua hình thức gửi thư xác nhận lại hoặc gọi số điện thoại miễn phí yêu cầu
biết thêm thông tin. Trong số 1.000.003 người công ty đã gửi thư, 32.904 đã đáp lại
bằng cách gửi lại thư xác nhận và 16.453 đáp lại bằng cách gọi đến số điện thoại hỗ
trợ miễn phí tạo nên tổng tỷ lệ trả lời là 5 phần trăm. Để biết được liệu những người
trả lời này có mua xe trong chương trình Marketing này không, ta sẽ sử dụng thêm

UU
FFTT
SSuu
aann
i iCC
HHoo
UU

FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

một tập tin bán hàng với các thông tin liên quan như: tên, địa chỉ, mẫu xe được
mua...tuy nhiên giới hạn trong thời gian 3 tháng kể từ ngày thư được phát đi. Một
chương trình khớp tự động sau đó phát hiện được khoảng 22.000 kết quả: đây chính
là những người đã nhận được thư và mua xe.

Sau khi đã có cơ sở dữ liệu, đây là lúc các thuật toán được áp dụng. Cụ thể, bằng
việc áp dụng bài toán Phân c ụm (Clustering) khai phá dữ liệu sẽ xác định được ai là
người có khả năng mua xe từ công ty. Sau đó bằng việc áp dụng bài toán Dự đoán
để xác định ai trong số đó sẽ là người mua mẫu xe đang được giới thiệu. Đây là
những quá trình mang nặng tính toán học, công nghệ thông tin do các chuyên gia về
kĩ thuật đảm nhận.


Bước 3 & Bước 4: hành động trên thông tin thu được và đo lường kết quả.

Sau khi được trang bị với những tri thức mới mà khai phá dữ liệu đem lại, công ty
đã quyết định gửi ra số lượng thư ít hơn và số tiền tiết kiệm được sẽ được dùng để
tăng sự hấp dẫn cho việc đến các đại lý để đi thử xe bằng cách thay thế cặp kính mát

bằng một đôi giày da. Cách tiếp cận mới sau đó đã chứng tỏ được sự hiệu quả hơn
rõ rệt.

1.2.4 Ứng dụng của khai phá dữ liệu trong Marketing
1.2.4.1 Nhận diện khách hàng tiềm năng

Định nghĩa đơn giản nhất của một khách hàng tiềm năng chỉ đơn giản là những
người bộc lộ ý muốn trở thành một một khách hàng, định nghĩa phức tạp hơn: họ
không những muốn trở thành khách hàng mà còn có đủ khả năng để trở thành khách
hàng, họ sẽ tạo lợi nhuận khi là khách hàng, họ không lừa gạt công ty và có khả

21


năng thanh toán các hóa đơn và nếu được chăm sóc tốt, họ sẽ là khách hàng trung
thành và còn giới thiệu sản phẩm của công ty đến những khách hàng tiềm năng khác.
Cho dù định nghĩa đơn giản hay phức tạp, nhiệm vụ đầu tiên là phải nhắm tới họ.
Việc xác định đúng đối tượng sẽ giúp doanh nghiệp tiết kiệm được nhiều thời gian ,
tiền bạc cho những khách hàng thực sự tiềm năng, những người sẽ mang lại nhiều

UU
FFTT
SSuu
aann
i iCC
HHoo
UU
FFTT
SSuu
aann

i iCC
HHoo
UU
FFTT
SSuu
aann
i iCC
HHoo

lợi nhuận cho doanh nghiệp nhất. Khai phá dữ liệu được áp dụng cho vấn đề này
bằng cách định nghĩa như thế nào là một khách hàng tiềm năng dựa trên các thông
tin liên đến tấn suất mua hàng của khách hàng, giá trị mua sắm qua thời gian, sự
nhạy cảm về giá… sau đó tìm ra các quy tắc cho phép những người với những đặc
điểm trên được nhắm đến.

1.2.4.2 Lựa chọn công cụ để thực hiện chính sách xúc tiến và hỗ trợ kinh doanh
Các công ty có thể truyền đạt thông tin về sản phẩm, doanh nghiệp đến với khách
hàng nhằm đẩy mạnh tiêu thụ hàng hóa, tao lợi thế cạnh tranh cho doanh nghiệp qua
nhiều cách. Đó có thể là thông qua quan hệ công chúng trong đó khuyến khích các
phương tiện truyền thông đăng trải những câu chuyện về công ty qua đó truyền đi
những thông điệp tích cực về công ty. Mặc dù có hiệu quả cao đối với một số công
ty (như Starbucks, Apple…) cách thức này lại không mang tính trực tiếp. Được chú
ý rộng rãi hơn là quảng cáo và Marketing trực tiếp. Quảng cáo có thể từ bìa tạp chí
cho đến những thanh pop-up khó chịu trên một số trang web thương mại cho đến
các chương trình truyền hình, các sự kiện thể thao lớn thậm chí ngay cả trong các
bộ phim. Trong bối cảnh này, các nhóm đối tượng được hướng đến sẽ có những đặc
điểm chung ...tuy nhiên quảng cáo lại không cho phép điều chỉnh các thông điệp
theo cá nhân như Marketing trực tiếp. Marketing trực tiếp sẽ cho phép phép tùy biến
các thông điệp cho các cá nhân khác nhau. Mỗi công cụ để thực hiện chính sách xúc
tiến và hỗ trợ kinh doanh đều có những ưu và nhược điểm riêng. Việc lựa chọn

công cụ nào trước hết phải phụ thuộc vào nhóm khách hàng được hướng tới. Sau đó,
bằng việc xây dựng các mô hình phản ứng đo lường mức độ phản ứng của các
nhóm khách hàng khác nhau với các công cụ xúc tiến khác nhau sẽ giúp doanh

22


×