Mở đầu
Trong lĩnh vực bán hàng, người ta rất quan tâm đến yếu tố doanh thu. Đó là kết
quả cuối cùng của những hoạt động kinh tế sản xuất, những hoạt động tài chính,
hay bất cứ những hoạt động nào nhằm đem lại lợi nhuận cho cửa hàng, doanh
nghiệp. Doanh thu được coi là yếu tố sống còn, người ta dựa vào đó để đánh giá
mức độ hiệu quả của hoạt động kinh tế nói chung và hoạt động bán hàng nói
riêng.
Doanh thu là vô cùng quan trọng trong hoạt động kinh tế, điển hình trong lĩnh
vực bán lẻ, nó là yếu tố tạo động lực để thúc đẩy sự phat triển của việc bán hàng
của doanh nghiệp, cửa hàng. Đối với nền kinh tế có sự cạnh tranh gay gắt như
hiện nay, để tồn tại được thì cửa hàng, doanh nghiệp cần phải tạo ra được doanh
thu từ các hoạt động của mình. Người ta tìm mọi cách tiếp cận để tối đa hóa doanh
thu càng nhiều càng tốt. Việc ra những chiến lược đúng đắn, sẽ là một sự thúc
đẩy mạnh mẽ cho việc tối đa lợi nhuận.
Một trong những cách để tăng lợi nhuận, đó là phân khúc, tiếp cận những nhóm
khách hàng khác nhau, dựa vào xu hướng tiêu dùng của họ, nhà quản lý bán hàng
có thể ra những quyết định chiến lược giúp tăng doanh số. Chính vì vậy, trong
môn học này, em tìm hiểu đề tài xây dựng hệ hỗ trợ nhà quản lý bán lẻ từ việc
phân cụm khách hàng dựa theo lượng chi tiêu, sử dụng thuật toán phân cụm kinh
điển KMeans. Hệ thống sẽ cho nhà quản lý thấy được xu hướng của khách hàng,
hỗ trợ nhà quản lý đưa ra quyêt định có lợi.
Em xin gửi lời cảm ơn đến thầy Lê Chí Ngọc đã hướng dẫn và góp ý về môn học
“Hệ hỗ trợ quyết định” rất sâu sắc tỉ mỉ, giúp chúng em hoàn thành môn học và
qua đó, chúng em được trang bị những kiến thức nền tảng cho một hướng đi rất
tiềm năng của nghề nghiệp.
1
1. Khảo sát
1.1 Đặt vấn đề
1.1.1 Nhu cầu
Trong lĩnh vực bán lẻ, khách hàng gắn liền với lợi nhuận, vì thế nhà quản lý cần
có những chiến lược sao cho tập khách và lượng chi tiêu của khách ngày một
nhiều. Làm sao để giữ chân khách cũ, thu hút khách mới, để họ thấy được mình
không chỉ đi mua hàng, mà còn là những “thượng đế” ? Làm sao để khách mua
sản phẩm của mình nhiều hơn? Đó là bài toán mà các nhà quản lý nỗ lực hướng
đến. Dựa trên những thông tin đã có, làm sao có thể ra được những quyêt định
chiến lược để đạt được những mục tiêu trên? Nắm trong tay được nội tại tinh hoa
của dữ liệu, sẽ là công cụ đắc lực cho nhà quản lý giúp doanh nghiệp, chi nhánh
của mình tạo lợi thế cạnh tranh, cụ thể ở đây là lĩnh vực bán lẻ.
1.1.2 Một số khó khăn
“Nắm trong tay đất sét, làm sao để đất sét hóa thành vàng”. Tập dữ liệu lấy từ các
“thượng đế” khi mua hàng, đó là dữ liệu thô, có số lượng khá lớn. Nhìn vào tập
thô đó, nhà quản lý không thể có chút cảm quan nào để đưa ra được các chiến
lược. Với số lượng lớn dữ liệu, hiệu quả việc phân tích bằng tay sẽ bị giới hạn.
Một trong những việc quan trọng cần phải làm, để chăm sóc khách hàng, đó là
việc biêt được khách hàng muốn gì. Và để biết được khách hàng muốn gì, ta cần
biết được xu hướng của họ, điều đó dẫn đến nhu cầu việc phân chia tập dữ liệu
ban đầu thành các tập con với những tập con mang những đặc trưng khác nhau.
Việc phân tập này cần dựa vào nội tại của dữ liệu để có cái nhìn hợp lý, không
thể phân chia một cách tùy ý theo một ngưỡng nào đó được.
Làm việc với biểu đồ, sẽ dễ dàng hơn làm việc với con số thô.
2
1.2 Giải pháp
1.2.1 Hệ thống phân cụm khách hàng
Từ những khó khăn nêu trên, một giải pháp được đưa ra là xây dựng hệ thống
phân cụm khách hàng theo lượng chi tiêu của họ. Từ những cụm khách hàng phân
chia được, nhà quản lý có thể biết được xu hướng của từng cụm, ra được các
quyết định chiến lược phù hợp nhằm gia tăng lợi nhuận cho việc kéo khách, bán
hàng.
Lợi ích:
+ Công cụ trực quan dữ liệu
+ Ứng dụng thuật toán máy học tăng hiệu quả phân tích dữ liệu
+ Kết xuất ra những biểu đồ dễ đọc mang nhiều ý nghĩa cho nhà quản lý.
1.2.2 Thuật toán phân cụm
Sử dụng thuật toán phân cụm KMeans để thực hiện.
Thuận toán KMeans là thuật toán phân cụm dựa trên khoảng cách của các điểm
dữ liệu, thuộc lớp bài toán học không giám sát, vì vậy, thuật toán sẽ đưa ra các
điểm dữ liệu có “xu hướng” gần tương tự nhau. Đây là lý do chính để ta chọn
thuật toán KMeans khi tìm xu hướng khách hàng. Hơn nữa, kết quả của thuật toán
KMeans còn có thể tái sử dụng làm đầu vào cho các nghiệp vụ phân tích khác
nếu cần.
Ưu điểm KMeans:
+ Thuật toán phân cụm kinh điển, dễ triển khai
+ Vì là thuật toán học không giám sát nên không cần dữ liệu có nhãn.
Nhược điểm:
+ Nội tại dữ liệu phải là tập hợp các cụm
+ Phải khảo sát để chỉ ra số cụm cần chia.
+ Nhạy cảm với nhiễu
3
2. Phân tích thiết kế hệ thống
2.1 Sơ đồ phân cấp chức năng
4
2.2 Sơ đồ dữ liệu mức khung cảnh
2.3 Sơ đồ dữ liệu mức đỉnh
5
2.4 Sơ đồ dữ liệu mức dưới đỉnh
3. Kết quả chạy thuật toán
3.1 Dữ liệu
6
3.2 Kết quả
+ Đồ thị Elbow tổng bình phương khoảng cách
+ Kết quả phân cụm
7
4. Chương trình
4.1 Giao diện
Giao diện đăng nhập
Giao diện nạp dữ liệu
8
Giao diện thống kê doanh thu
4.2 Công nghệ sử dụng
Phần mềm Phân cụm khách hàng xây dựng cho nhà quản lý dựa trên công nghệ
website, sử dụng:
+ HTML: Ngôn ngữ đánh dấu siêu văn bản.
+ CSS: Ngôn ngữ styling web
+ JS: Ngôn ngữ lập trình giao diện web.
Để tăng hiệu quả của phần mềm đối với khách hàng sử dụng, phần mềm là sự
kết hợp của những công nghệ:
+ Dotnet Core: Công nghệ cho phép tạo một web server để triển khai sản
phẩm đa nền tảng, xây dựng hệ thống dựa trên REST API.
+ MS SQL: Công nghệ cơ sở dữ liệu của Microsoft, truy xuất nhanh ổn định.
+ Angular: Tối ưu hóa trải nghiệm của người dùng, tương thích trên nhiều
trình duyệt.
+ Python: Công cụ phân tích dữ liệu mạnh mẽ
9
Kết luận
Qua môn báo cáo này, em đã trình bày về việc tiếp cận xu hướng của khách hàng
bằng thuật toán phân cụm KMeans. Từ môn học này, em được biết thêm và được
trang bị những kiến thức nền tảng nhất về một hướng đi rất tiềm năng của nghề
nghiệp khi học Toán Tin. Em xin chân thành cảm ơn thầy Lê Chí Ngọc đã tận
tình hướng dẫn góp ý những thiếu sót của chúng em trong quá trình học môn Hệ
hỗ trợ quyết định.
10