ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC
Báo cáo môn học hệ hỗ trợ quyết định:
Đề tài: phân loại khách hàng sử dụng
thẻ tín dụng
GVHD: TS Lê Chí Ngọc
Nội dung
Vấn đề đặt ra
Dữ liệu sử dụng
Thuật toán Kmeans
Kết quả và Nhận xét
Vấn đề đặt ra
Một số thông tin về thẻ tín dụng
*Thẻ tín dụng (Credit Card) là một loại thẻ ngân hàng mà người sở hữu có thể dùng để thanh toán mà không cần
tiền có sẵn trong thẻ.
*Việc sử dụng thẻ tín dụng đem đến nhiều lợi ích cho khách hang, tuy vậy cũng có những bất lợi nhất định
*Hiện nay, tại các ngân hang việc đăng kí sử dụng thẻ tín dụng trở nên đơn giản hơn khi bạn chứng minh
được tài chính, thông tin cá nhân minh bạch…..
SỐ LƯỢNG KHÁCH HÀNG TĂNG LÊN, CẦN HỆ THỐNG PHÂN LOẠI KHÁCH HÀNG ĐỂ CÓ NHỮNG CHÍNH
SÁCH PHÙ HỢP
DỮ LIỆU
8950 bản ghi
18 trường dữ liệu
Thông tin về bảng dữ liệu
BALANCE
SỐ DƯ CÒN LẠI TRONG THẺ
BALANCE_FREQUENCY
TẦN SUẤT UPDATE SỐ DƯ TRONG THẺ([0,1])
PURCHASES
SỐ LƯỢNG MUA HÀNG THỰC HIỆN
ONEOFF_PURCHASES
SỐ TIỀN MUA TỐI ĐA 1 LẦN THỰC HIỆN
INSTALLMENTS_PURCHASES
SỐ LƯỢNG MUA HÀNG TRẢ GÓP CỦA CHỦ THẺ
CASH_ADVANCE
TIỀN MẶT TRẢ BỞI CHỦ THẺ
PURCHASES_FREQUENCY
TẦN SUẤT MUA HÀNG ([0,1])
ONEOFF_PURCHASES_FREQU
TẦN SUẤT MUA HÀNG TRONG THỜI GIAN CỐ ĐỊNH
ENCY
PURCHASES_INSTALLMENTS_
FREQUENCY
TẦN SUẤT MUA HÀNG TRẢ GÓP
CASH_ADVANCE_FREQUENCY
TỈ LỆ SỐ TIỀN MẶT TRẢ TRƯỚC
CASH_ADVANCE_TRX
SỐ LƯỢNG GIAO DỊCH VỚI TIỀN MẶT
PURCHASES_TRX
SỐ GIAO DỊCH ĐƯỢC THỰC HIỆN KHI MUA HÀNG
CREDIT_LIMIT
GIỚI HẠN THẺ TÍN DỤNG CỦA CHỦ THẺ
PAYMENTS
SỐ LƯỢNG THANH TOÁN BỞI CHỦ THẺ
MINIMUM_PAYMENTS
GIÁ TRỊ TỐI THIỂU THANH TOÁN
PRC_FULL_PAYMENT
PHẦN TRĂM THANH TOÁN ĐẦY ĐỦ CỦA KH
TENURE
HẠN DÙNG DỊCH VỤ CỦA THẺ TÍN DỤNG
THUẬT TOÁN KMEANS
*Phân cụm là kỹ thuật quan trong trong khai phá dữ liệu, nó thuộc lớp các phương pháp unsupervised learning trong
Machine Leanrning. Trong thuật toán này, chúng ta không biết nhãn (label) của từng điểm dữ liệu mục đích là làm thế nào để
phân các điểm dữ liệu vào các nhóm khác nhau sao cho các điểm trong từng một cụm có tinh chất giống nhau
THUẬT TOÁN KMEANS
Trong thuật toán Kmeans, với K là số cụm cho trước, ta thực hiện vòng lặp 2 bài toán tối ưu
Với tâm cụm cho trước, ta gán nhãn cho các điểm dữ liệu sao cho khoảng cách từ điểm đến tâm
nhãn là nhỏ nhất
Với các điểm dữ liệu cùng nhãn, ta tìm tâm cụm của nhãn đó sao cho khoảng cách đến tâm cụm
đến các điểm trong cụm là nhỏ nhất
Thuật toán dừng lại khi tâm các cụm sau vòng lặp liền nhau là không đổi
THUẬT TOÁN ELBOW
Thuật toán ELBOW để lựa chọn số cụm tối ưu k cho dữ liệu, dựa trên chí số WSS
WSS ( with cluster sum of square): chỉ số thể hiện tổng khoảng các từ điểm dữ liệu đến các tâm của nhóm mà chúng được gán nhãn
Tuy nhiên, việc lựa chọn số tâm cụm đôi khi phụ thuộc vào kinh nghiệm hay yêu cầu của bài toán, nhưng thông thường khi sử dụng ELBOW,
người ta sẽ chọn số tâm cụm là sự biến thiên WSS trước và sau là không quá lớn
THUẬT TOÁN ELBOW
Kết quả chạy thuật toán
Sử dụng thuật toán ELBOW để tìm số cụm
Chọn số cụm : 7
Kết quả chạy thuật toán
Chí số các cụm, gán nhãn cho các điểm dữ liệu
Kết quả chạy thuật toán
Nhận xét các nhóm dữ liệu:
L: Low(thấp)
M:Medium(trung bình)
H: Hight(cao)
DEMO
Trang chủ
Kết quả phân tích với số cụm bằng 3
Trước hết, ta có kết quả tâm các cụm khách hàng
Một số bảng phân tích
Số lượ ng mỗ i nhó m
Số dư trong thẻ và số lượng mua hàng
nhóm 3; 1%
2291
Nhóm 1; 73%
Chuỗi 1
Chuỗi 2
Chuỗi 2
Phân bổ số tiền chi tiêu
số tiền mua hàng tối đa 1 lần
số tiền trả góp
số tiền trả góp
Cash_Advance
số tiền mặt tiêu dùng
số tiền mặt tiêu dùng
số tiền mặt tiêu dùng
Một số chỉ số cập nhật
tần suất mua hàng
tần suất cập nhật số dư
tần suất mua hàng trả góp
giới hạn thẻ
số tiền thanh toán tối thiểu
số tiền thanh toán tối thiểu