Tải bản đầy đủ (.pptx) (27 trang)

phân loại khách hàng sử dụng thẻ tín dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.66 MB, 27 trang )

ĐẠI HỌC BÁCH KHOA HÀ NỘI
VIỆN TOÁN ỨNG DỤNG VÀ TIN HỌC

Báo cáo môn học hệ hỗ trợ quyết định:
Đề tài: phân loại khách hàng sử dụng
thẻ tín dụng

GVHD: TS Lê Chí Ngọc


Nội dung
Vấn đề đặt ra

Dữ liệu sử dụng

Thuật toán Kmeans

Kết quả và Nhận xét


Vấn đề đặt ra
Một số thông tin về thẻ tín dụng

*Thẻ tín dụng (Credit Card) là một loại thẻ ngân hàng mà người sở hữu có thể dùng để thanh toán mà không cần
tiền có sẵn trong thẻ.

*Việc sử dụng thẻ tín dụng đem đến nhiều lợi ích cho khách hang, tuy vậy cũng có những bất lợi nhất định

*Hiện nay, tại các ngân hang việc đăng kí sử dụng thẻ tín dụng trở nên đơn giản hơn khi bạn chứng minh
được tài chính, thông tin cá nhân minh bạch…..


SỐ LƯỢNG KHÁCH HÀNG TĂNG LÊN, CẦN HỆ THỐNG PHÂN LOẠI KHÁCH HÀNG ĐỂ CÓ NHỮNG CHÍNH
SÁCH PHÙ HỢP


DỮ LIỆU

8950 bản ghi

18 trường dữ liệu


Thông tin về bảng dữ liệu
BALANCE

SỐ DƯ CÒN LẠI TRONG THẺ

BALANCE_FREQUENCY

TẦN SUẤT UPDATE SỐ DƯ TRONG THẺ([0,1])

PURCHASES

SỐ LƯỢNG MUA HÀNG THỰC HIỆN

ONEOFF_PURCHASES

SỐ TIỀN MUA TỐI ĐA 1 LẦN THỰC HIỆN

INSTALLMENTS_PURCHASES


SỐ LƯỢNG MUA HÀNG TRẢ GÓP CỦA CHỦ THẺ

CASH_ADVANCE

TIỀN MẶT TRẢ BỞI CHỦ THẺ


PURCHASES_FREQUENCY

TẦN SUẤT MUA HÀNG ([0,1])

ONEOFF_PURCHASES_FREQU

TẦN SUẤT MUA HÀNG TRONG THỜI GIAN CỐ ĐỊNH

ENCY

PURCHASES_INSTALLMENTS_
FREQUENCY

TẦN SUẤT MUA HÀNG TRẢ GÓP

CASH_ADVANCE_FREQUENCY

TỈ LỆ SỐ TIỀN MẶT TRẢ TRƯỚC

CASH_ADVANCE_TRX

SỐ LƯỢNG GIAO DỊCH VỚI TIỀN MẶT


PURCHASES_TRX

SỐ GIAO DỊCH ĐƯỢC THỰC HIỆN KHI MUA HÀNG


CREDIT_LIMIT

GIỚI HẠN THẺ TÍN DỤNG CỦA CHỦ THẺ

PAYMENTS

SỐ LƯỢNG THANH TOÁN BỞI CHỦ THẺ

MINIMUM_PAYMENTS

GIÁ TRỊ TỐI THIỂU THANH TOÁN

PRC_FULL_PAYMENT

PHẦN TRĂM THANH TOÁN ĐẦY ĐỦ CỦA KH

TENURE

HẠN DÙNG DỊCH VỤ CỦA THẺ TÍN DỤNG


THUẬT TOÁN KMEANS

*Phân cụm là kỹ thuật quan trong trong khai phá dữ liệu, nó thuộc lớp các phương pháp unsupervised learning trong
Machine Leanrning. Trong thuật toán này, chúng ta không biết nhãn (label) của từng điểm dữ liệu mục đích là làm thế nào để

phân các điểm dữ liệu vào các nhóm khác nhau sao cho các điểm trong từng một cụm có tinh chất giống nhau


THUẬT TOÁN KMEANS
Trong thuật toán Kmeans, với K là số cụm cho trước, ta thực hiện vòng lặp 2 bài toán tối ưu

Với tâm cụm cho trước, ta gán nhãn cho các điểm dữ liệu sao cho khoảng cách từ điểm đến tâm
nhãn là nhỏ nhất

Với các điểm dữ liệu cùng nhãn, ta tìm tâm cụm của nhãn đó sao cho khoảng cách đến tâm cụm
đến các điểm trong cụm là nhỏ nhất

Thuật toán dừng lại khi tâm các cụm sau vòng lặp liền nhau là không đổi


THUẬT TOÁN ELBOW

Thuật toán ELBOW để lựa chọn số cụm tối ưu k cho dữ liệu, dựa trên chí số WSS

WSS ( with cluster sum of square): chỉ số thể hiện tổng khoảng các từ điểm dữ liệu đến các tâm của nhóm mà chúng được gán nhãn

Tuy nhiên, việc lựa chọn số tâm cụm đôi khi phụ thuộc vào kinh nghiệm hay yêu cầu của bài toán, nhưng thông thường khi sử dụng ELBOW,
người ta sẽ chọn số tâm cụm là sự biến thiên WSS trước và sau là không quá lớn


THUẬT TOÁN ELBOW


Kết quả chạy thuật toán
Sử dụng thuật toán ELBOW để tìm số cụm


Chọn số cụm : 7


Kết quả chạy thuật toán
Chí số các cụm, gán nhãn cho các điểm dữ liệu


Kết quả chạy thuật toán
Nhận xét các nhóm dữ liệu:

L: Low(thấp)
M:Medium(trung bình)
H: Hight(cao)


DEMO


Trang chủ





Kết quả phân tích với số cụm bằng 3
Trước hết, ta có kết quả tâm các cụm khách hàng


Một số bảng phân tích


Số lượ ng mỗ i nhó m

Số dư trong thẻ và số lượng mua hàng

nhóm 3; 1%

2291

Nhóm 1; 73%

Chuỗi 1

Chuỗi 2

Chuỗi 2


Phân bổ số tiền chi tiêu

số tiền mua hàng tối đa 1 lần

số tiền trả góp

số tiền trả góp


Cash_Advance

số tiền mặt tiêu dùng


số tiền mặt tiêu dùng

số tiền mặt tiêu dùng


Một số chỉ số cập nhật

tần suất mua hàng

tần suất cập nhật số dư

tần suất mua hàng trả góp


giới hạn thẻ

số tiền thanh toán tối thiểu

số tiền thanh toán tối thiểu


×