HỆ HỖ TRỢ QUYẾT ĐỊNH
ĐỀ TÀI: HỆ HỖ TRỢ DỰ ĐOÁN KHẢ NĂNG
RỜI ĐI CỦA KHÁCH HÀNG VIỄN THÔNG
NỘI DUNG
1. ĐIỀU TRA, KHẢO SÁT
2. DỮ LIỆU
3. MÔ HÌNH BÀI TOÁN
4. ÁP DỤNG MÔ HÌNH
5. ĐÁNH GIÁ KẾT QUẢ, NHẬN XÉT
6. CHƯƠNG TRÌNH
1. ĐIỀU TRA KHẢO SÁT
Trong thực tế hoạt động, các hệ thống thường xảy ra tình trạng mất mát khách hàng. Có nhiều nguyên nhân dẫn
đến sự ra đi của khách hàng
Điều này khiến các nhà quản lí luôn phải tìm ra kế hoạch để giữ chân khách hàng . Nhưng vấn đề là có quá nhiều
khách hàng, vậy làm sao để nhà quản lí biết cần quan tâm khách hàng nào hơn
Giải pháp: cần có một hệ thống có thể gợi ý cho nhà quản lí về số người cũng như khả năng họ sẽ rời khỏi hệ thống
là bao nhiêu .
2. DỮ LIỆU KHẢO SÁT
Dữ liệu bao gồm
1721 bản ghi thông tin của từng khách hàng
14 trường dữ liệu bao gồm
3. MÔ HÌNH BÀI TOÁN
Mô hình logistic regression:
Thường được sử dụng cho các bài toán phân lớp nhị phân
Trong mô hình này đầu ra dưới dạng xác suất
Hàm sigmoid
Nếu P(Y=1|X) là khả năng rời đi
Mối quan hệ giữa xác suất P(Y=1|X) =
3. MÔ HÌNH BÀI TOÁN
Kết quả của mô hình
Giá trị của các p-value tương ứng với các biến đầu vào < 0.05 chứng tỏ các biến đầu vào đều tác động có ý nghĩa thống
kê đến biến phụ thuộc .
4. ÁP DỤNG MÔ HÌNH
Sử dụng 30% dữ liệu để dự đoán
Churn_probability: xác suất rời đi của khách hàng
Mô hình dự đoán: những khách hàng có xs >= 0.5 sẽ dự đoán
là có khả năng rời đi tức y=1, những khách hàng có xs <0.5
sẽ dự đoán không có khả năng rời đi tức y=0
4. ÁP DỤNG MÔ HÌNH : đánh giá độ hiệu quả của thuật toán
Negative (0)
Negative (0)
Positive(1)
Positive(1)
TN
FP
FN
TP
TP: Đoán có và thực tế là có
TN: Đoán không và thực tế là không
FP: Đoán có mà thực tế là không
FN: Đoán không thực tế là có
4. ÁP DỤNG MÔ HÌNH: đánh giá độ hiệu quả của thuật toán
Các đại lương đánh giá độ hiệu quả của thuật toán
•
Cho ta biết dự đoán có chúng ta chính xác bao nhiêu
•
Cho ta biết khả năng bắt không bị bỏ xót là bao nhiêu
4. ÁP DỤNG MÔ HÌNH: đánh giá độ hiệu quả của thuật toán
Đường cong ROC và Area Under the ROC Curve (AUC)
Are: diện tích phía dưới đường cong ROC càng cao thì thuật
toán càng tốt
5. ĐÁNH GIÁ, NHẬN XÉT.
Phân tích một số đặc trưng:
-Aggregate_Total_Rev( Những khách hàng có doanh thu càng cao thì khả năng rời đi sẽ thấp
- Aggregate_Data_Rev ( Những khách hàng có tổng doanh thu dữ liệu cao thì sẽ có khả năng
rời đi cao
⇒Khách hàng dùng càng nhiều càng tốt nhưng tốn tiền dữ liệu thì xấu
Gợi ý về chiến lược giữ chân khách hàng: Nên có chế độ khuyến mại về mặt data, Vẫn khuyến khích khách hàng
dùng nhiều nhưng giảm tiền dữ liệu xuống.
6. CHƯƠNG TRÌNH
6. CHƯƠNG TRÌNH
6. CHƯƠNG TRÌNH
6. CHƯƠNG TRÌNH
6. CHƯƠNG TRÌNH