HỆ HỖ TRỢ QUYẾT ĐỊNH
DỰ ĐOÁN PHẢN HỒI CỦA KHÁCH HÀNG VỚI CHIẾN
DỊCH TIẾP THỊ QUA ĐIỆN THOẠI
Giảng viên hướng dẫn: TS. Lê Chí Ngọc
MỤC LỤC
Điều tra, khảo sát
Dữ liệu thực nghiệm
Bài toán và mô hình
Kết quả và chương trình
Điều tra, khảo sát
Hiện trạng.
-
Hiện nay nhiều tổ chức ngân hàng đã áp dụng hình thức telemarketing (tiếp thị qua điện thoại) để
quảng cáo trực tiếp sản phẩm của mình cho khách hàng.
Điều tra, khảo sát
Vấn đề đặt ra.
Việc chi tiêu cho việc tiếp thị trực tiếp của các ngân hàng rất lớn.
Điều tra, khảo sát
Giải pháp.
• Việc xây dựng mô hình dự đoán giúp ngân hàng tăng thông tin về khách hàng của mình,
dự đoán phản ứng của khách hàng với chiến dịch tiếp thị qua điện thoại.
Dữ liệu thực nghiệm
Dữ liệu sử dụng được lấy bộ dữ liệu liên quan đến các chiến dịch tiếp thị
của một tổ chức ngân hàng ở Bồ Đào Nha. Các chiến dịch này được thực
hiện qua các cuộc gọi điện thoại.
Mục đích của chiến dịch là tiếp thị khách hàng đăng ký gửi tiền có kỳ hạn.
Dữ liệu thực nghiệm
Một số bản ghi của bộ dữ liệu:
Bài toán và mô hình áp dụng
Bài toán
- Bài toán sử dụng trong đề tài là bài toán phân loại nhị phân có giám sát:
+ Đầu vào: Các giá trị về thuộc tính của khách hàng gồm: tuổi; nghề nghiệp; tình trạng hôn nhân; học vấn; có nợ xấu hay không; số dư tài khoản
trung bình hằng năm; có khoản vay nhà ở hay không; có khoản vay các nhân hay không; loại liên lạc; tháng, thời lượng lần liên lạc gần nhất; số lần
đã liên lạc trong đợt tiếp thị này; số ngày kể từ lần cuối liên lạc của đợt tiếp thị trước; số lần đã liên lạc trong đợt tiếp thị trước; kết quả của đợt
tiếp thị trước.
+ Đầu ra: Xác suất khách hàng đồng ý gửi tiền có kỳ hạn (giá trị thuộc khoảng (0, 1)).
Bài toán và mô hình áp dụng
Mô hình áp dụng
- Mô hình Hồi quy Logistic (Logistic Regression).
+ Sử dụng hàm sigmoid để phân lớp:
z=
s = wTX
+ Vector thuộc tính:
X = (x1, x2,…, xn)T
+ Vector hệ số của mô hình:
w = (w1, w2,…, wn)T
- Đầu ra là xác suất đối tượng được phân vào 1 trong 2 lớp:
ŷ = P(y = 1 | X, w) = f(s)
Bài toán và mô hình áp dụng
Tính chất của mô hình Hồi quy Logistic
- Được sử dụng nhiều cho bài toán phân lớp.
- Sau khi xây dựng mô hình, việc xác định lớp cho mỗi điểm dữ liệu được thực hiện bằng cách so sánh 2 xác suất P (y = 1 | X, w) và P (y = 0 | X,
w).
+ Nếu P (y = 1 | X, w) > P (y = 0 | X, w) thì điểm dữ liệu được phân vào lớp 1.
+ Nếu P (y = 1 | X, w) < P (y = 0 | X, w) thì điểm dữ liệu được phân vào lớp 0.
- Do P (y = 1 | X, w) + P (y = 0 | X, w) = 1 nên việc so sánh 2 xác suất sẽ đưa về việc so sánh một trong hai xác suất với 0.5:
+ Nếu P (y = 1 | X, w) > 0.5 thì điểm dữ liệu được phân vào lớp 1.
+ Nếu P (y = 1 | X, w) < 0.5 thì điểm dữ liệu được phân vào lớp 0.
Kết quả
Accuracy.
Accuracy của mô hình:
Tổng các điểm dữ liệu được đoán đúng
Tổng các điểm dữ liệu
( = 0.8943231441048035)
Confusion matrix
Kết quả
Precision - Recall.
Precision:
Số dữ liệu hệ đoán đúng
Số dữ liệu hệ đoán
Recall:
Số dữ liệu hệ đoán đúng
Số dữ liệu thực sự đúng
Đánh giá mô hình:
Chương trình
Dự đoán phản hồi.
Chương trình
Biểu đồ
Chương trình
Biểu đồ