Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (16.02 MB, 74 trang )
<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">
<small>Sinh viên : Dinh Thi Quynh TrangMSV: 11195210</small>
Ha Noi - 2022
</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2"><small>Sinh viên : Dinh Thị Quỳnh Trang</small>
<small>MSV: 11195210</small>
Ha Noi - 2022
</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Tơi xin cam đoan bài luận văn: “Ứng dụng mơ hình hồi quy Logistic đánh giá
<small>khả năng khách hàng trả trước hạn khoản vay mua nhà tại ngân hàng Techcombank”</small>
là do tôi thực hiện và tơi xin chịu trách nhiệm hồn tồn về tính trung thực của nội
<small>dung trong bải.</small>
<small>Tác giả</small>
<small>Định Thị Quỳnh Trang</small>
</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
Trong thời gian làm Chuyên đề tốt nghiệp, em đã nhận được nhiều sự giúp đỡ nhiệt tình của thầy cơ, gia đình và bạn bè.
Em xin gửi lời cảm ơn chân thành đến TS. Phạm Thị Hồng Thắm đã tận tình hướng dẫn em trong suốt quá trình viết Chuyên đề tốt nghiệp.
Em xin cảm ơn đến các anh chị phịng Phân tích rủi ro và mơ hình của ngân
hàng Thuong mại cổ phần Kỹ Thương Việt Nam — Techcombank, đã cung cấp dữ liệu, cũng như hỗ trợ em thực tập và hoàn thành Chuyên đề tốt nghiệp.
Em xin gửi lời cảm ơn và sự tri ân sâu sắc đối với các thầy, cô giáo khoa Toán
thời gian em học tập tại đây. Vốn kiến thức được tiếp thu trong q trình học khơng chỉ là nền tảng cho q trình nghiên cứu mà cịn là hành trang vững chắc để em bước
<small>vào đời.</small>
<small>Em cũng vô cùng cảm ơn sự quan tâm, ủng hộ và giúp đỡ từ gia đình và bạn</small>
bè. Đó chính là nguồn động viên tinh thần rất lớn dé em theo đuổi và hoàn thành
Cuối cùng, trong phạm vi giới hạn về thời gian và trình độ, nên Chuyên đề chắc chắn khơng thể tránh khỏi sai sót và hạn chế. Em rất mong nhận được những ý kiến, đóng góp của các thầy cơ, anh chị dé bài viết của em được hoàn thiện hon! Em xin
<small>chân thành cảm ơn!</small>
<small>11195210 — Dinh Thị Quynh Trang 4</small>
</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">Chun dé tốt nghiệp chun ngành Tốn tài chính
<small>MỤC LỤC</small>
CÁC THUAT NGỮ...-- 2 + ++222E92E12E122112212211211271121121121121111121111211 11. cre. 7 CÁC TU VIET TẮTT...- 2: ¿+SESE2EE92E122122112112711211211121121171121121121111 21111. re. 7 DANH MỤC BẢNG...- - 65c E11EE151121111111111111111111111111 1111111111 E1xEErei 9 DANH MỤC HINH...cccccccsssscscsesscsesscecscecsesucsesucecsvencavsucecsvsucavsueassesusavsucarsveacaveneeees 10 MỞ ĐẦU... 2-5221 21 221221121122121121121121111121111211112111111212121 011 re 11 CHUONG 1: CƠ SỞ LÝ LUẬN VA TONG QUAN NGHIÊN CỨU... 14
1.1. CƠ SỞ LÝ LUẬN ...-2-22 22222221 221122122122127121121 21. cccrke 14
<small>1.1.1. Hoạt động cho vay tại ngân hàng... .--- -- 5c s+S ssskseiererrsee 14</small>
<small>1.1.2. Hoạt động vay va cho vay mua nhà... .-- ¿55+ +22 ++++s++vxseessss 161.1.3. Hành vi trả trước hạn khoản Vay ...- 5-5 + + ++ssvxseeseereeersee 17</small>
1.2.1. Tổng quan các mơ hình đánh giá khả năng trả trước hạn cho những
<small>[3100:0120 A0077... ....-- 5... 19</small>
1.2.2. Những yếu tố ảnh hưởng đến khả năng trả trước của khách hang...21 KET LUAN 09:i0I9) c1. ...Ố ... 24
2.1. XỬ LÍ VÀ LỰA CHỌN BIÊN...--©22- 2S 2222221222122 22212212Ecee 25 2.1.1. _ Cách thức xử lí biến...--:©22:22+c22x22ECSEEEEkrSrkrsrkrrrree 25 2.1.2. Cac tiêu chí lựa chọn biến cho mơ hình ...---2- 2 s+s+zszE+E+zszzzzsz 27 2.2. MƠ HÌNH HOI QUY LOGISTIC...- 2-52 s+S£E£EE2EEEEEeEEeExerxerxered 29 2.2.1. Mơ hình hồi quy LogistiC...--2- 5: ©52+2x+2E2EEt£E2EEerxrzrxerxerrxee 29
<small>2.2.2. Cac tiêu chí đánh giá mơ hình ...-- 5 +25 + *+vsvsserserrrrsreree 30</small>
2.3. THẺ DIEM VA VAI TRỊ CUA THE ĐIỀM...----2-©-2+cxc>szzce¿ 35
</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">Chun dé tốt nghiệp chun ngành Tốn tài chính
KET LUẬN CHUONG 2...-i- St E321 2EEE12111571215711151115E2E111711711151EE SE EEree 37 CHƯƠNG 3: SỬ DỤNG MƠ HÌNH HỎI QUY LOGISTIC ĐỀ ĐÁNH GIÁ KHẢ NĂNG KHÁCH HÀNG TRẢ TRƯỚC HẠN KHOẢN VAY MUA NHÀ TẠO NGAN HÀNG TECHCOMBANK...- - 2k St E121 1112111111111 E111 px. 38 3.1. THỰC TRẠNG CHO VAY MUA NHÀ VÀ HANH VI TRA TRƯỚC HAN CUA KHÁCH HANG TẠI TECHCOMBANK...-- 2 + set+E+£E£EeEvrxerxez 39
<small>3.1.1. _ Thực trạng cho vay mua nhà tại Techcombank... - --- -- + 393.1.2. _ Thực trạng hành vi trả trước hạn khoản vay mua nhà của khách hang tạiTechcombaniK...-- - - ¿+ - 2 E222 1112311112531 11 53 112931 11183111 031111 1n vn ng re Al</small>
3.2. DU LIEU NGHIÊN CỨU...-- 2: ©5¿+2+2E2E+£EE2EEEEE2EESExrrkrerkrrei 42 3.2.1. _ Tổng quan dữ liệu...---©5-+5++E22ES2E2E2EE2122121121121121. 21 xe 42
<small>3.2.2. Chia tập dit liệu...---222.222222112211221122122121 ca 46</small>
3.3.1. _ Phân tích đơn biến...--¿--:- ++22+22E2E2EEEEESEEEEEEErerkrrrrrrkee 46 3.3.2. _ Phân tích đa biến...--22c 2222k 2E 2212212212212... 47 3.3.3. Đánh giá mơ hình cuối cùng...----©2¿+22+£2+E++EzE+zEzEzzezrezreee 53 KET LUAN CHUONG3 1... ... 57 KET LUẬN VÀ KHUYEN NGHI..0..cccsscsssessssssssssesssecssesssecssecssecssscssecssesssecesessseceses 58 TAI LIEU THAM KHẢO...¿- 5c St StEEEEEE‡EEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEkrrtkervee 62
<small>PHU LỤC...- 2:22:22 2212EE222122212212212111211211211211211211211 21211 re 64</small>
</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Tiếng Anh Tiếng Việt
<small>Random Forest Rừng ngẫu nhiên</small>
Decision Tree Cay quyét dinh
<small>Accuaracy Độ chính xác</small>
Confusion matrix Ma trận nhầm lẫn Good Tốt
Bad Xấu
Train Tập huấn luyện
Validation Tập kiểm chứng trong quá trình huấn luyện
<small>Intime Trong thời gian</small>
<small>Outime Ngoai thoi gian</small>
Forward Hồi quy tiến Backward Hồi quy lùi
Trend Xu thế
Logical Trend Đường biểu diễn mối quan hệ biến đầu vào và WOE
<small>Business sense Khia canh kinh doanh</small>
<small>SVM Support Vector Machines</small> (Máy Vector hỗ trợ)
<small>GDA Gaussian Discriminant Analysis</small>
<small>11195210 — Dinh Thị Quynh Trang 7</small>
</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">Chuyên dé tốt nghiệp chun ngành Tốn tải chính
<small>(Phân tích phân biệt Gauss)ANN Artificial Neural Networks</small>
(Mang lưới than kinh nhân tạo)
<small>WOE Weight of evidence</small>
(Trong số dau hiệu)
<small>IV Information value</small>
<small>(Giá trị thông tin)</small>
<small>MLE Maximum Likehood Estimation</small>
(Ước lượng hợp lý tối đa)
(Quan sát dự đoán là tốt nhưng thực tế là xấu)
<small>ROC Receiver operating characteristic</small>
<small>(Đường cong đặc trưng hoạt động của bộ thu nhận)</small>
<small>AUC Area Under the ROC Curve</small>
<small>(Diện tích dưới đường cong ROC)PSI Population Stability Index</small>
(Chi số ôn định tổng thé)
<small>CSI Characteristic Stability Index</small>
(Chi số ôn định của biến)
</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Bảng 2.1. Ma trận nhằm lẫn... -- E1 1222222111111 1111 2155551111 vày 31 Bang 3.1. Bang mô ta biến độc lập... - --L-c c2 1122222211111 525111111555 xk2 42 Bang 3.2. Thống kê mô tả một số biến... .--- 7 2222222222 22+* s2 45 Bang 3.3. Thống kê ty lệ Missing ở một số biến... ..-c ¿<2 222cc 552 46 Bang 3.4. Kết quả hồi quy mơ hình cuối cùng ...-.--..--- 2c >sss2 53 Bảng 3.5. Thống kê mô ta của xác suất dự báo... . ----cc ecseeeseeeeeeeeeeeeees 54
Bang 3.7. Chỉ số PSI của mơ hình...- - . + c2 2221111212112 cez 56
</div><span class="text_page_counter">Trang 10</span><div class="page_container" data-page="10">Chuyên dé tốt nghiệp chuyên ngành Tốn tài chính
Hình 2.1. Đồ thị biểu diễn đường cong ROC...--2 +2 2c c2 *s+>>232
Hình 2.2. Đồ thị biểu diễn Gini...--- cece cece cece 1 1111122222221 sex32
Hình 3.1. Biểu đồ Box-plot biến tuổi... .- -¿- c2 1122221111122 E111 s2245 Hình 3.2. Xu thế WOE biến “TRANS_1”... 2 1122221111122 re 48 Hình 3.3. Xu thế WOE biến ‘TRANS _9°... 22011111222 1xx 48 Hình 3.4. Xu thế WOE biến 'PRODUCT_Š”...- c2 222252222221 sssey 49
Hình 3.6. Xu thế WOE biến “SEC_OS_2)...c 7221111122221 eg 50 Hình 3.7. Xu thế WOE biến ‘DEMO 3'... 2c 2222211111222 xy 51 Hình 3.8. Xu thé WOE biến ‘BAL CA 6'... c2 2211112222 xy 51 Hình 3.9. Xu thế WOE biến ‘LOAN 37 ...00...cccccccccceseeeeeceeeeeeeeessueeeeeeeeeess 52 Hình 3.10. CSI của 8 biến cuối cùng ở tập Train - Validation...---. 55 Hình 3.11. CSI của 8 biến cuối cùng ở tập Train — Test...---: 56
<small>11195210 — Dinh Thị Quynh Trang 10</small>
</div><span class="text_page_counter">Trang 11</span><div class="page_container" data-page="11">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
1. LY DO CHỌN DE TÀI
được tiền bang cách nhận các khoản lãi cho vay. Do đó, các khoản trả trước so với thời hạn đã thoả thuận của khách hàng sẽ làm ngân hàng mat đi một khoản tiền lãi,
hơn lãi suất hợp đồng.
Bên cạnh đó, một danh mục thế chấp như các khoản vay mua nhà phải được tái cấp vốn. Khi thời hạn tài trợ không khớp với thời hạn thế chấp, rủi ro thanh khoản có thể xảy ra. Việc ước tính khơng chính xác về các khoản trả trước dẫn đến rủi ro thiếu hoặc thừa tài trợ. Hơn nữa, ngân hàng luôn cần phải cân đối giữa mức lãi suất, kì hạn cho vay và các chi phí hoạt động cũng như lãi suất, kì hạn phải trả cho nguồn vốn mà ngân hàng đã dùng đề huy động. Việc khách hàng trả trước sẽ ảnh hưởng đến việc giải ngân đối với khoản vay của các khách hàng khác và kế hoạch hoạt động của
Tại Techcombank, dé tạo thuận lợi hơn cho khách hàng đến với sản phẩm của mình cũng như kích cầu mua nhà cho doanh nghiệp, ngân hàng thường ký thỏa thuận hợp tác hỗ trợ khách hàng vay tiền mua nhà ở một số dự án bất động sản. Do đó, đối với các khoản vay mua nhà tại Techcombank, trong khoảng thời gian 6 — 24 tháng kế từ lúc vay, khách hàng có thê sẽ khơng cần trả cả gốc lẫn lãi. Khoảng thời gian này được gọi là thời gian ân hạn. Sau khi kết thúc khoảng thời gian trên, khách hàng bắt đầu phải trả lãi, do đó khách hàng sẽ trả trước rất nhiều.
Vậy nên, việc đánh giá khả năng khách hàng vay mua nhà trả trước hạn là điều cần thiết để ngân hàng có những chiến lược phù hợp phịng ngừa các rủi ro trên, bù đắp chi phí trả lãi huy động vốn cũng như đảm bảo sự 6n định cho quá trình hoạt động của ngân hàng. Nhiều thuật toán như Rừng ngẫu nhiên (Random Forest), Mạng thần kinh nhân tạo (ANN)...đã dựa trên thơng tin lịch sử tín dụng, nhân khẩu học, đặc điểm khoản vay... để dự đoán hành vi thanh toán sớm hơn dự kiến của khách hàng. Trong đó, mơ hình hồi quy logistic được sử dụng rộng rãi và được chứng minh là có khả năng dự báo tốt và dễ giải thích. Đó là những ly do dé sinh viên lựa chọn đề tài:
<small>11195210 — Dinh Thị Quynh Trang 11</small>
</div><span class="text_page_counter">Trang 12</span><div class="page_container" data-page="12">Chun dé tốt nghiệp chun ngành Tốn tài chính
“Ứng dụng mơ hình hồi quy logistic đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà tại ngân hàng Techcombank” làm chuyên đề tốt nghiệp.
<small>2.1. Mục tiêu chung:</small>
đề đánh giá khả năng khách hàng trả trước hạn cho khoản vay mua nhà tại Ngân hàng Thương mại cô phần Kỹ Thương Việt Nam - Techcombank, từ đó thiết kế thẻ điểm cho khách hàng và đưa ra một số kiến nghị trong chiến lược phòng ngừa rủi ro khi
<small>khách hàng trả trước hạn của Ngân hàng.</small>
2.2. Mục tiêu cụ thể:
<small>Dé thực hiện được mục tiêu chung ở trên, Chuyên đê có các mục tiêu cu thêtheo các câu hỏi nghiên cứu sau đây:</small>
(i) Mơ hình hồi quy Logistic có phù hợp dé đánh giá kha năng khách hang
<small>trả trước hạn khoản vay mua nhà tại Techcombank hay không?</small>
(ii) — Có thể xây dựng được thẻ điểm phân loại khách hang từ mơ hình trên, để từ đó có những chính sách cho nhóm khách hàng mục tiêu hay
3. Đối tượng nghiên cứu và phạm vi nghiên cứu
- Đối tượng nghiên cứu: mơ hình hồi quy Logistic dự đốn hành vi trả trước hạn
<small>khoản vay mua nhà của khách hàng.</small>
<small>- Phạm vi nghiên cứu: những khách hàng có khoản vay mua nhà tại ngân hàng</small>
Techcombank trong giai đoạn thang 6/2020 đến tháng 9/2021.
<small>4. Phương pháp nghiên cứu</small>
<small>- Phương pháp nghiên cứu: Định lượng</small>
<small>- Mơ hình/ Thuật tốn: Logistic</small>
- Phần mềm: Python 5. Kết cấu chuyên đề
Ngoài phần mở đầu và kết luận, danh mục tài liệu tham khảo và phụ lục, Chun đề gồm có ba chương chính như sau:
<small>11195210 — Dinh Thị Quynh Trang 12</small>
</div><span class="text_page_counter">Trang 13</span><div class="page_container" data-page="13">Chuyên dé tốt nghiệp chun ngành Tốn tải chính Chương 1: Cơ sở lý luận và tông quan nghiên cứu
<small>Chương 2: Phương pháp nghiên cứu</small>
<small>hạn khoản vay mua nhà tại Techcombank.</small>
<small>11195210 — Dinh Thị Quynh Trang 13</small>
</div><span class="text_page_counter">Trang 14</span><div class="page_container" data-page="14">Chuyên dé tốt nghiệp chuyên ngành Tốn tài chính
Mục tiêu của Chương 1 là trình bay cơ sở lý luận và tổng quan về van đề nghiên cứu dé làm tiền đề nghiên cứu. Cụ thé, phần 1.1 trình bày cơ sở lý luận về hoạt động cho vay thế chấp, cho vay mua nhà và hành vi trả trước hạn của khách hàng, cùng các van đề liên quan dé thay được sự cần thiết của dé tài. Phan 1.2 tổng quan các mơ hình dự đoán và những yếu tố ảnh hưởng đến khả năng trả trước của khách hàng vay, dựa
<small>với dữ liệu tại ngân hàng Techcombank.</small>
<small>1.1.1. Hoạt động cho vay tại ngần hàng</small>
Theo quy định tại Khoản 1, Điều 2, Thông tư 39/2016/TT-NHNN của Ngân
hàng nhà nước quy định về hoạt động cho vay của tổ chức tín dụng đối với khách
hàng thì: “Cho vay là hình thức cấp tín dụng, theo đó tổ chức tín dụng giao hoặc cam
kết giao cho khách hàng một khoản tiền để sử dụng vào mục đích xác định trong một thời gian nhất định theo thỏa thuận với ngun tắc có hồn trả cả gốc và lãi”.
Ngân hàng là các trung gian tài chính cung cấp các khoản vay cho một loạt các hoạt động kinh tế. Họ chỉ giữ một tỷ lệ nhỏ tiền gửi như một khoản dự trữ dé trả cho những người gửi tiền đến ngân hàng để rút tiền vào bất kỳ ngày nào nhất định. Phần lớn khoản tiền gửi ngân hang dé cho vay. Ngoài ra, dé tài trợ cho hoạt động cho vay, ngân hàng còn huy động vốn từ vốn tự có, vốn vay thị trường trong và ngoài nước, vốn ủy thác tài trợ phát triển...
Hoạt động cho vay bị ảnh hưởng bởi nhu cầu và nguồn cung bat động sản, sự cạnh tranh giữa những người cho vay, điều kiện lãi suất, điều kiện kinh tế chung, khả năng cung cấp vốn... Dé đảm bảo an toàn và hiệu quả, hoạt động cho vay phải được thực hiện theo những nguyên tắc nhất định. Thứ nhất, khách hàng phải hoàn trả nợ
<small>dựa trên phương án có hiệu quả, mục đích hợp pháp và có khả năng hồn trả nợ. Ngân</small>
hàng sẽ xem xét thu nhập, điểm tín dụng, mức nợ...của người vay trước khi quyết định cho họ vay và cũng có thể tính lãi suất cao hơn đối với những người vay rủi ro.
<small>11195210 — Dinh Thị Quynh Trang 14</small>
</div><span class="text_page_counter">Trang 15</span><div class="page_container" data-page="15">Chuyên dé tốt nghiệp chuyên ngành Tốn tài chính
Hiện nay, hoạt động cho vay ở ngân hàng được phân loại theo nhiều phương thức khác nhau. Đối với mỗi loại khoản vay thì ngân hàng cung cấp với các mức lãi suất khác nhau. Cu thé:
<small>cho vay trung hạn và cho vay dài hạn</small>
+ Căn cứ vào tính chất bảo đảm của khoản vay: Cho vay có tài sản đảm bảo,
<small>cho vay khơng có tài sản đảm bảo</small>
+ Căn cứ vào phương thức cho vay: Cho vay từng lần, cho vay theo hạn mức tin dụng, cho vay thấu chi, cho vay trả góp, cho vay hợp vốn...
<small>e Vai trị của hoạt động cho vay</small>
- Vai trò đối với ngân hàng:
Hoạt động cho vay là hoạt động mang lại lợi nhuận chủ yếu cho ngân hàng. Các ngân hàng tính lãi suất cho các khoản vay cao hơn so với lãi suất mà họ cung cấp cho các khoản tiền gửi. Sự khác biệt giữa lãi được tính từ người đi vay và lãi được trả cho những người gửi tiền là nguồn thu nhập chính của họ.
<small>Bên cạnh đó, ngồi khoản thu từ lãi, ngân hàng cịn có các khoản thu phí dịch</small>
vụ như: dịch vụ thanh toán, dịch vụ tư vấn,... - Vai trò đối với khách hàng:
Với nhiều ưu điểm như an toàn, thuận tiện, dễ tiếp cận ..., hoạt động cho vay của ngân hàng đáp ứng kịp thời về nhu cầu vốn đa dạng của khách hàng: giúp các nhà
xuất; các cá nhân có khả năng tài chính để trang trải các khoản chỉ tiêu nâng cao chất
- Vai trò đối với nên kinh tế.
Ngân hàng làm trung gian với hoạt động cho vay sẽ giúp luân chuyền vốn giữa các chủ thê trong nền kinh tế: giữa những người có tiền dư thừa (người gửi tiền) và những người đang cần tiền (người đi vay).
<small>11195210 — Dinh Thị Quynh Trang 15</small>
</div><span class="text_page_counter">Trang 16</span><div class="page_container" data-page="16">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Hơn nữa, hoạt động cho vay sẽ giúp các doanh nghiệp có vốn mở rộng sản xuất, cá nhân có tiền nâng cao chất lượng cuộc sống, từ đó tăng tính hiệu quả trong sử dụng vốn, góp phần mở rộng sản xuất, thúc đây đổi mới công nghệ, thu hút đầu tu...dé phát triển kinh tế.
<small>1.1.2. Hoạt động vay và cho vay mua nhà</small>
nên ln có mong muốn có một ngôi nhà sạch đẹp, ấm cúng. Nhưng với chỉ tiêu ngày càng đắt đỏ; song song với q trình đơ thị hố dién ra nhanh, dân số đơng thì nhu cầu
Chính vì thế, hoạt động vay mua nhà được coi là giải pháp tối ưu, giúp người dân có thê mua nhà trong thời gian sớm nhất mà không phải chờ đến khi tích góp đủ số tiền.
Nhờ đó, người dân có thé yên tâm làm việc, cải thiện đời sống với ngơi nhà mình mơ ước. Ngồi ra, đối với nhiều người, đầu cơ còn là mua đi bán lại kiếm lời.
Vay thé chấp là hình thức vay vốn phổ biến nhất cho các khoản vay mua nhà. Khách hàng sẽ được xem xét xét duyệt hồ sơ cho vay dựa trên tài sản đảm bảo, thu nhập, điểm tín dụng,... Với hình thức này, số tiền cho vay tối đa lên đến 100% giá trị của căn nhà cần mua và thời hạn vay từ 10 - 30 năm với mức lãi suất không quá cao. Người vay cần phải thế chấp tài sản đảm bảo như xe hơi, đất đai... hoặc chính ngơi
nhà mình đang vay mua dé có thé được vay vốn. Tài sản vẫn thuộc sở hữu của người đi vay, ngân hàng chỉ giữ giấy tờ gốc chứng nhận sở hữu tài sản. Tuy nhiên, tuy nhiên nếu khơng có khả năng trả nợ cho ngân hàng, ngân hàng có thể bán tài sản nhằm giảm
Trong khi đó, đối với các ngân hàng, thị trường cho vay mua nhà là phân đoạn thị trường được đánh giá là tiềm năng, đặc biệt khi càng ngày càng nhiều các khu đô thị, dự án nha ở liền kề...được triển khai xây dựng, và thu nhập cũng như nhu cầu của
dùng với quy mô khá lớn và mức lãi suất cao, là nguồn thu rất lớn của ngân hàng. Bên
<small>cạnh đó, hoạt động cho vay mua nha còn giúp ngân hang đa dạng hố danh mục sản</small>
phẩm, góp phan phân tán rủi ro, thu hút khách hàng nhiều hơn. Đồng thời ngân hàng
cũng phát triển được nhiều sản phẩm liên kết như cho vay mua 6 tô hay nội thất sau <small>khi đã vay mua nhà.</small>
<small>11195210 — Dinh Thị Quynh Trang 16</small>
</div><span class="text_page_counter">Trang 17</span><div class="page_container" data-page="17">Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
Bên cạnh đó, hoạt động cho vay mua nhà cịn có ý nghĩa hết sức quan trọng đối với nền kinh tế nói chung và thị trường bất động sản nói riêng bởi sự tham gia vào thị trường của các ngân hàng đã tạo được những đòn bây quan trọng, kích thích nền sản xuất phát triển, thúc đây hoạt động kinh doanh bất động sản cũng như thúc đây q trình đơ thị hố đất nước.
nhiên, trong bối cảnh hạn mức (room) tín dụng ở các ngân hàng thương mại đang cạn kiệt, lãi suất tăng thì khơng chỉ khách vay mua bat động san dé đầu cơ gặp khó, ma
trên thực tế, người dan mua nhà ở cũng khó dé tiếp cận vốn tin dụng. Theo quan sát, ở một số ngân hàng, lãi suất vay mua nhà đang ở mức cao, giải ngân lâu hơn và khơng
<small>cịn những gói ưu đãi.</small>
<small>1.1.3. Hành vi trả trước hạn khoản vay</small>
Khi đi vay, khách hàng có thê lựa chọn 2 hình thức trả quen thuộc nhất là trả theo niên kim và tra theo du nợ từng phan. Khi trả theo niên kim, người vay sẽ trả một số tiền gốc và lãi cộng lại là bằng nhau ở hang ky, cho đến khi hoàn trả tổng số tiền gốc của khoản vay. Số tiền niên kim là cố định, nhưng thành phần của nó thay đồi. Trong thời gian đầu, phần lớn số tiền này được tạo thành từ tiền lãi và chỉ một phần nhỏ dành đề trả nợ gốc. Số tiền gốc cịn lại càng cao thì số tiền lãi càng cao. Vì vậy, theo thời gian, phần lãi nhỏ dan, dé tổng số tiền phải trả không đổi thì phần trả nợ gốc phải tăng lên. Trong khi với khoản vay trả dư nợ từng phần, hàng tháng, người đi vay
<small>còn lại.</small>
Trả trước hạn khoản vay là việc khách hàng muốn trả nhiều hơn số tiền tại một thời điểm sớm hơn so với thời hạn được ghi trên hợp đồng tín dụng của mình và ngân hàng. Người vay có thể chọn trả một số tiền lớn hơn số tiền trả góp hàng tháng hoặc tồn bộ khoản vay trước khi kết thúc thời hạn vay. Ở đây chúng ta xét đến những khách hàng tất tốn tồn bộ khoản vay trước hạn.
<small>11195210 — Dinh Thị Quynh Trang 17</small>
</div><span class="text_page_counter">Trang 18</span><div class="page_container" data-page="18">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Trả trước khoản vay có thể giúp khách hàng giảm bớt gánh nặng tài chính khi trả các khoản vay và tiết kiệm chỉ phí trả lãi. Tuy nhiên, đối với ngân hàng, việc trả trước được coi là rủi ro tài chính. Bởi khi cho vay vốn, thì bản thân ngân hàng được hưởng lợi từ chính số tiền cho khách hàng vay với một lãi suất nhất định. Các khoản trả trước sẽ làm giảm lợi nhuận của các hợp đồng thế chấp, đặc biệt khi cho rằng khách hàng có nhiều khả năng trả trước khi lãi suất thị trường hiện tại thấp hơn lãi
gặp rủi ro thanh khoản. Một danh mục thế chấp phải được tái cấp vốn. Do vậy, rủi ro thanh khoản xảy ra khi thời han tài trợ không khớp với thời hạn cam có. Việc ước tính khơng chính xác về các khoản trả trước dẫn đến rủi ro thiếu hoặc thừa tai trợ.
Cụ thể như nếu khách hàng vay tiền từ ngân hàng với thời hạn § năm. Tuy
nhiên, đến năm thứ 2 người vay lại muốn trả hết tiền vay trước cho ngân hàng. Thực
tế, ngân hàng luôn cần phải cân đối giữa mức lãi suất, kì hạn cho vay và lãi suất, kì
hạn phải trả cho nguồn vốn mà ngân hàng đã huy động, cũng như các chỉ phí hoạt
động khác. Điều dé hiểu là người đi vay luôn muốn trả nợ càng nhanh càng tốt nhưng ngược lại, ngân hàng bị day vào thé bị động do điều khiển dòng tiền mà khách trả nợ quá sớm. Việc khách hàng trả trước sẽ ảnh hưởng đến việc giải ngân đối với khoản vay của các khách hàng khác và kế hoạch hoạt động của tô chức, tạo ra sự phức tạp trong các chiến lược tái cấp vốn...Kéo theo đó, nguồn lãi suất mà ngân hàng có thé
<small>thu được trong thời hạn § năm cũng bị ảnh hưởng.</small>
Hon thé, đối với các khoản vay thé chấp, việc khách hang trả trước có thé gây ra rủi ro lãi suất. Bởi vì các khoản vay thế chấp thường được thanh toán sớm đề chịu khoản thanh toán lãi suất thấp hơn thông qua việc tái cấp vốn rẻ hơn. Khoản tài trợ mới có thé rẻ hon do tín dụng của người đi vay đã được cải thiện hoặc do lãi suất thị trường đã giảm. Trong khi đó, các khoản thế chấp có lãi suất có định thường được bảo hiểm trước sự thay đổi của lãi suất bằng cách sử dụng giao dịch hoán đối lãi suất, trong đó ngân hàng nhận lãi suất thả nỗi và tra lãi suất có định. Do đó, việc trả trước có thé khiến ngân hàng phải trả một tỷ lệ cô định, cao hơn lãi suất nhận được từ khoản thế chấp mới.
Vì vậy, ngân hàng sẽ thu phí khi khách hàng trả trước hạn các khoản vay dé bù đắp lại những rủi ro trên. Phí trả trước sẽ khác nhau giữa các ngân hàng và cũng phụ <small>thuộc vào thời hạn hoàn thành của khoản vay cá nhân. Thông thường, các ngân hàng</small>
<small>11195210 — Dinh Thị Quynh Trang 18</small>
</div><span class="text_page_counter">Trang 19</span><div class="page_container" data-page="19">Chuyên dé tốt nghiệp chuyên ngành Tốn tài chính
tính mức phí này dao động từ 1-5% trên tổng giá trị tiền trả trước hạn của người vay. Khách hàng có thể sẽ khơng phải nộp phí phạt trước hạn sau khi hồn thành khoản vay trong một số năm nhất định.
1.2.1. Tổng quan các mơ hình đánh giá kha năng trả trước han cho những
<small>khoản vay ngần hàng</small>
Cho tới nay, dé đánh giá khả năng khách hàng vay mua nhà trả trước hạn, các nghiên cứu hiện có đã áp dụng hai cách tiếp cận chính: cách tiếp cận trả trước tối ưu
theo lý thuyết tùy chọn (option-theoretic prepayment model) chỉ tính đến các khía cạnh tài chính (chi bao gồm các yếu tố liên quan đến biến động lãi suất, chi phí giao dịch...). Cách tiếp cận thứ hai bao gồm các mơ hình trả trước ngoại sinh (exogenous prepayment models) dựa trên thơng tin liên quan đến cả tài chính và phi tài chính, nhằm mục đích giải thích mối quan hệ giữa khả năng trả trước được quan sát và một tập hợp các biến độc lập thông qua phân tích thống kê và khai thác dữ liệu.
1.2.1.1. Mơ hình trả trước theo lý thuyết tuỳ chọn
<small>Các mơ hình này coi việc trả trước xảy ra như một hệ qua của hành vi hoàn</small>
toàn hợp lý từ người đi vay, một tùy chọn được cho là được thực hiện một cách tối
<small>ưu; nên cịn có tên gọi khác là mơ hình trả trước tơi ưu.</small>
Nhiều tùy chọn trả trước là một tùy chọn “phản ánh sự chênh lệch giữa giá trị của các khoản nợ chưa hoàn trả theo lãi suất tại thời điểm trả trước cho thời hạn còn lại của khoản vay, trừ đi số tiền còn lại của khoản vay”. Những người đi vay hợp lý chỉ nên thực hiện tùy chọn trả trước nếu khoản chênh lệch nêu trên là dương, vì nếu khơng, tùy chọn này là vơ nghĩa vì gửi tiền vào tài khoản tiết kiệm sẽ thích hợp hơn
theo các mơ hình này khi nó có lợi về mặt kinh tế cho họ và đặc biệt khi lãi suất thị
trường thấp hơn lãi suất trả trên tài sản thế chấp của họ. Sử dụng cách tiếp cận này, các nguyên nhân chính dẫn đến hành vi trả trước chỉ gồm giá trị nhà và lãi suất
<small>(Gerardi và cộng sự, 2013; Chamboko và Bravo, 2020).</small>
Tuy nhiên, không phải lúc nào mọi người cũng hành động hợp lý về mặt kinh
<small>tê. Các nghiên cứu đã chỉ ra răng các mơ hình trả trước dựa trên các biên sơ tải chính</small>
<small>11195210 — Dinh Thị Quynh Trang 19</small>
</div><span class="text_page_counter">Trang 20</span><div class="page_container" data-page="20">Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
thuần túy sẽ đánh giá thấp hơn hoặc ước tính quá mức các khoản trả trước trong các trường hợp cụ thé. Tức là, có thé quan sát thay một thành phần ngẫu nhiên đáng ké liên quan đến hành vi khơng chắc chắn. Bên cạnh đó, việc sử dụng các mơ hình trả trước theo lý thuyết tuỳ chọn khơng thể giải thích được đầy đủ hành vi trả trước nói
<small>1.2.1.2. Mơ hình trả trước ngoại sinh</small>
tài chính. Mơ hình trả trước ngoại sinh khắc phục được những thiếu sót của mơ hình
trả trước theo lý thuyết tuỳ chọn là khơng thê giải thích hành vi và người đi vay khơng trả trước khi nó là tối ưu, vì người tiêu dùng có động cơ phi tài chính khác để trả trước
<small>(Charlier và van Bussel, 2003; Jacobs và cộng sự, 2005; LaCour-Little, 2008; Saito,</small>
2018). Có nhiều lý do tại sao người đi vay quyết định trả trước khoản vay thế chấp
đến các yêu tố kinh tế vĩ mô là cần thiết dé bắt đầu một mơ hình như vậy.
Dựa trên những thơng tin này, đã có nhiều mơ hình học máy, học sâu được sử dụng dé dự đoán hành vi trả trước của khách hàng như Logistic, Random Forest, Neural Networks,...và đều được chứng minh là có kha năng dự bao và phân loại tốt.
<small>Trong một nghiên cứu của Sara Zahi và BouJemâa Achcab (2020), mơ hình</small>
Logistic đã được sử dụng dé dự đốn các khoản vay mua 6 tơ trả trước. Kết quả đánh giá mơ hình đã đạt được độ chính xác 85%. Kiểm định Hosmer — Lemeshow so sánh mức độ khớp giữa giá trị dự đoán và giá trị quan sát được cũng cho thấy mơ hình có khả năng dự báo tốt.
hành nghiên cứu sâu rộng va toan diện nhất về chủ đề đang thảo luận. Họ đã so sánh
Gaussian Discriminant Analysis (GDA). Kết qua thu được từ nghiên cứu cho thấy
GDA được đánh giá cao nhất, tiếp đến là Logistic. Đối với mô hình Logistic, sau khi áp dụng kĩ thuật L2 regularization, mơ hình đạt độ chính xác lên đến 99,92% và có thê dự đốn "No Prepayment" với accuracy là 100%.
Trong khi đó, Amar (2020) đã sử dụng mang Nơ-ron dé phân tích hành vi trả trước của những người đi vay thế chấp ở Mỹ từ năm 2000 đến năm 2018. Hai khía
<small>11195210 — Dinh Thị Quynh Trang 20</small>
</div><span class="text_page_counter">Trang 21</span><div class="page_container" data-page="21">Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
cạnh khác nhau được xem xét: khía cạnh thứ nhất xác định liệu một khoản thế chấp
<small>có trả trước hay khơng, khía cạnh thứ hai đánh giá mức độ của khoản trả trước (dự</small>
đoán tỷ lệ trả trước). Cả hai mơ hình mạng Nơ-ron đa lớp mà Amar phát triển, mơ hình hồi quy và phương pháp tiếp cận mơ hình hai yếu tố, đều cho kết quả tốt. Việc ước tính tỷ lệ thanh tốn trước là chính xác và điều này có triển vọng. Nghiên cứu cũng nhắn mạnh các mơ hình cần được dao tạo lại thường xuyên khi có dữ liệu mới
<small>dữ liệu.</small>
<small>máy học là Random Forest va Artificial Neural Networks (ANN), hai mô hình đượcthực hiện: một mơ hình xem xét khả năng tra trước tồn bộ, va một mơ hình trả trước</small>
từng phần. Cả hai thuật toán đều cho kết quả khả quan, có khả năng dự báo và phân biệt tốt, trong đó Random Forest hoạt động tốt hơn ANN trong cả 2 mơ hình mục tiêu.
<small>Mơ hình Random Forest trả trước toàn bộ đạt được AUC là 0,86 trong tập dữ liệu đào</small>
tạo và 0,83 trong tập dữ liệu thử nghiệm; trong khi với mục tiêu trả trước từng phần, AUC lần lượt là 0,93 trong tập Train và 0,90 trong tập Test.
Các mơ hình như Random Forest, SVM, Neural Network... cho kết quả với độ chính xác cao, tuy nhiên lại có cấu trúc khá phức tap và khó dé giải thích. Trong khi đó, mơ hình hồi quy Logistic lại có thé dé dang biến đổi về dạng tuyến tính nên dễ giải thích ảnh hưởng của biến độc lập lên mục tiêu, cũng như dễ hiểu và quy trình thực hiện rõ ràng. Vậy nên, Chuyên đề đã lựa chọn mơ hình Logistic dé đánh gia kha
<small>năng khách hang trả trước hạn khoản vay mua nhà.</small>
Theo Amar (2020), Lopes (2022), đối với một mô hình dự báo khả năng trả
+ Đặc điểm khoản vay: số tiền vay, thời hạn vay, số tiền phải trả hàng tháng, lãi suất, tình trạng sở hữu nhà / hạng mục đối với yêu cầu vay, giá trị tài sản đảm
<small>+ Các đặc điểm cá nhân của khách hàng: tuổi, giới tinh, tinh trạng hơn nhân,</small>
số lượng người phụ thuộc, trình độ học van, thu nhập hàng tháng, nghề nghiép/ tình
<small>trạng cơng việc, mức độ tín nhiệm...</small>
<small>11195210 — Dinh Thị Quynh Trang 21</small>
</div><span class="text_page_counter">Trang 22</span><div class="page_container" data-page="22">Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
+ Lịch sử tín dụng của khách hàng: số lượng và số tiền của các khoản tín dụng mở, số dư trung bình trong tài khoản séc, dư nợ cho vay, khoản nợ khơng trả được...
+ Kha năng tài chính của khách hàng: tổng tai sản, tổng thu nhập, chi phí hàng
<small>tháng của hộ gia đình, tỷ lệ nợ trên thu nhap...;</small>
biến động GDP, tỷ lệ thế chấp thị trường, tháng trong năm,,...
Trong đó, ưu đãi lãi suất là một trong những yếu tô quan trọng nhất quyết định việc trả trước. Khi lãi suất của hợp đồng thế chấp mới thấp hơn so với hợp đồng cũ, người vay có động cơ tài chính để trả hết thế chấp của mình và nhận một hợp đồng mới. Lee Nai & Ong Seow (2003) đã phân tích các yếu tố xác định rủi ro trả trước của các khoản thế chấp đối với nhà ở công cộng (nhà ở xã hội được hỗ trợ 1 phần bởi Nhà nước) ở Singapore. Kết quả nghiên cứu cho thấy, việc trả trước có mối tương quan thuận với tâm lý thị trường và lãi suất các khoản vay. Ngược lại, nó có mối tương quan nghịch với tăng trưởng thu nhập và chênh lệch tương đối giữa giá nhà ở tư nhân và công cộng. Các phát hiện cũng cho răng tỷ lệ trả trước của các khoản thế chấp nhà nước bị ảnh hưởng trực tiếp bởi bất kỳ chính sách nào nâng cao khả năng chỉ trả của
<small>người dân các khu nhà công cộng đê chuyên sang nhà ở tư nhân.</small>
<small>Một nghiên cứu khác của Chong Guo, John Boccio, Cameron (2018), khi phân</small>
tích tầm quan trọng, đã chỉ ra rằng thuộc tính quan trọng nhất ảnh hưởng đến khả năng trả trước là "current_UPB". Thuộc tính nay đề cập đến số dư nợ hiện tại của khoản vay. Số dư nợ càng ít, càng có nhiều khả năng người vay sẽ trả trước.
thấp sau khi khoản vay bắt đầu; mà chúng sẽ tăng dần lên cho đến khi đạt mức 6n
<small>cộng sự, 2005).</small>
Xu hướng giá nha cũng là một yếu tố ảnh hưởng đến khả năng trả trước hạn
<small>các khoản vay của khách. Trong những khoảng thời gian tăng giá nhà, việc bán nhà</small>
và thé chấp có thé tăng lên, vì lợi nhuận sẽ được tao ra khi ban tai sản. Các khoản tra trước do chuyên nhà sẽ thường xuyên hơn trong những giai đoạn này (Agency, 2014). Ngược lại, trong thời kỳ mat giá hoặc giá cả bap bênh, nguồn gốc bán nhà và thé chấp
<small>11195210 — Dinh Thị Quynh Trang 22</small>
</div><span class="text_page_counter">Trang 23</span><div class="page_container" data-page="23">Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
<small>có xu hướng giảm do những người mua nhà ngại rủi ro miễn cưỡng tham gia thịtrường. Đối lại, điều này dẫn đến việc trả trước ít hơn do chuyên địa điểm.</small>
Tháng trong năm cũng có thể ảnh hưởng đến tỷ lệ trả trước. Hiệu ứng này được gọi là tính thời vụ, và nó thé hiện tính thời vụ mạnh mẽ trên thị trường nhà ở. Nhiều căn nhà được ban hơn đáng kể trong những tháng mùa hè và đầu mùa thu. Bán nhà
<small>(hoặc doanh thu bán nhà) thường sẽ kích hoạt một khoản thanh tốn trước (P. Kang</small>
có nhiều kha năng xảy ra hon, do tiền thưởng hoặc do các khoản lợi thuế có thé có
<small>11195210 — Dinh Thị Quynh Trang 23</small>
</div><span class="text_page_counter">Trang 24</span><div class="page_container" data-page="24">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Chương này đã trình bày được cơ sở lý luận về hoạt động cho vay, cho vay mua nhà và hành vi vay trả trước hạn của khách hàng, đồng thời tổng quan được các mơ hình được sử dụng để dự báo khách hàng vay thế chấp trả trước hạn.
Hoạt động cho vay là hoạt động mang lại lợi nhuận chủ yếu cho ngân hang. Sự khác biệt giữa lãi được tính từ người đi vay và lãi được trả cho những người gửi tiền là nguồn thu nhập chính của họ. Việc khách hàng trả trước hạn các khoản vay sẽ làm ngân hàng mắt đi một khoản tiền lãi. Đặc biệt, với những khách hàng vay mua nhà, họ thường có khoảng thời gian ân hạn. Kết thúc khoảng thời gian này, khách hàng trả trước rất nhiều. Do đó, việc đánh giá khả năng khách hàng trả trước hạn khoản vay
<small>mua nhà là rât cân thiệt.</small>
Có hai mơ hình chính được sử dụng dé dự đốn hành vi trên của khách hàng, đó là mơ hình trả trước theo lý thuyết tùy chọn và mơ hình trả trước ngoại sinh. Các mơ hình lý thuyết tuỳ chọn chỉ tính đến các khía cạnh tài chính, do đó khơng thể giải thích được đầy đủ hành vi trả trước nói chung. Trong khi đó, các mơ hình trả trước ngoại sinh dựa trên thông tin liên quan đến cả tài chính và phi tài chính, với việc sử
<small>dụng các thuật toán Logistic, Random Forest, Neural Networks..., đã được chứng</small>
minh là có khả năng dự báo và phân loại tốt hơn.
Các nhóm biến được kỳ vọng đưa vào mơ hình dự báo bao gồm: Đặc điểm
dụng của khách hàng (số lượng và số tiền của các khoản tín dụng mở, số dư trung
<small>bình trong tải khoản séc, dư nợ cho vay, khoản nợ qua han...); Khả năng tai chính của</small>
khách hàng (tơng tài sản, tổng thu nhập, ty lệ nợ trên thu nhập...); Các biến số kinh tế vĩ mô (diễn biến của giá nhà, tỷ lệ thất nghiệp, biến động GDP, tỷ lệ thế chấp thị
<small>trường, thang trong năm,... ).</small>
Do tính ưu việt của hồi quy Logistic nên chun đề đã lựa chọn mơ hình này để đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà tại ngân hàng
<small>Techcombank. Cùng với mô hình Logistic, cách thức xử lí dữ liệu quen thuộc trong</small>
Ngân hàng là WOE cũng như với các tiêu chí kiểm định mơ hình cũng sẽ được trình
<small>bày ở chương 2.</small>
<small>11195210 — Dinh Thị Quynh Trang 24</small>
</div><span class="text_page_counter">Trang 25</span><div class="page_container" data-page="25">Chun dé tốt nghiệp chun ngành Tốn tài chính
Mục tiêu của Chương 2 là trình bày phương pháp sử dụng trong chuyên đề dé dự đoán khách hàng vay mua nhà trả trước hạn. Mục 2.1 đề cập đến cách thức xử lí biến WOE và các tiêu chí lựa chọn biến đưa vào mơ hình. Mục 2.2 trình bay về mơ hình được sử dụng trong nghiên cứu là mơ hình hồi quy Logistic, cùng với các tiêu
điểm trong việc ra quyết định và quản lý rủi ro. 2.1. XỨ LÍ VÀ LỰA CHỌN BIEN
Mục này trình bày về cách thức biến đổi, xử lí biến quen thuộc trong ngân hàng, đó là trọng số dấu hiệu — (WOE - Weight of evidence).
WOE sẽ nhóm các giá trị thành các khoảng gia trị. Với biến liên tục, WOE sẽ
nhóm các giá tri lại thành các khoảng liên tục. Chăng han, với biến tuổi, chúng ta có
thé nhóm các quan sát thành các khoảng: < 18 tuổi, 18 - 30 tuôi...Một khách hang 25 tudi sẽ được phân vào khoảng 18-30. Với biến phân loại, WOE có thé coi mỗi giá tri là một nhóm hoặc gộp các nhóm có sỐ lượng quan sat it lại với nhau. Ngoài ra, các giá trị bị Missing cũng có thể được coi là một nhóm riêng biỆt.
Việc nhóm các khoảng giá trị phải đáp ứng một số tiêu chí nhóm nhất định, chăng hạn mỗi khoảng giá trị phải chứa ít nhất 5% số quan sát mẫu. Hoặc những khoảng giá trị có giá tri WOE gần bằng nhau thì có thé nhóm lại với nhau. Việc này nhằm làm giảm số lượng nhóm và tăng tính phân loại cho mơ hình. Ngồi ra, việc nhóm các khoảng giá trị phải đảm bảo phù hợp kỳ vọng lý thuyết kinh tế về mỗi quan hệ WOE và biến độc lập (Logical Trend).
Logical Trend là một đường thường biểu thị mối quan hệ tuyến tính và logic
nhiều nợ càng lớn, ít có khả năng trả trước. Tức số lượng quan sát xấu giảm, WOE
tăng, nên xu thế (Trend) kỳ vọng ở đây là đường WOE đi lên. Tuy nhiên, các mối quan hệ WOE với biến độc lập có thé là mối quan hệ phi tuyến (hình chữ “U”, chữ
<small>“S”...), miễn là có thé giải thích được mỗi quan hệ.</small>
<small>11195210 — Dinh Thị Quynh Trang 25</small>
</div><span class="text_page_counter">Trang 26</span><div class="page_container" data-page="26">Chuyên dé tốt nghiệp chuyên ngành Toán tài chính
WOE do lường sự khác biệt giữa phân phối Good (0: quan sát tốt — khách hàng không trả trước hạn) va phân phối Bad (1: quan sát xấu — khách hàng trả trước hạn)
<small>trên từng khoảng giá tri:</small>
<small>WOE; = In (Dist_Good;/ Dist_Bad,)</small>
Dist_Good;: phân phối của quan sát tốt, bằng số lượng quan sát tốt ở mỗi khoảng giá trị chia cho tong số lượng quan sát tốt
<small>Dist_Bad;: phần phôi của quan sát xâu, băng sô lượng quan sát xâu ở mỗi</small>
khoảng giá trị chia cho tổng số lượng quan sát xấu.
nhau, có biến có gia tri quan sat rất lớn, có biến lại rất nhỏ. Điều này ảnh hưởng đến lúc hồi quy, kết qua các hệ số ước lượng sẽ bị chênh lệch nhau rất nhiều, do đó có thé đánh giá vai trị của biến khơng chính xác. WOE sẽ tính số lượng Good, Bad và đưa về tỷ lệ nên sẽ khơng có sự khác biệt q lớn giữa giá trị các biến. Bên cạnh đó, cách thức xử lí biến này có ưu điểm là giúp biến đổi các biến đầu vào liên tục thành những biến đơn điệu đối với biến phụ thuộc. Do đó các hệ số trong phương trình hồi qui logistic sẽ giải thích được đúng thực tế mối quan hệ giữa biến độc lập với biến phụ
<small>thuộc. Ngồi ra, WOE cịn giúp loại bỏ các gia trị ngoại lai vì chúng đã được nhóm</small>
chung về các khoảng giá trị và được gán giá trị bằng trọng số WOE, nên giá trị của
<small>các quan sát đó sẽ khơng cịn khác biệt so với các những quan sát khác thuộc cùngnhóm.</small>
Tuy nhiên, nó cũng có những hạn chế nhất định. Chăng hạn, khi tính tốn WOE, rất khó dé biết phân chia bao nhiêu khoảng giá trị là phù hợp hay khi nào thì nên nhóm hoặc tách nhóm. Mặt khác, các biến WOE luôn đơn điệu với biến phụ thuộc
thuộc). Điều này có thé dẫn đến nguy cơ đa cộng tuyến. Ngoài ra, nếu chia quá nhiều
<small>khoảng giá trị thi sẽ dễ xảy ra hiện tượng mơ hình bi q khớp (overfitting).</small>
<small>11195210 — Dinh Thị Quynh Trang 26</small>
</div><span class="text_page_counter">Trang 27</span><div class="page_container" data-page="27">Chuyên dé tốt nghiệp chuyên ngành Tốn tài chính 2.1.2. Các tiêu chí lựa chọn biến cho mơ hình
- _ Chỉ số giá trị thơng tin:
Một chỉ tiêu được tính tốn dựa trên WOE là IV. Đây là một tiêu chi dé chọn lọc biến, có kha năng phân biệt giữa Good và Bad của biến. IV càng lớn thì càng có
<small>khả năng phân biệt:</small>
<small>IV =} (Dist_Good; - Dist_Bad;). WOE;</small>
<small>IV < 0.02: Biến khơng có tác dụng trong việc phân loại quan sát tốt, xấu</small>
0.02 <IV < 0.1: biến có khả năng phân loại yếu
0.1<IV < 0.3: biến có khả năng phân loại trung bình 0.3<IV < 0.5: biến có khả năng phân loại mạnh
 IV > 0.5: Bin cú kh nng phân loại rất mạnh, tuy nhiên trường hop này cần xem xét lại đề tránh trường hợp biến có mối quan hệ trực tiếp đến biến phụ
<small>- Khia cạnh kinh doanh (Business sense):</small>
Mơ hình được xây dung từ bộ dữ liệu thực tế tại ngân hàng Techcombank để
<small>đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà, nên khía cạnh kinh</small>
doanh là một trong những tiêu chí cần thiết trong lựa chọn biến của mơ hình. Các biến
thích được về mặt kinh doanh. Trong trường hợp một biến có IV nhỏ hơn 0.02, nhưng nếu bên đó có ý nghĩa kinh tế và có ảnh hưởng đến biến phụ thuộc thì vẫn nên cân nhắc đề giữ lại.
- Ma trận hệ số tương quan:
<small>Hệ sô tương quan là chỉ sô thông kê đo lường mức độ mạnh yêu của môi quan</small>
hệ giữa hai biến số. Ta có cơng thức tính hệ số tương quan 2 biến X và Y:
Với X;, Y; lần lượt là giá trị quan sát thứ i của biến X, Y trong mau, X,Y lần lượt là giá trị trung bình của biến X, Y.
<small>11195210 — Dinh Thi Quỳnh Tran 27</small>
</div><span class="text_page_counter">Trang 28</span><div class="page_container" data-page="28">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Ma trận tương quan thê hiện mức độ tương quan giữa các biến độc lập trong mơ hình. Nếu hai biến tương quan cao lớn hơn 0.8 thi dé xảy ra hiện tượng đa cộng tuyến, dẫn đến sai số chuẩn của các hệ số ước lượng lớn, các hệ số khơng có ý nghĩa thống kê, dấu ước lượng các hệ số hồi quy có thé sai và khơng tin cậy... Do đó, nếu hai biến có hệ số tương quan lớn hơn 0.8, biến nào có chỉ số IV hoặc Gini thấp hơn thì loại biến đó.
Hồi quy Logistic theo phương pháp hồi quy từng bước (Stepwise) là việc xây dựng lặp di lặp lại từng bước cua mơ hình Logistic dé lựa chọn các biến độc lập đưa vào mơ hình. Nó sẽ thêm và xóa tự động các đặc điểm trong mỗi bước cho đến khi đạt được sự kết hợp tốt nhất. Hồi quy từng bước là kết hợp của hai kỹ thuật hồi quy tiến và hồi quy lùi.
e Hỏi quy tiễn (Forward): Chạy lần lượt mơ hình với từng biến độc lập, rồi chọn ra một mơ hình đặc trưng tốt nhất dựa trên sức mạnh dự đoán riêng của từng biến;
sau đó thêm các biến khác vào mơ hình này dé tao ra các mơ hình gồm hai, ba biến... tốt nhất, cho đến khi khơng cịn biến nào có ý nghĩa thống kê dé đưa vào hoặc mơ hình khơng cải thiện hơn thì dừng lại (được đánh giá thông qua kiểm định F, p-value, hoặc chỉ số Gini...). Phương pháp này có thể kém hiệu quả nếu
e Hồi quy lùi (Backward): Bắt đầu với tất cả các biến độc lập trong mơ hình và loại bỏ tuần tự các biến được coi là ít có ý nghĩa nhất, dựa trên các đặc điểm khác
trong mô hình, cho đến khi tất cả các biến cịn lại có giá trị p - value dưới một
mức đáng kề hoặc dựa trên một số thước đo khác về ý nghĩa đa biến. Phương pháp
<small>này cũng hạn chê khi mô hình có q nhiêu biên dau vào.</small>
hai phương pháp trên. Bước đầu của phương pháp này chính là hai bước hồi quy tiến dé đưa biến vào kết hợp với một bước hồi quy lùi dé loại biến. Sau đó sẽ là kết hợp một bước hồi quy tiễn và một bước hồi quy lùi. Cứ như vậy cho đến khi chon được cách kết hợp tốt nhất của các biến thì đừng lại.
<small>-P— value:</small>
Với mơ hình logistic dạng tuyến tính:
<small>11195210 — Dinh Thị Quynh Trang 28</small>
</div><span class="text_page_counter">Trang 29</span><div class="page_container" data-page="29">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Ta có cặp giả thuyết:
<small>Hạ: B¡ = 0 (Hệ số ước lượng của X; khơng có ý nghĩa thống kê)</small>
<small>H,: 8; #0 (Hệ số ước lượng của X; có ý nghĩa thống kê)</small>
Nếu p-value của kiểm định lớn hơn 0.05 thì chưa bác bỏ Hạ, với độ tin cậy 95%, hệ số khơng có ý nghĩa thống kê, hay biến Xp khơng có tác động đến biến phụ
khơng nên giữ lại biến đó.
Ta có khi xác suất P(Y=1) tăng lên, đồng nghĩa với việc số lượng quan sát xấu
cũng sẽ tăng. Mặt khác, theo công thức WOE, khi số lượng quan sát xấu tăng, thì WOE sẽ giảm. Do đó, với thuật toán in ra xác suất của P(Y =1) và các giá trị đầu vào được gán bằng giá trị WOE của mỗi khoảng biến, thì kết quả hồi quy của mơ hình
<small>Logistic dâu hệ sơ của các biên độc lập đêu phải âm.</small>
2.2.1. Mơ hình hồi quy Logistic
Logistic là một thuật tốn loại Classification. Nếu như mơ hình hồi quy tuyến tính trả về kết quả là một đại lượng liên tục như chi phí khám chữa bệnh, giá nhà... sau khi biết các thơng tin liên quan; thì hồi quy Logistic hướng đến việc dự báo xác suất biến Y đạt giá tri 0 hoặc 1 - biểu thị cho một sự kiện được dự đốn có xảy ra hay
Mơ hình Logistic, sẽ chạy kết quả thơng qua một hàm phi tuyến được gọi là hàm logistic dé tạo ra đầu ra là một xác suất p có giá trị từ 0 đến 1. Với z là hàm nhập vào,
<small>ta CÓ:</small>
<small>11195210 — Dinh Thị Quynh Trang 29</small>
</div><span class="text_page_counter">Trang 30</span><div class="page_container" data-page="30">Chun dé tốt nghiệp chun ngành Tốn tải chính
tỷ số odds làm cho mơ hình logit trở thành tuyến tính trong các tham số.
Ham này sẽ chuyền đổi giá trị xác suất trong khoảng (0; 1] thành những giá trị số thực năm trong khoảng (- œ, + 0). Cu thể, gia trị cua ham logit sẽ tiến đến + œ khi xác suất p > 1, và tiến đến — œ khi p > 0.
<small>- Cong thức:</small>
<small>ePotBixX1t B2ox2t-+BpxXp Odds</small>
- COng thức dang chuyền đổi thành hồi quy tuyến tính:
Ta sẽ thực hiện hồi quy mơ hình Logistic với các biến đầu vào được gan bằng
<small>giá trị WOE của mỗi nhóm được tạo ở trên.</small>
Dù mơ hình Logit là tuyến tính, nhưng nó khơng thé được ước lượng theo
và 0 vào mơ hình, thì các biểu thức In(0/1) và In(1/0) là khơng xác định. Vậy nên, các
<small>là MLE).</small>
<small>2.2.2. Các tiêu chí đánh giá mơ hình</small>
<small>2.2.2.1. Độ chính xác</small>
<small>Độ chính xác (Accuaracy) đo lường tỷ lệ các trường hợp được dự báo đúng</small>
trên tổng số các trường hợp là bao nhiêu, dé đánh giá hiệu qua dự báo của mơ hình trên một bộ dữ liệu. Độ chính xác càng cao thì mơ hình cảng chuẩn xác.
Với mức xác suất dự báo nằm trong khoảng 0 đến I, ta có thê lựa chọn ngưỡng cut-off. Thông thường ngưỡng cut-off là 0,5, khi đó các quan sát có xác suất lớn hon hoặc băng 0,5 sẽ được dự đoán là quan sát xấu (Y = 1), các quan sát có xác suất nhỏ hơn 0,5 sẽ được dự đoán là quan sát tốt (Y = 0).
</div><span class="text_page_counter">Trang 31</span><div class="page_container" data-page="31">Chuyên dé tốt nghiệp chun ngành Tốn tài chính Bảng 2.1. Ma trận nhầm lẫn
<small>Thực tế (1) Thực tế (0)</small>
<small>Dự đoán (1) TP FPDự đốn (0) FN TN</small>
Ta có ma trận nhằm lẫn (Confusion matrix) ở bảng 2.1 với:
True Positive (TP): sô lượng quan sát dự đoán là xấu và thực tế đúng là xấu True Negative (TN): số lượng quan sát dự đoán là tốt và thực tế đúng là tốt False Positive (FP): số lượng quan sát dự đoán là xấu nhưng thực tế là tốt False Negative (FN): số lượng quan sát dự đoán là tốt nhưng thực tế là xấu.
<small>Độ chính xác được tính theo cơng thức:</small>
<small>TP + TN</small>
<small>Độ chính xác = —msszzxaxTổng số lượng quan sat mau</small>
Tuy nhiên hạn chế cua chỉ tiêu này là đo lường trên tất cả các nhãn mà khơng quan tâm đến độ chính xác trên từng nhãn tốt, xấu. Do đó khi tầm quan trọng của việc
dự báo các nhãn khơng cịn như nhau, nó khơng cịn phủ hợp dé đánh giá. Độ chính
nhiều nhất hay đữ liệu của lớp nào thường bị phân loại nhằm nhất vào các lớp khác. 2.2.2.2. Đường cong ROC và chỉ số AUC
Đường cong ROC (Receiver operating characteristic) cho biết sức mạnh phân loại của một model. ROC thé hiện mối quan hệ giữa FPR - tỷ lệ dự báo nhằm nhóm khách hàng tốt thành xấu và TPR - tỷ lệ dự đốn chính xác nhóm khách hàng xấu. Khi đồ thị của ROC càng cong và tiệm cận với đường viền trên của hình chữ nhật thì mơ hình phân loại càng tốt.
<small>11195210 — Dinh Thị Quynh Trang 31</small>
</div><span class="text_page_counter">Trang 32</span><div class="page_container" data-page="32">Chuyên đê tốt nghiệp chuyên ngành Toán tài chỉnh
<small>False Positive Rate</small>
Hình 2.1. Đồ thị biểu diễn đường cong ROC
hồi qui logistic là mạnh hay yếu. AUC € [0,1], giá trị của nó càng gan 1 thì mụ hỡnh
 AUC>0.Đ: Mụ hỡnh tt
<small>đ 0.7< AUC<0.8: Mụ hình trung bình</small>
<small>@ AUC <0.7: Mơ hình khơng hiệu qua</small>
2.2.2.3. Hệ số Gini
Hệ số Gini thé hiện khả năng phân loại của mơ hình. Gini có thé được tinh băng diện tích hình A chia cho tổng điện tích hình A và B trong đồ thị
</div><span class="text_page_counter">Trang 33</span><div class="page_container" data-page="33">Chuyên dé tốt nghiệp chun ngành Tốn tài chính Hình 2.2. Đồ thị biểu diễn Gini
Ở đồ thị trên, trục hoành biểu diễn phần trăm tích lũy của số lượng quan sát khách hàng tốt và trục tung biêu diễn phan trăm tích ly của số lượng quan sát khách hàng xấu được thống kê từ mẫu tương ứng. Các quan sát sẽ được chia ra thành các
<small>khoảng giá tri và sap xêp theo xác st dự đốn giảm dan.</small>
nhiên ngẫu nhiên. Ở đường này, tỷ lệ Bad lấy được ở mỗi khoảng giá trị là như nhau va phân phối Good bang phân phối Bad ở mỗi khoảng giá trị. Lúc này, mơ hình khơng
giảm dan.
Đường bao gồm một đường thăng đi lên và một đường đi ngang biểu diễn mơ hình hồn hảo. Đường này thể hiện những % quan sát đầu tiên lấy ra từ mẫu đều là khách hàng xấu (đường đi lên), đến khi hết khách hàng xấu rồi chỉ lấy được khách hàng tốt (đường năm ngang).
Các mơ hình được xây dựng thường có khả năng phân biệt tốt hơn mơ hình ngẫu nhiên và kém hơn mơ hình hoàn hảo, thường được biéu diễn qua đường nằm giữa hai
<small>đường phía trên.</small>
Giá trị Gini năm trong khoảng từ 0% đến 100%. Hệ số Gini của mơ hình càng cao (càng gan 100%), tức có thé gom được nhiều quan sát khách hàng xấu nhất có thé
<small>Ta có:</small>
e Gini >60%: Mơ hình tốt
<small>@ 40% < Gini < 60%: Mơ hình trung bình@ Gini < 40%: Mơ hình khơng hiệu quả</small>
Lưu ý, Gini của một biến chính là Gini của mơ hình hồi quy với biến độc lập
duy nhất là biến đó.
2.2.2.4. Chỉ số PSI và CSI
</div><span class="text_page_counter">Trang 34</span><div class="page_container" data-page="34">Chuyên dé tốt nghiệp chun ngành Tốn tài chính
Mơ hình theo thời gian có thé bị ảnh hưởng bởi những thay đổi kinh tế, chính
<small>khi sử dụng mơ hình này.</small>
dựa trên thẻ điểm được in ra, PSI đo lường sự thay đổi phân bố giữa tập Train và tập
<small>Validation, tập Train va tap Test.</small>
V; (%) là tỷ lệ của số quan sát trong xếp hang i đối với tập dir liệu
¢ PSI>0.25: có sự thay đối lớn giữa 2 tập, không nên dùng mô hình. e Chisé CSI
CSI (Characteristic Stability Index) là chi số đo lường ôn định từng biến. Khi hiệu suất của mơ hình xấu đi, việc kiểm tra sự thay đổi trong phân phối của các biến độc lập có thể giúp xác định các nguyên nhân có thể xảy ra. CSI cho biết biến nào dang gây ra sự thay đổi chủ yếu trong phân bồ tơng thé. CSI có công thức và ngưỡng đánh gia tương tự PSI. Sự khác biệt duy nhất là thay vì dựa vào thẻ điểm cuối cùng,
<small>CSI = Ni (D; </small>
¢ CSI <0.1: biến có sự ơn định
<small>11195210 — Dinh Thị Quynh Trang 34</small>
</div><span class="text_page_counter">Trang 35</span><div class="page_container" data-page="35">Chun dé tốt nghiệp chun ngành Tốn tài chính ¢ 0.1 <CSI < 0.25: biến biến động vừa
2.3. THẺ DIEM VA VAI TRÒ CUA THẺ DIEM
số lượng và tỷ lệ quan sát tốt, xấu theo những khoảng điểm; dé có thể phân loại khách hàng. Khoảng điểm có thé được quy đổi theo nhiều cách, băng xác suất dự báo nhân với 1000, tổng điểm của các đặc tính... Một khách hàng sẽ được xem xét là tốt hoặc xấu dựa trên tong điểm đó. “Xấu” thường được định nghĩa là các hoạt động tiêu cực
gây rủi ro và thiệt hại cho ngân hàng như vỡ nợ, gian lận, rời bỏ... Những xác suất
hoặc điểm số này, cùng với những cân nhắc kinh doanh khác, sau đó được sử dụng làm cơ sở đề ra quyết định.
Chăng hạn, ngân hàng có thê sử dụng thông tin về điểm rủi ro, kết hợp với các yếu tô khác như ty lệ chấp thuận dự kiến và tiềm năng về lợi nhuận ở mỗi mức độ rủi ro dé phát triển các chiến lược ứng dụng mới nhằm tối đa hóa lợi nhuận và giảm thiểu nợ xấu. Với những khách hàng nộp đơn có rủi ro cao, và cách quy đổi điểm càng cao thì càng tốt, ngân hàng có thể quyết định từ chối tat cả những người nộp don đạt điểm
Ngược lại, những khách hàng đạt điểm cao có thể được hưởng mức giá ưu đãi và hạn
mức tín dụng cao hơn, được nâng cấp lên các sản phâm cao cấp, chăng hạn như thẻ
<small>vàng hoặc bach kim...</small>
Thẻ điểm cũng có thể giúp thiết lập các chính sách thấm định. Cu thé, một người nộp đơn đạt điểm rất cao hoặc rất thấp có thé bi từ chối hoặc chấp thuận hồn tồn mà khơng cần thu thập thêm thơng tin về bất động sản hay xác minh thu nhập. Do đó, làm giảm thời gian quay vịng để xử lý các hồ sơ khách hàng thông qua việc ra quyết định tự động. Thậm chí, thẻ điểm cịn hợp lý hóa quy trình ra quyết định, ví dụ, các hồ sơ có rủi ro cao hơn sẽ được giao cho các nhân viên có kinh nghiệm hơn dé được giám sát chặt chẽ, trong khi các ứng dụng rủi ro thấp được giao cho các nhân viên cấp dưới.
Trên cơ sở đó, kết hợp với kiến thức kinh doanh, thẻ điểm giúp ngân hàng đưa ra những quyết định về mặt chính sách, phịng ngừa rủi ro cũng như xác định nhóm khách hàng mục tiêu và có chiến lược phù hợp cho những nhóm khách hàng này. Với
</div><span class="text_page_counter">Trang 36</span><div class="page_container" data-page="36">Chuyên dé tốt nghiệp chuyên ngành Toán tải chính
ưu điểm là dé theo dõi, dé giải thích (Ly do từ chối, điểm thấp hoặc điểm cao có thé
<small>được giải thích cho khách hàng, cơ quan quan ly và các nhân viên khác), có tính minh</small>
bạch và có thé tính tốn được băng những cơng cụ đơn giản, thẻ điểm là một công cụ hữu hiệu dé quản lý rủi ro.
</div><span class="text_page_counter">Trang 37</span><div class="page_container" data-page="37">Chuyên dé tốt nghiệp chuyên ngành Tốn tải chính
Chương nay đã trình bay phương pháp nghiên cứu trong dé tài đánh giá khả năng khách hàng trả trước hạn khoản vay mua nhà. Với những ưu điểm như giúp
thành những biến đơn điệu đối với biến phụ thuộc, WOE được sử dụng dé xử lí biến. Bên cạnh đó, cần phải lựa chọn biến dé đưa vào mơ hình cuối cùng, thơng qua việc
bằng phương pháp hồi quy từng bước...
Chun đề sử dụng mơ hình hồi quy Logistic với biến đầu vào được gán bằng giá trị WOE của mỗi nhóm được tạo ở trên dé dự đốn. Logistic chạy kết qua thơng qua ham sigmoid dé tạo ra đầu ra là một xác suất p có giá trị từ 0 đến 1. Với odds là tỷ số của xác suất một sự kiện sẽ xảy ra trên cho xác suất khơng xảy ra, thì log của tỷ số odds sẽ làm cho hàm logit (logarit của giá trị Odds) trở thành tuyến tính trong các tham số. Điều này giúp dễ giải thích ảnh hưởng gián tiếp của biến độc lập lên biến
<small>mục tiêu.</small>
Chương này cũng trình bày về các tiêu chí đánh giá mơ hình như Độ chính xác,
trong tương lai của mơ hình. Cuối cùng, định nghĩa về thẻ điểm và vai trò của thẻ
<small>11195210 — Dinh Thị Quynh Trang 37</small>
</div>