Tải bản đầy đủ (.pdf) (14 trang)

Machine Learning và ứng dụng trong xếp hạng tín dụng khách hàng cá nhân tại các Ngân hàng thương mại Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (313 KB, 14 trang )

Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Machine Learning VÀ ỨNG DỤNG
TRONG XẾP HẠNG TÍN DỤNG KHÁCH HÀNG CÁ NHÂN
TẠI CÁC NGÂN HÀNG THƯƠNG MẠI Việt Nam
PGS. TS Nguyễn Hữu Tài
Trường Đại học Kinh tế Quốc dân
NCS. ThS. Đặng Hương Giang1
Trường Đại học Kinh tế Kỹ Thuật Cơng nghiệp
Tóm tắt
Hệ thống phần mềm chấm điểm xếp hạng tín dụng (XHTD) khách hàng cá nhân
hiện nay của các ngân hàng thương mại (NHTM) mới chỉ dừng lại ở mức đưa dữ liệu,
thông tin khách hàng vào hệ thống và trả lại kết quả là điểm XHTD của khách hỗ trợ cán
bộ tín dụng ra quyết định. Tuy nhiên đây là hình thức đánh giá cứng nhắc, tuy mức độ
chính xác cao nhưng vẫn có sai số nhất định. Sẽ thế nào nếu một khách hàng đến xin vay
tại NH này và bị từ chối vì điểm XHTD thấp nhưng được một NH khác cho vay và là một
khách hàng tốt, luôn trả nợ đúng hạn? Hay ngược lại, một khách hàng có điểm XHTD
tốt được ngân hàng cho vay nhưng sau đó lại trở thành một khoản nợ xấu với ngân hàng.
Đây là 2 trường hợp thể hiện sự bất cập của phần mềm chấm điểm tín dụng hiện tại của
các NHTM. Câu hỏi đặt ra là liệu có thể nâng cao độ chính xác trong đánh giá khách
hàng không? Làm thế nào để không bỏ lỡ các khách hàng tiềm năng hoặc loại bỏ những
khách hàng không thực sự tốt như thể hiện bên ngồi? Hệ thống Machine Learning với
nền tảng Big Data có thể giải quyết vấn đề này.
Từ khóa: Machine Learning, ngân hàng thương mại, xếp hạng tín dụng, Big Data
Machine Learning applications in personal credit ratings
of Vietnam Commercial Banks
Abstract
With current credit score software system for individual clients of commercial banks,
it is only set up to input data and customer’s information into the system and the returned


result is customer’s credit score which help loan officer to make lending decision. However,
this is a rigid, inflexible evaluation way. Although the current system has high accuracy,
it still has errors in measurement. What happens if a customer applies a loan at a bank
1

Email:

87


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

and his/her loan application is rejected because of low credit score but that same person
and loan application is approved by other bank and become a customer with good credit
and always pay on time. Or in an opposite situation, a customer with good credit score is
qualified for a loan but that loan is becoming a bad credit loan for the bank. These are 2
situations showing the failure of current credit score software system at commercial banks.
Is there any way to increase the accuracy in evaluating customers? How do we avoid missing
potential customers or prevent and get rid of customers that are not as good as they are
showing. The Machine Learning system with Big Data base can help solving this problem.
Keywords: Machine Learning, Commecial bank, credit ratings, Big Data, Artificial
intelligence.
1. Lời mở đầu
Những năm gần đây, sau khi phải đối mặt với những rủi ro lớn gây tổn thất cho ngân
hàng, đặc biệt là rủi ro tín dụng xảy ra với tần suất khá cao, giá trị lớn, các ngân hàng
thương mại Việt Nam đã chú trọng nhiều hơn đến hoạt động quản trị rủi ro tín dụng
trong kinh doanh và dần tiếp cận tới các chuẩn mực quản trị rủi ro và đánh giá tín dụng
(Credit Scoring) theo Hiệp ước quốc tế Basel II vào hoạt động quản trị rủi ro của mình.

Đây được cho là hướng đi đúng của các ngân hàng khi một mặt, họ vẫn có thể hút
khách hàng qua những sản phẩm, dịch vụ hấp dẫn, mặt khác, họ cần trang bị cho mình
những cơng cụ, phương pháp đánh giá khả năng chi, trả của mỗi khách hàng, qua đó dễ
dàng đưa ra quyết định cấp vốn.
Cùng với sự phát triển của cuộc Cách mạng công nghiệp 4.0, những tiến bộ trong
khoa học công nghệ đã cho phép các đơn vị tài chính, ngân hàng, giảm rủi ro cho vay
qua việc phân tích nhiều dữ liệu khác nhau về khách hàng. Bằng các kỹ thuật thống
kê, Machine Learning, các dữ liệu này được phân tích và cô đọng đưa ra một giá trị duy
nhất được gọi là điểm tín dụng thể hiện tính rủi ro cho vay. Điểm tín dụng càng cao, mức
độ tín dụng của khách hàng càng lớn. Đánh giá tín dụng có thể áp dụng Trí tuệ nhân tạo
(Artificial Intelligence), dựa trên mơ hình tiên đốn, đánh giá khả năng chi trả món vay
của khách hàng: đúng hạn, trễ hạn hoặc không đủ khả năng thanh tốn.
Lợi ích lớn nhất của đánh giá tín dụng là giúp các cơng ty tài chính, ngân hàng đưa
ra quyết định nhanh chóng, hiệu quả trong việc chấp nhận hoặc từ chối món vay của
khách hàng, tăng hoặc giảm giá trị khoản vay, lãi suất, kỳ hạn. Nhờ tính chính xác và tốc
độ đưa ra quyết định nhanh như vậy, đã khiến cho đánh giá tín dụng trở thành nền tảng
của quản trị rủi ro trong các lĩnh vực như ngân hàng, viễn thông, bảo hiểm và bán lẻ.
88


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

2. Tổng quan về xếp hạng tín dụng khách hàng cá nhân của NHTM
2.1. XHTD và vai trò của XHTD khách hàng cá nhân
XHTD là việc đưa ra nhận định về mức độ tín dụng đối với trách nhiệm tài chính;
hoặc đánh giá mức độ rủi ro tín dụng phụ thuộc các yếu tố bao gồm năng lực đáp ứng
các cam kết tài chính, khả năng dễ bị vỡ nợ khi các điều kiện kinh doanh thay đổi, ý thức
và thiện chí trả nợ của người đi vay.

Hệ thống XHTD của NHTM nhằm cung cấp những dự đốn khả năng xảy ra rủi ro
tín dụng có thể được hiểu là sự khác biệt về mặt kinh tế giữa những gì mà người đi vay
hứa thanh tốn với những gì mà NHTM thực sự nhận được. Khái niệm rủi ro được xét
đến ở đây là một sự không chắc chắn hay một tình trạng bất ổn có thể ước đốn được
xác suất xảy ra. Khái niệm tín dụng được hiểu là quan hệ chuyển giao quyền sử dụng vốn
giữa người cho vay và người đi vay trên nguyên tắc có hồn trả.
Hệ thống XHTD giúp NHTM quản trị rủi ro tín dụng bằng phương pháp tiên tiến,
giúp kiểm sốt mức độ tín nhiệm khách hàng, thiết lập mức lãi suất cho vay phù hợp với
dự báo khả năng thất bại của từng nhóm khách hàng. NHTM có thể đánh giá hiệu quả
danh mục cho vay thông qua sự giám sát sự thay đổi dư nợ và phân loại nợ trong từng
nhóm khách hàng đã được xếp hạng, qua đó điều chỉnh danh mục theo hướng ưu tiên
nguồn lực vào những nhóm khách hàng an tồn.
Hệ thống XHTD là một cơng cụ quan trọng để tăng cường tính khách quan, nâng
cao chất lượng và hiệu quả của hoạt động tín dụng. Mơ hình tính điểm tín dụng là
phương pháp lượng hóa mức độ rủi ro thơng qua đánh giá thang điểm, các chỉ tiêu đánh
giá trong những mơ hình chấm điểm được áp dụng khác nhau đối với từng loại khách
hàng. Khái niệm hiện đại về XHTD được tập trung vào các nguyên tắc chủ yếu bao gồm
phân tích tín nhiệm trên cơ sở ý thức và thiện chí trả nợ của người đi vay và từng khoản
vay; đánh giá rủi ro dài hạn dựa trên ảnh hưởng của chu kỳ kinh doanh và xu hướng khả
năng trả nợ trong tương lai; đánh giá rủi ro toàn diện và thống nhất dựa vào hệ thống
ký hiệu xếp hạng. Trong phân tích XHTD cần thiết sử dụng phân tích định tính để bổ
sung cho những phân tích định lượng. Các dữ liệu định lượng là những quan sát được
đo bằng số, các quan sát không thể đo lường bằng số được xếp vào dữ liệu định tính. Các
chỉ tiêu phân tích có thể thay đổi phù hợp với sự thay đổi của trình độ cơng nghệ và u
cầu quản trị rủi ro. Việc thu thập số liệu để đưa vào mơ hình XHTD cần được thực hiện
một cách khách quan, linh động. Sử dụng cùng lúc nhiều nguồn thông tin để có được cái
nhìn tồn diện về tình hình tài chính của khách hàng vay.

89



Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

2.2. Một số mơ hình XHTD khách hàng cá nhân
Nghiên cứu của Stefanie Kleimeier về mơ hình điểm số tín dụng cá nhân áp dụng
cho các ngân hàng bán lẻ tại Việt Nam Stafanie Kleimeier đã tiến hành nghiên cứu chi
tiết nguồn số liệu được tổng hợp từ các NHTM tại Việt Nam theo hai mươi hai biến số
bao gồm độ tuổi, thu nhập, trình độ học vấn, nghề nghiệp, thời gian cơng tác, tình trạng
cư ngụ, giới tính, tình trạng hơn nhân, mục đích vay... để xác định mức ảnh hưởng của
các biến số này đến rủi ro tín dụng và qua đó thiết lập một mơ hình điểm số tín dụng cá
nhân áp dụng cho các ngân hàng bán lẻ tại Việt Nam.
Nghiên cứu của Stefanie Kleimeier đã xây dựng mơ hình chấm điểm tín dụng cá
nhân gồm hai phần là chấm điểm nhân thân và năng lực trả nợ, chấm điểm quan hệ với
ngân hàng như trình bày trong Bảng 1. Căn cứ vào tổng điểm đạt được để xếp loại theo
mười mức giảm dần từ Aaa đến D như trình bày trong Bảng 2. Tuy nhiên, cơng trình
nghiên cứu này khơng đưa ra cách tính điểm cụ thể cho từng chỉ tiêu, để vận dụng được
mơ hình địi hỏi các NHTM phải thiết lập thang điểm cho từng chỉ tiêu đánh giá phù hợp
với thực trạng và hệ thống cơ sở dữ liệu cá nhân tại ngân hảng mình.
Bảng 1: Ký hiệu XHTD cá nhân theo Stefanie Kleimeier
Điểm

Xếp hạng

Ý nghĩa xếp hạng

> 400

Aaa


351 - 400

Aa

301 - 350

A

251 - 300

Bbb

Cho vay theo tài sản đảm bảo

201 - 250

Bb

Cho vay theo tài sản đảm bảo và đánh giá đơn vay vốn

151 - 200

B

Yêu cầu đánh giá thận trọng đơn vay vốn và có tài sản đảm bảo đầy đủ

101 - 150

Ccc


51 - 100

Cc

0 - 50

C

0

D

Cho vay tối đa theo đề nghị của người vay

Từ chối cho vay

Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring
for Vietnam’s Retail Banking Market

90


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Bảng 2: Chỉ tiêu chấm điểm XHTD cá nhân theo mơ hình Stefanie Kleimeier
Bước 1: Chấm điểm nhân thân và năng lực trả nợ
Tuổi


18 - 25 tuổi

26 - 40 tuổi

40 - 60 tuổi

> 60 tuổi

Trình độ học vấn

Sau đại học

Đại học, Cao đẳng

Trung học

Dưới trung học

Nghề nghiệp

Chuyên mơn

Giúp việc

Kinh doanh

Hưu trí

Thời gian cơng tác


< 0,5 năm

0,5 - 1 năm

1 - 5 năm

> 5 năm

Thời gian làm công việc hiện tại < 0,5 năm

0,5 - 1 năm

1 - 5 năm

> 5 năm

Tình trạng cư trú

Nhà riêng

Nhà thuê

Sống cùng gia đình Khác

Số người phụ thuộc

Độc thân

1 - 3 người


3 - 5 người

Thu nhập hàng năm

< 12 triệu đồng

12 - 36 triệu đồng

36 - 120 triệu đồng > 120 triệu đồng

Thu nhập gia đình hàng năm

< 24 triệu đồng

24 - 72 triệu đồng

72 - 240 triệu đồng > 240 triệu đồng

> 5 người

Bước 2: Chấm điểm quan hệ với ngân hàng
Thực hiện cam kết với ngân Khách hàng mới
hàng (ngắn hạn)

Chưa bao giờ trễ Có trễ hạn ít hơn 30 Có trễ hạn trên
hạn
ngày
30 ngày


Thực hiện cam kết với ngân Khách hàng mới
hàng (dài hạn)

Chưa bao giờ trễ Có trễ hạn trong 2 Có trễ hạn trước 2
hạn
năm gần đây
năm gần đây

Tổng giá trị khoản vay chưa trả

< 100 triệu đồng

100 - 500 triệu 500 triệu đồng - 1 tỷ > 1 tỷ đồng
đồng
đồng

Các dịch vụ khác đang sử dụng

Tiền gửi tiết kiệm

Thẻ tín dụng

Số dư bình qn tài khoản tiết < 20 triệu đồng
kiệm trong năm trước đây

Tiền gửi tiết kiệm và Khơng
thẻ tín dụng

20 - 100 triệu đồng 100 - 500 triệu đồng > 500 triệu đồng


Nguồn: Dinh Thi Huyen Thanh & Stafanie Kleimeier, 2006. Credit Scoring
for Vietnam’s Retail Banking Market

Mơ hình điểm số tín dụng cá nhân của FICO
Điểm số tín dụng (Credit score) cá nhân là một phương tiện kiểm sốt tín dụng
được gán cho mỗi cá nhân tại một số nước phát triển giúp tổ chức tín dụng ước 20 lượng
mức rủi ro khi cho vay. Điểm tín dụng càng thấp thì mức rủi ro của nhà cho vay càng
cao. Fair Isaac Corp đã xây dựng mơ hình điểm số tín dụng FICO thấp nhất là 300 và
cao nhất là 850 áp dụng cho cá nhân dựa vào tỷ trọng của 5 chỉ số phân tích được trình
bày trong Bảng 3.

91


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Bảng 3: Tỷ trọng các tiêu chí đánh giá trong mơ hình điểm số tín dụng FICO
Tỷ trọng

Tiêu chí đánh giá

35%

Lịch sử trả nợ (Payment history): Thời gian trễ hạn càng dài và số tiền trễ hạn càng cao thì điểm số tín
dụng càng thấp

30%


Dư nợ tại các tổ chức tín dụng (Amount owed): Nợ quá nhiều so với mức cho phép đặc biệt là đối với thẻ
tín dụng sẽ làm giảm điểm số tín dụng

15%

Độ dài của lịch sử tín dụng (Length of credit history): Thơng tin càng nhiều năm càng đáng tin và điểm
số tín dụng sẽ càng cao

10%

Số lần vay nợ mới (new credit): Vay nợ thường xuyên bị xem là dấu hiệu có khó khăn về tài chính nên
điểm số tín dụng càng thấp

10%

Các loại tín dụng được sử dụng (Types of credit used): Các loại nợ khác nhau sẽ được tính điểm số tín
dụng khác nhau
Nguồn

Mơ hình điểm số tín dụng FICO được áp dụng rộng rãi ở Mỹ do các thơng tin liên
quan đến tình trạng tín dụng của mọi người có thể được ngân hàng rà sốt dễ dàng qua
các cơng ty dữ liệu tín dụng (Credit reporting companies). Cơng ty dữ liệu tín dụng thực
hiện ghi nhận và cập nhật thơng tin từ các tổ chức tín dụng, 21 phân tích và cho điểm
đối với từng người. Theo mơ hình điểm số tín dụng của FICO thì người có điểm số tín
dụng ở mức 700 được xem là tốt, đối với cá nhân có điểm số tín dụng thấp hơn 620 sẽ có
thể bị ngân hàng e ngại khi xét cho vay.
3. Machine Learning và ứng dụng trong xếp hạng tín dụng khách
hàng cá nhân của NHTM
Với hệ thống phần mềm chấm điểm XHTD khách hàng cá nhân hiện nay của các
NHTM mới chỉ dừng lại ở mức đưa dữ liệu, thông tin khách hàng vào hệ thống và trả lại

kết quả là điểm XHTD của khách hỗ trợ cán bộ tín dụng ra quyết định. Tuy nhiên đây là
hình thức đánh giá cứng nhắc, tuy mức độ chính xác cao nhưng vẫn có sai số nhất định.
Sẽ thế nào nếu một khách hàng đến xin vay tại NH này và bị từ chối vì điểm XHTD thấp
nhưng được một NH khác cho vay và là một khách hàng tốt, luôn trả nợ đúng hạn? Hay
ngược lại, một khách hàng có điểm XHTD tốt được ngân hàng cho vay nhưng sau đó lại
trở thành một khoản nợ xấu với ngân hàng. Đây là 2 case thể hiện sự bất cập của phần
mềm chấm điểm tín dụng hiện tại của các NHTM. Với phần mềm hiện tại có thể giải
thích mức độ dự báo khả năng trả nợ trong tương lai của khách hàng khơng thể chính
xác hồn tồn và ngân hàng chấp nhận sai số đó. Câu hỏi đặt ra là liệu có thể nâng cao
92


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

độ chính xác trong đánh giá khách hàng không? Làm thế nào để không bỏ lỡ các khách
hàng tiềm năng hoặc loại bỏ những khách hàng không thực sự tốt như thể hiện bên
ngoài? Hệ thống Machine Learning với nền tảng Big Data có thể giải quyết vấn đề này.
3.1. Tổng quan về Trí tuệ nhân tạo, Machine Learning và Big Data
Trí tuệ nhân tạo hay trí thơng minh nhân tạo (tiếng Anh: artificial intelligence hay 
machine intelligence, (AI) là trí tuệ được biểu diễn bởi bất cứ một hệ thống nhân tạo
nào. Thuật ngữ này thường dùng để nói đến các máy tính có mục đích khơng nhất định
và ngành khoa học nghiên cứu về các lý thuyết và ứng dụng của Trí tuệ nhân tạo. Trí
thơng minh nhân tạo là một trong những ngành trọng yếu của tin học. Trí thơng minh
nhân tạo liên quan đến cách cư xử, sự học hỏi và khả năng thích ứng thơng minh của
máy móc. 
AI thể hiện một mục tiêu của con người, Machine Learning là một phương tiện được
kỳ vọng sẽ giúp con người đạt được mục tiêu đó. Và thực tế thì Machine Learning đã
mang nhân loại đi rất xa trên quãng đường chinh phục AI. Machine Learning và AI có

mối quan hệ chặt chẽ với nhau nhưng không hẳn là trùng khớp vì một bên là mục tiêu
(AI), một bên là phương tiện (Machine Learning). Chinh phục AI mặc dù vẫn là mục
đích tối thượng của Machine Learning, nhưng hiện tại Machine Learning tập trung vào
những mục tiêu ngắn hạn hơn như:
(1) Làm cho máy tính có những khả năng nhận thức cơ bản của con người như nghe,
nhìn, hiểu được ngơn ngữ, giải tốn, lập trình,...
(2) Hỗ trợ con người trong việc xử lý một khối lượng thông tin khổng lồ mà chúng ta
phải đối mặt hàng ngày, hay còn gọi là Big Data.
Machine Learning theo định nghĩa cơ bản là ứng dụng các thuật tốn để phân tích
cú pháp dữ liệu, học hỏi từ nó, và sau đó thực hiện một quyết định hoặc dự đoán về các
vấn đề có liên quan. Vì vậy, thay vì code phần mềm bằng cách thức thủ công với một bộ
hướng dẫn cụ thể để hoàn thành một nhiệm vụ cụ thể, máy được “đào tạo” bằng cách sử
dụng một lượng lớn dữ liệu (Big Data) và các thuật tốn cho phép nó học cách thực hiện
các tác vụ và ngày càng thông minh hơn.
3.2. Ứng dụng của Machine Learning trong xếp hạng tín dụng khách hàng cá
nhân tại các NHTM Việt Nam
Nhiều tổ chức tài chính sử dụng các mơ hình chấm điểm để giảm rủi ro trong đánh
giá tín dụng cũng như trong việc cấp và giám sát tín dụng. Các mơ hình chấm điểm tín

93


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

dụng dựa trên các lý thuyết thống kê cổ điển được sử dụng rộng rãi. Tuy nhiên, các mơ
hình này khơng dùng được khi có số lượng lớn dữ liệu đầu vào. Điều này ảnh hưởng đến
tính chính xác của dự báo dựa trên mơ hình.
Theo nhiều nghiên cứu thực nghiệm, các kỹ thuật học máy cùng với các thuật toán

khai thác dữ liệu (data mining) khác dựa trên cách tính tốn và chuyển đổi kiểu mới hoạt
động tốt hơn cho mục đích dự báo. Các thuật toán học máy được thiết kế để học từ một
lượng lớn dữ liệu lịch sử và sau đó tính tốn ra kết quả dự báo. Lấy điểm tín dụng cho các
khoản vay từ các ngân hàng bán lẻ làm ví dụ. Quá trình kinh doanh điển hình cho việc
cung cấp dịch vụ cho vay là: nhận các hồ sơ vay vốn, đánh giá rủi ro tín dụng, ra quyết
định về việc cho vay và giám sát việc hoàn trả vốn gốc và lãi.
Trong q trình đó, các vấn đề có thể xảy ra, chẳng hạn như làm thế nào để đẩy
nhanh tiến trình thẩm định tín dụng và làm thế nào để giám sát q trình hồn trả và
thực hiện can thiệp kịp thời khi khả năng vỡ nợ xuất hiện.
Để giải quyết hai vấn đề nêu trên, chúng ta có thể xây dựng hai mơ hình trong hai
tiến trình khởi tạo vốn vay và tiến trình giám sát.
Trong quá trình khởi tạo, đối tượng cần kiểm tra bao gồm tất cả các ứng viên nộp
đơn xin vay vốn. Mô hình có thể được sử dụng để phân tích và học thông qua dữ liệu lịch
sử của các hồ sơ đăng ký vay vốn, qua đó đánh giá liệu một ứng viên mới có đủ tin cậy để
được vay hay không nếu các chỉ tiêu đặc trưng của người nộp đơn được cung cấp, như thu
nhập, tình trạng hơn nhân, tuổi, lịch sử tín dụng (chẳng hạn đã từng nợ xấu hay chưa),...
Trong quá trình giám sát, hệ thống kiểm tra dữ liệu của người được duyệt vay vốn.
Bằng cách sử dụng dữ liệu lịch sử hồ sơ hoàn trả và trạng thái đặc điểm của khách hàng
đã hoàn thành tồn bộ q trình vay vốn, chúng ta có thể đào tạo mơ hình khác để đưa
ra dự kiến về việc liệu khách hàng này có xác suất lớn hay không khả năng vỡ nợ; bằng
cách quan sát hồ sơ hoàn trả của người nộp đơn cho một vài giai đoạn hồn vốn đầu tiên
và thay đổi các đặc tính, mơ hình này sẽ giúp tạo ra các điều chỉnh mới dựa trên thơng
tin cập nhật. Quy trình tự động này hiệu quả hơn về thời gian xử lý cũng như tính chính
xác so với cách làm truyền thống.
Tuy nhiên, có rất nhiều thuật tốn học máy đang có sẵn, câu hỏi đặt ra là “Thuật
toán nào là tốt nhất?”. Khơng có câu trả lời rõ ràng cho câu hỏi này vì tính hiệu quả của
các thuật tốn phụ thuộc vào dữ liệu và còn phụ thuộc vào cấu trúc dữ liệu cụ thể. Cách
chung để tìm một mơ hình thích hợp cho một bộ dữ liệu cụ thể hoặc một loại tập dữ liệu
là áp dụng thuật toán đã được sử dụng rộng rãi và đã được kiểm chứng.


94


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Trong hai tiến trình được nhắc tới ở trên, cả hai trơng giống nhau nhưng có các mơ
hình khác nhau. Tiến trình giám sát hồn trả trơng tương tự như tiến trình cấp vốn vay,
nhưng nó được học và đúc rút ra từ các dữ liệu lịch sử khác nhau, cụ thể là từ khách hàng
cũ đã hoàn thành việc trả nợ, bao gồm toàn bộ lịch sử hồ sơ thanh toán và các đặc điểm
của khách hàng. Một thuật tốn học máy khác có thể được ứng dụng để phù hợp tương
ứng với các thay đổi của cấu trúc dữ liệu.
Ngày nay, các thuật toán Machine Learning hay được sử dụng nhất có thể được phân
loại là phân loại đơn hoặc phân loại toàn bộ. Các đại diện của các thuật toán phân loại
đơn là CART, Naïve Bayes, SVM, logistics. Việc sửa đổi các bộ phân loại đơn, nhiều mơ
hình cùng học để giải quyết cùng một vấn đề, được sử dụng rộng rãi, chẳng hạn như
Random Forests, CART-Adaboost,...
Về cơ bản, Machine Learning cũng giống như việc dạy kiến thức tài chính cho một
học sinh mới dựa trên số liệu lịch sử để thực hiện xác định chất lượng của khoản vay,
sau đó bộ máy này sẽ có kinh nghiệm để tự quyết định. Nói rộng hơn, kỹ thuật Machine
Learning có thể được sử dụng trong tất cả các loại vấn đề phân loại.
Trong lĩnh vực ngân hàng/bảo hiểm, dựa trên Machine Learning có thể phát triển các
ứng dụng, bao gồm Xếp hạng tín dụng (Credit Scoring), Phân tích rủi ro (Risk Analytics),
Phát hiện gian lận (Fraud Detection), Bán chéo (Cross-Sell). Qua nhiều năm, một số kỹ
thuật xây dựng mơ hình khác nhau để thực hiện xếp hạng tín dụng đã phát triển, bao
gồm: tham số hoặc phi tham số (parametric or non-parametric), thống kê hoặc Machine
Learning, các thuật tốn giám sát hoặc khơng giám sát, mạng neuron. Các kỹ thuật gần
đây gồm các cách tiếp cận rất tinh vi, sử dụng hàng trăm hoặc hàng ngàn mơ hình khác
nhau, các cách thức kiểm định mơ hình khác nhau, đa dạng kết hợp rất nhiều thuật tốn

để mong đạt được kết quả với độ chính xác cao.
Mặc dù đa dạng là vậy, nhưng có một kỹ thuật xây dựng mơ hình nổi bật có tên là thẻ
điểm tín dụng (Credit Scorecard) được nhiều ngân hàng trên thế giới áp dụng rộng rãi
(Các ngân hàng như Commonwealth Bank of Australia, Standard Chartered Bank,... cũng
đang áp dụng kỹ thuật này). Thường được gọi là thẻ điểm tiêu chuẩn (Standard Scorecard),
nó dựa trên Mơ hình hồi quy Logistic (Logistic Regression Model). Mơ hình thẻ điểm tín
dụng dạng này được xây dựng đơn giản, dễ hiểu, dễ triển khai và chạy nhanh. Kết hợp
giữa thống kê và Machine Learning, độ chính xác của phương pháp này tương đương với
các kỹ thuật tinh vi, điểm số đầu ra của nó có thể được áp dụng trực tiếp để đánh giá xác
suất nợ xấu, từ đó cung cấp đầu vào cho việc định giá nợ xấu dựa trên rủi ro. Điều này rất
quan trọng đối với các bên cho vay cần tuân thủ khuôn khổ pháp lý Basel II.

95


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Mơ hình thẻ điểm tín dụng có thể được mô tả một cách đơn giản như sau: nó bao
gồm tập hợp các thuộc tính đầu vào từ khách hàng, cụ thể là đặc điểm khách hàng (Ví dụ
như tuổi, thu nhập, nghề nghiệp,...), thơng tin tín dụng q khứ của họ (Ví dụ như thơng
tin thu thập được từ Trung tâm thơng tin tín dụng Quốc gia - CIC, cũng như thơng tin
tín dụng khác mà ngân hàng nắm được),... căn cứ vào tính tốn của mơ hình, mỗi thuộc
tính sẽ được gán một hệ số nhất định, tổng của các con số này bằng điểm số đầu ra. Căn
cứ vào điểm số đầu ra, người ta có thể xác định được xác suất khách hàng có khả năng
phát sinh nợ xấu. Chính nhờ xác suất này mà việc tính được giá trị của rủi ro tín dụng
dễ dàng được thực hiện, qua đó ngân hàng nhanh chóng biết được số vốn tối thiểu dành
cho rủi ro tín dụng phù hợp với tiêu chuẩn Basel II.
Như vậy, hệ thống chấm điểm tín dụng và xếp hạng khách hàng bằng thẻ điểm,

được tạo ra bởi công nghệ Machine Learning, ứng dụng mơ hình hồi qui Logistic, khơng
chỉ giúp đánh giá khả năng thực hiện các nghĩa vụ tài chính của một khách hàng đối với
một ngân hàng như việc trả lãi và trả gốc nợ vay khi đến hạn, mà nó cịn là cơng cụ hỗ
trợ ngân hàng trong kiểm soát việc tuân thủ Basel II.
4. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng
tín dụng khách hàng cá nhân của NHTM
4.1. Quy trình phát triển hệ thống Machine Learning
Các bước phát triển hệ thống Machine Learning gồm: (1) Requirements; (2) Data;
(3) Model; (4) Production.
Requirements - Yêu cầu: là giai đoạn tìm hiểu về những gì người dùng đang cần,
mong muốn từ hệ thống Machine Learning. Trong mọi trường hợp, bước này là quan
trọng nhất. Càng thêm thời gian dành riêng cho giao tiếp và hiểu biết lẫn nhau giữa các
bộ phận, mục tiêu càng rõ ràng và cụ thể càng có nhiều cơ hội dự án sẽ thành công hơn.
Data - Số liệu: dữ liệu là “kinh nghiệm” cho model (mơ hình). Nếu chúng ta có thể
train các model với rất nhiều “kinh nghiệm” có chất lượng tốt, nó sẽ học những phương
án tốt hơn để phục vụ mục đích. Đối với các trường hợp trong đó dữ liệu khơng đủ hoặc
q lộn xộn nó cần một bước chuẩn bị dữ liệu, hoặc là thu thập thêm dữ liệu, hoặc là
mua từ 1 bên thứ 3, hoặc là sử dụng dữ liệu opensource. Trong trường hợp bất kỳ dữ liệu
phải được hoàn thiện sạch sẽ và có cấu trúc tốt.
Model - Mơ hình: Mục đích của bước này để thống nhất về số liệu chính xác để đánh
giá các mơ hình 1 cách khách quan. Mất nhiều ngày làm việc để lựa chọn các thuật tốn,
train model, kiểm tra nó và lập lại. Đây là phần cốt lõi và quan trọng nhất của quá trình.
96


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

Production - Vận hành: Một khi các thuật tốn được thử nghiệm sẵn sàng để hoạt

động, có hai cơng việc chính trong bước vận hành:
Tích hợp với các thiết lập hiện có.
Tự động cập nhật các mơ hình. Mơ hình tự động cập nhật theo thời gian khi mà
lượng data mới  liên tục được thêm vào.
4.2. Đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách
hàng cá nhân của NHTM
Việc phát triển một mơ hình Machine Learning cũng có nhiều bước và sẽ có một
vài điểm/bước tương đồng so với việc phát triển 1 phần mềm công nghệ thông thường
và Machine Learning là một nhánh cực kỳ hiện đại của việc phát triển phần mềm. Như
trong phần mềm thông thường, các giải pháp đóng gói sẵn tốn ít chi phí nhưng không
phù hợp với nhu cầu cụ thể, trong khi ngược lại xây dựng hệ thống Machine Learning
đưa đến các giải pháp có khả năng thiên biến vạn hóa hơn.
Dựa trên nghiên cứu về hệ thống XHTD khách hàng cá nhân hiện tại và mục tiêu
của việc ứng dụng Trí tuệ nhân tạo với công nghệ Machine Learning và nền tảng Big
Data, tác giả đề xuất quy trình ứng dụng Trí tuệ nhân tạo trong xếp hạng tín dụng khách
hàng cá nhân đối với các NHTM gồm các bước sau:
4.2.1. Xác định mục tiêu của hệ thống
Hệ thống được xây dựng với các mục tiêu chính sau:
1. Hỗ trợ thẩm định, phê duyệt cấp tín dụng và quản lý rủi ro tín dụng
2. Xây dựng chính sách khách hàng
3. Khắc phục những điểm yếu của hệ thống XHTD cũ
4. Đáp ứng yêu cầu của NHNN
4.2.2. Xây dựng nền tảng - kho dữ liệu khách hàng (Big Data)
Các NHTM cần chuẩn hóa dữ liệu lịch sử tín dụng khách hàng cá nhân tại hệ thống
ngân hàng của mình với các thơng tin khách hàng về các tiêu chí chấm điểm. Dữ liệu
càng lớn càng tốt, đề xuất thời gian số hóa lưu trữ hồ sơ khách hàng tối thiểu 10 năm.
Các trường thông tin khách hàng được sắp xếp khoa học với các thông tin:
1. Về nhân thân;

97



Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

2. Về lịch sử giao dịch với ngân hàng;
3. Về thông tin khoản vay;
4. Về tài sản đảm bảo;
5. Về lịch sử trả nợ của khách hàng.
4.2.3. Xây dựng mơ hình XHTD khách hàng cá nhân với nền tảng Big Data và công
nghệ Machine Learning
Việc xây dựng mơ hình XHTD khách hàng cá nhân với nền tảng Big Data và công
nghệ Machine Learning thực hiện qua các bước cơng việc sau:
1. Lựa chọn mơ hình XHTD phù hợp;
2. Lập trình hệ thống Machine Learning dựa trên mục tiêu đặt ra, mơ hình XHTD
được lựa chọn và hệ thống dữ liệu Big Data sẵn có.
4.2.4. Vận hành thử nghiệm, đánh giá và đưa vào sử dụng chính thức
Sử dụng mơ hình mới với cơng nghệ Machine Learning để đánh giá và dự báo kết
quả XHTD dựa trên dữ liệu nhóm khách hàng cũ.
So sánh kết quả dự báo của công nghệ Machine Learning với kết quả thực tế đã xảy
ra với nhóm khách hàng này và so sánh với với kết quả dự báo của công nghệ XHTD
khách hàng cá nhân hiện tại. Thơng qua phân tích tập khách hàng cũ với kho dữ liệu
khách hàng có sẵn và so sánh độ chính xác với cơng nghệ cũ để đánh giá mơ hình XHTD
mới cơng nghệ Machine Learning, đánh giá điểm mạnh và yếu của mơ hình để có hướng
điều chỉnh mơ hình.
Ứng dụng trên tập khách hàng mới và sau đó đánh giá mức độ chính xác dựa trên
kết quả thực tế của khách hàng
5. Kết luận
Dự báo chính xác về năng lực trả nợ của khách hàng trong tương lai là quan trọng

hàng đầu trong nghiệp vụ tín dụng của ngân hàng thương mại, điều này giúp các nhà
cấp tín dụng được kỳ vọng đưa ra quyết định nhanh chóng về việc có nên cho một khách
hàng vay hay không. Hiện nay những quyết định này được đưa ra dựa trên các thông tin
rất hạn chế. Với sự bùng nổ của dữ liệu trong mười năm qua, cơ hội sử dụng dữ liệu này
một cách thông minh đã phát triển theo cấp số nhân; nhưng những cơ hội này thường
vẫn chưa được thực hiện bởi vì việc giải thích số lượng lớn dữ liệu phức tạp vượt quá
98


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

khả năng của con người. Nó đã được chứng minh rằng sử dụng các kỹ thuật Machine
Learning cho phép người ta tận dụng tất cả các dữ liệu sẵn có, và do đó, đạt được một sự
cải thiện đáng kể về khả năng dự đoán trước các mơ hình truyền thống. Các dự đốn tốt
hơn (và đúng thời gian hơn) lần lượt dẫn đến tác động tích cực đến quyết định cho vay
của ngân hàng đối với khách hàng của mình. Ngồi ra, phương pháp mơ hình hóa này
có một khía cạnh tự điều chỉnh cho phép nó tự động điều chỉnh theo các xu hướng trong
dữ liệu đầu vào đơn giản bằng cách đào tạo định kỳ, do đó làm giảm nhu cầu truy cập lại
trọng số trong các mơ hình truyền thống và nâng cao mức độ chính xác của các dự báo.
Điều này khơng có nghĩa là vai trị của một nhà phân tích là con người sẽ trở nên lỗi
thời. Có những trường hợp mà các mơ hình máy tính có thể khơng tính tốn và dự báo
chính xác được, ví dụ, khi xảy ra các sự kiện bất thường (chiến tranh, thiên tai, biến động
chính trị,...). Những sự kiện này tạo ra sự gián đoạn khi các mẫu trong q khứ khơng
cịn áp dụng nữa. Do đó, việc tính điểm tín dụng tự động dựa trên thuật tốn Machine
Learning và phân tích của con người có thể bổ sung cho nhau trong việc xác định rủi ro
tín dụng.
TÀI LIỆU THAM KHẢO
1. Altman, E.I., 1968. Financial ratios, discriminant analysis and the prediction of corporate bankruptcy. The journal of finance, 23(4), pp.589-609.

2. Baesens, B., Van Gestel, T., Viaene, S., Stepanova, M., Suykens, J. and Vanthienen,
J., 2003. Benchmarking state-of-the-art classification algorithms for credit scoring,
Journal of the operational research society, 54(6), pp.627-635.
3. Chintan Trivedi, Irina Rabinovich and Shyarsh Desai (2017),Applying Machine
Learning to Leverage Big Data for Commercial Credit Scoring, The Credit & Financial Management Review,
4. Dinh Thi Huyen Thanh & Stafanie Kleimeier (2006), Credit Scoring for Vietnam’s
Retail Banking Market
5. Dominique Guegan, Bertrand Hassani (2017), Maison des Sciences Économiques,
106-112.
6. Fawcett, T., 2006. An introduction to ROC analysis. Pattern recognition letters,
27(8), pp.861-874.
7. Fensterstock, B.A., Salters, J. and Willging, R., 2013. On the Use of Ensemble Models
for Credit Evaluation. Credit Financ. Manag. Rev, 1(1), pp.1-14.
99


Kỷ yếu HộI THảO KHOA HọC QUốC GIA

"CÁCH MạNG CÔNG NGHIệP 4.0 VÀ NHữNG ĐổI MớI TRONG LĨNH VựC TÀI CHÍNH - NGÂN HÀNG"

8. Friedline, T., Masa, R.D. and Chowa, G.A., 2015. Transforming wealth: Using the inverse hyperbolic sine (IHS) and splines to predict youth’s math achievement. Social
science research, 49, pp.264-287.
9. Huang, C.L., Chen, M.C. and Wang, C.J., 2007. Credit scoring with a data mining approach based on support vector machines. Expert systems with applications,
33(4), pp.847-856.
10. Lo, K. and Lys, T., 2000. The Ohlson model: contribution to valuation theory, limitations, and empirical applications. Journal of Accounting, Auditing & Finance, 15(3),
pp.337-367.
11. Philipp Kallerhoff, PhD, Jumiya (2017), Big Data and Credit Unions: Machine
Learning in Member Transactions, Filene Research Institute.
12. Piotroski, J.D., 2000. Value investing: The use of historical financial statement information to separate winners from losers. Journal of Accounting Research, pp.1-41.
13. Rasmussen, C.E. and Williams, C.K., 2006. Gaussian processes for machine learning

(Vol. 1). Cambridge: MIT press.
14. West, D., 2000. Neural network credit scoring models. Computers & Operations
Research, 27(11), pp.1131- 1152
Ngày gửi bài: 19/5/2018
Ngày gửi lại bài: 21/5/2018
Ngày duyệt đăng: 02/06/2018

100



×