Tải bản đầy đủ (.pdf) (71 trang)

Luận văn Thạc sĩ Mô hình ma trận chuyển đổi trong xếp hạng tín dụng tiêu dùng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (759.41 KB, 71 trang )


BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TPHCM


DƯƠNG ANH TUẤN


MÔ HÌNH
MA TRẬN CHUYỂN ĐỔI
TRONG XẾP HẠNG
TÍN DỤNG TIÊU DÙNG



LUẬN VĂN THẠC SĨ KINH TẾ




Thành phố Hồ Chí Minh – Năm 2013

BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC KINH TẾ TPHCM


DƯƠNG ANH TUẤN


MÔ HÌNH MA TRẬN CHUYỂN ĐỔI
TRONG XẾP HẠNG


TÍN DỤNG TIÊU DÙNG

Chuyên ngành : Tài chính – Ngân hàng
Mã số :
60340201


LUẬN VĂN THẠC SĨ KINH TẾ



NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. Nguyễn Hữu Huy Nhựt


Thành phố Hồ Chí Minh – Năm 2013
LỜI CAM ĐOAN
Tôi xin cam đoan luận văn “Mô hình ma trận chuyển đổi trong xếp
hạng tín dụng tiêu dùng” là công trình nghiên cứu của chính tôi.
Ngoài những tài liệu tham khảo đã được trích dẫn trong luận văn,
tôi cam đoan rằng mọi số liệu và kết quả nghiên cứu của luận văn này
chưa từng được công bố hoặc được sử dụng dưới bất cứ hình thức nào.
TP. Hồ Chí Minh, ngày 04 tháng 12 năm 2013
Tác giả


Dương Anh Tuấn.

Mục lục
Trang phụ bìa

Lời cam đoan
Mục lục
Danh mục các bảng
Danh mục các hình vẽ, đồ thị
Tóm tắt 1
1. Giới thiệu 2
2. Tổng quan các nghiên cứu trước đây 5
3. Lý thuyết về điểm số tín dụng 8
3.1. Các khái niệm liên quan 8
3.2. Các phương pháp đo lường 28
4. Phương pháp nghiên cứu 39
4.1. Những trạng thái liên thông của điểm số hành vi và các mô hình chuỗi
Markov 39
4.2. Điểm hành vi dựa trên mô hình rủi ro tín dụng tiêu dùng của chuỗi
Markov 43
4.3. Mô tả dữ liệu 47
5. Nội dung và kết quả nghiên cứu 50
5.1. Bậc của ma trận chuyển đổi 50
5.2. Những ảnh hưởng của số tháng trên sổ sách 56
6. Kết luận 60
Tài liệu tham khảo 62



DANH MỤC CÁC BẢNG

Bảng 3.1 Số liệu thống kê 3 đặc tính của người vay
Bảng 3.2 Dữ liệu tình trạng cư trú và tuổi tác
Bảng 3.3 Kết quả áp dụng phương pháp Naïve Bayes’
Bảng 3.4 Tính toán tỷ lệ xác suất và tỷ lệ tình trạng xấu

Bảng 5.1 Ma trận chuyển đổi trung bình bậc nhất
Bảng 5.2 Ma trận chuyển đổi trung bình bậc hai
Bảng 5.3 So sánh ma trận chuyển đổi những khoản vay có tuổi khác nhau


DANH MỤC CÁC HÌNH VẼ, ĐỒ THỊ

Hình 3.1 Tỷ lệ trạng thái xấu theo điểm số
Hình 3.2 Chiến lược chia ngưỡng điểm
Hình 3.3 Phân phối điểm số
Hình 3.4 Độ mạnh và tính chính xác của khoản lỗ
Hình 4 Biểu đồ thể hiện tỷ lệ số lượng người vay xấu theo điểm số hành vi

1
Tóm tắt
Mặc dù các lý thuyết rủi ro tín dụng doanh nghiệp có nhiều nghiên cứu về mô
hình thay đổi rủi ro tín dụng của trái phiếu công ty theo thời gian, nhưng có rất ít
nghiên cứu về rủi to tín dụng đối với danh mục các khoản cho vay tiêu dùng.
Tuy nhiên, điểm số hành vi, được hầu hết các tổ chức cho vay tiêu dùng tính
toán hàng tháng, là phương pháp xếp hạng trong rủi ro tín dụng doanh nghiệp.
Lấy động cơ từ những nghiên cứu về rủi ro tín dụng doanh nghiệp, tôi phát triển
mô hình chuỗi Markov dựa trên các điểm số hành vi để thiết lập nên rủi ro tín
dụng của danh mục các khoản vay tiêu dùng. Mặc dù những mô hình như thế đã
được nhiều tổ chức cho vay sử dụng để phát triển các mô hình theo Thỏa ước
Basel, nhưng chưa có lý thuyết nào về chúng được xuất bản. Mô hình tôi đưa ra
sẽ khác về nhiều khía cạnh so với những mô hình tín dụng doanh nghiệp dựa
trên chuỗi Markov - chẳng hạn như nhu cầu cho một chuỗi Markov bậc hai, bao
hàm cả biến số thời hạn khoản vay. Mô hình được áp dụng sử dụng dữ liệu về
danh mục cho vay tiêu dùng của một công ty tài chính lớn ở Việt Nam.


2
1. Giới thiệu
Từ giữa những năm 1980, các ngân hàng đã cho người tiêu dùng vay nhiều hơn
hẳn cho các công ty (Crouhy, Galai, & Mark, 2001). Tuy nhiên, không có vấn đề
gì cho đến khi cuộc khủng hoảng nợ dưới chuẩn 2007 và sau đó là khủng hoảng
tín dụng diễn ra thì người ta nhận ra rằng ảnh hưởng đối với những khoản cho
vay như thế là gì trong lĩnh vực ngân hàng, và nó không dễ nghiên cứu như thế
nào khi so với những mô hình cho vay doanh nghiệp. Đặc biệt, nhu cầu cho
những mô hình thiết thực về rủi ro tín dụng của danh mục các khoản vay tiêu
dùng đã được mang vào tâm điểm bởi sự thất bại của các tổ chức xếp hạng nhằm
đánh giá chính xác các rủi ro tín dụng của các chứng khoán có đảm bảo bằng tài
sản thế chấp - Mortgage Backed Securities (MBS) và nghĩa vụ đối với khoản nợ
cầm cố - collateralized debt obligations (CDO) đều được dựa trên những danh
mục như thế. Có nhiều lý do khiến cho cuộc khủng hoảng nợ dưới chuẩn và sau
đó là khủng hoảng tín dụng xảy ra (Demyanyk & van Hemert, 2008; Hull, 2009),
nhưng, rõ ràng là có một nguyên nhân khiến người đi trước dẫn dắt kẻ theo sau
là thiếu một mô hình dễ dàng cập nhật về rủi ro tín dụng danh mục các khoản
vay tiêu dùng. Việc thiếu mô hình phù hợp về rủi ro tín dụng tiêu dùng ở cấp độ
danh mục lần đầu tiên được nêu bậc lên trong suốt quá trình phát triển của Thỏa
ước Basel, khi một mô hình rủi ro tín dụng của doanh nghiệp được sử dụng để
tính toán vốn pháp định cho tất cả các loại hình của các khoản vay (Báo cáo
giám sát hoạt động ngân hàng của Ủy ban Basel, 2005), cho dù ý tưởng nền tảng
của một mô hình như thế - việc vỡ nợ xảy ra khi các khoản nợ vượt quá giá trị

của tài sản thế chấp – thì không phải là nguyên nhân khiến cho người tiêu dùng
vỡ nợ.
Bài nghiên cứu này phát triển một mô hình dành cho rủi ro tín dụng của danh
mục các khoản vay tiêu dùng dựa trên những điểm số hành vi của từng người
tiêu dùng có khoản vay nằm trong danh mục. Một mô hình như thế hấp dẫn đối
với nhiều tổ chức cho vay, vì hầu hết tất cả những tổ chức cho vay hàng tháng

3
đều tính toán những điểm số hành vi cho tất cả những người đi vay. Điểm số
hành vi thường được chuyển thành xác suất vỡ nợ trong khoảng thời gian cố
định (thường là một năm) trong tương lai đối với người vay đó, nhưng người ta
cũng có thể xem nó như là một sự đại diện cho mức tín nhiệm tín dụng khó quan
sát được của người vay. Tôi xây dựng một mô hình rủi ro tín dụng chuỗi Markov
dựa trên điểm số hành vi đối với người tiêu dùng, có nhiều điểm tương đồng với
hình thức hạch toán theo giá thị trường đang có dấu hiệu giảm sút của những mô
hình rủi ro tín dụng doanh nghiệp dựa trên các mức độ đánh giá của các tổ chức
xếp hạng tín dụng (Jarrow, Lando, & Turnbull, 1997). Điểm số hành vi như thế
được dựa trên những mô hình chuỗi Markov đã được những tổ chức cho vay
phát triển cho phù hợp với mô hình Basel, nhưng không có phân tích nào xuất
hiện trong các lý thuyết; trong bài nghiên cứu này, tôi thảo luận những đặc tính
nên được bao hàm trong những mô hình như thế và so sánh giữa mô hình chuẩn
với mô hình phức tạp hơn. Phương pháp nghiên cứu xây dựng một mô hình dự
báo thực nghiệm để có được phân phối đa giai đoạn về tỷ lệ vỡ nợ trong dài hạn
dựa trên những ma trận chuyển đổi được xây dựng từ cơ sở dữ liệu quá khứ của
các điểm số hành vi. Mặc dù có thể xác định chính xác những điểm số đối với
xác suất vỡ nợ trong dài hạn nếu ta có dữ liệu trong khoảng thời gian đủ dài, dữ
liệu như thế thì không có trong thực tiễn. Phương pháp ma trận chuyển đổi cho
phép ta thực hiện một đo lường chuẩn xác như thế bằng cách sử
dụng loạt dữ
liệu trong khoảng thời gian ngắn hơn nhiều. Trong các tình huống nghiên cứu,
tôi sử dụng những điểm số hành vi của nhiều tổ chức cho vay, nhưng tôi cũng có
thể sử dụng phương pháp tương tự trên những điểm số của trung tâm thông tin
tín dụng.
Phương pháp này cũng giúp cho các tổ chức cho vay ra các quyết định cho vay
dài hạn bằng cách ước tính rủi ro cùng với sự thay đổi trong chất lượng của danh
mục các khoản vay theo thời gian. Ngoài ra, mô hình còn cung cấp những hiểu
biết sâu sắc về xác suất danh mục, việc xác định rõ nguồn vốn dự trữ thích hợp

4
và việc tạo ra những ước đoán về giá trị danh mục bằng cách đưa ra những phân
phối về khoản lỗ tín dụng ở cấp độ danh mục.
Bài nghiên cứu này nhằm thực hiện các mục tiêu sau:

Dựa vào điểm số hành vi được xác định hàng tháng, xây dựng mô
hình ma trận chuyển đổi điểm số hành vi theo thời gian để đánh giá
rủi ro tín dụng ở cấp độ danh mục.


Từ đó, đưa ra các dự đoán về khả năng vỡ nợ của người tiêu dùng
có khoản vay nằm trong danh mục.

Để thực hiện được các mục tiêu trên, tôi nhận thấy rằng cần giải đáp các câu hỏi
nghiên cứu sau:
 Điểm số hành vi và thời hạn vay có ảnh hưởng đến rủi ro tín dụng
của danh mục các khoản vay tiêu dùng hay không?
 Hai nhân tố trên ảnh hưởng như thế nào đến việc ước lượng rủi ro
tín dụng của danh mục các khoản vay tiêu dùng.

Trong phần 2, tôi nêu tổng quan các nghiên cứu trước đây, trong khi ở phần 3 tôi
điểm qua các khái niệm và phương pháp đo lường liên quan đến điểm số tín
dụng. Tiếp theo, trong phần 4 tôi rà soát lại những đặc tính của điểm số hành vi
và chuỗi Markov, đồng thời mô tả điểm số hành vi của chuỗi Markov dựa trên
mô hình rủi ro tín dụng tiêu dùng đã được mở rộng. Điều này đã được tham số
hóa bằng cách sử dụng mô hình hồi quy logic lũy tiến để ước tính xác suất
chuyển đổi của chuỗi Markov. Tính chính xác của những ước đoán của mô hình
sẽ được trình bày thông qua tình huống nghiên cứu, và phần mô tả dữ liệu được
sử dụng trong tình huống nghiên cứu cũng được lồng vào phần 4. Phần 5 cung
cấp các kết quả nghiên cứu dựa vào bộ dữ liệu được mô tả trong phần 4, trong đó

đưa ra những lý do tại sao mô hình bao hàm những ma trận chuyển đổi bậc cao
hơn; và thời hạn trên sổ sách của khoản vay. Cuối cùng phần 6 đưa ra vài kết
luận, bao gồm làm thế nào để mô hình có thể được sử dụng và mức độ phù hợp
của mô hình.
5
2. Tổng quan các nghiên cứu trước đây
Gần đây có nhiều bài nghiên cứu xem xét việc mô hình hóa rủi ro tín dụng của
những danh mục vay tiêu dùng. Rosch and Scheule (2004) thực hiện một biến
thể của mô hình những ma trận tín dụng một nhân tố, nền tảng của Thỏa ước
Basel. Họ sử dụng những hệ số tương quan thực nghiệm giữa những loại hình
vay tiêu dùng khác nhau và cố xây dựng các biến số kinh tế để giải thích những
khác biệt trong những giai đoạn khác nhau của chu kỳ kinh doanh.
Perli and Nayda (2004) cũng thực hiện mô hình cấu trúc rủi ro tín dụng của
doanh nghiệp và tìm kiếm cách ứng dụng mô hình vào việc cho vay tiêu dùng,
giả định rằng một người tiêu dùng sẽ vỡ nợ (không trả được nợ) nếu giá trị tài
sản của anh/chị ta nằm dưới ngưỡng được xác định. Tuy nhiên, việc vỡ nợ của
người tiêu dùng thường thiên về những vấn đề dòng tiền, ngây thơ tài chính hoặc
gian lận, và vì vậy một mô hình như thế bỏ qua vài khía cạnh của việc vỡ nợ của
người tiêu dùng.
Musto and Souleles (2005) sử dụng việc định giá vốn như là một phương pháp
thay thế đối với những thay đổi về giá trị của những danh mục cho vay tiêu
dùng. Họ sử dụng những điểm số hành vi, nhưng lấy những số điểm khác biệt
hàng tháng về điểm số hành vi như suất sinh lợi trên tài sản khi áp dụng mô hình
định giá vốn của họ.
Andrade and Thomas (2007) mô tả một mô hình cấu trúc dành cho rủi ro tín
dụng của các khoản vay tiêu dùng, trong đó điểm số hành vi là đại diện cho mức
độ tín nhiệm về tín dụng của người đi vay. Việc vỡ nợ xảy ra nếu giá trị danh
tiếng về mức độ tín nhiệm, về phương diện tiếp cận các khoản tín dụng sau này,
rơi xuống dưới chi phí sử dụng nợ [chi phí lãi và vốn gốc của khoản vay - the
cost of servicing the debt]. Sử dụng tình huống dựa trên trung tâm thông tin tín

dụng của Brazil, họ thấy rằng bước ngẫu nhiên là mô hình tốt nhất cho phần đặc
tính (idiosyncratic) của mức độ tín nhiệm. Malik and Thomas (2010) đã phát
triển một mô hình rủi ro về thời gian vỡ nợ của các khoản vay tiêu dùng, trong
6
đó những nhân tố rủi ro là điểm số hành vi, thời hạn vay, và các biến số kinh tế,
và đã sử dụng nó để phát triển mô hình rủi ro tín dụng đối với các danh mục cho
vay tiêu dùng.
Bellotti and Crook (2009) cũng đã sử dụng những rủi ro cân xứng để phát triển
mô hình rủi ro vỡ nợ dành cho các khoản vay tiêu dùng. Họ đã điều tra các biến
số kinh tế có thể thích hợp nhất, tuy vậy họ đã không sử dụng điểm số hành vi
trong mô hình của mình.
Thomas (2009b) đã rà soát lại các mô hình rủi ro tín dụng tiêu dùng hiện hữu và
chỉ ra các phương pháp tương tự có vài mô hình rủi ro tín dụng doanh nghiệp
được thiết lập.
Từ bài nghiên cứu có ảnh hưởng sâu xa của Jarrow và cộng sự (1997), phương
pháp chuỗi Markov đã chứng tỏ tính phổ biến trong việc mô hình hóa những
trạng thái liên thông của rủi ro tín dụng trong các danh mục cho vay của doanh
nghiệp. Ý tưởng là mô tả các trạng thái liên thông của rủi ro về phương diện xác
suất chuyển đổi giữa các cấp độ khác nhau mà những tổ chức xếp hạng tín dụng
dành cho các trái phiếu của công ty.
Có nhiều nghiên cứu xem xét cả những điều kiện kinh tế lẫn lĩnh vực hoạt động
của công ty ảnh hưởng như thế nào đến các ma trận chuyển đổi (Nickell,
Perraudin, & Varoli, 2001), trong khi những nhà nghiên cứu khác khái quát hóa
ý tưởng ban đầu của Jarrow và cộng sự bằng cách sử dụng chuỗi Affine Markov
(Hurd & Kuznetsov, 2006) hoặc những quy trình thời gian liên tục (Lando &
Skodeberg, 2002). Tuy nhiên, không có bất kỳ đề nghị nào trong những đề nghị
này làm gia tăng bậc của chuỗi Markov hoặc xem xét thời hạn trên sổ sách của
khoản vay, là 2 đặc tính mà tôi giới thiệu trong bài nghiên cứu này, mục đích
nhằm mô hình hóa rủi ro tín dụng tiêu dùng sử dụng chuỗi Markov. Điều này
thật đáng ngạc nhiên, bởi vì đã có công trình nghiên cứu về việc hạ bậc tín

nhiệm bởi những tổ chức xếp hạng tín nhiệm, họ cho rằng có một cái đà ảnh
hưởng trong đó một khi một công ty đã bị hạ bậc tín nhiệm, thì điều đó giống
7
như là bị hạ bậc thêm nữa hơn là được nâng bậc sau đó (Bangia, Diebold, &
Schuermann, 2002).
Trước đây, các mô hình chuỗi Markov đã được sử dụng trong cho vay tiêu dùng,
nhưng không bài nghiên cứu nào được xuất bản sử dụng điểm số hành vi như
không gian trạng thái, cũng không cho thấy mục tiêu của các mô hình dùng để
ước tính rủi ro tín dụng ở mức độ danh mục. Ứng dụng đầu tiên là do Cyert,
Davidson, và Thompson (1962), đã phát triển mô hình chuỗi Markov những
hành vi hoàn trả của khách hàng. Sau đó, những mô hình phức tạp hơn đã được
Ho (2001), Thomas, Ho, và Scherer (2001) và Trench cùng những cộng sự
(2003) phát triển. Schniederjans và Loch (1994) đã sử dụng các mô hình chuỗi
Markov để mô hình hóa các khía cạnh quảng bá của quản trị quan hệ khách hàng
trong ngành ngân hàng.
Điểm số hành vi dựa trên mô hình chuỗi Markov đôi khi được sử dụng trong
ngành công nghiệp (xem Scallan, 1998), nhưng chủ yếu sử dụng như là các biện
pháp đánh giá việc trích lập dự phòng, và chúng không bao hàm số tháng trên sổ
sách có ảnh hưởng sẽ được bài nghiên cứu này trình bày. Người ta có thể thu
được tỷ lệ trung bình khả năng vỡ nợ của danh mục từ các phân phối dài hạn,
trong khi mô phỏng của Monte Carlo sử dụng việc chuyển đổi các khoản vay cá
nhân thì cung cấp phân phối về tỷ lệ vỡ nợ.

8
3. Lý thuyết về điểm số tín dụng
3.1. Các khái niệm liên quan
3.1.1 Xác suất và tỷ lệ xác suất
Trong chấm điểm tín dụng, ta có thể phân tích những dữ liệu lịch sử về những
người vay trong quá khứ và sử dụng nó để tiên đoán về hành vi tương lai của
những người vay sau này. Để làm được điều này ta phải lắp ráp dữ liệu liên quan

của những người vay trước đây từ đơn xin vay, thông tin tín dụng, những ghi
chép về kế toán và tài chính, cũng như các thông tin quảng bá. Khi đó, những
người vay được phân loại thành hai nhóm rủi ro: tốt và xấu. Những người vay
xấu chỉ những cá nhân bị vỡ nợ, phá sản, hoàn trả trễ, … và những người vay tốt
là những người đáp ứng nghĩa vụ tài chính một cách đầy đủ và đúng hạn. Xác
suất để được đánh giá tốt tùy thuộc vào các đặc tính = (

, 

, … , 

) của
người vay và đặc tính này sẽ ảnh hưởng đến hành vi hoàn trả của người vay.
Những đặc tính này có thể bao gồm các đặc tính kinh tế xã hội như tuổi, tình
trạng cư trú, tình trạng làm việc, quá trình thực hiện tín dụng trong quá khứ trễ
hay bỏ sót các khoản thanh toán, và các nghĩa vụ đối với khoản nợ hiện hữu của
họ. Những đặc tính này chủ yếu không bao hàm các điều kiện kinh tế và môi
trường, nhưng khi chúng ta tranh cãi về sau thì những đặc tính này có thể cung
cấp thêm những thông tin hữu ích phụ trội và có thể được bao hàm. Kết quả của
từng đặc tính được gọi là giá trị (attributes) và chúng ta sẽ ký hiệu  khi thảo
luận về các đặc tính nói chung và = (

, 

, … , 

) khi chúng ta giải quyết các
vectơ bao hàm một bộ riêng biệt những giá trị
kết quả của các đặc tính. Có thể có
một lượng lớn những sự kết hợp khác nhau của những giá trị và mỗi giá trị lại

cho thấy một vectơ  khác nhau và chúng ta xác định  là bộ dữ liệu tất cả các
kết hợp khả thi của các giá trị. Trong ví dụ minh họa sau đây, chúng ta làm việc
chủ yếu với một lượng nhỏ những đặc tính. Ý tưởng là nhằm sử dụng vectơ
những giá trị của các đặc tính  của người vay để ước tính xác suất người vay đó
9
là tốt, {| }. Chúng ta viết xác suất có điều kiện của dữ liệu 
tương ứng được cho là tốt hay xấu như là:
Pr
{

|
 
}
= 
(

|

)
;
{| } = (|)
(|) + (|) = 1    (3.1)
Khi bàn về các xác suất thì thường dễ dàng hơn trong thực tiễn để xem xét tỷ lệ
xác suất của một sự kiện – cơ hội của sự kiện xảy ra chia cho cơ hội của cùng sự
kiện nhưng không xảy ra. Tương tự đối với rủi ro vỡ nợ ta có thể đánh giá cơ hội
của một kết quả là tốt hay xấu bằng cách lấy tỷ lệ xác suất giữa tốt và xấu, trong
đó chúng ta xác định tỷ lệ xác suất là tỷ lệ của xác suất kết quả tốt (xấu) với xác
suất kết quả xấu (tốt):

(


|

)


(

|

)

(

|

)
à 
(

|

)


(

|

)


(

|

)
=
1

(

|

)
(3.2)
Hãy cùng xem làm thế nào ta có thể sử dụng dữ liệu về những người vay trước
đây để ước tính những xác suất và tỷ lệ xác suất.
Ví dụ 1: Xác suất và khả năng xảy ra
Xem xét ví dụ dựa trên dữ liệu giả thuyết có một mẫu gồm 1.000 người vay
trước đây và có 3 đặc tính sẵn có cho từng người vay – tuổi, tình trạng cư trú, và
việc sở hữu thẻ tín dụng. Mỗi người vay được phân loại là tốt hay xấu. Trong ví
dụ giả thuyết này, số lượng tốt là 900 và số lượng xấu là 100, tạo thành tổng số
là 1.000. Chúng ta chỉ tập trung vào một đặc tính – tình trạng cư trú – với 3 giá
trị lần lượt là chủ sở hữu, thuê, hoặc khác. Xem xét số liệu thống kê những giá trị
này trong bảng 3.1 sau:
Giá trị Tốt Xấu
Chủ sở hữu 570 30
Thuê 150 50
Khác 180 20
Tổng cộng 900 100

10
Nguồn: Consumer Credit Models: Pricing, Profit and Portfolio, Lyn C. Thomas
(2009)
Sử dụng bảng số liệu này, cách đơn giản để ước tính xem một người đi vay đang
sở hữu nhà sẽ tốt là tính số lần (hoặc tỷ lệ xác suất) mà người này có kết quả tốt
hơn là kết quả xấu.
Tương tự chúng ta có thể ước tính cơ hội để được tốt đối với giá trị thuê và giá
trị khác:

(

|
  
)
=
570
570 + 30
= 0.95 
(

|
  
)
=
570
30
= 19.0

(


|
ê
)
=
150
150 + 50
= 0.75 
(

|
ê
)
=
150
50
= 3.0 (3.3)

(

|
á
)
=
180
180 + 20
= 0.90 
(

|
á

)
=
180
20
= 9.0
Tính toán tương tự có thể được thực hiện đối với xác suất có điều kiện hoặc tỷ lệ
xác suất đối với trạng thái xấu.
Chúng ta cũng quan tâm đến phân phối của những đặc tính của người vay giữa
tổng thể trạng thái tốt và xấu riêng biệt. Chúng ta có thể có được thông số này từ
những xác suất trong biểu thức (3.1) bằng cách dùng định lý Bayes’ nếu chúng ta
có vài quan điểm trước về cơ hội để một người vay mang trạng thái tốt hay xấu.
Nếu chúng ta giả định rằng cơ hội một người vay sẽ đạt trạng thái tốt là () và
cơ hội người đó ở trong trạng thái xấu là (), điều này tương tự với giả định
rằng có những tỷ số giữa tốt và xấu trong tổng thể, khi đó chúng ta có thể sử
dụng định lý Bayes’ như là cách đưa ra các xác suất có điều kiện xung quanh.
Định lý Bayes’ phát biểu rằng nếu chúng ta có những sự kiện không chắc chắn
thì
Pr
{

|

}
=
Pr
{

|

}

xPr
{

}
Pr
{

}
(3.4)
Điều này rõ ràng nếu bạn nghĩ cơ hội để cả hai E và F cùng xảy ra. Việc phụ
thuộc vào sự kiện nào bạn nghĩ đến đầu tiên xác suất này là cả Pr{} Pr {F|E}
11
lẫn Pr{} Pr {E|F}. Sự cân bằng của hai xác suất này đưa đến kết quả của
Bayes’.
Áp dụng định lý Bayes’ vào trường hợp xác suất của một trạng thái tốt và xấu có
giá trị  với phân phối những trạng thái tốt và xấu trong tổng thể được cho tương
ứng bởi 

và 


{ |} = (|) = (|)()/



{
 
|

}

= 
(

|

)
= 
(

|

)
()/

 (3.5)
Trong đó () là xác suất (rất nhỏ) mà một người vay sẽ có giá trị .
(|) và (|) được gọi là hàm số khả năng xảy ra, và mô tả những giá trị 
trong tổng thể trạng thái tốt (và xấu) như thế nào. Chúng cũng là những xác suất
có điều kiện như (|) nhưng để tránh nhầm lẫn và bởi vì nếu như  là một
tập hợp không xác định thì chúng có thể là những hàm mật độ, chúng ta sẽ ký
hiệu chúng là (|. ).
Nếu chúng ta quay trở lại dữ liệu trong ví dụ, chúng ta có thể tính toán khả năng
xảy ra của một trạng thái tốt (hay xấu) sẽ là chủ sở hữu, thuê hay khác như sau:
(  |) =
570
900
= 0.633 (  |) =
30
100
= 0.3


(
ê
|

)
=
150
900
= 0.167 
(
ê
|

)
=
50
100
= 0.5 (3.6)
(á|) =
180
900
= 0.20 (á|) =
20
100
= 0.2
3.1.2 Tỷ lệ xác suất thông tin và tỷ lệ xác suất tổng thể
Một tỷ lệ xác suất đặc biệt luôn lặp đi lặp lại trong chấm điểm tín dụng, đó là tỷ
lệ xác suất tổng thể 


được xác định bằng cách:







=

(

)

(

)
(3.7)
Nó phản ánh niềm tin ban đầu về cơ hội một người vay sẽ trở nên tốt trước khi
có bất kỳ thông tin sẵn có nào khác về người đi vay này. Sau đó, khi thông tin 
12
sẵn có về người vay, các xác suất sau của việc tốt hay xấu được cho bởi biểu
thức 
(

|

)
và 
(


|

)
. Chúng ta có thể chia 2 biểu thức trong biểu thức (3.5)
lại với nhau sẽ có được kết quả tỷ lệ xác suất sau của một cá nhân tốt có được từ
định lý Bayes’

(

|

)
=

(

|

)

(

|

)
=




(

|

)



(

|

)


 
(

)
,   (3.8)
Trong đó (|) và (|) là khả năng xảy ra của dữ liệu  có điều kiện về
người vay là tốt (xấu). (), tỷ số của khả năng xảy ra có điều kiện của trạng thái
tốt có giá trị  chia cho khả năng xảy ra của trạng thái xấu có giá trị , là tỷ lệ
xác suất thông tin.
Biểu thức (3.8) chỉ rõ rằng tỷ lệ xác suất của một người vay có giá trị  là tích số
giữa tỷ lệ xác suất tổng thể trước, độc lập với những giá trị của cá nhân người
vay, với tỷ lệ xác suất thông tin, phụ thuộc vào những giá trị của người vay.
Tỷ lệ xác suất thông tin () lớn hơn 1 nghĩa là người vay có giá trị  hầu như
có khả năng tốt hơn tổng thể; tỷ lệ xác suất thông tin () nhỏ hơn 1 nghĩa là
người vay sẽ ít có khả năng tốt hơn tổng thể. Sau đó chúng ta sẽ khám phá

logarit của tỷ lệ xác suất thông tin, ln (
(

)
), cũng là một cách hữu ích trong việc
đánh giá thông tin mà dữ liệu  chứa đựng về xác suất một người vay ở trạng
thái tốt và nó được gọi là tỷ trọng dấu hiệu được cung cấp bởi .
Ví dụ 1 (tiếp theo)
Chúng ta có thể kiểm chứng những kết quả của định lý Bayes’ bằng cách chú ý
đến bảng 3.1 của ví dụ, ngay lập tức chúng ta có () = 900/1000 = 0.9 và
() = 100/1000 = 0.1. Nhưng chú ý rằng (  ) = 600/1000 =
0.6, (ê) = 200/1000 = 0.2, và (á) = 200/1000 = 0.2. Khi đó:

(

|
  
)
=
(  |)
(  )


=
0.633
0.6
0.9 = 0.95 à

(


|
  
)
=
(  |)
(  )


=
0.3
0.6
0.1 = 0.05
13

(

|
ê
)
=
(ê|)
(ê)


=
0.167
0.2
0.9 = 0.75 à

(


|
ê
)
=
(ê|)
(ê)


=
0.5
0.2
0.1 = 0.25

(

|
  
)
=
(á|)
(á)


=
0.2
0.2
0.9 = 0.9 à

(


|
á
)
=
(á|)
(á)


=
0.2
0.2
0.1 = 0.1 (3.9)
Tỷ lệ xác suất tổng thể trong ví dụ là 

= 900/100 = 9 và vì vậy biểu thức
(3.8) trở thành

(

|
  
)
= 



(
  
|


)

(
  
|

)
= 9
0.633
0.3
= 19
= 

 
(
  
)
,   
(
  
)
= 2.11

(

|
ê
)
= 



(ê|)
(ê|)
= 9
0.167
0.5
= 3
= 

 
(
ê
)
,   
(
ê
)
= 0.33

(

|
á
)
= 


(á|)
(á|)

= 9
0.2
0.2
= 9
= 

 
(
á
)
,   
(
á
)
= 0.33 (3.10)
3.1.3 Dự báo sử dụng tỷ lệ xác suất thông tin
Trong những ngày đầu của chấm điểm rủi ro tín dụng, tỷ lệ xác suất thông tin có
thể được sử dụng để cải thiện những nguyên tắc giới hạn mang tính phê bình đối
với việc sát nhập. Bằng phương pháp thử và sai một tổ chức cho vay có thể dùng
điểm số chỉ dựa trên tỷ lệ xác suất thông tin để xác định mức rủi ro tương ứng
của người vay. Việc xác định tỷ lệ xác suất tổng thể không phải mấu chốt vì nó
chỉ là một hàng những người vay có rủi ro liên quan. Tuy nhiên, phương pháp
này chỉ hoạt động nếu có một vài đặc tính để xem xét vì nếu không thì việc tính
toán sẽ rất gay go. Sử dụng quy tắc chuỗi để diễn tả những xác suất chung trong
biểu thức (3.8), chúng ta có thể viết tỷ lệ xác suất như sau:
14
(|

, 


, … , 

) =






(


, 

, … , 

|

)

(


, 

, … , 

|

)

=






(


|

)

(


|

)


(


|
, 

)


(


|
, 

)
… 

(


|
, 

, … , 

)

(


|
, 

, … , 

)
(3.11)
Về nguyên tắc thì ta có thể xây dựng các bảng biểu những sự kiện ngẫu nhiên về

mức độ gia tăng để ước tính các hàm số khả năng xảy ra cần thiết trong biểu thức
(3.11). Mặc dù cơ sở dữ liệu của tổ chức cho vay thường chứa đựng những ghi
chép của từ 150 đặc tính trở lên về mỗi một người vay hoặc người nộp đơn vay,
và vì vậy phương pháp này thực sự không thực tiễn. Việc ước tính hàm mật độ
() cho các bảng biểu sự kiện ngẫu nhiên có kích cỡ lớn này là tâm điểm của
vấn đề. Với những vấn đề có 10 đặc tính, mỗi đặc tính có 5 giá trị, chúng ta thấy
rằng 5

= 9.765.625 ô dữ liệu được cần để tính toán tất cả các tỷ lệ xác suất
yêu cầu. Nếu như có tới 100 đặc tính với 2 giá trị (đó là kết quả nhị phân) thì
2

hay xấp xỉ 1.310

ô dữ liệu được yêu cầu. Đối với vấn đề phức tạp hơn
thì rất nhiều ô dữ liệu của các bảng biểu sự kiện ngẫu nhiên có kích cỡ lớn này
sẽ có lượt đếm giá trị 0 như những kết hợp giá trị tốt nhất chưa bao giờ được
quan sát. Thậm chí với công nghệ tiên tiến hiện nay trong tin học máy tính, cũng
không thể thu được những ước tính thống kê về số lượng lớn những xác suất khả
năng xảy ra.
Những gì cần thiết là một công nghệ chấm điểm hiệu quả, có thể tái sử dụng và
chính xác, cái mà một khi đã được tính toán sẽ trình bày mỗi một người vay một
con số vô hướng thay vì vectơ  những giá trị của các đặc tính. Đây là những gì
mà điểm số thực hiện.
3.1.4 Điểm số là thống kê đầy đủ
Một điểm số () là một hàm số những giá trị  của những đặc tính của một
người vay tiềm năng, cái được chuyển đổi vào trong xác suất để ước lượng rằng
người vay đó sẽ có trạng thái tốt. Giả định then chốt trong chấm điểm tín dụng là
điểm số là tất cả những điều được yêu cầu để tiên đoán xác suất một người vay
15

có trạng thái tốt. Trong chừng mực nào đó thì điểm số giống như là thống kê đầy
đủ. Thông thường nó cũng giả định rằng điểm số có mối quan hệ gia tăng đơn
điệu với xác suất trở thành trạng thái tốt – trong trường hợp đó điểm số được gọi
là điểm đơn điệu. Những điểm số như thế bảo toàn những phạm vi vì thế nếu
một người vay có một điểm số cao hơn người vay thứ hai, người vay thứ nhất có
xác suất trở thành trạng thái tốt cao hơn người thứ hai.
Chúng ta giả định rằng một điểm số đầy đủ hay thích hợp () thu được càng
nhiều thông tin cho việc dự đoán xác suất của một kết quả thực hiện cho là
tốt/xấu càng tốt cho dữ liệu gốc vectơ . Chúng ta sẽ giả định xuyên suốt rằng
chúng ta có điểm số thích hợp. Giả định này cho rằng điểm số rủi ro bao gồm
toàn bộ thông tin được yêu cầu để dự báo kết quả tốt/xấu nghĩa là

{

|
   ê 
}
= 
(

)

= 
(

|

(

)

, 
)
= 
(

|

)
  (3.12)
Vì vậy với một điểm số phù hợp chúng ta có thể thay thế những đặc tính đa kích
cỡ  mô tả người vay bằng giá trị vô hướng () và điều này không thay đổi xác
suất dự đoán rằng một người vay sẽ trong trạng thái tốt. Nếu ta sử dụng một tập
hợp những đặc tính khác nhau với các kết hợp giá trị  trong đó , ta có thể
phát triển một điểm số rủi ro phù hợp khác (). Cả hai điểm số này có thể đồng
ý về tất cả người vay hoặc có thể không, nhưng chúng cho thấy sự gia tăng đối
với mức xác suất như nhau về một người vay có trạng thái tốt.
Chúng ta sẽ đặt biến phụ thuộc  vào điểm số và viết

(

)
= 
(

)
 à 1 
(

)
= 1 

(

)
= 
(

)
   (3.13)
Tương tự chúng ta đặt biến phụ thuộc  vào khả năng xảy ra và sử dụng

({

|

(

)
= 
}|

)
= 
(

|

)
;

({


|

(

)
= 
}|

)
= 
(

|

)
;
({|() = }) = ()
16
Nếu điểm số s(x) là một điểm số phù hợp, thì chúng ta có thể mở rộng kết quả
trong biểu thức (3.8) rằng tỷ lệ xác suất của một người vay có đặc tính x là tích
số giữa tỷ lệ xác suất tổng thể với tỷ lệ xác suất thông tin đối với một kết quả
tương tự của điểm số, cụ thể:

(

|

)


(

|{

|

(

)
= 
})
=






({

|

(

)
= 
}|

)


({

|

(

)
= 
}|

)

= 


(

|

)

(

|

)
= 

 
(


)
(3.14)
Trong đó () = (|)/(|) là tỷ lệ xác suất thông tin được điểm số  cung
cấp.
3.1.5 Điểm số logarit tỷ lệ xác suất
Hàm số tỷ lệ xác suất (|) được định nghĩa trong biểu thức (3.8) có thể được
nghĩ như là một điểm số vì nó chứa đựng tất cả thông tin trong  rằng nó hữu ích
trong việc ước lượng xác suất một người vay sẽ tốt. Ngoài ra, ta luôn có thể trích
xuất xác suất ban đầu từ tỷ lệ xác suất, và nó có đặc điểm là khi tỷ lệ xác suất
tăng xác suất người vay sẽ tốt cũng tăng. Tuy nhiên, có một hàm điểm số khác –
điểm số logarit tỷ lệ xác suất – dùng để chi phối việc chấm điểm tín dụng vì nó
có những đặc điểm lý thuyết hấp dẫn và cũng vì nó là một trong những phương
pháp chính để xây dựng bảng điểm – hồi quy logistic – sẽ đưa ra bảng điểm cho
loại đó.
Chúng ta xác định điểm số logarit tỷ lệ xác suất như sau:

(

)
 
(

|

)
= 

(


|

)

(

|

)

(

|

)
+ 
(

|

)
= 1  (3.15)
Trong đó ln là logarit cơ số e (không cần thiết phải dùng cơ số này nhưng điều
này đã trở thành tiêu chuẩn trong thực tiễn). Logarit tỷ lệ xác suất đòi hỏi nhiều
ở các thang đo đối với những xác suất rất nhỏ hay rất lớn. Nhấn mạnh vào các sự
kiện hiếm và những xác suất rất nhỏ là quan trọng vì xác suất vỡ nợ của cá nhân
17
người vay là nhỏ nhưng dẫn đến kết quả lỗ cho hầu hết danh mục cho vay của tổ
chức cho vay là rất lớn.
Định nghĩa một điểm số logarit tỷ lệ xác suất không nên bị nhầm lẫn với quy

trình ước lượng chung được chỉ ra như là hồi quy logistic. Hồi quy logistic cố
gắng tìm ra một hàm điểm số, nó là tổng số điểm của từng giá trị và có những
đặc tính điểm số logarit tỷ lệ xác suất. Có nhiều cách khác nhau để xây dựng
hàm điểm số và một vài trong số đó ta có thể biến đổi hoặc cân đối hàm điểm số
nhằm có một điểm số logarit tỷ lệ xác suất tương đối.
Việc xác định rõ tỷ lệ xác suất hay điểm số của một sự kiện thì tương ứng với
việc xác định xác suất của nó vì chúng ta có thể viết xác suất dưới dạng tỷ lệ xác
suất:

(

|

)
=
(|)
1 + (|)

(

|

)
=
1
1 + (|)

Hoặc dưới dạng điểm số:

(


|

)
=
(|)
1 + (|)
=

()
1 + 
()
=
1
1 + 

(

)
(3.16)
3.1.6 Điểm số logarit tỷ lệ xác suất tách biệt thành tỷ lệ xác suất tổng
thể và tỷ lệ xác suất tỷ trọng dấu hiệu
Đặc điểm quan trọng nhất mang tính lý thuyết của một điểm số logarit tỷ lệ xác
suất là nó tách biệt hoàn toàn thông tin về tổng thể khỏi thông tin phong cách
riêng về cá nhân người vay được chấm điểm. Nếu chúng ta lấy logarit theo định
lý Bayes’ trong biểu thức (3.8), chúng ta có được điểm số logarit tỷ lệ xác suất
tách biệt thành 2 thành phần: một khoản phụ thuộc vào tỷ lệ xác suất tổng thể và
khoản còn lại phụ thuộc vào tỷ lệ xác suất thông tin:

(


)
= ln 
(

|

)
= ln 



(

|

)



(

|

)
= ln 





+ ln 

(

|

)

(

|

)

= ln 

+ ln 
(

)
= 

+ 
()
(3.17)
Trong đó 
()
() ()
18
Điều này phát biểu rằng điểm số logarit tỷ lệ xác suất là tổng số của một khoản

chỉ phụ thuộc vào tỷ lệ xác suất tổng thể (

=  

) và một khoản phụ
thuộc vào thông tin về người vay . Khoản đầu tiên bên tay phải (RHS) của biểu
thức (3.17) có thể được coi như là điểm số “ưu tiên” – đó là điểm số của một cá
nhân được chọn ngẫu nhiên trong tổng thể; sau đó điểm số này được gia tăng hay
bị sụt giảm bởi điểm số dựa vào dữ liệu độc nhất của cá nhân cụ thể.
Khoản sau, tỷ lệ xác suất của (), được gọi là tỷ trọng dấu hiệu của thông tin ,

(

)
. Có một định nghĩa tương tự dành cho khoản tỷ trọng dấu hiệu của điểm số
, để mà

(

)
= log () = log 

(

|

)

(


|

)
= log 
(|)()/

(|)()/


= log 

(

|

)
/(|)


/




(

)
= log () = log 

(


|

)

(

|

)
= log 
(|)()/

(|)()/


= log 

(

|

)
/(|)


/

 (3.18)
Vì vậy tỷ trọng dấu hiệu là logarit của tỷ số xác suất giữa tốt:xấu cho những

nhóm có thông tin  hoặc điểm số , được so với tỷ lệ xác suất tổng thể ban đầu.
Nếu dương thì cho thấy nhóm này tốt hơn tổng thể nói chung và nếu âm nghĩa là
tỷ lệ tốt của nhóm này sẽ thấp hơn toàn bộ tổng thể.
Điểm số logarit tỷ lệ xác suất bên trên tách biệt về bản chất trong biểu thức
(3.17) thành các logarit tỷ lệ xác suất và biểu thức này rất hữu ích. Một lần nữa
lưu ý rằng điểm số logarit tỷ lệ xác suất thông tin phụ thuộc vào những đặc tính
của cá nhân nhưng tỷ lệ xác suất tổng thể thì không. Một lý do khác tại sao
logarit tỷ lệ xác suất lại hữu ích hơn chính tỷ lệ xác suất là vì nếu ta lấy kết quả
ước lượng trước về logarit tỷ lệ xác suất bằng cách chọn mẫu dữ liệu, ước lượng
19
này có thể được tính gần đúng bằng phân phối chuẩn khi cỡ mẫu quá nhỏ hơn
mức cần thiết để có được ước lượng tỷ lệ xác suất có phân phối chuẩn (Hosmer
and Lemeshow 1989, p.44).

Ví dụ 2: Xây dựng điểm số logarit tỷ lệ xác suất
Một tổ chức cho vay có một mẫu gồm 1.000 trường hợp để xây dựng điểm số
logarit tỷ lệ xác suất, và có 3 đặc tính khác nhau – tình trạng cư trú, tuổi tác, và
thẻ tín dụng. Dữ liệu về tình trạng cư trú được cho ở bảng 3.1 ví dụ 1, nhưng
chúng ta sẽ lặp lại trong bảng ví dụ 2 cùng với dữ liệu về tuổi tác. Đặc tính tuổi
tác có 4 giá trị - dưới 30, 30-39, 40-49, và từ 50 trở lên.
Đầu tiên, chúng ta xây dựng tỷ trọng dấu hiệu, () và điểm số logarit tỷ lệ xác
suất, () đối với những giá trị tình trạng cư trú. Kết quả điểm số là những gì
chúng ta có để sử dụng nếu như tình trạng cư trú là đặc tính sẵn có duy nhất.
Chúng ta có thể dùng những kết quả trong biểu thức (3.4) hay (3.10) trong các
phép tính:


= ln

= ln 

900
100
= 2.197

(
  
)
= s

(
  
)
= ln
(
(  
)
)
= ln 

(
  
|

)

(
  
|

)

= ln 
0.633
0.3
= 0.747

(
  
)
= 

+ 
(
  
)
= 2.197 + 0.747 = 2.944
= ln (570/30) = ln (
(

|
  
)
)

(
ê
)
= s

(
ê

)
= ln
(
(ê
)
) = ln 

(
ê
|

)

(
ê
|

)
= ln 
0.167
0.5

= 1.099

(
ê
)
= 

+ 

(
ê
)
= 2.197 1.099 = 1.1 = ln 
150
50

= ln
(

|
ê
)
 (3.19)

×