Tải bản đầy đủ (.pdf) (9 trang)

APPLICATION OF SOME METHODS FOR BUILDING CLASSIFICATION FUNCTIONS IN EARLY WARNING OF DEFAULT RISK FOR VIETNAM JOINT STOCK COMMERCIAL BANKS

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (708.47 KB, 9 trang )

<span class="text_page_counter">Trang 1</span><div class="page_container" data-page="1">

ỨNG DỤNG MỘT SỐ PHƯƠNG PHÁP XÂY DỰNG HÀM PHÂN LOẠI TRONG CÂNH BÁO SỚM NGUY CƠ VỠ NỢ CỦA CÁC NGÂN HÀNG THƯƠNG MẠI CỔ PHẦN VIỆT NAM

<b>Nguyễn Thị Lan</b>

<b><sup>*</sup></b>

<b>, Đỗ Thị Nhâm, Ngọc Minh Châu, Lê Văn Hỗ </b>

<i><b>Khoa Cơng nghệ thơng tin, Học viện Nơng nghiệp Việt Nam </b></i>

<i><small>*</small></i>

<i><b>Tác giả liên hệ: </b></i>

Ngày gửi bài: 06.03.2018 <b>Ngày chấp nhận: 21.08.2018 </b>

TĨM TẮT

Trong nghiên cứu này chúng tơi vận dụng các mơ hình thống kê dựa trên phân tích khác biệt đa biến, hồi qui logistic và máy vecto hỗ trợ (SVM) để xây dựng các hàm phân loại nhằm cảnh báo rủi ro sớm cho các ngân hàng thương mại cổ phần (NHTMCP) Việt Nam. Các mơ hình được thực hiện trên các nhĩm thuộc tính như: khả năng sinh lời, các chỉ số thâm hụt, hiệu quả quản lí tài sản, chất lượng tài sản, mức độ an tồn, nhĩm chỉ số tăng trưởng bền vững và tính thanh khoản. Nghiên cứu tính tốn độ chính xác của các mơ hình nghiên cứu trên cả tập dữ liệu và kiểm tra, ngồi ra cịn đưa ra các loai sai lầm loại I, sai lầm loại II mà các mơ hình mắc phải

Từ khĩa: Ngân hàng thương mại, cảnh báo nguy cơ vỡ nợ, hàm phân loại.

<b>Application of Some Methods for Building Classification Functions in Early Warning of Default Risk for Vietnam Joint Stock Commercial Banks </b>

ABSTRACT

In our study, we used statistical models based on multivariate linear discriminant analysis, logistic regression and SVM methods to construct bank classification functions for early risk warning for Vietnam joint stock commercial banks The models were built on attribute groups such as profitability, deficit indicators, asset management efficiency, asset quality, safety level, sustainable growth rate and liquidity. The study calculates the accuracy of the research models on both data sets and tests, in addition to the types of mistakes of type I, mistakes of type II that models suffer from.

Keywords: Commercial banks, early warning, default risk, classification function.

1. ĐẶT VẤN ĐỀ

Vĉi tā cách là trung gian tài chính, ngån hàng thāćng mäi là lội hình doanh nghiệp kinh doanh đặc thù vì kinh doanh các lội hàng hịa đặc biệt là tiền tệ, vàng bäc, chăng khốn,„ và cung ăng các dðch vĀ ngõn hng theo quy nh cỵa phỏp luêt. Hiện nay, Ċ Việt Nam đang cĩ sĆ phỏt trin nhanh chng cỵa hệ thøng ngân hàng dén đến việc thành lêp hàng lột các ngân hàng và các chi nhánh mĉi. Hûi nhêp kinh tế qùc tế đem läi nhiều cć hûi nhng cng khng ớt rỵi ro cho h thứng ngån hàng nhā: dễ bð phá sân, thiếu vøn để cọnh tranh, thua lỳ v

mỗt th phn. Vic ỏnh giỏ mỷt doanh nghip ni chung ó rỗt kh khởn, phăc täp, đánh giá mût ngân hàng vĉi nhiều nét đặc thù riêng cịn khị khën và phăc täp hćn nhiều. Nếu chỵ áp dĀng cách đánh giá thưng thāĈng dĆa trên phân tích báo cáo tài chính sẽ khơng giúp nhiều cho việc phỏt hin sm nguy c v n, yu kộm cỵa các ngån hàng, điển hình nhā hàng lột vĀ sĀp ự cỵa cỏc ngõn hng ln trờn th gii trong nhąng nëm gỉn đåy nhā Lehman Brothers, Washington Mutual (2008). Täi nāĉc ta, trong nëm 2010 và 2011 nhiu tự chc ngồn hng ri vo tỡnh trọng mỗt thanh khôn nghiêm trõng, kết quâ cùi nëm 2011, mût sø ngân hàng phâi

</div><span class="text_page_counter">Trang 2</span><div class="page_container" data-page="2">

sáp nhêp, hp nhỗt (ba ngồn hng Nhỗt, Si Gn và Tín nghïa ngån hàng ó hp nhỗt v chớnh thc hột đûng dāĉi tên Ngân hàng TMCP Sài Gịn kể tĂ 01/01/2012) và chðu sc ộp tỏi cỗu trỳc lọi để phù hČp vĉi xu hng hin tọi. Tỗt cõ nhng vỗn trờn ó khng đāČc phân ánh và cânh báo sĉm thơng qua các kênh dĆ báo, phån tích thưng thāĈng (Nguyễn Lê Thành, 2012).

Trên th gii, giõm thiu rỵi ro, nởm 1988, y ban Basel về giám sát ngân hàng ban hành hệ thøng đo lāĈng vøn và rỵi ro tớn dng vi tên thāĈng gõi là hiệp āĉc Basel 1. Theo yêu cu cỵa Basel 1, cỏc ngõn hng phõi duy trỡ tỵ lệ vøn bít bủc trên tùng sø tài sân iu chnh theo h sứ rỵi ro (CAR) mc an tn l 8%. Do nhng họn ch cỵa Basel 1, nëm 2004 Ủy ban Basel läi giĉi thiệu phiên bân mĉi vĉi tên gõi Basel 2, cĩ hiệu lĆc tĂ nëm 2007 và kết thúc thĈi gian chuyển đùi đến nëm 2010 (Lê Thanh Ngõc và cs., 2015). TĂ nhąng nởm 70 cỵa th k trāĉc, mơ hình CAMELS (Capital adequacy, Aset Quality, Management, Earnings, Liquidity, Sensitivity to market risk) là hệ thøng xếp häng, giám sát tình hình ngân hàng Mỹ và đāČc coi là chuèn mĆc vĉi hỉu hết các tù chăc trên tồn thế gii khi ỏnh giỏ hiu quõ rỵi ro cỵa các ngân hàng nĩi riêng và các tù chăc tín dĀng nĩi chung. Tuy nhiên nếu chỵ đćn thuỉn áp dĀng mơ hỡnh CAMELS phõn tớch thỡ bc tranh y ỵ v sc khe cỵa cỏc tự chc tớn dng s chāa thĆc sĆ rõ nét (Nguyễn Lê Thành, 2012). Mà trong phân tích tù chăc tín dĀng theo phāćng pháp hiện đäi, ngồi nền tâng cć bân là các yếu tø tài chính tĂ kt quõ cỵa m hỡnh CAMELS, cn bự sung các yếu tø phi tài chớnh, cỏc yu tứ xuỗt phỏt tĂ quan hệ vĉi đøi tác kinh doanh để cĩ cỏi nhỡn tn din. Do tớnh cỗp thit cỵa vic cõnh bỏo nguy c v n cỵa cỏc ngõn hng, trên thế giĉi đã cị nhiều tác giâ đāa ra các phāćng pháp khác nhau nhìm phĀc vĀ việc cânh báo mût

<i>cỏch tứt nhỗt (Aziz & Humayon et al., 2006). </i>

Altman (1968) là ngāĈi đỉu tiên sĄ dĀng mơ hình thøng kê đa biến “Z-core” để tìm sĆ kết nøi giąa các chỵ sø tài chính để cĩ thể cânh báo nguy cć vċ nČ. Ohlson (1980) đāa ra mư hình khác: mơ hình logistic và mơ hình sø 8 để cânh

báo. Mût sø mơ hình thøng kê, chỵng hän nhā phân tích khác biệt, phân tích logistic và h÷i qui probit đã đāČc sĄ dĀng bi cỏc nh nghiờn cu

<i>rỵi ro tớn dng (Aziz & Humayon et al., 2006). </i>

Mût trong nhąng nghiên cău gỉn đåy Ċ lïnh vĆc này là Lacerda & Moro (2008), hừ ó phồn tớch nguy c phỏ sõn cỵa các cơng ty B÷ Đào Nha vĉi ba phāćng pháp: h÷i qui logistic, phāćng pháp biệt sø và máy vecto hú trČ. Gỉn đåy, vi s xuỗt hin cỵa cõy ra quyt nh và mäng noron (Le Cun, 1986), kï thuêt trí tuệ nhân täo (AI) đāČc sĄ dĀng rûng rãi cho tín dĀng, chúng cĩ hiệu quâ vāČt trûi so vĉi thøng kê truyền thøng về kết quâ đỉy hăa hẹn. Mặc dù nhąng m hỡnh ny vỗp phõi vỗn cc tiu a phāćng và hõc quá (Wei & Lichen, 2000). Việc tìm ra các phāćng pháp mĉi câi tiến các phāćng pháp cÿ, ăng dng nhiu li sứ liu l i hi cỗp bỏch hiện nay trên thế giĉi.

Ở nāĉc ta việc xây dĆng các mơ hình cânh báo vċ nČ ngån hàng ó c nghiờn cu nhng cha y ỵ, cha theo din bin n xỗu cỵa cỏc ngõn hng trong mỷt thi kỡ nhỗt đðnh (Đặng Huy Ngân, 2016). Mût vài tác giâ đã đāa ra các bài tốn cânh báo sĉm nguy cć vċ nČ. Đặng Huy Ngân (2015),đã sĄ dĀng kết hČp phân tích nhân tø và h÷i qui logistic để phân lội các ngân hàng thāćng mäi Việt Nam. Nguyễn Quang Dong (2009) đãxếp häng tín dĀng các ngân hàng, tù chăc tài chính Việt Nam bìng phāćng pháp phân tích tách biệt. Các nghiên cău trāĉc đåy đã xác đðnh các nhân tø tác đûng đến nguy cć vċ nČ, nhāng chýng cị phâi là nguyờn nhõn dộn n n xỗu trong thĈi kì đị khưng? Hćn nąa các ngån hàng cị đặc trāng riêng cị ânh hāĊng tĉi khâ nëng vċ nČ hay khưng? Đề cờp ti vỗn ny, ng Huy Ngân (2018) đã nghiên cău xây dĆng mơ hình cânh báo nguy cć vċ nČ cho các NHTMCP Việt Nam vĉi sø liệu mâng, mơ hình logit, đ÷ng thĈi cÿng thĄ nghiệm mơ hình mäng noron vào phân lội. Trong nghiên cău này chúng tơi sẽ vên dĀng các mơ hình thøng kê dĆa trên phân tích khác biệt, h÷i qui logistic và SVM để xây dĆng các hàm phân lội ngân hàng, tĂ đị đāa ra đû chính xỏc cỵa cỏc m hỡnh; giá trð các lội sai lỉm lội I, lội II mà

<i>múi mơ hình míc phâi và giá trð p-value cho so </i>

</div><span class="text_page_counter">Trang 3</span><div class="page_container" data-page="3">

sánh hiệu suỗt cỏc m hỡnh t kt luờn hiu suỗt cỵa chúng cĩ khác biệt nhiều khơng.

2. PHƯƠNG PHÁP NGHIÊN CỨU

<b>2.1 Nguồn số liệu và biến số </b>

Các sø liệu thĄ nghiệm trong nghiờn cu cỵa chýng ti clỗy tĂ báo cáo tài

chính cơng khai đã đāČc kiểm tốn (Bâng cån đøi kế tốn, bâng báo cáo lāu chuyển tiền tệ, bâng kết quâ hột đûng kinh doanh) täi thi im cựi nởm cỵa các ngân hàng thāćng mäi cù phỉn Việt Nam tĂ nëm 2009 đến hết nëm 2012, tùng cûng cĩ 136 quan sát (Đặng Huy Ngân, 2018). Các biến trong nghiên cău g÷m:

<b>Bảng 1. Các biến số nghiên cứu đã lựa chọn </b>

<small>Nhĩm 1: Khả năng sinh lời </small>

<small>e3 Chi phí dự phịng nợ khĩ địi + Giảm giá đầu tư chứng khốn/Thu nhập lãi thuần + </small>

<small>e9 Chi phí dự phịng nợ khĩ địi/Tổng thu nhập trước dự phịng và thuế + </small>

<small>Nhĩm 2: Các chỉ số thâm hụt </small>

<small>Nhĩm 3: Hiệu quả quản lý tài sản </small>

<small>Nhĩm 4: Chất lượng tài sản </small>

<small>a5 Gửi và cho vay tiền thị trường liên ngân hàng/Tài sản sinh lời - a6 Chứng khốn đầu tư và chứng khốn kinh doanh/Tài sản sinh lời + </small>

<small>Nhĩm 7: Tính thanh khoản </small>

<small>14 Huy động từ tổ chức kinh tế và dân cư/Tổng huy động - 15 Huy động trên thị trường liên ngân hàng/Tổng huy động + </small>

</div><span class="text_page_counter">Trang 4</span><div class="page_container" data-page="4">

<b>Bảng 2. Các biến số cĩ khả năng phân biệt các mức nguy cơ </b>

<small>e1 ROA-Khả năng sinh lời trên tổng tài sản e2 ROE-khả năng sinh lời trên vốn chủ sở hữu e4 (Lãi thuần - chi phí hoạt động)/Chi phí hoạt động e7 Tốc độ tăng trưởng thu nhập lãi thuần </small>

<small>e9 Chi phí dự phịng nợ khĩ địi/Tổng thu nhập trước dự phịng và thuế e10 Thu nhập từ phí dịch vụ/Trên tổng thu nhập hoạt động </small>

<small>l4 Huy động từ tổ chức kinh tế và dân cư/Tổng huy động </small>

<i>Biến phụ thuộc: biến cị nguy cć vċ nČ là </i>

biến phĀ thủc Y, Y đāČc gán bìng 1 (nguy cć vċ n cao) nu ngõn hng c t l n xỗu tĂ 3% trĊ lên. Biến Y đāČc gán bìng 0 (nguy c v n thỗp) nu t l n xỗu nhĩ hćn 3%. Trong bû dą liệu mâng 136 quan sát cĩ 35 quan sát thủc nhịm nguy cć vċ nČ cao và 101 quan sát thủc nhịm nguy cć vċ n thỗp.

<i>Bin c lp: Da trên ngu÷n sø liệu hiện </i>

cĩ, các chỵ tiêu trong mơ hình CAMEL và nhąng gČi ý tĂ các cơng trình nghiên cău trāĉc, cÿng nhā hột ỷng cỵa cỏc ngồn hng thng mọi, nghiờn cu ó đāČc xây dĆng, lĆa chõn 40 biến sø (Bâng 1). Dỗu kỡ vừng (+) tác đûng cùng chiều, (-) tác đûng ngāČc chiều, (+/-) tác đûng lúc thuên, lúc nghðch.

TĂ 40 biến sø thủc 7 nhịm đã đāČc tính tốn, tiến hành phån tích phāćng sai để xác đðnh các biến trong các nhĩm cĩ khâ nëng phån biệt các măc nguy cć (Đặng Huy Ngân, 2018). CĀ thể cịn 18 biến trong bâng 2.

<b>2.2. Phương pháp nghiên cứu </b>

<i><b>2.2.1. Mơ hình phân tích khác biệt tuyến tính </b></i>

Phân tích khác biệt tuyến tính, cĩ tên tiếng

<i>Anh là Linear Discriminant Analysis (LDA), là </i>

mût phāćng pháp phån lội thøng kê cù điển, đāČc đāa ra bĊi Fisher (1936). LDA đāČc sĄ dĀng hiu quõ trong nhng vỗn phõn li d liu tỡm kim mỷt s kt hp tuyn tớnh cỵa các thủc tính phân tách hai hay nhiều lĉp đøi tng. Kt quõ cỵa s kết hČp cĩ thể đāČc sĄ

<i>dĀng nhā mût bû phên lội tuyến tính (linear </i>

<i>classifier) hoặc phù biến hćn để giâm sø chiều </i>

<i>(dimensionality reduction) trāĉc khi phân lội cùi (Hastie et al., 2009; Nguyen Hoang Huy, </i>

2013; Sergio Bacallado, 2017).

<i>a. Mơ hình LDA lý thuyết </i>

Trong khơng gian p chiều, cĩ hai lĉp chăa đøi tng, trong bi tn cỵa chỳng ta l nhm c nguy cć vċ nČ và nhĩm khơng cĩ nguy cć vċ

</div><span class="text_page_counter">Trang 5</span><div class="page_container" data-page="5">

nČ. Múi đøi tāČng đāČc cho bĊi mût vecto biểu diễn . S phõn bứ cỵa cỏc ứi tng trong hai lĉp đều tuân theo phân bø chuèn, vĉi tham sø vecto trung bình và cùng ma trên hiệp phāćng sai . Để phân lội đøi tāČng về các lĉp tāćng ăng cỉn dĆa vào vecto biểu diễn , ta giâ sĄ  đāČc biểu diễn nhā sau: hoặc . Nếu mût quan sát X thủc về lĉp

<i>k { } thỡ mờt ỷ cỵa nĩ là: </i>

<small> </small> { <small> </small> } Phân lĉp Bayes gán X vào lĉp 0 nếu:

Tāćng đāćng vĉi <small> </small>

Ở đị . Hàm phân biệt tuyn tớnh cỵa c xỏc nh bi:

p dng phân tích khác biệt tuyến tính cho hai lĉp

vĉi { } và ̅̅̅̅̅̅ Xác đðnh vecto trung bình cho các lĉp

Ma trên hiệp phāćng sai méu ̂ cho các lĉp ̂

<sup>∑ </sup> <sup> </sup><sup>̂</sup>

<small> </small>

̂ ̂ <sup> </sup> <sup> ̂</sup> <sup> </sup> <sup> ̂</sup>

Trong đị: ̂ l c lng cỵa xỏc suỗt lp th nhỗt.

l c lng cỵa xỏc suỗt lp thă hai. - Nếu ̂ ̂ (lp th nhỗt). - Nu ̂ (lĉp thă hai). Hàm phân bit tuyn tớnh thc nghim cỵa c xỏc đðnh bĊi:

̂ ̂ ̂<small> </small> ̂ ̂

<i><b>2.2.2. Mơ hình hồi qui logistic </b></i>

Trong các mơ hình h÷i qui truyền thøng, biến phĀ thủc và biến đûc lêp cĩ thể nhên giá trð trên têp sø thĆc. Trong thc t c rỗt nhiu trng hČp, mût đäi lāČng chỵ nhên hai giá trð 0 và 1, nhāng nị läi phĀ thủc vào các biến đûc lêp khác nhên giá trð trên têp sø thĆc. NgāĈi ta cỉn đāa ra mût phāćng trình mư tâ mứi quan h gia

<i>xỏc suỗt p mỷt bin cứ A xõy ra vi giỏ tr cỵa cỏc bin đûc lêp x<sub>1</sub>, x<sub>2</sub>, …, x<sub>n</sub></i>. Trong bài tốn này biến cø A là biến cø ngân hàng bð vċ nČ, các biến đûc lêp là các biến trong bâng 2. Phāćng trỡnh

<i>dọng tuyn tớnh biu din xỏc suỗt p qua mỷt tự </i>

hp tuyn tớnh cỵa cỏc bin ỷc lêp thāĈng đāČc nghï đến trāĉc tiên. Tuy nhiên, mût phāćng

<i>trình tuyến tính nhā vêy là khơng hČp lý, vì p </i>

chỵ nhên giá trð giĉi hän trong độn [0,1], trong khi tự hp tuyn tớnh cỵa cỏc bin ỷc lờp c th nhờn giỏ tr bỗt kč trên đāĈng thỵng thĆc. Nhng ngi ta nhờn thỗy c mứi quan h cht chẽ giąa tỵ lệ cāČc, thành phỉn

<small> </small> và các

<i>biến đûc lêp x<sub>i</sub></i> dāĉi däng tuyến tính nên đã thiết lêp chýng dāĉi däng:

Phāćng trình (1) đāČc gõi là mơ hình h÷i qui logistic bûi, khi n = 1 ta cĩ mơ hình h÷i qui logistic đćn. SĄ dĀng phāćng pháp hČp lý cĆc đäi, các hệ sø

<i><sub>i</sub></i> trong phāćng trình (1) cị āĉc lāČng là ̂ đāČc xác đðnh bĊi hệ phng trỡnh sau:

</div><span class="text_page_counter">Trang 6</span><div class="page_container" data-page="6">

<i>cỵa phn t cĩ biến quan sát x = (x<sub>1</sub>,x<sub>2</sub>, …, x<sub>n</sub>) là: </i>

<i>Khi đị, nếu p >0,5 thì ta sẽ xếp phỉn tĄ </i>

này vào lĉp xây ra A, ngāČc läi ta sẽ xếp nĩ vào lĉp khơng xây ra A (Vơ Vën Tài và cs.).

<i><b>2.2.3. Máy vecto hỗ trợ </b></i>

<i>Máy vecto hú trČ (SVM - Support Vector </i>

<i>Machine) là mût khái niệm trong thøng </i>

kê và khoa hõc máy tính cho mût têp hČp các phāćng pháp hõc cĩ giám sát liên quan đến nhau để phân lội và phân tích h÷i quy. Thuêt tốn SVM ban đỉu đāČc tìm ra bĊi Vapnik (1995) và däng chuèn hiện nay sĄ dĀng lề mềm đāČc tìm ra bĊi Vapnik và Corte (1995). SVM däng chuèn nhên dą liệu vào và phân lội chúng vào hai lĉp khác nhau. Mût mơ hình SVM là mût cách biểu diễn các điểm trong khơng gian và lĆa chõn ranh giĉi giąa hai lĉp sao cho khụng cỏch l t cỏc vớ d huỗn luyện tĉi ranh giĉi là xa nhỗt c th. Trong nhiu trāĈng hČp, khưng thể phån chia các lĉp dą liệu mût cách tuyến tính trong mût khưng gian thủc tính ban đỉu. Vì vêy, nhiều khi cỉn phâi ánh xä các điểm dą liệu trong khơng gian ban đỉu vào mût khơng gian mĉi nhiều chiều hćn, để việc phân tách chúng trĊ nên dễ dàng hćn trong khơng gian mĉi. Ánh xä sĄ dĀng trong SVM chỵ đđi hĩi biết tích vư hng cỵa cỏc vecto d liu trong khưng gian mĉi, tích vư hāĉng này đāČc xác đðnh bìng mût hàm hät

<i>nhân K(x,y) phü hČp. Mût sĆ mơ tâ đćn giân cho thuêt tốn SVM c cung cỗp di ồy (Min et </i>

<i>al., 2005): </i>

Cho trc mỷt tờp huỗn luyn { }<sub> </sub>

vĉi đỉu vào là các vecto <sup> </sup> <sup> </sup>

và têp nhãn { }, máy phân lội vecto hú trČ SVM theo cng thc gức cỵa Vapnik, tha món cỏc điều kiện sau đåy: { <sup> </sup><sup> </sup> <sup> </sup>

<sup>(3) </sup>

Điều này tāćng đāćng vĉi [ ]

(4)

Ở đị w là vecto trõng sø và b là khuynh hāĉng. Ánh xä phi tuyến ɸ ánh xä khơng gian thủc tính đỉu vào đo đāČc vào khơng gian thủc tính cĩ sø chiều cao, hoặc vơ hän chiều ( l sứ chiu cỵa khng gian thủc tính). Phāćng trình (3) xác đðnh hai siêu phỵng lề song song (cĩ cùng vecto pháp tuyến) nìm hai bên (theo hāĉng xác đðnh bĊi vecto pháp tuyến) siêu phỵng phân tách trong khơng gian thủc tính vĉi đû rûng lề giąa hai siêu phỵng bìng ‖ ‖ . Hàm phân lội dĆa trên giá trð thủc tính ban đỉu xác đðnh bĊi: (5)

Hỉu hết các bài tốn phân lĉp là khơng phân tách tuyến tính. Vì vêy, mût cách tùng quát để tìm vecto trõng sø ta sĄ dĀng biến giâm để cho phép phân lội sai. Bài tốn tøi āu lề trĊ thành: <small> </small> ∑<sub> </sub> (6)

Tùy thủc vào { <sup> </sup> <sup> </sup><sup> </sup><sup> </sup>

<sup> (7) </sup>Ở đị các là các biến giâm cỉn thiết để cho phép phân lội sai méu thă i, và là mût siêu tham sø điều chỵnh măc đû phån đû sai để cân bìng vĉi đû rûng lề. TĂ các điều kiện tøi āu và hàm mĀc tiêu, thu đāČc mût bài tốn qui hộch tồn phāćng (QP), cị thể giâi bìng phāćng pháp nhån tĄ Lagrange. Hệ sø nhân Lagrange t÷n täi tāćng ăng vĉi múi mộu trong d liu huỗn luyn. Các méu tāćng ăng vĉi các khác khơng chính là các vecto hú trČ. Khi đị, bài tốn trên cị thể chuyển đùi thành bài tốn đøi ngéu vĉi hàm mĀc tiêu (8) và ràng bủc (9) nhā sau:

</div><span class="text_page_counter">Trang 7</span><div class="page_container" data-page="7">

(8) Vĉi ràng bủc {<sup> </sup> <sup> </sup>

<sup> (9) </sup>Trong bài tốn đøi ngéu Ċ trên, e là vecto đćn vð g÷m tồn sø 1, Q là ma trên bán xác đðnh dāćng, <sub> </sub> và ( ) là hät nhân. Ở đåy, các vecto đāČc ánh xä vào khơng gian cĩ sø chiều cao hćn bĊi hàm . Sau đị xåy dĆng SVM phân lội cùi cüng nhā sau:

(∑ )

3. KẾT QUẢ VÀ THẢO LUẬN

Để xây dĆng hàm phân lội trong việc

cânh bỏo sm nguy c v n cỵa cỏc ngõn hng thāćng mäi cù phỉn Việt Nam, nhĩm chúng tơi tiến hành xây dĆng và cài đặt trên ngơn ngą lêp trình Matlab, sĄ dĀng máy tính Intel Core i3, 2.1 GHz, 2GB Ram. Dą liệu thĄ nghiệm đāČc chia mût cách ngéu nhiên nhĈ hàm

<i>cvpartition, thĆc hiện 5 lỉn theo k-fold = 5, </i>

múi lỉn thành 2 tờp con: Mỷt tờp d liu huỗn luyn chim 80% và mût têp dą liệu kiểm tra chiếm 20% trong tùng sø 136 dą liu cỵa cỏc ngồn hng ứi vĉi 2 mơ hình phân tích khác biệt và h÷i qui SVM, cđn đøi vĉi h÷i qui logistic chúng tơi chia têp dą liệu lỉn lāČt theo k-fold = 1, 2, 3, 4, 5. Kết quâ phân lội thu đāČc đøi vĉi các phāćng pháp phån tích khác biệt tuyến tính (LDA), h÷i qui logistic và SVM đāČc thể hiện trong bâng 3.

<b>Hình 1. Ví dụ về siêu phẳng với lề cực đại trong khơng gian R<small>2</small></b>

<b>Bảng 3. Độ chính xác trung bình của các mơ hình </b>

<small>Mơ hình </small> <sup>Độ chính xác trung bình của dự đốn (%) </sup>

<small>Dữ liệu huấn luyện Dữ liệu kiểm tra </small>

</div><span class="text_page_counter">Trang 8</span><div class="page_container" data-page="8">

<i><b>Bảng 4. Giá trị p-value cho so sánh hiệu suất của các cặp mơ hình </b></i>

<b>Bảng 5. Giá trị các sai lầm của các mơ hình </b>

<small>Sai lầm loại I (%) Sai lầm loại II (%) Sai lầm chung (%) </small>

Đû chính xỏc cỵa m hỡnh phõn lội đāČc tính bìng tỷ sø giąa sø mộu c phõn li ýng trờn tựng sứ mộu cỵa têp dą liệu kiểm thĄ.

Kết quâ Ċ bõng 3 cho thỗy trong bi tn ny, ỷ chớnh xỏc cỵa ba mơ hình LDA, h÷i qui logistic, SVM trên tờp d liu huỗn luyn lỉn lāČt là 88,26; 95,05; 79,08% và trên têp dą liệu kiểm tra lỉn lāČt là 85,19; 83,70; 80,74%. Nhā vêy, mơ hình h÷i qui logistic cị đû chớnh xỏc cao nhỗt cõ tờp d liu huỗn luyện cịn LDA läi là phāćng pháp cị đû chính xỏc cao nhỗt tờp d liu kim tra.

Ngi ra để kiểm đðnh sĆ khác nhau trong xác suỗt thnh cng cỵa ba mơ hình,chúng tơi cđn đāa ra giá trð p-value trong kiểm đðnh phi tham sø nh bõng 4, theo thỡ hiu suỗt d n cỵa cỏc m hỡnh LDA, Logistic, SVM khơng quá khác biệt.

Để ỏnh giỏ hiu quõ cỵa các mơ hình trên thưng qua đû chính xác dĆ báo, chúng tơi cđn đánh giá thưng qua tỵ lệ phân lội sai hay nĩi cách khác là các lội sai lỉm míc phâi. Bâng 5 chỵ ra tỵ lệ sai lỉm lội I, sai lỉm lội II v sai lm ni chung cỵa ba m hỡnh. Nhớc läi, sai lỉm lội I ( )míc phâi khi phân lội mût ngån hàng cị nguy cć vċ nČ thành ngân hàng khưng cị nguy cć vċ nČ và sai lỉm lội II ( ) míc phâi khi phân lội mût ngân hàng khưng cị nguy cć vċ nČ thành ngân hàng cĩ nguy cć vċ nČ. Sai lỉm nĩi chung (ER) míc phâi khi phân lội sai, và nĩ cĩ cơng thăc tính nhā sau: <sub> </sub> <sub> </sub> <sub> </sub>. Trong đị, <sub> </sub>ln lt l xỏc suỗt bð phá sân và xác suỗt khng b phỏ sõn. Trong thĆc tế, chi phí sai

lỉm lội I gỉn nhā cao hćn sai lỉm lội II. Sinkey (1975) đã chỵ ra rìng mût tỵ lệ sai lỉm chung nhĩ vĉi mût sai lỉm lội I lĉn sẽ hao tøn chi phí nhiều hćn mût tỵ lệ sai lỉm chung lĉn vĉi sai lỉm lội I nhĩ.

Theo kết quâ Ċ bâng 5, tỵ lệ cỏc li sai lm li I cỵa phāćng pháp h÷i qui logistic thỗp nhỗt trong baphng phỏp, t l sai lm chung thỡ cỵa LDA l thỗp nhỗt, tip n hữi qui logistic và cùi cùng là SVM, cĀ thể tỵ l sai lm ni chung cỵa cỏc phng phỏp ny lỉn lāČt là 14,81%; 16,03% và 19,26%.

Nhā vêy, tĂ các kết quâ thĆc nghiệm Ċ trên, cĩ thể thỗy rỡng cõ ba phng pháp đāČc áp dĀng g÷mphân tích khác biệt tuyến tính LDA, h÷i qui logistic, SVM đều đät đû chính xác trong d bỏo rỵi ro cỵa ngõn hng l khỏ cao (lĉn hćn 70%). Trong đị, phāćng pháp h÷i qui logistic và phân tích khác biệt tuyến tính thể hiện đāČc āu thế hćn so vĉi mơ hình máy vecto hú trČ SVM, do cị đû chính xác cao hćn v t l sai lm thỗp hn m hỡnh mỏy vecto hú trČ SVM.

4. KẾT LUẬN VÀ KIẾN NGHỊ

Nghiờn cu xuỗt mỷt sø phāćng pháp xây dĆng hàm phân lội trong việc cânh báo sĉm nguy cć vċ n cỵa cỏc ngồn hng thāćng mäi cù phỉn Việt Nam, cĀ thể ba phāćng pháp là phân tích khác biệt tuyến tính LDA, h÷i qui logistic và SVM. Các kết quâ thĆc nghiệm vĉi măc đû chớnh xỏc tng ứi tứt, cho thỗy vic ỏp dng mơ hình này trong thĆc tế là hồn tồn cĩ triển võng.

</div><span class="text_page_counter">Trang 9</span><div class="page_container" data-page="9">

Đåy là mư hình cị tính ăng dĀng cao trong thĆc tiễn bĊi ngân hàng là mût trong các tù chăc trung gian tài chính quan trõng cỵa nn kinh t. Vỡ th trong tāćng lai cỉn phát triển tiếp ăng dĀng này, tiếp tĀc thu thờp thờm nhiu d liu cỵa cỏc ngồn hng khỏc nhau qua các nëm khác nhau, câi tiến phāćng pháp phån lội SVM, tìm hiểu thêm các phāćng pháp phån lội khác nhā mäng nćron, cåy quyết đðnh, trí tuệ nhân täo (AI) để đät đāČc kết quâ phân lội tøt hćn. Đ÷ng thĈi cỉn tìm hiểu chuyên såu hćn nąa mơ hình phân lội áp dĀng cho các lïnh vĆc thĆc tiễn khác nh nh giỏ bỗt ỷng sân, chuèn đốn bệnh trong y tế,„

TÀI LIỆU THAM KHẢO

Nguyễn Quang Dong (2009). Xếp hạng tín dụng các ngân hàng, các tổ chức tài chính Việt Nam bằng phương pháp phân tích khác biệt. Đề tài khoa học cấp bộ.

Đặng Huy Ngân (2015). Sử dụng kết hợp phân tích nhân tố và hồi qui Logistic để phân loại các ngân hàng thương mại cổ phần Việt Nam. Kỷ yếu hội thảo khoa học quốc gia “An ninh tài chính tiền tệ của Việt Nam trong bối cảnh hội nhập quốc tế” T7-2015.

Đặng Huy Ngân (2016). Xây dựng mơ hình cảnh báo nguy cơ vỡ nợ cho các ngân hàng thương mại cổ phần Việt Nam. Tạp chí Kinh tế & Phát triển. Số đặc biệt, tr. 82-90.

Đặng Huy Ngân (2018). Xây dựng mơ hình cảnh báo nguy cơ vỡ nợ cho các ngân hàng thương mại cổ phần Việt Nam. Luận án tiến sĩ Kinh tế học. Lê Thanh Ngọc, Đặng Trí Dũng và Lê Nguyễn Minh

Phương (2015). Mối quan hệ giữa tỉ lệ vốn tự cĩ và rủi ro của ngân hàng thương mại. Tạp chí Phát triển & Hội nhập, 15(35): 54-61.

Nguyễn Nhật Quang (2012). Trí tuệ nhân tạo nâng cao. Viện Cơng nghệ thơng tin và Truyền thơng, Đại học Bách Khoa Hà Nội.

Võ Văn Tài, Đổng Yến Nghi (2016). Bài tốn phân loại và ứng dụng trong y học. Tạp chí Khoa học, Đại học Cần Thơ, 42: 127-133.

Altman, Edward I. (1968). Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy. Journal of Finance, 23: 589-609.

Barbro Back, Teija Laitinen, Kaisa Sere, Michiel van Wezel (1996). Choosing bankruptcy predictors using discriminant analysis, logit analysis and genetic algorithms. Turku Centre for Computer Science Technical Report No 40, September 1996.

LeCun, Y. (1986). Learning Process in an Asymmetric Threshold Network. Disordered systems and biological and organizations, LesHouches, France, Springer.

Nguyen Hoang Huy (2013). Multi-step linear discriminant Analysis and its applications. Ph.D. thesis. Greifswald University, p. 7.

Hastie, T. và Tibshirani, R., Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer Series in Statistics. Springer Verlag.

Jae H. Min, Young-ChanLee (2005). Bankruptcy prediction using support vector machine with optimal choice of Kernel function parameters. Expert Systems with Applications, 28: 603-614. M.Adnan Aziz, Humayon (2006). Predicting corporate

bankruptcy: where we stand? Corporate governance: The international journal of business in society, 6(1): 18-33.

Soo Y Kim (2011). Prediction of hotel bankruptcy using support vector machine, artificial neural network, logistic regression, and multivariate discriminant analysis. The Service Industries Journal, 31(3): 441-468.

Sergio Bacallado (2017). Data Mining and Analysis. Stanford University. stats202/content/lectures.html/lec9.pdf. Truy cập ngày 9/1/2018.

Valadimir Vapnik (1995). The nature of statistical learning theory. Springer-Verlag.

</div>

×