Tải bản đầy đủ (.pdf) (68 trang)

Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.97 MB, 68 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ

PHẠM VĂN THÙY

KHAI THÁC VÀ PHÂN TÍCH DỮ LIỆU NGÂN HÀNG
NHẰM PHÁT HIỆN RỦI RO VÀ HỖ TRỢ RA QUYẾT ĐỊNH
TRONG QUẢN TRỊ

Ngành: Công nghệ thông tin
Chuyên ngành: Kỹ thuật phần mềm
Mã số: 60480103

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

HÀ NỘI - 2014


d

ĐẠI HỌC QUỐC GIA HÀ NỘI

LỜI
ĐOAN
TRƯỜNG
ĐẠICAM
HỌC CƠNG
NGHỆ
Tơi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá
nhân tôi, không sao chép lại của người khác. Trong toàn bộ nội dung của luận văn,
những điều đã trình bày là của cá nhân tơi hoặc được tôi tổng hợp từ nhiều nguồn tài


liệu. Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được trích dẫn hợp
pháp.
PHẠM VĂN THÙY
Tơi xin chịu tồn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định
cho lời cam đoan của tôi.

Nội, tháng
năm 2014
KHAI THÁC VÀ PHÂNHàTÍCH
DỮ 5LIỆU
NGÂN HÀNG
NHẰM PHÁT HIỆN RỦI RO VÀ HỖ TRỢ RA QUYẾT ĐỊNH
TRONG QUẢN TRỊ

Ngành: Công nghệ thông tin
Chuyên ngành: Kỹ thuật phần mềm
Mã số: 60480103

LUẬN VĂN THẠC SỸ CÔNG NGHỆ THÔNG TIN

NGƯỜI HƯỚNG DẪN KHOA HỌC: TS. PHAN XUÂN HIẾU

HÀ NỘI - 2014


LỜI CAM ĐOAN
Tôi xin cam đoan kết quả đạt được trong luận văn là sản phẩm của riêng cá
nhân tôi, khơng sao chép lại của người khác. Trong tồn bộ nội dung của luận văn,
những điều đã trình bày là của cá nhân tôi hoặc được tôi tổng hợp từ nhiều nguồn tài
liệu. Tất cả các nguồn tài liệu tham khảo có xuất xứ rõ ràng và được trích dẫn hợp

pháp.
Tơi xin chịu tồn bộ trách nhiệm và chịu mọi hình thức kỷ luật theo quy định
cho lời cam đoan của tôi.

Hà Nội, tháng 6 năm 2014


LỜI CẢM ƠN
Lời đầu tiên cho phép tôi được bày tỏ lòng biết ơn sâu sắc và cảm ơn chân
thành tới TS. Phan Xuân Hiếu- Trường Đại học Công nghệ - Đại học Quốc gia Hà
Nội - đã dành rất nhiều thời gian q báu để tận tình hướng dẫn, dìu dắt, chỉ bảo và
định hướng cho tơi trong suốt thời gian hồn thành luận văn.
Tơi xin bày tỏ lịng biết ơn tới các thầy cô giáo Khoa Công nghệ Thông tin Trường Đại học Công nghệ - Đại học Quốc gia Hà Nội đã truyền đạt những kiến thức,
kinh nghiệm quý báu trong suốt thời gian tôi học tập tại trường. Tôi xin gửi lời cảm ơn
sâu sắc tới Ban Giám đốc và các đồng nghiệp Trung tâm công nghệ ngân hàng quốc tế
Việt Nam (VIB) đã hết sức tạo điều kiện thuận lợi cho tôi trong suốt quá trình học tập
và thực hiện luận văn.
Tơi xin chân thành cảm ơn bạn bè và gia đình, những người thân ln ở bên
khuyến khích, động viên và ủng hộ tơi trong q trình học tập và hồn thành luận văn.
Do thời gian và trình độ có hạn nên luận văn này khơng thể tránh khỏi những
thiếu sót. Rất mong nhận được sự đóng góp ý kiến của các thầy cơ giáo, đồng nghiệp,
bạn bè, các quý vị quan tâm này để luận văn được hoàn thiện hơn.
Trân trọng cảm ơn!

Hà Nội, tháng 6 năm 2014
Phạm Văn Thùy


NỘI DUNG
BẢNG TỪ VIẾT TẮT .......................................................................................... 3

DANH MỤC HÌNH MINH HỌA ........................................................................4
DANH MỤC BẢNG BIỂU ...................................................................................5
MỞ ĐẦU ................................................................................................................6
CHƯƠNG 1: RỦI RO TÍN DỤNG VÀ MƠ HÌNH QUẢN LÝ RỦI RO TÍN
DỤNG TẠI NGÂN HÀNG ...................................................................................8
1.

Hoạt động tín dụng ........................................................................................ 8

2.

Phân loại tín dụng ngân hàng .......................................................................9

3.

Rủi ro ngân hàng và rủi ro tín dụng ............................................................ 9

4.

3.1

Rủi ro trong hoạt động ngân hàng: .......................................................... 9

3.2

Rủi ro tín dụng ....................................................................................... 10

3.3

Ảnh hưởng của rủi ro tín dụng .............................................................. 11


Hiện trạng tại VIB và yêu cầu về quản trị rủi ro .....................................12

CHƯƠNG 2: KHAI PHÁ DỮ LIỆU TRONG HỆ THỐNG THÔNG TIN
NGÂN HÀNG ......................................................................................................14
1.

2.

Khái niệm về khai phá dữ liệu....................................................................14
1.1

Tại sao lại khai phá dữ liệu....................................................................14

1.2

Định nghĩa khai phá dữ liệu ..................................................................14

1.3

Các bước chính trong khai phá dữ liệu..................................................15

1.4

Các phương pháp khai thác dữ liệu ....................................................... 17

Ứng dụng khai phá dữ liệu trong ngành tài chính ngân hàng ................18
2.1

Quản trị rủi ro ........................................................................................ 20


2.2

Phát hiện gian lận ..................................................................................22

2.3

Quản lý danh mục vốn đầu tư................................................................ 22

2.4

Ứng dụng trong kinh doanh ...................................................................23

2.5

Marketing và chăm sóc khách hàng ...................................................... 25

CHƯƠNG 3: BÀI TOÁN PHÂN LỚP DỰ BÁO RỦI RO TÍN DỤNG ........27
1.

Phát biểu bài tốn ........................................................................................ 28

2.

Mơ hình phân lớp dự báo rủi ro.................................................................29

3.

Phân lớp sử dụng cây quyết định ............................................................... 31
1



4.

3.1

Cây quyết định ....................................................................................... 31

3.2

Ưu nhược điểm của cây quyết định ....................................................... 31

3.3

Quá trình xây dựng cây quyết định ....................................................... 33

3.4

Thuật toán cây quyết định .....................................................................33

3.5

Thuật toán C4.5 ..................................................................................... 35

3.6

Chọn thuộc tính tốt nhất ........................................................................36

3.7


Chuyển cây quyết định sang dạng luật dễ hiểu .....................................38

Phân lớp SVM – Support Vector Machine ...............................................39
4.1

Phân lớp SVM tuyến tính ......................................................................41

4.2

Phân lớp SVM phi tuyến .......................................................................42

4.3

Phân đa lớp trong SVM .........................................................................44

CHƯƠNG 4: ỨNG DỤNG KHAI PHÁ DỮ LIỆU PHÁT HIỆN RỦI RO
TÍN DỤNG TẠI VIB .......................................................................................... 46
1.

2.

3.

4.

Hiện trạng tại VIB ....................................................................................... 46
1.1

Hệ thống xếp hạng tín dụng CRS .......................................................... 46


1.2

Kho dữ liệu KM ..................................................................................... 47

Tích hợp dữ liệu vào kho dữ liệu ............................................................... 49
2.1

Thiết kế lược đồ dữ liệu.........................................................................49

2.2

Load dữ liệu vào kho dữ liệu .................................................................50

Phân lớp và dự báo rủi ro từ kho dữ liệu VIB ..........................................51
3.1

Tiền xử lý dữ liệu ..................................................................................53

3.2

Phân lớp sử dụng cây quyết định áp dụng thuật toán C4.5 ...................54

3.3

Phân lớp sử dụng thuật tốn SVM ........................................................ 57

Đánh giá mơ hình......................................................................................... 59

CHƯƠNG 5: KẾT LUẬN ..................................................................................62
1.


Luận văn đã đạt được những kết quả sau .................................................62

2.

Hướng tiếp cận trong tương lai ..................................................................62

TÀI LIỆU THAM KHẢO ..................................................................................63

2


BẢNG TỪ VIẾT TẮT
KPDL

Khai phá dữ liệu

XHTD

Xếp hạng tín dụng

SVM

Support Vector Machine

CSDL

Cơ sở dữ liệu

CRS


Credit Rating System

KDD

Knowledge Discovery and Data Mining

DW

Data Warehouse

3


DANH MỤC HÌNH MINH HỌA
Hình 1: Các bước khai phá dữ liệu .......................................................................15
Hình 2: Các thành phần trong hệ thống Data mining ...........................................16
Hình 3: Khai phá dữ liệu tìm kiếm tri thức từ lượng dữ liệu khổng lồ ................19
Hình 4: Ứng dụng data mining trong ngân hàng ..................................................20
Hình 5: Mơ hình phân lớp dự báo rủi ro ............................................................... 29
Hình 6: Quy trình phân lớp ...................................................................................30
Hình 7: Ví dụ cây quyết định ................................................................................31
Hình 8: Sự phục thuộc của Entropy ......................................................................37
Hình 9: Siêu phẳng phân tách ...............................................................................40
Hình 10: Khoảng cách từ siêu phẳng đến điểm gần siêu phẳng nhất ...................40
Hình 11: Tập dữ liệu có thể tách tuyến tính ......................................................... 41
Hình 12: Chuyển đổi khơng gian bằng hàm nhân ................................................43
Hình 13:Phân đa lớp SVM .................................................................................... 44
Hình 14: Quy trình nhập liệu và chấm điểm XHTD ............................................47
Hình 15: Kiến trúc DataWarehouse tại VIB ......................................................... 48

Hình 16: Lược đồ data mart của các khoản vay ...................................................50
Hình 17: Ánh xạ dữ liệu dimension CL_STATUS với dữ liệu nguồn .................50
Hình 18: Ánh xạ fact table LOAN với dữ liệu nguồn ..........................................51
Hình 19: Tập dữ liệu mẫu ..................................................................................... 53
Hình 20: Một số chỉ số về dữ liệu trên thuộc tính ................................................54
Hình 21: Tỷ lệ giữa các mẫu trong các lớp dữ liệu ..............................................54
Hình 22: Chọn thuật tốn C4.5 .............................................................................55
Hình 23: Mơ hình xây dựng bằng C4.5 ................................................................ 56
Hình 24: Chuyển đổi dữ liệu từ Nominal sang Binary .........................................58
Hình 25: Minh họa kết quả mơ hình SVM trên Weka ..........................................59

4


DANH MỤC BẢNG BIỂU
Bảng 1: Các trường thông tin khách hàng ............................................................ 52
Bảng 2: Bảng kết quả xây dựng mô hình cây quyết định C4.5 ............................ 56
Bảng 3: Kết quả phân lớp C4.5 trên tập mẫu........................................................ 56
Bảng 4: Bảng kết quả xây dựng mơ hình phân lớp SVM .....................................58
Bảng 5: Ma trận kết quả phân lớp SVM với tập training .....................................59
Bảng 6: Đánh giá mơ hình phân lớp .....................................................................59
Bảng 7: Các chỉ số đánh giá bằng phân lớp C4.5 .................................................60
Bảng 8: Các chỉ số đánh giá của mơ hình phân lớp SVM ....................................61

5


MỞ ĐẦU
Ngày nay với sự phát triển mạnh mẽ của cơng nghệ thơng tin, cùng với đó là các
cơng cụ hỗ trợ cho việc tích lũy thơng tin cũng trở lên mạnh mẽ và tiện lợi, tạo điều

kiện cho các doanh nghiệp, tổ chức thu thập và sở hữu lượng thơng tin khổng lồ từ
những dữ liệu có cấu trúc đến phi cấu trúc. Hàng triệu cơ sở dữ liệu đã được dùng
trong quản trị kinh doanh, quản lý chính phủ, quản lý dữ liệu khoa học và nhiều ứng
dụng khác. Sự phong phú về dữ liệu, thông tin và sự khai thác kịp thời các dữ liệu đó
đã đem lại hiệu quả và hiệu suất trong công tác quản lý hoạt động kinh doanh của
doanh nghiệp. Nhưng các yêu cầu về khai thác thơng tin càng địi hỏi cao, người sử
dụng thông tin không những chỉ cần sử dụng dữ liệu mà còn cần thêm nhiều tri thức, ý
nghĩa tiềm ẩn trong những dữ liệu và thơng tin đó để hỗ trợ cho việc ra quyết định
trong chiến lược kinh doanh…. Cho đến những năm 90 của thế kỷ trước nhu cầu khai
phá dữ liệu mới thực sự bùng nổ, theo đó hàng loạt các lĩnh vực về tổ chức kho dữ
liệu, các hệ hỗ trợ ra quyết định, doanh nghiệp thơng minh, các thuật tốn, phân loại,
phân lớp … mở ra một hướng phát triển mới cho việc tổ chức và khai thác dữ liệu
KPDL bao hàm rất nhiều hướng tiếp cận. Các lĩnh vực chính được áp dụng trong
lĩnh vực này chủ yếu thừa kế từ lĩnh vực CSDL, học máy (machine leaning), trí tuệ
nhân tạo, lý thuyết thơng tin, xác suất thống kê. Các bài tốn chủ yếu trong khai phá
dữ liệu là phân lớp/ dự đoán, phân cụm (clustering), khai phá luật kết hợp …. Lĩnh vực
này cũng là điểm giao thoa của nhiều lĩnh vực khác. KPDL đã và đang áp dụng thành
công vào thị trường tài chính ngân hàng, chứng khốn, sinh học, y tế, giáo dục, viễn
thông.v.v
Trong môi trường hoạt động nhiều thử thách, các ngân hàng phải gánh chịu rủi ro
đáng kể để kiếm lợi nhuận. Chính vì thế mà đo lường, dự đoán, đánh giá và quản trị
rủi ro là một khía cạnh quan trọng của ngân hàng. Hoạt động tín dụng là hoạt động
chính mang lại nguồn thu chủ yếu cho ngân hàng nhưng cũng là hoạt động tiềm ẩn
nhiều rủi ro.Rủi ro tín dụng được cho là rủi ro lớn nhất đối với các ngân hàng thương
mại Việt Nam, bởi tổn thất từ rủi ro không chỉ ảnh hưởng đến sự an tồn, hiệu quả, uy
tín của ngân hàng mà còn ảnh hưởng đến sự ổn định của hệ thống ngân hàng và nền
kinh tế của đất nước.
Nhận thấy rủi ro có thể dự báo bằng cách áp dụng cơng nghệ thơng tin vào
việckhai thác và phân tích dữ liệu từ kho dữ liệu đã có, tơi đã chọn hướng nghiên cứu
Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định

trong quản trị cho đề tài luận văn của mình. Luận văn xây dựng trên lý thuyết KPDL
đã được các nhà khoa học nghiên cứu đồng thời tôi cũng xin trình bày quan điểm của
6


mình về việc áp dụng trong việc khai thác và phân tích dữ liệu tại ngân hàng quốc tế
Việt Nam nhằm phát hiện rủi ro để hỗ trợ các nhà quản trị ra quyết định

Luận văn được tổ chức thành 5 chương gồm:
Chương 1: Trình bày thế nào là hoạt động tín dụng trong ngân hàng, tầm quan
trọng của hoạt động tín dụng trong ngân hàng nói riêng và hệ thống ngân hàng nói
chung. Đưa ra các loại rủi ro trong hoạt động tín dụng và tầm quan trọng của việc quản
trị rủi ro tín dụng trong ngành ngân hàng. Chính vì tầm quan trọng của việc dự báo
đánh giá rủi ro đó mà ngân hàng VIB cũng khơng ngoại lệ, VIB đã có những biện
pháp và cơng cụ để đánh giá rủi ro tín dụng. Tuy nhiên điều đó là chưa đủ bởi các
cơng cụ hiện tại vẫn cịn phụ thuộc vào kinh nghiệm của cán bộ tín dụng. Chính vì thế
u cầu áp dụng cơng nghệ kỹ thuật để xây dựng một mơ hình dự báo rủi ro là cần
thiết
Chương 2: Trình bày tổng quan thế nào là khai phá dữ liệu, các bước trong quy
trình khai phá dữ liệu và các phương pháp khai phá dữ liệu. Ứng dụng của khai phá dữ
liệu trong ngành ngân hàng như áp dụng khai phá trong quản trị rủi ro, quản lý danh
mục, hỗ trợ dự báo kinh doanh, ứng dụng trong marketing chăm sóc khách hàng
Chương 3: Trình bày bài toán phân lớp dự báo rủi ro trong ngân hàng, cách tiếp
cận hiện tại, ưu nhược điểm của các tiếp cận hiện tại. Đưa ra bài toán phân lớp dự báo
rủi ro bằng kỹ thuật khai phá dữ liệu để hỗ trợ khắc phục những hạn chế từ cách tiếp
cận hiện tại. Từ đó luận văn đi sâu tìm hiểu 2 thuật toán phân lớp dự báo trong khai
phá dữ liệu là thuật toán phân lớp sử dụng cây quyết định C4.5 và thuật toán phân lớp
sử dụng SVM
Chương 4: Tìm hiểu hiện trạng của hệ thống dữ liệu hiện tại tại VIB và thực
nghiệm mơ hình phân lớp dự báo rủi ro trên bộ dữ liệu tại VIB. Đánh giá kết quả đạt

được qua các thông số đánh giá từ 2 mơ hình phân lớp
Chương 5: Tóm tắt lại những gì đã được thực hiện trong luận văn, những gì cịn
tồn tại. Đưa ra hướng tiếp cận trong tương lai

7


CHƯƠNG 1: RỦI RO TÍN DỤNG VÀ MƠ HÌNH QUẢN LÝ RỦI RO
TÍN DỤNG TẠI NGÂN HÀNG
Trong mơi trường hoạt động nhiều thử thách, các ngân hàng phải gánh chịu rủi ro
đáng kể để kiếm lợi nhuận. Chính vì thế mà đo lường, dự đoán, đánh giá và quản trị
rủi ro là một khía cạnh quan trọng của ngân hàng. Hoạt động tín dụng là hoạt động
chính mang lại nguồn thu chủ yếu cho ngân hàng nhưng cũng là hoạt động tiềm ẩn
nhiều rủi ro. Rủi ro tín dụng được cho là rủi ro lớn nhất đối với các ngân hàng thương
mại Việt Nam, bởi tổn thất từ rủi ro khơng chỉ ảnh hưởng đến sự an tồn, hiệu quả, uy
tín của ngân hàng mà cịn ảnh hưởng đến sự ổn định của hệ thống ngân hàng và nền
kinh tế của đất nước.

1. Hoạt động tín dụng
Tín dụng là một phạm trù kinh tế khách quan nhằm phản ánh mối quan hệ giao
dịch giữa hai chủ thể, trong đó bên chủ thể sở hữu giao một lượng giá trị bằng tiền
hoặc tài sản cho bên kia sử dụng và chủ thể sử dụng có nhiệm vụ hồn trả với một
lượng giá trị lớn hơn lượng giá trị ban đầu sau một thời gian được xác định.
Tín dụng ngân hàng là một giao dịch vay mượn tài sản giữa ngân hàng (bên
cho vay) và khách hàng (bên đi vay), trong đó bên đi vay được sử dụng tài sản của bên
cho vay trong một khoảng thời gian được thỏa thuận trước và phải hồn trả vơ điều
kiện vốn gốc và lãi cho bên cho vay khi đến hạn thanh tốn. Nói một cách khác, tín
dụng ngân hàng là quan hệ chuyển nhượng quyền sử dụng vốn giữa ngân hàng và
khách hàng trong một thời hạn nhất định với một khoản chi phí nhất định.
Bản chất của tín dụng là một giao dịch về tài sản trên cơ sở hoàn trả và có các

đặc trưng sau:
- Tài sản giao dịch trong quan hệ tín dụng ngân hàng bao gồm hai hình thức là
cho vay (bằng tiền) và cho thuê (bất động sản và động sản).
- Xuất phát từ nguyên tắc hoàn trả, vì vậy người cho vay khi chuyển giao tài sản
cho người đi vay sử dụng phải có cơ sở để tin rằng người đi vay sẽ trả đúng hạn.
- Giá trị hồn trả thơng thường phải lớn hơn giá trị lúc cho vay, hay nói cách
khác là người đi vay phải trả thêm phần lãi ngoài vốn gốc.
- Trong quan hệ tín dụng ngân hàng, tiền vay được cấp trên cơ sở bên đi vay
cam kết hồn trả vơ điều kiện cho bên cho vay khi đến hạn thanh toán.

8


Vai trị của tín dụng: góp phần phát triển kinh tế; góp phần ổn định tiền tệ và ổn
định giá cả; mở rộng và phát triển các mối quan hệ kinh tế đối ngoại và mở rộng giao
lưu quốc tế.
Chức năng của tín dụng: tập trung và phân phối lại tài ngun theo ngun tắc
có hồn trả; tiết kiệm tiền mặt và chi phí lưu thơng; phản ánh và kiểm sốt các

2. Phân loại tín dụng ngân hàng
Việc phân loại tín dụng dựa trên một số tiêu thức nhất định tùy theo yêu cầu của
khách hàng và mục tiêu quản lý của ngân hàng. Có thể phân loại tín dụng trong ngân
hàng theo nhiều cách như căn cứ vào thời hạn tín dụng, phân loại căn cứ theo hình
thức tín dụng…Tuy nhiên do khuôn khổ luận văn tập trung vào phần dự báo rủi ro tín
dụng nên luận văn chỉ dưa ra cách phân loại tín dụng dựa vào rủi ro, cách phân loại
này giúp ngân hàng thường xuyên đánh giá lại tính an tồn của các khoản tín dụng,
trích lập dự phòng tổn thất kịp thời, được phân loại thành 5 nhóm theo quyết định
493/2005/QĐ-NHNN ngày 22/04/2005 của Thống đốc Ngân hàng Nhà nước:
+ Nhóm 1: nợ đủ tiêu chuẩn, bao gồm nợ trong hạn được đánh giá có khả năng
thu hồi đủ gốc và lãi đúng hạn và các khoản nợ có thể phát sinh trong tương lai như

các khoản bảo lãnh, cam kết cho vay, chấp nhận thanh tốn.
+Nhóm 2: nợ cần chú ý, bao gồm nợ quá hạn dưới 90 ngày và nợ cơ cấu lại thời
hạn trả nợ.
+Nhóm 3: nợ dưới tiêu chuẩn, bao gồm nợ quá hạn từ 90 ngày đến 180 ngày và
nợ cơ cấu lại thời hạn trả nợ quá hạn dưới 90 ngày.
+Nhóm 4: nợ nghi ngờ, bao gồm nợ quá hạn từ 181 ngày đến 360 ngày và nợ cơ
cấu lại thời hạn trả nợ quá hạn từ 90 ngày đến 180 ngày
+Nhóm 5: nợ có khả năng mất vốn, gồm nợ quá hạn trên 360 ngày, nợ cơ cấu lại
thời hạn trả nợ trên 180 ngày và nợ khoanh chờ Chính phủ xử lý.

3. Rủi ro ngân hàng và rủi ro tín dụng
3.1 Rủi ro trong hoạt động ngân hàng:
Rủi ro trong hoạt động ngân hàng là những biến cố không mong đợi khi xảy ra
dẫn đến sự tổn thất về tài sản hoặc uy tín của ngân hàng. Các ngân hàng thường chịu
nhiều loại rủi ro khác nhau. Trong quản trị ngân hàng hiện đại thì các ngân hàng xếp
các loại rủi ro thành các nhóm chính để xây dựng bộ máy quản trị:
9


- Rủi ro chiến lược là rủi ro phát sinh do việc hoạch định chiến lược kinh doanh
vượt quá các nguồn lực có thể thực hiện hoặc quá thận trọng nên không sử dụng hiệu
quả các nguồn lực của ngân hàng.
- Rủi ro tín dụng là rủi ro phát sinh liên quan đến hoạt động cấp tín dụng cho
khách hàng mà vì lý do nội bộ hay ngoại cảnh mà khách hàng mất khả năng thanh tốn
một phần hoặc tồn bộ nghĩa vụ thanh tốn hoặc thanh tốn khơng đúng hạn được quy
định tại hợp đồng.
- Rủi ro thị trường là rủi ro phát sinh do những thay đổi bất thường về giá như
lãi suất, tỷ giá hối đoái, giá chứng khoán và giá các tài sản khác do Ngân hàng nắm giữ
trong quá trình hoạt động kinh doanh hoặc theo các giao dịch bảo đảm hoặc các giao
dịch có tài sản bảo đảm tương tự khác;

- Rủi ro lãi suất là rủi ro từ việc có những thay đổi bất lợi lên lợi nhuận kỳ vọng
từ lãi trong các năm hoạt động hiện tại và tương lai gây ra bởi sự thay đổi về lãi suất
và sự chênh lệch giữa tài sản và nguồn vốn của ngân hàng. - Rủi ro thanh khoản là rủi
ro luồng tiền ra khỏi ngân hàng bất thường, hoặc phát sinh do chênh lệch kỳ hạn giữa
tài sản có và nợ, hoặc khơng kịp hoặc khơng thể chuyển hóa tài sản thành tiền để đáp
ứng kịp thời các nhu cầu chi trả; là tình trạng ngân hàng không đáp ứng được nhu cầu
sử dụng vốn khả dụng, có thể gây thua lỗ, làm đình trệ hoạt động kinh doanh hoặc làm
mất khả năng thanh toán dẫn đến phá sản.
- Rủi ro hoạt động là rủi ro dẫn đến tổn thất do nguyên nhân con người, những
thiếu sót hoặc vận hành khơng tốt quy trình, hệ thống nội bộ hoặc do các sự kiện
khách quan bên ngồi. Cấu thành rủi ro hoạt động gồm có: gian lận nội bộ; gian lận từ
bên ngoài; nội quy và an toàn nơi làm việc; khách hàng, sản phẩm và thông lệ kinh
doanh; thiệt hại về vật chất; gián đoạn kinh doanh và các sự cố hệ thống; thực hiện,
chuyển giao và quản lý quy trình. Rủi ro tín dụng được coi là rủi ro lớn nhất đối với
các Ngân hàng thương mại Việt Nam nói chung bới các hoạt động tín dụng là hoạt
động chủ yếu của các Ngân hàng thương mại Việt Nam.
3.2 Rủi ro tín dụng
Rủi ro trong ngân hàng có xu hướng tập trung chủ yếu vào hoạt động tín dụng.
Đây là rủi ro lớn nhất và thường xuyên xảy ra, có thể khiến ngân hàng rơi vào trạng
thái tài chính khó khăn nghiêm trọng. “Rủi ro tín dụng trong hoạt động ngân hàng của
tổ chức tín dụng là khả năng xảy ra tổn thất trong hoạt động ngân hàng của tổ chức tín
dụng do khách hàng khơng thực hiện hoặc khơng có khả năng thực hiện nghĩa vụ của
mình theo cam kết.” - theo Quyết định số 493/2005/QĐ-NHNN ngày 22/4/2005 của
Thống đốc Ngân hàng Nhà nước Việt Nam;
10


Rủi ro tín dụng là loại rủi ro phát sinh trong q trình cấp tín dụng của ngân
hàng, biểu hiện trên thực tế qua việc khách hàng không trả được nợ hoặc trả nợ không
đúng hạn cho ngân hàng.

Rủi ro tín dụng là khả năng tiềm ẩn có thể gây tổn thất về vốn và thu nhập cho
Ngân hàng phát sinh khi đối tác không đáp ứng được một phần hoặc tồn bộ các điều
khoản của Hợp đồng tín dụng hay không thực hiện đầy đủ như đã thỏa thuận theo các
điều khoản của Hợp đồng tín dụng;
Rủi ro tín dụng xuất hiện trong quá trình cho vay, chiết khấu giấy tờ có giá, cho
th tài chính, bảo lãnh ngân hàng, bao thanh tốn và các hình thức cấp tín dụng khác
của ngân hàng.
Các nguyên nhân chủ yếu dẫn đến rủi ro tín dụng
Trong quan hệ tín dụng có hai đối tượng tham gia là ngân hàng cho vay và người
đi vay. Ngân hàng và người đi vay hoạt động tuân theo sự chi phối với những điều
kiện cụ thể của môi trường kinh doanh. Môi trường kinh doanhlà đối tượng thứ ba có
mặt trong quan hệ tín dụng. Rủi ro tín dụng xuất phát từ mơi trường kinh doanh gọi là
rủi ro do nguyên nhân khách quan. Rủi ro xuất phát từ người vay và ngân hàng cho
vay gọi là rủi ro do nguyên nhân chủ quan. Sự tiếp cận các yếu tố, nguyên nhân gây
rủi ro sau đây giúp chúng ta nhìn nhận một cách đầy đủ, tồn diện, khách quan hơn, từ
đó sẽ đưa ra được những đề xuất phòng ngừa, giảm thiểu rủi ro trong kinh doanh của
NHTM một cách hữu ích, thiết thực hơn.
3.3 Ảnh hưởng của rủi ro tín dụng
- Đối với nền kinh tế: Hoạt động ngân hàng liên quan đến hoạt động của các
doanh nghiệp và các cá nhân. Ngân hàng gặp khó khăn sẽ ảnh hưởng đến nguồn vốn
phục vụ cho hoạt động kinh doanh của các doanh nghiệp, doanh nghiệp thiếu vốn sẽ
gặp khó khăn để sản xuất kinh doanh dẫn đến đời sống cơng nhân gặp khó khăn. Sự
khủng hoảng từ hệ thống ngân hàng ảnh hưởng rất lớn đến tồn bộ nền kinh tế. Nó làm
cho nền kinh tế bị suy thoái, giá cả tăng, sức mua giảm, thất nghiệp tăng, xã hội mất
ổn định.Mặt khác, mối liên hệ về tiền tệ, đầu tư giữa các nước phát triển rất nhanh nên
tác động do khủng hoảng rủi ro tín dụng tại một nước cũng ảnh hưởng trực tiếp đến
nền kinh tế các nước có liên quan. Ngày nay nền kinh tế mỗi quốc gia đều phụ thuộc
vào nền kinh tế khu vực và thế giới, do đó hệ thống ngân hàng của một quốc gia gặp
khó khăn cũng ảnh hưởng đến nền kinh tế thế giới.
- Đối với ngân hàng: Khi gặp rủi ro tín dụng, ngân hàng khơng thu được vốn tín

dụng đã cấp và lãi cho vay, nhưng ngân hàng phải trả vốn và lãi cho khoản tiền huy
11


động khi đến hạn, điều này làm cho ngân hàng mất cân đối trong việc thu chi và sút
giảm hiệu quả kinh doanh. Khi gặp phải rủi ro tín dụng cao ngân hàng thường rơi vào
tình trạng mất khả năng thanh khoản, làm mất lòng tin người gửi tiền, ảnh hưởng đến
uy tín của ngân hàng, và có thể bị Ngân hàng Nhà nước đưa vào kiểm soát đặc biệt
hoặc bị phá sản, sát nhập. Đối với cán bộ nhân viên, do ngân hàng gặp khó khăn trong
kinh doanh nên chế độ phúc lợi, thu nhập sẽ bị hạn vì thế những người có năng lực sẽ
thun chuyển cơng tác, càng gây khó khăn cho ngân hàng.
Tóm lại, rủi ro tín dụng có thể gây những hậu quả: nhẹ nhất là ngân hàng bị giảm
lợi nhuận khi không thu hồi được lãi cho vay, nặng nhất khi ngân hàng không thu được
vốn và lãi, nợ thất thu với tỷ lệ cao dẫn đến ngân hàng bị lỗ và mất vốn, có thể bị phá
sản, gây hậu quả nghiêm trọng cho nền kinh tế nói chung và hệ thống ngân hàng nói
riêng. Chính vì vậy pháp luật địi hỏi các nhà quản trị ngân hàng buộc phải xây dựng
hệ thống quản lý tín dụng thích hợp nhằm giảm thiểu rủi ro trong hoạt động tín dụng.

4. Hiện trạng tại VIB và yêu cầu về quản trị rủi ro
Đặc điểm chung của các ngân hàng thương mại Việt Nam hiện nay là danh mục
tín dụng vẫn chiếm phần lớn trong tổng tài sản (từ 60% đến 70% tổng tài sản của ngân
hàng). Do vậy, việc thu thập thông tin về khách hàng vay để đánh giá khả năng thu hồi
vốn, dự báo rủi ro là nhu cầu cần thiết của các ngân hàng nói chung và VIB nói riêng.
Chính vì sự quan trọng đó VIB đã đầu tư xây dựng hệ thống xếp hạng tín dụng (CRS)
với mục đích đánh giá về rủi ro tín dụng của ngân hàng, rủi ro do khách hàng khơng có
khả năng hồn trả vốn vay hoặc rủi ro do ngân hàng phải thực hiện thay các nghĩa vụ
cam kết bảo lãnh cho khách hàng với một bên thứ ba.
Theo thơng lệ, hệ thống xếp hạng tín dụng nội bộ có thể được sử dụng trong các
quy trình quản lý rủi ro tín dụng sau: Ban hành chính sách tín dụng, Quy trình cho vay,
Giám sát rủi ro danh mục tín dụng, Lập báo cáo quản trị rủi ro, Chính sách dự phịng

rủi ro tín dụng, Xác định mức vốn an tồn tối thiểu, Phân tích hiệu quả sinh lời của
danh mục tín dụng và Xác định khung lãi suất tiêu chuẩn… Tóm lại, hệ thống xếp
hạng tín dụng nội bộ là một cấu phần quan trọng và là một công cụ đắc lực trong quản
trị kinh doanh ngân hàng.
Mặc dù hệ thống xếp hạng tín dụng tại VIB là một công cụ mạnh hỗ trợ cán bộ
quản lý tín dụng cũng như ban điều hành trong việc quản lý vận hành hoạt động tín
dụng tại ngân hàng. Nhưng nó mới chỉ dừng ở mức thu thập thơng tin liên quan về
khách hàng vay vốn và tính điểm và xếp hạng theo một mơ hình xếp hạng sẵn và xếp
hạng khách hàng theo số điểm tính được một cách cứng nhắc. Việc đánh giá kết quả từ
12


hệ thống vẫn dựa vào kinh nghiệm và trình độ đánh giá và phân tích của cán bộ tín
dụng vì vậy trong thực tế có thể khơng sát với thực tế của khách hàng. Ví dụ với các
khách hàng đã được xếp hạng đôi khi được xếp hạng AA, A… (hạng cao nhất trong
thang xếp hạng) thì việc trả nợ lại gặp khó khăn hoặc mặc dù có khách hàng điểm xếp
hạng thấp nhưng lại trả nợ rất đúng hạn. Chính vì vậy việc khai thác triệt để những
thơng tin thu thập được từ khách hàng và dữ liệu thực tế thì hệ thống chưa đáp ứng
được. Chính vì lý do đó mà việc áp dụng khai phá dữ liệu để thu được những thơng tin
hữu ích trong việc quản trị rủi ro và hỗ trợ việc ra quyết định là cần thiết.

13


CHƯƠNG 2: KHAI PHÁ DỮ LIỆU TRONG HỆ THỐNG THÔNG TIN
NGÂN HÀNG
1. Khái niệm về khai phá dữ liệu
1.1 Tại sao lại khai phá dữ liệu
Với sự phát triển của cơng nghệ thơng tin thì khối lượng dữ liệu lưu trữ ngày
càng lớn, và giữa những lượng dữ liệu khổng lồ đó lại ẩn chứa một số thơng tin được

coi là chìa khóa dẫn đến thành cơng của mọi lĩnh vực từ hoạt động sản xuất đến kinh
doanh. Việc khai thác, chiếc lọc thông tin ứng dụng vào cuộc sống của con người
không chỉ dừng lại là một kĩ thuật đơn thuần, nó địi hỏi sự ra đời của ngành khoa học
mới: khoa học về phát hiện tri thức và khai phá dữ liệu (Knowledge Discovery and
Data Mining - KDD).
1.2 Định nghĩa khai phá dữ liệu
Khai phá dữ liệu được dùng để mơ tả q trình phát hiện ra tri thức trong CSDL.
Quá trình này kết xuất ra các tri thức tiềm ẩn từ dữ liệu giúp cho việc dự báo trong
kinh doanh, các hoạt động sản xuất, ... Khai phá dữ liệu làm giảm chi phí về thời gian
so với phương pháp truyền thống trước kia (ví dụ như phương pháp thống kê). Có
nhiều thuật ngữ được dùng tương tự như Datamining như Knowledge Mining (khai
phá tri thức), knowledge extraction (chắt lọc tri thức), data/parttern analysis (phân tích
dữ liệu/mẫu), data archaeology (khảo cổ dữ liệu), data dredging (nạo vét dữ liệu) [7],

Có rất nhiều định nghĩa về khai phá dữ liệu, và chủ yếu là những định nghĩa
mang tính mô tả, dưới đây là một số định nghĩa nhiều tác giả về khai phá dữ liệu.
Định nghĩa của Ferruzza: “Khai phá dữ liệu là tập hợp các phương pháp được
dùng trong tiến trình khám phá tri thức để chỉ ra sự khác biệt các mối quan hệ và các
mẫu chưa biết bên trong dữ liệu”
Định nghĩa của Parsaye: “Khai phá dữ liệu là quá trình trợ giúp quyết định,
trong đó chúng ta tìm kiếm các mẫu thơng tin chưa biết và bất ngờ trong CSDL lớn”
Định nghĩa của Fayyad: “Khai phá tri thức là một q trình khơng tầm thường
nhận ra những mẫu dữ liệu có giá trị, mới, hữu ích, tiềm năng và có thể hiểu được”.

14


1.3 Các bước chính trong khai phá dữ liệu

Hình 1: Các bước khai phá dữ liệu


a. Làm sạch dữ liệu (data cleaning): xử lý dữ liệu không đầy đủ, dữ liệu nhiễu,
dữ liệu khơng nhất qn….
b. Tích hợp dữ liệu (data integration): Hợp nhất dữ liệu từ các nguồn khác nhau
sau khi đã làm sạch dữ liệu thành các kho dữ liệu (data warehouse & data
mart)
c. Trích chọn dữ liệu (data selection) Chỉ lấy những dữ liệu phục vụ việc khai
phá dữ liệu từ các tập dữ liệu lớn (Data warehouse, data repositories) mà
được tổng hợp từ bước trên

15


d. Biến đổi dữ liệu (data transformation): Bước chuẩn hóa làm mịn dữ liệu để
đưa dữ liệu thành dạng có thể phân tích và khai phá được, rút gọn dữ liệu (sử
dụnghàm nhóm, tính tổng, các phương pháp nén dữ liệu, lấy mẫu …), rời rạc
hóa dữ liệu…Sau bước này dữ liệu sẽ nhất quán, đầy đủ, được rút gọn và
được rời rạc hóa để phục vụ khai phá dữ liệu và phân tích
e. Khai phá dữ liệu (data mining): Q trình áp dụng các phương pháp, thuật
tốn thơng minh để trích ra những mẫu (parterns) thơng tin, những mối liên
hệ (relationships) đặc biệt trong dữ liệu. Đây được xem là bước quan trọng và
tốn nhiều công sức trong quá trình khai phá dữ liệu
f. Đánh giá mẫu (partern evalution): Đánh giá mức độ đúng đắn của tri thức mà
các mối quan hệ trong dữ liệu
g. Biểu diễn tri thức (knowledge presentation): thể hiện tri thức thành dạng dễ
hiểu cho người sử dụng như hiển thị trên đồ thị, biểu đồ, màu sắc, giá trị gần
gũi với người sử dụng …
Từ những bước cơ bản trong khai phá dữ liệu, kiến trúc mẫu của một hệ
thống khai phá dữ liệu có thể có những thành phần chính sau:


Hình 2: Các thành phần trong hệ thống Data mining

Trong đó
Database, data warehouse, World Wide Web, và information repositories: Đây
là các nguồn dữ liệu đầu vào cho quá trình khai phá dữ liệu, nguồn dữ liệu sử dụng
16



×