Tải bản đầy đủ (.pdf) (3 trang)

Ứng dụng cây quyết định để dự đoán chỉ số nhóm nợ hỗ trợ quản lý rủi ro tín dụng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (182.04 KB, 3 trang )

Ứng dụng cây quyết định để dự đoán chỉ số
nhóm nợ hỗ trợ quản lý rủi ro tín dụng

Nguyễn Thị Tâm Minh

Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Hệ thống thông tin; Mã số: 60 48 05
Người hướng dẫn: TS. Nguyễn Hà Nam
Năm bảo vệ: 2011

Abstract: Trình bày lý thuyết về tín dụng và rủi ro tín dụng, các mô hình phân tích
đánh giá rủi ro tín dụng. Nghiên cứu cây quyết định và một số thuật toán xây dựng cây
quyết định. Tiến hành ứng dụng cây quyết định để dự đoán chỉ số nhóm nợ hỗ trợ
quản lý rủi ro tín dụng. Đánh giá các kết quả đạt được khi sử dụng cây quyết định
C4.5 trong dự đoán chỉ số nhóm nợ.

Keywords: Công nghệ thông tin; Cây quyết định; Quản lý rủi ro; Tín dụng; Khai phá
dữ liệu; Thuật toán

Content
GIỚI THIỆU BÀI TOÁN
Trong kinh tế thị trường, hệ thống ngân hàng được ví như hệ thần kinh của cả nền
kinh tế. Hệ thống ngân hàng quốc gia hoạt động thông suốt, lành mạnh và hiệu quả là tiền đề
để các nguồn lực tài chính luân chuyển, phân bổ và sử dụng hiệu quả, kích thích tăng trưởng
kinh tế một cách bền vững. Tuy nhiên, trong kinh tế thị trường, thì rủi ro trong kinh doanh là
không thể tránh khỏi, mà đặc biệt là rủi ro trong hoạt động ngân hàng có phản ứng dây truyền,
lây lan và ngày càng có biểu hiện phức tạp. Sự sụp đổ của ngân hàng ảnh hưởng tiêu cực đến
đời sống kinh tế, chính trị, xã hội của một nước và có thể lan rộng sang qui mô quốc tế.
Rủi ro kinh doanh trong ngân hàng có xu hướng tập trung chủ yếu vào danh mục tín
dụng. Khi ngân hàng rơi vào trạng thái tài chính khó khăn nghiêm trọng, thì nguyên nhân
thường phát sinh từ hoạt động tín dụng của ngân hàng. Vì vậy dự đoán chỉ số nhóm nợ để


phát hiện sóm nguy cơ rủi ro là việc làm rất cần thiết và mang tính thực tiễn cao.
Bài toán đặt ra là: đưa bộ dữ liệu đầu vào gồm các thông tin khách hàng vay vốn và 1
thuộc tính phân lớp – thuộc tính chỉ số nhóm nợ, sau đó sử dụng cây quyết định C4.5 để phân
lớp dữ liệu, kết quả thu được là chỉ số nhóm nợ khách hàng.

2
NỘI DUNG LUẬN VĂN
20 năm trở về trước, hầu hết các ngân hàng sử dụng phương pháp truyền thống để
đánh giá rủi ro tín dụng người vay. Phương pháp này vừa mất thời gian, tốn kém, lại mang
tính chủ quan. Ngày nay, một số ngân hàng đã sử dụng mô hình cho điểm để lượng hóa rủi ro
tín dụng người vay. Tuy nhiên cả hai mô hình này đều chỉ biết các khoản vay là rủi ro khi
khách hàng không trả nợ đúng hạn
Để khắc phục, luận văn đã đề xuất phương án ứng dụng cây quyết định để phân lớp
chỉ số nhóm nợ khách hàng, trong đó nhóm nợ 1,2 là nợ tốt, nhóm 3,4,5 là nợ xấu. Nợ xấu là
nhóm nợ mà các chuyên gia ngân hàng quan tâm. Dữ liệu đầu vào đã được xử lý một cách cẩn
thận như rời rạc hóa giá trị số của thuộc tính định mức cho vay và thuộc tính tuổi khách hàng.
Xử lý giá trị thiếu bằng cách lấy giá trị chiếm đa số của thuộc tính đó điền vào giá trị bị thiếu.
Cây kết quả thu được được chuyển sang dạng luật, để thuận tiện cho việc đánh giá và tổng
hợp các mẫu.
Luận văn cũng chỉ ra được đâu là mẫu không có ích và đâu là tri thức mà ngân hàng
đang quan tâm.
KẾT LUẬN
Luận văn đã trình bày về các nội dung: khai phá dữ liệu, các kỹ thuật khai phá dữ liệu,
đặc biệt thuật toán cây quyết định đã được trình bày khá chi tiết, sau đó vận dụng lý thuyết rủi
ro để giải quyết bài toán dự đoán chỉ số nhóm nợ của khách hàng khi biết những thông tin cần
thiết, những thông tin – dữ liệu này đã được xử lý cho phù hợp. Từ đó đánh giá kết quả dự
đoán và đưa ra một số luật mới hỗ trợ chuyên gia ngân hàng quản lý rủi ro tín dụng.
Luận văn cần phải tiếp tục nghiên cứu và tìm hiểu về việc: nghiên cứu để tăng tính
chính xác cho bài toán dự đoán rủi ro, nghiên cứu bài toán dự đoán chỉ số nhóm nợ trên khối
dữ liệu lớn, nghiên cứu các phương pháp khai phá dữ liệu khác từ đó chọn được một mô hình

thích hợp nhất để có thể phát triển và đưa bài toán áp dụng vào thực tế.

References
[1] Jiawei Han and Micheline Kamber, Data Mining: Concepts and Techniques (2001)
[2] Michael J.A. Berry - Gordon S. Linoff, Data Mining Techniques For Marketing, Sales,
and Customer Relationship Management Second Edition, 2009.
[3] Knowledge Discovery in Databases. G.piatetsky - Shapiro and W.J. Frawley. AAAI/MIT
Press, 1991.
[4] Võ Huỳnh Tâm - Trần Ngân Bình, "Giáo trình trí tuệ nhân tạo", chương 9, Nhà xuất bản
Cần Thơ, 2006
[5] TS. Phạm Tiến Thành, Quản lý rủi ro tín dụng dưới góc độ ngân hàng, 2011.
[6] Wikipedia - Bách khoa toàn thư mở - Cây quyết định, 2011.

3
tree
[7] Nguyễn Văn Chức, Cây quyết định với bài toán phân lớp, 2011.

×