Tải bản đầy đủ (.doc) (22 trang)

LUẬT kết hợp TRONG hỗ TRỢ RA QUYẾT ĐỊNH CHO VAY vốn của NGÂN HÀNG

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (428.25 KB, 22 trang )

Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
ĐẠI HỌC QUỐC GIA
TRƯỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN

LUẬT KẾT HỢP TRONG HỖ TRỢ
RA QUYẾT ĐỊNH CHO VAY VỐN CỦA
NGÂN HÀNG
Giảng viên hướng dẫn: PGS. TS ĐỖ PHÚC
Học viên thực hiện:
CH1401031 Nguyễn Hữu Tâm
CH1401036 Nguyễn Xuân Toàn
CH1401015 Ngô Huỳnh Ngọc Phú
Hồ Chí Minh, tháng 07 năm 2015
GVHD: PGS.TS.Đỗ Phúc Trang 1
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
MỤC LỤC
1. Luật kết hợp 7
1.1 Khái niệm về luật và luật kết hợp 7
1.2. Một số nh chất của tập mục phổ biến và luật kết hợp 7
1.2.1. Một số nh chất với tập mục phổ biến: 7
1.2.2. Một số nh chất với luật kết hợp: 8
GVHD: PGS.TS.Đỗ Phúc Trang 2
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
MỞ ĐẦU
Trong thời đại bùng nổ công nghệ thông tin, các công nghệ lưu trữ dữ liệu ngày
càng phát triển tạo điều kiện cho các đơn vị thu thập dữ liệu tốt hơn. Đặc biệt trong
lĩnh vực kinh doanh, các doanh nghiệp đã nhận thức được tầm quan trọng của việc
nắm bắt và xử lý thông tin, nhằm giúp các chủ doanh nghiệp trong việc vạch ra các
chiến lược kinh doanh kịp thời mang lại những lợi nhuận to lớn cho doanh nghiệp của
mình. Tất cả lý do đó khiến cho các cơ quan, đơn vị và các doanh nghiệp đã tạo ra
một lượng dữ liệu khổng lồ cỡ Gigabyte thậm chí là Terabyte cho riêng mình. Các


kho dữ liệu ngày càng lớn và tiềm ẩn nhiều thông tin có ích. Sự bùng nổ đó dẫn tới
một yêu cầu cấp thiết đó là phải có những kỹ thuật và công cụ mới để biến kho dữ liệu
khổng lồ kia thành những thông tin cô đọng và có ích. Dựa trên các thông tin và tri
thức khai phá được, nhà quản lý có thể đưa ra những quyết định nhanh và chính xác
hơn.
Lĩnh vực ngân hàng trong thực tế hiện nay đang đứng trước rất nhiều thách thức
lớn. Quy mô các ngân hàng đa phần là vừa và nhỏ, năng lực cạnh tranh yếu do hạn
chế về nguồn vốn, năng lực huy động vốn, khả năng tiếp cận khách hàng tiềm năng,
năng lực đánh giá khách hàng, khả năng thu hồi nợ vay…. Tình trạng vi phạm các quy
định về tài chính của các ngân hàng đang diễn ra ngày càng nhiều và để lại nhiều hậu
quả nặng nề cho nền kinh tế. Bên cạnh đó, tình trạng sáp nhập ngân hàng cũng đang
diễn ra ngày càng nhiều, gây tâm lý hoang mang trong đại bộ phận khách hàng. Bên
cạnh đó, quy trình đánh giá khách hàng trước cho vay vẫn còn cảm tính và phụ thuộc
nhiều vào các cá nhân mà chưa có một hệ thống chuẩn các cơ sở dữ liệu để có thể
phân tích, đánh giá… dẫn đến nhiều quyết đinh sai lầm, ví dụ như từ chối khách hàng
tốt và chấp nhận cho vay đối với khách hàng xấu.
GVHD: PGS.TS.Đỗ Phúc Trang 3
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
CHƯƠNG I - TỔNG QUAN KHAI PHÁ DỮ LIỆU
HỖ TRỢ RA QUYẾT ĐỊNH
1. Khai phá dữ liệu hỗ trợ ra quyết định
Khai phá dữ liệu (Data Mining) được định nghĩa là: quá trình trích xuất các
thông tin có giá trị tiềm ẩn bên trong lượng lớn dữ liệu được lưu trữ trong các cơ sở
dữ liệu (CSDL), kho dữ liệu Hiện nay, ngoài thuật ngữ khai phá dữ liệu, người ta
còn dùng một số thuật ngữ khác có ý nghĩa tương tự như: Khai phá tri thức từ CSDL
(knowledge mining from databases),trích lọc dữ liệu (knowledge extraction), phân
tích dữ liệu/mẫu (data/pattern analysis), khảo cổ dữ liệu (data archaeology), nạo vét
dữ liệu (data dredging). Nhiều người coi khai phá dữ liệu và một thuật ngữ thông
dụng khác là khám phá tri thức trong CSDL (Knowledge Discovery in Databases –
KDD) là như nhau. Tuy nhiên, trên thực tế, khai phá dữ liệu chỉ là một bước thiết yếu

trong quá trình khám phá tri thức trong CSDL.
Sau đây là một số quan niệm về khai phá dữ liệu (KPDL):
KPDL là tập hợp các thuật toán nhằm chiết xuất những thông tin có ích từ kho
dữ liệu khổng lồ.
KPDL được định nghĩa như một quá trình phát hiện mẫu trong dữ liệu. Quá trình
này có thể là tự động hay bán tự động, song phần nhiều là bán tự động. Các mẫu được
phát hiện thường hữu ích theo nghĩa: các mẫu mang lại cho người sử dụng một lợi thế
nào đó, thường là lợi thế về kinh tế.
KPDL giống như quá trình tìm ra và mô tả mẫu dữ liệu. Dữ liệu như là một tập
hợp của các vật hay sự kiện, còn đầu ra của quá trình KPDL như là những dự báo của
các vật hay sự kiện mới.
Trong mọi hoạt động sản xuất, kinh doanh thì yếu tố thành công luôn đặt lên
hàng đầu. Giờ đây KPDL đã và đang trở thành một trong những hướng nghiên cứu
chính của lĩnh vực khoa học máy tính và công nghệ tri thức. Do đó có thể coi mục
đích chính của quá trình KPDL là một mô tả và dự đoán mà các mẫu KPDL phát hiện
đều được nhằm vào mục đích này.
Các dạng dữ liệu có thể khai phá:
GVHD: PGS.TS.Đỗ Phúc Trang 4
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
Do KPDL được ứng dụng rộng rãi nên có rất nhiều kiểu dữ liệu khác nhau
được chấp nhập trong KPDL. Dưới đây là một số kiểu dữ liệu điển hình:
CSDL quan hệ : Là các CSDL tác nghiệp được tổ chức theo mô hình dữ liệu quan hệ
( như Oracle, IBM, DB2, MS SQL, v.v ).
CSDL đa chiều : Là kho dữ liệu được tập hợp và chọn lọc từ nhiều nguồn dữ liệu
khác nhau. Dạng dữ liệu này có mang tính lịch sử (có thuộc tính thời gian) và chủ yếu
phục vụ cho quá trình phân tích cũng như là khai phá tri thức nhằm hỗ trợ quá trình ra
quyết định.
CSDL dạng giao dịch: Là một dạng CSDL tác nghiệp, nhưng các bản ghi thường là
các giao dịch. Dạng dữ liệu này phổ biến trong lĩnh vực thương mại và ngân hàng, ví
dụ: dữ liệu về các giao dịch thanh toán của ngân hàng,v.v.

Dữ liệu không gian và thời gian : Là dạng dữ liệu có tích hợp thuộc tính về không
gian(ví dụ: dữ liệu về bản đồ) hoặc thời gian (ví dụ: dữ liệu về thị trường chứng
khoán).
CSDL quan hệ-hướng đối tượng : Là dạng CSDL lai giữa hai mô hình quan hệ và
hướng đối tượng.
CSDL đa phương tiện : Dữ liệu âm thanh, hình ảnh, phim ảnh, text và web v.v Dạng
dữ liệu này hiện đang khá phổ biến trên Internet do sự ứng dụng rộng rãi của nó.
2. Khai phá dữ liệu sử dụng luật kết hợp
Phương pháp này nhằm phát hiện ra các luật kết hợp giữa các thành phần dữ
liệu trong cơ sở dữ liệu. Mẫu đầu ra của giải thuật khai phá dữ liệu là tập luật kết hợp
tìm được. Ta có thể lấy một số ví dụ đơn giản về luật kết hợp như sau: Sự kết hợp
giữa hai thành phần A và B có nghĩa là sự xuất hiện của A trong bản ghi kéo theo sự
xuất hiện của B trong cùng bản ghi đó: A ⇒ B.
Cho một lược đồ R = {A
1
,…A
p
} các thuộc tính với miền giá trị {0,1}, và một
quan hệ r trên R. Một tập luật kết hợp trên r được mô tả dưới dạng X ⇒ B với X ⊆ R
và B∈R\X. Về mặt trực giác, ta có thể phát biểu ý nghĩa của luật như sau: nếu một
bản ghi của bảng r có giá trị 1 tại mỗi thuộc tính thuộc X thì giá trị của thuộc tính B
GVHD: PGS.TS.Đỗ Phúc Trang 5
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
cũng là 1 trong cùng bản ghi đó. Ví dụ như ta có tập cơ sở dữ liệu về các mặt hàng
bán trong siêu thị, các dòng tương ứng với các ngày bán hàng, các cột tương ứng với
các mặt hàng thì giá trị 1 tại ô (20/10, bánh mì) xác định rằng bánh mì đã được bán
ngày hôm đó và cũng kéo theo sự xuất hiện giá trị 1 tại ô (20/10, bơ).
Cho W⊆R, đặt s(W,r) là tần số xuất hiện của W trong r được tính bằng tỷ lệ
của các dòng trong r có giá trị 1 tại mỗi cột thuộc W. Tần số xuất hiện của luật X ⇒ B
trong r được định nghĩa là s(X∪{B},r) còn gọi là độ hỗ trợ của luật, độ tin cậy của

luật là s(X∪{B},r)/s(X,r), ở đây X có thể gồm nhiều thuộc tính, B là giá trị không cố
định. Nhờ vậy mà không xảy ra việc tạo ra các luật không mong muốn trước khi quá
trình tìm kiếm bắt đầu. Điều đó cũng cho thấy không gian tìm kiếm có kích thước
tăng theo hàm mũ của số lượng các thuộc tính ở đầu vào. Do vậy cần phải chú ý khi
thiết kế dữ liệu cho việc tìm kiếm các luật kết hợp.
Nhiệm vụ của việc phát hiện các luật kết hợp là phải tìm tất cả các luật X ⇒ Y
sao cho tần số của luật không nhỏ hơn ngưỡng σ cho trước và độ tin cậy của luật
không nhỏ hơn ngưỡng θ cho trước. Từ một cơ sở dữ liệu ta có thể tìm được hàng
nghìn thậm chí hàng trăm nghìn các luật kết hợp.
Ta gọi một tập con X ⊆ R là phổ biến trong r nếu thoả mãn điều kiện s(X,r) ≥
σ. Nếu biết tất cả các tập phổ biến trong r thì việc tìm kiếm các luật kết hợp rất dễ
dàng. Vì vậy, giải thuật tìm kiếm các luật kết hợp trước tiên đi tìm tất cả các tập phổ
biến này, sau đó tạo dựng dần các luật kết hợp bằng cách ghép dần các tập thuộc tính
dựa trên mức độ phổ biến.
GVHD: PGS.TS.Đỗ Phúc Trang 6
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
CHƯƠNG 2 - ỨNG DỤNG LUẬT KẾT HỢP TRONG HỖ TRỢ
RA QUYẾT ĐỊNH CHO VAY VỐN CỦA NGÂN HÀNG
1. Luật kết hợp
1.1 Khái niệm về luật và luật kết hợp.
Định nghĩa hệ luật dẫn : Trong modul chương trình xử lý các thông tin của vấn
đề đang nằm trong bộ nhớ tạm thời thông qua một CSDL chứa các luật dẫn và bộ
phận suy diễn để suy ra thông tin mới.
Mô hình hệ luật dẫn bao gồm 3 bộ phận chính:
Cơ sở tri thức : tập các luật dẫn, mô hình bộ nhớ lâu bền của con người.
Bộ nhớ tạm thời (bộ nhớ hoạt động): chứa đựng các sự kiện khởi đầu của vấn đề
và các sự kiện có từ suy diễn, mô hình bộ nhớ tạm thời của con người.
Động cơ suy diễn: mô hình hoá lập luận của con người bằng cách kết hợp các sự
kiện của vấn đề với các luật trong CSTT để suy diễn ra thông tin mới.
Trong CSTT với các trạng thái chính là các sự kiện trong bộ nhớ hoạt động và bộ

phận lập luận chính là động cơ suy diễn. Khi các luật được phát tác thì các kết luận
được đưa vào bộ nhớ hoạt động thành các sự kiện mới và quá trình lặp lại liên tục đến
khi lặp điều kiện dừng của hệ thống ( không có luật nào thoả mãn điều kiện đang có,
hay không phát sinh thêm được tập mục phổ biến, thông tin mới…).
Mô tả một hệ luật dẫn: Các luật dẫn hoặc gọi là luật IF THEN là những mệnh đề có
dạng LHS=>RHS trong đó LHS xác định các điều kiện hoặc hoàn cảnh phải được
thoả mãn cho luật được áp dụng, RHS là những tác động phải xảy ra khi luật được áp
dụng.
1.2. Một số tính chất của tập mục phổ biến và luật kết hợp
1.2.1. Một số tính chất với tập mục phổ biến:
Giả sử A và B là các tập mục phổ biến, các tính chất của tập mục phổ biến như sau:
(1) Tính chất 1 : Nếu A

B thì supp(A) ≥ supp(B).
Vì tất cả các tác vụ trong D hỗ trợ B thì cũng hỗ trợ A.
GVHD: PGS.TS.Đỗ Phúc Trang 7
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
(2) Tính chất 2: Một tập chứa một tập không phổ biến thì cũng là tập không phổ
biến (nếu A không phổ biến thì B cũng không phổ biến).
Chứng minh: Nếu A

B thì supp(A) ≥ supp(B) (theo tính chất 1) mà
supp(A)<minsupp thì supp(B)<minsupp.
(3) Tính chất 3: Các tập con của một tập phổ biến cũng là tập phổ biến (nếu A là
tập phổ biến thì B cũng là tập phổ biến)
Nếu B là tập phổ biến trong D tức: supp(B) > minsup. Khi đó mọi tập con A
của B cũng là phổ biến trong D vì supp(A) ≥ ( supp(B) ≥ minsup (theo tính
chất 1). Trường hợp đặc biệt, nếu tập A={i1,i2, , ik} là tập phổ biến thì mọi
tập con có (k-1) mục của nó cũng là phổ biến. Lưu ý ngược lại là không đúng.
1.2.2. Một số tính chất với luật kết hợp:

Tính chất 1 : Không hợp các luật kết hợp.
Nếu X ⇒ Z và Y⇒ Z trong D thì không nhất thiết (X∪Y)⇒ Z là đúng.
Xét trường hợp X∩Y=∅ và các tác vụ trong D hỗ trợ Z nếu chỉ nếu chúng hỗ trợ
mỗi X hoặc Y, khi đó luật X∪Y⇒ Z có độ tin cậy là 0%.
Tương tự: X ⇒ Y và X ⇒ Z thì không nhất thiết X ⇒Y ∪ Z
Tính chất 2 : Không tách luật.
Nếu X ∪ Y⇒Z thì X ⇒Y và Y ⇒ Z chưa chắc xảy ra. Nhưng nếu X ⇒Y ∪ Z thì
kéo theo X

Y

X

Z
Ví dụ: Trường hợp Z có mặt trong một tác vụ chỉ khi cả hai X và Y cũng có mặt,
tức là supp(X∪Y)=supp(Z). Nếu độ hỗ trợ của X và Y đủ lớn hơn supp(X∪Y)
hay supp(X)>supp(X∪Y) và supp(Y)>supp(X∪Y) thì hai luật riêng biệt sẽ
không đủ độ tin cậy
Tuy nhiên, đảo lại: X → Y ∪ Z ⇒ X → Y ∧ X → Z
Tính chất 3 : Các luật kết hợp không có tính chất bắc cầu.
Nếu X → Y và Y → Z chúng ta không thể suy ra X →Z.
GVHD: PGS.TS.Đỗ Phúc Trang 8
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
Ví dụ: Giả sử T(X)⊂(T(Y)⊂(T(Z) tương ứng là tập các tác vụ chứa X,Y,Z và độ
tin cậy cực tiểu là minconf, conf(X→Y)=conf(Y→Z)=minconf
thế thì: conf(X→Z)=minconf
2
<minconf vì minconf<1, do đó luật X→Z không đủ
độ tin cậy.
2. Xây dựng ứng dụng tạo luật kết hợp quyết định cho khách hàng vay vốn

2.1 Cơ sở dữ liệu
Cơ sơ dữ liệu sử dụng để tạo luật kết hợp là “bank- data.cvs”. Cơ sở dữ liệu này
gồm 100 bản ghi, với 12 thuộc tính: ID (mã số), TUOI (tuổi), GIOI TINH (giới tính),
KHU VUC (khu vực), THU NHAP (thu nhập), KET HON (kết hôn), CON (số con),
XE (xe), TKTK (tài khoản tiết kiệm), TK_HIEN TAI (Tài khoản hiện tại), THE
CHAP (thế chấp).
Sử dụng phần mềm Weka để tạo ra luật kết hợp quyết định cho một khách hàng
được vay vốn hay không.
2.2 Preprocess (Tiền xử lý )
– Mở bảng dữ liệu bank- data.csv: sau khi khởi động Weka, chọn Exploer
Preproces open, sau đó chọn đường dẫn đến file bank-data.csv.
– Loại bỏ thuộc tính ID khỏi CSDL: Click chuột vào checkbox ở thuộc tính ID, sau
đó click vào
– Chuyển đổi kiểu dữ liệu của thuộc tính TUOI thành kiểu Nominal với 3 giá trị
Thanh nien (Thanh niên), Trung nien (Trung niên), Gia(Già)
Bước 1: Chọn mục MathExpression trong cây thư mục rồi thiết lập các thông
số trong hộp thoại của nó như sau:
GVHD: PGS.TS.Đỗ Phúc Trang 9
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
Click vào để hoàn thành. Tiếp đó click vào để thực hiện.
Bước 2: Chuyển đổi kiểu dữ liệu của trường TUOI sang kiểu Nominal
Sử dụng mục NumericToNominal
Bước 3: Thêm các giá trị Thanh nien, Trung nien, Gia vào thuộc tính TUOI
Chọn mục AddValues ở cây thư mục và thiết lập các thông số trong hộp thoại của
nó như sau:
Bước 4: Click vào button ở phía trên vùng Filter, sẽ xuất hiện một
bảng dữ liệu như sau:
GVHD: PGS.TS.Đỗ Phúc Trang 10
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
Click chuột phải vào thuộc tính TUOI rồi chọn Replace Value Width… Xuất

hiện hộp thoại, gõ 1 vào rồi Click OK, xuất hiện hộp thoại thứ 2, gõ Thanh nien vào
rồi click OK:
Thực hiện tương tự với hai trường hợp còn lại.
– Chuyển đổi kiểu dữ liệu của thuộc tính THU NHAP thành kiểu Nominal với 3 giá
trị Thap (Thấp), TB (Trung bình), Cao (Cao).
GVHD: PGS.TS.Đỗ Phúc Trang 11
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
Bước 1: Chọn mục MathExpression trong cây thư mục rồi thiết lập các thông
số trong hộp thoại của nó như sau:
Click vào để hoàn thành. Tiếp đó click vào để thực hiện.
Bước 2: Chuyển đổi kiểu dữ liệu của trường THU NHAP sang kiểu Nominal
Sử dụng mục NumericToNominal.
Bước 3: Thêm các giá trị Thap, TB, Cao vào thuộc tính THU NHAP
Chọn mục AddValues ở cây thư mục và thiết lập các thông số trong hộp thoại của
nó như sau:
Bước 4: Click vào button ở phía trên vùng Filter, sẽ xuất hiện một
bảng dữ liệu như sau:
GVHD: PGS.TS.Đỗ Phúc Trang 12
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
Click chuột phải vào thuộc tính THU NHAP rồi thực hiện tương tự như trên
– Chuyển đổi kiểu dữ liệu của thuộc tính CON thanh kiểu Nominal với 3 giá trị
0_con, 1_con, 2_con, 3_con
Bước 1: Chuyển kiểu dữ liệu của thuộc tính con thành kiểu Nominal
Sử dụng mục NumericToNominal
Bước 2: Dùng mục Addvalues để thêm giá trị con vào thuộc tính CON
Bước 3: Dùng mục mergeTwoValues để gộp 2 giá trị 0 và giá trị con thành
một giá trị có tên là 0_con
Quay lại bước 2 và thực hiện tương tự đối với các giá trị còn lại. Sau khi thực hiện
xong trong thuộc tính CON sẽ có 4 giá trị là 0_con, 1_con, 2_con, 3_con.
Lưu ý: Sau khi đã xử lý xong dữ liệu click vào button để lưu lại bảng dữ

liệu. Ta nhận thấy rằng ở các thuộc tính TUOI và THU NHAP sau khi xử lý xong có
một số giá trị sẽ không được sử dụng đến là 1, 2, 3, để loại bỏ những giá trị này ta luu
bảng dữ liệu lại với định dạng CSV rồi mở lại một lần nữa, lúc này các giá trị 1,2,3 đã
bị loại bỏ.
GVHD: PGS.TS.Đỗ Phúc Trang 13
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
2.3 Associate (Tạo luật kết hợp)
Trong vùng Associator, bên phải button

xuất

hiện dòng chữ Apriori
-N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S -1.0 -A -c -1, click chuột trái (hoặc chuột
phải chọn Show properties…) vào dòng chữ này để thiết lập các tham số như hình
sau:
Click Ok sau đó click vào button để tạo luật kết hợp, kết quả sẽ hiện thị ở
vùng Associator output như sau:
=== Run information ===
Scheme: weka.associations.Apriori -N 10 -T 0 -C 0.9 -D 0.05 -U 1.0 -M 0.1 -S
-1.0 -A -c -1
Relation: BANK-DATA-SUA
Instances: 101
Attributes: 11
GVHD: PGS.TS.Đỗ Phúc Trang 14
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
TUOI
GIOI TINH
KHU VUC
THU NHAP
KET HON

CON
XE
TKTK
TK_HIEN TAI
THE CHAP
CHO VAY
=== Associator model (full training set) ===
Apriori
=======
Minimum support: 0.1 (10 instances)
Minimum metric <confidence>: 0.9
Number of cycles performed: 18
Generated sets of large itemsets:
Size of set of large itemsets L(1): 42
Size of set of large itemsets L(2): 172
Size of set of large itemsets L(3): 131
Size of set of large itemsets L(4): 19
Size of set of large itemsets L(5): 1
Best rules found:
1. CON=1_con TK_HIEN TAI=C 16 ==> CHO VAY=C 15 conf:(0.94)
GVHD: PGS.TS.Đỗ Phúc Trang 15
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
2. CON=1_con TKTK=C 13 ==> CHO VAY=C 12 conf:(0.92)
3. CON=1_con THE CHAP=K 13 ==> CHO VAY=C 12 conf:(0.92)
4. CON=1_con XE=K 12 ==> CHO VAY=C 11 conf:(0.92)
5. CON=1_con TKTK=C TK_HIEN TAI=C 12 ==> CHO VAY=C 11 conf:
(0.92)
6. CON=1_con TK_HIEN TAI=C THE CHAP=K 12 ==> CHO VAY=C 11
conf:(0.92)
7. CON=0_con TKTK=C THE CHAP=C 12 ==> CHO VAY=K 11 conf:(0.92)

Kết quả: Tạo được 7 luật kết hợp:
1. CON=1_con TK_HIEN TAI=C 16 ==> CHO VAY=C 15 conf:(0.94)
2. CON=1_con TKTK=C 13 ==> CHO VAY=C 12 conf:(0.92)
3. CON=1_con THE CHAP=K 13 ==> CHO VAY=C 12 conf:(0.92)
4. CON=1_con XE=K 12 ==> CHO VAY=C 11 conf:(0.92)
5. CON=1_con TKTK=C TK_HIEN TAI=C 12 ==> CHO VAY=C 11 conf:
(0.92)
6. CON=1_con TK_HIEN TAI=C THE CHAP=K 12 ==> CHO VAY=C11
conf:(0.92)
7. CON=0_con TKTK=C THE CHAP=C 12 ==> CHO VAY=K 11 conf:(0.92)
Như vậy, thông qua kết quả của các lần khảo sát trước đó, các luật kết hợp được
sinh ra từ phần mềm có thể được sử dụng cho các lần cho vay tiếp theo. Chẳng hạn,
với độ tin cậy 94%, nếu khách hàng có 1 con và có tài khoản hiện tại tại ngân hàng thì
có thể cho vay (Luật 1). Hoặc, với độ tin cậy 92% nếu khách hàng chưa có con và có
tài khoản tiết kiệm nhưng cũng có tài khoản thế chấp thì không cho vay (Luật 7).
GVHD: PGS.TS.Đỗ Phúc Trang 16
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
CHƯƠNG 3 - KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
1. Kết luận
Do số lượng dữ liệu thực tế không nhiều nên kết quả chỉ dựa trên độ bao phủ
10%. Nếu số lượng bản ghi dữ liệu nhiều hơn, kết quả các luật rút ra sẽ trở nên chính
xác và mang tính đại diện tốt hơn rất nhiều.
Việc khai thác luật kết hợp dựa trên các quyết định quá khứ có thể đưa ra được
các luật tin cậy, làm tiền đề cho các quyết định tương tự trong tương lai. Bài seminar
đã trình bày được:
– Các loại tri thức trong cơ sở dữ liệu và kỹ thuật khai thác chúng để hỗ trợ
quyết định.
– Trình bày vả khái niệm , định nghĩa, tính chất của luật kết hợp, cách xác định
độ hỗ trợ của tập luật và độ tin cậy của nó.
– Trình bày được một số chức năng trong Weka

– Xây dựng ứng dụng dựa trên Weka để quyết định xem có cho khách hàng vay
vốn không.
Do thời gian hạn hẹp nên trong quá trình xây dựng ứng dụng và tìm hiểu còn có nhiều
hạn chế:
– Chưa khảo sát thực tế hệ thống cho vay vốn của ngân hàng
– Dữ liệu tự phát và số lượng rất ít nên chưa thấy hết khả năng trong chương
trình Weka
– Chưa so sánh được tốc độ chạy khi nạp dữ liệu đối với các thuật toán
2. Hướng phát triển
– Cố gắng khắc phục những khó khăn trên
– Xây dựng module tích hợp vào Weka
– Tìm hiểu tất cả chức năng trong Weka
GVHD: PGS.TS.Đỗ Phúc Trang 17
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
TÀI LIỆU THAM KHẢO
[1] Đỗ Phúc. “Chuyên đề: Ứng dụng Business Intelligence vào ERP nhằm hỗ trợ ra
quyết định.” 2014
[2] Arora, Jyoti, Nidhi Bhalla, and Sanjeev Rao. "A Review on Association Rule
Mining Algorithms." IJIRCCE International Journal of Innovative Research in
Computer and Communication Engineering 1.5 (2013).
[3] Maragatham, G., and M. Lakshmi. "A Recent Review on Association Rule
Mining." Computer Science & Engg Department, Sathyabama University, Chennai,
Tamil Nadu, India (2012).
[4] Liao, Shu-Hsien, Pei-Hui Chu, and Pei-Yuan Hsiao. "Data mining techniques and
applications–A decade review from 2000 to 2011." Expert Systems with Applications
39.12 (2012): 11303-11311.
GVHD: PGS.TS.Đỗ Phúc Trang 18
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
BẢNG TỔNG HỢP Ý KIẾN NHẬN XÉT ĐỀ TÀI
STT Họ Tên Đánh giá

1 Huỳnh Ngọc Ca 9.5
2 Hồ Công Hoài 9
3 Chu Thị Huế 9
4 Huỳnh Đức Huy 9
5 Phan Quang Huy 9
6 Nguyễn Thị Thùy Linh 8.5
7 Nguyễn Thành Luân 9
8 Nguyễn Hoàng Ngân 9
9 Bùi Bá Nguyên 8.5
10 Lê Hữu Tài 9
11 Mai Hoàng Thắng 9.5
12 Mai Trung Thành 9
13 Nguyễn Quốc Thành 9
14 Dương Thị Xuân Thoại 9
15 Trần Lệ Thủy 9
16 Trương Trí Tín 9
17 Trần Thanh Trâm 8.5
18 Nguyễn Hồ Duy Tri 9
19 Nguyễn Hồ Duy Trí 7.5
20 Hứa Phước Trường 10
21 Tôn Thất Kỳ Văn 9
TRUNG BÌNH 9.0
STT Họ Tên Đánh giá
1 Huỳnh Ngọc Ca 5
Nội dung trình bày đầy đủ, rõ ràng nhưng slide chữ
quá nhiều
2 Hồ Công Hoài 4.5
Đúng và nội dung sát. Giới thiệu được Weka nhưng
cần tập trung demo để thấy kết quả
3 Chu Thị Huế 4

Tiêu đề dài, tóm gọn phần nội dung khai phá dữ liệu.
Demo chi tiết về cách thức xử lý dữ liệu dùng Weka.
Chưa nêu rõ mục đích và kết quả của demo
4 Huỳnh Đức Huy 4
Nội dung ứng dụng cao. Trình bày tiền xử lý dữ liệu
dễ hiểu. Chưa kết luận tính ứng dụng
5 Phan Quang Huy 4
Đúng, đầy đủ. Cần tập trung vào 1 vấn đề để làm rõ
bài toán
6 Nguyễn Thị Thùy Linh 4
Nội dung đúng với tiêu đề. Chưa thể hiện được luật
cụ thể, tác động vào cho vay
7 Nguyễn Thành Luân 4 Demo trình bày khá phức tạp sử dụng Weka
8 Nguyễn Hoàng Ngân 4.5
Nội dung đúng tiêu đề nhưng chưa rõ ràng. Cần flow
trình bày mạch lạc hơn
9 Bùi Bá Nguyên 4
Demo chưa thể hiện hết tiêu đề. Chưa rõ ràng ở phần
đặt vấn đề và giải quyết bài toán
GVHD: PGS.TS.Đỗ Phúc Trang 19
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
10 Lê Hữu Tài 4
Cần thu nhỏ phạm vi đề tài. Thiếu quy trình để đưa
ra quyết định
11 Mai Hoàng Thắng 4.5 Nội dung trình bày phù hợp, thiếu demo mẫu tuần tự
12 Mai Trung Thành 4.5 Tốt, có demo weka
13 Nguyễn Quốc Thành 4 Đúng và sát tiêu đề. Giới thiệu về Weka
14 Dương Thị Xuân Thoại 4
Trình bày 1 phần nội dung. Demo chưa đầy đủ chức
năng

15 Trần Lệ Thủy 4 Còn thiếu so với tiêu đề
16 Trương Trí Tín 4.5
Đúng với tiêu đề, nội dung chi tiết. Chương trình
hay nhưng chưa đưa ra quyết định
17 Trần Thanh Trâm 4
Nội dung trình bày đúng, demo bằng Weka. Chưa có
minh họa luật cụ thể, quyết định cho vay hay không
18 Nguyễn Hồ Duy Tri 4.5
Nội dung đầy đủ. Phần demo chưa làm nổi bật việc
ra quyết định
19 Nguyễn Hồ Duy Trí 4 Hơi lang mang, dài dòng. Bài toán thực tiễn hấp dẫn
20 Hứa Phước Trường
Nội dung nhiều, phong phú nhưng cần trọng tâm
hơn
21 Tôn Thất Kỳ Văn 4.5
Chưa đúng với tiêu đề. Bố cục rõ ràng. Số liệu thực
tế. Chưa giới thiệu bộ lọc. Chưa có kết quả cuối
cùng
TRUNG BÌNH (01)
4.2

STT Họ Tên Đánh giá
1 Huỳnh Ngọc Ca 0.5 Tài liệu tham khảo mới, chưa đầy đủ
2 Hồ Công Hoài 1 Tài liệu mới và phong phú
3 Chu Thị Huế 1 Tài liệu mới và phong phú
4 Huỳnh Đức Huy 1 Đầy đủ và mới
5 Phan Quang Huy 1 Đầy đủ
6 Nguyễn Thị Thùy Linh 1 Tài liệu tham khảo phong phú
7 Nguyễn Thành Luân 1 Mới, có paper
8 Nguyễn Hoàng Ngân 1 Tài liệu mới, phong phú

9 Bùi Bá Nguyên 1 Tài liệu phong phú, mới
10 Lê Hữu Tài 1 Phong phú, đầy đủ, mới
11 Mai Hoàng Thắng 1 Tài liệu phong phú
12 Mai Trung Thành 1 Tài liệu tham khảo mới
13 Nguyễn Quốc Thành 1 Tài liệu mới và phong phú
14 Dương Thị Xuân Thoại 1 Tài liêu mới, đa dạng
15 Trần Lệ Thủy 1 Khá phong phú
GVHD: PGS.TS.Đỗ Phúc Trang 20
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
16 Trương Trí Tín 1 Tài liệu tham khảo đầy đủ
17 Trần Thanh Trâm 1 Tài liệu tham khảo có tính mới
18 Nguyễn Hồ Duy Tri 1 Mới, đầy đủ
19 Nguyễn Hồ Duy Trí 1 Mới, phong phú
20 Hứa Phước Trường 1 Tài liệu tham khảo đầy đủ
21 Tôn Thất Kỳ Văn 1 Đầy đủ. Có tài liệu mới
TRUNG BÌNH (02) 1.0
STT Họ Tên Đánh giá
1 Huỳnh Ngọc Ca 1 Trang chiếu đẹp, rõ ràng
2 Hồ Công Hoài 1 Slide đẹp, rõ ràng, có ví dụ minh họa
3 Chu Thị Huế 1 Slide đầy đủ, đẹp mắt, đúng với nội dung
4 Huỳnh Đức Huy 1 Rõ ràng, đầy đủ
5 Phan Quang Huy 1 Đẹp rõ ràng
6 Nguyễn Thị Thùy Linh 1 Đẹp rõ ràng
7 Nguyễn Thành Luân 1 Rõ ràng bắt mắt
8 Nguyễn Hoàng Ngân 1 Slide rõ ràng
9 Bùi Bá Nguyên 1 Slide rõ ràng, đẹp
10 Lê Hữu Tài 1 Đẹp rõ ràng đầy đủ
11 Mai Hoàng Thắng 1 Slide rõ ràng
12 Mai Trung Thành 1 Slide đẹp
13 Nguyễn Quốc Thành 1 Đẹp, dễ nhìn

14 Dương Thị Xuân Thoại 1 Slide rõ ràng, dễ nhìn
15 Trần Lệ Thủy 1 Đẹp
16 Trương Trí Tín 1 Trang chiếu rõ ràng, có chữ
17 Trần Thanh Trâm 1 Slide đẹp rõ ràng
18 Nguyễn Hồ Duy Tri 1 Trang chiếu bố trí hợp lý, gọn gàng, bắt mắt
19 Nguyễn Hồ Duy Trí 0.5 Slide nhiều chữ
20 Hứa Phước Trường 1 Trang chiếu trình bày rõ ràng
21 Tôn Thất Kỳ Văn 1 Sáng, đẹp. Chưa có trọng tâm
TRUNG BÌNH (03) 1.0
STT Họ Tên Đánh giá
1 Huỳnh Ngọc Ca 1 Trình bày tự tin, rõ ràng
2 Hồ Công Hoài 0.5 Trình bày tương đối rõ ràng, tự tin
3 Chu Thị Huế 1 Trình bày tự tin
4 Huỳnh Đức Huy 1 Trình bày rõ ràng, dễ hiểu
5 Phan Quang Huy 1 Tự tin, hấp dẫn
6 Nguyễn Thị Thùy Linh 1 Trình bày tự tin, hơi run
7 Nguyễn Thành Luân 1 Trình bày tự tin
8 Nguyễn Hoàng Ngân 0.5 Trình bày thiếu tự tin
9 Bùi Bá Nguyên 0.5 Trình bày lôi cuốn, thiếu tự tin
10 Lê Hữu Tài 1 Trình bày chưa tự tin
11 Mai Hoàng Thắng 1 Trình bày tốt, rõ ràng
12 Mai Trung Thành 1 Tự tin, rõ ràng
13 Nguyễn Quốc Thành 1 Trình bày mạch lạc
GVHD: PGS.TS.Đỗ Phúc Trang 21
Luật kết hợp trong hỗ trợ ra quyết định cho vay vốn của ngân hàng
14 Dương Thị Xuân Thoại 1 Trình bày rõ ràng
15 Trần Lệ Thủy 1 Tự tin
16 Trương Trí Tín 1
Trình bày chi tiết. Nói rõ ràng nhưng chưa tập
trung

17 Trần Thanh Trâm 1 Trình bày tự tin, rõ ràng, hơi run
18 Nguyễn Hồ Duy Tri 1 Trình bày tự tin, giọng nói lôi cuốn
19 Nguyễn Hồ Duy Trí 0.5 Chưa tự tin, đều đều
20 Hứa Phước Trường 1 Trình bày hấp dẫn, tự tin
21 Tôn Thất Kỳ Văn 1 Giọng nói to rõ ràng, càng về sau hơi yếu
TRUNG BÌNH (04) 0.9
STT Họ Tên Đánh giá
1 Huỳnh Ngọc Ca 2 Câu trả lời đúng, rõ ràng
2 Hồ Công Hoài 2 Trả lời đầy đủ
3 Chu Thị Huế 2 Trả lời thỏa đáng
4 Huỳnh Đức Huy 2 Trả lời thỏa đáng, đầy đủ, ngắn gọn
5 Phan Quang Huy 2 Thỏa đáng
6 Nguyễn Thị Thùy Linh 1.5 Trả lời đủ các câu hỏi, chưa rõ
7 Nguyễn Thành Luân 2
8 Nguyễn Hoàng Ngân 2 Trả lời thỏa đáng
9 Bùi Bá Nguyên 2 Trả lời được các câu hỏi
10 Lê Hữu Tài 2 Trả lời đầy đủ, đúng trọng tâm
11 Mai Hoàng Thắng 2 Trả lời đầy đủ các câu hỏi
12 Mai Trung Thành 1.5 Trả lời đủ
13 Nguyễn Quốc Thành 2 Đúng, đầy đủ
14 Dương Thị Xuân Thoại 2 Trả lời đầy đủ, đúng
15 Trần Lệ Thủy 2 Tốt
16 Trương Trí Tín 2 Trả lời đầy đủ, rõ ràng
17 Trần Thanh Trâm 1.5 Trả lời đủ các câu hỏi, chưa thỏa đáng
18 Nguyễn Hồ Duy Tri 1.5 Trả lời thỏa đáng các câu hỏi đưa ra
19 Nguyễn Hồ Duy Trí 1.5 Đầy đủ, thỏa đáng
20 Hứa Phước Trường 2
21 Tôn Thất Kỳ Văn 1.5
Demo chi tiết, quá nhiều về sử dụng phần mềm. Trả
lời tốt

TRUNG BÌNH (05) 1.9
GVHD: PGS.TS.Đỗ Phúc Trang 22

×