Tải bản đầy đủ (.pdf) (4 trang)

Ứng dụng cây quyết định mờ trong khai phá dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (105.3 KB, 4 trang )

Ứng dụng cây quyết định mờ trong khai phá
dữ liệu

Cao Hùng Cường

Trường Đại học Công nghệ
Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10
Người hướng dẫn: PGS.TS. Hồ Thuần
Năm bảo vệ: 2007

Abstract: Mô tả lý thuyết về khai phá dữ liệu (KPDL), cây quyết định và độ đo mờ
nói chung, kỹ thuật về KPDL. Trình bày thuật toán quy nạp cây quyết định mờ: biểu
diễn của nhận thức không chắc chắn trong bài toán phân loại, định lượng nhận thức
không chắc chắn, luật phân loại mờ và nhập nhằng phân loại, quy nạp cây quyết định
mờ, đưa ra những ưu khuyết điểm của thuật toán. Giới thiệu về cài đặt thuật toán và
chương trình mô phỏng thuật toán quy nạp xây dựng cây quyết định mờ
Keywords: Cây quyết định, Công nghệ thông tin, Cơ sở dữ liệu, Khai phá dữ liệu

Content
MỞ ĐẦU
Trong vài thập kỷ gần đây, cùng với sự phát triển nhanh chóng của công nghệ, mà định
luật Moore là một minh chứng, là sự bùng nổ chóng mặt của lượng thông tin trên thế giới.
Các công cụ lưu trữ thông tin cổ điển như sổ sách, tài liệu không còn đáp ứng được nhu cầu
lưu trữ thông tin nữa và việc sử dụng công cụ lưu trữ thông tin mới như băng từ, ổ cứng, là
điều tất yếu. Bên cạnh sự phát triển nhanh chóng về dung lượng cũng như độ tin cậy của các
thiết bị kỹ thuật số nhằm lưu trữ thông tin, một câu hỏi được đặt ra là làm thế nào để xử lý
lượng thông tin khổng lồ đó?
Rõ ràng việc xử lý thông tin nhằm rút ra tri thức nằm trong đó đã vượt quá khả năng xử
lý đơn thuần của con người. Ví dụ như một chuyên gia phân tích thị trường có thể mất hàng
năm trời để tính toán mô hình quyết định dựa trên hàng ngàn thông số dữ liệu trong khi thị
trường thay đổi nhanh chóng đòi hỏi phải ra quyết định kịp thời. Chính vì thế người ta nghĩ


đến việc xử lý dữ liệu tự động bằng máy tính nhằm khai thác tri thức tiềm ẩn bên trong. Điều
này là nền tảng ra đời của một môn khoa học mới được gọi khai phá dữ liệu.
Khai phá dữ liệu được ứng dụng vào rất nhiều mặt trong cuộc sống, có thể kể đến một
số ứng dụng như:
 Y học: phân tích phản ứng phụ của thuốc, phân tích gen, chẩn đoán bệnh,
 Tài chính: phán đoán xu hướng của thị trường chứng khoán, phát hiện gian lận tài
chính,
 Phân tích xu hướng mua, phán đoán tâm lý khách hàng,
 Kỹ thuật số: mã hóa dữ liệu, ước lượng thông tin,

References
[1] R.L.P. Chang and T. Pavlidis, Fuzzy decision tree algorithms, IEEE Trans.
Systems Man Cybernet. SMC-7 (1977) 28 35.
[2] K.J. Cios and L.M. Sztandera, Continuous ID3 algorithm with fuzzy entropy
measures, Proc. IEEE lnternat. Con/i on Fuzz Systems (San Diego, CA, 8 12
March 1992) 469 476.
[3] M.R. Civanlar and H.J. Trussell, Constructing membership functions using
statistical data, Fuzzy Sets and Systems 18 (1986) 1 14.
[4] A. De Luca and S. Termin, A definition of a nonprobabilistic entropy in the
setting of fuzzy sets theory, InJorm. and Control 20 (1972) 301-312.
[5] M.M. Gupta, Twenty-five years of fuzzy sets and systems: A tribute to
Professor Lotfi A. Zadeh, Fuzzy Sets and Systems 40 (1991) 409-413.
[6] C. Hagg, Possibility and cost in decision analysis, Fuzzy Sets and Systems 1
(1978) 81 86.
[7] M. Higashi and G.J. Klir, Measures of uncertainty and information based on
possibility distributions, lnternat. J. Gen. Systems 9 (1983) 43 58.
[8] G.J. Klir, Where do we stand on measures of uncertainty, ambiguity,
fuzziness and the like? Fuzzy Sets and Systems 24 (1987) 141 160.
[9] G.J. Klir, and T.A. Folger, Fuzzy Sets, Uncertainty, and lnformation
(Prentice-Hall, Englewood Cliffs, N J, 1988).

[10] G.J. Klir and M. Mariano, On the uniqueness of possibilistic measure
of uncertainty and information, Fuzzy Sets and Systems 24 (1987) 197-219.
[11] T. Kohonen, Self-Organization and Associative Memory (Springer,
Berlin, 1988).
[12] B. Kosko, Fuzzy entropy and conditioning, Inform. Sci. 30 (1986) 165
174.
[13] B. Kosko, Neural Networks and Fuzzy Systems (Prentice-Hall,
Englewood Cliffs, N J, 1992).
[14] C.C. Lee, Fuzzy logic in control systems: fuzzy logic controller, Part II,
IEEE Trans. Systems Man Cybernet. 20 (1990) 419-435.
[15] C T. Lin and C.S.G. Lee, Neural-network-based fuzzy logic control
and decision system, IEEE Trans. Comput. 12 (1991) 1320-1336.
[16] W. Meier, R. Weber and H J. Zimmermann, Fuzzy data analysis -
methods and industrial applications, Fuzzy Sets and Systems 61 (1994) 19-
28.
[17] J.R. Quinlan, Induction of decision trees, Mach. Learning 1(1)(1986)
81 106.
[18] J.R. Quinlan, Decision trees as probabilistic classifiers, Proc. 4th
lnternat. Workshop on Machine Learning (Morgan Kauffman, LosAltos, CA,
1987) 31 37.
[19] J.R. Quinlan, Simplifying decision trees, lnternat. J. Man Mach.
Studies 27 (1987) 221 234.
[20] J.R. Quinlan, Decision trees and decision making, 1EEE Trans.
Systems Man Cybernet. 20 (1990) 339 346.
[21] D. Ruan and E.E. Kerre, Fuzzy implication operators and generalized
fuzzy method of cases, Fuzzy Sets and Systems 54 (1993) 23-37.
[22] S.R. Safavian and D. Landgrebe, A survey of decision tree classifier
methodology, IEEE Trans. Systems Man Cybernet. 21 (1991) 66(~674.
[23] C.E. Shannon, A mathematical theory of communication, Bell System
Tech. J. 27 (1948) 379 423; 623-656.

[24] T. Tani and M. Sakoda, Fuzzy modeling by ID3 algorithm and its
application to prediction of heater outlet Nhiệt độ, Proc.IEEE lnternat. Conj'.
on Fuzz), Systems (San Diego, CA, 8-12 March 1992) 923 930.
[25] R. Weber, Automatic knowledge acquisition for fuzzy control
applications, Proc. lnternat. Symp. on Fuzzy Systems (lizuka, Japan, 12 15
July 1992) 9 12.
[26] R. Weber, Fuzzy-ID3: a class of methods for automatic knowledge
acquisition, Proc. 2nd Internat (lizuka, Japan, 17 22 July 1992) 265 268.
[27] L.A. Zadeh, Fuzzy Sets, Inform. and Control 8 (1965) 338 353.
[28] L.A. Zadeh, Fuzzy Sets as a basis for a theory of possibility, Fuzzy
Sets and Systems 1 (1978) 3 28.
[29] Yufei Yuan, Michael J.Shaw, Induction of fuzzy decision trees


×