Tải bản đầy đủ (.ppt) (32 trang)

Quá trình khai phá dữ liệu

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (305.25 KB, 32 trang )


PHÂN TÍCH QUÁ TRÌNH KHAI PHÁ DỮ LIỆU
Đ
Ề TÀI
CHÀO MỪNG THẦY CÔ VÀ CÁC BẠN ĐÃ ĐẾN VỚI ĐỀ TÀI CỦA
NHÓM 2
DATA MINING: KHAI PHÁ DỮ
LIỆU

NỘI DUNG CỦA ĐỀ TÀI GỒM 4 PHẦN
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU
PHẦN 2: CÁC CHỨC NĂNG CỦA KHAI PHÁ DỮ
LIỆU
DATA MINING: KHAI PHÁ DỮ
LIỆU
PHẦN 3: CÁC PHƯƠNG PHÁP KHAI PHÁ DỮ
LIỆU
PHẦN 4: CÁC ỨNG DỤNG TIỀM
NĂNG

DATA MINING: KHAI PHAÙ DÖÕ
LIEÄU
PHAÀN 1: KHAÙI NIEÄM CHUNG VEÀ KHAI PHAÙ DÖÕ
LIEÄU

DATA MINING: KHAI PHÁ DỮ
LIỆU
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU
Trong phần 1 này chúng ta cần nắm rõ các vấn đề


sau:

Động cơ của việc khai phá dữ liệu?

Khai phá dữ liệu là gì?

Khai phá dữ liệu có lợi ích gì?

Quá trình phát triển của khai phá dữ liệu

DATA MINING: KHAI PHÁ DỮ
LIỆU
1.Động cơ của việc khai phá dữ liệu
Trong một vài thập kỉ nay,khả năng tạo sinh và lưu trữ dữ
liệu của con người đã tăng lên cực kì nhanh. Lượng dữ liệu
khổng lồ phải lưu trữ đã dẫn đến một đòi hỏi cấp bách cho
những kó thuật mới,những công cụ tự động mới giúp con người
một cách thông minh trong việc chuyển đổi một lượng lớn dữ
liệu thành thông tin hữu ích và tri thức => Khai phá dữ liệu ra
đời.
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU

DATA MINING: KHAI PHÁ DỮ
LIỆU
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU
2..Khai phá dữ liệu là gì?
=> Khai phá dữ liệu là
* Trích rút những thông tin h u ích,ch a bi t,ti m n trong kh i ữ ư ế ề ẩ ố

d li u l n. ữ ệ ớ
* Phân tích d li u bán t đ ng.ữ ệ ự ộ
* Gi i thích d li u trên các t p d li u l n.ả ữ ệ ậ ữ ệ ớ


DATA MINING: KHAI PHÁ DỮ
LIỆU
Như chúng ta đã biết,khai phá dữ liệu là việc trích rút tri thức
một
cách tự động và hiệu quả từ một khối DL lớn.
Có một số nhà nghiên cứu còn gọi “Khai phá dữ liệu là phát
hiện
tri thức”.
đây ta có thể coi khai phá dữ liệu là cốt lõi của quá trình
phát hiên
tri thức.
Và như vậy, ta có mô hình của quá trình phát hiện tri thức như
sau:
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU

DATA MINING: KHAI PHÁ DỮ
LIỆU
Cơ sở
dữ liệu
Làm sạch
dữ liệu
Kho
dữ liệu
Dữ liệu

thích hợp
Khai phá
dữ liệu
Đánh
giá mẫu
T
ri thức
Lự
a chọn
Tích hợp
dữ liệu
Hình 2: QUÁ TRÌNH PHÁT HIỆN TRI
THỨC
PHẦN 1: KHÁI NIỆM CHUNGVỀ KHAI PHÁ DỮ
LIỆU

DATA MINING: KHAI PHÁ DỮ
LIỆU
Trong dó:
Làm sạch dữ liệu(Data cleaning): Là loại bỏ nhiễu và dữ liệu
không nhất quán.
Tích hợp dữ liệu(Data intergation):Dữ liệu của nhiều nguồn có
thể được tổ hợp lại.
Lựa chọn dữ liệu(Data selection): Những dữ liệu thích hợp với
nhiệm vụ phân tích được trích rút từ CSDL.
Chuyển đổi dữ liệu(Data transformation): Dữ liệu được chuyển
đổi hay được hợp nhất về dạng thích hợp cho việc khai phá.
Khai phá dữ liệu(Data mining): Đây là một tiến trình cốt yếu
trong đó các phương pháp thông minh được áp dụng nhằm trích ra các
mẫu dữ liệu.

Đánh giá mẫu(Pattem evaluation): Dựa trên một số độ đo nào đó
xác đònh lợi ích thực sự,độ quan trọng của các mẫu biểu diễn tri thức.
Biểu diễn tri thức(Knowledge presentation): giai đoạn này,các
kó thuật biểu diễn và hiển thòỉti thức được sử dụng để đưa tri thức đã
lấy ra được cho người dùng.
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU

DATA MINING: KHAI PHÁ DỮ
LIỆU
Việc khai phá dữ liệu có thể được tiến hành trên một lượng lớn dữ
liệu có
trong các CSDL,các kho dữ liệu hoặc trong các loại lưu trữ thông tin
khác.
Giao diện đồ hoạ cho người dùng
Đánh giá mẫu
Máy khai phá dữ liệu
Máy chủ cơ sở dữ liệu hay kho DL
Làm sạch và tích hợp
dữ liệu
Cơ sở
dữ liệu
Kho
dữ liệu
Cơ sở
tri thức
K
IẾN
T
RÚC

C
ỦA
M
ỘT
H

K
HAI
P

Đ
IỂN
H
ÌNH
H
ình 1:
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU

DATA MINING: KHAI PHÁ DỮ
LIỆU
Trong đó:

Máy chủ CSDL hay kho dữ liệu: Máy chủ này có trách nhiệm lấy được
Những dữ liệu thích hợp dựa trên yêu cầu khai phá của người dùng.

Cơ sở tri thức: Là miền tri thức được dùng để tìm kiếm hay dánh giá độ quan
trọng của các hình mẫu kết quả.

Máy khai phá dữ liệu: Là tập các modun để thực hiện công việc.


Đánh giá mẫu: Bộ phận này tương tác với các modun khai phá dữ liệể tập
trung vào việc duyệt tìm các mẫu được quan tâm.

Giao diện đồ hoạ cho người dùng: Bộ phận này cho phép người dùng giao tiếp
với hệ thống khai phá dữ liệu.
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU

DATA MINING: KHAI PHÁ DỮ
LIỆU

Cung cấp hỗ trợ ra quyết đònh

Dự báo

Khái quát dữ liệu
3.Lợi ích của khai phá dữ
liệu?
PHẦN 1: KHÁI NIỆM CHUNG VỀ KHAI PHÁ DỮ
LIỆU

×