Tải bản đầy đủ (.ppt) (25 trang)

LUẬT KẾT HỢP SONG SONG TRONG KHAI PHÁ DỮ LIỆU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.32 MB, 25 trang )

Đề tài 3:
“LUẬT KẾT HỢP SONG SONG
TRONG KHAI PHÁ DỮ LIỆU”
Thành viên: Lê Nhung, Cẩm Nhung, Quang Thiện, Hồng Thu
Thành viên: Lê Nhung, Cẩm Nhung, Quang Thiện, Hồng Thu
2. Đặc tính chung
2. Đặc tính chung
3. Nguyên lý
3. Nguyên lý
4. Cách tiếp cận
4. Cách tiếp cận
5. Kiến trúc bộ nhớ
5. Kiến trúc bộ nhớ
7. Hướng tiếp cận
NỘI
DUNG
Luật kết hợp song song là thực
hiện song song hóa  đáp ứng sự
tăng lên nhanh chóng của DL và
giảm thời gian thực hiện cho phù
hợp với yêu cầu thực tế.
Cho phép chia nhỏ công việc lớn thành nhiều
việc nhỏ hơn, nên có thể:
- Giải quyết đồng thời nhiều công việc.
- Thực thi nhiều chỉ thị chương trình.

Thời gian xử lí bài toán sẽ giảm xuống (vì
nhiều tài nguyên tính toán được sử dụng).
2. Đặc tính chung
2. Đặc tính chung


3. Nguyên lý
3. Nguyên lý
4. Cách tiếp cận
4. Cách tiếp cận
“Tôpô” = “Hình học của màng cao su”
“Tôpô” = “Hình học của màng cao su”
4. Cách tiếp cận
4. Cách tiếp cận
3. Xây dựng thuật toán song song từ thuật toán đã
được xây dựng (phù hợp cấu hình tôpô từ môi
trường song song thực tế).
5. Kiến trúc bộ nhớ
5. Kiến trúc bộ nhớ
1 2 3
-
Bộ nhớ chia sẻ (Shared Memory):
+ Khái niệm: Các bộ xử lí hoạt động độc lập nhưng
truy cập chung bộ nhớ.
+ Gồm 2 loại: UMA, NUMA
5. Kiến trúc bộ nhớ
5. Kiến trúc bộ nhớ
-
Bộ nhớ phân tán (Distributed Memory):
+ Khái niệm: Các bộ xử lí có bộ nhớ riêng (đòi hỏi
phải có kết nối mạng với nhau).
5. Kiến trúc bộ nhớ
5. Kiến trúc bộ nhớ
-
Bộ nhớ lai (Hybrid Distributed-Shared Memory):
+ Khái niệm: “lai” giữa bộ nhớ chia sẻ và phân tán.

5. Kiến trúc bộ nhớ
5. Kiến trúc bộ nhớ
a) Thuật toán Count Distribution:
-
Sử dụng kiến trúc không chia sẻ.
-
Mỗi bộ xử lý có 1 bộ nhớ chính, 1 bộ nhớ
phụ.
-
Kết nối bởi mạng truyền thông và có thể
truyền tin cho nhau (bằng phương pháp
truyền thông điệp).
b) Thuật toán Data Distribution:
-
CSDL được phân hoạch thành DL nhỏ
hơnmỗi bộ xử lý làm việc với một
tập DL không đầy đủ.
-
Việc trao đỗi DL giữa các bộ xử lý là rất
cần thiết.
c) Thuật toán song song Eclat:
-
Dùng phương pháp nhóm các tập mục
phổ biến có liên quan với nhau.
-
Sử dụng lược đồ phân chia lớp tương
đương (mỗi lớp tương đương chứa tập
mục ứng viên quan hệ tương đương).

-
Sử dụng kỹ thuật tổ chức CSDL theo
chiều dọc  nhóm các giao dịch liên
quan.
d) Thuật toán song song FP-Growth:
-
Dựa vào thuật toán FP-Tree tuần tự.
-
Xây dựng một số FP-Tree cục bộ
trong môi trường bộ nhớ phân tán
và sử dụng mô hình “Chủ-Tớ”.
-
Mô hình song song DL:
“Dữ liệu cần phải phân chia thành các tập con”
+ Ưu điểm: tăng tốc độ đạt được (bằng cách
giảm khối lượng DL cần xử lí trên mỗi bộ xử
lý).
+ Nhược điểm: Cần cân bằng tải công việc (do
sự chênh lẹch DL).
7. Hướng tiếp cận
-
Mô hình song song thao tác:
“Các chương trình cùng phối hợp hoàn thành
mục tiêu.”
+ Ưu điểm: Giảm độ phức tạp thao tác (bằng
cách chia thành thao tác nhỏ hơn để thực thi)
+ Nhược điểm:Tập dữ liệu trong mỗi chương
trình không giống nhau.

7. Hướng tiếp cận
HẾT!

×