Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (545.94 KB, 7 trang )

(1)<div class='page_container' data-page=1>

Xử lý truy vấn và

hiệu năng hệ CSDL

Vũ Tuyết Trinh

Bộ môn Hệ thống thông tin, Viện CNTT&TT
Đại học Bách Khoa Hà Nội

Xử lý câu hỏi truy vấn

Câu lệnh

SQL

Phân tích 
cú pháp 
(parser)

Biểu thức 
ĐSQH

Bộ tối ưu 
(optimizer)

Biểu thức 
ĐSQH 
tối ưu

Bộ sinh mã 
(code generator)

</div>
(2)<div class='page_container' data-page=2>

Cây toán tử

WAGON (NW, TYPE, COND, STATION,
CAPACITY, WEIGHT)

TRAIN (NT, NW)

 Cây toán tử logic

 Thứ tự các phép toán

 Cây toán tử vật lý

 Các thuật toán thực thi phép toán

WAGON
(NW, TYPE...)

TRAIN
(NT, NW)

NT = 4002
TYPE

Các phép toán vật lý (thuật toán)

 Query Blocks



SELECT-FROM-
WHERE-GROUPBY-ORDERBY

 VIEW được coi là 1

block riêng rẽ

 Dạng cây thực thi

(right-deep, bushy, …)

 Thứ tự kết nối



Thuật toán

 Sort

 Aggregates

 Select

 Project

 Join

Nested Loop

Sort-Merge

</div>
(3)<div class='page_container' data-page=3>

Truy nhập bảng

 Truy nhập tuần tự (Sequential scan): đọc theo

khối

 Truy nhập theo địa chỉ (index scan): truy nhập

vào bản ghi dựa trên chỉ mục

 Chi phí truy nhập ?

Phép toán nhiều pha:

Nested-Loops Join

 Nguyên tắc

 Đọc từng bản ghi của quan

hệ R (external relation) & lặp
trên quan hệ S (internal
relation)

 Đặc điểm

 one-and-haft pass,

non-blocking

 Chi phí ?

SOURCE 
S
SOURCE

R
Tuple R

Tuple R

Tuple S

Matching

</div>
(4)<div class='page_container' data-page=4>

Sort Merge Join

 Nguyên tắc

 Sắp xếp dữ liệu đầu vào

 trộn dữ liệu

 Đặc điểm

 two-pass, blocking algorithm

 Chi phí?

SOURCE 
S
SOURCE

R

Merge

Sort Sort

Hash Join (HJ)

 Nguyên tắc

 Tạo bảng băm trên R

 Đọc S và đối sánh với dữ liệu

trên bảng băm

 Đặc điểm

 two-pass, blocking algorithm

 Chi phí ?

SOURCE 
S

SOURCE

R

Tuple R Tuple S
Hash Table R

…

1 n

Matching

hash(Tuple S) 
hash(Tuple R)

build

</div>
(5)<div class='page_container' data-page=5>

Mơ hình giá

Chí phí thực hiện câu hỏi phụ thuộc:
 đọc/ghi bộ nhớ ngồi (số trang nhớ)
Kích thước dữ liệu phải xử lý

Chi phí truy nhập dữ liệu
Đọc ghi dữ liệu

xử lý

Truyền thông giữa các trạm làm việc

CTA = s * NBPAGES + t * NBNUPLETS (+ m * NBMESSAGES)

Trọng số

s = trọng số đọc/ghi dữ liệu (ví dụ = 1)
t = trọng số xử lý của CPU (ví dụ = 1/3)
m = trọng số truyền dữ liệu

Thông tin về các quan hệ

 Kích thước của các quan hệ và bản ghi

Thơng tin về các thuộc tính

Thơng tin về các chỉ số

Relation Cardinality Record size

WAGON 200000 60

TRAIN 60000 30

TRAFFIC 80000 20

Attribute Cardinality Size min-max

NW 200000 20

TYPE 200 5

COND 5 15

CAPACITY 400 15 5-45

NT 2000 10

DATE 800 6

Relation Attributes Unique Type Num of pages

WAGON NW Yes Principal 45

WAGON TYPE No Secondary 25

WAGON COND No Secondary 30

WAGON CAPACITY No Secondary 25

TRAIN NT No Principal 18

TRAFFIC NT No Principal 20

TRAFFIC DATE no Principal 40

Relation Cardinality Record size 
(num of rec./page)

Num. of pages

(NP’)

WAGON 200000 60(100) 1500(375)

TRAIN 60000 30 (200) 225(60)

</div>
(6)<div class='page_container' data-page=6>

Tối ưu

 Đặt vấn đề: Cho 1 câu truy vấn, các cây toán tử thực

thi nào sẽ được xem xét ?

 Khơng gian tìm kiếm

 Chiến lược tìm kiếm

 Ước lượng giá cho các kế hoạch thực thi

 Lý tưởng:tìm ra kế hoạch thực thi tốt nhất

Thực tế:Tránh kế hoạch thực thi tồi

Bộ tối ưu

Rewriter

Planner 
Method-Structure

Space

Algebraic

Space

</div>
(7)<div class='page_container' data-page=7>

Query: R1 R2 R3 R4 R5

R3 R2 
R4

R1 
R5

Optimal Plan:

R3 R2 
R4

R1 
R5

Optimal Plan:

Optimal plan for joining R3, R2, R4

Query: R1 R2 R3 R4 R5

</div>

Bài giảng Thiết kế và quản trị cơ sở dữ liệu - Chương 4: Xử lý truy vấn và hiệu năng hệ CSDL

Xử lý truy vấn và

hiệu năng hệ CSDL

Xử lý câu hỏi truy vấn

Cây toán tử

Các phép toán vật lý (thuật toán)

Thuật toán

Truy nhập bảng

Phép toán nhiều pha:

Nested-Loops Join

Sort Merge Join

Hash Join (HJ)

<b>… </b>

Mơ hình giá

Thông tin về các quan hệ

Tối ưu

Bộ tối ưu

Tài liệu liên quan

Tài liệu bạn tìm kiếm đã sẵn sàng tải về