Tối ưu truy vấn cơ sở dữ liệu quan hệ và cơ sở
dữ liệu phân tán bằng phương pháp Heuristic
Đinh Thị Lan Phương
Trường Đại học Công nghệ
Luận văn ThS chuyên ngành: Công nghệ thông tin; Mã số: 1 01 10
Người hướng dẫn: TS. Nguyễn Tuệ
Năm bảo vệ: 2007
Abstract: Tổng quan về cơ sở dữ liệu (CSDL): CSDL quan hệ, hệ quản trị CSDL, mô
hình dữ liệu quan hệ, hệ CSDL phân tán. Tổng quan về tối ưu hóa truy vấn: bài toán tối
ưu hóa truy vấn, bộ tối ưu hóa truy vấn. Trình bày một số phương pháp tối ưu hóa truy
vấn trong môi trường tập trung và trong môi trường phân tán. Phân tích phương pháp tối
ưu hóa bằng Heuristic: các chiến lược tối ưu tổng quát, các phép biến đổi đại số quan hệ,
thuật toán Heuristic, ví dụ tối ưu hóa câu hỏi theo Heuristic
Keywords: Công nghệ thông tin; Cơ sở dữ liệu; Cơ sở dữ liệu phân tán; Cơ sở dữ liệu
quan hệ; Phương pháp Heuristic
Content
MỞ ĐẦU
1. Đặt vấn đề
Trong thời đại của nền kinh tế tri thức mà chúng ta đang sống, mọi hoạt động muốn đạt
hiệu quả cao thì nhất thiết phải có được thông tin, tri thức cần thiết một cách nhanh chóng và
chính xác. Thông tin có thể có được ở mọi nơi, và CSDL là một trong những nguồn cung cấp
thông tin.
Vấn đề đặt ra là khối lượng thông tin lưu trữ lớn song đòi hỏi việc xử lý thông tin phải
nhanh chóng và hiệu quả. Để lấy được thông tin cần thiết ta cần thực hiện hàng loạt các thao tác
trên CSDL thông qua các câu truy vấn. Từ câu truy vấn ban đầu có thể thực hiện theo các
phương pháp khác nhau để có kết quả song cần phải hạ thấp chi phí thực hiện truy vấn gọi là tối
ưu hoá truy vấn. Tuy nhiên để có được phương án tối ưu nhất thì có thể chi phí cho quá trình tối
ưu lại rất cao.
Xuất phát từ những đặc điểm chung và tính thời sự nêu trên, tôi đã chọn đề tài nghiên
cứu về tối ưu hoá truy vấn và đi sâu vào tìm hiểu về phương pháp tối ưu truy vấn bằng
Heuristic mong được đóng góp một phần nhỏ bé trong việc nghiên cứu về các phương pháp tối
ưu hoá truy vấn dữ liệu để khai thác thông tin một cách có hiệu quả và nhanh chóng, trợ giúp cho
những người sử dụng dữ liệu thực hiện tốt công việc của mình.
2. Mục tiêu của luận văn
Mục tiêu của đề tài là nghiên cứu các phương pháp tối ưu hoá truy vấn, đặc biệt tập trung
nghiên cứu phương pháp tối ưu hoá bằng Heuristic. Luận văn bao gồm các vấn đề chính sau đây:
- Nghiên cứu về cơ sở dữ liệu quan hệ và cơ sở dữ liệu phân tán.
- Tìm hiểu bài toán tối ưu hoá truy vấn.
- Tìm hiểu một số phương pháp tối ưu hoá trong môi trường tập trung và phân tán.
- Nghiên cứu phương pháp tối ưu hoá truy vấn bằng Heuristic
3. Bố cục của luận văn
Luận văn gồm 4 chương:
Chương 1: Tổng quan về cơ sở dữ liệu quan hệ và cơ sở dữ liệu phân tán.
Chương 2: Bài toán tối ưu hoá truy vấn.
Chương 3: Một số phương pháp tối ưu hoá truy vấn trong môi trường tập trung và phân tán
Chương4: Phương pháp tối ưu hoá truy vấn bằng Heuristic, ví dụ minh hoạ.
References
Tài liệu tiếng Việt:
[1]. Nguyễn Kim Anh, Nguyên lý các hệ cơ sở dữ liệu, NXB ĐH Quốc Gia Hà Nội, 2004
[2]. Trần Tiến Dũng, Giáo trình lý thuyết và thực hành Oracle, NXB Giáo dục, 2000
[3]. Đỗ Phúc, Bài giảng cơ sở dữ liệu nâng cao (Dành cho lớp cao học CNTT), 2004
[4]. Đỗ Phúc - Nguyễn Tăng Tỵ, Giáo trình cơ sở dữ liệu, NXB Đại học QG TP Hồ Chí
Minh, 2006
[5]. Jeffrey D.Ulman, biên dịch Trần Đức Quang (2002), Nguyên lý các hệ cơ sở dữ liệu và
cơ sở tri thức, tập I và II, NXB thống kê.
[6]. Nguyễn Bá Tường, Nhập môn cơ sở dữ liệu phân tán, NXB Khoa học và kỹ thuật,
2005
[7]. Phạm Thế Quế, Giáo trình CSDL, Lý thuyết và thực hành, NXB Bưu Điện, 2004
[8].Tìm hiểu một số vấn đề về tối ưu hoá truy vấn, luận văn thạc sỹ, Nguyễn Thị Vân Anh
Tài liệu tiếng Anh:
[9]. Advanced Database Systems CS632 Spring 2001
[10]. Distributed Database by Farnoush Banaei – Kashani excerpt from “Principles of
Distributed Database System”, M.Tamer Özsu and Patrick Valduriez, April 19,2006
[11]. INGRES. 15-823. Advanced Topics in Database Systems Performance. 2, 2001
Anastassia
[12]. Query Optimization