Tải bản đầy đủ (.pdf) (4 trang)

Cơ sở dữ liệu trên bộ nhớ (in memory DB) và ứng dụng trong hệ thống phần mềm cần xử lý cơ sở dữ liệu hiệu năng cao

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (449.74 KB, 4 trang )

Cơ sở dữ liệu trên bộ nhớ (in - memory DB) và
ứng dụng trong hệ thống phần mềm cần xử lý
cơ sở dữ liệu hiệu năng cao


Hoàng Trí Nhân


Viện Công nghệ thông tin. Đại học Quốc gia Hà Nội
Luận văn ThS. Công nghệ thông tin: Chương trình đào tạo thí điểm
Người hướng dẫn : TS. Đinh Văn Dũng
Năm bảo vệ: 2013
60 tr .

Abstract. Trình bày hiện trạng nghiên cứu “Cơ sở dữ liệu trên bộ nhớ” trong và ngoài
nước. Tìm hiểu chuyên sâu kiến thức về Cơ sở dữ liệu trên bộ nhớ: khái niệm, kiến
trúc, đặc điểm tính năng, ưu nhược điểm. Nghiên cứu các sản phẩm Cơ sở dữ liệu trên
bộ nhớ, so sánh với các công nghệ, sản phẩm cạnh tranh. Tổng quát hóa các bài toán
nghiệp vụ, kiến trúc có thể áp dụng Cơ sở dữ liệu trên bộ nhớ; Cài đặt thử nghiệm.
Đưa ra những đề xuất, ý tưởng ứng dụng, cải tiến với cơ sở dữ liệu trên bộ nhớ
Keywords.Công nghệ thông tin; Quản lý hệ thống thông tin; Cơ sở dữ liệu;Phần mềm;
Tin học
Content.
1. Sự cấp thiết của đề tài
Sự phát triển với tốc độ rất nhanh của công nghệ thông tin bao gồm cả phần
cứng, phần mềm và hạ tầng mạng (Internet, LAN, WAN…) đã làm thay đổi bộ mặt và
hình thức kinh doanh trên quy mô toàn thế giới. Giờ đây hầu hết các quy trình kinh
doanh đều được tự động hóa, công nghệ thông tin hóa một cách tối đa. Các hệ thống
công nghệ thông tin đang là xương sống của những tập đoàn, tổ chức kinh doanh từ
nhỏ đến lớn, và khi việc kinh doanh phát triển hơn (nhiều khách hàng hơn, nhiều lĩnh
vực hơn, tinh vi hơn) nhưng cũng nhiều cạnh tranh hơn, những công ty tổ chức này


yêu cầu xây dựng những hệ thống phần mềm ngày càng lớn và phức tạp, nhưng vẫn
phải đáp ứng những yêu cầu về hiệu năng. Để đáp ứng yêu cầu này, ngành công nghệ
thông tin cũng đã có những bước phát triển nhanh chóng: phần cứng rẻ hơn, nhanh
hơn, băng thông mạng lớn hơn, các công cụ lập trình tiện dụng hơn, hiệu quả hơn,…
Nhưng thật không may có một thành phần quan trọng của các hệ thống công nghệ
thông tin là Cơ sở dữ liệu truyền thống lại không có được những phát triển ấn tượng
như vậy. Khi xây dựng những hệ thống lớn với số lượng dữ liệu cũng như số giao dịch
lớn, Cơ sở dữ liệu truyền thống (dựa trên ổ đĩa cứng) trở thành điểm nghẽn ảnh hưởng
không nhỏ đến hiệu năng của toàn bộ hệ thống. Thực trạng này đặt ra những yêu cầu
cần tìm ra những phương pháp, hướng đi mới cho hệ thống Cơ sở dữ liệu. Tại Việt
Nam, yêu cầu này càng trở nên cấp thiết hơn bao giờ hết khi hệ thống công nghệ thông
tin ngày càng đóng vai trò quan trọng trong quy trình hoạt động kinh doanh và thành
công của doanh nghiệp, số lượng các doanh nghiệp tổ chức ra đời ngày càng nhiều
trong môi trường kinh doanh cạnh tranh hơn, và chủ trương của Nhà nước về phát triển
khoa học công nghệ phục vụ sự phát triển chung của đất nước.
Để giải quyết vấn đề này, hiện cũng đã có các nghiên cứu thử nghiệm nhằm làm
tăng tốc độ truy vấn dữ liệu. Từ cơ sở tốc độ truy vấn của ổ cứng chậm hơn chip nhớ
flash, chip nhớ chậm hơn bộ nhớ chính (RAM), một hướng đi là đổi phương tiện lưu
trữ dữ liệu của CSDL từ ổ cứng sang SSD (chíp nhớ flash) hoặc RAM disk (giả lập ổ
cứng thành RAM), tốc độ truy vấn đã được cải thiện. Một hướng đi khác là In-memory
database (IMDB), lưu toàn bộ dữ liệu trong bộ nhớ chính. Kết quả so sánh giữa cơ sở
dữ liệu trên ổ cứng, trên SSD, trên bộ nhớ chính đã cho thấy sử dụng cơ sở dữ liệu trên
bộ nhớ là một hướng đi đúng đắn. Cơ sở dữ liệu trên bộ nhớ (In-memory database) là
cơ sở dữ liệu quan hệ dựa trên bộ nhớ, bỏ qua các thao tác truy cập ổ đĩa cứng bằng
cách lưu trữ và xử lý dữ liệu ngay trên bộ nhớ chính. Nó còn được gọi với các tên khác
như Main memory database (cơ sở dữ liệu bộ nhớ chính) hoặc real-time database (cơ
sở dữ liệu thời gian thực). Khác biệt cơ bản giữa Cơ sở dữ liệu trên bộ nhớ với cơ sở
dữ liệu truyền thống là nó sử dụng bộ nhớ chính (RAM) để lưu trữ dữ liệu. Khi đó tốc
độ truy cập không chỉ được cải thiện vì tốc độ đọc/ghi của RAM nhanh hơn mà còn vì
kiến trúc của hệ thống CSDL đơn giản hơn rất nhiều, cũng như không cần các cơ chế

buffer, không cần liên tục copy dữ liệu cache từ ổ cứng lên RAM, đồng thời các thuật
toán tối ưu câu truy vấn, tổ chức dữ liệu, chỉ mục cũng được tối ưu hơn.
Hiện nay, các nhà cung cấp giải pháp lưu trữ dữ liệu hàng đầu thế giới cũng đang
hướng về giải pháp Cơ sở dữ liệu trên bộ nhớ để cải thiện tốc độ truy cập dữ liệu. Điển
hình phải kể đến Oracle với sản phẩm Oracle TimesTen, IBM với sản phẩm IBM
solidDB. Ngoài ra, các công ty nhỏ và cộng đồng mã nguồn mở cũng tham gia mạnh
mẽ vào việc nghiên cứu phát triển và sử dụng cơ sở dữ liệu trên bộ nhớ. Tại Việt Nam,
chưa có nhiều nghiên cứu, bài viết chính thống về Cơ sở dữ liệu trên bộ nhớ, chủ yếu
là các thông tin trên một số diễn đàn công nghệ thông tin, các nghiên cứu toàn diện và
chuyên sâu lại càng hiếm. Từ đó đặt ra yêu cầu cấp thiết và thực tế là cần có một
nghiên cứu chuyên sâu và toàn diện về Cơ sở dữ liệu trên bộ nhớ: kiến trúc, đặc điểm
chức năng, ưu nhược điểm, cũng như cách sử dụng chúng sao cho hiệu quả.
2. Mục tiêu nghiên cứu
- Tìm hiểu hiện trạng, tình hình nghiên cứu Cơ sở dữ liệu trên bộ nhớ
- Nghiên cứu kiến thức cơ sở của Cơ sở dữ liệu trên bộ nhớ: khái niệm, kiến
trúc, đặc điểm tính năng
- Nghiên cứu ưu nhược điểm của Cơ sở dữ liệu trên bộ nhớ, các sản phẩm Cơ
sở dữ liệu trên bộ nhớ, so sánh với các công nghệ, sản phẩm cạnh tranh
- Tổng quát hóa các bài toán nghiệp vụ, kiến trúc có thể áp dụng Cơ sở dữ
liệu trên bộ nhớ; Cài đặt thử nghiệm.
- Đưa ra những đề xuất, ý tưởng ứng dụng, cải tiến với Cơ sở dữ liệu trên bộ
nhớ
3. Đối tượng, phạm vi và phương pháp nghiên cứu
- Đối tượng nghiên cứu: Cơ sở dữ liệu trên bộ nhớ
- Phạm vi nghiên cứu:
 Cơ sở lý luận, kiến thức cơ sở khoa học về Cơ sở dữ liệu trên bộ
nhớ
 Điểm khác biệt, lợi thế cạnh tranh của Cơ sở dữ liệu trên bộ nhớ, ưu
nhược điểm
 Các sản phẩm Cơ sở dữ liệu trên bộ nhớ

 Mô hình áp dụng và kết quả thực nghiệm
- Phương pháp nghiên cứu:
 Nghiên cứu lý thuyết: tìm hiểu lý thuyết về Cơ sở dữ liệu trên bộ
nhớ trên các paper, diễn đàn nổi tiếng, các website chính thức của
các công ty có sản phẩm hoặc giải pháp liên quan Cơ sở dữ liệu trên
bộ nhớ.
 Thử nghiệm: tổng quát hóa loại bài toán có thể áp dụng Cơ sở dữ
liệu trên bộ nhớ, chọn lựa một sản phẩm Cơ sở dữ liệu trên bộ nhớ
và hệ thống để áp dụng, rút ra kết quả.

4. Ý nghĩa khoa học và thực tiễn
- Ý nghĩa khoa học:
 Lý thuyết về Cơ sở dữ liệu trên bộ nhớ: khái niệm, mô hình kiến
trúc, ưu nhược điểm
 Phân tích so sánh với các công nghệ cạnh tranh, so sánh nội tại các
sản phẩm Cơ sở dữ liệu trên bộ nhớ.
- Ý nghĩa thực tiễn:
 Tổng quát hóa lớp bài toán có thể áp dụng Cơ sở dữ liệu trên bộ nhớ
để tăng hiệu năng
 Kết quả thử nghiệm
5. Bố cục của luận văn
- Chương 1: Cơ sở lý luận về Cơ sở dữ liệu trên bộ nhớ
- Chương 2: Cơ sở khoa học về Cơ sở dữ liệu trên bộ nhớ
- Chương 3: Các sản phẩm Cơ sở dữ liệu trên bộ nhớ
- Chương 4: Thử nghiệm Cơ sở dữ liệu trên bộ nhớ
- Kết luận và Hướng nghiên cứu tiếp theo
TÀI LIỆU THAM KHẢO
1. Hector Garcia, Kenneth Salem, Main Memory Database System, e-paper
2. Adina costea, Main Memory Database Systems, e-paper
3. />rview_of_MMDB

4. Oracle (2010), TimesTen Introduction, e-book
5. Oracle (2010), TimesTen Installation guide, e-book
6. Oracle (2010), TimesTen Operation guide, e-book
7. Oracle (2010), TimesTen Cache Guide, e-book
8. Oracle (2010), TimesTen to TimesTen Replication, e-book
9. Oracle (2010), Java Developer guide, e-book
10. IBM software, IBM solidDB, e-book
11. IBM software, IBM solidDB Universal Cache, ebook
12. Elliot King, The growth and expanding application of In-memory database,
whitepaper, 2011.
13. McObject, eXtremeDB in-memory database system, ebook
14. Thomas Mueller, H2 database engine, ebook
15. Blaine Simpson, Fred Toussi, HyperSQL database engine, ebook

×