Tải bản đầy đủ (.pdf) (126 trang)

Nghiên cứu mô hình hướng đối tượng cho cơ sở dữ liệu hướng thời gian ứng dụng thời gian vào việc quản lý dữ liệu chuỗi thời gian

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.17 MB, 126 trang )

Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

LỜI CẢM ƠN

Tôi xin được gửi lời cảm ơn chân thành đến:

-

Tiến sĩ Dương Tuấn Anh đã tận tình chỉ bảo, hướng dẫn tơi nghiên cứu và
thực hiện luận văn này. Nếu khơng có sự theo dõi và động viên của thầy, tôi
sẽ không thể hoàn thành luận văn đúng thời gian quy định.

-

Các thầy cô của Khoa Công nghệ Thông tin trường Đại học Bách khoa TP.
Hồ Chí Minh đã tận tâm giảng dạy mở ra cho chúng tôi những con đường
đến với những tri thức mới.

-

Anh Lại Đức Nhuận đã cung cấp những dữ liệu quan trọng thiết thực góp
phần làm sinh động luận văn.

-

Gia đình, bạn bè thân thiết những người ln bên tơi, động viên khuyến
khích tơi vào những thời điểm quan trọng của cuộc đời tôi.

_______________________________________________________________________
Lê Ngọc Minh Trị



Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

LƯU Ý VỀ TÊN ĐỀ TÀI

Tên đề tài:

NGHIÊN CỨU MƠ HÌNH HƯỚNG ĐỐI TƯỢNG CHO CƠ SỞ
DỮ LIỆU HƯỚNG THỜI GIAN - ỨNG DỤNG VÀO VIỆC QUẢN LÝ
DỮ LIỆU CHUỖI THỜI GIAN
sẽ được đổi tên thành:

QUẢN LÝ DỮ LIỆU CHUỖI THỜI GIAN
BẰNG MƠ HÌNH DỮ LIỆU QUAN HỆ - ĐỐI
TƯỢNG
cho sát với nội dung thực hiện trong luận văn.

_______________________________________________________________________
Lê Ngọc Minh Trị


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

TÓM TẮT
Hệ quản trị dữ liệu chuỗi thời gian là một thành phần đặc biệt quan trọng của
cơ sở dữ liệu hướng thời gian. Ngày này, dữ liệu chuỗi thời gian được ứng dụng hết
sức rộng rãi trong thực tiễn. Dữ liệu tài chính và dữ liệu khoa học là hai ví dụ tiêu
biểu có thể được mơ hình bằng chuỗi thời gian. Mặc dù đã có một số những cơng
trình nghiên cứu về việc quản lý chuỗi thời gian, nhưng vẫn còn khá ít những tài
liệu quan tâm đến việc làm cách nào ánh xạ dữ liệu chuỗi thời gian vào trong các

mô hình dữ liệu hiện thực. Theo khuynh hướng này, luận văn sẽ nêu ra một số
hướng tiếp cận mới nhằm ánh xạ chuỗi thời gian đã được trực quan hoá bằng mơ
hình dữ liệu thời gian tích hợp ITDM vào mơ hình dữ liệu quan hệ - đối tượng, tiêu
biểu là DBMS ORACLE. Để đánh giá rõ ràng hơn về các cách ánh xạ này, luận văn
cũng đã hiện thực hai ứng dụng tài chính tiêu biểu: chuỗi thời gian về thị trường
chứng khoán Việt Nam và chuỗi thời gian về tỉ giá ngoại tệ. Trong hai ứng dụng thử
nghiệm này có sử dụng đặc tính quan hệ - đối tượng tiêu biểu của hệ quản trị cơ sở
dữ liệu quan hệ - đối tượng ORACLE, góp phần giúp cho việc hiện thực cơ sở dữ
liệu chuỗi thời gian trở nên rõ ràng và linh hoạt.

_______________________________________________________________________
Lê Ngọc Minh Trị


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

ABSTRACT
Time series data management system is a special type of temporal databases
that has a variety of practical applications. Financial data and scientific data are
examples that can be modeled with time series. Though there have been some
researches on time series management, very few studies have reported how to map
time series data into implementation data models. In this thesis, we propose some
approaches to map time series represented in Integrated Temporal Data Model
(ITDM) into object-relational data model so that we can implement time series
databases on some object-relational DBMS such as ORACLE. To evaluate the
mapping scheme, we have applied it in two typical financial applications:
Vietnamese stock time series and foreign exchange rate time series. The two
experiments have shown that by using object-relational features of an objectrelational DBMS such as ORACLE, the implementation of time series databases
becomes feasible and quite straightforward.


_______________________________________________________________________
Lê Ngọc Minh Trị


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

MỤC LỤC
LỜI CẢM ƠN .............................................................................................................
LƯU Ý VỀ TÊN ĐỀ TÀI ...........................................................................................
TÓM TẮT ...................................................................................................................
ABSTRACT ................................................................................................................
MỤC LỤC ...................................................................................................................
Chương 1: GIỚI THIỆU ĐỀ TÀI ............................................................................ 1
1.1 GIỚI THIỆU CHUNG ................................................................................................1
1.2 MỤC TIÊU LUẬN VĂN ............................................................................................2
1.3 ĐÓNG GÓP CỦA LUẬN VĂN .................................................................................3
1.4 CẤU TRÚC CỦA LUẬN VĂN..................................................................................3

Chương 2: DỮ LIỆU CHUỖI THỜI GIAN – NHỮNG KHÁI NIỆM CĂN BẢN
VÀ CÁC CƠNG TRÌNH LIÊN QUAN.................................................................. 5
2.1 NHỮNG KHÁI NIỆM VỀ CƠ SỞ DỮ LIỆU HƯỚNG THỜI GIAN.......................5
2.1.1 Cơ sở dữ liệu hướng thời gian (Temporal Database) ..........................................5
2.1.2 Thời gian hợp lệ (Valid Time).............................................................................5
2.1.3 Thời gian giao dịch (Transaction Time) ..............................................................5
2.1.4 Nhãn thời gian (Timestamp)................................................................................6
2.1.5 Độ mịn thời gian (Granularity)............................................................................6
2.2 DỮ LIỆU CHUỖI THỜI GIAN (Time Series Data) ..................................................7
2.2.1 Khái niệm.............................................................................................................7
2.2.2 Lịch dùng trong chuỗi dữ liệu thời gian (Calendar for Time Series) ................10
2.3 MƠ HÌNH DỮ LIỆU THỜI GIAN TÍCH HỢP........................................................11

2.4 TỔNG THUẬT VỀ CÁC CƠNG TRÌNH LIÊN QUAN..........................................14
2.4.1 Các cơng trình tập trung vào mơ hình dữ liệu chuỗi thời gian ..........................14
2.4.2 Các cơng trình đi sâu vào các phương pháp ánh xạ chuỗi thời gian .................15
2.4.3 Các cơng trình thiên về những ứng dụng của chuỗi thời gian ...........................16

Chương 3: PHƯƠNG PHÁP ÁNH XẠ DỮ LIỆU CHUỖI THỜI GIAN VÀO
CÁC MƠ HÌNH DỮ LIỆU THƠNG DỤNG ....................................................... 19
3.1 ÁNH XẠ VÀO CƠ SỞ DỮ LIỆU QUAN HỆ .........................................................19
3.2 ÁNH XẠ VÀO CƠ SỞ DỮ LIỆU HƯỚNG ĐỐI TƯỢNG .....................................23
3.3 ÁNH XẠ VÀO CƠ SỞ DỮ LIỆU QUAN HỆ - ĐỐI TƯỢNG................................26
3.3.1 Lý do sử dụng cơ sở dữ liệu quan hệ - đối tượng ..............................................26
3.3.2 Ánh xạ vào cơ sở dữ liệu quan hệ - đối tượng...................................................29

Chương 4: ỨNG DỤNG VÀO CƠ SỞ DỮ LIỆU THỊ TRƯỜNG CHỨNG
KHOÁN VÀ CƠ SỞ DỮ LIỆU TỈ GIÁ NGOẠI TỆ .......................................... 38
4.1 NHỮNG ĐẶC ĐIỂM CỦA DBMS QUAN HỆ - ĐỐI TƯỢNG ORACLE ............39
4.1.1 Các câu lệnh SQL ..............................................................................................39
4.1.2 Các đặc điểm của mơ hình quan hệ - đối tượng thể hiện trong PL/SQL...........40
4.2 CHUỖI THỜI GIAN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM (CÁCH 1)...44
_______________________________________________________________________
Lê Ngọc Minh Trị


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng
4.2.1 Mô tả bài tốn ....................................................................................................45
4.2.2 Mơ hình ITDM của chuỗi thời gian SSI............................................................45
4.2.3 Ánh xạ chuỗi thời gian SSI vào DBMS Oracle (cách 1)...................................46
4.2.4 Các Member Function và Member Procedure...................................................50
4.3 CHUỖI THỜI GIAN TỈ GIÁ NGOẠI TỆ (CÁCH 2)...............................................52
4.3.1 Mơ tả bài tốn ....................................................................................................53

4.3.2 Mơ hình ITDM của chuỗi thời gian tỉ giá ngoại tệ............................................53
4.3.3 Ánh xạ chuỗi thời gian tỉ giá ngoại tệ vào DBMS Oracle (Cách 2)..................54
4.3.4 Các Member Function và Member Procedure...................................................57

Chương 5: HIỆN THỰC MỘT SỐ THAO TÁC TRUY VẤN DỮ LIỆU CHUỖI
THỜI GIAN CỦA HAI ỨNG DỤNG TRÊN....................................................... 59
5.1 CHUỖI THỜI GIAN THỊ TRƯỜNG CHỨNG KHOÁN VIỆT NAM ....................59
5.1.1 Các Stored Procedure ........................................................................................59
5.1.2 Các truy vấn.......................................................................................................62
5.1.3 Biểu diễn bằng đồ thị trực quan.........................................................................66
5.2 CHUỖI THỜI GIAN TỈ GIÁ NGOẠI TỆ ................................................................68
5.2.1 Các Stored Procedure ........................................................................................68
5.2.2 Các truy vấn.......................................................................................................72
5.2.3 Biểu diễn bằng đồ thị trực quan.........................................................................77

Chương 6: KẾT LUẬN ........................................................................................... 80
6.1 ĐÁNH GIÁ VỀ HAI CÁCH THỨC ÁNH XẠ ........................................................80
6.1.1 Ánh xạ vào DBMS quan hệ - đối tượng theo CÁCH 1 .....................................80
6.1.2 Ánh xạ vào DBMS quan hệ - đối tượng theo CÁCH 2 .....................................81
6.2 TỔNG KẾT ...............................................................................................................82
6.3 NHỮNG ỨNG DỤNG THỰC TIỄN........................................................................83
6.4 HƯỚNG PHÁT TRIỂN ............................................................................................84

TÀI LIỆU THAM KHẢO ..................................................................................... 85
Phụ lục A: LƯỢC ĐỒ THIẾT KẾ CƠ SỞ DỮ LIỆU MỨC LUẬN LÝ CỦA
CHUỖI THỜI GIAN THỊ TRƯỜNG CHỨNG KHOÁN ..................................A1
Phụ lục B: LƯỢC ĐỒ THIẾT KẾ CƠ SỞ DỮ LIỆU MỨC LUẬN LÝ CỦA
CHUỖI THỜI GIAN TỈ GIÁ NGOẠI TỆ...........................................................B1
Phụ lục C: MỘT SỐ ĐẶC ĐIỂM THÔNG DỤNG CỦA PL/SQL.................C1
C.1 CÁC CẤU TRÚC ĐIỀU KHIỂN TRONG PL/SQL.............................................. C1

C.1.1 Cấu trúc điều kiện IF........................................................................................ C1
C.1.2 Cấu trúc lặp LOOP........................................................................................... C3
C.2 CURSOR TRONG PL/SQL ................................................................................... C5
C.2.1 Khai báo CURSOR .......................................................................................... C6
C.2.2 Mở CURSOR................................................................................................... C6
C.2.3 Lấy giá trị từ CURSOR.................................................................................... C6
C.2.4 Đóng CURSOR................................................................................................ C7
C.2.5 Các thuộc tính của CURSOR........................................................................... C7
C.3 PROCEDURE VÀ FUNCTION............................................................................. C7
C.3.1 Procedure ......................................................................................................... C8
C.3.2 Function ........................................................................................................... C9
_______________________________________________________________________
Lê Ngọc Minh Trị


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Phụ lục D: TỔNG QUAN VỀ THỊ TRƯỜNG CHỨNG KHOÁN .................D1
D.1 MỘT SỐ KHÁI NIỆM ...........................................................................................D1
D.1.1 Thị trường tài chính ........................................................................................D1
D.1.2 Cấu trúc của thị trường tài chính ....................................................................D1
D.1.3 Thị trường tiền tệ (Money Market).................................................................D1
D.1.4 Thị trường vốn (Capital Market) ....................................................................D2
D.2 CHỨC NĂNG VÀ VAI TRỊ CỦA THỊ TRƯỜNG CHỨNG KHỐN...............D2
D.2.1 Chức năng của thị trường chứng khốn..........................................................D2
D.2.2 Vai trị của thị trường chứng khốn ................................................................D3
D.3 CHỨNG KHỐN ..................................................................................................D3
D.3.1 Khái niệm........................................................................................................D3
D.3.2 Trái phiếu........................................................................................................D3
D.3.3 Cổ phiếu thường (Common Stock).................................................................D4

D.3.4 Cổ phiếu ưu đãi (Preferred Stock) ..................................................................D5
D.4 CƠNG TY CHỨNG KHỐN................................................................................D6
D.4.1 Khái niệm........................................................................................................D6
D.4.2 Chức năng của cơng ty chứng khốn..............................................................D6

Phụ lục E:

CÀI ĐẶT CHƯƠNG TRÌNH..........................................................E1

Phụ lục F:

CÁC THUẬT NGỮ.......................................................................... F1

_______________________________________________________________________
Lê Ngọc Minh Trị


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Chương 1:

GIỚI THIỆU ĐỀ TÀI
Chuỗi thời gian là một dạng đặc biệt của cơ sở dữ liệu hướng thời gian, được ứng
dụng rộng rãi trong thực tiễn. Mặc dù đã có khá nhiều những nghiên cứu trên cơ sở dữ liệu
hướng thời gian, nhưng vẫn cịn rất thiếu những cơng trình nghiên cứu về dữ liệu chuỗi
thời gian (Time Series Data). Đặc biệt là làm cách nào để ánh xạ dữ liệu chuỗi thời gian
vào những mơ hình dữ liệu hiện thực. Chính vì vậy, luận văn sẽ thảo luận về các phương
pháp ánh xạ dữ liệu chuỗi thời gian vào những mơ hình dữ liệu khác nhau. Trong đó,
phương pháp ánh xạ vào mơ hình quan hệ - đối tượng được chú trọng vì những ưu điểm
nổi bật của nó.


1.1 GIỚI THIỆU CHUNG
Việc tách biệt chương trình và dữ liệu là một bước tiến quan trọng trong lập trình.
Các nhà phát triển có thể tập trung hơn vào việc viết chương trình mà khơng cịn bị chi
phối q nhiều vào việc quản lý dữ liệu nữa. Những thao tác trên dữ liệu đã được giao phó
hết cho các hệ quản trị cơ sở dữ liệu (DataBase Management System – DBMS) tin cậy.
Các hãng sản xuất ngày nay chú trọng vào việc phát triển các hệ quản trị cơ sở dữ liệu
quan hệ (Relational DataBase Management System – RDBMS), các hệ quản trị cơ sở dữ
liệu hướng đối tượng (Object-oriented DataBase Management System – ODBMS), cũng
như những hệ quản trị cơ sở dữ liệu quan hệ - đối tượng (Object-Relational DataBase
Management System – ORDBMS).
Tuy nhiên, các nhà thiết kế cũng như những nhà phát triển khi đi vào khảo sát, thiết
kế, lập trình hay hiện thực các ứng dụng thường bỏ qua các yếu tố về thời gian. Mặt khác,
những hệ quản trị cơ sở dữ liệu tuy đa dạng về chất lượng, phong phú về chủng loại, số
lượng nhưng lại không hỗ trợ, cũng như hỗ trợ rất ít về việc lưu trữ, thao tác trên dữ liệu
hướng thời gian.
Ngày càng có nhiều những bài tốn thực tế được ứng dụng cơng nghệ thơng tin
cũng như đã và đang được mơ hình hóa rộng rãi vào trong máy tính. Những ứng dụng này
khơng chỉ tập trung vào việc lưu trữ, thao tác trên những dữ kiện bất biến, cố định, không
thay đổi theo thời gian mà còn tập trung vào những dữ liệu mang ít nhiều các yếu tố về mặt
thời gian. Cơ sở dữ liệu hướng thời gian (Temporal Database) trở nên hết sức quan trọng
và cần thiết. Việc bỏ công sức, thời gian ra để nghiên cứu, ứng dụng cơ sở dữ liệu hướng
thời gian vào thực tiễn là hoàn toàn cần thiết.
Trong cơ sở dữ liệu hướng thời gian, dữ liệu chuỗi thời gian là một phần quan trọng
không thể thiếu. Dữ liệu chuỗi thời gian ngày càng được sử dụng rộng rãi từ những ứng
dụng khoa học đến những ứng dụng kinh tế, tài chính như:

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 1



Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Dự báo thời tiết: Lưu trữ những dữ liệu chuỗi thời gian về nhiệt độ, độ ẩm,
tốc độ gió… thay đổi liên tục theo từng giờ, từng phút là cực kỳ quan trọng
trong việc dự báo sự thay đổi của thời tiết.
Môi trường: Việc đo đạt, lưu trữ số liệu về số lượng băng ở hai cực của trái
đất theo từng tháng, từng năm là một bằng chứng quan trọng cho thấy sự thay
đổi của môi trường sống trên trái đất.
Ngân hàng: Trong tất cả các ngân hàng đều tồn tại nhu cầu về việc quản lý
những dữ liệu chuỗi thời gian về tỉ giá vàng, tỉ giá ngoại tệ luôn luôn biến
động không ngừng trong từng phút.
Thị trường chứng khoán: Giá cổ phiếu được niêm yết trên thị trường chứng
khoán là một dữ liệu chuỗi thời gian tiêu biểu.
Kinh doanh: Việc quản lý doanh thu hàng ngày, hàng tháng cũng là cơng việc
chính trong hoạt động kinh doanh của mỗi công ty.

Rõ ràng, dữ liệu chuỗi thời gian được ứng dụng hết sức rộng rãi trong rất nhiều lĩnh
vực thực tiễn. Tuy nhiên, mãi cho đến những năm gần đây dữ liệu chuỗi thời gian mới
được các nhà khoa học tập trung nghiên cứu một cách có hệ thống. Hiện tại, vẫn cịn rất
thiếu những cơng trình nghiên cứu tương xứng với vai trò của dữ liệu chuỗi thời gian, đặc
biệt là làm thế nào để ánh xạ dữ liệu chuỗi thời gian vào những mơ hình dữ liệu hiện thực.
Chính tầm quan trọng của dữ liệu chuỗi thời gian, những ứng dụng rộng rãi của nó,
cũng như nhu cầu phải tiến hành nghiên cứu dữ liệu chuỗi thời gian là động lực thơi thúc
các nhà khoa học tìm tịi, nghiên cứu về dữ liệu chuỗi thời gian và ứng dụng nó sao cho
hiệu quả. Đó cũng là mục đích chính của luận văn này.
Luận văn sẽ tập trung nghiên cứu về những phương pháp ánh xạ dữ liệu chuỗi thời
gian vào các mơ hình dữ liệu thơng dụng. Bên cạnh đó, luận văn sẽ đi sâu vào việc quản lý
dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng, bằng cách đưa ra hai

phương pháp ánh xạ dữ liệu chuỗi thời gian vào mơ hình quan hệ - đối tượng cũng như xây
dựng ứng dụng dữ liệu chuỗi thời gian về thị trường chứng khoán, tỉ giá ngoại tệ trên hệ
quản trị cơ sở dữ liệu quan hệ - đối tượng Oracle, đồng thời hiện thực một số thao tác truy
vấn thông dụng trên hai loại dữ liệu chuỗi thời gian này.

1.2 MỤC TIÊU LUẬN VĂN
Tìm hiểu những tính chất cơ bản của dữ liệu chuỗi thời gian.
Tham khảo những phương pháp ánh xạ dữ liệu chuỗi thời gian vào mơ hình dữ
liệu quan hệ và mơ hình dữ liệu hướng đối tượng.
Nghiên cứu phương pháp ánh xạ dữ liệu chuỗi thời gian vào mơ hình dữ liệu
quan hệ - đối tượng.

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 2


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Áp dụng phương pháp vừa nghiên cứu, xây dựng, hiện thực dữ liệu chuỗi thời
gian về thị trường chứng khoán cũng như dữ liệu chuỗi thời gian về tỉ giá
ngoại tệ trên hệ quản trị cơ sở dữ liệu quan hệ - đối tượng Oracle.
Thông qua hai ứng dụng thực tiễn này, tạo ra các truy vấn cơ bản trên dữ liệu
chuỗi thời gian. Đồng thời biểu diễn những dữ liệu chuỗi thời gian này thơng
qua đồ thị trực quan.

1.3 ĐĨNG GĨP CỦA LUẬN VĂN
Dữ liệu chuỗi thời gian có một tầm quan trọng nhất định. Đồng thời, các hệ quản trị
cơ sở dữ liệu quan hệ - đối tượng mang những đặc tính nổi bật được ứng dụng ngày một
rộng hơn. Chính vì vậy, luận văn đã tập trung nghiên cứu phương pháp ánh xạ dữ liệu

chuỗi thời gian vào mơ hình dữ liệu quan hệ - đối tượng. Luận văn đã thực hiện được
những công việc cụ thể sau:
Nghiên cứu cơ sở dữ liệu hướng thời gian nói chung, dữ liệu chuỗi thời gian
nói riêng. Trình bày những thuộc tính, đặc điểm, những thành phần chính của
dữ liệu chuỗi thời gian.
Tìm hiểu những cơng trình nghiên cứu liên quan đến dữ liệu chuỗi thời gian.
Tìm hiểu 2 phương pháp ánh xạ dữ liệu chuỗi thời gian vào mơ hình dữ liệu
quan hệ và mơ hình dữ liệu hướng đối tượng.
Nghiên cứu 2 cách thức ánh xạ dữ liệu chuỗi thời gian vào mơ hình dữ liệu
quan hệ - đối tượng.
Áp dụng phương pháp ánh xạ này hiện thực 2 ứng dụng chuỗi thời gian thị
trường chứng khoán Việt Nam và chuỗi thời gian tỉ giá ngoại tệ trên hệ quản
trị cơ sở dữ liệu quan hệ - đối tượng Oracle.
Hiện thực một số truy vấn cơ bản trên dữ liệu chuỗi thời gian của 2 ứng dụng
đã được hiện thực.
Biểu diễn trực quan sự biến động của những chuỗi thời gian này thông qua đồ
thị.
Rút ra những đánh giá về 2 cách thức ánh xạ chuỗi thời gian vào mơ hình dữ
liệu quan hệ - đối tượng.

1.4 CẤU TRÚC CỦA LUẬN VĂN
Luận văn sẽ được tổ chức thành 6 chương:
Chương 1: Giới thiệu về luận văn, lý do chọn luận văn cũng như những đóng
góp của luận văn.

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 3



Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Chương 2: Trình bày những định nghĩa, những khái niệm, những thuật ngữ
được sử dụng xuyên suốt trong luận văn cũng như các công trình liên quan.
Chương 3: Trình bày các phương pháp ánh xạ dữ liệu chuỗi thời gian đã được
biểu diễn bằng mơ hình dữ liệu thời gian tích hợp (IDTM) vào các mơ hình dữ liệu
thơng dụng.
Chương 4: Ứng dụng phương pháp vừa nghiên cứu, hiện thực dữ liệu chuỗi thời
gian về thị trường chứng khoán Việt Nam và dữ liệu chuỗi thời gian tỉ giá ngoại tệ trên
hệ quản trị cơ sở dữ liệu quan hệ - đối tượng Oracle.
Chương 5: Hiện thực một số thao tác truy vấn dữ liệu chuỗi thời gian của hai
ứng dụng trên.
Chương 6: Tổng kết lại những lý thuyết, những kỹ thuật, cũng như các kinh
nghiệm sau khi vận dụng phương pháp này. Qua đó đề xuất những hướng phát triển của
luận văn trong tương lai.
Sau chương 6 là những tài liệu tham khảo và các phụ lục gồm các nội dung:
Phụ lục A: Lược đồ thiết kế cơ sở dữ liệu mức luận lý của chuỗi thời gian thị
trường chứng khoán Việt Nam.
Phụ lục B: Lược đồ thiết kế cơ sở dữ liệu mức luận lý của chuỗi thời gian tỉ giá
ngoại tệ.
Phụ lục C: Một số những đặc điểm thông dụng của PL/SQL.
Phụ lục D: Tổng quan về thị trường chứng khoán.
Phụ lục E: Cách thức cài đặt chương trình.
Phụ lục F: Các thuật ngữ được sử dụng trong luận văn.
Như vậy, chương mở đầu đã giới thiệu tổng quan về những nhu cầu, những ứng
dụng rộng rãi của dữ liệu chuỗi thời gian, tầm quan trọng của cơ sở dữ liệu quan hệ - đối
tượng. Qua đó thấy được mục tiêu của luận văn là nghiên cứu về cách thức ánh xạ dữ liệu
chuỗi thời gian vào mơ hình dữ liệu quan hệ - đối tượng là cần thiết như thế nào. Phần này
cũng nêu lên một số đóng góp tích cực của luận văn. Chương này cũng đã trình bày cấu
trúc của luận văn nhằm giúp người đọc có cái nhìn tổng quát về những vấn đề sẽ được nêu

ra. Nội dung của luận văn sẽ được mô tả lần lượt trong những chương kế tiếp. Mở đầu là
những định nghĩa, những khái niệm cơ bản liên quan đến dữ liệu chuỗi thời gian.

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 4


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Chương 2:

DỮ LIỆU CHUỖI THỜI GIAN – NHỮNG KHÁI NIỆM
CĂN BẢN VÀ CÁC CÔNG TRÌNH LIÊN QUAN
Để thống nhất một số thuật ngữ được sử dụng xuyên suốt trong luận văn, ở chương
này sẽ trình bày một số định nghĩa, khái niệm chính yếu liên quan đến đề tài. Nội dung
được trình bày bao gồm: một số khái niệm liên quan đến cơ sở dữ liệu hướng thời gian, dữ
liệu chuỗi thời gian, mô hình dữ liệu thời gian tích hợp. Đồng thời trong chương này sẽ
điểm qua một số cơng trình của các nhà khoa học trên thế giới liên quan đến đề tài. Qua
đó, thấy được phương pháp ánh xạ dữ liệu chuỗi thời gian vào mơ hình dữ liệu quan hệ đối tượng là cần thiết như thế nào.

2.1 NHỮNG KHÁI NIỆM LIÊN QUAN ĐẾN CƠ SỞ DỮ
LIỆU HƯỚNG THỜI GIAN
Dữ liệu chuỗi thời gian là thành phần quan trọng của cơ sở dữ liệu hướng thời gian.
Chính vì vậy, trước hết cần phải nắm được một số khái niệm chính yếu liên quan đến dữ
liệu hướng thời gian. Nội dung trình bày được dựa trên tài liệu [7] của Christian S. Jensen
và Curtis Dyreson, tài liệu [8] của Christian S. Jensen.

2.1.1 Cơ sở dữ liệu hướng thời gian (Temporal Database)
Một cơ sở dữ liệu hướng thời gian là một cơ sở dữ liệu có hỗ trợ một số yếu tố về

thời gian, khơng tính đến thời gian được người dùng định nghĩa.

2.1.2 Thời gian hợp lệ (Valid Time)
Thời gian hợp lệ của một sự kiện là thời gian khi sự kiện đó là đúng trong mơ hình
hiện thực. Một sự kiện có thể kết hợp với nhiều thời điểm cũng như thời khoảng khác
nhau. Thời gian hợp lệ thường được người sử dụng cung cấp.

2.1.3 Thời gian giao dịch (Transaction Time)
Một sự kiện cơ sở dữ liệu được lưu trữ trong cơ sở dữ liệu tại một số điểm thời
gian, và sau khi nó được lưu trữ, nó được hiện hành cho đến khi nó bị xóa đi. Thời gian

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 5


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

giao dịch của một sự kiện cơ sở dữ liệu là thời gian mà khi sự kiện đó được trở nên hiện
hành trong cơ sở dữ liệu và có thể được rút trích. Về tổng quát, thời gian giao dịch không
phải là những thời điểm mà nó là những khoảng thời gian.

2.1.4 Nhãn thời gian (Timestamp)
Định nghĩa: Một nhãn thời gian là một giá trị thời gian được kết hợp với một
vài đối tượng mà là một giá trị thuộc tính hay một bộ các giá trị thuộc tính. Có
hai loại nhãn thời gian thông dụng là: nhãn thời gian thời điểm và nhãn thời
gian thời khoảng.
Nhãn thời gian thời điểm: (Instant Timestamp) Trong ví dụ sau: bệnh nhân
sẽ được đo huyết áp vào những thời điểm khác nhau trong ngày. Thông tin về
kết quả đo được thể hiện thông qua bảng 2.1. Trong đó, cột thời điểm đo

chính là nhãn thời gian thời điểm.
Tên bệnh nhân

Huyết áp

Thời điểm đo

Nguyễn Quốc Huy

12.8

07 : 00

Nguyễn Quốc Huy

13.0

07 : 30

Nguyễn Quốc Huy

11.9

08 : 00

Lâm Gia Huân

12.0

14 : 00


Lâm Gia Huân

11.5

18 : 00

Hà Tịnh

16.0

09 : 00

Hà Tịnh

15.0

09 : 10

Bảng 2.1: Ví dụ về nhãn thời gian thời điểm
Nhãn thời gian thời khoảng: (Interval Timestamp) Ví dụ ở bảng 2.2 cho
thấy lương của các nhân viên sẽ thay đổi theo những khoảng thời gian khác
nhau. Cột [TS, TE] chính là nhãn thời gian thời khoảng.

2.1.5 Độ mịn thời gian (Granularity)
Độ mịn thời gian cho biết khoảng cách ngắn nhất giữa hai điểm thời gian. Ví dụ khi
có độ mịn thời gian là 5 giây, có nghĩa là khoảng cách giữa hai điểm thời gian mà hệ thống
có thể hỗ trợ là 5 giây.

_______________________________________________________________________

Lê Ngọc Minh Trị
Trang 6


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Empno

Salr

TS

TE

52

18K

5

9

52

20K

10

20


52

25K

21

38

52

31K

39

47

52

38K

48

Now

97

30K

12


17

97

35K

18

Now

Bảng 2.2: Ví dụ về nhãn thời gian thời khoảng

2.2 DỮ LIỆU CHUỖI THỜI GIAN (Time Series Data)
Sau khi trình bày khái quát về cơ sở dữ liệu hướng thời gian cùng một số khái niệm
liên quan, phần 2.2 này sẽ tiếp tục xem xét những vấn đề liên quan đến dữ liệu chuỗi thời
gian. Nội dung sau đây được rút trích từ tài liệu [5] của Ramez Elmasri và Jae Young Lee.

2.2.1 Khái niệm
Các đối tượng trong cơ sở dữ liệu hướng thời gian có thể được phân loại thành 3
dạng khác sau phụ thuộc vào những đặc tính thời gian của chúng:
Những đối tượng không biến đổi theo thời gian: (Time-invariant Object)
Những đối tượng này bị ràng buộc là sẽ không thay đổi giá trị của chúng trong
hệ thống thông tin, một khi chúng đã được mơ hình vào hệ thống. (Ví dụ như
số chứng minh nhân dân của mỗi người hay số ID được sinh ra bởi hệ
thống…).
Các đối tượng biến đổi theo thời gian: (Time-varying Object) Chúng là
những đối tượng mà bị thay đổi giá trị không theo một quy luật thời gian nào
cả. (Ví dụ như lương hay cấp bậc của một nhân viên sẽ thay đổi không tuân
theo một quy luật nào về thời gian).
Các đối tượng chuỗi thời gian: (Time-series Object) Những đối tượng này

thay đổi giá trị của chúng và sự thay đổi này gắn kết chặt chẽ với một mẫu
thời gian đặc biệt gọi là lịch (Calendar). (Ví dụ như giá cổ phiếu biến động

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 7


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

hằng ngày, dữ liệu khoa học được lấy mẫu một cách đều đặn theo những
khoảng thời gian nhất định).
Chuỗi thời gian (Time Series): là một kỹ thuật trừu tượng hóa để quản lý những
tập hợp dữ liệu có những giá trị được giám sát tại những thời điểm, hoặc những khoảng
thời gian đều đặn. Những tập hợp và những phân tích của dữ liệu tài chính và dữ liệu khoa
học là những ví dụ có thể được mơ hình dưới dạng dữ liệu chuỗi thời gian. Những tính chất
thơng thường của những ứng dụng sử dụng dữ liệu chuỗi thời gian là:
1. Những ứng dụng này thường chứa đựng khối lượng lớn dữ liệu.
2. Sự thay đổi của các giá trị dữ liệu được gắn chặt chẽ vào một mẫu thời gian
được định nghĩa từ trước, gọi là lịch.
3. Những thao tác trên dữ liệu bao gồm những tác vụ số học cũng như những tác
vụ phân tích thống kê.
4. Tác vụ gom nhóm (Aggregation Operation) trên một tập hợp dữ liệu là quan
trọng hơn trên những phần tử đơn lẻ.
Dữ liệu chuỗi thời gian thường được thể hiện như là một chuỗi những sự kiện. Một
sự kiện (Event) là một cặp có trật tự bao gồm một giá trị thời gian (Temporal Value) và
một giá trị dữ liệu (Data Value). Giá trị dữ liệu có thể là đơn trị hoặc đa trị.
Định dạng của một loại dữ liệu chuỗi thời gian đa trị là {(t1 , < data_value1,1 ,
data_value1,2 , … >), (t2 , < data_value2,1 , data_value2,2 , … >), …}.
Định dạng một dữ liệu chuỗi thời gian đơn trị sẽ là: {(t1 , data_value1), (t2 ,

data_value2), …}.
Trong đó, data_valuei,j (hoặc data_valuei) là giá trị của một mục dữ liệu phù hợp
với miền giá trị nào đó và ti là các giá trị thời gian.
Hình 2.1 là ví dụ minh hoạ một cách trực quan về những dữ liệu chuỗi thời gian
khác nhau:
Ở hình 2.1(a) chỉ ra số dư hàng ngày của tài khoản. Chú ý rằng trong trường hợp
này chuỗi thời gian được biểu diễn: (1,10), (6,3), (8,7), (14,5), (17,11). Đây là loại chuỗi
thời gian hằng số bậc thang (Stepwise Constant Time Series).
Hình 2.1(b) diễn tả số lượng sách được bán ra hàng ngày. Chúng ta gọi nó là chuỗi
thời gian rời rạc (Discrete Time Series).
Hình 2.1(c) cho thấy độ lớn của từ trường đo được bởi thiết bị đo vào những
khoảng thời gian đều đặn. Trong trường hợp này chúng ta gọi đó là chuỗi thời gian liên tục
(Continuous Time Series).

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 8


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

11

7

10
3

5


1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17
(a) Số dư tài khoản: bậc thang hằng số (stepwise constant)

(b) Số lượng sách được bán: rời rạc (discrete)

(c) Từ trường: liên tục (continuous)
Hình 2.1: Ví dụ về chuỗi thời gian

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 9


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

2.2.2 Lịch dùng trong chuỗi dữ liệu thời gian (Calendar for Time Series)
Một trong những thành phần quan trọng của hệ quản trị chuỗi thời gian (Time
Series Management System) chính là lịch (Calendar). Lịch dùng trong những hệ quản trị
chuỗi thời gian khác với hệ thống lịch thông thường. Lịch dùng trong dữ liệu chuỗi thời
gian định nghĩa một mẫu thời gian (Time Pattern) đặc biệt tương ứng với những giá trị dữ
liệu được lấy mẫu và được lưu trữ. Ví dụ như, lịch dùng cho giao dịch cổ phiếu định nghĩa
một chuỗi những ngày mà thị trường chứng khoán mở cửa, gồm tất cả những ngày làm
việc không bao gồm những ngày nghỉ cuối tuần và ngày lễ.
Một lịch sẽ xác định miền giá trị của những giá trị thời gian của dữ liệu chuỗi thời
gian tương ứng. Nó cũng cung cấp một giao tiếp (Interface) cho những ngôn ngữ truy vấn
gần gũi với con người. Ví dụ: Có thể dùng cụm từ the fourth Thursday of November every
year trong câu truy vấn.
Một lịch được xem như là một tập hợp có trật tự của những đơn vị thời gian. Đơn
vị thời gian (Time Unit) là một điểm thời gian diễn tả một độ mịn thời gian nhất định như
giây, phút, tháng…

Một lịch được thể hiện thông qua một bộ end time>
Granularity: (Độ mịn thời gian) là đơn vị thời gian mặc định được sử dụng
trong một lịch.
Pattern: (Mẫu) là chuỗi con của những đơn vị thời gian diễn tả như là một
phần tử thời gian. Nếu như lịch sử dụng là tuần hoàn, một mẫu diễn tả một chu
kỳ sẽ được thể hiện. Ngược lại, một chuỗi bao gồm tất cả những điểm thời
gian của một lịch sẽ được thể hiện. Nếu có nhiều hơn một mẫu, sẽ dùng dấu
“|” (có nghĩa là hoặc (or)) để ngăn cách.
Period: (Chu kỳ) là chiều dài của một khoảng thời gian mà tại đó mẫu xuất
hiện một cách lặp đi lặp lại. Period của một lịch khơng có chu kỳ được ký hiệu
là ∞.
Start time: (Thời điểm bắt đầu) là điểm thời gian tại đó bắt đầu lịch.
End time: (Thời điểm kết thúc) là điểm thời gian tại đó kết thúc lịch.
Ví dụ: Lịch diễn tả 8 giờ làm việc mỗi ngày được thể hiện như sau:
Calendar WorkHours
< granularity: Hour,
pattern: {[9, 11], [13, 17]},
period: 24,
start time: 4/1/96,
end time: ∞ >
_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 10


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

2.3 MƠ HÌNH DỮ LIỆU THỜI GIAN TÍCH HỢP (Integrated
Temporal Data Model – ITDM)

Mơ hình dữ liệu thời gian tích hợp dùng để biểu diễn một cách trực quan những dữ
liệu chuỗi thời gian. Phần 2.3 này sẽ trình bày những đặc điểm chính của mơ hình ITDM
này. Nội dung phần này cũng được tham khảo trong tài liệu [5] của Ramez Elmasri và Jae
Young Lee như sau:
Trong mơ hình dữ liệu thời gian tích hợp, một đối tượng chuỗi thời gian được mơ
hình như là một thuộc tính chuỗi thời gian và được xem như tương tự những thuộc tính
khác. Kết hợp với mỗi đối tượng chuỗi thời gian là một lịch, cung cấp một miền giá trị thời
gian để xác định những giá trị thời gian đúng đắn và tần suất cập nhật thuộc tính thời gian
tương ứng.
Các ký hiệu của mơ hình dữ liệu thời gian tích hợp ITDM rất giống với lược đồ
thực thể quan hệ EER. Tuy nhiên cũng có một số thành phần được mở rộng:
1. Thuộc tính không biến đổi theo thời gian (Time-invariant Attribute) được biểu
diễn bằng một hình oval. (Hình 2.2)
Trong hình 2.2, thuộc tính Issuer là khóa chính, nó mơ tả tên của cổ phiếu. Issuer
chính là thuộc tính khơng biến đổi theo thời gian.

Issuer

Stock
Hình 2.2: Biểu diễn thuộc tính khơng biến đổi theo thời gian trong ITDM
2. Thuộc tính biến đổi theo thời gian (Time-varying Attribute) được thể hiện bởi
một hình oval có một hình chữ nhật được viền hai nét bên trong. (Hình 2.3)
Ở hình 2.3, Shares chính là thuộc tính biến đổi theo thời gian. Shares thể hiện số
lượng cổ phiếu được bán ra thay đổi theo những khoảng thời gian nhất định.

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 11



Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Shares

Stock
Hình 2.3: Biểu diễn thuộc tính biến đổi theo thời gian trong ITDM
3. Một hình oval với hình chữ nhật có một nét viền thể hiện một thuộc tính chuỗi
thời gian (Time Series Attribute). (Hình 2.4)
4. Mỗi thuộc tính chuỗi thời gian được gắn kết với một lịch kèm theo, và lịch này
được kết nối với thuộc tính chuỗi thời gian thơng qua một dấu mũi tên. (Hình
2.4)
Hình 2.4 biểu diễn thuộc tính chuỗi thời gian đơn giản. Trong đó, Dividend (cổ
tức) là thuộc tính chuỗi thời gian. Thuộc tính này được gắn kết với một lịch Quarters. Lịch
này diễn tả thời gian biến động của cổ tức theo từng quý.
Quarters

Dividend

Stock
Hình 2.4: Biểu diễn thuộc tính chuỗi thời gian đơn giản trong ITDM
5. Những thuộc tính thành phần của một thuộc tính chuỗi thời gian phức hơp,
thơng thường khơng có những lịch riêng biệt kết nối với chúng. Giả định rằng
lịch trong thuộc tính chuỗi thời gian phức hợp được dùng chung cho các thuộc
tính thành phần. (Hình 2.5)
6. Tuy nhiên, giá trị dữ liệu của một thuộc tính chuỗi thời gian phức hợp cũng có
thể là một chuỗi thời gian (Ticks chẳng hạn), và cũng có một lịch riêng kết hợp
với thành phần thuộc tính chuỗi thời gian này. (Hình 2.5)

_______________________________________________________________________
Lê Ngọc Minh Trị

Trang 12


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Hình 2.5 mơ tả thuộc tính chuỗi thời gian phức hợp Price. Price biểu diễn giá giao
dịch của cổ phiếu bao gồm giá cao (High), giá thấp (Low) và giá giao dịch vào giờ làm
việc (Ticks). Thuộc tính chuỗi thời gian Price sẽ được gắn kết với một lịch là
BusinessWeek, mô tả các ngày hoạt động trong tuần. Ngồi ra, thuộc tính chuỗi thời gian
Ticks, mô tả giá cổ phiếu vào từng giờ giao dịch. Do đó, Ticks sẽ được gắn kết với một
lịch là WorkHours, thể hiện các giờ hoạt động trong ngày.

High

Low

Ticks

Price

WorkHours

BusinessWeek

Stock
Hình 2.5: Biểu diễn thuộc tính chuỗi thời gian phức hợp trong ITDM
Hình 2.6 là mơ hình dữ liệu tích hợp chuỗi thời gian mơ tả các thuộc tính thơng
thường của cổ phiếu. Mơ hình này đã diễn tả được đầy đủ những thuộc tính của thực thể
cần biểu diễn bao gồm: những thuộc tính khơng biến đổi theo thời gian, thuộc tính biến đổi
theo thời gian, thuộc tính chuỗi thời gian. Chi tiết các thành phần được mô tả ở hình 2.2,

hình 2.3, hình 2.4, hình 2.5.

High

Low

Ticks

Quarters
WorkHours
Shares

Dividend

Price

Issuer
BusinessWeek

Stock
Hình 2.6: Ví dụ về lược đồ ITDM mơ tả những thuộc tính của cổ phiếu

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 13


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Mơ hình dữ liệu thời gian tích hợp rất đơn gian, trực quan, dễ sử dụng. Mơ hình

này được sử dụng rộng rãi trong việc mơ hình hố cơ sở dữ liệu hướng thời gian. Lưu ý,
mơ hình dữ liệu thời gian tích hợp ITDM ở hình 2.6 sẽ cịn được sử dụng như là ví dụ mẫu
trong những chương sau.

2.4 TỔNG THUẬT VỀ CÁC CƠNG TRÌNH LIÊN QUAN
Phần này sẽ điểm qua một số cơng trình đã được các khoa học trên thế giới quan
tâm nghiên cứu. Qua đó, cũng có được một góc nhìn khái qt hơn về những vấn đề liên
quan đến đề tài sẽ được phát triển.

2.4.1 Các cơng trình tập trung vào mơ hình dữ liệu chuỗi thời gian
Những cơng trình này sẽ tập trung vào các khía cạnh của cơ sở dữ liệu hướng thời
gian nói chung cũng như dữ liệu chuỗi thời gian nói riêng. Nội dung chủ yếu bàn về những
đặc tính nổi bật của dữ liệu chuỗi thời gian, cũng như cách thức mơ hình hóa dữ liệu chuỗi
thời gian.
Tài liệu [15] của Arie Segev và Arie Shoshani mô tả khá chi tiết những đặc điểm
của chuỗi thời gian. Trong tài liệu này, tác giả cũng trình bày khá rõ nét các thao tác trên
dữ liệu chuỗi thời gian. Cuối cùng, tài liệu cũng trình bày chi tiết về quá trình thể hiện dữ
liệu chuỗi thời gian trên môi trường quan hệ. Tài liệu này rất cần thiết cho những ai quan
tâm đến những đặc điểm của dữ liệu chuỗi thời gian cũng như các thao tác truy vấn trên dữ
liệu chuỗi thời gian.
Trong tài liệu [16], Arie Segev và Rakesh Chandra đã trình bày những đặc tính cơ
bản của dữ liệu chuỗi thời gian. Từ những đặc điểm này, các tác giả đã đề nghị cách thức
mơ hình hóa chuỗi thời gian thơng qua vector. Chính vì vậy, tài liệu đã tập trung vào việc
trình bày cách thức để mơ hình dữ liệu dựa trên vector, những đặc điểm chính của mơ hình
này, các khái niệm (concept) cũng như các luật. Ngoài ra, trong tài liệu này tác giả cũng
giới thiệu qua về ngôn ngữ truy vấn hướng thời gian (Temporal Query Language) và
những tác vụ đặc biệt trên cơ sở dữ liệu chuỗi thời gian. Đóng góp chính của tài liệu này là
ở việc nêu lên được cách thức mơ hình hóa dữ liệu chuỗi thời gian thơng qua mơ hình
vector.
Trong tài liệu [5], Ramez Elmasri và Jae Young Lee trình bày một số đặc điểm

quan trọng của dữ liệu chuỗi thời gian, đặc biệt là lịch (Calendar). Ngồi ra, tác giả cũng
mơ tả khá rõ nét cách thức xây dựng mơ hình dữ liệu thời gian tích hợp (Integrated
Temporal Data Model) là một mơ hình dữ liệu trực quan dùng để biểu diễn chuỗi thời gian.

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 14


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Hơn nữa trong tài liệu này tác giả cũng nêu ra hai phương pháp ánh xạ dữ liệu chuỗi thời
gian vào cơ sở dữ liệu quan hệ, cơ sở dữ liệu hướng đối tượng. Tài liệu này khá hữu ích,
đặc biệt là mơ hình dữ liệu thời gian tích hợp rất trực quan.
Trong tài liệu [20], Gene T. J. Wuu và Umeshwar Dayal đã trình bày mơ hình dữ
liệu OODAPLEX dùng cho quản lý dữ liệu chuỗi thời gian. Đây là mơ hình dữ liệu hướng
đối tượng dựa trên mơ hình dữ liệu chức năng DAPLEX. Ngồi ra, tài liệu cũng mơ tả cách
thức truy vấn trên mơ hình OODAPLEX. Mơ hình OODAPLEX cũng chỉ là mơ hình dữ
liệu hướng đối tượng dùng cho việc quản lý chuỗi thời gian.

2.4.2 Các cơng trình đi sâu vào các phương pháp ánh xạ chuỗi thời gian
Nội dung chính của các cơng trình này là việc tập trung nghiên cứu những cách
thức ánh xạ dữ liệu chuỗi thời gian vào các mơ hình hiện thực. Có rất nhiều hướng tiếp cận
nhưng nhiều nhất vẫn là phương pháp ánh xạ chuỗi thời gian vào mơ hình cơ sở dữ liệu
quan hệ.
Như đã nói ở phần trên, trong tài liệu [15] Arie Segev và Arie Shoshani ngồi việc
trình bày chi tiết những đặc điểm của dữ liệu chuỗi thời gian, các thao tác trên dữ liệu
chuỗi thời gian. Tác giả cịn trình bày rất chi tiết cách thức thể hiện dữ liệu chuỗi thời gian
trên môi trường cơ sở dữ liệu quan hệ. Đây là một trong những hướng tiếp cận kinh điển đã
được nhiều nhà khoa học đào xới nghiên cứu.

Ở tài liệu [2], trước tiên Werner Dreyer, Angelika Kotz Dittrich và Duri Schmidt
nêu lên một ứng dụng tiêu biểu của chuỗi thời gian đó là chuỗi thời gian về thị trường
chứng khốn Zurich. Thơng qua đó các tác giả tiến hành mơ hình hóa chuỗi thời gian này
theo mơ hình dữ liệu hướng đối tượng. Rõ ràng, dữ liệu chuỗi thời gian được xây dựng
trong mơ hình dữ liệu hướng đối tượng là rất trong sáng. Việc quản lý những thao tác dữ
liệu trên mơ hình này cũng hết sức dễ dàng.
Như trình bày ở trên, trong tài liệu [5], Ramez Elmasri và Jae Young Lee ngoài
việc mơ tả những đặc tính cơ bản của chuỗi thời gian, mơ hình dữ liệu thời gian tích hợp.
Tác giả còn miêu tả khá rõ ràng hai phương pháp ánh xạ chuỗi thời gian vào cơ sở dữ liệu
quan hệ và cơ sở dữ liệu hướng đối tượng. Luận văn sẽ dựa vào nội dung của tài liệu này
để phát triển.
Trong tài liệu [4], Werner Dreyer, Angelika Kotz và Duri Schmidt nêu ra các yêu
cầu cần thiết cho việc xây dựng hệ quản trị chuỗi thời gian. Đó là những u cầu về việc
mơ hình hóa dữ liệu, u cầu về trao đổi dữ liệu, yêu cầu về quản lý chất lượng dữ liệu,

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 15


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

yêu cầu đồng bộ hóa… Tài liệu cũng nêu ra ví dụ về chuỗi thời gian HIKU được công ty
Swiss company Telekurs lưu trữ. Cuối cùng tài liệu nêu ra các hướng để giải quyết yêu cầu
về quản lý chuỗi thời gian gồm: quản lý chuỗi thời gian bằng file, hệ quản trị cơ sở dữ liệu
quan hệ, hệ quản trị cơ sở dữ liệu hướng đối tượng hay hệ quản trị chuỗi thời gian chuyên
biệt. Tài liệu này cho thấy có những cách khác nhau để quản lý dữ liệu chuỗi thời gian.
Trong đó, cần thiết phải xây dựng một hệ quản trị chuỗi thời gian chuyên biệt.
Trong tài liệu [1] của Rakesh Chadra và Arie Segev đề xuất việc quản lý dữ liệu
chuỗi thời gian trên cơ sở dữ liệu mở rộng (Extensible Database). Cơ sở dữ liệu mở rộng

được cung cấp các khả năng như: thêm vào một số kiểu dữ liệu phức tạp từ các kiểu dữ
liệu cơ bản, có khả năng định nghĩa các tác vụ mới trên kiểu dữ liệu phức tạp này, … Cách
tiếp cận của tài liệu này chính là việc mở rộng một số khả năng cho cơ sở dữ liệu hiện tại
thay gì phải xây dựng một cơ sở dữ liệu mới.

2.4.3 Các công trình thiên về những ứng dụng của chuỗi thời gian
Phần này sẽ điểm qua một số cơng trình tập trung vào việc ứng dụng chuỗi thời
gian vào trong thực tiễn. Đồng thời cũng trình bày một số hệ quản trị dữ liệu chuyên dùng
cho việc quản lý chuỗi thời gian.
Tài liệu [2] của tác giả Werner Dreyer, Angelika Kotz Dittrich và Duri Schmidt
phân tích khá sâu ứng dụng chuỗi thời gian tiêu biểu. Đó là chuỗi thời gian về thị trường
chứng khốn Zurich. Tác giả cũng mơ tả một số những đặc điểm nổi bật của chuỗi thời
gian này.
Trong tài liệu [1] của Rakesh Chandra và Arie Segev cũng có trình bày những ứng
dụng thương mại cũng như những ứng dụng tài chính có sử dụng chuỗi thời gian. Qua tài
liệu này cũng thấy khả năng ứng dụng rộng rãi của dữ liệu chuỗi thời gian.
Trong tài liệu [4], Werner Dreyer, Angelika Kotz Dittrich và Duri Schmidt có trình
bày một ví dụ về dữ liệu chuỗi thời gian HIKU của cơng ty Swiss company Telekurs. Nó
chứa đựng 10000 chuỗi thời gian của thế giới tài chính. Hệ thống hoạt động từ năm 1986
đến năm 1992. Kích thước chuỗi thời gian này lện đến 4GB. Qua ví dụ này càng thấy rõ
hơn độ phức tạp của dữ liệu chuỗi thời gian.
Mỗi một loại dữ liệu chuỗi thời gian ứng dụng vào những lĩnh vực khác nhau đều ít
nhiều có sự khác biệt. Trong tài liệu [18], Arie Shoshani, Preston Holland, Janet Jacobsen,
và Debasis Mitra tập trung vào việc phân tích những đặc điểm của dữ liệu chuỗi thời gian
trong một lĩnh vực khá cụ thể, đó là những cơ sở dữ liệu về địa vật lý. Tài liệu đã trình bày

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 16



Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

những đặc điểm về thời gian, những tác vụ trên chiều thời gian. Tài liệu cũng nêu ra một
thí nghiệm cụ thể của ngành địa vật lý dùng để minh họa. Đọc tài liệu này, chúng ta thấy
được những ứng dụng rộng rãi của dữ liệu chuỗi thời gian trong ngành địa vật lý.
Ở tài liệu [14], Duri Schmidt, Angelika Kozt Dittrich và Werner Dreyer đã nêu ra
một số yêu cầu chính của việc thiết kế hệ quản trị chuỗi thời gian (Time Series
Management System). Tài liệu cũng đã trình bày một số điểm yếu của cơ sở dữ liệu hướng
thời gian trong việc quản lý các ứng dụng chuỗi thời gian. Qua đó, thấy được những nhu
cầu cần thiết phải xây dựng các hệ quản trị chuỗi thời gian. Sau cùng, tài liệu cũng mô tả
một số DBMS đã tồn tài dùng cho việc quản lý chuỗi thời gian. Trong đó, 2 DBMS là bảng
thương mại còn 2 DBMS mới chỉ là bảng prototype.
TSMS được đại học Berkeley phát triển. đây là bảng prototype dùng cho việc quản
lý chuỗi thời gian. DBMS này sử dụng kỹ thuật mở rộng quan hệ (Extended Relational
Technology).
Illustra TimeSeries DataBlade cũng là DBMS dùng kỹ thuật mở rộng các hệ quản
trị cơ sở dữ liệu quan hệ trong việc quản lý chuỗi thời gian.
FAME là một hệ thống thương mại do FAME Software Corporation xây dựng.
FAME sử dụng các đối tượng dữ liệu để quản lý các chuỗi thời gian.
CALANDA là một hệ quản trị chuỗi thời gian sử dụng theo mơ hình hướng đối
tượng. CALANDA được Union Bank of Switzerland phát triển.
Theo các tác giả đánh giá thì nhu cầu về một hệ quản trị cơ sở dữ liệu chuyên về
việc quản lý chuỗi thời gian là hết sức cần thiết. Do đó, cần phải đầu tư nhiều hơn nữa cho
vấn đề này.
Trong tài liệu [3], [13], Werner Dreney, Angelika Kotz Dittrich và Duri Schmidt lại
tiếp tục mô tả sâu hơn vào hệ quản trị chuỗi thời gian CALANDA. Hệ quản trị chuỗi thời
gian CALANDA này sử dụng giao diện trực quan GUI. Đồng thời việc quản lý dữ liệu
trong CALANDA sử dụng kỹ thuật mơ hình chuỗi thời gian theo mơ hình hướng đối
tượng. Hai tài liệu này là những hướng dẫn hữu ích trong việc sử dụng hệ quản trị chuỗi

thời gian CALANDA.
Những cơng trình nghiên cứu này đã đi từ những vấn đề tổng quan của cơ sở dữ
liệu hướng thời gian đến việc tập trung vào dữ liệu chuỗi thời gian – là một mảng rất quan
trọng trong các nghiên cứu thuộc lĩnh vực cơ sở dữ liệu hướng thời gian. Từ việc phân tích
những đặc điểm tổng quan của dữ liệu chuỗi thời gian đến việc ánh xạ dữ liệu chuỗi thời
gian vào cơ sở dữ liệu quan hệ hay cơ sở dữ liệu hướng đối tượng. Một số tác giả cũng đi
sâu vào việc giới thiệu các hệ quản trị dữ liệu chuỗi thời gian. Ngồi ra, cũng có những tài
liệu đề cập đến dữ liệu chuỗi thời gian trong một vài lĩnh vực cụ thể, qua đó cũng thấy
được tầm ứng dụng rộng lớn của dữ liệu chuỗi thời gian.

_______________________________________________________________________
Lê Ngọc Minh Trị
Trang 17


Quản lý dữ liệu chuỗi thời gian bằng mơ hình dữ liệu quan hệ - đối tượng

Tuy thế, vẫn còn rất thiếu những bài báo, tài liệu nói về việc ánh xạ dữ liệu chuỗi
thời gian vào trong mơ hình dữ liệu quan hệ - đối tượng. Đây sẽ là phần cơng việc chính
cần phải được giải quyết trong luận văn này.
Như vậy, luận văn đã điểm qua một số những khái niệm liên quan đến cơ sở dữ liệu
hướng thời gian cũng như dữ liệu chuỗi thời gian. Bên cạnh đó, cũng đã xem xét những
thành phần của mơ hình dữ liệu thời gian tích hợp. Đồng thời có được một cái nhìn tổng
quan về những cơng trình nghiên cứu trên thế giới liên quan đến đề tài. Qua đó, cũng xác
định được mục tiêu chính yếu của luận văn chính là tìm ra phương pháp ánh xạ hiệu quả
dữ liệu chuỗi thời gian vào mơ hình dữ liệu quan hệ - đối tượng. Để đi dần vào mục tiêu
này, chương kế tiếp sẽ lần lượt trình bày các phương pháp ánh xạ dữ liệu chuỗi thời gian
vào những mơ hình dữ liệu thơng dụng hiện nay.

_______________________________________________________________________

Lê Ngọc Minh Trị
Trang 18


×