Tải bản đầy đủ (.pdf) (62 trang)

Phân tích tương quan chính tắc và xấp xỉ mở rộng hiệp phương sai của chuối thời gian dừng

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (763.4 KB, 62 trang )

MỤC LỤC

MỞ ĐẦU.......................................................................................................... 3
Chương 1. NHỮNG KIẾN THỨC CHUẨN BỊ................................................ 6
1.1. Ma trận ..................................................................................................... 6
1.1.1. Định nghĩa ma trận ...................................................................... 6
1.1.2. Các phép tốn trên ma trận .......................................................... 6
1.2. Khơng gian Hilbert ................................................................................... 8
1.2.1. Định nghĩa.................................................................................... 8
1.2.2. Giới hạn của dãy điểm.................................................................. 8
1.2.3. Định nghĩa: .................................................................................. 8
1.3. Khái niệm về chuỗi thời gian và quá trình ngẫu nhiên .............................. 9
1.3.1. Định nghĩa.................................................................................... 9
1.3.2. Định nghĩa.................................................................................... 9
1.4. Quá trình dừng và phân tích hệ số tự tương quan.................................... 10
1.4.1. Khái niệm về quá trình dừng ...................................................... 10
1.4.2. Hàm tự hiệp phương sai của một quá trình dừng........................ 12
1.4.3. Hệ số tương quan và tự tương quan mẫu .................................... 12
1.4.4. Hệ số tự tương quan riêng .......................................................... 14
Chương 2. PHÂN TÍCH TƯƠNG QUAN CHÍNH TẮC VÀ XẤP XỈ MỞ
RỘNG HIỆP PHƯƠNG SAI CỦA CHUỖI THỜI GIAN DỪNG .................. 16
2.1. Bài toán nhận dạng dãy hiệp phương sai................................................. 16
2.2. Tính dương, tính khơng dưng và khai triển xấp xỉ của ma trận hiệp
phương sai Hankel. ................................................................................. 19
2.2.1. Giả thiết về bậc của dãy hiệp phương sai ................................... 19
2.2.2. Định nghĩa bậc dương của dãy hiệp phương sai......................... 22
2.2.3. Giả định về bậc dương p của dãy hiệp phương sai ..................... 22
2.2.4. Sự khác biệt giữa bậc đại số và bậc dương................................. 23
1



2.3. Lý thuyết về thể hiện ngẫu nhiên trong không gian Hilbert của hàm mẫu28
2.3.1. Không gian Hillbert của các hàm mẫu ....................................... 29
2.3.2. Về phương pháp nhận dạng không gian con ............................... 33
2.3.3. Giả thuyết về tính dương............................................................. 35
2.4. Các tương quan chính tắc và sự thể hiện tính ngẫu nhiên cân bằng ......... 38
2.4.1. Mệnh đề...................................................................................... 39
2.4.2. Mệnh đề...................................................................................... 40
2.4.3. Mệnh đề...................................................................................... 41
2.4.4. Định lý........................................................................................ 44
2.4.5. Mệnh đề...................................................................................... 47
2.5. Thể hiện ngẫu nhiên từ dữ liệu hiệp phương sai hữu hạn ........................ 48
2.5.1. Định lý........................................................................................ 50
2.5.2. Các hình thức bất biến của bộ lọc Kalman ................................. 53
2.5.3. Mệnh đề...................................................................................... 57
2.5.4. Định lý........................................................................................ 59
KẾT LUẬN .................................................................................................... 61
TÀI LIỆU THAM KHẢO .............................................................................. 62

2


MỞ ĐẦU
Gần đây đã có sự quan tâm trở lại đối với các thuật tốn nhận dạng
khơng gian trạng thái cho chuỗi thời gian dựa trên một qui trình hai bước mà
theo ngun tắc, có thể được mơ tả như ước lượng của một mơ hình hiệp
phương sai từ dữ liệu quan sát được tạo ra bởi thể hiệnngẫu nhiên. Phương
pháp này đem lại lợi thế lớn cho việc chuyển đổi pha ước lượng tham số phi
tuyến rất cần thiết trong việc xác định mơ hình Arma truyền thống vào thể
hiệnriêng, liên quan đến sử dụng phương pháp kỹ thuật số có sẵn để giải hai bài
tốn ma trận ước lượng hiệp phương sai và phương trình Riccati. Trong bài

này, chúng ta có thể dùng vào q trình đa biến và đồng thời chỉ ra rằng các
thuật tốn cũng có thể làm việc với những dữ liệu chứa các thành phần tất định
hoàn toàn (van Overschee và De Moor, 1993). Tuy nhiên, hạn chế được nhấn
mạnh trong bài báo này đó là các phương pháp này khơng làm việc với các dữ
liệu tùy ý. Đây là loại thủ tục đầu tiên được tán thành bởi Faure (1969), xem
Faurre và Chataigner (1971) và Faurre và Marmorat (1969). Nghiên cứu gần
đây, dựa trên phân tích mối tương quan chính tắc (Akaike năm 1975) (hoặc một
số phân tích giá trị kì dị khác), thuật toán Ho-Kalman (Kalman và các cộng sự,
1969), Aoki(1990), Larimore (1990), van Overschee và De Moor (1993). Các
nghiên cứu mới nhất về thuật tốn phân tích tương quan chính tắc được thực
hiện trực tiếp trên dữ liệu quan sát mà khơng cần tính tốn các ước lượng hiệp
phương sai (van Overschee và De Moor, 1993). Kinh nghiệm cho thấy rằng
thời gian tính tốn cần thiết để có được ước lượng tham số mẫu cuối cùng khả
quan hơn so với phương pháp truyền thống dự báo lỗi lặp của mơ hình Arma
truyền thống.
Những phương pháp này giới thiệu một số vấn đề tốn học khơng tầm
thường liên quan đến tính dương. Lý do là bởi trọng tâm vấn đề này tương
đương với vấn đề mở rộng hữu tỷ hiệp phương sai được nhiều người biết đến.

3


Do đó, việc xác định các đối số thơng thường trên cơ sở tìm thừa số của một
ma trận Hankel sẽ không thực hiện được với các dữ liệu chung chung. Lưu ý
rằng để tính tốn mơ hình khơng gian trạng thái các tín hiệu ước lượng hiệp
phương sai thì cần phải giải được phương trình Riccati. Mà để giải phương
được trình này thì điều kiện cần là phải bảo đảm tính dương. Trọng tâm của các
q trình mơ tả ở trên là vấn đề xác định một dãy hiệp phương sai.
Nhiệm vụ chính của đề tài này là chúng tơi tìm hiểu phân tích tương
quan chính tắc, mở rộng gần đúng hiệp phương sai và nhận dạng chuỗi thời

gian dừng.
Nội dung của luận văn bao gồm 2 chương:
Chương 1. Các kiến thức chuẩn bị
Trong chương này, chúng tơi trình bày về khái niệm chuỗi thời gian và
quá trình ngẫu nhiên, các cơng thức tính hàm tự hiệp phương sai; hàm tự tương
quan; hàm tự tương quan mẫu; hàm tự tương quan riêng mẫu, về toán tử lùi,
toán tử tiến, biến ngẫu nhiên và hàm phân phối, ma trận, không gian Hilbert.
Chương 2. Phân tích tương quan chính tắc, xấp xỉ mở rộng hiệp
phương sai chuỗi thời gian dừng
Đây là nội dung chính của luận văn, gồm 4 phần. Phần 2.1 chúng tơi giới
thiệu về Tính dương, khơng âm và khai triển xấp xỉ của ma trận hiệp phương
sai Hankel. Phần 2.2 trình bày về Lý thuyết về thể hiện tính ngẫu nhiên trong
khơng gian Hilbert của một hàm mẫu. Phần 2.3 là các tương quan chính tắc và
sự thể hiện tính ngẫu nhiên cân bằng. Phần 2.4 trình bày về thể hiện của tính
ngẫu nhiên từ dữ liệu hiệp phương sai hữu hạn.
Luận văn này được hoàn thành tại Đại học Vinh dưới sự hướng dẫn khoa
học của Thầy giáo TS. Nguyễn Trung Hòa. Tác giả xin bày tỏ lịng biết ơn chân
thành và sâu sắc của mình đối với Thầy. Người đã dành cho tác giả nhiều thời
gian quý báu, sự quan tâm giúp đỡ, hướng dẫn tận tình cho tác giả hồn thành
luận văn này. Nhân dịp này tác giả cũng xin chân thành gửi lời cảm ơn tới Thầy
4


giáo PGS.TS Nguyễn Văn Quảng, Thầy giáo PGS.TS Trần Xuân Sinh, Thầy
giáo PGS.TS Phan Đức Thành cùng các Thầy giáo, Cơ giáo trong khoa Tốn,
khoa Sau đại học đã tham gia giảng dạy giúp đỡ tác giả trong suốt quá trình học
tập nâng cao trình độ kiến thức. Cuối cùng tác giả xin cảm ơn gia đình và đồng
nghiệp cùng tất cả bạn bè đã ủng hộ, động viên và tạo điều kiện tốt nhất cho tác
giả trong suốt quá trình học tập và nghiên cứu.
Mặc dù có nhiều cố gắng, song luận văn khơng thể tránh được những

thiếu sót, tác giả rất mong nhận được những ý kiến đóng góp q báu từ các
Thầy giáo, Cơ giáo và các bạn để đề tài được hoàn thiện hơn.
Vinh, tháng 12 năm 2011
Tác giả

5


Chương 1. NHỮNG KIẾN THỨC CHUẨN BỊ
1.1. Ma trận
1.1.1. Định nghĩa ma trận
Một ma trận A cỡ m  n trên trường K (K – là trường thực  , hoặc
phức  ) là một bảng chữ nhật gồm m  n phần tử trong K được viết thành m
dòng và n cột như sau: A   aij mn trong đó aij  K là phần tử ở vị trí dịng i, cột j
của A.
Các ma trận thường được ký hiệu bởi A, B, C và tập hợp tất cả các ma
trận cỡ m×n trên trường K được ký hiệu bởi Mm x n(K)
a
b
Ví dụ 1. Ma trận Hankel 
c

d

b
c

c
d


d
e

f

g

d
e

e
f

a
f

g

h
 i

b c d e
a b c d 
f a b c

g f a b
h g f a

aij = akh với mọi i + j = k + h


Ví dụ 2. Ma trận Toeplitz

1.1.2. Các phép toán trên ma trận
Cho A   aij   M mn  K  . Ta nói: B   bij   M nm  K  là chuyển vị của A (ký
hiệu B = AT) nếu: aij  b ji , i, j
Cho A  M mn  K  , a  K . Ta gọi tích của một số a và A (ký hiệu aA) là một
ma trận C   cij   M mn  K  được xác định bởi: cij  a.aij
Nếu a = -1 thì ta ký hiệu (-1).A bởi -A và gọi là ma trận đối của A.
Cho A  M n  K  . Khi đó, nếu AT = A thì ta nói A là ma trận đối xứng; nếu
AT = – A thì ta nói A là ma trận phản xứng.
6


Nhận xét:
Từ khái niệm ma trận chuyển vị, dễ thấy :
T T



A 



AT  BT  A  B

A

Nếu B là ma trận phản xứng thì các phần tử trên đường chéo chính của B
đều bằng 0.
Cho A  M mn  K  ;  ,   K . Ta có: (ab).A = a.(bA); (aA)T = a.(AT)

Cho A, B  M mn ( K ) . Ta gọi tổng của A và B, ký hiệu là A + B là một ma
trận C   cij   M mn  K  được xác định bởi: cij  aij  bij . Hiệu của hai ma trận A
và B là của A + (-B) được ký hiệu bởi A – B.
Cho A, B, C  Mm,n(K), ,   K. Khi đó:
 Tổng hai ma trận có tính giao hốn: A + B = B + A
 Tổng các ma trận có tính kết hợp: A + (B + C) = (A + B) + C
 Tồn tại ma trận 0mxn sao cho: A + 0 = 0 + A = A
 Tồn tại ma trận đối của A sao cho: A + (- A) = (- A) + A = 0
 Phép nhân vơ hướng có tính phân phối đối với phép cộng các ma trận:
α(A+B) = αA + αB ;(α +β)A = αA+ βA
 Chuyển vị của tổng bằng tổng các chuyển vị:(A + B)T = AT + BT
Cho hai ma trận A = (aịj)  Mn(K), B = (bịj)  Mn(K). Khi đó tích của hai
n

ma trận A và B là AB = C = (cij)  Mn(K) với ci j 
B, C  Mm,n(K), ,   K. Khi đó:
 A(BC) = (AB)C
 A(B+C) = AB + AC
 (B+C)A = BA + CA
 k(BC) = (kB)C = B(kC)
7

a

b , i, j  1, n Cho A,

ik kj

k 1



1.2. Khơng gian Hilbert
1.2.1. Định nghĩa
Khơng gian tuyến tính thực E được gọi là khơng gian tiền Hilber nếu
trên đó có xác định một tích vơ hướng, nghĩa là với mỗi cặp  a, b   E  E , ta đều
có tương ứng một số thực, ký hiệu là a, b sao cho:
1. a, b  b, a
2. a, b1  b2  a, b1  a, b2

a, b1, b2  E

3. a,  b   b, a ;

a, b  E,   R

4. a, a  0 với mọi a  E, ngoài ra a, a  0 khi và chỉ khi a = 0.
Nhận xét:
1. a1  a2 , b  a1 , b  a2 , b
2.  a, b   a, b khơng gian thực
Trong khơng gian tiền Hilbert có thể định nghĩa một hàm chuẩn như
sau:
x 

x, x .

Với hàm này khơng gian tiền Hilbert có thể được xem là một khơng gian định
chuẩn.
1.2.2. Giới hạn của dãy điểm
Ta nói dãy điểm xn = x1,x2,…,xn trong không gian tiên Hilbert E có
giới hạn là a, và viết: limxn = a, nếu dãy số xn  a có giới hạn bằng 0. Dãy có

giới hạn gọi là dãy hội tụ. Dãy không hội tụ gọi là dãy phân kỳ. Dễ thấy giới
hạn của một dãy hội tụ là duy nhất.
1.2.3. Định nghĩa:
Không gian tiền Hilbert đầy đủ được gọi là không gian Hilbert.

8


1.3. Khái niệm về chuỗi thời gian và quá trình ngẫu nhiên
1.3.1. Định nghĩa.
Quá trình ngẫu nhiên X t là các biến ngẫu nhiên phụ thuộc tham số

t  T (trong đó T   và được giải thích như là thời gian). Đó là hiện tượng
mang tính thống kê phát triển theo thời gian, tuân theo những quy luật của lý
thuyết xác suất.
1.3.2. Định nghĩa.
Giả sử T là tập hợp tất cả các số nguyên thuộc một khoảng nào đó

 a, b   ,    a  b   ;  X t

t  T  là một dãy các đại lượng ngẫu nhiên

được sắp xếp theo thứ tự trên T. Chuỗi thời gian là một dãy  xt t  T  (hữu hạn
hoặc vô hạn) các giá trị của dãy X t .
Nếu thời gian là một đoạn T   a ; b   thì chuỗi thời gian được gọi là
liên tục. Nếu thời gian là một tập hợp rời rạc T   thì chuỗi thời gian được
gọi là rời rạc.
Khái niệm chuỗi thời gian có quan hệ trực tiếp đến khái niệm quá trình
ngẫu nhiên và các chuỗi thời gian mà ta đang xét chính là thể hiện của một q
trình ngẫu nhiên.

Có thể xem chuỗi thời gian là một dãy các điểm trong không gian vô hạn
chiều các đại lượng ngẫu nhiên, trên đó đã xác định một độ đo xác suất. Chính
vì thế có thể đưa hàng loạt các khái niệm của quá trình ngẫu nhiên vào chuỗi
thời gian một cách cụ thể hơn.
Để phân biệt ta sẽ sử dụng thuật ngữ quá trình X t để chỉ một dãy các đại
lượng ngẫu nhiên mà một thể hiện của nó là chuỗi thời gian xt . Và cũng có thể
hiểu rằng, một chuỗi thời gian là một dãy rời rạc các thể hiện của một quá trình,
được chỉ số hóa bởi các số nguyên liên tiếp trong những khoảng thời gian cách
đều nhau.

9


Nếu tập hợp các thời điểm quan sát là t0 , t0  h,..., t0  Nh thì chuỗi thời
gian được kí hiệu là x0 , x1 ,..., xN và N  1 là độ dài của chuỗi.
Nếu T   thì chuỗi thời gian là dãy vơ hạn về cả hai phía

..., x2 , x1 , x0 , x1 , x2 ,...
Nếu T   thì chuỗi thời gian chính là dãy

x0 , x1 , x2 ,...
Vì biến ngẫu nhiên thực là ánh xạ đo được từ không gian xác suất

  , F, ) vào không gian đo được () nên quá trình X t là hàm của cặp (t,) đo
được theo

 với mỗi t T .

Ví dụ. Các báo cáo tài chính mà ta thấy hằng ngày trên báo chí, tivi hay
Internet về các chỉ số chứng khoán, tỷ giá tiền tệ, chỉ số tăng cường hay chỉ số

tiêu dùng…đều là những thể hiện rất thực tế của chuỗi thời gian.
Trong giới hạn của luận văn này ta chỉ xét cho trường hợp T là tập các
số nguyên và chúng ta sẽ sử dụng thuật ngữ chuỗi thời gian để đồng thời chỉ dữ
liệu cũng như quá trình có dữ liệu đó là một thể hiện.

1.4. Q trình dừng và phân tích hệ số tự tương quan
1.4.1. Khái niệm về quá trình dừng
Giả sử  X t  là chuỗi thời gian.  X t2   . Khi đó
a) Hàm số  X (t )   X t với t  T gọi là hàm trung bình của  X t  .
b) Hàm 2 biến  X (t , s)  cov( X t , X s )    X t   X (t )  X s   X ( s)  với

s, t  T được gọi là hàm tự hiệp phương sai của  X t .
Chuỗi thời gian  X t , t  được gọi là dừng nếu thỏa mãn:
+)  X t   ,
2

t   .

10


+)  X t  m ,

t   .

t , s, r   .

+)  X (t , s )   X (t  r , s  r ) ,

Nhận xét. Nếu  X t , t   dừng thì  X (t , s )   X (t  s ,0) và chính vì vậy với

một q trình dừng thì có thể định nghĩa lại hàm hiệp phương sai bằng cách chỉ
định nghĩa thông qua một hàm một biến.

 X (h)   X (h,0)  Cov( X t h , X t ), t , h  .
Hàm số  X (.) được gọi là hàm tự hiệp phương sai của  X t  và  X (h) là giá
trị của nó tại độ “trễ” h .
Hàm tự tương quan của

Xt ,

được định nghĩa tại biến trễ h là:

 X ( h)   X ( h)  (0)  Corr( X t h , X t ), t , h   .
X
Chú ý. Trong thực tế, ta chỉ quan sát được một thể hiện hữu hạn các giá trị của
X   xt t  1, 2, ..., n của một chuỗi thời gian dừng nên về nguyên tắc ta khơng
thể biết chính xác được các hàm tự hiệp phương sai của chuỗi thời gian đó,
muốn ước lượng nó ta đưa vào khái niệm hàm tự hiệp phương sai mẫu của thể
hiện X .
Quá trình ngẫu nhiên  X t  được gọi là dừng theo nghĩa “chặt” nếu như

t1  t2  ...  t k và h  0 ta có

X

t1  h

X

t1




, X t2 ,..., X tk có cùng phân phối với



, X t2  h ,..., X tk  h .

Định nghĩa này tương đương với việc đòi hỏi rằng các quy luật xác suất
của chuỗi  X t  và của chuỗi  X t  h  là như nhau với mọi h .
Q trình dừng đóng vai trị bản chất trong việc phân tích chuỗi thời gian
và dĩ nhiên trong thực tế, các chuỗi thời gian quan sát thường chưa phải là một
chuỗi dừng. Vì vậy, khi gặp những dữ liệu như thế, phải có những xử lý thích
hợp để biến chuỗi thời gian nguyên thủy thành một chuỗi mới phù hợp với điều
kiện của tính dừng. Cơng cụ đầu tiên nghiên cứu chuỗi thời gian là hàm tự hiệp
phương sai.
11


1.4.2. Hàm tự hiệp phương sai của một quá trình dừng
Mệnh đề. (Các tính chất sơ cấp) Nếu  (.) là hàm tự hiệp phương sai của một
quá trình dừng  X t , t   thì:

 (0)  0.
 ( h)   (0), h  .
Và  (.) là hàm chẵn nghĩa là  ( h)   (  h), h   .
Một hàm thực k :    được gọi là xác định không âm nếu và chỉ nếu:
n


 a k (t
i

i

 t j )a j  0, n  * , a  (a1 , a2 ,..., an )   n , t  (t1 , t2 ,..., tn )   n hay

i , j 1
n

nếu và chỉ nếu

 a k (i  j )a
i

j

 0 với n, a đã nêu ở trên.

i , j 1

Định lí. (Đặc trưng của hàm tự hiệp phương sai) Một hàm thực xác định trên
tập  được gọi là hàm tự hiệp phương sai của một chuỗi thời gian dừng nếu
và chỉ nếu nó là chẵn và xác định khơng âm.
Định lí. Nếu X t , t  là quá trình dừng, và nếu ai   , i  thỏa mãn điều


kiện






ai   thì hệ thức Yt 

i 

aX
i

t i

, t   định nghĩa một quá trình dừng.

i 

1.4.3. Hệ số tương quan và tự tương quan mẫu
1.4.3.1. Hệ số tương quan mẫu
Nếu ta quan sát được n giá trị của chuỗi  X t  là x1 , x2 ,..., xn và n giá trị
của chuỗi Yt  là y1 , y2 ,..., yn thì hệ số hiệp phương sai   Cov ( X , Y ) được ước
lượng bởi   XY  X * Y .
Còn hệ số tương quan  của X và Y được tính bởi công thức:


XY  X * Y

X

2


   Y

 X

12

2

2

.
 Y 

2




n
n
Trong đó X  1  xi ; Y  1  yi là trung bình số học của các số xi , yi

n

i 1

n

i 1


n

n
n
tương ứng và X 2  1  xi2 ; Y 2  1  y i2 ; XY  1  xi y i .

n

i 1

n

n

i 1

i 1

1.4.3.2. Hệ số tự tương quan mẫu (ACF)
Giả sử ta quan sát được n giá trị của chuỗi  X t  là x1 , x2 ,..., xn . Khi đó ước
lượng của hệ số tự hiệp phương sai  X (h ) là hệ số tự hiệp phương sai mẫu được
cho bởi:
n h
1
 ( h )   xt  h  X
n t 1



 x


t



X .


 ( h)   ( h) (với độ trễ của thời gian là h ).
và hệ số tự tương quan mẫu là 
 (0)
Trong đó
i)

n là số quan sát của đại lượng X .

ii)

xt là thể hiện của X t tại thời điểm t .

iii) X là giá trị trung bình của các thể hiện của chuỗi thời gian.
Nhận xét.


 (h) và  (h) đo mối tương quan giữa đoạn số liệu x1 , x2 ,..., xn h với đoạn

số liệu xh1 , xh 2 ,..., xn cách nhau một độ trễ của thời gian là h.


Giá trị  ( h) nằm giữa 1 và +1. Và  ( h)   (  h) với mọi độ trễ của thời


gian h . Do vậy trong quá trình nghiên cứu ta chỉ xét những h  0.
Như vậy ACF là một hàm hay đồ thị của độ tự tương quan của mẫu ở
độ trễ h  1,2,... ACF có thể được dùng để giúp chúng ta tìm ra một chuỗi thời
gian dừng x1 , x2 ,..., xn . Việc này có thể được thực hiện vì chúng ta có thể liên
kết động thái của ACF với sự dừng của chuỗi thời gian.
Tổng quát, với một chuỗi số liệu không có tính mùa có thể chỉ ra rằng:
i) Nếu ACF của chuỗi thời gian x1 , x2 ,..., xn hoặc giảm thật nhanh hoặc
giảm
13


dần khá nhanh thì giá trị của chuỗi thời gian được xem là dừng.
ii) Nếu ACF của chuỗi thời gian x1 , x2 ,..., xn giảm dần thật chậm thì chuỗi
thời gian được xem là khơng dừng.
Ý nghĩa chính xác của từ “khá nhanh” và “thật chậm” có phần tùy ý và
tốt nhất được xác định bằng kinh nghiệm. Hơn thế nữa, kinh nghiệm chỉ ra rằng
với dữ liệu không có tính mùa, việc ACF giảm khá nhanh, nếu có thường xảy
ra sau một độ trễ h  2 .
1.4.4. Hệ số tự tương quan riêng
Hệ số tự tương quan riêng là khái niệm ít được sử dụng hơn so với hệ số
tự tương quan trong việc phân tích chuỗi thời gian. Trên thực tế, hệ số tự tương
quan riêng chỉ giúp cho ta việc nhận dạng mơ hình tự hồi quy trung bình trượt
ARMA để dự báo.
Ta có thể quan niệm một cách thô thiển là hệ số tự tương quan riêng của
chuỗi số liệu  X t  nhằm để đo mức độ kết hợp giữa chuỗi thời gian  X t  và
chuỗi thời gian trễ  X t k  khi ảnh hưởng của các quan sát xen vào ở giữa đã bị
loại trừ (ví dụ k  4 thì ta loại X t 1 , X t  2 , X t 3 ra khỏi việc tính tốn).
Định nghĩa. Hệ số tự tương quan riêng của chuỗi thời gian dừng  X t  , được
kí hiệu là  (k ) chính là hệ số tương quan của hai biến ngẫu nhiên:


X t    X t X t 1 ,...., X t k 1  và X t k    X t k X t 1 ,...., X t k 1  .
Nói cách khác  (k ) đo sự phụ thuộc của X t và X t k sau khi loại bỏ các
ảnh hưởng (tuyến tính) của các giá trị trung gian.
Giá trị tương quan riêng phần của mẫu tại độ trễ k là:


 ( k )   kk

 ( k )

k 1
  ( k ) 



k  1, j  ( k  j )

j 1

k 1

1    k 1, j  ( j )

j 1

14

khi


k 1

khi k  2, 3,


Ở đây:  k , j   k 1, j  ( j )   kk  k i ,k  j với j  1,2,..., k  1.

k  (1k ,2 k ,...,kk ) là nghiệm của phương trình:
 kk   k  k   k1 k
 (1)
  (0)
  (1)
 (0)
k  
 


  ( k  1)  ( k  2)

  ( k  1) 
  ( k  2) 
.





 (0) 

Như vây hàm tự tương quan riêng mẫu (PACF) là một danh sách hay đồ

thị của các trị số tự tương quan riêng của mẫu ở các độ trễ k  1,2,... đại lượng
này mô tả một cách trực giác các trị tự tương quan của mẫu đối với các giá trị
quan sát chuỗi thời gian ngăn cách bằng một độ trễ k lần đơn vị thời gian.
Một lần nữa, để áp dụng phương pháp luận Box-Jenkins, chúng ta phải
thử và cố gắng phân loại động thái của PACF.
Đầu tiên, PACF của một chuỗi thời gian khơng có tính mùa có thể giảm
thật nhanh. Với dữ liệu khơng có tính mùa, kinh nghiệm chỉ ra rằng nếu PACF
tắt, một cách tổng quát nó sẽ giảm thật nhanh sau một độ trễ bé hơn hay bằng 2.
Thứ hai, chúng ta nói rằng PACF giảm dần nếu hàm này không giảm thật
nhanh nhưng giảm đi theo một “dạng ổn định”. PACF có thể giảm dần theo
một dạng hàm mũ tắt dần (khơng dao động hoặc có dao động), một dạng sóng
hình sin tắt dần hoặc một dạng bị trội bởi một trong hai dạng trên hoặc một tổ
hợp của chúng. Hơn nữa, PACF có thể giảm dần khá nhanh hoặc giảm dần thật
chậm.

15


Chương 2. PHÂN TÍCH TƯƠNG QUAN CHÍNH TẮC VÀ XẤP XỈ MỞ
RỘNG HIỆP PHƯƠNG SAI CỦA CHUỖI THỜI GIAN DỪNG
2.1. Bài toán nhận dạng dãy hiệp phương sai
Trọng tâm của các thủ tục được mô tả ở trên là bài toán nhận dạng một
dãy hiệp phương sai sau đây. Giả sử

 0 , 1 ,  2 ...,  v 

(1.1)

là một tập hữu hạn các ma trận hiệp phương sai cỡ m  m được ước lượng theo
một cách nào đó từ một dãy m chiều của các quan sát


 y0 , y1 , y2 ..., yT 

(1.2)

và xét bái tốn tìm một bộ ba tối tiểu các ma trận ( A, C , C ) nghĩa là nếu (A,C)
có thể quan sát được hồn tồn và (A, C ' ) có thể đạt được hồn tồn, thỏa mãn

CAk 1 C '  Ak k = 1,2,…,v

(1.3)

 0 , 1 ,  2 ,...

(1.4)

sao cho dãy vô hạn

k 1
thu được từ (1.1) bằng cách đặt CA C '  Ak với k = v+1,v+2,…, chính là

một dãy hiệp phương sai thật sự.
Bài tốn tìm bộ ba tối thiểu ( A, C , C ) thỏa mãn (1.3) được gọi là bài toán
thể hiện phần tối thiểu. Bộ ba ( A, C , C ) thường được tính bằng cách phân tích
tối thiểu một ma trận khối Hankel tương ứng với các dữ liệu (1.1) như sau:
 1

2
H =  


  i

2
3

3
4





i 1  i  2




 C  C 
j 
 CA  

 j 1 

  CA ' 
=   


 




 i 1  
  i  j 1 
CA  C ( A ') j 1 

16

/

(1.5)


trong đó i + k -1 = ν và ma trận Hankel H được chọn là càng gần vuông càng
tốt khi lấy i  j  1 . Trong thực tế, (1,3) có được nếu và chỉ nếu thỏa (1,5) với
mọi (i,j) sao cho i  j  1  v , và do đó phân tích tối thiểu phải được thực hiện
với một sự lựa chọn (i, j) để ma trận Hankel (1,5) có hạng tối đa. Dãy vơ hạn

0 , 1 ,  2 ...

k 1
thu được theo cách này bằng cách thiết lập CA C '  Ak với

k = v+1,v+2,… được gọi là một mở rộng hữu tỷ tối thiểu của dãy hữu hạn (1.1)
và nói chung không phải là một dãy tự hiệp phương sai. Số chiều r của một
phần mở rộng hữu tỷ tối thiểu được gọi là bậc đại số của dãy riêng (1.1). Rõ
ràng bậc r bằng bậc McMillan của ma trận hữu tỷ m×m

Z ( z )  C ( zI  A)1 C '

1

A0 ,
2

(1.6)

và các phần tử của chuỗi vô hạn (1.4) là các hệ số của khai triển Laurent

Z ( z) 

1
A0  A1 z 1  A2 z 2  ...
2

(1.7)

với z = ∞.
Tuy nhiên, các bài tốn nhận dạng cơ bản thì phức tạp hơn rất nhiều so
với bải toán thực hiện riêng cổ điển. Trong thực tế đòi hỏi (1.4) là một dãy tự
hiệp phương sai thật sự, có nghĩa là (1.4) là một dãy dương theo nghĩa với mỗi
t 



ma trận khối Toeplitz T t

0
 '
 1
Tt =  
 '

 t

1

2

0


1


 t' 1

 t'  2



t 
  t 1 

 

 0 

(1.8)

hình thành từ các chuỗi vơ hạn (1.4), xác định dương hoặc, tương đương, hàm
ma trận


 ( z ) : Z ( z )  Z (1 / z ) '
là nửa xác định dương trên đường tròn đơn vị, tức là:
17

(1.9)


(ei )  0 ,

 [0, 2 )

(1.10)

Tính chất này tương đương với Φ là một ma trận mật độ phổ. Trong thực tế, nó
là mật độ phổ của dãy hiệp phương sai (1.4). Rõ ràng (1.1) không thể là một
dãy tự hiệp phương sai riêng trừ khi Tν > 0, nhưng điều này là chưa đủ.
Theo quan điểm về phép nhận dạng, có thể có hai cách để xác định một
mơ hình ( A, C , C ) từ dãy hiệp phương sai hữu hạn (1.1). Một cách đã được đưa
ra trong tài liệu là làm tối thiểu hoá (1.5) một ma trận khối Hankel hữu hạn
dưới dạng cân bằng (Aoki, 1990, van Overschee và De Moor, 1993). Điều đó
đưa đến một giải pháp cho bài tốn thể hiện riêng tối thiểu và như sẽ được chỉ
ra trong bài này, khơng có một bảo đảm trước rằng phương pháp này sẽ đưa
đến một mở rộng dương. Thực tế không có vấn đề gì với dạng biến thiên (biến
thiên ngẫu nhiên) của các ước lượng hiệp phương sai (1.1), và để nhấn mạnh
điểm này, ta giả định ban đầu rằng tất cả các chuỗi dữ liệu (1.2) dài vô hạn.
Một phương pháp nhận dạng tiếng ồn về mặt lý thuyết, sẽ khơng được xem xét
trong bài này, trước tiên có thể được thay thế để thực hiện mở rộng dương và
sau đó sử dụng một thủ tục đệ quy mơ hình ngẫu nhiên trên bộ ba ( A, C , C ) của
chuỗi mở rộng dương.
Các vấn đề liên quan đến phần mở rộng dương sẽ được thảo luận tại mục

2.2, ở mục này sự ràng buộc tính dương sẽ được giải thích. Thất bại trong giải
quyết khó khăn này đã được chỉ ra bởi các tác giả của bài báo này tại các cuộc
họp khoa học trong mười năm qua. Điều này đã không mang lại hiệu quả rõ rệt,
ngoại trừ hai bài báo gần đây, Heij et al. (1992) và Vaccaro và Vukina (1993),
trong đó những vấn đề này đã được đề cập. Chúng tôi minh họa cho quan điểm
của mình về thủ tục nhận dạng của Aoki (1990) và chứng minh rằng có một giả
định ẩn và khó kiểm tra tuy nhiên nếu thiếu nó thì quy trình sẽ khơng được đảm
bảo thành cơng. Điều cơ bản là khơng có phương pháp nhận dạng khơng gian

18


con nào được nghiên cứu sẽ luôn luôn làm việc với các dữ liệu tổng quát nên
một vài điều kiện khơng hồn tồn tự nhiên trên các dữ liệu là cần thiết.

2.2. Tính dương, tính khơng dương và mở rộng xấp xỉ của ma trận hiệp
phương sai Hankel.
2.2.1. Giả thiết về bậc của dãy hiệp phương sai
Giải pháp của vấn đề thực hiện tối thiểu hoá một phần, tức là việc tìm bộ
ba ( A, C , C ) thỏa mãn (1.1) nói chung khơng phải là duy nhất. Tính không duy
nhất này đã được nghiên cứu, chẳng hạn Kalman và các cộng sự (1969),
Kalman (1979) và Gragg và Lindquist (1983), không phải là một vấn đề trong
bài báo này. Vì vậy, để tránh điều này, chúng ta sẽ giả thiết là bậc đại số của
(1.1) bằng bằng bậc đại số của

 0 , 1 ,  2 ...,  v1

(2.1)

vì vậy ta có thể sử dụng một ma trận Hankel (1.5) dựa trên dữ liệu này, tức là,

với i + j = ν, cho phép chúng ta xác định ma trận Hankel dich chuyển

 2

 (H )   3
 

  i 1

3
4

 i 2

4
5

 i 3

  j 1 
  j  2 

 

 v 

(2.2)

duy nhất. Trong trường hợp này, thuật toán cổ điển Ho-Kalman (Kalman và các
cộng sự al 1969.) tạo nên một nghiệm tối thiểu ( A, C , C ) và nó duy nhất sai

khác một phép biến đổi đồng dạng.
Lần đầu tiên được chỉ ra bởi Zeiger và McEwen (1974), phân tích tối
thiểu mà trên đó thủ tục Ho-Kalman dự trên phân tích kỳ dị, do đó xác định

19


( A, C , C ) duy nhất, xem Kung (1978). Trong thực tế, ma trận Hankel H có thể
được phân tích thành
H = UΣV’

U’U = I = V’V

(2.3)

trong đó Σ là ma trận chéo cấp n gồm các trị kỳ dị khác không được sắp theo
thứ tự giảm dần. Đặt Ω: = UΣ1/2 và  : = VΣ1/2 sẽ dẫn đến một phân tích

H   '

 '     '

(2.4)

có dạng (1.5). Thế thì một nghiệm tối thiểu (A,C, C ) thu được bằng cách giải

A '   ( H ),

C  '   ( H ),
1


và C '   ( H '),
1

ở đây σ(H) là ma trận chuyển Hankel (2.2) và ρ1(H) là khối dòng đầu tiên của
H. Suy ra bộ ba (A,C, C ) cần phải được lấy bởi

A  1/2 U ' (H )V 1/2 ,

(2.5a)

C  p1 ( H )V  1/2 ,

(2.5b)

C  p1 ( H ')U  1/2 ,

(2.5c)

một dạng mà chúng ta gọi là như là khoảng hữu hạn cân bằng, vì nó được cân
bằng theo nghĩa cả  '  và  '  đều bằng Σ, và
 C 


 CA ' 






C ( A ') j 1 

 C 


CA



 


CAi 1 

(2.6)

Aoki (1990) đã đề xuất rằng thủ tục này cũng được sử dụng cho phép
nhận dạng các chuỗi thời gian. Với chiến lược trên thì thuật tốn này là một thủ
tục thể hiện tất định và do đó khơng bảo đảm trước rằng (1.6) là thực sự dương,
hoặc thậm chí ổn định, ngay cả khi ma trận Toeplitz Tν được xác định dương.
Như được trình bày trong Byrnes và Lindquist (1982), có những tập con mở
của không gian dữ liệu hiệp phương sai (1.1), với nó A là khơng ổn định, huống
hồ là dương. Thực tế, giống như trong van Overschee và De Moor (1993), thủ

20


tục của Aoki (1990) là dựa trên giả thiết ẩn sau đây mà khơng hồn tồn tự
nhiên.
Giả định 2.1. Dữ liệu hiệp phương sai (1.1) có thể được tạo ra chính xác bởi

một hệ ngẫu nhiên chưa biết nào đó có số chiều bằng hạng của H.
Vì vậy, chúng ta khơng những cần phải biết rằng có một hệ cơ bản hữu
hạn chiều, mà cịn cần phải có một giới hạn trên đối với số chiều của nó. Phải
v
2

chăng cận trên bằng [ ] là đủ.
Giả định này liệu có đúng không? Nếu các dữ liệu hiệp phương sai được
tạo ra một cách thực sự chính xác từ một hệ thống ngẫu nhiên "thực sự" và có
một ước lượng đáng tin cậy về cấp của nó khơng lớn hơn một nửa chiều dài của
chuỗi hiệp phương sai, thì giả định sẽ đúng. Tuy nhiên, đây là một điểm quan
trọng của bài viết này, người ta không thể hy vọng vào Giả định 2.1 đúng với
dãy hiệp phương (1.1) sai tùy ý.
Để làm rõ điểm này, ta hãy gọi
tối thiểu của

 0 , 1 ,  2 ,... là một mở rộng hữu tỷ

 0 , 1 ,  2 ,...,  v  nếu hàm hữu tỷ (1.7) có bậc tối thiểu. Theo

định nghĩa thì đây là bậc đại số của

 0 , 1 ,  2 ,...,  v  . Một mở rộng hữu

tỷ được gọi là dương nếu, với mỗi μ > ν, ma trận khối Toeplitz Tμ được tạo nên
từ các chuỗi vô hạn tương ứng (1.4) là xác định dương. Một mở rộng với tính
chất này được gọi là mở rộng hữu tỷ dương. Ta đã biết rằng mở rộng

 0 , 1 ,  2 ,... là dương nếu và chỉ nếu (1,7) dương thực sự, tức là hàm hữu
tỷ Z(z) là giải tích trong đường trịn đóng đơn vị và hàm ma trận


( z )  Z ( z )  Z (1/ z ) '

(2.7)

là xác định khơng âm trên vịng trịn đơn vị, có Φ là ma trận mật độ phổ. Một
mở rộng dương hữu tỷ dương tối thiểu của chuỗi hữu hạn (1.1) là sự mở rộng
mà số chiều của bộ ba ( A, C , C ) trong (1,6) càng nhỏ càng tốt.
21


2.2.2. Định nghĩa bậc dương của dãy hiệp phương sai
Định nghĩa 2.2.

Bậc dương p của dãy tự hiệp phương sai hữu hạn

{0,1,…,} là số chiều của mở rộng dương tối thiểu bất kỳ.
Một ví dụ đã biết của một mở rộng dương là mở rộng entropy cực đại
(Whittle, 1963) tương ứng với mật độ phổ Φ(z) := W(z)W(1/z)’, trong đó yếu tố
phổ W(z) là nghịch đảo (sai khác một nhân tử ma trận hằng) của đa thức ma
trận Levinson-Szego bậc ν tương ứng với dãy tự hiệp phương sai hữu hạn (1.1).
Vì hàm hữu tỷ W(z) nói chung có bậc McMillan bằng mν, suy ra từ lý thuyết
phân tích phổ (Anderson, 1958) rằng Z(z) cũng có bậc mν. Do đó, bậc dương p
bị chặn dưới bởi bậc đại số r và bị chặn trên bởi mν.
Như đã nêu, vấn đề phổ biến trong các tài liệu (Aoki, 1990, van
Overschee và De Moor năm 1993 và những người khác) là việc bỏ qua các
ràng buộc về tính dương và sử dụng đại số chứ không phải là mở rộng dương,
thường được tính bằng việc phân tích tối thiểu một ma trận khối Hankel như
(1,5), hoặc về nguyên tắc, bằng phương pháp tương đương, ngay cả khi các ma
trận Hankel không được tính tốn rõ ràng. Trong thực tế, Giả định 2.1 cũng có

thể được phát biểu theo cách sau.
2.2.3. Giả định về bậc dương p của dãy hiệp phương sai
Giả định 2.1’. Bậc dương p của (1.1) tương đương với bậc đại số .
Giả định này quy định một thuộc tính của dãy tự hiệp phương sai (1.1),
nó khơng tổng qt. Ta có thể minh họa điều này bằng việc xét bài toán mở
rộng hữu tỉ một dãy tự hiệp phương sai vô hướng hữu hạn (1.1). Bậc dương p
nằm giữa bậc đại số r và ν. Lưu ý không phải là trường hợp p = ν và cũng
không phải trường hợp p <ν là "điều hiếm có", bởi vì có các tập hợp mở các
dãy hiệp phương sai (1.1) của cả hai trường hợp trên. Trong Byrnes và
Lindquist (1996) đã chỉ ra rằng với mỗi μ sao cho ν/2 ≤ μ ≤ ν có một tập mở
của dữ liệu hiệp phương sai trong Rv mà p = μ. Nếu giới hạn trên p = ν đạt
22


được, có vơ hạn các bộ ba tối thiểu khơng tương đương ( A, C , C ) khi đưa ra
một mở rộng dương, một trong số đó là mở rộng entropy cực đại. Trong thực
tế, có thể chỉ ra rằng các mở rộng ν chiều ấy tạo nên một không gian Euclide
(Byrnes và Lindquist, 1989). Điều này cho thấy rằng dữ liệu hữu hạn (1.1)
khơng có đủ thơng tin để thiết lập một hệ cơ bản "thực sự". Tương tự với
trường hợp khi p < ν.
Ví dụ 2.3. Xét trường hợp m = 1 và ν = 2, tức là, xét một dãy hiệp phương sai
riêng vô hướng { 0 , 1 , 2 }.Nếu  1 =  2 = 0, ta có r = p = 0. Mặt khác ta
ln có r = 1, ở những chỗ bậc dương có thể hoặc là một hoặc hai. Đặt γ0: =

1/0 và γ1 := ( 12 + 2)/(1 -  12 ), Có thể chỉ ra (Geogion, (1987, hoặc trong
Byrnes và Lindquist, năm 1996, nhiều ví dụ khác cũng được đưa ra) rằng p = 1
nếu và chỉ nếu
1 

0

1  0

và p = 2 nếu ngược lại.
Trong thực tế, khơng khó khăn để xây dựng các ví dụ mà sự khác biệt
giữa hạng đại số và hạng dương là lớn tùy ý, như định lý sau đây.
2.2.4. Sự khác biệt giữa bậc đại số và bậc dương
Định lý 2.4. Giả sử n    cố định. Khi đó với một ν lớn tùy ý có một hàm hữu
tỷ ổn định Z ( z ) bậc n, sao cho ma trận Toeplitz Tv có dạng (1.8) gồm các hệ số
của mở rộng Laurent (1.7), là xác định dương khi T v1 là không xác định.
Chứng minh. Trước tiên ta chứng minh cho trường hợp n =1. Xét một hàm vô
hướng

Z  z 

1 z b
2 za

23

(A.1)


Với một dãy vô hướng (1.4) sao cho 0=1. Ta biết rằng T là xác định dương
khi và chỉ khi

t 1

t = 0, 1, 2,…, v – 1

(A.2)


trong đó {0, 1, 2,…} được gọi là các tham số Schur. Có một tương ứng 1-1
giữa các dãy riêng (1.1) và các dãy riêng cúng độ dài {0, 1,…, -1}. Người ta
đã chỉ ra rằng các tham số Schur của (2.1p) được sinh bởi hệ động lực phi
tuyến

1
 0  ( a  b)
2
1
 0  (b  a )
2

t



 t 1 1   2

t

   t t
 t 1 1   t2

(A.3)

và Tt đúng là kỳ dị khi có hữu hạn escape. Byrnes và các cộng sự (1991) cũng
đã chỉ ra rằng {t} được sinh bởi một hệ tuyến tính

 u t 1   2 / k

v    1
 t 1  

1  u t 
,
0   vt 

(A.4)

Trong đó t = vt / ut và K := (a+b)(1+ab)-1 . Nếu modun của K lớn hơn 1, ma
trận hệ số của (2.4p) có các trị riêng phức và do đó sai khác một nhân tử vô
hướng dạng

 cos
  sin 


sin  
,
cos 

Trong đó := arctan K 2  1 . Vì vậy t là độ nghiêng của một đường thẳng đi
qua gốc tọa độ của R 2 quay ngược chiều kim đồng hồ với một góc  theo mỗi
bước thời gian. Hệ quả là
arctan t+1 = arctan t +  .

24


Hơn nữa, giả thiết rằng 0 > 0, điều kiện Schur t < 1 sẽ khôg thỏa mãn chừng

nào t+1 âm hoặc khơng xác định, như có thể thấy từ hệ thức đề quy đầu tiên
của (2.3p). Vì vậy (2.2p) thỏa mãn khi và chỉ khi
arctan +1 < /2
vì vậy, với một  > 0 đủ nhỏ, lấy a = 1-  và b = 1+ , cho một Z ổn định. Khi
đó K 

 
2
và   arctan
2
2
2
2


4   2  . Ta có thể chọn  sao cho



  ,
 1


ở đây  :


 arctan  0 . Thế thì (2.5p) bảo đàm cho T > 0, nhưng ta cũng có
2

arctan +1 > /2

để cho T  0.
Tiếp theo, giả sử n tùy ý. Xét hàm vô hướng
1
Z z  
2

1
a  b  n1 z 
2
1
 n z   a  b  n 1  z 
2

 n z  

Ở đây {t} và {t} là các đa thức Szego loại một và loại hai tương ứng. Hàm Z
có tính chất là n tham số Schur đầu tiên của nó, {0, 1 ,…,n-1}, đúng là dữ liệu
xác định duy nhất n , n-1, n và n-1;[1987],[1994]. Theo [1994] nó chỉ ra
rằng các tham số Schur còn lại được sinh bởi

t



t

1

1   t2 n 1



   t t
 t 1 1   t2 n1

1
 0  ( a  b)
2

Vì vậy, ta cần quy nạp bài toán với trường hợp n = 1. Nếu ta chọn tham
số Schur ban đầu đủ bé sao cho n(z) và n-1(z) xấp xỉ zn và zn-1,

n(z) +0n-1(z)
25


×