Tải bản đầy đủ (.doc) (14 trang)

TIỂU LUẬN THỐNG KÊ KHÍ HẬU

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (564.74 KB, 14 trang )

TIỂU LUẬN THỐNG KÊ KHÍ HẬU
I.GIỚI THIỆU MỘT SỐ MÔ HÌNH THỐNG KÊ
1. Mô hình hồi quy
a) Hồi quy tuyến tính
- Hồi quy tuyến tính một biến
Khái niệm về hồi quy:
Xét mối quan hệ giữa hai biến ngẫu nhiên X và Y, giữa chúng có mối quan
hệ phụ thuộc hàm: X = f(Y). Giữa chúng có mối quan hệ phụ thuộc thống kê. Mỗi
giá trị x ∈ X tương ứng với một hàm phân bố (hoặc hàm mật độ) có điều kiện
F(y/x) (hoặc f(y/x)) của Y. Ta gọi mối quan hệ phụ thuộc này là sự phụ thuộc
tương quan giữa hai biến ngẫu nhiên.
Để xác định mối quan hệ tương quan ta cần phải xác định được các phân bố
có điều kiện
)(
),(
)/(
2
yf
yxf
yxf =

)(
),(
)/(
1
xf
yxf
xyf =
Để xác định các phân bố có điều kiện trên là rất khó. Do vậy, để đơn giản chúng ta
chỉ xét mối quan hệ phụ thuộc giữa X và một số đặc trưng có điều kiện của Y, như
kỳ vọng, trung vị, mốt, …


Phổ biến hơn cả là xét mối quan hệ giữa X và kỳ vọng có điều kiện m
y
(x)= M[Y/X]

Đây là sự phụ thuộc hồi quy: Hồi quy của Y lên X
y = m
y
(x)
Hồi quy trên được gọi là hồi quy I. Hồi quy này có thể là hàm tuyến tính hoặc phi
tuyến. Nói chung, y = m
y
(x) là một hàm bất kỳ, phức tạp và hầu như không biết
được dưới dạng giải tích.

+∞
∞−
=== dyxyyfxXYMxm
y
)/(]/[)(
y = m
y
(x)
x
t
,y
t
Trong thực tế, để nghiên cứu mối quan hệ tương quan giữa Y và X người ta
thường xấp xỉ m
y
(x) bởi một lớp hàm f(x) nào đó đã biết trước dạng giải tích y ≈

= f(x). Trong trường hợp này hàm hồi quy tìm được gọi là hồi quy II.
Trong trường hợp hàm hồi quy II được xác định bằng phương pháp bình
phương tối thiểu thì nó được gọi là hồi quy bình phương trung bình. Trường hợp
đơn giản nhất của hồi quy bình phương trung bình là hồi quy bình phương trung
bình tuyến tính, f(x) là hàm bậc nhất
Y = f(X) = α + βX, hay Y = f(x) = α + βx
Với các hệ số xác định bởi :
α = M[Y] - βM[X], β = µ
xy

xx
- Hồi quy tuyến tính nhiều biến
Xét m biến ngẫu nhiên X
1
, X
2
, , X
m
với phân bố đồng thời f(x
1
, x
2
, , x
m
).
Hồi quy I giữa X
1
lên X
2
, X

3
, , X
m
được xác định bởi :
x
1
= m
1
(x
1
, x
2
, , x
m
) = M[X
1
/X
2
=x
2
, ,X
m
=x
m
] =
Trong đó f(x
1
,x
2
, ,x

α
) là mật độ có điều kiện của X
1
khi X
2
= x
2
, , X
α
=x
α
Đây là quỹ tích của những điểm (m
1
, x
1
, x
2
, , x
m
) với mọi giá trị có thể có của
x
2
, , x
m
và được gọi là mặt hồi quy I
x
1
= m
1
(x

1
, ,x
m
)
Nói chung, đây là một mặt bất kỳ và trên thực tế khó có thể biết được dạng
thức giải tích của nó.
Nếu xấp xỉ x1 bởi một hàm f(x2, ,xm) nào đó đã biết trước dạng giải tích
m
1
(x
2
, ,x
m
) ≈ = f(x
2
, ,x
m
)
nó được gọi là hồi quy II của X
1
lên X
2
, ,X
m
.
Nếu hàm f thuộc lớp hàm tuyến tính thì mặt hồi quy được gọi là một siêu phẳng.
Khi đó ta có phương trình hồi quy tuyến tính nhiều biến :
y
ˆ


+∞
∞−
1211
), ,/( dxxxxfx
m
1
ˆ
x
mm
xxx
βββ
+++=

ˆ
2211
mm
XXX
βββ
+++=
ˆ
2211
Các hệ số β
1
được xác định sao cho
min
2
2
11














+−

=
m
i
ii
XXM
ββ
b) Hồi quy phi tuyến
- Hồi quy phi tuyến một biến
Hồi quy phi tuyến là khi y = my(x) ≈ f(x), với f(x) là một hàm phi tuyến nào đó
Nguyên tắc cơ bản để tìm các phương trình hồi quy phi tuyến là tuyến tính hóa các
thành phần phi tuyến
Một số dạng phổ biến :
1) Dạng hyperbol :
x
a
ay
1

0
+=
đặt
x
x

=
1
và đưa phương trình về dạng mới
xaay

+=
10
2) Dạng lũy thừa :
1
0
a
xay =
logarit hóa hai vế :
xaay logloglog
10
+=
và đặt
yy

=log
,
xx

=log

,
00
log aa

=
và phương trình được đưa về dạng :
xaay

+

=

10
3) Dạng hàm mũ :
xa
eay
1
0
=
logarit tự nhiên hai vế rồi đặt
yy

=ln
,
00
ln aa

=
và đưa phương trình về dạng mới :
xaay

10
+

=

4) Dạng lôga :
xaay log
10
+=
, đặt
xx

=log
ta được dạng mới :
xaay

+=
10
5) Dạng đa thức bậc cao :
m
m
xaxaxaxaay +++++=
3
3
2
210
-Hồi quy phi tuyến nhiều biến
c. Hồi quy từng bước
Khi xét hồi quy giữa X1 và các X2, , Xm với m khá lớn, nảy sinh vấn đề :










=++++
=++++
=++++
=++++
∑∑∑∑∑
∑∑∑∑∑
∑∑∑∑∑
∑∑∑∑
++
+
+
yxxaxaxaxa
yxxaxaxaxa
xyxaxaxaxa
yxaxaxana
mm
m
mmm
m
m
m
m

m
mo
22
2
1
10
224
2
3
1
2
0
13
2
2
10
2
21





Phương trình hồi quy quá cồng kềnh, sai số hệ thống tăng, giữa các X
2
, X
m
luôn
tồn tại mối tương quan do vậy một số biến không cần thiết có mặt trong phương
trình hồi quy.

Bài toán đặt ra : Chỉ chọn k trong số m biến (k << m) có ý nghĩa quan trọng nhất.
Một trong những cách giải quyết bài toán này là hồi quy từng bước (Stepwise
Regression).
Xét hồi quy tuyến tính giữa biến phụ thuộc X
1
và m-1 biến độc lập X
2
, , X
m
.
Bước 1 : Tính các hệ số tương quan toàn phần r
1
, giữa X
1
và các X
i
(i=2 m) và
chọn trong chúng hệ số có giá trị tuyệt đối lớn nhất.
Giả sử :
{ }
i
mi
rr
1
2
12
max
≤≤
=
ta có

)1(
2
)1(
2
)1(
1
)1(
1
sxaax →+=⇒
Bước 2 : Tính các hệ số tương quan riêng r
1,2
(i=3 m) và chọn hệ số có giá trị lớn
nhất trong chúng. Giả sử:
{ }
21
3
213
max

≤≤

=
i
mi
rr
ta có
)2(
3
)2(
32

)2(
2
)2(
1
)2(
1
sxaxaax →++=⇒
Bước 3: So sánh giá trị chuẩn thặng dư s
(2)
với s
(1)
:
Quá trình được chọn cho đến bước thứ k thỏa mãn điều kiện:
ε
<


)(
)1()(
k
kk
s
ss
2. Hàm phân lớp
Phương pháp áp dụng hàm phân lớp vào dự báo khí tượng đã được đề cập
đến khá lâu trên thế giới. ở nước ta cũng đã có một số tác giả nghiên cứu áp dụng
như Nguyễn Viết Phong (1964), Nguyễn Văn Tuyên (1988), Phan Văn Tân (2000),
Nguyễn Viết Lành (2001), Tuy nhiên bài toán phân lớp chủ yếu được thực hiện
với những dự báo các hiện tượng mà kết quả dự báo chỉ trả lời câu hỏi là có hoặc
không, tức là chỉ tồn tại 2 lớp A và B mà xác suất xuất hiện lớp này là phần bù của

lớp kia. Nói cách khác:
P(A) = 1 - P(B)
ở đây: P(A), P(B) là xác suất xuất hiện 2 lớp đối nhau A và B của một hiện
tượng Q nào đó. Dự báo như vậy được gọi là dự báo 2 pha, ví dụ: dự báo xuất hiện
dông, xuất hiện sương mù, có bão hay không, mưa trên chuẩn hay dưới chuẩn, Ta
xét mối quan hệ giữa Q và một tập hợp các nhân tố X
j
(j=1,…, M) mà ta cho rằng
giữa chúng có quan hệ với nhau. Giả sử khi Q xảy ra lớp A ta sẽ có tập hợp {X
j
A
}
và ngược lại ứng với lớp B ta có tập hợp {X
j
B
}. Khi đó giữa {X
j
A
} và {X
j
B
} có thể
xảy ra:
- 2 tp hp ny khụng giao nhau, tỏch ri khi nhau. Khi ú thụng qua s
xut hin ca X ta cú th nhn bit hay d bỏo chớnh xỏc s xut hin A hay B ca
hin tng Q;
- 2 tập hợp này giao nhau, khi đó tuỳ thuộc phần giao nhau nhỏ hay lớn mà
khả năng dự báo Q chính xác đợc nhiều hay ít thông qua sự xuất hiện của X. Tất
nhiên, khi chúng trùng khít nhau thì không có khả năng dùng X để nhận biết hay dự
báo Q.

Thụng thng, ngi ta dựng mt hm f no ú biu th giỏ tr ca X sao cho
f(X
j
A
) v f(X
j
B
) to thnh 2 min giỏ tr trờn trc s. Hai min ny tỏch ri nhau
hoc giao nhau tng ng vi mc giao nhau ca {X
j
A
} v {X
j
B
} trong khụng
gian M chiu. im phõn cỏch tt nht l 0. Khi ú du ca f(X
j
A
) v f(X
j
B
) s giỳp
ta nhn bit hay d bỏo 2 lp ca Q. Nu gi I l hm phõn lp v hm phõn b ca
cỏc X
j
l chun, khi ú cú th t:
I = Sign[(P(X)]
Trong nhiu cụng trỡnh, ngi ta chn hm I di dng:
õy f l hm mt . Vi gi thit l cỏc hm f(x
i

) u cú dng phõn b
chun, ta s cú f
0
(X
A
) v f
1
(X
B
) cng cú phõn b chun vi hm mt :
Trong ú: R
ij
l ma trn tng quan v |R| l nh thc ca nú, à
0
, à
1
l k
vng ca tp hp A v B. Khi ú hm I cú dng chung:
hoc

Cú th nhn c c
i
(i = 0,, M) nh vo quan h tng quan gia cỏc X
i
. I
s nhn c giỏ tr trỏi du, nu X
i
thuc vo 2 tp khỏc nhau ó nờu. iu ú
cng cú ngha l tựy theo du ca I ta s cú c tớn hiu xut hin A hay B.
i vi trng hp s pha >2 cũn ang ớt kt qu nghiờn cu s dng hm

phõn lp d bỏo. Chng hn i vi 3 pha:
- Pha 1 (di chun): Y < Y
1






= c
Xf
Xf
LnI
B
)(
)(
1
0
A

= =











=
M
i
M
j
kjjkii
M
Mk
xx
R
xxxf
1 1
ij
5.0
2/
21
))((
R
1
2
1
expR)2() ,(
àà
i
M
i
M
j
ji

ij
x
R
I )(
1
2
1
1 1
10

= =
=
àà
(30)
(31)
(31)
i
M
i
i
xCCI

=
+=
1
0
(32)
- Pha 2 (cn chun) : Y
1
Y < Y

2
- Pha 3 (trờn chun): Y Y
2
Cỏc ngng Y
1
v Y
2
c xỏc nh bng mt trong hai tu chn sau õy:
- Tớnh theo cỏc phõn v: Y
1
= q
33
, Y
2
= q
66
, trong ú q
33
v q
66
l cỏc phõn v
ng vi cỏc xỏc sut 33% v 66%;
- Tớnh theo lch chun: Y
1
= Y
tb
- S
y
/2, Y
2

= Y
tb
+ S
y
/2 trong ú
Y
v S
y
tng ng l giỏ tr trung bỡnh v lch chun ca Y.
Hàm phân lớp ứng với pha thứ i (i=1, 2, 3) cũng đợc sử dụng dạng tơng tự nh
đối với hàm phân lớp (32), có dạng:
F
i
=
i
0
C
+
i
1
C
1
X
+
i
2
C
2
X
++

i
M
C
M
X
(i=1,2,3) (33)
Trong ú M l s nhõn t d bỏo; X
j
(j=1,2, ,M) l cỏc nhõn t d bỏo. Kt
qu d bỏo s cn c vo giỏ tr ca F
i
. Nu F
k
= max{F
i
(i=1,2,3)}: d bỏo hin
tng ri vo pha k (vi k=1, 2, 3).
a) Hai lp
b) Nhiu lp
Phơng pháp phân lớp đợc sử dụng rộng rãi trong khí tợng để xây dựng các
phơng trình dự báo các pha thời tiết khác nhau, thông dụng nhất là phân hai lớp
tuyến tính. Ưu điểm của nó là sử dụng dễ dàng và cho hiệu quả cao, nhất là đối với
dự báo sự có xảy ra và không xảy ra một hiện tợng thời tiết nào đó.
Giả sử có hai pha thời tiết là
1


2

cùng với véc tơ nhân tố ảnh hởng đợc

chia thành hai lớp tơng ứng. Nh vậy mỗi véc tơ nhân tố ảnh hởng ở trong số liệu lu
trữ X = (
1
x
,
2
x
,
n
x
) ta biết nó thuộc lớp nào trong hai lớp
1


2

. Nhiệm vụ đặt ra là
ta phải tìm quy tắc giải để khi có bất kỳ véc tơ nhân tố ảnh hởng nào không nằm
trong bộ lu trữ ta phải chỉ ra đợc thời tiết thuộc
1

hay
2

.
ứng với mỗi nhân tố ảnh hởng là một điểm trong không gian n chiều. Các
điểm ứng với các véc tơ nhân tố ảnh hởng thuộc một lớp sẽ tạo ra một miền nào đó
trong không gian n chiều. Nếu ta ký hiệu các điểm của lớp thứ nhất là dấu tròn, các
điểm của lớp thứ hai là dấu gạch thì trong trờng hợp có hai nhân tố ta có hai miền
trong mặt phẳng, hai miền này có thể ở một trong 3 trờng hợp sau:

Trờng hợp thứ nhất: Hai miền riêng biệt. Đây là trờng hợp phân lớp lý tởng.
Các véc tơ nhân tố ảnh hởng chia thành hai lớp. Trong không gian n chiều rất ít khi
thấy. Trong không gian này ta tìm đợc đờng thẳng phân chia hai lớp.
Trờng hợp thứ 2, hai miền trùng nhau ta không thể phân chia các véc tơ nhân
tố ảnh hởng thành các lớp, nh vậy không thể dự báo đợc pha thời tiết
1


2

theo
hệ thống nhân tố đã chọn.
Trờng hợp thứ 3 là hai miền có chung trong trờng hợp này đa đến dự báo có
điều kiện.
Trong thực tế khí tợng bài toán phức tạp hơn nhiều vì các véc tơ nhân tố ảnh
hởng bị giới hạn thống kê và biên của miền xác định cha chắc có trong bộ số liệu
mẫu, ta chỉ có thể tìm đợc biên hữu hạn của chúng, giá trị tìm đợc chỉ có ý nghĩa
xác suất ứng với qui luật phân bố các đại lợng cực trị.
Giả sử sau khi tuyển chọn bằng các phơng pháp ở trên, ta có một tập hợp m
nhân tố x
i
= (x
1
, x
2
,, x
m
) cần đa vào tham gia xây dựng phơng trình dự báo phân
hai lớp. Trong chuối số liệu của mỗi nhân tố: x
i

= (x
i1
, x
i2
,, x
in
) đợc phân thành 2
lớp ứng với các pha thời tiết cần dự báo.
Gọi n
1
và n
2
là độ dài lớp 1 và lớp 2 của nhân tố x
i
: n
1
+ n
2
= n.
Giả thiết hàm mật độ phân bố các nhân tố trong mỗi lớp là phân bố chuẩn.
Gọi f
1
(x
1
, x
2
,, x
n
) là hàm mật độ xác suất của các nhân tố (x
1

, x
2
,, x
n
) trong lớp 1
và f
2
(x
1
, x
2
,, x
n
) là hàm mật độ xác suất của các nhân tố (x
1
, x
2
,, x
n
) trong lớp 2.
Ta có hàm mật độ xác suất đối với hai pha nh sau:
( ) ( )
1
1
2 2
1 1 2 1 1
1 1
1
( , , , ) (2 ) .exp
2

n
n n
n ij i i j j
i j
f x x x k x x x x



= =

=



( ) ( )
1
1
2 2
2 1 2 2 2
1 1
1
( , , , ) (2 ) .exp
2
n
n n
n ij i i j j
i j
f x x x k x x x x




= =

=



Với giả thiết: k
ij
(I) = k
ij
(II) = k
ij
Và:
( ) ( )
ij
k
i i j j
E x x x x=

1
ij
ij
k
k

=

Trong đó:
11 12 1

21 22 2
1 2



n
n
n n mn
k k k
k k k
k k k
=
là mô men tơng quan của véc tơ
ij
x

1
ij
k

là các thành phần của ma trận mô men tơng quan nghịch đảo.
Xét tỉ số
1
2
f
F
f
=
.
- Nếu khả năng yếu tố dự báo xảy ra vào lớp thứ nhất lớn hơn khả năng xảy ra ở lớp

thứ hai thì
1
f
>
2
f
, khi đó F>1.
3. Phân tích trực giao
a) Hàm trực giao tự nhiên
- Đặt bài toán
Trong thực tế ta có thể khai triển một hàm không ngẫu nhiên bất kỳ f(t)
thành chuỗi theo một hệ hàm
( ){ }
t
k
ϕ
nào đó :
( ) ( )


=
=
1k
kk
tatf
ϕ
Hệ hàm
( ){ }
t
k

ϕ
là trực chuẩn trên đoạn [a,b] nếu :




=

=
b
a
ki
ki
ki
tdtt
. khi 1
, khi 0
)( )(
ϕϕ
Khi đó hệ số khai triển Fourier a
k
được xác định bởi:

=
b
a
kk
dtttfa ,)()(
ϕ
Nếu xấp xỉ khai triển f(t) bởi n thành phần đầu

( ) ( ) ( )


=≈
n
k
kkn
tatftf
1
ϕ
Khi đó sai số xấp xỉ tại mỗi giá trị đối số t là:
( ) ( ) ( )
tftft
nn
−=
δ
Sai số bình phương trung bình của phép xấp xỉ là:
( ) ( )
[ ]

−=
b
a
nn
dttftf
2
δ
Nếu hệ hàm
( ){ }
t

n
ϕ
là trực chuẩn đầy đủ thì với mọi hàm f(t) bất kỳ ta có:


=

=
b
a
k
k
dttfa )(
2
1
2
Hệ hàm
( ){ }
t
n
ϕ
có thể là hệ hàm lượng giác, hệ hàm Bessel, đa thức trực giao –
Trebưsev, Ermit và các hệ hàm khác.
Giả sử X(t) là một hàm ngẫu nhiên xác định trên khoảng [a,b] có kỳ vọng toán học
bằng không, m
x
(t) = 0, và hàm tương quan cho trước
( ) ( )
[ ]
battttR

x
,,,,
2121


( ){ }
t
n
ϕ
là hệ hàm trực chuẩn đầy đủ.
Khi đó ta biểu diễn hàm ngẫu nhiên X(t) dưới dạng chuỗi Fourier


=
=
1
)()(
k
kk
tAtX
ϕ
Các hệ số Fourier A
k
là những đại lượng ngẫu nhiên

=
b
a
kk
dtttXA )()(

ϕ
Nếu xấp xỉ X(t) bởi n thành phần đầu :

=
=
n
k
kkn
tAtX
1
)()(
ϕ
Sai số bình phương trung bình của phép xấp xỉ là một đại lượng ngẫu nhiên:
[ ]

−=
b
a
nn
tdtXtx
2
)()(
δ
Độ chính xác của phép xấp xỉ được xác định bởi
[ ]
22

nn
M
δσ

=
Nó phụ thuộc vào việc chọn hệ hàm
( ){ }
t
n
ϕ
và số hạng tử n trong biểu thức xấp xỉ
Vấn đề đặt ra là liệu có thể xác định được hệ hàm
( ){ }
t
n
ϕ
khi cho trước số hạng tử
n và độ chính xác của phép xấp xỉ là
2
n
σ
hay không?
Bài toán biểu diễn hàm ngẫu nhiên X(t) dưới dạng tổng của n số hạng
)()(
1
tAtX
k
n
k
k
ϕ

=


Trong đó hệ hàm
( ){ }
nkt
k
1, =
ϕ
được gọi xác định sao cho
[ ]
22

nn
M
δσ
=
Đạt cực tiểu được gọi là khai triển hàm thành tổng các thành phần trực giao tự
nhiên. Hệ hàm
( ){ }
nkt
k
1, =
ϕ
được gọi là hệ hàm trực giao tự nhiên
Với


=
−=
b
a
n

k
kn
adttf
1
222
)(
δ
ta có


=
−=
n
k
k
b
a
n
AtX
1
222
)(
δ
Hay

∫∫
=







−=
n
k
b
a
k
b
a
n
dtttXdttX
1
2
22
)()()(
ϕδ

∫∫∫
=
−=
n
k
b
a
b
a
kk
b

a
dtdttttXtXdttX
1
212121
2
)()()()()(
ϕϕ
[ ]
==⇒
22

nn
M
δσ

∫∫∫
=

n
k
b
a
b
a
kkx
b
a
x
dtdtttttRdttR
1

212121
)()(),()(
ϕϕ
Bài toán quy về tìm hệ hàm
( ){ }
nkt
k
1, =
ϕ
để tổng sau đạt cực đại

∫∫
=
n
k
b
a
b
a
kkx
dtdtttttR
1
212121
)()(),(
ϕϕ
- Tìm các thành phần trực giao tự nhiên
Từ lý thuyết phương trình tích phân ta có:

=
b

a
x
tdttttR )()(),(
12221
λϕϕ
Với λ là giá trị riêng và
( )
1
t
ϕ
là hàm riêng
∫∫
=
b
a
b
a
kkxk
dtdtttttR
212121
)()(),(
ϕϕλ
Tương ứng với mỗi giá trị riêng
k
λ
của hàm tương quan ta có một hàm riêng
( )
t
k
ϕ

như vậy cần xác định được n hàm riêng ứng với n giá trị riêng có giá trị tuyệt đối
lớn nhất đầu tiên
n
λλλ
, ,,
21
Khi đó phương sai sai số của phép xấp xỉ được xác định bởi:


=
−=
b
a
n
k
kxn
dtttR
1
2
),(
λσ
Ta có
∫∫
==
b
a
b
a
kkxk
dtdtttttR

212121
)()(),(
ϕϕλ
[ ]
k
b
a
k
ADdtttXM =













2
)()(
ϕ
Các giá trị riêng của hàm tương quan là phương sai của các hệ số A
k
tương ứng của
khai triển hàm ngẫu nhiên theo hệ các hàm riêng
( ){ }

t
k
ϕ
. Như vậy cần xác định
được n hàm riêng ứng với n giá trị riêng có trị tuyệt đối lớn nhất đầu tiên
n
λλλ
, ,,
21
Khi đó phương sai sai số của phép xấp xỉ được xác định bởi:


=
−=
b
a
n
k
kxn
dtttR
1
2
),(
λσ
Ta có
∫∫
==
b
a
b

a
kkxk
dtdtttttR
212121
)()(),(
ϕϕλ
[ ]
k
b
a
k
ADdtttXM =













2
)()(
ϕ
Các giá trị riêng của hàm tương quan là phương sai của các hệ số A
k

tương ứng của
khai triển hàm ngẫu nhiên theo các hàm riêng
( ){ }
t
n
ϕ
. Các giá trị riêng của hàm
tương quan là những số dương.
Độ chính xác của phép xấp xỉ:














=


b
a
b
a

n
n
dttXM
dttXtXM
)(
)]()([
2
2
2
η
do đó



=

=
b
a
x
b
a
n
k
kx
n
dtttR
dtttR
),(
),(

1
2
λ
η
Giả sử hàm ngẫu nhiên X(t) có kỳ vọng toán học bằng 0, được cho tại một số hữu
hạn điểm t
1
, t
2
,…, t
m
.
( ){ }
t
k
ϕ
là một hệ hàm nào đó cũng được cho tại t
1
, t
2
, …, t
m
.
Ký hiệu X
1
=X(t
1
), …, X
m
=X(t

m
) là các lát cắt của X(t)
Khi đó có thể biểu diễn X(t) như là một vectơ :
X=(X
1
, X
2
, , X
m
)
Ký hiệu
( )
mit
ik
k
i
1, ==
ϕϕ
và dưới dạng vectơ :
ϕ
k
= (ϕ
1
k
, ϕ
2
k
,…, ϕ
m
k

)
Là các vectơ trực chuẩn, tức là :

=




=
=
m
i
l
i
k
i
lk
lk
1
. khi 0
, khi 1
ϕϕ
Nếu xem thông tin của X(t) chứa đầy đủ tại m lát cắt t
1
, t
2
, …, t
m
, khi đó ta có thể
biểu diễn:


=
=
m
k
k
k
AX
1
ϕ


.
Khi xấp xỉ hệ thức này bởi n << m hạng tử đầu tiên:

=

n
k
k
k
AX
1
ϕ


Với

=
=

m
j
k
jjk
XA
1
ϕ

=
=≈
n
k
k
iki
miAX
1
, ,2 ,1 ,
ϕ
Phép xấp xỉ mắc sai số nào đó
Phương sai của phép xấp xỉ được xác định bởi:
=













−=
∑ ∑
= =
m
i
n
k
k
ikin
AXM
1
2
1
2
ϕσ
=













+−
∑ ∑ ∑∑
= = = =
m
i
n
k
n
k
n
l
l
i
k
ilk
k
ikii
AAAXXM
1 1 1 1
2
2
ϕϕϕ








+−=
∑ ∑∑∑ ∑∑ ∑
= = = = = = =
m
i
n
k
m
i
m
j
n
k
n
l
m
i
l
i
k
ilk
l
j
k
ijii
AAXXXM
1 1 1 1 1 1 1
2
2
ϕϕϕϕ

Mà ta có:
k
j
n
k
m
i
m
j
k
iji
n
k
kk
n
k
n
l
m
i
l
i
k
ilk
XXAAAA
ϕϕϕϕ
∑∑∑∑∑∑ ∑
= = === = =
==
1 1 111 1 1

Do đó ta có:
k
j
n
k
m
i
m
j
k
iij
m
i
iin
RR
ϕϕσ
∑∑∑∑
= = ==
−=
1 1 11
2
Trong đó R
ij
= M[X
i
,X
j
], (Chú ý: Kỳ vọng của X(t) bằng không)
Cần xác định ϕ
k

=(ϕ
1
k
, ϕ
2
k
,…, ϕ
m
k
) để
∑∑
= =
=
m
i
k
j
k
i
m
j
ijk
Rb
1 1
ϕϕ
đạt cực đại
ϕ
k
=(ϕ
1

k
, ϕ
2
k
,…, ϕ
m
k
) được xác định từ hệ phương trình:

=
==
m
j
ijij
miR
1
, ,2 ,1 ,
λϕϕ
Phương sai sai số:
∑∑
==
−=
n
k
k
n
i
iin
R
11

2
λσ
Ta có

=
==
m
j
k
ik
k
jij
miR
1
, ,2 ,1 ,
ϕλϕ

=
==
m
j
l
il
l
jij
miR
1
, ,2 ,1 ,
ϕλϕ
Suy ra :

∑∑ ∑
= = =
=
m
i
m
j
m
i
l
i
k
ik
l
i
k
jij
R
1 1 1
ϕϕλϕϕ
∑∑ ∑
= = =
=
m
i
m
j
m
i
l

i
k
il
k
i
l
jij
R
1 1 1
ϕϕλϕϕ
Với

=
=−
m
i
l
i
k
ilk
1
0)(
ϕϕλλ

0≠−
lk
λλ
do đó

=

=
m
i
l
i
k
i
1
0
ϕϕ
do đó
lk

ϕϕ

trực giao
[ ]
=













=

=
2
1
m
j
k
jjk
XMAD
ϕ
∑∑∑∑
= == =
=






m
i
m
j
k
j
k
iij
m
i

m
j
k
j
k
iji
RXXM
1 11 1
ϕϕϕϕ
k
k
i
m
i
k
i
m
i
k
m
j
k
jij
k
i
R
λϕϕλϕϕ
===
∑∑ ∑
== = 11 1

Sai số xấp xỉ



















=

∑ ∑
=
= =
m
i
i
m
i

k
i
n
k
ki
n
XM
AXM
1
2
2
1 1
2
ϕ
η

∑∑
==
=
m
k
k
m
i
ii
R
11
λ
ta có



=
=
−=
m
k
k
n
k
k
n
1
1
2


1
λ
λ
η
Cách tính:
0)(

,0 )(
,0 )(
2211
2222121
1212111
=−+++
=++−+

=+++−
mmmmm
mm
mm
RRR
RRR
RRR
ϕλϕϕ
ϕϕλϕ
ϕϕϕλ
0
. . .
. . . . . .
. . .
. . .
21
22221
11211
=
RRR
RRR
RRR
mmmm
m
m
λ
λ
λ




0
1
2
2
1
1
=−−−−−

−−
mm
mmm
pppp
λλλλ
Nhận được các giá trị riêng, thay vào hệ giải ra sẽ được các vectơ riêng
b) Phân tích nhân tố
II. CÁC CHỈ TIÊU ĐÁNH GIÁ DỰ BÁO
1. Sai số trung bình hay BIAS
||
1
1
i
N
i
i
N
OFMAE −=

=
Trong đó F

i
là giá trị dự báo và O
i
là giá trị quan trắc
2. Sai số tuyệt đối trung bình
3. Sai số bình phương trung bình
4. Độ lệch chuẩn
5. Hệ số tương quan
6. Điểm kỹ năng
7. Điểm BRIER đối với dự báo xác suất
8. Đối với các yếu tố phân hạng
1 2 3 4 5 6 7
n
1
η
n
2
III. DỰ BÁO NHIỆT ĐỘ THÁNG MỘT CỦA HÀ NỘI SỬ DỤNG PHƯƠNG PHÁP
HÀM TRỰC GIAO TỰ NHIÊN VÀ HỒI QUY TUYẾN TÍNH
1. Trường độ nhiệt độ của khu vực phía bắc thông qua các thành phần trực giao tự
nhiên
Số liệu nhiệt độ mặt nước biển (SST) được sử dụng ở đây được khai thác từ
Internet theo địa chỉ: Bộ số liệu SST
được xây dựng trên cơ sở các số liệu khí quyển, đại dương toàn cầu COADS
(Comprehensive Ocean Atmosphere Data). Thời kỳ có số liệu bắt đầu từ tháng I
năm 1854 đến nay và số liệu thường xuyên được cập nhật. Độ phân giải của bộ số
liệu SST là 2
o
kĩnh vĩ và chỉ có số liệu trên các đại dương. Như vậy toàn bộ số nút
lưới của bộ số liệu là 11074 nút.

Lượng thông tin đóng góp của 12 véc tơ riêng đầu tiên khi phân tích trường
SST toàn cầu được trình bày trong bảng 1.
Mười hai véc tơ riêng đầu tiên của trường SST toàn cầu chiếm khoảng 60
đến xấp xỉ 70% lượng thông tin của trường này trong tất cả các tháng các tháng.
Như vậy chỉ với 12 véc tơ riêng đầu tiên đã có thể phản ánh được khoảng hai phần
ba sự biến động của SST trên phạm vi toàn cầu. ý nghĩa các véc tơ riêng của trường
SST toàn cầu được thể hiện thông qua các bản đồ phân bố hệ số tải trọng theo
không gian. Có thể thấy mỗi véc tơ riêng thể hiện được những diễn biến nổi trội
của SST trên các khu vực khác nhau. Véc tơ riêng đầu tiên chiếm tải trọng đóng
góp khoảng 12-15% tổng phương sai, tập trung chủ yếu trên khu vực xích đạo Thái
Bình Dương (Hình 2a, 3a). Như vậy có thể nói trong các dao động sóng dài diễn ra
đối với SST trên các đại dương, hiện tượng ENSO đóng vai trò quan trọng nhất.
Véc tơ riêng thứ hai tập trung trên khu vực Bắc Thái Bình Dương liên quan đến
hoạt động của hệ thống áp cao trên khu vực này (Hình 2b, 3b). Đặc biệt, véc tơ
riêng thứ 10 có biểu hiện tập trung trên khu vực Biển Đông và vùng phụ cận liên
quan đến hoạt động của gió mùa và các nhiễu động mạnh mẽ của khu vực này
(Hình 2c, 3c).

×