73 74
DO j=1, 13
t(j)= t(j)+(d(j)-t(j))/(n2-n1)*(n-n1)
ENDDO
ENDIF
IF (beta.LT.b(1)) THEN
j=1
ELSE IF (beta.GT.b(13)) THEN
j=12
ELSE
j=1
3 IF (beta.GE.b(j).AND.beta.LE.b(j+1)) GOTO 4
j=j+1
GOTO 3
ENDIF
4 TraB24 = t(j)+(t(j+1)-t(j))*(beta-b(j))
* /(b(j+1)-b(j))
RETURN
END
Chương 3
KHÁI NIỆM VỀ HỆ CÁC ĐẠI LƯỢNG NGẪU NHIÊN
VÀ ỨNG DỤNG
3.1. Hệ các đại lượng ngẫu nhiên
Trong nhiều bài toán thực tế, các kết quả thí nghiệm được mô tả
bằng hai hoặc nhiều hơn đại lượng ngẫu nhiên. Người ta thường biểu
diễn hệ hai đại lượng ngẫu nhiên
X
, Y bằng một điểm ngẫu nhiên trên
mặt phẳng với tọa độ
x
và y (hình 3.1).
0
Y
y
x
X
Hình 3.1. Điểm ngẫu nhiên
0
(x,y)
y
x
0
Hình 3.2. Góc phần tư ứng với xác
suất
),( yxF
Xác suất cùng thực hiện hai bất đẳng thức
x
X
<
và
y
Y
< được
gọi là
hàm phân bố hệ hai đại lượng ngẫu nhiên ) ,( YX :
75 76
()
)( ),( ) ,( yYxXPyxF
<
<= . (3.1)
Về ý nghĩa hình học thì hàm phân bố
) ,( yxF
chính là xác suất
điểm ngẫu nhiên
) ,( YX rơi vào góc phần tư vô cùng có đỉnh ở điểm
) ,( yx , nằm ở bên trái và phía dưới điểm đó (hình 3.2).
Δ
y
RΔ
y
y
x
x
Δ
x
0
Hình 3.3. Biểu diễn miền
Δ
R trong mặt phẳng
Xét xác suất điểm ngẫu nhiên rơi vào hình chữ nhật nhỏ
Δ
R
có kích
thước
x
Δ
và
y
Δ
ở lân cận điểm ) ,( yx trong mặt phẳng biểu diễn điểm
ngẫu nhiên (hình 3.3). Xác suất rơi vào hình chữ nhật
Δ
R sẽ tính bằng
()
) ,( ) ,(
) ,( ) ,( ),(
yxFyyxF
yxxFyyxxFRYXP
+Δ+−
−Δ+−Δ+Δ+=⊂
Δ
Chia xác suất này cho diện tích hình chữ nhật, ta sẽ được xác suất
trung bình mà điểm ngẫu nhiên rơi vào một đơn vị diện tích tại điểm
) ,( yx . Khi 0→
Δ
x
, 0→
Δ
y
, ta có
(
)
=
ΔΔ
+Δ+−Δ+−Δ+Δ+
=
ΔΔ
⊂
→Δ
→Δ
Δ
→Δ
→Δ
yx
yxFyyxFyxxFyyxxF
yx
RyX
y
x
y
x
),(),(),(),(
lim
),(
lim
0
0
0
0
) ,() ,(
) ,(
''
yxfyxF
yx
yxF
yx
==
∂∂
∂
=
2
. (3.2)
Hàm
) ,( yxf
gọi là mật độ phân bố của hệ. Mật độ phân bố
) ,( yxf thường được biểu thị bởi một mặt gọi là mặt phân bố.
Khi biết mật độ phân bố, có thể tìm hàm phân bố theo công thức
∫∫
∞−∞−
=
x
y
ydxdyxfyxF ) ,( ),( . (3.3)
Các đại lượng ngẫu nhiên
X
và
Y
gọi là độc lập nếu như quy luật
phân bố của từng đại lượng trong chúng không phụ thuộc vào việc đại
lượng kia nhận giá trị nào. Trong trường hợp ngược lại
X
và
Y
được
gọi là phụ thuộc.
Mật độ phân bố của hệ các đại lượng ngẫu nhiên độc lập bằng tích
của các mật độ phân bố của từng đại lượng trong hệ
)()(),( yfxfyxf
21
=
. (3.4)
Khái niệm “phụ thuộc” ở đây phải được hiểu là phụ thuộc “xác
suất”, hay phụ thuộc “ngẫu nhiên”. Nếu đại lượng
Y
liên hệ với đại
lượng
X
bằng mối phụ thuộc xác suất, thì nếu biết giá trị của
X
cũng
không thể chỉ ra chính xác giá trị của
Y
, mà chỉ có thể chỉ ra quy luật
phân bố của nó tùy thuộc vào đại lượng
X
nhận giá trị nào.
Phụ thuộc xác suất có thể chặt chẽ nhiều hoặc ít. Tùy mức độ tăng
độ chặt chẽ của phụ thuộc xác suất mà mối phụ thuộc này càng dần tới
phụ thuộc hàm. Phụ thuộc xác suất biểu hiện ở chỗ với sự biến đổi của
77 78
đại lượng
X
, đại lượng Y có xu thế cũng biến đổi (thí dụ, tăng hoặc
giảm khi tăng
X
). Xu thế này chỉ được bảo tồn “về trung bình”, ở những
nét tổng quát và trong từng trường hợp riêng lẻ có thể có ngoại lệ.
3.2. Các đặc trưng số của hệ hai đại lượng ngẫu nhiên. Mô
men tương quan. Hệ số tương quan
Mô men gốc bậc
sk , của hệ ) ,( YX :
[
]
ýk
sk
YX M
,
=
α
. (3.5)
Mô men tâm bậc
sk , :
[
]
sk
sk
YX
&&
M
,
=
μ
, (3.6)
ở đây
x
mXX −=
&
,
y
mYY −−
&
.
Những mô men gốc bậc một chính là những kỳ vọng toán học của
Y
X
, :
[
]
[
]
XYXm
x
M M
,
===
01
01
α
,
[
]
[
]
YYXm
y
M M
,
===
10
10
α
.
Có hai mô men tâm bậc hai có ý nghĩa quan trọng là phương sai của
các đại lượng
Y
X
, :
[
]
[
]
][ D M M
,
XXYXD
x
====
202
02
&&&
μ
,
[
]
[
]
][ D M M
,
YYYXD
y
====
220
20
&&&
μ
.
Mô men tâm hỗn hợp bậc hai
][ M
,
YX
&&
=
11
μ
có vai trò đặc biệt được ký hiệu là
yx
K
và gọi là mô men tương quan
(mô men liên hệ) của các đại lượng
YX , :
)]( )[( M][ M
yxyx
mYmXYXK −−==
&&
. (3.7)
Công thức tính
yx
K
:
− Đối với các đại lượng ngẫu nhiên rời rạc:
ji
ij
yjxiyx
pmymxK
)( )(
∑
∑
−
−
=
, (3.8)
− Đối với các đại lượng ngẫu nhiên liên tục:
∫∫
∞
∞−
∞
∞−
−−= ydxdyxfmymxK
yxyx
),()( )(
. (3.9)
Mô men tương quan là đặc trưng của hệ, ngoài mô tả sự tản mạn của
các đại lượng
Y
X
,
, nó còn đặc trưng cho sự liên hệ giữa các đại lượng.
Người ta chứng minh được rằng đối với những đại lượng ngẫu nhiên độc
lập mô men tương quan bằng không. Xét theo cấu trúc của công thức
(3.7), thấy rằng nếu mức độ tản mạn của một trong hai đại lượng
X
hay
Y
mà nhỏ, thì
yx
K
sẽ có giá trị nhỏ. Để đặc trưng đơn thuần về sự liên
hệ giữa các đại lượng
Y
X
,
người ta dùng hệ số tương quan:
yx
yx
yx
K
r
σσ
= . (3.10)
Những đại lượng ngẫu nhiên mà
yx
K
hay
yx
r
bằng 0 được gọi là
những đại lượng không tương quan.
Hệ số tương quan đặc trưng không phải cho sự phụ thuộc bất kỳ mà
chỉ cho sự phụ thuộc tuyến tính.
Công thức ước lượng các đặc trưng số của hệ hai đại lượng ngẫu
nhiên có dạng sau:
n
x
m
n
i
i
x
∑
=
=
1
~
;
n
y
m
n
i
i
y
∑
=
=
1
~
;
79 80
1
1
2
−
−
=
∑
=
n
mx
D
n
i
xi
x
)
~
(
~
;
1
1
2
−
−
=
∑
=
n
my
D
n
i
yi
y
)
~
(
~
;
1
1
−
−−
=
∑
=
n
mymx
K
n
i
yixi
yx
)
~
( )
~
(
~
. (3.11)
Đối với trường hợp xử lý những quan trắc về một hệ m đại lượng
ngẫu nhiên
) , , ,(
m
XXX
21
người ta cũng thực hiện những tính toán tương tự. Giả sử có
n quan trắc,
kết quả quan trắc viết dưới dạng bảng số: mỗi dòng chứa
m
giá trị của
các đại lượng ngẫu nhiên
m
XXX , , ,
21
trong một lần quan trắc, bảng
này sẽ gồm
n dòng:
i
1
x
2
x
k
x
m
x
1
11
x
21
x
1k
x
1m
x
2
12
x
22
x
2k
x
2m
x
i
i
x
1
i
x
2
ki
x
mi
x
n
n
x
1
n
x
2
kn
x
mn
x
Ước lượng của các kỳ vọng toán học được tìm như là các trung bình
số học:
) , , ,(
~
mk
n
x
m
n
i
ik
x
k
21
1
==
∑
=
.
Ước lượng không chệch của các phương sai:
1
1
2
−
−
=
∑
=
n
mx
D
n
i
xik
k
k
)
~
(
~
.
Ước lượng của các mô men tương quan:
1
1
−
−−
=
∑
=
n
mxmx
K
n
i
xilxik
lk
lk
)
~
)(
~
(
~
.
Từ những giá trị của các mô men tương quan, xác định những giá trị
của các mô men tương quan chuẩn hóa:
lk
lk
lk
K
r
σσ
~~
~
~
= ,
trong đó
llkk
DD
~
~
,
~
~
==
σσ
.
Các mô men tương quan hay các mô men tương quan chuẩn hóa của
hệ các đại lượng ngẫu nhiên thường được viết thành dạng ma trận tương
quan:
~
mm
m
m
ji
K
KK
KKK
K
222
11211
=
;
hay ma trận tương quan chuẩn hóa:
~
mm
m
m
ji
r
rr
rrr
r
222
11211
=
.
81 82
Do tính chất đối xứng, các ma trận chỉ cần điền một nửa. Ở đường
chéo chính của ma trận tương quan là các phương sai của các đại lượng
m
XXX , , ,
21
, tức
mmm
DKDKDK
~~
.; . . ;
~~
;
~~
===
222111
.
Ma trận tương quan thường được dùng để nghiên cứu sự phụ thuộc
tuyến tính giữa các đại lượng ngẫu nhiên trong hệ các đại lượng được
quan trắc.
Thí dụ 3.1: Tính ma trận tương quan đối với bảng giá trị ngày của
nhiệt độ nước biển
Tw , nhiệt độ không khí Ta , độ ẩm tuyệt đối
H
, độ
ẩm tương đối
H
r
và khí áp Pa quan trắc trong năm 1980 ở Hòn Dấu.
Ta ghi bảng số liệu quan trắc dưới dạng:
TT
Tw
Ta
H
H
r
Pa
1 22,2 22,2 23,9 89 1013,2
2 22,4 22,1 24,2 91 1013,6
3 22,4 21,5 23,5 92 1014,2
4 21,8 20,6 21,3 88 1018,1
5 21,0 16,4 14,3 77 1020,9
6 20,5 17,7 15,6 77 1020,5
7 19,0 15,3 11,4 66 1023,7
8 18,8 16,4 12,8 68 1020,4
9 19,1 17,0 15,2 78 1019,5
10 19,4 18,4 17,2 82 1015,3
. . . . . . . . . . . . . . . . . . . . . . .
366 . . . . . . . . . . . . . . . . . . . .
Kết quả tính các phần tử nửa trên bên phải của ma trận các mô men
tương quan chuẩn hóa được ghi thành bảng như sau:
Tw Ta
H
Hr
Pa
Tw
1,00 0,96 0,88 0,04 -0,75
Ta
1,00 0,93 0,12 -0,80
H
1,00 0,42 -0,87
Hr
1,00 -0,41
Pa
1,00
Trong khí tượng thủy văn, bảng này thường được gọi là ma trận
tương quan, nó thể hiện sự liên hệ thống kê với nhau của các yếu tố quan
trắc. Mỗi phần tử của ma trận này gọi là hệ số tương quan giữa hai yếu tố
quan trắc cùng hàng và cùng cột. Các hệ số tương quan có giá trị tuyệt
đối lớn thể hiện sự liên hệ chặt chẽ về mặ
t thống kê, hệ số nhỏ thể hiện sự
liên hệ yếu.
Từ ma trận tương quan của trạm Hòn Dấu, thấy rằng nhiệt độ nước
biển liên hệ chặt chẽ nhất với nhiệt độ không khí, sau đó với độ ẩm tuyệt
đối và cuối cùng với khí áp, trong đó liên hệ giữa nhiệt độ nước và khí áp
là liên hệ nghịch, thể hiện bởi hệ s
ố tương quan mang dấu âm (-0,75).
Giữa nhiệt độ nước biển với độ ẩm tương đối hầu như không có liên hệ,
biểu hiện ở hệ số tương quan rất nhỏ (0,04). Nhiệt độ không khí và áp
suất khí quyển liên hệ với nhau bằng mối phụ thuộc nghịch khá chặt chẽ.
Nhiệt độ không khí thường cao khi áp thấp quan trắc thấy trên vùng biển.
3.3. Phép là trơn các mối phụ thuộc th
ực nghiệm bằng
phương pháp bình phương nhỏ nhất
Giả sử ta có bảng các số liệu thực nghiệm, trong đó ghi các giá trị
của đại lượng biến số
i
x và các giá trị tương ứng của đại lượng phụ
thuộc vào nó
i
y . Từ những suy luận nào đó về bản chất của hiện tượng
hoặc theo hình dạng bề ngoài, chúng ta có thể chọn dạng phụ thuộc tổng
83 84
quát
)( xy
ϕ
= cho mối phụ thuộc giữa
y
và
x
. Hàm )( xy
ϕ
=
phụ
thuộc vào một số tham số
, , , cba Chính những tham số này cần được
xác định để sao cho tổng các bình phương độ lệch của
i
y
khỏi
)(
i
x
ϕ
cực tiểu.
Có thể viết hàm
)( xy
ϕ
= rõ hơn dưới dạng
) , , , ;( cbaxy
ϕ
= . (3.12)
Cần chọn , , , cba sao cho thỏa mãn điều kiện sau
min )] , , , ;( [
=−
∑
=
2
1
cbaxy
n
i
ii
ϕ
. (3.13)
Từ (3.13) suy ra hệ phương trình:
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
)] , , , ;( [
)] ,
, , ;( [
)] , , , ;( [
0
0
0
1
1
1
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
−
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
−
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
−
∑
∑
∑
=
=
=
i
n
i
ii
i
n
i
ii
i
n
i
ii
c
cbaxy
b
cbaxy
a
cbaxy
ϕ
ϕ
ϕ
ϕ
ϕ
ϕ
(3.14)
Hệ (3.14) có số phương trình đúng bằng số tham số cần xác định.
Không thể giải hệ (3.14) ở dạng tổng quát, mà phải cho trước dạng cụ thể
của hàm
ϕ
.
1. Trường hợp bxabaxy
+
== ) , ;(
ϕ
(tức dạng phụ thuộc
tuyến tính)
ta có:
x
a
=
∂
∂
ϕ
;
i
i
x
a
=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
ϕ
;
1=
∂
∂
b
ϕ
; 1=
⎟
⎠
⎞
⎜
⎝
⎛
∂
∂
i
b
ϕ
.
Thế các biểu thức trên đây vào (3.14) ta được hệ hai phương trình để
xác định a và
b:
⎪
⎪
⎩
⎪
⎪
⎨
⎧
=+−
=+−
∑
∑
=
=
n
i
ii
n
i
iii
bxay
xbxay
1
1
0
0
)]([
)]([
hay
⎪
⎪
⎩
⎪
⎪
⎨
⎧
=−−
=−−
∑∑
∑∑∑
==
===
0
0
11
11
2
1
nbxay
xbxayx
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
⇒
⇒
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎨
⎧
=−−
=−−
∑∑
∑∑∑
==
===
0
0
11
11
2
1
b
n
x
a
n
y
n
x
b
n
x
a
n
yx
n
i
i
n
i
i
n
i
i
n
i
i
n
i
ii
Các tổng trong những phương trình trên chính là những
mô men
thống kê
khác nhau, do đó ta viết hệ thành:
⎪
⎩
⎪
⎨
⎧
=−−
=−−
0
0 ],[
**
**
2
*
1,1
bmam
bmaYX
xy
x
αα
Tìm
b
từ phương trình thứ hai và thế vào phương trình thứ nhất:
**
xy
mamb −=
,
85 86
0 ) (][ ] ,[
****
2
*
1,1
=−−−
xxy
mmamXaYX
αα
,
*
2**
2
***
1,1
)(][
],[
x
yx
x
yx
D
K
mX
mmYX
a =
−
−
=
α
α
.
Vậy
*
x
yx
D
K
a =
;
**
xy
mamb −= . (3.15)
hay
*
*
*
x
y
ra
σ
σ
= ,
**
xy
mamb −= (3.16)
Phương trình tuyến tính
bxaxy
+
== )(
ϕ
có dạng
*
*
*
*
*
*
x
x
yx
y
x
yx
m
D
K
mx
D
K
y −+=
hay
)(
*
*
*
*
x
x
yx
y
mx
D
K
my −=− .
2. Trường hợp cxbxay ++=
2
(dạng phụ thuộc parabôn):
Hệ phương trình để xác định các hệ số cba , , như sau:
⎪
⎪
⎭
⎪
⎪
⎬
⎫
=++
=++
=++
].,[][][][
];,[][][][
];,[][][][
*
,
***
*
,
***
*
,
***
YXcXbXaX
YXcXbXaX
YXcXbXaX
10012
11123
12234
αααα
αααα
αααα
(3.17)
Lưu ý quy luật tạo thành những hệ số trong các phương trình (3.17)
như sau: ở vế trái chỉ có các mô men thống kê của đại lượng
X
theo thứ
tự bậc giảm dần; ở vế phải có các mô men của hệ
) ,( YX , trong đó bậc
của mô men theo
X
giảm từ phương trình này tới phương trình khác,
còn bậc theo
Y
luôn giữ nguyên là bậc một.
Các hệ số của parabôn bậc bất kỳ cũng được xác định bằng những
phương trình có cấu trúc tương tự.
3. Trường hợp
) , , , ;(
k
aaaxy
21
ϕ
=
là tổng của các hàm cho
trước bất kỳ
)( , ),( ),( xxx
k
ϕ
ϕ
ϕ
21
với các hệ số
k
aaa , , ,
21
:
∑
=
=+++=
k
i
iikk
xaxaxaxay
1
2211
)()( )()(
ϕϕϕϕ
. (3.18)
Thí dụ:
xaxaxaxaaaaax 2sin2cossincos) , , , ;(
43214321
ω
ω
ω
ω
ϕ
+
+
+
=
hay
xxx
eaeaeaaaax
) , , ;(
γβα
ϕ
321321
++= .
Hệ phương trình để tính các hệ số
k
aaa , , ,
21
trong trường hợp
tổng quát (3.18) có dạng
87 88
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎩
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎨
⎧
=
=+++
=
=+++
=
=+++
∑
∑∑∑
∑
∑∑∑
∑
∑∑∑
=
===
=
===
=
===
n
i
iki
n
i
ikk
n
i
iki
n
i
iki
n
i
ii
n
i
iikk
n
i
i
n
i
ii
n
i
ii
n
i
iikk
n
i
ii
n
i
i
xy
xaxxaxxa
xy
xxaxaxxa
xy
xxaxxaxa
1
1
2
1
22
1
11
1
2
1
2
1
2
22
1
211
1
1
1
1
1
122
1
2
11
).(
)]([ )( )()( )(
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
);(
)( )( )]
([)( )(
;)(
)( )( )( )()]([
ϕ
ϕϕϕϕϕ
ϕ
ϕϕϕϕϕ
ϕ
ϕϕϕϕϕ
(3.19)
4. Bài toán là trơn sẽ phức tạp hơn nếu trong các biểu thức của
hàm
) , , , ;( cbaxy
ϕ
= các tham số bằng số , , , cba nằm dưới dạng
phi tuyến. Trong trường hợp này thường người ta có được cách giải bằng
một phương pháp khá đơn giản qua thí dụ sau đây.
Thí dụ:
2
ax
ey
−
= hay axy sin= .
Ta viết
),( axy
ϕ
=
, trong đó
−a
hệ số cần tìm theo phương pháp
bình phương nhỏ nhất.
Ta có thể đưa ra một loạt các giá trị của a và với từng a tìm tổng
các bình phương của hiệu
i
y và :),( ax
i
ϕ
∑∑
=
−=
n
i
ii
axya
1
2
)],([)(
ϕ
.
Tổng này là một hàm phụ thuộc vào
a . Nếu biểu diễn sự biến thiên của
∑
)(a lên đồ thị, ta sẽ tìm được giá trị thích hợp của a ứng với giá trị
∑
)(a cực tiểu (hình 3.4).
),( axy
ϕ
=
a
0
0
∑
)(a
∑
)(a
a
1
b
2
b
3
b
4
b
a
x
a
0
Hình 3.4. Khảo sát bằng đồ thị để tìm hệ số a tối ưu trong trường hợp phi tuyến
Trong hải dương học, phương pháp là trơn phụ thuộc thực nghiệm
bằng phương pháp bình phương nhỏ nhất thường được áp dụng khi người
ta cần tìm những biểu thức liên hệ giữa các tham số hải dương học dựa
trên số liệu quan trắc. Thí dụ tìm biểu thức liên hệ giữa hệ số nhớt của
nước với nhiệt độ, độ muối của n
ước biển; tìm công thức tính tốc độ
truyền âm trong biển theo nhiệt độ, độ muối và áp suất khi những liên hệ
này khó rút ra bằng lập luận lý thuyết. Bài toán là trơn cũng hay được sử
dụng để lập biểu thức khôi phục các giá trị quan trắc của một yếu tố nào
đó bị khuyết trong khi biết giá trị quan trắc của một yếu tố khác mà nó có
liên hệ một cách rõ ràng xuất phát từ suy luậ
n lý thuyết, lập mối liên hệ
giữa yếu tố khó quan trắc với yếu tố dễ quan trắc, lập mối phụ thuộc giữa
giá trị của cùng một yếu tố ở tầng sâu này với tầng sâu khác Đặc biệt,
người ta hay sử dụng phương pháp là trơn thực nghiệm để thiết lập các
89 90
phương trình dự báo yếu tố hải dương học nào đó theo các yếu tố khí
tượng và hải dương khác ảnh hưởng tới nó.
Thí dụ 3.2: Tìm phương trình liên hệ giữa nhiệt độ nước biển
w
T và
nhiệt độ không khí
a
T trên biển theo tập số liệu trung bình tháng của hai
yếu tố này tại trạm Hòn Dấu trong ba năm 1979-1981. Các số liệu được
sắp xếp trong bảng dưới đây:
Năm 1979 Năm 1980 Năm 1981
Tháng
w
T
a
T
w
T
a
T
w
T
a
T
1 19,9 18,2 19,7 18,0 19,6 18,2
2 20,2 19,2 17,0 15,2 19,7 18,2
3 20,6 19,6 21,3 20,7 21,6 20,9
4 23,4 22,6 23,6 22,7 25,7 25,4
5 27,9 26,4 27,9 26,9 27,9 26,2
6 29,6 28,1 30,1 28,3 30,2 28,6
7 31,0 29,8 29,8 28,7 29,8 28,8
8 29,3 28,1 29,9 28,7 30,7 29,5
9 28,9 27,4 28,8 27,3 29,8 28,3
10 27,5 25,8 28,1 25,7 26,9 24,7
11 23,7 21,9 25,7 23,9 23,6 21,5
12 21,1 20,4 21,9 19,3 19,4 17,4
Ta có tổng cộng 36 cặp giá trị nhiệt độ nước và nhiệt độ không khí
tương ứng,
36
=
n . Trên hình 3.5 biểu diễn các cặp giá trị nhiệt độ không
khí và nhiệt độ nước tương ứng thành các điểm chấm trên mặt phẳng
TaTw − . Các điểm tập trung trên một dải hẹp bên cạnh một đường thẳng
cho thấy có sự liên hệ tuyến tính, tỷ lệ thuận khá rõ rệt giữa hai yếu tố
nhiệt độ nước biển và nhiệt độ không khí.
Hình 3.5. Đồ thị thể hiện mối liên hệ tuyến tính giữa
nhiệt độ nước biển và nhiệt độ không khí trạm Hòn Dấu
Ta tuần tự tính các đại lượng trong công thức (3.16) để lập phương
trình biểu diễn định lượng của mối liên hệ này:
906,23
36
1
36
1
,
*
===
∑
=j
jaax
TTm ;
328,25
36
1
36
1
,
*
===
∑
=j
jwwy
TTm ;
285,4)(
35
1
36
1
2
,
*
=−==
∑
=j
ajaTax
TT
σσ
;
91 92
253,4)(
35
1
36
1
2
,
*
=−==
∑
=j
wjwTwy
TT
σσ
;
993,0))((
35
1
36
1
,,
*
,
=−−=
∑
=j
wjwajaxy
TTTTr ;
985,0
285,4
253,4
993,0
*
*
*
,
===
x
y
xy
ra
σ
σ
;
775,1906,23985,0328,25
**
=×−=−=
xy
ammb .
Vậy phương trình liên hệ giữa nhiệt độ nước biển và nhiệt độ không
khí sẽ là:
aw
TT 985,0775,1 += .
Thí dụ 3.3: Xác định xu thế nước biển dâng tại trạm Hòn Dấu. Số
liệu độ cao mực nước trung bình năm (cm) tại trạm Hòn Dấu được sắp
xếp theo thứ tự năm trong bảng dưới đây:
1957 185 1966 189 1975 188 1984 204 1993 189 2002 193
1958 184 1967 186 1976 188 1985 201 1994 192 2003 197
1959 185 1968 183 1977 184 1986 189 1995 192 2004 191
1960 186 1969 187 1978 190 1987 186 1996 193 2005 190
1961 186 1970 181 1979 191 1988 186 1997 193 2006 194
1962 183 1971 189 1980 192 1989 190 1998 192 2007 190
1963 180 1972 187 1981 192 1990 187 1999 193 2008 194
1964 188 1973 192 1982 188 1991 191 2000 194
1965 196 1974 189 1983 191 1992 189 2001 197
Giả sử mực nước biển phụ thuộc tuyến tính vào thời gian, tức tăng
hoặc giảm tuyến tính theo năm. Áp dụng trường hợp 1 đã xét trên đây, ta
thiết lập một mối phụ thuộc tuyến tính
baxy += ,
trong đó biến
y
là độ cao mực nước, biến
x
là thời gian (số hiệu năm
quan trắc). Các hệ số
a và b tính được theo công thức (3.15) hoặc
(3.16) bằng:
176,0
=
a ; 981,158
−
=
b .
Giá trị của hệ số
a
chính là tốc độ biến thiên của
−
y
mực nước khi thời
gian tăng lên một năm. Vậy tại trạm Hòn Dấu, trung bình mực nước dâng
lên 0,176 cm hay
≈
1,8 mm mỗi năm.
Để trực quan, ta có thể biểu diễn biến thiên của mực nước Hòn Dấu
theo năm nh
ư trên hình 3.6. Đường đậm nét là đường thằng hồi quy
981,158176,0
−
= xy .
Hình 3.6. Biến thiên của mực nước Hòn Dấu thời kỳ 1957-2008
5. Trường hợp bài toán hồi quy tuyến tính nhiều biến
Giả sử có n quan trắc đối với đại lượng phụ thuộc
y
và các đại
lượng độc lập
m
xxx , , ,
21
. Phương trình hồi quy được thiết lập như
sau
mm
xaxaxaay
+
+
+
+
=
22110
. (3.20)
Các hệ số
) , ,( mia
i
1
=
được chọn sao cho thoả mãn
93 94
∑
=
=−−−−−=
n
j
mjmjjj
xaxaxaay
1
2
22110
min) (
δ
.
Lần lượt lấy đạo hàm biểu thức trên theo
m
aaaa , , , ,
210
và cho
các đạo hàm bằng không, ta có hệ
1+m phương trình để xác định các hệ
số
a
[
][]
[
]
[
]
[] [ ] [ ] [ ] [ ]
[] [ ] [ ] [ ] [ ]
[] [ ] [ ] [ ] [ ]
mmmmmmm
mm
mm
mm
yxaxxaxxaxxax
yxaxxaxxaxxax
yxaxxaxxaxxax
yaxaxaxna
=++++
=++++
=++++
=++++
22110
2222212102
1121211101
22110
Hệ phương trình này gọi là hệ phương trình chính tắc để xác định
các hệ số hồi quy
a
. Dưới dạng ma trận ta viết hệ này như sau
[
][]
[
]
[] [ ] [ ] [ ]
[] [ ] [ ] [ ]
[] [ ][ ] [ ]
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
=
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
mmmmmmm
m
m
m
b
b
b
b
a
a
a
a
xxxxxxx
xxxxxxx
xxxxxxx
xxxn
.
2
1
0
2
1
0
21
222212
112111
21
(3.21)
hay dưới dạng vectơ
A x = b. (3.22)
Trong hệ phương trình (3.22), vectơ
A ký hiệu cho ma trận vuông hai
chiều các hệ số của hệ (3.21)
[
]
[
]
[
]
[] [ ] [ ] [ ]
[] [ ] [ ] [ ]
[] [ ][ ] [ ]
21
222212
112111
21
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
mmmmm
m
m
m
xxxxxxx
xxxxxxx
xxxxxxx
xxxn
vectơ b - ma trận một chiều các hệ số tự do
⎟
⎟
⎟
⎟
⎟
⎟
⎠
⎞
⎜
⎜
⎜
⎜
⎜
⎜
⎝
⎛
m
b
b
b
b
2
1
0
và vectơ
x - ma trận một chiều các ẩn cần xác định
0
a
,
1
a
, ,
m
a
. Dấu
[
]
ký hiệu phép lấy tổng
∑
n
1
.
Trong hải dương học, phương pháp hồi quy nhiều biến hay được
dùng để thiết lập những mối phụ thuộc giữa một tham số quan trắc với
các tham số khác khi nhận thấy các tham số này có liên hệ tương quan
với nhau xét theo ma trận tương quan tính được (xem mục 3.2).
Thí dụ 3 4: Lập phương trình hồi quy tuyến tính biểu diễn sự phụ
thuộc của nhiệt độ nước biển vào các yếu tố khí tượng. Số liệu cho trước
là bảng giá trị trung bình ngày của nhiệt độ nước biển
Tw
, nhiệt độ
không khí
Ta
, độ ẩm tuyệt đối
H
, độ ẩm tương đối H
r
, khí áp
Pa
,
lượng bốc hơi Ev , lượng mưa Ra , thành phần gió kinh hướng Vk , thành
phần gió vĩ hướng Vv và lượng mây Cd , quan trắc từ năm 1980 đến
1981 ở Côn Đảo.
95 96
Kết quả tính ma trận tương quan được ghi thành bảng sau:
Tw Ta
H
Hr
Pa Ev Ra
Vk
Vv
Cd
Tw
1,00 0,74 0,84 0,27 -0,46 -0,36 0,28 0,52 0,40 -0,16
Ta
1,00 0.76 -0.19 -0.43 0.06 0.20 0.49 0.34 -0.02
H
1,00 0.48 -0.57 -0.50 0.16 0.52 0.45 0.07
Hr
1,00 -0.26 -0.84 -0.02 0.13 0.19 0.11
Pa
1,00 0.32 -0.05 -0.34 -0.54 -0.21
Ev
1,00 -0.02 -0.25 -0.29 -0.06
Ra
1,00 0.11 0.00 -0.27
Vk
1,00 0.35 -0.10
Vv
1,00 0.18
Cd
1,00
Từ ma trận tương quan, nếu chú ý tới các hệ số tương quan có giá trị
tuyệt đối khá lớn, cỡ từ 0,4 trở lên, có thể tạm cho rằng, nhiệt độ nước có
sự liên hệ nhất định với nhiệt độ không khí, độ ẩm tuyệt đối, áp suất khí
quyển, các thành phần gió kinh hướng và vĩ hướng. Ta sẽ lập phương
trình hồi quy tuyến tính biểu diễn sự liên hệ giữ
a nhiệt độ nước với các
yếu tố này, bỏ qua các yếu tố độ ẩm tương đối, lượng bốc hơi, lượng mưa
và lượng mây, dưới dạng:
vkaaw
VaVaPaHaTaaT
543210
+
+
++
+
=
.
Hệ phương trình chính tắc dạng (3.21) tính được cụ thể như sau:
81757940185235197171788146346
54621852328124801649855517245
20879778
3519712480167440356482110938219863648737487
595389717849852110938260373956565720926
558935814655171986364856565753185219690
206983462457374872092619690731
543210
543210
543210
543210
543210
543210
−=++−−−−
=++−−−−
=
−−+++
=−−+++
=−−+++
=−−+++
aaaaaa
aaaaaa
aaaaaa
aaaaaa
aaaaaa
aaaaaa
Giải hệ phương trình này, ta được các hệ số hồi quy:
01,0
07,0
02,0
48,0
30,0
82,14
5
4
3
2
1
0
=
=
−=
=
=
−=
a
a
a
a
a
a
Phương trình hồi quy cuối cùng là:
vkaaw
VVPHTT 01,007,002,048,030,082,14
+
+
−
+
+
−
=
.
Hình 3.7. Nhiệt độ nước quan trắc và tính theo phương trình hồi quy
trạm Côn Đảo năm 1980
97 98
Tính kiểm tra lại chuỗi quan trắc theo phương trình này cho thấy
phương trình xấp xỉ tốt chuỗi số liệu quan trắc. Hệ số tương quan chung
giữa chuỗi quan trắc và chuỗi giá trị tính theo phương trình hồi quy bằng
0,86. Sai số bình phương trung bình giữa chuỗi quan trắc và chuỗi tính
theo phương trình là trơn bằng 1,13
o
. Hình 3.7 là đồ thị so sánh giữa hai
chuỗi giá trị nhiệt độ nước quan trắc và tính theo phương trình hồi quy.
Bài toán thiết lập phương trình hồi quy nhiều biến như thí dụ vừa
xét hay được áp dụng để bổ khuyết số liệu quan trắc. Thí dụ, nếu trên cơ
sở lập luận hay kinh nghiệm, ta biết nhiệt độ nước liên hệ với các yếu tố
khí tượng khác bằng phương trình như trên, có thể
dùng phương trình
này để khôi phục giá trị của nhiệt độ nước nếu vì lý do nào đó nó không
được quan trắc.
Bài toán lập phương trình hồi quy, kể cả đơn biến và nhiều biến,
cũng thường dùng để lập các phương trình dự báo. Trong trường hợp
này, có thể thiết lập phương trình liên hệ giữa yếu tố cần dự báo với các
yếu tố mà nó phụ thuộc (gọi là các yếu tố tiên lượ
ng) nhưng với thời gian
trễ khác nhau, tức các giá trị của yếu tố dự báo (trong thí dụ vừa xét là
nhiệt độ nước biển) được lấy sau các giá trị của các yếu tố khí tượng một,
hai hay một số ngày. Những vấn đề về chọn các yếu tố tiên lượng phải
được xem xét kỹ hơn trên cơ sở các suy luận vật lý và kinh nghiệm của
người xử lý số liệu.
Trong phụ lục chương 3 có dẫn mã Fortran của các thủ tục tính các
hệ số hệ phương trình chuẩn tắc và giải hệ này bằng phương pháp Gauss.
Phụ lục chương 3
A. Mã Fortran của thủ tục tính các ma trận A và b của phương trình
chuẩn tắc (3.21) trong phương pháp hồi quy tuyến tính nhiều biến
C
Y
là mảng một chiều để lưu n giá trị của biến phụ thuộc
C
X
là mảng n dòng m cột để lưu các giá trị m biến độc lập
C
A là mảng từ 0 đến
m
dòng và từ 0 đến
1
+
m
cột
C
để lưu các giá trị của ma trận
A
C
Cột
1
+
m của mảng
A
lưu giá trị của hệ số b
SUBROUTINE LHPTCT (Y, X, A, N, M)
INTEGER N, M, I, J, K
REAL Y (10000), X (10000, 50), A (0 : 50, 0 : 51)
A (0, 0) = N
DO J = 1, M
A (0, J) = 0.0
DO K = 1, N
A (0, J) = A (0, J) + X (K, J)
END DO
END DO
A (0, M + 1) = 0.0
DO K = 1, N
A (0, M + 1) = A (0, M + 1) + Y (K)
END DO
DO I = 1, M
A (I, M + 1) = 0.0
DO K = 1, N
A (I, M + 1) = A (I, M + 1) + Y (K) * X(K, I)
END DO
99 100
END DO
DO I = 1, M
DO J = I, M
A (I, J) = 0.0
DO K = 1, N
A (I, J) = A (I, J) + X (K, I) * X (K, J)
END DO
ENDDO
ENDDO
DO I = 1, M
DO J = 0, I - 1
A (I, J) = A (J, I)
END DO
END DO
RETURN
END
B. Mã Fortran của thủ tục Gauss giải hệ phương trình (3.21)
C
A
là mảng từ 0 đến m dòng và từ 0 đến 1
+
m cột
C
để lưu các giá trị của ma trận
A
C
Cột
1
+
m của mảng
A
lưu giá trị của hệ số b
C
X
là mảng một chiều để lưu nghiệm của hệ, tức các hệ số
i
a
C trong phương trình (3.19)
SUBROUTINE GAUSS (M, A, X)
INTEGER M
REAL A (0 : 50, 0 : 51), X (0 : 50)
DO I = 0, M - 1
K = I
AMAX = ABS (A (K, K))
DO J = I + 1, M
R = ABS (A (J, I))
IF (AMAX .LT. R) THEN
AMAX = R
K = J
END IF
END DO
IF (K .NE. I) THEN
DO J = I, M + 1
AMAX = A (I, J)
A (I, J) =A (K, J)
A (K, J) = AMAX
END DO
END IF
DO J = I + 1, M + 1
A (I, J) = A (I, J) / A (I, I)
END DO
DO J = I + 1, M
DO K = I + 1, M + 1
A (J, K) = A (J, K) - A (J, I) * A (I, K)
END DO
END DO
END DO
X (M) = A (M, M + 1) / A (M, M)
DO I = M - 1, 0, -1
X (I) = A (I, M + 1)
DO J = I + 1, M
101 102
X (I) = X (I) - A (I, J) * X (J)
END DO
END DO
RETURN
END
Chương 4
NHỮNG KHÁI NIỆM CƠ BẢN CỦA LÝ THUYẾT HÀM
NGẪU NHIÊN VÀ ỨNG DỤNG
Hàm ngẫu nhiên là hàm mà trong kết quả thí nghiệm có thể nhận
dạng cụ thể nào đó không biết trước được.
Dạng cụ thể mà hàm ngẫu nhiên nhận trong kết quả thí nghiệm gọi
là hiện của hàm ngẫu nhiên. Nếu thực hiện một nhóm thí nghiệm với hàm
ngẫu nhiên, thì ta nhận được một nhóm hay một họ hiện của hàm đó. Rõ
ràng mỗi hiện là một hàm bình thường (không ng
ẫu nhiên). Nếu ta cố
định một giá trị nào đó của biến
t của hàm ngẫu nhiên
)(tX
, thì hàm
)(tX lúc này trở thành đại lượng ngẫu nhiên, đại lượng ngẫu nhiên này
được quy ước gọi là mặt cắt của hàm ngẫu nhiên tương ứng với
t đã cho.
4.1. Các đặc trưng của hàm ngẫu nhiên
Kỳ vọng toán học của hàm ngẫu nhiên
)(tX là một hàm không
ngẫu nhiên
)(tm
x
mà tại từng giá trị của đối số t bằng kỳ vọng toán học
của mặt cắt tương ứng của hàm ngẫu nhiên:
)]([)( tXMtm
x
=
. (4.1)
Về ý nghĩa, kỳ vọng toán học của hàm ngẫu nhiên là một hàm trung bình
nào đó mà các hiện cụ thể biến thiên xung quanh nó (hình 4.1).