Tải bản đầy đủ (.pdf) (41 trang)

CÁC PHƯƠNG PHÁP THỐNG KÊ TRONG THUỶ VĂN - CHƯƠNG 6 pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (434.08 KB, 41 trang )

Chơng 6
quan hệ thống kê giữa các biến thuỷ văn
6.1. Tổng quan
Hiện tợng thuỷ văn thờng thờng đợc hình thành bởi rất nhiều yếu tố,
trong thực tế không thể xét đầy đủ đợc các yếu tố đó, trong nhiều trờng hợp cũng
không cần thiết phải xét nh vậy. Vì thế khi xây dựng các mối quan hệ nhân quả
chỉ cần phân tích những nhân tố về mặt định tính có thể xem nh là chính đối với
quá trình hình thành đặc trng thuỷ văn nghiên cứu. Những nhân tố chính này quy
định dạng cơ bản của mối quan hệ, còn những nhân tố khác không quan trọng bằng
sẽ tạo nên môi trờng phân tán đặc trng cho mối quan hệ ngẫu nhiên.
Ngay cả trong các trờng hợp khi mối quan hệ giữa các biến lợng nghiên
cứu, thực chất là hàm số (điều này trong thực tế nghiên cứu thuỷ văn rất ít thấy), mối
quan hệ đợc xây dựng theo tài liệu quan trắc sẽ không cho ta lời giải đơn trị, là do
sai số đo đạc ngẫu nhiên đợc đa vào mối quan hệ.
Vì lẽ đó, mà các nhà thuỷ văn thờng không gặp quan hệ hàm số mà gặp
những quan hệ thống kê, trong đó ứng với mỗi giá trị của đại lợng đợc lấy làm
biến lợng độc lập sẽ có một tập hợp vô hạn những giá trị của đại lợng kia (hàm sẽ
đợc mô tả bằng đờng phân phối có điều kiện). Các đờng phân phối có điều kiện
sẽ thay đổi theo sự thay đổi của biến lợng độc lập. Mối quan hệ thống kê đợc ứng
dụng rất rộng rãi trong mọi lĩnh vực thuỷ văn. Mối quan hệ này phải dựa vào các
phơng pháp đo đạc dòng chảy, và dựa vào các quan hệ này mà xây dựng các lợc
đồ tính toán, dự báo thuỷ văn. Mối quan hệ giữa dòng chảy sông ngòi và lợng m
a,
mối quan hệ giữa lu lợng hay mực nớc ở các trạm quan trắc khác nhau trên một
con sông đờng lu lợng, mối quan hệ dòng chảy của các sông nằm trong vùng
đồng nhất về điều kiện địa vật lýv v đều là những thì dụ về việc sử dụng mối quan
hệ thống kê trong thuỷ văn. Việc nâng cao mức độ phân tích khoa học các quá trình
thuỷ văn, việc hoàn thiện các phơng pháp toán học khái quát hoá các chuỗi thống
kê vả việc sử dụng MTĐT đã tạo ra khả năng phát triển nhanh chóng sử dụng mối
quan hệ thống kê vào nghiên cứu thuỷ văn.
Để khái quát hoá khái niệm quan hệ thống kê ngời ta sử dụng khái niệm


quan hệ ngẫu nhiên, mà ứng với chúng không phải là chuỗi thống kê mẫu, mà là tập

332
hợp đầy đủ các giá trị ngẫu nhiên nghiên cứu, khi dung lợng của chuỗi n tiến tới vô
hạn hay đến một số hữu hạn N bao gồm toàn bộ khoảng biến thiên của biến lợng.
Nh vậy, dung lợng mẫu càng lớn, mối quan hệ thống kê thực nghiệm càng
tiến tới (xem nh giới hạn của mình) quan hệ ngẫu nhiên. Việc khái quát hoá này
cũng tơng tự nh khái quát hoá tần số thực nghiệm bằng khái niệm xác suất.
Khi giấu các biến lợng ngẫu nhiên x và y có mối quan hệ thống kê thì phân
phối có điều kiện của biến ngẫu nhiên y thay đổi theo sự biến thiên của x. Ta nhớ
rằng lợng phân phối có điều kiện của biến ngẫu nhiên y là luật phân phối của nó
nhận đợc với điều kiện của biến ngẫu nhiên x nhận một giá trị xác định x
i
. Rõ ràng
là khái niệm luật phân phối có điều kiện có ý nghĩa nếu nh xét đồng thời kê (x,y).
Khi giải quyết các bài toàn thực tế thờng thì đề cập để những mẫu ngẫu
nhiên có dung lợng nào đó đợc rút ra từ tổng thể. Điều đó có nghĩa là thờng
không xét mối quan hệ ngẫu nhiên mà là mối quan hệ thống kê. Ngoài ra khả năng
sử dụng các quan hệ thống kê để dự báo và tính toán thuỷ văn phải đợc căn cứ vào
giả thiết là ớc lợng thích đáng của các mối quan hệ đó sẽ cho phép nhận đợc kết
luận về quan hệ ngẫu nhiên có cơ sở chắc chắn. Một điều kiện quan trọng cho phép
ta sử dụng các quan hệ thống kê để dự báo và tính toán các đặc trng của chế độ
thuỷ văn là sự cháp nhận giả thuyết cố định (hay giả thuyết dừng) của một loạt điều
kiện hình thành các quan hệ này.
Khả năng ứng dụng của các mối quan hệ mà đợc làm sáng tỏ trên cơ sở tài
liệu thực nghiệm, đối với tổng thể đợc đa vào lý thuyết ớc lợng các tham số
mẫu của mối quan hệ chẳng hạn nh ớc lợng những dao động ngẫu nhiên của
chúng.
ớc lợng này có giá trị đặc biệt khi chỉnh lý các đại lợng thuỷ văn tạo nên
những chuỗi thờng thờng có dung lợng không lớn. Trong các trờng hợp đó có

thể các mối quan hệ thống kê rất phù hợp với tài liệu mẫu nhng lại chệch so với
quan hệ ngãu nhiên.
Mối quan hệ ngẫu nhiên giữa hai biến lợng đợc mô tả đầy đủ nhất bằng
hàm mật độ phân phối hai chiều. Còn mối quan hệ thống kê giữa hai biến lợng ấy
đợc miên tả bằng biểu đồ lăng trụ tần suất. Những mô tả mối quan hệ thống kê và
ngẫu nhiên giữa hai biến lợng nh vậy sẽ đợc khái quát hoá đối với tr
ờng hợp

333
mối quan hệ giữa n biến lợng. Các mối quan hệ này đợc mô tả bằng luật phân
phối n chiều. Sự mô tả các mối quan hệ thống kê và ngẫu nhiên nh vậy là đầy đủ
nhất nhng lại yếu cầu một lợng thông tin gốc rất lớn. Khi nghiên cứu các quá
trình thuỷ văn những điều kiện này không thể thực hiện đợc. Vì vậy khi nghiên cứu
các mối quan hệ thống kê nói chung và giữa hai biến lợng thuỷ văn nói riêng
ngời ta thờng sử dụng mối quan hệ gọi là tơng quan, đây là mối quan hệ giữa giá
trị đợc xác định của một đại lợng (đối số) và trị bình quân có điều kiện tơng ứng
của đại lợng kia (hàm số). Rõ ràng là mối quan hệ tơng quan là dạng biểu diễn
riêng của mối quan hệ thống kê.
Mối quan hệ tơng quan đợc biểu diễn dới dạng các phơng trình tơng
quan hay phơng trình hồi quy có thể là tuyến tính hoặc không tuyến tính. Sau đây
chúng ta sẽ xét mối tơng quan tuyến tính giữa các biến ngẫu nhiên. Trong trờng
hợp mối quan hệ không tuyến tính giữa các đặc trng thuỷ văn cần nghiên cứu có
thể biến đổi tài liệu gốc để cho mối quan hệ giữa các giá trị đã đợc biến đổi có
dạng tuyến tính. Ta nhận thấy rằng phép biến đổi trên đây chính là chuyển luật phân
phối gốc của đại lợng nghiên cứu sang dạng chuẩn.
Một số phơng pháp biến đổi đó đã đợc nghiên cứu ở chơng II. Cũng cần
phải chú ý rằng phơng pháp biến đổi đem dùng chỉ có ý nghĩa trong trờng hợp
khi yếu tố có trong mối quan hệ không tuyến tính giữa các đại lợng gốc đ
ợc xác
định là rất tin cậy.

Khi chuỗi tài liệu quan trắc ngắn thờng có tình trạng nguy hiểm là lấy mối
quan hệ tuyến tính để thay cho mối quan hệ không tuyến tính là do những phân tán
không ngẫu nhiên của tài liệu tạo nên mẫu nhỏ.
6. 2. Tơng quan tuyến tính giữa hai biến
Trong thuỷ văn ngời ta rất hay sử dụng mối tơng quan tuyến tính gữa hai
biến lợng. Các mối quan hệ này đợc dùng kéo dài các chuỗi đặc trng dòng chảy
ra thời kỳ nhiều năm, để dự báo dòng chảy hay mực nớc ở tuyến dới theo tài liệu
dòng chảy ở tuyến đo phía trên; tơng tự nh vậy đối với rất nhiều đặc trng khác
của chế độ thuỷ văn có thể xây dựng các quan hệ dự báo tính toán phụ thuộc vào các
nhân tố xác định chung. Vì vậy chúng ta nghiên cứu mối quan hệ giữa hai đại lợng
ngẫu nhiên không phải là trờng hợp riêng của mối tơng quan tuyến tính nhiều
chiều, đợc trình bày ở mục sau, mà nh là một bài toán độc lập.

334
Chúng ta sẽ xét các mối quan hệ cơ bản đợc mô tả bằng tơng quan tuyến
tính gữa hai biến lợng. Việc làm sáng tỏ mối quan hệ giữa các đặc trng khí tợng
thuỷ văn nghiên cứu sẽ đợc tiến hành trên cơ sở nghiên cứu các chuỗi của chúng.
Khi đa lên đồ thị các giá trị tơng ứng x
i
và y
i
chúng ta nên nhóm ở mức độ nào đó
phân bố theo quy tắc đờng thẳng: y=ax + b phù hợp nhất với nhóm điểm đó. Điều
đó đạt đợc trong trờng hợp khi tổng bình phơng khoảng lệch giữa tài liệu quan
trắc đợc với giá trị tính toán đợc theo phơng trình quy hồi là nhỏ nhất.
min])bax(Yi[S
2
n
1
i


+=
(6.1)
Các giá trị của tham số a và b thoả mãn với phơng trình (6.1) ta tìm đợc khi
cho đạo hàm của tổng đo theo các tham số trong không đạo hàm theo a.

0)x()baxy(2
da
dS
i
n
1
ii
==


Từ đó:
(6.2)
0xbxayx
n
1
i
n
1
i
2
n
1
ii
=++


Đạo hàm theo b:

0)baxy(2
db
dS
n
1
ii
==


từ đó (6.3)

=
n
1
i
n
1
i
0nbxay
Ta đặt trị bình quân của các biến lợng:

yy
n
1
,xx
n
1

n
1
i
n
1
i
==

(6.4)
Giải các phơng trình (6.2) và (6.3) đối với các tham số a và b ta nhận đợc

xayb,
)xnx(
)yxnyx(
a
n
1
2
i
2
n
1
ii
=


=




Biểu thức của tham số a đợc gọi là hệ số hồi quy, có thể dẫn đấn dạng:

335

x
y
ra


= (6.5)
Hệ số tơng quan r giữa các biến x và y có thể căn cứ vào các mẫu nghiên
cứu tính theo công thức:





=
n
1
n
1
2
i
2
i
n
1
ii
)yy()xx(

)yy)(xx(
r
(6.6)
Hệ số tơng quan thờng đợc sử dụng ở dạng sau:

yx
)y,xcov(
r

=
(6.7)
Trong đó: cov(x,y) - hiệp biến (mônen hỗn hợp bậc hai) hay mômen quan hệ
của các đại lợng x và y là kỳ vọng toán của tích các khoảng lệch x và y so với tần
phân phối của chúng, nghĩa là:

)yy)(xx(
n
1
)y,xcov(
ii
n
1
=


hay
y/xx/y
aar =
(6.8)
trong đó a

y/x
và a
x/y
hệ số hồi quy của y theo x và của x theo y.
Ta sẽ điểm lại những tính chất cơ bản của hệ số tơng quan:
Nếu các biến x và y độc lập với nhau thì tổng của tích các khoảng lệch so với
trị bình quân của chúng ở tử số các biểu thức (6.6) sẽ bằng 0 do đó hệ số tơng
quan cũng bằng 0. Trong trờng hợp khi mối quan hệ giữa các biến lợng là hàm số
(ngoài quan hệ tuyến tính ra) hệ số tơng quan bằng cộng hay trừ 1 (1). Khi đó
mối tơng quan, phụ thuộc vào mức độ chặt chẽ của nó, hệ số tơng quan biến đổi
trong khoảng 1.
Hệ số tơng quan tơng ứng với trờng hợp khi hàm số tăng theo sự tăng của
đối số (mối quan hệ thuận), hàm số giảm khi đối số tăng sẽ đợc đặc trng bằng hệ
số tơng quan âm (nội quan hệ nghịch).

336
Khoảng lệch trung bình bình phơng của các bién lợng so với bình quân số
học của chúng đợc xác định theo các biểu thức:

n
)yy(
;
n
)xxi(
n
1
2
i
y
n

1
2
x


=


(6.9)
- Tham số b có thể đợc viết dới dạng:

xryb
x
y


= (6.10)
Với các đẳng thức (5.6) và (5.9) phơng trình tơng quan có thể biểu diễn
dới dạng:

)xx(r)xx(ayy
axyaxbaxy
x
y



==
+=+=
(6.11)

Đẳng thức vừa nhận đợc này là phơng trình hồi quy của y theo x.
Tơng tự ta nhận đợc phơng trình quan hệ tuyến tính của x theo y có dạng:

)yy(
x
rxx
x



=
(6.12)
Các phơng trình (6.11) và (6.12) là những quan hệ độc lập khác nhau không
thể nhận phơng trình này từ phơng trình kia đợc. Ta chú ý rằng dạng phơng
trình tơng quan khác nhau của y theo x và của x theo y là do sự khác biệt của đặc
tính thống kê trong quan hệ và không có liên quan gì với độ dài hữu hạn của tài
liệu mẫu.
Các quan hệ trên nói chung đều đúng với các mẫu lấy từ bất kỳ luật phân
phối nào của biến lợng ngẫu nhiên x và y. Nếu các biến lợng x và y phân phối
theo luật chuẩn thì mỗi điểm của phơng trình hồi quy là tâm của đờng phân phối
có điều kiện của biến ngẫu nhiên phụ thuộc (y), các giá trị y đợc lập nhóm quanh
nó, các giá trị y này xuất hiện đồng thời (trong các lần thử khác nhau) với cùng một
giá trị x nghiên cứu. Lúc này trong trờng hợp riêng các đờng phân phối có điều
kiện cũng ứng với luật phân phối chuẩn có trị bình quân đợc tính bằng đẳng thức
(6.4) và có phơng sai xác định theo đẳng thức (6.9)

337
Dới dạng tổng quát sự phân tán của những đại lợng có quan hệ tơng
đơng với nhau, tuân theo luật phân phối chuẩn đợc biểu diễn theo phạm vi của
elip phân tán (elíp xác suất nh nhau) (hình 6.1). Đối với các chuỗi thống kê chuẩn

độc lập với nhau elíp sẽ trở thành hình tròn, còn đối với mối quan hệ hàm số thì nó
trở thành mối quan hệ tuyến tính đơn trị.
Đờng thẳng ab là đờng hồi
quy của y theo x nó chia các tuyến
thẳng đứng của elíp ra làm 2 phần
bằng nhau, và nó biểu diễn sự phân
tán của giá trị y ứng với mỗi giá trị
x. Giá trị phân tán lý luận đợc mô
tả bằng quan hệ (6.9). Giá trị
phơng sai đặc trng của hàm y là
một số không đổi, không phụ thuộc
vào x
i
, vì vậy biểu thức (6.9) sẽ cho
ta ớc lợng sự phân tán của y. Đối
với thiết diện ứng với giá trị x
i
cố
định cũng nh đối với toàn bộ phơng trình hồi quy nói chung đờng chia đôi các
cát tuyến nằm ngang song song với trục x.
Hình 6.1 Sơ đồ quan hệ y = ax+b;
y=a'x+b' đối với phân bố chuẩn
biến x và y
Các đờng ab và cd ứng với các phơng trình (6.11) và (6.12) nh trên đã rõ
chúng chỉ trùng nhau khi các đại lơng x và y có quan hệ hàm số với nhau:
Để kết luận về vấn đề này, vì các phơng trình tơng quan nhận đợc trên cơ
sở các mẫu phải phù hợp với các quan hệ ngẫu nhiên, nên phải đánh giá độ chính
xác và phơng trình hồi quy và tham số của phơng trình này. Để làm chỉ tiêu độ
chính xác của phơng trình hồi quy, ngời ta sử dụng khoảng lệch trung bình bình
phơng có điều kiện (sai số tiêu chuẩn) là khoảng lệch trung bình bình phơng giữa

các giá trị quan trắc và giá trị tính toán đợc theo phơng trình hồi quy.
n
)yy(
)x(
n
1i
2
pn,i
y

=


(6.13)
trong đó: y
i,q,tr
- Giá trị quan trắc đợc; y
tt
- Gía trị tính toán đợc theo đờng
hồi quy.

338
Sử dụng hệ số tơng quan thì biểu thức (6.13) sẽ có dạng:
2
0)x(y
r1y =
(6.14)
ở đây
y0
- là khoảng lệch trung bình bình phơng của chuỗi giá trị gốc

y(hàm số); r - hệ số tơng quan của phơng trình đờng hồi quy.
Biểu thức (6.14) cho thấy rằng chẳng hạn khi r=0,95 khoảng lệch trung bình
bình phơng của các giá trị nhận đợc theo phơng trình hồi quy bằng 0,32, nghĩa là
độ phân tán của các giá trị đó nhỏ gấp 3 lần so với độ phan tán của chuỗi biến lợng
phụ thuộc gốc.
Khi nghiên cứu các tham số a và b đợc xem nh là đại lợng biến đổi,
chúng biến thiên từ mẫu này sang mẫu khác, độ chính xác của ớc lợng có thể đặc
trng bằng các giá trị của sai số tiêu chuẩn tơng ứng.

n
r1
n
2
y)x(y
b



=
(6.15)
Khi sử dụng để xây dựng đờng hồi quy các tham số a và b có sai số ngẫu
nhiên, chúng ta cho phép có sai số trong khi ớc lợng tung độ của đờng hồi quy.
Sai số này có thể đợc đặc trng bằng giá trị của phơng sai tơng ứng (bình
phơng sai số tiêu chuẩn).
















+

=

=
n
1i
2
i
2
i
2
yi
2
y
)xx(
)xx(
2n
1
)x()x(
(6.17)

Phơng sai
đặc trng cho độ phân tán của tung độ đờng hồi quy mẫu
so với đờng hồi quy của tổng thể.
2
)xi(y

Sau đây chúng ta sẽ nghiên cứu vấn đề độ chính xác về ớc lợng hệ số tơng
quan mẫu.
Trong công trình của V.I Rômanôvski [111.tr 391] đã chứng minh đợc
công thức sai số trung bình bình phơng của hệ số tơng quan.

339

2
222
r
n2
13r75
n2
r11
1
1n
r1
++


=

mà khi n khá lớn (n > 25) đợc viết dới dạng thờng hay gặp:


1n
r1
2
r



(6.18)
Khi n rất lớn và r gần bằng 1, phân phối của hệ số tơng quan mẫu sẽ tiếp tới
luật phân phối chuẩn có tần phân phối bằng r và khoảng lệch trung bình =1-r
2
. Khi n
là hằng số và r = 1 luật phân phối của hệ số tơng quan càng lệch so với luật chuẩn.
Hệ số tơng quan đợc tính theo mẫu có dung lợng hữu hạn n thờng
thờng là nhỏ hơn hệ số tơng quan của tổng thể, nghĩa là hệ số tơng quan mẫu có
chệch âm. Độ chệch này giảm khi n tăng.
Phân phối chuẩn của hệ số tơng quan mẫu gần nh đợc bảo tồn khi n
không nhỏ lắm và r không lớn lắm. Trong các trờng hợp khác (khi n nhỏ và r lớn)
phân phối của r mẫu là không đối xứng.
Đối với hệ số tơng quan tính theo các mẫu từ trong phân phối khác với luật
chuẩn, luật phân phối của r mẫu nói chung là cha biết vì thế việc ứng dụng hệ số
tơng quan thực nghiệm là khó khăn. Khi dung lợng của mẫu nhỏ (n < 50) và đặc
biệt khi r lớn độ đánh giá mức độ phân tán ngẫu nhiên của hệ số tơng quan mẫu
ngời ta thờng sử dụng phép biến đổi Fisher biến đổi này đợc dựa vào việc sử
dụng biến lợng đặc biệt z có quan hệ hàm số với r bằng biểu thức.

r
1
r1
ln

2
1
z

+
=
(6.19)
Để xác định các giá trị z=f(r) nên sử dụng tại liệu của bảng 6.1
Phân phối z ngay cả đối với các mẫu không lớn rất gần với phân phối chuẩn
trong thực tế không phụ thuộc vào n và giá trị thực r.
Sai số tiêu chuẩn z bằng:

3n
1

=
(6.20)

340
Theo các giá trị
Z
, và sử dụng số liệu bảng 6.1 ta có thể tìm đợc và cần đa
vào luật phân phối chuẩn sẽ xác định ở giới hạn nào đó những giá trị hệ số tơng
quan mẫu ứng với các mẫu khác nhau của xác suất tin cậy.
Trờng hợp riêng sử dụng phép biến đổi Fisher là đồ thị hình 6.2
Bảng 6.1 Giá tri z = f(r)
r 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0
0,1
0,2

0,3
0,4
0,5
0,6
0,7
0,8
0,9
0,99
0,00
0,10
0,20
0,31
0,42
0,55
0,69
0,87
0,10
1,47
2,65
0,01
0,11
0,21
0,32
0,44
0,56
0,71
0,89
1,13
1,53
2,70

0,02
0,12
0,22
0,33
0,45
0,58
0,72
0,91
1,16
1,59
2,76
0,03
0,13
0,23
0,34
0,46
0,59
0,74
0,93
1,19
1,66
2,83
0,04
0,14
0,24
0,35
0,47
0,60
0,06
0,95

1,22
1,74
2,90
0,05
0,15
0,26
0,37
0,48
0,62
0,78
0,97
1,26
1,83
2,99
0,06
0,16
0,27
0,38
0,50
0,63
0,79
1,00
1,29
1,95
3,11
0,07
0,17
0,28
0,39
0,51

0,65
0,81
1,02
1,39
2,09
3,25
0,08
0,18
0,29
0,40
0,52
0,66
0,83
1,05
1,38
2,30
3,45
0,09
0,19
0,30
0,41
0,54
0,68
0,85
1,07
1,42
2,65
3,80
Hệ số tơng quan nhỏ nhất ứng với mức ử dụng 5% trong tổng thể, với các
giá trị của hệ số đệ tính theo các mẫu có dung lợng khác nhau.

Một trong những bài toán tính toán thuỷ văn đợc giải quyết có sử dụng đến
tơng quan tuyến tính là việc chuyển các tham số của chuỗi đại lợng thuỷ văn đợc
xác định theo mẫu ngắn sang giai đoạn dài. Cơ sở vật lý của lời giải đó là tính đồng
bộ có trong dao động của các chuỗi thuỷ văn đợc nghiên cứu và của đặc trng khí
tơng thuỷ văn nào đó có tơng quan với đại lợng này. Lúc này đáng chú ý là đặc
trng (đối số) đợc có định trong suốt một thời kỳ dài là thời kỳ mà đại lợng (hàm
số) thuỷ văn ta quan tâm.
Mối quan hệ thống kê của tài liệu quan trắc đồng có thể đợc sử dụng dới 2
dạng sau đây. Một dạng sử dụng mối quan hệ thống kê là để khôi phục đại lợng
thuỷ văn ta quan tâm cho toàn bộ thời kỳ tài liệu của đối số có đợc. Hớng thứ hai

341
căn cứ vào việc sử dụng các phơng trình ta quan sát, xác lập giữa các giá trị của
tham số thống kê (trị bình quân và khoảng lệch tiệu chuẩn) ở đối tợng mà đối với
n phải tiến hành kéo dài và ở đối tợng tơng tự.
Sử dụng cách thứ nhất để
ta kéo dài chuỗi ngắn là giá trị
trong đó đợc tính theo phơng
trình hồi quy. Chúng đợc khôi
phục nh vậy cho phép ta xác
định các tham số nó ứng với thời
kỳ quan trắc dài ở đới tơng tự
(trị bình quân để biến đổi), ngoài
ra còn chứa một lợng thông tin
bổ sung về sự lần lợt của các
pha nớc khác nhau trong thời kỳ
nhiều năm.
Song cần phải chú ý là
chuỗi khôi phục đó không đợc
khôi phục chính xác nh tài liệu

quan tóc trớc đây đặc trng
nghiên cứu. Vấn đề là ở chỗ các
giá trị của hàm (trong trờng hợp này là của đại lợng phục hồi y) nhân theo phơng
trình hồi quy là trị bình quân của tập hợp sự thể hiện khi cố định giá trị của đối số x
i
.
Nhng giá trị thực tế riêng biệt của hàm Y lệch tơng đối nhiều so với đờng hồi
quy. Việc thay thế những giá trị phân tán xung đờng hồi quy đó bằng kỳ vọng toán
của chúng sẽ dẫn đến đợc khôi phục khác với chuỗi thực tế đợc san bằng những
động X.X.Kirski và M.F.Menkel [82] đã chứng minh rằng biến đổi thực tế của đại
lợng thuỷ văn đợc nghiên ứu bằng Cv/r, trong đó là hệ số biến đổi nhận đợc theo
đã đợc khôi phục bằng phơng trình hồi quy, còn r là hệ số tơng quan của phơng
trình hồi quy. Tơng tự nh vậy để bảo đảm tính chất dao động chung của biến
lợng y đợc biểu diễn bằng hệ số biến đổi thực Cv ta cần phải tăng khoảng lệch y-
y tính theo phơng trình hồi quy 1/r lần.
Hình 6.2 Giá trị cực tiểu của hệ số
tơng quan với mức sử dụng 5% trong tổng
thể với các giá trị khác nhau của hệ số này
trong các mẫu có dung lợng khác nhau.

342
Thuật toán đó đợc dùng vào việc tính toán theo phơng trình hồi quy gốc
với trờng hợp khi r=1 cũng giống nh sử dụng lời giải, "duy nhất" ứng với phơng
trình.

)xx(y)x(y
i
x
y
i




+=
Khi các đờng hồi quy của y theo x và của x theo y trùng nhau. Khi sử dụng
phơng pháp của G.P.Ivanôv cũng nhận đợc kết quả tơng tự. Thực chất của nó là
đối với đối tợng nghiên cứu không phải chuyển giá trị
x)-(xi
x
y
từ đối tợng tơng
tự, mà chuyển tần số P
xi
đặc trng cho giá trị )xx(
x
y
i




Đối với những chuỗi tuân theo luật phân phối chuẩn, việc chuyển từ tơng tự
sang các giá trị
)xx(
x
y
i




hay P
x
có nghĩa là thực hiện một phép toán tơng đơng
chỉ khác nhau bằng hình dạng bên ngoài.
Đối với những luật phân xác suất không đối xứng, phơng pháp Ivanôv là
đúng hơn cả. Vì rằng giá trị P
xi
nhận đợc theo đờng tần suất thực nghiệm sẽ phản
ánh đợc tính không đối xứng của nó.
Cần phải chú ý rằng khi hệ số tơng quan nhỏ các chuỗi đợc khô phục có
xét đến số hiệu chỉnh sẽ không phản ánh đợc dao động của đại lợng nghiên cứu
trong một khoảng thời gian cụ thể, đối với khoảng thời gian này trong khi tính toán
đợc sử dụng tài liệu quan trắc dao động của biến số x.
Phần khôi phục của chuỗi là một thí dụ điển hình chuyển đặc tính những dao
động của chuỗi nghiên cứu mà không khôi phục chúng trong trình tự thời gian cụ
thể.
Để chuyển các tham số thông kê sang thời kỳ nhiều n (không kéo dài chuỗi
theo những giá trị tơng ứng của đối tợng tơng tự) ngời ta đã sử dụng các
phơng trình sau đây của Kriski và Menkel [82].

)xx(ryy
nN
xN
yN
nN



+= (6.21)


343
)(r
2
xn
2
xN
2
xN
2
yN
22
yN2
2
yN



+=
(6.22)

Trong đó,
nN
x,Y
trị bình quân của các đại lợng tơng ứng trong thòi kỳ N
(thời kỳ quan trắc nhiều năm ở đối tợng - tơng tự)
y,x
nn
trị bình quân ứng với
thời kỳ quan trắc ngắn n của đối tợng cần đợc kéo dài ớc lợng khoảng lệch
trung bình bình phơng của y và x trong các thời kỳ đó; r - hệ số tơng quan giữa

các giá trị y và x xảy ra đồng thời.
Hệ số tơng quan giữa các ớc lợng của phơng sai đợc lấy bằng r
2
trên cơ
sở quan hệ gần đúng đã biết trong thống kê toán. Giá trị phơng sai
yN
đợc tính
khi giải phơng trình (6.22)

)1(r1
2
xN
2
xn
2
2
yn
2
yN




=
(6.23)
Để đánh giá độ chính xác của các tham số nhận đợc cho thời kỳ nhiều năm
ngời ta sử dụng các công tức sai số tiêu chuẩn.

2
yN

Ny
r
N
nN
1
n



=
(6.24)

4
yN
yN
r
N
nN
1
n2



=

(6.25)
Sau đây chúng ta sẽ xét một số ví dụ minh hoạ trình tự những đề xuất phân
tích ở trên. Theo tài liệu quan trắc dòng chảy năm sông Dnepr - trạm Xmolensk (x)
trong 82 năm (từ 1882) và sông ViaZma - trạm Xtarafa (Y) trong 18 năm (từ 1954)
ta xây dựng phơng trình hồi quy và sử dụng nó để kéo dài chuỗi tài liệu của trạm

Xtaraia và để chuyển các tham số của chuỗi 18 năm sang thời kỳ nhiều năm. Đồ thị
quan hệ của tài liệu trong thời kỳ quan trắc đồng bộ đợc biểu diễn trên hình 6.3.
Đối với thời kỳ quan trắc đồng bộ ta có

=134xi


=124yi
2
skm/l4,7x = .
2
skm/l9,6y =
79,1;117)yyi();58)xxi(;73)yyi();xxi(
xn
22
===




. Ngoài ra ta đã biết
55,2y =
9,6x,28,1xN
N
=
=



344

Căn cứ vào chuỗi số liệu này ta nhận đợc:

27,1
58
73
)xxi(
)yyi)(xx(
a
2
i
x/y
==


=



89,0
117.58
73
)yyi()xxi(
)yyi)(xxi(
r
51,24,7.27,19,6xayb
22
x/y
==



=
===



Trong trờng hợp này phơng trình hồi quy của y theo số có dạng:
Y(x) = 6,9+ 1,27 ( x-7,4) l/sKm
2
hay là
Hình 6.3 Đồ thị quan hệ dòng chảy năm S. Viazm -
tr. Xtaraia (y) và s. Dnhepr ở tp. Smolensk (x)
Y(x) = 1,27x-2,51 l/s Km
2
Những tính toán tơng tự đối với đờng hồi quy của x theo y sẽ dẫn đến
phơng trình:
X(Y) = 0,62 + 3,11 l/s Km
2

345
Khoảng lệch trung bình bình phơng có điều kiện của biến lợng y đối với
đờng hồi quy ứng với đối số cho trớc bằng:

24,1
15
73.27,1117
n
)yy()xx(a)yyi(
ii
2
1)x(y

=

=

=


Còn theo công thức (6.14)

20,189,0155,2r1
22
y2)x(y
===

Sai số tiêu chuẩn của số hạng tự do b của phơng trình hồi quy đợc xác
định theo công thức:

29,0
18
24,1
n
1)x(y
b
==

=

hoặc là

28,0

18
20,1
n
2)x(y
b
==

=

Sai số tiêu chuẩn của hệ số hồi quy bằng

16,0
58
24,1
)xxi(
2
1)x(y
a
==


=


hay là

16,0
58
20,1
)xxi(

2
2)x(y
a
==


=


Trong trờng hợp này các kết quả tính toán tham số của phơng trình hồi
quy có thể đợc biểu diễn dới dạng

16,027,1a
a

29,051,2b
b

Sai số tiêu chuẩn của tung độ phơng trình hồi quy theo công tức (6.17) đợc
biểu diễn bằng:

346
.
58
)4,7xi(
16
1
24,1
)xx(
)xxi(

2n
1
2
2
i
2
)x(y)xi(y

+=


+

=


Thí dụ: khi x
i
=5
y(x)
=0,50l/s.km
2
, khi x
i
= 10
y(x)
= 0,52
l/skm
2
và khi ==

y(x) =
0,29 =
b điều đó có thể có.
Sai số tiêu chuẩn của hệ số tơng quan trong trờng hợp này bằng:

05,0
17
89,01
1n
r1
22
=

=


=

Sai số xác suất bằng
= 0,67 = 0,03
Chúng ta sẽ tiến hành đánh giá sai số tiêu chuẩn hệ số tơng quan bằng phép
biến đổi Fisher. Để làm việc theo giá trị của hệ số tơng quan r=0,89 và theo bảng ta
sẽ xác định đợc giá trị của hàm z bằng z= 1,42. Sai số trung bình bình phơng của
z theo biểu thức (6.20) bằng

26,0
318
1
z


=

Nh vậy trong phạm vi
z
giá trị z bằng
z
tr
= z+
z
= 1,42+0,28 = 1,68
z
d
= z-
z
= 1,42 -0,26 = 1,16
Tiếp theo với z
tr
và z
d
theo bảng 6.1 ta xác định đợc giới hạn trên và giới hạn
dới của r.
r
tr
= 0,93
r
d
= 0,82
Khi sử dụng công thức (6.18), ta có:
r
tr

= 0,89 + 0,05 = 0,94
r
d
= 0,89 - 0,05 = 0,84

347
Sự khác nhau trong ớc lợng r là do khi r lớn và dung lợng mẫu nhỏ luật
phân phối của ớc lợng mẫu sẽ lệch đi ít nhiều so với luật phân phối chuẩn.
Sử dụng các phơng trình (6.21) và (6.23), ta tiến hành chuyển các tham số y
và y sang thời kỳ nhiều năm.

2
nN
xN
yn
nN
skm/l26,6)4,79,6(
82,1
55,2
89,09,6)xx(ryy =+=


+=

2
2
2
2
2
xN

2
xn
2
yn
yN
skm/l58,2
)
82,1
79,1
1(89,01
55,2
1r1
=

=












=

Trong trờng hợp này

41,0
y
Cv
N
yN
yN
=

=
Sử dụng phơng trình tơng quan y(x) = 1,27 x chuỗi dòng chảy sông
Viazma có thể khối phục đợc cho t bộ thời kỳ mà có tài liệu quan trắc dòng chảy
sông Dnepr trạm Xmôlensk.
Sử dụng chuỗi các tài liệu quan trắc đợc và tài liệu khôi phục theo phơng
trình tơng quan ta nhận đợc
2
yN
2
N
skm/l42,2;skm/l21,6y ==
Trong trờng hợp
này sự khác nhau giữa các tham số nhận đợc theo chuỗi đợc khôi phục và theo
tính toán bằng các phơng trình (6.24) và (6.23) không lớn lắm điều đó là do mối
quan hệ giữa dòng chảy trong thời kỳ quan trắc đồng bộ rất chặt chẽ (r = 0,89).
6 .3. Tơng quan tính toán nhiều chiều.
Trong nghiên cứu các quá trình thuỷ văn do nhiều tổ tạo nên, thí dụ nh: khi
xây dựng các lợc đồ tính toán và dự báo đôi khi cần phải xác lập quan hệ tuyến
tính giữa một số biến lợng với nhau. Để giải bài toán này ngời ta chú ý đến phép
toán tơng đơng tuyến tính nhiều chiều. Thực chất của phơng pháp này là sử dụng
các lập luận cơ bản của phơng pháp tơng quan tuyến tính giữa hai biến lợng đối
với trờng hợp biến lợng mà ta quan tâm phụ thuộc vào số lợng tuỳ ý đối số x.

Cơ sở để tìm mối quan hệ là sử dụng tài liệu quan trắc đại lợng y và các đại
lợng quy định nó là x
1
, x
2
và x
n
. Kết quả đo đạc đồng thời các đại lợng đó có thể
biểu diễn dới dạng

348
Y
1
, x
11
, x
21
, x
31
, x
j1
, x
n1
Y
2
, x
12
, x
22
, x

32
, x
j2
, x
n2
Y
i
, x
1i
, x
2i
, x
3i
, x
ji
, x
ni
y
m
, x
1m
, x
2m
, x
3m
, x
jm
, x
nm
y, x

1
, x
2
, x
3
, x
j
, x
n
Dựa vào những tài liệu đo đạc trên đây ta phải tìm một quan hệ tuyến tính
giữa y và x1, x2, xn, theo nguyên tắc bình phơng nhỏ nhất phù hợp nhất với tài
liệu thực nghiệm. Lời giải nhận đợc rất đơn giản nếu nh không nghiên cứu chính
các giá trị gốc y và x1, x2, xn là các khoảng lệch của chúng so với trị bình quân.

m, 2,1i
n, 2,1j
;xxx;yyiy
jij
00
1
=
=
==

Trong trờng hợp này phơng trình hồi quy của tơng quan tuyến tính nhiều
chiều

) xx(k )xx(k )xx(k)xx(kyy
nininjijj2i22iij1


+
+

+
+

++=

(6.26)
của giá trị y đối với các biến số x
1
, x
2
, x
n
của nó đợc viết nh là phơng trình hồi
quy của giá trị
00i
i
0
yyy
đối với khoảng lệch của đối số x
1
, x
2
, x
n
so với trị
bình quân của chúng.


(6.27)
0
nn
0
22
0
11
0
1
xk xkxky +++=
Rõ ràng là có m phơng trình nh vậy đối với số lợng quan trắc của giá trị
y, x
1
, x
2
, x
n
. Lúc này m == . Khi m >>n bài toán xác định các tham số sẽ không
giải đợc khi m = n lời giải sẽ nhận đợc với độ chính xác thoả mãn với tài liệu
gốc, nhng lời giải này chỉ có ý nghĩa đối với các quan hệ hoàn toàn là hàm số.
Trờng hợp hệ có số lợng phơng trình lớn hơn số lợng tham số cha biết
sẽ là trờng hợp cơ bản của việc xây dựng các phơng trình hồi quy. Lời giải tốt
nhất của hệ có phơng trình thừa là tìm những giá trị của đại lợng cha biết đó mà

349
đợc liên kết với nhanh bằng các phơng trình liên hẹ nghiên cứu, khi xác định
chúng các phơng trình này khoảng lệch nhỏ nhất gữa các giá trị tính toán và quan
trắc. nếu dùng tổng các khoảng lệch đó của chúng để đánh giá sẽ gặp phải trờng
hợp là các khoảng lệch lớn nhng có dấu ngợc nhau có thể bù trù lẫn nhau, trong
khi đó của giá trị tuyệt đối của các khoảng lệch riêng biệt có thể là rất lớn.

Do đó lời giải tốt nhất của hệ phơng trình đợc chấp nhận là lời giải mà
trong đó tổng bình phơng tất cả các khoảng lệch (hay sai số tính toán sử dụng
phơng trình hồi quy) có giá trị nhỏ nhất, vì vậy phơng pháp giải này mang tên là
phơng pháp bình phơng nhỏ nhất.
Nh ta đã thấy ở bài 2 của chơng này hệ số hồi quy trong phơng trình
tơng quan liên kết hai biến lợng bằng y/x r
x
giữa x và y đợc thay thế bằng tổ hợp
các hệ số đó tính từng cặp đại lợng trong phơng trình hồi quy. Chẳng hạn, trong
trờng hợp có 3 biến lợng y, x
1
, x
2
phơng trình hồi quy có dạng:

2
0
2
1x1x
2x1x1yx2yx
2
y
1
0
2
1x1x
2x1x2yx1yx
1
y
0

x
r1
rrr
x
x
r1
rrr
.
x
y




+




=

Trong trờng hợp có 4 biến lợng ta có:
3
0
3x2x3x1x2x1x
2
3x1x
2
2x1x
2

3x2x
3x1x2yx3x2x1ỹ2x1x
3x2x3x1x2x1x3x1x
2
2x1x
2
3x2x
2x3x2yx1x3x1yx
2
2x1x2yx
3x
y
2
0
3x2x3x
1x2x1x
2
3x1x
2
2x1x
2
3x2x
1x2x3yx3x2x1ỹ23x1x
3x2x3x1x2x1x
2
2x1x
2
3x2x
3x2x3yx2x1x1yx
2

3x1x2yx
2x
y
1
0
3x2x3x1x2x1x
2
2x1x
2
3x2x
2x1x3yx3x1x2ỹ3x2x
3x2x3x1x2x1x
2
2x1x
2
3x2x
3x1x3x2xv2x3x2xy1x
1x
y
0
x
rrr2rrr1
)rrrr(r
rrr2rrr1
rrrr)r1(r
x
rrr2rrr1
)rrrr(r
rrr2rr1
rrrr)r1(r

x
rrr2rr1
)rrrr(r
rrr2rr1
rrr)2r1(r
y




+
+
+




+
+



+
+




+
+

+




+
+



+
+




+
+
+
+




+



=
(6.29)


350
Các hệ phơng trình viết dới dạng (6.28) và (6.29) có thể đợc dùng đơn
giản hoá và khái quát hoá cho trờng hợp chung của các biến lợng bằng cách sử
dụng định thức . Trong trờng hợp đó các biểu thức tổng quát của hệ số hồi quy (kj)
có thể viết dới dạng:

yy
yxj
xj
y
D
D
.kj


=
(6.30)
trong đó,
y
khoảng lệch trung bình bình phơng của biến lợng phụ thuộc
(hàm số)
xj
- khoảng lệch trung bình bình phơng của biến lợng độc lập D
yj
hay
D
yy
là những định thức con của định thức:


1r rrr
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
r
.
.
.
1
.
.
.
r
.
.
.
r
.

.
.
r
.
.
.
rr1rr
r r r1r
r jr rr1
xnxj2xnx1xnxxny
xjxn2xjx1xjxxjy
xn2xxj2x1x2xy2x
xixnxj1x2x1xy1x
yxnyx2yx1yx
(6.31)
Định thức con là một phân của định thức gốc (D) . Trong trờng hợp này,
dòng đầu tiên và cột dọc ứng với biến lợng có trong ký hiệu của định thức con đợc
xoá đi.Thí dụ định thức con thứ nhất D
yy
nghĩa là định tức gốc D đợc xoá đi dòng
thứ nhất và cột thứ nhất:

1
.
.
.
r
.
.
.

r
.
.
.
r
.
.
.
r 1rr
.
.
.
.
.
.
.
.
.
.
.
.
r r 1r
r r r1
D
xnxj
2xnx1xnx
xjxn2xjx1xjx
xn2xxj2x1x2x
xn1xxixj2x1x
yy

=


351
Định thức con D
y
x
1
là định thức D đợc xoá đi dòng thứ nhất của cột thứ hai.
Đó là định tức con thứ hai. Định tức con thứ ba (D
yx2
) nhận đợc bằng cách xoá
trong định thức D dòng thứ nhất và cột thứ ba của nó. Định tức con thứ t D
yx3

xoá dòng thứ nhất và cột thứ t trong định thức D, vv Những giải thích trên đều
thuộc về trờng hợp xác định hệ số hồi quy. Dới dạng tổng quát định thức con D
ij

nhận đợc bằng cách xoá đi dòng thứ i và cột thứ j của định thức D.
Sau đây chúng ta sẽ xem xét mối quan hệ của hệ các định thức với biểu thức
dạng (6.28). căn cứ vào biểu thức (6.30) các hệ số hồi quy đối với phơng trình ba
biến lợng.

(6.32)
2
0
2
1
0

1
0
xkxky +=

yy
2yx
2x
y
1
yy
1yx
1x
y
1
D
D
.k
D
D
.k


=


=

Đối với trờng hợp nghiên cứu định thức có dạng:

1rr

r1r
rr1
D
2x1x2yx
2x1x1yx
2yx1yx
=
(6.33)
Các định thức con của định thức này trong biểu thức hệ số hồi quy bằng:

[]
2
2x1x
2x1x
2x1x
yy
2x1x1yx2yx2yx2x1x1yx
2x1x2yx
1yx
2yx
1x1x2yx1yx
2yx
2x1x1yx
1yx
r1
1r
r1
D
,rrrrrr
rr

1r
D
,rrr
1r
rr
D
==
===
==

phơng trình hồ quy sẽ có dạng (6.28). Các nguyên tố của định thức (6.33) là những
hệ số tơng quan từng đôi một giữa các biến nghiên cứu, đợc xác định theo
phơng trình

352





=
m
1
2
kk
m
1
2
jj
kk

m
1
jj
jk
)xx()xx(
)xx()xx(
r
(6.34)
Hệ số tơng quan toàn phần hay hệ số tơng quan tổng giữa biến lợng phụ
thuộc vào tất cả các biến lợng độc lập đợc xác định theo biểu thức:

yy
D
D
1R =
(6.35)
Nếu các hệ số tơng quan từng đôi một đặc trng cho mức độ quan hệ giữa
hai biến lợng biến thiên từ - đến 1, thì hệ số tơng quan tổng hợp, có giới hạn biến
thiên từ 0 đến 1.
Mối quan hệ tuyến tính (chứ không phải quan hệ bất kỳ) giữa hai biến lợng
mà không có r=0 và R=0 giữa n biến lợng. Trong trờng hợp có mối quan hệ hàm
số giữa các biến lợng r = 1,0; R= 1,0.
Hệ số tơng quan tổng hợp R khi r =1 luôn luôn lớn hơn bất kỳ hệ số tơng
quan từng đôi một nào ở trong định thức D, ngoài đờng chéo, ở đây r
yy
= r
x1x1
=
r
x2x2

= = r
x2x2
= = r
x1xn
= 1 .
Ta nhận thấy rằng hệ số tơng quan tổng hợp có thể đợc tính nh thế là hệ
số tơng quan từng đôi một giữa các giá trị quan trắc đợc của biến lợng phụ thuộc
vào những giá trị tính toán theo đờng hồi quy.
Khoảng lệch trung bình bình phơng của các giá trị quan trắc (y
qtr
) so với các
giá trị tính toán đợc theo phơng trình hồi quy (y
tt
) đặc trng cho độ chính xác của
phơng trình hồi quy mẫu đem dùng, có thể đợc tính theo công thức:

m
)yy(
2
m
1
pH
y


=
(6.36)
hay là

2

0y
R1=
(6.37)

353
R=1,
y
= 0, chứng tỏ rằng giá trị quan trắc và tính toán đợc theo phơng
trình (6.30) hoàn toàn phù hợp với nhau.
Khi R=0;
y
=
0
thì suy ra việc sử dụng phơng trình hồi quy sẽ không có ý
nghĩa.
Để đánh giá sai số trung bình bình phơng của hệ số phơng trình hồi quy
(k
j
) ta sử dụng công thức:

,n, 2,1j,
P)nm(
m
kj
y
kj
=


= (6.38)

trong đó m - số số hạng của chuỗi đợc dùng để xây dựng phơng trình hồi
quy n số biến lợng độc lập.

jj
kj
P


=


jj
định thức con của định thức, nhận đợc bằng cách xoá bỏ dòng thứ j và
cột thứ j trong định thức.
Từ phơng trình (6.38) rút ra sai số của hệ số hồi quy (trong các điều kiện
nh nhau) sẽ tăng lên khi số lợng biến lợng tăng. Với độ dài của chuỗi các giá trị
thuỷ văn không lớn lắm việc sử dụng số biến lợng nhiều hơn bồn đê xây dựng
phơng trình hồi quy nhiều chiều sẽ nhận đợc những hệ số hồi quy kém chính xác
và lời giải về mặt thống kê là kém ổn định.
Biểu thức tổng quát của sai số trung bình bình phơng của hệ số hồi quy k
j

đối với trờng hợp ba biến lợng đợc viết dới dạng:

)r1)(2m(
y
2
2x1x1x
ki



=
(6.39)

)r1)(2m(
y
2
2x1x2x
2k


=
(6.40)
Đối với trờng hợp 4 biến lợng ta có:

354

.
)rrr2rrr1)(3m(
r1
,
)rrr2rrr1)(3m(
r1
,
)rrr2rrr1)(3m(
r1
3x2x3x1x2x1x
2
3x2x
2

3x1x
2
2x1x
2
3x2x
3x
y
3k
3x2x3x1x2x1x
2
3x2x
2
3x1x
2
2x1x
2
3x2x
2x
y
2k
3x2x3x1x2x1x
2
3x2x
2
3x1x
2
2x1x
2
3x2x
1x

y
1k
+



=
+



=
+



=

Khả năng sử dụng công cụ tơng quan tuyến tính nhièu chiều trong thực tế
nghiên cứu đợc gắn liền với việc ứng dụng MTĐT. Thí dụ chơng trình đợc lập
dới dạng ngôn ngữ ALGOL - 6.0 đã đợc dùng ở GGI để nghiên cứu quan hệ giữa
nhiều biến lợng đối với bài toán kéo dài các chuỗi thuỷ văn sang thời kỳ nhiều
năm. Để giải bài toàn này phải dựa vào các mối quan hệ thống kê của nhiều biến
lợng.
Với các chuỗi tài liệu đặc trng của chế độ thuỷ văn thờng thờng có độ dài
khác nhau và những năm không quan trắc đợc, chơng trình sẽ xét trớc bài toán
lợng thông tin gốc của tình hình bằng cách bổ sung vào chỗ không có tài liệu bằng
các số không. Chơng trình sẽ xét trớc việc tìm tự động những biến lợng độc lập
hiệu quả nhất và khôi phục theo các biến lợng đó những giá trị không quan tác
đợc.

6.4. ứng dụng phơng pháp tơng quan tuyến tính nhiều
chiều để kéo dài các chuỗi thuỷ văn ngắn sang thời kỳ
nhiều năm.
Chúng ta sẽ xét trình tự việc kéo dài các giá trị dòng chảy năm sang thời kỳ
nhiều năm của sông Kivir - trạm Miatuxôvô bằng cách sử dụng sông tơng tự là các
sông Vuokxy - trạm nhà máy thuỷ điện X (x
1
) và sông Nêva - trạm Pêtrôkrêpost
(x
2
)
Đối với sông Xvir - trạm Miatuxôvô có tài liệu quan trắc trong các thời đoạn
1881 - 1940 và 1945 - 1951. Để minh hoạ phơng pháp xây dựng phơng trình hồi
quy ta giả thiết rằng ở điểm này thông tin về dòng chảy năm chỉ có trong 20 năm
(1928 - 1940 và 1945 - 1951) đợc quan trắc đồng bộ trên ba sông nghiên cứu. Dựa
vào tài liệu quan trắc đồng bộ tròn 20 năm đó ta tìm các hệ số tơng quan của từng

355
đôi một: r
yx1
= 0,74; r
yx2
=0,88; r
x1x2
= 0,55. Trong trờng hợp này định thức (D) và
các định thức con của nó sẽ bằng:

1,055,0.88.0.74,0.230,077,055,01
155,088,0
55,0174,0

88,07,01
D =+==


.70,0,055,01
155,0
55,01
D
,47,0)88,055,0.74,0(
55,088,0
174,0
D
,26,0)55,5.88,074,0(
188,0
55,074,0
D
2
yy
2yx
1yx
===
===
===

Hệ số tơng quan tổng hợp bằng:

93,0
70,0
10,0
1

D
D
1R
yy
===

Việc tính toán trị bình quân và khoảng lệch trung bình bình phơng của
chuỗi gốc sẽ nhận đợc kết quả sau:

58,1;96,1;71,1
75,8x,79,9x,876,0y
2x1xy
21
===
=
==

Các hệ số hồi quy của phơng trình bằng:

73,0
70,0.58,1
47,0.71,1
k
32,0
70,0.96,1
26,0.71,1
k
2
1
==

==

Với những tài liệu gốc trên ta sẽ xây dựng phơng trình hồi quy dạng:

)xx(k)x1x(kyy
22211

+=

hay là f:
Y-8,76 = 0,32 (x
1
- 9,79) + 0,73 (x2 - 8,57)

356

×