Tải bản đầy đủ (.pdf) (61 trang)

Thủy văn học và phân tích vùng ngập lụt ( ĐH Quốc Gia Hà Nội ) - Chương 3 pot

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.89 MB, 61 trang )

chơng 3. phân tích tần suất


ảnh. Lũ lụt ở sông Trinity cạnh Dayton, Texas nawm 1990
3.1.
lời giới thiệu
Phạm vi nghiên cứu
Có nhiều các chu trình thuỷ văn phải đợc làm rõ và đợc giải thích theo xác suất
là do sự biến đổi ngẫu nhiên vốn có của nó. cho ví dụ không thể dự báo lu lợng và
lợng ma một cách chính xác dựa vào các số liệu trong quá khứ hay tơng lai do
không biết nguyên nhân cơ chế hoạt động của chúng. Rất may là phơng pháp thống kê
là rất phù hợp để cấu thành và biểu diễn chuỗi số liệu quan trắc thành một dạng mà có
thể nội suy và ớc lợng. Chơng này chỉ ra các phơng pháp ngẫu nhiên mà trong
thuỷ văn các số liệu có thể đợc xác định và biểu diễn trong một phuơng pháp thống kê
chuẩn.
163
Các biến cố ngẫu nhiên
Một biến cố ngẫu nhiên là một tham số (nh lu lợng, lợng ma, quá trình lu
lợng) nó có thể đợc dự báo một cách chính xác đó là, một biến cố ngẫu nhiên là kết
quả của một quá trình ngẫu nhiên. Một số biến cố có thể đợc xử lý bằng thống kê một
cách gián đoạn hay liên tục. Phần lớn các số liệu thuỷ văn là liên tục và đợc phân tích
xác suất bằng phân bố xác suất liên tục. Cho ví dụ, giá trị lu lợng trong biểu đồ hình
3.1a có thể bằng bất cứ một giá trị thực nào khi đo đạc bằng dụng cụ đo, đó là các số
liệu liên tục. Tuy nhiên chính bản thân các số liệu lại đợc biểu diễn một cách gián
đoạn là do các quá trình đo đạc. Các số liệu dòng chảy hàng ngày có thể đợc xác định
một cách xác thực nhất bằng lu lợng nớc m
3
/s. Dạng biểu diễn này của số liệu đợc
gọi là dạng gián đoạn - liên tục. Đó là các số liệu liên tục đợc quy thành gián đoạn.
Điều này cũng đợc minh hoạ trong hình 3.1(a), trong đó lu lợng đợc giả thiết dạng
m


3
/s gần nhất.
Các biến cố ngẫu nhiên gián đoạn có thể chỉ đợc lấy trên một lu vực nhất định
trong các giá trị rời rạc. Cho ví dụ, tung một đồng xu kết quả là mặt sấp hoặc ngửa sẽ
xuất hiện; tung một con súc sắc các giá trị xuất hiện từ 1 đến 6. Kết quả từ thùng đo
ma là các giá trị thuỷ văn đơn giản nh trong hình 3.1(b): nó có thể có hay không có
một đỉnh trong suốt khoảng thời gian.

Hình 3.1. Các số liệu liên tục và gián đoạn a) số liệu liên tục và gián đoạn b)số liệu gián đoạn. Kết
quả biểu đồ lấy từ thùng đo ma. Mỗi một đơn vị độ cao là 0.01 inch lợng ma.
164
Các số liệu gián đoạn - liên tục có thể đợc xử lý bằng gián đoạn. Thật vậy chúng
đợc gián đoạn hoá bất cứ lúc nào các bảng số liệu đợc sắp xếp trình tự, do các gía trị
này còn đợc cắt bớt. (Ví dụ nh giá trị gần nhất của 1 ft
3
/s lu lợng hay 0.1 inch
lợng ma). Tuy nhiên, việc phân tích các yếu tố tần suất này là rất thuận tiện do số
liệu tính toán lớn mà ta có thể xem xét. Cho ví dụ, nếu lu lợng dòng chảy đợc đo đạc
gần đúng nhất (ft
3
/s) trong khoảng từ 0 đến 5000 ft
3
/s thì phải tính toán 5000 khoảng
gián đoạn. Tơng ứng, các điểm liên tục sẽ dễ dàng hơn rất nhiều. Mặc dù các phân bố
tần suất rời rạc thỉnh thoảng đợc áp dụng cho các giá tị liên tục (ví dụ độ lớn lợng
ma của một trận ma), các ứng dụng chủ yếu của phân bố rời rạc trong thuỷ văn là
một biến cố ngẫu nhiên mà ở dạng số để đáp ứng một số tiêu chuẩn nhất định, ví dụ giá
trị lũ đợc mong đợi để vợt quá một độ lớn nhất định, trong thời kỳ nhiều năm.
biểu diễn số liệu
Số liệu gián đoạn - liên tục thờng đợc biểu diễn dới dạng biểu đồ hình cột hay

một đờng cong. Chiều cao và hình dạng chung của đờng cong là phù hợp với các đặc
trng số liệu và lựa chọn luật phân bố các số liệu một cách hợp lý, ví dụ có những phân
bố nên làm đối xứng hay có những phân bố nên chọn bất đối xứng. Sử dụng lu lợng
dòng chảy, ví dụ, giá trị lu lợng đợc phân chia thành từng lớp một và tơng ứng với
nó là một tần suất xuất hiện của lớp đó. Độ lớn của mỗi lớp nên đủ nhỏ làm sao các
thành phần số liệu có thể thấy đợc nhng cũng phải đủ lớn để cho các thành phần
không bị lẫn lộn. Giá trị đã sử dụng trong các lớp có thể thay đổi hình ảnh của số liệu
(Benjamin và Cornel, 1970). Giá trị này có thể không thuận tiện cho việc thay đổi nhiều
chơng trình tính toán, vì vậy các kỹ s có thể so sánh và đa ra một vài sự lựa chọn
khác nhau. Với sự trợ giúp của Panofsky và Brier, 1968 đã đa ra:
K = 5log
10
n (3.1)
ở đây K là số khoảng lớp và n là số giá trị. Khoảng lớp không phải là hằng số độ rộng.
Nếu không, thuận lợi cho việc nhóm các số liệu thành một nhóm lớn hơn, khoảng đợc
kết hợp.
Nửa tung độ của đồ thị đợc phân chia bởi toàn bộ số lần quan sát đợc, tần suất
tơng ứng (xác suất ) của mỗi một khoảng lớp, nh vậy tổng tung độ bằng 1.0 tạo nên
sự thay đổi phơng pháp đánh dấu số liệu. Cho đến cách thứ ba là dạng của một phân
bố tần suất luỹ tích, nó cho biết toàn bộ đờng cong phân bố tần suất tơng ứng trên
một khoảng nhất định và là xác suất mà một giá trị ở hoành độ là nhỏ hơn hoặc bằng
độ lớn ở mỗi điểm đó. Cả hai tần suất trên đều đợc dùng nhiều trong thuỷ văn và đợc
minh hoạ rõ nét nhất trong một số ví dụ .
Ví dụ 3.1
đồ thị tần suất
Số liệu lũ lớn nhất trong 31 năm đợc ghi lại tại Cypress Creek, gần Horton,
Texas, đợc trình bày trong bảng 3.1. Phơng trình 3.1 cho biết rằng có khoảng tơng
ứng 7 hay 8 lớp. ở đây là nó cho phép giới hạn tiêu chuẩn là 2000ft
3
/s (tiêu chuẩn này

quan trọng hơn những quy tắc đếm tay khác đôí với số khoảng lớp).
Tần suất, tần suất tơng ứng, tần suất luỹ tích cũng đợc xác định trong bảng và
165
biểu diễn trong hình 3.2 và 3.3. Ví dụ , trong hình 3.2 xác suất nằm trong khoảng 2000
và 4000 là 0.29. Từ đờng cong xác suất luỹ tích (hình 3.3), xác suất mà lu lợng nhỏ
hơn hoặc bằng 4000 ft
3
/s là 0.58. Chú ý rằng tổng của tần suất tơng ứng là 1.0 đợc
chỉ ra trong bảng 3.1 và tổng tung độ đợc biểu diễn trong hình 3.3.
Bảng 3.1 Bảng tính toán số liệu và tần suất ở Cypress Creek , gần Horton, Texas
Số liệu cha
sắp xếp
Số liệu đã
sắp xếp
Số liệu cha
sắp xếp
Số liệu đã
sắp xếp
Năm Q(m
3
/s) Stt Q(m
3
/s) Năm Q(m
3
/s) Stt Q(m
3
/s)
1945
1946
1947

1948
1949
1950
1951
1952
1953
1954
1955
1956
1957
1958
1959
1960
9840
5170
1620
235
15600
4740
427
3310
4400
7760
2520
340
5440
3000
3690
10300


1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
15600
10300
9840
7760
6560
6260
5440
5230
5170
4740
4710
4400
4300
3980

3690
3460

1961
1962
1963
1964
1965
1966
1967
1968
1969
1970
1971
1972
1973
1974
1975

6260
1360
1000
2770
1400
3210
1110
5230
4300
2820
1900

3980
6560
4710
3460
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
3310
3210
3000
2820
2770
2520
1900
1620
1400
1360
1110

1000
427
340
235

Khoảng lớp Giá trị trung bình Tần suất Tần suất tơng ứng Tần suất l/t
0 - 2000
2000 - 4000
4000 - 6000
6000 - 8000
8000 - 10000
10000 - 12000
12000 - 14000
14000 - 16000
1000
3000
5000
7000
9000
11000
13000
15000
9
9
7
3
1
1
0
1

0.29
0.29
0.23
0.10
0.03
0.00
0.03
0.03
0.29
0.58
0.81
0.91
0.94
0.97
0.97
1.00

31
=




166
Một cách gián đoạn hoá các số liệu lu lợng liên tục sẽ đợc quy định là một biến
cố ngẫu nhiên rời rạc cho mỗi một khoảng lớp. Bất kỳ một giá trị nào nằm trong một
lớp sẽ đợc quy định là giá trị rời rạc tơng ứng của các lớp đó, thông thờng điểm
trung bình hay điểm giữa của mỗi lớp. Trong trờng hợp này điểm giữa sẽ đợc điền
vào hoành độ (hình 3.4). Một giá trị tần suất tơng ứng là giá trị tần suất của lu lợng
3000 ft

3
/s là 0.29 (giá trị tơng đơng này đợc lấy dựa vào những hiện tợng đã biết
mà một biến cố ngẫu nhiên liên tục có thể có, không cần xác định chính xác bằng giá trị
cụ thể).
Đờng bất đối xứng lu lợng ở Cypress Creek đợc trình bày trong hình 3.2 và
3.4, đó là điểm cuối ở bên phải. Nó sẽ đợc xác định và lấy tơng đơng với sự thay đổi
phân bố trong nhiều trờng hợp khác.


Hình 3.2. Biểu đồ tần suất tơng ứng cho vùng Cypress Creek, gần Horton, Texas.


Hình 3.3. Biểu đồ tần suất luỹ tích cho vùng Cypress Creek.
167

Hình 3.4. Biểu đồ tần suất rời rạc của vùng Cypress Creek.
Những tần suất này bằng với hàm khối lợng xác suất rời rạc (PMF).
3.2.
Các khái niệm xác suất
Tiến hành một thí nghiệm với N kết quả đạt đợc, X
1
,X
2
,X
i
,X
N
. Các kết quả
này là độc lập, nếu không hai trong số đó có thể xảy ra cùng một lúc. Nó là số lần xuất
hiện các mặt, chúng đặc trng cho toàn bộ kết quả đạt đợc khi tiến hành thí nghiệm.

Xác suất của một biến cố X
i
có thể đợc xác định bằng số lần xuất hiện biến cố tơng
ứng trong rất nhiều phép thử. Xác suất này có thể đợc xác định bằng P(X
i
) = n
i
/n, ở
đây n
i
là số lần xuất hiện (xác suất ) của biến cố X
i
trong n phép thử. Tuy nhiên n
i
/n chỉ
là tần suất tơng ứng hoặc xác suất xảy ra của biến cố X
i
.
Một xác suất rời rạc là một xác suất đơn giản của một biến cố rời rạc. Nếu nh
một P(X
i
) nhất định bằng với xác suất của biến cố ngẫu nhiên X
i
, các điều kiện cho phép
tồn tại những xác suất rời rạc của những biến cố này khi xem xét các khoảng đơn giản
của toàn bộ kết quả đạt đợc:
0 < P(X
i
) < 1 (3.2)


. (3.3)

=
=
N
i
XiP
1
1)(
Xác suất hợp của hai biến cố độc lập là tổng xác suất của mỗi xác suất biến cố
thành phần:
P(X
1
X
2
) = P(X
1
) + P(X
2
) (3.4)
Hai biến cố X
1
và Y
1
đợc gọi là độc lập, nếu việc xảy ra biến cố này không ảnh
168
hởng đến sự xuất hiện biến cố kia. Xác suất giao (cả hai cùng xảy ra đợc ký hiệu )
của hai biến cố độc lập là tích của chúng:
P(X
1

Y
1
) = P(X
1
). P(Y
1
). (3.5)
Đối với các biến cố phụ thuộc lẫn nhau:
P(X
1
Y
1
) = P(X
1
) + P(Y
1
) - P(X
1
Y
1
). (3.6)
Xác suất điều kiện của X
1
khi biến cố Y
1
đã xảy ra là:
P(X
1
/Y
1

) = P(X
1
Y
1
)/ P(Y
1
) . (3.7)
Nếu biến cố X
1
và Y
1
là độc lập thì kết hợp 2 phơng trình 3.5 và 3.7 trở thành:
P(X
1
/Y
1
) = P(X
1
).P(Y
1
)/P(Y
1
) =P(X
1
). (3.8)
Những khái niệm này thờng đợc minh hoạ trong biểu đồ Venn (Hình 3.5) trên
đó diện tích là xác suất, với tổng diện tích tong ứng thì xác suất bằng 1.0, hay 100%.


Hình 3.5. Biểu đồ Venn minh hoạ xác suất


Ví dụ 3.2
Các xác suất có điều kiện
Lấy biến cố Y
1
là điều kiện mà lợng ma xảy ra trong một ngày nhất định và
biến cố X
1
là điều kiện mà chớp quan sát đựơc trong một ngày nhất định. Cho xác suất
của những biến cố này:
P(X
1
) = 0.3 (xác suất chớp là 30%)
P(Y
1
) = 0.1 (xác suất ma là 10% )
P(X
1
/Y
1
) = 0.5 (nếu có chớp xuất hiện thì ma là 50% )
Tính xác suất cả ma và chớp cùng xảy ra (là xác suất của X
1
và Y
1
)?
Từ phơng trình 3.7:
P(X
1
Y

1
) = P(Y
1
/X
1
).P(X
1
) = 0.15.
Nếu là độc lập với P(Y
1
/X
1
) = P(Y
1
) = 0.03.
Xác suất của các biến cố độc lập cùng xảy ra luôn luôn nếu chúng là phụ thuộc.

169
3.3.
Các biến cố ngẫu nhiên và các luật phân bố xác suất
Các biến cố ngẫu nhiên và biến cố rời rạc
Tính chất của các biến cố ngẫu nhiên có thể đựơc miêu tả bởi quy luật phân bố
xác suất của nó. Mỗi một kết quả đạt đợc trong một phép thử đựoc quy định là số giá
trị phụ thuộc vào hàm khối lợng xác suất rời rạc (PMF) hay hàm mật độ xác suất liên
tục (PDF). Trong thuỷ văn, các biến cố ngẫu nhiên rời rạc đợc sử dụng rất rộng rãi để
biểu diễn số trờng hợp xảy ra mà phù hợp vơí một tiêu chuẩn nhất định. Ví dụ, giá trị
lũ vợt quá giá trị cụ thể cho trớc, lợng ma xảy ra tại một nơi nhất định, Các ví
dụ trong chơng này đều thuộc loại này. Nh một quy tắc, các biến cố ngẫu nhiên rời
rạc đợc liên kết chỉ với các tham số mà có thể chỉ là các số nguyên. Tuy nhiên có thể
nhóm các biến cố ngẫu nhiên liên tục thành các số nguyên gần đúng nhất hay các giá

trị nguyên bỏ dấu phẩy. Cho ví dụ, lợng ma 2.18 inch thay là lợng ma 218 inch.
Đôi khi biến đổi để xử lý một biến cố liên tục thành dạng rời rạc, nh lu lợng
rời rạc trong hình 3.4. Hãy chú ý P(x
1
) có nghĩa là xác suất mà biến cố ngẫu nhiên rời
rạc X lấy từ giá trị x
1.
Biểu diễn lại lu lợng x "rời rạc ", chúng ta có thể lấy xác suất
tơng ứng trong hình 3.4:
P(1000) = 0.29, P(9000) = 0.03
P(3000) = 0.29, P(11000) = 0.03
P(5000) = 0.23, P(13000) = 0.0
P(7000) = 0.10, P(15000) = 0.03




=
bxa
xPbxaP )()(
(3.9)
Chú ý rằng các giá trị này phù hợp với xác suất tuyệt đối của phơng trình 3.2 và
3.3. Hơn nữa các xác suất là rời rạc.
Hàm phân bố luỹ tích (CDF) đợc xác định là:
Từ các giá trị trong bảng trên, F(7000) = 29+29 + 23 +10 =91%.




==

XXi
XiPxXPxF )()()(
(3.10)
Các biến cố ngẫu nhiên liên tục thờng đợc sử dụng để biểu diễn các yếu tố
thuỷ văn nh lu lợng, thể tích, độ sâu, và thời gian. Các giá trị này không phải
chuyển về dạng nguyên, mặc dù các biến cố liên tục có thể nhóm thành dạng nguyên.
Cho một biến cố ngẫu nhiên liên tục, phần diện tích dới hàm mật độ phân bố xác suất
f(x) nh sau (xem hình 3.6):
P(x
1
< x < x
2
) = (3.11)

2
1
)(
x
x
dxxf
và phần diện tích dới PDF bằng 1.0:

(3.12)



= 0.1)( dxxf
170
Bản thân CDF không phải là một xác suất và có thứ nguyên nghịch đảo với thứ
nguyên của X, ví dụ nh ft3/s

-1
. Tuy nhiên, không giống với các nhà tính toán, nó
không tuân theo các đơn vị thờng dùng của PDF. Trong thực tế, các giá trị của PDF
rất ít khi dùng đến. Mặt khác nó là hàm mật độ luỹ tích (CDF) và rất quan trọng vì nó
là xác suất CDF, liên tục đợc xác định giống với các thành phần rời rạc của nó:


Hình 3.6 .Hàm mật độ xác suất liên tục



)1(xF

==
1
)()1(
X
dxxfxxP
(3.13)
giá trị nằm trong khoảng: các
0.1)(0


Xf



(3.14)

)1()()( xlFxFxxxP

221

=


(3.15)
DF và CDF đợc lấy tơng ứng với phơng trình (3.13) nghịch đảo :

P
)(
)(
xf
dx
xdF
=
.
Biểu đồ trong hình 3.2 có thể đợc biểu diễn bằng PDF liên tục nếu các tần suất
tơng ứng đợc tạo ra từ các khoảng lớp nhỏ hơn x. Phần diện tích dới biểu đồ là 1.0.
Cho ví dụ , nếu tung độ của biểu đồ tần suất tơng ứng trong hình 3.2 có khoảng chia là
2000 ft
3
/s, tơng ứng với một PDF. Nó minh hoạ cho những PDF có thể có hình dạng cố
định và dạng giá trị đơn, chúng không cần giống hình dạng đòng cong trơn. Biểu đồ
này có phân bố hỗn hợp, trong đó các xác suất rời rạc biểu diễn xác suất mà một biến cố
lấy một giá trị rời rạc cụ thể, trong khi một PDF liên tục cho biết đỉnh của các giá trị
với m
khó khăn bởi vì ngời
ta thờng bắt chớc hình dạng của biểu đồ tần suất (hình 3.2) các PDF phần lớn sử
ột diện tích bằng 1,0 ngoại trừ các hàm xác suất rời rạc. Để ví dụ, một phân bố
hỗn hợp đựoc biểu diễn trong hình 3.7 trong đó xác suất là 0.15 tại lu lợng bằng 0.0.

Chọn một phân bố liên tục PDF để biểu diễn các số liệu là
171
dụng các biến cố thuỷ văn sẽ đựoc trình bày trong phần sau đây.

Hình 3.7. c (PMF)
cho F)
(độ lớn diện tích = 0.85) đối với xác suất có giá trị lớn hơn 0.
Các
ham số phân bố. Chính bản thân
các m
Cho một phân bố rời rạc, moment gốc bậc N có hể đợc xác định nh sau.

xPx
à
(3.17)
Và đối với các phân bố liên tục nh sau:
N
rị trung vị, trung bình hay giá trị kỳ vọng, đợc tính
ằng E() đối với kỳ vọng nh sau:

(3.19)
à

là một tham số vị trí vì
nó ch
Luật phân bố tần suất rời rạc. Sử dụng các hàm phân bố xác suất rời rạ
xác suất có giá trị = 0 và các hàm mật độ xác suất liên tục (PD
moment của một phân bố
Khái niệm moment là một thuật ngữ cơ học. Một PMF hoặc PDF là một dạng
hàm trong đó các moment có quan hệ với các tham số của nó. Tuy nhiên, nếu các

moment có thể tìm đợc thì cũng có thể tìm thấy các t
oment cũng cho biết hình dạng của các phân bố.
t

= )('
i
N
iN


= dxxfx
N
)(
'
à
(3.18)
Moment gốc bậc một là giá t


b
rạc) rời PMF (cho



= )()(
ii
xpxxE
à
v
)tục nliê PDF (cho



= )()(
ii
xfxxE
à
(3.20)
Trung vị là một giá trị đợc lấy ở giữa hay cũng đựoc gọi

o biết vị trí trục quay x số lớn của phân bố đợc thiết lập.
Thông thờng luật phân bố của một biến cố sẽ đợc tìm và thông tin về các biến
cố quan hệ sẽ đợc cung cấp. Để ví dụ, phân bố của lu lợng dòng chảy có thể đợc
biết và cho biết thông tin về trạm đó, đó là một hàm của lu lợng. Giá trị kỳ vọng của
172
h guyên àm g(x) đối với biến cố ngẫu nhiên x có thể đợc xác định theo công thức căn n
của x.
ii
xfxg
(3.21)
khi x là biến cố ngẫu nhiên rời rạc, và
= dxxfxgx )()()] (3.22)
hi x là biến cố ngẫu nhiên liên tục.
ỳ vọng là một hàm tuyến tính, nếu
E(a) = a (3.23)

.25)
Các moment gốc bậc cao hơn của luật phân bố th
tế, các moment trung tâm của giá trị trung bình đợc xác định theo PMF rời rạc là:
(3.26)
và đối với PDF liên tục:

iá trị
rung bình của x đợc đa lên mũ N, trong đó moment trung
trung tâm bậc hai đợc gọi là phong sai và đóng vai trò rất qu
dxxfxxE
i
)()(])[(
22
àà
(3.28)
cho các biến cố ngẫu nhiên liên tục
bình bậc hai, nó biểu diễn độ lớn hay
hoảng rộng của phân b ộ h uẩn




= )()())

(( xgE




gE ([
k
K a, b là hằng số.

E(bx) = bE(x) (3.24)
E(a + bx) = a + bE(x) (3
òng không sử dụng. Trong thực

)()(
i
N
iN
xpx
àà
=








= dxxfx
N
)()(
àà
N
(3.27)
Những moment này thờng là các giá trị kỳ vọng của khoảng lệch khỏi g
t tâm bậc nhất bằng 0.
Moment an trọng.



=

=xVar )(

2






== dxxfxxExVar )()(])[()(
222
àà
(3.29)
Phơng sai là độ lệch khỏi giá trị trung


,
k ố . Một đơn vị t ơng đơng là đ lệc ch
nó đơn giản là
ai bậc hai. Từ công thứ : phơng s c của kỳ vọng
Var(x) = E[(x -
à
) ] = E[x - 2x
à
à
22 2
+ ]
= E[x
2
] - E[2
à
à

2
x]+E[ ]
= E[x
2
] - 2
à
à
à
2
+
à
22

E[x]+ = E[x ]
2
- 2 ]

à
=E[x
]-
2 2

E[x =
Phơng sai không phải là mộ
Var(bx) = b
2
Var(x) (3.32)

2
]-[E(x)]

2
(3.30)
t biến đổi tuyến tính. Ta có các quan hệ sau:
Var(a) = 0 (3.31)

Var(a+bx) = b
2
Var(x) (3.33)
ở đây a,b là các hằng số
173
Các moment bậc cao hơn có thể đợc xác
trong thuỷ văn là bất đối xứng, nó là moment trung tâm bậc 3 và đợc đơn giản hoá
bằng
định nếu cần thiết, nhng thờng dùng
độ lệch trung bình mũ 3.


3
à
g

3

Độ lệch phải hay lệch trái giá trị trung bình là tham số hình dạng và đợc biểu
diễn tong hình 3.8. Nếu nh phân bố là đối xứn
(3.34)
g thì hệ số bất đối xứng bằng 0.
Đôi khi nó đợc sử dụng để làm đơn giản h
số phơng sai đợc xác định theo tỷ lệ độ lệch khỏi giá trị trung bình, hay nó có thể
đợc sử dụng cho mục đích tính CV.


oá việc tính toán mức độ phân bố. Hệ

à

/
=
CV
(3.35)

Hình 3.8. ảnh hởng của hệ số bất đối xứng đối với hàm mật độ xác suất (PDF)
ị, và đỉnh (của Haan 1977, Hình 3.3)
ông của phân bố. Giá trị này
của x
ân bố sẽ đợc xác định cho mỗi một phân bố khi
xem xét. Các mối quan hệ cho biết một phơng pháp đơn giản của việc xác định các
ã biết. Với mục đích đó việc xác định các
mome
và các vị trí tơng ứng của giá trị số đông, trung v
Một giá trị tính tại giã đờng cong là trung vị x
m,
nó không phải là moment
nhng đúng hơn giá trị của x mà CDF bằng 0.5:
F(x
m
) = 0.5 (3.36)
Các tham số khác không phải là moment nh số đ
ở PDF (hoặc PMF) là một điểm cực đại. Các quan hệ giữa giá trị trung bình,
trung vị và số đông cũng đợc minh hoạ trong hình 3.8. Các phân bố chủ yếu là một
phơng thức (phân bố hỗn hợp của hình 3.7 là nhị thức).

Các moment và các tham số đợc trình bày trong phần này để xem xét quy luật
phân bố xác suất và có thể lấy để phân tích. Các dạng hàm nh PMF hay PDF có thể
đợc thay thành dạng tổng hay dạng tích phân và các moment đã xác định từ các thành
phần của các tham số trong phân bố. Nó không đợc minh hoạ ở đây do mối quan hệ
giữa các moment và các tham số ph
tham số phân bố nếu nh các moment đ
nt phải đợc lấy từ các số liệu.
Ước lợng moment từ các số liệu
Cho các gía trị tham số của phân bố, nó là một chuỗi x
1
, x
2
,, x
n
của các biến
ngẫu nhiên phụ thuộc vào việc cho PMF hay PDF. Các chuỗi có độ dài xác định sẽ xây
dựng một cách phổ biến toàn bộ các biến cố ngẫu nhiên dựa vào PDF hay PMF đã cho
với các tham số nhất định. Tơng tự có thể xác định các tham số từ các moment do
chúng có quan hệ với nhau, nh xem xét ở trên (và đợc xử lý lại cho phù hợp). Các số
liệu thuỷ văn đo đạc thờng đợc tạo ra từ các quá trình vật lý hỗn hợp(ví dụ dòng chảy
174
có thể đợc tạo ra từ ma hay tuyết tan), vì vậy có thể kết hợp nhiều phân bố xác suất.
Trong đó các số liệu quan sát là đối tợng nghiên cứu để thấy sự khác nhau của nó với
giá trị thực và tìm ra một phân bố phù hợp. Do đó, các giá trị của các moment đã tính
từ các số liệu sẽ đợc sử dụng để tính ngợc trở lại những giá trị cha biết. Tuy nhiên
ớc lợng của chúng có thể xác định nhanh chóng tữ các số liệu, nh
ới đây đối với 3 tham số moment chủ yếu trong thuỷ văn. Nếu s
nhiên
các trình bày ở
d ố các biến cố ngẫu

là n, ớc lợng trị trung bình là:



=
đối tợng để thấy sự sai khác trong việc ớc lợng
chúng. Ước lợng không có sai số là giá trị kỳ vọng và bằng giá trị số đông. Nó có thể
đợc trình bày (Benjamin và Cornel, 1970 ) nh
==
n
i
i
x
n
x
1
1
~
à
(3.37)
Các moment bậc cao hơn là các

à
=
)(xE
khi cần thiết. Cho phơng
ai và ớc lợng không chính xác là: s
,
1
1

2
2
1


=



)(
1
222
=

=
xxS
n
i

1 đến n ), trong đó cho nhiều giá trị, mẫu n phần lớn cũng đợc ớc lợng
tơng
Do việc ớc lợng của các moment là một hàm của các biến cố ngẫu nhiên, chính
ản thân chúng cũng là các biến cố ngẫu nhiên. Phơ
đợc
n
xnx
n
i
i
(3.38)

ở đây mẫu số n-1 (thực chất là n) để giảm bớt sai số (ngoại trừ các trờng hợp khác,
cộng tất cả từ
tự, và cả 2 mẫu này đều có thể đợc tìm trong đó, mặc dù các ớc lợng chính, sai
số thờng đợc chú ý hơn trong tính toán. Dạng thứ hai của phơng trình 3.38 đợc a
chuộng hơn.
b ng sai của giá trị trung bình cũng
xác định nh sau:


S
SxVar
x
x
2
2
)( = (3.39)
n
àn bộ các moment.
Độ lệch là hàm đặc biệt do nó bao gồm tổng khoảng lệch khỏi giá trị trung bình
à là sai số lớn hơn khi xác định chúng (giá trị của nó). Mộ
số là:
Tuy vậy, nếu phơng sai của giá trị trung bình đợc coi là sai số đo đạc trong việc
ớc lợng giá trị trung bình, nó đợc tạo nên khi chuỗi tăng, điều này đúng khi xác
định to
v t ớc lợng xấp xỉ giảm sai
3
3
)(
.
)2)(1(


1
x
i
S
S
xx
nn
n
gC



=
(3.40)

Với S
x
2
đợc cho bởi phơng trình 3.38. không dễ để lấy xấp xỉ làm giảm sai số
dựa v
cong phân bố Pearson - 3 (phần 3.5)
nhn
ào các hàm phân bố (Bodee và Robitaille, 1975), nhng lấy xấp xỉ C
S1
là phù hợp
để ứng dụng trong thuỷ văn (Tasker và Stedinger, 1986) là
C
S2
= (1 + 6/n).C

S1
(3.41)
Công thức này chính xác để ứng dụng đờng
g cũng thoả mãn các phân bố khác khi C
S1
đợc xử lý. Ước lợng bất đối xứng đã
tính toán sử dụng phơng trình 3.41 đợc gọi là khoảng ớc lợng, có nghĩa là việc ớc
lợng toàn bộ số liệu tại trạm đo mà ta quan tâm.
175
Các sai số và các lỗi trong khi ớc lợng các hệ số bất đối x khi số ứng tăng lên
đây W là nhân tố trọng lợng, C
S
là hệ số bất đối ã tính bằng việc sử dụng các
số liệu đơn giản, và C
m
là hình dạng bất đối xứng, nó đợc xác định dựa vào bản đồ nh
trong
trạm đo n giảm xuống. Các số liệu về nớc ở Hội đồng t vấn Thuỷ lợi là rất phù hợp
cho việc xác định hệ số bất đối xứng, C
w
, dựa vào phơng trình:
C
w
= WCS + (1 - W)C
m
(3.42)

xứng đ
hình 3.9. Nhân tố trọng lợng W đợc tính toán làm giảm sai số của C
W

, ở đây

)()(
)(
mS
m
CVCV
CV
W
+
=


Để xác định W đòi hỏi phải biết phơng sai của C
m
[V(C
m
)] và phơng sai của
C
S
[V(C
S
)]. V(C
m
) đợc xác định từ biểu đồ của hệ số bất đối xứng ở nớc Mỹ bằng
0.3025. Đa W vào phơng trình (3.42) bất đối xứng C
w
đợc viết nh sau

)()(

)()(
Sm
mSSm
w
CVCV
CCVCCV
C
+
+
=



Hình 3.9 .Tạo ra các hệ số bất đối xứng theo dạng loga của dòng chaỷ hàng năm lớn nhất.
(từ số liệu năm 1982 ở Hội đồng t vấn thuỷ lợi).
loga Pearson 3 của các biến ngẫu
hể đợc tính từ kết quả của Monte Carlo, hệ số kinh nghiệm Wallis, Matalas,
và Slack năm 1974. Chúng đợc biểu diễn nh sau:
V(C
S
)=10
A-Blog
10
(n/10)
rong đó
Sai số của bất đối xứng C
S
đối với đờng cong
nhiên có t
t

176
50.155.0

50.126.094.0
>=
=
S
C nếu
C nếu
B
CB
SS

ở đây C
90
>
S
C ếu
đối xứng) và n là số năm.
Đối với các vùng thuỷ văn đô thị ăn để ớc lợng các moment do dòng
chảy tăng theo thời gian. Do đó phân bố tần suất có thể không ổn định (thay đổi theo
thời gian). Tơng tự, các mô hình đã trình bày trong chơng 5 và 6, có thể đợc sử dụng
để phát triển c g một thời kỳ
phát triển n
30.052.0
9008.033.0
+=
+=
n
nếu

CA
CCA
S
SS
S
là giá trị tuyệt đối của hệ số bất đối xứng cố định (đợc sử dụng nh một ớc
lợng của số đông bất
, rất khó kh
ác phân bố xác suất cho dòng chảy trong vùng đô thị tron
hất định.
Ví dụ 3.3
Các moment của chuỗi số liệu cực đại hàng năm
Chuỗi số liệu 31 năm của lu lợng lớn nhất hàng năm ở miền Nam Cpress Creek
của H g bảng 3.2. Xác định giá trị trung bình, độ
) tơng ứng bằng việc sử dụng phơng
rình 3.37 và 3.38. So sánh sự khác nhau giữa các ớc lợng bất đối xứng.
Các kết quả c h sau:

Số liệu gốc Số liệu loga cơ số 10
orton, Texas, đợc trình bày lại tron
của số liệu gốc và giá trị log (cơ số 10lệch chuẩn,
t
giải
ho các giá trị n

Trung vị 4144 3.463
Độ lệch chuẩn 3311 0.424
Hệ số lệch CS1 (3.40) 1.659 -0.936
Hệ số lệch CS2(3.41) 1.981 -0.117
Hệ số bất đối xứng (3.42) 0.7


Khi xem xét số liệu loga cơ số 10 ta sử dụng vùng số liệu trong hình 3.9 cho thấy
C
m
= - 0.3 ở Horton. Trung bình trọng lợng sử dụng phơng trình 3.42 cho thấy ớc
ợng thay đổi là - 0.7, thậm chí nhỏ hơn cả giá trị cho bởi phơng trình 3.41. Các giá
hể đ orton. Với những mục đích
ụ trong phần này, giá trị - 0. ụng (phơng trình 3.41).
Cho chuỗi s 42, C
m
= -0.3
và trị a C
S
= 1.117, do đó:
à V(C
s
) = 10
A-Blog
10
(n/10)
= 0.313 và V(C
m
) = 0.303 từ bản đồ
Cuối cùng
l
trị thay đổi gần hơn có t ợc xác định các trạm khác ở H
của các ví d 117 có thể đợc sử d
ố liệu tại Cpress Creek ở Horton sử dụng phơng trình 3.
tuyệt đối củ
A = -0.52 + 0.3(1.117) = - 0.185

B = 0.94 - 0.26(1.117) = 0.65
v
177
W = 0.303/(0.313 + 0.303) = 0.492 và 1 - W = 0.508
và C
w
= 0.492 (- 0.117) + 0.508(- 0.3) = -0.70

Làm trơn phân bố chuỗi số liệu
ột khả năng sử dụng các ớc lợng moment để điền các số liệu vào phân bố xác
suất từ các số liệu trong hàm phân bố. Ví dụ, luật phân bố chuẩn có các tham số trung
vị
M
à
và phơng sai
2

. Phơng pháp moment làm cho phân bố chuẩn trở nên đơn giản
để sử dụng các ớc lợng trung vị và phơng sai. Hơn nữa, tham số
của phân bố kinh
nghiệm đợc coi nh trung vị của phân bố. Tuy nhiên, ở phơng pháp moment đặt


=1/
à

. Phơng pháp biểu đồ và phơng pháp thích hợp tối đa là hai phơng pháp tạo
nên phơng pháp phân bố moment. Phơng pháp biểu đồ đợc trình bày trong phần
3.6. Mặc dầu phơng pháp thích hợp tối đa là phơng pháp cao hơn phơng pháp
moment về phơng diện thống kê, tính toán nhiều hơn và phức tạp hơn phơng pháp

oment nhng nằm ngoài phạm vi của phần n
ợc sử dụng trong thuỷ văn đã đ
m ày. Phơng pháp thích hợp tối đa cho
một vài phân bố đ ợc Kite trình bày (1977). Đối tợng
xác định các tham số trong phân bố là xác định CDF của nó. Trong một số trờng hợp,
tuy mục đích giống nhau có thể thực hiện mà không cần tính toán chính xác các tham
số của phân bố. Thực chất, phân bố đã sử dụng nhân tố tần suất K, cụ thể nh sau:

x
S
x
x
K

=
(3.43)
K là một hàm phụ thuộc vào CDF và là một hàm của bất đối xứng. Tuy nhiên, nếu nh
nhờ giá trị hệ số bất đối xứng và gía trị CDF, giá trị tơng ứng của x có thể
cũng đợc tính toán. Các nhân tố tần suất sẽ đợc trình bày trong phần sau khi xem
xét một vài phân bố cụ thể.
3.4.
K đợc biết
thời kỳ lặp lại và thời khoảng tái diễn
Phần lớn các giá trị trung bình đã sử dụng trong thuỷ văn cho biết xác suất của
một hiện tợng đợc quy định là thời kỳ lặp lại hay thời khoảng tái diễn của hiện
tợng. Thời kỳ lặp lại đợc xác định nh sau: Mỗi một giá trị cực đại hàng năm lớn
nhất có một thời kỳ lặp T năm nếu nh độ lớn của nó lớn hơn hoặc bằng giá trị trung
bình T năm. Xác suất lớn hơn trong thời kỳ T năm đó là xác suất mà hiện tợng xảy ra
lớn hơn hoặc bằng giá trị của bất kỳ một năm naò. Do đó, dòng chảy lũ 50 năm có xác
suất 0

độc lập).
.02, hay 2%, nó bằng hoặc lớn hơn bất kỳ giá trị lũ của một năm riêng biệt nào.
Nó là điều kiện để thấy đợc biểu hiện của thời kỳ trớc và không chính xác với thời kỳ
sau của một hiện tợng. Thực chất, ta chấp nhận đó là giá trị trung bình tức là có
khoảng 20 con lũ trong 50 năm trong khoảng 1000 năm. Có thể hai con lũ trong 50
năm trong một dãy (với xác suất 0.02*0.02=0.0004 cho các hiện tợng xảy ra
178
Khái niệm của thời kỳ lặp lại đòi hỏi các hiện tợng phải xảy ra độc lập và luôn
đợc tìm bằng việc phân tích chuỗi số liệu dòng chảy lớn nhất hàng năm (hay lợng
ma ). Hiện tợng lớn nhất trong một năm đợc coi là độc lập với các hiện tợng lớn
nhất tr ất kỳ há n dụ ợng
lớn nhấ lập trong ời kỳ n năm xét năm chúng xảy r
Bảng 3 ment của d ảy lũ hàng nă Cpress Cre orton, Texas 45-1975.
Dòng
3
/s) Log
10
hảy Dòn Log d y TB
ong b một năm nào k c. Nhng nó cũ g có thể ứng ng cho n hiện t
t độc một th , không mà a.
.2. Mo òng ch m của ek ở H năm 19

Năm chảy (m
dòng c g chảy TB òng chả
1945 9,840 3.993 5,696 0.530
1946 5,170 3.713 1,026
1
-3,909
1
3

-1,624
-2,784
-2,744
1,086
-
-2,244
-164 0.137
2,416 0.354
566 0.2
684 0.076
0.25 1
1947 ,620 3.2 10 -2,524 -0.253
1948 235 2.37 1 -1.092
1949 15,600 4.193 1,456 0.730
1950 4,740 3.676 596 0.213
1951 427 2.630 -3,717 832
1952 ,310 3.520 -834 0.057
1953 4,400 3.643 256 0.18 1
1954 7,760 3.890 3,616 0.427
1955 2,520 3.401 06 1
1956 340 2.53 1 -3,804 93 1
1957 5,440 3.736 1,296 0.273
1958 3,000 3.477 -1144 0.014
1959 3,690 3.567 -454 0.104
1960 10,300 4.0 13 6,156 0.550
1961 6,260 3.797 2,116 0.334
1962 1,360 3.134 329
1963 1,000 3.000 -3144 463
1964 2,770 3.442
-1,374 020

1965 1,400 3.146 3 17
1966 3,210 3.507 -934 0.044
1967 1,110 3.045 -3,034 4 17
1968 5,230 3.7 19 0.256
1969 4,300 3.633 156 0.17 1
1970 2,820 3.450
1,324 0 13
1971 1,900 3.279 184
1972 3,980 3.600
1973 6,560 3.8 17
1974 4,710 3.673 10
1975 3,460 3.539
179
Trung bình 4.144 3.463 0 0
Tổng 128.462 107.345 0 0
CS1 1.659 -0.936
CS2 1.981 -1.117
Trong trờng hợp này, nếu nh hiện tợng thứ hai lớn nhất trong một năm lớn
hơn hiện tợng lớn nhất trong bất kỳ năm khác nó có thể đợc sử dụng trong phân tích
tần suất. Chuỗi n giá trị lớn nhất này (độc lập) đợc gọi là chuỗi vựơt trung bình, nh
chuỗi lớn nhất hàng năm. Cả hai chuỗi đều đợc sử dụng trong thuỷ văn với sai số nhỏ
rong thời kỳ nhiều năm (hiện tợng hiếm). Có rất nh
ợng độc lập tuyệt đối khi sử dụng giá trị vợt trung bình
u kỳ lặp nhỏ hơn thời kỳ cuả giá trị lớn
ợt trung bình T
e

iá trị lớn nhất hàng năm T
m
là (Chow, 1964):


t iều mặt giống nhau của các hiện
t nhiều năm, nhng đối với
chu kỳ lặp ngắn giá trị vợt trung bình có ch
nhất hàng năm. Các quan hệ giữa các chu kỳ lặp dựa vào giá trị v
g
)1ln(ln
1

=
mm
e
TT
T
(3.44)
Quan hệ này

đợc trình bày trong hình 3.10.
Ví dụ 3.4
Giá trị vợ ng rị cực đ i hàng năm
Xem biểu số liệu lu ợng dòng chảy sô òi sau
N B ợng đ lớn nhấ /s)
t tru bình và giá t ạ
l ng ng :
ăm a lu l ộc lập t (m
3
1 700 300 150
2 900 600 100
4 850 650 350
5

3 550 400 200
500 350 100

Tần suất của giá trị vợt trung b cực đại h sau:

C Lớn nhất hàng năm Vợt trung bình
ình và gía trị àng năm nh
ấp
1 900 900
2 850 850
3 700 700
4 550 650
5 500 600

Một lựa chọn khác là sử dụng toàn bộ số liệu trong quá khứ, chúng có thể độc lập
hay không độc lập. Nó đợc gọi là chuỗi tổng hợp, một ví dụ chuỗi dòng chảy 365 ngày
180
(từ đó
ích không thể lấy trực tiếp từ số liệu trong chu kỳ lặp,
do các giá trị trong chuỗi số liệu hỗn hợp không nhất thiết độc lập.
Các chu kỳ lặp có thể đợc quy định thành các hiện tợng nhỏ nhất (nh mùa
kiệt) trong một dạng giống nhau với phép nội suy lớn hơn hay bằng giá trị trung bình.
Tuy dòng chảy lũ 20-năm có xác suất 5% mà lu lợng nhỏ hơn hoặc bằng một giá trị
cho trớc trong bất kỳ năm nào.
giá trị vợt trung bình và giá trị lớn nhất đợc tìm). Thông tin về tần suất đợc
lấy từ chuỗi tổng hợp thờng đợc biểu diễn trong đờng cong quan hệ lu lợng - thời
gian (Seacy, 1959). Nó là các điểm độ lớn có thể lớn hơn hoặc bằng tỷ lệ thời gian - độ
lớn. Các thông tin từ phép phân t

Hình 3.10. Đờng cong biểu diễn quan hệ chu kỳ lặp với giá trị trung bình

và giá trị cực đại hàng năm (theo phơng trình 3.44)
Cuối cùng chu kỳ lặp không cần phải giới hạn theo đơn vị năm. Các hiện tợng là
độc lập, các tháng hay các tuần có thể đợc sử dụng. Lu lợng 6 tháng tuy có xác suất
là 1/6 bằng hay lớn hơn bất kỳ một tháng nào đó trong năm.
3.5
Các mô hình phân bố xác suất cơ bản
Chủ quan và khách quan
Có rất nhiều hàm phân bố xác suất rời rạc và hàm mật độ xác suất liên tục đợc
sử dụng trong thuỷ văn nhng trong phần này chỉ nghiên cứu một vài dạng phổ biến
nhất. Các loại khác chỉ tham khảo trong các hợp phần thống kê thuỷ văn nh Gumbel
(1958), Chow(1964), Benjamin và Cornel, 1970 , Haan (1977), Kite (1977). Rất khó
khăn để có thể làm giảm số phân bố liên tục bởi vì ít nhất có đến 10 hàm đợc chọn để
181
áp dụng đối với một lu lợng lũ. Tuy vậy, các phân bố chủ yếu là phân bố chuẩn, phân
bố Gamma (Pearson-3), phân bố loga, phân bố log-Gamma (log-Pearson 3) và Gumbel
(giá trị cực đại loại I). Thêm nữa, phân bố mũ cũng đợc nghiên cứu do tính chất đơn
giản và những ứng dụng trong nhiều thời kỳ liên tiếp cuả nó.
Mục đích nghiên cứu của các phân tích rời rạc thờng giả định xác suất xảy ra
của mỗi hiện tợng, còn phân tích liên tục thờng là xác định độ lớn xác suất của mỗi
ân tích rời rạc, ở đây có thể đợc xem xét trong cả PMF và
CDF, nh
một tần suất của các hiện tợng độc lập mà mỗi
kết q
Xác suất mà có giá trị x đúng và n-x là sai phả
c lập: P
x
(1-P)
n-x
. Nhng điều này cho biết tần suất có khả năng x đúng
Tất cả


hiện tợng xảy ra. Đối với ph
ng giá trị của phân tích liên tục trong PDF là ít khi đợc chú ý, chỉ cần xác
định các biến cố ngẫu nhiên liên tục trong CDF. Sự khác nhau này sẽ đợc thấy khi
xem xét các phân bố khác nhau đợc trình bày dới đây
Luật phân bố nhị thức
Nó rất thông dụng để xem xét
uả của mỗi hiện tợng có thể đúng hay sai, ví dụ con lũ T năm có thể xảy ra hay
không xảy ra. Theo Bernoulli, các phép thử độc lập cho xác suất đúng của mỗi một lần
thử là một hằng số P. Phân bố nhị thức trả lời câu hỏi, xác suất chính xác của n phép
thử Bernoulli là bao nhiêu? Trong bài này chỉ nghiên cứu các phân bố là độc lập đợc
sử dụng rất phổ biến trong thuỷ văn.
i đợc tạo ra từ n hiện tợng xảy ra
độ
và n-x là sai,
tần suất này phải đợc xem xét, bao gồm trong đó cả những hiện tợng xảy ra và
không xảy ra liên tục. Các cách có thể kết hợp chọn x hiện tựơng ngoài n hiện tợng xảy
ra đợc cho bởi hệ số kết hợp (Parzen 1960):

)!(!
!
xnx
n
x
n

=










(3.
PP
x
n
xP
x
1()(








=

biết các tham số n và p, ví dụ về các PMF đợc trình bày trong
hình 3.11 v ơng trình 3.19 và 3.28, giá trị trung bình và giá trị phơng sai
ủa x là:
(3.47)
(3.48)
45)
Do đó, kỳ vọng xác suất là tạo ra từ xác suất của bất kỳ một tần suất hay số lần

mà tần suất đó có thể xảy ra .

nx
xn
3.2.1.0,) =


(3.46)

Chú ý B(n, p) cho
à từ các ph
c
E(x) = np
Var(x) = np(1 - p)
Giá trị độ lệch là:
5.0
)]1([
21
pnp
p
g


=

(3.49)
thực tế, độ lệch bằng 0 và phân bố là đối xứng nếu p = 0.5.
Hàm mật độ là:



=
Kết quả của CDF có thể rất cồng kềnh đối với các giá trị n lớn và các giá trị trung










=
x
i
ii
pp
i
n
xF
0
1
)1()(
(3.50)
182
bình của x. Nó đợc sắp xếp thành bảng bởi Công ty hoá chất Rubber (n.d) và Chuaanr
quốc tế Burea (1950). Cho giá trị của n an hệ giữa phân bố nhị thức và phân
bố Beta có thể đợc sử dụng (Abramowits và Stegun. 1964; Benjamin và Cornel, 1970 ),
hay hay nó đợc lấy xấp xỉ bởi phân bố chuẩn khi p = 0.5.


lớn các qu

Ví dụ 3.5
Xác suất rủi ro và AN TOàN
Tần suất của n năm, xác suất mà một lần xảy ra trong chuỗi số liệu T năm là bao
nhiêu? Xác suất xảy ra trong bất kỳ một năm nào là p =1/T, và số lần xảy ra là B(n,p).
Xác suất (xảy ra một lần trong n hiện tợng) đợc gọi là xác suất rủi ro. Tuy xác suất
tối thiểu là tổng xác suất trong một con lũ, hai và ba con lũ, , n con lũ xảy ra trong
suốt thời kỳ n năm, nhng điều này sẽ không thuận lợi để tính toán nó. Thay vào đó:

Hình (theo Benjamin và Cornel, 1970. Hình 3.3.1)
Xác suất rủi ro = 1 - P(0)
= 1 - P(hiện tợng trong n năm không xảy ra)
3.11. Hàm khối lợng phân bố nhị thức (PMF).
183
= 1 - (1-P)
n
= 1 - (1-1/T)
n
(3.51)
Xác suất an toàn đợc xác định nh sau:
= 1 - xác suất rủi ro
= (1-P)
n

n
= (1-1/T) (3.52)
Khái niệm này của xác suất an toàn và xác suất rủi ro là rất quan trọng trong
thuỷ văn thực hành. Phơng trình 3.51 có thể đợc sử dụng để xác định các chu kỳ lặp
để đáp ứng yêu cầu của việc thiết kế và độ lớn của xác suất rủi ro. Các giá trị đợc trình

bày trong bảng 3.3 minh hoạ c ho thiết kế lâu dài và với xác
suất rủi ro thấp.
ho thời kỳ dài để đáp ứng c
Ví dụ 3.6
Tiêu chuẩn thiết kế lũ
Xem xét con lũ có thời kỳ lặp lại là 50 năm (p = 0.02)
Xác suất rủi ro của một con lũ 50 năm sẽ xảy ra trong suất thời gian là 30 năm
của một dự án điều khiển lũ là bao nhiêu? Đây là xác suất rủi ro của các hiện tợng
không xảy ra khi xem xét ở trên, và phân bố của số lần không xảy ra là B(30,0.02). Do
đó từ
đa thời kỳ lặp lại của hiện tợng
lên 10
30
= 0.26
và xá y là có sự thay đổi 26% hiện tợng xảy ra
của chuỗi 100 năm trong thời kỳ 30 năm của dự án.
trong 10 năm là
bao n
, P(x = 0) = (1 - P)
10
= 0.92
Đối với n = 100, P(x = 0) = (1
nh v
Trờng hợp chun trong suất thời kỳ T
là bao nhiêu?
P(x = 0) = e
-1
= 0.368 (xác suất an toàn)

P(x > 0) =1 - e

-1
= 0.632 (xác suất rủi ro)
phơng trình 3.51:
Xác suất rủi ro = 1 - (1 - 0.02)
30

= 1 - 0.98
30
= 1 - 0.545
= 0.455.
Nếu xác suất rủi ro này quá lớn, các kỹ s phải
0 năm. Đối với xác suất rủi ro này là:
= 1 - 0.99
c suất an toàn là 0.74. Sau trờng hợp nà
Xác suất của con lũ có thời kỳ lặp lại là 100 năm không xảy ra
hiêu? và trong 100 năm?
Đối với n = 10
- P)
100
= 0.37.
ậy có tỷ lệ 37% con lũ 100 năm sẽ không xảy ra trong 100 năm
g, xác suất rủi ro có lũ lớn hơn lũ T- nằm
năm
P(x = 0) = (1 - 1/T)
T

Khi T là lớn thì giá trị này xấp xỉ 1/e (Benjamin và Cornel, 1970 , p 234), với t lớn:

184
Nh p xỉ xác

suất là 2/3.
Bản Các u kỳ lặp sự ay đổ n củ c su i ro và thiết kế

n hà (năm
một xấp xỉ, lũ T năm sẽ xảy ra mà không cùng thời kỳ T năm với xấ


g 3.3. ch cho th i độ lớ a xá ất rủ
Thời gian vậ nh n )
An
toàn
Rủi
ro
2 5 10 15 20 25 50 100
75 25 2.0 4.1 7.7 11.3 14.9 18.5 36.6 72.6
63 37 2.6 5.5 10.6 15.6 20.6 25.6 50.8 101.1
50 50 3.4 7.7 14.9 22.1 29.4 36.6 72.6 144.8
40 60 4.4 10.3 20.1 29.9 39.7 49.4 98.4 196.3
30 70 6.1 14.5 28.5 42.6 56.6 70.6 140.7 280.9
25 75 7.5 17.9 35.3 52.6 70.0 87.4 174.3 348.1
20 80 9.5 22.9 45.3 67.7 90.1 112.5 224.6 448.6
15 85 12.8 31.3 62.0 92.8 123.6 154.3 308.2 615.8
10 90 19.5 48.0 95.4 142.9 190.3 237.8 475.1 949.6
5 95 39.5 98.0 195.5 292.9 390.4 487.9 975.3 1950.1
2 98 99.5 248.0 495.5 743.0 990.5 1238.0 2475.4 4950.3
1 99 199.5 498.0 995.5 1493.0 1990.5 2488.0 4975.5 9950.4
0.5 99.5 399.5 998.0 1995 3990.5 4988.0 9975.5 19950.5 .5 2993.0




Ví dụ 3.7
Thiết kế đê
ngập lụt và bảo vệ các
ênh lớn đợc hoàn thành 20 năm. Để bảo vệ kênh
đòi h ,0.05). Xác suất bằng bao
hiêu khi:
năm (xác suất tuyệt đối)?
xác suất an toàn = (1 - 1/20)
3
= 0.86
b) Đê sẽ vợt đỉnh bất cứ một năm nào?
= 0.05
c) Đê sẽ vợt mộ


21
)1( pp

Một con đê đã đợc xây dựng để bảo vệ nhà cửa trong vùng
k . Đê đã xây dựng với hiện tợng lũ
ỏi 3 năm phải hoàn thành. Tuy nhiên, xác suất là B(3
n
a) Đê sẽ không vợt đỉnh trong 3
xác suất = 1/T
t trong 3 năm?
0.13553.0,05.0.9
2
==




1



==
3
)1(xp
185
d) Đê sẽ vợt quá ít nhất 1 trong 3 năm?
xác suất rủi ro =1 - xác suất an toàn = 0.14
m?

đ) Đê vợt trong 3 nă
xác suất = (1 - p)(1 - p)p = 0.95
2
.0,05 = 0.045

Quy luật phân bố mũ
Khi nghiên cứu một quá trình ngẫu nhiên với các hiện tợng xảy ra độc lập, các
uá trình là ổn định (các tham số của quá trình là không
không thể có nhiều hơn một trờng hợp tại một thời điểm xác định. Những điều kiện
jamin và Cornel, 1970), thờng đặc trng cho
trờn biến ngẫu nhiên t cho biết khoảng thời gian (thời
ian cách nhau giữa các trận ma), nó tạo phân bố mũ với PDF:

(3.53)
DF này đợc minh hoạ trong hình 3.
= 1/


2
. (3.55)
Do đó luật phân bố này có tính chất thuận lợi kh
bằng này thấy
đợc độ lệch về bên phải với hệ số độ bất đối xứng g = 2.
CDF có thể dễ dàng đợc xác định:

(3.56)
Thực chất khi t tiến đến vô cùng, F = 1, (vùng ở dới PDF phải bằng 1)
q thay đổi theo thời gian) và nó
này trình bày một quá trình Poisson (Ben
g hợp của các trận ma. Nếu
g đợc tìm để
0t =
t
etf


)(
P 12
Trị trung bình của phân bố là
E(t) = 1/
. (3.54)
Và phơng sai là
Var
i mà giá trị trung bình của nó
độ lệch chuẩn của nó, hay CV = 1, ở đây CV là hệ số biến đổi. Phân bố

t
t

t
edetF



==

1)(
0

Hình 3.12. Hàm mật độ phân bố xác suất mũ (PDF). Các tham số từ ví dụ 3.8.
186
Phân bố mũ có thể đợc vận dụng và kết quả đôi khi đợc lấy xấp xỉ các phân bố
lệch phức tạp hơn nh phân bố Gamma hay phân bố của giá trị vô cùng. Nó đôi khi
đợc sử dụng để đánh dấu các điểm t a hay lợng dòng chảy, nhng chủ
yếu ứng dụng cho những thời kỳ dài. Phân bố tơng ứng gần gũi là phân bố Poisson, là
PMF đối với các giá trị trong khoảng thời gian t, và Gamma, là PDF đối với khoảng thời
gian giữa hiện t
ổng lợng m
ợng bậc k xảy ra (Benjamin và Cornel, 1970 ).
Ví dụ 3.8
Khoảng thời gian cách nhau giữa các trận ma
ra ở Gainesville,
Floria, có 8760
iờ trong một năm, khoảng thời gain trung bình là

áp dụng bằn với

Trong một năm nhất định nào đó có khoảng 110 trận ma xảy
và trung bình cứ 5,3 giờ có một trận. Không quan tâm đến sự thay đổi,

g
(8760 - 110.5,3)/110 = 74.3 giờ
Luật phân bố mũ có thể g phơng pháp moment
1
0135.0



== hr
t


1
a,Tìm xác suất ít nhất là 4 ngày giữa các trận ma
g 2 trận ma
Do xác suất mà một biến liên tục chính xác bằng một giá trị cụ thể = 0
c, Xác suất giữa 2 trận ma
P (t
96) = 1- F(96) = e
-0.0135.96
= 0.27
b, Tìm xác suất cách nhau 12 iờ giữa
P(t = 12) = 0

12 giờ
P(t
12) = F(12) = 1-e
-0.0135.12
= 0.15



Luật phân bố chuẩn
Luật phân bố chuẩn cũng đựơc biết nh là phân bố Gaussian hay đờng cong sai
số chuẩn và là luật phân bố cơ bản của phơng pháp xác suất thống kê. Một nguyên
nhân mà định lý giới hạn chỉ ra những điều kiện rất chung chung, nh số các biến cố
trong tổng trở nên lớn hơn, sự phân bố tổng số lớn các biến cố ngẫu nhiên sẽ xấp xỉ
phân
là tổng các quá trình riêng lẻ. Tuy
nhiên luật phân bố chuẩn đã tìm ra nhiều ứng dụng trong thuỷ văn trong lĩnh vực
hống kê các giả thuyết, các khoảng riêng và kiểm tra chất lợng.
PDF đối với phân bố chuẩn (đờng bao- hình dạng đờng cong ) đợc trình bày
trong
bố chuẩn, không xét đến phần dới phân bố (Benjamin và Cornel, 1970). Có nhiều
các quá trình vật lý có thể đợc khái quát hoá nh
t
hình 3.13 và đợc viết bởi:

=

xexf
x
-
2
)/))(2/1((
2
1
)(
à



Các tham số của phân bố là trị trung bình và phơng sai, độ lệch = 0. Phơng
(3.57)
187

×