Tải bản đầy đủ (.pdf) (61 trang)

Thủy văn học và phân tích vùng ngập lụt ( đh quốc gia hà nội ) chương 3

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.89 MB, 61 trang )

chơng 3. phân tích tần suất

ảnh. Lũ lụt ở sông Trinity cạnh Dayton, Texas nawm 1990

3.1.

lời giới thiệu

Phạm vi nghiên cứu
Có nhiều các chu trình thuỷ văn phải đợc làm rõ và đợc giải thích theo xác suất
là do sự biến đổi ngẫu nhiên vốn có của nó. cho ví dụ không thể dự báo lu lợng và
lợng ma một cách chính xác dựa vào các số liệu trong quá khứ hay tơng lai do
không biết nguyên nhân cơ chế hoạt động của chúng. Rất may là phơng pháp thống kê
là rất phù hợp để cấu thành và biểu diễn chuỗi số liệu quan trắc thành một dạng mà có
thể nội suy và ớc lợng. Chơng này chỉ ra các phơng pháp ngẫu nhiên mà trong
thuỷ văn các số liệu có thể đợc xác định và biểu diễn trong một phuơng pháp thống kê
chuẩn.

163


Các biến cố ngẫu nhiên
Một biến cố ngẫu nhiên là một tham số (nh lu lợng, lợng ma, quá trình lu
lợng) nó có thể đợc dự báo một cách chính xác đó là, một biến cố ngẫu nhiên là kết
quả của một quá trình ngẫu nhiên. Một số biến cố có thể đợc xử lý bằng thống kê một
cách gián đoạn hay liên tục. Phần lớn các số liệu thuỷ văn là liên tục và đợc phân tích
xác suất bằng phân bố xác suất liên tục. Cho ví dụ, giá trị lu lợng trong biểu đồ hình
3.1a có thể bằng bất cứ một giá trị thực nào khi đo đạc bằng dụng cụ đo, đó là các số
liệu liên tục. Tuy nhiên chính bản thân các số liệu lại đợc biểu diễn một cách gián
đoạn là do các quá trình đo đạc. Các số liệu dòng chảy hàng ngày có thể đợc xác định
một cách xác thực nhất bằng lu lợng nớc m3/s. Dạng biểu diễn này của số liệu đợc


gọi là dạng gián đoạn - liên tục. Đó là các số liệu liên tục đợc quy thành gián đoạn.
Điều này cũng đợc minh hoạ trong hình 3.1(a), trong đó lu lợng đợc giả thiết dạng
m3/s gần nhất.
Các biến cố ngẫu nhiên gián đoạn có thể chỉ đợc lấy trên một lu vực nhất định
trong các giá trị rời rạc. Cho ví dụ, tung một đồng xu kết quả là mặt sấp hoặc ngửa sẽ
xuất hiện; tung một con súc sắc các giá trị xuất hiện từ 1 đến 6. Kết quả từ thùng đo
ma là các giá trị thuỷ văn đơn giản nh trong hình 3.1(b): nó có thể có hay không có
một đỉnh trong suốt khoảng thời gian.

Hình 3.1. Các số liệu liên tục và gián đoạn a) số liệu liên tục và gián đoạn b)số liệu gián đoạn. Kết
quả biểu đồ lấy từ thùng đo ma. Mỗi một đơn vị độ cao là 0.01 inch lợng ma.

164


Các số liệu gián đoạn - liên tục có thể đợc xử lý bằng gián đoạn. Thật vậy chúng
đợc gián đoạn hoá bất cứ lúc nào các bảng số liệu đợc sắp xếp trình tự, do các gía trị
này còn đợc cắt bớt. (Ví dụ nh giá trị gần nhất của 1 ft3/s lu lợng hay 0.1 inch
lợng ma). Tuy nhiên, việc phân tích các yếu tố tần suất này là rất thuận tiện do số
liệu tính toán lớn mà ta có thể xem xét. Cho ví dụ, nếu lu lợng dòng chảy đợc đo đạc
gần đúng nhất (ft3/s) trong khoảng từ 0 đến 5000 ft3/s thì phải tính toán 5000 khoảng
gián đoạn. Tơng ứng, các điểm liên tục sẽ dễ dàng hơn rất nhiều. Mặc dù các phân bố
tần suất rời rạc thỉnh thoảng đợc áp dụng cho các giá tị liên tục (ví dụ độ lớn lợng
ma của một trận ma), các ứng dụng chủ yếu của phân bố rời rạc trong thuỷ văn là
một biến cố ngẫu nhiên mà ở dạng số để đáp ứng một số tiêu chuẩn nhất định, ví dụ giá
trị lũ đợc mong đợi để vợt quá một độ lớn nhất định, trong thời kỳ nhiều năm.
biểu diễn số liệu
Số liệu gián đoạn - liên tục thờng đợc biểu diễn dới dạng biểu đồ hình cột hay
một đờng cong. Chiều cao và hình dạng chung của đờng cong là phù hợp với các đặc
trng số liệu và lựa chọn luật phân bố các số liệu một cách hợp lý, ví dụ có những phân

bố nên làm đối xứng hay có những phân bố nên chọn bất đối xứng. Sử dụng lu lợng
dòng chảy, ví dụ, giá trị lu lợng đợc phân chia thành từng lớp một và tơng ứng với
nó là một tần suất xuất hiện của lớp đó. Độ lớn của mỗi lớp nên đủ nhỏ làm sao các
thành phần số liệu có thể thấy đợc nhng cũng phải đủ lớn để cho các thành phần
không bị lẫn lộn. Giá trị đã sử dụng trong các lớp có thể thay đổi hình ảnh của số liệu
(Benjamin và Cornel, 1970). Giá trị này có thể không thuận tiện cho việc thay đổi nhiều
chơng trình tính toán, vì vậy các kỹ s có thể so sánh và đa ra một vài sự lựa chọn
khác nhau. Với sự trợ giúp của Panofsky và Brier, 1968 đã đa ra:
K = 5log10n

(3.1)

ở đây K là số khoảng lớp và n là số giá trị. Khoảng lớp không phải là hằng số độ rộng.
Nếu không, thuận lợi cho việc nhóm các số liệu thành một nhóm lớn hơn, khoảng đợc
kết hợp.
Nửa tung độ của đồ thị đợc phân chia bởi toàn bộ số lần quan sát đợc, tần suất
tơng ứng (xác suất ) của mỗi một khoảng lớp, nh vậy tổng tung độ bằng 1.0 tạo nên
sự thay đổi phơng pháp đánh dấu số liệu. Cho đến cách thứ ba là dạng của một phân
bố tần suất luỹ tích, nó cho biết toàn bộ đờng cong phân bố tần suất tơng ứng trên
một khoảng nhất định và là xác suất mà một giá trị ở hoành độ là nhỏ hơn hoặc bằng
độ lớn ở mỗi điểm đó. Cả hai tần suất trên đều đợc dùng nhiều trong thuỷ văn và đợc
minh hoạ rõ nét nhất trong một số ví dụ .
Ví dụ 3.1

đồ thị tần suất

Số liệu lũ lớn nhất trong 31 năm đợc ghi lại tại Cypress Creek, gần Horton,
Texas, đợc trình bày trong bảng 3.1. Phơng trình 3.1 cho biết rằng có khoảng tơng
ứng 7 hay 8 lớp. ở đây là nó cho phép giới hạn tiêu chuẩn là 2000ft3/s (tiêu chuẩn này
quan trọng hơn những quy tắc đếm tay khác đôí với số khoảng lớp).

Tần suất, tần suất tơng ứng, tần suất luỹ tích cũng đợc xác định trong bảng và
165


biểu diễn trong hình 3.2 và 3.3. Ví dụ , trong hình 3.2 xác suất nằm trong khoảng 2000
và 4000 là 0.29. Từ đờng cong xác suất luỹ tích (hình 3.3), xác suất mà lu lợng nhỏ
hơn hoặc bằng 4000 ft3/s là 0.58. Chú ý rằng tổng của tần suất tơng ứng là 1.0 đợc
chỉ ra trong bảng 3.1 và tổng tung độ đợc biểu diễn trong hình 3.3.
Bảng 3.1 Bảng tính toán số liệu và tần suất ở Cypress Creek , gần Horton, Texas
Số liệu cha

Số liệu đã

Số liệu cha

Số liệu đã

sắp xếp

sắp xếp

sắp xếp

sắp xếp

Năm

Q(m3/s)

Stt


Q(m3/s)

Năm

Q(m3/s)

Stt

Q(m3/s)

1945

9840

1

15600

1961

6260

17

3310

1946

5170


2

10300

1962

1360

18

3210

1947

1620

3

9840

1963

1000

19

3000

1948


235

4

7760

1964

2770

20

2820

1949

15600

5

6560

1965

1400

21

2770


1950

4740

6

6260

1966

3210

22

2520

1951

427

7

5440

1967

1110

23


1900

1952

3310

8

5230

1968

5230

24

1620

1953

4400

9

5170

1969

4300


25

1400

1954

7760

10

4740

1970

2820

26

1360

1955

2520

11

4710

1971


1900

27

1110

1956

340

12

4400

1972

3980

28

1000

1957

5440

13

4300


1973

6560

29

427

1958

3000

14

3980

1974

4710

30

340

1959

3690

15


3690

1975

3460

31

235

1960

10300

16

3460

Khoảng lớp

Giá trị trung bình

Tần suất

Tần suất tơng ứng

Tần suất l/t

0 - 2000


1000

9

0.29

0.29

2000 - 4000

3000

9

0.29

0.58

4000 - 6000

5000

7

0.23

0.81

6000 - 8000


7000

3

0.10

0.91

8000 - 10000

9000

1

0.03

0.94

10000 - 12000

11000

1

0.00

0.97

12000 - 14000


13000

0

0.03

0.97

14000 - 16000

15000

1

0.03

1.00

= 31

166


Một cách gián đoạn hoá các số liệu lu lợng liên tục sẽ đợc quy định là một biến
cố ngẫu nhiên rời rạc cho mỗi một khoảng lớp. Bất kỳ một giá trị nào nằm trong một
lớp sẽ đợc quy định là giá trị rời rạc tơng ứng của các lớp đó, thông thờng điểm
trung bình hay điểm giữa của mỗi lớp. Trong trờng hợp này điểm giữa sẽ đợc điền
vào hoành độ (hình 3.4). Một giá trị tần suất tơng ứng là giá trị tần suất của lu lợng
3000 ft3/s là 0.29 (giá trị tơng đơng này đợc lấy dựa vào những hiện tợng đã biết

mà một biến cố ngẫu nhiên liên tục có thể có, không cần xác định chính xác bằng giá trị
cụ thể).
Đờng bất đối xứng lu lợng ở Cypress Creek đợc trình bày trong hình 3.2 và
3.4, đó là điểm cuối ở bên phải. Nó sẽ đợc xác định và lấy tơng đơng với sự thay đổi
phân bố trong nhiều trờng hợp khác.

Hình 3.2. Biểu đồ tần suất tơng ứng cho vùng Cypress Creek, gần Horton, Texas.

Hình 3.3. Biểu đồ tần suất luỹ tích cho vùng Cypress Creek.

167


Hình 3.4. Biểu đồ tần suất rời rạc của vùng Cypress Creek.
Những tần suất này bằng với hàm khối lợng xác suất rời rạc (PMF).

3.2.

Các khái niệm xác suất
Tiến hành một thí nghiệm với N kết quả đạt đợc, X1,X2,Xi,XN. Các kết quả
này là độc lập, nếu không hai trong số đó có thể xảy ra cùng một lúc. Nó là số lần xuất
hiện các mặt, chúng đặc trng cho toàn bộ kết quả đạt đợc khi tiến hành thí nghiệm.
Xác suất của một biến cố Xi có thể đợc xác định bằng số lần xuất hiện biến cố tơng
ứng trong rất nhiều phép thử. Xác suất này có thể đợc xác định bằng P(Xi) = ni/n, ở
đây ni là số lần xuất hiện (xác suất ) của biến cố Xi trong n phép thử. Tuy nhiên ni/n chỉ
là tần suất tơng ứng hoặc xác suất xảy ra của biến cố Xi.
Một xác suất rời rạc là một xác suất đơn giản của một biến cố rời rạc. Nếu nh
một P(Xi) nhất định bằng với xác suất của biến cố ngẫu nhiên Xi, các điều kiện cho phép
tồn tại những xác suất rời rạc của những biến cố này khi xem xét các khoảng đơn giản
của toàn bộ kết quả đạt đợc:

0 < P(Xi) < 1

(3.2)

N

P( Xi) = 1

.

(3.3)

i=1

Xác suất hợp của hai biến cố độc lập là tổng xác suất của mỗi xác suất biến cố
thành phần:
P(X1 X2) = P(X1) + P(X2)

(3.4)

Hai biến cố X1 và Y1 đợc gọi là độc lập, nếu việc xảy ra biến cố này không ảnh
168


hởng đến sự xuất hiện biến cố kia. Xác suất giao (cả hai cùng xảy ra đợc ký hiệu )
của hai biến cố độc lập là tích của chúng:
P(X1 Y1) = P(X1). P(Y1).

(3.5)


Đối với các biến cố phụ thuộc lẫn nhau:
P(X1 Y1) = P(X1) + P(Y1) - P(X1 Y1).

(3.6)

Xác suất điều kiện của X1 khi biến cố Y1 đã xảy ra là:
P(X1/Y1) = P(X1 Y1)/ P(Y1) .

(3.7)

Nếu biến cố X1 và Y1là độc lập thì kết hợp 2 phơng trình 3.5 và 3.7 trở thành:
P(X1/Y1) = P(X1).P(Y1)/P(Y1) =P(X1).

(3.8)

Những khái niệm này thờng đợc minh hoạ trong biểu đồ Venn (Hình 3.5) trên
đó diện tích là xác suất, với tổng diện tích tong ứng thì xác suất bằng 1.0, hay 100%.

Hình 3.5. Biểu đồ Venn minh hoạ xác suất

Ví dụ 3.2

Các xác suất có điều kiện

Lấy biến cố Y1 là điều kiện mà lợng ma xảy ra trong một ngày nhất định và
biến cố X1 là điều kiện mà chớp quan sát đựơc trong một ngày nhất định. Cho xác suất
của những biến cố này:
P(X1) = 0.3 (xác suất chớp là 30%)
P(Y1) = 0.1 (xác suất ma là 10% )
P(X1/Y1) = 0.5 (nếu có chớp xuất hiện thì ma là 50% )

Tính xác suất cả ma và chớp cùng xảy ra (là xác suất của X1 và Y1)?
Từ phơng trình 3.7:
P(X1 Y1) = P(Y1/X1).P(X1) = 0.15.
Nếu là độc lập với

P(Y1/X1) = P(Y1) = 0.03.

Xác suất của các biến cố độc lập cùng xảy ra luôn luôn nếu chúng là phụ thuộc.

169


3.3.

Các biến cố ngẫu nhiên và các luật phân bố xác suất

Các biến cố ngẫu nhiên và biến cố rời rạc
Tính chất của các biến cố ngẫu nhiên có thể đựơc miêu tả bởi quy luật phân bố
xác suất của nó. Mỗi một kết quả đạt đợc trong một phép thử đựoc quy định là số giá
trị phụ thuộc vào hàm khối lợng xác suất rời rạc (PMF) hay hàm mật độ xác suất liên
tục (PDF). Trong thuỷ văn, các biến cố ngẫu nhiên rời rạc đợc sử dụng rất rộng rãi để
biểu diễn số trờng hợp xảy ra mà phù hợp vơí một tiêu chuẩn nhất định. Ví dụ, giá trị
lũ vợt quá giá trị cụ thể cho trớc, lợng ma xảy ra tại một nơi nhất định, Các ví
dụ trong chơng này đều thuộc loại này. Nh một quy tắc, các biến cố ngẫu nhiên rời
rạc đợc liên kết chỉ với các tham số mà có thể chỉ là các số nguyên. Tuy nhiên có thể
nhóm các biến cố ngẫu nhiên liên tục thành các số nguyên gần đúng nhất hay các giá
trị nguyên bỏ dấu phẩy. Cho ví dụ, lợng ma 2.18 inch thay là lợng ma 218 inch.
Đôi khi biến đổi để xử lý một biến cố liên tục thành dạng rời rạc, nh lu lợng
rời rạc trong hình 3.4. Hãy chú ý P(x1) có nghĩa là xác suất mà biến cố ngẫu nhiên rời
rạc X lấy từ giá trị x1. Biểu diễn lại lu lợng x "rời rạc ", chúng ta có thể lấy xác suất

tơng ứng trong hình 3.4:
P(1000) = 0.29, P(9000) = 0.03
P(3000) = 0.29, P(11000) = 0.03
P(5000) = 0.23, P(13000) = 0.0
P(7000) = 0.10, P(15000) = 0.03

P ( x)

P ( a x b) =

(3.9)

a xb

Chú ý rằng các giá trị này phù hợp với xác suất tuyệt đối của phơng trình 3.2 và
3.3. Hơn nữa các xác suất là rời rạc.
Hàm phân bố luỹ tích (CDF) đợc xác định là:
Từ các giá trị trong bảng trên, F(7000) = 29+29 + 23 +10 =91%.
F ( x) = P ( X x) =

P ( Xi )

(3.10)

Xi X

Các biến cố ngẫu nhiên liên tục thờng đợc sử dụng để biểu diễn các yếu tố
thuỷ văn nh lu lợng, thể tích, độ sâu, và thời gian. Các giá trị này không phải
chuyển về dạng nguyên, mặc dù các biến cố liên tục có thể nhóm thành dạng nguyên.
Cho một biến cố ngẫu nhiên liên tục, phần diện tích dới hàm mật độ phân bố xác suất

f(x) nh sau (xem hình 3.6):
P(x1< x < x2) =



x2

f ( x) dx

(3.11)

= 1 .0

(3.12)

x1

và phần diện tích dới PDF bằng 1.0:


170




f ( x ) dx


Bản thân CDF không phải là một xác suất và có thứ nguyên nghịch đảo với thứ
nguyên của X, ví dụ nh ft3/s-1 . Tuy nhiên, không giống với các nhà tính toán, nó

không tuân theo các đơn vị thờng dùng của PDF. Trong thực tế, các giá trị của PDF
rất ít khi dùng đến. Mặt khác nó là hàm mật độ luỹ tích (CDF) và rất quan trọng vì nó
là xác suất CDF, liên tục đợc xác định giống với các thành phần rời rạc của nó:

Hình 3.6 .Hàm mật độ xác suất liên tục

F (x1) = P ( x x1) =



X1



f ( x) dx

(3.13)

các giá trị nằm trong khoảng:

0 f ( X ) 1 .0

(3.14)

P(x1 x x2 ) = F(x2 ) F(xl1)

(3.15)




PDF và CDF đợc lấy tơng ứng với phơng trình (3.13) nghịch đảo :
dF ( x)
= f ( x) .
dx
Biểu đồ trong hình 3.2 có thể đợc biểu diễn bằng PDF liên tục nếu các tần suất
tơng ứng đợc tạo ra từ các khoảng lớp nhỏ hơn x. Phần diện tích dới biểu đồ là 1.0.
Cho ví dụ , nếu tung độ của biểu đồ tần suất tơng ứng trong hình 3.2 có khoảng chia là
2000 ft3/s, tơng ứng với một PDF. Nó minh hoạ cho những PDF có thể có hình dạng cố
định và dạng giá trị đơn, chúng không cần giống hình dạng đòng cong trơn. Biểu đồ
này có phân bố hỗn hợp, trong đó các xác suất rời rạc biểu diễn xác suất mà một biến cố
lấy một giá trị rời rạc cụ thể, trong khi một PDF liên tục cho biết đỉnh của các giá trị
với một diện tích bằng 1,0 ngoại trừ các hàm xác suất rời rạc. Để ví dụ, một phân bố
hỗn hợp đựoc biểu diễn trong hình 3.7 trong đó xác suất là 0.15 tại lu lợng bằng 0.0.
Chọn một phân bố liên tục PDF để biểu diễn các số liệu là khó khăn bởi vì ngời
ta thờng bắt chớc hình dạng của biểu đồ tần suất (hình 3.2) các PDF phần lớn sử
171


dụng các biến cố thuỷ văn sẽ đựoc trình bày trong phần sau đây.

Hình 3.7.Luật phân bố tần suất rời rạc. Sử dụng các hàm phân bố xác suất rời rạc (PMF)
cho xác suất có giá trị = 0 và các hàm mật độ xác suất liên tục (PDF)
(độ lớn diện tích = 0.85) đối với xác suất có giá trị lớn hơn 0.

Các moment của một phân bố

Khái niệm moment là một thuật ngữ cơ học. Một PMF hoặc PDF là một dạng
hàm trong đó các moment có quan hệ với các tham số của nó. Tuy nhiên, nếu các
moment có thể tìm đợc thì cũng có thể tìm thấy các tham số phân bố. Chính bản thân
các moment cũng cho biết hình dạng của các phân bố.

Cho một phân bố rời rạc, moment gốc bậc N có thể đợc xác định nh sau.

x

àN ' =

N
i

P( xi )

(3.17)

Và đối với các phân bố liên tục nh sau:



àN' =





x N f ( x) dx

(3.18)

Moment gốc bậc một là giá trị trung vị, trung bình hay giá trị kỳ vọng, đợc tính
bằng E() đối với kỳ vọng nh sau:
E ( x) à =




x p( x )
i

i

(cho PMF rời rạc)

(3.19)




E( x) à =







x i f ( x i ) (cho PDF liê n tục )

(3.20)

Trung vị là một giá trị đợc lấy ở giữa hay cũng đựoc gọi là một tham số vị trí vì
nó cho biết vị trí trục quay x số lớn của phân bố đợc thiết lập.
Thông thờng luật phân bố của một biến cố sẽ đợc tìm và thông tin về các biến

cố quan hệ sẽ đợc cung cấp. Để ví dụ, phân bố của lu lợng dòng chảy có thể đợc
biết và cho biết thông tin về trạm đó, đó là một hàm của lu lợng. Giá trị kỳ vọng của
172


hàm g(x) đối với biến cố ngẫu nhiên x có thể đợc xác định theo công thức căn nguyên
của x.
E( g( x)) =



g( x ) f ( x )
i

i

(3.21)



khi x là biến cố ngẫu nhiên rời rạc, và
E[ g( x)] =







g( x) f ( x) dx


(3.22)

khi x là biến cố ngẫu nhiên liên tục.
Kỳ vọng là một hàm tuyến tính, nếu a, b là hằng số.
E(a) = a

(3.23)

E(bx) = bE(x)

(3.24)

E(a + bx) = a + bE(x)

(3.25)


Các moment gốc bậc cao hơn của luật phân bố thòng không sử dụng. Trong thực
tế, các moment trung tâm của giá trị trung bình đợc xác định theo PMF rời rạc là:
àN =



(x

à ) N p( x i )

(3.26)


( x à ) N f ( x) dx

(3.27)

i



và đối với PDF liên tục:
àN =







Những moment này thờng là các giá trị kỳ vọng của khoảng lệch khỏi giá trị
trung bình của x đợc đa lên mũ N, trong đó moment trung tâm bậc nhất bằng 0.
Moment trung tâm bậc hai đợc gọi là phong sai và đóng vai trò rất quan trọng.
Var ( x) 2 = E[( x à ) 2 ] =



(x

à ) 2 f ( x) dx

(3.28)


( x à ) 2 f ( x) dx

(3.29)

i



cho các biến cố ngẫu nhiên liên tục
Var ( x) 2 = E[( x à ) 2 ] =







Phơng sai là độ lệch khỏi giá trị trung bình bậc hai, nó biểu diễn độ lớn hay
khoảng rộng của phân bố . Một đơn vị tơng đơng là độ lệch chuẩn , nó đơn giản là
phơng sai bậc hai. Từ công thức của kỳ vọng:
Var(x) = E[(x - à )2] = E[x2 - 2x à + à 2]
= E[x2] - E[2 à x]+E[ à 2]
= E[x2] - 2 à E[x]+ à 2 = E[x2] - 2 à 2 + à 2]
=E[x2]-

à2

= E[x2]-[E(x)]2

(3.30)


Phơng sai không phải là một biến đổi tuyến tính. Ta có các quan hệ sau:
Var(a) = 0
2

Var(bx) = b Var(x)
2

Var(a+bx) = b Var(x)

(3.31)
(3.32)
(3.33)

ở đây a,b là các hằng số
173


Các moment bậc cao hơn có thể đợc xác định nếu cần thiết, nhng thờng dùng
trong thuỷ văn là bất đối xứng, nó là moment trung tâm bậc 3 và đợc đơn giản hoá
bằng độ lệch trung bình mũ 3.
à
(3.34)
g 33

Độ lệch phải hay lệch trái giá trị trung bình là tham số hình dạng và đợc biểu
diễn tong hình 3.8. Nếu nh phân bố là đối xứng thì hệ số bất đối xứng bằng 0.
Đôi khi nó đợc sử dụng để làm đơn giản hoá việc tính toán mức độ phân bố. Hệ
số phơng sai đợc xác định theo tỷ lệ độ lệch khỏi giá trị trung bình, hay nó có thể
đợc sử dụng cho mục đích tính CV.

CV = / à
(3.35)

Hình 3.8. ảnh hởng của hệ số bất đối xứng đối với hàm mật độ xác suất (PDF)
và các vị trí tơng ứng của giá trị số đông, trung vị, và đỉnh (của Haan 1977, Hình 3.3)

Một giá trị tính tại giã đờng cong là trung vị xm, nó không phải là moment
nhng đúng hơn giá trị của x mà CDF bằng 0.5:
F(xm) = 0.5

(3.36)

Các tham số khác không phải là moment nh số đông của phân bố. Giá trị này
của x ở PDF (hoặc PMF) là một điểm cực đại. Các quan hệ giữa giá trị trung bình,
trung vị và số đông cũng đợc minh hoạ trong hình 3.8. Các phân bố chủ yếu là một
phơng thức (phân bố hỗn hợp của hình 3.7 là nhị thức).
Các moment và các tham số đợc trình bày trong phần này để xem xét quy luật
phân bố xác suất và có thể lấy để phân tích. Các dạng hàm nh PMF hay PDF có thể
đợc thay thành dạng tổng hay dạng tích phân và các moment đã xác định từ các thành
phần của các tham số trong phân bố. Nó không đợc minh hoạ ở đây do mối quan hệ
giữa các moment và các tham số phân bố sẽ đợc xác định cho mỗi một phân bố khi
xem xét. Các mối quan hệ cho biết một phơng pháp đơn giản của việc xác định các
tham số phân bố nếu nh các moment đã biết. Với mục đích đó việc xác định các
moment phải đợc lấy từ các số liệu.
Ước lợng moment từ các số liệu

Cho các gía trị tham số của phân bố, nó là một chuỗi x1, x2,, xn của các biến
ngẫu nhiên phụ thuộc vào việc cho PMF hay PDF. Các chuỗi có độ dài xác định sẽ xây
dựng một cách phổ biến toàn bộ các biến cố ngẫu nhiên dựa vào PDF hay PMF đã cho
với các tham số nhất định. Tơng tự có thể xác định các tham số từ các moment do

chúng có quan hệ với nhau, nh xem xét ở trên (và đợc xử lý lại cho phù hợp). Các số
liệu thuỷ văn đo đạc thờng đợc tạo ra từ các quá trình vật lý hỗn hợp(ví dụ dòng chảy
174


có thể đợc tạo ra từ ma hay tuyết tan), vì vậy có thể kết hợp nhiều phân bố xác suất.
Trong đó các số liệu quan sát là đối tợng nghiên cứu để thấy sự khác nhau của nó với
giá trị thực và tìm ra một phân bố phù hợp. Do đó, các giá trị của các moment đã tính
từ các số liệu sẽ đợc sử dụng để tính ngợc trở lại những giá trị cha biết. Tuy nhiên
các ớc lợng của chúng có thể xác định nhanh chóng tữ các số liệu, nh trình bày ở
dới đây đối với 3 tham số moment chủ yếu trong thuỷ văn. Nếu số các biến cố ngẫu
nhiên là n, ớc lợng trị trung bình là:
à~ = x =

1 n
xi
n i =1

(3.37)

Các moment bậc cao hơn là các đối tợng để thấy sự sai khác trong việc ớc lợng
chúng. Ước lợng không có sai số là giá trị kỳ vọng và bằng giá trị số đông. Nó có thể
đợc trình bày (Benjamin và Cornel, 1970 ) nh E (x ) = à khi cần thiết. Cho phơng
sai và ớc lợng không chính xác là:

2 S2 =

x
=


2
i

1 n
( xi x ) 2
1 n i =1

nx 2

n 1

(3.38)

,

ở đây mẫu số n-1 (thực chất là n) để giảm bớt sai số (ngoại trừ các trờng hợp khác,
cộng tất cả từ 1 đến n ), trong đó cho nhiều giá trị, mẫu n phần lớn cũng đợc ớc lợng
tơng tự, và cả 2 mẫu này đều có thể đợc tìm trong đó, mặc dù các ớc lợng chính, sai
số thờng đợc chú ý hơn trong tính toán. Dạng thứ hai của phơng trình 3.38 đợc a
chuộng hơn.
Do việc ớc lợng của các moment là một hàm của các biến cố ngẫu nhiên, chính
bản thân chúng cũng là các biến cố ngẫu nhiên. Phơng sai của giá trị trung bình cũng
đợc xác định nh sau:
Var( x ) Sx =
2

Sx
n

2


(3.39)

Tuy vậy, nếu phơng sai của giá trị trung bình đợc coi là sai số đo đạc trong việc
ớc lợng giá trị trung bình, nó đợc tạo nên khi chuỗi tăng, điều này đúng khi xác
định toàn bộ các moment.
Độ lệch là hàm đặc biệt do nó bao gồm tổng khoảng lệch khỏi giá trị trung bình
và là sai số lớn hơn khi xác định chúng (giá trị của nó). Một ớc lợng xấp xỉ giảm sai
số là:
CS g =
1

n
( xi x ) 3
.
3
(n 1)(n 2)
Sx

(3.40)

Với Sx2 đợc cho bởi phơng trình 3.38. không dễ để lấy xấp xỉ làm giảm sai số
dựa vào các hàm phân bố (Bodee và Robitaille, 1975), nhng lấy xấp xỉ CS1 là phù hợp
để ứng dụng trong thuỷ văn (Tasker và Stedinger, 1986) là
CS2 = (1 + 6/n).CS1

(3.41)

Công thức này chính xác để ứng dụng đờng cong phân bố Pearson - 3 (phần 3.5)
nhng cũng thoả mãn các phân bố khác khi CS1 đợc xử lý. Ước lợng bất đối xứng đã

tính toán sử dụng phơng trình 3.41 đợc gọi là khoảng ớc lợng, có nghĩa là việc ớc
lợng toàn bộ số liệu tại trạm đo mà ta quan tâm.
175


Các sai số và các lỗi trong khi ớc lợng các hệ số bất đối xứng tăng lên khi số
trạm đo n giảm xuống. Các số liệu về nớc ở Hội đồng t vấn Thuỷ lợi là rất phù hợp
cho việc xác định hệ số bất đối xứng, Cw, dựa vào phơng trình:
Cw = WCS + (1 - W)Cm

(3.42)

ở đây W là nhân tố trọng lợng, CS là hệ số bất đối xứng đã tính bằng việc sử dụng các
số liệu đơn giản, và Cm là hình dạng bất đối xứng, nó đợc xác định dựa vào bản đồ nh
trong hình 3.9. Nhân tố trọng lợng W đợc tính toán làm giảm sai số của CW, ở đây
W =

V (C m )
V (C S ) + V (C m )

Để xác định W đòi hỏi phải biết phơng sai của Cm[V(Cm)] và phơng sai của
CS[V(CS)]. V(Cm) đợc xác định từ biểu đồ của hệ số bất đối xứng ở nớc Mỹ bằng
0.3025. Đa W vào phơng trình (3.42) bất đối xứng Cw đợc viết nh sau
Cw =

V (Cm ) CS + V (C S )Cm
V (Cm ) + V (C S )

Hình 3.9 .Tạo ra các hệ số bất đối xứng theo dạng loga của dòng chaỷ hàng năm lớn nhất.
(từ số liệu năm 1982 ở Hội đồng t vấn thuỷ lợi).


Sai số của bất đối xứng CS đối với đờng cong loga Pearson 3 của các biến ngẫu
nhiên có thể đợc tính từ kết quả của Monte Carlo, hệ số kinh nghiệm Wallis, Matalas,
và Slack năm 1974. Chúng đợc biểu diễn nh sau:
V(CS)=10A-Blog10(n/10)
trong đó

176


A = 0.33 + 0.08 CS

nếu CS 90

A = 0.52 + 0.30 CS

nếu C S > 90

B = 0.94 0.26 CS

nếu C S 1.50

B = 0.55

nếu C S > 1.50

ở đây CS là giá trị tuyệt đối của hệ số bất đối xứng cố định (đợc sử dụng nh một ớc
lợng của số đông bất đối xứng) và n là số năm.
Đối với các vùng thuỷ văn đô thị, rất khó khăn để ớc lợng các moment do dòng
chảy tăng theo thời gian. Do đó phân bố tần suất có thể không ổn định (thay đổi theo

thời gian). Tơng tự, các mô hình đã trình bày trong chơng 5 và 6, có thể đợc sử dụng
để phát triển các phân bố xác suất cho dòng chảy trong vùng đô thị trong một thời kỳ
phát triển nhất định.
Ví dụ 3.3

Các moment của chuỗi số liệu cực đại hàng năm

Chuỗi số liệu 31 năm của lu lợng lớn nhất hàng năm ở miền Nam Cpress Creek
của Horton, Texas, đợc trình bày lại trong bảng 3.2. Xác định giá trị trung bình, độ
lệch chuẩn, của số liệu gốc và giá trị log (cơ số 10) tơng ứng bằng việc sử dụng phơng
trình 3.37 và 3.38. So sánh sự khác nhau giữa các ớc lợng bất đối xứng.

giải
Các kết quả cho các giá trị nh sau:

Số liệu gốc

Số liệu loga cơ số 10

Trung vị

4144

3.463

Độ lệch chuẩn

3311

0.424


Hệ số lệch CS1 (3.40)

1.659

-0.936

Hệ số lệch CS2(3.41)

1.981

-0.117

Hệ số bất đối xứng (3.42)

0.7

Khi xem xét số liệu loga cơ số 10 ta sử dụng vùng số liệu trong hình 3.9 cho thấy
Cm = - 0.3 ở Horton. Trung bình trọng lợng sử dụng phơng trình 3.42 cho thấy ớc
lợng thay đổi là - 0.7, thậm chí nhỏ hơn cả giá trị cho bởi phơng trình 3.41. Các giá
trị thay đổi gần hơn có thể đợc xác định các trạm khác ở Horton. Với những mục đích
của các ví dụ trong phần này, giá trị - 0.117 có thể đợc sử dụng (phơng trình 3.41).
Cho chuỗi số liệu tại Cpress Creek ở Horton sử dụng phơng trình 3.42, Cm = -0.3
và trị tuyệt đối của CS = 1.117, do đó:
A = -0.52 + 0.3(1.117) = - 0.185
B = 0.94 - 0.26(1.117) = 0.65


V(Cs) = 10


A-Blog

(n/10)
10

= 0.313 và V(Cm) = 0.303 từ bản đồ

Cuối cùng
177


W = 0.303/(0.313 + 0.303) = 0.492 và 1 - W = 0.508


Cw = 0.492 (- 0.117) + 0.508(- 0.3) = -0.70

Làm trơn phân bố chuỗi số liệu

Một khả năng sử dụng các ớc lợng moment để điền các số liệu vào phân bố xác
suất từ các số liệu trong hàm phân bố. Ví dụ, luật phân bố chuẩn có các tham số trung
vị à và phơng sai 2 . Phơng pháp moment làm cho phân bố chuẩn trở nên đơn giản
để sử dụng các ớc lợng trung vị và phơng sai. Hơn nữa, tham số của phân bố kinh
nghiệm đợc coi nh trung vị của phân bố. Tuy nhiên, ở phơng pháp moment đặt
=1/ à . Phơng pháp biểu đồ và phơng pháp thích hợp tối đa là hai phơng pháp tạo
nên phơng pháp phân bố moment. Phơng pháp biểu đồ đợc trình bày trong phần
3.6. Mặc dầu phơng pháp thích hợp tối đa là phơng pháp cao hơn phơng pháp
moment về phơng diện thống kê, tính toán nhiều hơn và phức tạp hơn phơng pháp
moment nhng nằm ngoài phạm vi của phần này. Phơng pháp thích hợp tối đa cho
một vài phân bố đợc sử dụng trong thuỷ văn đã đợc Kite trình bày (1977). Đối tợng
xác định các tham số trong phân bố là xác định CDF của nó. Trong một số trờng hợp,

tuy mục đích giống nhau có thể thực hiện mà không cần tính toán chính xác các tham
số của phân bố. Thực chất, phân bố đã sử dụng nhân tố tần suất K, cụ thể nh sau:
K =

xx
Sx

(3.43)

K là một hàm phụ thuộc vào CDF và là một hàm của bất đối xứng. Tuy nhiên, nếu nh
K đợc biết nhờ giá trị hệ số bất đối xứng và gía trị CDF, giá trị tơng ứng của x có thể
cũng đợc tính toán. Các nhân tố tần suất sẽ đợc trình bày trong phần sau khi xem
xét một vài phân bố cụ thể.

3.4.

thời kỳ lặp lại và thời khoảng tái diễn
Phần lớn các giá trị trung bình đã sử dụng trong thuỷ văn cho biết xác suất của
một hiện tợng đợc quy định là thời kỳ lặp lại hay thời khoảng tái diễn của hiện
tợng. Thời kỳ lặp lại đợc xác định nh sau: Mỗi một giá trị cực đại hàng năm lớn
nhất có một thời kỳ lặp T năm nếu nh độ lớn của nó lớn hơn hoặc bằng giá trị trung
bình T năm. Xác suất lớn hơn trong thời kỳ T năm đó là xác suất mà hiện tợng xảy ra
lớn hơn hoặc bằng giá trị của bất kỳ một năm naò. Do đó, dòng chảy lũ 50 năm có xác
suất 0.02, hay 2%, nó bằng hoặc lớn hơn bất kỳ giá trị lũ của một năm riêng biệt nào.
Nó là điều kiện để thấy đợc biểu hiện của thời kỳ trớc và không chính xác với thời kỳ
sau của một hiện tợng. Thực chất, ta chấp nhận đó là giá trị trung bình tức là có
khoảng 20 con lũ trong 50 năm trong khoảng 1000 năm. Có thể hai con lũ trong 50
năm trong một dãy (với xác suất 0.02*0.02=0.0004 cho các hiện tợng xảy ra độc lập).
178



Khái niệm của thời kỳ lặp lại đòi hỏi các hiện tợng phải xảy ra độc lập và luôn
đợc tìm bằng việc phân tích chuỗi số liệu dòng chảy lớn nhất hàng năm (hay lợng
ma ). Hiện tợng lớn nhất trong một năm đợc coi là độc lập với các hiện tợng lớn
nhất trong bất kỳ một năm nào khác. Nhng nó cũng có thể ứng dụng cho n hiện tợng
lớn nhất độc lập trong một thời kỳ n năm, không xét năm mà chúng xảy ra.
Bảng 3.2. Moment của dòng chảy lũ hàng năm của Cpress Creek ở Horton, Texas năm 1945-1975.

Năm

Dòng chảy (m3/s)

Log10 dòng chảy

Dòng chảy TB

Log dòng chảy TB

1945

9,840

3.993

5,696

0.530

1946


5,170

3.713

1,026

0.25 1

1947

1,620

3.2 10

-2,524

-0.253

1948

235

2.37 1

-3,909

-1.092

1949


15,600

4.193

11,456

0.730

1950

4,740

3.676

596

0.213

1951

427

2.630

-3,717

-.832

1952


3,310

3.520

-834

0.057

1953

4,400

3.643

256

0.18 1

1954

7,760

3.890

3,616

0.427

1955


2,520

3.401

-1,624

-.06 1

1956

340

2.53 1

-3,804

-.93 1

1957

5,440

3.736

1,296

0.273

1958


3,000

3.477

-1144

0.014

1959

3,690

3.567

-454

0.104

1960

10,300

4.0 13

6,156

0.550

1961


6,260

3.797

2,116

0.334

1962

1,360

3.134

-2,784

-.329

1963

1,000

3.000

-3144

-.463

1964


2,770

3.442

-

1,374

-.020

1965

1,400

3.146

-2,744

-.3 17

1966

3,210

3.507

-934

0.044


1967

1,110

3.045

-3,034

-.4 17

1968

5,230

3.7 19

1,086

0.256

1969

4,300

3.633

156

0.17 1


1970

2,820

3.450

-

1,324

-.0 13

1971

1,900

3.279

-2,244

-.184

1972

3,980

3.600

164


0.137

1973

6,560

3.8 17

2,416

0.354

1974

4,710

3.673

566

0.2 10

1975

3,460

3.539

684


0.076

-

179


Trung bình

4.144

3.463

0

0

Tổng

128.462

107.345

0

0

CS1

1.659


-0.936

CS2

1.981

-1.117

Trong trờng hợp này, nếu nh hiện tợng thứ hai lớn nhất trong một năm lớn
hơn hiện tợng lớn nhất trong bất kỳ năm khác nó có thể đợc sử dụng trong phân tích
tần suất. Chuỗi n giá trị lớn nhất này (độc lập) đợc gọi là chuỗi vựơt trung bình, nh
chuỗi lớn nhất hàng năm. Cả hai chuỗi đều đợc sử dụng trong thuỷ văn với sai số nhỏ
trong thời kỳ nhiều năm (hiện tợng hiếm). Có rất nhiều mặt giống nhau của các hiện
tợng độc lập tuyệt đối khi sử dụng giá trị vợt trung bình nhiều năm, nhng đối với
chu kỳ lặp ngắn giá trị vợt trung bình có chu kỳ lặp nhỏ hơn thời kỳ cuả giá trị lớn
nhất hàng năm. Các quan hệ giữa các chu kỳ lặp dựa vào giá trị vợt trung bình Te và
giá trị lớn nhất hàng năm Tm là (Chow, 1964):
Te =

1
ln Tm ln(Tm 1)

(3.44)

Quan hệ này đợc trình bày trong hình 3.10.
Ví dụ 3.4

Giá trị vợt trung bình và giá trị cực đại hàng năm


Xem biểu số liệu lu lợng dòng chảy sông ngòi sau:
Năm

Ba lu lợng độc lập lớn nhất (m3/s)

1

700

300

150

2

900

600

100

3

550

400

200

4


850

650

350

5

500

350

100

Tần suất của giá trị vợt trung bình và gía trị cực đại hàng năm nh sau:

Cấp

Lớn nhất hàng năm

Vợt trung bình

1

900

900

2


850

850

3

700

700

4

550

650

5

500

600

Một lựa chọn khác là sử dụng toàn bộ số liệu trong quá khứ, chúng có thể độc lập
hay không độc lập. Nó đợc gọi là chuỗi tổng hợp, một ví dụ chuỗi dòng chảy 365 ngày
180


(từ đó giá trị vợt trung bình và giá trị lớn nhất đợc tìm). Thông tin về tần suất đợc
lấy từ chuỗi tổng hợp thờng đợc biểu diễn trong đờng cong quan hệ lu lợng - thời

gian (Seacy, 1959). Nó là các điểm độ lớn có thể lớn hơn hoặc bằng tỷ lệ thời gian - độ
lớn. Các thông tin từ phép phân tích không thể lấy trực tiếp từ số liệu trong chu kỳ lặp,
do các giá trị trong chuỗi số liệu hỗn hợp không nhất thiết độc lập.
Các chu kỳ lặp có thể đợc quy định thành các hiện tợng nhỏ nhất (nh mùa
kiệt) trong một dạng giống nhau với phép nội suy lớn hơn hay bằng giá trị trung bình.
Tuy dòng chảy lũ 20-năm có xác suất 5% mà lu lợng nhỏ hơn hoặc bằng một giá trị
cho trớc trong bất kỳ năm nào.

Hình 3.10. Đờng cong biểu diễn quan hệ chu kỳ lặp với giá trị trung bình
và giá trị cực đại hàng năm (theo phơng trình 3.44)

Cuối cùng chu kỳ lặp không cần phải giới hạn theo đơn vị năm. Các hiện tợng là
độc lập, các tháng hay các tuần có thể đợc sử dụng. Lu lợng 6 tháng tuy có xác suất
là 1/6 bằng hay lớn hơn bất kỳ một tháng nào đó trong năm.

3.5

Các mô hình phân bố xác suất cơ bản

Chủ quan và khách quan

Có rất nhiều hàm phân bố xác suất rời rạc và hàm mật độ xác suất liên tục đợc
sử dụng trong thuỷ văn nhng trong phần này chỉ nghiên cứu một vài dạng phổ biến
nhất. Các loại khác chỉ tham khảo trong các hợp phần thống kê thuỷ văn nh Gumbel
(1958), Chow(1964), Benjamin và Cornel, 1970 , Haan (1977), Kite (1977). Rất khó
khăn để có thể làm giảm số phân bố liên tục bởi vì ít nhất có đến 10 hàm đợc chọn để
181


áp dụng đối với một lu lợng lũ. Tuy vậy, các phân bố chủ yếu là phân bố chuẩn, phân

bố Gamma (Pearson-3), phân bố loga, phân bố log-Gamma (log-Pearson 3) và Gumbel
(giá trị cực đại loại I). Thêm nữa, phân bố mũ cũng đợc nghiên cứu do tính chất đơn
giản và những ứng dụng trong nhiều thời kỳ liên tiếp cuả nó.
Mục đích nghiên cứu của các phân tích rời rạc thờng giả định xác suất xảy ra
của mỗi hiện tợng, còn phân tích liên tục thờng là xác định độ lớn xác suất của mỗi
hiện tợng xảy ra. Đối với phân tích rời rạc, ở đây có thể đợc xem xét trong cả PMF và
CDF, nhng giá trị của phân tích liên tục trong PDF là ít khi đợc chú ý, chỉ cần xác
định các biến cố ngẫu nhiên liên tục trong CDF. Sự khác nhau này sẽ đợc thấy khi
xem xét các phân bố khác nhau đợc trình bày dới đây
Luật phân bố nhị thức

Nó rất thông dụng để xem xét một tần suất của các hiện tợng độc lập mà mỗi
kết quả của mỗi hiện tợng có thể đúng hay sai, ví dụ con lũ T năm có thể xảy ra hay
không xảy ra. Theo Bernoulli, các phép thử độc lập cho xác suất đúng của mỗi một lần
thử là một hằng số P. Phân bố nhị thức trả lời câu hỏi, xác suất chính xác của n phép
thử Bernoulli là bao nhiêu? Trong bài này chỉ nghiên cứu các phân bố là độc lập đợc
sử dụng rất phổ biến trong thuỷ văn.
Xác suất mà có giá trị x đúng và n-x là sai phải đợc tạo ra từ n hiện tợng xảy ra
độc lập: Px(1-P)n-x . Nhng điều này cho biết tần suất có khả năng x đúng và n-x là sai,
Tất cả tần suất này phải đợc xem xét, bao gồm trong đó cả những hiện tợng xảy ra và
không xảy ra liên tục. Các cách có thể kết hợp chọn x hiện tựơng ngoài n hiện tợng xảy
ra đợc cho bởi hệ số kết hợp (Parzen 1960):
n
n!
=
x x! (n x)!

(3.45)

Do đó, kỳ vọng xác suất là tạo ra từ xác suất của bất kỳ một tần suất hay số lần

mà tần suất đó có thể xảy ra .
n
P(x) = Px (1 P)nx ,
x

x = 0.1.2.3.....n

(3.46)

Chú ý B(n, p) cho biết các tham số n và p, ví dụ về các PMF đợc trình bày trong
hình 3.11 và từ các phơng trình 3.19 và 3.28, giá trị trung bình và giá trị phơng sai
của x là:
E(x) = np

(3.47)

Var(x) = np(1 - p)

(3.48)

Giá trị độ lệch là:
g=

1 2p
[np(1 p)]0.5

(3.49)

thực tế, độ lệch bằng 0 và phân bố là đối xứng nếu p = 0.5.
Hàm mật độ là:

F ( x) =

x

n

i p (1 p)
i=0



i

1 i

(3.50)

Kết quả của CDF có thể rất cồng kềnh đối với các giá trị n lớn và các giá trị trung
182


bình của x. Nó đợc sắp xếp thành bảng bởi Công ty hoá chất Rubber (n.d) và Chuaanr
quốc tế Burea (1950). Cho giá trị của n lớn các quan hệ giữa phân bố nhị thức và phân
bố Beta có thể đợc sử dụng (Abramowits và Stegun. 1964; Benjamin và Cornel, 1970 ),
hay hay nó đợc lấy xấp xỉ bởi phân bố chuẩn khi p = 0.5.

Ví dụ 3.5

Xác suất rủi ro và AN TOàN


Tần suất của n năm, xác suất mà một lần xảy ra trong chuỗi số liệu T năm là bao
nhiêu? Xác suất xảy ra trong bất kỳ một năm nào là p =1/T, và số lần xảy ra là B(n,p).
Xác suất (xảy ra một lần trong n hiện tợng) đợc gọi là xác suất rủi ro. Tuy xác suất
tối thiểu là tổng xác suất trong một con lũ, hai và ba con lũ, , n con lũ xảy ra trong
suốt thời kỳ n năm, nhng điều này sẽ không thuận lợi để tính toán nó. Thay vào đó:

Hình 3.11. Hàm khối lợng phân bố nhị thức (PMF).(theo Benjamin và Cornel, 1970. Hình 3.3.1)

Xác suất rủi ro

= 1 - P(0)
= 1 - P(hiện tợng trong n năm không xảy ra)
183


= 1 - (1-P)n
= 1 - (1-1/T)n

(3.51)

Xác suất an toàn đợc xác định nh sau:
= 1 - xác suất rủi ro
= (1-P)n
= (1-1/T)n

(3.52)

Khái niệm này của xác suất an toàn và xác suất rủi ro là rất quan trọng trong
thuỷ văn thực hành. Phơng trình 3.51 có thể đợc sử dụng để xác định các chu kỳ lặp
để đáp ứng yêu cầu của việc thiết kế và độ lớn của xác suất rủi ro. Các giá trị đợc trình

bày trong bảng 3.3 minh hoạ cho thời kỳ dài để đáp ứng cho thiết kế lâu dài và với xác
suất rủi ro thấp.
Ví dụ 3.6

Tiêu chuẩn thiết kế lũ

Xem xét con lũ có thời kỳ lặp lại là 50 năm (p = 0.02)
Xác suất rủi ro của một con lũ 50 năm sẽ xảy ra trong suất thời gian là 30 năm
của một dự án điều khiển lũ là bao nhiêu? Đây là xác suất rủi ro của các hiện tợng
không xảy ra khi xem xét ở trên, và phân bố của số lần không xảy ra là B(30,0.02). Do
đó từ phơng trình 3.51:
Xác suất rủi ro = 1 - (1 - 0.02)30
= 1 - 0.9830
= 1 - 0.545
= 0.455.
Nếu xác suất rủi ro này quá lớn, các kỹ s phải đa thời kỳ lặp lại của hiện tợng
lên 100 năm. Đối với xác suất rủi ro này là:
= 1 - 0.9930 = 0.26
và xác suất an toàn là 0.74. Sau trờng hợp này là có sự thay đổi 26% hiện tợng xảy ra
của chuỗi 100 năm trong thời kỳ 30 năm của dự án.
Xác suất của con lũ có thời kỳ lặp lại là 100 năm không xảy ra trong 10 năm là
bao nhiêu? và trong 100 năm?
Đối với n = 10, P(x = 0) = (1 - P)10 = 0.92
Đối với n = 100, P(x = 0) = (1 - P)100 = 0.37.
nh vậy có tỷ lệ 37% con lũ 100 năm sẽ không xảy ra trong 100 năm
Trờng hợp chung, xác suất rủi ro có lũ lớn hơn lũ T- nằm trong suất thời kỳ T
năm là bao nhiêu?
P(x = 0) = (1 - 1/T)T
Khi T là lớn thì giá trị này xấp xỉ 1/e (Benjamin và Cornel, 1970 , p 234), với t lớn:
P(x = 0) = e-1 = 0.368 (xác suất an toàn)


P(x > 0) =1 - e-1 = 0.632 (xác suất rủi ro)
184


Nh một xấp xỉ, lũ T năm sẽ xảy ra mà không cùng thời kỳ T năm với xấp xỉ xác
suất là 2/3.

Bảng 3.3. Các chu kỳ lặp cho sự thay đổi độ lớn của xác suất rủi ro và thiết kế

Thời gian vận hành n (năm)

An

Rủi

toàn

ro

2

5

10

15

20


25

50

100

75

25

2.0

4.1

7.7

11.3

14.9

18.5

36.6

72.6

63

37


2.6

5.5

10.6

15.6

20.6

25.6

50.8

101.1

50

50

3.4

7.7

14.9

22.1

29.4


36.6

72.6

144.8

40

60

4.4

10.3

20.1

29.9

39.7

49.4

98.4

196.3

30

70


6.1

14.5

28.5

42.6

56.6

70.6

140.7

280.9

25

75

7.5

17.9

35.3

52.6

70.0


87.4

174.3

348.1

20

80

9.5

22.9

45.3

67.7

90.1

112.5

224.6

448.6

15

85


12.8

31.3

62.0

92.8

123.6

154.3

308.2

615.8

10

90

19.5

48.0

95.4

142.9

190.3


237.8

475.1

949.6

5

95

39.5

98.0

195.5

292.9

390.4

487.9

975.3

1950.1

2

98


99.5

248.0

495.5

743.0

990.5

1238.0

2475.4

4950.3

1

99

199.5

498.0

995.5

1493.0

1990.5


2488.0

4975.5

9950.4

0.5

99.5

399.5

998.0

1995.5

2993.0

3990.5

4988.0

9975.5

19950.5

Ví dụ 3.7

Thiết kế đê


Một con đê đã đợc xây dựng để bảo vệ nhà cửa trong vùng ngập lụt và bảo vệ các
kênh lớn đợc hoàn thành. Đê đã xây dựng với hiện tợng lũ 20 năm. Để bảo vệ kênh
đòi hỏi 3 năm phải hoàn thành. Tuy nhiên, xác suất là B(3,0.05). Xác suất bằng bao
nhiêu khi:
a) Đê sẽ không vợt đỉnh trong 3 năm (xác suất tuyệt đối)?
xác suất an toàn = (1 - 1/20)3 = 0.86
b) Đê sẽ vợt đỉnh bất cứ một năm nào?
xác suất = 1/T = 0.05
c) Đê sẽ vợt một trong 3 năm?
3
p(x = 1) = p1 (1 p) 2 = 3.0,05.0.95 2 = 0.135
1

185


d) Đê sẽ vợt quá ít nhất 1 trong 3 năm?
xác suất rủi ro =1 - xác suất an toàn = 0.14
đ) Đê vợt trong 3 năm?
xác suất = (1 - p)(1 - p)p = 0.952 .0,05 = 0.045

Quy luật phân bố mũ

Khi nghiên cứu một quá trình ngẫu nhiên với các hiện tợng xảy ra độc lập, các
quá trình là ổn định (các tham số của quá trình là không thay đổi theo thời gian) và nó
không thể có nhiều hơn một trờng hợp tại một thời điểm xác định. Những điều kiện
này trình bày một quá trình Poisson (Benjamin và Cornel, 1970), thờng đặc trng cho
trờng hợp của các trận ma. Nếu biến ngẫu nhiên t cho biết khoảng thời gian (thời
gian cách nhau giữa các trận ma), nó đợc tìm để tạo phân bố mũ với PDF:
f ( t ) = e t


t0

(3.53)

PDF này đợc minh hoạ trong hình 3.12
Trị trung bình của phân bố là
E(t) = 1/ .

(3.54)

Var = 1/2 .

(3.55)

Và phơng sai là
Do đó luật phân bố này có tính chất thuận lợi khi mà giá trị trung bình của nó
bằng độ lệch chuẩn của nó, hay CV = 1, ở đây CV là hệ số biến đổi. Phân bố này thấy
đợc độ lệch về bên phải với hệ số độ bất đối xứng g = 2.
CDF có thể dễ dàng đợc xác định:
F ( t ) = e t d = 1 e t
t

0

Thực chất khi t tiến đến vô cùng, F = 1, (vùng ở dới PDF phải bằng 1)

Hình 3.12. Hàm mật độ phân bố xác suất mũ (PDF). Các tham số từ ví dụ 3.8.

186


(3.56)


Phân bố mũ có thể đợc vận dụng và kết quả đôi khi đợc lấy xấp xỉ các phân bố
lệch phức tạp hơn nh phân bố Gamma hay phân bố của giá trị vô cùng. Nó đôi khi
đợc sử dụng để đánh dấu các điểm tổng lợng ma hay lợng dòng chảy, nhng chủ
yếu ứng dụng cho những thời kỳ dài. Phân bố tơng ứng gần gũi là phân bố Poisson, là
PMF đối với các giá trị trong khoảng thời gian t, và Gamma, là PDF đối với khoảng thời
gian giữa hiện tợng bậc k xảy ra (Benjamin và Cornel, 1970 ).
Ví dụ 3.8

Khoảng thời gian cách nhau giữa các trận ma

Trong một năm nhất định nào đó có khoảng 110 trận ma xảy ra ở Gainesville,
Floria, và trung bình cứ 5,3 giờ có một trận. Không quan tâm đến sự thay đổi, có 8760
giờ trong một năm, khoảng thời gain trung bình là
(8760 - 110.5,3)/110 = 74.3 giờ
Luật phân bố mũ có thể áp dụng bằng phơng pháp moment với
1
= = 0.0135hr 1
t

a,Tìm xác suất ít nhất là 4 ngày giữa các trận ma
P (t 96) = 1- F(96) = e-0.0135.96 = 0.27
b, Tìm xác suất cách nhau 12 giờ giữa 2 trận ma
P(t = 12) = 0
Do xác suất mà một biến liên tục chính xác bằng một giá trị cụ thể = 0
c, Xác suất giữa 2 trận ma 12 giờ
P(t 12) = F(12) = 1-e-0.0135.12 = 0.15


Luật phân bố chuẩn

Luật phân bố chuẩn cũng đựơc biết nh là phân bố Gaussian hay đờng cong sai
số chuẩn và là luật phân bố cơ bản của phơng pháp xác suất thống kê. Một nguyên
nhân mà định lý giới hạn chỉ ra những điều kiện rất chung chung, nh số các biến cố
trong tổng trở nên lớn hơn, sự phân bố tổng số lớn các biến cố ngẫu nhiên sẽ xấp xỉ
phân bố chuẩn, không xét đến phần dới phân bố (Benjamin và Cornel, 1970). Có nhiều
các quá trình vật lý có thể đợc khái quát hoá nh là tổng các quá trình riêng lẻ. Tuy
nhiên luật phân bố chuẩn đã tìm ra nhiều ứng dụng trong thuỷ văn trong lĩnh vực
thống kê các giả thuyết, các khoảng riêng và kiểm tra chất lợng.
PDF đối với phân bố chuẩn (đờng bao- hình dạng đờng cong ) đợc trình bày
trong hình 3.13 và đợc viết bởi:

f ( x) =

1
2

e ((1 / 2 )( x à ) / )

2

- x

(3.57)

Các tham số của phân bố là trị trung bình và phơng sai, độ lệch = 0. Phơng
187



×