Tải bản đầy đủ (.pdf) (107 trang)

CÁC PHƯƠNG PHÁP THỐNG KÊ TRONG THUỶ VĂN - CHƯƠNG 2 doc

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.45 MB, 107 trang )

Chơng 2
Các qui luật cơ bản của phân bố xác suất ứng dụng
trong thuỷ văn
2.1 Tổng quan
Khi dựa trên lý thuyết đờng cong phân bố mật độ xác suất đã xét trong
chơng 1, các thủ thuật đơn giản nhất của việc sơ đồ hoá và khái quát các tập thống
kê có thể thực hiện hoàn chỉnh và thể hiện dới dạng chung nhất.
Đờng cong phân bố nhận đợc đối với các sơ đồ thống kê khác nhau tạo
thành một hệ thống phát triển của khái quát toán học có lợi cho việc mô tả các tónh
chất hạng rộng của hiện tợng ngẫu nhiên.
Các dạng đờng cong phân bố khác nhau hoặc dựa trên các sơ đồ xác suất tập
trung đợc xác định về mặt lý thuyết , hoặc tự thể hiện sự khái quát hoá các qui luật
thống kê đặc trng cho các phạm trù xác định của tập thực nghiệm.
Tuy nhiên, trong bất kỳ trờng hợp nào các đờng cong phân bố xác suất
trong thể trừu tợng đều phản ánh qui luật thống kê thực đặc trng bởi các hiện
tợng ngẫu nhiên đại chúng.
Hình thức biểu diễn các qui luật phân bố liên quan chặt chẽ với việc chia đại
lợng ngẫu nhiên ra các dạng liên tục và rời rạc.
Đại lợng ngẫu nhiên rời rạc là biến của tệp (tập hợp) có thể thể hiện ở dạng
liệt xác định bằng số x1, x2, , xn, Khi giải các bài toán thực hành khác thờng
có vấn đề với đại lợng ngẫu nhiên chỉ nhận các giá trị nguyên. Để lấy ví dụ về tập
thuỷ văn đại lợng ngẫu nhiên rời rạc có thể chỉ ra số khô hạn sông ngòi vào mỗi
năm trong mùa hè nhận đợc từ N năm trên phân bố xê -ri các năm ít và nhiều nớc.
Khi nghiên cứu các tập thống kê các hiện tợng thiên nhiên thờng có vấn đề
với các đại lợng ngẫu nhiên liên tục, có nghĩa là với các hiện tợng mà kết quả thử
có thể nhận mọi giá trị trong giới hạn khoảng đang xét. Các đại l
ợng nh vậy là sai
số đo đạc và giá trị thành phần tập các đặc trng khác nhau của chế độ thuỷ văn (lu
lợng nớc và phù sa, mực nớc, vận tốc dòng chảy v.v ). Rõ ràng khi mô tả phân
bố các đại lợng nh vậy về nguyên tắc không thể viết và đánh số tất cả chúng vào
một liệt xác định, thậm chí trong giới hạn khoảng đủ hẹp. Các đại lợng này tạo nên



56
một tập vô hạn. Nếu khi xét tập các đại lợng ngẫu nhiên rời rạc có thể gắn mỗi giá
trị của nó x1, x2, , xn, với một xác suất đặc trng xác định bởi nó p(xi) thì trong
trờng hợp liệt liên tục các đại lợng ngẫu nhiên chỉ có thể nói về xác suất rơi vào
khoảng cho trớc của nó (bù là rất nhỏ).
Thực tiễn, khi nghiên cứu các tập thống kê các đại lợng ngẫu nhiên liên tục
chặt chẽ dùng phép tính bởi các thủ thuật nhóm và mô tả đồ thị các tập thống kê đã
trình bày trong chơng 1.
Khi phân tích lý thuyết các đại lợng ngẫu nhiên liên tục thay tần số thực
nghiệm bởi mật độ phân bố xác suất và tơng ứng là thay mômen thực nghiệm bằng
biểu thức tích phân của chúng.
áp dụng cho việc nghiên cứu các qui luật phân bố tập các đại lợng ngẫu
nhiên rời rạc sẽ trình bày qui luật phân bố nhị thức và phân bố Piecson III, khi xét
nó nh trờng hợp riêng của qui luật phân bố nhị thức. Tiếp theo trên cơ sở ngoại
suy phổ biến qui luật phân bố nhị thức khởi điểm trong trờng hợp các đại lợng
liên tục và nh vậy đã chuyển tới phân bố gamma hoặc đờng cong Piecson III và
dẫn tới hệ quả do S. N. Krixki và M. Ph. Menkel cũng nh G. N. Brocovits thực
hiện. Khi có sự ứng dụng rộng rãi trong thuỷ văn qui luật phân bố nhị thức ta coi nó
là cơ sở khi trình bày qui luật phân bố chuẩn.
Từ các đờng cong phân bố khác nhau xét các phơng trình Gudrits và
Gumbel đợc sử dụng u thế trong thực tiễn thuỷ văn ở nớc ngoài.
Từ số các biến đổi đa dạng biến ngẫu nhiên dừng một cách chi tiết ở biến đổi
logarit thỉnh thoảng vẫn đợc sử dụng khi tính toán dòng chảy trong nớc và nớc
ngoài.
Khảo cứu các đờng cong đảm bảo thực nghiệm đặc thù khái quát của các
đặc tr
ng thuỷ văn khác nhau xét ví dụ nghiên cứu của G. P. Kalinhin và L. M.
Konarevski. Một số phân bố có các giá trị bổ sung khi tính toán thuỷ văn có thể
trình bày theo mức độ cần thiết trong các chơng khác. Các phân bố đó là phân bố

Student, Phiser,
2
và các phân bố khác sử dụng khi phân tích mẫu các biến ngẫu
nhiên .
Biểu thức giải tích của đờng cong phân bố mô tả tốt nhất tập thực nghiệm
các đại lợng ngẫu nhiên có thể thu đợc bằng nhiều phơng pháp , về số lợng tuy
rằng hạn chế khi thực hiện các điều kiện chung sau đây.

57
1. Hiển nhiên, đờng cong phân bố cần dựa trên một sơ đồ thống kê xác định
mà dới tác động của nó tạo nên hiện tợng ngẫu nhiên này hoặc kia. Vậy, ví dụ
qui luật phân bố chuẩn xuất hiện trong các trờng hợp khi mà đại lợng ngẫu nhiên
đang nghiên cứu có thể thể hiện dới dạng tổng (hoặc hàm tuyến tính) một số lớn
các số hạng thành phần (nhân tố) độc lập với nhau, mỗi số ảnh hởng nhỏ tới tổng.
Nếu điều kiện cuối cùng đợc thoả mãn và ảnh hởng của một số trong các số hạng
hình thành đại lợng ngẫu nhiên chiếm u thế thì đặc điểm của phân bố số hạng đó
ảnh hởng tới qui luật phân bố của đại lợng ngẫu nhiên đang nghiên cứu. Khi nhận
làm cơ sở sơ đồ lý thuyết mối liên hệ của sự xuất hiện đại lợng ngẫu nhiên không
phải là tổng mà là tích một số đủ lớn các tác động thành phần hay nói cách khác vào
tổng của các logarit của chúng ta thu đơcj qui luật phân bố logarit chuẩn. Khi giới
hạn bằng các ví dụ này ta thấy ý nghĩa thống kê khác, khi xét các qui luật phân bố
sẽ đợc làm sáng tỏ khi trình bày chúng.
2. Trong phơng trình đờng cong phân bố cần phải giảm các tham số, xác
định bằng số theo số liệu thực nghiệm. Điều kiện này rất quan trọng khi phân tích
thống kê các dao động nhiều năm của các đại lợng thuỷ văn vì tập thống kê của
chúng thờng hạn chế bởi vài chục số hạng (năm quan trắc).
Cùng với nó ta còn biết rằng các tham số phơng trình đờng cong phân bố
đợc xác định với sai số càng lớn thì tệp thống kê càng nhỏ và đại lợng mômen
thống kê càng cao dùng để tính toán các tham số đờng cong phân bố. Thật vậy, nếu
nh giá trị trung bình số học và hệ số biến đổi nằm trong tham số phơng trình

đờng cong phân bố có thể xác định theo các tập thống kê một cách thông th
ờng
theo cách của các nhà thuỷ văn có độ tin cậy tơng đối, thì tính toán hệ số bất đối
xứng theo chuỗi nhân tạo, tức là gắn với tuyến đo thuỷ văn xác định với sai số lớn;
xác định độ nhọn trong các trờng hợp nh vậy hoàn toàn mất ý nghĩa do sai số quá
lớn.
Liên quan tơí điều đang bàn trên tham số này với tính toán thuỷ văn hầu nh
không sử dụng. Cho nên khi giải các bài toán thuỷ văn ngời ta chỉ sử dụng các
phơng trình đờng cong phân bố chỉ có hai hoặc cùng lắm là ba tham số xác định
theo tập thống kê ban đầu ( trung bình số học, hệ số biến đổi, hệ số bất đối xứng).
Có thể nhận thấy rằng hầu nh với các tính toán thống kê ngời ta sử dụng không
quá 4 tham số để xác định dạng đờng cong phân bố.
Ngoài các yêu cầu chung đã nêu trên trong quan hệ của phơng trình đờng
cong phân bố , khi phân tích thống kê dao động nhiều năm của dòng chảy sông
ngòi xuất hiện cả các điều kiện phụ. Do vậy, đại lợng dòng chảy sông ngòi là thực

58
dơng, đờng cong phân bố mô tả dao động của chúng không đợc cắt vào phần giá
trị âm, vì nó mâu thuẫn với bản chất vật lý của hiện tợng đang xét.
Sự hạn chế của các đờng cong phân bố bởi giới hạn trên không thực hiện
đợc vì không có các thủ thuật tơng xứng căn bản điều chỉnh nó. Có những tìm tòi
xác định giá trị khả năng lớn nhất của đặc trng dòng chảy đang xét thờng dẫn tới
không phải là cực đại tuyệt đối mà là đại lợng đợc xem nh là một giá trị nào đó
có xác suất vợt bé. Ngoài ra, trong thực tiễn tính toán thuỷ văn ngời ta không sử
dụng giá trị xác suất vợt hàng năm, tiến tới 0 mà nhận một xác suất hữu hạn đủ
thực, chặn bởi các giá trị đảm bảo trên nguyên tắc 1; 0,1% và đôi khi trong các
trờng hợp hiếm 0,01%.
Nh vậy, thiếu hạn chế đờng cong phân bố từ phía các đại lợng lu lợng
nớc lớn trong khoảng ngoại suy không mâu thuẫn với bản chất vật lý của dao động
dòng chảy sông ngòi và không đi tới lời giải không thực tế, tức là vơí việc nhận các

giá trị dòng chảy tính toán lệch nhiều các đại lợng lấy từ tài liệu đo đạc thuỷ văn.
Có thể nhận thấy rằng các tìm kiếm ứng dụng đờng cong phân bố giới hạn
từ phía các đại lợng dòng chảy lớn bởi một giới hạn cố định nào đó trong nhiều
trờng hợp dẫn tới nhận đợc các đại lợng dòng chảy tính toán thậm chí vợt quá
các đờng cong tơng ứng với việc xoá không hạn chế trong vùng các đại lợng
dơng. Tất nhiên điều đó liên quan với tính không xác định của việc thành lập giới
hạn trên. Thêm vào đó có thể nói rằng nhiều ví dụ sử dụng các đ
ờng cong phân bố
không giới hạn trong khoa học và trong kỹ thuật để mô tả chuỗi thống kê không thể
vô cùng lớn với suất đảm bảo tiến tới 0. Ví dụ nh sai số kích thớc khi chuẩn bị chi
tiết này hay chi tiết kia thờng đợc mô tả bởi qui luật phân bố chuẩn traỉ dài từ -
đến , mặc dù biết rằng sai số chuẩn bị chi tiết không thể lớn vô hạn do đại lợng
của chi tiết hạn chế bởi kích thớc chuẩn bị sử dụng khi xử lý.
Các hình ảnh nêu trên, cũng nh ớc lợng sự tơng ứng của sơ đồ lý thuyết
phân bố xác suất với tài liệu quan trắc thuỷ văn chứng tỏ rằng việc sử dụng các
đờng cong phân bố không hạn chế bởi các giá trị lớn không dẫn tới mâu thuẫn với
bản chất vật lý của tập các đại lợng thuỷ văn và có thể đợc xét nh là phơng tiện
hoàn toàn chấp nhận của mô tả toán học các qui luật thống kê trong giới hạn suất
đảm bảo sử dụng thực tế.
Nh vậy, đối với đờng cong phân bố sử dụng để mô tả dao động dòng chảy
sông ngòi nhiều năm và chuỗi các tham số khác của chế độ thuỷ văn (x), có thể đặt
các điều kiện biên sau: 0 x < .

59
Thờng các đờng cong phân bố lý thuyết sử dụng trong thuỷ văn thoả mãn
điều kiện đơn đỉnh. Nó sinh ra nh là hậu quả của yêu cầu đồng nhất và độc lập
ngẫu nhiên của các đại lợng thuỷ văn đang xét . Thật vậy, tính đa đỉnh của phân bố
là hậu quả của việc thống nhất một vài tệp với các phân bố rất khác nhau . Nhng do
khi giải các bài toán thuỷ văn thờng dùng phép với các đại lợng đồng pha, tất
nhiên dự đoán rằng phân bố của chúng sẽ đơn đỉnh. Do đờng cong phân bố sử

dụng khi giải các bài toán tính toán dòng chảy sông ngòi ở dạng vi phân cần có dạng
chung nh sau: bắt đầu từ một giá trị dơng nào đó (hoặc 0), sau đó khi tăng đạt tới
giá trị cực đại (đỉnh) và khi hạ đi vào vùng đại lợng vô cùng lớn.
Sử dụng các đờng cong phân bố giải tích cho phép thực hiện việc làm trơn
các phân bố thực nghiệm, nhấn mạnh khi đó các nét qui luật nhất của tệp thống kê
đang xét và loại trừ các áp đặt ngẫu nhiên của số liệu thực nghiệm chỉ đặc trng cho
mẫu đợc chọn và không mang tính qui luật theo toàn bộ tập tổng thể. Sử dụng các
đờng cong phân bố giải tích cho khả năng thành lập các qui luật thống kê dặc thù
cho dãy các đại lợng ngẫu nhiên đặc trng cho một và chỉ một hiện tợng nhng
đợc hình thành trong các điều kiện bản chất khác nhau. Cụ thể, sự thành lập tơng
tự đợc ứng dụng rộng rãi trong các nghiên cứu thuỷ văn với mục đích làm sáng tỏ
các qui luật thống kê đặc thù cho chuỗi dòng chảy năm và dòng chảy cực đại . Với
sự mô tả phân tích nhờ đờng cong phân bố chuỗi tạo ra trên cơ sở tài liệu quan trắc
nảy sinh các bài toán cơ bản sau:
1. Chọn các đờng cong phân bố phù hợp nhất với tập thống kê đang xét.
Trong điều kiện sử dụng chọn lọc hạn chế theo số lợng các số liệu thuỷ văn dạng
hàm phân bố thờng ban đầu đợc chọn trên cơ sở tính đến các luận điểm chung, cụ
thể là sự phù hợp của qui luật phân bố ứng dụng bởi các điều kiện biên thay đổi các
đặc trng thuỷ văn đang xét. Tiếp theo tiến hành sự kiểm tra rộng rãi (ứng dụng cho
các điều kiện khác nhau của sông ngòi ) tiính phù hợp của qui luật phân bố xác suất
đang nhận với tài liệu thực nghiệm. Sự kiểm tra này ở giai đoạn đầu sử dụng đờng
cong phân bố để tính toán các đặc trng thuỷ văn đợc hoàn thành trên cơ sở so
sánh trực tiếp các đờng cong đảm bảo giải tích và thực nghiệm. Tiếp theo là thử các
thủ thuật ớc lợng khách quan nh chỉ tiêu thống kê
2
, chỉ tiêu Kolmogorov -
Smirnov và v.v
2. Sau khi chọn dạng hàm phân bố nảy sinh bài toán xác định giá trị số của
các tham số hàm đó, chúng đợc tính theo số liệu quan trắc cho đặc trng dòng chảy
này hoặc kia của thành phần nào đó thuộc chế độ thuỷ văn sông ngòi. Sự lựa chọn

đúng hàm phân bố và các tham số bằng số của nó xác định theo số liệu thực nghiệm

60
( trung bình số học, hệ số biến đổi, hệ số bất đối xứng), đảm bảo từ quan điểm
nguyên tắc bình phơng tối thiểu, sự làm trơn tốt nhất phân bố thực nghiệm .
3. Khi xét các sai số có thể của việc xác định tham số phân bố bị chi phối bởi
tính hạn chế của lựa chọn đang xét trong tính toán quan trọng là đánh giá định lợng
các sai số đó. Sự đánh giá nh vậy đợc thực hiện hoặc nhờ sử dụng công thức lý
thuyết rút ra một vài hạn chế, hoặc với ứng dụng phơng pháp thực nghiệm thống
kê.
2.2 Qui luật phân bố nhị thức rời rạc
Trong thực tiễn tính toán thuỷ văn đờng cong Piecson III đợc phổ biến
rộng rãi nhất khi thể hiện khái quát đờng cong phân bố nhị thức đối với trờng hợp
đại lợng ngẫu nhiên liên tục. Qui luật phân bố nhị thức tơng ứng với việc lặp một
thí ngjiệm duy nhất với các điều kiện không đổi và chỉ có hai kết quả xuất hiện (xác
suất p) và không xuất hiện (xác suất q = 1- p) của biến cố ngẫu nhiên . Mỗi giá trị
của đại lợng ngẫu nhiên phân bố theo qui luật phân bố nhị thức thể hiện số trờng
hợp (m) thực hiện đợc biến cố ngẫu nhiên nào đó từ n trờng hợp có thể.
Trình bày sơ đồ qui luật phân bố nhị thức có thể thực hiện đợc nhờ các định
lý cộng và nhân xác suất .
Theo định lý cộng xác suất suy ra rằng xác suất xuất hiện một biến cố độc
lập không báo trớc bằng tổng xác suất của các biến cố đó, hoặc nói cách khác là
nếu biến cố ngẫu nhiên A có thể xuất hiện ở một số dạng A
1
, A
2
, A
3
, , A
n

, có các
xác suất khác nhau - p
1
, p
2
, , p
n
, thì xác suất xuất hiện đại lợng A ở dạng A
1
, A
2
,
A
3
, , A
k
, (k<n) sẽ bằng tổng xác suất các biến cố A
1
, A
2
, A
3
, , A
k
, tức là:
P = p
1
+ p
2
+ + P

k
Có khi ngời ta viết định lý này dới dạng:
),K(p )B(p)A(p)K BA(P
+
+
+
=

Các biến cố A, B, , K là độc lập. Ký hiệu

có nghĩa là "hoặc".
Theo định lý nhân xác suất suy ra rằng xác suất trùng của một vài biến cố
ngẫu nhiên độc lập bằng tích xác suất của chúng.

61
Biến cố ngẫu nhiên độc lập đợc hiểu là các biến cố mà kết quả thử nghiệm
lần sau không phụ thuộc vào lần trớc, và do vậy lần thử sau không thể đoán trên cơ
sở thực hiện những lần thử trớc.
Định lý nhân xác suất thờng đợc viết dới dạng:
P(AB K) = p(A)p(B) p(K).
Khi đó cũng giả thiết rằng biến cố A, B, , K là độc lập với nhau.
Tơng ứng với nhứng điều nêu trên qui luật phân bố nhị thức nhận đợc khi
giải quyết bài toán sau:
Tiến hành n lần thử độc lập, mà kết quả thử biến cố có thể nhận các giá trị
dơng 0, 1, 2, , n với các xác suất p
0
, p
1
, p
2

, , p
n
. Xác suất xuất hiện biến cố A
duy nhất bằng p, còn xác suất xuất hiện biến cố ngợc B (không xuất hiện A) bằng
q. Yêu cầu xác định xác suất P
m
xuất hiện biến cố A m lần với n lần thử.
Trong các phụ lục kỹ thuật biến cố A đợc hiểu là lợng sản phẩm tốt trong
dung lợng nào đó của tập, còn biến cố ngợc là sản phẩm có lỗi. Đã có lần thử [58]
xét các tập thống kê đại lợng dòng chảy từ quan điểm của qui luật phân bố nhị thức
. Trong trờng hợp đó biến cố A coi là thời đoạn ma, trong thời gian đó dòng chảy
đợc hình thành, và biến cố ngợc là thời đoạn không ma. Khi đó ngời ta coi rằng
bắt đầu thời đoạn ma và không ma là các biến cố độc lập, do vậy xác suất thời
đoạn ma (p) và không ma (q) là không đổi trong mọi lần thử. Trong các xây dựng
lý thuyết xác suất kinh điển coi mô hình qui luật phân bố nhị thức thờng xét sơ đồ
cuốn hút (với vòng quay tiếp theo) các quả cầu trong lồng chứa p cầu đên và q cầu
trắng. Rõ ràng các ví dụ trên đều dẫn tới một sơ đồ toán học thống nhất. Vì lẽ đó ta
copi kết luận qui luật phân bố nhị thức là bối cảnh chung của bài toán.
Trong trờng hợp khi thực hiện thí nghiệm cần xuất hiện một trong hai biến
cố A hoặc B có xác suất p hoặc q và tổng xác suất của chúng p + q = 1, vì biết chắc
chắn rằng hoặc A, hoặc B trong thí nghiệm sẽ đợc thực hiện.
Xét tuần tự các trờng hợp với 2, 3, 4 lần thử, sau đó khái quát cho n lần thử.
Nếu xác suất biến cố với 1 lần thử bằng p, thì với 2 lần thử khả năng xảy ra biến cố
A 0 lần (tức là không xảy ra biến cố A, cả hai lần đều xuất hiện biến cố B), 1, 2 lần.
Trên cơ sở lý thuyết nhân và cộng xác suất tơng ứng sẽ bằng:
P
0
= qq; P
1
= pq+qp; P

2
= pp

62
Nh vậy, xác suất P(m) xuất hiện biến cố m lần (0; 1; 2) trong hai lần thử
(n=2) có phân bố nh sau:
m 0 1 2
P(
m)
q
2
2p
q
p
2
Đối với ba lần thử (n=3) tơng tự ta nhận đợc:
m .

0 1 2 3
P
(m)
.

q
3
3
pq
2
3
p

2
q
p
3
Phân bố xác suất này tơng ứng với phân bố số hạng của nhị thức:
(p+q)
2
= p
2
+ 2pq + q
2
(p+q)
3
=p
3
+3p
2
q+3pq
2
+p
3
Thấy rằng số trờng hợp xuất hiện (hay không xuất hiện ) đại lợng A trong
mỗi phân bố bằng n+1. Qui luật phân bố xác suất trên dễ dàng mở rộng cho số lần
thử không hạn chế. Giả sử thí nghiệm n lần. Không cần xét tới trật tự xuất hiện biến
cố ngẫu nhiên có thể thực hiện cho lần n+1 tiếp theo:
1) không xuất hiện n lần biến cố A
2) xuất hiện (n-1) lần biến cố B và 1 lần biến cố A
3) xuất hiện (n-2) lần biến cố B và 2 lần biến cố A

m+1) xuất hiện (n-m) lần biến cố B và m lần biến cố A, v.v

n) xuất hiện 1 lần biến cố B và ( n-1) lần biến cố A
n+1) xuất hiện n lần biến cố A.
Xác suất trờng hợp thứ nhất là q
n
. Trờng hợp thứ hai có thể xảy ra một
trong các dạng: hoặc là xuất hiện biến cố A trong lần thử thứ nhất, hoặc lần thứ hai,

63
hoặc lần thứ ba, v.v cho đến lần cuối cùng, hơn nữa trong mọi trờng hợp còn lại
đều xuất hiện biến cố B; xác suất mỗi biến cố trong các dạng này bằng nhau và bằng
q
n-1
p, vì số lợng các dạng này bằng n, nên xác suất trờng hợp thứ hai sẽ bằng:
P
2
= nq
n-1
p
Trong trờng hợp thứ ba xác suất mỗi dạng bằng q
n-2
p, còn số dạng khi thực
hiện trờng hợp thứ ba, tất nhiên, bằng số kết hợp từ n thành tố theo 2, tức là:
.
n
)1n(n
C
2
n

=


Suy ra xác suất trờng hợp thứ ba bằng:
.pqCP
22n2
n3

=

Bằng cách tơng tự có thể tìm thấy xác suất mọi trờng hợp còn lại.
Phù hợp với qui luật phân bố nhị thức đã trình bày, khái quát cho n thành
viên, có thể viết dới dạng sau:
.1pnqp pq
!
m
)1mn) (1n(n
pq
!3
)2n)(1n(n
pq
!2
)1n(n
pnqq)pq(
n1nmmn
33n22n1nnn
=+++
+
+
+



+

++=+


(2.1)
Tổng tất nhiên là bằng 1, vì q+p=1
Xác suất rằng biến cố B xuất hiện (n-m) lần, còn biến cố A xuất hiện m lần,
sẽ bằng:
,pqC)m(P
mmnm
n

= (2.2)
hoặc:
,pq
)!mn(!m
!n
pq
)!mn(!m
)1mn) (1n(n
)m(P
mmnmmn

=

+

=
(2.3)

tức là bằng thành viên thứ (n-m) , hoặc thành viên chứa đại lợng p
m
trong
khai triển nhị thức (q+p)
m
. Phân bố nh thế gọi là nhị thức.
Kết luận trên trực tiếp suy ra từ sơ đồ lập luận gắn ớc lợng xác suất không
liên tục ( rời rạc ) của đại lợng ngẫu nhiên đợc ký hiệu qua m.

64
Dạng chung của qui luật phân bố nhị thức với n và p khác nhau thể hiện trên
h.2.1. Khi p=0,5 qui luật phân bố nhị thức đối xứng, Nó tiến tới đối xứng với n tăng
và ngay cả khi p 0,5, hơn thế còn đạt tới giới hạn nhanh hơn khi p càng gần giá trị
0,5. Với p < 0,5 qui luật phân bố nhị thức lệch trái (dơng), khi p > 0,5 - lệch phải
(âm).
Kỳ vọng toán học [E(m)] đại lợng ngẫu nhiên rời rạc m, phân bố theo qui
f) e)d)
c) b)
a)
Hình. 2.1 Phân bố nhị thức rời rạc với các tham số n và p khác nhau
a) n=10, p=0,8; b) n=10, p=0,5; c) n=10, p=0,2; d) n=5, p=0,2; e) n=20, p=0,2;
f)n=15, p=0,2.
luật nhị thức, bằng
np)m(Em ==
(2.4)
Đẳng thức (2.4) nhận đợc nh sau. Khi sử dụng công thức (2.2) cũng nh
biểu thức (1.3) và q=1-p, ta có:

=


=

=



====
n
0m
mnm
n
0m
mnmm
n
n
0m
nn
.)p1(p
)!mn(!m
!n
m)p1(pmC)m(mP)m(Em

Với m=0, số hạng thứ nhất bằng không. Vì thế lấy tổng bắt đầu từ m=1. Đa
np ra khỏi dấu tổng, ta có:


=





==
1n
1m
mn1m
.)p1(p
)!mn()!1m(
)!1n(
np)m(Em


65
Trong đẳng thức cuối cùng dùng phép thế y = m-1 và z = n-1; kết quả nhận
đợc:


=



==
1n
1m
yzy
,)p1(p
)!yz(!y
!z
np)m(Em

vì n-m = z+1-(y+1) = z-y. Do đó tổng trong đẳng thức này so với (2.1) bằng

1, và ta có
npm =
.
Dẫn công thức để phơng sai đại lợng rời rạc phân bố theo qui luật nhị thức:
.mm
n
m
m2mm
n
mm2mm
n
)mm(
)m(
2
n
0m
2
n
0m
2
n
0m
2
n
0m
n
0m
2
n
0m

2
n
0m
2
2
=+=
=
+
=

=




=
=
=
====

Kỳ vọng toán học m
2
bằng:

====
+===
n
0m
n
0m

n
0m
2
n
0m
22
),m(mP)m(P)1m(m)m(Pmm)m(E
với P(m) - qui luật phân bố nhị thức đại lợng ngẫu nhiên m. Tổng thứ hai
trong biểu thức trên là kỳ vọng toán học (1.3). Số hạng đầu tiên có thể thể hiện dới
dạng
.)p1(p
)!mn(!m
!n
)1m(m
)p1(pC)1m(m)m(P)1m(m
mnm
n
0m
n
0m
n
0m
mnmm
n

=
==




=
=



Đa ra khỏi dấu tổng n(n-1)p
2
và thay đổi giới hạn tổng:
.)p1(p
)!mn()!2m(
)!2n(
p)1n(n)m(P)1m(m
mn2m
n
2m
2
n
0m

==



==

Đa vào các ký hiệu mới: y=m-2 và z=n-2, khi đó:

66
.p)1n(n)p1(pCp)1n(n)m(P)1m(m
2yzy

z
0y
z
y
2
n
0m
===

==

Trong biểu thức ban đầu đối với phơng sai thay các số hạng vừa nhận đợc:
,npq)p1(np)np1pnp(np
]np1)1n(p[nppnnpp)1n(n
m)m(mP)m(P)1m(mmm)m(
222
n
0m
2
n
0m
2
n
0m
22
==+=
=+=+=
=+==

===


vì :
222
n
0m
pnm
npm)m(mP
=
==

=

Nh vậy, phơng sai của đại lợng ngẫu nhiên m phân bố theo qui luật nhị
thức, bằng:
npq)p1(np)m(
2
== (2.5)
Mômen trung tâm bậc ba đối với qui luật phân bố nhị thức dẫn ra không diễn
giải, vì đã có trong sách của Mitropolski[89],
)pq(npq
3
=à (2.6)
Biểu diễn các tham số của phân bố đang xét thông qua các đại lợng thờng
ứng dụng trong thuỷ văn - hệ số biến đổi và hệ số bất đối xứng. Tính đến (1.22),
(1.27), (2.4)-(2.6), ta đợc:
,
np
q
np
npq

m
C
m
v
==

=
(2.7)
.
q
)np(
q
pn
q
pnpqn
q
)np(npq
np
q
)pq(npq
C
C
5
2/3
2/52/5
2/3
2/32/3
3
3
3

3
v
3
s
====









=
à
=
(2.8)
Sơ đồ nhị thức đối với phân bố rời rạc các đại lợng có thể tìm thấy ứng dụng
khi giải một số bài toán thuỷ văn. Xét ví dụ sau. Trong kết quả quan trắc trên một
số con sông xác định rằng trong vòng 20 năm quan sát thấy 4 trờng hợp sông khô
cạn. Yêu cầu xác định xác suất cho thời kỳ 20 năm có thể quan sát thấy sông khô
cạn từ 2 đến 10 trờng hợp.

67
Để áp dụng qui luật nhị thức ở dạng (2.2) cần biết giá trị tham số P, mà nó
trong đa số các trờng hợp phụ lục thuỷ văn không biết trớc. Cho nên xác định nó
đợc thực hiện xấp xỉ trên cơ sở các số liệu thực nghiệm.Khi giải các bài toán tơng
tự coi ớc lợng P là tỷ số:
,

n
m
P =
(2.9)
với m - số kết quả thuận lợi; n - số lần thử.
Khi sử dụng công thức (2.9), ta có:
.2,0
20
4
P ==

Sai số trong việc xác định P, tính theo công thức (2.9) càng lớn nếu số lần thử
càng ít. Giới hạn dao động có thể của đại lợng ngẫu nhiên (chẳng hạn nh P, xác
định theo mẫu ngẫu nhiên) đợc đánh giá trong thống kê với việc sử dụng khái niệm
khoảng tin cậy, chỉ ra các giới hạn, mà trong khuon khổ của nó các đại lợng đang
xét có thể thay đổi với các mức xác suất khác nhau. Khoảng tin cậy đảm bảo khoảng
95 và 99% đối với P trong trờng hợp phân bố nhị thứccó thể nhận đợc khi sử dụng
tuỳ thuộc trên hình 2.2 và 2.3. Trên các hình này thấy rằng đối với P nhận đợc P =
0,2 và n = 20 giới hạn tin cậy 99% của P là 0,02 và 0,39. Rõ ràng khi tăng thời gian
quan trắc (n) giới hạn tin cậy sẽ nhỏ hơn.Theo biểu thức (2.2) ta tính xác suất cho 20
năm sẽ là tuần tự 1, 2, . . . , 10 trờng hợp với sông khô cạn trong mùa hè:
.000086,08,0.2,0.C)12(P
,0005,08,0.2,0.C)11(P
,002,08,0.2,0.C)10(P
,0074,08,0.2,0.C)9(P
,0221,08,0.2,0.C)8(P
,0540,08,0.2,0.C)7(
P
,1090,08,0.2,0.C)6(P
,1746,08,0.2,0.C)5(P

,2180,08,0.2,0.C)4(P
,2050,08,0.2,0.C)3(P
,137,08,0.2,0.C)2(P
,0576,08,0.2,0.C)1
(P
,0115,08,0.2,0.C)0(P
81212
20
20
91111
20
20
101010
20
20
1199
20
20
1288
20
20
1377
20
20
1466
20
20
1555
20
20

1644
20
20
1733
20
20
1822
20
20
1911
20
20
2000
20
20
==
==
==
==
==
==
==
==
==
==
==
==
==



68
Hệ số nhị thức
với n nhỏ có thể đợc xác định khá đơn giản từ tam giác
Pascal:
m
n
C
n
Hệ số

m
n
C
0 1
1 1 1
2 1 2 1
3 1 3 3 1
4 1 4 6 4 1
5 1 5 10 10 5 1
6 1 6 15 20 15 6 1
7 1 7 21 35 35 21 7 1
8 1 8 28 56 70 56 28 8 1
. . . . . . . . . . .
Giá trị số của các hệ số mỗi dòng ngang tiếp theo trong giới hạn tam giác
Pascal đợc nhận bằng tổng hai số phân bố ở dòng trớc đó về hai phía trái và phải
của hệ số đó.
Đồ thị phân bố với n = 20 và p = 0,2 thể hiện trên h. 2.1 d: giá trị trung bình
của đại lợng ngẫu nhiên m phù hợp với công thức (2.4) trong trờng hợp đang xét
là m = 20.0,2 = 4.
Thực vậy, với m = 4 quan sát thấy xác suất cực đại cho 4 trờng hợp của 20

năm đợc ghi nhận sông khô cạn vào mùa hè. Rõ ràng rằng với giá trị m càng nhỏ
và lớn hơn 4 xác suất này cần phải nhỏ hơn và đợc khẳng định bằng kết quả tính
toán.
Ta tính các tham số phân bố thực nghiệm đã cho theo công thức (2.5) - (2.8):

2
= npq = 20.0,2(1-0,2) = 3,2,
.335,0
)789,1(
92,1
C
,92,1)2,08,0(8,0.2,0.20)pq(npq
447,0
4
789,1
m
C
789,12,3
2
3
3
s
3
vm
==

à
=
===à
==


=
==



69
H. 2.2 Giới hạn tin cậy 95% đối với xác suất thực nghiệm theo phân
bố nhị thức (theo số liệu công trình [140])
.
Trong tính toán thuỷ văn thờng yêu cầu xác định xác suất xuất hiện không
quá r đầu ra thuận lợi trong n lần thử độc lập. Xác suất này đợc xác định theo hàm
tích phân phân bố nhị thức rời rạc
.qpC)rm(P
r
0m
mnmn
m

=

=
(2.10)
Tổng trong trờng hợp này đợc tính theo giá trị m = 0, 1, 2, . . . , r. Với m

70

0 P(m r) = 0; với m r P(m r) = 1.



Hình. 2.3 Giới hạn tin cậy 99% đối với xác suất thực nghiệm theo
phân bố nhị thức (theo số liệu công trình [140]).

Giả sử rằng cần xác định xác suất cho 20 năm quan trắc dòng chảy sông ngòi
không quá 5 trờng hợp sông khô hạn. Ta có: n = 20; p = 0,2; r = 5. Khi sử dụng
biểu thức (2.10) và đẳng thức hiển nhiên p = 1 - q, nhận đợc:
.808,0175,0218,0205,0140,0058,0012,0)2,01(2,0C)5m(P
m
0m
m20mm
20
=+++++==

=



71
Thờng trong tính toán thuỷ văn ngời ta sử dụng xác suất thiên lớn của số r
đã cho. Trong trờng hợp này ta có:
P[m (r + 1)] = 1 - P(m r) (2.11)
Bởi vì:
P(m r) + P [m (r + 1) = 1.
Khi sử dụng công thức (2.11), ta tính xác suất cho thời kỳ 20 năm không có
quá 6 trờng hợp khô hạn sông ngòi
P( m 6) = 1 - 0,808 = 1,92.
Hàm tích phân phân bố số trờng hợp vợt khô hạn sông ngòi với n = 20, p =
0,2 và r = 1 ữ 10 ở trên h. 2.4.

Hình 2.4 Đờng cong suất đảm bảo phân bố nhị thức các trờng hợp khô

hạn sông ngòi . n = 20, p = 0,2.
1- Đờng cong suất đảm bảo nhị thức liên tục, 2-
phân bố nhị thức rời rạc (điểm đa theo giá trị giữa khoảng)

Phân bố nhị thức rời rạc có thể ứng dụng trong tính toán thuỷ văn và cả khi
giải các bài toán tơng tự. ứng dụng lớn nhất trong tính toán thuỷ văn là phân bố nhị
thức các đại lợng ngẫu nhiên liên tục sẽ xét trong Đ. 4 của chơng này. Khi giải
một số bài toán tính toán thuỷ văn ngời ta sử dụng qui luật phân bố Poatxông, cũng
mô tả phân bố các đại lợng ngẫu nhiên rời rạc.
2. 3 Qui luật phân bố Poatxông
Phân bố Poatxông đa ra từ phân bố nhị thức rời rạc với n và khi np =
giữ giá trị hằng số hữu hạn.

72
Có thể nhận thấy rằng, nếu nh trong phân bố nhị thức rời rạc xác suất P
m

đợc xác định theo biểu thức (2.2), không có giá trị tiến đến 0 và 1, thì trong phân
bố Poatxông P 0.
Phân bố Poatxông có dạng:
.e
!
m
),m(f
m


=
(2.12)
Do đó, phân bố đã cho chỉ có một tham số , xác định theo số liệu thực

nghiệm.
Kết luận của qui luật phân bố Poatxông ta tiến hành khi dựa trên qui luật
phân bố nhị thức rời rạc.
Phù hợp với biểu thức (2.3) phân bố nhị thức rời rạc có dạng:
.)p1(p
!m
)1mn) (2n)(1n(n
)p1(pC)p,n,m(f
mnm
mnmm
n



+
=
==

Nhân tử số và mẫu số với n
m
và tiến hành thế biếntheo đẳng thức np = .
.)p1(
!mn
)1mn) (2n)(1n(n
)p,n,m(f
mnm
m


+



=

Chia tử số cho n
m
, ta đợc:
.
)p1(
)p1(
!mn
1m
1
n
2
1
n
1
1)p,n,m(f
m
n
m

























=
(2.13)
Xét từng phần biểu thức tới hạn của dẳng thức thu đợc. Tiến hành biến đổi















=










=
p
1
np
p
1
n
)p1()p1()p1(
và lấy giới hạn khi p 0

73
.e)p1(iml
p
1
0p





=












Và cuối cùng xét giới hạn của biểu thức khi n và p 0.
.1
)p1(
n
1m
1
n
2
1
n
1
1
lim
m

0p
n
=






























=



Thế giá trị giới hạn vào công thức (2.13), cuối cùng thu đợc phân bố
Poatxông (2.12), thể hiện dạng giới hạn của phân bố nhị thức rời rạc với tham số =
np và p 0 và n .
Dẫn biểu thức đối với kỳ vọng toán học , phơng sai và mô men trung tâm
bậc ba của đại lợng ngẫu nhiên phân bố theo qui luật Poatxông . Khi đó ta sử dụng
các mô men nhân tố. Mô men giai thừa bậc r của đại lợng ngẫu nhiên m từ m = 1
đến m = n thể hiện bằng biểu thức :

==
+==
n
1m
n
1m
r
r
).1rm) (1m(m
n
1
m
n
1
f


Tìm đợc mô men giai thừa đối với qui luật phân bố Poatxông:
).1rm) (2m)(1m(me
!m
f
1m
m
r
+

=


=


Khi thế
m
=
m-r

r
và đa ra khỏi dấu tổng hằng số
r
, mở giai thừa m! và
tiến hành những rút gọn cần thiết, và cũng thay đổi giới hạn của tổng, nhận đợc:


=

=



=
1m
m
em
r
r
.
)!rm(
r
f
(2.14)
Cần lu ý rằng luỹ thừa nguyên dơng của mọi số có thể thể hiện dới dạng:
,CAC
r
1i
iri
r

=
=
(2.15)

74
Với A
ri
- số Stirling, xác định theo công thức xoáy đảo:
A
ri

= iA
r-1,i
+ A
r-1,i-1+
(2.16)
Với các giá trị ban đầu A
1,1
= 1 và A
1,2
= 0 . Chúng ta cần giá trị Stirling thể
hiện trên bảng 2.1.
Bảng 2.1 Số Stirling
i

r

1 2 3
1 1
2 1 1
3 1 3 1

Biểu diễn các mô men gốc của phân bố Poatxông , sử dụng quan hệ (2.14) và
(2.15),
.ACAC
r
1i
i
ri
r
1i

i
rir

==
==
(2.17)
Theo các biểu thức (2-16) và (2-17) ta nhận đợc các biểu thức đối với ba
mômen gốc đầu tiên của phân phối Poatxông
Khi r = 1


=
=
==
1r
1i
11,11
Af
Khi r = 2


=
=
+==
2r
1i
2
i22
iAf
Khi r = 3


32
3r
1i
ii33
3Af ++==

=
=


75
Giá trị của hệ số Ari lấy theo bảng 2.1.
Các mômen cao hơn bậc ba trong tính toán thuỷ văn ngời ta không dùng nên
ta không xét.
Theo các công thức (1.38) biểu hiện mômen trung tâm à qua mômen gốc
(fr), ta nhận đợc.
.2333)()(3
0
332323232
3
22
2
1
=+++=++++=à
=+=à


Phân tích trên cho thấy rằng mômen gốc bậc một hoặc trị bình quân số học
(

m
), mômen trung tâm bậc hai hoặc phơng sai và mô men trung tâm bậc ba
(
2
m

à
3
) trong phân phối Poatxông đều bằng:
=à==
3
2
m
m

chuyển sang các tham số thờng dùng trong thuỷ văn, ta đợc:

2
1
v
m
C

=


=

=


2
1
2/33
3
s
C

=


=

à
=

hay là:
===

mCC
2
1
sv
r


Vì vậy, nếu chuỗi đại lợng ngẫu nhiên rời rạc m đợc đặc trng bởi đẳng
thức

3
2

m
m
thì điều đó là cơ sở cho phép ta giả thiết rằng đại lợng ngẫu
nhiên m đợc phân phối theo luật Poatxông .
Ta nên chú ý đến tính chất gần đúng của đẳng thức trị bình quân số học (
m
) ,
phơng sai (
) và mô men trung tâm bậc ba (à
2
m

3
) cho thấy khả năng dao động ngẫu
nhiên của các tham số mẫu với tổng thể của chúng.

76
Những quan hệ giữa các tham số vừa chứng minh trên ít đợc dùng đối với
các chuỗi thống kê của đại lợng thuỷ văn, vì vậy phân phối này trong thuỷ văn
ngời ta ít sử dụng. Tuy vậy, trong một số trờng hợp việc sử dụng nó có thể là cần
thiết nh một số thí dụ sau:
Trớc hết ta làn lợt so sánh luật phân phối nhị thức rời rạc với luật phân
phối Poatxông.
So sánh đợc tiến hành với những giá trị sau đây của các tham số phân phối
Poatxông 1)=5,0; 2)=1,3) =0,1. ứng với điều kiện = 5,0 (vì = np) ta nhận
đợc những tham số của phân phối nhị thức rời rạc nh sau:
1a. p = 0,20 n = 25. 1b. p = 0,10 n = 50.
Đôí với điều kiện =1,0.
2a. p = 0,20 n=5 2b. p = 0,10 n=10
2c. p = 0,05 n=20 2d. p = 0,02 n=50

Với điều kiện = 0,1
3a. p = 0,020 n=5 3b. p = 0,01 n=10
3c. p = 0,005 n=20.
Các kết quả tính toán đã đợc trình bày ở bảng 2.2 và trên hình 2 5 cho thấy
rằng, khi n tăng và p giảm phân phối Poatxông tiến dần tới phân phối nhị thức. Kết
luận này không phải là bất ngờ vì từ phân tích chung, phân phối Poatxông là dạng
giới hạn của luật phân phối nhị thức khi n và p 0.
Những kết luận nhận đợc theo tài liệu của bảng 2.2 là quan trọng hơn vì
chúng cho phép ta ớc lợng đợc dung lợng mẫu, mà trong đó những khác nhau ở
lợc đồ phân phối đợc nghiên cứu của đại lợng ngẫu nhiên thực tế có thể coi là
không cơ bản. Những tính toán cho thấy rằng phân phối Poatxông khá trùng với
phân phối nhị thức ngay cả khi dung lợng mẫu tơng đối nhỏ (n>10), đặc biệt với
sự giảm tham số
.
Kết luận rất quan trọng theo quan điểm ứng dụng luật phân phối này vào giải
những bài toán thuỷ văn, vì trong trờng hợp này dung lợng thờng dùng cho các
chuỗi thờng hạn chế bởi một vài chục số hạng.

77
B¶ng 2.2






















78
Hình 2.5 So sánh qui luật phân bố tích phân nhị thức và qui luật Poatxông
1-qui luật nhị thức p=0,2, n=25; 2- qui luật nhị thức p=0,1, n=50; 3- phân bố
Poatxông
=5
m
ý nghĩa thực tế của việc sử dụng luật Poatxông là giảm bớt đợc những tính
toán so với việc phân phối nhị thức rời rạc. Ngoài ra, với một số giá trị của các tham
số n và p những tính toán theo luật phân phối nhị thức là rất khó khăn, do những
bảng lôgarit với năm chữ số có nghĩa không đủ độ chính xác. Từ điều kiện đó nên
luật Poatxông thờng đợc dùng khi p 0, vì thế nó đợc dùng để làm trơn những
phân phối quan trắc , các biến cố hiếm nh thời kỳ rất dài pha ít nớc hoặc nhiều
nớc, sấm trong mùa đông v.v Với tính chất trên mà luật phân phối Poatxông
thờng đợc gọi là luật phân phối của những hiện tợng cực hạn (ít thấy).
Việc ứng dụng luật Poatxông chúng ta sẽ xét ở thí dụ đánh giá sự lặp lại của
những nhóm năm ít nớc và nhiều nớc trên một số sông ở Liên Xô. Các tài liệu cơ
bản gốc đã đợc trình bày ở bảng 2.3
Bảng 2.3. Tài liệu về thời gian dài nhất của thời kỳ ít nớc và về số năm
quan trắc trên một số sông ở Liên Xô.

Sông Trạm Thời gian dài nhất của thời kỳ ít nớc Số năm quan trắc
Volga
Unza
Bêlaia
Iarôxlavl
Makariiev
Ufa
11
15
11
79
68
85

79
Nếu coi những thời kỳ ít nớc hoặc nhiều nớc của sông kéo dài là hiện
tợng rất hiếm và giả thiết rằng mối quan hệ ngẫu nhiên giữa các giá trị của dòng
chảy năm là không có thì có thể dùng luật phân phối Poatxông dới dạng :




== e
!
)R(P
(2.19)
Để làm sáng tỏ xác suất P(R=) gặp số lợng nhóm năm (v) ít nớc hoặc
nhiều nớc có độ dài lớn không ít hơn k năm.
Trong trờng hợp này, tham số phân phối là trị bình quân của số lợng thời
kỳ ít nớc hoặc nhiều nớc có độ dài lớn hơn k năm trong chuỗi tài liệu n năm

quan trắc đợc.
Đối với bài toán này tham số của phân phối Poatxông có thể đợc tính theo
công thức gần đúng:
1k
2
n
+

(2.20)
Việc chứng minh công thức này dựa vào lý thuyết tổ hợp. Cụ thể hơn về
nhóm các năm ít nớc và nhiều nớc sẽ đợc xét ở chơng IV. ở đây ta chỉ xét mối
quan hệ này với độ chính xác đủ để giải những bài toán thực tế, xác định số lợng
bình quân của những nhóm nớc có thời gian lớn hơn k năm trong các mẫu đaị
lợng ngẫu nhiên độc lập.
Khi sử dụng các biểu thức (2.19) và (2.20) dễ dàng có thể tính đợc xác suất
xuất hiện trong n năm quan trắc có số lợng nhóm nớc () với độ dài lớn hơn k
năm.Lu ý khi đó k khá lớn và vì thế cho nên nhóm nớc quan trắc đợc, chẳng hạn
nh nhóm năm ít nớc là hiện tợng rất hiếm, tơng ứng có xác suất xuất hiện nhóm
nớc đó là rất nhỏ. Cũng nh trên ở đây ngời ta giả thiết là không tồn tại quan hệ
trong chuỗi tổng lợng năm của dòng chảy sông ngòi.
Sự xuất hiện hai nhóm nớc ít với độ dài của mỗi nhóm lớn hơn 7 năm, trong
mẫu có 85 năm quan trắc (sông Bêlai - trạm Ufa) có thể dự đoán với xác suất là bao
nhiêu ? Do có n = 85, = 2, k = 7. Theo công thức (2.17) chúng ta nhận đợc:
332,0
256
85
2
85
17
===

+

Theo công thức (2.19) xác suất phải tìm trong trờng hợp này bằng:

80

×