Tải bản đầy đủ (.pdf) (21 trang)

Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 1 potx

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (467.84 KB, 21 trang )



1


nguyễn hữu khải









phân tích thống kê
trong thuỷ văn

























Nhà xuất bản đại học quốc gia hà nội


2

Mục lục

Nội dung Trang
Lời nói đầu
Chơng 1. mở đầu
1.1. Khái niệm chung
1.2. Cơ sở áp dụng phơng pháp thống kê trong thuỷ văn
1.3. Một số khái niệm thống kê cần biết trong thuỷ văn.
1.4. Lợc sử phát triển của thống kê thuỷ văn
1.5. Câu hỏi và bài tập
chong 2. phân tích tần suất
2.1. Đờng tần suất kinh nghiệm
2.2. Giấy xác suất (giấy tần suất).
2.3. Đờng tần suất lý luận
2.4. Phơng pháp xây dựng đờng tần suất

2.5. Tổ hợp tần suất
2.6. Câu hỏi và bài tập
chơng 3. Kiểm định các giả thiết thống kê
3.1. Khái niệm
3.2. Kiểm định các giả thiết thống kê
3.3. Ước lợng các thông số thống kê
3.4. Câu hỏi và bài tập
chơng 4. Phân tích tơng quan
4.1.Khái niệm
4.2. Tơng quan tuyến tính 2 biến
4.3. Tơng quan tuyến tính nhiều biến
4.4. Các quan hệ tơng quan khác
4.5. Câu hỏi và bài tập
chơng 5. Phân tích chuỗi thời gian
5.1. Khái niệm
5.2. Lọc và làm trơn chuỗi thời gian thuỷ văn
5.3. Phân tích chuỗi thời gian
5.4. Mô phỏng chuỗi thời gian
5.5. Câu hỏi và bài tập
4
5
5
6
8
19
20
22
22
25
28

54
58
65
68
68
69
87
96
99
99
100
117
127
135
137
137
141
151
168
172


3

tµi liÖu tham kh¶o
phô lôc
Phô lôc ch¬ng 2
Phô lôc 2.1
Phô lôc 2.2
Phô lôc 2.3

Phô lôc 2.4
Phô lôc 2.5
Phô lôc 2.6
Phô lôc 2.7A
Phô lôc 2.7B
Phô lôc 2.8
Phô lôc 2.9
Phô lôc 2.10
Phô lôc ch¬ng 3
Phô lôc 3.1
Phô lôc 3.2A
Phô lôc 3.2B
Phô lôc 3.3

175
177
178
178
186
188
190
198
199
202
203
204
205
207
209
209

210
211
212
221




















4


Lời nói đầu
Thống kê toán học đợc ứng dụng trong nhiều lĩnh vực khoa học, trong đó có thuỷ
văn. Tuy nhiên, thuỷ văn học vận dụng các nguyên lý toán thống kê theo những

phơng pháp riêng và phát triển theo một hớng riêng. Vì vậy một giáo trình về các
phơng pháp thống kê trong thuỷ văn là rất cần thiết cho công tác giảng dạy, học tập
và nghiên cứu khoa học. Giáo trình này không trình bày lại những phần lý thuyết đã
có trong nhiều giáo trình về xác suất và thống kê toán học của ĐHQG Hà Nội, mà chỉ
nhắc lại một số phần thực sự cần thiết và tập trung vào vấn đề phân tích các quan hệ
thống kê của chuỗi số liệu thuỷ văn.
Giáo trình gồm 5 chơng. Đó là: Chơng 1: Mở dầu; Chơng 2: Phân tích tần suất;
Chơng 3: Kiểm định các giả thiết thống kê; Chơng 4: Phân tích tơng quan và
chơng 5: Phân tích chuỗi thời gian thuỷ văn.
Do chơng trình đào tạo sau đại học không có phần thống kê thuỷ văn nên trong
giáo trình đề cập thêm những nội dung sâu hơn nh tổ hợp tần suất, tơng quan phi
tuyến và hàm trực giao, phân tích hàm cấu trúc, mô phỏng chuỗi thời gian và một số
giải thích sâu hơn cho những nội dung đã trình bày. Những phần này đợc in nghiêng
với cỡ chữ nhỏ hơn. Chúng không là yêu cầu bắt buộc đối với sinh viên đại học, nhng
có thể bổ sung nâng cao cho các sinh viên hệ cử nhân khoa học tài năng và chất lợng
cao, cũng nh làm tài liệu tham khảo cho các học viên cao học, nghiên cứu sinh và cán
bộ nghiên cứu trong thuỷ văn và các ngành khác có liên quan. Các hình vẽ và công
thức trong giáo trình thuộc phần lý thuyết đợc sao chụp từ các tài liệu tham khảo.
Tác giả chân thành cảm ơn các bạn đồng nghiệp đã đóng góp ý kiến về kết cấu và
nội dung của giáo trình, cảm ơn các sinh viên ngành thuỷ văn trong quá trình thực
hiện một số lớn bài tập trong giáo trình, cảm ơn Khoa Khí tợng Thuỷ văn và Hải
dơng học, Trờng Đại học Khoa học Tự nhiên và ĐHQG Hà Nội đã tạo điều kiện
thuận lợi cho việc xuất bản giáo trình này.
Giáo trình đợc biên soạn lần đầu nên không tránh khỏi những thiếu sót, rất
mong đợc sự góp ý của bạn đọc.
Tác giả








5

Chơng I
mở đầu
1. 1. Khái niệm chung
Các hiện tợng thuỷ văn chịu tác động của nhiều nhân tố, nhng chúng ta không
có khả năng phân tích đầy đủ mức độ ảnh hởng của mỗi nhân tố đến sự hình thành
của các hiện tợng này. Mô tả toán học các hiện tợng thuỷ văn và mối quan hệ giữa
chúng không thể hoàn toàn bằng con đờng vật lý-toán mà nhiều khi phải thông qua
số liệu quan trắc, tức là áp dụng phơng pháp thống kê. Ví dụ dòng chảy hình thành
do các nhân tố khí tợng và mặt đệm. Các nhân tố khí tợng bao gồm ma, bốc hơi,
nhiệt độ, độ ẩm v.v., các nhân tố này có sự phân bố rất khác nhau theo thời gian,
không gian, giữa chúng lại có mối liên hệ chi phối lẫn nhau. Các nhân tố mặt đệm gồm
có kích thớc, hình dạng lu vực, mạng lới sông, độ dốc sông và lu vực, điều kiện
địa chất và địa chất thuỷ văn, độ ẩm lu vực, hệ thống hồ ao, đầm lầy v.v., giữa chúng
cũng có mối liên hệ tơng hỗ. Làm sáng tỏ mối quan hệ này chỉ có thể thực hiện bằng
phơng pháp thống kê. Trong phơng pháp thống kê ngời ta tập trung sự chú ý đến
bản thân các kết quả quan trắc hơn là đến các quá trình vật lý tạo ra chúng. Thống kê
là một khoa học mô tả chứ không phải là khoa học về nhân quả.
Số liệu của các đại lợng thuỷ văn thu thập đợc thờng là không liên tục, mà
phân bố rời rạc theo từng thời khoảng, tập hợp của chúng theo thời gian tạo thành
một chuỗi thuỷ văn. Chuỗi số liệu thuỷ văn thu thập đợc chỉ là một phần nào đó
(mẫu) của toàn bộ (tổng thể) quá trình của nó theo thời gian. Sự phân bố của chuỗi
thuỷ văn khác nhau tuỳ theo tính chất địa vật lý của từng khu vực cụ thể. Các đặc
trng tính toán theo mẫu tại một vị trí cha phản ảnh đầy đủ quy luật dao động của
chúng theo không gian và thời gian. Điều này làm ảnh hởng đến các bài toán tiếp
theo nh tính toán hay dự báo thuỷ văn phục vụ công trình dân sinh kinh tế. Vì vậy

phải xử lý số liệu, xác định các phơng trình toán học mô phỏng quy luật dao động của
chúng làm cơ sở cho bài toán ngoại suy.
Các phơng pháp thống kê áp dụng vào thuỷ văn có một số đặc điểm cần lu ý do
tính chất đặc thù của các hiện tợng thuỷ văn. Thứ nhất, đó là nguồn thông tin về
chúng có hạn, và chúng ta không có khả năng tăng đáng kể lợng thông tin này. Do
vậy phải chọn mô hình toán học thích hợp thoả mãn tốt nhất số liệu thực nghiệm, ớc
lợng các thông số của nó để có thể tăng nhân tạo lợng thông tin từ chuỗi số liệu
ngắn sang chuỗi dài hơn. Bằng cách thử lựa một phân bố xác suất cho vừa khớp với số
liệu thuỷ văn, rất nhiều thông tin thống kê của mẫu có thể tổng kết một cách cô đọng
trong hàm số và trong các thông số của hàm. Các thông số thống kê cho ta những
thông tin thiết yếu của một tập số liệu thu gọn một dãy số thành một tập nhỏ hơn.
Chúng là các số đặc trng của tổng thể. Đó là các thông số kì vọng m
x
, phơng sai
2
,
hệ số biến đổi C
v
, hệ số bất đối xứng (hay thiên lệch) C
S
và đôi khi có cả hệ số nhọn
(hay tù) C
e
. Nhng chúng ta không biết trớc mô hình nào là phù hợp với đại lợng


6

đang xét, hơn nữa cũng không có thêm thông tin nào về dạng hàm toán học mô phỏng
ngoài chuỗi số liệu quan trắc, trong khi chuỗi số liệu lại thờng không đủ dài. Vì thế

lựa chọn dạng hàm mô phỏng thờng phải dựa vào một số quan điểm chung nào đó,
hoặc thử dần dựa trên một số tiêu chuẩn. Mức độ phù hợp giữa hàm mô phỏng và số
liệu thực nghiệm sẽ đợc đánh giá bằng cách so sánh chúng với nhau dựa vào các chỉ
tiêu thống kê. Khi đã xác đinh đợc hàm toán học phù hợp thì việc đánh giá độ chính
xác, độ tin cậy và độ ổn định của các thông số theo tập hợp mẫu thu thập lại rất quan
trọng, nó quyết định các kết quả tính toán tiếp theo. Ngoài ra các hiện tợng thuỷ văn
có quan hệ với các nhân tố ảnh hởng ở các mức độ khác nhau. Có thể thông qua mối
quan hệ này để bổ sung các thông tin về hiện tợng thuỷ văn nghiên cứu và kéo dài
chuỗi số liệu, từ đó làm tăng độ chính xác của các thông số thống kê. Cần đánh giá
mức độ ảnh hởng và mối quan hệ này bằng các tiêu chuẩn thống kê.
Đặc điểm thứ hai là sự đồng nhất của chuỗi số liệu thu thập. Do các nguyên nhân
chủ quan hay khách quan, nh thay đổi thiết bị và phơng pháp hay vị trí đo đạc, sự
biến động của lu vực khi sử dụng đất hay xây dựng các hồ chứa, đa đến sự không
đồng nhất của chuỗi số liệu. Xác định các đặc trng dựa trên chuỗi không đồng nhất
sẽ dẫn đến những sai số đáng kể. Do đó trớc khi sử dụng các phơng pháp thống kê
phải phân tích kỹ lỡng các thông tin ban đầu trên quan điểm đồng nhất về mặt vật lý
và thống kê. Tuy nhiên thờng khó xác định nguyên nhân và mức độ phá vỡ tính đồng
nhất của chuỗi nên cần thiết sử dụng các tiêu chuẩn thống kê kết hợp với phân tích
vật lý để đánh giá.
Đặc điểm thứ ba là tồn tại một mối quan hệ nội tại trong các số hạng của chuỗi
thuỷ văn. Chúng làm mất đi tính ngẫu nhiên của mẫu xem xét, làm giảm tính độc lập
của các số hạng, thay đổi cấu trúc của chuỗi, dẫn tới làm tăng mức độ không ổn định
của các ớc lợng thống kê. Tuy nhiên chuỗi thuỷ văn là một thể hiện của quá trình
ngẫu nhiên và tuân theo những quy luật riêng. Các quy luật này đợc xác định thông
qua phân tích chuỗi thời gian làm cơ sở cho việc chọn mô hình mô phỏng chúng.
Giải quyết các bài toán thống kê liên quan đến việc xử lý một khối lợng tài liệu
rất lớn, các tính toán phức tạp và cồng kềnh nên cần sử dụng máy tímh điện tử. Hiện
nay nhiều máy tính có bộ nhớ lớn, tốc độ xử lý cao đã góp phần tích cực vào việc áp
dụng phơng pháp thống kê trong thuỷ văn, đồng thời cũng cho phép cải tiến và phát
triển các phơng pháp thống kê hơn nữa.

Có nhiều sách và tài liệu về các phơng pháp thống kê [3,4,17,21,22,23,24,32]áp
dụng trong các lĩnh vực toán học, vật lý, hoá học, sinh học, trong các ngành kỹ thuật,
kinh tế. Do những đặc thù của hiện tợng thuỷ văn, việc áp dụng các nguyên lý thống
kê có sự vận dụng riêng, sử dụng các mô hình toán riêng và đợc phát triển trên cơ sở
dữ liệu thuỷ văn quan trắc.
1.2. Cơ sở áp dụng phơng pháp thống kê trong thuỷ văn
Phơng pháp thống kê toán học đợc áp dụng trong nhiều lĩnh vực thuỷ văn học,
nhng rộng rãi nhất là trong tính toán và dự báo dòng chảy sông ngòi. Cơ sở chính để
áp dụng phân tích thống kê trong thuỷ văn là coi các đại lợng thuỷ văn là những đại
lợng ngẫu nhiên.
Kết quả tính toán cho thấy tỷ số phần trăm của số điểm thực nghiệm nằm trong
khoảng từ trị số bình quân đến



32



;
;
xấp xỉ với tỷ số trong phạm vi tơng ứng


7

của phân bố chuẩn (70%; 95% và 100%) (bảng 1.1 [10]). Theo định lý giới hạn trung
tâm của xác suất thì điều đó chứng tỏ rằng với dạng phân bố gần chuẩn nh vậy chuỗi
có thể coi là ngẫu nhiên và độc lập.
Bảng 1.1. Tỷ số phần trăm của số năm có lợng dòng chảy năm ở trong các khoảng




32



;
;

Tỷ số phần trăm TT

Sông Trạm Số năm





2



3


1 Đà Hoà Bình 84 72,6 96,4 100
2 Lô Phù Ninh 79 68,6 94,9 100
3 Thao Yên Bái 80 66,3 96,3 100
4 Hồng Sơn Tây 87 67,8 96,6 100
5 Mekong Vientaine 62 72,6 96,8 100

6 TrờngGiang HánKhẩu 88 66,7 91,0 100
7 TùngHoa CápNhĩTân 56 66,1 96,5 100
8 Volga Aroxlap 53 69,8 94,3 100

Bảng 1.2. Hệ số tơng quan giữa các số hạng trong chuỗi dòng chảy
Lu lợng
lớn nhất năm
Lu lợng
trung bình năm

TT


Sông

Trạm
r
1
r
2
r
3
r
1
r
2
r
3

1 Hồng Sơn Tây -0,008


0,331

0,044

0,028

0,048

0,089

2 Đà Hoà Bình -0,069

0,288

0,040

0,043

0,060

0,081

3 Thao Yên Bái 0,067

0,089

0,158

0,076


0,057

-0,030

4 Lô Phù Ninh -0,068

0,071

0,099

0,117

0,082

0,007

5 Mekong Vientaine -0,033

0,035

0,092

0,245

0,178

0,187

6 TrờngGiang


ThốnThan 0,140

0,040

0,120

0,210

0,040

-0,070

7 Tùng Hoa CápNhĩTân -0,030

0,190

0,020

0,360

0,400

0,260

8 TâyGiang Ngô Châu 0,040

0,060

0,020



Lợng dòng chảy các năm hầu nh không có liên hệ. Hệ số tơng quan của dòng
chảy giữa các năm kề nhau, cách nhau 2, 3 năm rất nhỏ và sai số tơng quan rất lớn.
Ví dụ chuỗi dòng chảy lớn nhất và dòng chảy trung bình của sông ngòi Việt Nam có hệ
số tơng quan giữa các năm kề nhau khá nhỏ, xấp xỉ bằng 0, trên sông Mêkông tơng
quan tuy có lớn hơn (r =0,2-0,3), nhng cũng không thực sự lớn (bảng 1.2 [10]).
Luận điểm về tính ngẫu nhiên của các đại lợng thuỷ văn không thể chứng minh
trọn vẹn, nhng các kết quả áp dụng cho dòng chảy sông ngòi đã chứng tỏ giả thiết đề
ra là đúng đắn. Các luận điểm lý thuyết dùng làm cơ sở cho khả năng xem xét chuỗi
các đại lợng thuỷ văn nh tập hợp các biến cố ngẫu nhiên đợc gọi là các định luật tới
hạn của lý thuyết xác suất. Những luận điểm cơ bản đó dẫn tới luật số lớn và định lý
giới hạn trung tâm.


8

Trong thực tế, chuỗi quan trắc thủy văn dù có dài bao nhiêu cũng chỉ là một mẫu
trong tổng thể. Nếu ta lấy một chuỗi dòng chảy năm có thời gian quan trắc dài và chia
thành các mẫu có dung lợng nhỏ, rồi vẽ đờng tần suất thì thấy các đờng tần suất
gần giống nhau[10]. Điều đó chứng tỏ mẫu gần với quy luật của tổng thể. Nếu số năm
quan trắc tăng đến một mức nào đó thì quy luật thống kê của mẫu bắt đầu thể hiện rõ
rệt. Phân tích các chuỗi dòng chảy của nhiều trạm trên nhiều sông thấy có quy luật
phân bố xác suất tơng tự. Nh vậy có thể phân tích quy luật phân bố mẫu thay cho
tổng thể.
Hoạt động kinh tế của con ngời có thể làm thay đổi dòng chảy, nếu chuỗi quá dài
sẽ không đồng nhất. Nhng nếu quá ngắn sẽ không đảm bảo tính đại biểu và có
trờng hợp không độc lập. Ví dụ[10] tại trạm Sơn Tây giai đoạn ít nớc từ 1954-1965
cho hệ số tơng quan tuyến tính khá lớn, r =- 0,53, chứng tỏ chuỗi không độc lập. Vì
vậy chuỗi phải có tính đại biểu, tức là có độ dài thoả mãn, bao gồm đầy dủ những năm

nhiều nớc, ít nớc và nớc trung bình.
Dù muốn hay không, các hiện tợng thuỷ văn đều mang trong mình nó tính tất
nhiên và ngẫu nhiên, đợc thể hiện với những mức độ khác nhau tuỳ nơi tuỳ lúc. Khi
ta rút ra một số trị của chuỗi thuỷ văn thì kết quả phép rút số trị đó có thể coi là ngẫu
nhiên. Nhng khi ta rút ra một chuỗi số liên tục (theo ý nghĩa thống kê, không phụ
thuộc ý muốn con ngời) thì kết quả phép rút đó sẽ cho một chuỗi số trị có tính ngẫu
nhiên và tất nhiên trên cả 2 chiều không gian và thời gian. Chúng ta không thể loại
trừ đợc tính chu kỳ dòng chảy theo mùa, năm hay nhiều năm, tính phụ thuộc lẫn
nhau, tính quán tính cũng nh tính ngẫu nhiên của chúng. Vấn đề đặt ra là phải
phân tích lựa chọn để loại bớt hay kết hợp cả 2 thành phần này nhằm giải quyết hợp
lý các bài toán cụ thể theo một đối tợng khai thác nguồn nớc tại một vùng lãnh thổ
cụ thể.
1.3. Một số khái niệm thống kê cần biết trong thuỷ văn
1.3.1. Tổng thể và mẫu
Tổng thể là tập hợp vô hạn tất cả các giá trị có thể nhận đợc của đại lợng ngẫu
nhiên, có các đặc trng thống kê không đổi. Còn mẫu là một bộ phận hay một phần
rút ra từ tổng thể. Số các giá trị của mẫu gọi là độ lớn hay dung lợng mẫu, ký hiệu là
n. Các đặc trng thống kê của mẫu thay đổi tuỳ theo dung lợng mẫu và cách chọn
mẫu. Sự sai khác giữa các đặc trng thống kê của mẫu so với tổng thể gọi là sai số lấy
mẫu.
Để giảm sai số lấy mẫu, trong thuỷ văn việc chọn mẫu phải đảm bảo các yêu cầu
sau:
- Đảm bảo tính đồng nhất, tức là mẫu đợc rút ra từ một tổng thể, đồng nhất cả về
nguyên nhân hình thành và vị trí địa lý. Trong thực tế tính đồng nhất có thể bị vi
phạm nếu chọn số liệu trong các thời kỳ quan trắc khác nhau khi có sự thay đổi điều
kiện hình thành dòng chảy hay phơng pháp đo đạc.
- Đảm bảo tính ngẫu nhiên và độc lập, tức là các số liệu phải là các biến cố ngẫu
nhiên và độc lập. Nếu mẫu đợc chọn là dòng chảy lớn nhất năm hay trung bình năm
thì đợc coi là ngẫu nhiên và độc lập, nhng nếu là dòng chảy mùa, tháng hay ngắn
hơn thì không thể đảm bảo tính chất này.



9

- Đảm bảo tính đại biểu, tức là phải phản ánh quy luật chung của tổng thể. Muốn
vậy mẫu phải đủ dài và bao gồm các thời ký nhiều nớc, ít nớc và trung bình nớc.
- Phơng pháp chọn mẫu trong thuỷ văn
Trong thuỷ văn thờng có các phơng pháp chọn mẫu sau [10,15,17,21]:
1). Mỗi năm chọn một trị số, ví dụ mỗi năm chọn một giá trị dòng chảy lớn nhất,
nhỏ nhất hay trung bình. Tập hợp các trị số đợc chọn trong n năm cho ta một mẫu,
khi đó dung lợng mẫu bằng số năm quan trắc. Chuỗi nh vậy gọi là chuỗi năm hay
cực đại năm (annual maximum series-AM)
2). Chọn mỗi năm một số trị số lớn hơn một trị số định trớc. Tập hợp các trị số
nh vậy cũng tạo thành một mẫu nhng có dung lợng lớn hơn số năm quan trắc.
Chuỗi đó gọi là chuỗi thời gian riêng phần (Partial Duration series-PD) hay chuỗi vợt
ngỡng (Peaks over a threshold-POT).
Cách chọn mẫu này nhằm khắc phục trờng hợp mẫu ngắn, tuy nhiên trị số định trớc phải lựa
chọn sao cho phù hợp, nếu quá nhỏ thì chuỗi sẽ dài nhng tính độc lập giảm, còn nếu quá lớn dung
lợng mẫu sẽ quá nhỏ không đủ cho tính toán thống kê. Một điều quan trọng là chọn mẫu theo cách
này khó bảo đảm rằng các số hạng trong chuỗi là độc lập, bởi vì sự xuất hiện của một trận lũ lớn có
thể liên quan đến các điều kiện bão hoà ẩm đất đợc tạo ra bởi một con lũ lớn khác xẩy ra trớc đó
không lâu.
3). Phơng pháp trạm năm, dựa trên sự tổng hợp số liệu quan trắc của nhiều trạm
trên một khu vực đồng nhất về địa vật lý. Phơng pháp này đòi hỏi phải đảm bảo điều
kiện đồng nhất và độc lập. Nghĩa là số liệu quan trắc tại các trạm phải độc lập và có
đặc điểm địa vật lý đồng nhất. Điều này khó thực hiện vì đã độc lập thì ít khi đồng
nhất hay ngợc lại, đã đồng nhất thì ít khi độc lập.
Phơng pháp này đợc sử dụng khi chuỗi số liệu ngắn, khi tính lũ có xét đến lũ
cực lớn với tần suất nhỏ.
1.3.2. Tần suất và tần suất luỹ tích

a. Tần suất: Tỷ số của số lần xuất hiện một trị số nào đó chia cho tổng số lần thí
nghiệm hay đo đạc:
n
m
p
(1.1)
b. Tần suất luỹ tích: Là tỷ số giữa số lần xuất hiện một giá trị lớn hơn hay bằng trị
số đã cho chia cho tổng số lần thí nghiệm hay đo đạc:

n
Sốthứtự
n
m
P
, (1.2)
trong đó m là số lần xuất hiện những giá trị bằng hoặc lớn hơn trị số đã cho hay là số
thứ tự của chuỗi đã sắp xếp từ lớn đến nhỏ. Nói cách khác tần suất luỹ tích là tổng các
giá trị liên tiếp của các tần suất tính đến một điểm cho trớc:




i
j
ji
xfxFP
1
)()(
(1.3)
Từ đây khi viết

n
m
P
.100% hay viết gọn là tần suất thì ta hiểu là tần suất luỹ
tích.


10

Ví dụ 1.1[10]: Cho 84 năm số liệu Q
max
của trạm Sơn Tây, tính tần suất và tần
suất luỹ tích theo các cấp nh bảng 1.3.
Bảng 1.3. Tần suất và tần suất luỹ tích Qmax trạm Sơn Tây
TT Cấp Q
max
Tần số

Tần suất Tần suất luỹtích
1 39000-36000

1 1,19 1,19
2 36000-33000

0 0,00 1,19
3 33000-30000

1 1,19 2,38
4 30000-27000


1 1,19 3,57
5 27000-24000

3 3,57 7,14
6 24000-21000

5 5,95 13,09
7 21000-18000

10 11,90 24,99
8 18000-15000

24 28,57 53,56
9 15000-12000

34 40,48 94,04
10 12000-9000 5 5,95 100,00

1.3.3. Hàm tần suất và hàm tần suất luỹ tích
Quan hệ giữa các trị số x
i
đã cho và tần suất xuất hiện của nó gọi là hàm tần suất:

)(
i
xfP
(1.4)
Quan hệ giữa các trị số x
i
đã cho và tần suất luỹ tích của nó gọi là hàm tần suất

luỹ tích:




i
j
ji
xfxFP
1
)()(
(1.5)
Các hàm tơng ứng của tổng thể là giới hạn của các hàm trên khi


n
, gọi là
hàm mật độ f(x) và hàm phân bố F(x):



xXPxf )(
,





x
duufxXPxF )()(

, (1.6)
trong đó: x là biến ngẫu nhiên và u là biến hình thức.
Giữa hàm mật độ và hàm phân bố có quan hệ:

dx
xdF
xf
)(
)(
(1.7)
Tuy nhiên trong thuỷ văn thờng sử dụng hàm mức bảo đảm xác suất, còn gọi là
xác suất vợt hay tần suất, kí hiệu là P(x). Khi đó có:




x
xFduufxXPxP )()()()( 1
(1.8)
Đờng cong mức bảo đảm, hay đờng tần suất, là đờng biểu thị hàm mức bảo
đảm xác suất P(x), có dạng nh hình 1.1.[26]




11













Hình 1.1. Đờng tần suất
Có thể phân biệt giữa F(x) và P(x) nh trên hình 1.1. Phần giới hạn phía dới
đờng cong nhng ở trên giá trị x là hàm P(x), còn phần nằm ở dới giá trị x là hàm
F(x). Sau này các hàm tần suất của các đờng cong lí luận đợc viết dới dạng
)()( xFxP 1
. Và hàm mật độ đợc ký hiệu bằng p(x) thay cho f(x).
1.3.4. Độ lặp lại N (chu kỳ lặp lại)
Là khoảng thời gian trung bình tính bằng năm xuất hiện một trị số nào đó so với
trị số đã cho.
Nếu P>50% thì trị số đó nhỏ hơn trị số đã cho
Nếu P<50% thì trị số đó bằng hoặc lớn hơn trị số đã cho
- Công thức tính N
+ Với P50% thì
P
N
100

(1.9)
+ Với P50% thì
P
N



100
100
(1.10)
Ví dụ 1.2[10]: Cho một chuỗi quan trắc đợc sắp xếp từ lớn đến nhỏ và tính đợc
tần suất luỹ tích nh bảng 1.4.
Bảng 1.4. Dòng chảy và tần suất tơng ứng
m 1 2 3 4 5 6 7 8 9 10
Q (m
3
/s) 1000 930 880

790 750 740 690 680 670 650
P=m/n.100%

10 20 30 40 50 60 70 80 90 100

Từ bảng (1.4) và công thức (1.9), (1.10) ta đợc:
+ Độ lặp lại của lợng dòng chảy có Q=930 m
3
/s là N=100/20=5, nghĩa là trung
bình 5 năm lại xuất hiện một năm có lợng dòng chảy bằng hoặc lớn hơn 930 m
3
/s.
+Độ lặp lại của lợng dòng chảy có Q=670 m
3
/s là
10
90
100

100


N
, nghĩa là
trung bình 10 năm lại xuất hiện một năm có lợng dòng chảy nhỏ hơn 670 m
3
/s.
x
0 10 20 30 40 50 60 70 80 90 100
P(%)

P(x)

F(x)

x



12

+ Khi sử dụng chuỗi năm vợt thì độ lặp lại đợc tính theo quan hệ với chuỗi năm
nh sau:

)/1exp(1
1
PD
AM
T

T


, (1.11a)
hay:










1
1
AM
AM
PD
T
T
T
ln
(1.11b)
So sánh độ lặp lại tính theo 2 loại chuỗi ta đợc nh bảng 1.5 [22]
Bảng 1.5: So sánh độ lặp lại tính theo chuỗi cực đại năm và chuỗi vợt
Độ lặp lại Thời gian (năm)
T
AM

1,58 2,54 100,50
T
PD
1,00 2,00 100,00

1.3.4. Các đặc trng và mômen thống kê trong thuỷ văn
a. Các thông số biểu thị xu thế tập trung
- Số trung bình
x
: Là trung bình số học của chuỗi






n
i
i
n
x
nn
xxx
x
1
21
1

(1.12a)
Nếu tần số của x

i
(kể cả chia nhóm) là f
i
thì ta có:

i
n
i
i
nn
fx
nn
fxfxfx
x





1
2211
1

, (1.12b)
hoặc:



n
i

ii
n
i
i
i
Px
n
f
xx
11
, (1.12c)
trong đó: n=f
1
+f
2
++f
n
; P
i
là tần suất của x
i
; fi là tần số xuất hiện x
i
.
Số trung bình là một trong những thông số cơ bản nhất của mẫu, là trung tâm của
các số hạng của tập mẫu. Song nó bị ảnh lớn của các giá trị cực đoan, nhất là khi mẫu
ngắn. Khi


n

thì trung bình số học tiến tới kỳ vọng toán học m(x).
- Số giữa (median): x
g
(M
e
)
Sau trung bình số học thì số giữa là đặc trng tập trung của chuỗi. Nó bằng giá trị
nằm ở vị trí giữa của chuỗi số đã sắp xếp tăng dần hay giảm dần.
Nếu số số hạng là lẻ (2m+1) thì: x
g
= x
m
+1 (1.13a)
Nếu số hạng là chẵn (2m) thì: )(
1
2
1


mmg
xxx
(1.13b)
Trên đờng tần suất số giữa là số ứng với tần suất 50%.
Nếu phân nhóm thì số giữa tính theo công thức gần đúng sau:

C
f
f
n
Lx

g
l
g
.
)(
2
1















, (1.13c)
trong đó:


13

L
1

: Giới hạn dới của cấp chứa số giữa; n: Tổng số số hạng chuỗi,

l
f )(
: Tổng tần số tuyệt đối của toàn bộ các cấp nhỏ hơn cấp chứa số giữa;
fg: Tần số tuyệt đối cấp chứa số giữa; C: Độ rộng của cấp.
Theo ví dụ 1.1 (bảng 1.3) ta có: L
1
=15000;

l
f )(
=39,
f
g
=24; C=3000.
Từ đó ta đợc:
15400153753000
24
39
2
84
15000

.
g
x
m
3
/s

Hoặc có thể vẽ đờng tần suất chuỗi Q
max
Sơn Tây, ứng với P=50% ta đợc
x
g
=15300 m
3
/s,
- Số đông (mod) x
đ

Số đông là số xuất hiện nhiều nhất trong chuỗi. Trên đờng phân bố mật độ tần
suất số đông ứng với điểm cực đại y=f
max
(hình 1.2)
1 - Tâm phân phối (trị bình quân số học); 2 - Số giữa; 3 - Số đông
4 - x
0
- Giá trị đầu tiên của đại lợng ngẫu nhiên.
Hình 1.2. Đờng cong mật độ tần suất
Nếu số liệu đợc phân nhóm thì số đông tìm đợc theo biểu thức [10]:
x
đ
=
Cu
l
l
L











1
, (1.14)
trong đó: L
1
là giới hạn dới của cấp chứa số đông;
l

là chênh lệch tần số của cấp
chứa số đông so với cấp thấp hơn;
u

là chênh lệch tần số của cấp chứa số đông so với
cấp cao hơn; C là độ rộng của mỗi cấp.
Theo ví dụ 1.1 (bảng 1.3) ở trên ta có L
1
=12000 m
3
/s;
l
=34-5=29;

u


=34-24=10; C=3000.
Từ đó ta đợc: x
đ
=
14200142313000
10
29
29
1200

.
m
3
/s
Theo Karl Pearson [10] 3 số trung bình, số giữa và số đông có quan hệ:

)(
gd
xxxx 3
(1.15)
b. Đặc trng biểu thị sự phân tán
- Khoảng lệch:
i
=
xx
i

(1.16)



14

Khoảng lệch biểu thị sự phân tán của từng số hạng so với giá trị trung bình,
nhng không đánh giá dựoc độ phân tán của toàn bộ chuỗi số.
- Biên độ (khoảng biến thiên): R = x
max
- x
min
(1.17)
Biên độ biểu thị độ phân tán lớn nhất của toàn chuỗi nhng không phản ảnh đợc
mức độ phân tán của từng số hạng trong chuỗi.
- Khoảng lệch trung bình:




n
i
i
xx
n
D
1
1
(1.18)
Đặc trng này biểu thị sự phân tán hợp lý hơn nhng ít khi dùng.
- Khoảng lệch quân phơng (độ lệch chuẩn):

n

xx
n
i
i
2
1
)(




(1.19)
Đặc trng này biểu thị độ lệch chung của tất cả các số hạng của chuỗi số so với trị
số trung bình. Nó có cùng thứ nguyên với đại lợng xem xét. Bình phơng của độ lệch
chuẩn là phơng sai:
2
=D. Khi


n
thì phơng sai mẫu dần tới phơng sai của
tổng thể và chính là mômen trung tâm bậc 2:




n
i
i
xx

n
D
1
2
1
)(
(1.20)
Tuy nhiên độ lệch chuẩn có thứ nguyên nên không thể so sánh giữa các chuỗi số
có thứ nguyên khác nhau. Đồng thời cũng không thể so sánh khi 2 chuỗi có
x
khác
nhau.
- Hệ số biến đổi (biến sai) C
v
:








n
i
i
n
i
i
V

K
nx
n
xx
X
C
1
2
1
2
1
1
)(
)(

, (1.21)
trong đó:
x
x
K
i
i

(1.22)
gọi là hệ số môđun.
C
v
là hệ số không thứ nguyên, cho phép so sánh giữa các đại lợng không cùng
thứ nguyên, khắc phục những hạn chế của . Tuy nhiên nó không cho ta thấy rõ dạng
đờng phân bố mà chuỗi thuỷ văn thờng có nh đối xứng hay không đối xứng, nhọn

hay tù.
c. Đặc trng biểu thị dạng đờng phân bố
- Hệ số bất đối xứng (lệch) C
s
: Thể hiện độ lệch so với trị số trung bình

3
1
3
33
1
3
)1()(
V
n
i
i
V
n
i
i
s
nC
K
xnC
xx
C







(1.23)


15

C
s
là số không thứ nguyên, có thể lớn hơn, nhỏ hơn hay bằng 0, phụ thuộc vào tử
số



n
i
i
xx
1
3
)(
. Khi C
s
= 0, đờng phân bố đối xứng so với trị số trung bình
x
, nghĩa là
độ lệch về phía lớn hơn hay nhỏ hơn
x
là nh nhau. Khi đó

x
trùng với x
đ
.
Nếu



n
i
i
xx
1
3
)(
> 0 thì C
s
> 0, đờng phân bố lệch dơng, tức là tổng độ lệch của
các số hạng có trị số lớn hơn
x
thì lớn hơn tổng độ lệch của các số hạng có trị số nhỏ
hơn
x
. Khi đó
x
lệch sang phải so với x
đ
.
Nếu




n
i
i
xx
1
3
)(
< 0 thì C
s
< 0, đờng phân bố lệch âm, tức là tổng độ lệch của các
số hạng có trị số lớn hơn
x
thì nhỏ hơn tổng độ lệch của các số hạng có trị số nhỏ hơn
x
. Khi đó
x
lệch sang trái so với x
đ
.
Các dạng đờng tơng ứng với các trờng hợp C
s
thể hiện ở hình 1.3 [32].









Hình 1.3. Đờng cong phân bố đối xứng hay lệch dơng (1) hoậc âm (2)
- Hệ số nhọn C
e
: Hệ số nhọn biểu thị mức độ trơn hay nhọn của dạng đờng phân
bố.

4
1
4
1





n
i
i
e
xx
n
C
)(
(1.24)
Ngời ta thờng hay so sánh độ nhọn với phân bố chuẩn. Với phân bố chuẩn có
C
e
=3, nên dùng số d E để so sánh: E=C

e
-3.
Nếu E=0 thì hàm là phân bố chuẩn. Nếu C
e
>0 thì đờng phân bố nhọn, còn khi C
e

<0 thì đờng phân bố tù.
Các trờng hợp đờng phân bố nhọn hay tù đợc biểu thị trên hình 1.4[32].
1.E>0; 1. E=0; E<0
Hình 1.4. Dạng hàm phân bố theo độ nhọn
X
đ
X
đ


16

1.3.5. Liên hệ giữa các mômen và các đặc trng thống kê trong thuỷ văn
Khi mô tả tính chất của các tập hợp thống kê thờng sử dụng 2 loại mômen thống
kê, đó là mômen gốc và mômen trung tâm.
- Mômen gốc (

): Mômen gốc bậc k của các đại lợng ngẫu nhiên rời rạc x biểu thị
trong dạng:





n
i
k
ik
x
n
1
1

(1.25)
Vì vậy mômen gốc bậc k của đại lợng ngẫu nhiên x là kỳ vọng toán học m
x
hoặc
giá trị trung bình bậc k của đại lợng ngẫu nhiên này. Nói riêng khi k=1 ta có mômen
gốc bậc 1, hoặc nói cách khác, là trung bình số học của đại lợng nghiên cứu.




n
i
i
x
n
1
1
1

(1.26)
- Mômen trung tâm (


): Mômen trung tâm bậc k của đại lợng ngẫu nhiên x là
giá trị trung bình của khoảng lệch bậc k của đại lợng ngẫu nhiên so với kỳ vọng m
x
của nó.




n
i
k
k
xx
n
1
1
)(

(1.27)
Khi k=2, ta có mômen trung tâm bậc 2:




n
i
xx
n
1

2
2
1
)(

(1.28)
Khi k=3, ta có mômen trung tâm bậc 3:




n
i
i
xx
n
1
3
3
1
)(

(1.29)
Khi k=4, ta có mômen trung tâm bậc 4:




n
i

i
xx
n
1
4
4
1
)(

(1.30)
Dĩ nhiên, mômen trung tâm bậc 0, cũng nh mômen gốc bậc 0, là bằng 1, còn
mômen trung tâm bậc 1 là bằng 0.
Hiệu giữa giá trị đại lợng ngẫu nhiên x và kỳ vọng toán học m
x
(giá trị trung
bình) của nó gọi là đại lợng ngẫu nhiên quy tâm:

xxx
0
,
ứng dụng khái niệm này có thể xác định mômen trung tâm bậc k gọn hơn, nh là
kỳ vọng toán học bậc k của đại lợng ngẫu nhiên quy tâm:




n
i
k
k

x
n
1
0
1
)(

(1.31)
Tổng quát, các mômen có thể xem xét không chỉ đối với gốc toạ độ (mômen gốc)
hoặc kỳ vọng (mômen trung tâm) mà còn đối với một điểm tuỳ ý a:




n
i
k
ik
ax
n
1
1
)(

(1.32)
Dĩ nhiên khi a=0 biểu thức (1.33) trùng với mômen gốc, còn khi a =
x
, nó trùng
với mômen trung tâm.



17

Giữa các mômen thống kê và các đặc trng có mối quan hệ nh bảng 1.6 dới đây.
Cũng vì vậy phơng pháp xác định các thông số thống kê theo các công thức mômen ở
trên gọi là phơng pháp mômen.
Bảng 1.6. Biểu thị các thông số thống kê theo mômen
TT

Thông số Biểu thị qua mômen tơng ứng
1
Trung bình số học
X

(kỳ vọng toán học m
x
)
Mômen gốc bậc 1:
1


2
Phơng sai
2
=D
Khoảng lệch quân phơng
(khoảng lệch chuẩn)
Mômen trung tâm bậc 2:
2



Căn bậc 2 của mômen trung tâm bậc 2:
2


3 Hệ số biến đổi C
v

Căn bậc 2 của
2

chia cho
1

:
1
2



4 Hệ số bất đối xứng (lệch) C
s

Mômen trung tâm bậc 3
3

chia cho lập
phơng của :
23
2

3
3
3
/






5 Hệ số nhọn C
e

Mômen trung tâm bậc 4
4

chia cho luỹ
thừa 4, sau đó trừ đi 3:
33
2
2
4
4
4








1.3.6. Các thông số thống kê mẫu
Các công thức tính thông số trên viết cho một tổng thể hay mẫu dài có n rất lớn.
Khi mẫu ngắn ngời ta thờng dùng các công thức tơng ứng sau để hiệu chỉnh độ
lệch:

xn
K
n
xx
n
i
i
n
i
i
)(
)()(
1
1
1
2
1
2
1










(1.33a)
Với số liệu phân nhóm thì:

1
2
1





n
xxf
n
i
ii
)(

(1.33b)






n

i
iv
K
n
C
1
2
1
1
1
)(
(1.34)

3
1
3
3
1
3
3
1
21
1
v
n
i
i
v
n
i

i
s
Cn
K
Cnn
K
C
)(
)(
))((
)(








(1.35a)
Với số liệu phân nhóm, Karl Pearson đa ra quan hệ kinh nghiệm:


d
s
xx
C


(1.35b)


4
2
1
4
4
1
4
)3(
)1(
1
)3)(2)(1(
)(
1
v
n
i
i
n
i
i
e
Cn
K
n
nnn
xx
n
C










(1.36)


18

Nguyên tắc hiệu chỉnh độ lệch sẽ đợc trình bày trong chơng III.
Một số thông số thống kê có thể tìm đợc bằng phần mềm Excel hoặc tham khảo
chơng trình trên ngôn ngữ Fortran của Phạm Văn Huấn [3].
Ví dụ1.3: Tính các đặc trng thống kê cho dòng chảy trung bình năm trạm Hoà
Bình sông Đà (1956-2002) (bảng 1.7).
Bảng 1.7. Tính các đặc trng thống kê dòng chảy năm trạm Hoà Bình sông Đà
Năm Q
năm

K
i
=Q
i
/
Q

1

i
K

2
1)(
i
K

3
1)(
i
K

4
1)(
i
K

1956 1800 1.046512 0.046512 0.0021633 0.0001006 4.68E-06
1957 1420 0.825581 -0.17442 0.0304218 0.0053061 0.00092549
1958 1550 0.901163 -0.09884 0.0097688 0.0009655 9.5429E-05
1959 1810 1.052326 0.052326 0.002738 0.0001433 7.4965E-06
1960 1590 0.924419 -0.07558 0.0057125 0.0004318 3.2633E-05












1998 1950 1.133721 0.133721 0.0178813 0.0023911 0.00031974
1999 2240 1.302326 0.302326 0.0914008 0.0276328 0.0083541
2000 1850 1.075581 0.075581 0.0057125 0.0004318 3.2633E-05
2001 2120 1.232558 0.232558 0.0540833 0.0125775 0.002925
2002 2160 1.255814 0.255814 0.0654408 0.0167407 0.0042825
Tổng 80800 -0.02326 1.0417117 0.0035052 0.05316346
Q
1720
=258,7
C
V
=0,15 C
S
= -0,22 C
e
=0,058

Theo các công thức (1.12a), (1.33a), (1.34), (1.35) và (1.36), xác định đợc:
Q
1720; =258,7; C
v
=0,15; C
s
= -0,22 và C
e
=0,058. Nh vậy có thể thấy dòng chảy

năm trạm Hoà Bình sông Đà có hệ số biến đổi nhỏ, gần đối xứng và có dạng tù.
Các thông số
x
, C
v
, C
s
là những thông số cơ bản để xây dựng đờng tần suất của
các đại lợng thuỷ văn, nói riêng là dòng chảy sông ngòi.
1.3.7. Luật số lớn và định lý giới hạn trung tâm
a. Luật số lớn
Giả sử có dẫy biến ngẫu nhiên x
i
độc lập và có phân bố nh nhau, đồng thời tồn tại kỳ
vọng toán học m(x
i
)=a<

và phơng sai
2
<

. Kí hiệu



n
i
in
xS

1
. Khi đó đối với số dơng
0


bất kỳ ta có bất đẳng thức Tsebsev:

2
2



n
a
n
S
P
n










, (1.37)
tức là với mọi

0



0


và n đủ lớn, thì giá trị trung bình số học S
n
/n với xác suất nhỏ
hơn (1-

) sẽ khác kỳ vọng toán học a một lợng không quá

. Trong trờng hợp riêng có luật
số lớn dới dạng Khinchin:

0









n
n
a

n
S
P

(1.38)


19

tức là có sự hội tụ theo xác suất của trung bình số học tới kỳ vọng toán học.
b. Định lý giới hạn trung tâm: Phát biểu nh sau:
Nếu dãy các biến ngẫu nhiên x
i
là một chuỗi độc lập và phân bố đồng nhất với số trung
bình bằng
x
và phơng sai
2
thì phân bố của tổng N biến ngẫu nhiên đó sẽ tiệm cận về phân
bố chuẩn với số trung bình bằng N
x
và phơng sai N
2
khi N rất lớn, bất kỳ các số hạng có
phân bố nh thế nào.
Định lý do A.A.Markov và A.M.Liapunov đề xuất và sau đó đợc Markov và S.N.
Bernơstin ứng dụng vào tổng các đại lợng ngẫu nhiên có tơng quan rất kém.

áp dụng vào thuỷ văn thấy rằng lợng dòng chảy là kết quả của nhiều nhân tố x
i


phức tạp và độc lập nh: lợng ma; tổn thất; tập trung dòng chảy; các nhân tố mặt
đệm; hoạt động của con ngời
Tuy nhiên dòng chảy không thể là tổng đại số đơn giản của các nhân tố ảnh hởng
đó. Do vậy không thể theo định lý giới hạn trung tâm tìm ra phân bố lý luận của các
đặc trng thuỷ văn. Chúng ta phải tìm những hàm phân bố phù hợp hơn.
1.4. Lợc sử phát triển của thống kê thuỷ văn
Lúc đầu khi thống kê số liệu ngời ta chỉ tính một số đặc trng đơn giản nh
trung bình, khoảng lệch quân phơng. Đờng tần suất là đờng kinh nghiệm của mực
nớc và lu lợng.
Hazen là ngời bắt đầu ứng dụng lý thuyết xác suất vào trong thuỷ văn (1914)
khi nghiên cứu quy luật dao động nhiều năm của dòng chảy. Ông mô tả phân bố thống
kê của dòng chảy sông ngòi theo luật Gauss (chuẩn) với 2 thông số: trung bình và
khoảng lệch quân phơng. Công thức tính tần suất đề nghị là
n
m
P
50,

. Ông cũng là
ngời đa ra lới xác suất để vẽ đờng kinh nghiệm và ngoại suy và đợc gọi là lới
Hazen.
Giai đoạn phát triển sau đó là của A. Foster và Đ.L. Xôcôlôpski (1934). Foster cho
rằng phân bố của chuỗi dòng chảy là không đối xứng và đề nghị dùng đờng cong
Pearson III (P.III) để mô tả. Foster đã thành lập bảng Foster sau đó X.I. Rbkin làm
chính xác hoá (1938) cho phép theo các thông số cơ bản có thể xác định giá trị của
hàm. Xôcôlôpxki chỉ ra sự ứng dụng các công thức kinh nghiệm để xác định các đặc
trng thống kê cho các khu vực không có tài liệu đo đạc, đề nghị dùng quan hệ C
s
=

2C
v
mà không xác định trực tiếp C
s
từ tài liệu quan trắc. Ông cũng sử dụng đờng
P.III để tính dòng chảy lớn nhất.
G.N. Brokovich đa ra một hàm phân bố có giới hạn 0<x<

trong dạng đa thức
Lager. Số hạng đầu tiên của nó trùng với đờng cong P.III khi C
s
= 2C
v
, khắc phục
nhợc điểm của P.III khi C
s
<2C
v
thì nhận giá trị <0. Đề nghị này đa đến sử dụng 3
thông số (thêm thông số bất đối xứng C
s
).
Để khắc phục thực sự nhợc điểm của P.III khi C
s
<2C
v
, X.N.Kritski và M.F.
Menkel (1946) đã đa ra đờng cong Kritski-Menkel bằng cách biến đổi biến của
đờng P.III sao cho 0<x<


. Đờng này gọi là đờng cong Gamma 3 thông số.
Korenhistov (1948) xây dựng bảng tra với các giá trị C
v
và tỷ số C
s
/C
v
. Ngoài ra một
loạt các tác giả khác cũng tìm cách khắc phục nhợc điểm của đờng P.III.


20

Một hớng khác là vẫn sử dụng phân bố chuẩn và P.III nhng đổi biến số bằng
logarit hoá và đợc đờng cong log chuẩn và logP.III. Dạng này đợc Fisher và Sleyd
(1934) áp dụng cho dòng chảy sông ngòi.
G.A. Alecxayev (1946) đã phân tích chi tiết đờng cong Goodrich, và chứng minh
rằng nó không âm khi C
s
<2C
v
(ngay cả khi C
s
<0). Sau này G.G. Xvaniđze và Grigoli
(1972) sử dụng phân bố Johnson có giới hạn 2 đầu cho dòng chảy tháng.
Các nhà nghiên cứu đi sâu vào khả năng ngoại suy đến tần suất nhỏ của các
đờng cong tần suất và kiểm tra sự phù hợp của đờng cong tần suất lí luận với đờng
thực nghiệm. Đồng thời các nhà nghiên cứu cũng tập trung vào đánh giá độ chính xác
của sai số mẫu các thông số thống kê, giá trị mẫu của các phân vị xác suất. Kritski-
Menkel dành sự chú ý cho việc đánh giá thống kê độ chính xác của các thông số đờng

cong tần suất theo mẫu. Vào năm 1948 các ông đã công bố các biểu thức sai số ngẫu
nhiên của các thông số trên và sau đó là các công thức hiệu chỉnh ớc lợng mẫu của
chúng. G.G. Xvanitđze(1964), E.G. Blokhinov (1966) đã sử dụng phơng pháp
Monte-Carlo để mô hình hoá chuỗi thuỷ văn không và có tơng quan giữa các số hạng,
từ đó xác định sai số ngẫu nhiên và hiệu chỉnh độ lệch của các thông số ớc lợng theo
mẫu Gumbel, Weibull, Frechet (1935-1960) đã giới thiệu dạng đờng phân bố cho các
đại lợng cực trị.
Phân tích thống kê thuỷ văn ngày càng đợc ứng dụng nhiều và ngày càng phát
triển và nhiều mô hình mô phỏng quy luật dao động chuỗi thời gian dòng chảy nh
xích Markov, ARIMA, Thomas-Fiering đã và đang đợc sử dụng trong cả dự báo cũng
nh tính toán thuỷ văn, thuỷ lợi.
Một hớng phát triển khác hiện nay là tạo chuỗi thuỷ văn có độ dài tùy ý theo
phơng pháp Monte-Carlo, phục vụ cho các bài toán phân tích tính toán thuỷ năng,
thuỷ lợi.
1.5. Câu hỏi và bài tập
a. Câu hỏi
1. Thế nào là mẫu và tổng thể?
2. Thế nào là tần suất và tần suất luỹ tích?
3. Thế nào là độ lặp lại và cách tính?
4. ý nghĩa giá trị trung bình và công thức tính?
5. ý nghĩa khoảng lệch quân phơng và hệ số biến đổi. Công thức tính?
6. ý nghĩa hệ số bất đối xứng và công thức tính?
7. ý nghĩa hệ số nhọn và công thức tính?
b. Bài tập:
1. Tính các đặc trng thống kê của chuỗi dòng chảy trung bình năm trạm Yên Bái
trên sông Hồng? Số liệu cho trong bảng 1.8.
Bảng 1.8. Dòng chảy trung bình năm trạm Yên Bái sông Hồng từ năm 1956-2003
TT

Năm

Q

TT

Năm

Q

TT

Năm

Q

TT

Năm

Q

1 1956 877 13 1968

966 25 1980 622 37

1992

593


21


2 1957 768 14 1969

690 26 1981 583 38

1993

506
3 1958 688 15 1970

938 27 1982 666 39

1994

820
4 1959 759 16 1971

1290

28 1983 720 40

1995

812
5 1960 717 17 1972

746 29 1984 732 41

1996


905
6 1961 920 18 1973

918 30 1985 735 42

1997

856
7 1962 737 19 1974

691 31 1986 901 43

1998

636
8 1963 654 20 1975

746 32 1987 634 44

1999

826
9 1964 765 21 1976

689 33 1988 537 45

2000

742
10


1965 576 22 1977

615 34 1989 609 46

2001

950
11

1966 957 23 1978

930 35 1990 883 47

2002

788
12

1967 655 24 1979

616 36 1991 682 48

2003






×