Tải bản đầy đủ (.pdf) (367 trang)

Các phương pháp thống kê trong thủy văn

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (6.15 MB, 367 trang )

Lời tựa
Việc sử dụng rộng rãi các phơng pháp của lý thuyết xác suất trong thuỷ văn
khởi đầu vào những năm 30 của thế kỷ XX. Những nghiên cứu tích cực trong lĩnh
vực này đợc triển khai mạnh trong những năm sau chiến tranh. Việc sử dụng các
phơng pháp thống kê trong thuỷ văn mở rộng một cách đáng kể. Tuy nhiên, các
kết quả nghiên cứu vấn đề này đợc trình bày trong các bài báo riêng biệt hoặc
trong các chuyên khảo hẹp không phù hợp với các nhà thuỷ văn thực hành. Các
công trình trình bày một cách có hệ thống việc áp dụng các phơng pháp thống kê
trong thuỷ văn vẫn còn bỏ ngỏ. Tập thể tác giả mong muốn khắc phục khiếm
khuyết đó và tiếp tục phát triểnviệc áp dụng các phơng pháp thống kê trong thuỷ
văn học.
Khi soạn thảo cuốn sách các tác giả có xu hớng trình bày các tài liệu một
cách đơn giản và trực quan nhất, bỏ qua các cấu trúc toán học phức tạp và cá vấn đề
thống kê chuyên dụng. Cho nên chủ yếu chỉ chú ý vào việc giải thích ý nghĩa vật lý
của các thủ thuật thống kê với lợng thông tin hoàn toàn không đầy đủ và chính xác.
Khuôn khổ bó hẹp của cuốn sách phải bỏ qua việc trình bày chi tiết lý thuyết hàm
ngẫu nhiên gồm việc sử dụng hàm tơng quan quan hệ, hàm tự tơng quan, hàm
phổ và phổ kép, sự đồng pha và lệch pha các dao động tuần hoàn. Trong cuốn sách
không xét các phơng pháp thống kê dự báo các dao động nhiều năm của các đặc
trng thuỷ văn mặc dù các phân tích độ ổn định theo thời gian đã dẫn và độ chính
xác của hàm phổ và hàm tơng quan có quan hệ trực tiếp tới việc đánh giá độ tin
cậy của sơ đồ dự báo, đợc thực hiện bởi việc sử dụng các phép thống kê. Vì lẽ đó
cũng không đa vào cuốn sách phụ lục các bảng hiệu chỉnh đợc sử dụng khi tính
toán.
Việc soạn cuốn sách có nhiều khó khăn nên không thể tránh khỏi nhiều
thiếu sót . Thực tiễn sử dụng và sự phê bình nghiêm túc mới có thể khắc phục các
thiếu sót đó, các tác giả sẵn sàng tiếp nhận và trân trọng cảm ơn.
Các tác giả cảm ơn GS. GAG. Svanhidze về những lời chú giá trị qua quá
trình phản biện và soát bản thảo.



Mở đầu
1. Các luận điểm chung.
Các phơng pháp thống kê trong các nghiên cứu thuỷ văn đợc ứng dụng khi
giải nhiều bài toán vì nhiều khi nó là con đờng duy nhất để đánh giá định lợng các
khía cạnh khác nhau của hiện tợng thuỷ văn. Phát biểu trên xuất phát từ bản chất đa
nhân tố của quá trình thuỷ văn. Thực vậy ngời ta đã biét một cách rộng rãi rằng nhiều
hiện tợng thuỷ văn là kết quả tác động của một số lớn các nhân tố, mức độ ảnh hởng
của mỗi trong các nhân tố đó lê sự hình thành của hiện tựơng đang xét tính một cách
trọn vẹn là điều không thể. Mô tả toán học các hiện tợng tơng tự chỉ có thể bằng
phng pháp thống kê. Thí dụ, xét lu lợng cực đại của nớc, giá trị của nó xác định
trực tiếp kích thớc các thành phần quan trọng của công trình thuỷ. Dòng chảy cực đại
đợc hình thành dới tác động của các nhân tố khí tợng và đặc điểm của mặt đệm.
Các nhân tố khí tợng bao gồm ma, lớp phủ tuyết, sự phân bố củ chúng theo
diện tích bồn thu nớc, cờng độ và thời đoạn ma và cấp nớc của lớp phủ tuyết.
Cũng ảnh hởng tới dòng chảy cực đại của sông ngòi là độ ẩm trớc đó của lu vựcmà
nó lại đợc xác định bởi một tổ hợp các yếu tố khí tợng và các điều kiện địa lý tự
nhiên khác: ma, bốc hơi từ bề mặt lu vực, các tính chất thuỷ lý của lớp thổ nhỡng
và nhiều yếu tố khác. Các nhân tố địa lý tự nhiên bao gồm kích thớc và dạng bồn thu
nớc, cấu trúc mạng lới thuỷ văn, độ dốc sông ngòi và lu vực, điều kiện địa chất và
thuỷ đại chất của bồn thu nớc, sự có mặt của điền trũng, ao hồ, đầm lầy, rừng, hồ
chứa và v.v... Làm sáng tỏ các quy luật đặc trng cho hiện tợng đợc hình thành nh
hệ quả của các mối quan hệ đa nhân tố chỉ có thể bằng phơng pháp thống kê.
áp dụng các phơng pháp thống kê trong thuỷ văn có một vài đặc điểm chi
phối đặc thù của hiện tợng đang xét trong thuỷ văn.
Đặc điểm thứ nhất là trong hành trangcủa nhà thuỷ văn thơng có ít thông tin
mà nó thờng không thể tăng lên đợc nữa. Khi đó quan trọng nhất là vấn đề ớc
lợng thống kê các tham số lựa chọn của phân phối để tăng nhân tạo lợng thông tin
(dẫn các dãy thuỷ văn ngắn về thời đoạn nhiều năm), lựa chọn mô hình toán tơng đối
phù hợp thở mãn tốt nhất số liệu thực nghiệm. Thực vậy, thờng không biết trớc đợc
hàm phân bố nào sẽ mô tả đặc trng thuỷ văn này hay kia. Khi đó mọi thông tin bổ

sungvề dạng đờng cong phân bố, ngoài số liệu quan trắc , tất nhiên là ngắn, đều cha
có. Nên sự lựa chọn đờng cong phân bố thờng đợc thực hiện xuất phát từ một vài
quan niệm chung, thí dụ về các điều kiện biên cần thoả mãn sơ đồ đợc tiếp nhận. Mức
6


độ tơng ứng của tài liệu thực nghiệm với đờng cong phân bố đợc lựa chọn sử dụng
(đờng đảm bảo) sau đó đợc kiểm tra bằng cách so sánh đờng cong phân bố lý
thuyết với thực nghiệm.
Trong nhiều trờng hợp số liệu quan trắc về dòng chảy thờng trùng lặp với một
số đờng phân bố giải tích. Trong những trừng hợp nh vậy lựa chọn đờng cong phân
bố này hoặc khác trở thành một nhiệm vụ không xác định tất nhiên dẫn đến nhiều kết
quả tính toán khác nhau.
Sau khi xác định qui luật phân bố mà nó mô tả hiện tợng thuỷ văn ta quan tâm,
xuất hiện nhiệm vụ đánh giá các tham số phân bố tổng hợp theo tập mẫu và nó đến lợt
lại đợc thực hiện với một mức độ chính xác nào đó phụ thuộc vào dạng đờng cong
phân bố và lợng thông tin khi thực hiện tính toán các tham số lựa chọn của phân bố.
Do vậy đánh giá lựa chọn các tham số của phân bố đợc thực hiện thờng xuyên với
sai số này hoặc kia, xác định nó trong bất kỳ tính toán thuỷ văn nào là nhiệm vụ quan
trọng bậc nhất. Bài toán này thờng bị phức tạp hoá bởi sự hiện diện của sự bất đối
xứng trong chuỗi thuỷ văn và mối quan hệ nội tại trong dãy. Đối với các trờng hợp đó
các phép giải tích của lý thuyết ớc lợng tập mẫu tất nhiên là cha có. Lời giải gần
đúng các vấn đề đó trong nhiều trờng hợp có thể nhận đợc trên cơ sở phơng pháp
Monte-Carlo - phơng pháp thực nghiệm thống kê.1
Đặc điểm thứ hai của việc áp dụng các phơng pháp thống kê trong thuỷ văn là
ở chỗ dãy quan trắc về dòng chảy sông ngòi trong một số trờng hợp là không đồng
nhất cả thời gian lẫn không gian. Điều này làm phức tạp hơn việc mô tả thống kê tập
hợp các đại lợng thuỷ văn. Cho nên, trớc khi tính toán thống kê thờng cần phải
chọn lọc một cách kỹ lỡng thông tin ban đầu từ quan điểm đồng nhất về mặt vật lý và
thống kê. Không tính đến điều này có thể dẫn tới các kết luận không chính xác. Để

minh hoạ điều đó có ví dụ sau đây. Giả sử xét dòng chảy cực đaị của sông ngòi, trên đó
trong một số năm xác định đã xây dựng hồ chứa để thực hiện điều tiết mùa dòng chảy
sông ngòi. Trong trờng hợp đó hoàn toàn tất nhiên là phân bố dòng chảy cực đại trớc
và sau khi xây dựng hồ chứa sẽ khác nhau và trộn hai phân bố vào một nhóm là không
thể đợc. Thờng rất khó xác định trớc nguyên nhân phá vỡ trạng thái đồng nhất của
chuỗi quan trắc. Trong những trờng hợp nh vậy đặc biệt cần thiết phải tính tới việc

1

Lần đầu tiên phơng pháp Monte - Carlo đợc trình bày bởi các nhà toán học Mỹ Dj. Neyman và S.
Ulam. Ngày nay phơng pháp này thờng đợc gọi là phơng pháp thực nghiệm thống kê .

7


sử dụng các tiêu chuẩn thống kê đồng nhất với việc phân tích vật lý kỹ lỡng chuỗi
quan trắc đang nghiên cứu.
Đặc điểm thứ ba của việc ứng dụng các phơng pháp thống kê trong thuỷ văn
liên quan tới sự có mặt của quan hệ nội tại các thành phần trong chuỗi, nó phá vỡ tính
ngẫu nhiên của mẫu, kết quả là lợng thông tin độc lập giảm , tính bất ổn định của ớc
lợng thống kê tăng đồng thời thay đổi cấu trúc của chuỗi thuỷ văn. Những vấn đề này
càng có ý nghĩa đặc biệt quan trọng khi điều tiết dòng chảy sông ngòi vì tính chất
nhóm các năm ít và nhiều nớc phần nhiều đợc xác định bởi quan hệ nội tại của
chuỗi.
Các đặc điểm đã nêu của việc mô tả thống kê hiện tợng thuỷ văn đợc phản
ánh trong các phần tơng ứng của cuốn sách này.
Ngoài các luận điểm có tính nguyên tắc chung đã nêu, trong cuốn sách còn xét
tới các thủ thuật cụ thể sử dụng đờng cong phân bố và lới xác suất áp dụng trong
thuỷ văn , các phơng pháp kéo dài chuỗi quan trắc ngắn về thời kỳ nhiều năm,
phơng pháp phân tích tính đồng nhất và quan hệ ngẫu nhiên của chuỗi thuỷ văn với

việc sử dụng các khái niệm cuả lý thuyết hàm ngẫu nhiên. Xét đến cả phơng pháp
thực nghiệm thống kê (phơng pháp Monte - Carlo) ứng dụng giải một vài bài toán
thuỷ văn.
Giải quyết nhiều bài toán thuỷ văn thống kê sẽ không thực hiện đợc nếu không
sử dụng máy tính điện tử.
Thực vậy, khó thể tởng tợng nếu dẫn một chuỗi ngắn về thời kỳ nhiều nămvới
việc sử dụng vài tơng tự trên cơ sở toán học của phơng pháp tuyến tính bôi mà
không sử dụng máy tính điện tử.
Việc sử dụng rộng rãi phơng pháp thực nghiệm thống kê khi phân tích nhóm
các năm nhiều nớc và ít nớc, sử dụng nhiều phơng pháp lý thuyết hàm ngẫu nhiên
để mô tả nh dao động dòng chảy nhiều năm của sông ngòi (tính toán hàm tự tơng
quan và tơng quan quan hệ, tính hàm phổ và phổ quan hệ. tính toán đồng phân và sai
phân của các pha dao động tuần hoàn) sẽ mất ý nghĩa nếu thiếu maý tính điện tử.
Việc tự động hoá tổng hợp các hệ thống lựa chọn, kiểm tra, xử lý, bảo tồn và
khái quát thông tin thuỷ văn đợc thực hiện ngày nay tại Tổng cục KTTV đồi hỏi việc
áp dụng rộng rãi các phơng pháp thống kê cũng nh các phơng tiện hiện đại của kỹ
thuật tính toán - máy tính điện tử. Tuy nhiên diều đó không phải là u thế chủ yếu của
tự động hoá tổng hợp đo đạc thuỷ văn.
8


Thiết lập quỹ dữ liệu thuỷ văn trên các phơng tiện kỹ thuật mang thông tin mở
ra những khả năng to lớn giải quyết các bài toán thuỷ văn khác nhau theo một lãnh thổ
rộng lớn, có thể là cả lãnh thổ Liên bang Xô viết, trên cơ sở sử dụng máy tính và các
phơng pháp thống kê hiện đại. Có thể tin rằng việc kết hợp các máy tính có tốc độ cao
với các phơng pháp phân tích thống kê hiện đại dẫn tới các sơ đồ tính toán và dự báo
dòng chảy sông ngòi chất lợng cao.
Khi trình bày nhiều chơng, cuốn sách sử dụng rộng rãi các kết quả tính toán
thực hiện trên máy tính. Tuy nhiên, trình bày có hệ thống cơ sở áp dụng máy tính trong
các nghiên cứu thuỷ văn còn thiếu vì nó nằm ngoài khuôn khổ nội dung cuốn sách này.

Hiện nay có rất nhiều tài liệu phổ biến theo lý thuyết xác suất và toán học thống
kê, trong đó xem xét một cách khá trình tự cơ sở toán học của các thuật toán sử dụng
khi giải các baì toán thuỷ văn nêu trên. Tuy nhiên khi sử dụng các phép toán đã đợc
xử lý rộng rãi của lý thuyết xác suất trong các nghiên cứu và tính toán thuỷ văn khả
năng áp dụng nó còn xa mới trọn vẹn, đôi khi thậm chí còn cha chuẩn xác. Trong các
trờng hợp này việc làm sáng tỏ các đặc điểm xuất hiện khi áp dụng lý thuyết xác suất
vào trong thuỷ văn và việc hình thành các thủ thuật phân tích thống kê trong thực tiễn
có ý nghĩa quan trọng.
Tiến tới mục đích đó và để khai thác tốt hơn các tài liệu trong cuốn sách dẫn ra
nhiều thủ thuật thu đợc từ hoạt động khoa học và thực tế hoặc đợc thành lập theo các
tài liệu quan trắc. Tất nhiên, trong các thủ thuật này hoàn toàn cha mở ra hết bản chất
của các vấn đề xem xét, nó chỉ minh hoạ cho các tài liệu đang trình bày.
Các vấn đề lý thuyết thống kê toán học không đợc trình bày chi tiết mà chỉ sử
dụng các kết quả cần thiết cho áp dụng thực tiễn. Để khai thác sâu hơn khía cạnh toán
học của vấn đề đang xét cần tham khảo thêm các cuốn sách phổ cập khác. Trong cuốn
sách chỉ trình bày các phơng pháp thống kê thờng hay sử dụng nhất trong thuỷ văn
và các phơng pháp (theo ý các tác giả) thờng xuyên sử dụng nhất trong tính toán và
dự báo thuỷ văn.
2. Một vài nét ngắn gọn về sự phát triển phân tích thống kê tài liệu thuỷ
văn
Sử dụng các thuật toán xử lý thống kê tài liệu quan trắc thuỷ văn liên quan tới
việc hoàn thành việc khái quát đầu tiên, có nghĩa là về mặt lịch sử tơng ứng tới giai
đoạn đầu tiên của phát triển thuỷ văn học. Khi đó để đặc trng các đại lợng thuỷ văn
chỉ có các tham số cơ bản nhất của chuỗi thống kê : giá trị trung bình, độ lệch quân
9


phơng và các ma trận khác nhau. Trong giai đoạn này, dễ thấy mô tả thống kê đầy đủ
nhất là đờng cong đảm bảo trạng thái mực nớc (lu lợng nớc) trong năm. Ngời ta
cũng đã sử dụng một ít phân tích tơng quan.

Khởi đầu cho việc sử dụng rộng rãi các phép toán xác suất và thống kê toán học
liên quan tới sự xuất hiện công trình của A. Hazen[152-153], lần đầu tiên sử dụng lý
thuyết xác suất để nghiên cứu các qui luật thống kê dao động nhiều năm của dòng
chảy sông ngòi.
A. Hazen tiếp nhận đờng cong Gauxơ để mô tả phân bố thống kê chuỗi dòng
chảy sông ngòi có tính chất đối xứng, chạy từ - đến và đợc đặc trng bởi hai
tham số: giá trị trung bình của đại lợng biến đổi và độ lệch quân phơng của nó (hoặc
hệ số biến đổi). Để xác định suất đảm bảo thực nghiệm Hazen sử dụng công thức
P=

m 0,5
,
n

với n - số thành viên của chuỗi; m- số thứ tự của thành viên chuỗi phân bố theo trật tự
giảm (hoặc tăng) dần.
Các công trình của Hazen đã đặt nền móng cho việc xây dựng các lới xác suất,
cho phép làm thẳng các đờng cong đảm bảovà đẽ dàng cho việc ngoại suy. A. Hazen
dựng lới trên đó làm thẳng hoàn toàn đờng cong phân bố chuẩn (đờng cong
Gauxơ).
Giai đoạn quan trọng tiếp theo trong việc sử dụng các thủ thuật thống kê trong
thuỷ văn là các công trình của A. Phoster [149-151] và Đ. L. Xocolovski [131-132].
A. Phoster xác định rằng chuỗi dòng chảy thờng không đối xứng và vì thế giới
thiệu áp dụng cho việc xây dựng đờng cong đảm bảo dòng chảy đờng cong bất đối
xứng Piêcson III. Ngoài ra, đờng cong này với các giá trị xác định của tham số không
mang giá trị âm, hơn hẳn so với phân bố chuẩn về tính tơng ứng với bản chất hiện
tợng đang xét.
Đối với khả năng sử dụng thực tiễn rộng rãi đờng cong Piecson III, Phoster
thiết lập bảng giá trị hàm cho phép theo các tham số cơ bản xác định bởi nó (giá trị
trung bình, hệ số biến đổi và hệ số bất đối xứng ) dựng mọi đờng cong. Bảng Phoster

đợc S. I. Rpkin[117] hiệu đính và đợc sử dụng tốt trong tính toán thuỷ văn ở Liên
Xô. Tiếp theo bảng này đợc mở rộng bởi GGI đối với các giá trị cao hơn của hệ số bất
đối xứng (tới Cs = 5,2).
10


Việc các nhà thuỷ văn sử dụng rộng rãi các phép toán lý thuyết xác suất và
thống kê toán học ở Liên Xô bắt đầu từ lúc xuất hiện công trình của Đ.L. Xocolovski
[132], trong đó trình bày sơ đồ tính toán Phoster với đờng cong Piecson III. Đồng thời
Xocolovski còn đa ra một thành phần hoàn toàn mới trong cấu trúc của Phoster, chỉ ra
cách xác định đại lợng hệ số biến đổi theo công thức thực nghiệm đối với sông ngòi
không có số liệu đo đạc thuỷ văn trực tiếp. Vào thời điểm xuất hiện công trình của
Xocolovski cũng đã có đề xuất của Cotrerin để xác định chuẩn dòng chảy của sông
ngòi cha đợc nghiên cứu.
Nh vậy, xuất hiện khả năng dựng đờng cong đảm bảo của dòng chảy thậm
chí đối với sông ngòi hoàn toàn cha nghiên cứu thuỷ văn. Đối với việc đó chỉ cần
nhận một vài tỷ lệ tiêu chuẩn giữa các đại lợng của hệ số biến đổi (Cv) và hệ số bất
đối xứng (Cs). Tính cần thiết của cách giải nh vậy đợc xác định bởi tình huống là đại
lợng hệ số bất đối xứng (Cs) theo chuỗi dòng chảy ngắn đang có đợc xác định rất
không chính xác. áp dụng với việc tính toán đại lợng dòng chảy năm có suất đảm bảo
khác nhau tỷ lệ này đợc đề xuất bằng hai lần (Cs = 2Cv), và tơng ứng với giới hạn
dới của đại lợng ngẫu nhiên đang xét.
Tiếp về sau, Xocolovski [131] phổ biến nghiên cứu tính ứng dụng của đờng
cong Piecson III để tính toán lu lợng cực đại suất đảm bảo khác nhau.
Lúc đầu việc áp dụng rộng rãi đờng cong Piecson III đã có ý đến mong muốn
loại bỏ nhợc điểm của nó là nó nhận giá trị âm với các giá trị suất đảm bảo lớn khi mà
hệ số bất đối xứng của chuỗi ngẫu nhiên nhỏ hơn hai lần giá trị hệ số biến đổi
(Cs<2Cv). Tính chất nêu trên của đờng cong đang xét dẫn tới nhận giá trị âm của dòng
chảy (hoặc là một đại lợng dơng cực lớn, đối với việc mô tả chuỗi thống kê bởi
đờng cong Piecson III) khi ngoại suy phần thấp của đờng cong đảm bảo ngoài giới

hạn quan trắc.
Thử nghiệm đầu tiên theo hớng này do G. N. Brocovits [26-29]. Hàm phân bố
xác suất các đại lợng thay đổi trong khoảng 0theo đa thức (nhiều thành viên) Lager. Thành phần đầu tiên của khai triển trùng với
biểu thức của đờng cong Piecson III với Cs = 2Cv là mô hình xuất phát để biến đổi
tiếp theo bằng cách nhập các thành phần tiếp theo của khai triển.
Đề nghị của Brocovits áp dụng với ba tham số (giá trị trung bình, hệ số biến đổi,
hệ số bất đối xứng) đợc xem xét bởi Velicanov[33], ông thực hiện biến đổi đờng
cong Piecson III thành biểu thức tổng quan hơn bằng cách nhân tung độ của đờng
11


cong xuất phát với một thừa số nhiễu có dạng nhiều thành phần Ao + A1x + A2x2 +
A3x3 + ... Tuy nhiên lời giải mà Velicanov thu đợc, nh đã đợc G.A. Alecxayev
chứng minh, không hoàn toàn loại trừ đợc nhợc điểm đã nêu của đờng cong
Piecson III .
Cách do Brocovits và Velicanov khởi xớng đợc E.Đ. Xapharov chọn [119].
Xuất phát từ biểu thức chung của đờng cong phân bố xác suất, xuất hiện khi khai
triển một hàm bất kỳ (thay đổi trong khoảng 0,) theo đa thức Lager, Xapharov đi đến
phơng trình đờng cong phân bố xác suất trùng với Velicanov khi biến đổi đờng
cong Piecson III bằng phơng pháp biến đổi bằng thừa số nhiễu . Khi ứng dụng
phơng trình này Xapharov lập một bảng chuẩn để dựng đờng cong đảm bảo với Cv
thay đổi trong khoảng từ 0,05-1,0 và với các tỷ lệ Cv/Cs khác nhau. Đồng thời ông đề
xuất thuật toán đồ giải giải tích xác định hệ số biến đổi (Cv) và hệ số bất đối xứng (Cs)
áp dụng cho phân bố xác suất đang nghiên cứu.
Do các biến đổi đã nêu không loại trừ đợc nhợc điểm cơ bản đã nêu ở trên
của đờng cong Piecson III , khi Cs ~ 2Cv thì dẫn tới kết quả tính toán không khác
mấy đờng cong Piecson III nên chúng không nhận đợc sự ứng dụng rộng rãi.
Nhiệm vụ biến đổi đờng cong Piecson III để loại bỏ nhợc điểm bản chất của
nó là giá trị âm khi Cs < 2Cv đợc giải quyết bởi S.N. Krixki và M. Ph. Menkel[78],

họ thực hiện biến đổi biến ban đầu x (dấu hiệu phân bố) bằng biến thế z theo hệ thức
z=axb, với a và b - tham số phụ thuộc vào đại lợng hệ số biến đổi và hệ số bất đối
xứng dãy thực nghiệm của biến x ban đầu.
Việc áp dụng thực tế đờng cong Krixki - Menkel đợc nhận tên gọi là phân bố
gamma ba tham số1 trở nên khả thi sau ấn phẩm của Đ.V. Korenhistov [64] bảng tung
độ các đờng cong này đối với các giá trị khác nhau của hệ số biến đổi Cv và hệ thức
Cv/Cs. Trong các bảng này gồm giá trị hệ số biến đổi Cv từ 0,10 đến1,20. E.G.
Blokhinov và N.V. Nhicolskaia [24] đã mở rộng bảng tới Cv=2,0.
Bên cạnh việc biên soạn hớng tới việc loại bỏ nhợc điểm đã nêu của đờng
cong Piecson III, ngời ta còn nghiên cứu với mục đích là tạo ra các sơ đồ khác mô tả

1

Tên gọi này tuy nhiên là cha đầy đủ, vì mô hình xuất phát - đờng cong Piecson III là phân bố
gamma, biểu diễn ở dạng chung cũng qua ba tham số (x, Cv, Cs). Cho nên hoàn toàn không nhất thiết nh Krixki
và Menkel đã làm là trói buộc khái niệm đờng cong Piecson III với điều kiện Cs = 2Cv. Nói riêng, áp dụng vào
nhiệm vụ tính toán dòng chảy trong nhiều trờng hợp hoàn toàn hợp lý với Cs 2Cv .

12


các qui luật thống kê mang tính chất của chuỗi. ta đã biết những cố gắng thể hiện hàm
mật độ xác suất f(x) của đại lợng x thay đổi trong khoảng từ - đến ở dạng chung
hơn so với đờng cong phân bố chuẩn1 (đờng cong Gauxơ). Cách giải quyết này đã
đợc M. V. Mialcovski [90] áp dụng và ông sử dụng phơng pháp khai triển hàm f(x)
về chuỗi Gramm-Sarle trong dạng đa thức (đa thành viên) ermit. Thành viên đầu tiên
của khai triển này trùng với biểu thức của qui luật phân bố chuẩn. Do đó phơng pháp
này, về bản chất, dẫn đến biến đổi (biến dạng) của qui luật phân bố chuẩn Gauxơ ở
dạng phân bố bất đối xứng bằng cách xét thêm các thành viên chuỗi phụ thuộc vào các
mômen bậc cao hơn so với các mômen xác định đờng cong chuẩn xuất phát.

Phép biến dạng đờng cong chuẩn đã nêu với sự trợ giúp của khai triển hàm
phân bố đại lợng (x), thay đổi trong khoảng - xem nh là chuyển đổi từ hàm phân bố ban đầu (Gauxơ) đến một qui luật phân bố
chung hơn (nh là phân bố bất đối xứng) bằng cách nhân tung độ mô hình phân bố
xuất phát với một hàm f(x) nào đó, gọi là nhiễu. Hàm này thờng đợc biểu thị dới
dạng một liệt đại số.
Tơng tự, có thể xem phép biến đổi trên của việc biến đổi phân bố Piecson III
với sự trợ giúp của khai triển về chuỗi theo đa thức Lager.
Lời giải với sự sử dụng đờng cong phân bố Sarle , Mialcovski đạt đến giai đoạn
thuận tiện cho các tính toán thực tiễn. Ông đã thành lập các bảng cho phép xác định
tung độ đờng cong đảm bảo phụ thuộc vào hệ số bất đối xứng và độ nhọn - chính là
các tham số của đờng cong này.
Mặc dù vậy, đề xuất này không phổ biến trong thực tiễn tính toán thuỷ văn do
việc xây dựng đờng cong dựa trên việc ớc lợng các đại lợng hệ số bất đối xứng và
độ nhọn mà chúng theo chuỗi thực nghiệm đợc xác định với độ chính xác rất thấp.
Ngoài ra, biến đổi do Mialcovski đề xớng trong một số trờng hợp không loại
bỏ đợc khả năng nhận giá trị âm với một vài giá trị nào đó của biến. Nh A.M.
Basin[16] đã chứng minh, đờng cong Sarle không chiếm u thế nào và chỉ có tính
chất thực nghiệm.

1

Thuật ngữ đờng cong "chuẩn" là do Piecson đề xuất và ông nói:" Nhiều năm trớc đây tôi gọi là
đờng cong chuẩn là đờng cong Gauxơ - Laplas. Tên gọi này thuận tiện vì để lại gốc quốc tế và không thuận
tiện vì coi nh các phân bố khác bị hiểu là không chuẩn. Tất nhiên điều này không đúng."[99, tr.21].

13


Bên cạnh những vấn đề đã nêu, sử dụng đờng cong chuẩn để giải các bài toán

thuỷ văn gắn liền với biến đổi logarit hoặc là phơng trình đờng cong chuẩn, hoặc là
giá trị dòng chảy ban đầu. Rõ ràng phân bố xác suất chuẩn logarit chỉ có các đại lợng
ngẫu nhiên dao động trong miền giá trị dơng (thí dụ nh lu lợng nớc trong sông
ngòi), dologarit không có giá trị âm. Trong trờng hợp thứ nhất phơng trình qui luật
chuẩn đợc thế biến x bởi logx. Kết quả là thu đợc một phân bố chuẩn logarit (chuẩnloga) bất đối xứng bắt đầu từ 0 và không bị chặn trên. Trong trờng hợp thứ hai, có
nghĩa là sử đụng chuỗi đầu vào không phải là x mà là logx, giá trị dao động của các giá
trị hiển nhiên dơng 0 x < đạt đợc - < lgx < , làm trơn tính bất đối xứng của
chuỗi và sau đó mô tả bởi đờng cong phân bố chuẩn.
Hớng gắn với biến đổi logarit dựa trên phân tích toán học đợc nhà toán học
Đan Mạch A. Phiser thực hiện; Sleyd [155] áp dụng cho tính toán dòng chảy sông
ngòi . Thông tin về điều này chứa trong bài báo của S.N. Krixki và M. Ph. Menkel
[84].
Khả năng sử dụng đờng cong logarit chuẩn để mô tả các qui luật dao động
thống kê lũ do ma đã đợc các nhà bác học Mỹ Berdon và Kumperon nghiên cứu.
ở Liên Xô vấn đề về khả năng sử dụng đờng cong chuẩn để đánh giá độ lặp lại
của lũ do ma trong trờng hợp biến đổi đại lợng chuỗi đầu vào thành logarit đợc
E.G. Blokhinov nghiên cứu chi tiết. Trong công trình đó Blokhinov đa ra đề nghị sử
dụng hoàn thiện các đờng cong loga-chuẩn. Cần nhận thấy rằng trong lĩnh vực tính
toán thuỷ văn đề xuất về biến đổi logarit các đại lợng biến đôỉ thuộc về S. I.
Rpkin[116], ngời đã sử dụng nó để xây dựng sơ đồ tính toán lu lợng cực đại của
nớc với các xác suất an toàn khác nhau.
Kết quả phân tích đó Rpkin đi đến kết luận về khả năng mô tả qui luật thống
kê của logarit các đại lợng cực đại lu lợng nớc nhờ đờng cong Piecson III.
Một trong những u thế của đề nghị này, theo Rpkin, là ở chỗ đờng cong
Piecson III bị chặn trên khi P 0. Tuy nhiên tính chất này của đờng cong nói trên
cũng nh các đờng cong khác bị chặn trên sẽ rất khó dùng trrong thực tế vì xác định
giới hạn trên của đại lợng biến đổi thờng gắn với việc phải thực hiện đủ một số động
tác bất kỳ khi ngoại suy đờng cong đảm bảo hoặc khi sử dụng phơng pháp nhóm
điểm.
Bên cạnh các sơ đồ phân bố xác suất kể trên các nhà thuỷ văn xô viết còn xét tới

một vài cách khác đối với khả năng sử dụng để ớc lợng dao động ngẫu nhiên dòng
14


chảy sông ngòi. Thế nên, G. A. Alecxayev[10] đã ủng hộ phân tích chi tiết đờng cong
Gudrits. Ông xem xét sơ đồ xác suất lý thuyết thoả mãn qui luật phân bố Gudrits và
thành lập bảng chuẩn các tung độ chuẩn hoá cho phép dựng đờng cong đảm bảo trên
cơ sở đánh giá 3 tham số: giá trị trung bình, hệ số biến đổi và hệ số bất đối xứng. G.
A. Alecxayev chứng minh rằng đờng cong Gudrits, khác với đờng cong Piecson III,
không âm ngay cả với Cs < 2Cv (thậm chí với giá trị Cs âm) nếu nh Cs > 2Cv -0,9.
Tuy nhiên do thiếu những u thế cơ bản so với đờng cong Piecson III và đờng cong
Krixki-Menkel nên đờng cong Gudrits không đợc phổ biến trong thực tiễn tính toán
thuỷ văn để ngoại suy đờng cong đảm bảo.
Thời gian gần đây, G.G. Svanhidze và G. L. Grigolia [44,124] đã nghiên cứu
khả năng sử dụng phân bố Jonshon bị chặn cả trên lẫn dới. Để ớc lợng tham số
phân bố đã cho họ đã sử dụng lần đầu tiên bốn mômen. Giới hạn trên và dới của phân
bố này xác định theo cực tiểu của chỉ tiêu phù hợp 2 với các giới hạn phân bố khác
nhau. Khi đó xác định ảnh hởng của các giới hạn lên tham số phân bố ( x, Cv, Cs ) và
hệ số tơng quan giữa các thành viên trong chuỗi.
Sự tập trung lớn trong các tài liệu thuỷ văn dành cho việc giải thích cơ sở sử
dụng các sơ đồ thống kê khác nhau ( cụ thể là đờng cong Piecson III và phân bố
gamma ba tham số ) để đánh giá các đặc trng khí tợng thuỷ văn độ lặp hiếm, có
nghĩa là trong vùng ngoại suy.
Bản chất của các nghiên cứu này là ở chỗ không thể chứng minh sự tơng ứng
của các qui luật phân bố chuỗi dòng chảy sông ngòi bởi sơ đồ thống kê này hoặc kia
với các cấu trúc lý thuyết. Kết luận nh thế với mức độ tin cậy này hoặc kia có thể
đợc chỉ trên cơ sở phân tích chuỗi thống kê đang có của đại lợng nghiên cứu.
Kiểm tra sự tơng ứng của các đờng cong thực nghiệm và lý thuyết theo tài
liệu quan trắc ở một số tuyến đo khí tợng thuỷ văn đợc Xocolovski [132] tiến hành
khi trình bày phơng pháp Phoster. Tuy nhiên, do độ dài thời đoạn quan trắc không lớn

ở một số tuyến đo, đặc biệt là vào thời kỳ Xocolovski thực hiện công trình (hoặc là tính
hạn chế rõ ràng của mẫu về ý nghĩa thống kê), việc so sánh nh vậy không thể đợc
coi là đủ cơ sở tin cậy về tính áp dụng của sơ đồ lý thuyết đờng cong phân bố đại
lợng ngẫu nhiên trong thuỷ văn.
Cho nên vào năm 1941 G. N. Brocovits và G.N. Velicanov [30] đã cố gắng mở
rộng khả năng phơng pháp so sánh trực tiếp đờng cong đảm bảo thực nghiệm và giải
tích bằng cách sử dụng số liệu về lu lợng nớc theo vài tuyến trộn vào một tập hợp
để xây dựng đờng cong đảm bảo thực nghiệm (phơng pháp trạm năm). Khi đó trong
15


một tổ hợp nhập các chuỗi lu lợng có các giá trị hệ số biến đổi ít khác nhau, từ kết
quả phân tích trên Brocovits và Velicanov đi tới kết luận về khả năng sử dụng đờng
cong Piecson III với Cs = 2Cv để mô tả qui luật dao động ngẫu nhiên của lu lợng
nớc (cụ thể là lu lợng cực đại).
Tiếp theo S.N. Krixki và M. Ph. Menkel [83] đã tiến hành nghiên cứu rộng rãi
tính ứng dụng của đờng cong Piecson III cũng nh đờng cong mang tên họ là
gamma ba tham số để đánh giá dao động ngẫu nhiên của dòng chảy sông ngòi. Kết
quả của sự phân tích này đợc thực hiện với việc sử dụng phơng pháp trạm năm và
một vài chỉ tiêu đồng nhất thống kê xác định rằng đờng cong Krixki và Menkel là sơ
đồ tiện ích để mô tả các qui luật thống kê dao động dòng chảy sông ngòi. Tơng tự đối
với đờng cong Piecson III với Cs 2Cv.
G. P. Kalinhin [58] đã thử xây dựng mô hình phân bố thống kê mới của dao
động ngẫu nhiên dòng chảy năm và cực đại. Các nghiên cứu do ông thực hiện là hoàn
thành bảng tung độ đờng cong đảm bảo khái quát lu lợng nớc cực đại và trung
bình năm. Các bảng này là các trờng hợp riêng của các đờng cong Piecson III trong
giới hạn khoảng biến đổi của hệ số bất đối xứng nhỏ. Do vậy, kết quả nghiên cứu này
chỉ có thể coi nh thêm một khẳng định (trên tài liệu thực nghiệm) khả năng sử dụng
đờng cong Piecson III để mô tả dao động ngẫu nhiên của dòng chảy năm và cực đại.
Krixki và Menkel dành sự chú ý nhiều cho vấn đề đánh giá thống kê độ chính

xác việc xác định mẫu các tham số đờng cong phân bố[78, 79].
Trớc khi xuất hiện các công trình của Krixki và Menkel với việc xác định các
sai số ngẫu nhiên của các ớc lợng mẫu các tham số thống kê của chuỗi các đại lợng
thuỷ văn ngời ta sử dụng các mối quan hệ dùng cho các tập tuân theo qui luật phân bố
chuẩn Gauxơ. Krixki và Menkel [78] dựa trên phơng pháp mômen và xuất phát từ luật
phân bố nhị thức khi Cs = 2Cv nhận đợc biểu thức sai số ngẫu nhiên xác định độ lệch
quân phơng (chuẩn), hệ số biến đổi và hệ số bất đối xứng, độ nhọn và tung độ đờng
cong đảm bảo.
Vào năm 1968, Krixki và Menkel [79] đã công bố các công thức hiệu chỉnh sai
số chuẩn ớc lợng mẫu hệ số biến đổi và tung độ đờng cong đảm bảo Piecson III
nhận đợc có tính đến hệ số tơng quan giữa các ớc lợng mẫu trung bình và chuẩn
(độ lệch quân phơng).
Sự phát triển nghiên cứu tiếp theo trong lĩnh vực đánh giá độ chính xác của
ớc lợng mẫu tham số các đờng cong phân bố cũng nh giải quyết hàng loạt vấn đề
16


khác liên quan tới lĩnh vực giải thích các qui luật thống kê đặc thù cho chuỗi các đặc
trng thuỷ văn , liên quan tới việc phổ cập vào thực tiễn tính toán thuỷ văn và thuỷ lợi
là phơng pháp Monte-Carlo (mô hình hoá toán học). Lần đầu tiên cơ sở phơng pháp
này đợc trình bày khá đầy đủ trong các công trình của G.G. Svanhide [123].
Dựa trên phơng pháp Monte-Carlo, E. G. Blokhinov [18] khi sử dụng khả năng
thực nghiệm số trên máy tính điện tử thu đợc biểu thức đối với sai số ngẫu nhiên với
hiệu chỉnh về sự trộn ớc lợng mẫu các tham số chỗi thống kê các đặc trng thuỷ
văn.
Trong các công trình G.G Svanhide [120, 129] và Khomerika [141] đa ra
phơng án mô hình hoá chuỗi thuỷ văn có tính đến phân phối trong năm của dòng
chảy. Nó dựa trên phơng pháp chọn hai lần: lợng nớc trong năm và đờng quá trình
quan trắc thực (lát cắt). Khi đó tính đến cả các quan hệ ngẫu nhiên giữa dòng chảy các
thời kỳ khác nhau.

Ngày nay, ngời ta đa ra khá nhiều các phơng pháp mô hình hoá thống kê
chuỗi thuỷ văn , từ đó mối quan tâm lớn nhất là phơng án dựa trên luật phân bố chuẩn
với chuyển đổi tới phân bố đã cho [125]. Con đờng này của mô hình hoá thống kê là
hứu hiệu hơn cả khi mô hình nhóm các chuỗi thuỷ văn với ma trận cacs hệ số tơng
quan kép cho trớc. Khi đó có thể tính đến cả tơng quan trong chuỗi.
Vào năm 1941, Krixki và Menkel [77] đa ra đề nghị sử dụng để ớc lợng các
tham số thống kê chuỗi các đại lợng thuỷ văn bằng phơng pháp tơng tự tối đa, cơ
sở toán học của nó đợc soạn thảo bởi nhà toán học Anh R. Phiser. Khả năng sử dụng
phơng pháp tơng tự tối đa trong tính toán thuỷ văn đợc Blokhin xem xét kỹ[22].
Các lời giải mà ông nhận đợc đa tới khả năng sử dụng thực nghiệm với sơ đồ phân
bố gamma ba tham số.
Kết thúc tổng quan ngắn về sử dụng các đờng cong phân bố lý thuyết trong
thực tế tính toán thuỷ văn nhận thấy rằng mô tả thống kê tơng tự các số liệu thuỷ văn
xuất phát từ giả thuyết thiếu một qui luật nào đó trong liệt đại lợng ngẫu nhiên đợc
nghiên cứu.
Tuy nhiên, trờng phái này là không thật chặt chẽ, vì trong công trình của P.A.
Ephimovits đã chứng tỏ sự hiện diện của quan hệ tơng quan trong chuỗi tại các tập
thống kê đại lợng dòng chảy năm. Sự có mặt quan hệ tự tơng quan, cụ thể trong
chuỗi dòng chảy năm không phủ nhận khả năng sử dụng đờng cong phân bố lý thuyết

17


trong thuỷ văn , nhng xác định đợc tính cần thiết xét tới vấn đề này, đặc biệt khi xét
các bài toán sau:
1) khi nghiên cứu dao động tuần hoàn dòng chảy sông ngòi, gồm nghiên cứu
nhóm các năm nhiều nớc và ít nớc.
2) khi soạn thảo phơng pháp dự báo đặc trng dòng chảy sông ngòi với hạn dài
(1 năm và nhiều hơn) trên cơ sở sử dụng hàm tự tơng quan và phơng pháp tơng
quan tuyến tính bội.

3) khi nghiên cứu qui luật dao động theo thời gian và không gian của dòng chảy
sông ngòi.
Đặc biệt việc soạn thảo tích cực theo các hớng trên bắt đầu từ hai chục năm
gần đây và tiếp diễn tới bây giờ. Điều này liên quan tới sự phát triển lý thuyết hàm
ngẫu nhiên và chủ yếu với việc sử dụng rộng rãi máy tính điện tử.
Mô tả toán học dao động nhiều năm dòng chảy sông ngòi dựa trên các giả
thuyết cơ bản sâu đây, mà các vấn đề thảo luận khó có thể nói là đã kết thúc đợc hiện
nay.
1. Giả thiết về sự độc lập hoàn toàn của dao động dòng chảy sông ngòi nhiều
năm. áp dụng tới sự nghiên cứu dao động dòng chảy năm và đặc biệt là nhóm các năm
ít nớc và nhiều nớc, giả thuyết này, tất nhiên, là bị phủ nhận, còn trong quan hệ
nhóm với các đặc trng thuỷ văn khác (nh lu lợng nớc cực đại và cực tiểu) sự
thà nhận nó vẫn cha thống nhất.
2. Giả thiết về sự hiện diện quan hệ tơng quan tuyến tính gữa thể tích dòng
chảy các năm hỗn hợp (xich Markov đơn). Giả thiết này nhận đợc sự thừa nhận rộng
rãi và đợc sử dụng để đánh giá độ chính xác việc xác định các tham số đờng cong
phân bố , trong tính toán điều tiết dòng chảy và v.v... Sự hiện diện quan hệ giữa các giá
trị nằm giữa của các đặc trng thuỷ văn khác đợc nghiên cứu ít hơn so với chuỗi dòng
chảy năm.
3. Giả thiết tơng ứng của dao động nhiều năm của dòng chảy năm của mô hình
quá trình ngẫu nhiên dừng với thời đoạn không liên tục. Mô hình này tìm thấy đợc
một vài ứng dụng khi lập phơng pháp tính toán và dự báo các đặc trng khác nhau
(chủ yếu là các giá trị cực đại và cực tiểu) của dòng chảy năm. Giả thiết đang xét
không có thể coi là đã đợc chứng minh hay loại bỏ do sự thiếu chuỗi các đại lợng
thuỷ văn, thể hiện tập đủ lớn.
18


4. Giả thiết tơng ứng dao động các đại lợng dòng chảy sông ngòi của mô hình
toán dạng quá trình ngẫu nhiên không dừng. Nghiên cứu tính ứng dụng của giả thiét

này mới chỉ bắt đầu.
5. Giả thiết về tính egodic dao động dòng chảy sông ngòi , dự đoán khả năng
thay thế quan trắc theo thời gian (ở một số điểm không gian) bằng đặc trng thuỷ văn
nào đó đợc quan trắc trong không gian, hoặc ngợc lại. Sự thực hiện giả thiết này của
các đặc trng thuỷ văn có nghĩa là khả năng xét tổng hợp chuỗi các đặc trng thuỷ văn
trong giới hạn một vùng nào đó, nơi mà giả thiết đang thực hiện.
Khả năng sử dụng giả thiết này trong thuỷ văn còn cha đợc chứng minh.Sự
xuất hiện đa dạng về số lợng các mô hình toán mô tả dao động nhiều năm của dòng
chảy sông ngòi mức độ nào đó liên quan tới chuỗi quan trắc thậm chí có độ dài lớn
nhất vẫn không đủ để khẳng định một cách tin tởng về sự đúng đắn của việc lựa chọn
mô hình này hoặc mô hình kia.
Ngoài ra, trong hàng loạt công trình, tiến hành không chính xác việc ớc lợng
kết quả nhận đợc trên cơ sở sử dụng các mô hình toán trong các công trình đó, dẫn
đến việc đánh giá cao khả năng của sơ đồ thử nghiệm do vậy dẫn đến việc khó có cơ sở
để tuyên truyền chúng.
Các giả thuyết kể trên thuộc về tập các đặc trng dòng chảy năm của sông ngòi
(lu lợng nớc trung bình năm, cực đại và cực tiểu), chúng có thể đợc diễn toán
bằng hàm ngẫu nhiên dừng với mức chính xác nh tập các đặc trng dòng chảy sông
ngòi có thể biểu diễn qua một tập rời rạc. Nếu nh dao động dòng chảy sông ngòi đợc
xét với quan điểm cao hơn nh tính liên tục của phổ dao động theo thời gian, thì trong
trờng hợp đó các qui luật thống kê của các dao động này có thể thể hiện chỉ ở dạng
các quá trình không dừng.
Không đề cập đến ở đây mọi công bố theo vấn đề đợc nêu, chỉ đề cập đến các
công trình ở một mức độ nào đó có dạng cơ bản để thể hiện tốt trong lĩnh vực đang xét.
Các công trình sớm nhất sử dụng các phép lý thuyết hàm ngẫu nhiên dừng đa
đến các phép giải bằng số thuôcj về Iu. M. Alekhin [12-14]. Trong các công trình này
chứa đựng một tài liệu rộng rãi tính toán các hàm tự tơng quan dao động nhiều năm
của dòng chảy sông ngòi với thời đoạn 30 năm.

19



Hàm tự tơng quan thu đợc đợc tác giả sử dụng cho nền của phơng pháp gọi
là động lực - ngẫu nhiên dự báo dòng chảy sông ngòi. Bản chất đề nghị này dẫn đến
việc ngoại suy tuyến tính đại lợng dòng chảy năm theo biểu thức dạng:
Qi+1 = k1Qi + k2Qi-1 + k3Qi-2 + ... + knQi-(n-1).
với Qi - đại lợng dòng chảy năm; ki (i=1,2,3...,n) - hệ số ngoại suy xác định
theo số liệu thực tế.
Hàm tự tơng quan để phan tích các qui luật thống kê dao động tuần hoàn của
dòng chảy năm đợc I. P. Druzjinhin sử dụng. Kết quả nghiên cứu theo ý của
Druzjinhin và những ngời khác [51], chứng tỏ về tính không dừng của dao động thể
tích dòng chảy năm. Thừa nhận quan điểm này họ, tất nhiên, giả thiết khả năng sử
dụng phép hàm ngẫu nhiên dừng để nghiên cứu qui luật thống kê dao động tuần hoàn
dòng chảy sông ngòi gọi các dao động này là qúa trình dừng ....
Khi nghiên cứu các qui luật dao động tuần hoàn dòng chảy năm với việc sử
dụng hàm phổ, G. P. Kalinhin và A. I. Đavđova [59] đi tới kết luận về sự có mặt của
chu kỳ thời đoạn khác nhau.
Khi đánh giá khả năng nghiên cứu dao động nhiều năm của dòng chảy bằng các
thủ thuật sử dụng trong các công trình của Alekhin, Druzjinhin, Kalinhin, Đavđova và
những ngời khác, cần thiết đánh giá kỹ lỡng và đầy đủ các kết luận thu đợc, nếu
thiếu nó việc sử dụng thực tế chúng, nh để dự báo đại lợng dòng chảy năm chỉ có
tính tạm thời. Chi tiết hơn vấn đề này sẽ đợc xét khi trình bày nội dung chính của
cuốn sách.
Một hớng nghiên cứu khác của vấn đề đang xét dựa trên việc sử dụng sơ đồ
xích Markov đơn. Mô hình toán học này đợc tiếp nhận trong nhiều nghiên cứu qui
luật dao động dòng chảy năm của S. N. Krixki và M. Ph. Menkel [67, 69, 78, 82], E.G.
Blokhinov [25], Đ. Ia. Ratkovits [95-97], A. S. Reznhicovxki [37,98] G.G. Svanhide
[120-124] và những ngời khác. Cách làm này có tính khách quan lớn của sự phân tích
và dựa trên phơng tiện toán học đợc xử lí tốt hơn.
Trong các công trình tiếp theo khi mô tả dao động nhiều năm của dòng chảy

sông ngòi ngời ta sử dụng rộng rãi lý thuyết hàm ngẫu nhiên (lý thuyết qúa trình xác
suất). Trong số các nghiên cứu chi tiết của hớng này có chuyên khảo của N. A.
Cartvelisvili [61], Đ. I. Kazakevits [56] và G.A. Alexayev [9].

20


Gần đây, sự tập trung nghiên cứu dao động không gian và thời gian các đặc
trng khác nhau của chế độ thuỷ văn. Các nghiên cứu này dựa trên lý thuyết trờng
đồng nhất và đẳng hớng. Kết quả phân tích dùng để giải các bài toán nội suy các giá
trị đại lợng thuỷ văn theo lãnh thổ để chọn các chỉ tiêu khách quan phân bố mạng lới
đài trạm thuỷ văn, để đánh giá độ chính xác của việc xác định các đại lợng thuỷ văn.
Cơ sở thống kê trong các nghiên cứu này đợc coi là các hàm tơng quan không gian.
Sự trình bày tốt nhất các vấn đề này có trong chuyên khảo của G.A. Alecxayev [9].

21


Chơng 1
Các thông tin ban đầu từ lý thuyết xác suất và
thống kê toán học
1.1. Các luận điểm xuất phát trong cơ sở sử dụng
phơng pháp lý thuyết xác suất và thống kê toán học
trong thuỷ văn
Phơng pháp lý thuyết xác suất và thống kê toán học sử dụng trong các lĩnh
vực khác nhau của thuỷ văn học. Tuy nhiên sử dụng rộng rãi nhất các phơng pháp
này trong tính toán và dự báo các đặc trng của dòng chảy sông ngòi.
Khi thiết kế các dự án điều tiết dòng chảy , khi thi công và vận hành các thuỷ
công trình, hệ thống tới tiêu, cầu cống và khi thực hiện các biện pháp thuỷ công
khác gắn liền với việc sử dụng tài nguyên nớc đòi hỏi phải đánh giá định lợng các

tham số dòng chảy sông ngòi thay đổi theo thời gian và không gian. Có nghĩa là
nhất thiết xác định các đại lợng lu lợng nớc trung bình, cực đại và cực tiểu
năm, phân phối dòng chảy trong năm, đại lợng dòng chảy phù sa v.v..
Các đại lợng sử dụng để thiết kế cần phải đặc trng cho chế độ thuỷ văn của
đối tợng nớc nghiên cứu trong tơng lai - thời kỳ vận hành trạm thuỷ lợi , tính
toán cho hàng chục và hàng trăm năm sau.
Rõ ràng, bàn về các giá trị khả năng trong tơng lai của tham số này hay
tham số kia của chế độ thuỷ văn có thể nhận đợc chỉ khi dựa trên các tài liệu đo
đạc thuỷ văn đã đợc tiến hành cho thời kỳ nhiều năm. Khi đó về nguyên tắc có thể
sử dụng ba hớng.
Hớng thứ nhất là hớng tất định - xác định đại lợng ta quan tâm rồi sử
dụng nó để liên kết dòng chảy với các nhân tố chi phối nó.
Hớng thứ hai dựa trên việc sử dụng đồng thời các qui luật nhân quả và
thống kê đặc trng cho dòng chảy sông ngòi và và các nhân tố xác định nó.
Con đờng thứ ba gắn liền với sử dụng trực tiếp các qui luật thống kê thể
hiện trong chuỗi các đại lợng thuỷ văn.

22


Sơ đồ dự báo dựa trên việc sử dụng các qui luật nhân quả (hớng thứ nhất),
với sự phát triển của thuỷ văn hiện đại cho phép xác định đại lợng các đặc trng
thuỷ văn với thời hạn không vợt quá vài tháng. Hơn nữa, độ chính xác các ớc
lợng nh vậy giảm nhanh khi tăng thời gian dự kiến.
Một vài nhà nghiên cứu cố gắng xác định khả năng của các sơ đồ dự báo khi
xem xét chuỗi các đại lợng thuỷ văn nh là một hàm tuần hoàn theo thời gian. Cơ
sở của ý tởng đó về dòng chảy th nhất là chu kỳ thay đổi nớc trong năm, có
nghĩa là lần lợt các pha dòng chảy lặp lại mỗi năm theo một tuần tự giống nhau và
khaỏng lệch thời gian xuất hiện bé. Tuy nhiên, với sự hiện diện chu kỳ năm hiện
tợng biến động dòng chảy không biến mất, cho nên coi nguyên nhân thứ hai của

sự thay đổi đó kéo theo các ý tởng về dao động tuần hoàn của bức xạ mặt trời và
các quá trình địa vật lý khác. Các kết quả nhận đợc trong lĩnh vực này tới nay
chứng tỏ rằng còn cha giải quyết vấn đề ở chỗ mức độ nào đại lợng thuỷ văn là
hàm xác định của thời gian và bằng cách nào dạng của nó có thể xác định trên cơ sở
tài liệu quan trắc .
Nh vậy, cần xét tới tinhg huống là việc xác định biến trình thời gian một đặc
trng thuỷ văn nào đó cho thời đoạn tính toán hàng chục năm hiện còn là vấn đề nan
giải. Tuy vậy, dự báo các đặc trng thuỷ văn với hạn nagứn là rất quan trọng, vì quá
trình vận hành các trạm thuỷ lợi chúng cho phép gắn với các điều kiện cụ thể nào đó
của chế độ nớc. Các qui phạm dự báo cũng đợc sử dụng rộng rãi khi qui hoạch
nhiều biện pháp thuỷ lợi.
Việc sử dụng đồng thời các quan hệ nhân quả gắn liền các đại lợng dòng
chảy sông ngòi và các nhân tố xác định nó với ớc lợng thống kê các tham số và
biến của các quan hệ đó là cách giải quyết xét hiệu quả hơn có tính nguyên tắc bài
toán đang xét. Tuy nhiên do độ tin cậy thấp của các phơng trình quan hệ nhân quả
và độ xử lý thấp của các phơng pháp nhóm thống kê , việc sử dụng hớng này rất
hạn chế. Thờng chúng hay đợc áp dụng để tính toán các đặc trng dòng chảy ( cụ
thể là lu lợng nớc với các suất đảm bảo khác nhau) sông ngòi cha đợc nghiên
cứu về phơng diện thuỷ văn. Khi đó suất đảm bảo biến chính của quan hệ và đại
lợng cần tìm là giống nhau, tức là sử dụng dạng đơn giản nhất xác định suất đảm
bảo của hàm.
Ngày nay, các giá trị biến đổi mang các thủ thuật ớc lợng giá trị tính toán
của các đại lợng thuỷ văn mô tả theo qui luật thống kê đặc trng cho chuỗi các đại
lợng thuỷ văn. Khả năng sử dụng cách đó để thu đợc các giá trị tính toán tham số
23


của chế độ thuỷ văn dựa trên giả thuyết rằng chuỗi các đại lợng đang xét đợc hình
thành nh là một tập ngẫu nhiên.
Sự tiếp nhận giả thuyết về sự phụ thuộc của dao động các đại lợng thuỷ văn

theo các qui luật dao động đặc trng bởi các số ngẫu nhiên có nghĩa là gắn thời
gian xuất hiện đại lợng này hay đại lợng kia (ví dụ trong liệt quan trắc) là không
lớn, ngẫu nhiên. Để mô tả tính chất tập các đại lợng nh vậy trong sự lặp các giá trị
khác nhau của đại lợng đó ở giới hạn tập đủ lớn.
Luận điểm này về tính chất ngẫu nhiên của sự hình thành chuỗi thuỷ văn
không thể chứng minh trọn vẹn bằng lý thuyết, tuy nhiên áp dụng tới chuỗi dòng
chảy sông ngòi (năm, cực đại) nó không chỉ một lần đợc khẳng định bằng kiểm
chứng bởi việc đánh giá sự tơng ứng của các đờng cong đảm bảo dòng chảy thực
nghiệm và sơ đồ lý thuyết.
Các kết quả phân tích nh vậy đợc xét ở chơng 4 chứng tỏ tính đúng đắn
của việc sử dụng hớng thống kê làm cơ sở cho nhiều thủ thuật tính toán thuỷ văn.
Bằng các luận điểm lý thuyết dùng để làm cơ sở cho khả năng xem chuỗi các
đại lợng ngẫu nhiên khác nhau nh là một tập các biến cố ngẫu nhiên đợc gọi là
các định luật tới hạn của lý thuyết xác suất.
Một trong những luận điểm cơ bản nhất của các định luật này dẫn tới qui
luật số lớn, theo nó với một số lợng lớn các hiện tợng đồng nhất ngẫu nhiên, kết
quả trung bình của chúng hầu nh mất ngẫu nhiên và có thể dự đoán đợc với mức
xác định cao.
Tính chất nêu trên của các hiện tợng ngẫu nhiên thể hiện khá rõ ràng ở
trong chuỗi các đại lợng thuỷ văn ở chỗ theo độ tăng của số thành viên của tập,
đờng cong đảm bảo có dạng bền vững. Các ví dụ cụ thể theo vấn đề này sẽ dẫn
trong chơng 5.
Luận điểm thứ hai dẫn tới định luật tới hạn trung tâm, mà theo nó hiện tợng
(biến cố) xuất hiện dới tác động của tổng hoặc tích số lớn các nhân tố ngẫu nhiên
độc lập (ít phụ thuộc) tạo nên tập ngẫu nhiên tuân theo các qui luật thống kê xác
định.
Rõ ràng, nhiều hiện tợng thuỷ văn có thể xem xét thoả mãn sơ đồ này.

24



Thực vậy, khi xét điều kiện hình thành một đặc trng thuỷ văn nào đó, thí dụ
nh lu lợng nớc cực đại của lũ xuân có thể dễ dàng xác định rằng sự xuất hiện
hiện tợng này diễn ra hàng năm theo dạng của một qui luật tất định. Tuy nhiên đại
lợng lu lợng nớc cực đại trong một năm cụ thể nào đó đợc hình thành dới
ảnh hởng của rất nhiều nhân tố, xác định trữ lợng ẩm trong tuyết, mức độ ẩm ớt
của lu vực , lợng ma trong quá trình hình thành lu lợng nớc cực đại, quá trình
cờng độ tan v.v.. Dới tác động của nguyên nhân này hay nguyên nhân khác xuất
hiện ở trong năm cụ thể đó một qui luật đã biết mang dạng của biến cố ngẫu nhiên.
Dựa trên các luận điểm thống kê đã nêu , cần thấy rằng chúng giả thiết thiếu
sự biến đổi một chiều trong điều kiện hình thành hiện tợng thuỷ văn của đại lợng
đang xét trong giới hạn của một tập đủ lớn (cụ thể cho n năm đủ dài). Nếu điều kiện
hình thành thay đổi đơn trị nh dớt tác động của hoạt động kinh tế trong đại lợng
của các đặc trng thuỷ văn thu đợc sau tác động đã nêu cần phải đợc hiệu chỉnh.
Rõ ràng các hiệu chỉnh này thực hiện có ý nghĩa nếu nh sự thay đổi một chiều
trong điều kiện hình thành lớn đến mức ảnh hởng tới các đại lợng của tham số
thuỷ văn đang xét về qui mô nằm ngoài giới hạn sai số tính toán.
Coi luận điểm mực trung bình không thay đổi, xuất phát từ kết luận rằng các
đại lợng thu đợc trên cơ sở phân tích chuỗi đại lợng thuỷ văn đang có với thời
đại địa chất và khí hậu ngày nay vì sự thay đổi gắn với lịch sử địa chất trái đất (và
các thay đổi khí hậu tơng ứng) thực hiện trong thời kỳ lớn hơn nhiều lần thời đoạn
tính toán. Cho nên chuỗi đo đạc thực tế đang có đợc coi nh là một mẫu nào đó từ
tập tổng thể lý thuyết gồm các số đại lợng vô hạn các đặc trng thuỷ văn ta quan
tâm. Khi đó tập mẫu đang có cần thực tế có nghĩa là mang tính dại diện đối với toàn
tập. Nói cách khác, nó cần chứa đủ các năm nhiều, ít và nớc trung bình nếu nh xét
đặc trng dòng chảy sông ngòi. Tơng tự, cần phải hình thành ngay cả chuỗi các
đại lợng thuỷ văn khác để đánh gía chúng sử dụng các phơng pháp lý thuyết xác
suất.
Đìều kiện quan trọng tiếp theo của tính ứng dụng các phơng pháp lý thuyết
xác suất trong thuỷ văn là yêu cầu nguyên tắc đồng nhất các đại lợng thuỷ văn

trong một tập. Cụ thể (áp dụng cho các đặc trng dòng chảy sông ngòi) điều này
biểu hiện trớc hết ở chỗ chọn các đại lợng dòng chảy đồng nhất căn nguyên (lu
lợng) vào trong một tập. Chỉ tiêu đồng nhất có thể là tính phụ thuộc của đại lợng
dòng chảy đang xét trong một pha chu kỳ thay đổi trong năm của nớc. ĐIều này
thờng đợc sử dụng khái niệm về lu lợng nớc đồng pha. Do dao động theo năm
ngày bắt đầu và kết thúc các pha khác nhau của chu kỳ trong năm chọn đại lợng
25


dòng chảy đồng pha đã nêu không thể gắn chặt với ngày này mà đợc thực hiện
xuất phát từ việc đánh giá tính đồng nhất tổng thể của chúng theo bản chất.
Vậy, đồng nhất tổng thể là lu lợng nớc lũ xuân cực đại, lũ ma, thể tích
dòng chảy cho một pha đồng nhất trong năm (xuân, kiệt), giá trị năm của dòng chảy
tổng cộng và dòng chảy thành phần của nó (mặt, ngầm) v.v..
2.2 Các

phơng pháp khái quát số liệu thống kê đơn

giản nhất.
Kết quả quan trắc và đo đạc thuỷ văn có thể thể hiện bằng bảng, đồ thị hoặc
dạng giải tích.
Nhiều thủ thuật có thể tìm thấy trong các Niên giám thuỷ văn , trong các
chuyên khảo Tài nguyên nớc mặt Liên bang Xô viết và các ấn phẩm khác trong
đó trình bày các số liệu về thành phần của chế độ nớc sông ngòi với các mức khái
quát chúng khác nhau. Xử lý các số liệu này bản thân đã là một ví dụ của thống kê
mô tả. Thờng thông tin cơ bản ban đầu nằm trong các bảng rất cồng kềnh. Trong
trờng hợp này sử dụng nó ở dạng nguyên thuỷ khi nghiên cứu nhiều vấn đề thuỷ
văn là khó khăn. Cho nên từ lâu đã sử dụng nhiều phơng pháp khác nhau để khái
quát bằng số thông tin ban đầu (tính giá trị trung bình, dẫn các giá trị tới hạn theo
thành phần này hoặc kia của chế độ thuỷ văn và v.v..).

Một cách thể hiện đầy đủ hơn và đồng thời tiện lợi hơn có thể thực hiện đợc
trên cơ sở sử dụng các phơng pháp thống kê toán học, là khoa học phân tích định
lợng các hiện tợng đại chúng đồng thời tính đến cả tính chất đặc thù của chúng.
Xét một vài ví dụ minh hoạ các thủ thuật sử dụng khi xử lý thống kê số liệu
thuỷ văn và đồng thời dẫn một số khái niệm và định nghĩa thống kê .
Trong bảng 1.1 là kết quả quan trắc dòng chảy trung bình năm sông Dnhepr
tại tuyến đo Loxmanskaia Kamenka từ năm 1918 đến 1962. để tăng độ trực quan
của kết qủa quan trắc và để thể hiện chúng tiện lợi hơnkhi xử lí tiếp theo số liệu ban
đầu thờng đợc dẫn theo bảng nhóm. Với mục đích đó từ bảng 1.1 chọn các giá trị
cực đại (Qmax) và cực tiểu (Qmin) của lu lợng nớc và tính hiệu giữa chúng đ, gọi là
biên độ hay là khoảng dao động,
R = Qmax - Qmin =3040 - 717 = 2323 m3/s.

26


Bảng 1.1 Lu lợng nớc trung bình sông Dnhepr tại Loxmanskaia Kamenka
Năm

Q

Năm

Q

Năm

Q

Năm


Q

Biên độ chung của dao động đại lợng ngẫu nhiên có thể đợc chia ra các
phần riêng biệt mà ngoài ranh giới giữa chúng nhận một số điểm (đại lợng) đặc
trng nào đó của chuỗi. Vậy, khi chia chuỗi các đại lợng ngẫu nhiên sắp xếp theo
thứ tự giảm dần ra 4 phần , chia ra 4 đoạn: trên cùng hay là đoạn thứ nhất là những
giá trị của biến mà dới nó là ắ số hạng của tập, đoạn thứ hai là chiếm vị trí giữa
chuỗi, và đoạn dới hay là đoạn thứ ba mà dới nó là ẳ số hạng của tập. Không hiếm
khi ngời ta chia biên độ theo phần trăm. Các giá trị đại lợng ngẫu nhiên phân bố
trên các ranh giới đó đợc gọi là ....
Trong trờng hợp chung khi nhận một tập thống kê phân bố liên tục trong
giới hạn cả biên độ thì có khả năng xét thành phần bất kỳ nào của tệp nằm giữa hai
ranh giới chỉ định bất kỳ. Trong trờng hợp này mọi giá trị (kể cả các giá trị nói
trên) của biến nhận đợc các điểm đặc trng nhất định gọi là điểm đoạn phần t.
Biên độ nhận đợc có thể chia ra các khoảng, hoặc phân cấp và tính số lần
đạt của dấu hiệu đang thử (lu lợng nớc) cho mỗi phân cấp. Các khoảng này có
thể bằng và không bằng nhau theo giá trị. Trong thuỷ văn thờng sử dụng các phân
cấp bằng nhau theo giá trị. Số lợng các phân cấp thờng đợc lựa chọn phụ thuộc
27


vào dung lựợng tài liệu đang xét đẻ nó có thể phản ánh các nét cơ bản nhất của
chuỗi quan trắc đang xét. Khi đó với sự tăng độ dài của khoảng số lần đạt của biến
nghiên cứu vào trong mỗi khoảng sẽ tăng lên và tăng độ tin cậy thống kê của tài liệu
đang thể hiện. Nhng với dung lợng quan trắc lớn và độ dài của khoảng lớn số
phân cấp sẽ không lớn, và khi đó sẽ san bằng các nét đặc thù của chuỗi quan trắc
này hoặc kia. Khi giảm độ dài của khoảng số lần đạt trong khoảng sẽ giảm và khả
năng nguy hiểm xuất hiện qui luật không đặc trng cho chuỗi thống kê đã cho. Đẩi
với đánh giá sâu sắc số khoảng thờng sử dụng các công thức kinh nghiệm, nh nx

5lgN, với nx - số khoảng; N- dung lợng chung của quan trắc.

Hình 1.1 Biểu đồ phân bố và đờng cong tích luỹ tần số dòng chảy năm sông
Dnhepr tại Loxmanskaia Kamenka.

Nhận thấy rằng, các công thức nh vậy không thể hiện qui tắc chung và vì
thế có thể xét chỉ trong chính lần xấp xỉ đầu tiên, khi không có một thông tin bổ
sung nào ngoài chuỗi quan trắc đang nghiên cứu và khi dung lợng số liệu ban đầu
không lớn và không nhỏ lắm. Với dung lợng nhỏ số liệu thống kê sự nhóm theo
khoảng hầu nh trở thành một bài toán không thể thực hiện. Và với số quan trắc lớn,
áp dụng công thức trên có thể đa đến số phân cấp lớn và làm tăng khối lợng tính
toán. Các phân cấp đợc chọn không cần phải phủ nhau để một và chỉ một giá trị
chuỗi quan trắc không có thể rơi vào hai phân cấp.Nếu giá trị quan trắc rơi vào ranh
giới phân cấp thì nó đợc coi là thuộc phân cấp lớn hơn.
áp dụng cho ví dụ đang xét chỉ định tơng ứng với những lập luận trên 12
phân cấp bằng nhau và tính số trờng hợp đạt lu lợng nớc trong mỗi phân cấp.
28


Kết quả tính toán đa vào bảng 1.2, trên đầu cột ghi tên phân cấp và dòng 1 - số
trờng hợp rơi lu lợng nớc vào mỗi phân cấp. Rõ ràng, tổng các trờng hợp theo
mọi phân cấp bằng số năm quan trắc . bảng đợc lập nh vậy gọi là bảng phân bố
thực nghiệm , hoặc là bảng tần số tuyệt đối. Khi biểu diễn tần số tuyệt đối bằng
phần trăm so với tổng các trờng hợp ta có phân bố tần số tơng đối ( dòng 2, bảng
1.2), tổng lần lợt nó cho ta các tần số luỹ tích tuyệt đối và tơng đối (dòng 3 và 4
bảng 1.2).
Tổng các tần số tơng đối bằng 100%, và có thể sử dụng khi kiểm tra tính
đúng đắn của tính toán . Số liệu bảng 1.2 chỉ ra rằng thờng xuyên nhất lu lợng
nớc trung bình năm s. Dnhepr tại Loxmanskaia Kamenka đợc quan trắc trong
khoảng 1500-1700 m3/s; với sự tăng hoặc giảm lu lợng nớc số trờng hợp giảm

một cách có qui luật không tính đến những chênh lệch riêng lẻ với qui tắc này, nó
có thể coi là các dao động ngẫu nhiên.
Bảng 1.2 Nhóm số liệu dòng chảy năm s. Dnhepr tại Loxmanskaia
Kamenka.
Số liệu bảng 1.2 có thể thể hiện dới dạng đồ thị (h. 1.1), trên đó theo trục
tung đặt các phân cấp lu lợng nớc đã nhận, còn theo trục hoành ở dạng các hình
chữ nhật - tần số tơng đối. Cũng ở đây trong dạng một đờng cong mềm mại chỉ rõ
sự tăng trởng tần số tơng đối. Tổng tăng trởng tần số gắn với giá trị lớn hơn của
mỗi khoảng.
Đồ thị thu đợc của tần số tơng đối gọi là ...., còn đồ thị tần số tơng đối
luỹ tích - .... hay là đờng cong tích luỹ. Sự trình diễn bằng bảng hoặc đồ thị các tần
số gọi là phân bố thực nghiệm , trong trờng hợp này là dòng chảy năm s. Dnhepr
tại Loxmanskaia Kamenka.
Diện tích mỗi phần riêng của ... bằng tích của kích thớc phân cấpvà tần số
tơng đối, còn tổng diện tích .... - tổng của các tích đó.
Đờng cong luỹ tích là đồ thị thể hiện độ lặp của lu lợng nớc lớn hơn giá
trị cho trớc.
Giả sử chúng ta quan tâm lu lợng nớc trung bình năm lớn hơn 1900 m3/s
thờng quan trắc đợc không? Với lu lợng này lấy từ đờng cong luỹ tích giá trị
độ lặp bằng 44,5%. Điều này có nghĩa là đại lợng lu lợng nớc 1900 m3/s và lớn
hơn đợc quan trắc trong 44,5 % mọi trờng hợp. Nếu nh chúng ta quan tâm vấn
29


×