Tải bản đầy đủ (.pdf) (40 trang)

Mô hình hoá mưa - dòng chảy ( Phần cơ sở - Nxb ĐH Quốc Gia Hà Nội ) - Chương 7 ppt

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.59 MB, 40 trang )

Chương 7
ước lượng thông số và độ bất định dự báo
Một câu trả lời chung chung cho một câu hỏi đúng còn tốt hơn nhiều một câu trả
lời tỉ mỉ cho một câu hỏi sai.
John W. Tukey 1962
7.1 ước lượng thông số và độ bất định dự báo
Từ các chương trước chúng ta thấy rõ ràng rằng giới hạn của cả cấu trúc mô hình
và số liệu sẵn có về các giá trị thông số, điều kiện ban đầu và điều kiện biên, nhìn
chung sẽ gây khó khăn cho việc áp dụng một mô hình thuỷ văn mà không có sự hiệu
chỉnh nào đó. Một số rất ít các trường hợp trình bày trong tài liệu có những mô hình
được áp dụng chỉ sử dụng các giá trị thông số được đo hoặc được ước lượng trước (như
Beven và nnk 1984; Farkin vµ nnk 1996; Refsgaard vµ Knudsen 1996; Loague và
Kyriakidis 1997). Trong phần lớn các trường hợp, giá trị thông số được hiệu chỉnh để
có sự phù hợp tốt hơn với số liệu quan trắc. Đây là vấn đề hiệu chỉnh mô hình đà được
bàn tới trong mục 1.8. Câu hỏi là làm thế nào để đánh giá một mô hình hoặc tập các
giá trị thông số tốt hơn những cái khác đang mở ra sự đa dạng của các phương pháp
đánh giá khác nhau từ việc kiểm tra hình ảnh đồ thị các biến dự báo và quan trắc đến
các phép đo định lượng độ tương thích khác nhau, được biết như hàm mục tiêu, độ đo
hoạt động, độ đo phù hợp (hoặc không phù hợp), độ đo hữu hiệu, độ đo xác suất. Một
vài thí dụ sử dụng các phép đo này trong mô hình mưa dòng chảy sẽ được trình bày
trong mục 7.3
Mọi sự hiểu chỉnh mô hình và dự báo hệ quả sẽ là nội dung của độ bất định. Độ
bất định này nảy sinh ở vấn đề là không phải mô hình mưa-dòng chảy là sự phản ảnh
thực sự của các quá trình có liên quan, rằng nó không thể xác định được những điều
kiện ban đầu và điều kiện biên mà mô hình yêu cầu với độ chính xác đầy đủ, và rằng
số liệu quan trắc sẵn có cho việc hiệu chỉnh mô hình không phải không có sai số.
Những thảo luận có giá trị về nguồn gốc của độ bất định có thể tìm thấy trong
Melching (1995). Tài liệu về hiệu chỉnh mô hình và ước lượng độ bất định dự báo cho
những mô hinh thuỷ văn tăng nhanh chóng. Chương này chỉ có thể đưa ra những tóm
lược về chủ đề chính đang được tìm hiểu, với mục đích thảo luận đó chúng ta phân biệt
3 chủ đề chính dưới đây:


Các phương pháp hiệu chỉnh mô hình với giả thiết bộ thông số tối ưu và bỏ qua
ước lượng của độ bất định dự báo có thể tìm được. Những phương pháp này giới hạn từ
việc thử sai đơn giản mà các giá trị thông số được người dùng tù hiĨu chØnh ®Õn

224


phương pháp tối ưu hoá tự động sẽ được bàn tới trong mục 7.4
Các phương pháp hiệu chỉnh mô hình với giả thiết bộ thông số tối ưu nhưng đưa
ra những giả thiết chắc chắn về bề mặt phản ứng (xem mục 7.2) xung quanh giá trị tối
ưu để ước lượng độ bất định dự báo cũng có thể tìm được. Những phương pháp này
được gọi chung là phân tích độ tin cậy và sẽ được bàn tới trong mục 7.5
Phương pháp hiệu chỉnh mô hình phản ảnh ý tưởng là có một bộ thông số tối ưu
với sự ưa thích ý tưởng tương đương của mô hình như thảo luận trong mục 1.8 cũng
được đưa ra. Tương đương là cơ sở của phương pháp GLUE bàn tới trong mục 7.6.
Trong tình huống này phương pháp tiếp cận để đặt điều kiện sử dụng mô hình nhiều
hơn là hiệu chỉnh mô hình vì tiếp cận này cố gắng tính nhiều bộ thông số mô hình mà
chúng đưa ra các mô phỏng chấp nhận được. Như là một kết quả, dự báo cần liên kết
với độ bất định nào đó
Trong việc giải bài toán hiệu chỉnh và đặt điều kiện mô hình có một số điểm rất cơ
bản cần phải nhớ. Chúng ta có thể tóm lược như sau:
Không hẳn là chỉ có duy nhất một kết qủa đúng. Nhiều mô hình và bộ thông số
khác nhau có thể cho sự phù hợp tốt với số liệu và cũng có thể rất khó để quyết định
liệu cái này có thể tốt hơn cái khác. Trong thực tế việc chọn cấu trúc mô hình, bộ
thông số tối ưu cho một thời đoạn quan trắc nào đó có thể không tối ưu cho thời đoạn
khác.
Những giá trị thông số ®· hiƯu chØnh cã thĨ chØ ®óng trong khu«n khỉ cấu trúc
mô hình cụ thể đà được sử dụng. Những giá trị này có thể không sử dụng được cho mô
hình khác (thậm chí các thông số có cùng tên) hoặc những lưu vực khác nhau.
Kết quả của mô hình sẽ nhạy hơn nhiều với sự thay đổi giá trị của một vài thông

số hơn là với sự biến đổi của những giá trị khác. Việc phân tích độ nhạy về cơ bản sẽ
sớm thực hiện trong một nghiên cứu (mục 7.2)
Các độ đo hoạt động khác nhau thường cho những kết qủa khác nhau trong
thành phần của cả những giá trị thông số tối ưu lẫn độ nhạy tương đối của các thông
số khác nhau.
Độ nhạy cũng có thể phụ thuộc vào thời đoạn của số liệu được dùng, và đặc biệt
liệu một phần cụ thể nào đó của mô hình có được luyện trong một thời đoạn nhất
định. Nếu không (ví dụ nếu thành phần sản sinh dòng chảy vượt thấm chỉ được sử
dụng dưới các trận mưa cực trị) thì khi đó những thông số có liên hệ với những thành
phần này nhìn chung là không nhạy.
Việc hiệu chỉnh mô hình mang nhiều đặc điểm của phân tích hồi quy đơn giản
mà ở đó bộ thông số tối ưu sẽ là một trong các khả năng nào đó làm cực tiểu sai số
hoặc sai số toàn cục. Tuy nhiên vẫn có những số dư và điều này bao gồm độ bất định
trong dự báo của mô hình đà hiệu chỉnh. Như trong hồi quy, độ bất định này thường
lớn hơn vì mô hình dự báo phản ứng với nhiều, rất nhiều điều kiện cực trị, liên hệ với
số liệu dùng cho hiệu chỉnh.

225


7.2 Phân tích độ nhạy và bề mặt phản ứng thông số
Để đơn giản, ta xem xét mô hình chỉ có 2 thông số. Một số giá trị ban đầu của các
thông số được chọn và mô hình được vận hành với bộ thông số đà được hiệu chỉnh. Kết
quả dự báo được so sánh với một số biến quan trắc và một độ đo tương thích được tính
toán và làm tròn để sao cho nếu mô hình có độ phù hợp tốt thì có giá trị bằng 1, còn
kém thì bằng 0 (độ đo hoạt động chi tiết được bàn tới trong mục sau). Giả sử trong lần
chạy đầu tiên mô hình cho kết quả độ phù hợp bằng 0.72, nghĩa là chúng ta kỳ vọng
rằng mô hình có thể làm tốt hơn thế (tiến gần hơn tới 1). Đó là một lý do tương đối đơn
giản khiến chúng ta phải thiết lập một mô hình để thay đổi các giá trị thông số, chạy
lần khác và tính toán lại độ phù hợp. Tuỳ chọn này được cung cấp trong phần mềm

TOPMODEL (xem phụ lục A). Tuy nhiên, chúng ta chọn thế nào để được giá trị thông
số làm thay đổi độ phù hợp.
Một cách làm là thử sai đơn giản, biểu diễn kết quả trên màn hình, suy nghĩ về
vai trò của mỗi thông số trong mô hình, và thay đổi các giá trị để làm cho đỉnh các
thuỷ đồ nâng cao hơn hoặc đường nước xuống dài hơn, hoặc bất cứ cái gì cần thiết.
Việc này có vẻ rất cảm tính, nhưng khi lượng thông số lớn hơn thì sẽ rất khó phân loại
được tất cả những tương tác qua lại giữa các thông số trong mô hình và quyết định cái
gì sẽ cần được thay đổi tiếp theo (hÃy thử cách này với phần mềm TOPMODEL mà ở
đó có tới 5 thông số có thể được thay đổi)
Một cách khác là chạy mô hình đủ để đánh giá hoạt động của mô hình trong toàn
bộ không gian thông số. Trong ví dụ 2-thông số đơn giản, chúng ta có thể quyết định
dựa trên phạm vi giá trị đối với mỗi thông số, sử dụng 10 số gia gián đoạn cho mỗi
phạm vi thông số và chạy mô hình cho mỗi tổ hợp giá trị thông số. Phạm vi của thông
số xác định không gian thông số. Biểu diễn giá trị kết quả của độ phù hợp xác định
một bề mặt phản ứng thông số như các đường đẳng trị trên hình 7.1 (xem biểu diễn ba
chiều trên hình 1.7). Trong ví dụ này, 10 gia số gián đoạn sẽ cần 102=100 lần chạy mô
hình. Đối với những mô hình đơn giản việc chạy không mất quá nhiều thời gian.
Chẳng hạn, với 100 lần chạy của TOPMODEL với 1000 bước thời gian trên máy PC
Pentium sẽ mất khoảng 2 phút, mặc dù vậy những mô hình phân bố phức tạp sẽ mất
nhiều thời gian hơn. Cách làm tương tự cho 3 thông số sẽ yêu cầu cao hơn một chút:
103 lần chạy. Đối với 6 thông số sẽ yêu cầu 106 hay là 1 triệu lần chạy (mất khoảng 2
tuần tính toán đối với TOPMODEL trên một máy PC, và lâu hơn đối với những mô
hình phức tạp hơn) và 10 gia số cho mỗi biến không phải là sự rời rạc hoá rất mịn của
không gian thông số. Tất nhiên, không phải tất cả các lần chạy mô hình sẽ đưa đến
tương thích tốt với số liệu. Thời gian tính toán lâu có thể ghi cả những lần chạy mô
hình chạy có độ tương thích kém. Đây là lý do chủ yếu giải thích tại sao có nhiều
nghiên cứu về kỹ thuật tối ưu hoá tự động nhằm giảm thiểu số lần chạy cần thiết để
tìm được một bộ thông số tối ưu.
Dạng của mặt phản ứng có thể trở nên phức tạp hơn nhiều khi lượng thông số
tăng lên, và cũng khó khăn hơn để có thể hình dung ra mặt phản ứng thông số trong

không gian ba chiều hoặc nhiều chiều hơn. Một vài vấn đề chúng ta đà gặp phải, tuy

226


nhiên, có thể minh hoạ được bằng ví dụ 2-thông số của chúng ta. Dạng của mặt phản
ứng không phải luôn luôn là kiểu gò đồi đơn giản như chỉ ra trong hình 1.7. Nếu vậy
thì việc tìm bộ thông số tối ưu đà không có gì khó khăn. Bất kỳ kỹ thuật tự động tối ưu
hoá nào gọi là “leo dèc” trong mơc 7.4, sÏ thùc hiƯn tèt viƯc dò tìm con đường từ một
điểm xuất phát bất kỳ tới điểm tối ưu.

Hình 7.1. Bề mặt phản ứng cho 2 chiều thông số với độ phù hợp biểu thi như những đường đẳng trị

Một trong những vấn đề thường gặp phải là độ trơ thông số. Điều này sẽ xảy ra
nếu một thông số ảnh hưởng quá ít đến kết quả mô hình trong giới hạn của nó. Điều
đó có thể là kết quả của thành phần mô hình liên kết với thông số không được kích
hoạt trong quá trình chạy (có lẽ thông số là khả năng lớn nhất trong dung lượng mô
hình và dung lượng này không bao giờ đầy). Trong trường hợp này, một phần mặt
phản ứng thông số sẽ là phẳng với sự thay đổi một hoặc nhiều thông số (ví dụ thông số
1 trong hình 7.2a). Thay đổi thông số trong khu vực này có ảnh hưởng rất ít đến kết
quả. Các kỹ thuật leo dốc có thể tìm thấy nó khó khăn để tìm một con đường bằng
phẳng và hướng tới một hàm tương thích tốt hơn nếu chúng đưa đến một cao nguyên
bằng phẳng trong mặt phản ứng. Những điểm khởi đầu khác nhau có thể đưa tới
những bộ giá trị thông số cuối cùng khác nhau.
Vấn đề khác nữa là sự tương tác giữa các thông số. Điều này có thể dẫn tới nhiều
đỉnh (hình 7.2b) hoặc các sống trong mặt phản ứng (hình 7.2c), với các cặp giá trị
thông số khác nhau cho độ tương thích rất giống nhau. Trong những trường hợp sau
kỹ thuật leo dốc có thể tìm thấy sống rất dễ dàng nhưng có thể khó tìm thấy sự hội tụ
trên một bộ đơn các giá trị cho độ tương thích tốt nhất. Một lần nữa giá trị khởi đầu
khác nhau có thể cho những bộ thông số cuối cùng khác nhau.

Vấn để nhiều đỉnh địa phương có thể làm cho việc tối ưu hoá leo dốc thực sự khó
khăn. Một trong những đỉnh địa phương này sẽ là điều kiện tối ưu toàn cục, nhưng có
thể có một số lượng đỉnh địa phương cho độ tương thích tương tự. Mặt phản ứng cũng
có thể rất bất thường hoặc lởm chởm (xem Blackie và Eales 1985 cho ví dụ 2-thông số
tốt và cũng được bàn đến trong Sorooshian và Gupta 1995). Lại một lần nữa điểm khởi
đầu khác nhau đối với thuật toán leo dốc có thể đưa tới những giá trị cuối cùng rất
khác nhau. Hầu hết các thuật toán như vậy sẽ tìm được điều kiện tối ưu cục bộ gần
nhau, nó không thể là tối ưu toàn cục.
Đây không phải là một ví dụ phức tạp về mặt toán học; có thể có nguyên nh©n vỊ

227


mặt vật lý giải thích tốt tại sao sự việc có thể như vậy. Nếu một mô hình có những
thành phần sinh dòng chảy vượt thấm, vượt bÃo hoà hoặc dòng chảy sát mặt (chúng ta
hy vọng nhiều hơn 2 thông số trong trường hợp này) thì sẽ có những bộ thông số cho
một độ tương thích tốt đối với thuỷ đồ khi sử dụng cơ chế vượt thấm; những bộ cho độ
tương thích tốt sử dụng cơ chế vượt bÃo hoà, bộ thông số phù hợp tôt bởi dòng chảy sát
mặt; và thậm chí nhiều bộ hơn cho độ tương thích tốt bởi sự pha trộn của cả 3 quá
trình (xem Beven và Kirkby 1979 cho một ví dụ sử dụng TOPMODEL nguyên thuỷ).
Đỉnh địa phương khác nhau thì có thể nằm ở những phần rất khác nhau trong không
gian thông số.

Hình 7.2. Bề mặt phản ứng phức tạp hơn trong 2 chiều không gian thông số. (a). Vùng phẳng của bề
mặt phản ứng không nhạy với sự phù hợp trong khi thay đổi thông số. (b). Nhiều đỉnh trên bề mặt
phản ứng chỉ ra nhiều đỉnh cục bộ. (c). Sống trên bề mặt phản ứng phản ảnh tương tác thông số.

Các kiểu thể hiện trên hình 7.2 có thể làm cho việc tìm tối ưu toàn cục trở nên
khó khăn để đưa ra được kết luận cuối cùng. Hầu hết các bài toán tối ưu hoá thông số
liên quan tới nhiều hơn 2 thông số. Để có được ấn tượng về khó khăn phải đối mặt, hÃy

cố gắng tưởng tượng một số lượng đỉnh địa phương sẽ trông giống một cái gì đó trên bề
mặt phản ứng 3 thông số; rồi một mặt 4 thông số, vân vân. Một vài cải tiến đà được
thực hiện trong việc hình dung mặt phản ứng nhiều chiều hơn trong máy tính nhưng
việc cố gắng hình dung một mặt như vậy chẳng mÊy chèc lµm mƯt mái cho bé n·o nhá
bÐ (thËm chí cả với những chuyên gia làm mô hình thuỷ văn). Thuật toán leo dốc hiện

228


đại được trình bày trong mục 7.4 được thiết kế rất mạnh để giải quyết sự phức tạp
như thế của bề mặt phản ứng.
Tuy nhiên, có cách khác để tiếp cận vấn đề, nghĩa là bằng thiết kế những mô hình
thuỷ văn để tránh những bài toán hiệu chỉnh như thế. Chẳng hạn một mô hình có thể
được cấu trúc để tránh kiểu thông số dung lượng lưu trữ ngưỡng cực đại đưa đến chỉ
kích hoạt với bước thời gian nhỏ. Công trình đầu tiên theo kiểu tiếp cận này trong mô
hình mưa-dòng chảy được thực hiện bởi Rechard Ibbitt (xem Ibbitt và ODonnell
1971,1974) khi sử dụng mô hình kiểu ESMA nhËn thøc. Trong khi ®ã, nh­ ®· l­u ý
trong mục 6.2, mô hình PDM được hình thành ban đầu bëi Moore vµ Clark (1981)
cịng tõ ý t­ëng nµy. TÊt nhiên, thường thì các mô hình không được thiết kế như vậy.
Những khái niệm thuỷ văn được đưa ra gồm những bài toán hiệu chỉnh thông số, đặc
biệt là trong các mô hình dựa trên vật lý. Tuy nhiên, đối với bất kỳ mô hình nào mà
buộc phải hiệu chỉnh theo cách này, những quan tâm này sẽ là thích đáng.
Có những bài toán cụ thể trong việc đánh giá bề mặt phản ứng và độ nhạy của
thông số trong những mô hình phân bố, ít nhất là vì có một lượng rất lớn các giá trị
thông số liên quan và khả năng tương tác giữa các thông số trong việc xác định trường
phân bố của chúng. Điều này sẽ để lại một khó khăn cho tương lai thấy trước và chỉ
những cách làm khôn ngoan trong việc hiệu chỉnh các mô hình phân bố xuất hiện để
khẳng định rằng hầu hết, nếu không phải tất cả, các thông số được cố định (có lẽ trong
vòng một phạm vi nào đó khả thi, như trong Parkin và nnk 1996) hoặc được hiệu
chỉnh với một vài quan trắc phân bố và lưu lượng lưu vực không đơn độc (như Franks

và nnk 1988 và Lamb và nnk 1998). Những vấn đề đặc biệt của việc hiệu chỉnh các mô
hình phân bố đà được thảo luận ngay từ mục 5.1.1 và 5.7
7.2.1 Đánh giá độ nhạy thông số
ảnh hưởng của việc hiệu chỉnh thông số sẽ được tăng cường rõ rệt nếu có thể tập
trung nỗ lực lên các thông số này để kết quả mô phỏng mô hình là nhạy nhất. Điều
này đòi hỏi một cách tiếp cận để đánh giá độ nhạy thông số với một cấu trúc mô hình
phức tạp. Độ nhạy có thể được đánh giá với sự lưu tâm đến cả biến dự báo (như đỉnh
lưu lượng, thể tích lưu lượng, mực nước ngầm, tốc độ tuyết tan...) hoặc phép đo hoạt
động nào đấy (xem mục sau). Cả hai có thể là những thành phần của bề mặt phản ứng
tương ứng của chúng trong không gian thông số. Một định nghĩa của độ nhạy của kết
quả mô phỏng mô hình đối với một thông số cụ thể là gradient địa phương của bề mặt
phản ứng theo hướng của trục toạ độ thông số được chọn. Định nghĩa này có thể được
dùng để xác định chỉ số độ nhạy, chuẩn hoá dưới dạng sau:

dz
Si

dxi
xi

(7.1)

trong đó, Si là chỉ số độ nhạy liên quan tới thông số i với giá trị xi, và z là giá trị của
biến hoặc phép đo hoạt động tại điểm đó trong không gian thông số (xem McCuen
1973). Gradient sẽ được đánh giá một cách địa phương, khi cho những giá trị của các

229


thông số khác, hoặc bằng giải tích cho những mô hình đơn giản, hoặc bằng phương

pháp số bởi một sai phân hữu hạn, nghĩa là bằng việc đánh giá thay ®ỉi trong z khi xi
®­ỵc thay ®ỉi bëi mét l­ỵng nhỏ (1%). Bởi vì kết qủa mô phỏng phụ thuộc và tất cả các
thông số nên độ nhạy Si đối với bất kỳ thông số cụ thể i nào sẽ có xu hướng biến đổi
thông qua không gian thông số (như được minh hoạ bởi hình 7.2). Chính vì lý do này,
độ nhạy thường được đánh giá trong vùng gần nhất với bộ thông số ước lượng tốt nhất
hoặc bộ thông số tối ưu đà xác định, sau khi thực hiện việc hiệu chỉnh mô hình.
Tuy vậy, đây là một ước lượng rất địa phương của độ nhạy trong không gian thông
số. Một phép ước lượng mang tính toàn cục hơn nhìn chung có thể cho một ước lượng
tốt hơn của một thông số trong cấu trúc mô hình. Hiện sẵn có một số kỹ thuật phân
tích độ nhạy toàn cục. Nhưng một từ chúng đưa ra những giả thiết tối thiểu về hình
dạng của mặt phản ứng được biết với nhiều dạng như phép phân tích độ nhạy tổng
quát hoá (GSA), phép phân tích độ nhạy khu vực hoá (RSA) hay phương pháp
Hornberger- Spear- Young(HSY) (xem Hornberger và Spear 1981; Young 1983; Beck
1987) chúng là tiền thân của phương pháp GLUE được mô tả trong mục 7.6. Phương
pháp HSY được dựa trên mô phỏng Monte-Carlo. Mô phỏng Monte-Carlo sử dụng
nhiều lần chạy khác nhau của một mô hình, với mỗi lần chạy sử dụng một bộ thông số
được chọn một cách ngẫu nhiên. Trong phương pháp HSY, giá trị thông số được chọn
từ những phân bố đồng nhất mở rộng giới hạn xác định của mỗi thông số. Các giới hạn
sẽ phản ánh giá trị thông số khả thi trong một ứng dụng cụ thể. ý tưởng là để nhận
được một mẫu mô phỏng mô hình thông qua không gian thông số khả thi. Những mô
phỏng này được phân chia theo một số cách được coi là có hành vi và phi hành vi trong
mối liên hệ với hệ thống đang nghiên cứu. Mô phỏng hành vi có thể là những mô
phỏng với một giá trị cao của một biến hoặc phép đo hoạt động chắc chắn; mô phỏng
phi hành vi có thể thực hiện với giá trị thấp.
Phép phân tích độ nhạy HSY thì tìm sự khác nhau giữa chuỗi hành vi và phi
hành vi đối với mỗi thông số. Thực hiện việc này bằng cách so sánh phân bố tích luỹ
của thông số trong mỗi chuỗi (ví dụ hình 7.3). ở đâu có sự khác biệt lớn giữa hai phân
bố đối với một thông số, có thể kết luận rằng việc mô phỏng là nhạy đối với thông số đó
(hình 7.3b). Nơi nào có hai phân bố rất giống nhau có thể kết luận là việc mô phỏng
không nhạy với thông số đó (hình 7.3c). Độ đo định lượng sự khác nhau giữa các phân

bố có thể được tính bằng cách sử dụng thống kê d Kolmogorov-Smirnov phi thông số.
Mặc dù đối với một lượng mô phỏng lớn, cách kiểm tra này không mạnh và sẽ đưa ra
rằng những khác biệt nhỏ là có ý nghĩa về mặt thống kê. Tuy nhiên thống kê d có thể
được sử dụng như là chỉ số của sự sai khác tương đối. Cách tiếp cận này có thể được
mở rộng, cung cấp mẫu mô phỏng Monte-Carlo đầy đủ, cho nhiều hơn hai bộ thông số
(mục mềm GLUE dùng 10 lớp khác nhau trong việc đánh giá độ nhạy). Những thí dụ
khác sử dụng phương pháp HSY trong mô hình mưa-dòng chảy bao gồm Horberger
(1985) sử dụng TOPMODEL và Harlm và Kung(1992) dùng mô hình HBV. Phương
pháp HSY là phương pháp phi thông số của phép phân tích độ nhạy trong đó nó đưa
ra những giả thiết không sớm về sự biến đổi hay hiệp phương sai của những giá trị
thông số khác nhau, nhưng chỉ đánh giá những bộ giá trị thông số trong dạng hoạt

230


động của chúng.
7.3. Độ đo hoạt động và độ đo hữu hiệu
Định nghĩa mặt phản ứng thông số như đà phác thảo ở trên và chỉ ra trong hình
7.1 và 7.2 yêu cầu một độ đo định lượng của hoạt động hoặc độ phù hợp. Không quá
khó để xác định yêu cầu của mô hình mưa-dòng chảy như sau: Chúng ta muốn một mô
hình để dự báo các đỉnh thuỷ đồ một cách đúng đắn (ít nhất là trong độ lớn của sai số
liên quan đến quan trắc), để dự báo đúng thời điểm xuất hiện các đỉnh thuỷ đồ, và cho
một biểu diễn tốt của dạng đường cong nước xuống để thiết lập điều kiện ban đầu
trước khi cho sự kiện tiếp theo. Chúng ta cũng có thể đòi hỏi rằng trên khoảng thời
gian mô phỏng dài thì độ lớn tương đối của các thành phần khác nhau của cân bằng
nước sẽ được dự báo chính xác. Những yêu cầu có thể có một chút khác biệt giữa các
dự án khác nhau, vì vậy không thể có một độ đo vạn năng nào của việc hoạt động phục
vụ cho tất cả các mục đích.
Hầu hết các phép đo độ tương thích đà được sử dụng trong quá khứ trong việc mô
phỏng thuỷ đồ dựa trên tổng bình phương sai số hoặc phương sai sai số. Lấy bình

phương của phần dư trong một đóng góp dương của cả dự báo vượt quá và dự báo thấp
hơn và cuối cùng lấy tổng trên toàn bộ các bước thời gian. Phương sai sai số 2 được
định nghĩa như sau:

2

1 T
ˆ
  y t  y t 2
T  1 t 1

(7.2)


ở đây yt là giá trị dự báo của biÕn y t¹i b­íc thêi gian t= 1, 2, ..., T. Thường thì biến
dự báo là lưu lượng Q (như trên hình 7.4). Nhưng cũng có thể đánh giá hoạt động của
mô hình trong mối liên quan tới những biến dự báo khác, vì vậy chúng ta sẽ sử dụng
biến tổng quát y sau đây. Một phép đo độ tương thích phù hợp được sử dụng rộng rÃi
dựa trên cơ sở phương sai sai số là độ hiệu quả mô hình của Nash và Sutcliff (1970),
được định nghĩa như:

E 1

2
02

(7.3)

2
ở đây 0 là phương sai quan trắc. Độ hiệu quả giống hệ số xác định thống kê. Nó có


thể bằng 1 đối với độ tương thích hoàn hảo, khi đó 2 =0; nó có giá trị bằng 0 khi
2
0 = 2 , điều này đồng nghĩa với việc nói rằng mô hình thuỷ văn không tốt hơn mô

hình vô thức một thông số, đưa đến dự báo là trung bình của các quan trắc cho tất cả
các bước thời gian. Giá trị âm của độ hữu hiệu chi ra rằng mô hình đang hoạt động
kém hơn mô hình vô thức
Tổng bình phương sai số và hiệu quả mô hình hoá không phải là những phép đo
độ tương thích lý tưởng đối với mô hình mưa-dòng chảy do 3 nguyên nhân chính. Thứ
nhất là những số dư lớn nhất sẽ có xu hướng tìm thấy gần đỉnh thuỷ đồ. Vì các sai số

231


được bình phương có thể dẫn tới các dự báo lưu lượng đỉnh đưa đến tỷ trọng lớn hơn
trong việc dự báo dòng thấp (mặc dù đây rõ ràng là đặc tính đáng mong muốn cho một
số mục đích dự báo lũ). Thứ hai là, thậm chí nếu độ lớn đỉnh được dự báo một cách
hoàn hảo thì những phép đo này có thể nhạy cảm đối với những sai số thời gian trong
việc dự báo. Điều này được chứng minh cho thuỷ đồ thứ 2 trong hình 7.4, nó được dự
báo tốt về mặt hình dáng và độ lớn đỉnh nhưng sự sai khác nhỏ về mặt thời gian dẫn
tới những sai số đáng kể trên cả 2 nhánh lên và xuống.

Hình 7.3. Phân tích độ nhạy tổng quát (Hornberger-Spean-Young). (a). Phân bố luỹ tích ban đầu của
giá trị thông số cho mẫu đồng nhất của các giá trị thông số trước qua một giới hạn xác định. (b). Phân
bố luỹ tích của các giá trị thông số cho mô phỏng hành vi và không hành vi cho thông số nhạy. (c).
Phân bố luỹ tích của các giá trị thông số cho mô phỏng hành vi và không hành vi cho thông số không
nhạy.

Hình 7.4 cũng chứng minh 3 hiệu ứng, có nghĩa là phần dư tại bước thời gian liên

tiếp không thể độc lập mà có thể tự tương quan về mặt thời gian. Việc sử dụng tổng
đơn giản bình phương sai số như là phép đo độ tương thích có một cơ sở lý thuyết
mạnh mẽ về mặt suy luận thống kê. Nhưng đối với những trường hợp mà ở đó các mẫu
(ở đây là các dự báo tại mỗi bước thời gian) có thể được xem như độc lập và phương sai
không đổi. Trong nhiều mô phỏng thuỷ đồ cũng có những gợi ý rằng phương sai của
sai số có thể thay đổi theo một cách nhất định theo thời gian, có xu hướng cao hơn đối
với những dòng chảy lớn hơn. Điều này dẫn đến việc sử dụng các độ đo mượn từ lý
thuyết hữu hiệu cực đại trong thống kê cố gắng, tính toán một sự tương quan và thay
đổi phương sai sai số (sai số hỗn hợp, ví dụ Sorroshiam 1983, Horbenger 1985). §é

232


hữu hiệu cực đại nhằm cực đại hoá xác suất của việc dự báo một quan trắc đà đưa ra
mô hình. Những xác suất này được xác định trên cơ sở hàm hữu hiệu. Nó là phép đo
độ tương thích có lợi thế là có thể giải thích một cách trực tiếp trong dạng xác suất dự
báo. Tuy nhiên hàm hữu hiệu thích hợp sẽ phụ thuộc vào việc xác định cấu trúc cho
sai số mô hình.

Hình 7.4. So sánh thuỷ đồ quan trắc và dự báo

Nằm dưới sự phát triển hàm hữu hiệu sử dụng trong phương pháp hữu hiệu cực
đại là ý tưởng rằng có một mô hình đúng đắn, tập trung sự chú ý vào bản chất sai số
liên quan với mô hình. Về mặt lý tưởng, chúng ta sẽ hy vọng tìm thấy một mô hình với
thế dịch chuyển bằng 0, và sai số hoàn toàn ngẫu nhiên với phương sai nhỏ nhất và
không tự tương quan. Đối với trường hợp tương đối đơn giản khi sai số tăng thêm với
phân bố Gauss và tự tương quan bước thời gian đơn thì hàm hữu hiệu được phát triển
trong hộp 7.1. Mô hình sai số phức tạp hơn sẽ dẫn đến hàm hữu hiệu phức tạp hơn (ví
dụ Cox và Hincley 1974). Về nguyên tắc, cấu trúc sai số sẽ được kiểm tra để khẳng
định rằng một mô hình sai số gần đúng đà được sử dụng. Thực tế điều này phải là một

quá trình lặp vì dưới giả thiết rằng có một mô hình đúng, cấu trúc tối ưu của sai số mô
hình phải được kiểm tra, nhưng việc tìm ra tối ưu phụ thuộc vào việc xác định hàm
hữu hiệu cho một cấu trúc sai số.
Thực nghiệm cho thấy rằng mô hình thuỷ văn nói chung không phù hợp tốt cho
các yêu cầu của kỹ thuật suy diễn thống kê cổ điển và rằng cần có tiếp cận khả thi hơn
và định hướng áp dụng cho hiệu chỉnh mô hình. Chắc chắn có nhiều độ đo hoạt động
khác có thể được sử dụng. Một số ví dụ như dự báo biến đơn như lưu lượng trong mô
phỏng thuỷ đồ đưa ra trong hình 7.1. Cũng có thể cần thiết kết hợp độ đo phù hợp cho
nhiều biến hơn, ví dụ lưu lượng và một hoặc nhiều dự báo mực nước ngầm. Thêm nữa,
số cách khác nhau kết hợp thông tin là sẵn có và một số ví dụ được đưa ra trong hình
7.2. Sự phát triển đáng quan tâm hơn gần đây được dựa trên phương pháp lý thuyết
tập hợp để hiệu chỉnh mô hình (xem mục 7.6).
Nhớ rằng tất cả các độ đo nhằm cung cấp một độ đo tương đối của sự hoạt động
của mô hình. Các độ đo này sẽ phản ánh những mục đích ứng dụng riêng theo cách
gần đúng. Không có bất kỳ một phép đo hoạt động nào vạn năng và những lựa chọn ít
nhiều được thực hiện, sẽ có ảnh hưởng lên những ước lượng độ tương thích tương đối
đối với các mô hình và bộ thông số khác nhau, đặc biệt là nếu một bộ thông số tèi ­u

233


được tìm. Mục tiếp theo sẽ xem xét các kỹ thuật để tìm bộ thông số tối ưu, sau đó một
phương pháp khả thi hơn để hiệu chỉnh mô hình sẽ được thảo luận.
7.4 Kỹ thuật tối ưu hoá tự động
Mô tả đầy đủ của tất cả các kỹ thuật sẵn có cho việc tối ưu hoá tự động là ngoài
phạm vi của cuốn sách này, đặc biệt vì chúng ta đà lưu ý rằng khái niệm bộ thông số
tối ưu không thể là một thứ đặc biệt có ích trong mô hình hoá thuỷ văn. Trong mục
này, chúng ta sẽ đưa ra những mô tả ngắn gọn các thuật toán sẵn có. Để biết thêm chi
tiết, những mô tả các thuật toán khác nhau đà có sẵn trong Press và nnk (1992) và
Sen & Stoffa (1995), những thảo luận về những kỹ thuật liên quan tới những mô hình

thuỷ văn được cho trong Sorooshian và Gupta (1995)
7.4.1 Kỹ thuật leo dèc
Kü tht leo dèc ®èi víi viƯc hiƯu chØnh thông số là mảng nghiên cứu quan trọng
từ khi việc nghiên cứu các mô hình hoá bằng máy tính được bắt đầu trong những năm
60 của thế kỷ XX. Leo dốc từ bất kỳ điểm nào trên bề mặt phản ứng đòi hỏi phải có
những hiểu biết về gradient của bề mặt này để thuật toán này biết hướng để leo.
Những kỹ thuật đà có có thể được chia làm 2 kiểu cơ bản. Kiểu thứ nhất là những
thuật toán yêu cầu gradient của mặt phản ứng phải được xác định bằng giải tích cho
mỗi điểm trong không gian thông số. Về mặt toán học điều này đòi hỏi rằng một biểu
thức giải tích cho vi phân của đầu ra mô hình liên quan với mỗi giá trị thông số là sẵn
có. Nhìn chung phương pháp gradient này không được sử dụng rộng rÃi trong các mô
hình thuỷ văn vì nó thường không thể xác định được vi phân giải tích như thế đối với
những cấu trúc mô hình phức tạp. Hơn nữa thường dùng là các thuật toán tìm kiếm
trực tiếp, tìm dọc theo những hướng thử từ những điểm hiện thời với mục đích tìm
hàm mục tiêu đà cải tiến. Các thuật toán khác nhau biến đổi theo cách tìm kiếm được
sử dụng. Những thuật toán được sử dụng rộng rÃi trong mô hình mưa-dòng chảy bao
gồm phương pháp Rosenbrock (Rosenbrock,1960) và phương pháp đơn hình (Nelder và
Mead,1965). Sau đó được giải thích trong Sorooshian và Gupta( 1995).
Tất nhiên leo dốc trên những mặt phản ứng trơn sẽ dễ dàng hơn nhiều là trên
những bề mặt phẳng hoặc lởm chởm. Nhiều mô hình thuỷ văn không cho mặt phản
ứng trơn nhưng như đà lưu ý ở trên, với 3 hoặc nhiều hơn 3 giá trị thông số có thể khó
đánh giá hoặc hình dung hình dạng đầy đủ của bề mặt phản ứng. Nếu một kỹ thuật
leo dốc được sử dụng cho việc hiệu chỉnh thông số, một sự kiểm tra tối thiểu lên hoạt
động của thuật toán trong việc tìm tối ưu toàn cục là bắt đầu thuật toán từ một số các
điểm khởi đầu rất khác nhau (hoặc được chọn ngẫu nhiên) trong không gian thông số
và kiểm tra sự phù hợp của bộ cuối cùng của những giá trị thông số đà tìm được. Nếu
bộ cuối cùng là sát đúng thì có thể nó được chấp nhận rằng có một tối ưu đơn. Nếu
không, thì xem xét một trong những thuật toán trong những mục tiếp theo, tất cả
chúng được phát triển để cho mạnh hơn với sự chú ý đến độ phức tạp trên bề mặt
phản ứng.

7.4.2 Luyện mô phỏng

234


Cách khác sử dụng những điểm khởi đầu ngẫu nhiên để tìm tối ưu toàn cục là
luyện mô phỏng. Tên này phát sinh từ một sự tương tự giữa các thông số mô hình
trong việc tối ưu hoá và các hạt trong chất lỏng làm lạnh, đó là cơ sở của thuật toán.
Nếu các hạt ngay từ đầu ở trạng thái lỏng chúng sẽ được phân bố ngẫu nhiên trong
không gian chất lỏng chiếm chỗ. Khi chất lỏng bị làm lạnh tới nhiệt độ thấp hơn việc
luyện sẽ xảy ra trong cách làm cực tiểu hoá năng lượng của hệ thống. Nếu việc làm
lạnh quá nhanh thì việc làm cực tiểu năng lượng này sẽ xảy ra mang tính địa phương;
Nếu rất chậm chạp thì rốt cuộc sẽ dẫn đến trạng thái năng lượng cực tiểu toàn cục. ý
tưởng của luyện mô phỏng là bắt chước quá trình làm lạnh này, khởi đầu từ các bộ
thông số phân bố ngẫu nhiên trong không gian thông số để tìm trạng thái tối ưu toàn
cục liên quan tới độ đo hoạt động của bài toán tối ưu hoá.
Có nhiều hình thức khác nhau trên luyện mô phỏng, bao gồm tái luyện mô phỏng
rất nhanh và luyện trường trung bình (xem Tarantola 1987; Ingber 1993; Sen và
Stoffa 1995). Bản chất của tất cả các phương pháp là quy tắc chấp nhận những bộ
thông số mới. Cho một bộ thông số khởi đầu, một nhiễu loạn của một hoặc nhiều hơn
các giá trị thông số được phát sinh và độ đo hoạt động mới được tính toán, nếu nó tốt
hơn bộ thông số trước thì mô hình mới được chấp nhận. Nếu không tốt hơn thì nó vẫn
có thể được chấp nhận với một xác suất dựa trên một hàm mũ của sai phân theo giá
trị độ đo hoạt động, được thu phóng bởi một nhân tố tương đương với nhiệt độ trong
phép tương tự luyện. Khi nhiệt độ giảm nhẹ trên một số lần lặp, xác suất này giảm.
Cách này cho phép các bộ thông số với hoạt động kém hơn được chấp nhận, đảm bảo
rằng thuật toán không bị bẫy bởi điều kiện tối ưu địa phương, ít nhất là nếu tốc độ
lạnh đủ chậm. Do đó sự lựa chọn lịch trình lạnh là quan trọng và sẽ thay đổi từ bài
toán này tới bài toán khác. Những phương pháp luyện mô phỏng khác nhau sẽ khác
nhau về cách mà chúng cố gắng làm gia tăng số lượng mô hình được chấp nhận, có liên

quan với những mô hình loại bỏ và vì vậy mà tăng cường hiệu quả tìm kiếm. Trong
thuỷ văn, một ứng dụng gần đây của luyện mô phỏng có thể được tìm thấy trong
Thyer và nnk (1999).
Có những điểm tương đồng giữa luyện mô phỏng và một số phương pháp xích
Markov- Monte Carlo cho việc ước lượng thông số, mà đà có sự phát triển mạnh trong
thống kê. Sen và Stoffa (1993) đà lưu ý rằng thuật toán Metropolis MC2 tương ứng
trực tiếp với phương pháp luyện mô phỏng. Cách này đà được dùng trong việc ước
lượng thông số mô hình mưa-dòng chảy bởi Kuczera và Parent (1998) và Overney
(1998)
7.4.3 Các thuật toán di truyền
Phương pháp thuật toán di truyền (GA) là cách khác để cố gắng đảm bảo rằng
điều kiện tối ưu toàn cục luôn được tìm thấy nhưng dựa trên một sự tương tự khác
hẳn, đó là tiến hoá sinh vật. Một tập hợp ngẫu nhiên của các cá thể (các bộ thông số
khác nhau) được chọn như là điểm khởi đầu và sau đó cho phép tiến hoá để tạo ra
liên tục hoặc lặp lại trong cách cải thiện độ phù hợp (độ đo hoạt động) ở mỗi phép lặp
cho đến khi đạt được sự phù hợp tối ưu toàn cục. Những thuật toán khác nhau vỊ c¸ch

235


điều hành dùng để tiến hoá một tập tại mỗi lần lặp, nó bao gồm sự lựa chọn tạp giao
và đột biến. Sự mô tả phổ thông đà được cung cấp bởi Forrest (1993) và những mô tả
chi tiết hơn được cung cấp bởi Davis (1991). Sen và Soffa (1995) chỉ ra một số phần tử
của luyện mô phỏng có thể chứa trong phương pháp thuật toán di truyền như thế nào.
Tối ưu hoá GA đà được sử dụng bởi Wang trong việc hiệu chỉnh mô hình Xianjiang, bởi
Kuczera (1997) với mô hình mưa-dòng chảy quan niệm 5 thông số và bởi Franchini và
Galeati (1997) với mô hình 11 thông số.
Một dạng thuật toán đà được phát triển để sử dụng trong mô hình mưa-dòng chảy
và liên kết kỹ thuật leo dốc với ý tưởng GA là thuật toán tiến hoá phức tạp đà xáo trộn
được phát triển bởi Duan và nnk (SCE) (1992). Trong thuật toán này, các tìm kiếm

đơn hình khác nhau được thực hiện song song từ mỗi điểm khởi đầu ngẫu nhiên. Sau
mỗi lần lặp của việc tìm kiếm nhiều lần, những giá trị thông số hiện thời được xáo
trộn để hình thành dạng đơn hình mới, sau đó hình thành những điểm khởi đầu mới
cho việc lặp tìm kiếm tiếp sau. Sự xáo trộn này cho thông tin toàn cục về bề mặt phản
ứng để được phân chia và có nghĩa là nhìn chung thuật toán rất mạnh đối với sự có
mặt của nhiều đỉnh địa phương. Kuczera (1997) đà kết luận rằng thuật toán SCE
trong việc tìm tối ưu toàn cục trong không gian 5 thông số thành công hơn là thuật
toán GA cổ điển.
7.5. thừa nhận độ bất định trong các mô hình và số liệu: phân
tích độ tin cậy
Các kỹ thuật trong những mục trước được thiết kế để tìm một bộ thông số tối ưu
một cách hiệu quả nhất có thể. Chạy mô hình sử dụng những bộ thông số tối ưu này sẽ
cho độ tương thích tốt nhất đối với các quan trắc dùng để hiệu chỉnh, như đà được
định nghĩa bởi phép đo hoạt động đà sử dụng. Từ lâu đà thừa nhận rằng các phép đo
hoạt động khác nhau sẽ đưa đến bộ thông số tối ưu khác nhau. Như vậy còn xa độ đo
hoạt động mới có thể phản ảnh mục tiêu của mô hình. Tuy nhiên, bộ thông số tối ưu
đơn độc có thể biểu lộ một ít thông tin về độ bất định có thể có, liên quan đến những
dự báo mô hình. Có nhiều nguyên nhân của độ bất định trong mô hình. Những sai số
trong điều kiện biên và điều kiện ban đầu, những sai số trong số liệu hiệu chỉnh và
những sai số từ bản thân mô hình, tất cả có xu hướng gây ra độ bất định trong việc dự
báo mô hình được đánh giá. Như đà lưu ý trước đây, một tổng quan về nguồn gốc của
độ bất định trong mô hình mưa-dòng chảy và những phương pháp để ước lượng độ bất
định được cung cấp bởi Melching (1995). Ông đà tính tới những phương pháp dựa trên
mô phỏng Monte-Carlo: mô phỏng Latin Hypercube: ước lượng mômen cấp 2 bậc 1 giá
trị trung bình (MFOSM); phương pháp mômen cấp 2 bậc 1 cải tiến (AFOSM); phương
pháp ước lượng điểm của Rosenblueth; và phương pháp ước lương điểm của Harr. Về
cơ bản có tất cả những cách tạo mẫu bề mặt phản ứng cho độ đo hoạt động trong
không gian thông số. ở nơi việc chạy đầy đủ mô hình có thể thực hiện được, nhìn
chung kỹ thuật mô phỏng Monte-Carlo sẽ cho kết quả chính xác nhất; những cái khác
là những phép xấp xỉ để ghi lại thời gian tính toán. Tuy nhiên, một không gian thông

số nhiều chiều sẽ yêu cầu rất nhiều tập mẫu Monte-Carlo, như đà giải thÝch trong môc

236


7.2 ở trên, sao cho phương pháp xấp xỉ có giá trị trong ứng dụng thực tiễn.
Mục đích của việc ước lượng độ bất định là để đánh giá xác suất của một đại lượng
xác định chẳng hạn lưu lượng đỉnh của một sự kiện trong một khoảng xác định nhưng
không lưu ý rằng các kiểu khác nhau của khoảng cách có thể yêu cầu. Chẳng hạn
Haan và Meeker phân biệt 3 kiểu khoảng cách. Khoảng tin cậy sẽ bao gồm ước lượng
của đặc trưng chưa biết của đại lượng quan tâm. Ví dụ như lưu lượng đỉnh trung bình
của sự kiện. Vì chúng ta không thể ước lượng chính xác lưu lượng đỉnh từ tập mẫu sẵn
có của mô hình đà chạy, nên thậm chí việc ước lượng trung bình sẽ không chắc chắn.
Khoảng tin cậy khi đó có thể sử dụng để xác định ước lượng trung bình với xác suất
nhất định. Thông thường nhất giới hạn 5 và 95 % được dùng để xác định khoảng tin
cậy (tức là xác suất 90% mà giá trị nằm bên trong khoảng). Giới hạn tin cậy cũng có
thể được tính cho những đại lượng tóm tắt khác cho phân bố của lưu lượng đỉnh, như
phương sai hoặc thậm chí là giá trị các phân vị.
Kiểu thứ hai của khoảng cách là khoảng cho phép. Nó được xác định để sao cho
bao gồm tỉ lệ xác định của ước lượng mô hình bất định của quan trắc cụ thể được sử
dụng trong việc hiệu chỉnh mô hình. Đối với thí dụ lưu lượng đỉnh, khoảng cho phép có
thể được xác định cho việc dự báo mô hình của đỉnh quan trắc cụ thể, sử dụng trong
việc hiệu chỉnh mô hình. Cuối cùng, kiểu thứ ba là khoảng dự báo. Trong mô hình
mưa-dòng chảy nó được định nghĩa như là khoảng bao gồm một tỷ lệ nhất định của
ước lượng độ bất định mô hình của lưu lượng đỉnh (hoặc bất kỳ biến dự báo nào khác)
cho một sự kiện tương lai. Trong mô hình mưa-dòng chảy chủ yếu chúng ta quan tâm
tới khoảng dự báo sau khi hiệu chỉnh hoặc đặt điều kiện của một mô hình.
Giới hạn bất định có quan hệ với sự thay đổi của các biến dự báo trong không gian
thông số, hoặc chính xác hơn, nếu một biến dự báo (hơn là độ đo hoạt động) được diễn
tả như một mặt trong không gian thông số, cho gradient hay độ dốc của mặt với sự

quan tâm đến sự thay đổi của các giá trị thông số khác nhau. Nếu độ dốc lớn thì
phương pháp như MFOSM sẽ dự báo rằng độ bất định trong dự báo sẽ lớn. Nhưng,
nếu độ dốc là khá nhỏ thì các phương pháp sẽ dự báo một độ bất định nhỏ vì biến dự
báo sẽ ít biến đổi nếu thông số được xem xét là bất định. Gọi lại phương trình 7.1, độ
dốc là chỉ số của độ nhạy cục bộ của việc dự báo đối với sai số trong việc ước lượng giá
trị thông số.
Một câu hỏi đặt ra là tính toán giá trị của độ dốc ở đâu để đưa đến một ước lượng
tốt của giới hạn bất định. Đó là nơi mà các phương pháp xấp xỉ phải thực hiện các giả
thiết chắc chắn. Giả thiết cổ điển cho rằng bề mặt phản ứng là chuẩn đa biến cục bộ
bao quanh dự báo bộ thông số tối ưu. Phương sai của ước lượng của biến Q sẽ được ®­a
ra b»ng:
p

p

Q Q
ˆ
ˆ
E  xi  xi x j  x j 
j 1 x i x j

Var (Q) 
i 1





(7.4)


ở đây độ dốc (các số hạng vi phân) được đánh giá gần tới tối ưu E[.] biểu thị cho giá trị



kỳ vọng, x là giá trị thông số, và x là bộ thông số tối ưu. Số hạng E  xi  xi  x j  x j







237


phản ánh hiệp phương sai của các thông số. Nếu các thông số có thể được xem như độc
lập về mặt thống kê thì:
p

Q
Var (Q) i
i 1 x i


2

(7.5)

ở đây i là ước lượng phương sai của thông số xi.
Nếu phản ứng của mô hình là tuyến tính thì đây có thể là phép xấp xỉ đầy đủ,

nhưng nhiều mô hình mưa-dòng chảy chủ yếu là phi tuyến cao. Do đó, việc tuyến tính
hoá xung quanh tối ưu sẽ không cho ước lượng chính xác của độ bất dinh trong dự báo.
Melching( 1995) đà lưu ý rằng đây có thể là một bài toán cụ thể trong việc phân tích
độ tin cậy của thiết kế kỹ thuật mà ở đó mối quan tâm thường nằm ở độ rủi ro của lỗi
thiết kế cụ thể dưới những điều kiện cực trị (như hồ chứa tràn kênh hoặc sơ đồ chống
lũ trong trường hợp mô hình mưa-dòng chảy). Độ bất định trở thành quan trọng trong
việc đánh giá rủi ro, nhưng đối với một mô hình phi tuyến nó sẽ là quan trong để khảo
sát dáng điệu mất đi từ ước lượng tốt nhất hoặc phản ứng mô hình trong khu vực của
những phản ứng cực trị nhiều hơn. Đây là mục tiêu, ví dụ, của phương AFOSM, vẫn
sử dụng việc tuyến tính hoá nhưng làm xung quanh ước lượng của một điểm lỗi hay
giới hạn tin cậy hơn là xung quanh dự báo trung bình. Chi tiết hơn và tham khảo có
thể tìm thấy trong Melching (1995)
7.6.Hiệu chỉnh mô hình sử dụng phương pháp lý thuyết tập hợp
Có một phương pháp khác để hiệu chỉnh mô hình trong đó ít dựa hơn vào quan
điểm cho rằng có một bộ thông số tối ưu. Như đà thảo luận trong mục 1.8, các kiểm tra
chi tiết của bề mặt phản ứng cho thấy có nhiều sự kết hợp khác nhau của giá trị thông
số đưa đến sự phù hợp tốt với chuỗi số liệu đo đạc ngay cả đối với các mô hình tương
đối đơn giản. Khái niệm về bộ thông số tối ưu có thể là thiếu cơ sở trong mô hình hoá
thủy văn, mang đến từ các khái niệm trong suy diễn thống kê. Nền tảng của lý thuyết
suy diễn thống kê là có một mô hình chính xác: vấn đề là ước lượng các thông số của
mô hình đưa đến một độ bất định nào đó trong số liệu sẵn có. Trong thuỷ văn, thực
hiện những giả thiết như thế còn khó khăn hơn. Không có mô hình chính xác và số
liệu có sẵn để đánh giá các mô hình khác nhau, có thể có độ bất định lớn liên quan đến
chúng, đặc biệt là các sự kiện cực trị, thường được quan t©m lín nhÊt.

238


Một phương pháp thay thế để hiệu chỉnh mô hình là cố gắng xác định một tập hợp
của mô hình chấp nhận được. Phương pháp lý thuyết tập hợp nhìn chung dựa vào mô

phỏng Monte-Carlo. Một lượng lớn các lần chạy của mô hình được thực hiện với các bộ
thông số chọn ngẫu nhiên khác nhau. Các bộ thông số phù hợp thoả mÃn một tiêu
chuẩn hoạt động hoặc được duy trì sẽ không bị loại bỏ. Kết quả là một tập hợp các mô
hình có thể chấp nhận được hơn là một mô hình tối ưu đơn. Sử dụng tất cả các mô
hình có thể chấp nhận được cho dự báo đưa đến một khoảng dự báo cho mỗi biến quan
tâm, cho
phép một ước
lượng của
khoảng
dự
báo. Loại
phương pháp
này
không được
sử dụng
rộng
rÃi
trong mô
hình
mưadòng
chảy (ngoại
trừ
phương
án
GLUE
của mục tiếp
theo),
nhưng đà có
một
số

nghiên cứu
trong mô
hình
hóa
chất
lượng nước
(chẳng
hạn Klepper

nnk
1991;
Rose

nnk
1991;
Van
Straten
và Keesman
1991).

239


Hình 7.5. Xác định lặp lại của bộ tối ưu Pareto sử dụng tập hợp bộ thông số chọn ngẫu nhiên ban đầu.
(a), Bộ thông số ban đầu trong không gian thông số hai chiều(các thông số x1,x2). (b), Bộ thông số
ban đầu trong không gian hàm mục tiêu 2 chiều (các hàm F1 F2 ). (c, d), Nhóm các bộ thông số sau một
phép lặp. (e, f), Nhóm các bộ thông số sau phép lặp thứ 4. Sau phép lặp cuối cùng không có mô hình
với các giá rị thông số nằm ngoài bộ tối ưu Pareto có giá trị của hàm mục tiêu cao hơn các mô hình
trong bộ tối ưu Pareto. Yapo và nnk. In lại từ tạp trí Thuỷ văn 204: 83 97, xuất bản 1998 với sự cho
phép của Elsevier Science.


Một phát triển gần đây trong việc tiếp cận lý thuyết tập hợp là phương pháp hiệu
chỉnh thông số đa tiêu chuẩn của Yapo và nnk (1998). Phương pháp của họ dựa trên
khái niệm tập hợp tối ưu của Pareto, một tập hợp các mô hình với các bộ thông số khác
nhau. Tất cả đều có các giá trị tiêu chuẩn hoạt động khác nhau không kém bất kỳ một
mô hình nào nằm ngoài bộ thông số tối ưu trên bất kỳ đa tiêu chuẩn nào. Trong thuật
ngữ của phương pháp, các mô hình trong bé tèi ­u chiÕm ­u thÕ h¬n so víi các bộ các
mô hình bên ngoài tập hợp này. Yapo và nnk (1998) đà tạo ra một phương pháp khá
hay để xác định bộ tối ưu Pareto, liên quan tới thuật toán tối ưu hoá SCE trong mục
7.3. Đơn giản hơn phương pháp thực nghiệm Monte-Carlo thuần tuý, họ bắt đầu với N
điểm được chọn ngẫu nhiên trong không gian các thông số và sau đó sử dụng kỹ thuật
dò tìm để thay đổi giá trị các thông số và tìm ra N bộ bên trong bộ tối ưu (Hình 7.5).
Họ cho rằng điều này sẽ hiệu quả hơn nhiều so víi t×m bé tèi ­u Pareto.
Hä chøng minh viƯc sử dụng mô hình và rút ra giới hạn dự báo trong mô hình
mưa dòng chảy Sacrameto ESMA, sử dụng trong hệ thống dự báo sông ngòi của Cục
khí tượng quốc gia Mỹ, áp dụng cho lưu vực sông Leaf River, Mississippi. Mô hình có
13 thông số cần hiệu chỉnh. Hai hàm mục tiêu được sử dụng trong hiệu chỉnh: tổng
bình phương sai số và tiêu chuẩn hữu hiệu cực đại hỗn hợp. Để tìm ra tập hợp bộ tối
ưu Pareto, 500 bộ thông số được đưa vào, cần 68980 lần chạy mô hình. Kết quả được
chỉ trên hình 7.6, trong dạng nhóm 500 bộ thông số cuối cùng trên bề mặt hai hàm
mục tiêu ( từ Yapo và nnk 1998) và phạm vi kết hợp của lưu lượng được dự báo bởi bộ
thông số chọn ngẫu nhiên ban đầu và bộ thông số tối ưu Pareto cuối cùng (Gupta và
nnk 1998). ưu điểm chính của phương pháp bộ tối ưu Pareto là nó không yêu cầu đưa
ra các độ đo hoạt động khác nhau để được kết hợp vào trong một độ đo tổng thể. Gupta
và nnk (1999) cho rằng phương pháp này ngày nay cạnh tranh hơn với các phương
pháp tương tác được thực hiện bởi một chuyên gia mô hình hoá để đạt được sự hiệu
chỉnh, làm thoả mÃn yêu cầu phù hợp với số liệu.

240



Hình 7.6. Hiệu chỉnh bộ tối ưu Pareto của mô hình mưadòng chảy Scramento ESMA cho lưu vực sông
Leaf River, Mississippi (Yapo và nnk 1998). (a), Nhóm 500 bộ thông số mô hình của bộ tối ưu Pareto
trong mặt của 2 thông số mô hình. (b), Giới hạn dự báo cho 500 bộ thông số tối ưu Pareto. In lại từ Tạp
chí thuỷ văn 204: 83 97. Xuất bản 1998, víi sù cho phÐp tõ Elsevier Science.

Nh­ chØ ra ở hình 7.6(a) bộ mô hình được tìm thấy để tối ưu Pareto phản ánh các
yêu cầu mâu thuẫn của việc thoả mÃn nhiều độ đo hoạt động. Tuy nhiên, hình 7.6(b)
chỉ ra rằng điều đó không đảm bảo rằng các giá trị dự báo từ mẫu của mô hình tối ưu
Pareto sẽ phù hợp với các quan trắc vì nó không thể bù đắp hoàn toàn cho sai số của
cấu trúc mô hình hoặc lưu lượng quan trắc không có sai số tự do. Bộ chọn ngẫu nhiên
ban đầu sẽ phù hợp với quan trắc nhưng với giới hạn rộng hơn đáng kể (lưu ý thang
loga lưu lượng trên hình 7.6b). Cần phải nhớ rằng phương pháp không hướng tới ước
lượng các giới hạn dự báo trong bất kỳ ý nghĩa thống kê nào, nhưng một đặc điểm của
phương pháp đó là nó dường như đưa đến một bộ vượt giới hạn của dự báo so với quan
trắc. Người sử dụng sau đó sẽ gặp khó khăn trong việc liên hệ khoảng dự báo với bất
kỳ độ tin cậy nào mà họ muốn đáp ứng bất kỳ quan trắc cụ thể nào.
7.7. thừa nhận sự tương đương: Phương pháp GLUE
Nếu chúng ta chấp nhận rằng không có mô hình đơn chính xác hoặc tối ưu, thì
một phương pháp khác để ước lượng giới hạn dự báo là ước lượng độ tin tưởng. Chúng
ta có thể liên kết với các mô hình và các bộ thông số khác nhau. Đây là tư tưởng nền
tảng tiếp theo thừ nhận sự tương đương của mô hình và bộ thông số. Tất nhiên chúng
ta có thể đưa ra các độ tin tưởng khác nhau cho các mô hình và các bộ thông số khác
nhau, và nhiều khi chúng ta có thể loại bỏ chúng do chúng rõ ràng không đưa ra phân
loại hợp lý cđa ph¶n øng cho mét øng dơng. “Tèi ­u” đưa ra dữ liệu nào đó để hiệu
chỉnh, sẽ có ®é tin cËy cao nhÊt liªn quan ®Õn nã, nh­ng như thấy dưới đây, sẽ có
nhiều mô hình khác cũng cho kết quả tốt. Điều này có thể được thấy trong đồ thị dạng
điểm của hình 7.7(a), nó biểu diễn một ứng dụng điển hình của TOPMODEL đối với
lưu vực Maimai, ë New Zealand.


241


Hình 7.7. áp dụng TOPMODEL cho lưu vực Maimai M8 (3.8 ha), New Zealand sử dụng phương pháp
GLUE. (a) Đồ thị điểm của độ hiệu quả mô hình Nash- Sutclife. Mỗi một điểm diễn tả một lần chạy mô
hình với các giá trị thông số chọn ngẫu nhiên bằng chọn mẫu đồng nhất trong khoảng của mỗi thông số.
(b) Giới hạn dự báo lưu lượng cho thời kỳ 1987, sau khi quy định sử dụng các quan trắc từ 1985 và 1986.

Các đồ thị điểm là biểu đồ tản mạn của giá trị các thông số tương phản với giá trị
hàm mục tiêu. Mỗi điểm đại diện cho một lần chạy của mô hình từ thực nghiệm
Monte-Carlo, sử dụng nhiều mô phỏng với các giá trị chọn ngẫu nhiên khác nhau.
Chúng chủ yếu đại diện cho phép chiếu các mẫu điểm trên bề mặt phản ứng phù hợp
vào trong từng chiều của thông số riêng biệt. Trên hình 7.7(a) các mô hình tốt là các
mô hình mà các điểm đồ thị gần đỉnh. Sẽ thấy rằng với mỗi thông số có một mô phỏng
tốt qua một khoảng rộng của các thông số. Chúng ta thường thấy với loại này của
phương pháp Monte-Carlo, các mô phỏng tốt đưa tất cả về phía biên của khoảng các
thông số mẫu. Tuy nhiên cũng tồn tại các mô phỏng xấu qua toàn bộ khoảng rộng của
mỗi mẫu thông số. Duan và nnk (1992) chỉ ra dạng tương tự với các mô hình khác
nhau hoàn toàn. Dáng điệu như vậy là một biểu hiện khá rõ về một mô hình cho kết
quả tốt hay xấu không phụ thuộc vào từng thông số mà hầu hết bộ thông số và sự
tương tác giữa chúng. Như một phép chiếu của bề mặt phản ứng, đồ thị điểm không
thể chỉ ra toàn bộ cấu trúc phức tạp của các tương tác thông số, định hình dạng cho bề
mặt đó. Tuy nhiên, trong một khái niệm, điều này lại không quá quan trọng vì chúng
ta từ đầu đà thực sự quan tâm là ở đó các bộ thông số tốt coi như là một tập hợp.
Tuy nhiên, tất cả các bộ thông số tốt này lại đưa đến các kết quả dự báo khác
nhau, nhưng nếu chúng ta kết hợp một độ tin cậy với mỗi tập hợp dự báo (cao nhất đối
với mô hình tối ưu, và bằng 0 đối với các mô hình bị loại bỏ), thì chúng ta có thể ước
lượng độ bất định rút ra trong các dự báo theo một quan niệm rất đơn giản là lấy
trọng số các dự báo của các mô hình có thể chấp nhận được bằng độ tin cậy liên kết
của chúng. Phương pháp như vậy cho phép sự không tuyến tính của phản ứng của các

mô hình có thể chấp nhận bằng việc sử dụng các bộ thông số khác nhau để đưa vào
trong tính toán dự báo và ước lượng độ bất định.
Tiếp cận hoàn toàn tự nhiên này dẫn tới dạng phân tích Bayes (xem Lee 1989;
Box và Tiao 1992). Thống kê Bayes cho phép dạng thông tin chủ quan này được sử

242


dụng để ước lượng xác suất của các kết quả khác nhau (xem hộp 7.2). ở đây phân bố
có trước của các mô hình và dự báo được đánh giá trong dạng độ hữu hiệu nào đó (độ
tin cậy hoặc chấp nhận được) liên quan đến các quan trắc có sẵn và phân bố sau tính
toán có thể được sử dụng trong dự báo. Đây là bản chất của phương pháp ước lượng độ
bất định hữu hiệu tổng quát (GLUE) được đưa ra bởi Beven và Binley (1992), ngày
nay được sử dụng rộng rÃi trong thuỷ văn với các chỉ tiêu hữu hiệu khác nhau. Cập
nhật các phân bố hữu hiệu khi số liệu hiệu chỉnh mới có sẵn được điều khiển dễ dàng
trong khuôn khổ phương pháp Bayes này.
Trong phương pháp GLUE, phân bố trước của các giá trị thông số được sử dụng để
tạo các bộ thông số ngẫu nhiên để sử dụng trong mỗi mô hình bằng mô phỏng Monte
Carlo. Một chuỗi đầu vào được sử dụng để tìm kiếm mỗi mô hình và các kết quả được
so sánh với số liệu hiệu chỉnh có sẵn. Một độ đo hoạt động định lượng được dùng để
đánh giá khả năng chấp nhận được của mỗi mô hình dựa trên các phần dư của mô
hình. Bất kỳ độ đo hữu hiệu nào đưa ra ở hộp 7.1 hoặc 7.2 ®Ịu cã thĨ phơc vơ mơc
®Ých nµy. ChØ cã mét yêu cầu, đó là độ đo phải tăng đơn điệu với độ tăng mức độ phù
hợp và các mô hình không hành vi phải có độ đo hữu hiệu bằng 0. Các độ đo hữu hiệu
khác nhau hoặc kết hợp của các độ đo hữu hiệu khác nhau sẽ dẫn đến các ước lượng
khác nhau của độ bất định dự báo.
Trong việc sử dụng mô hình cho dự báo tất cả các mô phỏng với độ đo hữu hiệu lớn
hơn 0 sau đó được phép đóng góp vào phân bố của dự báo. Các dự báo của mỗi mô
phỏng được lấy trọng số bằng độ đo hữu hiệu kết hợp với mô phỏng đó. Phân bố trọng
số hữu hiệu luỹ tích dự báo có thể được sử dụng để ước lượng các phân vị cho các dự

báo ở bất kỳ bước thời gian nào.
Thực hiện phương pháp GLUE yêu cầu một số quyết định phải tiến hành :
Quyết định sử dụng một hay nhiều mô hình trong một phân tích.
Quyết định khoảng giá trị khả thi cho mỗi thông số.
Quyết định chiến lược tạo mẫu cho các bộ thông số
Quyết định tiếp cận độ đo hữu hiệu
Những quyết định này, trong một phạm vi nào đó, là hoàn toàn chủ quan, nhưng
điểm quan trọng là chúng phải rõ ràng trong bất kỳ ứng dụng nào. Vì vậy việc phân
tích có thể phải thực hiện lại nếu cần thiết và các quyết định có thể cần được thảo luận
và đánh giá của những người khác.
Cho trước một mẫu đủ lớn của mô phỏng Monte Carlo, phạm vi các dự báo trọng
số hữu hiệu có thể được đánh giá để thu được phân vị dự báo ở bất kỳ bước thời gian
nào. Đây là công việc rất đơn giản nếu các giá trị hữu hiệu được chuẩn hoá như
LM i =1, trong đó M i là chØ sè mÉu Monte Carlo thø i, ®Ĩ ë bÊt cø b­íc thêi



gian t nµo ta cã:
^
^


P(Q t  q )   L M i  Q i ,t  q 



(7.6)

243



^

trong đó Qi ,t là biến quan tâm đà dự báo bởi mẫu Monte Carlo thứ i và N là số lượng

^



mẫu. Phân vị dự báo P Q i ,t p q đạt được theo cách này (như chỉ ra trong ví dụ ở


hình 7.7(b)) được quy định trên đầu vào của mô hình, các phản ứng của mô hình đối
với từng mẫu thông số cụ thể được sử dụng, sự lựa chọn chủ quan độ hữu hiệu và các
quan trắc được sử dụng trong hiệu chỉnh độ hữu hiệu. Do đó, chúng là phương pháp
kinh nghiệm, nhưng chú ý là trong thủ tục như vậy các mô phỏng đóng góp cho
khoảng phân vị cụ thể có thể thay ®ỉi tõ b­íc thêi gian nµy tíi b­íc thêi gian khác,
phản ánh sự không tuyến tính và thay đổi theo thời gian trễ trong các phản ứng mô
hình. Thực tế nó cũng cho phép rằng các đặc điểm phân bố của các dự báo mô hình
trọng số hữu hiệu có thể thay đổi từ bước thời gian này đến bước thời gian khác (xem
Freer và nnk (1996) và trường hợp nghiên cứu trong mục 7.8 dưới đây).
Bất kỳ sự tượng tác nào của các thông số trong mô hình và bất kỳ ảnh hưởng của
sai số trong số liệu đầu vào và số liệu quan trắc cũng sẽ được phản ánh không rõ ràng
trong độ đo hữu hiệu kết hợp với mỗi mô phỏng và do đó không phải xem xét riêng rẽ.
Điều này tạo ra một giả thiết rằng những ảnh hưởng này sẽ tương tự nhau trong quá
trình dự báo, nhưng đà tránh được vấn đề là những ¶nh h­ëng nµy qu¶ thùc rÊt khã
cã thĨ xem xÐt một cách riêng rẽ.
7.7.1.Quyết định khoảng thông số khả thi
Quyết định khoảng giá trị khả thi của thông số là công việc không dễ dàng, ngay
cả khi cho trước một số thực nghiệm trong các ứng dụng trước đó của mô hình. Mục

đích là để có khoảng đủ rộng không gian thông số, mà sự phù hợp tốt của mô hình là
không bị loại trừ, nhưng cũng không rộng đến mức giá trị các thông số vô nghĩa hoặc
có ý nghĩa hoặc các lần chạy mô hình không hành vi không cần thiết tiến hành. Tuy
nhiên, người ta thường thấy rằng ngay cả nếu khoảng giá trị được đưa ra là khá rộng,
thì các giá trị phù hợp tốt tìm thấy đúng ở biên của một số thông số (như hình 7.7).
Điều này có lẽ do các dự báo của mô hình không quá nhạy với những thông số đó hoặc
có thể là khoảng được vẽ ra không đủ rộng, vì nó công nhận rằng vẫn còn có giá trị
khác phù hợp hơn ở ngoài khoảng đang xét. Đề nghị tốt nhất là bắt đầu với các khoảng
tương đối rộng và xem xét liệu chúng có thể được thu hẹp lại sau một mẫu đầu tiên
của không gian thông số.
7.7.2. Quyết định chiến lược tạo mẫu
Lựa chọn một chiến lược tạo mẫu cũng rất quan trọng vì nếu một lượng lớn các
thông số được bao gồm trong việc phân tích một số lượng lớn các bước chạy mô hình để
xác định dạng của bề mặt phản ứng chấp nhận được trong kh«ng gian nhiỊu chiỊu cđa
th«ng sè. ý t­ëng sư dụng các bộ thông số được chọn ngẫu nhiên là để ít nhất cũng
nhận được một mẫu lớn từ không gian này, nhưng rõ ràng thời gian tính toán có thể sẽ
lÃng phí nếu quá nhiều lần chạy mô hình khu vực không gian các thông số đưa đến sự
kém phù hợp với số liệu. Một vài chiến lược đà được đưa ra trong ước lượng thống kê
thông số với mục đích tránh được vấn đề này. Trong hầu hết c¸c øng dơng cđa GLUE

244


ngày nay, một mẫu độc lập đồng nhất các thông số trong không gian thông số đà được
sử dụng. Điều này đảm bảo sự độc lập trước đây của các bộ thông số trước khi đánh
giá chúng với sự sử dụng độ hữu hiệu đà chọn và rất dễ thực hiện, nhưng nó cũng có
thể là một phương pháp tương đối không hiệu quả nếu các khu vực lớn không gian
thông số đưa đến các mô phỏng không hành vi.
Chi phí tính toán trong việc thực hiện hàng nghìn các mô phỏng để xác định một
bề mặt phản ứng thu được hợp lý là nguyên nhân chính tại sao phương pháp Monte

Carlo không được sử dụng rộng rÃi trong mô hình hoá thuỷ văn. Số lượng lớn hơn các
thông số và độ phức tạp lớn hơn của bề mặt phản ứng, sẽ dẫn tới số lượng các mô
phỏng lớn hơn được yêu cầu. Giới hạn này sẽ trở nên nhỏ đi, ít nhất là đối với các mô
hình tương đối đơn giản, vì khả năng tính toán của máy tính điện tử ngày càng được
tăng cường và giá cả của chúng tiếp tục giảm xuống. Phát triển hiện thời các hệ thống
máy tính giá rẻ liên kết Ethernet, hệ thống PC song song sử dụng các hộp không ngăn
sẽ đồng nghĩa với việc mô phỏng Monte Carlo sẽ càng tăng tính khả thi trong cả các
dự án nghiên cứu và ứng dụng. Những hệ thống song song như vậy là dạng lý tưởng
của tính toán loại này. Nếu một bước chạy đơn của mô hình sẽ phù hợp trong bộ nhớ
của bộ điều khiển đơn thì sẽ mất rất ít hiệu quả trong cấu trúc song song: mỗi bộ điều
khiển cần thiết sẽ hoạt động với khả năng tính toán tối đa trong suốt quá trình chạy,
ngoại trừ khoảng thời gian rất ngắn trong đó các kết quả từ một bước chạy được
chuyển đến cho bộ điều khiển chủ hoặc ghi lên đĩa và một bước chạy mới lại được bắt
đầu.
Tuy nhiên, với các mô hình lớn sẽ vẫn có một vài lợi ích trong nỗ lực làm cho mô
phỏng Monte Carlo trở nên hiệu quả hơn. Chẳng hạn, trong phương pháp GLUE, có
rất ít lợi ích trong các khu vực mẫu của không gian thông số với độ hữu hiệu thấp
ngay khi những khu vực này được thiết lập. Sẽ tốt hơn khi chỉ tập trung các mẫu vào
khu vực có độ hữu hiệu cao. Đây là chủ đề đà được nghiên cứu trong nhiều lĩnh vực
khác nhau đưa đến một đề tài mở rộng mà thường được gọi là tạo mẫu đại biểu. Một
số phương pháp đà được pháp triển để lợi dụng các kiến thức thu được của phản ứng
bề mặt trong việc tinh chỉnh chiến lược chọn mẫu hợp lý. Những phương pháp này bao
gồm các kỹ thuật chẳng hạn như một số phương pháp Latin Hypercube và xích
Markov Monte Carlo (MC2 ), nó cố gắng tạo mẫu bề mặt phản ứng theo giá trị mật độ
hữu hiệu, để các khu vực có độ hữu hiệu cao được tạo mẫu thường xuyên hơn. Hi vọng
rằng việc tiết kiệm đáng kể thời gian tính toán trên máy tính điện tử sẽ được thực
hiện từ việc xác định đúng đắn bề mặt hữu hiệu. Những phương pháp như vậy có thể
hoạt động tốt khi bề mặt được xác định tốt, nhưng đối với các bề mặt với rất nhiều cực
đại cục bộ hoặc bằng phẳng, các ưu điểm có thể sẽ không lớn. ảnh hưởng của kỹ thuật
chọn mẫu đồng nhất cũng có thể được cải thiện bằng việc chạy mô hình chỉ ở những

khu vực của không gian thông số nơi mà các mô hình hành vi được mong đợi dựa trên
cơ sở của mẫu trước đó. Tìm kiếm ba cấu trúc của Spear và nnk (1994) và phương
pháp Monte Carlo hướng dẫn của Shorter và Rabitz (1997) đều có thể được sử dụng
theo cách này.
Tất nhiên có thể cũng có một vài thông tin biết trước về thông số. Thông tin này có

245


thể đưa ra một số dạng. Đầu tiên là ý nghĩa nào đấy của phân phối mong đợi và
phương sai của các giá trị thông số. Một vài bộ thông số ở trong một khoảng xác định
có thể được biết trước là không khả thi trên cơ sở hoạt động trước đó hoặc suy diễn cơ
học. Sau đó mỗi bộ thông số có thể vẫn được hình thành bởi tạo mẫu đồng nhất không
gian thông số nhưng có thể đưa ra một độ hữu hiệu có trước (có lẽ bằng 0). Nếu độ hữu
hiệu biết trước bằng 0, sẽ không cần thiết chạy mô hình, một mô hình như vậy được
xem là không khả thi.
Một câu hỏi thú vị xuất hiện khi sẵn có các giá trị đo đạc của một, một vài hoặc
tất cả các giá trị thông số trong mô hình. Trong một số trường hợp (hiếm) thậm chí có
thể xác định các phân bố và hiệp phương sai cho các giá trị thông số trên cơ sở các đo
đạc. Những kết quả này sau đó có thể sử dụng để xác định trọng số hữu hiệu có trước
trong không gian thông số mẫu đồng nhất. Mặc dù thường có các trường hợp mà các đo
đạc như vậy là thông tin tốt nhất chúng ta có được về giá trị thông số, không có đảm
bảo rằng giá trị đo đạc được ở một quy mô sẽ phản ánh các giá trị hiệu quả yêu cầu
trong mô hình để đạt được hàm dự báo phù hợp với các giá trị quan trắc. Sau đó người
ta có thể thêm thông tin sai lệch vào trong phân bố thông số có trước, nhưng nếu
không gian thông số là một mẫu đủ rộng để bao gồm các giá trị thông số ảnh hưởng
bền vững thì ứng dụng được lặp lại của phương trình Bayes hoặc theo cách khác kết
hợp các độ hữu hiƯu (xem hép 7.2) sÏ lµm cho sù hoµn thiƯn của mô hình tăng lên khi
chi phối hình dạng của bề mặt phản ứng so với các ước lượng trước ban đầu của các
phân bố thông số .

7.7.3. Quyết định độ hữu hiệu
Có rất nhiều độ đo có thể được sử dụng để đánh giá các kết quả của mô phỏng mô
hình. Những độ đo này sẽ một phần phụ thuộc vào số liệu quan trắc có sẵn để đánh
giá mô hình, ngay cả khi chỉ có duy nhất một loại số liệu có sẵn (chẳng hạn số liệu lưu
lượng trong đánh giá mô hình mưa-dòng chảy) vẫn có những cách khác nhau tính toán
sai số của mô hình và sử dụng những sai số này cho tính toán độ hữu hiệu. Điều chắc
chắn là nếu chúng ta muốn phân cấp mẫu của các mô hình bằng sự hoạt động, thì các
độ hữu hiệu khác nhau sẽ cho các phân cấp khác nhau và cùng một độ đo tính toán
cho các thời kỳ quan trắc khác nhau cũng sẽ cho các cấp khác nhau .
Lựa chọn độ hữu hiệu nên được xác định rõ ràng bởi bản chất của vấn đề dự báo.
Nếu vấn đề ta quan tâm là dòng chảy nhỏ thì độ hữu hiệu đưa đến trọng số lớn hơn
cho dự báo dòng chảy thấp được dùng. Nếu vấn đề quan tâm là lượng nước trong thiết
kế hồ chứa thì độ hữu hiệu dựa trên sai số dự báo tổng lượng có lẽ là gần đúng hơn.
Nếu chúng ra quan tâm đến dự báo đỉnh lũ thì độ đo nhấn mạnh độ chính xác đỉnh lũ
được chọn. Trong dự báo lũ, độ hữu hiệu giải thích độ chính xác dự báo thời gian đỉnh
lũ có thể được chọn. Nếu đánh giá mô hình phân bố được thực hiện thì độ hữu hiệu kết
hợp thực hiện dự báo lưu lượng và thực hiện dự báo của biến trạng thái nội tại như
mực nước ngầm có thể là gần đúng. Một tổng kết các độ đo hữu hiệu khác nhau được
đưa ra ở hộp 7.1.
7.7.4. Cập nhật các độ hữu hiÖu

246


Nếu nhiều hơn một thời kỳ số liệu có sẵn cho tính toán mô hình hoặc nếu số liệu
mới có sẵn thì các độ hữu hiệu cho mỗi thời kỳ có thể được kết hợp theo một số cách
khác nhau như chỉ ra ở hộp 7.2. Đây có thể được xem như là một thủ tục cập nhật. ở
mỗi bước, bao gồm cả sau thời kỳ đầu tiên, có một độ hữu hiệu trước liên kết với mỗi
bộ thông số, được kết hợp với giá trị của độ hữu hiệu cho thời kỳ được sử dụng cho
tính toán giá trị tiếp theo. Phương trình Bayes là một phương pháp nổi tiÕng sư dơng

tÝnh to¸n nh­ vËy trong lý thut thèng kê, nhưng nó không phải là duy nhất (xem
hộp 7.2). Giá trị sau từ một thời kỳ, sau đó trở thành giá trị trước cho bước áp dụng
tiếp theo. Độ hữu hiệu cho một bộ thông số đưa ra ở các thời kỳ có thể tương quan với
nhau; vì vậy hy vọng nó là trường hợp mà nếu mô hình thùc hiÖn tèt trong mét thêi kú
hiÖu chØnh sÏ tiÕp tục thực hiện tốt cho thời kỳ khác. Nếu đây không phải là trường
hợp thì độ hữu hiệu kết hợp của nó giảm đi.
Điều có thể là trong sự kết hợp hai độ tin cậy từ hai biến quan trắc kh¸c nhau
trong cïng mét thêi kú hiƯu chØnh, sÏ cã mối tương quan trong hoạt động mô hình
tương phản với các biến khác nhau, nghĩa là một mô hình tạo ra mô phỏng tốt của
biến đầu ra có thể tạo ra mô phỏng tốt tương tự đối với biến trạng thái nội tại (mặc dù
có thể nói rằng điều này không cần thiết trong nhiều mô hình môi trường). Nếu một
mô hình tạo ra mô phỏng tốt cho cả hai biến thì độ hữu hiệu tương đối của nó sẽ tăng
lên, ngược lại độ tin cậy sẽ giảm đi.
Lựa chọn phương pháp kết hợp độ hữu hiệu có thể bao hàm sự lựa chọn của chính
độ đo đó, đặc biệt nếu nó yêu cầu nhiều phương pháp kết hợp, chẳng hạn đối với các độ
đo từ các thời kỳ khác nhau, sÏ cã cïng kÕt qu¶ nh­ mét thêi kú liên tục đơn lẻ (ở nơi
mà điều này có thể thực hiện). áp dụng lặp lại phương trình Bayes sẽ không dẫn tới
kết cục này nếu hàm hữu hiệu là hàm tuyến tính của phương sai sai số nghịch đảo.
Nhiều thành công sẽ đưa đến trong thời kỳ gần nhất của số liệu có trọng số lớn hơn
trong việc xác định các độ hữu hiệu sau (dĩ nhiên nó có thể đưa đến ảnh hưởng mong
muốn nếu hệ thống được xem là thay đổi theo thời gian). Tuy nhiên, sử dụng độ hữu
hiệu là hàm tuyến tính của hàm mũ nghịch đảo của phương sai sai số, sẽ đưa đến sự
tương đương của độ hữu hiệu sau cùng.
7.7.5.Phần mền GLUE
Phần mền GLUE là một chương trình Window được thiết kế để biểu diễn các
nguyên lý của phương pháp GLUE. Khi thĨ hiƯn, nã cã mét sè giíi h¹n vỊ sè lượng các
thông số, số lượng các biến được dự báo và số lượng các độ hữu hiệu có thể được xem
xét (phụ lục A), nhưng các nguyên lý đà thể hiện dễ dàng được mở rộng tới các môi
trường phần mềm chung hơn như MATLAB, MATHCAD, hoặc thậm chí cả EXEL.
Như đà nói ở chương trước, phần mềm TOPMODEL sẽ tạo ra một file kết quả và sau

đó kết quả này được sử dụng trực tiếp trong GLUE. Một ví dơ vỊ file sè liƯu cđa øng
dơng TOPMODEL ®èi víi lưu vực Slapton Wood cũng được bao gồm trong phần mềm
này. Dĩ nhiên, chương trình đủ tổng quát để nó có thể phân tích các kết quả từ bất kỳ
thực nghiệm mô phỏng Monte Carlo nào, một đối tượng của các giới hạn đà lưu ý ở
trên. Có các tuỳ chọn trong chương trình để lập các đồ thị điểm cho mỗi bộ thông số
riêng biệt với độ hữu hiệu khác nhau và biến đầu ra dự báo; để phân tích độ nhạy của

247


từng thông số với việc sử dụng dạng phân tích HSY được miêu tả ở mục 7.2; để tính
toán phân bố tích luỹ của các dự báo trọng số độ hữu hiệu với việc sử dụng phương
trình (7.6) và liệt kê các bộ thông số tốt nhất và kém nhất của bất kỳ độ hữu hiệu nào
(hoặc đưa đến dự báo cao nhất và thấp nhất cho bất kỳ biến đầu ra dự báo nào).
7.8.Trường hợp nghiên cứu: Một ứng dụng của phương pháp GLUE
trong mô hình hoá lưu vực Saeternbekken MINIFELT, NaUy
Phương pháp GLUE có lẽ sẽ được hiểu tèt nhÊt lµ b»ng mét vÝ dơ cơ thĨ. Trong
vÝ dụ này, chúng ra sẽ xem xét chỉ một mô h×nh TOPMODEL, trong mét më réng øng
dơng cho l­u vùc nhỏ Saeternbekken MINIFELT ở NaUy, đà sử dụng trong trường
hợp nghiên cứu của mục 6.5. Phiên bản TOPMODEL sử dụng dựa trên cơ sở các giả
thiết hàm vận chuyển ban đầu có dạng mũ. Cần nhấn mạnh rằng, việc chọn một mô
hình đơn giản là tương đương với việc gán một độ hữu hiệu kỳ trước dương cho bộ
thông số mẫu cho mô hình đó (mô hình của tôi !) và bằng 0 cho các mô hình khác. Tất
nhiên điều này rất thường thấy, nhưng sẽ không có lý do tại sao nhiều hơn một cấu
trúc mô hình không được bao hàm trong khuôn khổ GLUE (riêng chi phí máy tính
thậm chí nhiều hơn các mô phỏng Monter-Carlo).
Việc sử dụng cả đo đạc lưu lượng và lỗ khoan quy định độ bất định trong các dự
báo của TOPMODEL cho lưu vực Saeterbekken đà được xem xét bởi Lamb và nnk
(1998b). Họ là những người đầu tiên nghiên cứu sử dụng các giá trị thông số toàn cục
(quy mô lưu vực). Năm thông số được thay đổi trong mô phỏng Monte Carlo. Các

khoảng được chọn đối với mỗi thông số phản ánh các kinh nghiệm trước đây sử dụng
TOPMODEL và một phân tích ban đầu các đường cong triết giảm trong việc thiết lập
khoảng cho thông số m (Bảng 7.1). Một ví dụ về các phản ứng của TOPMODEL đối với
các giá trị thông số riêng biệt đà được chỉ ra cho một áp dụng tương tự trong đồ thị
điểm ở hình 7.7, với việc sử dụng chỉ tiêu hiệu quả Nash Sutcliffe như độ hữu hiệu.
Lamb và nnk (1998b) chọn sử dụng độ hữu hiệu khác cũng dựa trên phương sai
của các phần dư:



L exp W 2



(7.7)

trong đó W là hệ số trọng số. Điều này sẽ đưa ra các giá trị gần tới 0 cho phương sai
sai số lớn hơn, nhưng giống như chỉ tiêu hiệu quả Nash-Sutcliffe, nó sẽ có giới hạn là
1 nếu phương sai sai sè rÊt nhá. Trong tr­êng hỵp l­u vùc Saeterbekken, một số các
độ đo hoạt động khác có thể được tính toán với sử dụng các quan trắc lưu lượng và lỗ
khoan khác nhau. Dạng này của độ đo hoạt động cho phép chúng có khả năng kết hợp
dễ dàng với việc sử dụng phương trình Bayes, vì khuếch đại các độ hữu hiệu là tương
đương với việc lấy trung bình trọng số của các phương sai phần dư khác nhau bên
trong hàm mũ (phương trình 7.2.2 trong hộp 7.2). Trong ứng dụng cụ thể này, điều
này cho phép các trọng số khác nhau được sử dụng cho thời kỳ hiệu chỉnh năm 1987,
khi một trong các lỗ khoan tự ghi không tạo ra các phản ứng thuỷ văn có ý nghĩa đầy
đủ.
Một ấn tượng của độ nhạy của các thông số TOPMODEL riêng biệt có thể thu

248



×