0
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Hoàng Thị Mai
ĐÁNH GIÁ ẢNH HƢỞNG CỦA SỐ LIỆU VỆ TINH ĐẾN DỰ BÁO
QUỸ ĐẠO VÀ CƢỜNG ĐỘ BÃO MEGI (2010) BẰNG PHƢƠNG PHÁP
LỌC KALMAN TỔ HỢP
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – Năm 2013
1
ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
Hoàng Thị Mai
ĐÁNH GIÁ ẢNH HƢỞNG CỦA SỐ LIỆU VỆ TINH ĐẾN DỰ BÁO
QUỸ ĐẠO VÀ CƢỜNG ĐỘ BÃO MEGI (2010) BẰNG PHƢƠNG PHÁP
LỌC KALMAN TỔ HỢP
Chuyên ngành: Khí tƣợng và Khí hậu học
Mã số:60440222
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƢỜI HƢỚNG DẪN KHOA HỌC:
Hà Nội – Năm 2013
2
MỤC LỤC
DANH MỤC CÁC HÌNH VẼ 3
BẢNG KÍ HIỆU CÁC CHỮ VIẾT TẮT 5
Mở đầu 6
Chƣơng 1 TỔNG QUAN VỀ PHƢƠNG PHÁP ĐỒNG HÓA 8
1.1 Tổng quan về các phƣơng pháp đồng hóa số liệu 8
1.2 Nghiên cứu phƣơng pháp đồng hóa số liệu trên Thế giới 12
1.3 Nghiên cứu phƣơng pháp đồng hóa số liệu ở Việt Nam 13
Chƣơng 2 CƠ SỞ LÍ THUYẾT VỀ LỌC KALMAN TỔ HỢP 16
2.1 Cơ sở lý thuyết của lọc Kalman 16
2.2 Lọc Kalman tổ hợp 21
Chƣơng 3 THIẾT KẾ MÔ HÌNH VÀ THÍ NGHIỆM 27
3.1 Tổng quan về bão Megi (2010) 27
3.2 Thiết kế mô hình và số liệu 29
3.2.1 Mô hình dự báo thời tiết WRF-LETKF 29
3.2.1 Miền tính và cấu hình mô hình 35
3.2.2 Nguồn số liệu 35
3.3 Thiết kế thí nghiệm 36
Chƣơng 4 KẾT QUẢ VÀ KẾT LUẬN 38
4.1 Thí nghiệm dự báo tất định 38
4.2 Thí nghiệm tổ hợp 39
KẾT LUẬN 52
TÀI LIỆU THAM KHẢO 53
3
DANH MỤC CÁC HÌNH VẼ
Hình 2.1 Minh họa hai bƣớc chính của bộ lọc Kalman. 20
Hình 3.1 Cƣờng độ bão Megi (2010) 27
Hình 3.2 Hình ảnh mắt bão Megi đang tiến sát đảo Luzon (bên trái),Mặt cắt
siêu bão Megi ngoài khơi đảo Luzon, Philippines (bên phải). 28
Hình 3.3 Sự di chuyển của bão Megi (2010) 29
Hình 3.4 Sơ đồ hệ thống của mô hình WRF 30
Hình 3.5 Sơ đồ hệ thống dự báo tổ hợp WRF-LETKF 31
Hình 4.1 Các quĩ đạo của Megi (6h một) từ số liệu phân tích (đƣờng màu
đen) và dự báo 3 ngày tại thời điểm 0000 UTC ngày 17 (đƣờng màu xanh
nhạt), 0000 UTC ngày 18 (đƣờng màu đỏ), 1200 UTC ngày 18 (đƣờng màu
tía), và 0000 UTC ngày 19/10/2010 (đƣờng màu xanh sẫm) 38
Hình 4.2 Tốc độ gió cực đại bề mặt quan trắc đƣợc (đƣờng nét đứt) và tốc độ
gió cực đại dự báo (đƣờng nét liền) tại các thời điểm (a) 00Z17,(b) 00Z18, (c)
12Z18,(d) 00Z19 39
Hình 4.3 Gia số phân tích sử dụng đồng hóa số liệu gió vệ tinh (cán gió màu
xanh), gia số quan trắc gió (cán gió màu đen) tại thời điểm 1200 UTC ngày 18
cho các mực 750hPa, 300 hPa, 250 hPa, 200 hPa khảo sát với độ dày là 30
hPa. 40
Hình 4.4 (bên trái) Dự báo 00Z ngày 18/10/2010, Hình 4.5 (bên phải) Dự báo
12Z ngày 18/10/2010 (a) Dự báo quĩ đạo bão trung bình (đƣờng liền gạch
chéo) , dự báo CTL (đƣờng liền chấm tròn), quĩ đạo bão thực (nét đứt gạch
chéo), quĩ đạo của các member (đƣởng mảnh). 41
Hình 4.6 (bên trái) Dự báo 00Z ngày 18/10/2010, Hình 4.7 (bên phải) Dự báo
12Z ngày 18/10/2010 (a) Tốc độ gió cực đại 10m của tổ hợp các member
4
(đƣờng mảnh), tốc độ gió cực đại trung bình của các member (đƣờng liền
đậm) và quan trắc gió cực đại (đƣờng nét đứt); (b) Cũng giống nhƣ hình (a)
nhƣng đối với áp suất cực tiểu bề mặt. 43
Hình 4.8 Sơ đồ độ cao theo thời gian của dòng dẫn trung bình trong miền
(10
o
-25
o
N, 110
o
-125
o
E) (a) thí nghiệm CTL, (b) thí nghiệm đồng hóa với số
liệu CIMSS. Đƣờng nét đứt biểu thị khoảng thời gian dự báo control bắt đầu
lệch khỏi quan trắc. 44
Hình 4.9 Độ cao địa thế vị tại mực 500 hPa hình bên trái thí nghiệm CTL,
hình bên phải thí nghiệm đồng hóa tại các thời điểm (a) 1200 UTC ngày 19;
(b) 1800 UTC ngày 19 và (c) 0000 UTC ngày 20. 45
Hình 4.10 Mô phỏng độ lớn trung bình của độ đứt thẳng đứng giữa mực 200
và 850 hPa trong thí nghiệm CTL (đƣờng liền), trong TN1 (đƣờng nét đứt) 47
Hình 4.11 Đồng hóa số liệu vệ tinh mực thấp 800-300 hPa (bên trái), 47
mực cao 300 -80 hPa (bên phải) 47
Hình 4.12 Dự báo quĩ đạo Megi với đồng hóa gió AMV mực thấp (hình trái)
và mực cao (hình phải). 48
Hình 4.13. Tƣơng tự nhƣ Hình 4.9 thí nghiệm mực thấp (hình trái) và thí nghiệm
mực cao (hình phải) 50
Hình 4.14 Đồng hóa gió AMV mực thấp (hình trái) và mực cao (hình phải) 51
5
BẢNG KÍ HIỆU CÁC CHỮ VIẾT TẮT
3DVAR
Đồng hóa biến phân 3 chiều
4DVAR
Đồng hóa biến phân 4 chiều
ACCN
Áp cao cận nhiệt
AMV
Atmospheric Motion Vecto
ARW
Advanced Research WRF
BMJ
Sơ đồ tham số hóa đối lƣu mây tích Betts-Miler-
Janjic
CTL
Control
GFS
Global Forecast System
GRADS
Grid Analysis and Display System
HRM
The High-resolution Regional Model
JTWC
the Joint Typhoon Warning Center
KFS
Kain Fritsch scheme
LETKF
Local Ensemble Transform Kalman Filter
LSM
Land-Surface Model
NMM
Nonhydrostatic Meso Model
NCAR/NCEP
Trung tâm dự báo môi trƣờng quốc gia Hoa Kỳ
PBL
Lớp biên hành tinh
SEnKF
Series Ensemble Kalman Filter
TN1
Thí nghiệm 1
UTC
Giờ quốc tế
vmax
Tốc độ gió cực đại
WRF
Mô hình dự báo thời tiết
WRF-LETKF
Mô hình dự báo thời tiết kết hợp với phƣơng pháp
lọc Kalman tổ hợp
WRF-VAR
Mô hình dự báo thời tiết kết hợp phƣơng pháp biến
phân
6
Mở đầu
Các nghiên cứu trƣớc đây đã chỉ ra rằng quỹ đạo bão chủ yếu đƣợc xác
định bởi dòng dẫn môi trƣờng (Carr và Elsberry 1995 [8]; Berger và cộng sự
(2007) [6]), rất nhiều các công trình dự báo bão bằng mô hình số đã cho thấy
quỹ đạo bão có thể đƣợc dự báo khá tốt mà không cần phải tính đến các chi
tiết động lực bên trong (Aberson và DeMaria 1994). Mặc dù dòng môi trƣờng
có tác động đến dự báo quỹ đạo bão, dự báo chính xác đƣờng đi của bão hiện
vẫn là vấn đề thách thức do các tƣơng tác đa quy mô của bão với môi trƣờng
xung quanh. Có rất nhiều yếu tố chi phối sự di chuyển của bão bao gồm dòng
dẫn môi trƣờng, hiệu ứng Beta, độ đứt gió thẳng đứng, hay hiệu ứng địa hình
(Pike và Neumann 1987 [11]; Carr et al. 2001 [8]; Payne et al. 2007 [12]).
Những yếu tố này thể hiện đặc biệt rõ ở khu vực Tây Bắc Thái Bình Dƣơng
với sai số quỹ đạo bão ở khu vực này sau 3 ngày có thể lên đến 500 km trong
một số trƣờng hợp.
Do các yếu tố bất định trong mô hình dự báo bão, các dự báo quỹ đạo hay
cƣờng độ bão bằng một vài mô hình đơn lẻ nhìn chung không nắm bắt đƣợc
đầy đủ các biến đổi của bão nhƣ các dự báo tổ hợp. Chính vì vậy, dự báo bão
bằng các phƣơng pháp tổ hợp đang đƣợc xem là một trong những hƣớng đi
phát triển nhanh nhất, đặc biệt theo hƣớng sử dụng bộ lọc Kalman tổ hợp
(EnKF). Theo cách tiếp cận này, không những trƣờng điều kiện ban đầu đƣợc
cải thiện sau khi đã đƣợc đồng hóa các dạng số liệu quan trắc khác nhau mà
ngay cả sai số nội tại của mô hình cũng có thể đƣợc tính đến trong các bài
toán dự báo, do đó có khả năng nâng cao chất lƣợng dự báo bão một cách
đáng kể. Hiện nay, việc đánh giá và sử dụng số liệu vệ tinh để tăng cƣờng
chất lƣợng dự báo quỹ đạo và cƣờng độ bão đang đƣợc quan tâm đặc biệt do
số liệu vệ tinh có độ phủ lớn và độ chính xác cao. Với mạng lƣới quan trắc
7
thƣa thớt trên khu vực Tây Bắc Thái Bình Dƣơng các dữ liệu vệ tinh là một
nguồn thông tin quan trọng trong việc cải thiện dòng dẫn bão môi trƣờng.
Trong luận văn này tác giả sẽ tìm hiểu vai trò của số liệu vệ tinh AMV khi
đƣa vào đồng hóa sẽ ảnh hƣởng nhƣ thế nào tới việc dự báo qũy đạo và cƣờng
độ bão cho một trƣờng hợp bão Megi năm 2010 với đề tài “Đánh giá ảnh
hưởng của số liệu vệ tinh đến dự báo quỹ đạo và cường độ bão Megi (2010)
bằng phương pháp đồng hóa lọc Kalman tổ hợp” nội dung gồm 4 chƣơng
nhƣ sau:
Chƣơng 1 Tổng quan về phƣơng pháp đồng hóa
Chƣơng 2 Cơ sở lý thuyết về lọc Kalman tổ hợp
Chƣơng 3 Thiết kế thí nghiệm và miền tính
Chƣơng 4 Kết quả và kết luận
Qua đây tôi xin gửi lời cảm ơn chân thành và sâu sắc tới giáo viên hƣớng dẫn
TS Kiều Quốc Chánh và các thầy cô giáo trong Khoa Khí tƣợng Thủy văn và
Hải dƣơng học đã tạo điều kiện giúp đỡ tôi hoàn thành luận văn này. Đặc biệt
tôi cũng xin gửi lời cảm ơn tới các anh, chị phòng Thí nghiệm Dự báo Thời
tiết và khí hậu đã giúp đỡ và tạo điều kiện trong thời gian tôi làm việc và học
tập tại đây.
Tôi xin chân thành cảm ơn !
Hoàng Thị Mai
8
Chƣơng 1
TỔNG QUAN VỀ PHƢƠNG PHÁP ĐỒNG HÓA
1.1 Tổng quan về các phƣơng pháp đồng hóa số liệu
Hiện nay hƣớng phát triển chính của mô hình dự báo thời tiết số là cải
tiến cấu hình và xây dựng mô hình nhƣ một đối tƣợng cơ bản của khoa học
phi tuyến. Bên cạnh sự tiến bộ trong việc cải tiến phƣơng pháp và các tham số
hóa vật lí, sự tiến bộ của công nghệ máy tính đã giúp tăng đáng kể độ phân
giải của các mô hình ở cả quy mô toàn cầu và quy mô vừa. Tuy nhiên, các
nghiên cứu về vấn đề dự báo chỉ ra rằng, những nỗ lực này của con ngƣời
cuối cùng sẽ tới một giới hạn không thể vƣợt qua đƣợc do sự phụ thuộc rất
lớn của kết quả dự báo vào điều kiện ban đầu. Nói cách khác, sự nguy hiểm
xuất hiện ở đây đó là kết quả dự báo từ những mô hình có độ phân giải thô,
mặc dù đƣợc tính toán chính xác hơn nhƣng lại không mô tả đúng thực tế. Vì
vậy cần những phƣơng pháp tốt hơn để giải quyết vấn đề không chỉ đơn thuần
là cải tiến sức mạnh của các mô hình số. Những năm gần đây, phƣơng pháp
đồng hóa số liệu đang đƣợc các Trung tâm khí tƣợng lớn trên thế giới nhƣ
NCAR/NCEP và NOOA phát triển và ứng dụng, đặc biệt là phƣơng pháp lọc
Kalman tổ hợp. Với phƣơng pháp này, tổ hợp kết quả của nhiều thành phần
tham gia dự báo sẽ cải thiện đƣợc chất lƣợng dự báo dựa trên số liệu đầu vào
đƣợc cập nhật liên tục theo thời gian. Thực nghiệm cho thấy rằng phƣơng
pháp này đạt kết quả cao hơn rất nhiều so với phƣơng pháp dự báo thông
thƣờng.
Sự thay thế của dự báo đơn lẻ bằng dự báo tổ hợp dựa trên sự thừa
nhận rằng khí quyển có bản chất hỗn loạn. Lorenz (1963) chỉ ra rằng, chỉ một
nhiễu động rất nhỏ (ví dụ nhiễu động đƣợc sinh ra bởi sự vỗ cánh của con
bƣớm) khi đƣợc đƣa vào khí quyển tại một thời điểm sẽ dẫn đến sự thay đổi
9
rất lớn của khí quyển theo thời gian, sự thay đổi này lớn đến mức chỉ sau
khoảng hai hoặc ba tuần, các chuyển động trong khí quyển đƣợc gây nhiễu và
khí quyển không đƣợc gây nhiễu khác nhau hoàn toàn. Nghiên cứu của
Lorenz dẫn đến sự phát sinh của một hệ thống lí thuyết động lực mới, ở đó, sự
mô phỏng của các hệ thống tất định nhƣ khí quyển (bao gồm các mô hình số)
cũng mang tính tất định: những nhiễu động ngẫu nhiên trong trƣờng ban đầu
dù rất nhỏ sẽ dẫn đến sự sai khác rất lớn theo thời gian. Mặt khác, chúng ta lại
không thể nào đo đƣợc chính xác trạng thái thực của khí quyển. Các giá trị
của trƣờng phân tích (đƣợc tổng hợp từ số liệu quan trắc và mô hình) luôn
chứa những sai số mà ở đó, độ lớn của chúng chỉ có thể đƣợc ƣớc lƣợng một
cách gần đúng. Những sai số này bao gồm sai số của thiết bị đo, sự không đầy
đủ của các trạm quan trắc và phép lấy gần đúng trong kĩ thuật tính toán của
mô hình. Ngay cả với một mô hình khí quyển hoàn hảo, độ chính xác của kết
quả dự báo sẽ giảm nhanh chóng chỉ trong vòng vài tuần.
Khoa học nghiên cứu về đồng hóa số liệu đƣợc bắt đầu từ những năm
50 của thế kỷ trƣớc, phƣơng pháp đồng hóa số liệu đầu tiên đƣợc gọi là “phân
tích khách quan”, đối lập với “phân tích synop” các phƣơng pháp khách quan
sử dụng phép nội suy đơn giản. Trong khí tƣợng, bài toán đồng hóa số liệu là
quá trình mà qua đó tất cả các thông tin có sẵn đƣợc sử dụng để ƣớc tính một
cách chính xác nhất có thể trạng thái khí quyển tại một thời điểm ban đầu cho
trƣớc. Vấn đề xác định điều kiện ban đầu cho mô hình dự báo số này là một
bài toán quan trọng trong bất kì hệ thống dự báo bằng mô hình số nào, do đặc
tính phụ thuộc mạnh vào điều kiện ban đầu của của các mô hình dự báo thời
tiết số.
Các thông tin có sẵn về cơ bản bao gồm các quan trắc thích hợp, và phù hợp
với tính chất vật lý chi phối sự phát triển của khí quyển, chúng có giá trị thực
tế dƣới hình thức của một mô hình số. Do bản chất phi tuyến của các phƣơng
10
trình mô tả khí quyển nên những sai số nhỏ không thể đo đƣợc trong trạng
thái ban đầu sẽ phát triển rất nhanh sau một khoảng thời gian (10-14 ngày) và
kết quả dự báo sẽ không còn tin cậy cho dù mô hình dự báo là hoàn hảo. Bằng
cách đồng hoá số liệu, những sai số dự báo do điều kiện ban đầu có thể đƣợc
giảm nhẹ dẫn đến kết quả dự báo tốt hơn. Ƣớc lƣợng điều kiện ban đầu càng
chính xác, thì chất lƣợng dự báo sẽ càng tốt.
Phƣơng pháp đồng hóa số liệu đã trở thành một phƣơng pháp quan trọng
trong ngành dự báo, đồng hóa số liệu có thể chia thành nhiều nhóm khác
nhau: tuần tự, không tuần tự, liên tục, biến phân v.v. Theo quan điểm hiện
đại, các phƣơng pháp đồng hóa số liệu có thể đƣợc tạm chia thành hai loại:
Một là phƣơng pháp đồng hóa biến phân (ĐHBP), trong đó trạng thái
phân tích đƣợc tìm bằng cách xác định trạng thái của khí quyển có khả năng
xảy ra cao nhất ứng với một tập quan trắc và một trạng thái nền cho trƣớc. Bài
toán ĐHBP có thể chia thành bài toán 3 chiều (3DVAR) hay 4 chiều
(4DVAR). Cách tiếp cận chung của bài toán này là tìm một trƣờng phân tích
nào đó có khả năng xảy ra cao nhất bằng cách tối thiểu hóa một hàm giá.
Phƣơng pháp đồng hóa biến phân này có ƣu điểm là hàm giá đƣợc cực tiểu
hóa trên toàn miền và do đó kết quả trƣờng phân tích sẽ loại bỏ đƣợc những
tình huống dị thƣờng (hay còn gọi là các tình huống dị thƣờng “mắt trâu”) -
mà trong đó trạng thái phân tích chỉ nhận giá trị xung quanh điểm quan trắc.
Mặc dù vậy, đồng hóa biến phân có một số nhƣợc điểm lớn không thể bỏ qua.
Nhƣợc điểm thứ nhất đó là không cho phép tính đến sự biến đổi của ma trận
sai số hiệp biến trạng thái nền theo thời gian. Đây là một điểm yếu lớn vì
trong thực tế sai số nền biến thiên mạnh theo thời gian và hình thế thời tiết.
Nhƣợc điểm thứ hai là việc hội tụ của phép lặp khi tìm trạng thái phân tích
phụ thuộc nhiều vào sự tồn tại của các cực trị địa phƣơng. Thêm vào đó, việc
nghịch đảo ma trận sai số nền trong thực tế là không thể. Do đó, rất nhiều các
11
giả thiết đơn giản hóa cho ma trận này phải đƣợc đƣa vào để loại bỏ các
tƣơng quan chéo không cần thiết giữa các biến.
Phƣơng pháp đồng hóa thứ hai là phƣơng pháp đồng hóa dãy (ĐHD),
khác với đồng hóa biến phân, phƣơng pháp đồng hóa dãy xác định trạng thái
phân tích theo cách làm tối thiểu hóa sai số của trạng thái phân tích so với
quan trắc và trạng thái nền. Tiêu biểu cho phƣơng pháp này là các bài toán nội
suy tối ƣu và phƣơng pháp lọc Kalman cùng với các biến thể của nó. Điểm
khác biệt cơ bản nhất giữa đồng hóa biến phân và đồng hóa dãy là ma trận sai
số hiệp biến của trạng thái nền trong đồng hóa dãy đƣợc tích phân theo thời
gian thay vì giữ không đổi nhƣ trong cách tiếp cận đồng hóa biến phân. Có
hai quá trình đòi hỏi khối lƣợng tính toán rất lớn trong các phƣơng pháp đồng
hóa dãy là các tính toán nghịch đảo ma trận và tính toán mô hình tiếp tuyến.
Các tính toán này là quá lớn ngay cả với một mô hình đơn giản, và hầu nhƣ
không thể tính toán đƣợc trong các bài toán thực tế. Để khắc phục nhƣợc
điểm này của lọc Kalman, một biến thể khác của lọc Kalman dựa trên dự báo
Monte-Carlo có tính toán khả thi hơn đã đƣợc phát triển là bộ lọc Kalman tổ
hợp (EnKF). Tuy nhiên, cách tiếp cận này cũng có một vài nhƣợc điểm liên
quan đến tính địa phƣơng hóa của số liệu quan trắc xung quanh các điểm nút
quan trắc và sự phụ thuộc của ma trận sai số vào số lƣợng thành phần tổ hợp,
ƣu điểm nổi trội của lọc Kalman tổ hợp đó là không đòi hỏi phát triển các mô
hình tiếp tuyến nhƣ trong phƣơng pháp ĐHBP. Thêm vào đó, lọc Kalman tổ
hợp cho phép tạo ra các trƣờng nhiễu ban đầu biến đổi theo thời gian. Vì vậy
phƣơng pháp EnKF đang đƣợc coi là một cách tiếp cận tiềm năng nhất cho dự
báo tổ hợp trong tƣơng lai.
12
1.2 Nghiên cứu phƣơng pháp đồng hóa số liệu trên Thế giới
Trên thế giới đã có nhiều tác giả nghiên cứu về bài toán đồng hóa số
liệu cho mô hình số và đạt đƣợc những kết quả khả quan trong dự báo thời
tiết, cũng nhƣ trong dự báo các hiện tƣợng cực đoan nhƣ mƣa lớn, bão, …
Nghiên cứu theo phƣơng pháp đồng hóa biến phân: Tác giả Xavier (2006)
[16] đã sử dụng phƣơng pháp đồng hóa biến phân ba chiều để đồng hóa
profile nhiệt độ và độ ẩm từ vệ tinh MODIS cùng với số liệu thám không vô
tuyến để cải thiện trƣờng ban đầu của mô hình MM5. Nghiên cứu đã chỉ ra
rằng việc sử dụng dữ liệu vệ tinh MODIS đã cải thiện đáng kể diễn biến mƣa
lớn kết hợp với áp thấp nhiệt đới. Sau đó cũng có tác giả Routray (2008) [14]
đã đồng hóa các số liệu quan trắc bề mặt, ship, bouy, cao không và vệ tinh địa
tĩnh Kapanal-1 để dự báo mƣa lớn ở Ấn Độ bằng việc sử dụng hệ thống đồng
hóa số liệu 3DVAR kết hợp mô hình WRF. Kết quả tính toán cho thấy, việc
đồng hóa số liệu đã cải thiện đáng kể chất lƣợng mô phỏng mƣa lớn trong
mùa mƣa ở Ấn Độ. Gần đây nhất có tác giả Rakesh (2009) [15] đã sử dụng sơ
đồ 3DVAR để đồng hóa dữ liệu tốc độ gió và hƣớng gió gần bề mặt biển từ
vệ tinh QSCAT, tốc độ gió và TPW từ vệ tinh SSM/I cho cả hai mô hình
MM5 và WRF để dự báo thời tiết hạn ngắn ở Ấn Độ. Kết quả nghiên cứu cho
thấy dự báo trƣờng gió từ hai mô hình này đƣợc cải thiện đáng kể trong
trƣờng hợp đồng hóa dữ liệu gió từ QSCAT và SSM/I, trong khi trƣờng nhiệt
độ và độ ẩm cho hiệu quả kém hơn. Trƣờng dự báo mƣa tốt nhất trong trƣờng
hợp đồng hóa dữ liệu TPW. Ngoài ra, nghiên cứu cũng chỉ ra rằng sai số dự
báo các trƣờng gió, nhiệt độ và độ ẩm ở các mực khác nhau bằng mô hình
WRF nhỏ hơn khi dự báo bằng mô hình MM5.
Nghiên cứu theo phƣơng pháp đồng hóa dãy đƣợc phát triển mạnh mẽ
hơn một thập kỉ qua tại Trƣờng Đại học Marry Land, các nghiên cứu này chủ
yếu đi theo hƣớng đồng hóa lọc Kalman tổ hợp và một biến thể của nó, gọi là
13
Lọc Kalman tổ hợp địa phƣơng. Năm 2003 Eugenia Kalnay đã phát hành
cuốn sách “Data Assimilation and Predictability” nội dung của cuốn sách
trình bày toàn bộ lý thuyết về phƣơng pháp đồng hóa số liệu và sự phân chia
các loại đồng hóa số liệu. Trong cuốn sách tác giả cũng trình bày rất rõ cơ sở
lý thuyết của lọc Kalman và một tổ hợp 25-50 các thành phần là đủ để phát
huy tác dụng của lọc Kalman. Những năm sau đó Kalnay và các cộng sự của
mình tiếp tục đi sâu vào việc nghiên cứu phƣơng pháp lọc Kalman tổ hợp và
ứng dụng những ƣu điểm của phƣơng pháp này vào dự báo nghiệp vụ. Gần
đây Kalnay và các cộng sự của mình (2008) [10] đã thiết kế phƣơng pháp lọc
Kalman tổ hợp địa phƣơng cho mô hình toàn cầu NCEP. Trong nghiên cứu
này các tác giả thực hiện việc tính toán bằng hệ thống song song tích hợp giữa
lọc LETKF với hệ thống dự báo toàn cầu 2004. Các thí nghiệm số đƣợc thực
hiện tại mô hình độ phân giải T26L28. Tất cả các quan trắc khí quyển đƣợc
đồng hóa nghiệp vụ bởi NCEP 2004, ngoại trừ bức xạ vệ tinh đƣợc đồng hóa
bởi LETKF. Tính chính xác của các phân tích trong LETKF đƣợc đánh giá
với nội suy thống kê phổ (SSI) (là sơ đồ đồng hóa số liệu toàn cầu của NCEP
năm 2004). Các bộ quan trắc đƣợc lựa chọn trong phân tích LETKF chính xác
hơn trong SSI vùng ngoại nhiệt đới Nam bán cầu và tƣơng đối chính xác
trong ngoại nhiệt đới và nhiệt đới ở Bắc Bán cầu.
1.3 Nghiên cứu phƣơng pháp đồng hóa số liệu ở Việt Nam
Trong những năm gần đây bài toán đồng hóa số liệu ở nƣớc ta đang
đƣợc nghiên cứu nhằm cải thiện trƣờng ban đầu tốt hơn. Một số tác giả
nghiên cứu theo hƣớng đồng hóa biến phân: Kiều Thị Xin và Lê Đức (2003)
[4] đã nghiên cứu áp dụng mô hình đồng hóa số liệu 3DVAR cho mô hình
HRM. Bằng cách sử dụng các số liệu tại các trạm cao không và SYNOP, kết
quả cho thấy lƣợng mƣa dự báo gần với thực tế hơn so với trƣờng hợp không
sử dụng đồng hóa số liệu. Tác giả Kiều Thị Xin (2005) [5] cũng đã sử dụng
14
phƣơng pháp biến phân hai chiều để phân tích độ ẩm đất từ nhiệt độ quan trắc
2 mét cho mô hình HRM. Kết quả cho thấy tác động nhỏ của độ ẩm đất đến
dự báo các trƣờng khí tƣợng trên cao trên khu vực Việt Nam. Tác giả Trần
Tân Tiến và Nguyễn Thị Thanh (2011) [3] đã nghiên cứu đồng hóa dữ liệu vệ
tinh MODIS trong mô hình WRF để dự báo mƣa lớn ở khu vực Trung Bộ.
Kết quả tính toán đƣợc thực hiện bằng cách sử dụng số liệu vệ tinh MODIS
để đồng hóa trƣờng ban đầu cho mô hình WRF, dự báo mƣa lớn cho khu vực
Trung Bộ trong hai mùa mƣa 2007 - 2008 và thu đƣợc kết quả khá khả quan.
Ngoài ra, còn một số tác giả cũng nghiên cứu theo hƣớng này: GS Phan Văn
Tân và Nguyễn Lê Dũng (2009) [2] đã thử nghiệm và ứng dụng hệ thống
WRF-VAR kết hợp với sơ đồ ban đầu hóa xoáy vào dự báo quĩ đạo bão trên
Biển Đông. Theo nghiên cứu này, thì mô hình WRF kết hợp với hệ thống
đồng hóa số liệu ba chiều (gọi là hệ thống WRF-VAR), đã đƣợc ứng dụng dự
báo thử nghiệm cho một số trƣờng hợp bão hoạt động trên biển Đông có quĩ
đạo tƣơng đối phức tạp và có cƣờng độ khác nhau. Tác giả sử dụng tập số liệu
toàn cầu và số liệu địa hình cho việc chạy mô hình WRF, việc đồng hóa số
liệu đƣợc thực hiện với nguồn số liệu quan trắc giả đƣợc tạo ra nhờ một
module ban đầu hóa xoáy. Kết quả thu đƣợc đã mở ra một khả năng phát triển
hệ thống WRF-VAR thành một phiên bản dự báo bão khi thêm một module
tạo xoáy nhân tạo.
Trên thế giới cũng đã có nhiều tác giả nghiên cứu về bài toán đồng hóa
dãy, và đã đạt đƣợc nhiều kết quả khả quan trong bài toán dự bão quỹ đạo và
cƣờng độ bão. Ở Việt Nam, nghiên cứu theo phƣơng pháp này vẫn còn là vấn
đề mới mẻ, tác giả Kiều Quốc Chánh (2011) [1] đã tổng quan về hệ thống
đồng hóa lọc Kalman tổ hợp và ứng dụng cho mô hình dự báo thời tiết WRF.
Trong đó, tác giả có đề cập tới cơ sở lý thuyết bộ lọc Kalman, lọc Kalman tổ
hợp và thiết kế phƣơng pháp đồng hóa này với mô hình dự báo thời tiết WRF.
15
Kết quả ban đầu thu đƣợc cho thấy bộ lọc Kalman tổ hợp có khả năng nắm
bắt tốt số liệu quan trắc vệ tinh. Những ƣu điểm mà phƣơng pháp lọc Kalman
tổ hợp đem lại là nguồn động lực cho các nhà nghiên cứu phát triển và ứng
dụng vào nghiệp vụ dự báo. Hiện nay, một số đề tài đang nghiên cứu theo
hƣớng này: “Nghiên cứu xây dựng hệ thống đồng hóa tổ hợp cho mô hình thời
tiết và hệ thống tổ hợp cho một số mô hình khí hậu khu vực nhằm dự báo và
dự tính các hiện tượng thời tiết, khí hậu cực đoan” (Đề tài ĐT.NCCB-
ĐHUD.2011-G/10) do TS Ngô Đức Thành chủ trì. Ngoài ra, còn có đề tài cấp
nhà nƣớc do GS Trần Tân Tiến chủ nhiệm “Xây dựng qui trình công nghệ dự
báo quĩ đạo và cường độ bão trên khu vực Tây bắc Thái Bình Dường và biển
Đông hạn 5 ngày” (KC.08.01/11-15). Các đề tài này có một đặc điểm chung
đó là ứng dụng ƣu điểm của lọc Kalman tổ hợp kết hợp với mô hình dự báo
thời tiết WRF nhằm cải thiện chất lƣợng dự báo cƣờng độ và quĩ đạo bão trên
khu vực Tây bắc Thái Bình Dƣơng và biển Đông. Đối với dự báo quĩ đạo sau
3 ngày sai số dự báo xuống còn dƣới 350 km. Mở ra một hƣớng nghiên cứu
mới trong việc dự báo quĩ đạo và cƣờng độ bão trong tƣơng lai gần.
16
Chƣơng 2
CƠ SỞ LÍ THUYẾT VỀ LỌC KALMAN TỔ HỢP
2.1 Cơ sở lý thuyết của lọc Kalman
Bộ lọc Kalman cơ bản, bao gồm hai bƣớc chính gọi là bước dự báo và
bước phân tích. Trong bƣớc dự báo, một trạng thái ban đầu của khí quyển và
sai số tƣơng ứng của trạng thái này (do trạng thái ban đầu không phải là trạng
thái thực) sẽ đồng thời đƣợc tích phân theo thời gian. Trong bƣớc phân tích,
kết quả của bƣớc dự báo tại một thời điểm trong tƣơng lai sẽ đƣợc kết hợp với
số liệu quan trắc tại thời điểm đó để tạo ra đƣợc một trạng thái ban đầu mới
và sai số của trạng thái ban đầu này cho quá trình dự báo tiếp theo.
Bước dự báo
Giả thiết khí quyển tại một thời điểm i nào đó đƣợc đặc trƣng bởi một trạng
thái
a
i
x
với một sai số
a
i
ε
. Đầu tiên chúng ta sẽ dự báo cho trạng thái đến thời
điểm i + 1 sẽ cho bởi :
)(
1
a
i
f
i
M xx
(2.1)
trong đó M là mô hình dự báo. Do mô hình này là không hoàn hảo, dự báo
bằng mô hình này sẽ có một sai số nào đó kể cả khi điều kiện ban đầu là chính
xác. Gọi sai số nội tại này của mô hình là
, khi đó một cách lý thuyết giá trị
sai số này sẽ đƣợc xác định nhƣ sau:
)(
1
t
i
t
i
M xx
(2.2)
trong đó
t
ii )1(
x
là trạng thái thực của khí quyển tại thời điểm i (i + 1). Chúng ta
sẽ giả thiết rằng sai số nội tại này là không lệch và ma trận sai số hiệp biến
của nó đƣợc cho bởi một ma trận Q, nghĩa là :
T
Q;0
(2.3)
17
Song song với dự báo trạng thái, chúng ta sẽ dự báo cả sai số từ thời điểm thứ
i đến thời điểm thứ i + 1 sử dụng mô hình tiếp tuyến L đƣợc định nghĩa dựa
trên dạng biến phân của phƣơng trình (2.1) nhƣ sau:
iii
M
xxLx
x
x
x
)(
)(
1
(2.4)
Với mô hình tiếp tuyến L này, sai số của trạng thái tại thời điểm thứ i + 1 sẽ
đƣợc cho bởi
i
a
ii
εxLε )(
1
(2.5)
Trong thực tế, chúng ta không bao giờ biết đƣợc sai số tuyệt đối thực
i
và
nhƣ thế không thể dự báo đƣợc sai số cho bƣớc tiếp theo. Tuy nhiên, trong đa
số các trƣờng hợp, chúng ta lại có thể biết hoặc xấp xỉ đƣợc đặc trƣng thống
kê của sai số đƣợc đặc trƣng bởi ma trận sai số hiệp biến P <
T
>. Thêm
vào đó, ma trận này cũng sẽ đƣợc sử dụng để đồng hóa cho bƣớc tiếp theo.
Do đó, chúng ta sẽ viết lại (2.5) cho ma trận sai số hiệp biến thay vì cho sai số
tuyệt đối
i
. Lƣu ý theo định nghĩa rằng
t
i
f
i
f
i
xxε
,
t
i
a
i
a
i
xxε
chúng ta sẽ có mối quan hệ sau
QLLP
η)εLη)εL
xxxxεεP
T
Ta
i
a
i
a
i
Tt
i
f
i
t
i
f
i
T
ii
f
i
((
))((
11111
(2.6)
Chú ý thêm rằng chúng ta đã giả thiết là sai số mô hình và sai số trạng thái
a
i
ε
là không có tƣơng quan với nhau. Nhƣ vậy, cho trƣớc giá trị sai số mô hình
Q, mô hình M, và mô hình tiếp tuyến L, phƣơng trình (2.2) và (2.6) cấu thành
18
một quá trình dự báo cơ bản trong bƣớc dự báo theo đó trạng thái
a
i
x
và sai số
a
i
ε
tại thời điểm i sẽ đƣợc dự báo đến thời điểm i + 1.
Bước phân tích
Trong bƣớc phân tích tiếp theo, giả sử tại thời điểm i + 1, chúng ta có một bộ
số liệu quan trắc y
o
với sai số quan trắc là
o
. Nhiệm vụ của chúng ta trong
bƣớc này là phải kết hợp đƣợc trạng thái dự báo
f
i 1
x
và sai số
f
i 1
P
với quan trắc
để tạo đƣợc một bộ số liệu đầu vào mới tốt hơn tại thời điểm i + 1. Mặc dù
a
i
x
là ƣớc lƣợng tốt nhất của trạng thái khí quyển tại thời điểm i, giá trị dự báo
f
i 1
x
tại thời điểm i + 1 lại không phải là tốt nhất do sai số của mô hình và của
a
i
x
. Do đó chúng ta cần phải đồng hóa tại thời điểm i + 1 để trạng thái dự báo
không bị lệch khỏi trạng thái thực tại các thời điểm này. Một cách hình thức,
chúng ta sẽ ƣớc lƣợng trạng thái khí quyển mới tốt hơn tại thời điểm i + 1 nhƣ
sau:
)]([
111
f
i
of
i
a
i
H
xyKxx
(2.7)
trong đó H là một toán tử quan trắc nội suy từ trƣờng mô hình sang các giá trị
điểm lƣới, và K là ma trận trọng số. Một cách trực quan, ma trận K càng lớn,
ảnh hƣởng của quan trắc lên trƣờng phân tích càng nhiều. Do đó, ma trận K
rất quan trọng và phải đƣợc dẫn ra một cách tối ƣu nhất có thể. Để thuận tiện
cho việc suy dẫn K, chúng ta định nghĩa một vài biến sai số sau:
t
i
a
i
a
i
xxε
,
t
i
f
i
f
i
xxε
,
)(
t
i
oo
i
H xyε
(2.8)
19
Để tìm ma trận K, chúng ta trƣớc hết phải tính ma trận sai số hiệp biến P
a
cho
trạng thái phân tích
a
i 1
x
và sau đó cực tiểu hóa ma trận này. Theo định nghĩa:
T
Ta
i
)(
)
1
t
1i
a
1i
t
1i
a
1i
a
1i
a
1i
x-x)(x-x
(εεP
(2.9)
Thay (2.7) vào (2.9) và xắp xếp lại, chúng ta sẽ thu đƣợc:
T
a
i
)εH-εKε)εH-εKεP
f
1i
o
1i
f
1i
f
1i
o
1i
f
1i
((((
1
(2.10)
trong đó ma trận H là tuyến tính hóa của toán tử quan trắc H.
Đặt
Tf
i
)
1
f
1i
f
1i
(εεP
,
T
)
o
1i
o
1i
(εεR
, và giả thiết trạng thái nền không có tƣơng
quan với trạng thái phân tích, chúng ta sẽ thu đƣợc từ (2.10) phƣơng trình sau:
TTf
i
a
i
KRKKHIPKHIP
)()(
11
(2.11)
Ma trận trọng số K sẽ cực tiểu hóa vết của ma trận sai số
a
i 1
P
khi và chỉ khi
0))((
1
a
i
trace P
K
(2.12)
trong đó trace() ký hiệu vết của ma trận. Ở đây, đạo hàm theo ma trận sẽ đƣợc
hiểu là đạo hàm từng thành phần của ma trận. Lý do cho việc cực tiểu hóa vết
của ma trận thay vì trực tiếp ma trận là do tổng các thành phần trên đƣờng
chéo của ma trận
a
i 1
P
sẽ chính là bình phƣơng của tổng sai số căn quân
phƣơng trong trƣờng hợp các biến là không tƣơng quan chéo. Do vết của một
ma trận là bảo toàn trong các phép biến đổi trực chuẩn, chúng ta luôn có thể
chéo hóa ma trận sai số
a
i 1
P
để đƣa về một cơ sở mà trong đó tổng sai số căn
quân phƣơng sẽ là tổng của các thành phần đƣờng chéo. Lấy đạo hàm vết của
ma trận
a
i 1
P
, chúng ta khi đó sẽ thu đƣợc từ (2.11) và (2.12)
1
11
)(
Tf
i
Tf
i
HHPRHPK
(2.13)
20
Với giá trị ma trận trọng số K cho bởi (2.13) ở trên, giá trị cực tiểu của ma
trận sai số hiệp biến phân tích khi đó sẽ thu đƣợc bằng cách thay (2.13) vào
(2.11). Biến đổi tƣờng minh chúng ta sẽ thu đƣợc:
.)(
11
f
i
a
i
PKHIP
(2.14)
Nhƣ vậy, ở bƣớc phân tích này chúng ta đã thu đƣợc một ƣớc lƣợng ban đầu
mới tốt hơn từ một trạng thái dự báo (hay dự báo nền) và quan trắc cho trƣớc.
Sau khi thu đƣợc trạng thái mới
a
i 1
x
và ma trận sai số mới
a
i 1
P
, quá trình dự
báo lại đƣợc lặp lại cho bƣớc đồng hóa kế tiếp theo. Một cách tóm tắt, lọc
Kalman đƣợc cho bởi minh họa trong hình 2.1.
Hình 2.1 Minh họa hai bƣớc chính của bộ lọc Kalman.
Mặc dù có ƣu điểm vƣợt trội so với các phƣơng pháp đồng hóa biến
phân khác, lọc Kalman cho bởi hệ các phƣơng trình (2.1), (2.6), (2.7), (2.13),
(2.14) lại rất khó áp dụng trực tiếp trong các mô hình thời tiết có tính phi
tuyến cao và bậc tự do rất lớn. Ba khó khăn chính của bộ lọc Kalman ở trên là
1) xây dựng mô hình tiếp tuyến L; 2) lƣu trữ và thao tác các ma các trận sai số
với số chiều có kích thƣớc quá lớn; và 3) sai số nội tại của mô hình Q không
đƣợc biết đầy đủ. Khó khăn thứ nhất có thể đƣợc giải quyết bằng cách sử
dụng một biến thể của bộ lọc Kalman, gọi là Kalman tổ hợp mở rộng (EnKF)
đƣợc đề xuất ban đầu bởi Evensen năm 1994. Khó khăn thứ hai đƣợc khắc
21
phục bằng cách địa phƣơng hóa các số liệu quan trắc xung quanh từng điểm
nút lƣới (localization) hoặc đồng hóa lần lƣợt từng giá trị quan trắc theo chuỗi
(serial). Về sai số nội tại của mô hình, đây là một hƣớng phát triển còn mở
của bộ lọc Kalman trong thời gian gần đây và có rất nhiều phƣơng pháp xử lý
nhƣ: kỹ thuật tăng cấp cộng tính, kỹ thuật tăng cấp nhân, kỹ thuật hiệu chỉnh
độ lệch hệ thống, kỹ thuật cộng nhiễu ngẫu nhiên.
Nhƣ đã đề cập ở trên, quá trình đồng hóa phải bao gồm hai bƣớc chính là
phân tích khách quan và ban đầu hóa. Trong bƣớc phân tích của bộ lọc
Kalman quá trình ban đầu hóa không đƣợc trình bày một cách cụ thể. Tuy
nhiên, các phân tích chi tiết cho thấy trong thực tế, bộ lọc Kalman đã tính đến
quá trình ban đầu hóa một cách nội tại trong bƣớc dự báo. Điều này là do
trong bƣớc dự báo này, ma trận sai số hiệp biến nền sẽ đƣợc tích phân theo
thời gian. Do đó, các tƣơng quan chéo giữa các biến động lực sẽ đƣợc hiệu
chỉnh theo thời gian. Ở một giới hạn đủ dài, ma trận sai số hiệp biến nền thu
đƣợc từ bộ lọc này sẽ có khả năng phản ánh đƣợc các tƣơng quan chéo giữa
các biến động lực và nhƣ vậy thông tin quan trắc thu đƣợc của bất kỳ một
biến nào cũng sẽ đƣợc cập nhất cho tất cả các biến mô hình khác. Đây chính
là ƣu điểm của bộ lọc Kalman, đặc biệt trong vùng vĩ độ thấp tại đó không tồn
tại một ràng buộc lý thuyết tƣờng minh cho các mối quan hệ động lực giữa
các biến giống nhƣ trong vùng ngoại nhiệt đới.
2.2 Lọc Kalman tổ hợp
Do khả năng phát triển mô hình tiếp tuyến và tích phân ma trận sai số
hiệp biến theo thời gian với mô hình tiếp tuyến là không thực tế trong các mô
hình dự báo thời tiết, lọc Kalman phải đƣợc cải tiến để có thể áp dụng đƣợc
cho các bài toán nghiệp vụ. Một cách tiếp cận phổ biến nhất dựa trên tích
phân ngẫu nhiên Monte-Carlo theo đó một tập các đầu vào đƣợc tạo ra xung
quanh một giá trị trƣờng phân tích cho trƣớc. Lƣu ý rằng tập đầu vào này
22
không phải đƣợc lấy bất kỳ mà đƣợc tạo ra dựa theo phân bố xác suất cũng
nhƣ giá trị sai số của trƣờng phân tích
a
P
tại từng thời điểm. Ví dụ nếu phân
bố của trƣờng phân tích có dạng phân bố chuẩn Gauss, khi đó tập đầu vào của
trƣờng phân tích sẽ phải tuân theo phân bố:
)()()(
2
1
2/12/
1
||)2(
1
)(
aaaTaa
a
ep
an
a
xxPxx
P
P
x
(2.15)
trong đó
a
x
là giá trị trƣờng phân tích trung bình tổ hợp thu đƣợc từ bƣớc
phân tích của lọc Kalman. Với một tập K các đầu vào {
a
k
x
}
k=1 K
sinh ra từ
phân bố (2.15), chúng ta có thể thu đƣợc ma trận sai số hiệp biến dự báo cho
bƣớc thời gian tiếp theo nhƣ sau:
Tff
k
K
k
ff
k
f
K
)()(
1
1
1
xxxxP
(2.16)
trong đó
)]([)(
1 i
a
ki
f
k
tMt xx
. Các nghiên cứu đã chỉ ra rằng một tổ hợp khoảng
25-50 các thành phần là đủ để lọc Kalman tổ hợp phát huy tác dụng.
Ngoài việc giản lƣợc quá trình phát triển mô hình tiếp tuyến, cách tiếp cận
EnKF có một vài ƣu điểm nổi trội bao gồm 1) Rút bớt các tính toán với các
ma trận có số chiều lớn; 2) Không cần tuyến tính hóa mô hình cũng nhƣ mô
hình liên hợp (adjoint); 3) Cung cấp một tổ hợp các nhiễu ban đầu tối ƣu hóa
cho việc dự báo các ma trận sai số hiệp biến. Mặc dù có nhiều điểm thuận lợi
song đến tại thời điểm này, chỉ có trung tâm dự báo thời tiết của Canada đã
đƣa lọc Kalman tổ hợp vào dự báo nghiệp vụ do khối lƣợng tính toán lớn.
EnKF hiện đƣợc coi là một hƣớng đi phát triển mạnh nhất trong thời gian tới
cho các bài toán nghiên cứu có tính dự báo thấp nhƣ bão nhiệt đới và ngoại
nhiệt đới, mƣa lớn, hay dông.
Trong phần này một biến thể cụ thể của lọc EnKF, gọi là lọc EnKF tổ hợp
biến đổi địa phƣơng hóa (LETKF) sẽ đƣợc trình bày và thử nghiệm. Một cách
23
cơ bản, lọc LETKF là một phƣơng pháp theo đó tại mỗi điểm nút lƣới, chúng
ta sẽ chọn một lân cận mô hình với kích thƣớc cho trƣớc (ví dụ một không
gian 3 chiều có kích thƣớc 11 11 3 với tâm là điểm nút chúng ta đang
quan tâm). Với không gian con này, chúng ta sẽ chọn ra tất cả các quan trắc
cho đƣợc bên trong không gian này và tạo ra một vectơr quan sát lân cận
riêng biêt. Sau đó, sử dụng ma trận nhiễu tổ hợp nền để biến đổi từ không
gian căng bởi số điểm nút lƣới địa phƣơng sang không gian con căng bởi số
thành phần tổ hợp. Điều này sẽ làm giảm đáng kể khối lƣợng tính toán ma
trận vì không gian tổ hợp thƣờng nhỏ hơn không gian địa phƣơng rất nhiều.
Do đó, các phép toán ma trận sẽ có độ chính xác cao hơn. Để minh họa thuật
toán một cách rõ ràng, nhắc lại rằng ma trận nhiễu tổ hợp nền
f
X
(có số chiều
N
K) đƣợc định nghĩa nhƣ sau:
}| ||{
21
ff
K
fffff
xxxxxxX
, (2.17)
trong đó,
K
k
f
k
f
K
1
1
xx
.
Gọi w là một vectơr biến đổi trong không gian tổ hợp đƣợc định nghĩa nhƣ
sau:
wXxx
bb
. (2.18)
Khi đó, hàm giá trong không gian tổ hợp địa phƣơng sẽ chuyển thành
][}])([)({)1()(
1
wXxwXXXXIww
bbbTbbTbT
JkJ
, (2.19)
trong đó
][ wXx
bb
J
là hàm giá trong không gian mô hình. Hàm giá sẽ đƣợc
cực tiểu hóa nếu w là trực giao với không gian con rỗng của toán tử X
f
. Lấy
đạo hàm của
)(wJ
theo w và sử dụng:
24
dxd
x
)(
T
AxAxx
x
2)(
T
chúng ta sẽ thu đƣợc giá trị
a
w
làm cực tiểu hóa hàm giá (2.19) nhƣ sau:
)]([)(
01 fTfaa
H xyRYPw
, (2.20)
trong đó
)](), ,(),([
21
ff
K
fffff
HHH xxxxxxY
(2.21)
và
11
])()1[(
fTfa
K YRYIP
. (2.22)
Nhƣ vậy, trong không gian tổ hợp, ma trận trọng số thu đƣợc từ (2.6) sẽ có
dạng:
1
)(
ˆ
RYPK
Tfa
,
và do đó ma trận trọng số K trở thành:
1
)(
ˆ
RYPXKXK
Tfaff
. (2.23)
Với ma trận K thu đƣợc ở trên, giá trị trạng thái phân tích trung bình tổ hợp
tại điểm nút chúng ta đang quan tâm sẽ đƣợc cho bởi:
][
fofa
xHyKxx
(2.24)
Cũng giống nhƣ trong bộc lọc SEnKF, nhiệm vụ cuối cùng của chúng ta là
xây dựng bộ tổ hợp các trạng thái phân tích. Để làm điều đó, chúng ta chú ý
rằng:
Tfff
K
)(
1
1
XXP
; và
Taaa
K
)(
1
1
XXP
Sử dụng mối quan hệ sau
.)(
fa
PKHIP