Tải bản đầy đủ (.pdf) (382 trang)

Nghiên cứu thử nghiệm dự báp định lượng mưa từ sản phẩm của mô hình HRM và GSM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (22.34 MB, 382 trang )


BTNMT
TTKTTVQG


BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THUỶ VĂN QUỐC GIA

Số 4 Đặng Thái Thân - Quận Hoàn Kiếm - Hà Nội
********



BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ



ĐỀ TÀI:
NGHIÊN CỨU THỬ NGHIỆM DỰ BÁO
ĐỊNH LƯỢNG MƯA TỪ SẢN PHẨM CỦA
MÔ HÌNH HRM VÀ GSM




Chủ nhiệm: TS. Bùi Minh Tăng




7557
18/11/2009


HÀ NỘI, 11-2009

BTNMT
TTKTTVQG

BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THUỶ VĂN QUỐC GIA
Số 4 Đặng Thái Thân - Quận Hoàn Kiếm - Hà Nội
********



BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ



ĐỀ TÀI:
NGHIÊN CỨU THỬ NGHIỆM DỰ BÁO
ĐỊNH LƯỢNG MƯA TỪ SẢN PHẨM CỦA
MÔ HÌNH HRM VÀ GSM





Chủ nhiệm: TS. Bùi Minh Tăng










HÀ NỘI, 11-2009

BỘ TÀI NGUYÊN VÀ MÔI TRƯỜNG
TRUNG TÂM KHÍ TƯỢNG THUỶ VĂN QUỐC GIA

Số 4 Đặng Thái Thân - Quận Hoàn Kiếm - Hà Nội
********

BÁO CÁO
TỔNG KẾT ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ CÔNG NGHỆ CẤP BỘ

ĐỀ TÀI:
NGHIÊN CỨU THỬ NGHIỆM DỰ BÁO ĐỊNH LƯỢNG MƯA TỪ
SẢN PHẨM CỦA MÔ HÌNH HRM VÀ GSM

Chỉ số đăng ký :
Chỉ số phân loại :
Chỉ số lưu trữ :

Cộng tác viên chính
ThS. Võ Văn Hòa ThS. Đỗ Lệ Thủy
TS. Lê Đức ThS. Nguyễn Đăng Quang
CN. Vũ Duy Tiến CN. Nguyễn Thu Hằng
ThS. Lê Xuân Cầu CN. Nguyễn Mạnh Linh
TS. Phạm Thanh Ngà CN. Nguyễn Vinh Thư

Hà Nội, ngày … tháng … năm 2009 Hà Nội, ngày … tháng … năm 2009
CHỦ NHIỆM ĐỀ TÀI CƠ QUAN THỰC HIỆN CƠ QUAN CHỦ TRÌ
TRUNG TÂM KTTVQG
KT. TỔNG GIÁM ĐỐC
PHÓ TỔNG GIÁM ĐỐC



Bùi Minh Tăng Lê Thanh Hải Trần Văn Sáp

Hà Nội, ngày … tháng … năm 2009 Hà Nội, ngày … tháng … năm 2009
HỘI ĐỒNG ĐÁNH GIÁ CHÍNH THỨC CƠ QUAN QUẢN LÝ ĐỀ TÀI
CHỦ TỊCH HỘI ĐỒNG TL. BỘ TRƯỞNG
KT. VỤ TRƯỞNG
VỤ KHOA HỌC VÀ CÔNG NGHỆ
PHÓ VỤ TRƯỞNG




TS. Nguyễn Lê Tâm Nguyễn Lê Tâm
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia



DANH SÁCH CÁC CHỮ VIẾT TẮT

ANN Mạng thần kinh nhân tạo
(Artifical Neural Network)

BIAS Sai số hệ thống

BoM Cơ quan khí tượng Australia
(Bureau of Meteorology)

BPNN Mạng ANN đa lớp lan truyền ngược sai số
(Error Back Propogation Neural Network)

BS Chỉ số Brier
(Brier Score)

BSS Chỉ số kỹ năng Brier
(Brier Skill Score)

CMC Cơ quan khí tượng Canada
(Canadian Meteorological C
entre)

DA Phân tích phân biệt
(Discriminant Analysis)

DMO Dự báo trực tiếp từ mô hình
(Direct Model Output)


DWD Tổng cục thời tiết Cộng hoà Liên bang Đức
(Deutscher WetterDienst)

ECMWF Trung tâm dự báo hạn vừa Châu Âu
(European Center for Medium-range Weather Forecasts)

EMOS Thống kê sau mô hình tổ hợp
(Ensemble Model Ouput Statistics)

ETS Chỉ số đánh giá ETS
(Equitable T
hreat Score)

FAR Tỷ lệ cảnh báo khống
(False Alarm Ratio)

FDA Phân tích phân biệt Fisher
(Fisher Discriminant Analysis)

GME Mô hình toàn cầu của CHLB Đức
(Global Model for Europe)
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
i
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


GMOS Thống kê sau mô hình trên lưới
(Gridded Model Ouput Statistics)

GSM Mô hình phổ toàn cầu của JMA

(Global Spectral Model)

HK Chỉ số đánh giá HK
(Hanssen and Kuiper discriminant)

JMA Cơ quan khí tượng Nhật bản
(Japan Meteorological Agency)

LDA Phân tích phân biệt tuyến tính
(Linear Discriminant Analysis)

LR Hồi quy Logistic
(Logistic Regression)

MAE Sai số tuyệt đối trung bình
(Mean Absolute Error)

ME Sai số trung bình
(Mean Error)

MDA Phân tích phân biệt đa nhóm
(Multiple Discriminant Analysis)

MLR Hồi quy tuyến tính đa biến
(Multiple Linear Regression)

MOS Thống kê sau mô hình
(Model Ouput Statistics)

NCEP Trung tâm dự báo môi trường quốc gia Mỹ

(National Centers for Environmental Prediction)

NWS Cơ quan khí tượng quốc gia Mỹ
(US National Meteorological Service)

NWP Dự báo thời tiết số trị

(Numerical Weather Prediction)

POD Chỉ số xác suất phát hiện mưa
(Probability Of Detection)

PoP Xác suất xảy ra mưa
(Probability Of Precipitation)

Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
ii
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


PP Phương pháp dự báo hoàn hảo
(Perfect Prognosis)

PQPF Dự báo xác suất định lượng mưa
(Probabilistic Quantitative Precipitation Forecast)

QPF Dự báo định lượng mưa
(Quantitative Precipitation Forecast)

RAN Mô hình thống kê sử dụng số liệu tái phân tích

(Re-Analysis)

RMSE Sai số quân phương
(Root Mean Square Error)

ROC Biểu đồ đường đặc trưng hoạt độ
ng - ROC
(Relative Operating Characteristics Diagram)

ROCA Diện tích của đường cong ROC
(ROC Area)

TS Chỉ số đánh giá TS
(Threat Score)

TTDBTƯ Trung tâm Dự báo Khí tượng Thủy văn Trung ương

UMOS Thống kê sau mô hình có cập nhập hệ số
(Updatable Model Ouput Statistics)
















Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
iii
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


DANH SÁCH CÁC BẢNG

TT
Số thứ
tự bảng
Nội dung Trang
1 2.1.1 Số lượng các trạm quan trắc khí tượng bề mặt của 9 khu vực
hành chính địa lý được thử nghiệm dự báo theo MOS
23
2 2.1.2 Số lượng các trạm quan trắc khí tượng và thủy văn của 10 lưu
vực sông được thử nghiệm dự báo theo MOS
23
3 2.2.1 Tần xuất tuyển chọn ít nhất 10% của các nhân tố dự báo theo 3
phương pháp MLR, LR và FDA từ GSM vào mùa hè trên khu
vực Việt Nam
33
4 2.2.2 Tương tự bảng 2.2.1 nhưng cho số liệu GSM vào mùa đông 33
5 2.2.3 Tương tự bảng 2.2.1 nhưng cho số liệu HRM vào mùa hè 34
6 2.2.4 Tương tự bảng 2.2.1 nhưng cho số liệu HRM vào mùa đông 34
7 2.2.5 Tần xuất tuyển chọn ít nhất 20% của các nhân tố dự báo theo
phương pháp MLR từ GSM vào mùa hè trên 9 khu vực

35
8 2.2.6 Tương tự bảng 2.2.5 nhưng cho số liệu GSM vào mùa đông 36
9 2.2.7 Tần xuất tuyển chọn ít nhất 10% của các nhân tố dự báo theo
ANN từ GSM vào mùa hè với số nút ẩn khác nhau
37
10 2.2.8 BSS trung bình trên khu vực Việt Nam từ tập dữ liệu độc lập
theo ANN từ GSM vào mùa hè với số nút ẩn khác nhau
38
11 2.2.9 Mức độ tin cậy (%) kiểm nghiệm dự báo theo ANN04 có kỹ
năng cao hơn các dự báo khác theo ANN với số nút ẩn > 4
38
12 2.2.10 ROCA trên khu vực Việt Nam từ tập dữ liệu độc lập theo ANN
từ GSM vào mùa hè với số nút ẩn khác nhau
39
13 2.2.11 Điểm số BSS trung bình trên khu vực Việt Nam từ tập dữ liệu
độc lập theo 4 phương pháp MLR, LR, FDA và ANN từ GSM
vào mùa hè
40
14 2.2.12 Tương tự bảng 2.2.11 nhưng cho số liệu GSM vào mùa đông 40
15 2.2.13 Tương tự bảng 2.2.11 nhưng cho số liệu HRM vào mùa hè 40
16 2.2.14 Tương tự bảng 2.2.11 nhưng cho số liệu HRM vào mùa đông 41
17 2.2.15 Mức độ tin cậy (%) kiểm nghiệm dự báo theo MLR có kỹ năng
cao hơn các dự báo khác theo LR, FDA và ANN từ GSM vào
mùa hè
41
18 2.2.16 Tương tự bảng 2.2.15 nhưng cho số liệu GSM vào mùa đông 41
19 2.2.17 Tương tự bảng 2.2.15 nhưng cho số liệu HRM vào mùa hè 41
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
iv
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia



20 2.2.18 Tương tự bảng 2.2.15 nhưng cho số liệu HRM vào mùa đông 42
21 2.2.19 ROCA trên khu vực Việt Nam từ tập dữ liệu độc lập theo 4
phương pháp MLR, LR, FDA và ANN từ GSM vào mùa hè
48
22 2.2.20 Tương tự bảng 2.2.19 nhưng cho số liệu GSM vào mùa đông 48
23 2.2.21 Tương tự bảng 2.2.19 nhưng cho số liệu HRM vào mùa hè 48
24 2.2.22 Tương tự bảng 2.2.19 nhưng cho số liệu HRM vào mùa đông 48
25 2.2.23 Điểm số BSS trung bình trên các khu vực từ tập dữ liệu độc lập
theo phương pháp MLR từ GSM vào mùa hè
49
26 2.2.24 Tương tự bảng 2.2.23 nhưng cho số liệu GSM vào mùa đông 49
27 2.2.25 BSS trung bình trên các lưu vực từ tập dữ liệu độc lập theo
phương pháp MLR từ GSM vào mùa hè
52
28 3.1.1 Bảng phân loại tần xuất cho biến dự báo dạng nhị phân 58
29 3.2.1 Tần xuất tuyển chọn ít nhất 10% của các nhân tố dự báo theo
phương pháp MLR cho mô hình GSM trên khu vực Việt Nam
61
30 3.2.2 Tương tự bảng 3.2.1 nhưng cho mô hình HRM 61
31 3.2.3 Tần xuất tuyển chọn ít nhất 10% của các nhân tố dự báo theo
phương pháp MLR từ GSM vào mùa hè và mùa đông trên 9
khu vực
62
32 3.2.4 Tương tự bảng 3.2.3 nhưng cho mô hình HRM 63
33 3.2.5 Số đặc trưng dữ liệu đầu vào được lựa chọn trong mô hình FE-
BPNN cho 9 khu vực nghiên cứu đối với mùa hè
66
34 3.2.6 Tương tự bảng 3.2.5 nhưng cho mùa đông 66

35 3.2.7 Tương tự bảng 3.2.5 nhưng cho các lưu vực sông vào mùa hè 67
36 3.2.8 Tương tự bảng 3.2.5 nhưng cho các lưu vực sông vào mùa đông 67
37 3.2.9 Số nút ẩn tối ưu của phương pháp FE-BPNN cho 9 khu vực
nghiên cứu
68
38 3.2.10 Số nút ẩn tối ưu của phương pháp FE-BPNN cho 7 lưu vực
sông nghiên cứu
68
39 3.2.11 Kết quả đánh giá và so sánh kỹ năng dự báo QPF trên tập số
liệu độc lập cho toàn bộ khu vực Việt Nam với số liệu mô hình
HRM
69
40 3.2.12 Tương tự bảng 3.2.11 nhưng cho mô hình GSM 70
41 3.2.13 Chỉ số ME (mm/24h) trên tập số liệu độc lập cho QPF trực tiếp
từ mô hình và các phương pháp thống kê thử nghiệm với số liệu
HRM đối với 9 khu vực nghiên cứu
71
42 3.2.14 Tương tự bảng 3.2.13 nhưng cho mô hình GSM 71
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
v
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


43 3.2.15 Chỉ số RMSE (mm/24h) trên tập số liệu độc lập cho QPF trực
tiếp từ mô hình và các phương pháp thống kê thử nghiệm với số
liệu HRM đối với 9 khu vực nghiên cứu
73
44 3.2.16 Tương tự bảng 3.2.15 nhưng cho mô hình GSM 73
45 3.2.17 Tần xuất xuất hiện mưa theo các ngưỡng mưa cho trước tương
ứng cho tập số liệu độc lập mùa hè và mùa đông đối với 9 khu

vực nghiên cứu
74
46 3.2.18 Các chỉ số đánh giá dự báo nhị phân cho tập số liệu độc lập
mùa đông trên toàn bộ khu vực Việt Nam với số liệu mô hình
HRM
76
47 3.2.19 Tương tự bảng 3.2.18 nhưng cho mô hình HRM vào mùa hè 77
48 3.2.20 Tương tự bảng 3.2.18 nhưng cho số liệu GSM vào mùa đông 78
49 3.2.21 Tương tự bảng 3.2.18 nhưng cho số liệu GSM vào mùa hè 79
50 3.2.22 Chỉ số ME (mm/24h) trên tập số liệu độc lập cho QPF trực tiếp
từ mô hình và các mô hình thống kê thử nghiệm với số liệu
HRM đối với 10 lưu vực sông
80
51 3.2.23 Tương tự bảng 3.2.22 nhưng cho số liệu GSM 81
52 3.2.24 Chỉ số RMSE (mm/24h) trên tập số liệu độc lập cho QPF trực
tiếp từ mô hình và các phương pháp thống kê thử nghiệm với số
liệu HRM đối với 10 lưu vực sông
82
53 3.2.25 Tương tự bảng 3.2.24 nhưng cho số liệu từ GSM 83
54 3.2.26 Kết quả đánh giá RMSE trung bình của phương pháp FE-
BPNN cho 9 khu vực
84
55 3.2.27 Tương tự bảng 3.2.26 nhưng cho 7 lưu vực sông 84
56 3.2.28 Kết quả đánh giá một số chỉ số đánh giá kỹ năng dự báo sự xuất
hiện mưa của phương pháp FE-BPNN cho 9 khu vực nghiên
cứu
85
57 4.2.1 Chỉ số BSS trung bình trên khu vực Việt Nam và 9 khu vực
nghiên cứu từ mô hình MLR với đầu vào GSM cho mùa hè năm
2009

89
58 4.2.2 Tương tự bảng 4.2.1 nhưng cho 10 lưu vực sông nghiên cứu 91
59 4.2.3 Tương tự bảng 4.2.1 nhưng cho chỉ số ROCA 92
60 4.2.4 Tương tự bảng 4.2.2 nhưng cho chỉ số ROCA 92
61 4.2.5 Kết quả đánh giá và so sánh giữa dự báo trực tiếp từ GSM và
dự báo từ mô hình thống kê MLR cho mùa hè năm 2009
94
62 4.2.6 Tương tự bảng 4.2.5 nhưng cho 10 lưu vực sông nghiên cứu 94
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
vi
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


DANH SÁCH CÁC HÌNH VẼ VÀ BIỂU ĐỒ

TT
Số thứ tự
hình
Nội dung
Trang
1 1.1.1 Sự khác biệt giữa thế giới thực tế với thế giới được mô phỏng
bởi các mô hình NWP
5
2 1.1.2 Sự khác biệt giữa cách tiếp cận thống kê cổ điển và PP 6
3 1.1.3 Sự khác biệt giữa cách tiếp cận PP và MOS 7
4 1.2.1 Một ví dụ so sánh đường dự báo xác suất mưa từ phương trình
hồi quy tuyến tính (đường đứt nét) và hồi quy logistic (đường
liền nét) trong đó các điểm dữ liệu được chỉ ra bởi các dấu
chấm đen (theo Wilks, 2006)
16

5 1.2.2 Ví dụ về mạng ANN 3 lớp (theo Applequist và nnk (2002)) 20
6 2.1.1 Sự biến thiên của chỉ số BSS trung bình trên khu vực Việt
Nam theo các giá trị tỷ lệ dừng khác nhau với phương pháp
MLR từ mô hình GSM dự báo cho mùa hè với 2 ngưỡng mưa
01mm (trái) và 50mm (phải)
28
7 2.1.2 Một ví dụ về biểu đồ độ tin cậy 30
8 2.1.3 Ví dụ về đường đặc trưng hoạt động (biểu đồ ROC) 32
9 2.2.1 Biểu đồ tin cậy cho khu vực Việt Nam ngưỡng mưa 50mm
theo ANN từ GSM vào mùa hè với số nút ẩn khác nhau 4, 5, 6
và 7 (lần lượt từ trái qua phải)
39
10 2.2.2 Tương tự hình 2.2.1 nhưng cho ngưỡng mưa 1mm 39
11 2.2.3 Biểu đồ tin cậy cho khu vực Việt Nam từ tập dữ liệu độc lập
theo 4 phương pháp MLR, LR, FDA và ANN từ GSM vào
mùa hè với các ngưỡng mưa khác nhau
43
12 2.2.4 Tương tự hình 2.2.3 nhưng cho số liệu GSM vào mùa đông 44
13 2.2.5 Tương tự hình 2.2.3 nhưng cho số liệu HRM vào mùa hè 45
14 2.2.6 Tương tự hình 2.2.3 nhưng cho số liệu HRM vào mùa đông 46
15 2.2.7 Phân bố của BSS (x10
-2
) trung bình tại từng điểm trạm trên
khu vực Việt Nam dự báo theo MLR từ GSM vào mùa hè
(trái) và mùa đông (phải)
50
16 2.2.8 Biểu đồ tin cậy trên 3 khu vực Nam Trung Bộ, Nam Bộ và
Tây Nguyên từ tập dữ liệu độc lập theo phương pháp MLR
cho mô hình GSM vào mùa hè và mùa đông với ngưỡng mưa
1mm

51
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
vii
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


17 3.1.1 Sự biến thiên của chỉ số RMSE trung bình trên khu vực Việt
Nam theo các trị tỷ lệ dừng khác nhau với phương pháp MLR
cho bài toán QPF từ mô hình GSM (trái) và HRM (phải) đối
với mùa hè
56
18 4.1.1 Sơ đồ dự báo PQPF và QPF nghiệp vụ 88
19 4.2.1 Biểu đồ tin cậy cho toàn bộ Việt Nam theo mô hình MLR với
số liệu GSM vào mùa hè năm 2009 với các ngưỡng mưa khác
nhau
89
20 4.2.2 Tương tự hình 4.2.1 nhưng cho một số khu vực và ngưỡng
mưa khác nhau
90
21 4.2.3 Tương tự hình 4.2.1 nhưng cho một số lưu vực sông và
ngưỡng mưa khác nhau
91
22 4.2.4 Tương tự hình 4.2.1 nhưng cho chỉ sổ đánh giá ROCA 93
23 4.2.5 Lượng mưa 24h từ 00Z 08/05/2009 đến 00Z 09/05/2009: Dự
báo theo PQPF-MLR (phải) và quan trắc (trái) cho các ngưỡng
mưa 10mm (hình a) và 20mm (hình b)
96
24 4.2.6 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
15/05/2009
96

25 4.2.7 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu 00Z ngày
28/05/2009
96
26 4.2.8 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
05/07/2009
97
27 4.2.9 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
16/07/2009
97
28 4.2.10 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
17/07/2009
97
29 4.2.11 Tương tự cho hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z
ngày 22/07/2009
98
30 4.2.12 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
08/08/2009
98
31 4.2.13 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
05/09/2009
98
32 4.2.14 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
06/09/2009
99
33 4.2.15 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
07/09/2009
99
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
viii
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia



34 4.2.16 Tương tự hình 4.2.5 nhưng cho dự báo bắt đầu từ 00Z ngày
08/09/2009
99
35 4.2.17 Lượng mưa tích lũy 24h từ 7h ngày 05/07/2009 - 7h ngày
06/07/2009: dự báo trực tiếp từ mô hình GSM (trái), quan trắc
(giữa) và dự báo từ phương pháp MLR (phải)
100
36 4.2.18 Tương tự hình 4.2.17 nhưng cho lượng mưa tích lũy 24h tính
từ 7h ngày 18/07/2009 đến 7h ngày 19/07/2009
100
37 4.2.19 Tương tự hình 4.2.17 nhưng cho lượng mưa tích lũy 24h tính
từ 7h ngày 22/07/2009 đến 7h ngày 23/07/2009
101
38 4.2.20 Tương tự hình 4.2.17 nhưng cho lượng mưa tích lũy 24h tính
từ 7h ngày 05/09/2009 đến 7h ngày 06/09/2009
101


































Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
ix
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


MỤC LỤC

Trang


MỞ ĐẦU 1

CHƯƠNG I
KHÁI QUÁT VỀ PHƯƠNG PHÁP THỐNG KÊ SAU MÔ HÌNH
CHO DỰ BÁO XÁC SUẤT ĐỊNH LƯỢNG MƯA
4
1.1 Khái quát về các nghiên cứu ứng dụng thống kê sau mô hình cho
dự báo xác suất định lượng mưa
4
1.1.1 Các cách tiếp cận cho bài toán thống kê sau mô hình 4
1.1.2 Khái quát về một số nghiên cứu sử dụng cách tiếp cận MOS cho dự
báo xác suất định lượng mưa
8
1.1.2.1 Trên thế giới 8
1.1.2.2 Giới thiệu mộ
t số hệ thống MOS nghiệp vụ trên thế giới 12
1.1.2.3 Tại Việt Nam 13
1.1.2.4 Nghiên cứu lựa chọn mô hình MOS phù hợp cho điều kiện Việt Nam 14
1.2 Giới thiệu một số phương pháp thống kê sau mô hình 14
1.2.1 Hồi quy tuyến tính đa biến 14
1.2.2 Hồi quy Logistic 15
1.2.3 Phân tích phân biệt 16
1.2.4 Mạng thần kinh nhân tạo 19

CHƯƠNG II
NGHIÊN CỨU THIẾT KẾ VÀ XÂY DỰNG CÁC MÔ HÌNH
MOS DỰ BÁO XÁC SUẤT ĐỊNH LƯỢNG MƯA
21
2.1 Thiết kế
và xây dựng các mô hình MOS dự báo xác suất định

lượng mưa
21
2.1.1 Thiết kế các mô hình MOS dự báo xác suất định lượng mưa 21
2.1.2 Mô tả tập số liệu nghiên cứu 24
2.1.3 Phương pháp xử lý số liệu và tuyển chọn nhân tố 25
2.1.4 Phương pháp đánh giá 28
2.2 Các kết quả đánh giá 33
2.2.1 Nhân tố dự báo 33
2.2.2 Lựa chọn số nút ẩn tối ưu cho phương pháp ANN 37
2.2.3 Kết quả đánh giá và so sánh kỹ năng dự báo 40
Kết luận chương II

53
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
x
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


CHƯƠNG III
NGHIÊN CỨU THIẾT KẾ VÀ XÂY DỰNG CÁC MÔ HÌNH
MOS DỰ BÁO ĐỊNH LƯỢNG MƯA
54
3.1 Thiết kế và xây dựng các mô hình MOS dự báo định lượng mưa 54
3.1.1 Thiết kế các mô hình MOS dự báo định lượng mưa 54
3.1.2 Mô tả tập số liệu nghiên cứu 55
3.1.3 Phương pháp xử lý số liệu và tuyển chọn nhân tố 55
3.1.4 Phương pháp đánh giá 57
3.2 Các kết quả đánh giá 60
3.2.1 Nhân tố dự báo 60
3.2.1.1 Phương pháp MLR 60

3.2.1.2 Phương pháp FE-BPNN 65
3.2.2 Lự
a chọn số nút ẩn tối ưu cho phương pháp ANN 67
3.2.3 Kết quả đánh giá và so sánh kỹ năng dự báo 68
3.2.3.1 Kết quả đánh giá cho phương pháp MLR 68
3.2.3.2 Kết quả đánh giá cho phương pháp FE-BPNN 83
Kết luận chương III 86


CHƯƠNG IV
MỘT SỐ KẾT QUẢ THỬ NGHIỆM NGHIỆP VỤ
54
4.1 Lựa chọn mô hình MOS dự báo xác suất và định lượng mưa
nghiệp vụ
87
4.2 Một số kế
t quả đánh giá nghiệp vụ 88
4.2.1 Dự báo xác suất định lượng mưa 88
4.2.2 Dự báo định lượng mưa 93
4.2.3 Dự báo cho một số đợt mưa lớn mùa hè năm 2009 95


KẾT LUẬN VÀ KIẾN NGHỊ 102

TÀI LIỆU THAM KHẢO 105

PHỤ LỤC
I Thông tin về các trạm quan trắc, khu vực và lưu vực sông và tập nhân
tố dự báo từ các mô hình HRM và GSM
110

II Phương pháp mạng thần kinh nhân tạo FE-BPNN 117
III Các phươ
ng trình MLR dự báo xác suất định lượng mưa cho một số
ngưỡng 1mm
124

Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
xi
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


MỞ ĐẦU

Dự báo mưa, đặc biệt dự báo định lượng mưa là một vấn đề rất khó khăn đồng
thời cũng là một trong những yêu cầu cấp thiết trong công tác dự báo, đặc biệt trong
dự báo bão, lũ, phục vụ phòng tránh thiên tai và kinh tế xã hội, điều tiết hồ chứa.
Việc sử dụng phương pháp synốp truyền thống chỉ có thể dự báo mưa một cách
định tính. Tuy các mô hình d
ự báo thời tiết số trị (NWP) có thể đưa ra những dự
báo định lượng, nhưng những sản phẩm dự báo trực tiếp từ mô hình (DMO - Direct
Model Output) thường có những sai số hệ thống nhất định liên quan đến nhiều yếu
tố, đặc biệt là vấn đề tham số hóa. Hơn nữa, DMO cũng chưa tính đến các yếu tố
địa phương của chính những đị
a điểm dự báo.
Từ lâu, phương pháp dự báo thống kê bằng cách xây dựng các phương trình
hồi qui tuyến tính đơn giản giữa yếu tố dự báo với các yếu tố đã biết (nhưng không
phải từ mô hình số trị) đã được áp dụng trong dự báo thời tiết. Từ khi mô hình số
được đưa vào nghiệp vụ, phương pháp thống kê có kết hợp với các sản phẩm của
mô hình b
ắt đầu được hình thành để làm tăng cường thêm những kết quả của dự báo

động lực trong dự báo nghiệp vụ. Hai phương pháp thống kê cơ bản không có và có
sử dụng sản phẩm của mô hình NWP là Dự báo hoàn hảo (PP - Perfect Prognosis)
và Thống kê sau mô hình (MOS - Model Ouput Statistics). Về cơ bản, cả hai cách
tiếp cận này đều sử dụng các phương trình hồi quy nhiều biến trong đó các nhân t

được lựa chọn thông qua một sơ đồ tuyển chọn nhân tố.
Hiện nay, ở hầu hết các trung tâm dự báo trên thế giới, song song với việc đưa
ra các sản phẩm mô hình thường có các chỉ dẫn thống kê (guidance) để thêm giá trị
vào những sản phẩm trực tiếp của mô hình. Đây là phương thức hợp lý để diễn xuất
mô hình một cách khách quan nhằm loại bỏ những sai số của mô hình và dự
báo
định lượng cho địa điểm có tính đến các điều kiện khí hậu và địa phương cụ thể. Cơ
quan khí tượng Mỹ là nơi đã áp dụng MOS nhiều nhất đối với các mô hình khác
nhau để đưa ra các sản phẩm dự báo nghiệp vụ. Ngoài ra, Trung tâm Dự báo Hạn
vừa Châu Âu (ECMWF), Cơ quan khí tượng Úc (BoM), Cơ quan khí tượng Hồng
Kông (HKO), Cục khí tượng Trung Quốc (CMA), … cũng áp dụng phương pháp
MOS đối với mô hình nghiệ
p vụ để nâng cao chất lượng dự báo DMO.
Tuy nhiên, việc sử dụng các dự báo bằng PP hay MOS vẫn còn đang tiếp tục
được đánh giá và hoàn thiện hơn. Gần đây, cùng với sự phát triển của tốc độ tính
toán và xử lý của máy tính, một số kỹ thuật thống kê phi tuyến bắt đầu được quan
tâm chú ý và thử nghiệm trong các bài toán MOS cho dự báo định lượng mưa như
như phương pháp thống kê nhân tạo, mạng thần kinh nhân tạo, hồi quy logistic,
phân tích phân biệt, Ngoài ra, m
ột số biến thể cập nhập khác như như UMOS và
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
1
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia



lọc Kalman cũng đã được nghiên cứu để khắc phục những hạn chế của MOS khi có
những thay đổi lớn trong mô hình NWP.
Tại Việt Nam, trước năm 1997, trong nghiệp vụ dự báo hàng ngày, chủ yếu sử
dụng phương pháp synốp để dự báo hình thế thời tiết. Một số các công cụ trên cơ sở
phương pháp thống kê truyền thống cũng được xây dựng, nhưng phần lớn là những
phương trình hồi qui đơn giản áp dụng cho một vài điểm, chỉ để dự báo một số nhân
tố truy
ền thống như nhiệt độ, vận tốc gió, và phần lớn là áp dụng cho những dự báo
hạn vừa và dài. Từ năm 1997 trở lại đây, trên cơ sở hợp tác song phương với một số
trung tâm dự báo quốc tế, rất nhiều sản phẩm mô hình NWP đã được thu nhận, lưu
trữ và phục vụ tác nghiệp tại Trung Tâm Dự báo Khí tượng thủy văn Trung ương
(TTDBTƯ). Nă
m 2002, TTDBTƯ bắt đầu chạy nghiệp vụ mô hình số phân giải cao
HRM với phiên bản 28km và 14km.
Trong lĩnh vực thống kê sau mô hình cho bài toán dự báo định lượng mưa, cho
đến nay có rất ít nghiên cứu về vấn đề này. Tại Tổng cục KTTV trước kia, đã có
những nghiên cứu ban đầu về sử dụng mạng thần kinh nhân tạo ANN cho dự báo
khí hậu, dự báo lũ cho một số sông và thu được một số kết quả nh
ất định. Tuy
nhiên, việc ứng dụng hệ ANN cho dự báo các yếu tố độc lập, nhất là dự báo lượng
mưa có sử dụng sản phẩm từ mô hình dự báo số cho đến nay vẫn chưa được triển
khai ở Việt Nam.
Như vậy, đến nay TTDBTƯ đã có một số mô hình nghiệp vụ để phục vụ công
tác dự báo. Tuy nhiên, việc ứng dụng các sản phẩm này kết h
ợp với các thông tin
khác trong dự báo thời tiết nghiệp vụ vẫn còn ở dạng rời rạc, thiếu hệ thống. Các
sản phẩm của mô hình chủ yếu được tham khảo một cách chủ quan. Trong khi các
mô hình cũng còn cần được cải tiến cho phù hợp với hoàn lưu của khu vực, cũng
như phù hợp với các điều kiện địa phương. Xuất phát từ thực tế này, bài toán xử lý
hậu mô hình với cách tiếp cận thống kê là rất cần thiết. Đây là những công cụ

khách quan để diễn giải đầu ra của mô hình hỗ trợ cho dự báo synốp truyền thống
nhằm nâng cao khả năng dự báo mưa một cách định lượng để phục vụ sự phát triển
kinh tế xã hội và phòng chống giảm nhẹ thiên tai. Dựa trên những mục tiêu và nội
dung công việc đã được đă
ng ký trong bản thuyết minh đề tài, nội dung của báo cáo
tổng kết đề tài sẽ được bố cục thành các phần sau:

Mở đầu
Chương I. Khái quát về phương pháp thống kê sau mô hình cho dự báo
xác suất định lượng mưa
Chương II. Nghiên cứu thiết kế và xây dựng các mô hình MOS dự báo xác
suất định lượng mưa
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
2
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


Chương III. Nghiên cứu thiết kế và xây dựng các mô hình MOS dự báo
định lượng mưa
Chương IV. Một số kết quả thử nghiệm nghiệp vụ
Kết luận và kiến nghị
Tài liệu tham khảo
Các phụ lục kèm theo

Đề tài do các cán bộ nghiên cứu của Trung tâm Dự báo Khí tượng thủy văn
Trung ương thực hiện với sự cộng tác chặt chẽ của các đồng nghiệp trong và ngoài
đơn vị, và s
ự theo dõi, chỉ đạo kịp thời của Ban Giám đốc Trung tâm. Nhóm thực
hiện đề tài hy vọng những kết quả nghiên cứu mà đề tài đạt được sẽ có những đóng
góp cho công tác dự báo định lượng mưa nghiệp vụ cũng như nghiên cứu phát triển

sau này tại Trung tâm Dự báo Khí tượng thủy văn Trung ương nói riêng và Trung
tâm Khí tượng thủy văn Quốc gia nói chung. Nhân dịp này, chủ nhiệm đề tài và các
cộng tác viên xin gửi lời c
ảm ơn chân thành đến Lãnh đạo Bộ Tài nguyên và Môi
trường, Lãnh đạo Trung tâm Khí tượng thủy văn Quốc gia và đặc biệt là Ban Giám
đốc Trung tâm Dự báo Khí tượng thủy văn Trung ương đã tạo mọi điều kiện cho
chúng tôi hoàn thành đề tài. Một lần nữa, xin trân trọng cảm ơn.



Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
3
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


CHƯƠNG I
KHÁI QUÁT VỀ PHƯƠNG PHÁP THỐNG KÊ SAU MÔ HÌNH CHO
DỰ BÁO XÁC SUẤT ĐỊNH LƯỢNG MƯA


1.1. KHÁI QUÁT VỀ CÁC NGHIÊN CỨU ỨNG DỤNG THỐNG KÊ SAU
MÔ HÌNH CHO DỰ BÁO XÁC SUẤT ĐỊNH LƯỢNG MƯA
1.1.1. Các cách tiếp cận cho bài toán thống kê sau mô hình
Như đã biết, rất nhiều phương pháp dự báo khí hậu và thời tiết nghiệp vụ đều
dựa trên nền tảng của thống kê. Điều này là do khí quyển là một hệ thống động lực
phi tuyến nên không thể dự báo chính xác theo quan điểm dự báo tất định
(deterministic). Chính vì thế, các phương pháp thống kê là thực sự cần thiết và trở
thành một phần không thể thiếu của các hệ th
ống dự báo. Trong khoa học khí
quyển, việc ứng dụng các phương pháp thống kê trong dự báo nghiệp vụ có thể

phân làm 2 dạng: dự báo thống kê cổ điển và dự báo thống kê động lực (Wilks,
1995, 2006). Phương pháp dự báo thống kê cổ điển được nghiên cứu phát triển
trước khi có các sản phẩm dự báo thời tiết số (NWP) và chủ yếu được ứng dụng cho
dự báo khí hậu. Cùng v
ới sự phát triển của khoa học khí quyển và công nghệ tính
toán, các sản phẩm NWP được sử dụng rộng rãi và đưa đến sự ra đời của phương
pháp dự báo thống kê động lực do các thông tin dự báo trực tiếp từ mô hình NWP
(DMO - Direct Model Output) vẫn chưa thực sự chính xác. Về bản chất, cả hai
phương pháp này đều dựa trên một số phương pháp thống kê để thiết lập mố
i quan
hệ tuyến tính hoặc phi tuyến giữa yếu tố dự báo và một tập hợp các nhân tố dự báo.
Các phương trình dự báo được xây dựng dựa trên một tập số liệu trong quá khứ (gọi
là tập số liệu phụ thuộc) và áp dụng để dự báo cho tương lai. Cho đến nay, phương
pháp thống kê cổ điển ít khi được sử dụng cho bài toán dự báo thời tiết mà thay vào
đó là các phương pháp thống kê
động lực.
Mục đích chính của phương pháp dự báo thống kê động lực là sử dụng các
thông tin NWP kết hợp với các công cụ tính toán thống kê để tăng cường chất lượng
dự báo của DMO. Hiện tại, phương pháp này được sử dụng tại hầu hết các trung
tâm dự báo trên thế giới và đóng vai trò như là các hệ thống diễn giải (guidance) trợ
giúp cho các dự báo viên. Phương pháp này thực sự quan trọng trong vi
ệc cung cấp
các bản tin dự báo định lượng hoặc dự báo cho các điểm không thuộc lưới tính toán
của mô hình NWP. Việc áp dụng các phương pháp thống kê để cải thiện chất lượng
dự báo DMO là xuất phát từ các lý do như sau:
- Có một sự khác biệt lớn giữa khí quyển thực tế với khí quyển được mô
phỏng bên trong mô hình (xem hình 1.1.1). Cụ thể, khí quyển của mô hình NWP là
một bức tranh đã được đơn gi
ản hóa đi rất nhiều so với khí quyển thực;
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM

4
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


- Bản thân các mô hình NWP có sai số do sự chưa hoàn chỉnh trong động lực
và vật lý, phương pháp số, …. Những sai số này có thể mang tính hệ thống hoặc
mang tính ngẫu nhiên;
- Các mô hình NWP là các hệ thống tất định. Điều này có nghĩa rằng với một
tập các giá trị đầu vào, các mô hình NWP chỉ tạo ra duy nhất một giá trị đầu ra.
Trong khi, trạng thái tương lai của khí quyển là bất định. Chính vì vậy, sử dụng kết
hợ
p các thông tin từ các mô hình NWP với các phương pháp thống kê sẽ cho phép
định lượng hóa và đưa độ bất định vào tính toán theo các hình thế dự báo khác
nhau. Đặc biệt, sự kết hợp này có thể đưa đến các dự báo xác suất, dạng dự báo mà
các mô hình NWP tất định không thể làm được.
Hình 1.1.1: Sự khác biệt giữa thế giới thực tế với thế giới được mô phỏng bởi các
mô hình NWP (theo Karl và nnk, 1989)

Trong phương pháp dự báo thời tiết thống kê động lực, có hai cách tiếp cận
chính được sử dụng là PP (Perfect Prognosis) và MOS (Model Output Statistics).
Cách tiếp cận PP được Klein và những người khác (viết tắt là nnk) đề xuất đầu tiên
vào năm 1959 để sử dụng các thông tin dự báo động lực t
ất định từ các mô hình
NWP. Trên thực tế, PP không hiệu chỉnh sai số của mô hình NWP mà chỉ sử dụng
các dự báo của mô hình NWP như là các biến khí quyển tương lai (giả thiết như là
các giá trị quan trắc hoàn hảo). Quá trình phát triển các phương trình PP là tương tự
như phương pháp thống kê cổ điển, đó là cả yếu tố dự báo và nhân tố dự báo đều là
các giá trị quan trắc. Tuy nhiên, vẫn có một số khác biệt c
ơ bản giữa thống kê cổ
điển và PP như được thấy trong hình 1.1.2. Cụ thể, trong pha luyện để xác định các

hệ số hồi quy, phương pháp thống kê cổ điển có một độ trễ thời gian giữa yếu tố dự
báo và nhân tố dự báo trong khi cách tiếp cận PP sử dụng bộ số liệu đồng thời.
Trong pha dự báo, phương pháp thống kê cổ điển sử d
ụng các nhân tố dự báo được
quan trắc tại thời điểm hiện tại để dự báo cho yếu tố dự báo tương lai thì PP lại sử
dụng các nhân tố được dự báo trong tương lai để dự báo yếu tố trong tương lai với
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
5
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


cùng thời điểm. Hay nói cách khác, cách tiếp cận PP không tính toán đến độ trễ thời
gian trong cả pha luyện và pha dự báo mà ngụ ý rằng các nhân tố dự báo trong
tương lai chính là các giá trị quan trắc. Do đó, nếu các dự báo từ các mô hình NWP
là hoàn hảo, thì dự báo trong tương lai của PP cũng gần như hoàn hảo. Đây chính là
lý do tại sao cách tiếp cận này lại được gọi là PP.


Hình 1.1.2: Sự khác biệt giữa cách tiếp cận thống kê cổ điển và PP

Cách tiếp cận MOS được đề xuất đầu tiên bởi Glahn và Lowry năm 1972
trong đó sử dụng các sản phẩm dự báo từ mô hình NWP để tạo ra các bản tin dự báo
thời tiết thống kê. Về cơ bản, cả MOS và PP đều sử dụng các thông tin dự báo từ
mô hình như là các nhân tố dự báo. Tuy nhiên, giữa hai cách tiếp cận này vẫn có
một số khác biệt cơ bản (xem hình 1.1.3) như sau:
- PP chỉ sử dụng thông tin từ mô hình NWP trong pha dự báo trong khi MOS
sử dụng cả trong pha luyện và pha dự báo;
- MOS có tính đến độ trễ thời gian thông qua dự báo của mô hình NWP còn
cách tiếp cận PP thì không;
- PP là độc lập với mô hình NWP còn MOS lại phụ thuộc vào mô hình NWP.

Do đó, sai số của mô hình NWP được đưa vào trong tính toán của MOS còn PP thì
không tính đến sai số mô hình.
- Quan hệ giữa yếu tố dự báo và các nhân tố dự báo trong PP thường cao h
ơn
so với MOS do sử dụng các dữ liệu quan trắc xảy ra đồng thời. Trong khi đó, các
mối quan hệ này trong MOS thường giảm theo hạn dự báo do sự giảm kỹ năng dự
báo của mô hình NWP.
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
6
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


- Số lượng các nhân tố dự tuyển trong PP thường bị hạn chế hơn so với MOS
do các nhân tố dự báo trong PP là các giá trị quan trắc.


Hình 1.1.3: Sự khác biệt giữa cách tiếp cận PP và MOS

Nói chung, các cách tiếp cận nói trên đều dựa trên phương pháp hồi quy tuyến
tính đa biến để tìm kiếm quan hệ tốt nhất giữa yếu tố dự báo và nhân tố dự báo.
Trong cách tiếp cận cổ điển, dự báo yếu tố trong tương lai được dựa trên tập hợp
các nhân tố quan trắc hiện tại. Đối với PP, quan hệ đồng thời gi
ữa yếu tố dự báo và
các nhân tố dự báo là cơ sở cho phương trình dự báo, còn trong cách tiếp cận MOS
thì các phương trình dự báo được xây dựng dựa trên mối quan hệ giữa các dự báo từ
thời điểm trước đó của mô hình NWP nhưng xác định tại thời điểm hiện tại với
quan trắc hiện tại của yếu tố dự báo.
Việc so sánh ưu nhược đi
ểm giữa cách tiếp cận thống kê cổ điển với cách tiếp
cận PP và MOS này là không hợp lý bởi vì chúng có bản chất khác nhau. Tuy

nhiên, giữa PP và MOS có thể được so sánh. Cụ thể, PP có ưu điểm hơn MOS trong
việc sử dụng tập số liệu phụ thuộc để tìm các hệ số hồi quy, đó là PP chỉ cần tập số
liệu khí hậu trong quá khứ mà không cần số liệu của mô hình. Do đ
ó, mỗi khi mô
hình NWP có sự thay đổi (dẫn đến thay đổi bản chất sai số) thì không nhất thiết
phải xây dựng lại các phương trình dự báo. Đặc biệt, PP có thể sử dụng với bất kỳ
mô hình NWP nào trong khi MOS lại phải xây dựng bộ phương trình dự báo cho
từng mô hình NWP khác nhau. Đây chính một lợi thế về mặt tính toán của PP so
với MOS. Ngược lại, MOS lại có ưu điểm vượt trội hơ
n hẳn PP ở trong việc đưa
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
7
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


được sai số dự báo của mô hình NWP vào tính toán xây dựng phương trình thống
kê dự báo. Đây chính là lợi thế giúp cho cách tiếp cận MOS thường được sử dụng
trong dự báo nghiệp vụ thời tiết thống kê.
Cho đến nay, mặc dù cả hai cách tiếp cận PP và MOS đã trải qua nhiều năm
phát triển với nhiều biến thể phức tạp, nhưng hai cách tiếp cận này vẫn còn những
hạn chế nhất định. Trong
đó, tất cả các biến thể của MOS và PP đều bị ảnh hưởng
bởi giới hạn của tập số liệu mẫu sử dụng để xây dựng phương trình dự báo. Kalnay
(2003) đã đề xuất một giải pháp để khắc phục vấn đề này đó là sử dụng số liệu tái
phân tích (reanalysis) để phát triển một sơ đồ hậu xử lý trong đó tích hợp được t
ất
cả các ưu điểm của MOS và PP nhưng lại khắc phục được vấn đề giới hạn của tập
số liệu phụ thuộc. Dựa trên đề xuất của Kalnay (2003), Marzban và nnk (2006) đã
giới thiệu một cách tiếp cận mới gọi là RAN (Re-Analysis). Theo Marzban và nnk
(2006), cách tiếp cận RAN là một sự kết hợp giữa PP và MOS trong đó số liệu tái

phân tích được sử dụng cùng v
ới số liệu quan trắc và mô hình để: 1) phát triển một
phương trình hồi quy để khử sai số do sự không hoàn chỉnh của mô hình NWP và 2)
phát triển phương trình hồi quy loại bỏ sai số không liên quan đến mô hình NWP.
Các kết quả đánh giá và so sánh PP, MOS và RAN dựa trên các phân tích lý thuyết
(các mô hình hồi quy chỉ sử dụng một nhân tố) đã chỉ ra rằng cách tiếp cận RAN có
thể tạo ra các dự báo ổn định và không có sai số hệ thống (BIAS bằng không) so với
MOS và PP. Tuy nhiên, cách tiếp cận RAN mới chỉ dừng lại ở việc đưa ra các ý
tưởng thực hiện mà chưa có bất kỳ nghiên cứu thực nghiệm cụ thể nào được thực
hiện để chỉ ra tính hiệu quả của cách tiếp cận này so với PP và MOS.

1.1.2. Khái quát về một số nghiên cứu sử dụng cách tiếp cận MOS cho dự
báo xác suất định lượng mưa
1.1.2.1. Trên thế giới
Những nỗ lực nghiên cứu áp dụng các phương pháp thống kê trong bài toán dự
báo xác suất định lượng mưa (PQPF-Probabilistic Quantitative Precipitation
Forecast) đầu tiên phải kể đến là công trình nghiên cứu của Klein (1968) dựa trên
cách tiếp cận PP; khí hậu synốp của Spiegler và Fisher (1971), Korte và nnk (1972);
và MOS của Glahn và Lowry (1972). Glahn và Lowry (1972) chính là những người
đặt nền móng đầu tiên trong việc ứng dụng các phương pháp thống kê kết hợp với
các sản phẩm dự báo t
ừ mô hình NWP nhằm mục đích: i) nâng cao chất lượng dự
báo mưa từ mô hình NWP, ii) dự báo cho các điểm không được dự báo trực tiếp từ
mô hình NWP, và iii) áp dụng cho bài toán downscaling.
Đối với bài toán PQPF, mô hình MOS của Glahn và Lowry (1972) được xây
dựng dựa trên phương pháp hồi quy tuyến tính đa biến (MLR - Mutiple Linear
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
8
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia



Regression) với yếu tố dự báo là xác suất xảy ra mưa thay vì lượng mưa hiểu theo
nghĩa thông thường. Cụ thể, lượng mưa quan trắc sẽ được quy về biến nhị phân
trong đó nhận giá trị 1 nếu có mưa xảy ra (xác suất 100%) và giá trị 0 nếu không có
mưa xảy ra (xác suất 0%). Glahn và Lowry (1972) gọi phương pháp thống kê này là
mô hình PoP (Probability of Precipatation). Quá trình tuyển chọn nhân tố cho mô
hình PoP được thực hiện dựa trên ph
ương pháp hồi quy từng bước với tiêu chuẩn
dừng tuyển chọn dựa trên chỉ số đánh giá Brier (Brier ,1950). Trong nghiên cứu
này, Glahn và Lowry (1972) không phát triển các phương trình MOS cho tất cả các
trạm mà dựa trên các đặc trưng khí hậu để nhóm các trạm vào trong các nhóm khác
nhau và phát triển các phương trình MOS cho từng nhóm trạm này.
Kế thừa những thành công trong nghiên cứu của Glahn và Lowry (1972), rất
nhiều nghiên cứu dựa trên cách tiếp cận MOS cho bài toán PQPF đã được thực hiện
như nghiên cứ
u của Wasserman (1972), Lowry và Glahn, (1976), Paegle (1974),
Bermowitz (1975), Bermowitz và Zurndorfer (1979), Arritt và Frank (1985) cho các
trạm thuộc nước Mỹ; Tapp và nnk (1986) cho Úc; Lemcke và Kruizinga (1988) cho
Hà Lan, Brunet và nnk (1988) cho Canađa, …. Hầu hết các nghiên cứu này dựa trên
ý tưởng về mô hình PoP của Glahn và Lowry (1972) nhưng đã được địa phương
hóa và có một số điểm khác biệt liên quan đến các tùy chọn về ngưỡng mưa, tập
nhân tố, dung lượng mẫu, mùa dự báo, tiêu chí tuyển chọn nhân tố, … Tuy nhiên,
có một kết quả chung mà tất cả các nghiên cứu nói trên chỉ ra đó là các kế
t quả dự
báo từ MOS đã cho thấy sự cải thiện đáng kể trong chất lượng dự báo so với DMO,
dự báo khí hậu quán tính và dự báo chủ quan của dự báo viên. Đặc biệt, cách tiếp
cận MOS còn được ứng dụng để phát triển các phương trình dự báo lượng mưa
trung bình lưu vực sông như trong các nghiên cứu của Krzysztofowitz và nnk
(1993), Knuepffer (1996), Sigrest và Krzysztofowitz (1998), Charba (1998) và
Antolik (2000), và Sokol (2003).

Nói chung, những nghiên cứu ứng dụng MOS cho bài toán PQPF được tổng
quan ở
trên về cơ bản dựa trên phương pháp MLR. Với phương pháp thống kê này,
có hai hạn chế mà các nghiên cứu gặp phải đó là: i) sự quá khớp (overfitting) của
các phương trình dự báo (có thể tạo ra các dự báo PQPF lớn hơn 1 hoặc nhỏ hơn 0
khi áp dụng cho tập số liệu độc lập); và ii) quan hệ phi tuyến giữa yếu tố dự báo và
các nhân tố dự báo không thể được đưa vào trong tính toán. Để giải quyết hai hạn
chế này, một số phương pháp thống kê phi tuyến đã được đề xuất bao gồm phương
pháp hồi quy logistic (LR - Logistic Regression) và mạng thần kinh nhân tạo (ANN
- Artificial Neural Network).
Nghiên cứu ứng dụng LR đầu tiên cho bài toán PQPF là của Applequist và
nnk (2002). Trong nghiên cứu này, các tác giả đã đánh giá kỹ năng dự báo PQPF
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
9
Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


dựa trên một số phương pháp thống kê khác nhau, trong đó MLR được sử dụng như
là dự báo đối chứng do mô hình MOS nghiệp vụ của Cơ quan khí tượng Mỹ (NWS)
sử dụng phương pháp này. Các kết quả đánh giá đã cho thấy phương pháp LR là có
kỹ năng tốt hơn cả. Đối với các phương pháp còn lại, sự cải thiện là không rõ ràng.
Cho đến nay, nghiên cứu của Applequist và nnk (2002) là nghiên cứu toàn diện nhất
trong việc ứng dụng các phương pháp thống kê khác nhau trong bài toán ứng dụng
MOS cho PQPF. Ngoài nghiên cứu của Applequist và nnk (2002), một số nghiên
cứu ứng dụng LR cho bài toán PQPF phải kể đến là Sokol (2003), Gahrs và nnk
(2003), Hamill và nnk (2004), Sloughter và nnk (2007).
Đối với việc ứng dụng phương pháp ANN cho bài toán PQPF, đã có rất nhiều
công trình nghiên cứu đề cập đến vấn đề này như Lindner and Krein (1993), Sarle
(1994), Navone và Ceccatto (1994), Bishop (1996), Kuligowski và Barros
(1998a,b), Hall và nnk (1999), Koizumi (1999), Marban (2003), Nói chung, hầu

hết các nghiên cứu này đều cho thấy sự cải thiện trong chất lượng dự báo PQPF t

các mô hình MOS áp dụng phương pháp ANN. Ngoài ra, một kết quả quan trọng có
thể rút ra từ những nghiên cứu nói trên là về cấu trúc của mạng ANN phù hợp cho
bài toán PQPF, đó là một mạng gồm với 3 lớp: một lớp đầu vào, một lớp ẩn và một
lớp đầu ra; và các hàm truyền trong mạng ANN nói trên đều có dạng hàm sigma phi
tuyến giống như phương pháp hồi quy logistic. Tuy nhiên, có rất ít nghiên cứu chỉ
ra được số lượng nút ẩn tố
i ưu cho bài toán PQPF.
Ngoài các biến thể MOS sử dụng phương pháp LR và ANN để khắc phục vấn
đề quá khớp và đưa quan hệ phi tuyến vào trong quá trình thiết lập các phương trình
dự báo như đã trình bày ở trên, một dạng biến thể khác của MOS cũng khá phổ biến
và thường được sử dụng cho các biến dự báo đa cấp như lượng mưa, vân lượng
mây, … là các mô hình MOS dựa trên phương pháp phân tích phân biệt (DA -
Discriminant Analysis). Phương pháp DA bao g
ồm 2 dạng cơ bản là phân tích phân
biệt tuyến tính (LDA - Linear Discriminant Analysis) hay còn gọi là phân tích phân
biệt Fisher (FDA) và phân tích phân biệt đa nhóm (MDA - Multiple Discriminant
Analysis). LDA thường được sử dụng cho bài toán 2 nhóm trong khi MDA được
ứng dụng cho bài toán đa nhóm. Cho đến nay, việc nghiên cứu ứng dụng DA trong
dự báo định lượng mưa (QPF - Quantitative Precipitation Forecast) theo cấp đã
được thực hiện khá rộng rãi với một số nghiên cứu điển hình như c
ủa Miller (1962),
Suzuki (1964a, b, c), Klein (1978), Wilson (1982), Carter và Elsner (1997),
Mohanty và nnk (2001). Gần đây, Mohanty và Mohapatra (2007) đã nghiên cứu kết
hợp mô hình PoP và MDA để dự báo QPF theo cấp. Cụ thể, mô hình PoP được sử
dụng để dự báo sự xuất hiện của mưa và sau đó áp dụng mô hình MDA để dự báo
lượng mưa theo các cấp mưa cho trước. Hầu hết các nghiên cứu nói trên đều cho
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
10

Trung Tâm Dự báo KTTV Trung ương Trung tâm KTTV Quốc Gia


thấy khả năng ứng dụng của phương pháp DA cho bài toán QPF. Tuy nhiên, kỹ
năng dự báo thường không cao, đặc biệt là cho các ngưỡng mưa lớn khi mà dung
lượng mẫu của các ngưỡng mưa này bị hạn chế. Đây cũng chính là nhược điểm lớn
nhất của phương pháp DA và phương pháp này chỉ dự báo tốt khi dung lượng mẫu
của các nhóm đưa ra là tương đối đồng đều.
Từ những phân tích nêu trên, có th
ể thấy, kể từ khi Glahn và Lowry (1972) đề
xuất, cách tiếp cận MOS truyền thống (sử dụng phương pháp MLR và các nhân tố
đồng thời) đã trải qua gần 40 năm phát triển với nhiều biến thể khác nhau dựa trên:
1) sự thay đổi về việc sử dụng tập nhân tố dự báo (các nhân tố có thể là giá trị dự
báo hay quan trắc, có dạng liên tục hoặc nhị phân, và được xác định tại nhiều thời
điểm khác nhau); 2) sử dụng các phương pháp thống kê khác nhau (LR, hồi quy
Poisson, ANN, DA, ). Tất cả những thay đổi này đều hướng tới mục tiêu khắc
phục các nhược điểm của cách tiếp cận MOS truyền thống và qua đó nâng cao chất
lượng dự báo. Tuy nhiên, vẫn còn một số hạn chế mà các biến thể nói trên không
thể khắc phục được đó là khả năng thích ứng của các mô hình MOS khi có những
sự thay đổi c
ăn bản bên trong các mô hình NWP, sự biến đổi nhanh của các hình thế
thời tiết, đòi hỏi khối lượng lưu trữ số liệu lớn, …
Gần đây, một dạng biến thể cập nhập (updatable) hoặc thích ứng (adaptive)
của MOS đã được giới thiệu để khắc phục các nhược điểm nói trên. Chẳng hạn,
Wilson và Vallée (2002) đã phát triển một hệ thống MOS cập nhập hệ
số (UMOS-
Updatable MOS) cho Cơ quan khí tượng Canađa - CMC dựa trên các nghiên cứu
của Ross (1987, 1989, 1992). Có hai đặc tính căn bản trong UMOS, đó là: 1) số liệu
đầu vào cho các phương pháp thống kê có dạng ma trận SSCP (Sum-of-Squares-
and-Cross-Products) thay vì dưới dạng thô bao gồm số liệu quan trắc và dự báo.

Các ma trận này sẽ được cập nhập khi có dữ liệu mới; và 2) các phương trình dự
báo được phát triển bởi sự kết hợp (blending) có trọng s
ố giữa số liệu mới và cũ sao
cho nắm bắt được những thay đổi mới nhất mà vẫn đảm bảo được tính dịch chuyển
và ổn định của hệ thống từ số liệu cũ sang số liệu mới. Wilson và Vallée (2003) đã
đánh giá kỹ năng dự báo PoP của UMOS so với PP và DMO và chỉ ra rằng hệ thống
UMOS có kỹ năng dự báo tốt hơn hẳn PP và DMO. Ngoài ra, hệ th
ống UMOS cũng
rất nhạy với sự thay đổi của sai số hệ thống. Tuy nhiên, các nghiên cứu của Wilson
và Vallée (2003) cũng cho thấy sự cải thiện trong chất lượng dự báo của UMOS chỉ
bộc lộ rõ trong các hạn dự báo ngắn (<24h), còn đối với các hạn dự báo dài hơn sự
cải thiện là không đáng kể, đặc biệt là cho dự báo PoP.
Khác với nghiên cứu của Wilson và Vallée (2002, 2003), Yuval và Hsieh
(2003) đã phát triển một sơ
đồ MOS phi tuyến thích ứng (Adaptive Nonlinear
MOS) dựa trên phương pháp ANN để dự báo QPF. Cụ thể, tập số liệu phụ thuộc
Nghiên cứu thử nghiệm dự báo định lượng mưa từ sản phẩm dự báo của mô hình HRM và GSM
11

×