Tải bản đầy đủ (.pdf) (173 trang)

Nghiên cứu ứng dụng phương pháp thống kê sau mô hình tổ hợp EMOS vào dự báo nhiệt độ và điểm sương bề mặt ở việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (3.97 MB, 173 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----***-----

VÕ VĂN HÒA

NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP THỐNG KÊ
SAU MƠ HÌNH TỔ HỢP (EMOS) VÀO DỰ BÁO
NHIỆT ĐỘ VÀ ĐIỂM SƯƠNG BỀ MẶT Ở VIỆT NAM

LUẬN ÁN TIẾN SĨ NGÀNH KHÍ TƯỢNG VÀ KHÍ HẬU HỌC

Hà Nội - 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----***-----

VÕ VĂN HÒA

NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP THỐNG KÊ
SAU MƠ HÌNH TỔ HỢP (EMOS) VÀO DỰ BÁO
NHIỆT ĐỘ VÀ ĐIỂM SƯƠNG BỀ MẶT Ở VIỆT NAM
Chuyên ngành: Khí tượng và khí hậu học
Mã số: 62.44.02.22
LUẬN ÁN TIẾN SĨ NGÀNH KHÍ TƯỢNG VÀ KHÍ HẬU HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC
1. TS. Bùi Minh Tăng
2. GS.TS Phan Văn Tân



Hà Nội - 2015


Lời cam đoan
Tơi xin cam đoan đây là cơng trình nghiên cứu của riêng tơi. Các số
liệu, kết quả trình bày trong luận án là trung thực và chưa từng được ai cơng
bố trong bất kỳ cơng trình nào khác.

Tác giả luận án

Võ Văn Hòa

1


Lời cảm ơn
Luận án được hoàn thành tại Trung tâm Dự báo khí tượng thủy văn
Trung ương và tại Khoa Khí tượng Thủy văn và Hải dương học, Trường Đại
học Khoa học Tự Nhiên, Hà Nội. Tác giả xin bày tỏ lòng biết ơn chân thành
tới hai nhà khoa học đã hết lịng động viên, tận tình giúp đỡ và quan tâm tới
từng bước nghiên cứu của luận án.
Để thực hiện luận án, tác giả đã được giúp đỡ về thời gian và điều kiện
nghiên cứu thuận lợi từ Trung tâm Dự báo khí tượng thủy văn Trung ương,
nơi tác giả được hỗ trợ về tài liệu, số liệu nghiên cứu, trang thiết bị tính tốn
và lưu trữ số liệu.
Lời tri ân tác giả muốn gửi tới các đồng nghiệp tại Trung tâm Dự báo
khí tượng thủy văn Trung ương đã chia sẻ, giúp đỡ và góp ý về một số nội
dung nghiên cứu của luận án.
Tác giả sẽ không bao giờ quên sự quan tâm, chăm sóc, sẻ chia buồn vui

và giúp đỡ qua bao khó khăn của người bạn đời và hai con nhỏ. Lòng biết ơn
sâu nặng nhất của tác giả xin gửi về cha mẹ, những người đã ban cho tác giả
cuộc sống, dưỡng nuôi suốt thời thơ ấu và định hướng khoa học là con đường
theo đuổi suốt đời của tác giả.

Tác giả

2


Mục lục
Lời cam đoan ................................................................................................ 1
Lời cảm ơn .................................................................................................... 2
Mục lục ......................................................................................................... 3
Danh sách các ký hiệu và chữ viết tắt ......................................................... 6
Danh mục các bảng ...................................................................................... 8
Danh mục các hình vẽ, đồ thị ..................................................................... 12
MỞ ĐẦU ..................................................................................................... 14
CHƯƠNG 1. TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP NGHIÊN CỨU
HIỆU CHỈNH THỐNG KÊ CHO DỰ BÁO TỔ HỢP ............................. 21
1.1. Khái niệm và vai trò của dự báo tổ hợp .............................................. 21
1.2. Sự cần thiết phải hiệu chỉnh dự báo tổ hợp ......................................... 24
1.3. Tổng quan các nghiên cứu hiệu chỉnh thống kê cho dự báo tổ hợp ..... 27
1.3.1. Ngoài nước .................................................................................. 27
1.3.2. Trong nước .................................................................................. 34
CHƯƠNG 2. MÔ TẢ SỐ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .. 37
2.1. Đặt bài toán ........................................................................................ 37
2.2. Nghiên cứu lựa chọn và ứng dụng các phương pháp thống kê để nâng
cao chất lượng dự báo trung bình tổ hợp và xác suất từ hệ thống SREPS .. 40
2.2.1. Các phương pháp thống kê tác động đến dự báo trung bình tổ hợp

.............................................................................................................. 40
2.2.2. Các phương pháp thống kê tác động đến cả dự báo trung bình tổ
hợp và dự báo xác suất .......................................................................... 43
2.2.3. Ứng dụng các phương pháp EMOS cho hệ thống SREPS............. 49
2.3. Mô tả tập số liệu nghiên cứu .............................................................. 53
2.4. Phương pháp xử lý số liệu .................................................................. 58

3


2.5. Phương pháp đánh giá ........................................................................ 60
2.5.1. Các chỉ số đánh giá chất lượng dự báo trung bình tổ hợp............ 61
2.5.2. Các chỉ số đánh giá chất lượng dự báo xác suất .......................... 62
CHƯƠNG 3. KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ ...................... 67
3.1. Đánh giá khả năng khử sai số hệ thống .............................................. 67
3.2. Đánh giá khả năng cải thiện chất lượng dự báo trung bình tổ hợp ...... 74
3.2.1. Yếu tố nhiệt độ khơng khí ............................................................. 74
3.2.2. Yếu tố nhiệt độ điểm sương .......................................................... 78
3.2.3. Yếu tố nhiệt độ tối cao ngày ......................................................... 81
3.2.4. Yếu tố nhiệt độ tối thấp ngày........................................................ 83
3.2.5. Nhận định chung .......................................................................... 86
3.3. Đánh giá khả năng cải thiện chất lượng dự báo xác suất .................... 88
3.3.1. Yếu tố nhiệt độ khơng khí ............................................................. 89
3.3.2. Yếu tố nhiệt độ điểm sương .......................................................... 94
3.3.3. Yếu tố nhiệt độ tối cao ngày ......................................................... 98
3.3.4. Yếu tố nhiệt độ tối thấp ngày...................................................... 102
3.3.5. Nhận định chung ........................................................................ 106
3.4. Xây dựng qui trình dự báo nghiệp vụ và đánh giá kết quả thử nghiệm
nghiệp vụ từ năm 2011-2013................................................................... 109
3.4.1. Xây dựng qui trình dự báo nghiệp vụ cho hệ thống EMOS dựa trên

phương pháp NGR_EM ....................................................................... 109
3.4.2. Kết quả đánh giá thử nghiệm nghiệp vụ từ năm 2011 đến 2013 . 112
KẾT LUẬN ............................................................................................... 122
KIẾN NGHỊ VỀ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO ............. 124
DANH MỤC CÁC CÔNG TRÌNH NGHIÊN CỨU CỦA TÁC GIẢ CĨ
LIÊN QUAN ĐẾN LUẬN ÁN ................................................................. 125
TÀI LIỆU THAM KHẢO........................................................................ 127

4


PHỤ LỤC 1. Danh sách 174 trạm được sử dụng trong nghiên cứu ...... 139
PHỤ LỤC 2. Kết quả đánh giá cho T2m hạn dự báo 48h và 72h .......... 142
PHỤ LỤC 3. Kết quả đánh giá cho Td2m hạn dự báo 48h và 72h ........ 148
PHỤ LỤC 4. Kết quả đánh giá cho Tmax hạn dự báo 48h và 72h ........ 154
PHỤ LỤC 5. Kết quả đánh giá cho Tmin hạn dự báo 48h và 72h......... 160
PHỤ LỤC 6. Kết quả đánh giá thử nghiệm nghiệp vụ từ 2011-2013 .... 166

5


Danh sách các ký hiệu và chữ viết tắt
ai

Hệ số hồi qui thứ i hoặc trọng số thứ i

ANN

Mạng thần kinh nhân tạo


BCES

Hiệu chỉnh sai số bằng phương pháp trọng số hàm mũ

BCLR

Hiệu chỉnh sai số bằng phương pháp hồi quy tuyến tính

BCMA

Hiệu chỉnh sai số bằng phương pháp trung bình trượt

BMA

Phương pháp trung bình Bayes

BIAS

Sai số hệ thống

BS

Chỉ số đánh giá xác suất

BSS

Chỉ số đánh giá kỹ năng dự báo xác suất

CMC


Cơ quan khí tượng Canađa

CRPS

Chỉ số xác suất hạng liên tục

DBTH

Dự báo tổ hợp

DWD

Tổng cục thời tiết Cộng hoà Liên bang Đức

ECMWF

Trung tâm dự báo thời tiết hạn vừa Châu Âu

EMES

Trung bình tổ hợp có trọng số tính theo hàm mũ

EMMV

Trung bình tổ hợp có trọng số tính theo phương sai sai số

EMOS

Hiệu chỉnh thống kê cho dự báo tổ hợp


F

Yếu tố dự báo

Fi

Thành phần dự báo tổ hợp thứ i

GEM

Mơ hình tồn cầu của CMC

GME

Mơ hình tồn cầu của DWD

GFS

Mơ hình tồn cầu của NCEP

GSM

Mơ hình tồn cầu của JMA

HTTH

Hệ thống dự báo tổ hợp

JMA


Cơ quan khí tượng Nhật Bản

6


KF

Phương pháp lọc Kalman

KTTV

Khí Tượng Thủy Văn

LR

Hồi quy Logistic

ME

Sai số trung bình

MOS

Thống kê sau mơ hình

N

Dung lượng mẫu hoặc tổng số dự báo thành phần

NCEP


Trung tâm dự báo môi trường quốc gia của Mỹ

NOGAPS

Mơ hình tồn cầu của Hải qn Mỹ (US Navy)

nnk

Những người khác

NGR_EM

Hồi quy Gauss không thuần nhất trong đó kỳ vọng quan hệ
tuyến tính với trung bình tổ hợp

NGR_ER

Hồi quy Gauss khơng thuần nhất trong đó kỳ vọng là trung
bình có trọng số của các dự báo thành phần

NGR_EP

Tương tự NGR_ER nhưng có loại bỏ trọng số âm

NWP

Dự báo thời tiết số trị

O


Giá trị quan trắc

Raw

Dự báo trung bình tổ hợp hoặc xác suất trực tiếp từ hệ
thống dự báo tổ hợp thời tiết hạn ngắn (SREPS)

RMSE

Sai số quân phương

SREPS

Hệ thống dự báo tổ hợp thời tiết hạn ngắn.

TBTH

Trung bình tổ hợp

TTDBTƯ

Trung Tâm Dự Báo khí tượng thủy văn Trung Ương

Td2m

Nhiệt độ điểm sương tại độ cao 2 mét

Tmax


Nhiệt độ tối cao ngày

Tmin

Nhiệt độ tối thấp ngày

T2m

Nhiệt độ khơng khí tại độ cao 2 mét

7


Danh mục các bảng
Bảng 2.1: Các kỹ thuật thống kê được thử nghiệm để nâng cao chất lượng dự
báo TBTH và xác suất của hệ thống SREPS (dấu tích ngụ ý có tác động) .... 50
Bảng 2.2: Cấu hình chi tiết của 4 mơ hình NWP khu vực được lựa chọn để
xây dựng hệ thống SREPS cho khu vực Việt Nam ....................................... 55
Bảng 2.3: Danh sách các nguồn số liệu được thu thập phục vụ nghiên cứu .. 57
Bảng 3.1: Kết quả tính tốn chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h (các giá
trị bôi đậm ngụ ý không đem lại sự cải thiện trong sai số) ............................ 75
Bảng 3.2: Kết quả tính tốn chỉ số đánh giá MAE (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h........... 76
Bảng 3.3: Kết quả tính tốn chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h ...... 77
Bảng 3.4: Kết quả tính tốn chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h......... 79
Bảng 3.5: Kết quả tính tốn chỉ số đánh giá MAE (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h......... 79

Bảng 3.6: Kết quả tính toán chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h .... 80
Bảng 3.7: Kết quả tính tốn chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h ......... 81
Bảng 3.8: Kết quả tính tốn chỉ số đánh giá MAE (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h ......... 82
Bảng 3.9: Kết quả tính tốn chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h..... 83

8


Bảng 3.10: Kết quả tính tốn chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h ......... 84
Bảng 3.11: Kết quả tính tốn chỉ số đánh giá MAE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h ..... 85
Bảng 3.12: Kết quả tính tốn chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h ..... 85
Bảng 3.13: Kết quả tính tốn chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h (các giá trị
bôi đậm ngụ ý không đem lại sự cải thiện trong chất lượng dự báo) ............. 89
Bảng 3.14: Kết quả tính tốn chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h ............ 92
Bảng 3.15: Kết quả tính tốn chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h ............ 93
Bảng 3.16: Kết quả tính tốn chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h........... 94
Bảng 3.17: Kết quả tính tốn chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h........... 97
Bảng 3.18: Kết quả tính tốn chỉ số độ rộng 90.48% của dự báo xác suất từ

Raw và 7 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h........... 98
Bảng 3.19: Kết quả tính toán chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h ........... 99
Bảng 3.20: Kết quả tính tốn chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h ......... 101
Bảng 3.21: Kết quả tính tốn chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h ......... 102
Bảng 3.22: Kết quả tính tốn chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h ......... 103

9


Bảng 3.23: Kết quả tính tốn chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h ......... 105
Bảng 3.24: Kết quả tính tốn chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h ......... 105
Bảng 3.25: Chỉ số ME (0C) cho dự báo TBTH của T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 113
Bảng 3.26: Chỉ số MAE (0C) cho dự báo TBTH của T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 113
Bảng 3.27: Chỉ số RMSE (0C) cho dự báo TBTH của T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 114
Bảng 3.28: Chỉ số ME (0C) cho dự báo TBTH của Td2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 115
Bảng 3.29: Chỉ số MAE (0C) cho dự báo TBTH của Td2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 115
Bảng 3.30: Chỉ số RMSE (0C) cho dự báo TBTH của Td2m hạn dự báo 24h
từ NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 ...... 115
Bảng 3.31: Chỉ số ME (0C) cho dự báo TBTH của Tmax hạn dự báo 24h từ

NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 116
Bảng 3.32: Chỉ số MAE (0C) cho dự báo TBTH của Tmax hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 117
Bảng 3.33: Chỉ số RMSE (0C) cho dự báo TBTH của Tmax hạn dự báo 24h
từ NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 ...... 117
Bảng 3.34: Chỉ số ME (0C) cho dự báo TBTH của Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 118
Bảng 3.35: Chỉ số MAE (0C) cho dự báo TBTH của Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 118

10


Bảng 3.36: Chỉ số RMSE (0C) cho dự báo TBTH của Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 119
Bảng 3.37: Chỉ số CRPS cho dự báo xác suất T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 120
Bảng 3.38: Chỉ số CRPS cho dự báo xác suất Td2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 120
Bảng 3.39: Chỉ số CRPS cho dự báo xác suất Tmax hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 120
Bảng 3.40: Chỉ số CRPS cho dự báo xác suất Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013 .......... 121

11


Danh mục các hình vẽ, đồ thị
Hình 2.1: Giả thiết minh họa một hệ thống dự báo tổ hợp không tối ưu (bên
trái) và hiệu quả của bài toán EMOS có thể đem lại (bên phải) .................... 38

Hình 2.2: Sự biến thiên của chỉ số RMSE trung bình trên tồn khu vực Tây
Bắc trong tháng 11 năm 2010 theo các độ dài chuỗi số liệu phụ thuộc khác
nhau cho từng phương pháp EMOS.............................................................. 52
Hình 2.3: Sơ đồ dự báo trượt theo thời gian của các phương pháp EMOS
được thử nghiệm .......................................................................................... 53
Hình 2.4: Miền dự báo của hệ thống SREPS................................................ 54
Hình 2.5: Các bảng quan hệ của CSDL quan trắc các yếu tố nhiệt độ bề mặt
..................................................................................................................... 59
Hình 2.6: Sơ đồ minh họa phương pháp nội suy song tuyến tính [115] (P là
điểm trạm cần nội suy, các điểm nút lưới được ký hiệu là Q) ....................... 60
Hình 2.7: Giản đồ tụ điểm cho dự báo T2m hạn 24h cho tại khu vực Tây Bắc
từ dự báo thành phần HRM_GFS của SREPS (trái) và BCMA (phải) .......... 62
Hình 2.8: Ví dụ về các dạng biểu đồ dạng lý thuyết được tạo ra dựa trên hệ
thống dự báo tổ hợp bao gồm 10 dự báo thành phần .................................... 64
Hình 2.9: Ví dụ về sự thay đổi của độ nhọn hàm phân bố theo theo sự thay
đổi của biên độ độ phủ 90.48% .................................................................... 65
Hình 3.1: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo T2m hạn 24h trên khu vực Tây Bắc ....... 68
Hình 3.2: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo Td2m hạn 24h trên khu vực Tây Bắc ..... 70
Hình 3.3: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo Tmax hạn 24h trên khu vực Tây Bắc...... 71

12


Hình 3.4: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo Tmin hạn 24h trên khu vực Tây Bắc ...... 72
Hình 3.5: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
T2m hạn 24h trên khu vực Tây Bắc.............................................................. 91

Hình 3.6: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
Td2m hạn 24h trên khu vực Tây Bắc ............................................................ 95
Hình 3.7: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
Tmax hạn 24h trên khu vực Tây Bắc .......................................................... 100
Hình 3.8: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
Tmin hạn 24h trên khu vực Tây Bắc........................................................... 104
Hình 3.9: Sơ đồ thời gian cần thiết để thu thập số liệu, chạy hệ thống SREPS
và các phương pháp EMOS trong điều kiện nghiệp vụ tại TTDBTƯ.......... 109
Hình 3.10: Sơ đồ qui trình nghiệp vụ vận hành hệ thống EMOS dựa trên
phương pháp NGR_EM cho hệ thống SREPS tại TTDBTƯ....................... 111

13


MỞ ĐẦU
 Đặt vấn đề
Các nghiên cứu của Lorenz [74, 75] đã nêu lên tầm quan trọng của điều
kiện ban đầu đối với các mơ hình dự báo thời tiết số trị (NWP) trong đó thừa
nhận tồn tại các nguồn bất định (uncertainties) trong dự báo. Những nguồn
bất định này đã hạn chế khả năng dự báo của các mô hình NWP. Phương
pháp dự báo tổ hợp (DBTH) đã được nghiên cứu để giải quyết vấn đề nói trên
và sử dụng trong dự báo nghiệp vụ tại nhiều nơi trên thế giới từ những năm
1992 của thế kỷ trước. Cho đến nay, DBTH đã được phát triển và ứng dụng
cho nhiều mục đích khác nhau và được đánh giá là lĩnh vực có tốc độ thay đổi
nhanh nhất trong nghiên cứu và ứng dụng của khoa học khí quyển.
Trên thực tế, mơ hình NWP sử dụng trong các hệ thống dự báo tổ hợp
(HTTH) luôn tồn tại các sai số hệ thống (bias) liên quan đến sự khơng hồn
hảo trong động lực, vật lý, phương pháp số, mô tả địa hình, … Những sai số
này ảnh hưởng lớn tới chất lượng dự báo của các HTTH như dự báo trung
bình tổ hợp (TBTH) không tốt hơn dự báo đối chứng và các dự báo thành

phần, dự báo xác suất không tin cậy, … Thậm chí, với một phương pháp
nhiễu động hồn hảo, thì hàm phân bố xác suất dựa trên một HTTH có thể
khơng phù hợp nếu mơ hình có sai số nhỏ nội tại [33]. Do vậy, phương pháp
hậu xử lý là cần thiết để nâng cao chất lượng dự báo trung bình tổ hợp và xác
suất của HTTH.
Tại Việt Nam, các HTTH hạn ngắn và hạn vừa đã được nghiên cứu và
triển khai vào nghiệp vụ từ năm 2010 cho đến nay. Các kết quả đánh giá đã
cho thấy chất lượng dự báo nhiệt độ và độ ẩm bề mặt từ các HTTH nghiệp vụ
này luôn tồn tại các sai số hệ thống. Dẫn đến chất lượng dự báo TBTH và xác
suất không đáp ứng được yêu cầu của bài tốn nghiệp vụ dự báo. Chính vì
vậy, việc nghiên cứu ứng dụng các phương pháp thống kê để hiệu chỉnh các

14


dự báo trực tiếp cho yếu tố nhiệt độ và độ ẩm từ các HTTH nghiệp vụ là hết
sức cần thiết và cấp bách.
 Tính cấp thiết của đề tài
Tại Việt Nam, các hệ thống NWP đã được nghiên cứu và ứng dụng
nghiệp vụ từ hơn 10 năm trở lại đây trong đó bao gồm các HTTH từ quy mơ
hạn ngắn cho đến hạn mùa. Năm 2010, TTDBTƯ đã triển khai nghiệp vụ hệ
thống dự báo tổ hợp thời tiết hạn ngắn (1-3 ngày) - SREPS dựa trên cách tiếp
cận đa mơ hình đa phân tích và bao gồm 20 dự báo thành phần. Các sản phẩm
dự báo TBTH và dự báo xác suất từ SREPS đã và đang góp phần quan trọng
trong công tác dự báo thời tiết hạn ngắn, đặc biệt là dự báo các hiện tượng
thời tiết nguy hiểm tại TTDBTƯ. Theo kết quả đánh giá của TTDBTƯ [4, 6,
7], chất lượng dự báo TBTH và xác suất của hệ thống SREPS vẫn còn nhiều
hạn chế cho một số biến bề mặt và trên cao. Những hạn chế này dẫn đến hiệu
quả phục vụ công tác dự báo thời tiết của hệ thống SREPS chưa cao. Câu hỏi
đặt ra là “Làm thế nào để nâng cao được chất lượng dự báo TBTH và xác

suất của hệ thống SREPS ?”.
Nguyên nhân dẫn đến những hạn chế của hệ thống SREPS có thể bắt
nguồn từ sự chưa hồn hảo của các mơ hình NWP được sử dụng, sai số địa
hình và thảm phủ, sai số trường ban đầu và điều kiện biên, … [4]. Để cải tiến
tổng thể chất lượng dự báo của SREPS, rất nhiều bài toán khác nhau cần phải
thực hiện riêng rẽ hoặc đồng thời. Chẳng hạn, để khắc phục ngun nhân do
mơ hình NWP, rõ ràng cần phải đầu tư nghiên cứu cải tiến mô hình từ động
lực, vật lý cho đến phương pháp số. Để cải tiến trường ban đầu, cần phải
nghiên cứu ứng dụng bài tốn đồng hóa số liệu, … Đây là những bài tốn lớn
địi hỏi phải nghiên cứu lâu dài và tốn nhiều công sức. Vậy “Làm cách nào để
lựa chọn được giải pháp hiệu quả nhất để nâng cao được chất lượng dự báo
TBTH và xác suất cho hệ thống SREPS ?”.

15


Theo Du [33], trên thế giới hiện tại phổ biến 2 cách tiếp cận để giải
quyết những tồn tại nói trên cho các HTTH, đó là động lực và thống kê. Cách
tiếp cận động lực liên quan đến bài toán cải tiến mơ hình NWP sử dụng trong
HTTH hoặc cải tiến cách thức tạo ra các dự báo thành phần của HTTH. Cách
tiếp cận thống kê tương tự như bài tốn thống kê sau mơ hình (MOS) cho mơ
hình NWP tất định trong đó các kỹ thuật thống kê được sử dụng để hiệu chỉnh
các dự báo thành phần của HTTH hoặc tổng hợp thông tin DBTH một cách
hiệu quả nhất để nâng cao được chất lượng dự báo TBTH và xác suất của
HTTH. Câu hỏi đặt ra là “Trong hai cách tiếp cận nói trên, cách tiếp cận nào
phù hợp cho hệ thống SREPS ?”.
Như đã biết, hệ thống SREPS hiện đang ứng dụng ở Việt Nam dựa trên
cách tiếp cận đa mơ hình đa phân tích trong đó sử dụng 4 mơ hình NWP khu
vực chạy riêng rẽ với các đầu vào từ 5 mơ hình NWP tồn cầu. Theo cách tiếp
cận động lực, việc cải tiến mô hình cần phải thực hiện cho cả 4 mơ hình NWP

của hệ thống SREPS trong khi cải tiến trường ban đầu sẽ liên quan tới 5 mơ
hình NWP tồn cầu. Cách tiếp cận này địi hỏi một khối lượng cơng việc
khổng lồ và thực hiện trong thời gian dài. Việc cải tiến cách thức tạo ra các dự
báo thành phần hoặc số lượng dự báo thành phần cũng gặp phải khó khăn
tương tự. Trong khi đó, cách tiếp cận thống kê chỉ tác động đến kết quả đầu ra
của hệ thống SREPS mà khơng ảnh hưởng tới các mơ hình NWP được sử
dụng cũng như cách thức tạo ra các dự báo thành phần. Đây là cách tiếp cận
đơn giản, khả thi và có thể đem lại hiệu quả cao khi sai số hệ thống chiếm ưu
thế trong sai số tổng cộng.
Các kết quả đánh giá chất lượng dự báo tất định và xác suất một số yếu
tố bề mặt của hệ thống SREPS [4, 6, 7] đã chỉ ra sai số hệ thống nội tại trong
các dự báo thành phần của SREPS đã hạn chế chất lượng báo tất định và xác
suất đối với nhiệt độ, độ ẩm, gió, áp và mưa - các yếu tố thời tiết. Hay nói

16


cách khác, chất lượng dự báo thời tiết từ hệ thống SREPS chưa đáp ứng được
yêu cầu của bài toán nghiệp vụ, đặt biệt là dự báo điểm. Trong đó, các yếu tố
nhiệt độ và độ ẩm cho thấy khuynh hướng sai số hệ thống rõ nét nhất. Do các
phương pháp EMOS được lựa chọn (sẽ trình bày dưới đây) chỉ có thể áp dụng
cho biến liên lục và có tính đồng nhất cao, nên 2 yếu tố nhiệt độ và điểm
sương bề mặt là phù hợp nhất. Việc nghiên cứu áp dụng các phương pháp
EMOS cho yếu tố lượng mưa, gió, … sẽ là hướng nghiên cứu tiếp theo của
luận án. Cụ thể, các yếu tố nhiệt độ không khí, nhiệt độ tối cao và tối thấp
ngày và điểm sương bề mặt (phản ánh độ ẩm) bề mặt (tại độ cao 2 mét) sẽ là
các đối tượng nghiên cứu của luận án này.
Đứng trước yêu cầu cấp thiết này, tác giả thực hiện đề tài: “Nghiên cứu
ứng dụng phương pháp thống kê sau mơ hình tổ hợp (EMOS) vào dự báo
nhiệt độ và điểm sương bề mặt ở Việt Nam”. Trong khuôn khổ luận án, tác

giả ứng dụng và thử nghiệm một số phương pháp thống kê để hiệu chỉnh các
kết quả dự báo từ SREPS cho yếu tố nhiệt độ tại độ cao 2 mét, nhiệt độ tối
cao ngày, nhiệt độ tối thấp ngày và điểm sương bề mặt tại độ cao 2 mét. Sau
đó, tiến hành đánh giá và lựa chọn phương pháp EMOS hiệu quả và khả thi
nhất trong bài toán nghiệp vụ tại TTDBTƯ.
 Luận điểm bảo vệ của luận án
1. Luận án đã lựa chọn và áp dụng một số phương pháp thống kê
hiệu chỉnh dự báo tổ hợp (EMOS) phù hợp với hệ thống dự báo tổ hợp thời
tiết hạn ngắn (SREPS) tại TTDBTƯ;
2. Luận án đã đánh giá và chỉ ra được hiệu quả của các phương pháp
EMOS nói trên trong việc nâng cao chất lượng dự báo TBTH và xác suất từ
SREPS cho các yếu tố nhiệt độ và điểm sương bề mặt;
3. Luận án đã xác định được phương pháp EMOS tốt nhất và đánh
giá được khả năng ứng dụng nghiệp vụ tại TTDBTƯ.

17


 Đối tượng, phương pháp và phạm vi nghiên cứu của luận án
Nghiên cứu đầy đủ các phương pháp EMOS là một bài toán lớn liên
quan đến nhiều vấn đề và khía cạnh khoa học khác nhau. Việc thực hiện đầy
đủ bài tốn này nằm ngồi khn khổ luận án. Do đó, luận án chỉ tập trung
vào phương pháp thống kê với đối tượng, phạm vi và phương pháp sau đây:
- Đối tượng nghiên cứu: các yếu tố nhiệt độ bề mặt gồm nhiệt độ
khơng khí (T2m), điểm sương bề mặt (Td2m), nhiệt độ tối cao ngày (Tmax)
và nhiệt độ tối thấp ngày (Tmin).
- Phạm vi nghiên cứu: toàn bộ lãnh thổ Việt Nam đại diện bởi 174 vị
trí trạm quan trắc khí tượng bề mặt;
- Phương pháp nghiên cứu: luận án sử dụng các phương pháp nghiên
cứu gồm phương pháp thống kê, phương pháp lập trình mơ phỏng, phương

pháp toán học và phương pháp đánh giá khách quan.
 Những đóng góp mới của luận án
Những đóng góp mới của luận án đồng thời cũng là những luận điểm
bảo vệ đã được nêu trên đây. Đó là lần đầu tiên, luận án đã xây dựng được hệ
phương pháp EMOS cho hệ thống SREPS ở Việt Nam, bao gồm: 1) Áp dụng
thành công một số phương pháp EMOS cho hệ thống SREPS tại TTDBTƯ và
chỉ ra được tính hiệu quả của các phương pháp EMOS này trong việc nâng
cao chất lượng dự báo TBTH và xác suất cho các yếu tố nhiệt độ và điểm
sương bề mặt từ hệ thống SREPS; 2) Xác định được các phương pháp EMOS
tốt nhất và chỉ ra được khả năng ứng dụng nghiệp vụ của các phương pháp
này tại TTDBTƯ.
 Ý nghĩa khoa học và thực tiễn của luận án
- Trên cơ sở các công trình nghiên cứu trong và ngồi nước cho đến
thời điểm hoàn thành luận án những vấn đề EMOS đã được xem xét, đánh giá

18


những ưu, nhược điểm, từ đó lựa chọn được một số phương pháp EMOS phù
hợp với hệ thống SREPS tại TTDBTƯ;
- Kết quả nghiên cứu thử nghiệm của luận án đã chỉ ra tính hiệu quả
của các phương pháp EMOS được chọn trong việc nâng cao chất lượng dự
báo TBTH và xác suất cho yếu tố nhiệt độ và điểm sương bề mặt, góp phần
làm sáng tỏ khả năng ứng dụng của phương pháp;
- Từ những thử nghiệm đối với hệ thống SREPS tại TTDBTƯ và bộ số
liệu quan trắc từ mạng lưới trạm khí tượng Việt Nam, luận án đã xác định
được phương pháp EMOS tốt nhất và đánh giá được khả năng ứng dụng
nghiệp vụ cho hệ thống SREPS tại TTDBTƯ, góp phần nâng cao chất lượng
các bản tin dự báo phục vụ phịng tránh, ứng phó với thiên tai.
 Cấu trúc của luận án

Ngoài các phần lời cam đoan, lời cám ơn, danh sách các từ viết tắt,
bảng biểu, hình vẽ và đồ thị, mục lục, mở đầu, tài liệu tham khảo và phụ lục,
nội dung chính của luận án bao gồm:
Chương 1: Tổng quan về các phương pháp nghiên cứu hiệu chỉnh
thống kê cho dự báo tổ hợp. Chương này trình bày một cách khái quát về
DBTH từ định nghĩa, vai trò và các phương pháp tạo DBTH. Tiếp đó, đưa ra
các nhận định về sự cần thiết phải hiệu chỉnh DBTH và luận giải tại sao lại
lựa chọn cách tiếp cận thống kê. Cuối cùng, các nghiên cứu ứng dụng phương
pháp thống kê cho bài tốn EMOS trong và ngồi nước sẽ được tổng quan.
Chương 2: Mô tả số liệu và phương pháp nghiên cứu. Ở đây sẽ đưa ra
các luận giải để lựa chọn các phương pháp thống kê thích hợp để hiệu chỉnh
DBTH từ hệ thống SREPS. Cơ sở toán học của phương pháp EMOS được lựa
chọn cũng như cách thức áp dụng các phương pháp này cho hệ thống SREPS
cũng sẽ được trình bày chi tiết. Cuối cùng là mơ tả tập số liệu nghiên cứu,

19


phương pháp xử lý số liệu và phương pháp đánh giá chất lượng dự báo của
các phương án EMOS được thử nghiệm.
Chương 3: Kết quả thử nghiệm và đánh giá. Chương này trình bày
tồn bộ các kết quả thử nghiệm và đánh giá chất lượng dự báo TBTH và dự
báo xác suất từ các phương pháp EMOS được nghiên cứu và so sánh với chất
lượng dự báo TBTH và xác suất trực tiếp từ SREPS (ký hiệu là Raw). Do các
phương pháp EMOS được sử dụng để loại bỏ sai số hệ thống trong các dự báo
thành phần của SREPS, nên phần đầu của chương này sẽ tập trung phân tích
khả năng khử sai số hệ thống của các phương pháp EMOS. Kế tiếp, các đánh
giá khả năng cải thiện chất lượng dự báo TBTH và xác suất sẽ được phân tích.
Cuối cùng, sơ đồ qui trình nghiệp vụ của phương pháp EMOS được lựa chọn
và kết quả đánh giá thử nghiệm nghiệp vụ trong các năm 2011-2013 sẽ được

đưa ra và phân tích.
Kết luận và kiến nghị: trình bày tóm tắt các kết quả chủ yếu của luận
án, những điểm mới đã đạt được; nêu những tồn tại và kiến nghị việc sử dụng
kết quả luận án cũng như các vấn đề cần tiếp tục nghiên cứu.

20


CHƯƠNG 1. TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP NGHIÊN CỨU
HIỆU CHỈNH THỐNG KÊ CHO DỰ BÁO TỔ HỢP

1.1. Khái niệm và vai trò của dự báo tổ hợp
Theo Kalnay (2003) [66], DBTH là một tập hợp dự báo xác định tại
cùng một thời điểm (có thể được bắt đầu từ các điều kiện ban đầu khác nhau,
thời điểm bắt đầu dự báo khác nhau, hoặc dựa trên các mơ hình khác nhau) và
hướng đến 3 mục đích:
 Tăng cường chất lượng dự báo thơng qua trung bình tổ hợp (TBTH)
 Cung cấp một chỉ số định lượng về độ tin cậy của dự báo
 Làm cơ sở cho dự báo xác suất
Mục đích đầu tiên được thực hiện để loại bỏ sai khác giữa các thành
phần trong khi vẫn giữ lại những đặc tính tương tự. Mục đích thứ hai liên
quan đến tương quan giữa độ tán và sai số dự báo TBTH, dù mối tương quan
này khơng hồn tồn chặt và chưa được khẳng định vững chắc. Mục đích thứ
ba được xây dựng dựa trên tần suất dự báo xuất hiện hiện tượng từ các thành
phần tổ hợp. Mỗi một dự báo thành phần là một trạng thái có thể của khí
quyển thực. Hay nói cách khác, một DBTH sẽ là một xấp xỉ hữu hạn của hàm
mật độ xác suất của trạng thái khí quyển trong khơng gian pha của nó.
Định nghĩa của Kalnay chủ yếu dựa trên các HTTH tồn cầu cho mục
đích dự báo hạn vừa và hạn dài cho nên tầm quan trọng của dự báo tất định
(dự báo từ TBTH) và dự báo xác suất là như nhau. Tuy nhiên, khi các HTTH

cho mục đích dự báo hạn ngắn xuất hiện, DBTH đã được định nghĩa theo
quan điểm dự báo xác suất. Theo Gneiting và nnk (2003) [51], DBTH là một
tập hợp dự báo xác định tại cùng một thời điểm làm cơ sở cho dự báo xác
suất có độ nhọn (sharpness) cực đại trong khi vẫn duy trì độ tin cậy
(reliability) của dự báo xác suất. Hai khái niệm độ nhọn và độ tin cậy đóng

21


vai trò quan trọng trong các HTTH ngày nay và đã được trình bày chi tiết
trong một số nghiên cứu trong nước [3, 4].
Như đã biết, trong mơ hình NWP tất định, chúng ta mong muốn giá trị
dự báo của mơ hình (Xm) bằng giá trị của trạng thái khí quyển thực (X). Tuy
nhiên, do trạng thái mơ hình chỉ là một xấp xỉ trung bình của khí quyển với
một độ tin cậy nhất định, nên luôn tồn tại một sai số Xe nào đó sao cho X =
Xm + Xe. Trên thực tế, sai số Xe là ngẫu nhiên và khơng thể biết trước được.
Do đó, chúng ta mong muốn có thể ước lượng một tập các nghiệm Xm + X’
trong đó có nghiệm thực X sao cho X Є Xm + X’ hoặc một phân bố sai số X’
bao hàm sai số Xe. Bởi vì các nguồn bất định được tạo ra tại mỗi bước dự báo
là hoàn tồn ngẫu nhiên và khơng thể tránh khỏi. Do đó, X’ không thể là một
giá trị đơn lẻ mà phải có dạng phân bố xác suất kết hợp với độ bất định trong
trạng thái ban đầu và mức độ phi tuyến của hệ thống mơ hình hóa.
Q trình ước lượng độ tin cậy và mơ tả chính xác phân bố sai số phụ
thuộc vào trạng thái hoặc độ bất định trong dự báo để bao hàm được trạng thái
thực chính là nhiệm vụ chính của DBTH. Như vậy, để cải thiện được khả
năng dự báo phân bố sai số X’ cần thiết phải cải tiến các kỹ thuật tạo tổ hợp,
trong khi đó việc cải tiến độ chính xác của trường Xm chủ yếu phụ thuộc vào
độ chính xác của trường ban đầu và mơ hình. Hay nói cách khác, kỹ thuật tạo
DBTH sẽ giải quyết vấn đề sai số ngẫu nhiên trong khi các cải tiến điều kiện
ban đầu và mơ hình sẽ xử lý sai số hệ thống dự báo. Do vậy, điều kiện ban

đầu chính xác và mơ hình hồn hảo là cơ sở quan trọng cho DBTH.
Vấn đề đặt ra là làm cách nào để có thể ước lượng được phân bố sai số
X’ trong DBTH. Về mặt nguyên tắc, tất cả các nguồn bất định cần phải được
mơ tả đầy đủ và tính tốn chính xác trong hệ thống mơ hình hóa để tích phân
theo thời gian và tạo ra một tổ hợp hữu hạn các dự báo. Trên cơ sở đó, tổ hợp
các dự báo này sẽ ước lượng được phân bố xác suất và độ bất định/độ tin cậy

22


của dự báo. Dựa trên các cách tiếp cận này, Du (2007) [34] đã tổng kết và
phân loại HTTH vào trong 3 lớp như sau:
1. Các HTTH một chiều (HTTH-1D): các HTTH này chỉ tập trung vào
độ bất định trong điều kiện ban đầu bằng cách sử dụng phương pháp gây
nhiễu động trường ban đầu để tạo ra các dự báo thành phần. Ba đặc trưng cơ
bản của HTTH-1D cần phải thỏa mãn gồm tính hiện thực, độ phân kỳ và tính
trực giao. Tính hiện thực ngụ ý rằng biên độ của nhiễu động cần nằm trong
phạm vi sai số phân tích và biểu diễn phân bố thực theo khơng gian. Tính
phân kỳ u cầu nhiễu động cần phải có cấu trúc phát triển để các thành phần
dự báo phân kỳ càng nhiều càng tốt theo thời gian để bao hàm tất cả các
nghiệm có thể trong khơng gian mơ hình. Tính trực giao địi hỏi nhiễu động
phải trực giao lẫn nhau để thu được thông tin cực đại trong dự báo tổ hợp.
Cho đến nay, đã có rất nhiều phương pháp gây nhiễu trường ban đầu được
nghiên cứu và triển khai nghiệp vụ tại nhiều trung tâm dự báo lớn trên thế
giới như phương pháp Monte-Carlo [35, 43, 78], phương pháp dự báo trễ [62,
76, 88], phương pháp ươm nhiễu [99, 100], phương pháp véc tơ kỳ dị [44, 73,
84], phương pháp lọc Kalman tổ hợp - ETKF [63, 64, 105, 107].
2. Các HTTH hai chiều (HTTH-2D): khác với các HTTH-1D chỉ tính
đến độ bất định trong điều kiện ban đầu, các HTTH-2D xem xét thêm các
nguồn bất định trong động lực và vật lý của mơ hình NWP. Hiện tại, có một

số cách tiếp cận để xây dựng các HTTH-2D như hệ thống đa mơ hình [36, 37,
82], đa vật lý [65, 93], đa tổ hợp [81, 101] và vật lý rối [25, 63, 92]. Cách tiếp
cận này thường được sử dụng trong các HTTH dự báo thời tiết nghiệp vụ.
3. Các HTTH ba chiều (HTTH-3D): trong các hệ thống này yếu tố quá
khứ (chiều thời gian) được xem xét bên cạnh các độ bất định đến từ điều kiện
ban đầu và điều kiện biên. Ví dụ, cách tiếp cận dự báo trễ là một phương pháp
sử dụng sai số quá khứ (sai số của các dự báo trước dự báo hiện tại) để đo

23


×