Tải bản đầy đủ (.docx) (195 trang)

Nghiên cứu ứng dụng phương pháp thống kê sau mô hình tổ hợp (EMOS) vào dự báo nhiệt độ và điểm sương bề mặt ở việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.54 MB, 195 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----***-----

VÕ VĂN HÒA

NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP THỐNG KÊ
SAU MÔ HÌNH TỔ HỢP (EMOS) VÀO DỰ BÁO
NHIỆT ĐỘ VÀ ĐIỂM SƯƠNG BỀ MẶT Ở VIỆT NAM

LUẬN ÁN TIẾN SĨ NGÀNH KHÍ TƯỢNG VÀ KHÍ HẬU HỌC

Hà Nội - 2015


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----***-----

VÕ VĂN HÒA

NGHIÊN CỨU ỨNG DỤNG PHƯƠNG PHÁP THỐNG KÊ
SAU MÔ HÌNH TỔ HỢP (EMOS) VÀO DỰ BÁO
NHIỆT ĐỘ VÀ ĐIỂM SƯƠNG BỀ MẶT Ở VIỆT NAM
Chuyên ngành: Khí tượng và khí hậu học
Mã số: 62.44.02.22
LUẬN ÁN TIẾN SĨ NGÀNH KHÍ TƯỢNG VÀ KHÍ HẬU HỌC

NGƯỜI HƯỚNG DẪN KHOA HỌC
1.


TS. Bùi Minh Tăng

2.

GS.TS Phan Văn Tân

Hà Nội - 2015


Lời cam đoan
Tôi xin cam đoan đây là công trình nghiên cứu của riêng tôi. Các số
liệu, kết quả trình bày trong luận án là trung thực và chưa từng được ai công bố
trong bất kỳ công trình nào khác.
Tác giả luận án

Võ Văn Hòa

1


Lời cảm ơn
Luận án được hoàn thành tại Trung tâm Dự báo khí tượng thủy văn
Trung ương và tại Khoa Khí tượng Thủy văn và Hải dương học, Trường Đại
học Khoa học Tự Nhiên, Hà Nội. Tác giả xin bày tỏ lòng biết ơn chân thành
tới hai nhà khoa học đã hết lòng động viên, tận tình giúp đỡ và quan tâm tới
từng bước nghiên cứu của luận án.
Để thực hiện luận án, tác giả đã được giúp đỡ về thời gian và điều kiện
nghiên cứu thuận lợi từ Trung tâm Dự báo khí tượng thủy văn Trung ương, nơi
tác giả được hỗ trợ về tài liệu, số liệu nghiên cứu, trang thiết bị tính toán và
lưu trữ số liệu.

Lời tri ân tác giả muốn gửi tới các đồng nghiệp tại Trung tâm Dự báo
khí tượng thủy văn Trung ương đã chia sẻ, giúp đỡ và góp ý về một số nội
dung nghiên cứu của luận án.
Tác giả sẽ không bao giờ quên sự quan tâm, chăm sóc, sẻ chia buồn vui
và giúp đỡ qua bao khó khăn của người bạn đời và hai con nhỏ. Lòng biết ơn
sâu nặng nhất của tác giả xin gửi về cha mẹ, những người đã ban cho tác giả
cuộc sống, dưỡng nuôi suốt thời thơ ấu và định hướng khoa học là con đường
theo đuổi suốt đời của tác giả.
Tác giả

2


Mục lục
Lời cam đoan................................................................................................................................ 1
Lời cảm ơn.................................................................................................................................... 2
Mục lục........................................................................................................................................... 3
Danh sách các ký hiệu và chữ viết tắt................................................................................. 6
Danh mục các bảng.................................................................................................................... 8
Danh mục các hình vẽ, đồ thị.............................................................................................. 12
MỞ ĐẦU..................................................................................................................................... 14
CHƯƠNG 1. TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP NGHIÊN CỨU
HIỆU CHỈNH THỐNG KÊ CHO DỰ BÁO TỔ HỢP.............................................. 21
1.1. Khái niệm và vai trò của dự báo tổ hợp............................................................. 21
1.2. Sự cần thiết phải hiệu chỉnh dự báo tổ hợp....................................................... 24
1.3. Tổng quan các nghiên cứu hiệu chỉnh thống kê cho dự báo tổ hợp.......27
1.3.1. Ngoài nước............................................................................................................ 27
1.3.2. Trong nước............................................................................................................ 34
CHƯƠNG 2. MÔ TẢ SỐ LIỆU VÀ PHƯƠNG PHÁP NGHIÊN CỨU .. 37
2.1. Đặt bài toán................................................................................................................... 37

2.2. Nghiên cứu lựa chọn và ứng dụng các phương pháp thống kê để nâng
cao chất lượng dự báo trung bình tổ hợp và xác suất từ hệ thống SREPS .. 40
2.2.1. Các phương pháp thống kê tác động đến dự báo trung bình tổ hợp
40
2.2.2. Các phương pháp thống kê tác động đến cả dự báo trung bình tổ
hợp và dự báo xác suất................................................................................................. 43
2.2.3. Ứng dụng các phương pháp EMOS cho hệ thống SREPS..................49
2.3. Mô tả tập số liệu nghiên cứu.................................................................................. 53
2.4. Phương pháp xử lý số liệu....................................................................................... 58

3


2.5. Phương pháp đánh giá............................................................................................... 60
2.5.1. Các chỉ số đánh giá chất lượng dự báo trung bình tổ hợp.................61
2.5.2. Các chỉ số đánh giá chất lượng dự báo xác suất.................................... 62
CHƯƠNG 3. KẾT QUẢ THỬ NGHIỆM VÀ ĐÁNH GIÁ.................................... 67
3.1. Đánh giá khả năng khử sai số hệ thống.............................................................. 67
3.2. Đánh giá khả năng cải thiện chất lượng dự báo trung bình tổ hợp..........74
3.2.1. Yếu tố nhiệt độ không khí................................................................................. 74
3.2.2. Yếu tố nhiệt độ điểm sương............................................................................. 78
3.2.3. Yếu tố nhiệt độ tối cao ngày............................................................................ 81
3.2.4. Yếu tố nhiệt độ tối thấp ngày.......................................................................... 83
3.2.5. Nhận định chung................................................................................................. 86
3.3. Đánh giá khả năng cải thiện chất lượng dự báo xác suất............................. 88
3.3.1. Yếu tố nhiệt độ không khí................................................................................. 89
3.3.2. Yếu tố nhiệt độ điểm sương............................................................................. 94
3.3.3. Yếu tố nhiệt độ tối cao ngày............................................................................ 98
3.3.4. Yếu tố nhiệt độ tối thấp ngày....................................................................... 102
3.3.5. Nhận định chung.............................................................................................. 106

3.4. Xây dựng qui trình dự báo nghiệp vụ và đánh giá kết quả thử nghiệm
nghiệp vụ từ năm 2011-2013........................................................................................ 109
3.4.1. Xây dựng qui trình dự báo nghiệp vụ cho hệ thống EMOS dựa trên
phương pháp NGR_EM.............................................................................................. 109
3.4.2. Kết quả đánh giá thử nghiệm nghiệp vụ từ năm 2011 đến 2013 . 112
KẾT LUẬN.............................................................................................................................. 122
KIẾN NGHỊ VỀ CÁC HƯỚNG NGHIÊN CỨU TIẾP THEO...........................124
DANH MỤC CÁC CÔNG TRÌNH NGHIÊN CỨU CỦA TÁC GIẢ CÓ
LIÊN QUAN ĐẾN LUẬN ÁN........................................................................................ 125
TÀI LIỆU THAM KHẢO.................................................................................................. 127

4


PHỤ LỤC 1. Danh sách 174 trạm được sử dụng trong nghiên cứu...................139
PHỤ LỤC 2. Kết quả đánh giá cho T2m hạn dự báo 48h và 72h.......................142
PHỤ LỤC 3. Kết quả đánh giá cho Td2m hạn dự báo 48h và 72h....................148
PHỤ LỤC 4. Kết quả đánh giá cho Tmax hạn dự báo 48h và 72h.....................154
PHỤ LỤC 5. Kết quả đánh giá cho Tmin hạn dự báo 48h và 72h..................... 160
PHỤ LỤC 6. Kết quả đánh giá thử nghiệm nghiệp vụ từ 2011-2013............166

5


Danh sách các ký hiệu và chữ viết tắt
ai

Hệ số hồi qui thứ i hoặc trọng số thứ i

ANN


Mạng thần kinh nhân tạo

BCES

Hiệu chỉnh sai số bằng phương pháp trọng số hàm mũ

BCLR

Hiệu chỉnh sai số bằng phương pháp hồi quy tuyến tính

BCMA

Hiệu chỉnh sai số bằng phương pháp trung bình trượt

BMA

Phương pháp trung bình Bayes

BIAS

Sai số hệ thống

BS

Chỉ số đánh giá xác suất

BSS

Chỉ số đánh giá kỹ năng dự báo xác suất


CMC

Cơ quan khí tượng Canađa

CRPS

Chỉ số xác suất hạng liên tục

DBTH

Dự báo tổ hợp

DWD

Tổng cục thời tiết Cộng hoà Liên bang Đức

ECMWF

Trung tâm dự báo thời tiết hạn vừa Châu Âu

EMES

Trung bình tổ hợp có trọng số tính theo hàm mũ

EMMV

Trung bình tổ hợp có trọng số tính theo phương sai sai số

EMOS


Hiệu chỉnh thống kê cho dự báo tổ hợp

F

Yếu tố dự báo

Fi

Thành phần dự báo tổ hợp thứ i

GEM

Mô hình toàn cầu của CMC

GME

Mô hình toàn cầu của DWD

GFS

Mô hình toàn cầu của NCEP

GSM

Mô hình toàn cầu của JMA

HTTH

Hệ thống dự báo tổ hợp


JMA

Cơ quan khí tượng Nhật Bản

6


KF

Phương pháp lọc Kalman

KTTV

Khí Tượng Thủy Văn

LR

Hồi quy Logistic

ME

Sai số trung bình

MOS

Thống kê sau mô hình

N


Dung lượng mẫu hoặc tổng số dự báo thành phần

NCEP

Trung tâm dự báo môi trường quốc gia của Mỹ

NOGAPS

Mô hình toàn cầu của Hải quân Mỹ (US Navy)

nnk

Những người khác

NGR_EM

Hồi quy Gauss không thuần nhất trong đó kỳ vọng quan hệ
tuyến tính với trung bình tổ hợp

NGR_ER

Hồi quy Gauss không thuần nhất trong đó kỳ vọng là trung
bình có trọng số của các dự báo thành phần

NGR_EP

Tương tự NGR_ER nhưng có loại bỏ trọng số âm

NWP


Dự báo thời tiết số trị

O

Giá trị quan trắc

Raw

Dự báo trung bình tổ hợp hoặc xác suất trực tiếp từ hệ
thống dự báo tổ hợp thời tiết hạn ngắn (SREPS)

RMSE

Sai số quân phương

SREPS

Hệ thống dự báo tổ hợp thời tiết hạn ngắn.

TBTH

Trung bình tổ hợp

TTDBTƯ

Trung Tâm Dự Báo khí tượng thủy văn Trung Ương

Td2m

Nhiệt độ điểm sương tại độ cao 2 mét


Tmax

Nhiệt độ tối cao ngày

Tmin

Nhiệt độ tối thấp ngày

T2m

Nhiệt độ không khí tại độ cao 2 mét

7


Danh mục các bảng
Bảng 2.1: Các kỹ thuật thống kê được thử nghiệm để nâng cao chất lượng dự
báo TBTH và xác suất của hệ thống SREPS (dấu tích ngụ ý có tác động)......50
Bảng 2.2: Cấu hình chi tiết của 4 mô hình NWP khu vực được lựa chọn để
xây dựng hệ thống SREPS cho khu vực Việt Nam..................................................... 55
Bảng 2.3: Danh sách các nguồn số liệu được thu thập phục vụ nghiên cứu .. 57
Bảng 3.1: Kết quả tính toán chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h (các giá
trị bôi đậm ngụ ý không đem lại sự cải thiện trong sai số)...................................... 75
Bảng 3.2: Kết quả tính toán chỉ số đánh giá MAE (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h................76
Bảng 3.3: Kết quả tính toán chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h...........77
Bảng 3.4: Kết quả tính toán chỉ số đánh giá ME (độ C) của dự báo TBTH từ

Raw và 10 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h..............79
Bảng 3.5: Kết quả tính toán chỉ số đánh giá MAE (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h..............79
Bảng 3.6: Kết quả tính toán chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h.......80
Bảng 3.7: Kết quả tính toán chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h..............81
Bảng 3.8: Kết quả tính toán chỉ số đánh giá MAE (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h..............82
Bảng 3.9: Kết quả tính toán chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h.......83

8


Bảng 3.10: Kết quả tính toán chỉ số đánh giá ME (độ C) của dự báo TBTH từ
Raw và 10 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h...............84
Bảng 3.11: Kết quả tính toán chỉ số đánh giá MAE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h..........85
Bảng 3.12: Kết quả tính toán chỉ số đánh giá RMSE (độ C) của dự báo TBTH
từ Raw và 10 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h..........85
Bảng 3.13: Kết quả tính toán chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h (các giá trị
bôi đậm ngụ ý không đem lại sự cải thiện trong chất lượng dự báo)...................89
Bảng 3.14: Kết quả tính toán chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h...................92
Bảng 3.15: Kết quả tính toán chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố T2m với hạn dự báo 24h...................93
Bảng 3.16: Kết quả tính toán chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h................94

Bảng 3.17: Kết quả tính toán chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h................97
Bảng 3.18: Kết quả tính toán chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Td2m với hạn dự báo 24h................98
Bảng 3.19: Kết quả tính toán chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h.................99
Bảng 3.20: Kết quả tính toán chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h..............101
Bảng 3.21: Kết quả tính toán chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmax với hạn dự báo 24h..............102
Bảng 3.22: Kết quả tính toán chỉ số đánh giá CRPS của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h...............103

9


Bảng 3.23: Kết quả tính toán chỉ số độ phủ 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h...............105
Bảng 3.24: Kết quả tính toán chỉ số độ rộng 90.48% của dự báo xác suất từ
Raw và 7 phương pháp EMOS cho yếu tố Tmin với hạn dự báo 24h...............105
Bảng 3.25: Chỉ số ME (0C) cho dự báo TBTH của T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................113
Bảng 3.26: Chỉ số MAE (0C) cho dự báo TBTH của T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................113
Bảng 3.27: Chỉ số RMSE (0C) cho dự báo TBTH của T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................114
Bảng 3.28: Chỉ số ME (0C) cho dự báo TBTH của Td2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................115
Bảng 3.29: Chỉ số MAE (0C) cho dự báo TBTH của Td2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................115

Bảng 3.30: Chỉ số RMSE (0C) cho dự báo TBTH của Td2m hạn dự báo 24h
từ NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013..........115
Bảng 3.31: Chỉ số ME (0C) cho dự báo TBTH của Tmax hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................116
Bảng 3.32: Chỉ số MAE (0C) cho dự báo TBTH của Tmax hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................117
Bảng 3.33: Chỉ số RMSE (0C) cho dự báo TBTH của Tmax hạn dự báo 24h
từ NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013..........117
Bảng 3.34: Chỉ số ME (0C) cho dự báo TBTH của Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................118
Bảng 3.35: Chỉ số MAE (0C) cho dự báo TBTH của Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................118

10


Bảng 3.36: Chỉ số RMSE (0C) cho dự báo TBTH của Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................119
Bảng 3.37: Chỉ số CRPS cho dự báo xác suất T2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................120
Bảng 3.38: Chỉ số CRPS cho dự báo xác suất Td2m hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................120
Bảng 3.39: Chỉ số CRPS cho dự báo xác suất Tmax hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................120
Bảng 3.40: Chỉ số CRPS cho dự báo xác suất Tmin hạn dự báo 24h từ
NGR_EM và Raw trong các năm thử nghiệm nghiệp vụ 2011-2013................121

11



Danh mục các hình vẽ, đồ thị
Hình 2.1: Giả thiết minh họa một hệ thống dự báo tổ hợp không tối ưu (bên
trái) và hiệu quả của bài toán EMOS có thể đem lại (bên phải)............................. 38
Hình 2.2: Sự biến thiên của chỉ số RMSE trung bình trên toàn khu vực Tây
Bắc trong tháng 11 năm 2010 theo các độ dài chuỗi số liệu phụ thuộc khác
nhau cho từng phương pháp EMOS.................................................................................. 52
Hình 2.3: Sơ đồ dự báo trượt theo thời gian của các phương pháp EMOS
được thử nghiệm....................................................................................................................... 53
Hình 2.4: Miền dự báo của hệ thống SREPS................................................................. 54
Hình 2.5: Các bảng quan hệ của CSDL quan trắc các yếu tố nhiệt độ bề mặt
59
Hình 2.6: Sơ đồ minh họa phương pháp nội suy song tuyến tính [115] (P là
điểm trạm cần nội suy, các điểm nút lưới được ký hiệu là Q)................................. 60
Hình 2.7: Giản đồ tụ điểm cho dự báo T2m hạn 24h cho tại khu vực Tây Bắc
từ dự báo thành phần HRM_GFS của SREPS (trái) và BCMA (phải)................62
Hình 2.8: Ví dụ về các dạng biểu đồ dạng lý thuyết được tạo ra dựa trên hệ
thống dự báo tổ hợp bao gồm 10 dự báo thành phần.................................................. 64
Hình 2.9: Ví dụ về sự thay đổi của độ nhọn hàm phân bố theo theo sự thay
đổi của biên độ độ phủ 90.48%........................................................................................... 65
Hình 3.1: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo T2m hạn 24h trên khu vực Tây Bắc............68
Hình 3.2: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo Td2m hạn 24h trên khu vực Tây Bắc..........70
Hình 3.3: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng
7 phương pháp EMOS cho dự báo Tmax hạn 24h trên khu vực Tây Bắc..........71

12


Hình 3.4: Giản đồ tụ điểm của dự báo thành phần HRM_GFS của Raw cùng

7 phương pháp EMOS cho dự báo Tmin hạn 24h trên khu vực Tây Bắc...........72
Hình 3.5: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
T2m hạn 24h trên khu vực Tây Bắc.................................................................................. 91
Hình 3.6: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
Td2m hạn 24h trên khu vực Tây Bắc............................................................................... 95
Hình 3.7: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
Tmax hạn 24h trên khu vực Tây Bắc............................................................................. 100
Hình 3.8: Biểu đồ hạng của Raw cùng 7 phương pháp EMOS đối với dự báo
Tmin hạn 24h trên khu vực Tây Bắc.............................................................................. 104
Hình 3.9: Sơ đồ thời gian cần thiết để thu thập số liệu, chạy hệ thống SREPS
và các phương pháp EMOS trong điều kiện nghiệp vụ tại TTDBTƯ...............109
Hình 3.10: Sơ đồ qui trình nghiệp vụ vận hành hệ thống EMOS dựa trên
phương pháp NGR_EM cho hệ thống SREPS tại TTDBTƯ................................ 111

13


MỞ ĐẦU
Đặt vấn đề
Các nghiên cứu của Lorenz [74, 75] đã nêu lên tầm quan trọng của điều
kiện ban đầu đối với các mô hình dự báo thời tiết số trị (NWP) trong đó thừa
nhận tồn tại các nguồn bất định (uncertainties) trong dự báo. Những nguồn bất
định này đã hạn chế khả năng dự báo của các mô hình NWP. Phương pháp dự
báo tổ hợp (DBTH) đã được nghiên cứu để giải quyết vấn đề nói trên và sử
dụng trong dự báo nghiệp vụ tại nhiều nơi trên thế giới từ những năm 1992 của
thế kỷ trước. Cho đến nay, DBTH đã được phát triển và ứng dụng cho nhiều
mục đích khác nhau và được đánh giá là lĩnh vực có tốc độ thay đổi nhanh nhất
trong nghiên cứu và ứng dụng của khoa học khí quyển.
Trên thực tế, mô hình NWP sử dụng trong các hệ thống dự báo tổ hợp
(HTTH) luôn tồn tại các sai số hệ thống (bias) liên quan đến sự không hoàn

hảo trong động lực, vật lý, phương pháp số, mô tả địa hình, … Những sai số
này ảnh hưởng lớn tới chất lượng dự báo của các HTTH như dự báo trung bình
tổ hợp (TBTH) không tốt hơn dự báo đối chứng và các dự báo thành phần, dự
báo xác suất không tin cậy, … Thậm chí, với một phương pháp nhiễu động
hoàn hảo, thì hàm phân bố xác suất dựa trên một HTTH có thể không phù hợp
nếu mô hình có sai số nhỏ nội tại [33]. Do vậy, phương pháp hậu xử lý là cần
thiết để nâng cao chất lượng dự báo trung bình tổ hợp và xác suất của HTTH.
Tại Việt Nam, các HTTH hạn ngắn và hạn vừa đã được nghiên cứu và
triển khai vào nghiệp vụ từ năm 2010 cho đến nay. Các kết quả đánh giá đã cho
thấy chất lượng dự báo nhiệt độ và độ ẩm bề mặt từ các HTTH nghiệp vụ này
luôn tồn tại các sai số hệ thống. Dẫn đến chất lượng dự báo TBTH và xác suất
không đáp ứng được yêu cầu của bài toán nghiệp vụ dự báo. Chính vì vậy, việc
nghiên cứu ứng dụng các phương pháp thống kê để hiệu chỉnh các

14


dự báo trực tiếp cho yếu tố nhiệt độ và độ ẩm từ các HTTH nghiệp vụ là hết
sức cần thiết và cấp bách.
Tính cấp thiết của đề tài
Tại Việt Nam, các hệ thống NWP đã được nghiên cứu và ứng dụng
nghiệp vụ từ hơn 10 năm trở lại đây trong đó bao gồm các HTTH từ quy mô
hạn ngắn cho đến hạn mùa. Năm 2010, TTDBTƯ đã triển khai nghiệp vụ hệ
thống dự báo tổ hợp thời tiết hạn ngắn (1-3 ngày) - SREPS dựa trên cách tiếp
cận đa mô hình đa phân tích và bao gồm 20 dự báo thành phần. Các sản phẩm
dự báo TBTH và dự báo xác suất từ SREPS đã và đang góp phần quan trọng
trong công tác dự báo thời tiết hạn ngắn, đặc biệt là dự báo các hiện tượng thời
tiết nguy hiểm tại TTDBTƯ. Theo kết quả đánh giá của TTDBTƯ [4, 6, 7],
chất lượng dự báo TBTH và xác suất của hệ thống SREPS vẫn còn nhiều hạn
chế cho một số biến bề mặt và trên cao. Những hạn chế này dẫn đến hiệu quả

phục vụ công tác dự báo thời tiết của hệ thống SREPS chưa cao. Câu hỏi đặt
ra là “Làm thế nào để nâng cao được chất lượng dự báo TBTH và xác suất
của hệ thống SREPS ?”.
Nguyên nhân dẫn đến những hạn chế của hệ thống SREPS có thể bắt
nguồn từ sự chưa hoàn hảo của các mô hình NWP được sử dụng, sai số địa
hình và thảm phủ, sai số trường ban đầu và điều kiện biên, … [4]. Để cải tiến
tổng thể chất lượng dự báo của SREPS, rất nhiều bài toán khác nhau cần phải
thực hiện riêng rẽ hoặc đồng thời. Chẳng hạn, để khắc phục nguyên nhân do
mô hình NWP, rõ ràng cần phải đầu tư nghiên cứu cải tiến mô hình từ động
lực, vật lý cho đến phương pháp số. Để cải tiến trường ban đầu, cần phải
nghiên cứu ứng dụng bài toán đồng hóa số liệu, … Đây là những bài toán lớn
đòi hỏi phải nghiên cứu lâu dài và tốn nhiều công sức. Vậy “Làm cách nào để
lựa chọn được giải pháp hiệu quả nhất để nâng cao được chất lượng dự báo
TBTH và xác suất cho hệ thống SREPS ?”.

15


Theo Du [33], trên thế giới hiện tại phổ biến 2 cách tiếp cận để giải
quyết những tồn tại nói trên cho các HTTH, đó là động lực và thống kê. Cách
tiếp cận động lực liên quan đến bài toán cải tiến mô hình NWP sử dụng trong
HTTH hoặc cải tiến cách thức tạo ra các dự báo thành phần của HTTH. Cách
tiếp cận thống kê tương tự như bài toán thống kê sau mô hình (MOS) cho mô
hình NWP tất định trong đó các kỹ thuật thống kê được sử dụng để hiệu chỉnh
các dự báo thành phần của HTTH hoặc tổng hợp thông tin DBTH một cách
hiệu quả nhất để nâng cao được chất lượng dự báo TBTH và xác suất của
HTTH. Câu hỏi đặt ra là “Trong hai cách tiếp cận nói trên, cách tiếp cận nào
phù hợp cho hệ thống SREPS ?”.
Như đã biết, hệ thống SREPS hiện đang ứng dụng ở Việt Nam dựa trên
cách tiếp cận đa mô hình đa phân tích trong đó sử dụng 4 mô hình NWP khu

vực chạy riêng rẽ với các đầu vào từ 5 mô hình NWP toàn cầu. Theo cách tiếp
cận động lực, việc cải tiến mô hình cần phải thực hiện cho cả 4 mô hình NWP
của hệ thống SREPS trong khi cải tiến trường ban đầu sẽ liên quan tới 5 mô
hình NWP toàn cầu. Cách tiếp cận này đòi hỏi một khối lượng công việc khổng
lồ và thực hiện trong thời gian dài. Việc cải tiến cách thức tạo ra các dự báo
thành phần hoặc số lượng dự báo thành phần cũng gặp phải khó khăn tương tự.
Trong khi đó, cách tiếp cận thống kê chỉ tác động đến kết quả đầu ra của hệ
thống SREPS mà không ảnh hưởng tới các mô hình NWP được sử dụng cũng
như cách thức tạo ra các dự báo thành phần. Đây là cách tiếp cận đơn giản, khả
thi và có thể đem lại hiệu quả cao khi sai số hệ thống chiếm ưu thế trong sai số
tổng cộng.
Các kết quả đánh giá chất lượng dự báo tất định và xác suất một số yếu
tố bề mặt của hệ thống SREPS [4, 6, 7] đã chỉ ra sai số hệ thống nội tại trong
các dự báo thành phần của SREPS đã hạn chế chất lượng báo tất định và xác
suất đối với nhiệt độ, độ ẩm, gió, áp và mưa - các yếu tố thời tiết. Hay nói

16


cách khác, chất lượng dự báo thời tiết từ hệ thống SREPS chưa đáp ứng được
yêu cầu của bài toán nghiệp vụ, đặt biệt là dự báo điểm. Trong đó, các yếu tố
nhiệt độ và độ ẩm cho thấy khuynh hướng sai số hệ thống rõ nét nhất. Do các
phương pháp EMOS được lựa chọn (sẽ trình bày dưới đây) chỉ có thể áp dụng
cho biến liên lục và có tính đồng nhất cao, nên 2 yếu tố nhiệt độ và điểm sương
bề mặt là phù hợp nhất. Việc nghiên cứu áp dụng các phương pháp EMOS cho
yếu tố lượng mưa, gió, … sẽ là hướng nghiên cứu tiếp theo của luận án. Cụ
thể, các yếu tố nhiệt độ không khí, nhiệt độ tối cao và tối thấp ngày và điểm
sương bề mặt (phản ánh độ ẩm) bề mặt (tại độ cao 2 mét) sẽ là các đối tượng
nghiên cứu của luận án này.
Đứng trước yêu cầu cấp thiết này, tác giả thực hiện đề tài: “Nghiên cứu

ứng dụng phương pháp thống kê sau mô hình tổ hợp (EMOS) vào dự báo nhiệt
độ và điểm sương bề mặt ở Việt Nam”. Trong khuôn khổ luận án, tác giả ứng
dụng và thử nghiệm một số phương pháp thống kê để hiệu chỉnh các kết quả
dự báo từ SREPS cho yếu tố nhiệt độ tại độ cao 2 mét, nhiệt độ tối cao ngày,
nhiệt độ tối thấp ngày và điểm sương bề mặt tại độ cao 2 mét. Sau đó, tiến
hành đánh giá và lựa chọn phương pháp EMOS hiệu quả và khả thi nhất trong
bài toán nghiệp vụ tại TTDBTƯ.
Luận điểm bảo vệ của luận án
1.

Luận án đã lựa chọn và áp dụng một số phương pháp thống kê hiệu

chỉnh dự báo tổ hợp (EMOS) phù hợp với hệ thống dự báo tổ hợp thời tiết hạn
ngắn (SREPS) tại TTDBTƯ;
2.

Luận án đã đánh giá và chỉ ra được hiệu quả của các phương pháp

EMOS nói trên trong việc nâng cao chất lượng dự báo TBTH và xác suất từ
SREPS cho các yếu tố nhiệt độ và điểm sương bề mặt;
3.

Luận án đã xác định được phương pháp EMOS tốt nhất và đánh

giá được khả năng ứng dụng nghiệp vụ tại TTDBTƯ.

17


Đối tượng, phương pháp và phạm vi nghiên cứu của luận án

Nghiên cứu đầy đủ các phương pháp EMOS là một bài toán lớn liên
quan đến nhiều vấn đề và khía cạnh khoa học khác nhau. Việc thực hiện đầy đủ
bài toán này nằm ngoài khuôn khổ luận án. Do đó, luận án chỉ tập trung vào
phương pháp thống kê với đối tượng, phạm vi và phương pháp sau đây:
-

Đối tượng nghiên cứu: các yếu tố nhiệt độ bề mặt gồm nhiệt độ không

khí (T2m), điểm sương bề mặt (Td2m), nhiệt độ tối cao ngày (Tmax) và nhiệt
độ tối thấp ngày (Tmin).
-

Phạm vi nghiên cứu: toàn bộ lãnh thổ Việt Nam đại diện bởi 174 vị trí

trạm quan trắc khí tượng bề mặt;
-

Phương pháp nghiên cứu: luận án sử dụng các phương pháp nghiên

cứu gồm phương pháp thống kê, phương pháp lập trình mô phỏng, phương
pháp toán học và phương pháp đánh giá khách quan.
Những đóng góp mới của luận án
Những đóng góp mới của luận án đồng thời cũng là những luận điểm
bảo vệ đã được nêu trên đây. Đó là lần đầu tiên, luận án đã xây dựng được hệ
phương pháp EMOS cho hệ thống SREPS ở Việt Nam, bao gồm: 1) Áp dụng
thành công một số phương pháp EMOS cho hệ thống SREPS tại TTDBTƯ và
chỉ ra được tính hiệu quả của các phương pháp EMOS này trong việc nâng cao
chất lượng dự báo TBTH và xác suất cho các yếu tố nhiệt độ và điểm sương bề
mặt từ hệ thống SREPS; 2) Xác định được các phương pháp EMOS tốt nhất và
chỉ ra được khả năng ứng dụng nghiệp vụ của các phương pháp này tại

TTDBTƯ.
Ý nghĩa khoa học và thực tiễn của luận án
-

Trên cơ sở các công trình nghiên cứu trong và ngoài nước cho đến

thời điểm hoàn thành luận án những vấn đề EMOS đã được xem xét, đánh giá

18


những ưu, nhược điểm, từ đó lựa chọn được một số phương pháp EMOS phù
hợp với hệ thống SREPS tại TTDBTƯ;
-

Kết quả nghiên cứu thử nghiệm của luận án đã chỉ ra tính hiệu quả của

các phương pháp EMOS được chọn trong việc nâng cao chất lượng dự báo
TBTH và xác suất cho yếu tố nhiệt độ và điểm sương bề mặt, góp phần làm
sáng tỏ khả năng ứng dụng của phương pháp;
-

Từ những thử nghiệm đối với hệ thống SREPS tại TTDBTƯ và bộ số

liệu quan trắc từ mạng lưới trạm khí tượng Việt Nam, luận án đã xác định được
phương pháp EMOS tốt nhất và đánh giá được khả năng ứng dụng nghiệp vụ
cho hệ thống SREPS tại TTDBTƯ, góp phần nâng cao chất lượng các bản tin
dự báo phục vụ phòng tránh, ứng phó với thiên tai.
Cấu trúc của luận án
Ngoài các phần lời cam đoan, lời cám ơn, danh sách các từ viết tắt, bảng

biểu, hình vẽ và đồ thị, mục lục, mở đầu, tài liệu tham khảo và phụ lục, nội
dung chính của luận án bao gồm:
Chương 1: Tổng quan về các phương pháp nghiên cứu hiệu chỉnh thống
kê cho dự báo tổ hợp. Chương này trình bày một cách khái quát về DBTH từ
định nghĩa, vai trò và các phương pháp tạo DBTH. Tiếp đó, đưa ra các nhận
định về sự cần thiết phải hiệu chỉnh DBTH và luận giải tại sao lại lựa chọn
cách tiếp cận thống kê. Cuối cùng, các nghiên cứu ứng dụng phương pháp
thống kê cho bài toán EMOS trong và ngoài nước sẽ được tổng quan.
Chương 2: Mô tả số liệu và phương pháp nghiên cứu. Ở đây sẽ đưa ra
các luận giải để lựa chọn các phương pháp thống kê thích hợp để hiệu chỉnh
DBTH từ hệ thống SREPS. Cơ sở toán học của phương pháp EMOS được lựa
chọn cũng như cách thức áp dụng các phương pháp này cho hệ thống SREPS
cũng sẽ được trình bày chi tiết. Cuối cùng là mô tả tập số liệu nghiên cứu,

19


phương pháp xử lý số liệu và phương pháp đánh giá chất lượng dự báo của các
phương án EMOS được thử nghiệm.
Chương 3: Kết quả thử nghiệm và đánh giá. Chương này trình bày toàn
bộ các kết quả thử nghiệm và đánh giá chất lượng dự báo TBTH và dự báo xác
suất từ các phương pháp EMOS được nghiên cứu và so sánh với chất lượng dự
báo TBTH và xác suất trực tiếp từ SREPS (ký hiệu là Raw). Do các phương
pháp EMOS được sử dụng để loại bỏ sai số hệ thống trong các dự báo thành
phần của SREPS, nên phần đầu của chương này sẽ tập trung phân tích khả
năng khử sai số hệ thống của các phương pháp EMOS. Kế tiếp, các đánh giá
khả năng cải thiện chất lượng dự báo TBTH và xác suất sẽ được phân tích.
Cuối cùng, sơ đồ qui trình nghiệp vụ của phương pháp EMOS được lựa chọn
và kết quả đánh giá thử nghiệm nghiệp vụ trong các năm 2011-2013 sẽ được
đưa ra và phân tích.

Kết luận và kiến nghị: trình bày tóm tắt các kết quả chủ yếu của luận án,
những điểm mới đã đạt được; nêu những tồn tại và kiến nghị việc sử dụng kết
quả luận án cũng như các vấn đề cần tiếp tục nghiên cứu.

20


CHƯƠNG 1. TỔNG QUAN VỀ CÁC PHƯƠNG PHÁP NGHIÊN CỨU
HIỆU CHỈNH THỐNG KÊ CHO DỰ BÁO TỔ HỢP
1.1. Khái niệm và vai trò của dự báo tổ hợp
Theo Kalnay (2003) [66], DBTH là một tập hợp dự báo xác định tại
cùng một thời điểm (có thể được bắt đầu từ các điều kiện ban đầu khác nhau,
thời điểm bắt đầu dự báo khác nhau, hoặc dựa trên các mô hình khác nhau) và
hướng đến 3 mục đích:
Tăng cường chất lượng dự báo thông qua trung bình tổ hợp (TBTH)
Cung cấp một chỉ số định lượng về độ tin cậy của dự báo
Làm cơ sở cho dự báo xác suất
Mục đích đầu tiên được thực hiện để loại bỏ sai khác giữa các thành
phần trong khi vẫn giữ lại những đặc tính tương tự. Mục đích thứ hai liên quan
đến tương quan giữa độ tán và sai số dự báo TBTH, dù mối tương quan này
không hoàn toàn chặt và chưa được khẳng định vững chắc. Mục đích thứ ba
được xây dựng dựa trên tần suất dự báo xuất hiện hiện tượng từ các thành phần
tổ hợp. Mỗi một dự báo thành phần là một trạng thái có thể của khí quyển thực.
Hay nói cách khác, một DBTH sẽ là một xấp xỉ hữu hạn của hàm mật độ xác
suất của trạng thái khí quyển trong không gian pha của nó.
Định nghĩa của Kalnay chủ yếu dựa trên các HTTH toàn cầu cho mục
đích dự báo hạn vừa và hạn dài cho nên tầm quan trọng của dự báo tất định (dự
báo từ TBTH) và dự báo xác suất là như nhau. Tuy nhiên, khi các HTTH cho
mục đích dự báo hạn ngắn xuất hiện, DBTH đã được định nghĩa theo quan
điểm dự báo xác suất. Theo Gneiting và nnk (2003) [51], DBTH là một tập hợp

dự báo xác định tại cùng một thời điểm làm cơ sở cho dự báo xác suất có độ
nhọn (sharpness) cực đại trong khi vẫn duy trì độ tin cậy (reliability) của dự
báo xác suất. Hai khái niệm độ nhọn và độ tin cậy đóng

21


vai trò quan trọng trong các HTTH ngày nay và đã được trình bày chi tiết trong
một số nghiên cứu trong nước [3, 4].
Như đã biết, trong mô hình NWP tất định, chúng ta mong muốn giá trị
dự báo của mô hình (Xm) bằng giá trị của trạng thái khí quyển thực (X). Tuy
nhiên, do trạng thái mô hình chỉ là một xấp xỉ trung bình của khí quyển với
một độ tin cậy nhất định, nên luôn tồn tại một sai số X e nào đó sao cho X = Xm
+ Xe. Trên thực tế, sai số Xe là ngẫu nhiên và không thể biết trước được. Do
đó, chúng ta mong muốn có thể ước lượng một tập các nghiệm X m + X’ trong
đó có nghiệm thực X sao cho X Є X m + X’ hoặc một phân bố sai số X’ bao
hàm sai số Xe. Bởi vì các nguồn bất định được tạo ra tại mỗi bước dự báo là
hoàn toàn ngẫu nhiên và không thể tránh khỏi. Do đó, X’ không thể là một giá
trị đơn lẻ mà phải có dạng phân bố xác suất kết hợp với độ bất định trong trạng
thái ban đầu và mức độ phi tuyến của hệ thống mô hình hóa.
Quá trình ước lượng độ tin cậy và mô tả chính xác phân bố sai số phụ
thuộc vào trạng thái hoặc độ bất định trong dự báo để bao hàm được trạng thái
thực chính là nhiệm vụ chính của DBTH. Như vậy, để cải thiện được khả năng
dự báo phân bố sai số X’ cần thiết phải cải tiến các kỹ thuật tạo tổ hợp, trong
khi đó việc cải tiến độ chính xác của trường Xm chủ yếu phụ thuộc vào độ
chính xác của trường ban đầu và mô hình. Hay nói cách khác, kỹ thuật tạo
DBTH sẽ giải quyết vấn đề sai số ngẫu nhiên trong khi các cải tiến điều kiện
ban đầu và mô hình sẽ xử lý sai số hệ thống dự báo. Do vậy, điều kiện ban đầu
chính xác và mô hình hoàn hảo là cơ sở quan trọng cho DBTH.
Vấn đề đặt ra là làm cách nào để có thể ước lượng được phân bố sai số

X’ trong DBTH. Về mặt nguyên tắc, tất cả các nguồn bất định cần phải được
mô tả đầy đủ và tính toán chính xác trong hệ thống mô hình hóa để tích phân
theo thời gian và tạo ra một tổ hợp hữu hạn các dự báo. Trên cơ sở đó, tổ hợp
các dự báo này sẽ ước lượng được phân bố xác suất và độ bất định/độ tin cậy

22


của dự báo. Dựa trên các cách tiếp cận này, Du (2007) [34] đã tổng kết và phân
loại HTTH vào trong 3 lớp như sau:
1.

Các HTTH một chiều (HTTH-1D): các HTTH này chỉ tập trung vào

độ bất định trong điều kiện ban đầu bằng cách sử dụng phương pháp gây nhiễu
động trường ban đầu để tạo ra các dự báo thành phần. Ba đặc trưng cơ bản của
HTTH-1D cần phải thỏa mãn gồm tính hiện thực, độ phân kỳ và tính trực giao.
Tính hiện thực ngụ ý rằng biên độ của nhiễu động cần nằm trong phạm vi sai
số phân tích và biểu diễn phân bố thực theo không gian. Tính phân kỳ yêu cầu
nhiễu động cần phải có cấu trúc phát triển để các thành phần dự báo phân kỳ
càng nhiều càng tốt theo thời gian để bao hàm tất cả các nghiệm có thể trong
không gian mô hình. Tính trực giao đòi hỏi nhiễu động phải trực giao lẫn nhau
để thu được thông tin cực đại trong dự báo tổ hợp. Cho đến nay, đã có rất nhiều
phương pháp gây nhiễu trường ban đầu được nghiên cứu và triển khai nghiệp
vụ tại nhiều trung tâm dự báo lớn trên thế giới như phương pháp Monte-Carlo
[35, 43, 78], phương pháp dự báo trễ [62, 76, 88], phương pháp ươm nhiễu [99,
100], phương pháp véc tơ kỳ dị [44, 73, 84], phương pháp lọc Kalman tổ hợp ETKF [63, 64, 105, 107].
2.

Các HTTH hai chiều (HTTH-2D): khác với các HTTH-1D chỉ tính


đến độ bất định trong điều kiện ban đầu, các HTTH-2D xem xét thêm các
nguồn bất định trong động lực và vật lý của mô hình NWP. Hiện tại, có một số
cách tiếp cận để xây dựng các HTTH-2D như hệ thống đa mô hình [36, 37,
82], đa vật lý [65, 93], đa tổ hợp [81, 101] và vật lý rối [25, 63, 92]. Cách tiếp
cận này thường được sử dụng trong các HTTH dự báo thời tiết nghiệp vụ.
3.

Các HTTH ba chiều (HTTH-3D): trong các hệ thống này yếu tố quá

khứ (chiều thời gian) được xem xét bên cạnh các độ bất định đến từ điều kiện
ban đầu và điều kiện biên. Ví dụ, cách tiếp cận dự báo trễ là một phương pháp
sử dụng sai số quá khứ (sai số của các dự báo trước dự báo hiện tại) để đo

23


×