Tải bản đầy đủ (.pdf) (84 trang)

Đánh giá kết quả dự báo nhiệt độ và lượng mưa của một số mô hình dự báo thời tiết cho khu vực Việt Nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.57 MB, 84 trang )

Header Page 1 of 16.

TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------o0o----------

PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT CHO KHU VỰC VIỆT NAM

LUẬN VĂN THẠC SỸ KHOA HỌC

HÀ NỘI, 2012
Footer Page 1 of 16.


Header Page 2 of 16.

TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----------o0o-----------

PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT CHO KHU VỰC VIỆT NAM

Chuyên ngành
Mã số


: Khí tƣợng và Khí hậu học
: 60 44 87
LUẬN VĂN THẠC SỸ KHOA HỌC

NGƢỜI HƢỚNG DẪN KHOA HỌC:
TS. VŨ THANH HẰNG

HÀ NỘI, 2012
Footer Page 2 of 16.

ii


Header Page 3 of 16.

MỤC LỤC
MỤC LỤC ....................................................................................................................... 1
CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ
TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ ........................................................................ 6
1.1. Bài toán đánh giá dự báo trong khí tƣợng ............................................................ 6
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá .................................................. 6
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết ............................. 7
1.1.3. Sơ lược về tiêu chuẩn đánh giá ................................................................... 10
1.1.4. Các loại yếu tố dự báo ................................................................................ 11
1.1.5. Các thuộc tính của một dự báo tốt .............................................................. 12
1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến .............................................. 14
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số ..................... 14
1.2.2. Phương pháp đánh giá đối với biến liên tục ............................................... 17
1.2.3. Phương pháp đánh giá đối với dự báo pha ................................................ 21
1.3. Cơ sở lý thuyết của phƣơng pháp đánh giá fuzzy .............................................. 24

1.4. Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam33
CHƢƠNG 2. KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM,
MM5 VÀ NGUỒN SỐ LIỆU SỬ DỤNG ..................................................................... 36
2.1. Giới thiệu về mô hình MM5 .............................................................................. 36
2.1.1. Giới thiệu mô hình ...................................................................................... 36
2.1.2. Cấu trúc mô hình ........................................................................................ 36
2.1.3. Hệ các phương trình thủy nhiệt động lực của MM5 ................................... 37
2.1.4. Điều kiện biên ............................................................................................. 37
2.1.5. Các quá trình tham số hóa .......................................................................... 38
2.2. Giới thiệu về mô hình HRM .............................................................................. 40
2.2.1. Giới thiệu mô hình ...................................................................................... 40
2.2.2. Cấu trúc lưới và phương pháp số ............................................................... 40
2.2.3. Hệ các phương trình cơ bản ....................................................................... 40
2.2.4. Các quá trình tham số hóa vật lý ................................................................ 41
2.3. Số liệu ................................................................................................................. 42
CHƢƠNG 3. KẾT QUẢ ĐÁNH GIÁ NHIỆT ĐỘ VÀ LƢỢNG MƢA CỦA MÔ
HÌNH MM5 VÀ HRM CHO KHU VỰC VIỆT NAM ................................................. 45
3.1. Kết quả đánh giá nhiệt độ................................................................................... 45
3.2. Kết quả đánh giá lƣợng mƣa .............................................................................. 51
3.3. Kết quả thử nghiệm đánh giá mƣa bằng phƣơng pháp fuzzy ............................ 66
3.3.1. Kết quả thử nghiệm với chuỗi số liệu mẫu ................................................. 66
3.3.2. Thử nghiệm đánh giá kết quả dự báo mưa bằng phương pháp fuzzy cho
Việt Nam................................................................................................................ 71
3.3.2.1. Thử nghiệm đánh giá cho dự báo mưa do bão gây ra ............................ 71
3.3.2.2. Thử nghiệm đánh giá cho dự báo mưa do không khí lạnh gây ra .......... 75
KẾT LUẬN ................................................................................................................... 79
TÀI LIỆU THAM KHẢO ............................................................................................. 81
Tiếng Việt: ................................................................................................................. 81
Tiếng Anh: ................................................................................................................. 81


Footer Page 3 of 16.

1


Header Page 4 of 16.

DANH MỤC HÌNH VẼ
Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết ................................................. 8
Hình 1.2. Sơ
(NWP) .......... 16
Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trƣờng hợp dự báo 00 giờ,
bên phải là trƣờng hợp dự báo 36 giờ (số liệu lấy từ trạm phao) .................................. 17
Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lƣợng dự báo mƣa .......... 21
Hình 1.5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tƣơng thích cả về không
gian và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phƣơng pháp fuzzy
(vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc). .................................... 24
Hình 1.6. Cửa sổ quan trắc và dự báo của phƣơng pháp đánh giá fuzzy ...................... 25
Hình 2.1. Sơ đồ lồng ghép hai miền tính cho MM5 ...................................................... 39
Hình 2.2. Các trạm quan trắc trong miền tính ............................................................... 43
Hình 3.1. Nhiệt độ trung bình trong các tháng mùa hè tại các trạm. a) HRM1; b) OBS
(128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) ....................................................... 46
Hình 3.2. Nhiệt độ trung bình trong các tháng mùa đông tại các trạm. a) HRM1; b)
OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .............................................. 47
Hình 3.3. Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a) và mùa hè (b) ............................................................................................................ 48
Hình 3.4. Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a) và mùa hè (b) ............................................................................................................ 49
Hình 3.5. Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa
đông (a) và mùa hè (b) .................................................................................................. 50

Hình 3.6. Hệ số tƣơng quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các
khu vực (b, c, d) ............................................................................................................. 51
Hình 3.7. Giá trị trung bình mƣa tích lũy 24 giờ trong các tháng mùa hè. a) HRM1; b)
OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .............................................. 52
Hình 3.8. Giá trị trung bình mƣa tích lũy 24 giờ trong các tháng mùa đông. a) HRM1;
b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .......................................... 53
Hình 3.9. Điểm số ME của mƣa cho toàn Việt Nam và các khu vực trong các tháng
mùa đông (a) và mùa hè (b) ........................................................................................... 54
Hình 3.10. Điểm số MAE của mƣa cho toàn Việt Nam và các khu vực trong các tháng
mùa đông (a) và mùa hè (b) ........................................................................................... 55
Hình 3.11. Chỉ số RMSE của mƣa cho Việt Nam và các khu vực trong mùa đông (a)
và mùa hè (b) ................................................................................................................. 56
Hình 3.12. Hệ số tƣơng quan của mƣa của các mô hình cho Việt Nam (a) và các khu
vực (b, c, d) .................................................................................................................... 58
Hình 3.13 . Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa đông ........... 59
Hình 3.14. Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa hè ................ 59
Hình 3.15. Chỉ số TS các khu vực theo các ngƣỡng mƣa trong mùa đông ................... 61
Hình 3.16. Chỉ số TS các khu vực theo các ngƣỡng mƣa trong mùa hè ....................... 62
Hình 3.17. Chỉ số POD các khu vực theo các ngƣỡng mƣa trong mùa đông ............... 63
Hình 3.18. Chỉ số POD các khu vực theo các ngƣỡng mƣa trong mùa hè .................... 63
Hình 3.19. Chỉ số TSS các khu vực theo các ngƣỡng mƣa trong mùa đông................. 64
Hình 3.20. Chỉ số TSS các khu vực theo các ngƣỡng mƣa trong mùa hè ..................... 65
Hình 3.21. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 3h (phải) (mm/h) lúc 15h
UTC ngày 29/5/1999 ..................................................................................................... 66

Footer Page 4 of 16.

2



Header Page 5 of 16.

Hình 3.22. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo 03 giờ ngày
29/5/1999 ....................................................................................................................... 68
Hình 3.23. Vùng mƣa thám sát (trái) và vùng mƣa dự báo mƣa tích lũy 24h (phải)
(mm/ngày) ngày 6/7/2007 ............................................................................................. 71
Hình 3.24. Kết quả đánh giá bằng phƣơng pháp fuzzy cho dự báo mƣa 24 giờ ngày
06/7/2007 ....................................................................................................................... 72
Hình 3.25. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 24h (phải) (mm/ngày) ngày
23/12/2007 (không khí lạnh) ......................................................................................... 75
Hình 3.26. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo mƣa tích lũy 24
giờ ngày 23/12/2007 ...................................................................................................... 76

Footer Page 5 of 16.

3


Header Page 6 of 16.

MỞ ĐẦU
Nhƣ chúng ta đã biết, khí hậu nói chung và thời tiết nói riêng ảnh hƣởng
đến mọi mặt đời sống kinh tế - xã hội của loài ngƣời. Vì vậy việc dự báo các yếu
tố khí hậu cũng nhƣ thời tiết đang ngày càng quan trọng và cần thiết, trở thành
mối quan tâm lớn của tất cả các quốc gia trên thế giới. Và giờ đây nó càng trở
nên cấp bách hơn bao giờ hết khi ảnh hƣởng của
các nƣớc trên thế giới trong đó Việt Nam cũng là một trong
những quốc gia chịu ảnh hƣởng nặng nề của biến đổi khí hậu.

s



thử nghiệm
nghiệp vụ

hoặc nghiê
văn và

văn Trung ƣơng, RAMS, HRM, WRF
, Trƣờng
Khoa
Môi
.

nhiên

Mỗi mô hình số đều chứa đựng các sai số sinh ra do số liệu ban đầu, do
các quá trình tham số hóa trong khí quyển chƣa đủ chính xác...
,
cần phải tìm ra đƣợc những điểm mạnh của mô
hình để khai thác và sử dụng đồng thời chỉ ra những điểm yếu để tìm cách khắc
phục, đem lại hiệu quả cao hơn cho công tác dự báo. Bên cạnh đó, kết quả đánh
giá còn có thể cho biết về sai số hệ thống của mô hình, là cơ sở cho việc hiệu
chỉnh mô hình cho tốt hơn. Chính vì vậy, vấn đề đánh giá định lƣợng sản phẩm
của các mô hình số là rất cần thiết và có ý nghĩa khoa học.
Bài toán đánh giá dự báo là đánh giá mức độ chính xác của mô hình hoặc
mức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quan
trắc thực tế nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các
chuyên gia nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất
lƣợng dự báo của mô hình. Hơn nữa, kết quả đánh giá dự báo có thể đƣa ra

những thông tin giúp các nhà quản lý quyết định có nên đầu tƣ cơ sở vật chất,
trang thiết bị để phát triển mô hình hay không.
và lƣợng mƣa

Footer Page 6 of 16.

4


. Chính vì vậy, trong


Header Page 7 of 16.

khuôn khổ của luận văn tác giả tập trung vào việc đánh giá chất lƣợng dự báo
24h của nhiệt độ, lƣợng mƣa của hai mô hình dự báo thời tiết số đƣợc sử dụng
phổ biến hiện nay ở Việt Nam là mô hình HRM và mô hình MM5. Ngoài phần
Mở đầu, Kết luận và Tài liệu tham khảo, luận văn đƣợc bố cục cụ thể nhƣ sau:
Chƣơng 1. Tổng quan về bài toán đánh giá dự báo trong khí tƣợng và các
chỉ số đánh giá.
Chƣơng 2. Khái quát về các mô hình dự báo thời tiết số HRM, MM5 và
nguồn số liệu sử dụng.
Chƣơng 3. Kết quả đánh giá nhiệt độ và lƣợng mƣa của mô hình MM5 và
HRM cho khu vực Việt Nam.

Footer Page 7 of 16.

5



Header Page 8 of 16.

CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG
KHÍ TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ

1.1. Bài toán đánh giá dự báo trong khí tƣợng
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá
Đánh giá chất lƣợng dự báo thời tiết nói chung là phƣơng pháp thẩm tra
đánh giá và xác định định lƣợng mức độ chính xác của mô hình hoặc mức độ sai
khác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế
nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các chuyên gia
nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lƣợng dự
báo của mô hình.
Có ba lý do quan trọng nhất để đánh giá dự báo là:
- Kiểm tra chất lƣợng dự báo – dự báo chính xác đến đâu và sẽ đƣợc cải
tiến ra sao.
- Nâng cao chất lƣợng dự báo: Bƣớc đầu tiên để tiến tới dự báo tốt hơn là
việc tìm ra cái gì mà ngƣời làm dự báo đang làm sai.
- So sánh chất lƣợng của các hệ thống dự báo khác nhau – đến mức độ
nào thì một hệ thống dự báo đƣợc cho là dự báo tốt hơn so với những hệ thống
dự báo khác và bằng cách nào mà hệ thống dự báo đó đem lại kết quả tốt hơn
nhƣ vậy.
Các hoạt động đánh giá chỉ hữu ích khi chúng đƣa ra đƣợc các quyết định
về sản phẩm dự báo đang đƣợc đánh giá. Quyết định đó sẽ làm phát sinh những
thay đổi trong sản phẩm dự báo hoặc cách thức dự báo đƣợc thực hiện sau đó,
hoặc quyết định đó xác nhận và khẳng định sản phẩm dự báo thỏa mãn cho các
mục đích của ngƣời sử dụng và của xã hội. Các sản phẩm dự báo đƣợc phổ biến
rộng rãi trong công chúng thì phải đƣợc viết đủ khách quan để ngƣời sử dụng có
thể kiểm tra, còn các số liệu quan trắc khí quyển thực tế phải đƣợc thể hiện một
cách chính xác những gì diễn ra trong thực tế. Hơn nữa, một vài phƣơng pháp

đánh giá còn đòi hỏi quan trắc tại một điểm cũng có thể đại diện một cách đầy
đủ và khách quan các hiện tƣợng thời tiết xảy ra trong một khu vực.
Chính tính cấp thiết trong các hoạt động đánh giá chất lƣợng dự báo thời
tiết cho thấy mục đích đánh giá phải đƣợc thiết lập trƣớc khi hệ thống đánh giá
Footer Page 8 of 16.

6


Header Page 9 of 16.

đƣợc xác lập. Từ đây các hoạt động đánh giá trong khí tƣợng cũng nhƣ trong các
hoạt động dự báo thời tiết có thể đƣợc phân chia thành hai mục đích chính là
đánh giá hành chính và đánh giá khoa học.
Mục đích hành chính: Các thông tin đánh giá trong mục đích quản lý hành
chính nhằm cung cấp thông tin cho việc mua sắm các trang thiết bị chính nhƣ
các máy tính có cấu hình cao hơn, tốc độ xử lý nhanh hơn,… Xác định khi nào,
hoặc có nên thay thế một sản phẩm đang đƣợc sử dụng bằng một sản phẩm dự
báo mới hay không, và còn nhiều các quyết định khác để phát triển tối ƣu nguồn
lực về con ngƣời cũng nhƣ các nguồn trang thiết bị khác phục vụ cho công tác
phát hành một bản tin dự báo thời tiết.
Mục đích khoa học: Đánh giá với mục đích khoa học là xác định một cách
đầy đủ và chi tiết ƣu điểm cũng nhƣ nhƣợc điểm của một sản phẩm dự báo. Các
hoạt động này giúp tìm ra các biện pháp thích hợp để cải thiện chất lƣợng dự
báo phục vụ cũng nhƣ cung cấp các thông tin để hoạch định phƣơng hƣớng cho
việc nghiên cứu và phát triển tiếp theo.
Ngoài ra một số tác giả khác còn xét đến mục đích kinh tế nhƣng đó là
vấn đề rất phức tạp nên trong giới hạn luận văn này không đƣợc đề cập đến.
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết
Hình 1.1 là một kiểu mô hình chung nhất để đánh giá dự báo các yếu tố

thời tiết, ngoài ra có thể có các mô hình đánh giá khác nữa. Tuy nhiên đây là mô
hình cho thấy bức tranh chi tiết nhất về quan hệ giữa đặc trƣng của phép đánh
giá các đại lƣợng đo và các giải pháp khác nhau để có thể lựa chọn. Sơ đồ này
sử dụng cho việc quyết định các bƣớc cần thiết phải đƣợc làm trƣớc khi lựa chọn
các phƣơng pháp đánh giá cụ thể.
Tất cả các phƣơng pháp đánh giá đều bắt đầu từ việc tập hợp các tập số
liệu quan trắc và dự báo (hình bình hành ở trên cùng trong Hình 1.1). Bƣớc tiếp
theo là xử lý số liệu, bƣớc này phụ thuộc vào việc quyết định của ngƣời sử dụng
(hình thoi trong sơ đồ). Quan trọng nhất là việc quyết định của ngƣời sử dụng
lựa chọn mục đích đánh giá hành chính hay khoa học nhƣ đã nêu ở trên.
Khi mục đích đánh giá đã đƣợc xác định, tiến hành phân loại các tập số
liệu mẫu theo mục đích đã định trƣớc. Phân loại nghĩa là chia nhỏ các phần tử
trong tập mẫu ra thành hai hay nhiều nhóm theo một nguyên tắc đã định sẵn, sau
đó thực hiện đánh giá cho từng nhóm một cách riêng biệt. Trên Hình 1.1 đã chỉ
Footer Page 9 of 16.

7


Header Page 10 of 16.

ra hai kiểu phân loại là “Phân loại ngoại bộ” và “Phân loại nội bộ”.
Phân loại ngoại bộ là kiểu phân loại mà nguyên tắc lựa chọn độc lập đối
với các yếu tố đang cần đƣợc đánh giá. Kiểu phân loại ngoại bộ phổ biến nhất là
cho phép xác định các biến đổi trong đánh giá theo thời gian trong ngày hoặc
theo mùa. Phân loại ngoại bộ có thể tiến hành ở bất cứ thời điểm nào trong quá
trình trƣớc khi tính toán các đánh giá thống kê thực tế, và có thể đƣợc làm cho
cả mục đích hành chính hay mục đích khoa học.

Các tập số liệu

dùng để đánh giá

Mục đích
khoa học

Quản lý
hành
chính

Phân loại
ngoại bộ

Phân loại
ngoại bộ

Phân loại
nội bộ theo
quan trắc

Phân loại
nội bộ theo
dự báo

Biến pha

Biến liên tục

Bảng liên hợp

Đồ thị điểm


Biến pha

Bảng liên hợp

Biến liên tục

Phân loại
nội bộ theo
dự báo

Biến pha

Đồ thị điểm

Sai số trung bình tuyệt đối

Điểm Berier RPS

Nguyên lý phát
hiện
tín hiệu

Biến liên tục

Sai số bình
phƣơng trung bình

Bảng độ tin cậy
Điểm kỹ năng

Brier

Độ giảm phƣơng sai

Hệ số phân tán

Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết
Footer Page 10 of 16.

8

Độ lệch (BIAS)


Header Page 11 of 16.

Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học thấy rằng, cần
có một nhu cầu phân loại cao hơn đối với tập mẫu. Chẳng hạn nhƣ, nếu ta quan
tâm đến dự báo cực trị thì tập mẫu sẽ phải đƣợc phân nhóm để tách các giá trị
cực trị đó ra từ chuỗi các sự kiện chung. Kiểu phân nhóm này đƣợc gọi là “phân
loại nội bộ” bởi vì nguyên tắc phân loại đƣợc quyết định bởi mục đích đánh giá
và sử dụng chính yếu tố đang đƣợc đánh giá. Có hai cách để thực hiện phân loại
nội bộ, trên Hình 1.1 cho thấy sự khác nhau trong kết quả đánh giá thu đƣợc từ
hai cách phân loại đó.
Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khí
tƣợng quan trắc đƣợc. Sau đó, các tiêu chuẩn đánh giá có thể đƣợc tính toán cho
từng nhóm giá trị quan trắc và giá trị thống kê đƣợc tạo thành này gọi là giá trị
có điều kiện đối với quan trắc. Một ví dụ cho phân bố có điều kiện của dự báo là
một giá trị đặc biệt hay một phạm vi các giá trị quan trắc.
Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khí

tƣợng đƣợc dự báo. Cũng tƣơng tự nhƣ trên, các giá trị thống kê đƣợc tính toán
theo cách phân loại này đƣợc gọi là điều kiện dự báo. Việc lựa chọn kiểu phân
loại phụ thuộc vào mục đích đánh giá. Trong nhiều trƣờng hợp cần phải sử dụng
kết hợp cả hai cách phân loại trên để đƣa ra một kết quả hoàn chỉnh. Hơn nữa,
nhƣ đã thấy ở sơ đồ trên, những đại lƣợng đánh giá khác nhau (hình ô van bên
dưới) đặc trƣng cho một kiểu phân nhóm khác và đƣa ra nhiều thông tin khác
nhau về sản phẩm.
Một cách khác, trong đánh giá hành chính, ngƣời ta ít quan tâm chi tiết
đến việc biểu diễn những biến theo các giá trị khác nhau trong dự báo. Mà thay
vào đó, các câu hỏi đặt ra đều mang tính chung chung và chỉ cần một câu trả lời
ngắn gọn xúc tích nào đó. Vì vậy, phân loại nội bộ có thể vẫn đƣợc thực hiện
nhƣng nó hiếm khi đƣợc dùng đến. Tuy nhiên, ƣu điểm lớn của đánh giá hành
chính là biểu diễn chất lƣợng sản phẩm chỉ bằng vài con số hoặc việc so sánh
thuận tiện hay hƣớng xác minh dễ dàng. Bản chất chung của đánh giá hành
chính có mối liên hệ mật thiết với các quy tắc điểm số tổng kết đƣợc chỉ ra ở
Hình 1.1. Đôi khi việc tóm tắt cũng trở nên khó khăn khi phải cố gắng tổng kết
tất cả các thông tin về chất lƣợng sản phẩm chỉ trong một điểm số để cung cấp
cho nhà quản lý. Nhu cầu tóm tắt thông tin đánh giá chỉ bằng một con số gây ra
một áp lực lớn cho việc thiết kế hệ thống đánh giá để đảm bảo đƣợc rằng:
- Điểm số đƣợc lựa chọn theo yêu cầu là đáng tin cậy;
Footer Page 11 of 16.

9


Header Page 12 of 16.

- Các sự kiện hợp thành đều đƣợc xem xét công bằng nhƣ nhau trong các
điểm số;
Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đều

đƣợc xem là nhƣ nhau trong quá trình trung bình hóa. Điều này làm cho việc
thực hiện thuận tiện hơn (việc tính toán sẽ đơn giản hơn khi sử dụng đại lƣợng
trung bình), nhƣng cũng vì thế mà rất khó để có thể tìm đƣợc một hàm trọng số
chính xác và phản ánh đủ khách quan cho các sự kiện hợp thành của mục đích
sử dụng mà không có bất kỳ trở ngại nào đối với các thuộc tính của điểm số.
Làm thế nào để đƣa ra các hàm trọng số của các sự kiện hợp thành trong đánh
giá tổng hợp vẫn còn là vấn đề chƣa giải quyết đƣợc.
Trƣớc đây, các điểm số đánh giá đã đƣợc đánh giá quá cao. Vì thế các dự
báo viên sớm thất vọng khi phải cố gắng sử dụng chúng để trả lời các câu hỏi về
các vấn đề mang tính chất khoa học. Tính chất của việc đánh giá tổng kết đó hạn
chế việc sử dụng trong mục đích khoa học bởi thiếu sự phân loại đánh giá bằng
những điều kiện cho trƣớc. Ví dụ, điểm số tổng kết không thể nói mƣa dự báo
tốt nhƣ thế nào trong các trƣờng hợp ngƣỡng thấp mà chỉ có thể nói mƣa đƣợc
dự báo tốt nhƣ thế nào một cách chung chung. Không thể nói, dƣới điều kiện
nào mô hình phần tử hữu hạn khu vực RFE (Regional Finite Element model) tốt
hơn mô hình phổ, chỉ có thể nói rằng mô hình RFE tốt hơn hoặc xấu hơn một
chút so với mô hình phổ.
1.1.3. Sơ lược về tiêu chuẩn đánh giá
Các điểm số dùng trong đánh giá đƣợc minh họa theo từng cặp ở phía
dƣới Hình 1.1 cho thấy mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị
điểm là hoàn toàn tƣơng tự nhau, chúng cung cấp các dạng thông tin nhƣ nhau,
bảng liên hợp xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến
dự báo liên tục. Điểm tổng kết luôn đƣợc phân loại theo cách này: Điểm Brier
và điểm RP đều đo chính xác các đặc tính của khả năng xảy ra hay biến pha,
chúng tƣơng tự sai số bình phƣơng trung bình của dự báo theo biến liên tục. Chú
ý rằng dự báo pha không tƣơng tự nhƣ sai số trung bình tuyệt đối. Có hai loại
đại lƣợng đo đƣợc phân loại tƣơng ứng theo dự báo và quan trắc là “Bảng độ tin
cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó bảng liên hợp và đồ thị
điểm lại tổng quát hơn, cho phép phân loại theo một trong hai cách hoặc theo cả
hai cách. Nguyên lý phát hiện tín hiệu là một ý tƣởng mới mẻ và hiện nay chƣa

đƣợc sử dụng rộng rãi.
Footer Page 12 of 16.

10


Header Page 13 of 16.

Các điểm số liệt kê trên Hình 1.1 gồm 3 loại, đó là: điểm số tuyến tính,
điểm số toàn phƣơng (bậc hai) và điểm số kỹ năng.
Điểm số toàn phƣơng đƣa ra trọng lƣợng của sai số theo bình phƣơng của
chúng trong khi điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số
toàn phƣơng thƣờng đƣa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm
số này rất phù hợp trong các trƣờng hợp sai số lớn thực sự nghiêm trọng hơn sai
số nhỏ.
Điểm số kỹ năng đƣợc xây dựng để đánh giá mối quan hệ giữa dự báo và
một giá trị chuẩn nào đó. Giá trị chuẩn đƣợc chọn lựa để mô tả một dự báo
không kỹ năng.
Ba tiêu chuẩn đƣợc sử dụng để so sánh là: chuẫn ngẫu nhiên, chuẩn quán
tính và chuẩn khí hậu. Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và không
yêu cầu hiểu biết tri thức, chuẩn quán tính là một dự báo xác định và yêu cầu các
hiểu biết về điều kiện thời tiết, còn chuẩn khí hậu là một dự báo trạng thái thời
tiết diễn ra trong khoảng thời gian dài và cần phải có sự hiểu biết về tiến trình
lịch sử của thời tiết. Điểm số kỹ năng đƣợc biểu diễn trong công thức sau:
SS

SC
PS

ST

ST

trong đó SC là điểm có đƣợc từ dự báo, ST là điểm đạt đƣợc từ dự báo chuẩn và
PS là điểm từ dự báo hoàn hảo. Điểm số kỹ năng có thể đƣợc hình thành từ việc
sử dụng bất kỳ một trong các điểm số. Điểm số kỹ năng phổ biến nhất dựa trên
nền tảng của điểm Brier (điểm kỹ năng Brier), điểm RP (điểm kỹ năng RP), các
giá trị của bảng ngẫu nhiên (điểm Heidke) và sai số trung bình tuyệt đối. Tiêu
chuẩn thƣờng đƣợc sử dụng nhất là chuẩn khí hậu, còn điểm Heidke lại thƣờng
xuyên đƣợc kết hợp với chuẩn ngẫu nhiên. Không có điểm kỹ năng cơ bản nào
là quan trọng hơn, chúng bình đẳng nhƣ nhau và đều biểu hiện đặc tính của kỹ
năng.
1.1.4. Các loại yếu tố dự báo
Sau khi giải quyết xong những vấn đề về phân loại và những yêu cầu của
một mô hình đánh giá đã đặt ra cần lựa chọn một phƣơng pháp thích hợp để đáp
ứng các yêu cầu đó. Hình chữ nhật trên Hình 1.1 đƣa ra gợi ý cho cách lựa chọn
phù hợp tùy thuộc vào bản chất dự báo đƣợc đánh giá. Phụ thuộc vào mục đích
đánh giá ngƣời ta chia ra thành hai dạng dự báo là: Dự báo các đại lƣợng liên tục
Footer Page 13 of 16.

11


Header Page 14 of 16.

và dự báo pha.
* Yếu tố dự báo liên tục: Là các yếu tố đƣợc dự báo tại một giá trị nhất
định hoặc trong một khoảng giá trị nào đó. Trong số các yếu tố thời tiết thì nhiệt
độ, áp suất, và gió là hay đƣợc dự báo theo cách này.
* Yếu tố dự báo pha: Là các yếu tố dự báo có thể xảy ra hoặc không xảy
ra. Chẳng hạn nhƣ xét sự xuất hiện của giáng thủy (có hoặc không), hoặc xét

dạng giáng thủy (băng, tuyết, nƣớc).
Một số yếu tố có thể đƣợc dự báo liên tục hoặc dự báo pha tùy thuộc vào
yêu cầu của ngƣời sử dụng trong quá trình làm dự báo. Tuy nhiên khi một dự
báo mà cho kết quả biến thiên liên tục thì phải đƣợc đánh giá theo pha bởi vì tất
cả những thông tin đó rất cần thiết cho ngƣời sử dụng.
* Dự báo xác suất đƣợc xem nhƣ là dự báo pha nhƣng tổng quát hơn.
Trong đó, mỗi pha đƣợc gán bằng một xác suất xảy ra và tổng tất cả xác suất
phải bằng 1 (tức là một cái gì đó phải xảy ra). Dự báo pha là một dự báo xác
suất thu hẹp, ở đây xác suất chỉ có hai trƣờng hợp xảy ra hoặc là 0% hoặc là
100% và hiển nhiên là một trong hai trƣờng hợp ấy chắc chắn sẽ xảy ra.
1.1.5. Các thuộc tính của một dự báo tốt
Do tính chất phức tạp của bài toán đánh giá, việc lựa chọn, sử dụng những
chỉ số nào để phản ánh đƣợc tất cả các khía cạnh là vấn đề khó khăn. Chẳng hạn,
khi nói về đánh giá chất lƣợng dự báo (có thể là của một mô hình) Murphy
(1993) đã đƣa ra 3 khái niệm để chỉ mức độ “tốt” của một dự báo là:
1) Độ chắc chắn (Consistency) của dự báo là mức độ phù hợp giữa dự báo
và kiến thức hiểu biết của dự báo viên;
2) Chất lƣợng dự báo (Quality) là mức độ phù hợp giữa dự báo với thực tế
xảy ra;
3) Ý nghĩa (hay giá trị - Value) của dự báo là mức độ mà dự báo có thể
giúp cho ngƣời ra quyết định thấy rõ hoặc đạt đƣợc lợi ích nào đó về kinh tế
hoặc lợi ích khác.
Cũng theo Murphy (1993), đã đƣa ra 9 khái niệm đƣợc gọi là 9 thuộc tính
đóng góp cho độ chắc chắn của dự báo nhƣ sau:
- Độ lệch (Bias): Là mức độ phù hợp giữa trung bình quan trắc và trung
Footer Page 14 of 16.

12



Header Page 15 of 16.

bình dự báo.
- Tính liên kết (Association): Là mức độ chặt chẽ về quan hệ tuyến tính
giữa dự báo và quan trắc(chẳng hạn, hệ số tƣơng quan là thƣớc đo mối quan hệ
tuyến tính này).
- Độ chính xác (Accuracy):
dự báo và thực tế (

)

.K
.
- Kỹ năng dự báo (Skill):
một dự báo tham chiếu nào đó. Dự báo tham chiếu
nói chung là dự báo không có kỹ năng, nhƣ dự báo ngẫu nhiên (may rủi), dự báo
quán tính, hoặc dự báo khí hậu. Kỹ năng ám chỉ sự tăng lên của độ chính xác do
hệ thống dự báo “thông minh”.
- Độ tin cậy (Reliability): Là sự phù hợp trung bình giữa các giá trị dự báo
và các giá trị quan trắc. Nếu tất cả các trƣờng hợp dự báo đƣợc xem xét khi đó
độ tin cậy trên toàn bộ giống nhƣ thiên hƣớng (bias). Nếu các trƣờng hợp dự báo
đƣợc phân chia thành các khoảng khác nhau hoặc theo các phân hạng thì độ tin
cậy giống nhƣ độ lệch có điều kiện (conditional bias). Thông thƣờng độ tin cậy
đƣợc cải tiến nhờ Bias. Nhƣng sau khi cải tiến làm độ tin cậy của các dự báo
tƣơng đƣơng tăng lên thì chính Bias lại sẽ bị khử đi.
- Độ phân giải (Resolution): Là năng lực của dự báo có thể phân loại tập
các sự kiện thành các tập con có phân bố tần suất khác nhau. Điều đó có nghĩa là
phân bố nhận đƣợc khi “A” đƣợc dự báo khác với phân bố nhận đƣợc khi “B”
đƣợc dự báo. Thậm chí nếu các dự báo là sai, hệ thống dự báo có độ phân giải
nếu nó có thể phân chia một cách thành công phân bố của các dạng khác nhau.

(Nói cách khác, có thể tách biệt đƣợc các trƣờng hợp dự báo thành những tập có
cùng phân bố).
- Độ nhọn (hay độ nhạy bén - Sharpness): Là xu hƣớng của dự báo có thể
dự báo đƣợc các giá trị cực trị. Độ nhọn là một thuộc tính của dự báo, tƣơng tự
nhƣ độ phân giải, một dự báo có thể có thuộc tính này ngay cả khi nó sai (trong
trƣờng hợp này nó có thể là kém tin cậy);
- Độ phân biệt (hay độ phân lớp - Discrimination): Là khả năng của dự
Footer Page 15 of 16.

13


Header Page 16 of 16.

báo có thể tách biệt các quan trắc thành những trƣờng hợp có tần suất dự báo
cao hơn, tức là có khả năng phân lớp. Là khả năng của dự báo có thể tách biệt
các quan trắc thành những trƣờng hợp có tần suất dự báo cao hơn, tức là có khả
năng phân lớp.
- Độ biến động (hay tính không chắc chắn - Uncertainty): Là sự dao động
của các giá trị quan trắc trong tập mẫu đánh giá và không phụ thuộc vào giá trị
dự báo. Đối với các biến đƣợc dự báo theo pha thì độ biến động là 1 nếu sự kiện
xảy ra và 0 nếu sự kiện không xảy ra. Đại lƣợng này liên quan đến độ “khó
khăn” của dự báo. Độ biến động càng lớn có nghĩa là sẽ có những dao động lớn
với nhiều tần số khác nhau trong yếu tố dự báo đang đƣợc đánh giá và dĩ nhiên
việc dự báo sẽ khó khăn hơn. Độ biến động của từng tập số liệu sẽ rất khác nhau
và do đó, việc so sánh giữa các con số đánh giá thống kê của tập số liệu là hết
sức mạo hiểm vì chúng thƣờng rất nhạy với độ biến động.
Theo truyền thống thì đánh giá dự báo tập trung nhấn mạnh vào độ chính
xác và kỹ năng dự báo. Nhƣng cũng cần lƣu ý rằng các thuộc tính khác của dự
báo cũng ảnh hƣởng mạnh đến giá trị dự báo.

1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số
a. Những nguyên nhân gây sai số trong mô hình dự báo số
Để ứng dụng đƣợc một mô hình khu vực hạn chế vào trong nghiệp vụ dự
báo thời tiết đòi hỏi trƣớc hết là phải đánh giá đƣợc sai số dự báo của mô hình so
với thực tế. Các nguyên nhân có thể đƣa đến dự báo sai của mô hình số có thể
tóm tắt nhƣ sau:
- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí
quyển là chƣa hoàn chỉnh;
- Ảnh hƣởng của địa hình đến kết quả dự báo (thƣờng không đƣợc mô
hình số mô tả hoàn chỉnh);
- Các quá trình vật lý và các sơ đồ tham số hóa chƣa thật sự hoàn thiện;
- Một số giả thiết không thực sự phù hợp đƣợc đƣa ra để có thể giải đƣợc
hệ phƣơng trình thủy nhiệt động lực học mô tả khí quyển thực.
- Điều kiện biên và điều kiện ban đầu của các biến khí tƣợng là chƣa hoàn
Footer Page 16 of 16.

14


Header Page 17 of 16.

chỉnh và phụ thuộc khá nhiều vào địa hình. Các trạm thám sát thƣa thớt, đặc biệt
là vùng nhiệt đới;
- Các kết quả nhận đƣợc chứa đựng những sai số khi giải các công thức
toán học bằng phƣơng pháp gần đúng, ...
b. Nguyên lý chung cho việc đánh giá mô hình dự báo số
Hình 1.2
Hình
1.1

số liệu quan trắc và bộ số liệu này phải tƣơng
, số liệu quan trắc có thể sẽ đƣợc phân
tích về lƣới dự báo hoặc

phẩm
. Trong trƣờng hợp này
, điều quan trọng trong đánh giá mô
hình là phải luôn ghi nhớ thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kết
quả.
Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra là
những vấn đề quyết định cần giải quyết phải đƣợc làm cho mục đích đánh giá
trƣớc khi một hệ thống đánh giá đƣợc thiết lập. “Đánh giá hành chính” trả lời
câu hỏi về xu hƣớng trong kỹ năng và độ chính xác của mô hình và thƣờng đƣợc
sử dụng để so sánh độ chính xác của hai mô hình khác nhau. Tƣơng tự nhƣ đánh
giá các yếu tố thời tiết cho những mục đích hành chính, có một khuynh hƣớng
nhằm giảm thiểu các kết quả chỉ bằng một vài con số thông qua việc sử dụng các
điểm số tổng kết.
“Đánh giá khoa học”
diễn của mô hình để đƣa ra
thông tin có thể phản hồi lại cho c
front. Bộ số liệu đánh giá
phải đƣợc sắp xếp cẩn thận theo các đặc trƣng đó, và điều này có thể đƣợc thực
hiện theo một trong hai hƣớng đó là theo cơ sở của các đặc trƣng quan trắc hay
theo cơ sở của các đặc trƣng dự báo.
Footer Page 17 of 16.

15


Header Page 18 of 16.


“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá
theo mùa hoặc theo thời gian chạy mô hình
.

Các tập số liệu
dùng để đánh giá

Quản lý
hành
chính

Mục đích
khoa học

Phân loại
ngoại bộ

Phân loại
theo không
gian
Phân loại
nội bộ

Sai số trung bình tuyệt đối
Sai số bình phƣơng trung bình

Sai số đƣờng đi

Thẩm định trung tâm áp suất

Điểm kỹ năng (Độ suy giảm phƣơng sai)

Độ lệch trung tâm

Các trƣờng hợp nghiên cứu

Hệ số phân tán

Lỗi hệ thống

Độ lệch (BIAS)

Tƣơng quan dị thƣờng

Điểm số S1

Hình 1.2

Footer Page 18 of 16.

(NWP)

16


Header Page 19 of 16.

. Khi phân loại theo
không gian đƣợc tiến hành theo mục đích khoa học, các khu vực có quy mô dƣới
lƣới đƣợc ƣu tiên lựa chọn để phản ánh các chế độ khí hậu khác nhau nhƣ các

khu vực có địa hình đồi núi, các vùng núi khuất gió, bờ biển,…
1.2.2. Phương pháp đánh giá đối với biến liên tục
1.2.2.1. Phương pháp toán đồ tụ điểm
Hệ số tƣơng quan = 0.595

Hệ số tƣơng quan = 0.789

Tốc độ gió mô hình PPR (kts)

Tốc độ gió mô hình PPR (kts)

Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trường hợp dự báo 00 giờ,
bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao)

Toán đồ tụ điểm là phƣơng pháp đơn giản nhất, chủ yếu phục vụ cho các
biến liên tục nhƣ nhiệt độ và gió, thƣờng gồm tất cả các điểm số ứng với mỗi
cặp dự báo – quan trắc tƣơng ứng trên cùng một đồ thị với tung độ và hoành độ
có tỷ lệ nhƣ nhau. Trƣờng hợp lý tƣởng là các điểm số nằm trên một đƣờng
thẳng đi qua gốc tọa độ và tạo với trục hoành một góc 450 (giá trị dự báo bằng
giá trị quan trắc). Đƣờng 450 này thƣờng đƣợc vẽ ra để thuận tiện cho việc nội
suy các điểm rời rạc.
Hình 1.3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển. Mỗi điểm
“x” đại diện cho ít nhất một lần xuất hiện của cặp dự báo – quan trắc riêng lẻ.
Trên mỗi đồ thị còn có một đƣờng thẳng thứ hai mà có thể không đi qua gốc tọa
độ, đó chính là đƣờng hồi quy bình phƣơng tối thiểu tƣơng ứng với tập số liệu
Footer Page 19 of 16.

17



Header Page 20 of 16.

quan trắc.
Nếu dự báo là hoàn hảo thì đƣờng hồi quy sẽ trùng với đƣờng 450. Sự phù
hợp giữa đƣờng hồi quy và đƣờng 45 0 cho thấy chất lƣợng của dự báo. Chất
lƣợng dự báo sẽ giảm đi nếu đƣờng hồi quy có khuynh hƣớng lệch theo chiều
nằm ngang hơn. Nếu đƣờng hồi quy nằm ngang hoàn toàn thì khi đó quan trắc
hoàn toàn độc lập với dự báo.
Một đại lƣợng đánh giá khác có thể ƣớc lƣợng từ đồ thị điểm là sai số
bình phƣơng hoặc độ lệch. Hình 1.3 chỉ ra một đồ thị điểm khác cho dự báo
nhiệt độ khách quan (sản phẩm mô hình thống kê). Tập số liệu mẫu là 701
trƣờng hợp (số liệu này đƣợc lấy từ 11 trạm vùng Đại Tây Dƣơng - CASSP).
Trong đồ thị này không thấy xuất hiện các dấu “x” nhƣ đồ thị trƣớc, thay vào đó
là các con số. Các số trên đồ thị này biểu hiện số trƣờng hợp các cặp giá trị nhiệt
độ quan trắc - dự báo tƣơng ứng với đồ thị điểm.
Một đồ thị điểm mô tả phân loại cơ bản từ tất cả các trƣờng hợp đƣợc
miêu tả riêng rẽ. Điều này cho phép cân nhắc một cách linh hoạt cho phân tích
số liệu. Giả sử -200C và +100C đƣợc chọn nhƣ là ngƣỡng của nhiệt độ cực trị,
giá trị này có thể nhận đƣợc từ phân tích trên đồ thị. Tất cả các điểm, ở đây nhiệt
độ quan trắc nằm trong giới hạn của cực trị và không có nhiệt độ dự báo đƣợc
gọi là miền các sự kiện dự báo sót (missed events) và tất cả các điểm ở đây giá
trị dự báo nằm trong phạm vi cực trị và không quan trắc đƣợc gọi là miền báo
động sai (false alarms). Miền các sự kiện dự báo sót và miền báo động sai có thể
thấy trên đồ thị. Qua đồ thị có thể thấy, tất cả nhiệt độ có giá trị cao nhất đã bị
bỏ sót (dự báo dƣới ngƣỡng) trong khi đó nhiệt độ thấp xảy ra ở cả hai miền các
sự kiện dự báo sót và miền báo động sai.
Phân loại trên cơ sở quan trắc chỉ cho phép nhận dạng miền các sự kiện
dự báo sót (đƣờng ngang vẽ đậm ở các giá trị ngƣỡng). Phân loại trên cơ sở dự
báo chỉ cho phép nhận dạng đƣợc miền báo động sai (đƣờng đứng vẽ đậm ở các
giá trị ngƣỡng). Từ đây có thể thấy rằng điều quan trọng nhất là phải sử dụng cả

hai kiểu phân loại để nhận đƣợc thông tin đầy đủ và hoàn hảo về một sản phẩm
đang đƣợc đánh giá. Ví dụ những giá trị thấp nhất đã bị bỏ sót có thể lấy lại
đƣợc đơn giản bằng cách tƣởng tƣợng di chuyển tất cả các điểm trên đồ thị đến
bên trái giá trị ngƣỡng 100C, nhƣng cái giá phải trả cho việc hiệu chỉnh này là sự
tăng lên đột ngột trong miền báo động sai. Điều này sẽ không nhìn thấy nếu
Footer Page 20 of 16.

18


Header Page 21 of 16.

phân loại trên cơ sở của một mình quan trắc. Do vậy luôn luôn có thể hiệu đính
cho sự kiện cực trị đã bị bỏ sót.
Phân loại trên cơ sở dự báo có lẽ có ích hơn cho hiểu biết về ý nghĩa thực
của dự báo. Thông tin chi tiết về ý nghĩa của dự báo cho các nhiệt độ khác nhau
có thể nhận đƣợc từ một chuỗi phân bố có điều kiện cho mỗi nhiệt độ dự báo
hoặc cho phạm vi của nhiệt độ.
1.2.2.2 Các chỉ số đánh giá
Trong các công thức dƣới đây, Fi và Oi tƣơng ứng là giá trị mô hình và giá
trị quan trắc của một biến nào đó (nhiệt độ, lƣợng mƣa), i=1,2,…, N, N là dung
lƣợng mẫu.
a. Sai số trung bình (ME - Mean Error)
ME

1 N
(Fi
Ni 1

Oi )


(1. 1)

Giá trị của ME nằm trong khoảng (-∞, +∞). ME cho biết xu hƣớng lệch
trung bình của giá trị dự báo so với giá trị quan trắc, nhƣng không phản ánh độ
lớn của sai số. ME dƣơng cho biết giá trị dự báo vƣợt quá giá trị quan trắc và
ngƣợc lại. Mô hình đƣợc xem là “hoàn hảo” (không thiên lệch về một phía nào
cả) nếu ME=0.
b. Sai số tuyệt đối trung bình (MAE-Mean Absolute Error)
MAE

1 N
Fi Oi
Ni 1

(1. 2)

Giá trị MAE nằm trong khoảng (0,+∞). MAE biểu thị biên độ trung bình
của sai số mô hình nhƣng không nói lên xu hƣớng lệch của giá trị dự báo và
quan trắc. Khi MAE = 0, giá trị của mô hình hoàn toàn trùng khớp với giá trị
quan trắc, mô hình đƣợc xem là “lý tƣởng”. Thông thƣờng MAE đƣợc sử dụng
cùng với ME để đánh giá độ tin cậy. Chẳng hạn, nếu MAE của sản phẩm khác
biệt hẳn so với ME thì việc hiệu chỉnh là hết sức mạo hiểm. Trong trƣờng hợp
ngƣợc lại, khi mà MAE và ME tƣơng đối “sát” với nhau thì có thể dùng ME để
hiệu chỉnh sản phẩm dự báo một cách đáng tin cậy.
c. Sai số bình phƣơng trung bình MSE (Mean Square Error)

Footer Page 21 of 16.

19



Header Page 22 of 16.

1 N
(Fi
Ni 1

MSE

Oi ) 2

(1. 3)

MSE là trung bình của tổng bình phƣơng của hiệu giữa các giá trị mô hình và
quan trắc, phản ánh mức độ dao động của sai số. Mô hình là “lí tƣởng” nếu
MSE=0.
d. Sai số bình phƣơng trung bình quân phƣơng (RMSE - Root mean square
Error)
1 N
(Fi
Ni1

RMSE

(1. 4)

Oi ) 2

Sai số bình phƣơng trung bình là một trong những đại lƣợng cơ bản và

thƣờng đƣợc sử dụng phổ biến cho việc đánh giá kết quả của mô hình dự báo số
trị. Ngƣời ta thƣờng hay sử dụng đại lƣợng sai số bình phƣơng trung bình quân
phƣơng (RMSE) biểu thị độ lớn trung bình của sai số. Đặc biệt RMSE rất nhạy
với những giá trị sai số lớn. Do đó nếu RMSE càng gần MAE sai số mô hình
càng ổn định và có thể thực hiện việc hiệu chỉnh sản phẩm mô hình. Giống nhƣ
MAE, RMSE không chỉ ra độ lệch giữa giá trị dự báo và giá trị quan trắc. Giá trị
của RMSE nằm trong khoảng (0,+ ∞).
Khi so sánh MAE và RMSE ta thấy: RMSE ≥ MAE. Còn RMSE = MAE
khi và chỉ khi tất cả các sai số có độ lớn nhƣ nha0u: RMSE = MAE =0.
e. Hệ số tƣơng quan (Correlation coefficient)
N

( Fi
r

F )(Oi

O)

i 1
N

( Fi
i 1

(1. 5)

N

F)


2

(Oi

O)

2

i 1

Hệ số tƣơng quan (r) cho phép đánh giá mối quan hệ tuyến tính giữa tập
giá trị dự báo và tập giá trị quan trắc. Giá trị của nó biến thiên trong khoảng -1
đến 1, giá trị hoàn hảo bằng 1. Giá trị tuyệt đối của hệ số tƣơng quan càng lớn
thì mối quan hệ tuyến tính giữa hai biến càng chặt chẽ. Hệ số tƣơng quan dƣơng
phản ánh mối quan hệ cùng chiều (đồng biến), ngƣợc lại, hệ số tƣơng quan âm
biểu thị mối quan hệ ngƣợc chiều (nghịch biến) giữa dự báo và quan trắc.

Footer Page 22 of 16.

20


Header Page 23 of 16.

1.2.3. Phương pháp đánh giá đối với dự báo pha
Đánh giá thống kê theo loại (categorical statistics) là loại tiêu chuẩn đánh
giá sự phù hợp giữa sự xảy ra hiện tƣợng dự báo và hiện tƣợng quan trắc tại nút
lƣới.
Các điểm số đánh giá đƣợc dựa vào bảng ngẫu nhiên sau (Damrath, 2002):


Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa

Hits (H) = dự báo có + quan trắc có
Misses (M) = dự báo không + quan trắc có
False alarms (F) = dự báo có + quan trắc không
Correct negatives (CN) = dự báo không + quan trắc không
Dƣới đây là một vài điểm số thƣờng dùng trong đánh giá dự báo mƣa định
lƣợng ở trên thế giới:
a. Chỉ số FBI (BS hay FBI - Bias score): Đánh giá tỷ số giữa vùng dự báo và
vùng thám sát.
FBI < 1: vùng dự báo nhỏ hơn vùng thám sát
FBI > 1: vùng dự báo lớn hơn vùng thám sát
FBI = 1: vùng dự báo trùng với vùng thám sát (giá trị lý tƣởng)
FBI

H F
H M

FBI là tỉ lệ giữa số lần có xảy ra hiện tƣợng theo mô hình và
theo quan trắc. Giá trị FBI biến đổi trong khoảng từ 0 đến +∞.
Footer Page 23 of 16.

21

(1. 6)


Header Page 24 of 16.


FBI càng nhỏ hơn 1 mô hình cho kết quả càng sai sót nhiều; FBI
càng lớn hơn 1 mô hình cho kết quả càng sai khống nhiều. Đại lƣợng
FBI chỉ cho biết mức độ phù hợp giữa mô hình và quan trắc về tần số
xuất hiện nhƣng không phản ánh độ chính xác của mô hình.
b. Xác suất phát hiện (Probability of Detection - POD)
POD

H
H M

(1. 7)

POD đƣợc hiểu là xác suất xuất hiện hiện tƣợng, bằng tỷ số giữa số lần
trùng khớp giữa mô hình và quan trắc khi hiện tƣợng có xuất hiện (hits) và tổng
số lần xuất hiện hiện tƣợng trong thực tế. POD cho biết khả năng thành công của
mô hình, có giá trị trong khoảng từ 0 đến 1, lý tƣởng là POD = 1 (mô hình đƣợc
xem là hoàn hảo). POD càng gần 1 thì độ chính xác của mô hình càng cao. POD
chỉ nhạy đối với những hiện tƣợng không dự báo đƣợc (misses events) chứ
không nhạy đối với phát hiện sai (false alarms).
c. Tỷ phần phát hiện sai (False Alarms Ratio - FAR)
FAR

F

(1. 8)

H F

FAR cho biết tỷ lệ mô phỏng/dự báo khống của mô hình (mô hình cho kết
quả có nhƣng thực tế hiện tƣợng không xảy ra). Giá trị của FAR biến đổi từ 0

cho đến 1. FAR=0 khi F=0, tức tỷ lệ khống của mô hình bằng 0. Giá trị của FAR
càng gần 0 thì mô hình càng tốt (tối ƣu). Ngƣợc lại, FAR càng tiệm cận tới 1
(tƣơng đƣơng với H tiến gần tới không) thì mô hình càng kém.
d. Điểm số thành công (Critical Success Index – CSI hay Threat Score – TS)
CSI

TS

H
M F H

(1. 9)

TS phản ánh mối quan hệ giữa số lần mô hình cho kết quả hiện tƣợng có
xuất hiện và số lần quan trắc đƣợc hiện tƣợng có xuất hiện. Nó có thể đƣợc xem
nhƣ thƣớc đo độ chính xác của mô hình khi bỏ qua không xem xét những trƣờng
hợp hiện tƣợng không xuất hiện. Phạm vi biến thiên của TS từ 0 đến 1. TS=0
nghĩa là mô hình không có kỹ năng, TS=1 – mô hình là hoàn hảo.

Footer Page 24 of 16.

22


Header Page 25 of 16.

e. Điểm số thành công hợp lý (Equitable Threat Score – ETS)
ETS có giá trị tốt nhất là 1.
H H random
M F H H random


ETS

(1. 10)

trong đó Hrandom là số dự báo đúng ngẫu nhiên xác định nhƣ sau

H random

(H F) * (H M)
total

(1. 11)

ETS cho biết mối quan hệ giữa số lần mô hình đúng (kể cả đúng do ngẫu
nhiên) so với quan trắc trong những trƣờng hợp hiện tƣợng có xuất hiện trong
thực tế. Phạm vi biến thiên của ETS là 1/3 đến 1. ETS=1 – mô hình là hoàn hảo.
Chỉ số ETS thƣờng đƣợc dùng trong đánh giá dự báo mƣa của mô hình số vì
tính “công bằng” của nó. Chỉ số này rất nhạy cảm với các dự báo đúng, vì nó xử
lý “F” và “M” theo cùng một cách, không phân biệt nguồn gốc của sai số dự
báo.
f. Điểm số so le (Odds Ratio)
OR

(1. 12)

H * CN
M*F

g. Điểm số Hanssen & Kuipers (HK hay TSS)

HK

TSS

H
H M

F
F CN

(1. 13)

TSS phản ánh mức độ tách biệt giữa những kết quả của mô hình đối với các sự
kiện có xảy ra và không xảy ra hiện tƣợng. Giá trị của TSS nằm trong khoảng -1
đến 1. TSS=0 là mô hình không có kỹ năng, TSS=1 thì mô hình là hoàn hảo.
h. Độ chính xác (Percentage Correct – PC hay Fraction Correct - FC)
PC

H CN
total

(1. 14)

FC phản ánh tỷ lệ trùng khớp giữa kết quả của mô hình và quan trắc trong
cả hai pha có và không xuất hiện hiện tƣợng. Giá trị của PC biến đổi trong
khoảng từ 0 đến 1. Nếu mô hình là hoàn hảo, tức kết quả mô hình trùng khớp
hoàn toàn với quan trắc thì PC bằng 1, ngƣợc lại, PC sẽ bằng 0 nếu tất cả mọi
trƣờng hợp kết quả của mô hình đều ngƣợc với quan trắc. PC càng lớn độ chính
xác mô phỏng, dự báo của mô hình càng cao.
Footer Page 25 of 16.


23


×