Tải bản đầy đủ (.pdf) (75 trang)

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ LƯỢNG MƯA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ CHO KHU VỰC VIỆT NAM

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (5.4 MB, 75 trang )

ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
----------o0o----------

PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƯỢNG MƯA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT SỐ CHO KHU VỰC VIỆT NAM

LUẬN VĂN THẠC SỸ KHOA HỌC

HÀ NỘI, 2011


ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-----------o0o-----------

PHẠM THỊ TUYẾT MÂY

ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƯỢNG MƯA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT SỐ CHO KHU VỰC VIỆT NAM

Chuyên ngành
Mã số

: Khí tượng và Khí hậu học
: 604487
LUẬN VĂN THẠC SỸ KHOA HỌC



NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS. VŨ THANH HẰNG

HÀ NỘI, 2011
ii


MỤC LỤC
MỤC LỤC .......................................................................................................................1
 
DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT......................................................2
 
DANH MỤC HÌNH VẼ ..................................................................................................3
 
MỞ ĐẦU .........................................................................................................................4
 
CHƯƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ
TƯỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ ........................................................................6
 
1.1. Bài toán đánh giá dự báo trong khí tượng ............................................................6
 
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá ..................................................6
 
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết .............................7
 
1.1.3. Sơ lược về tiêu chuẩn đánh giá ...................................................................10
 
1.1.4. Các loại yếu tố dự báo ................................................................................11
 

1.1.5. Các thuộc tính của một dự báo tốt ..............................................................11
 
1.2. Một số phương pháp và chỉ số đánh giá phổ biến ..............................................13
 
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số .....................13
 
1.2.2. Phương pháp đánh giá đối với biến liên tục ...............................................16
 
1.2.3. Phương pháp đánh giá đối với dự báo pha ................................................19
 
1.3. Cơ sở lý thuyết của phương pháp đánh giá fuzzy ..............................................22
 
1.3.1 Các phương pháp đánh giá fuzzy đặc trưng ................................................25
 
1.3.2. Ưu điểm của phương pháp đánh giá fuzzy .................................................29
 
1.4. Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam29
 
CHƯƠNG 2. KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM,
MM5 VÀ NGUỒN SỐ LIỆU SỬ DỤNG .....................................................................31
 
2.1. Giới thiệu về mô hình MM5 ..............................................................................31
 
2.1.1. Giới thiệu mô hình ......................................................................................31
 
2.1.2. Cấu trúc mô hình ........................................................................................31
 
2.1.3. Hệ các phương trình thủy nhiệt động lực của MM5 ...................................32
 
2.1.4. Điều kiện biên .............................................................................................32

 
2.1.5. Các quá trình tham số hóa ..........................................................................33
 
2.2. Giới thiệu về mô hình HRM ..............................................................................34
 
2.2.1. Giới thiệu mô hình ......................................................................................34
 
2.2.2. Cấu trúc lưới và phương pháp số ...............................................................35
 
2.2.3. Hệ các phương trình cơ bản .......................................................................35
 
2.2.4. Các quá trình tham số hóa vật lý ................................................................35
 
2.3. Số liệu.................................................................................................................36
 
CHƯƠNG 3. KẾT QUẢ ĐÁNH GIÁ NHIỆT ĐỘ VÀ LƯỢNG MƯA CỦA MÔ HÌNH
MM5 VÀ HRM CHO KHU VỰC VIỆT NAM ............................................................38
 
3.1. Kết quả đánh giá nhiệt độ...................................................................................38
 
3.2. Kết quả đánh giá lượng mưa ..............................................................................45
 
3.3. Kết quả thử nghiệm đánh giá bằng phương pháp fuzzy.....................................59
 
3.3.1. Kết quả đánh giá dự báo mưa cho chuỗi số liệu thử nghiệm .....................59
 
3.3.2. Thử nghiệm đánh giá kết quả dự báo mưa bằng phương pháp fuzzy cho Việt
Nam .......................................................................................................................64
 
KẾT LUẬN VÀ KIẾN NGHỊ .......................................................................................70

 
TÀI LIỆU THAM KHẢO .............................................................................................72
 
Tiếng Việt: .................................................................................................................72
 
Tiếng Anh: .................................................................................................................72
 
1


DANH MỤC CÁC KÝ HIỆU VÀ CHỮ VIẾT TẮT
BOM

Cơ quan khí tượng Australia

CMA

Tổng Cục Khí tượng Trung Quốc

CMC

Cơ quan Khí tượng Canađa

CS

Cộng sự

DWD

Tổng cục Thời tiết Cộng hòa liên bang Đức


ĐPG

Độ phân giải

ETA

Mô hình dự báo khu vực

GFS

Mô hình phổ toàn cầu

GME

Mô hình toàn cầu

HRM

Mô hình dự báo thời tiết phân giải cao (High
resolution Regional Model)

KTTV

Khí tượng Thủy văn

MM5

Mô hình Khí tượng động lực quy mô vừa


NCAR

Trung tâm Quốc gia Nghiên cứu Khí quyển Mỹ

NCKH

Nghiên cứu khoa học

NWP
TTDBTƯ

Mô hình dự báo số
Trung tâm Dự báo Khí tượng Thủy văn Trung ương

WRF

Mô hình khí quyển quy mô vừa

WMO

Tổ chức Khí tượng thế giới

2


DANH MỤC HÌNH VẼ
Hình 1. Sơ đồ chung cho đánh giá các yếu tố thời tiết ........................................................ 8
Hình 2. Sơ đồ chung đánh giá sản phẩm mô hình dự báo số (NWP) ............................... 15
Hình 3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trường hợp dự báo 00 giờ,
bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao) ...................................... 16

Hình 4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa .................. 19
Hình 5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tương thích cả về không gian
và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phương pháp fuzzy (vùng dự
báo tính đến cả miền lân cận quanh điểm quan trắc). ....................................................... 23
Hình 6. Cửa sổ quan trắc và dự báo của phương pháp đánh giá fuzzy ............................. 23
Hình 7. Sơ đồ lồng ghép hai miền tính cho MM5 ............................................................. 34
Hình 8. Các trạm quan trắc trong miền tính ...................................................................... 36
Hình 9. Nhiệt độ trung bình trong các tháng mùa hè tại các trạm. a) HRM1; b) OBS
(128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) ........................................................... 39
Hình 10. Nhiệt độ trung bình trong các tháng mùa đông tại các trạm. a) HRM1; b)
OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) .................................................. 40
Hình 11. Nhiệt độ trung bình của toàn chuỗi số liệu. a) HRM1; b) OBS (128 trạm) ; c)
HRM2; d) MM5; e) OBS (24 trạm) .................................................................................. 41
Hình 12. Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a), mùa hè (b), và trung bình toàn chuỗi số liệu (c) ......................................................... 42
Hình 13. Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a), mùa hè (b), và trung bình toàn chuỗi số liệu (c) ......................................................... 43
Hình 14. Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a), mùa hè (b), và trung bình toàn chuỗi số liệu (c) ......................................................... 44
Hình 15. Hệ số tương quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các khu
vực (b, c, d) ........................................................................................................................ 45
Hình 16. Giá trị mưa trung bình ngày trong các tháng mùa hè. a) HRM1; b) OBS (128
trạm); c) HRM2; d) MM5; e) OBS (24 trạm).................................................................... 46
Hình 17. Giá trị mưa trung bình ngày trong các tháng mùa đông. a) HRM1; b) OBS
(128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) ........................................................... 47
Hình 18. Giá trị mưa trung bình ngày của toàn chuỗi số liệu. a) HRM1; b) OBS (128
trạm); c) HRM2; d) MM5; e) OBS (24 trạm).................................................................... 48
Hình 19. Điểm số ME của mưa cho toàn Việt Nam và các khu vực trong các tháng mùa
đông (a), mùa hè (b), và trung bình cả chuỗi (c) ............................................................... 49
Hình 20. Điểm số MAE của mưa cho toàn Việt Nam và các khu vực trong các tháng

mùa đông (a), mùa hè (b), và trung bình cả chuỗi (c) ....................................................... 50
Hình 21. Chỉ số RMSE của mưa cho Việt Nam và các khu vực trong mùa đông (a), mùa
hè (b), và trung bình cả chuỗi (c) ...................................................................................... 51
Hình 22. Hệ số tương quan của mưa của các mô hình cho Việt Nam (a) và các khu vực
(b, c, d)............................................................................................................................... 53
Hình 23. Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa đông và mùa hè .. 54
Hình 24. Chỉ số TS các khu vực theo các ngưỡng mưa trong mùa đông và mùa hè. ....... 56
Hình 25. Chỉ số POD các khu vực theo các ngưỡng mưa trong mùa đông và mùa hè. .... 57
Hình 26. Chỉ số TSS các khu vực theo các ngưỡng mưa trong mùa đông và mùa hè. ..... 59
 

3


MỞ ĐẦU
Như chúng ta đã biết, khí hậu nói chung và thời tiết nói riêng ảnh hưởng đến mọi
mặt đời sống kinh tế - xã hội của loài người. Vì vậy việc dự báo các yếu tố khí hậu
cũng như thời tiết đang ngày càng quan trọng và cần thiết, trở thành mối quan tâm lớn
của tất cả các quốc gia trên thế giới. Và giờ đây nó càng trở nên cấp bách hơn bao giờ
hết khi ảnh hưởng của biến đổi khí hậu ngày càng sâu sắc đến hầu hết các nước trên thế
giới trong đó Việt Nam, cũng là một trong những quốc gia chịu ảnh hưởng nặng nề của
biến đổi khí hậu.
Trong nỗ lực tăng cường chất lượng dự báo, kết hợp với phương pháp dự báo
synop truyền thống trước đây, các mô hình dự báo số trị đã được đưa vào chạy dự báo ở
Việt Nam, đầu tiên là mô hình HRM, được thử nghiệm vào năm 2000. Cho đến nay đã
có nhiều mô hình khác nhau đang được chạy nghiệp vụ hoặc nghiên cứu tại một số
trung tâm tính toán của Việt Nam như HRM, ETA tại Trung Tâm Khí tượng Thủy văn
Trung ương, RAMS, HRM, WRF tại Khoa Khí tượng Thủy văn và Hải dương học,
Trường Đại học Khoa học Tự nhiên, MM5, WRF tại Viện Khoa học Khí tượng Thủy
văn và Môi trường.

Mỗi mô hình số đều chứa đựng các sai số sinh ra do số liệu ban đầu, do các quá
trình tham số hóa trong khí quyển chưa đủ chính xác... Bởi vậy, trước khi áp dụng một
mô hình số cần phải tìm ra được những điểm mạnh của mô hình để khai thác và sử
dụng đồng thời chỉ ra những điểm yếu để tìm cách khắc phục, đem lại hiệu quả cao hơn
cho công tác dự báo. Bên cạnh đó, kết quả đánh giá còn có thể cho biết về sai số hệ
thống của mô hình, là cơ sở cho việc hiệu chỉnh mô hình cho tốt hơn. Chính vì vậy, vấn
đề đánh giá định lượng sản phẩm của các mô hình số là rất cần thiết và có ý nghĩa khoa
học.
Bài toán đánh giá dự báo là đánh giá mức độ chính xác của mô hình hoặc mức
độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế
nhằm chỉ ra những ưu điểm, nhược điểm của mô hình, giúp cho các chuyên gia nghiên
cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lượng dự báo của mô
hình. Hơn nữa, kết quả đánh giá dự báo có thể đưa ra những thông tin giúp các nhà
quản lý quyết định có nên đầu tư cơ sở vật chất, trang thiết bị để phát triển mô hình hay
không.
Như chúng ta đã biết nhiệt độ và lượng mưa là hai yếu tố quan trọng và được
quan tâm nhiều nhất trong các bản tin dự báo thời tiết. Chính vì vậy, trong khuôn khổ
của luận văn tác giả tập trung vào việc đánh giá chất lượng dự báo 24h của nhiệt độ,
lượng mưa của hai mô hình dự báo thời tiết số được sử dụng phổ biến hiện nay ở Việt
Nam là mô hình HRM và mô hình MM5. Ngoài phần Mở đầu, Kết luận và Tài liệu
4


tham khảo, luận văn được bố cục cụ thể như sau:
Chương 1. Tổng quan về bài toán đánh giá dự báo trong khí tượng và các chỉ số
đánh giá.
Chương 2. Khái quát về các mô hình dự báo thời tiết số HRM, MM5 và nguồn
số liệu sử dụng.
Chương 3. Kết quả đánh giá nhiệt độ và lượng mưa của mô hình MM5 và HRM
cho khu vực Việt Nam.


5


CHƯƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ
TƯỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ
1.1. Bài toán đánh giá dự báo trong khí tượng
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá
Đánh giá chất lượng dự báo thời tiết nói chung là phương pháp thẩm tra đánh giá
và xác định định lượng mức độ chính xác của mô hình hoặc mức độ sai khác giữa các
sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế nhằm chỉ ra những
ưu điểm, nhược điểm của mô hình, giúp cho các chuyên gia nghiên cứu tìm kiếm các
giải pháp cải tiến, phát triển, nâng cao chất lượng dự báo của mô hình.
Có ba lý do quan trọng nhất để đánh giá dự báo là:
- Kiểm tra chất lượng dự báo – dự báo chính xác đến đâu và sẽ được cải tiến ra
sao.
- Nâng cao chất lượng dự báo: Bước đầu tiên để tiến tới dự báo tốt hơn là việc
tìm ra cái gì mà người làm dự báo đang làm sai.
- So sánh chất lượng của các hệ thống dự báo khác nhau – đến mức độ nào thì
một hệ thống dự báo được cho là dự báo tốt hơn so với những hệ thống dự báo khác và
bằng cách nào mà hệ thống dự báo đó đem lại kết quả tốt hơn như vậy.
Các hoạt động đánh giá chỉ hữu ích khi chúng đưa ra được các quyết định về sản
phẩm dự báo đang được đánh giá. Quyết định đó sẽ làm phát sinh những thay đổi trong
sản phẩm dự báo hoặc cách thức dự báo được thực hiện sau đó, hoặc quyết định đó xác
nhận và khẳng định sản phẩm dự báo thỏa mãn cho các mục đích của người sử dụng và
của xã hội. Các sản phẩm dự báo được phổ biến rộng rãi trong công chúng thì phải
được viết đủ khách quan để người sử dụng có thể kiểm tra, còn các số liệu quan trắc khí
quyển thực tế phải được thể hiện một cách chính xác những gì diễn ra trong thực tế.
Hơn nữa, một vài phương pháp đánh giá còn đòi hỏi quan trắc tại một điểm cũng có thể
đại diện một cách đầy đủ và khách quan các hiện tượng thời tiết xảy ra trong một khu

vực.
Chính tính cấp thiết trong các hoạt động đánh giá chất lượng dự báo thời tiết cho
thấy mục đích đánh giá phải được thiết lập trước khi hệ thống đánh giá được xác lập.
Từ đây các hoạt động đánh giá trong khí tượng cũng như trong các hoạt động dự báo
thời tiết có thể được phân chia thành hai mục đích chính là đánh giá hành chính và đánh
giá khoa học.
Mục đích hành chính: Các thông tin đánh giá trong mục đích quản lý hành chính
nhằm cung cấp thông tin cho việc mua sắm các trang thiết bị chính như các máy tính có
cấu hình cao hơn, tốc độ xử lý nhanh hơn,… Xác định khi nào, hoặc có nên thay thế
6


một sản phẩm đang được sử dụng bằng một sản phẩm dự báo mới hay không, và còn
nhiều các quyết định khác để phát triển tối ưu nguồn lực về con người cũng như các
nguồn trang thiết bị khác phục vụ cho công tác phát hành một bản tin dự báo thời tiết.
Mục đích khoa học: Đánh giá với mục đích khoa học là xác định một cách đầy
đủ và chi tiết ưu điểm cũng như nhược điểm của một sản phẩm dự báo. Các hoạt động
này giúp tìm ra các biện pháp thích hợp để cải thiện chất lượng dự báo phục vụ cũng
như cung cấp các thông tin để hoạch định phương hướng cho việc nghiên cứu và phát
triển tiếp theo.
Ngoài ra một số tác giả khác còn xét đến mục đích kinh tế nhưng đó là vấn đề rất
phức tạp nên trong giới hạn luận văn này không được đề cập đến.
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết
Hình 1 là một kiểu mô hình chung nhất để đánh giá dự báo các yếu tố thời tiết,
ngoài ra có thể có các mô hình đánh giá khác nữa. Tuy nhiên đây là mô hình cho thấy
bức tranh chi tiết nhất về quan hệ giữa đặc trưng của phép đánh giá các đại lượng đo và
các giải pháp khác nhau để có thể lựa chọn. Sơ đồ này sử dụng cho việc quyết định các
bước cần thiết phải được làm trước khi lựa chọn các phương pháp đánh giá cụ thể.
Tất cả các phương pháp đánh giá đều bắt đầu từ việc tập hợp các tập số liệu quan
trắc và dự báo (hình bình hành ở trên cùng trong Hình 1). Bước tiếp theo là xử lý số

liệu, bước này phụ thuộc vào việc quyết định của người sử dụng (hình thoi trong sơ
đồ). Quan trọng nhất là việc quyết định của người sử dụng lựa chọn mục đích đánh giá
hành chính hay khoa học như đã nêu ở trên.
Khi mục đích đánh giá đã được xác định, tiến hành phân loại các tập số liệu mẫu
theo mục đích đã định trước. Phân loại nghĩa là chia nhỏ các phần tử trong tập mẫu ra
thành hai hay nhiều nhóm theo một nguyên tắc đã định sẵn, sau đó thực hiện đánh giá
cho từng nhóm một cách riêng biệt. Trên Hình 1 đã chỉ ra hai kiểu phân loại là “Phân
loại ngoại bộ” và “Phân loại nội bộ”.
Phân loại ngoại bộ là kiểu phân loại mà nguyên tắc lựa chọn độc lập đối với các
yếu tố đang cần được đánh giá. Kiểu phân loại ngoại bộ phổ biến nhất là cho phép xác
định các biến đổi trong đánh giá theo thời gian trong ngày hoặc theo mùa. Phân loại
ngoại bộ có thể tiến hành ở bất cứ thời điểm nào trong quá trình trước khi tính toán các
đánh giá thống kê thực tế, và có thể được làm cho cả mục đích hành chính hay mục
đích khoa học.

7


Các tập số liệu
dùng để đánh giá

Mục đích
khoa học

Quản lý
hành
chính

Phân loại
ngoại bộ


Phân loại
ngoại bộ

Phân loại
nội bộ theo
quan trắc

Biến pha

Bảng liên hợp

Phân loại
nội bộ theo
dự báo

Biến liên tục

Đồ thị điểm

Biến pha

Bảng liên hợp

Biến liên tục

Phân loại
nội bộ theo
dự báo


Biến pha

Đồ thị điểm

Sai số trung bình tuyệt đối

Điểm Berier RPS

Nguyên lý phát hiện
tín hiệu

Biến liên tục

Sai số bình
phương trung bình

Bảng độ tin cậy
Điểm kỹ năng Brier

Độ giảm phương sai

Hệ số phân tán

Độ lệch (BIAS)

Hình 1. Sơ đồ chung cho đánh giá các yếu tố thời tiết
Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học thấy rằng, cần có một
nhu cầu phân loại cao hơn đối với tập mẫu. Chẳng hạn như, nếu ta quan tâm đến dự báo
cực trị thì tập mẫu sẽ phải được phân nhóm để tách các giá trị cực trị đó ra từ chuỗi các
sự kiện chung. Kiểu phân nhóm này được gọi là “phân loại nội bộ” bởi vì nguyên tắc

phân loại được quyết định bởi mục đích đánh giá và sử dụng chính yếu tố đang được
đánh giá. Có hai cách để thực hiện phân loại nội bộ, trên Hình 1 cho thấy sự khác nhau
8


trong kết quả đánh giá thu được từ hai cách phân loại đó.
Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khí tượng
quan trắc được. Sau đó, các tiêu chuẩn đánh giá có thể được tính toán cho từng nhóm
giá trị quan trắc và giá trị thống kê được tạo thành này gọi là giá trị có điều kiện đối với
quan trắc. Một ví dụ cho phân bố có điều kiện của dự báo là một giá trị đặc biệt hay
một phạm vi các giá trị quan trắc.
Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khí tượng
được dự báo. Cũng tương tự như trên, các giá trị thống kê được tính toán theo cách
phân loại này được gọi là điều kiện dự báo. Việc lựa chọn kiểu phân loại phụ thuộc vào
mục đích đánh giá. Trong nhiều trường hợp cần phải sử dụng kết hợp cả hai cách phân
loại trên để đưa ra một kết quả hoàn chỉnh. Hơn nữa, như đã thấy ở sơ đồ trên, những
đại lượng đánh giá khác nhau (hình ô van bên dưới) đặc trưng cho một kiểu phân nhóm
khác và đưa ra nhiều thông tin khác nhau về sản phẩm.
Một cách khác, trong đánh giá hành chính, người ta ít quan tâm chi tiết đến việc
biểu diễn những biến theo các giá trị khác nhau trong dự báo. Mà thay vào đó, các câu
hỏi đặt ra đều mang tính chung chung và chỉ cần một câu trả lời ngắn gọn xúc tích nào
đó. Vì vậy, phân loại nội bộ có thể vẫn được thực hiện nhưng nó hiếm khi được dùng
đến. Tuy nhiên, ưu điểm lớn của đánh giá hành chính là biểu diễn chất lượng sản phẩm
chỉ bằng vài con số hoặc việc so sánh thuận tiện hay hướng xác minh dễ dàng. Bản chất
chung của đánh giá hành chính có mối liên hệ mật thiết với các quy tắc điểm số tổng
kết được chỉ ra ở hình 1. Đôi khi việc tóm tắt cũng trở nên khó khăn khi phải cố gắng
tổng kết tất cả các thông tin về chất lượng sản phẩm chỉ trong một điểm số để cung cấp
cho nhà quản lý. Nhu cầu tóm tắt thông tin đánh giá chỉ bằng một con số gây ra một áp
lực lớn cho việc thiết kế hệ thống đánh giá để đảm bảo được rằng:
- Điểm số được lựa chọn theo yêu cầu là đáng tin cậy.

- Các sự kiện hợp thành đều được xem xét công bằng như nhau trong các điểm
số.
Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đều được xem

như nhau trong quá trình trung bình hóa. Điều này làm cho việc thực hiện thuận tiện
hơn (việc tính toán sẽ đơn giản hơn khi sử dụng đại lượng trung bình), nhưng cũng vì
thế mà rất khó để có thể tìm được một hàm trọng số chính xác và phản ánh đủ khách
quan cho các sự kiện hợp thành của mục đích sử dụng mà không có bất kỳ trở ngại nào
đối với các thuộc tính của điểm số. Làm thế nào để đưa ra các hàm trọng số của các sự
kiện hợp thành trong đánh giá tổng hợp vẫn còn là vấn đề chưa giải quyết được.
9


Trước đây, các điểm số đánh giá đã được đánh giá quá cao. Vì thế các dự báo
viên sớm thất vọng khi phải cố gắng sử dụng chúng để trả lời các câu hỏi về các vấn đề
mang tính chất khoa học. Tính chất của việc đánh giá tổng kết đó hạn chế việc sử dụng
trong mục đích khoa học bởi thiếu sự phân loại đánh giá bằng những điều kiện cho
trước. Ví dụ, điểm số tổng kết không thể nói mưa dự báo tốt như thế nào trong các
trường hợp ngưỡng thấp mà chỉ có thể nói mưa được dự báo tốt như thế nào một cách
chung chung. Không thể nói, dưới điều kiện nào mô hình phần tử hữu hạn khu vực RFE
(Regional Finite Element model) tốt hơn mô hình phổ, chỉ có thể nói rằng mô hình RFE
tốt hơn hoặc xấu hơn một chút so với mô hình phổ.
1.1.3. Sơ lược về tiêu chuẩn đánh giá
Các điểm số dùng trong đánh giá được minh họa theo từng cặp ở phía dưới hình
1 cho thấy mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị điểm là hoàn toàn
tương tự nhau, chúng cung cấp các dạng thông tin như nhau, bảng liên hợp xuất phát từ
yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến dự báo liên tục. Điểm tổng kết
luôn được phân loại theo cách này: Điểm Brier và điểm RP đều đo chính xác các đặc
tính của khả năng xảy ra hay biến pha, chúng tương tự sai số bình phương trung bình
của dự báo theo biến liên tục. Chú ý rằng dự báo pha không tương tự như sai số trung

bình tuyệt đối. Có hai loại đại lượng đo được phân loại tương ứng theo dự báo và quan
trắc là “Bảng độ tin cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó bảng liên hợp
và đồ thị điểm lại tổng quát hơn, cho phép phân loại theo một trong hai cách hoặc theo
cả hai cách. Nguyên lý phát hiện tín hiệu là một ý tưởng mới mẻ và hiện nay chưa được
sử dụng rộng rãi.
Các điểm số liệt kê trên hình 1 gồm 3 loại, đó là: điểm số tuyến tính, điểm số toàn
phương (bậc hai) và điểm số kỹ năng.
Điểm số toàn phương đưa ra trọng lượng của sai số theo bình phương của chúng
trong khi điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số toàn phương
thường đưa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm số này rất phù hợp
trong các trường hợp sai số lớn thực sự nghiêm trọng hơn sai số nhỏ.
Điểm số kỹ năng được xây dựng để đánh giá mối quan hệ giữa dự báo và một
giá trị chuẩn nào đó. Giá trị chuẩn được chọn lựa để mô tả một dự báo không kỹ năng.
Ba tiêu chuẩn được sử dụng để so sánh là: chuẫn ngẫu nhiên, chuẩn quán tính và
chuẩn khí hậu. Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và không yêu cầu hiểu
biết tri thức, chuẩn quán tính là một dự báo xác định và yêu cầu các hiểu biết về điều
kiện thời tiết, còn chuẩn khí hậu là một dự báo trạng thái thời tiết diễn ra trong khoảng
thời gian dài và cần phải có sự hiểu biết về tiến trình lịch sử của thời tiết. Điểm số kỹ
10


năng được biểu diễn trong công thức sau:

SS =

SC − ST
PS − ST

trong đó SC là điểm có được từ dự báo, ST là điểm đạt được từ dự báo chuẩn và PS là
điểm từ dự báo hoàn hảo. Điểm số kỹ năng có thể được hình thành từ việc sử dụng bất

kỳ một trong các điểm số. Điểm số kỹ năng phổ biến nhất dựa trên nền tảng của điểm
Brier (điểm kỹ năng Brier), điểm RP (điểm kỹ năng RP), các giá trị của bảng ngẫu
nhiên (điểm Heidke) và sai số trung bình tuyệt đối. Tiêu chuẩn thường được sử dụng
nhất là chuẩn khí hậu, còn điểm Heidke lại thường xuyên được kết hợp với chuẩn ngẫu
nhiên. Không có điểm kỹ năng cơ bản nào là quan trọng hơn, chúng bình đẳng như
nhau và đều biểu hiện đặc tính của kỹ năng.
1.1.4. Các loại yếu tố dự báo
Sau khi giải quyết xong những vấn đề về phân loại và những yêu cầu của một
mô hình đánh giá đã đặt ra cần lựa chọn một phương pháp thích hợp để đáp ứng các
yêu cầu đó. Hình chữ nhật trên hình 1 đưa ra gợi ý cho cách lựa chọn phù hợp tùy thuộc
vào bản chất dự báo được đánh giá. Phụ thuộc vào mục đích đánh giá người ta chia ra
thành hai dạng dự báo là: Dự báo các đại lượng liên tục và dự báo pha.
* Yếu tố dự báo liên tục: Là các yếu tố được dự báo tại một giá trị nhất định
hoặc trong một khoảng giá trị nào đó. Trong số các yếu tố thời tiết thì nhiệt độ, áp suất,
và gió là hay được dự báo theo cách này.
* Yếu tố dự báo pha: Là các yếu tố dự báo có thể xảy ra hoặc không xảy ra.
Chẳng hạn như xét sự xuất hiện của giáng thủy (có hoặc không), hoặc xét dạng giáng
thủy (băng, tuyết, nước)
Một số yếu tố có thể được dự báo liên tục hoặc dự báo pha tùy thuộc vào yêu
cầu của người sử dụng trong quá trình làm dự báo. Nhưng khi một dự báo mà cho kết
quả biến thiên liên tục thì phải được đánh giá theo pha bởi vì tất cả những thông tin đó
rất cần thiết cho người sử dụng.
* Dự báo xác suất được xem như là dự báo pha nhưng tổng quát hơn. Trong đó,
mỗi pha được gán bằng một xác suất xảy ra và tổng tất cả xác suất phải bằng 1 (tức là
một cái gì đó phải xảy ra). Dự báo pha là một dự báo xác suất thu hẹp, ở đây xác suất
chỉ có hai trường hợp xảy ra hoặc là 0% hoặc là 100% và hiển nhiên là một trong hai
trường hợp ấy chắc chắn sẽ xảy ra.
1.1.5. Các thuộc tính của một dự báo tốt
Do tính chất phức tạp của bài toán đánh giá, việc lựa chọn, sử dụng những chỉ số
11



nào để phản ánh được tất cả các khía cạnh là vấn đề khó khăn. Chẳng hạn, khi nói về
đánh giá chất lượng dự báo (có thể là của một mô hình) Murphy (1993) đã đưa ra 3
khái niệm để chỉ mức độ “tốt” của một dự báo là:
1) Độ chắc chắn (Consistency) của dự báo là mức độ phù hợp giữa dự báo và
kiến thức hiểu biết của dự báo viên;
2) Chất lượng dự báo (Quality) là mức độ phù hợp giữa dự báo với thực tế xảy
ra;
3) Ý nghĩa (hay giá trị - Value) của dự báo là mức độ mà dự báo có thể giúp cho
người ra quyết định thấy rõ hoặc đạt được lợi ích nào đó về kinh tế hoặc lợi ích khác.
Cũng theo Murphy (1993), đã đưa ra 9 khái niệm được gọi là 9 thuộc tính đóng
góp cho độ chắc chắn của dự báo như sau:
- Độ lệch (Bias): Là mức độ phù hợp giữa trung bình quan trắc và trung bình dự
báo.
- Tính liên kết (Association): Là mức độ chặt chẽ về quan hệ tuyến tính giữa dự
báo và quan trắc(chẳng hạn, hệ số tương quan là thước đo mối quan hệ tuyến tính này).
- Độ chính xác (Accuracy): Là thuật ngữ chung chỉ mức độ phù hợp giữa dự báo
và thực tế (xác định bởi quan trắc). Sai khác giữa giá trị quan trắc và giá trị dự báo
được gọi là sai số. Sự sai khác này càng nhỏ, sai số sẽ càng nhỏ, và độ chính xác sẽ
càng cao. Khó khăn của độ chính xác là ở chỗ khái niệm quy mô của độ chính xác,
nghĩa là ranh giới hay giới hạn có thể chấp nhận được.
- Kỹ năng dự báo (Skill): Kỹ năng hay độ chính xác tương đối là độ chính xác
của một dự báo so với một dự báo tham chiếu nào đó. Dự báo tham chiếu nói chung là
dự báo không có kỹ năng, như dự báo ngẫu nhiên (may rủi), dự báo quán tính, hoặc dự
báo khí hậu. Kỹ năng ám chỉ sự tăng lên của độ chính xác do hệ thống dự báo “thông
minh”.
- Độ tin cậy (Reliability): Là sự phù hợp trung bình giữa các giá trị dự báo và
các giá trị quan trắc. Nếu tất cả các trường hợp dự báo được xem xét khi đó độ tin cậy
trên toàn bộ giống như thiên hướng (bias). Nếu các trường hợp dự báo được phân chia

thành các khoảng khác nhau hoặc theo các phân hạng thì độ tin cậy giống như độ lệch
có điều kiện (conditional bias). Thông thường độ tin cậy được cải tiến nhờ Bias. Nhưng
sau khi cải tiến làm độ tin cậy của các dự báo tương đương tăng lên thì chính Bias lại sẽ
bị khử đi.
- Độ phân giải (Resolution): Là năng lực của dự báo có thể phân loại tập các sự
kiện thành các tập con có phân bố tần suất khác nhau. Điều đó có nghĩa là phân bố nhận
12


được khi “A” được dự báo khác với phân bố nhận được khi “B” được dự báo. Thậm chí
nếu các dự báo là sai, hệ thống dự báo có độ phân giải nếu nó có thể phân chia một
cách thành công phân bố của các dạng khác nhau. (Nói cách khác, có thể tách biệt được
các trường hợp dự báo thành những tập có cùng phân bố).
- Độ nhọn (hay độ nhạy bén - Sharpness): Là xu hướng của dự báo có thể dự
báo được các giá trị cực trị. Độ nhọn là một thuộc tính của dự báo, tương tự như độ
phân giải, một dự báo có thể có thuộc tính này ngay cả khi nó sai (trong trường hợp này
nó có thể là kém tin cậy);
- Độ phân biệt (hay độ phân lớp - Discrimination): Là khả năng của dự báo có
thể tách biệt các quan trắc thành những trường hợp có tần suất dự báo cao hơn, tức là có
khả năng phân lớp. Là khả năng của dự báo có thể tách biệt các quan trắc thành những
trường hợp có tần suất dự báo cao hơn, tức là có khả năng phân lớp.
- Độ biến động (hay tính không chắc chắn - Uncertainty): Là sự dao động của
các giá trị quan trắc trong tập mẫu đánh giá và không phụ thuộc vào giá trị dự báo. Đối
với các biến được dự báo theo pha thì độ biến động là 1 nếu sự kiện xảy ra và 0 nếu sự
kiện không xảy ra. Đại lượng này liên quan đến độ “khó khăn” của dự báo. Độ biến
động càng lớn có nghĩa là sẽ có những dao động lớn với nhiều tần số khác nhau trong
yếu tố dự báo đang được đánh giá và dĩ nhiên việc dự báo sẽ khó khăn hơn. Độ biến
động của từng tập số liệu sẽ rất khác nhau và do đó, việc so sánh giữa các con số đánh
giá thống kê của tập số liệu là hết sức mạo hiểm vì chúng thường rất nhạy với độ biến
động.

Theo truyền thống thì đánh giá dự báo tập trung nhấn mạnh vào độ chính xác và
kỹ năng dự báo. Nhưng cũng cần lưu ý rằng các thuộc tính khác của dự báo cũng ảnh
hưởng mạnh đến giá trị dự báo.
1.2. Một số phương pháp và chỉ số đánh giá phổ biến
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số
a. Những nguyên nhân gây sai số trong mô hình dự báo số
Để ứng dụng được một mô hình khu vực hạn chế vào trong nghiệp vụ dự báo
thời tiết đòi hỏi trước hết là phải đánh giá được sai số dự báo của mô hình so với thực
tế. Các nguyên nhân có thể đưa đến dự báo sai của mô hình số có thể tóm tắt như sau:
- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí quyển là
chưa hoàn chỉnh;
- Ảnh hưởng của địa hình đến kết quả dự báo (thường không được mô hình số
mô tả hoàn chỉnh);
13


- Các quá trình vật lý và các sơ đồ tham số hóa chưa thật sự hoàn thiện;
- Một số giả thiết không thực sự phù hợp được đưa ra để có thể giải được hệ
phương trình thủy nhiệt động lực học mô tả khí quyển thực.
- Điều kiện biên và điều kiện ban đầu của các biến khí tượng là chưa hoàn chỉnh
và phụ thuộc khá nhiều vào địa hình. Các trạm thám sát thưa thớt, đặc biệt là vùng nhiệt
đới;
- Các kết quả nhận được chứa đựng những sai số khi giải các công thức toán học
bằng phương pháp gần đúng, ...
b. Nguyên lý chung cho việc đánh giá mô hình dự báo số
Hình 2 phác họa nguyên lý chung cho việc đánh giá mô hình dự báo số, phù hợp
với nguyên lý đánh giá các yếu tố khí tượng được trình bày trên Hình 1. Việc đánh giá
được bắt đầu với một tập số liệu bao gồm cả số liệu dự báo và số liệu quan trắc và bộ số
liệu này phải tương thích với nhau cả về không gian lẫn thời gian. Tương thích về
không gian, số liệu quan trắc có thể sẽ được phân tích về lưới dự báo hoặc số liệu dự

báo có thể được nội suy theo không gian về các điểm quan trắc. Tuy nhiên, cách phân
tích số liệu quan trắc về lưới dự báo ít được dùng hơn vì nó không phản ánh đúng thực
tế so với cách nội suy số liệu dự báo về các điểm quan trắc. Những nhận định này trở
nên hết sức quan trọng đối với việc đánh giá nếu việc phân tích là trường kiểm nghiệm
sản phẩm đầu ra của mô hình đang được đánh giá. Trong trường hợp này sẽ có một độ
lệch nào đó trong những kết quả của mô hình. Vì vậy, điều quan trọng trong đánh giá
mô hình là phải luôn ghi nhớ thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kết quả.
Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra là những vấn
đề quyết định cần giải quyết phải được làm cho mục đích đánh giá trước khi một hệ
thống đánh giá được thiết lập. “Đánh giá hành chính” trả lời câu hỏi về xu hướng trong
kỹ năng và độ chính xác của mô hình và thường được sử dụng để so sánh độ chính xác
của hai mô hình khác nhau. Tương tự như đánh giá các yếu tố thời tiết cho những mục
đích hành chính, có một khuynh hướng nhằm giảm thiểu các kết quả chỉ bằng một vài
con số thông qua việc sử dụng các điểm số tổng kết.
“Đánh giá khoa học” bao gồm câu trả lời cho các câu hỏi về sự thay đổi theo
không gian cũng như thời gian trong việc biểu diễn của mô hình để đưa ra thông tin có
thể phản hồi lại cho các nhà phát triển mô hình để cải tiến thêm mô hình hoặc các dự
báo viên phải thay đổi hướng dự báo. Một ví dụ đơn giản là việc đánh giá các đặc trưng
là khu vực áp thấp hay front. Bộ số liệu đánh giá phải được sắp xếp cẩn thận theo các
đặc trưng đó, và điều này có thể được thực hiện theo một trong hai hướng đó là theo cơ
sở của các đặc trưng quan trắc hay theo cơ sở của các đặc trưng dự báo.
14


“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá theo mùa
hoặc theo thời gian chạy mô hình hoặc theo các quy luật chọn lựa khác độc lập với các
tham số đang được đánh giá. Phân loại theo mùa là cách sử dụng phổ biến để phát hiện
sự khác nhau trong đặc trưng riêng giữa các mùa.

Các tập số liệu

dùng để đánh giá

Quản lý
hành
chính

Mục đích
khoa học

Phân loại
ngoại bộ

Phân loại
theo không
gian
Phân loại
nội bộ
Sai số trung bình tuyệt đối

Sai số bình phương trung bình

Sai số đường đi

Thẩm định trung tâm áp suất
Điểm kỹ năng (Độ suy giảm phương sai)

Độ lệch trung tâm

Các trường hợp nghiên cứu


Hệ số phân tán

Lỗi hệ thống

Độ lệch (BIAS)

Tương quan dị thường

Điểm số S1

Hình 2. Sơ đồ chung đánh giá sản phẩm mô hình dự báo số (NWP)
15


Phân loại theo không gian có thể được làm cho cả mục đích hành chính và mục
đích khoa học. Phân loại theo không gian được tiến hành theo mục đích hành chính để
thấy được sự khác biệt về độ chính xác giữa các vùng của mô hình tương ứng với các
vùng địa lý hành chính của đất nước. Khi phân loại theo không gian được tiến hành
theo mục đích khoa học, các khu vực có quy mô dưới lưới được ưu tiên lựa chọn để
phản ánh các chế độ khí hậu khác nhau như các khu vực có địa hình đồi núi, các vùng
núi khuất gió, bờ biển,…
1.2.2. Phương pháp đánh giá đối với biến liên tục
1.2.2.1. Phương pháp toán đồ tụ điểm
Hệ số tương quan = 0.595

Hệ số tương quan = 0.789

Tốc độ gió mô hình PPR (kts)

Tốc độ gió mô hình PPR (kts)


Hình 3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trường hợp dự báo 00 giờ,
bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao)
Toán đồ tụ điểm là phương pháp đơn giản nhất, chủ yếu phục vụ cho các biến
liên tục như nhiệt độ và gió, thường gồm tất cả các điểm số ứng với mỗi cặp dự báo –
quan trắc tương ứng trên cùng một đồ thị với tung độ và hoành độ có tỷ lệ như nhau.
Trường hợp lý tưởng là các điểm số nằm trên một đường thẳng đi qua gốc tọa độ và tạo
với trục hoành một góc 450 (giá trị dự báo bằng giá trị quan trắc). Đường 450 này
thường được vẽ ra để thuận tiện cho việc nội suy các điểm rời rạc.
Hình 3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển. Mỗi điểm “x” đại
diện cho ít nhất một lần xuất hiện của cặp dự báo – quan trắc riêng lẻ. Trên mỗi đồ thị
còn có một đường thẳng thứ hai mà có thể không đi qua gốc tọa độ, đó chính là đường
hồi quy bình phương tối thiểu tương ứng với tập số liệu quan trắc.
16


Nếu dự báo là hoàn hảo thì đường hồi quy sẽ trùng với đường 450. Sự phù hợp
giữa đường hồi quy và đường 450 cho thấy chất lượng của dự báo. Chất lượng dự báo
sẽ giảm đi nếu đường hồi quy có khuynh hướng lệch theo chiều nằm ngang hơn. Nếu
đường hồi quy nằm ngang hoàn toàn thì khi đó quan trắc hoàn toàn độc lập với dự báo.
Một đại lượng đánh giá khác có thể ước lượng từ đồ thị điểm là sai số bình
phương hoặc độ lệch. Hình 3 chỉ ra một đồ thị điểm khác cho dự báo nhiệt độ khách
quan (sản phẩm mô hình thống kê). Tập số liệu mẫu là 701 trường hợp (số liệu này
được lấy từ 11 trạm vùng Đại Tây Dương - CASSP). Trong đồ thị này không thấy xuất
hiện các dấu “x” như đồ thị trước, thay vào đó là các con số. Các số trên đồ thị này biểu
hiện số trường hợp các cặp giá trị nhiệt độ quan trắc - dự báo tương ứng với đồ thị
điểm.
Một đồ thị điểm mô tả phân loại cơ bản từ tất cả các trường hợp được miêu tả
riêng rẽ. Điều này cho phép cân nhắc một cách linh hoạt cho phân tích số liệu. Giả sử 200C và +100C được chọn như là ngưỡng của nhiệt độ cực trị, giá trị này có thể nhận
được từ phân tích trên đồ thị. Tất cả các điểm, ở đây nhiệt độ quan trắc nằm trong giới

hạn của cực trị và không có nhiệt độ dự báo được gọi là miền các sự kiện dự báo sót
(missed events) và tất cả các điểm ở đây giá trị dự báo nằm trong phạm vi cực trị và
không quan trắc được gọi là miền báo động sai (false alarms). Miền các sự kiện dự báo
sót và miền báo động sai có thể thấy trên đồ thị. Qua đồ thị có thể thấy, tất cả nhiệt độ
có giá trị cao nhất đã bị bỏ sót (dự báo dưới ngưỡng) trong khi đó nhiệt độ thấp xảy ra ở
cả hai miền các sự kiện dự báo sót và miền báo động sai.
Phân loại trên cơ sở quan trắc chỉ cho phép nhận dạng miền các sự kiện dự báo
sót (đường ngang vẽ đậm ở các giá trị ngưỡng). Phân loại trên cơ sở dự báo chỉ cho
phép nhận dạng được miền báo động sai (đường đứng vẽ đậm ở các giá trị ngưỡng). Từ
đây có thể thấy rằng điều quan trọng nhất là phải sử dụng cả hai kiểu phân loại để nhận
được thông tin đầy đủ và hoàn hảo về một sản phẩm đang được đánh giá. Ví dụ những
giá trị thấp nhất đã bị bỏ sót có thể lấy lại được đơn giản bằng cách tưởng tượng di
chuyển tất cả các điểm trên đồ thị đến bên trái giá trị ngưỡng 100C, nhưng cái giá phải
trả cho việc hiệu chỉnh này là sự tăng lên đột ngột trong miền báo động sai. Điều này sẽ
không nhìn thấy nếu phân loại trên cơ sở của một mình quan trắc. Do vậy luôn luôn có
thể hiệu đính cho sự kiện cực trị đã bị bỏ sót.
Phân loại trên cơ sở dự báo có lẽ có ích hơn cho hiểu biết về ý nghĩa thực của dự
báo. Thông tin chi tiết về ý nghĩa của dự báo cho các nhiệt độ khác nhau có thể nhận
được từ một chuỗi phân bố có điều kiện cho mỗi nhiệt độ dự báo hoặc cho phạm vi của
nhiệt độ.
1.2.2.2 Các chỉ số đánh giá
17


Trong các công thức dưới đây, Fi và Oi tương ứng là giá trị mô hình và giá trị
quan trắc của một biến nào đó (nhiệt độ, lượng mưa), i=1,2,…, N, N là dung lượng
mẫu.
a. Sai số trung bình (ME - Mean Error)

1 N

ME = ∑ (Fi − Oi )
N i=1

(1. 1)

Giá trị của ME nằm trong khoảng (-∞, +∞). ME cho biết xu hướng lệch trung
bình của giá trị dự báo so với giá trị quan trắc, nhưng không phản ánh độ lớn của sai số.
ME dương cho biết giá trị dự báo vượt quá giá trị quan trắc và ngược lại. Mô hình được
xem là “hoàn hảo” (không thiên lệch về một phía nào cả) nếu ME=0.
b. Sai số tuyệt đối trung bình (MAE-Mean Absolute Error)

1 N
MAE =
∑ Fi − Oi
N i =1

(1. 2)

Giá trị MAE nằm trong khoảng (0,+∞). MAE biểu thị biên độ trung bình của sai
số mô hình nhưng không nói lên xu hướng lệch của giá trị dự báo và quan trắc. Khi
MAE = 0, giá trị của mô hình hoàn toàn trùng khớp với giá trị quan trắc, mô hình được
xem là “lý tưởng”. Thông thường MAE được sử dụng cùng với ME để đánh giá độ tin
cậy. Chẳng hạn, nếu MAE của sản phẩm khác biệt hẳn so với ME thì việc hiệu chỉnh là
hết sức mạo hiểm. Trong trường hợp ngược lại, khi mà MAE và ME tương đối “sát”
với nhau thì có thể dùng ME để hiệu chỉnh sản phẩm dự báo một cách đáng tin cậy.
c. Sai số bình phương trung bình MSE (Mean Square Error)

MSE =

1 N

2
∑ (Fi − O i )
N i =1

(1.

3)
MSE là trung bình của tổng bình phương của hiệu giữa các giá trị mô hình và quan trắc,
phản ánh mức độ dao động của sai số. Mô hình là “lí tưởng” nếu MSE=0.
d. Sai số bình phương trung bình quân phương (RMSE - Root mean square Error)

RMSE =

1 N
2
∑ (Fi − Oi )
N i=1

(1. 4)

Sai số bình phương trung bình là một trong những đại lượng cơ bản và thường
được sử dụng phổ biến cho việc đánh giá kết quả của mô hình dự báo số trị. Người ta
thường hay sử dụng đại lượng sai số bình phương trung bình quân phương (RMSE)
18


biểu thị độ lớn trung bình của sai số. Đặc biệt RMSE rất nhạy với những giá trị sai số
lớn. Do đó nếu RMSE càng gần MAE sai số mô hình càng ổn định và có thể thực hiện
việc hiệu chỉnh sản phẩm mô hình. Giống như MAE, RMSE không chỉ ra độ lệch giữa
giá trị dự báo và giá trị quan trắc. Giá trị của RMSE nằm trong khoảng (0,+ ∞)

Khi so sánh MAE và RMSE ta thấy: RMSE ≥ MAE. Còn RMSE = MAE khi và
chỉ khi tất cả các sai số có độ lớn như nha0u: RMSE = MAE =0.
e. Hệ số tương quan (Correlation coefficient)
N

∑ ( F − F )(O − O)
i

r=

i

i =1

N

N

2

∑ ( F − F ) ∑ (O − O)
i

i =1

(1. 5)
2

i


i =1

Hệ số tương quan (r) cho phép đánh giá mối quan hệ tuyến tính giữa tập giá trị
dự báo và tập giá trị quan trắc. Giá trị của nó biến thiên trong khoảng -1 đến 1, giá trị
hoàn hảo bằng 1. Giá trị tuyệt đối của hệ số tương quan càng lớn thì mối quan hệ tuyến
tính giữa hai biến càng chặt chẽ. Hệ số tương quan dương phản ánh mối quan hệ cùng
chiều (đồng biến), ngược lại, hệ số tương quan âm biểu thị mối quan hệ ngược chiều
(nghịch biến) giữa dự báo và quan trắc.
1.2.3. Phương pháp đánh giá đối với dự báo pha
Đánh giá thống kê theo loại (categorical statistics) là loại tiêu chuẩn đánh giá sự
phù hợp giữa sự xảy ra hiện tượng dự báo và hiện tượng quan trắc tại nút lưới.
Các điểm số đánh giá được dựa vào bảng ngẫu nhiên sau (Damrath, 2002):

Hình 4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa
Hits (H) = dự báo có + quan trắc có
Misses (M) = dự báo không + quan trắc có
19


False alarms (F) = dự báo có + quan trắc không
Correct negatives (CN) = dự báo không + quan trắc không
Dưới đây là một vài điểm số thường dùng trong đánh giá dự báo mưa định lượng ở trên
thế giới:
a. Chỉ số FBI (BS hay FBI - Bias score): Đánh giá tỷ số giữa vùng dự báo và vùng
thám sát.
FBI < 1: vùng dự báo nhỏ hơn vùng thám sát
FBI > 1: vùng dự báo lớn hơn vùng thám sát
FBI = 1: vùng dự báo trùng với vùng thám sát (giá trị lý tưởng)

FBI =


H+F
H+M

(1. 6)

FBI là tỉ lệ giữa số lần có xảy ra hiện tượng theo mô hình và theo
quan trắc. Giá trị FBI biến đổi trong khoảng từ 0 đến +∞.
BIAS càng nhỏ hơn 1 mô hình cho kết quả càng sai sót nhiều; BIAS
càng lớn hơn 1 mô hình cho kết quả càng sai khống nhiều. Đại lượng BIAS
chỉ cho biết mức độ phù hợp giữa mô hình và quan trắc về tần số xuất hiện
nhưng không phản ánh độ chính xác của mô hình.
b. Xác suất phát hiện (Probability of Detection - POD)

POD =

H
H+M

(1. 7)

POD được hiểu là xác suất xuất hiện hiện tượng, bằng tỷ số giữa số lần trùng
khớp giữa mô hình và quan trắc khi hiện tượng có xuất hiện (hits) và tổng số lần xuất
hiện hiện tượng trong thực tế. POD cho biết khả năng thành công của mô hình, có giá
trị trong khoảng từ 0 đến 1, lý tưởng là POD = 1 (mô hình được xem là hoàn hảo). POD
càng gần 1 thì độ chính xác của mô hình càng cao. POD chỉ nhạy đối với những hiện
tượng không dự báo được (misses events) chứ không nhạy đối với phát hiện sai (false
alarms).
c. Tỷ phần phát hiện sai (False Alarms Ratio - FAR)


F
FAR =
H+F

20

(1. 8)


FAR cho biết tỷ lệ mô phỏng/dự báo khống của mô hình (mô hình cho kết quả
có nhưng thực tế hiện tượng không xảy ra). Giá trị của FAR biến đổi từ 0 cho đến 1.
FAR=0 khi F=0, tức tỷ lệ khống của mô hình bằng 0. Giá trị của FAR càng gần 0 thì
mô hình càng tốt (tối ưu). Ngược lại, FAR càng tiệm cận tới 1 (tương đương với H tiến
gần tới không) thì mô hình càng kém.
d. Điểm số thành công (Critical Success Index – CSI hay Threat Score – TS)

CSI = TS =

H
M+F+H

(1. 9)

TS phản ánh mối quan hệ giữa số lần mô hình cho kết quả hiện tượng có xuất
hiện và số lần quan trắc được hiện tượng có xuất hiện. Nó có thể được xem như thước
đo độ chính xác của mô hình khi bỏ qua không xem xét những trường hợp hiện tượng
không xuất hiện. Phạm vi biến thiên của TS từ 0 đến 1. TS=0 nghĩa là mô hình không
có kỹ năng, TS=1 – mô hình là hoàn hảo.
e. Điểm số thành công hợp lý (Equitable Threat Score – ETS)
ETS có giá trị tốt nhất là 1.


ETS =

H − H random
M + F + H − H random

(1. 10)

trong đó Hrandom là số dự báo đúng ngẫu nhiên xác định như sau

H random

(H + F) * (H + M)
=
total

(1. 11)

ETS cho biết mối quan hệ giữa số lần mô hình đúng (kể cả đúng do ngẫu nhiên)
so với quan trắc trong những trường hợp hiện tượng có xuất hiện trong thực tế. Phạm vi
biến thiên của ETS là 1/3 đến 1. ETS=0 nghĩa là mô hình không có kỹ năng, ETS=1 –
mô hình là hoàn hảo. Chỉ số ETS thường được dùng trong đánh giá dự báo mưa của mô
hình số vì tính “công bằng” của nó. Chỉ số này rất nhạy cảm với các dự báo đúng, vì nó
xử lý “F” và “M” theo cùng một cách, không phân biệt nguồn gốc của sai số dự báo.
f. Điểm số so le (Odds Ratio)

OR =

H * CN
M*F


(1. 12)

g. Điểm số Hanssen & Kuipers (HK hay TSS)

HK = TSS =

H
F

H + M F + CN
21

(1. 13)


TSS phản ánh mức độ tách biệt giữa những kết quả của mô hình đối với các sự kiện có
xảy ra và không xảy ra hiện tượng. Giá trị của TSS nằm trong khoảng -1 đến 1. TSS=0
là mô hình không có kỹ năng, TSS=1 thì mô hình là hoàn hảo.
h. Độ chính xác (Percentage Correct – PC hay Fraction Correct - FC)

PC =

H + CN
total

(1. 14)

FC phản ánh tỷ lệ trùng khớp giữa kết quả của mô hình và quan trắc trong cả hai
pha có và không xuất hiện hiện tượng. Giá trị của PC biến đổi trong khoảng từ 0 đến 1.

Nếu mô hình là hoàn hảo, tức kết quả mô hình trùng khớp hoàn toàn với quan trắc thì
PC bằng 1, ngược lại, PC sẽ bằng 0 nếu tất cả mọi trường hợp kết quả của mô hình đều
ngược với quan trắc. PC càng lớn độ chính xác mô phỏng, dự báo của mô hình càng
cao.
1.3. Cơ sở lý thuyết của phương pháp đánh giá fuzzy
Những dự báo có độ phân giải cao của các mô hình số trị có thể khá chính xác
và cung cấp cho dự báo viên những thông tin rất hữu ích. Tuy nhiên, khi đánh giá sử
dụng các phương pháp truyền thống chúng lại thường có kết quả (score) không tốt bởi
vì rất khó khăn trong việc dự báo trùng khớp chính xác với quan trắc ở độ phân giải
cao. Đánh giá “fuzzy” tiến tới trùng khớp bằng cách làm giảm yêu cầu về mức độ chính
xác giữa dự báo và quan trắc. Mấu chốt của cách tiếp cận fuzzy là việc sử dụng một cửa
sổ không gian (spatial window) hoặc vùng lân cận các điểm dự báo và/hoặc quan trắc.
Việc xử lý số liệu trong cửa sổ có thể bao gồm trung bình (nâng qui mô), ngưỡng, hoặc
phát sinh của một PDF, phụ thuộc vào phương pháp fuzzy đặc biệt được sử dụng và mô
hình giải quyết ẩn nó liên quan tới việc làm thế nào để có một dự báo tốt. Kích thước
của vùng lân cận có thể được thay đổi để cung cấp các kết quả đánh giá ở nhiều kích
thước, do đó cho phép người sử dụng xác định tại kích thước nào thì dự báo có kỹ năng
tốt.
Phương pháp đánh giá fuzzy cho phép vùng dự báo có thể không thật trùng khớp
với vùng thám sát. Mức chênh lệch cho phép được xác định bởi một vùng lân cận địa
phương. Sự khác nhau giữa phương pháp đánh giá truyền thống và phương pháp đánh
giá fuzzy được thể hiện trong hình 5:

22


a. Quan trắc

b. Dự báo
(Đánh giá truyền thống)


c. Dự báo
(Đánh giá fuzzy)

Hình 5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tương thích cả về không
gian và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phương pháp fuzzy
(vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc).
Không phải dễ dàng chỉ ngay ra được kích thước vùng lân cận thích hợp. Nó còn
phụ thuộc vào khoảng cách lưới, độ phân giải thời gian, và trạng thái thời tiết, vì vậy
một giá trị đơn lẻ có thể không thích hợp cho tất cả các loại dự báo cũng như các miền
tính.
Phương pháp đánh giá fuzzy giải quyết được điều này bằng cách thay đổi kích
thước của miền lân cận, bởi vậy nó đem lại các thông tin cho chất lượng dự báo như là
một hàm của quy mô.
Một số phương pháp đánh giá fuzzy giả định rằng các ô lưới lân cận của vùng
quan trắc cũng được mở rộng tương ứng như vùng dự báo. Đây là một trong những
cách thể hiện sự không chắc chắn trong quan trắc. Trường hợp này được thể hiện trong
hình 1.6, được gọi là vùng quan trắc – vùng dự báo.

a. Quan trắc

b. Dự báo

(Đánh giá fuzzy)

(Đánh giá fuzzy)

Hình 6. Cửa sổ quan trắc và dự báo của phương pháp đánh giá fuzzy
Để mô tả kỹ phương pháp đánh giá fuzzy, một số các ký hiệu được thiết lập như
sau:

23


×