Tải bản đầy đủ (.pdf) (84 trang)

đánh giá kết quả dự báo nhiệt độ và lượng mưa của một số mô hình dự báo thời tiết cho khu vực việt nam

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (2.58 MB, 84 trang )


TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
o0o





PHẠM THỊ TUYẾT MÂY




ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT CHO KHU VỰC VIỆT NAM






LUẬN VĂN THẠC SỸ KHOA HỌC















HÀ NỘI, 2012

ii

TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
o0o





PHẠM THỊ TUYẾT MÂY



ĐÁNH GIÁ KẾT QUẢ DỰ BÁO NHIỆT ĐỘ VÀ
LƢỢNG MƢA CỦA MỘT SỐ MÔ HÌNH DỰ BÁO
THỜI TIẾT CHO KHU VỰC VIỆT NAM



Chuyên ngành : Khí tƣợng và Khí hậu học
Mã số : 60 44 87



LUẬN VĂN THẠC SỸ KHOA HỌC



NGƢỜI HƢỚNG DẪN KHOA HỌC:
TS. VŨ THANH HẰNG






HÀ NỘI, 2012

1
MỤC LỤC
MỤC LỤC 1
CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG KHÍ
TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ 6
1.1. Bài toán đánh giá dự báo trong khí tƣợng 6
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá 6
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết 7
1.1.3. Sơ lược về tiêu chuẩn đánh giá 10
1.1.4. Các loại yếu tố dự báo 11
1.1.5. Các thuộc tính của một dự báo tốt 12
1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến 14
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số 14
1.2.2. Phương pháp đánh giá đối với biến liên tục 17
1.2.3. Phương pháp đánh giá đối với dự báo pha 21

1.3. Cơ sở lý thuyết của phƣơng pháp đánh giá fuzzy 24
1.4. Tình hình nghiên cứu chung liên quan đến đề tài trên thế giới và tại Việt Nam33
CHƢƠNG 2. KHÁI QUÁT VỀ CÁC MÔ HÌNH DỰ BÁO THỜI TIẾT SỐ HRM,
MM5 VÀ NGUỒN SỐ LIỆU SỬ DỤNG 36
2.1. Giới thiệu về mô hình MM5 36
2.1.1. Giới thiệu mô hình 36
2.1.2. Cấu trúc mô hình 36
2.1.3. Hệ các phương trình thủy nhiệt động lực của MM5 37
2.1.4. Điều kiện biên 37
2.1.5. Các quá trình tham số hóa 38
2.2. Giới thiệu về mô hình HRM 40
2.2.1. Giới thiệu mô hình 40
2.2.2. Cấu trúc lưới và phương pháp số 40
2.2.3. Hệ các phương trình cơ bản 40
2.2.4. Các quá trình tham số hóa vật lý 41
2.3. Số liệu 42
CHƢƠNG 3. KẾT QUẢ ĐÁNH GIÁ NHIỆT ĐỘ VÀ LƢỢNG MƢA CỦA MÔ
HÌNH MM5 VÀ HRM CHO KHU VỰC VIỆT NAM 45
3.1. Kết quả đánh giá nhiệt độ 45
3.2. Kết quả đánh giá lƣợng mƣa 51
3.3. Kết quả thử nghiệm đánh giá mƣa bằng phƣơng pháp fuzzy 66
3.3.1. Kết quả thử nghiệm với chuỗi số liệu mẫu 66
3.3.2. Thử nghiệm đánh giá kết quả dự báo mưa bằng phương pháp fuzzy cho
Việt Nam 71
3.3.2.1. Thử nghiệm đánh giá cho dự báo mưa do bão gây ra 71
3.3.2.2. Thử nghiệm đánh giá cho dự báo mưa do không khí lạnh gây ra 75
KẾT LUẬN 79
TÀI LIỆU THAM KHẢO 81
Tiếng Việt: 81
Tiếng Anh: 81





2
DANH MỤC HÌNH VẼ

Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết 8
Hình 1.2. Sơ (NWP) 16
Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trƣờng hợp dự báo 00 giờ,
bên phải là trƣờng hợp dự báo 36 giờ (số liệu lấy từ trạm phao) 17
Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lƣợng dự báo mƣa 21
Hình 1.5. a. Miền quan trắc; b. Đánh giá truyền thống (phải tƣơng thích cả về không
gian và thời gian giữa dự báo và quan trắc); c. Đánh giá bằng phƣơng pháp fuzzy
(vùng dự báo tính đến cả miền lân cận quanh điểm quan trắc). 24
Hình 1.6. Cửa sổ quan trắc và dự báo của phƣơng pháp đánh giá fuzzy 25
Hình 2.1. Sơ đồ lồng ghép hai miền tính cho MM5 39
Hình 2.2. Các trạm quan trắc trong miền tính 43
Hình 3.1. Nhiệt độ trung bình trong các tháng mùa hè tại các trạm. a) HRM1; b) OBS
(128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 46
Hình 3.2. Nhiệt độ trung bình trong các tháng mùa đông tại các trạm. a) HRM1; b)
OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 47
Hình 3.3. Sai số ME của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a) và mùa hè (b) 48
Hình 3.4. Sai số MAE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa đông
(a) và mùa hè (b) 49
Hình 3.5. Sai số RMSE của nhiệt độ cho toàn Việt Nam và các khu vực trong mùa
đông (a) và mùa hè (b) 50
Hình 3.6. Hệ số tƣơng quan nhiệt độ của các mô hình cho toàn Việt Nam (a) và các
khu vực (b, c, d) 51

Hình 3.7. Giá trị trung bình mƣa tích lũy 24 giờ trong các tháng mùa hè. a) HRM1; b)
OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 52
Hình 3.8. Giá trị trung bình mƣa tích lũy 24 giờ trong các tháng mùa đông. a) HRM1;
b) OBS (128 trạm); c) HRM2; d) MM5; e) OBS (24 trạm) 53
Hình 3.9. Điểm số ME của mƣa cho toàn Việt Nam và các khu vực trong các tháng
mùa đông (a) và mùa hè (b) 54
Hình 3.10. Điểm số MAE của mƣa cho toàn Việt Nam và các khu vực trong các tháng
mùa đông (a) và mùa hè (b) 55
Hình 3.11. Chỉ số RMSE của mƣa cho Việt Nam và các khu vực trong mùa đông (a)
và mùa hè (b) 56
Hình 3.12. Hệ số tƣơng quan của mƣa của các mô hình cho Việt Nam (a) và các khu
vực (b, c, d) 58
Hình 3.13 . Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa đông 59
Hình 3.14. Chỉ số FBI cho Việt Nam và các khu vực trong thời kỳ mùa hè 59
Hình 3.15. Chỉ số TS các khu vực theo các ngƣỡng mƣa trong mùa đông 61
Hình 3.16. Chỉ số TS các khu vực theo các ngƣỡng mƣa trong mùa hè 62
Hình 3.17. Chỉ số POD các khu vực theo các ngƣỡng mƣa trong mùa đông 63
Hình 3.18. Chỉ số POD các khu vực theo các ngƣỡng mƣa trong mùa hè 63
Hình 3.19. Chỉ số TSS các khu vực theo các ngƣỡng mƣa trong mùa đông 64
Hình 3.20. Chỉ số TSS các khu vực theo các ngƣỡng mƣa trong mùa hè 65
Hình 3.21. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 3h (phải) (mm/h) lúc 15h
UTC ngày 29/5/1999 66

3
Hình 3.22. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo 03 giờ ngày
29/5/1999 68
Hình 3.23. Vùng mƣa thám sát (trái) và vùng mƣa dự báo mƣa tích lũy 24h (phải)
(mm/ngày) ngày 6/7/2007 71
Hình 3.24. Kết quả đánh giá bằng phƣơng pháp fuzzy cho dự báo mƣa 24 giờ ngày
06/7/2007 72

Hình 3.25. Vùng mƣa thám sát (trái) và vùng mƣa dự báo 24h (phải) (mm/ngày) ngày
23/12/2007 (không khí lạnh) 75
Hình 3.26. Kết quả đánh giá bằng phƣơng pháp fuzzy cho hạn dự báo mƣa tích lũy 24
giờ ngày 23/12/2007 76























4
MỞ ĐẦU
Nhƣ chúng ta đã biết, khí hậu nói chung và thời tiết nói riêng ảnh hƣởng

đến mọi mặt đời sống kinh tế - xã hội của loài ngƣời. Vì vậy việc dự báo các yếu
tố khí hậu cũng nhƣ thời tiết đang ngày càng quan trọng và cần thiết, trở thành
mối quan tâm lớn của tất cả các quốc gia trên thế giới. Và giờ đây nó càng trở
nên cấp bách hơn bao giờ hết khi ảnh hƣởng của
các nƣớc trên thế giới trong đó Việt Nam cũng là một trong
những quốc gia chịu ảnh hƣởng nặng nề của biến đổi khí hậu.
s
ở thử nghiệm
nghiệp vụ
hoặc nghiê
văn Trung ƣơng, RAMS, HRM, WRF
văn và , Trƣờng Khoa nhiên
Môi .
Mỗi mô hình số đều chứa đựng các sai số sinh ra do số liệu ban đầu, do
các quá trình tham số hóa trong khí quyển chƣa đủ chính xác ,
cần phải tìm ra đƣợc những điểm mạnh của mô
hình để khai thác và sử dụng đồng thời chỉ ra những điểm yếu để tìm cách khắc
phục, đem lại hiệu quả cao hơn cho công tác dự báo. Bên cạnh đó, kết quả đánh
giá còn có thể cho biết về sai số hệ thống của mô hình, là cơ sở cho việc hiệu
chỉnh mô hình cho tốt hơn. Chính vì vậy, vấn đề đánh giá định lƣợng sản phẩm
của các mô hình số là rất cần thiết và có ý nghĩa khoa học.
Bài toán đánh giá dự báo là đánh giá mức độ chính xác của mô hình hoặc
mức độ sai khác giữa các sản phẩm dự báo của mô hình với những kết quả quan
trắc thực tế nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các
chuyên gia nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất
lƣợng dự báo của mô hình. Hơn nữa, kết quả đánh giá dự báo có thể đƣa ra
những thông tin giúp các nhà quản lý quyết định có nên đầu tƣ cơ sở vật chất,
trang thiết bị để phát triển mô hình hay không.
và lƣợng mƣa và
. Chính vì vậy, trong


5
khuôn khổ của luận văn tác giả tập trung vào việc đánh giá chất lƣợng dự báo
24h của nhiệt độ, lƣợng mƣa của hai mô hình dự báo thời tiết số đƣợc sử dụng
phổ biến hiện nay ở Việt Nam là mô hình HRM và mô hình MM5. Ngoài phần
Mở đầu, Kết luận và Tài liệu tham khảo, luận văn đƣợc bố cục cụ thể nhƣ sau:
Chƣơng 1. Tổng quan về bài toán đánh giá dự báo trong khí tƣợng và các
chỉ số đánh giá.
Chƣơng 2. Khái quát về các mô hình dự báo thời tiết số HRM, MM5 và
nguồn số liệu sử dụng.
Chƣơng 3. Kết quả đánh giá nhiệt độ và lƣợng mƣa của mô hình MM5 và
HRM cho khu vực Việt Nam.





















6
CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN ĐÁNH GIÁ DỰ BÁO TRONG
KHÍ TƢỢNG VÀ CÁC CHỈ SỐ ĐÁNH GIÁ

1.1. Bài toán đánh giá dự báo trong khí tƣợng
1.1.1. Mục đích và ý nghĩa của bài toán đánh giá
Đánh giá chất lƣợng dự báo thời tiết nói chung là phƣơng pháp thẩm tra
đánh giá và xác định định lƣợng mức độ chính xác của mô hình hoặc mức độ sai
khác giữa các sản phẩm dự báo của mô hình với những kết quả quan trắc thực tế
nhằm chỉ ra những ƣu điểm, nhƣợc điểm của mô hình, giúp cho các chuyên gia
nghiên cứu tìm kiếm các giải pháp cải tiến, phát triển, nâng cao chất lƣợng dự
báo của mô hình.
Có ba lý do quan trọng nhất để đánh giá dự báo là:
- Kiểm tra chất lƣợng dự báo – dự báo chính xác đến đâu và sẽ đƣợc cải
tiến ra sao.
- Nâng cao chất lƣợng dự báo: Bƣớc đầu tiên để tiến tới dự báo tốt hơn là
việc tìm ra cái gì mà ngƣời làm dự báo đang làm sai.
- So sánh chất lƣợng của các hệ thống dự báo khác nhau – đến mức độ
nào thì một hệ thống dự báo đƣợc cho là dự báo tốt hơn so với những hệ thống
dự báo khác và bằng cách nào mà hệ thống dự báo đó đem lại kết quả tốt hơn
nhƣ vậy.
Các hoạt động đánh giá chỉ hữu ích khi chúng đƣa ra đƣợc các quyết định
về sản phẩm dự báo đang đƣợc đánh giá. Quyết định đó sẽ làm phát sinh những
thay đổi trong sản phẩm dự báo hoặc cách thức dự báo đƣợc thực hiện sau đó,
hoặc quyết định đó xác nhận và khẳng định sản phẩm dự báo thỏa mãn cho các
mục đích của ngƣời sử dụng và của xã hội. Các sản phẩm dự báo đƣợc phổ biến
rộng rãi trong công chúng thì phải đƣợc viết đủ khách quan để ngƣời sử dụng có
thể kiểm tra, còn các số liệu quan trắc khí quyển thực tế phải đƣợc thể hiện một

cách chính xác những gì diễn ra trong thực tế. Hơn nữa, một vài phƣơng pháp
đánh giá còn đòi hỏi quan trắc tại một điểm cũng có thể đại diện một cách đầy
đủ và khách quan các hiện tƣợng thời tiết xảy ra trong một khu vực.
Chính tính cấp thiết trong các hoạt động đánh giá chất lƣợng dự báo thời
tiết cho thấy mục đích đánh giá phải đƣợc thiết lập trƣớc khi hệ thống đánh giá

7
đƣợc xác lập. Từ đây các hoạt động đánh giá trong khí tƣợng cũng nhƣ trong các
hoạt động dự báo thời tiết có thể đƣợc phân chia thành hai mục đích chính là
đánh giá hành chính và đánh giá khoa học.
Mục đích hành chính: Các thông tin đánh giá trong mục đích quản lý hành
chính nhằm cung cấp thông tin cho việc mua sắm các trang thiết bị chính nhƣ
các máy tính có cấu hình cao hơn, tốc độ xử lý nhanh hơn,… Xác định khi nào,
hoặc có nên thay thế một sản phẩm đang đƣợc sử dụng bằng một sản phẩm dự
báo mới hay không, và còn nhiều các quyết định khác để phát triển tối ƣu nguồn
lực về con ngƣời cũng nhƣ các nguồn trang thiết bị khác phục vụ cho công tác
phát hành một bản tin dự báo thời tiết.
Mục đích khoa học: Đánh giá với mục đích khoa học là xác định một cách
đầy đủ và chi tiết ƣu điểm cũng nhƣ nhƣợc điểm của một sản phẩm dự báo. Các
hoạt động này giúp tìm ra các biện pháp thích hợp để cải thiện chất lƣợng dự
báo phục vụ cũng nhƣ cung cấp các thông tin để hoạch định phƣơng hƣớng cho
việc nghiên cứu và phát triển tiếp theo.
Ngoài ra một số tác giả khác còn xét đến mục đích kinh tế nhƣng đó là
vấn đề rất phức tạp nên trong giới hạn luận văn này không đƣợc đề cập đến.
1.1.2. Mô hình chung cho đánh giá dự báo các yếu tố thời tiết
Hình 1.1 là một kiểu mô hình chung nhất để đánh giá dự báo các yếu tố
thời tiết, ngoài ra có thể có các mô hình đánh giá khác nữa. Tuy nhiên đây là mô
hình cho thấy bức tranh chi tiết nhất về quan hệ giữa đặc trƣng của phép đánh
giá các đại lƣợng đo và các giải pháp khác nhau để có thể lựa chọn. Sơ đồ này
sử dụng cho việc quyết định các bƣớc cần thiết phải đƣợc làm trƣớc khi lựa chọn

các phƣơng pháp đánh giá cụ thể.
Tất cả các phƣơng pháp đánh giá đều bắt đầu từ việc tập hợp các tập số
liệu quan trắc và dự báo (hình bình hành ở trên cùng trong Hình 1.1). Bƣớc tiếp
theo là xử lý số liệu, bƣớc này phụ thuộc vào việc quyết định của ngƣời sử dụng
(hình thoi trong sơ đồ). Quan trọng nhất là việc quyết định của ngƣời sử dụng
lựa chọn mục đích đánh giá hành chính hay khoa học nhƣ đã nêu ở trên.
Khi mục đích đánh giá đã đƣợc xác định, tiến hành phân loại các tập số
liệu mẫu theo mục đích đã định trƣớc. Phân loại nghĩa là chia nhỏ các phần tử
trong tập mẫu ra thành hai hay nhiều nhóm theo một nguyên tắc đã định sẵn, sau
đó thực hiện đánh giá cho từng nhóm một cách riêng biệt. Trên Hình 1.1 đã chỉ

8
ra hai kiểu phân loại là “Phân loại ngoại bộ” và “Phân loại nội bộ”.
Phân loại ngoại bộ là kiểu phân loại mà nguyên tắc lựa chọn độc lập đối
với các yếu tố đang cần đƣợc đánh giá. Kiểu phân loại ngoại bộ phổ biến nhất là
cho phép xác định các biến đổi trong đánh giá theo thời gian trong ngày hoặc
theo mùa. Phân loại ngoại bộ có thể tiến hành ở bất cứ thời điểm nào trong quá
trình trƣớc khi tính toán các đánh giá thống kê thực tế, và có thể đƣợc làm cho
cả mục đích hành chính hay mục đích khoa học.






















Hình 1.1. Sơ đồ chung cho đánh giá các yếu tố thời tiết
Mục đích
khoa học
Các tập số liệu
dùng để đánh giá
Quản lý
hành
chính
Phân loại
ngoại bộ
Phân loại
ngoại bộ
Phân loại
nội bộ theo
dự báo
Hệ số phân tán
Điểm Berier RPS
Điểm kỹ năng
Brier
Bảng độ tin cậy

Bảng liên hợp
Phân loại
nội bộ theo
quan trắc
Biến pha
Biến liên tục
Biến liên tục

Biến pha

Đồ thị điểm
Bảng liên hợp

Đồ thị điểm

Nguyên lý phát
hiện
tín hiệu
Độ lệch (BIAS)
Phân loại
nội bộ theo
dự báo
Biến pha

Biến liên tục

Sai số trung bình tuyệt đối
Sai số bình
phƣơng trung bình
Độ giảm phƣơng sai


9
Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học thấy rằng, cần
có một nhu cầu phân loại cao hơn đối với tập mẫu. Chẳng hạn nhƣ, nếu ta quan
tâm đến dự báo cực trị thì tập mẫu sẽ phải đƣợc phân nhóm để tách các giá trị
cực trị đó ra từ chuỗi các sự kiện chung. Kiểu phân nhóm này đƣợc gọi là “phân
loại nội bộ” bởi vì nguyên tắc phân loại đƣợc quyết định bởi mục đích đánh giá
và sử dụng chính yếu tố đang đƣợc đánh giá. Có hai cách để thực hiện phân loại
nội bộ, trên Hình 1.1 cho thấy sự khác nhau trong kết quả đánh giá thu đƣợc từ
hai cách phân loại đó.
Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khí
tƣợng quan trắc đƣợc. Sau đó, các tiêu chuẩn đánh giá có thể đƣợc tính toán cho
từng nhóm giá trị quan trắc và giá trị thống kê đƣợc tạo thành này gọi là giá trị
có điều kiện đối với quan trắc. Một ví dụ cho phân bố có điều kiện của dự báo là
một giá trị đặc biệt hay một phạm vi các giá trị quan trắc.
Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khí
tƣợng đƣợc dự báo. Cũng tƣơng tự nhƣ trên, các giá trị thống kê đƣợc tính toán
theo cách phân loại này đƣợc gọi là điều kiện dự báo. Việc lựa chọn kiểu phân
loại phụ thuộc vào mục đích đánh giá. Trong nhiều trƣờng hợp cần phải sử dụng
kết hợp cả hai cách phân loại trên để đƣa ra một kết quả hoàn chỉnh. Hơn nữa,
nhƣ đã thấy ở sơ đồ trên, những đại lƣợng đánh giá khác nhau (hình ô van bên
dưới) đặc trƣng cho một kiểu phân nhóm khác và đƣa ra nhiều thông tin khác
nhau về sản phẩm.
Một cách khác, trong đánh giá hành chính, ngƣời ta ít quan tâm chi tiết
đến việc biểu diễn những biến theo các giá trị khác nhau trong dự báo. Mà thay
vào đó, các câu hỏi đặt ra đều mang tính chung chung và chỉ cần một câu trả lời
ngắn gọn xúc tích nào đó. Vì vậy, phân loại nội bộ có thể vẫn đƣợc thực hiện
nhƣng nó hiếm khi đƣợc dùng đến. Tuy nhiên, ƣu điểm lớn của đánh giá hành
chính là biểu diễn chất lƣợng sản phẩm chỉ bằng vài con số hoặc việc so sánh
thuận tiện hay hƣớng xác minh dễ dàng. Bản chất chung của đánh giá hành

chính có mối liên hệ mật thiết với các quy tắc điểm số tổng kết đƣợc chỉ ra ở
Hình 1.1. Đôi khi việc tóm tắt cũng trở nên khó khăn khi phải cố gắng tổng kết
tất cả các thông tin về chất lƣợng sản phẩm chỉ trong một điểm số để cung cấp
cho nhà quản lý. Nhu cầu tóm tắt thông tin đánh giá chỉ bằng một con số gây ra
một áp lực lớn cho việc thiết kế hệ thống đánh giá để đảm bảo đƣợc rằng:
- Điểm số đƣợc lựa chọn theo yêu cầu là đáng tin cậy;

10
- Các sự kiện hợp thành đều đƣợc xem xét công bằng nhƣ nhau trong các
điểm số;
Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đều
đƣợc xem là nhƣ nhau trong quá trình trung bình hóa. Điều này làm cho việc
thực hiện thuận tiện hơn (việc tính toán sẽ đơn giản hơn khi sử dụng đại lƣợng
trung bình), nhƣng cũng vì thế mà rất khó để có thể tìm đƣợc một hàm trọng số
chính xác và phản ánh đủ khách quan cho các sự kiện hợp thành của mục đích
sử dụng mà không có bất kỳ trở ngại nào đối với các thuộc tính của điểm số.
Làm thế nào để đƣa ra các hàm trọng số của các sự kiện hợp thành trong đánh
giá tổng hợp vẫn còn là vấn đề chƣa giải quyết đƣợc.
Trƣớc đây, các điểm số đánh giá đã đƣợc đánh giá quá cao. Vì thế các dự
báo viên sớm thất vọng khi phải cố gắng sử dụng chúng để trả lời các câu hỏi về
các vấn đề mang tính chất khoa học. Tính chất của việc đánh giá tổng kết đó hạn
chế việc sử dụng trong mục đích khoa học bởi thiếu sự phân loại đánh giá bằng
những điều kiện cho trƣớc. Ví dụ, điểm số tổng kết không thể nói mƣa dự báo
tốt nhƣ thế nào trong các trƣờng hợp ngƣỡng thấp mà chỉ có thể nói mƣa đƣợc
dự báo tốt nhƣ thế nào một cách chung chung. Không thể nói, dƣới điều kiện
nào mô hình phần tử hữu hạn khu vực RFE (Regional Finite Element model) tốt
hơn mô hình phổ, chỉ có thể nói rằng mô hình RFE tốt hơn hoặc xấu hơn một
chút so với mô hình phổ.
1.1.3. Sơ lược về tiêu chuẩn đánh giá
Các điểm số dùng trong đánh giá đƣợc minh họa theo từng cặp ở phía

dƣới Hình 1.1 cho thấy mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị
điểm là hoàn toàn tƣơng tự nhau, chúng cung cấp các dạng thông tin nhƣ nhau,
bảng liên hợp xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến
dự báo liên tục. Điểm tổng kết luôn đƣợc phân loại theo cách này: Điểm Brier
và điểm RP đều đo chính xác các đặc tính của khả năng xảy ra hay biến pha,
chúng tƣơng tự sai số bình phƣơng trung bình của dự báo theo biến liên tục. Chú
ý rằng dự báo pha không tƣơng tự nhƣ sai số trung bình tuyệt đối. Có hai loại
đại lƣợng đo đƣợc phân loại tƣơng ứng theo dự báo và quan trắc là “Bảng độ tin
cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó bảng liên hợp và đồ thị
điểm lại tổng quát hơn, cho phép phân loại theo một trong hai cách hoặc theo cả
hai cách. Nguyên lý phát hiện tín hiệu là một ý tƣởng mới mẻ và hiện nay chƣa
đƣợc sử dụng rộng rãi.

11
Các điểm số liệt kê trên Hình 1.1 gồm 3 loại, đó là: điểm số tuyến tính,
điểm số toàn phƣơng (bậc hai) và điểm số kỹ năng.
Điểm số toàn phƣơng đƣa ra trọng lƣợng của sai số theo bình phƣơng của
chúng trong khi điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số
toàn phƣơng thƣờng đƣa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm
số này rất phù hợp trong các trƣờng hợp sai số lớn thực sự nghiêm trọng hơn sai
số nhỏ.
Điểm số kỹ năng đƣợc xây dựng để đánh giá mối quan hệ giữa dự báo và
một giá trị chuẩn nào đó. Giá trị chuẩn đƣợc chọn lựa để mô tả một dự báo
không kỹ năng.
Ba tiêu chuẩn đƣợc sử dụng để so sánh là: chuẫn ngẫu nhiên, chuẩn quán
tính và chuẩn khí hậu. Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và không
yêu cầu hiểu biết tri thức, chuẩn quán tính là một dự báo xác định và yêu cầu các
hiểu biết về điều kiện thời tiết, còn chuẩn khí hậu là một dự báo trạng thái thời
tiết diễn ra trong khoảng thời gian dài và cần phải có sự hiểu biết về tiến trình
lịch sử của thời tiết. Điểm số kỹ năng đƣợc biểu diễn trong công thức sau:

STPS
STSC
SS

trong đó SC là điểm có đƣợc từ dự báo, ST là điểm đạt đƣợc từ dự báo chuẩn và
PS là điểm từ dự báo hoàn hảo. Điểm số kỹ năng có thể đƣợc hình thành từ việc
sử dụng bất kỳ một trong các điểm số. Điểm số kỹ năng phổ biến nhất dựa trên
nền tảng của điểm Brier (điểm kỹ năng Brier), điểm RP (điểm kỹ năng RP), các
giá trị của bảng ngẫu nhiên (điểm Heidke) và sai số trung bình tuyệt đối. Tiêu
chuẩn thƣờng đƣợc sử dụng nhất là chuẩn khí hậu, còn điểm Heidke lại thƣờng
xuyên đƣợc kết hợp với chuẩn ngẫu nhiên. Không có điểm kỹ năng cơ bản nào
là quan trọng hơn, chúng bình đẳng nhƣ nhau và đều biểu hiện đặc tính của kỹ
năng.
1.1.4. Các loại yếu tố dự báo
Sau khi giải quyết xong những vấn đề về phân loại và những yêu cầu của
một mô hình đánh giá đã đặt ra cần lựa chọn một phƣơng pháp thích hợp để đáp
ứng các yêu cầu đó. Hình chữ nhật trên Hình 1.1 đƣa ra gợi ý cho cách lựa chọn
phù hợp tùy thuộc vào bản chất dự báo đƣợc đánh giá. Phụ thuộc vào mục đích
đánh giá ngƣời ta chia ra thành hai dạng dự báo là: Dự báo các đại lƣợng liên tục

12
và dự báo pha.
* Yếu tố dự báo liên tục: Là các yếu tố đƣợc dự báo tại một giá trị nhất
định hoặc trong một khoảng giá trị nào đó. Trong số các yếu tố thời tiết thì nhiệt
độ, áp suất, và gió là hay đƣợc dự báo theo cách này.
* Yếu tố dự báo pha: Là các yếu tố dự báo có thể xảy ra hoặc không xảy
ra. Chẳng hạn nhƣ xét sự xuất hiện của giáng thủy (có hoặc không), hoặc xét
dạng giáng thủy (băng, tuyết, nƣớc).
Một số yếu tố có thể đƣợc dự báo liên tục hoặc dự báo pha tùy thuộc vào
yêu cầu của ngƣời sử dụng trong quá trình làm dự báo. Tuy nhiên khi một dự

báo mà cho kết quả biến thiên liên tục thì phải đƣợc đánh giá theo pha bởi vì tất
cả những thông tin đó rất cần thiết cho ngƣời sử dụng.
* Dự báo xác suất đƣợc xem nhƣ là dự báo pha nhƣng tổng quát hơn.
Trong đó, mỗi pha đƣợc gán bằng một xác suất xảy ra và tổng tất cả xác suất
phải bằng 1 (tức là một cái gì đó phải xảy ra). Dự báo pha là một dự báo xác
suất thu hẹp, ở đây xác suất chỉ có hai trƣờng hợp xảy ra hoặc là 0% hoặc là
100% và hiển nhiên là một trong hai trƣờng hợp ấy chắc chắn sẽ xảy ra.
1.1.5. Các thuộc tính của một dự báo tốt
Do tính chất phức tạp của bài toán đánh giá, việc lựa chọn, sử dụng những
chỉ số nào để phản ánh đƣợc tất cả các khía cạnh là vấn đề khó khăn. Chẳng hạn,
khi nói về đánh giá chất lƣợng dự báo (có thể là của một mô hình) Murphy
(1993) đã đƣa ra 3 khái niệm để chỉ mức độ “tốt” của một dự báo là:
1) Độ chắc chắn (Consistency) của dự báo là mức độ phù hợp giữa dự báo
và kiến thức hiểu biết của dự báo viên;
2) Chất lƣợng dự báo (Quality) là mức độ phù hợp giữa dự báo với thực tế
xảy ra;
3) Ý nghĩa (hay giá trị - Value) của dự báo là mức độ mà dự báo có thể
giúp cho ngƣời ra quyết định thấy rõ hoặc đạt đƣợc lợi ích nào đó về kinh tế
hoặc lợi ích khác.
Cũng theo Murphy (1993), đã đƣa ra 9 khái niệm đƣợc gọi là 9 thuộc tính
đóng góp cho độ chắc chắn của dự báo nhƣ sau:
- Độ lệch (Bias): Là mức độ phù hợp giữa trung bình quan trắc và trung

13
bình dự báo.
- Tính liên kết (Association): Là mức độ chặt chẽ về quan hệ tuyến tính
giữa dự báo và quan trắc(chẳng hạn, hệ số tƣơng quan là thƣớc đo mối quan hệ
tuyến tính này).
- Độ chính xác (Accuracy):
dự báo và thực tế ( )

. K
.
- Kỹ năng dự báo (Skill):
một dự báo tham chiếu nào đó. Dự báo tham chiếu
nói chung là dự báo không có kỹ năng, nhƣ dự báo ngẫu nhiên (may rủi), dự báo
quán tính, hoặc dự báo khí hậu. Kỹ năng ám chỉ sự tăng lên của độ chính xác do
hệ thống dự báo “thông minh”.
- Độ tin cậy (Reliability): Là sự phù hợp trung bình giữa các giá trị dự báo
và các giá trị quan trắc. Nếu tất cả các trƣờng hợp dự báo đƣợc xem xét khi đó
độ tin cậy trên toàn bộ giống nhƣ thiên hƣớng (bias). Nếu các trƣờng hợp dự báo
đƣợc phân chia thành các khoảng khác nhau hoặc theo các phân hạng thì độ tin
cậy giống nhƣ độ lệch có điều kiện (conditional bias). Thông thƣờng độ tin cậy
đƣợc cải tiến nhờ Bias. Nhƣng sau khi cải tiến làm độ tin cậy của các dự báo
tƣơng đƣơng tăng lên thì chính Bias lại sẽ bị khử đi.
- Độ phân giải (Resolution): Là năng lực của dự báo có thể phân loại tập
các sự kiện thành các tập con có phân bố tần suất khác nhau. Điều đó có nghĩa là
phân bố nhận đƣợc khi “A” đƣợc dự báo khác với phân bố nhận đƣợc khi “B”
đƣợc dự báo. Thậm chí nếu các dự báo là sai, hệ thống dự báo có độ phân giải
nếu nó có thể phân chia một cách thành công phân bố của các dạng khác nhau.
(Nói cách khác, có thể tách biệt đƣợc các trƣờng hợp dự báo thành những tập có
cùng phân bố).
- Độ nhọn (hay độ nhạy bén - Sharpness): Là xu hƣớng của dự báo có thể
dự báo đƣợc các giá trị cực trị. Độ nhọn là một thuộc tính của dự báo, tƣơng tự
nhƣ độ phân giải, một dự báo có thể có thuộc tính này ngay cả khi nó sai (trong
trƣờng hợp này nó có thể là kém tin cậy);
- Độ phân biệt (hay độ phân lớp - Discrimination): Là khả năng của dự

14
báo có thể tách biệt các quan trắc thành những trƣờng hợp có tần suất dự báo
cao hơn, tức là có khả năng phân lớp. Là khả năng của dự báo có thể tách biệt

các quan trắc thành những trƣờng hợp có tần suất dự báo cao hơn, tức là có khả
năng phân lớp.
- Độ biến động (hay tính không chắc chắn - Uncertainty): Là sự dao động
của các giá trị quan trắc trong tập mẫu đánh giá và không phụ thuộc vào giá trị
dự báo. Đối với các biến đƣợc dự báo theo pha thì độ biến động là 1 nếu sự kiện
xảy ra và 0 nếu sự kiện không xảy ra. Đại lƣợng này liên quan đến độ “khó
khăn” của dự báo. Độ biến động càng lớn có nghĩa là sẽ có những dao động lớn
với nhiều tần số khác nhau trong yếu tố dự báo đang đƣợc đánh giá và dĩ nhiên
việc dự báo sẽ khó khăn hơn. Độ biến động của từng tập số liệu sẽ rất khác nhau
và do đó, việc so sánh giữa các con số đánh giá thống kê của tập số liệu là hết
sức mạo hiểm vì chúng thƣờng rất nhạy với độ biến động.
Theo truyền thống thì đánh giá dự báo tập trung nhấn mạnh vào độ chính
xác và kỹ năng dự báo. Nhƣng cũng cần lƣu ý rằng các thuộc tính khác của dự
báo cũng ảnh hƣởng mạnh đến giá trị dự báo.
1.2. Một số phƣơng pháp và chỉ số đánh giá phổ biến
1.2.1. Sơ đồ chung đánh giá sản phẩm mô hình dự báo thời tiết số
a. Những nguyên nhân gây sai số trong mô hình dự báo số
Để ứng dụng đƣợc một mô hình khu vực hạn chế vào trong nghiệp vụ dự
báo thời tiết đòi hỏi trƣớc hết là phải đánh giá đƣợc sai số dự báo của mô hình so
với thực tế. Các nguyên nhân có thể đƣa đến dự báo sai của mô hình số có thể
tóm tắt nhƣ sau:
- Các công thức toán học để mô tả các quá trình vật lý xảy ra trong khí
quyển là chƣa hoàn chỉnh;
- Ảnh hƣởng của địa hình đến kết quả dự báo (thƣờng không đƣợc mô
hình số mô tả hoàn chỉnh);
- Các quá trình vật lý và các sơ đồ tham số hóa chƣa thật sự hoàn thiện;
- Một số giả thiết không thực sự phù hợp đƣợc đƣa ra để có thể giải đƣợc
hệ phƣơng trình thủy nhiệt động lực học mô tả khí quyển thực.
- Điều kiện biên và điều kiện ban đầu của các biến khí tƣợng là chƣa hoàn


15
chỉnh và phụ thuộc khá nhiều vào địa hình. Các trạm thám sát thƣa thớt, đặc biệt
là vùng nhiệt đới;
- Các kết quả nhận đƣợc chứa đựng những sai số khi giải các công thức
toán học bằng phƣơng pháp gần đúng,
b. Nguyên lý chung cho việc đánh giá mô hình dự báo số
Hình 1.2
Hình
1.1
số liệu quan trắc và bộ số liệu này phải tƣơng
, số liệu quan trắc có thể sẽ đƣợc phân
tích về lƣới dự báo hoặc
phẩm
. Trong trƣờng hợp này
, điều quan trọng trong đánh giá mô
hình là phải luôn ghi nhớ thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kết
quả.
Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra là
những vấn đề quyết định cần giải quyết phải đƣợc làm cho mục đích đánh giá
trƣớc khi một hệ thống đánh giá đƣợc thiết lập. “Đánh giá hành chính” trả lời
câu hỏi về xu hƣớng trong kỹ năng và độ chính xác của mô hình và thƣờng đƣợc
sử dụng để so sánh độ chính xác của hai mô hình khác nhau. Tƣơng tự nhƣ đánh
giá các yếu tố thời tiết cho những mục đích hành chính, có một khuynh hƣớng
nhằm giảm thiểu các kết quả chỉ bằng một vài con số thông qua việc sử dụng các
điểm số tổng kết.
“Đánh giá khoa học”
diễn của mô hình để đƣa ra
thông tin có thể phản hồi lại cho c
front. Bộ số liệu đánh giá
phải đƣợc sắp xếp cẩn thận theo các đặc trƣng đó, và điều này có thể đƣợc thực

hiện theo một trong hai hƣớng đó là theo cơ sở của các đặc trƣng quan trắc hay
theo cơ sở của các đặc trƣng dự báo.

16
“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá
theo mùa hoặc theo thời gian chạy mô hình
.
























Hình 1.2 (NWP)
Mục đích
khoa học
Các tập số liệu
dùng để đánh giá
Quản lý
hành
chính
Phân loại
ngoại bộ
Phân loại
theo không
gian
Sai số trung bình tuyệt đối
Sai số bình phƣơng trung bình
Điểm kỹ năng (Độ suy giảm phƣơng sai)
Hệ số phân tán
Độ lệch (BIAS)

Tƣơng quan dị thƣờng
Điểm số S1
Thẩm định trung tâm áp suất
Các trƣờng hợp nghiên cứu
Sai số đƣờng đi
Độ lệch trung tâm
Lỗi hệ thống
Phân loại
nội bộ

17

. Khi phân loại theo
không gian đƣợc tiến hành theo mục đích khoa học, các khu vực có quy mô dƣới
lƣới đƣợc ƣu tiên lựa chọn để phản ánh các chế độ khí hậu khác nhau nhƣ các
khu vực có địa hình đồi núi, các vùng núi khuất gió, bờ biển,…
1.2.2. Phương pháp đánh giá đối với biến liên tục
1.2.2.1. Phương pháp toán đồ tụ điểm

Hình 1.3 . Toán đồ tụ điểm cho dự báo gió biển. Bên trái là trường hợp dự báo 00 giờ,
bên phải là trường hợp dự báo 36 giờ (số liệu lấy từ trạm phao)
Toán đồ tụ điểm là phƣơng pháp đơn giản nhất, chủ yếu phục vụ cho các
biến liên tục nhƣ nhiệt độ và gió, thƣờng gồm tất cả các điểm số ứng với mỗi
cặp dự báo – quan trắc tƣơng ứng trên cùng một đồ thị với tung độ và hoành độ
có tỷ lệ nhƣ nhau. Trƣờng hợp lý tƣởng là các điểm số nằm trên một đƣờng
thẳng đi qua gốc tọa độ và tạo với trục hoành một góc 45
0
(giá trị dự báo bằng
giá trị quan trắc). Đƣờng 45
0
này thƣờng đƣợc vẽ ra để thuận tiện cho việc nội
suy các điểm rời rạc.
Hình 1.3 là một ví dụ về toán đồ tụ điểm cho dự báo gió biển. Mỗi điểm
“x” đại diện cho ít nhất một lần xuất hiện của cặp dự báo – quan trắc riêng lẻ.
Trên mỗi đồ thị còn có một đƣờng thẳng thứ hai mà có thể không đi qua gốc tọa
độ, đó chính là đƣờng hồi quy bình phƣơng tối thiểu tƣơng ứng với tập số liệu
Hệ số tƣơng quan = 0.789
Tốc độ gió mô hình PPR (kts)
Tốc độ gió mô hình PPR (kts)
Hệ số tƣơng quan = 0.595

18

quan trắc.
Nếu dự báo là hoàn hảo thì đƣờng hồi quy sẽ trùng với đƣờng 45
0
. Sự phù
hợp giữa đƣờng hồi quy và đƣờng 45
0
cho thấy chất lƣợng của dự báo. Chất
lƣợng dự báo sẽ giảm đi nếu đƣờng hồi quy có khuynh hƣớng lệch theo chiều
nằm ngang hơn. Nếu đƣờng hồi quy nằm ngang hoàn toàn thì khi đó quan trắc
hoàn toàn độc lập với dự báo.
Một đại lƣợng đánh giá khác có thể ƣớc lƣợng từ đồ thị điểm là sai số
bình phƣơng hoặc độ lệch. Hình 1.3 chỉ ra một đồ thị điểm khác cho dự báo
nhiệt độ khách quan (sản phẩm mô hình thống kê). Tập số liệu mẫu là 701
trƣờng hợp (số liệu này đƣợc lấy từ 11 trạm vùng Đại Tây Dƣơng - CASSP).
Trong đồ thị này không thấy xuất hiện các dấu “x” nhƣ đồ thị trƣớc, thay vào đó
là các con số. Các số trên đồ thị này biểu hiện số trƣờng hợp các cặp giá trị nhiệt
độ quan trắc - dự báo tƣơng ứng với đồ thị điểm.
Một đồ thị điểm mô tả phân loại cơ bản từ tất cả các trƣờng hợp đƣợc
miêu tả riêng rẽ. Điều này cho phép cân nhắc một cách linh hoạt cho phân tích
số liệu. Giả sử -20
0
C và +10
0
C đƣợc chọn nhƣ là ngƣỡng của nhiệt độ cực trị,
giá trị này có thể nhận đƣợc từ phân tích trên đồ thị. Tất cả các điểm, ở đây nhiệt
độ quan trắc nằm trong giới hạn của cực trị và không có nhiệt độ dự báo đƣợc
gọi là miền các sự kiện dự báo sót (missed events) và tất cả các điểm ở đây giá
trị dự báo nằm trong phạm vi cực trị và không quan trắc đƣợc gọi là miền báo
động sai (false alarms). Miền các sự kiện dự báo sót và miền báo động sai có thể
thấy trên đồ thị. Qua đồ thị có thể thấy, tất cả nhiệt độ có giá trị cao nhất đã bị

bỏ sót (dự báo dƣới ngƣỡng) trong khi đó nhiệt độ thấp xảy ra ở cả hai miền các
sự kiện dự báo sót và miền báo động sai.
Phân loại trên cơ sở quan trắc chỉ cho phép nhận dạng miền các sự kiện
dự báo sót (đƣờng ngang vẽ đậm ở các giá trị ngƣỡng). Phân loại trên cơ sở dự
báo chỉ cho phép nhận dạng đƣợc miền báo động sai (đƣờng đứng vẽ đậm ở các
giá trị ngƣỡng). Từ đây có thể thấy rằng điều quan trọng nhất là phải sử dụng cả
hai kiểu phân loại để nhận đƣợc thông tin đầy đủ và hoàn hảo về một sản phẩm
đang đƣợc đánh giá. Ví dụ những giá trị thấp nhất đã bị bỏ sót có thể lấy lại
đƣợc đơn giản bằng cách tƣởng tƣợng di chuyển tất cả các điểm trên đồ thị đến
bên trái giá trị ngƣỡng 10
0
C, nhƣng cái giá phải trả cho việc hiệu chỉnh này là sự
tăng lên đột ngột trong miền báo động sai. Điều này sẽ không nhìn thấy nếu

19
phân loại trên cơ sở của một mình quan trắc. Do vậy luôn luôn có thể hiệu đính
cho sự kiện cực trị đã bị bỏ sót.
Phân loại trên cơ sở dự báo có lẽ có ích hơn cho hiểu biết về ý nghĩa thực
của dự báo. Thông tin chi tiết về ý nghĩa của dự báo cho các nhiệt độ khác nhau
có thể nhận đƣợc từ một chuỗi phân bố có điều kiện cho mỗi nhiệt độ dự báo
hoặc cho phạm vi của nhiệt độ.
1.2.2.2 Các chỉ số đánh giá
Trong các công thức dƣới đây, F
i
và O
i
tƣơng ứng là giá trị mô hình và giá
trị quan trắc của một biến nào đó (nhiệt độ, lƣợng mƣa), i=1,2,…, N, N là dung
lƣợng mẫu.
a. Sai số trung bình (ME - Mean Error)

N
1i
ii
)OF(
N
1
ME

(1. 1)
Giá trị của ME nằm trong khoảng (-∞, +∞). ME cho biết xu hƣớng lệch
trung bình của giá trị dự báo so với giá trị quan trắc, nhƣng không phản ánh độ
lớn của sai số. ME dƣơng cho biết giá trị dự báo vƣợt quá giá trị quan trắc và
ngƣợc lại. Mô hình đƣợc xem là “hoàn hảo” (không thiên lệch về một phía nào
cả) nếu ME=0.
b. Sai số tuyệt đối trung bình (MAE-Mean Absolute Error)
N
1i
i
O
i
F
N
1
MAE

(1. 2)
Giá trị MAE nằm trong khoảng (0,+∞). MAE biểu thị biên độ trung bình
của sai số mô hình nhƣng không nói lên xu hƣớng lệch của giá trị dự báo và
quan trắc. Khi MAE = 0, giá trị của mô hình hoàn toàn trùng khớp với giá trị
quan trắc, mô hình đƣợc xem là “lý tƣởng”. Thông thƣờng MAE đƣợc sử dụng

cùng với ME để đánh giá độ tin cậy. Chẳng hạn, nếu MAE của sản phẩm khác
biệt hẳn so với ME thì việc hiệu chỉnh là hết sức mạo hiểm. Trong trƣờng hợp
ngƣợc lại, khi mà MAE và ME tƣơng đối “sát” với nhau thì có thể dùng ME để
hiệu chỉnh sản phẩm dự báo một cách đáng tin cậy.
c. Sai số bình phƣơng trung bình MSE (Mean Square Error)

20
N
1i
2
ii
)OF(
N
1
MSE
(1. 3)
MSE là trung bình của tổng bình phƣơng của hiệu giữa các giá trị mô hình và
quan trắc, phản ánh mức độ dao động của sai số. Mô hình là “lí tƣởng” nếu
MSE=0.
d. Sai số bình phƣơng trung bình quân phƣơng (RMSE - Root mean square
Error)
N
1i
2
ii
)OF(
N
1
RMSE


(1. 4)
Sai số bình phƣơng trung bình là một trong những đại lƣợng cơ bản và
thƣờng đƣợc sử dụng phổ biến cho việc đánh giá kết quả của mô hình dự báo số
trị. Ngƣời ta thƣờng hay sử dụng đại lƣợng sai số bình phƣơng trung bình quân
phƣơng (RMSE) biểu thị độ lớn trung bình của sai số. Đặc biệt RMSE rất nhạy
với những giá trị sai số lớn. Do đó nếu RMSE càng gần MAE sai số mô hình
càng ổn định và có thể thực hiện việc hiệu chỉnh sản phẩm mô hình. Giống nhƣ
MAE, RMSE không chỉ ra độ lệch giữa giá trị dự báo và giá trị quan trắc. Giá trị
của RMSE nằm trong khoảng (0,+ ∞).
Khi so sánh MAE và RMSE ta thấy: RMSE ≥ MAE. Còn RMSE = MAE
khi và chỉ khi tất cả các sai số có độ lớn nhƣ nha0u: RMSE = MAE =0.
e. Hệ số tƣơng quan (Correlation coefficient)
N
i
i
N
i
i
N
i
ii
OOFF
OOFF
r
1
2
1
2
1
)()(

))((

(1. 5)
Hệ số tƣơng quan (r) cho phép đánh giá mối quan hệ tuyến tính giữa tập
giá trị dự báo và tập giá trị quan trắc. Giá trị của nó biến thiên trong khoảng -1
đến 1, giá trị hoàn hảo bằng 1. Giá trị tuyệt đối của hệ số tƣơng quan càng lớn
thì mối quan hệ tuyến tính giữa hai biến càng chặt chẽ. Hệ số tƣơng quan dƣơng
phản ánh mối quan hệ cùng chiều (đồng biến), ngƣợc lại, hệ số tƣơng quan âm
biểu thị mối quan hệ ngƣợc chiều (nghịch biến) giữa dự báo và quan trắc.


21
1.2.3. Phương pháp đánh giá đối với dự báo pha
Đánh giá thống kê theo loại (categorical statistics) là loại tiêu chuẩn đánh
giá sự phù hợp giữa sự xảy ra hiện tƣợng dự báo và hiện tƣợng quan trắc tại nút
lƣới.
Các điểm số đánh giá đƣợc dựa vào bảng ngẫu nhiên sau (Damrath, 2002):

Hình 1.4. Sơ đồ biểu diễn các chỉ số phục vụ đánh giá chất lượng dự báo mưa
Hits (H) = dự báo có + quan trắc có
Misses (M) = dự báo không + quan trắc có
False alarms (F) = dự báo có + quan trắc không
Correct negatives (CN) = dự báo không + quan trắc không
Dƣới đây là một vài điểm số thƣờng dùng trong đánh giá dự báo mƣa định
lƣợng ở trên thế giới:
a. Chỉ số FBI (BS hay FBI - Bias score): Đánh giá tỷ số giữa vùng dự báo và
vùng thám sát.
FBI < 1: vùng dự báo nhỏ hơn vùng thám sát
FBI > 1: vùng dự báo lớn hơn vùng thám sát
FBI = 1: vùng dự báo trùng với vùng thám sát (giá trị lý tƣởng)

MH
FH
FBI

FBI là tỉ lệ giữa số lần có xảy ra hiện tƣợng theo mô hình và
theo quan trắc. Giá trị FBI biến đổi trong khoảng từ 0 đến +∞.

(1. 6)



22
FBI càng nhỏ hơn 1 mô hình cho kết quả càng sai sót nhiều; FBI
càng lớn hơn 1 mô hình cho kết quả càng sai khống nhiều. Đại lƣợng
FBI chỉ cho biết mức độ phù hợp giữa mô hình và quan trắc về tần số
xuất hiện nhƣng không phản ánh độ chính xác của mô hình.
b. Xác suất phát hiện (Probability of Detection - POD)
MH
H
POD


(1. 7)
POD đƣợc hiểu là xác suất xuất hiện hiện tƣợng, bằng tỷ số giữa số lần
trùng khớp giữa mô hình và quan trắc khi hiện tƣợng có xuất hiện (hits) và tổng
số lần xuất hiện hiện tƣợng trong thực tế. POD cho biết khả năng thành công của
mô hình, có giá trị trong khoảng từ 0 đến 1, lý tƣởng là POD = 1 (mô hình đƣợc
xem là hoàn hảo). POD càng gần 1 thì độ chính xác của mô hình càng cao. POD
chỉ nhạy đối với những hiện tƣợng không dự báo đƣợc (misses events) chứ
không nhạy đối với phát hiện sai (false alarms).

c. Tỷ phần phát hiện sai (False Alarms Ratio - FAR)
FH
F
FAR

(1. 8)
FAR cho biết tỷ lệ mô phỏng/dự báo khống của mô hình (mô hình cho kết
quả có nhƣng thực tế hiện tƣợng không xảy ra). Giá trị của FAR biến đổi từ 0
cho đến 1. FAR=0 khi F=0, tức tỷ lệ khống của mô hình bằng 0. Giá trị của FAR
càng gần 0 thì mô hình càng tốt (tối ƣu). Ngƣợc lại, FAR càng tiệm cận tới 1
(tƣơng đƣơng với H tiến gần tới không) thì mô hình càng kém.
d. Điểm số thành công (Critical Success Index – CSI hay Threat Score – TS)
HFM
H
TSCSI

(1. 9)
TS phản ánh mối quan hệ giữa số lần mô hình cho kết quả hiện tƣợng có
xuất hiện và số lần quan trắc đƣợc hiện tƣợng có xuất hiện. Nó có thể đƣợc xem
nhƣ thƣớc đo độ chính xác của mô hình khi bỏ qua không xem xét những trƣờng
hợp hiện tƣợng không xuất hiện. Phạm vi biến thiên của TS từ 0 đến 1. TS=0
nghĩa là mô hình không có kỹ năng, TS=1 – mô hình là hoàn hảo.


23
e. Điểm số thành công hợp lý (Equitable Threat Score – ETS)
ETS có giá trị tốt nhất là 1.
random
random
HHFM

HH
ETS

(1. 10)
trong đó H
random
là số dự báo đúng ngẫu nhiên xác định nhƣ sau
total
)MH(*)FH(
H
random

(1. 11)
ETS cho biết mối quan hệ giữa số lần mô hình đúng (kể cả đúng do ngẫu
nhiên) so với quan trắc trong những trƣờng hợp hiện tƣợng có xuất hiện trong
thực tế. Phạm vi biến thiên của ETS là 1/3 đến 1. ETS=1 – mô hình là hoàn hảo.
Chỉ số ETS thƣờng đƣợc dùng trong đánh giá dự báo mƣa của mô hình số vì
tính “công bằng” của nó. Chỉ số này rất nhạy cảm với các dự báo đúng, vì nó xử
lý “F” và “M” theo cùng một cách, không phân biệt nguồn gốc của sai số dự
báo.
f. Điểm số so le (Odds Ratio)
F*M
CN*H
OR

(1. 12)
g. Điểm số Hanssen & Kuipers (HK hay TSS)
CNF
F
MH

H
TSSHK

(1. 13)
TSS phản ánh mức độ tách biệt giữa những kết quả của mô hình đối với các sự
kiện có xảy ra và không xảy ra hiện tƣợng. Giá trị của TSS nằm trong khoảng -1
đến 1. TSS=0 là mô hình không có kỹ năng, TSS=1 thì mô hình là hoàn hảo.
h. Độ chính xác (Percentage Correct – PC hay Fraction Correct - FC)
total
CNH
PC

(1. 14)
FC phản ánh tỷ lệ trùng khớp giữa kết quả của mô hình và quan trắc trong
cả hai pha có và không xuất hiện hiện tƣợng. Giá trị của PC biến đổi trong
khoảng từ 0 đến 1. Nếu mô hình là hoàn hảo, tức kết quả mô hình trùng khớp
hoàn toàn với quan trắc thì PC bằng 1, ngƣợc lại, PC sẽ bằng 0 nếu tất cả mọi
trƣờng hợp kết quả của mô hình đều ngƣợc với quan trắc. PC càng lớn độ chính
xác mô phỏng, dự báo của mô hình càng cao.

×