Tải bản đầy đủ (.pdf) (142 trang)

đánh giá sai số hệ thống dự báo ma của mô hình hrm cho khu vực đông bắc bộ

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (25.6 MB, 142 trang )



1
ĐạI HọC QUốC GIA Hà NộI
TRƯờNG ĐạI HọC KHOA HọC Tự NHIÊN




TRầN quang năng



đánh giá sai số hệ thống dự báo ma của
mô hình hrm cho khu vực đông bắc bộ




LUậN VĂN THạC Sĩ KHOA HọC





Hà NộI 2009


2
ĐạI HọC QUốC GIA Hà NộI
TRƯờNG ĐạI HọC KHOA HọC Tự NHIÊN




TRầN quang năng

đánh giá sai số hệ thống dự báo ma của
mô hình hrm cho khu vực đông bắc bộ


Chuyên ngành : Khí tợng học và Khí hậu học
Mã số : 60.44.87

LUậN VĂN THạC Sĩ KHOA HọC


NGI HNG DN KHOA HC:
PGS.TS. nguyễn văn tuyên



Hà NộI 2009



3
MỤC LỤC
MỞ ĐẦU
CHƯƠNG 1. KHÁI QUÁT VỀ MÔ HÌNH HRM VÀ VẤN ĐỀ ĐÁNH GIÁ CHẤT
LƯỢNG DỰ BÁO THỜI TIẾT 1

1.1. Giới thiệu tóm tắt mô hình HRM (High resolution regional model) ở Trung

tâm dự báo KTTV Trung Ương 1
1.1.1. Khái quát về mô hình HRM 1
1.1.2. Chạy mô hình HRM với các số liệu ban đầu và số liệu biên từ ba mô hình
toàn cầu khác nhau 2
1.2. Khái quát về bài toán đánh giá chất lượng dự báo thời tiết 5
1.2.1 Mục đích và ý nghĩa của đánh giá dự báo 6
1.2.2 Mô hình đánh giá chung cho các yếu tố dự báo thời tiết 7
1.2.3 Các yếu tố dự báo 11
1.2.4 Các điểm số dùng trong đánh giá 12
1.3 Mô hình đánh giá sản phẩm dự báo số trị 14
1.4. Các đặc trưng đánh giá 17
1.4.1. Độ chính xác 17
1.4.2. Kỹ năng dự báo 18
1.4.3 Độ tin cậy 18
1.4.4. Độ phân giải 18
1.4.5. Độ biến động 19
1.5. Các phương pháp đánh giá sản phẩm dự báo số 19
1.5.1. Những nguyên nhân sai số dự báo bằng mô hình số 19
1.5.2. Một số định nghĩa 20
1.5.3. Phương pháp đánh giá với biến liên tục 22
1.5.4. Phương pháp đánh giá với dự báo pha 28


4
CHƯƠNG 2. SỐ LIỆU VÀ PHƯƠNG PHÁP ĐÁNH GIÁ DỰ BÁO BÁO MƯA
MÔ HÌNH HRM 34
2.1. Số liệu 34
2.1.1 . Số liệu mưa quan trắc và thực tế 34
2.1.2. Số liệu mưa dự báo của mô hình HRM 37
2.2. Phương pháp đánh giá dự báo mưa của mô hình HRM 38

2.2.1 . Đánh giá khi xem mưa là biến liên tục 38
2.2.2. Đánh giá mưa khi phân lượng mưa ra đa cấp rời rạc 38
2.2.3. Đánh giá mưa khi phân lượng mưa ra 2 cấp một 41
2.3 Căn cứ phân loại hình thế synốp chính gây mưa khu vực Đông Bắc Bộ 43
2.3.1 . Cơ sở phân loại hình thế synốp và các tác nhân gây mưa khu vực Đông
Bắc Bộ 43
2.3.2. Đặc trưng và mô phỏng các loại hình thế thời tiết gây mưa ở khu vực Đông
Bắc Bộ 47
2.4. Thống kê về các ngày có mưa lớn diện rộng và các hình thế gây ra mưa lớn
diện rộng trong ba năm 2005, 2006 và 2007 ở khu vực Đông Bắc Bộ 61
CHƯƠNG 3. KẾT QUẢ TÍNH TOÁN VÀ PHÂN TÍCH DỰ BÁO MƯA MÔ
HÌNH HRM 65
3.1. Các kết quả tính toán 65
3.2. Phân tích chất lượng sản phẩm dự báo 65
3.2.1. Phân tích sai số hệ thống Bias 66
3.2.2. Về những chỉ tiêu thống kê khác 76
KẾT LUẬN
TÀI LIỆU THAM KHẢO


5
LỜI CẢM ƠN

Trước hết, tôi xin bày tỏ lòng biết ơn sâu sắc tới PGS. TS. Nguyễn Văn Tuyên -
người đã tận tình chỉ bảo và hướng dẫn tôi hoàn thành luận văn này.
Tôi xin cảm ơn các Thầy cô và các cán bộ trong khoa Khí tượng - Thủy văn -
Hải dương học đã cung cấp cho tôi những kiến thức chuyên môn quý giá, giúp đỡ và
tạo điều kiện thuận lợi về cơ sở vật chất trong suốt thời gian tôi học tập và thực hành ở
Khoa.
Tôi xin cảm ơn các cán bộ phòng Dự báo Khí tượng Hạn ngắn, các cán bộ

phòng Nghiên cứu ứng dụng (Trung tâm dự báo Khí tượng Thủy văn Trung Ương), đặc
biệt là Thạc sĩ Vũ Anh Tuấn và Thạc sĩ Võ Văn Hòa đã tạo điều kiện, trao đổi chuyên
môn cũng như có những ý kiến quý báu giúp tôi hoàn thiện luận văn này.
Tôi cũng xin cảm ơn Phòng sau đại học, Trường Đại học Khoa học Tự nhiên đã
tạo điều kiện cho tôi có thời gian hoàn thành luận văn.
Cuối cùng, tôi xin gửi lời cảm ơn chân thành tới gia đình, người thân và bạn bè,
những người đã luôn ở bên cạnh cổ vũ, động viên và tạo mọi điều kiện tốt nhất cho tôi
trong suốt thời gian học tập tại trường.

Trần Quang Năng



6
MỞ ĐẦU
Mô hình HRM (High resolution Regional model) đã được tiến hành chạy nghiệp
vụ từ năm 2001 tại Trung tâm Dự báo Khí tượng Thủy văn Trung ương và các sản
phẩm của nó đã ngày càng trở nên quan trọng trong công tác dự báo nghiệp vụ hàng
ngày. Tuy nhiên, hiện nay việc đánh giá khả năng dự báo của mô hình HRM vẫn còn
hạn chế. Các dự báo viên vẫn thường xem xét sản phẩm dự báo số của mô hình theo
kinh nghiệm nên vẫn chưa có hiểu biết một cách hệ thống và đầy đủ về khả năng dự
báo của mô hình, đặc biệt là trong từng hình thế thời tiết cụ thể. Do đó việc sử dụng
sản phẩm của mô hình HRM còn chưa đem lại hiệu quả cao.
Mưa vừa là yếu tố khí tượng vừa là hiện tượng thời tiết được liệt vào hàng các
hiện tượng thời tiết khó dự báo nhất. Không những chỉ khó dự báo mà việc đánh giá dự
báo mưa cũng là một việc hết sức khó khăn và phức tạp. Trước hết khó khăn nằm ngay
trong bản chất trường yếu tố mưa là trường bất liên tục và không cố định cả theo thời
gian lẫn không gian; nhiều đặc trưng thống kê có tính quy luật ở những yếu tố khí
tượng khác, nhưng lại không có ở số liệu mưa, làm cho việc xử lý số liệu mưa cũng rất
phức tạp. Xong dự báo mưa lại có vai trò đặc biệt quan trọng trong phục vụ dự báo,

nhất là phục vụ phòng chống thiên tai. Vì vậy đó là vấn đề quan trọng cần thiết phải
nghiên cứu. Vì vậy, dự báo mưa và đánh giá dự báo mưa là vấn đề quan trọng cần thiết
phải nghiên cứu.
Luận văn này tập trung vào việc đánh giá sai số hệ thống dự báo mưa của mô
hình HRM theo không gian và thời gian kết hợp với một số hình thế thời tiết chính gây
mưa, mưa vừa và mưa lớn cho khu vực Đông Bắc Bộ
Bố cục luận văn gồm các phần:
Chương 1: Khái quát về mô hình HRM và vấn đề đánh giá chất lượng dự báo thời tiết.


7
Chương 2: Số liệu và phương pháp đánh giá dự báo mưa mô hình HRM
Chương 3: Kết quả tính toán và phân tích dự báo mưa mô hình HRM
KẾT LUẬN
TÀI LIỆU THAM KHẢO


8
CHƯƠNG 1
KHÁI QUÁT VỀ MÔ HÌNH HRM VÀ VẤN ĐỀ ĐÁNH GIÁ
CHẤT LƯỢNG DỰ BÁO THỜI TIẾT
Chương 1 sẽ xem xét tổng quan về mô hình HRM (High resolution regional
model) đang được chạy nghiệp vụ ở Trung tâm dự báo KTTV Trung Ương (NCHMF)
và vấn đề đánh giá chất lượng dự báo thời tiết nói chung cùng những phương pháp,
điểm số nói riêng trong việc đánh giá các sản phẩm của mô hình dự báo thời tiết số.
1.1 Giới thiệu tóm tắt mô hình HRM (High resolution regional model) ở Trung
tâm dự báo KTTV Trung Ương
1.1.1 Khái quát về mô hình HRM
Mô hình khu vực độ phân giải cao HRM ban đầu được phát triển bởi Cơ quan Khí
tượng Quốc gia Đức (DWD – Deutcher WetterDienst) và được đưa vào sử dụng nghiệp

vụ ở Trung tâm dự báo Khí tượng Thủy văn Trung Ương từ tháng 5 năm 2002, dự báo
cho hai miền chính trong thời hạn 72 giờ. Miền lớn xác định trong khoảng từ 5
0
S –
35
0
N, 80
0
E – 130
0
E, 161x201 điểm lưới với độ phân giải ngang là 0.25
0
(28 km), 20
mực thẳng đứng và bước thời gian tích phân là 120s (HRM28). Miền nhỏ hơn xác định
trong khoảng 7.125
0
N – 27.125
0
N, 97.25
0
E – 117.25
0
E, 161x161 điểm lưới với độ
phân giải ngang là 0.125 (14 km), 31 mực thẳng đứng, bước thời gian tích phân là 90s
(HRM14); cả hai miền này đều sử dụng số liệu ban đầu và số liệu biên lấy từ mô hình
toàn cầu GME (DWD) 3 giờ một thông qua mạng internet. Trước ngày 27 tháng 9 năm
2004, độ phân giải ngang và thẳng đứng của GME theo thứ tự là 60 km và 31 mực.
Hiện tại, độ phân giải ngang của GME đã tăng lên thành 40 km và độ phân giải thẳng
đứng đã là 40 mực. Mực thấp nhất của GME là 10m.
Mô hình HRM được cung cấp bởi DWD với mã nguồn mở đã trở thành mô hình

đầu tiên chạy dự báo nghiệp vụ tại Trung tâm Khí tượng Thủy văn Quốc gia Việt Nam.
Các sản phẩm của mô hình HRM rất đa dạng và trở thành nguồn tham khảo tốt cho các
dự báo viên trong nghiệp vụ dự báo hàng ngày. Ngoài ra, sản phẩm của nó còn dùng
làm đầu vào, điều kiện ban đầu cho các mô hình khác như: Sóng, nước dâng trong bão,
mô hình thủy văn


9
Tuy nhiên, sau một thời gian chạy nghiệp vụ, các nhà mô hình Việt Nam đã nhận
ra rằng vẫn còn tồn tại rất nhiều hạn chế trong mô hình HRM, đặc biệt là trong việc thu
số liệu đầu vào từ mô hình toàn cầu GME. Những hạn chế này đã được chỉ ra trong các
trường ban đầu của GME, sơ đồ đồng hóa số liệu sử dụng trong GME và các sơ đồ
tham số hóa vật lý bên trong HRM:
Những tham số bề mặt trong các trường ban đầu của GME không phải thu được
từ quan trắc mà là sản phẩm đầu ra của GME được tích phân từ năm 1994 với số liệu
ban đầu thu được từ trung bình khí hậu
Các trường độ ẩm: Trường độ ẩm cung cấp bởi GME trong nhiều trường hợp
không chính xác, đặc biệt là trong các mùa bão. Các vị trí của của áp thấp nhiệt đới và
bão nhiệt đới thường được xác định sai trong số liệu ban đầu của GME. Điều này xảy
ra là do các số liệu đó thu được từ vệ tinh (Vệ tinh địa cực hay vệ tinh địa tĩnh) và
không được cập nhật liên tục trong suốt quá trình đồng hóa số liệu.
Sơ đồ đồng hóa số liệu trong GME: Nội suy tối ưu ba chiều (3D-OI)
Sơ đồ tham số hóa vật lý trong HRM: Sơ đồ mưa quy mô lưới được tính toán theo
công thức mô phỏng thu được từ quan trắc mây ngoại nhiệt đớ1.
1.1.2 Chạy mô hình HRM với các số liệu ban đầu và số liệu biên từ ba mô
hình toàn cầu khác nhau.
Để sử dụng các mô hình toàn cầu GME, GSM, GFS như là số liệu ban đầu và số
liệu biên cho mô hình HRM đòi hỏi phải có những phân tích cụ thể, cẩn thận về các số
liệu quan trắc, các sơ đồ phân tích và các kĩ thuật ban đầu hóa.
Có một vài sự khác nhau giữa các đặc trưng chính của GME và GSM. Giữa các số

liệu đầu vào của mô hình GSM, các trường ẩm hay các số liệu về ẩm trên đại dương
được tính toán từ ảnh các vệ tinh địa tĩnh (GMS-5 và MTSAT-1R). Những thông tin
này thu được từ vệ tinh không có nhiều giá trị cho tất cả những khu vực trên đại dương
nơi mà các quan trắc truyền thống như SYNOP, TEMP còn thưa thớt. Liên quan đến sơ


10
đồ phân tích khách quan, mô hình GSM có sơ đồ đồng hóa số liệu 4 chiều 4D-VAR
trong các mực của mô hình, trong khi mô hình GME sử dụng sơ đồ nội suy tối ưu
truyền thống và không phức tạp bằng 4D-VAR, nhưng có quá nhiều quan trắc bị “là
trơn”. Địa hình bề mặt cũng đóng một vai trò quan trọng trong một số mô hình sự báo
thời tiết số (NWP). Tuy nhiên, cả mô hình GSM và GME đều cùng sử dụng bộ số liệu
GTOPO30 từ USGS (NWP-hệ thống của DWD 2002).
1.1.2.1 Số liệu cần cho HRM
HRM cần 3 nhóm số liệu:
Nhóm 1: Các trường cố định: fis, gz0, fr_land, soiltyp, Plcov
Nhóm 2: Các trường mực đơn lẻ: ps, t_snow, t_s, t_g, t_m, t_cl, w_snow, w_i, w_gl,
w_g2, w_g3, w_cl, qv_s
Nhóm 3: Các trường đa mực: u, v, t, qv, qc, qi
1.1.2.2 Sử dụng kết hợp số liệu của GME và GSM làm số liệu ban đầu và số liệu
biên cho HRM
Tháng 9 năm 1997, theo hiệp định song phương giữa Trung tâm KTTV Quốc Gia
Việt Nam và Cơ quan khí tượng Nhật Bản, các sản phẩm dự báo và phân tích của mô
hình phổ toàn cầu GSM được cung cấp cho khu vực từ 20 – 60
0
N, 80 – 160
0
E với độ
phân giải ngang là 1.5
0

x1.5
0
và 1.25
0
x1.25
0
trong thời đoạn 72 tiếng. Những trường
phân tích và dự báo từ mô hình GSM này đã được sử dụng trong hoạt động dự báo
nghiệp vụ tại Trung tâm Dự báo KTTV Trung Ương, qua thời gian đã được các dự báo
viên thừa nhận như là một trong những sản phẩm tốt, kết quả gần với thời tiết thực
nhất, đặc biệt đối với những trường hợp có hoàn lưu xoáy thuận xuất hiện trên đại
dương. Ban đầu, mô hình GSM có độ phân giải ngang là 0.5625
0
x0.5625
0
(xấp xỉ 60
km) và 40 mực thẳng đứng. Tuy nhiên, JMA cung cấp cho một vài trung tâm khí tượng
trong khu vực (bao gồm Việt Nam) số liệu 17 mực áp suất tiêu chuẩn ( 16 mực áp suất


11
và bề mặt) với độ phân giải thô 1.25
0
x1.25
0
. Từ khi JMA cung cấp thêm 5 trường khí
tượng: Nhiệt độ, Nhiệt độ điểm sương, thành phần gió (u,v), khí áp trung bình mực
nước biển và địa thế vị ở 16 mực khí áp. Vì vậy, HRM được chạy với bộ số liệu đầu
vào từ cả GME và GSM: các tham số bề mặt được lấy từ GME, trong khi các tham số
đa mực khác được lấy từ GSM.

1.1.2.3 Số liệu cung cấp bởi JMA
Số liệu ở mực cao không có: mây ở dạng nước (qc), mây ở dạng băng (qi), địa
hình bề mặt và các tham số khác.
Độ phân giải ngang: 1.25x1.25
0
. Miền bao phủ: 60 – 160
0
E, 20
0
S – 60
0
N.
Các trường đa mực:
- (T – Td): 300, 400, 500, 600, 700, 850, 920, 1000hPa
- T, U, V, H: 0, 20, 30, 50, 70, 100, 150, 200, 250, 300, 400, 500, 700,
850, 920, 1000 hPA
Các trường đơn mực:
(T-Td), T: 2m (Nhiệt độ và nhiệt độ điểm sương tại độ cao 2m)
U, V : 10 m (thành phần gió tại độ cao 10m)
MSLP : Áp suất mực biển trung bình
Vì số liệu của GSM không đủ để chạy mô hình HRM nên Trung tâm dự báo Khí
tượng Thủy văn Trung Ương đã cải tiến và sử dụng cả bộ số liệu của mô hình GME và
GSM:
Số liệu GSM: MSLP, U, V, T, (T – Td) tại bề mặt và 16 mực áp suất, địa thế vị
tại mực 300 hPa


12
Số liệu GME: Các tham số mặt đất (địa hình, độ thô bề mặt, tham số đất, đất bao
phủ, núi…), mây dạng nước (qc), mây dạng băng (qi) tại 31 mực mô hình

1.1.2.4 Số liệu cung cấp bởi GFS (NCEP)
Số liệu GFS được phân bố miễn phí tại server của NCEP tgftp.nws.noaa.gov
+ Miền bao phủ: 360 x 180 điểm lưới, độ phân giải ngang là 1
0
x1
0
.
+ Các tham s b mt, các trng c nh, các tham s a mc (26 mc):
- Các tham số đa mực: T, U, V, QV, QC tại 10, 20, 30, 50, 70, 100,
150, 200, 250, 300, 350, 400, 450, 550, 650, 700, 750, 800, 850, 900,
925, 950, 975, 1000 hPa
- Thời hạn dự báo: 00 đến 384 giờ
Trên đây là tổng quan về mô hình khu vực độ phân giải cao HRM đang chạy
nghiệp vụ tại Trung tâm Dự báo Khí tượng Thủy văn Trung Ương. Hiện nay mô hình
này vẫn tiếp tục được cải tiến.
1.2 Khái quát về bài toán đánh giá chất lượng dự báo thời tiết
Đánh giá là sự tính toán ước lượng mối quan hệ giữa tập số liệu dự báo và giá trị
quan trắc. Hoạt động đánh giá chỉ có ích khi ta đưa ra được những kết luận cuối cùng
đối với sản phẩm đang được đánh giá. Những giải pháp này có thể hoặc là sẽ sinh ra
các thay đổi trong các sản phẩm hoặc các phương pháp dự báo hoặc là giải quyết chúng
một cách thỏa đáng. Để đánh giá thì kết quả dự báo phải được trình bày một cách đầy
đủ và khách quan. Trong khi đó thì quan trắc lại được thừa nhận là sự mô tả chính xác
những gì có trong thực tế. Một vài phương pháp đánh giá đòi hỏi giả thiết rằng quan
trắc tại một điểm cũng có thể đại diện cho hiện tượng thời tiết xảy ra trong một vùng.
1.2.1 Mục đích và ý nghĩa của đánh giá dự báo


13
Mục đích của phương pháp đánh giá phải được thiết lập trước khi hệ thống đánh
giá được xác lập vì mục đích đánh giá có quan hệ mật thiết đến việc thiết lập hệ thống

đánh giá.
Theo Barbara Brown (2007), đánh giá chất lượng dự báo thời tiết bao gồm 3
mục đích chính sau đây:
a. Mục đích hành chính
Ban đầu, Cơ quan Khí tượng Canada (1871) sử dụng việc đánh giá để chứng tỏ
với Nghị viện những lợi ích mà công tác dự báo đem lạ1. Đồng thời, thông tin đánh giá
cũng có nhiều ứng dụng mang tính hành chính khác như: Yêu cầu tài trợ các trang thiết
bị như máy tính điện tử, hay quyết định khi nào và có nên thay đổi sản phẩm dự báo
bằng một sản phẩm khác hay một vài cách giải quyết khác. Điều này cũng phụ thuộc
vào sự phát triển của cộng đồng và sự phát triển của các trang thiết bị sử dụng trong
dịch vụ thời tiết. Các câu hỏi đặt ra cho việc đánh giá với những mục đích mang tính
hành chính là: “Liệu độ chính xác của bản dự báo sẽ được cải tiến?” hoặc “Các dự báo
khách quan về nhiệt độ tốt hơn so với dự báo chủ quan hay không?”. Đánh giá hành
chính được sử dụng để kiểm tra thường xuyên chất lượng tổng thể các bản dự báo và
theo dõi những thay đổi về chất lượng của chúng qua từng giai đoạn.
b. Mục đích khoa học
Mục đích khoa học của đánh giá chất lượng dự báo dùng để nhận biết chi tiết
những điểm mạnh và điểm yếu của một sản phẩm dự báo và từ đó có những hành động
tích cực nhằm cải thiện kết quả dự báo. Mặt khác, đánh giá khoa học cũng cung cấp
trực tiếp các thông tin cho hướng nghiên cứu và phát triển phương pháp dự báo
c. Mục đích kinh tế
Theo Brier và Allen (1951), mục đích kinh tế của đánh giá chất lượng dự báo
đóng một vai trò hết sức quan trọng, nó giúp đánh giá được lợi ích của việc dự báo
đúng, từ đó đưa ra được những quyết sách hợp lý trong các hoạt động có liên quan và


14
để thỏa mãn những yêu cầu từ người sử dụng sản phẩm dự báo cuối cùng. Ví dụ, khi có
một bản tin dự báo thời tiết chính xác sẽ giúp ích cho việc bảo vệ người dân trước các
thảm hiện tượng thời tiết nguy hiểm như bão hay lũ lụt hoặc cũng có thể giúp ích rất

nhiều trong các hoạt động sản xuất nông nghiệp…
Vì mục đích kinh tế là vấn đề phức tạp nên trong tiểu mục sau đã bỏ qua không
xem xét.
1.2.2 Mô hình đánh giá chung cho các yếu tố dự báo thời tiết




15

ĐGKH

ĐGHC

Phân lo
ại ngoại
bộ
Các t
ập số liệu d
ùng
để đánh giá
Phân lo
ại nội
bộ theo quan
trắc
Phân lo
ại nội
bộ theo dự
báo
Phân lo

ại
ngoại bộ
Phân lo
ại
nội bộ
Biến pha
Bi
ến

liên t
ục

B
ảng li
ên

hợp
Nguyên lý phát
hiện tín hiệu
Đồ thị điểm
Biến pha
Bi
ến

liên t
ục

Biến pha
Bi
ến


liên t
ục

B
ảng li
ên

hợp
Đồ thị điểm
B
ảng độ tin
cậy
Đi
ểm

Brier RPS

Đi
ểm kỹ

năng Brier
Sai s
ố trung
bình tuyệt đối
Sai s
ố b
ình
phương trung
bình

Đ
ộ giảm
phương sai

H
ệ số

Phân tán

Độ lệch


16
Hình 1.1 Sơ đồ chung cho đánh giá các yếu tố thời tiết
Theo tác giả Henry R. Stanski và các cộng sự (1989), việc đánh giá tổng quát
(chung) cho các yếu tố dự báo thời tiết được minh họa trên hình 1.1, đồng thời cũng
tóm tắt các kiểu quyết định được đưa ra trước khi một phương pháp đánh giá chuyên
dụng được chọn lựa. Đây chỉ là một mô hình đánh giá chung nhất và dĩ nhiên vẫn có
thể tồn tại nhiều mô hình tương tự khác. Tuy nhiên, mô hình này cho ta một bức tranh
nhất quán về mối quan hệ các đặc trưng của phép đánh giá các đại lượng đo và các giải
pháp khác nhau để có thể đem lại lựa chọn thích hợp.
Tất cả các phương pháp đánh giá đều được bắt đầu từ việc tập hợp các tập số
liệu quan trắc và dự báo (hình bình hành ở trên). Khi công việc trên đó hoàn thành thì
bước tiếp theo là việc xử lý số liệu. Việc này phụ thuộc vào các cách giải quyết khác
nhau (dạng hình thoi trong sơ đồ), tức là phụ thuộc vào mục đích đánh giá, đánh giá
hành chính hoặc đánh giá khoa học.
Một khi mục đích đánh giá đó được thiết lập, một tập mẫu có thể được phân loại
để đáp ứng mục đích đã định sẵn. Phân loại nghĩa là tách các phần tử trong tập mẫu
thành hai hay nhiều nhóm theo một nguyên tắc lựa chọn, sau đó, thực hiện đánh giá
cho từng nhóm riêng biệt. “Phân loại ngoại bộ ” nghĩa là đánh giá theo nguyên tắc lựa

chọn một cách độc lập các yếu tố cần đánh giá. Dạng phổ biến của phân loại ngoại bộ
chính là dạng cho phép xác định những biến đổi trong đánh giá theo thời gian (ngày
hoặc theo mùa). Ví dụ, ở Việt Nam dự báo giáng thủy vào mùa đông chính xác hơn
vào mùa hè, do vào mùa hè, giáng thủy sinh ra do đối lưu rất khó dự báo. Vì vậy phải
chia tập số liệu ra để đánh giá riêng cho từng mùa. Phân loại ngoại bộ có thể được tiến
hành ở bất cứ thời điểm nào trong quá trình, kể cả trước khi sử dụng đánh giá theo các
chỉ số thống kê và việc phân loại này hoặc là theo mục đích hành chính, hoặc là theo
mục đích khoa học.
Xuất phát từ các câu hỏi đặt ra đối với đánh giá khoa học ta thấy rằng, cần có
một nhu cầu phân loại cao hơn đối với tập mẫu. Ví dụ, nếu ta quan tâm đến dự báo cực
trị thì tập mẫu sẽ phải được phân nhóm để tách các giá trị đó từ chuỗi các sự kiện


17
không phải là cực trị. Kiểu phân nhóm này được gọi là “phân loại nội bộ” bởi vì
nguyên tắc phân loại được quyết định bởi mục đích đánh giá và sử dụng chính yếu tố
đang được đánh giá. Có hai cách để thực hiện phân loại nội bộ, và hình 1.1 cho thấy
kiểu đánh giá cho mỗi cách này hơi khác nhau.
Phân loại theo quan trắc nghĩa là phân loại theo giá trị của các yếu tố khí tượng
được quan trắc. Sau đó, các đại lượng đánh giá có thể được tính toán cho từng nhóm
giá trị quan trắc và giá trị thống kê được tạo thành này gọi là giá trị có điều kiện đối với
quan trắc. Một ví dụ cho phân bố có điều kiện của dự báo là một giá trị đặc biệt hay
một ngưỡng của các giá trị quan trắc.
Phân loại theo dự báo nghĩa là phân loại theo giá trị của các yếu tố khí tượng
được dự báo. Và cũng tương tự như trên, các con số thống kê được tính toán theo cách
phân loại này được gọi là điều kiện dự báo.
Việc lựa chọn kiểu phân loại phụ thuộc vào yêu cầu đánh giá. Và nhiều khi sẽ
cần phải sử dụng cả hai cách phân loại trên để đưa ra một câu trả lời hoàn chỉnh. Hơn
nữa, như đã thấy trên sơ đồ, những đại lượng đánh giá khác nhau (hình ô van bên dưới)
đặc trưng cho một kiểu phân nhóm khác và đưa ra nhiều thông tin khác nhau về sản

phẩm.
Ngược lại, trong đánh giá hành chính, người ta ít quan tâm chi tiết đến việc biểu
diễn những biến theo các giá trị khác nhau trong dự báo. Quả thực, các câu hỏi đặt ra
đều mang tính chung chung và chỉ cần một câu trả lời tóm tắt nào đó. Vì vậy, phân loại
nội bộ có thể vẫn được thực hiện nhưng nó hiếm khi được dùng đến. Tuy nhiên, ưu
điểm lớn của đánh giá hành chính là biểu diễn chất lượng sản phẩm chỉ bằng vài con số
hoặc là việc so sánh hay hướng nhận dạng được thực hiện dễ dàng hơn. Ta có thể thấy
được, bản chất tóm tắt tổng kết của đánh giá hành chính qua mối liên hệ với các luật
cho điểm tổng kết được chỉ ra ở hình 1.1.
Đôi khi việc cố gắng tổng kết tất cả các thông tin về chất lượng sản phẩm vào
một điểm số để cung cấp cho ban quản lý là một việc hết sức khó khăn. Việc tóm tắt


18
thông tin đánh giá vào một con số gây ra một áp lực lớn cho việc thiết kế hệ thống
đánh giá để chắc chắn rằng:
A. Điểm số được lựa chọn là đáng tin cậy theo yêu cầu.
B. Các sự kiện cấu thành đều được xem xét công bằng như nhau trong các điểm
số.
Hạn chế chung của bản tổng kết đánh giá này là tất cả các sự kiện đó đều được
xem xét công bằng như nhau trong quá trình trung bình hóa. Điều này được thực hiện
cho thuận tiện (việc tính toán sẽ đơn giản hơn khi sử dụng đại lượng trung bình) nhưng
cũng vì thế rất khó có thể tìm ra được trọng số phản ánh các sự kiện thành phần quan
trọng cho mục đích nào đó mà không có bất kỳ trở ngại nào đối với các thuộc tính
mong muốn khác của đánh giá. Vấn đề chưa được giải quyết là làm thế nào để đưa ra
trọng số của các sự kiện thành phần trong đánh giá tổng hợp.
Trước đây, người ta đặt ra yêu cầu quá cao đối với các điểm số đánh giá. Vì thế
các dự báo viên đã biểu hiện sự thất vọng khi cố gắng sử dụng các điểm số này để trả
lời các vấn đề khoa học. Bản chất của việc đánh giá tổng kết đó hạn chế việc sử dụng
chúng trong mục đích khoa học do thiếu sự phân loại đánh giá bằng những điều kiện

cho trước. Ví dụ, điểm số tổng kết không thể nói có thể mưa dự báo tốt như thế nào
trong các trường hợp ngưỡng thấp mà chỉ có thể nói mưa được dự báo tốt như thế nào
một cách chung chung. Không thể nói, dưới điều kiện nào mô hình phần tử hữu hạn
khu vực RFE (Regional Finite Element model) tốt hơn mô hình phổ, chỉ có thể nói
rằng mô hình RFE tốt hơn hoặc xấu hơn một chút so với mô hình phổ.
1.2.3 Các yếu tố dự báo
Sau khi giải quyết xong những vấn đề về phân nhóm và những yêu cầu của một
mô hình đánh giá đưa ra, chúng ta cần lựa chọn một phương pháp thích hợp để đáp ứng
các yêu cầu đó. Dựa theo mục đích đánh giá người ta chia ra thành hai dạng dự báo là:
dự báo các đại lượng liên tục và dự báo pha. Yếu tố dự báo liên tục là các yếu tố được
dự báo tại một giá trị riêng biệt hoặc là trong một khoảng giá trị. Trong số các yếu tố


19
thời tiết thì chỉ nhiệt độ và gió là hay được dự báo theo cách này. Ví dụ, “Nhiệt độ thấp
nhất đêm nay là gần -10
o
C”, hoặc “Gió tây có tốc độ 15 km/h, giật 25 km/h”. Yếu tố
dự báo pha là các yếu tố dự báo có thể xảy ra hoặc không xảy ra. Ví dụ như khi ta xét
sự xuất hiện của giáng thủy (có hai trường hợp xảy ra là mưa hoặc không mưa), hoặc
dạng của giáng thủy (thường có ba dạng là băng, tuyết và nước (mưa)).
Một vài yếu tố có thể được dự báo pha hoặc là dự báo liên tục, việc lựa chọn
chủ yếu phụ thuộc vào yêu cầu của người sử dụng trong quá trình dự báo. Nếu dự báo
yêu cầu chi tiết hơn thì dự báo viên sẽ phải dự báo lượng giáng thủy theo đơn vị mm
(loại trừ trường hợp giáng thủy lớn quá mức dự tính), giáng thủy có xuất hiện hay
không và dự báo đầy đủ lượng giáng thủy có thể xảy ra. Hệ thống đánh giá phản hồi lại
cho yêu cầu sử dụng theo đóng cách này. Một dự báo mà cho kết quả biến thiên liên
tục thì phải được đánh giá theo pha bởi vì tất cả những thông tin đó đều cần thiết cho
người sử dụng.Ví dụ về tầng mây, người ta có thể dự báo được độ cao tối thiểu là 100
feet, nhưng đa phần tầng mây được đánh giá theo các lớp mà vai trò của chúng là vô

cùng quan trọng đối với hàng không.
Dự báo xác suất được xem như dự báo theo pha tổng quát. Trong đó, mỗi pha
được gán bằng một xác suất xảy ra và tổng tất cả xác suất phải bằng một. Dự báo pha
là một dự báo xác suất thu hẹp, ở đây xác suất chỉ có hai trường hợp xảy ra là 0%
,100% và hiển nhiên là một trong hai trường hợp ấy chắc chắn sẽ xảy ra.
1.2.4 Các điểm số dùng trong đánh giá
Các điểm số dùng trong đánh giá được minh họa theo từng cặp ở phía dưới hình
1.1 cho ta thấy được mối quan hệ giữa chúng. Ví dụ, bảng liên hợp và đồ thị điểm là
hoàn toàn tương tự nhau, chúng cung cấp các dạng thông tin như nhau, bảng liên hợp
xuất phát từ yếu tố dự báo pha cùng đồ thị điểm xuất phát từ biến dự báo liên tục. Điểm
tổng kết luôn được phân loại theo cách này: Điểm Brier và điểm RP đều đo chính xác
các đặc tính của khả năng xảy ra hay biến pha, chúng tương tự sai số bình phương
trung bình của dự báo theo biến liên tục. Chú ý rằng dự báo pha không tương tự như
sai số trung bình tuyệt đố1. Có hai loại đại lượng đo được phân loại tương ứng theo dự


20
báo và quan trắc là “Bảng độ tin cậy” và “Nguyên lý phát hiện tín hiệu”. Trong khi đó
bảng liên hợp và đồ thị điểm lại tổng quát hơn, nó cho phép phân loại theo một trong
hai cách hoặc theo cả hai cách. Nguyên lý phát hiện tín hiệu là một ý tưởng mới mẻ và
hiện nay chưa được sử dụng rộng rãi.
Các điểm số liệt kê trên hình 1.1 và được trình bày trong chương 2 gồm 3 loại,
đó là: Các điểm số tuyến tính, các điểm số toàn phương (bậc hai) và điểm số kỹ năng.
Điểm số toàn phương đưa ra trọng lượng của sai số theo bình phương của chúng trong
khi đó điểm số tuyến tính cho sai số có giá trị bậc nhất. Vì vậy điểm số toàn phương
thường đưa ra trọng số sai số lớn hơn là điểm số tuyến tính và điểm số này rất phù hợp
trong các trường hợp sai số lớn thực sự nghiêm trọng hơn sai số nhỏ.
Điểm số kỹ năng được xây dựng để đánh giá mối quan hệ giữa dự báo và một
giá trị chuẩn nào đó. Giá trị chuẩn được chọn lựa để mô tả một dự báo không kỹ năng.
Ba tiêu chuẩn được sử dụng để so sánh là: sự may rủi (ngẫu nhiên), quán tính và khí

hậu. Tính ngẫu nhiên mô tả sự phỏng đoán thuần túy và không yêu cầu hiểu biết tri
thức, quán tính là một dự báo xác định và yêu cầu các hiểu biết về điều kiện thời tiết,
còn tính khí hậu là một dự báo trạng thái thời tiết diễn ra trong khoảng thời gian dài và
cần phải có sự hiểu biết về tiến trình lịch sử của thời tiết. Điểm số kỹ năng được biểu
diễn trong công thức sau:

ST
PS
STSC
SS



(1.0)

Trong đó SC là điểm có được từ dự báo, ST là điểm đạt được từ dự báo chuẩn
và PS là điểm từ dự báo hoàn hảo. Điểm số kỹ năng có thể được hình thành từ việc sử
dụng bất kỳ một trong các điểm số. Điểm số kỹ năng phổ biến nhất dựa trên nền tảng
của điểm Brier (điểm kỹ năng Brier), điểm RP (điểm kỹ năng RP), các giá trị của bảng
ngẫu nhiên (điểm Heidke) và sai số trung bình tuyệt đối. Tiêu chuẩn thường được sử
dụng nhất là tính khí hậu, còn điểm Heidke lại thường xuyên được kết hợp với tính


21
ngẫu nhiên. Không có điểm kỹ năng cơ bản nào là quan trọng hơn, chúng bình đẳng
như nhau và đều biểu hiện đặc tính của kỹ năng.
1.3 Mô hình đánh giá sản phẩm dự báo số trị
Hình 1.2 mô tả một nguyên tắc chung cho việc đánh giá sản phẩm dự báo số trị
và nó cũng phù hợp với nguyên tắc đánh giá các yếu tố khí tượng đó được trình bày ở
hình 1.1. Việc đánh giá được bắt đầu với một bộ số liệu bao gồm cả số liệu dự báo và

số liệu quan trắc và bộ số liệu này phải được thể hiện, sắp xếp đối xứng với nhau cả
theo không gian và thời gian. Theo quy mô không gian, số liệu quan trắc có thể sẽ
được phân tích về lưới của các số liệu dự báo hoặc là số liệu dự báo có thể được nội
suy theo không gian về các trạm quan trắc (điểm quan trắc). Tuy nhiên, cách thứ nhất ít
được làm thường xuyên hơn vì có những chỉ trích cho rằng khi số liệu quan trắc được
nội suy về điểm lưới thì nó đã không còn mang tính khách quan vốn có của nó như
trước khi nội suy nữa. Những chỉ trích này đã trở nên đặc biệt quan trọng đối với việc
đánh giá nếu việc phân tích là một trường sản phẩm thử nghiệm của mô hình và có thể
được kiểm tra lại. Trong trường hợp đó, sẽ có một độ lệch nào đó trong những kết quả
của mô hình. Do đó, điều quan trọng trong đánh giá mô hình là phải luôn luôn ghi nhớ
thủ tục kiểm tra lại số liệu quan trắc khi đánh giá kết quả.
Để đánh giá một sản phẩm mô hình số có hiệu quả, yêu cầu đặt ra là những vấn
đề quyết định cần phải giải quyết phải được làm cho mục đích đánh giá trước khi một
hệ thống đánh giá được thiết lập. “Đánh giá hành chính” trả lời câu hỏi về xu hướng
trong kỹ năng và độ chính xác của mô hình và nó thường được sử dụng để so sánh độ
chính xác của hai mô hình khác nhau. Tương tự như đánh giá các yếu tố thời tiết cho
những mục đích hành chính, có một khuynh hướng nhằm giảm bớt những kết quả có
các giá trị số nhỏ thông qua việc sử dụng các điểm số chung.
“Đánh giá khoa học” bao gồm các câu hỏi trả lời về sự thay đổi theo không gian
và thời gian trong sự biểu diễn của mô hình để cung cấp thông tin có thể phản hồi lại
cho các nhà phát triển mô hình cải tiến thêm mô hình hay cho các dự báo viên để thay
đổi xu hướng dự báo. Một ví dụ đơn giản là việc đánh giá các đặc trưng như khu vực


22
áp suất thấp hay fronts. Bộ số liệu đánh giá phải được sắp xếp cẩn thận theo các đặc
trưng đó, và điều này có thể được thực hiện theo một trong hai hướng đó là theo cơ sở
của các đặc trưng quan trắc hay theo cơ sở của các đặc trưng dự báo.




23

Các t
ập số liệu d
ùnng đ

đánh giá
M
ục đích
khoa học
Qu
ản lý
hành chính
Phân lo
ại
ngoại bộ
Phân lo
ại theo không
gian
Đánh giá

chủ quan
SS tuy
ệt đối
trung bình
SS bình
phương TB
Điểm kỹ năng
Hệ số phân tán

Độ lệch
Tương quan

dị thường
Đánh giá khách quan


24
Hình 1.2 Sơ đồ chung cho đánh giá mô hình dự báo thời tiết số (NWP)
Phân loại theo không gian có thể được làm vì mục đích quản lý hành chính hoặc
vì mục đích khoa học. Phân loại theo không gian được tiến hành theo mục đích hành
chính để thấy được sự khác biệt trong độ chính xác trên các vùng của mô hình tương
ứng với các vùng quản lý hành chính của đất nước. Khi phân loại theo không gian
được tiến hành theo mục đích khoa học, các khu vực có quy mô dưới lưới được ưu tiên
lựa chọn để phản ánh các chế độ khí hậu khác nhau như các khu vực có địa hình đồi
núi, các vùng núi khuất gió, bờ biển, …
“Phân loại ngoại bộ” ở đây có ý nghĩa là phân chia bộ số liệu đánh giá theo mùa
hoặc theo thời gian chạy mô hình hoặc theo các quy luật chọn lựa khác độc lập với các
tham số đang được đánh giá. Phân loại theo mùa là cách sử dụng phổ biến để phát hiện
sự khác nhau trong biểu hiện giữa các mùa.
1.4 Các đặc trưng đánh giá
Một quan điểm cuối cùng về phép đánh giá là: “Một đánh giá đơn lẻ sẽ không
thể cho ta biết được thông tin đầy đủ về chất lượng của sản phẩm”. Tất cả đều cung cấp
thông tin về một hoặc một số đặc tính (thuộc tính) của sản phẩm dự báo. Do đó một hệ
thống đánh giá sẽ phải bao gồm cả việc tính toán các đại lượng được chọn khác nhau
để mô tả các thuộc tính thích hợp phục vụ cho mục đích đánh giá. Các thuật ngữ liên
quan tới các điểm số đánh giá đều được liệt kê dưới đây.
1.4.1 Độ chính xác
Độ chính xác là thuật ngữ chung chỉ ra mức độ chính xác, phù hợp giữa thời tiết
dự báo và thời tiết thực được thể hiện qua các quan trắc. Sự khác nhau giữa một giá trị

quan trắc và một giá trị dự báo được gọi là sai số. Sự khác nhau này càng nhỏ, sai số sẽ
càng nhỏ và độ chính xác sẽ càng cao. Cái khó là ở chỗ phải hiểu được ý nghĩa của
mức độ chính xác, nghĩa là ranh giới hay giới hạn có thể chấp nhận được. Sự tranh luận
về độ chính xác diễn ra ở nhiều mức độ khác nhau: một mặt có thể nói nó là độ chính
xác trung bình, mặt khác lại cho rằng nó là độ chính xác với từng điều kiện hoặc độ


25
chính xác riêng cho từng ngày, quả thực độ chính xác sẽ càng cao khi thời tiết tốt
(nghĩa là dự báo dễ).
Đôi khi độ chính xác cũng được biểu hiện thông qua các thuộc tính khác của dự
báo như độ tin cậy, độ phân giải hay độ không chắc chắn.
1.4.2 Kỹ năng dự báo
Kỹ năng hay độ chính xác tương đối được định nghĩa như độ chính xác của một
dự báo tương đối so với độ chính xác của một sản phẩm dự báo chuẩn. Theo tiêu chuẩn
chung, các dự báo chuẩn như chuẩn khí hậu, dự báo quán tính, dự báo ngẫu nhiên được
coi là không có kỹ năng. ý nghĩa của điểm kỹ năng là ở chỗ, chúng sẽ cho ta thấy sự
khác biệt về độ chính xác giữa các dự báo khác nhau.
1.4.3 Độ tin cậy
Độ tin cậy tương đương với độ lệch và là giá trị tuyệt đối trung bình cho phép
giữa tập giá trị dự báo và giá trị quan trắc của một yếu tố khí tượng. Thông thường độ
tin cậy được cải tiến nhờ Bias. Nhưng sau khi cải tiến làm độ tin cậy của các dự báo
tương đương tăng lên thì chính Bias lại sẽ bị khử đi.
Đối với các biến liên tục (ví dụ: nhiệt độ), độ tin cậy có thể được biểu diễn bằng
khả năng dự báo nhiệt độ tối đa trong khoảng cộng trừ 3
o
C. Độ tin cậy cho các dự báo
xác suất theo pha (hay khả năng dự báo có thể xảy ra) được định lượng trong một mức
tin cậy nào đấy, ví dụ: khả năng dự báo mưa là 70% tương đương tần số quan sát được
là 90%. Như vậy, dự báo này có sai số là 20%.

1.4.4 Độ phân giải
Độ phân giải là khả năng mà dự báo có thể phân chia hoặc phân tích một tập
mẫu thành các phần nhỏ với phân bố tần suất khác nhau. Độ phân giải liên quan đến độ
lệch chuẩn hay phương sai của chuỗi số liệu quan trắc được phân nhóm theo dự báo.
Độ phân giải cũng phụ thuộc vào kinh nghiệm và trình độ của chính người làm dự báo.

×