Tải bản đầy đủ (.doc) (76 trang)

Mạng nơron nhân tạo và ứng dụng trong dự báo thời tiết

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (613.56 KB, 76 trang )

MỤC LỤC
Chương 1............................................................................................................................3
NGHIÊN CỨU CHUNG VỀ BÀI TOÁN DỰ BÁO THỜI TIẾT...........................................3
Chương 2..........................................................................................................................20
LÝ THUYẾT VÀ ỨNG DỤNG MẠNG NƠRON NHÂN TẠO...........................................20
Mô hình nơron nhân tạo...........................................................................................24
Bảng 2.1: Một số hàm kích hoạt thường được sử dụng trong các mô hình nơron. .25
2.4.2.1. Tập mờ....................................................................................................31
2.5. Mạng lan truyền ngược.....................................................................................32
2.5.1. Cấu trúc mạng............................................................................................32
2.5.2. Thuật toán..................................................................................................34
Hình 3.3: Đồ thị biểu diễn mức độ mây..................................................................43
Modul 3: Xử lý dữ liệu đầu ra.............................................................................43
Modul 2: Mạng nơron..........................................................................................44
Hình 3.5: Minh họa cho vấn đề cực tiểu địa phương...............................................46
3.2.1. Khởi tạo trọng số...........................................................................................46
3.2.2. Hằng số học...................................................................................................47
3.2.3. Số lượng nơron lớp ẩn...................................................................................47
3.2.4. Cách thức cập nhật trọng số...........................................................................48

LỜI NÓI ĐẦU
Dự báo thời tiết ra đời từ xa xưa, từ khi có sự xuất hiện của con người và càng
ngày càng gắn bó với cuộc sống của chúng ta. Từ thủa ban đầu, con người đã có thể “dự
đoán ” trước được các hiện tượng tự nhiên sẽ xảy ra trong khoảng thời gian gần. Dần dần
kinh nghiệm quan sát được tích lũy, cộng thêm những tư duy sâu xa đã giúp họ có được
các dự báo chính xác hơn cho các hiện tượng khí tượng trong tương lai. Những phân tích,
kinh nghiệm tích lũy dần được đúc kết thành các bài toán dự báo, cho phép tính toán khá
chính xác hiện tượng thời tiết sắp xảy ra.
Hiện nay trên thế giới các hệ thống dự báo thời tiết nghiệp vụ được thực hiện bởi
3 phương pháp chính: phương pháp Synôp, phương pháp thống kê và phương pháp số trị.
Trong mỗi phương pháp đó lại có rất nhiều phương pháp và các mô hình dự báo cụ thể.


Mỗi phương pháp đều có những ưu điểm và nhược điểm riêng. Việc ứng dụng phương
pháp nào là tùy thuộc vào tài nguyên của hệ thống, trình độ của người dự báo, yêu cầu và
mục đích của người xây dựng hệ thống,...


Ở Việt Nam hiện nay sử dụng chủ yếu phương pháp Synôp. Trong phương pháp
này các nhà khí tượng thu thập số liệu tại các trạm khí tượng trên diện rộng ở cả lãnh thổ
Việt Nam và nước ngoài để xây dựng thành các bản đồ, rồi căn cứ vào các bản đồ đó để
suy ra trạng thái thời tiết ở các thời điểm tương lai. Phương pháp này có hạn chế là dựa
nhiều vào kinh nghiệm của người dự báo, họ phân tích tình huống tương tự để đưa ra dự
báo và điều này gặp khó khăn vì dữ liệu thời tiết rất lớn, đa chiều và biến đổi mạnh về
không gian và thời gian.
Ứng dụng mạng nơron nhân tạo là một trong những phương pháp thống kê. Đó là
một phương pháp mới, có nhiều ưu thế vượt trội trong việc giải quyết các vấn đề phi
tuyến. Các phương pháp thống kê nói chung và ứng dụng mạng nơron nhân tạo nói riêng
mang tính khách quan hơn dự báo Synôp và đáp ứng được nhiều yêu cầu của thực tiễn
mà dự báo Synôp không đáp ứng được.
Khái niệm mạng nơron được bắt đầu vào cuối những năm 1890 khi người ta cố
gắng mô tả hoạt động của trí tuệ con người. Từ đó, lý thuyết mạng nơron được phát triển
để áp dụng trong nhiều lĩnh vực trong đó có dự báo. Trên thế giới, mạng nơron đã và
đang được áp dụng trong nhiều lĩnh vực trong đó có thủy văn từ nhiều năm trước và đã
thu được nhiều thành tựu.
Với những ưu thế vượt trội của việc ứng dụng mạng nơron nhân tạo như tính
mềm dẻo, khả năng dung thứ lỗi cao, giải quyết được các vấn đề phi tuyến thích hợp
trong việc xử lý dữ liệu có tính biến động lớn,… Đó là những lý do để em chọn đề tài:
Mạng nơron nhân tạo và ứng dụng trong dự báo thời tiết, đề tài mong muốn ứng dụng
phương pháp này để đóng góp những cải tiến mới trong công tác dự báo thời tiết.
Bố cục đề tài:
Chương 1: Nghiên cứu chung về bài toán dự báo thời tiết.
Chương 2: Lý thuyết và ứng dụng của mạng nơron nhân tạo.

Chương 3: Chương trình thử nghiệm dự báo thời tiết ứng dụng của mạng nơron
lan truyền ngược.
Mặc dù đã cố gắng song đề tài khó tránh khỏi những thiếu sót. Em rất mong nhận
được những ý kiến đóng góp của Thầy Cô giáo cũng như của các bạn sinh viên để em có
thể hoàn thiện hơn đề tài của mình.

2


Em xin chân thành cảm ơn sự giúp đỡ của các thầy cô trong khoa, sự ủng hộ của gia
đình bạn bè và đặc biệt là sự hướng dẫn, chỉ bảo tận tình của Cô giáo - Thạc sĩ Nguyễn
Hiền Trinh đã giúp em trong quá trình thực tập để hoàn thành đề tài này.
Em xin chân thành cảm ơn!
Sinh viên
Nguyễn Thị Oanh

Chương 1
NGHIÊN CỨU CHUNG VỀ BÀI TOÁN DỰ BÁO THỜI TIẾT
1.1.

Mở đầu
Dự báo là một phát biểu về tương lai. Mỗi phát biểu như vậy có một cơ sở chắc chắn

nhất định. Các dự báo được xây dựng bằng nhiều phương pháp, kiểm chứng qua biểu
thức đánh giá. Vì vậy, dự báo là một lĩnh vực có tiềm năng rộng lớn.
Để nói về vai trò của dự báo thời tiết, chúng ta xem những hậu quả của thiên tai
không được dự báo về kịp thời gây ra.
Trên thế giới, năm 2008 là một trong những năm thế giới phải hứng chịu nhiều thảm
hoạ thiên nhiên nhất. Thiệt hại từ thảm hoạ thiên nhiên năm 2008 lên tới 200 tỷ
USD.Trong đó, có khoảng 220 nghìn người chết trong những thảm hoạ thiên nhiên như

lốc xoáy, động đất và lũ lụt. Châu Á chịu tác động mạnh nhất của thảm hoạ thiên nhiên.
Siêu bão Nargis tại Myanmar đã giết chết 130 nghìn người và phá huỷ phần lớn khu vực
đồng bằng thấp Irrawaddy.Tính tổng số, có khoảng 1700 cơn lốc xoáy đã phá huỷ nước
Mỹ trong năm qua, gây thiệt hại tới hàng tỷ USD.

3


Ở Việt Nam, Tổng cục Thống kê vừa tổng kết năm 2008, thiên tai đã làm 550 người
chết và mất tích, 440 người bị thương; gần 350 nghìn ha mạ, lúa và hoa màu bị mất trắng,
hơn 1 triệu con gia súc và gia cầm bị chết; 68 nghìn ha diện tích nuôi trồng thủy sản bị
thiệt hại, gần 5 nghìn ngôi nhà bị sập và cuốn trôi… Tổng thiệt hại do thiên tai gây ra năm
2008 lên tới gần 12.000 tỉ đồng. Nguyên nhân chính là sự gia tăng những cơn bão mạnh,
kỳ dị và sự xuất hiện của nhiều hiện tượng thời tiết nguy hiểm.
Để phòng tránh và giảm nhẹ những tác hại do thời tiết gây ra, việc dự báo thời tiết có
ý nghĩa rất quan trọng. Nhiều khi chỉ cần dự báo trước một vài tiếng đồng hồ cũng đủ để
sơ tán người và của ra khỏi vùng nguy hiểm, cứu được nhiều sinh mạng và tài sản chính
vì vậy, đã từ lâu con người đã quan tâm đến việc theo dõi và tìm cách dự báo thời tiết.
Dự báo thời tiết là một công việc hết sức phức tạp. Mặc dù khoa học dự báo thời tiết
ra đời đã trên 100 năm và hiện nay hàng trăm ngàn nhà khoa học ở nhiều nước đang nỗ
lực nghiên cứu để tìm cách nâng cao chất lượng công tác dự báo thời tiết nhưng cho đến
nay người ta vẫn chưa khẳng định được chính xác thời tiết của ngày hôm sau sẽ ra sao.
Dự báo thời tiết cần có một hệ thống thu nhập và trao đổi số liệu trên toàn cầu cùng
với các công cụ để xử lý làm căn cứ cho việc dự báo. Hệ thống quan trắc là cơ sở đầu tiên
của hệ thống dự báo thời tiết. Bên cạnh đó, hệ thống thông tin liên lạc có vai trò cực kỳ
quan trọng. Khâu cuối cùng trong hệ thống dự báo thời tiết là chỉnh lý các số liệu đã thu
nhập và sử dụng các phương pháp khác nhau đưa ra kết quả dự báo.
Như vậy, các phương pháp dự báo thời tiết được đề cập đến trong đề tài chỉ những
mắt xích cuối cùng trong hệ thống dự báo thời tiết.
1.2.Quy trình thực hiện dự báo

Dự báo là một quá trình phức tạp nhưng về cơ bản có thể thực hiện theo các bước sau:

4


1. Xác định mục tiêu
2. Xác định dự báo cái

3. Xác định khía cạnh thời
gian
4. Xem xét dữ liệu
5. Lựa chọn mô hình

Mô hình không
thích hợp

6. Đánh giá mô hình

Mô hình thích hợp
7. Chuẩn bị dự báo
8. Trình bày kết quả dự báo
9. Theo dõi kết quả dự báo

Hình 1.1: Quy trình dự báo
Bước 1: Xác định mục tiêu
Bước đầu tiên trong quy trình dự báo là xác định mục tiêu. Xác định mục tiêu là xác
định xem kết quả dự báo sẽ được sử dụng như thế nào. Mục tiêu chung của dự báo là để
lập kế hoạch và có những quyết định hành động hợp lý. Mục tiêu của dự báo thời tiết là
để người dân có những chuẩn bị cho các hoạt động trong tương lai và chính phủ có
những kế hoạch phòng chống rủi ro kịp thời.

Bước 2: Xác định dự báo cái gì
Khi các mục tiêu tổng quát đã rõ, ta phải xác định chính xác dự báo cái gì. Ví dụ, khi
mục tiêu chung là dự báo thời tiết nhưng một hệ thống có thể dự báo thiên tai gồm có:
bão, lũ lụt, mưa đá, sóng thần, hạn hán,… hay dự báo các thông số thời tiết hàng ngày
gồm có: nhiệt độ, độ ẩm, lượng mưa, các yếu tố về gió,… Đề tài này xây dựng hệ thống

5


thử nghiệm dự báo thời tiết hàng ngày với 6 thông số: nhiệt độ, độ ẩm, mưa, hướng gió,
tốc độ gió, mây.
Bước 3: Xác định khía cạnh thời gian
Có 2 loại khía cạnh thời gian cần xem xét
Thứ nhất là độ dài dự báo: dự báo dài hạn hoặc dự báo ngắn hạn. Ví dụ trong dự báo
thời tiết hiện nay Trung tâm KTTV Quốc gia đưa ra các bản tin dự báo thời tiết hàng
ngày, dự báo hạn vừa 1-3 ngày và dự báo dài hạn 3-5 ngày và nhận định xu thế thời tiết
mùa. Các hiện tượng thời tiết nguy hiểm khác như: tố, lốc, vòi rồng, lũ quét chỉ cảnh báo
trước từ 30 phút đến 1 giờ hoặc 2 giờ.
Thứ hai là người sử dụng và người làm dự báo phải thống nhất tính cấp thiết của dự
báo, ví dụ, thời gian hệ thống sẽ được xây dựng, thời gian để hệ thống thực hiện một dự
báo. Trong đề tài này tác giả thử nghiệm dự báo trước 24h, thời gian huấn luyện mạng
với dữ liệu của một mùa (90 ngày) là 9 giờ nhưng thời gian dự báo cho từng ngày gần
như là tức thời.
Bước 4: Xem xét dữ liệu
Cần phải xem xét đên dữ liệu mà hệ thống sẽ sử dụng nguồn dữ liệu, cách phân loại
chọn lọc, xử lý dữ liệu làm đầu vào hệ thống. Trong hệ thống dự báo thời tiết, nguồn dữ
liệu có thể được lấy từ các trạm khí tượng, vệ tinh, rađa, tầu thời tiết, máy bay thời tiết,
các phương tiện truyền thông,… Tùy theo loại dữ liệu mà có cách phân loại và xử lý phù
hợp, ví dụ như dữ liệu ảnh, dữ liệu âm thanh hay số liệu có đơn vị đo khác nhau thì sẽ
khác nhau. Trong đề tài tác giả sử dụng dữ liệu được quy về các đơn vị thống nhất: nhiệt

độ °C, độ ẩm: %, mưa: %, tốc độ gió: km/h, hướng gió: °, mây: % (tùy theo nhiều mây
hay ít mây).
Bước 5: Lựa chọn mô hình
Việc quyết định xem mô hình dự báo nào là thích hợp liên quan đến nhiều yếu tố dữ
liệu đầu vào, các yêu cầu về thời gian, yêu cầu và kết quả đầu ra, tài nguyên sẵn có,…
Quy trình lựa chọn mô hình dự báo có thể được lựa chọn dựa trên một số chiến lược dự
báo như sau:

6


Tiền định: Dựa trên mối quan hệ mật thiết giữa hiện tại và tương lai. Các mô hình
chuỗi thời gian thích hợp với chiến lược này.
1.

Triệu chứng: Dựa trên những dấu hiệu hiện tại để dự báo cho tương lai.

2.

Hệ thống: Dựa trên ý tưởng cho rằng xu hướng phát triển trong tương lai sẽ tuân

thủ theo một quy tắc nào đó, chẳng hạn các lý thuyết kinh tế - xã hội.
Đề tài này sử dụng chiến lược dự báo tiền định, với các điều kiện hiện tại của nước ta
như: cơ sở hạ tầng còn hạn chế, trang bị chưa đủ hiện đại, hệ thống quan trắc và thông tin
liên lạc chưa đáp ứng được đầy đủ các yêu cầu của công tác dự báo, phương pháp Synôp
thường dùng chưa mang lại độ chính xác dự báo cao,… phương pháp ứng dụng mạng
nơron nhân tạo đã chứng tỏ được nhiều ưu việt như: khả năng dung thứ lỗi cao, phù hợp
với các hệ thống có độ phức tạp tính toán lớn, đảm bảo được tính cấp thiết về mặt thời
gian,… hơn thế nữa, dữ liệu thống kê về thời tiết có thu thập được một cách đầy đủ nên
tác giả đã lựa chọn mô hình dự báo Chuỗi thời gian với ứng dụng của mạng nơron nhân

tạo.
Bước 6: Đánh giá mô hình
Đối với các phương pháp tất định thì bước này ít quan trọng hơn nhưng đối với các
phương pháp định lượng thì cần phải đánh giá mức độ phù hợp của mô hình (trong phạm
vi mẫu dữ liệu). Nếu mô hình không phù hợp thì quay lại bước 5. Đề tài sử dụng 2 tiêu
chí ME (Sai số trung bình) và MAPE (Sai số trung bình phần trăm tuyệt đối) để đánh giá
độ chính xác của dự báo thì thấy kết quả chấp nhận được.
Bước 7: Chuẩn bị dự báo
Sau khi đã đánh giá và lựa chọn được mô hình dự báo phù hợp thì chuẩn bị các số
liệu phục vụ cho việc dự báo.
Bước 8: Trình bày kết quả dự báo
Có nhiều cách để trình bày kết quả dự báo, có thể thông qua bảng biểu, đồ thị hay
hình ảnh minh họa, có thể trình bày ở dạng nói, trình bày tại một vị trí hoặc trên phương
tiện thông tin đại chúng,… Dù bằng cách này hay cách kia thì những kết quả dự báo phải
ngắn gọn, rõ ràng, thể hiện được sự tin cậy của dự báo và phải bằng ngôn ngữ người nghe
hiểu được.

7


Bước 9: Theo dõi kết quả dự báo
Độ lệch giữa giá trị dự báo và giá trị thực phải được thỏa thuận một cách tích cực,
khách quan và cởi mở. Mục tiêu của việc thảo luận là để hiểu tại sao có các sai số và xác
định độ lớn của các sai số, qua đó bảo trì và nâng cấp hệ thống dự báo. Trao đổi và hợp
tác giữa người sử dụng và người làm dự báo có vai trò rất quan trọng trong việc xây dựng
và duy trì quy trình dự báo thành công.
1.3.

Phân loại các phương pháp dự báo
Dự báo bao gồm các phương pháp dựa trên đánh giá và các phương pháp dựa trên


thống kê. Các phương pháp và các mối quan hệ giữa các phương pháp như sau:
1.3.1. Phương pháp ngoại suy
Phương pháp ngoại suy là một trong những phương pháp đơn giản để dự báo.
Phương pháp ngoại suy là phương pháp sử dụng các số liệu thống kê trong quá khứ làm
đầu vào. Trong phương pháp ngoại suy chỉ có số liệu quá khứ của đối tượng cần dự báo
là cần thiết. Các số liệu quá khứ này sẽ được khớp theo một hàm nào đó hoặc sử dụng
mạng nơron thông minh với một trục x là trục thời gian, một trục y là các số liệu quá khứ.
Các giá trị trong tương lai sẽ được dự báo bằng cách tính giá trị của hàm tại các thời điểm
trong tương lai. Tùy theo hàm được lựa chọn để khớp số liệu mà ta có các mô hình dự
báo khác nhau. Các hàm dự báo tiêu biểu nhất là hàm tuyến tính, mô hình dự báo hàm
mũ và hàm Logistic tương ứng với các mô hình dự báo tuyến tính, mô hình dự báo hàm
mũ và mô hình dự báo hàm Logistic.
-

Mô hình tuyến tính

Là mô hình đơn giản nhất với hàm được dùng để khớp số liệu là hàm tuyến tính
y=mx + b. Phương pháp thông dụng nhất để khớp n số liệu quá khứ vào hàm tuyến tính
là phương pháp bình phương tối thiểu. Trong đó, y là hàm tuyến tính của x (trục x là trục
thời gian, trục y là các số liệu quá khứ). Theo phương pháp này thì hệ số m, b sẽ được
tính:

8


m=
b=

n(∑ xy )(∑ x)(∑ y )

n ( ∑ ( x 2 )) − ( ∑ x ) 2

(∑ y )(∑( x 2 )) − (∑ x)(∑ xy )
n(∑(x 2 )) − (∑ x) 2

Đối với mô hình tuyến tính, một đại lượng r gọi là hệ số tương quan có thể được tính
để đánh giá độ chính xác của các số liệu thống kê. Hệ số r chạy từ 0 đến 1. Hệ số càng
gần 1 thì các số liệu quá khứ càng được khớp tốt vào hàm tuyến tính. Nếu giá trị quá nhỏ
có nghĩa là đại lượng dự báo không phụ thuộc tuyến tính vào thời gian, vì thế dùng mô
hình tuyến tính là không hợp lý. Giá trị r được tính như sau:
r=

n(∑ xy ) − (∑ x)(∑ y )

[n∑ x

2

][

− ( ∑ x ) n∑ y 2 − ( ∑ y )
2

2

]

- Mô hình hàm mũ
Mô hình hàm mũ phổ biến để tính các đại lượng tăng trưởng như dân số,… Phương
trình của hàm mũ được biểu diễn: y=b.mx. Nếu lấy log cả hai vế ta sẽ có:

ln(y) = x.ln(m) + ln(b)
Khi đó, dùng phương pháp bình phương tối thiểu để khớp hàm trên với số liệu quá
khứ đã được biến đổi tương ứng, ta sẽ tìm được các hệ số a=ln(m) và c = ln(b). Và m, b
sẽ được tính:
m = ea và b=ec
1.3.2. Mô hình ứng dụng mạng nơron
Là mô hình có khả năng “học” từ các dữ liệu quá khứ, có thể cập nhật các tham số.
Nếu lựa chọn được các tham số tối ưu thì đó là mô hình xấp xỉ rất tốt đường cong dịch
chuyển của đối tượng cần dự báo. Kết quả cũng có độ lệch chính xác cao. Đây là mô hình
được lựa chọn cho bài toán dự báo thời tiết của đề tài, cụ thể các vấn đề liên quan đến
mạng nơron sẽ được trình bày trong chương 2.
1.3.3. Phương pháp dựa luật
Các phương pháp ngoại suy truyền thống có giới hạn chính là bỏ qua tri thức của
người quản lý về các tình huống. Dự báo dựa trên luật là một kiểu của hệ thống chuyên

9


gia, đưa ra các vấn đề bằng cách chuyển các tri thức về dự báo thành một tập các luật.
Các luật này sử dụng tri thức chuyên gia và các đặc trưng của dữ liệu cùng với một số
phương pháp ngoại suy đơn giản để thực hiện dự báo.
Phương pháp dự báo dựa trên luật kết hợp phương pháp đánh giá tri thức theo miền.
Ưu điểm cơ bản của dự báo luật là kết hợp được các tri thức một cách dễ dàng.
1.3.4. Mô hình kinh tế lượng
Là mô hình với nhiều biến mô tả sự phụ thuộc của các đại lượng cần dự báo trên cơ
sở các thông số kinh tế xã hội như: thu nhập tổng sản lượng nội địa, khả năng mua, giá cả,
… Mô hình kinh tế lượng được biểu diễn bởi hàm sau:
y = a1x1 + a2x2 + … + anxn + b
Trong đó y là đại lượng cần dự báo, x1, x2, …, xn là các thông số kinh tế xã hội có liên
quan.

Các tham số a1, a2, …, an xác định sự phụ thuộc của đại lượng dự báo vào các thông
số kinh tế - xã hội. Các tham số này có thể được xác định dựa trên các nghiên cứu kinh tế
về thị trường và giá cả, … Nếu các số liệu quá khứ có thể thu thập được cho nhiều thông
số kinh tế cũng như đại lượng cần dự báo, các tham số a1, a2, …, an có thể được tính toán
dựa trên việc khớp các số liệu quá khứ vào các hàm tuyến tính.

1.3.5. Mô hình chuyên gia
Khi các số liệu quá khứ không có hoặc không thu thập được thì mô hình đánh giá
thường được sử dụng. Mô hình đánh giá dựa trên các ý kiến đánh giá của các chuyên gia
lĩnh vực này. Một mô hình tiêu biểu cho loại này là mô hình ý kiến chuyên gia.
Mô hình chuyên gia là mô hình dựa trên đánh giá của các chuyên gia trong lĩnh vực
cần dự báo hoặc có liên quan. Các số liệu dự báo của các chuyên gia đưa ra sẽ được xem
xét, đánh giá, tổng hợp để đưa ra kết quả dự báo cuối cùng.

10


Một trong các phương pháp dự báo này là để các chuyên gia tranh luận và đưa ra kết
quả dự báo. Phương pháp này dễ thất bại vì mỗi chuyên gia đều muốn bảo vệ ý kiến của
mình một cách thuyết phục.
Một phương pháp tốt hơn được biết đến là kỹ thuật Delphi. Kỹ thuật này tránh sự đối
đầu, giáp mặt trong một nhóm, do đó các ý kiến và người đưa ra ý kiến đều được giấu
tên. Kỹ thuật này được tiến hành lần lượt. Trong vòng đầu tiên, những người tham gia
được yêu cầu viết ra các yêu cầu của mình. Các kết quả đó được gom lại và được sao
chép ra để đưa cho các thành viên khác. Những người tham gia được yêu cầu đưa ra
những nhận xét để bảo vệ hay thay đổi ý kiến gốc của mình dựa trên những gì mà người
khác viết ra. Một lần nữa, những câu trả lời được gom lại và được đưa cho những người
tham gia,… Trong lần cuối cùng, những người tham gia được yêu cầu đánh giá lại ý kiến
ban đầu của họ trên quan điểm được thể hiện bởi các thành viên khác. Hệ thống chuyên
gia sử dụng các luật của chuyên gia. Các mô hình: ý kiến chuyên gia, phân tích kết hợp,

tự mồi và kinh tế lượng có thể giúp cho quá trình phát triển của hệ chuyên gia.
1.3.6. Mô hình tương tự
Dễ thấy rằng, không có kỹ thuật dự báo nào là thích hợp cho mọi tình huống. Dự báo
kết hợp cung cấp cho chúng ta cách thức để bù đắp những thiếu sót của một phương pháp
dự báo cụ thể nào đó. Bằng cách chọn những phương pháp bổ sung, sự thiếu sót của một
kỹ thuật có thể được đền bù bằng ưu điểm của những kỹ thuật khác.
Một mô hình kết hợp giữa ngoại suy và các ý kiến chuyên gia là mô hình tương quan.
Mô hình này cho phép so sánh, đánh giá theo phương pháp ngoại suy đối với các đại
lượng dự báo được kiểm chứng là có xu hướng phát triển theo đường ngoại suy. Các hệ
số cho phương trình ngoại suy sẽ được chỉ định dựa trên các ý kiến chuyên gia, so sánh,
đánh giá và hiệu chỉnh. Phương pháp này khác với phương pháp ngoại suy ở chỗ: ở
phương pháp ngoại suy, các hệ số sẽ được tính toán dựa trên các số liệu quá khứ, trong
khi đó các hệ số của phương pháp này có được hoàn toàn là do đánh giá, so sánh tương
quan của một đối tượng khác.
1.4.

Một số phương pháp với bài toán dự báo thời tiết

11


Dự báo thời tiết là một khoa học và là một nghệ thuật. Rất nhiều phương pháp đã
được ứng dụng cho dự báo thời tiết. Phương pháp cụ thể nàp được áp dụng phụ thuộc
vào một số các yếu tố như số lượng thông tin được sử dụng, mức độ phức tạp mà ứng
dụng dự báo thể hiện và kinh nghiệm của người dự báo,…
1.4.1. Phương pháp quán tính
Là phương pháp đơn giản nhất trong dự báo thời tiết. Phương pháp này giả thiết rằng
thời tiết ngày mai cũng giống thời tiết hôm nay, nghĩa là các điều kiện tại thời điểm được
dự báo sẽ không thay đổi. Phương pháp quán tính làm việc tốt khi các mẫu thời tiết thay
đổi rất ít và các đặc tính trên bản đồ thời tiết thay đổi rất chậm. Nếu điều kiện thời tiết

thay đổi đáng kể từng ngày thì phương pháp này không thể sử dụng được.
1.4.2. Phương pháp dự báo theo xu hướng
Một kỹ thuật dự báo thời tiết quan trọng khác là thông qua bản đồ thời tiết. Phương
pháp xu hướng yêu cầu xác định hướng, tốc độ di chuyển của các khối khí, hệ thống áp
suất và các vùng mây, lượng mưa. Dựa vào các thông tin trên mà người dự báo sẽ dự báo
các đặc tính thời tiết trong tương lai. Các khác biệt trong miền, sự tăng tốc hay giảm tốc
có thể của hệ thống bão, các tác động cục bộ như địa hình, khối nước và độ nóng của đảo
ảnh hưởng đến dự báo, do đó các yếu tố trên cũng được xem xét.
1.4.3. Phương pháp khí hậu học
Phương pháp khí hậu học cũng là một phương pháp đơn giản khác để dự báo thời tiết.
Điều đầu tiên được biết đến về dự báo của một vùng là khí hậu của nó (nhiệt độ cao, thấp,
trung bình hoặc lượng mưa). Phương pháp này cần đến thống kê thời tiết trung bình được
tính qua nhiều năm để thực hiện dự báo.
Khí hậu học hiếm khi là một dự báo đúng cho một ngày đã cho, vì dự báo có thể biến
đổi cao hoặc thấp so với trung bình. Phương pháp khí hậu học chỉ làm việc được tốt khi
mẫu thời tiết tương tự nahu ở cùng thời điểm trong năm. Nếu mẫu thời tiết quá bất
thường với một thời điểm đã cho trong năm thì phương pháp này thất bại.
1.4.4. Phương pháp tương tự
Phương pháp tương tự là phương pháp hơi phức tạp hơn để tạo nên một dự báo. Nó
liên quan đến việc xác định kịch bản dự báo của một ngày và nhớ đến một ngày trong quá

12


khứ khi kịch bản thời tiết là khá tương tự. Người dự báo có thể dự báo rằng thời tiết trong
dự báo rất giống như trong quá khứ.
Ví dụ, hôm nay rất ấm nhưng có khối khí lạnh đang đến gần khu vực này. Ta đến
điều kiện thời tiết tương tự một tuần trước đó, cũng một ngày ấm nhưng có khối khí lạnh
đang đến gần. Vào ngày đó cũng nhớ có sấm sét, mưa to vào buổi chiều khi khối khí lạnh
tràn vào khu vực. Do đó, sử dụng phương pháp tương tự, ta có thể dự báo rằng khối khí

lạnh cũng sẽ tạo ra sấm sét và mưa to vào buổi chiều.
Phương pháp tương tự là khó sử dụng vì không thể tìm được sự tương tự hoàn toàn.
Hiện tượng thời tiết đa dạng hiếm khi lặp lại ở cùng một địa phương nơi mà chúng đã
từng xảy ra. Tuy nhiên qua thời gian dài, khi nhiều dữ liệu thời tiết được thu thập thì cơ
hội tìm được một sự tương tự tốt cho tình huống thời tiết hiện tại có thể khá hơn và dự
báo tương tự có thể được cải thiện.
1.4.5. Phương pháp dự báo sử dụng văn bản
Văn bản đưa ra một cách tổng quan về các thông tin thời tiết quan trọng trong 24 giờ
đã qua cũng như là các biểu thị quan trọng của thời tiết trong 24 giờ tới. Tổng kết dữ liệu
ngày trước của thành phố để biết lượng mưa cũng như nhiệt độ cao thấp. Sau đó, đồ thị
được vẽ trên bản đồ trong một số giờ để tìm xu hướng chuyển động của các khối khí, hệ
thống thời tiết. Những bản đồ này được phân tích và thời tiết trong tương lai sẽ được dự
báo. Dự báo sử dụng văn bản là khó thực hiện dự báo chỉ sử dụng duy nhất thông tin
văn bản về thời tiết.
Hầu hết các phương pháp trình bày ở trên được sử dụng từ vài thập kỷ trước khi máy
tính chưa phát triển đủ mạnh để thực hiện các dự báo số trị. Ngày nay, chúng được sử
dụng để đánh giá mức độ hiệu quả của các dự báo thời tiết: so sánh với dự báo quán tính
hoặc với chuẩn khí hậu.
Sau đây xin giới thiệu một số phương pháp dự báo thời tiết nghiệp vụ (những phương
pháp mới, được ứng dụng trong những hệ thống lớn, chuyên nghiệp).
1.4.6. Phương pháp Synôp
Đây là phương pháp dự báo thời tiết cổ điển được sử dụng chủ yếu trong hơn 100
năm qua và cho đến nay vẫn được các nhà khí tượng ở nhiều nước sử dụng, trong đó có

13


Việt Nam, dựa trên việc thiết lập các bản đồ thời tiết. Việc dự báo phụ thuộc rất lớn vào
kinh nghiệm phân tích và đánh giá chủ quan của người làm dự báo bên cạnh các thông tin
bổ trợ từ các sản phẩm của mô hình dự báo số và phân tích ảnh mây vệ tinh,… Dự báo

theo phương pháp này cho kết quả tương đối tốt trong phần lớn các trường hợp, riêng với
mưa, sản phẩm dự báo mang tính định tính như mưa vừa, mưa to, mưa rất to,…mà không
có con số định lượng cụ thể. Hiện nay bản tin dự báo thời tiết đưa trên đài truyền hình
Việt Nam là kết quả của phương pháp này. Dự báo theo phương pháp này đòi hỏi người
dự báo có kiến thức về kỹ thuật dự báo còn phải có những kinh nghiệm và hiểu biết về
khí hậu thời tiết ở địa phương. Đây cũng là một hạn chế của phương pháp Synôp, cũng
do đặc điểm này mà dẫn đến những hạn chế khác như không thể dự báo trước nhiều
ngày, không thể dự báo cho nhiều vùng khác nhau,…
1.4.7. Phương pháp tổng hợp
Dự báo tổng hợp là một hướng mới đang được phát triển mạnh tại các trung tâm dự
báo khí tượng nghiệp vụ trên thế giới. Với việc coi khí quyển được cảm nhận và mô
phỏng (bởi quan trắc và các mô hình số trị) là một hệ thống tập hợp thống kê thay vì là
một hệ xác định, đặc trưng thống kê của tập hợp các dự báo khác nhau sẽ cho kết quả tin
cậy hơn của từng dự báo riêng biệt. Nghiên cứu ứng dụng phương pháp dự báo tổng hợp
ở Việt Nam đã nhận được một số kết quả ban đầu rất khả quan tại trung tâm Khí tượng
Thủy văn quốc gia.
1.4.8. Phương pháp số trị
Phương pháp dự báo số trị - dự báo bằng mô hình thủy động lực học hiện đại có độ
phân giải cao áp dụng cho từng khu vực đã được sử dụng ở nhiều quốc gia trên thế giới,
đặc biệt là các nước phát triển. Phương pháp này sử dụng sức mạnh của máy tính điện tử,
bằng rất nhiều cách khác nhau để giải hệ phương trình mô tả khí quyển để suy ra các biến
khí quyển như áp suất, nhiệt độ, vận tốc gió,… Chất lượng dự báo mưa lớn cao hơn hẳn
các phương pháp trên và sản phẩm số của mô hình dự báo có thể đảm bảo những yêu cầu
của mô hình dự báo thủy văn đối với lũ lụt, lũ quét. Một trong những nhân tố quyết định
gây nên sự hình thành và phát triển mưa lớn trong các hiện tượng thời tiết nguy hiểm như
xoáy thuận nhiệt đới,… là đối lưu mây tích. Các quá trình đối lưu này đóng vai trò quan
trọng trong chu trình vận chuyển năng lượng của khí quyển và do đó phân bố lại sự đốt

14



nóng không đồng đều trên bề mặt trái đất. Ngoài phụ thuộc vào độ hội tụ ẩm mực thấp,
đối lưu mạnh còn phụ thuộc vào tính bất ổn định của khí quyển,…Các quá trình quy mô
vừa này chỉ có thể tính được bằng các mô hình số trị. Với các phương pháp số trị, hiên
nay những trung tâm khí tượng lớn trên thế giới có thể đưa ra những dự báo thời tiết trên
phạm vi toàn cầu trước hàng tuần mà phương pháp Synôp cổ điển không thể nào thực
hiện được.
1.4.9. Phương pháp thống kê
Phương pháp thống kê lấy số liệu quá khứ làm đầu vào. Phương pháp này có ưu
điểm mang tính chất khách quan, đơn giản và dễ xây dựng mô hình cũng như sử dụng
trong nghiệp vụ. Độ chính xác của mô hình phụ thuộc rất nhiều vào việc lựa chọn các
tham số dự báo và quá trình xử lý số liệu. Bên cạnh đó, do đặc điểm cơ bản của phương
pháp thống kê là coi những quá trình xảy ra ở hiện tại và tương lai đều tuân theo các quy
luật thu được từ số liệu trong quá khứ, dẫn tới kết quả của mô hình dự báo phụ thuộc vào
độ dài tập mẫu. Chuỗi số liệu tập mẫu quá ngắn sẽ chứa trong nó những quy luật mà hiện
tại không có, còn chuỗi số liệu quá dài có thể gây mất ổn định hệ thống.
1.5.

Phương pháp giải với mạng nơron nhân tạo
Trong những năm gần đây, nhiều phương pháp như mô hình mờ, mạng nơron mờ,

mạng nơron thời gian hồi quy,… được áp dụng rộng rãi cho việc giải quyết các bài toán
phi tuyến phức tạp trong đó có dự báo thời tiết.

Đề tài nghiên cứu phương pháp dựa trên mạng nơron vì:
-

Mạng nơron là các bộ xấp xỉ đa năng, có thể nhận biết được nhiều mối quan hệ

trong dữ liêu.

-

Ứng dụng mạng nơron đang tỏ ra có nhiều ưu thế vượt trội và nhiều triển vọng

trong việc giải quyết các vấn đề phi tuyến, bất ổn định và phức tạp.
-

Mạng nơron cung cấp một cách chuyển đổi linh hoạt hơn các kỹ thuật truyền

thống thường bị giới hạn bởi các giả thuyết nghiêm ngặt về chuẩn tắc, tuyến tính, hay
sự độc lập các biến,…

15


-

Khả năng miễn nhiễu và chịu sai hỏng cao, chẳng hạn mạng có thể nhận các dữ

liệu bị sai lệch hoặc không đầy đủ mà vẫn hoạt động được, đây là điểm đáng chú ý nhất
của mạng nơron trong ứng dụng dự báo.
-

Khả năng thích ứng, mạng có thể học và hiệu chỉnh trong quá trình hoạt động, đặc

điểm này của mạng cho phép ta hi vọng một hệ có thể học tập để nâng cao khả năng
phân tích và dự báo trong khi hoạt động.
-

Khả năng tổng quát hoá tốt và phân lớp mạng.

Do đó, ứng dụng mạng nơron phù hợp vào bài toán dự báo thời tiết vì quy luật biến

đổi của dữ liệu thời tiết phức tạp và khó có thể xác định dựa trên các công thức toán học
hay ý kiến chủ quan của các chuyên gia.
Trong khí tượng học, đã có nhiều nhà khí tượng trên thế giới và Việt Nam sử dụng
mạng nơron nhân tạo như công cụ thống kê cho bài toán phức tạp giúp hiệu chỉnh sản
phẩm mô hình số, tái tạo và bổ sung số liệu, tính toán tổng lượng ozon trong khí quyển,…
Kết hợp mạng nơron với lý thuyết mờ là một hướng nghiên cứu mới trong nhiều năm
gần đây và đã có những kết quả cụ thể trong nhiều lĩnh vực ứng dụng trong đó có dự báo
thời tiết.
Về mặt lý thuyết, mạng nơron và hệ thống mờ là các hệ thống tương đương theo
nghĩa chúng có khả năng chuyển đổi được, tuy nhiên trong thực tế mỗi hệ thống lại có
những ưu, nhược điểm riêng. Ví dụ, đối với mạng nơron, tri thức có thể tự động thu được
bởi thuật toán hồi quy nhưng quá trình luyện lại tương đối chậm và việc phân tích mạng
đã luyện là khó khăn trong khi các hoạt động của các hệ thống mờ có thể giải thích được
dựa trên các luật mờ và như vậy tốc độ thực thi của chúng có thể điều chỉnh được.
Lý thuyết mờ thích hợp với bài toán dự báo thời tiết ở chỗ:
Thứ nhất, trong dữ liệu thời tiết đã có sẵn tính mờ. Ví dụ, ta thường bắt gặp những
mệnh đề sau: càng về đêm trời càng lạnh, gió chuyển về hướng tây, xu hướng bớt tuyết,
đôi chỗ có mưa, mưa rải rác trên diện rộng,… Tất cả các giá trị này, cùng với các đặc
điểm như “đang tăng”, “hầu như”,… đều là những đặc tính của tập mờ.
Thứ hai, lý thuyết mờ đã từng được ứng dụng trong lĩnh vực này. Ví dụ, Bjarne
Hansen đã từng xây dựng hai hệ thống thời tiết mờ, một hệ thống dự báo chính xác độ

16


cao tối đa và tầm nhìn của mây, và một hệ thống khác dự báo thời tiết biển. Gottfried
Shaffar xây dựng hệ thống mờ, HS4Cast, dự báo lượng đá trên đường dựa trên việc đánh
giá nhiệt độ mờ, chính xác đến thấp hơn 0.75 độ.

Cuối cùng, Dự báo thời tiết là một lĩnh vực mà với các yêu cầu của nó, một hệ thống
mờ có thể đáp ứng được vì:
-

Đó là lĩnh vực mà các giải pháp xấp xỉ được chấp nhận. Giá trị và khoảng giá trị

của các biến (ví dụ hướng gió, lượng bao phủ mây, nhiệt độ) có thể biểu diễn số được.
Một số hoặc tất cả các biến này đều có các biên mờ vì có lỗi do đo đạc, do quan sát, hoặc
do xấp xỉ một cách chú ý.
-

Đó là lĩnh vực mà mối quan hệ giữa đầu vào và đầu ra chắc chắn tồn tại nhưng

không được rõ ràng. Tùy theo mùa và tùy theo địa lý khu vực, cùng điều kiện thời tiết đầu
vào có thể dẫn đến các điều kiện thời tiết đầu ra khác nhau. Do đó:
+ Không có công thức toán học nào thích hợp để tạo ra các kết quả mong muốn
hoặc:
+ Có thể có những công thức tính toán nhưng nó phức tạp đến mức là khi nó chạy
trên bộ vi xử lý đích, sẽ không thể tạo ra được kết quả mong muốn trong thời gian
cần thiết.
Do vậy, đặt hộp đen mờ giữa những đầu vào và đầu ra của hệ thống sẽ giải quyết
được những yếu tố phức tạp trên, làm tăng thêm mức độ linh hoạt của mô hình.
Các phương pháp cộng tác giữa mạng nơron và hệ mờ có nhiều triển vọng tận dụng
được những ưu thế của mạng nơron cũng như khắc phục những hạn chế của mạng nơron
thông qua những ưu thế của mờ.

1.6.

Đánh giá dự báo
Nội dung chính của việc đánh giá dự báo là so sánh giữa kết quả dự báo và số liệu đo


bằng lý thuyết xác suất và thống kê toán học. Có rất nhiều cách đánh giá khác nhau, dưới
đây là một số phương pháp thường được sử dụng.

17


Giả sử Yt là giá trị quan trắc, Yt’ là giá trị dự báo, m là tổng số mẫu để đánh giá,
những giá trị trung bình có thêm gạch ngang trên đầu (Yt , Yt ' ) .
Sai số dự báo: et = Yt - Yt’

t = 1, 2, …, m

Sau đây là một số phép đo để so sánh khi cần đánh giá các mô hình dự báo khác
nhau.
a. Sai số trung bình:
1 m
∑et
m t =1

ME =

Thông số ME giúp đo sai số trung bình giữa dự báo và quan trắc. Nếu ME=0 có
nghĩa rằng, xét về trung bình, dự báo là hoàn toàn chính xác. ME càng gần 0 càng tốt.
b. Sai số trung bình tổng bình phương:
MSE =

1 m 2
∑et
m t =1


c. Sai số tổng bình phương:
m

SSE = ∑ et2
t =1

d. Hệ số tương quan:
R=

∑ (Y

t

)(

− Yt Yt ' − Yt

∑ (Y − Y ) ∑ (Y
2

t

t

t

'

'


)

− Yt

'

)

2

Thông số R cho ta ước lượng về sự tương đồng giữa giá trị dự báo và giá trị quan
trắc. Nếu R=1 có nghĩa là mọi điểm trong hệ trục tọa độ quan trắc – dự báo đều nằm
trên đường chéo chính.
e. Sai số trung bình phần trăm:
MPE =

100 m et

m t =1 Yt

Giả sử rằng MPE bằng 5%, khi đó ta có thể đánh giá mô hình với sai số thống kê
khoảng 5% đối với các giá trị dự báo trong tương lai gần. Phương pháp này tuy nhiên

18


sẽ cho kết quả không tốt nếu như Y t gần 0. Trong trường hợp đó không nên dùng
phương pháp này để đánh giá.
f. Sai số căn bậc 2 trung bình tổng bình phương:

1 m 2
∑ et
m t =1

RMSE =

RMSE là phương pháp đánh giá hay được sử dụng nhất để đánh giá độ chính xác
của dự báo. Thông số RMSE cho ta ước lượng về cường độ của sai số. Sai số này
càng lớn khi có nhiều dự báo có độ lệch lớn. Giá trị lý tưởng là RMSE = 0.
g. Sai số trung bình tuyệt đối:
MAE =

1 m
∑ et
m t =1

Sai số trung bình tuyệt đối cho ta ước lượng về cường độ trung bình của sai số giữa
dự báo và quan trắc. Giá trị lý tưởng là MAE = 0.
h.

Sai số trung bình phần trăm tuyệt đối:
MAPE =

100 m et

m t =1 Yt

MAPE đưa ra đánh giá về độ chính xác tương đối của mô hình. Cũng giống như chỉ số
trung bình phần trăm MPE, MAPE cũng sẽ cho ra kết quả không tốt nếu như YT+t nhỏ
gần đến 0.

i. Chỉ số kỹ năng
Để so sánh dự báo A với dự báo B dựa trên một chỉ số đánh giá nào đó (ME, RMSE,
R, …ký hiệu chung là S), ta sử dụng chỉ số kỹ năng:
Skill ( A, B ) =

S A − SB
SP − SB

Trong đó SP là giá trị lý tưởng cho chỉ số S, ví dụ với ME, RMSE là 0, với R là 1. Chỉ
số Skill(A, B) càng lớn thì mô hình A càng tốt hơn mô hình B và ngược lại.
Ngoài các chỉ số đánh giá được nói trên, người ta còn sử dụng một số chỉ số khác, ví
dụ số dự báo có sai số lần lượt nhỏ hơn 1 và 2 đơn vị, số cặp dự báo – quan trắc chính
xác hoàn toàn,…

19


Trong đề tài này, tác giả sử dụng 2 tiêu chí ME, MAPE để đánh giá tính khách quan
và độ chính xác tương đối của mô hình.
1.7.

Kết luận
Bài toán dự báo là bài toán rất quan trọng trong việc xây dựng chiến lược phát triển

cho mỗi cấp, mỗi ngành, mỗi tổ chức, mỗi cá nhân,…
Có nhiều phương pháp dự báo khác nhau, mỗi phương pháp đều có ưu điểm và
nhược điểm về độ phức tạp tính toán, về mức độ chính xác, về tính khách quan,…
Việc ứng dụng mạng nơron trong việc giải bài toán dự báo tỏ ra có nhiều ưu điểm vì
mạng nơron là một mô hình tính toán mềm dẻo, chấp nhận sai sót, dễ thích nghi,…
Sau khi xây dựng mô hình dự báo, cần đánh giá mô hình ngay mà không cần đợi đến

khi có kết quả dự báo với những gì đã xảy ra trong thực tế. Không có phương pháp chung
để đánh giá kết quả dự báo mà tùy theo mô hình dự báo, tùy theo lĩnh vực ứng dụng của
mô hình mà chọn chỉ số hoặc nhóm chỉ số để đánh giá.Việc tích hợp lý thuyết mờ và
mạng nơron là cần thiết. Điều đó làm tăng tính mềm dẻo, linh hoạt của mô hình và làm
tăng tính hợp lý của kết quả dự báo.

Chương 2
LÝ THUYẾT VÀ ỨNG DỤNG MẠNG NƠRON NHÂN TẠO
2.1. Giới thiệu

20


Nghiên cứu bộ não con người, cụ thể là tế bào thần kinh (nơron) là ước muốn từ lâu
của nhân loại. Từ đó, các nhà khoa học đã không ngừng nghiên cứu và tìm hiểu về mạng
nơron. Lý thuyết về mạng nơron đã hình thành và đang phát triển, đặc biệt là nghiên cứu
các ứng dụng của chúng.
Cơ sở xây dựng mạng nơron nhân tạo chính là cố gắng mô phỏng lại các quá trình
diễn ra trong các nơron sinh vật.
Quá trình nghiên cứu và phát triển mạng nơron nhân tạo có thể được chia thành 4 giai
đoạn như sau:
- Giai đoạn một: Giai đoạn một có thể tính từ nghiên cứu của William (1980) về tâm
lý học với sự liên kết các nơron thần kinh. Từ năm 1940 Mc.Colloch và Pitts đã cho biết:
nơron có thể được mô hình hóa như thiết bị ngưỡng (giới hạn) để thực hiện các phép tính
logic. Cũng thời gian đó Wiener đã xét các mối liên hệ giữa các nguyên lý phản hồi và
chức năng bộ não.
- Giai đoạn hai: Giai đoạn hai vào những năm 1960, gần như đồng thời một số mô
hình nơron hoàn hảo hơn đã được đưa ra, đó là mô hình Perceptron của Rosenblatt hay
Adaline của Widrow.
Trong đó mô hình Perceptron rất được quan tâm vì nguyên lý đơn giản, nhưng nó

cũng có hạn chế vì không dùng được cho các hàm logic phức tạp. Còn Adaline là mô
hình tuyến tính, tự chỉnh, được dùng rộng rãi trong điều khiển thích nghi, tách nhiễu, mô
hình này vẫn đang được phát triển và ứng dụng cho đến ngày nay.
- Giai đoạn ba: Giai đoạn ba có thể được tính là khoảng đầu của những năm 80 của
thế kỷ 20. Những đóng góp lớn cho mạng nơron trong giai đoạn này phải kể đến
Grossberg, Kohonen và Hopfield. Đóng góp lớn của Hopfield là hai mạng phản hồi:
mạng rời rạc năm 1983 và mạng liên tục năm 1984. Đặc biệt, ông đã dự kiến nhiều khả
năng tính toán lớn của mạng nơron mà một nơron không có khả năng đó. Cảm nhận của
Hopfield đã được Rumelhart, Hinton đề xuất thuật toán truyền ngược sai số nổi tiếng để
huấn luyện mạng nơron nhiều lớp nhằm giải quyết nhiều lớp bài toán phức tạp.
- Giai đoạn bốn: Giai đoạn bốn là từ năm 1987 đến nay. Hàng năm thế giới đều mở
hộ nghị toàn cầu chuyên ngành nơron. Các công trình nghiên cứu để hoàn thiện thêm về
lý thuyết mạng nơron như: mở rộng hoàn thiện các lớp mạng, phân tích tính ổn định của

21


mạng, kết hợp lý thuyết mạng nơron với các lý thuyết khác. Hàng loạt các lĩnh vực khác
như: kỹ thuật tính, tối ưu, sinh học, y học, thống kê, giao thông, hóa học, truyền thông, khí
tượng, …đã đóng góp nhiều công trình nghiên cứu, ứng dụng mạng nơron vào lĩnh vực
của mình và đem lại những kết quả đáng khích lệ.
Ở trong nước, mạng nơron được nghiên cứu từ những năm 1980, đi vào ứng dụng
trong các lĩnh vực tin học, viễn thông, đo lường, điều khiển, khí tượng, … Một số chip
nơron đã được dùng trong kỹ thuật lọc và một số ứng dụng khác. Trong ngành khí tượng
thủy văn, mạng nơron đã và đang được áp dụng cho dự báo lũ, dự báo trường nhiệt độ,
dự báo bức xạ mặt trời.
2.2. Nơron sinh vật
Nơron sinh vật có nhiều dạng khác nhau như dạng hình tháp, dạng tổ ong, dạng dễ
cây. Tuy khác nhau về hình dạng, nhưng chúng có cấu trúc và nguyên lý hoạt động
chung. Một tế bào nơron gồm bốn phần cơ bản như hình 2.1 dưới đây.

Các nhánh và rễ: Các nhánh và rễ là các bộ phận nhận thông tin, các đầu nhận và
các đầu ra của các nơron khác bám vào rễ hoặc nhánh của một nơron. Khi các đầu vào từ
ngoài này có sự chênh lệch về nồng độ K+, Na+ hay Cl- so với nồng độ bên trong của nó
thì xảy ra hiện tượng thấm từ ngoài vào trong thông qua một cơ chế màng thấm đặc biệt.
Hiện tượng thẩm thấu như vậy tạo nên một cơ chế truyền đạt thông tin với hàng nàn hàng
vạn nối vào trên một nơron sinh vật, ứng với hàng nghìn hàng vạn liên kết khác nhau,
mức độ thẩm thấu đặc trưng bởi cơ chế màng tượng trưng bằng một tỷ lệ. Tỷ lệ đó được
gọi là tỷ trọng hay đơn giản gọi là trọng số.

22


Hình 2.1: Cấu trúc nơron sinh vật
Thân thần kinh: Thân thần kinh chứa các nhân và cơ quan tổng hợp protein. Các ion
vào được tổng hợp và biến đổi. Khi nồng độ các ion đạt đến một giá trị nhất định, xảy ra
quá trình phát xung (hay kích thích). Xung đó được phát ra ở đầu ra của nơron. Dây dẫn
đầu ra của nơron được gọi là dây thần kinh.
Dây thần kinh: Dây thần kinh là đầu ra. Đó là phương tiện truyền dẫn tín hiệu. Dây
thần kinh được cấu tạo gồm các đốt và có thể dài từ vài micro mét đến vài mét tùy từng
kết cấu cụ thể. Đầu ra này có thể truyền tín hiệu đến các nơron khác.
Khớp thần kinh: Khớp thần kinh là bộ phận tiếp xúc của đầu ra nơron với rễ, nhánh
của các nơron khác. Chúng có cấu trúc màng đặc biệt để tiếp nhận các tín hiệu khi có sự
chênh lệch về nồng độ ion giữa bên trong và bên ngoài. Nếu độ lệch về nồng độ càng lớn
thì việc truyền các ion càng nhiều và ngược lại. Mức độ thẩm thấu của các ion có thể coi
là một đại lượng thay đổi tùy thuộc vào nồng độ như một giá trị đo thay đổi được gọi là
trọng số.

23



2.3.

Mạng nơron nhân tạo

2.3.1. Mô hình một nơron nhân tạo
Trên cơ sở mô hình nơron sinh vật tổng quát, người ta đề xuất mô hình nơron nhân
tạo gồm 2 thành phần chính: bộ tổng các liên kết đầu vào và bộ kích hoạt.

-1
W1

θ

W2

v(t)

.
.
.



y
f(.)

Wm

Hình 2.2: Mô hình nơron nhân tạo
Mô hình nơron nhân tạo

Để mô phỏng một nơron ta có thể coi nó như một hệ thống nhiều đầu vào và một đầu
ra (hình trên).
Bộ tổng: Bộ tổng hợp các liên kết đầu vào của một phần tử nơron có thể mô tả như
sau:
m

v(t ) = ∑ w k xk ( t ) − θ
k =1

Trong đó:
v(t) là tổng tất cả đầu vào mô tả toàn bộ thế năng tác động ở thân nơron.
x(t) là các đầu vào ngoài; k = 1, 2,…, m; m là số lượng đầu vào tín hiệu vào từ các
đầu nhạy thần kinh hoặc từ các nơron khác đưa vào.
wk: Trọng số liên kết ngoài, là hệ số mô tả mức độ liên kết giữa các đầu vào ngoài tới
nơron hiện tại; k= 1, … m; m là số đầu vào.
θ: là hằng số, còn gọi là ngưỡng, xác định ngưỡng kích thích hay ức chế.

24


Tên hàm
Bước nhảy đơn vị

Công thức tương ứng
1 if x0
f(x)=

0 if x<0

Hàm dấu (sgn)


1 if x0
f(x)=

Hàm đồng nhất
Hàm tuyến tính bão hòa

-1 if x<0

f(x) = x

đối xứng

1 if x0
x if -1x1
-1 if x<0

f(x)=

Hàm Sigmoid lưỡng cực

f ( x) =

2
−1
1 + e−λ x

Bảng 2.1: Một số hàm kích hoạt thường được sử dụng trong các mô hình nơron
Phần này sử dụng hàm quan hệ f(.) cho đầu ra y, để chặn tín hiệu ở đầu ra. Các hàm
đầu ra thông thường là các hàm có giới hạn ngưỡng phù hợp với đặc điểm đầu ra của

nơron sinh vật. Hàm dạng này thể hiện đặc điểm kích hoạt hay ức chế của một nơron.
m

y = f (u (t )) = f (∑ xi (t )w i − θ )
i =1

Với u(t)= v(t) và y(t) là đầu ra nơron mô tả tín hiệu đưa ra.
Hàm f(.) ở đây được chia thành hai nhóm: nhóm hàm bước nhảy và nhóm hàm liên
tục. Đặc điểm chung của các hàm này thường tiến tới một giá trị cố định với các giá trị
được gán [0, 1] hoặc [-1, 1]. Những dạng hàm kích hoạt hay dùng cung cấp ở bảng trên.
Một số dạng hàm khác cũng được sử dụng như: dạng hàm Gauss, hàm logarit, hàm mũ,
hàm arctg.
2.3.2. Cấu trúc mạng nơron nhân tạo
Có thể xây dựng cấu trúc mạng nơron dựa theo những yếu tố sau:
• Số lớp có trong mạng và số nơron trong từng lớp.

25


×