Tải bản đầy đủ (.pdf) (106 trang)

Nghiên cứu, xây dựng phần mềm dự báo dòng chảy dựa trên các phương pháp học máy tiên tiế

Bạn đang xem bản rút gọn của tài liệu. Xem và tải ngay bản đầy đủ của tài liệu tại đây (1.76 MB, 106 trang )

B NễNG NGHIP V PHT TRIN NễNG THễN
TRường đại học thđy lỵi

THUYẾT MINH ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ PHÁT TRIỂN CÔNG NGHỆ

Tên đề tài: Nghiên cứu, xây dựng phần mềm dự
báo dòng chảy dựa trên các phương pháp học
máy tiên tiến

Chủ nhiệm đề tài: ThS. Phạm Thị Hoàng Nhung

HÀ NỘI - 2009


B1-2-TMKHCN

THUYẾT MINH ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ PHÁT TRIỂN CÔNG NGHỆ1
I. THÔNG TIN CHUNG VỀ ĐỀ TÀI
1

Tên đề tài

2

Mã số

Nghiên cứu, xây dựng phần mềm dự báo dòng chảy
dựa trên các phương pháp học máy tiên tiến


3

5

Thời gian thực hiện: 12 tháng
(Từ tháng 1/2010 đến tháng 12/2010)

4

Cấp quản lý

Nhà nước

Bộ
Tỉnh

Cơ sở

Kinh phí 90 triệu đồng, trong đó:
Tổng số (triệu đồng)

Nguồn
- Từ Ngân sách sự nghiệp khoa học

90

- Từ nguồn tự có của cơ quan

0


- Từ nguồn khác
Thuộc Chương trình (ghi rõ tên chương trình, nếu có)
6

0

Thuộc Dự án KH&CN 2 (ghi rõ tên dự án KH&CN, nếu có)
Đề tài độc lập
7

Lĩnh vực khoa học
Tự nhiên;
Kỹ thuật (Công nghiệp, XD, GT, ...);

8

Nông, lâm, ngư nghiệp;
Y dược.

Chủ nhiệm đề tài
Họ và tên:
Năm sinh:
Nam/Nữ:

Phạm Thị Hoàng Nhung
1979
Nữ

Mẫu Thuyết minh này dùng cho đề tài nghiên cứu ứng dụng và triển khai thực nghiệm thuộc các lĩnh vực khoa
học đã nêu tại mục 7, trang 1 của Thuyết minh. Thuyết minh được trình bày và in ra trên khổ giấy A4.

2
Theo Quy định tạm thời về việc xây dựng và quản lý các dự án khoa học và công nghệ (Quyết định số
11/2005/QĐ-BKHCN ngày 25/8/2005 của Bộ trưởng Bộ KH&CN)
1

3


Học hàm:
Học vị: Thạc sỹ

Năm được phong học hàm:
Năm đạt học vị: 2007

Chức danh khoa học: ThS, GV
Chức vụ:
Điện thoại:
Cơ quan: 04. 35637021 Nhà riêng: 04.36414138
Mobile: 0988.133.655
Fax: .................................................. E-mail:
Tên cơ quan đang công tác: Khoa CNTT, Trường Đại học Thủy Lợi
...............................................................................................................................................
Địa chỉ cơ quan: 175 Tây Sơn, Đống Đa, Hà Nội
...............................................................................................................................................
Địa chỉ nhà riêng: P1102, OCT2, ĐN1, Bắc Linh Đàm- Hà Nội
...............................................................................................................................................
9

Cơ quan chủ trì đề tài
Tên cơ quan chủ trì đề tài: Trường Đại học Thủy Lợi

...............................................................................................................................................
Điện thoại: 04.38522201
Fax: 04.35633315
E-mail: ...................................................................................................................................
Website:
Địa chỉ: 175 Tây Sơn, Đống Đa, Hà Nội
...............................................................................................................................................
Họ và tên thủ trưởng cơ quan: Nguyễn Quang Kim
Số tài khoản: ..........................................................................................................................
Ngân hàng: ............................................................................................................................
Tên cơ quan chủ quản đề tài: Bộ NN & PTNT, Vụ KHCN

II. NỘI DUNG KHOA HỌC VÀ CÔNG NGHỆ CỦA ĐỀ TÀI
10

Mục tiêu của đề tài (bám sát và cụ thể hoá mục tiêu đặt hàng - nếu có đặt hàng)
- Nghiên cứu các phương pháp học máy tiên tiến, so sánh, đánh giá để tìm ra phương pháp
phù hợp giải quyết bài tốn dự báo dòng chảy.
- Xây dựng phần mềm dự báo.

11

Tổng quan tình hình nghiên cứu và luận giải sự cần thiết phải nghiên cứu đề tài

(Trên cơ sở đánh giá tổng quan tình hình nghiên cứu trong và ngồi nước, phân tích những
cơng trình nghiên cứu có liên quan đến đề tài, những kết quả nghiên cứu mới nhất trong lĩnh vực
nghiên cứu đề tài, đánh giá những khác biệt về trình độ KH&CN trong nước và thế giới, nêu
được những gì đã giải quyết rồi, những gì cịn tồn tại, chỉ ra những hạn chế cụ thể, từ đó nêu

4



được hướng giải quyết - luận giải, cụ thể hoá được tính cấp thiết của đề tài và những vấn đề mới
về KH&CN mà đề tài đặt ra nghiên cứu)
11.1. Tình trạng đề tài
Mới

Kế tiếp (tiếp tục hướng nghiên cứu của chính
nhóm tác giả)

11.2. Đánh giá tổng quan tình hình nghiên cứu thuộc lĩnh vực của đề tài
Ngoài nước (phân tích, đánh giá được những cơng trình nghiên cứu có liên quan đến đề tài,
những kết quả nghiên cứu mới nhất trong lĩnh vực nghiên cứu đề tài; nêu được những khác biệt
về trình độ KH&CN trong nước và thế giới):
......................................................................................................................................................
Hiện nay, có rất nhiều phương pháp dự báo dịng chảy đã được đưa ra dựa trên các mơ
hình vật lý và toán học. Trong nhiều trường hợp, kết quả dự báo theo các mơ hình nói trên đã đạt
được một số thành công đáng ghi nhận. Tuy nhiên, vấn đề tìm kiếm phương pháp đủ tốt để giải
quyết bài toán dự báo vẫn là nội dung nghiên cứu thời sự hiện nay. Trong những năm gần đây
việc nghiên cứu, sử dụng các phương pháp học máy tiên tiến như: mạng nơron nhân tạo
(Artificial Neural Network - ANN), giải thuật di truyền (Genetic Algorithm - GA),... trong bài
toán dự báo chuỗi thời gian nói chung và dự báo dịng chảy nói riêng [5-7,12-14, 19] là một
hướng tiếp cận được sự quan tâm đặc biệt của một số nhóm nghiên cứu trên thế giới. Đây được
coi là những công cụ rất mạnh để giải quyết các bài tốn có tính phi tuyến, phức tạp và đặc biệt
trong các trường hợp mà mối quan hệ giữa các q trình khơng dễ thiết lập một cách tường
minh.
Demetris F. Lekkas [12] cung cấp một khung nhìn phương pháp luận về các phương pháp
dự báo dòng chảy. Ibrahim Can cùng các cộng sự [5] và Cristiane Medina Finzi Quintao và các
cộng sự [19] công bố một số kết quả nghiên cứu cập nhật về dự báo dịng chảy của một số dịng
sơng tại Thổ Nhĩ Kỳ và Brazin. Đặc biệt, các cơng trình này đã cung cấp cách thức đánh giá kết

quả thực nghiệm các phương pháp dự báo thủy văn được đề cập. Các cơng trình nghiên cứu
khác về mạng nơ-ron nhân tạo, giải thuật di truyền và kết hợp chúng đã khẳng định rằng đây là
một hướng nghiên cứu có thể giải quyết các bài tốn dự báo nói chung trong đó có dự báo dịng
chảy.
......................................................................................................................................................
Trong nước: (Phân tích, đánh giá tình hình nghiên cứu trong nước thuộc lĩnh vực nghiên
cứu của đề tài, đặc biệt phải nêu cụ thể được những kết quả KH&CN liên quan đến đề tài mà các
cán bộ tham gia đề tài đã thực hiện; nếu có các đề tài cùng bản chất đang thực hiện hoặc đăng ký

5


nghiên cứu ở cấp khác, nơi khác của nhóm nghiên cứu phải giải trình rõ các nội dung kỹ thuật
liên quan đến đề tài này; nếu phát hiện có đề tài đang tiến hành mà đề tài này có thể phối hợp
nghiên cứu được thì cần ghi cụ thể Tên đề tài, tên Chủ nhiệm đề tài và Cơ quan chủ trì đề tài đó)
......................................................................................................................................................
Tác giả Lê Xn Cầu và Nguyễn Văn Chương [1] đã sử dụng mạng thần kinh nhân tạo để
xây dựng dự báo lũ sông Cầu, sông Trà Khúc và sông Vệ đã đạt được những kết quả rất khả
quan.
Năm 2003, GS Huỳnh Ngọc Phiên (Viện Công nghệ châu Á – AIT) [2] đã ứng dụng mạng
nơ ron nhân tạo để dự báo mực nước tại các trạm Tạ Bú trên sông Đà, Yên Bái trên sông Thao
và Gềnh Gà trên sông Lô với thời gian dự báo 6h cho kết quả tốt, tuy nhiên nếu thời gian dự báo
tăng lên 18h thì hiệu quả của mơ hình giảm.
......................................................................................................................................................
11.3. Liệt kê danh mục các cơng trình nghiên cứu có liên quan đến đề tài đã nêu trong
phần tổng quan (tên cơng trình, tác giả, nơi và năm cơng bố - chỉ ghi những cơng trình tác giả
thật tâm đắc và đã trích dẫn để luận giải cho sự cần thiết nghiên cứu đề tài)
......................................................................................................................................................
[1].
Lê Xuân Cầu, Nguyễn Văn Chương (2000), Dự báo lũ sông Cầu, sông Trà Khúc và sông

Vệ bằng mạng thần kinh nhân tạo, Hội nghị khoa học và cơng nghệ dự báo khí tượng thủy văn,
202-210.
[2].

Huynh Ngoc Phien and Nguyen Duc Anh Kha (2003), Flood forecasting for the upper

reach of the Red river basin, North Vietnam, Water SA, vol. 29, no3, p.267-272.
[3].

Viện Khí tượng Thủy văn. Danh sách các đề tài, dự án nghiên cứu khoa học công nghệ.

/>[4].

Thomas Back (1996), Evolutionary Algorithm in Theory and Practice, Oxford University

Press.
[5].

Ibrahim Can, Cahit Yerdelen, Ercan Kahya1 (2007), Stochastic modeling of Karasu

River (Turkey) using the methods of Artificial Neural Networks, Proceeding of the AGU
Hydrology Days 2007, March 19 - March 21, 2007, Colorado State University, Fort Collins,
Colorado, USA, 138-144.
[6].

Paulin Coulibaly, Francois Anctil, and Bernard Bobee (2001), Multivariate Reservoir

Inflow Forecasting Using Temporal Neural Networks, Journal of Hydrologic Engineering, 6(5),
367-376.
[7].


Oscar R. Dolling, Eduardo A. Varas (2002), Artificial neural networks for stream flow

prediction, Journal of Hydraaulic research, 40(5), 547-554.

6


[8].

D.E. Goldberg (1989), Genetic Algorithm in Search, Optimization and Machine

Learning, Addison Wesley, Reading, MA.
[9].

J. Hertz, A. Krogh, and R.G. Palmer. (1991), Introduction to the Theory of Neural

Computation, New York: Addison-Wesley.
[10].

Ismail Kilinş, Kerem Ciğizouğlu (2005), Reservoir Management Using Artificial Neural

Networks, 14th. Reg. Directorate of DSI (State Hydraulic Works), Istanbul, Turkey.
[11].

Steve Lawrence and C. Lee Giles (2000), Overfitting and Neural Networks: Conjugate

Gradient and Backpropagation, International Joint onference on Neural Networks, Como, Italy,
July 24–27, 114–119, 2000.
[12].


D.R. Legates, G.J. McCabe Jr. (1998), Evaluating the Use of "Goodness-of-Fit"

Measures in Hydrologic and Hydroclimatic Model Validation; Water Resour. Res.
1998WR900018, 35(1): 233.
[13].

Demetris F. Lekkas (2002), Development and Comparison of Data-Based

Flow

Forecasting Methods, PhD Thesis, Department of Civil and Environmental Engineering,
Imperial College of Science, Technology and Medicine, London.
[14].

Lekkas D.F., Onof C (2005), Improved flow forecasting using artificial neural networks,

9th International Conference on Environmental and Technology, Rhodes Island, Greece, 1-3
September 2005, 877-884.
[15].

Chin-Teng Lin, C.S. George Lee (1996), Neural fuzzy systems: a neuro-fuzzy

synergism to intelligent systems, Prentice-Hall Inc.
[16].

D. Montana and L. Davis (1989), Training feedforward neural networks using genetic

algorithms, In Proceedings of the Eleventh International Joint Conference on Artificial
Intelligence, 762-767, Morgan Kaufmann, San Mateo, CA.

[17].

Nelson, M.C. and Illingworth, W.T. (1991), A Practical Guide to Neural Nets, Reading,

MA: Addison-Wesley.
[18].

L.Wessels, E.Barnard (1992), Avoiding False Local Minima by Proper Initialization of

Connections, IEEE Trans. on Neural Networks.
[19].

Cristiane Medina Finzi Quintao, Walmir Matos Caminhas, Selenio Rocha Silva, Bruno

Rabelo Versiani (2004), Neo Fuzzy Neuron and its applications to Prediction flood and wind in
Brazil, Workshop on Modelling and Control for Participatory Planning and Managing Water
Systems, September 29-October 1, 2004 (Poster), Venice, Italia.

7


11.4. Phân tích, đánh giá cụ thể những vấn đề KH&CN cịn tồn tại, hạn chế của sản phẩm,
cơng nghệ nghiên cứu trong nước và các yếu tố, các nội dung cần đặt ra nghiên cứu, giải
quyết ở đề tài này (nêu rõ, nếu thành cơng thì đạt được những vần đề gì)
......................................................................................................................................................
Tại Việt Nam cũng có một số nghiên cứu thử nghiệm khá thành cơng dự báo dịng chảy sử
dụng mạng nơron nhân tạo. Tuy nhiên các tác giả chỉ sử dụng mạng nơ ron nhân tạo như một
công cụ để thực hiện nghiên cứu, chưa có những thay đổi về bản chất của mạng giúp chúng có
thể thực thi hiệu quả hơn. Ví dụ các tác giả thường sử dụng mạng nơ ron nhiều lớp truyền thẳng
(Multilayer Perceptron) với thuật toán học lan truyền ngược sai số (error back propagation). Đây

là một phương pháp học của mạng nơ-ron nhân tạo, nó cho phép điều chỉnh trọng số của mạng
để tối thiểu hoá hàm sai số. Giải thuật này hoạt động dựa trên cơ chế giảm gradient, với những
hàm đơn giản có một cực trị thì phương pháp giảm gradient đưa ta đến cực trị toàn cục. Tuy
nhiên, chúng ta biết rằng hàm sai số trong mạng nơ-ron nhiều lớp là một hàm có bề mặt rất phức
tạp với rất nhiều cực trị địa phương, do đó phương pháp này khơng thể đảm bảo cho ta tìm thấy
được một cực trị toàn cục trên bề mặt hàm giá này. Chính vì vậy, để cải thiện giải thuật, người ta
thường tìm cách thay đổi hằng số học hoặc thêm vào đó thành phần qn tính để cho phép có
thể vượt qua những cực trị địa phương trong quá trình tìm kiếm. Việc lựa chọn hằng số học và
hằng số quán tính cũng là một vấn đề rất khó khăn, bởi vì nếu chúng q lớn đơi khi dẫn đến
tình trạng khơng ổn định của q trình tìm kiếm, cịn nếu chọn quá nhỏ thì lại dẫn đến tốc độ
học chậm và khả năng vượt qua các cực trị địa phương thấp. Quá trình tìm kiếm trên những hàm
giá như thế này đã được chứng minh là một bài toán NP đầy đủ nghĩa là ta không thể sử dụng
được một giải pháp tổng quát có độ phức tạp đa thức để đạt đến kết quả. Đề tài này đi sâu vào
nghiên cứu bản chất của mạng nơ ron nhân tạo, cải tiến thuật toán học giúp việc áp dụng chúng
vào bài tốn dự báo dịng chảy hiệu quả hơn.
Ngồi ra, những cơng trình nghiên cứu trong nước thường sử dụng các phần mềm của nước
ngồi, ví dụ như WinNN. Việc sử dụng phần mềm của nước ngồi có một số nhược điểm như:
thiếu linh động, không thể thay đổi hoặc thêm các thuật tốn mới. Ngồi ra, chúng ta cịn phải
trả tiền bản quyền khi sử dụng.

12

Cách tiếp cận

8


(Luận cứ rõ việc lựa chọn cách tiếp cận phù hợp đối tượng nghiên cứu để đạt mục tiêu đặt
ra) ......................................................................................................................................................
1. Tiếp cận một số giải pháp đã có. Phân tích những ưu nhược điểm của mỗi phương pháp.

2. Tham khảo tài liệu về các giải pháp trên thế giới.
3. Tập hợp và tranh thủ các góp ý của cá nhân, tổ chức trong lĩnh vực thuỷ văn và công
nghệ thông tin.
......................................................................................................................................................
Nội dung nghiên cứu ứng dụng và triển khai thực nghiệm
(Liệt kê và mô tả những nội dung nghiên cứu ứng dụng và triển khai thực nghiệm cần tiến
hành để đạt được mục tiêu đặt ra, trong đó, chỉ rõ những nội dung mới, nội dung quan
trọng nhất để tạo ra sản phẩm, công nghệ chủ yếu; những hoạt động để chuyển giao kết
quả nghiên cứu đến người sử dụng; dự kiến những nội dung có tính rủi ro và giải pháp
khắc phục - nếu có)

13

......................................................................................................................................................
Nội dung 1: Thu thập tài liệu
-

Báo cáo thu thập các số liệu đo đạc thủy văn của một số trạm đo trên lưu vực sông Đà.

Nội dung 2: Tài liệu nghiên cứu các công nghệ liên quan
-

Tài liệu về mạng nơ ron nhân tạo
Tài liệu về giải thuật di truyền

Nội dung 3: Tài liệu về phương pháp đề xuất
- Tài liệu nghiên cứu về việc kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai
số để luyện mạng nơ ron nhân tạo.
Nội dung 4: Xây dựng phần mềm
-


Xây dựng môđun mạng nơ ron nhân tạo với giải thuật lan truyền ngược sai số.
Xây dựng môđun giải thuật di truyền.
Xây dựng môđun kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số.

9


Nội dung 5: Thử nghiệm
- Tài liệu về việc sử dụng phương pháp đề xuất trong dự báo dòng chảy.
Nội dung 6: Viết tài liệu hướng dẫn sử dụng
-

Viết tài liệu hướng dẫn sử dụng

Nội dung 7: Tổng kết báo cáo đề tài
.................................................................................................................................. ................. .
Phương pháp nghiên cứu, kỹ thuật sử dụng

14

(Luận cứ rõ việc lựa chọn các phương pháp nghiên cứu, kỹ thuật sử dụng phù hợp với từng
nội dung của đề tài; làm rõ tính mới, sáng tạo, độc đáo của các phương pháp nghiên cứu và kỹ
thuật sử dụng)
......................................................................................................................................................
Phương pháp nghiên cứu:
-

Sử dụng những kỹ thuật mới nhất của ngành Khoa học máy tính về trí tuệ nhân tạo, tính
tốn thơng minh.


-

Dựa vào tài liệu, kết quả thử nghiệm để đề xuất xây dựng phần mềm phù hợp.

Kĩ thuật sử dụng:
-

Mạng nơ ron nhân tạo.

-

Giải thuật di truyền.

-

Kỹ thuật lập trình trên Windows.

......................................................................................................................................................
15

Hợp tác quốc tế

Đã
hợp tác

Tên đối tác
(Người và tổ chức
khoa học và công
nghệ)


Nội dung hợp tác
(Ghi rõ nội dung, lý do, hình thức hợp tác,
kết quả thực hiện hỗ trợ cho đề tài này)

10


Dự kiến
hợp tác

Tên đối tác
(Người và tổ chức
khoa học và công
nghệ)

Nội dung hợp tác
(Ghi rõ nội dung cần hợp tác; lý do hợp tác; hình thức
thực hiện; dự kiến kết quả hợp tác đáp ứng yêu cầu của đề
tài)

16 Tiến độ thực hiện (phù hợp với những nội dung đã nêu tại mục 13)
Các nội dung, công việc
chủ yếu cần được thực
hiện
(các mốc đánh giá chủ
yếu)
1

Sản phẩm

phải đạt

Thời gian
(bắt đầu,
kết thúc)

Người,
cơ quan
thực hiện

3

4

5

2

1

Thu thập tài liệu

- Báo cáo thu thập các số liệu đo T1/2010
đạc thủy văn của một số trạm đến
đo trên lưu vực sông Đà.
T2/2010

Khoa
CNTT


2

Nghiên cứu các công
nghệ liên quan

- Tài liệu về mạng nơ ron nhân T3/2010
tạo
đến
- Tài liệu về giải thuật di truyền
T4/2010

Khoa
CNTT

3

Nghiên cứu giải pháp đề
xuất cho việc luyện mạng
nơ ron nhân tạo

- Tài liệu nghiên cứu về việc kết T5/2010
hợp giải thuật di truyền và giải đến
thuật lan truyền ngược sai số để T6/2010
luyện mạng nơ ron nhân tạo.

Khoa
CNTT

4


Xây dựng phần mềm

- Phần mềm có khả năng xây mơ T7/2010
phỏng mạng nơ ron nhân tạo đến
với các giải thuật học: lan T10/2010
truyền ngược sai số, giải thuật
di truyền và giải thuật đề xuất

Khoa
CNTT

5

Thử nghiệm

- Thử nghiệm phần mềm trong T10/2010
việc dự báo dòng chảy tại lưu đến
vực sông Đà. Đánh giá, so sánh T11/2010
các chỉ tiêu dự báo.

Khoa
CNTT

6

Viết tài liệu sử dụng

- Giúp người sử dụng có thể dễ T11/2010
dàng cài đặt, vận hành, khai
thác phần mềm một cách hiệu

quả.

Khoa
CNTT

7

Tổng kết báo cáo đề tài

T12/2010

11

Khoa


CNTT
III. DỰ KIẾN KẾT QUẢ CỦA ĐỀ TÀI
Dạng kết quả dự kiến của đề tài

17

Dạng kết quả I

Dạng kết quả II

Mẫu (model,
maket)

Ngun lý ứng

dụng

Sản phẩm (có thể
trở thành hàng hố,
để thương mại hố)

Phương pháp

Vật liệu

Tiêu chuẩn

Thiết bị, máy móc

Quy phạm

Dây chuyền công
nghệ
Giống cây trồng

Giống vật nuôi

Dạng kết quả IV

Sơ đồ, bản đồ

Bài báo

Số liệu, Cơ sở dữ
liệu


Sách chuyên
khảo

Báo cáo phân tích
Tài liệu dự báo
(phương pháp, quy
trình, mơ hình,...)

Phần mềm máy
tính

Đề án, qui hoạch

Bản vẽ thiết kế

Luận chứng kinh
tế-kỹ thuật, báo cáo
nghiên cứu khả thi

Kết quả tham gia
đào tạo sau đại học
Sản phẩm đăng
ký bảo hộ sở hữu trí
tuệ

Quy trình cơng
nghệ

Khác

18

Dạng kết quả III

Khác

Khác

Khác

Yêu cầu chất lượng và số lượng về kết quả, sản phẩm KH&CN dự kiến tạo ra
(Kê khai đầy đủ, phù hợp với những dạng kết quả đã nêu tại mục 17)

18.1 Yêu cầu kỹ thuật, chỉ tiêu chất lượng đối với sản phẩm dự kiến tạo ra (dạng kết quả
I)

1

Tên sản phẩm cụ thể và
chỉ tiêu chất lượng chủ
yếu của sản phẩm

Đơn
vị
đo

Cần
đạt

2


3

4

12

Mức chất lượng
Mẫu tương tự
(theo các
tiêu chuẩn mới nhất)
Trong nước
Thế giới
5

6

Dự kiến
số lượng,
quy mô
sản phẩm
tạo ra
7


18.2 Yêu cầu khoa học đối với sản phẩm dự kiến tạo ra (dạng kết quả II, III)
Tên sản phẩm

Yêu cầu khoa học dự kiến đạt được


Ghi chú

2

3

4

1

Sản phẩm phần mềm

- Có khả năng mơ phỏng hoạt động của
mạng nơ ron nhân tạo.
- Có thể thực hiện các thuật tốn luyện
mạng khác nhau.
- Có khả năng hiển thị trực tiếp các chỉ
tiêu về dự báo dịng chảy trong q trình
chạy.

2

Tài liệu hướng dẫn

- Giúp người sử dụng có thể dễ dàng cài
đặt, vận hành, khai thác phần mềm một
cách hiệu quả.

3


Báo cáo phân tích

- Báo cáo thu thập các số liệu đo đạc thủy
văn của một số trạm đo trên lưu vực sông
Đà.
- Tài liệu về mạng nơ ron nhân tạo, tài liệu
về giải thuật di truyền, tài liệu về phương
pháp đề xuất.
- Tài liệu về quá trình thiết kế phần mềm.
- Tài liệu về việc sử dụng phương pháp đề
xuất trong dự báo dịng chảy.

4
5
18.3 Dự kiến cơng bố kết quả tạo ra (dạng kết quả IV)

1

Tên sản phẩm

Tạp chí, Nhà xuất bản

Ghi chú

2

3

4


1 Bài báo khoa học

Tạp chí Khoa học Thuỷ lợi và Môi trường

13


18.4. Đánh giá một số chỉ tiêu kinh tế-kỹ thuật của các sản phẩm, công nghệ nghiên
cứu, đặc biệt là của sản phẩm, công nghệ chủ yếu dự kiến tạo ra của đề tài so với các sản
phẩm tương tự trong và ngoài nước; so sánh với các phương án nhập công nghệ hoặc mua
sản phẩm tương tự để đánh giá hiệu quả của đề tài (trình độ KH&CN, tính phù hợp, hiệu quả
kinh tế, ...)
......................................................................................................................................................
Về kĩ thuật:
Các kĩ thuật đề xuất áp dụng vào đề tài đều là những kĩ thuật tiên tiến của ngành Khoa

-

học máy tính: Mạng nơ ron nhân tạo, giải thuật di truyền.
Về kinh tế:
Áp dụng thành cơng phần mềm dự báo dịng chảy mang lại nhiều lợi ích kinh tế cho các

-

ngành thủy điện, tưới tiêu,…
Xây dựng thành công phần mềm mạng nơ ron nhân tạo với các phương pháp học tiên

-

tiến giúp chúng ta làm chủ cơng nghệ, giảm thiểu kinh phí mua phần mềm nước ngoài.

......................................................................................................................................................

19

Khả năng và phương thức chuyển giao kết quả nghiên cứu

19.1. Khả năng về thị trường (nhu cầu thị trường trong và ngoài nước, nêu tên và nhu cầu
của khách hàng cụ thể nếu có; khi nào có thể đưa sản phẩm của đề tài ra thị trường?);
......................................................................................................................................................
Khả năng thị trường là rất lớn vì nước ta có mạng lưới sơng ngịi dày đặc, nhu cầu về dự
báo dịng chảy chính xác là rất lớn.
19.2. Khả năng về kinh tế (khả năng cạnh tranh về giá thành và chất lượng của sản phẩm)
......................................................................................................................................................
Sản phẩm nếu thành công sẽ có lợi thế lớn về giá thành, tính năng so với các sản phẩm cạnh
tranh.
......................................................................................................................................................
19.3. Khả năng liên doanh liên kết với các doanh nghiệp ngay trong quá trình nghiên cứu
......................................................................................................................................................
Có khả năng liên doanh liên kết với các doanh nghiệp trong quá trình nghiên cứu giải
quyết các bài tốn dự báo chuỗi thời gian.
......................................................................................................................................................
19.4. Mơ tả phương thức chuyển giao
(chuyển giao cơng nghệ trọn gói, chuyển giao cơng nghệ có đào tạo, chuyển giao theo hình thức

14


trả dần theo tỷ lệ % của doanh thu, liên kết với doanh nghiệp để sản xuất hoặc góp vốn (với đơn
vị phối hợp nghiên cứu hoặc với cơ sở sẽ áp dụng kết quả nghiên cứu) theo tỷ lệ đã thoả thuận
để cùng triển khai sản xuất, tự thành lập doanh nghiệp trên cơ sở kết quả nghiên cứu tạo ra, ...)

......................................................................................................................................................
Mơ hình thích hợp nhất đối với các kết quả của đề tài là chuyển giao công nghệ có đào tạo.

20

Các lợi ích mang lại và các tác động của kết quả nghiên cứu

20.1. Đối với lĩnh vực KH&CN có liên quan
(Ghi những dự kiến đóng góp vào các thành tựu nổi bật trong khoa học quốc tế, đóng góp vào
tiêu chuẩn quốc tế; triển vọng phát triển theo hướng nghiên cứu của đề tài; ảnh hưởng về lý luận
đến phát triển ngành khoa học, đến sáng tạo trường phái khoa học mới; ...)
......................................................................................................................................................
Là một trong những đề tài khởi đầu trong việc cải tiến bản chất của mạng nơ ron nhân tạo
áp dụng trong việc dự báo dòng chảy. Xây dựng được phần mềm linh hoạt, khả năng tùy biến
cao, có giao diện thân thiện.
Sản phẩm của đề tài là tài liệu giảng dạy, hướng dẫn Nghiên cứu khoa học và Đồ án tốt
nghiệp cho sinh viên các ngành công nghệ thông tin, thủy văn tài nguyên nước.
20.2. Đối với nơi ứng dụng kết quả nghiên cứu
Xây dựng được phần mềm dự báo có độ chính xác cao. Nếu ứng dụng thành cơng sẽ có thể
nhân rộng trên toàn quốc.
20.3. Đối với kinh tế - xã hội và môi trường
(Nêu những tác động dự kiến của kết quả nghiên cứu đối với sự phát triển kinh tế - xã hội:
những luận cứ khoa học của đề tài có khả năng ảnh hưởng đến chủ trương chính sách, cơ chế
quản lý cụ thể của Đảng và Nhà nước; khả năng nâng cao tiêu chuẩn văn hoá của xã hội; ảnh
hưởng đến môi trường; khả năng ảnh hưởng đến sự nghiệp chăm sóc sức khoẻ cộng đồng, hoặc
tạo ra sản phẩm hàng hoá đáp ứng nhu cầu thị trường, góp phần tạo cơng ăn việc làm, nâng cao
hiệu quả sản xuất, v.v...)
......................................................................................................................................................
Việc xây dựng thành công sản phẩm là bước khởi đầu trong việc nội địa hóa phần mềm
trong lĩnh vực tài nguyên nước.

IV. CÁC TỔ CHỨC, CÁ NHÂN THAM GIA THỰC HIỆN ĐỀ TÀI
Hoạt động của các tổ chức phối hợp chính tham gia thực hiện đề tài
(Ghi các tổ chức phối hợp chính tham gia thực hiện đề tài và nhiệm vụ được giao thực hiện
trong đề tài, kể cả các đơn vị sản xuất hoặc những người sử dụng kết quả nghiên cứu - Những dự
kiến phân công này sẽ được thể hiện bằng các hợp đồng thực hiện giữa chủ nhiệm đề tài và cơ
quan chủ trì đề tài với các đơn vị, tổ chức nói trên - khi được giao nhiệm vụ chính thức hoặc sau
khi trúng tuyển)
21

Tên tổ chức,

Địa chỉ

15

Nhiệm vụ được giao

Dự kiến


thủ trưởng của tổ chức
1

Khoa CNTT

thực hiện trong đề tài
175 Tây Sơn –Đống Đa
– Hà Nội

kinh phí


- Nghiên cứu thuật
tốn
- Xây dựng phần
mềm

Cán bộ thực hiện đề tài
(Ghi những người dự kiến đóng góp khoa học chính thuộc tổ chức chủ trì
và cơ quan phối hợp tham gia thực hiện đề tài, không quá 10 người kể cả chủ
nhiệm đề tài - mỗi người có tên trong danh sách này cần khai báo lý lịch khoa
học theo Biểu B1-4-LLCN.SĐ)
22

Họ và tên

3

1

ThS. Phạm Thị Hoàng Nhung

2

PGS. TS. Nguyễn Đăng Tộ

3

CN. Phạm Văn Tùng
ThS. Dương Đức Toàn


4

KS. Nguyễn Thị Ngọc Hà

5

ThS. Trần Thị Minh Hồn

6

Cơ quan cơng
tác

Thời gian làm
việc cho đề tài
Nhiệm vụ dự kiến
(Số tháng quy
đổi 3)

Khoa CNTT,
ĐHTL
Khoa CNTT,
ĐHTL
Khoa CNTT,
Thủy văn, ĐHTL

12

Phụ trách chung


10

Phụ trách chung

10

Khoa CNTT,
ĐHTL
Khoa CNTT,
ĐHTL

8

ThS. Đỗ Văn Hải

Khoa CNTT,
ĐHTL

3

7

ThS. Vũ Anh Dũng

8

8

CN. Vũ Tiến Thái


9

KS. Phạm Trí Cơng

Khoa CNTT,
ĐHTL
Khoa CNTT,
ĐHTL
Khoa CNTT,

Thu thập tài liệu
Nghiên cứu về
mạng nơ ron nhân
tạo
Nghiên cứu về giải
thuật di truyền
Nghiên cứu về giải
thuật di truyền áp
dụng vào bài toán
luyện mạng nơ ron
nhân tạo
Nghiên cứu giải
thuật cải tiến tăng
hiệu quả luyện
mạng nơ ron nhân
tạo
Xây dựng phần
mềm
Xây dựng phần
mềm

Xây dựng phần

6

8
8

Một (01) tháng quy đổi là tháng gồm 22 ngày làm việc, mỗi ngày làm việc gồm 08 tiếng.

16


10

ThS. Dương Đức Toàn

ĐHTL
Khoa Thủy văn
Tài nguyên nước,
ĐHTL

17

8

mềm
Thử nghiệm


V. KINH PHÍ THỰC HIỆN ĐỀ TÀI VÀ NGUỒN KINH PHÍ

(Giải trình chi tiết xem phụ lục kèm theo)
Đơn vị: đồng
23 Kinh phí thực hiện đề tài phân theo các khoản chi
S
Trong đó
T
Mục chi
Kinh phí
Sự nghiệp khoa học
T
1 Mục 6050: Xây dựng đề cương
2.000.000
2.000.000
2 Mục 6100: Phụ cấp chủ nhiệm đề tài
3.600.000
3.600.000
3

Mục 6550: Chi phí văn phịng phẩm

4
5
6

Khác
0
0

500.000


500.000

0

Mục 6650: Hội thảo, hội nghị
Mục 7000: Chi phí nghiệp vụ chun
mơn

3.500.000
71.400.000

3.500.000
71.400.000

0

Kinh phí quản lý (cơ quan chủ quản)
Tổng

9.000.000

9.000.000

0

90.000.000

90.000.000

0


Bằng chữ: Chín mươi triệu đồng chẵn.
Hà Nội, ngày 24 tháng 12 năm 2009
Chủ nhiệm đề tài

Phịng Khoa học Cơng nghệ

Phịng Tài vụ

Hiệu trưởng Trường Đại học Thuỷ Lợi

18

0


BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NÔNG THÔN
TRƯỜNG ĐẠI HỌC THỦY LỢI

THUYẾT MINH ĐỀ TÀI NGHIÊN CỨU
KHOA HỌC VÀ PHÁT TRIỂN CÔNG NGHỆ

Tên đề tài: Nghiên cứu, xây dựng phần mềm dự
báo dòng chảy dựa trên các phương pháp học
máy tiên tiến
(Phần Giải thuật đề xuất)

CƠ QUAN CHỦ QUẢN:

BỘ NÔNG NGHIỆP VÀ PHÁT TRIỂN NƠNG THƠN


CƠ QUAN CHỦ TRÌ:

TRƯỜNG ĐẠI HỌC THỦY LỢI

CHỦ NHIỆM ĐỀ TÀI:

THS. PHẠM THỊ HOÀNG NHUNG

1


MỤC LỤC
Chương 1. Ứng dụng giải thuật di truyền vào bài toán tối ưu hoá trọng số của mạng nơ-ron
nhân tạo ...................................................................................................................................... 3
1.2 Xây dựng hàm giá ............................................................................................................ 3
1.2 Mã hoá nhiễm sắc thể ....................................................................................................... 3
1.2 Lai ghép ............................................................................................................................ 5
1.2 Đột biến ............................................................................................................................ 6
1.2 Thử nghiệm ...................................................................................................................... 6
1.2 Giải thuật đề xuất ........................................................................................................... 11
Chương 2. Kết hợp giải thuật di truyền với giải thuật lan truyền ngược sai số để tối ưu hoá
trọng số mạng nơ-ron nhân tạo................................................................................................. 13
2.1 Đặt vấn đề....................................................................................................................... 13
2.2 Kết hợp giải thuật di truyền và giải thuật lan truyền ngược sai số ................................. 14
Kết luận ................................................................................................................................ 16
Tài liệu tham khảo .................................................................................................................... 18

2



Chương 1. Ứng dụng giải thuật di
truyền vào bài toán tối ưu hoá trọng
số của mạng nơ-ron nhân tạo
Như chúng ta đã biết sử dụng giải thuật lan truyền ngược sai số để tối ưu hoá trọng số của
mạng nơ-ron nhân tạo đang được sử dụng rộng rãi hiện nay. Tuy nhiên, giải thuật này hoạt
động theo cơ chế giảm gradient nên nó khó có thể tìm ra được cực trị tồn cục. Trong nghiên
cứu của mình tơi sử dụng giải thuật di truyền để tối ưu hoá trọng số của mạng giúp quá trình
học của mạng được tốt hơn.
Để có thể sử dụng được giải thuật di truyền vào việc học của mạng nơ-ron cần phải thực hiện
một số bước như sau:


Xây dựng hàm giá



Mã hố nhiễm sắc thể



Thực hiện giải thuật di truyền

1.2 Xây dựng hàm giá
Hàm giá này sẽ được sử dụng để tạo nên độ phù hợp của các cá thể và của cả quần thể
trong GA. Trong nghiên cứu này tôi sử dụng hàm sai số căn quân phương RMSE của tập mẫu
học.

1 p n
∑∑ ( yij − dij )

pn=i 1 =j 1

=
RMSE

2

(2.1)

Trong đó:
-

y ij , d ij là đầu ra của mạng và đầu ra mong muốn của đầu ra thứ j tại mẫu học
thứ i

-

n là số đầu ra của mạng

-

p là số mẫu học

Trong q trình tiến hố của tồn bộ quần thể, hàm giá này sẽ dần dần đạt tới cực tiểu tồn
cục.

1.2 Mã hố nhiễm sắc thể
Mỗi cá thể trong GA sẽ thay mặt cho một bộ trọng số của mạng nơ-ron. Ở đây ta không
cần phải phân biệt trọng số nào ở lớp nào mà ta chỉ cần trải tất cả các trọng số lên sơ đồ gen của
nhiễm sắc thể.

a. Mã hoá nhị phân

3


Một phương pháp mã hoá nhiễm sắc thể khá nổi tiếng do Whitley cùng các đồng tác giả
[1] đề xuất gọi là GENITOR. Có một số phiên bản của GENITOR, về cơ bản mỗi trọng số của
mạng được mã hoá thành một chuỗi bit như trên hình dưới. Index-bit để chỉ ra rằng kết nối có tồn
tại hay khơng (bằng 1 - có kết nối, bằng 0 – khơng có kết nối). Chuỗi bit nhị phân còn lại sẽ biểu
diễn giá trị của trọng số. Whitley sử dụng 8-bit để mã hoá dải giá trị từ -127 đến +127 số 0 được
mã hoá 2 lần. Với cách mã hoá này các toán tử đột biến, lai ghép thực hiện khá đơn giản. Tuy
nhiên, muốn tăng độ chính xác của việc mã hoá cần phải tăng số bit mã hoá trên một trọng số. Do
đó, chiều dài của nhiễm sắc thể sẽ tăng theo dẫn đến việc thực thi thuật toán sẽ chậm.

Hình 2.3 Mã hố nhị phân trọng số theo phương pháp GENITOR

b. Mã hoá số thực
Montana D. và Davis L. [2] mã hoá trực tiếp các trọng số bằng các số thực là các giá trị
của các trọng số. Điều này làm tăng độ chính xác của phép mã hố cũng như giảm được kích
thước của nhiễm sắc thể. Trong nghiên cứu của mình chúng tơi cũng sử dụng phương pháp này để
thực hiện việc mã hoá trọng số của mạng. Các gen (trọng số) được khởi tạo ngẫu nhiên trong
khoảng (-3, +3). Tuy nhiên với kỹ thuật mã hoá này ta cần thay đổi các toán tử lai ghép, đột biến
cho phù hợp.

4


Hình 2.4 Ví dụ về phương pháp mã hố trọng số bằng số thực

1.2 Lai ghép

Có một số cách tiếp cận trong lai ghép giữa các nhiễm sắc thể [3].
a. Lai ghép trọng số (crossover-weights)
Toán tử lai ghép này sẽ đưa một giá trị vào mỗi vị trí của nhiễm sắc thể con bằng cách lấy
ngẫu nhiên một giá trị tại cùng vị trí của nhiễm sắc thể cha hoặc mẹ.
b. Lai ghép nút (crossover-nodes)
Việc lai ghép được thực hiện giữa các nút cùng vị trí của cha và mẹ. Mỗi khi hai nút tại
một lớp nào đó được lai ghép các trọng số của tất cả các liên kết đầu vào tới các nút đó sẽ được
hốn vị cho nhau (hình 2.5).

5


Hình 2.5 Lai ghép nút (crossover-nodes)

1.2 Đột biến
a. Đột biến trọng số (mutate weights)
Một gen (trọng số) được lựa chọn ngẫu nhiên với một xác suất p mutation để tiến hành đột
biến. Có hai phương pháp đột biến trọng số [3] là:
UNBIASED: với mỗi gen được chọn đột biến nó sẽ được thay thế bằng một giá trị ngẫu
nhiên xung quanh 0.
BIASED: với mỗi gen được chọn đột biến nó sẽ được cộng thêm một giá trị ngẫu nhiên.
Montana [3] đã thử nghiệm hai phương pháp đột biến trọng số này. Kết quả phương pháp
BIASED chạy tốt hơn. Điều này có thể được giải thích là do khi chạy bộ giá trị các trọng số có xu
hướng tốt hơn. Do đó, việc đột biến thay thế giá trị gốc bằng các giá trị ngẫu nhiên xung quanh
giá trị gốc (BIASED) sẽ cho kết quả tốt hơn là thay thế bằng các giá trị ngẫu nhiên xung quanh 0
(UNBIASED).
b. Đột biến nút (mutate nodes)
Toán tử đột biến nút sẽ chọn ra n nút không phải là các nút đầu vào. Tất cả các liên kết tới
các nút này sẽ lần lượt được cộng thêm một giá trị ngẫu nhiên.


1.2 Thử nghiệm
a. Thử nghiệm giải thuật di truyền với các phương pháp đột biến khác nhau
So sánh hai phương pháp đột biến ‘đột biến trọng số BIASED’ và ‘đột biến nút’, cả hai
phương pháp này đều sử dụng phương pháp ‘lai ghép trọng số’. Thử nghiệm với mẫu học dạng
hình sin gồm 30 mẫu, chi tiết trong phụ lục B. Các tham số giống nhau với cả hai phương án:

-

Số lượng quần thể: 100

-

Xác suất lai: 0.3

6


-

Xác suất đột biến: 0.1

-

Ngưỡng dừng lặp: 0.05

Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là bảng thống
kê các lần chạy và số thế hệ cần thiết để đạt được yêu cầu về sai số.

(1) – phương án ‘đột biến trọng số BIASED’
(2) – phương án ‘đột biến nút’


Bảng 2.2 So sánh các phương pháp đột biến
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27

28
29
30
31
32
33
34

(1)
61
227
152
97
27
60
164
181
31
57
167
146
780
342
100
235
138
44
71
316
37

70
80
68
249
123
55
89
39
77
247
159
73
130

(2)
100
21
33
15
33
170
593
152
104
116
101
91
647
56
377

515
42
54
118
161
153
96
45
100
20
82
41
33
24
43
150
60
11
40

STT
36
37
38
39
40
41
42
43
44

45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69

(1)
134
143
59

35
188
522
38
39
487
205
99
75
153
26
62
146
152
80
63
905
66
71
134
36
523
22
39
82
8
219
128
35
84

55

(2)
50
35
151
231
37
97
48
514
76
163
37
72
44
40
58
59
105
18
67
43
298
369
158
163
28
56
69

58
129
60
37
15
35
22

STT
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91

92
93
94
95
96
97
98
99
100

(1)
59
133
40
66
112
87
163
794
55
260
141
674
67
102
52
235
85
100
27

49
48
276
443
32
56
246
66
341
215
72

Trung bình 152.67

(2)
151
157
43
85
20
85
32
55
167
139
101
63
91
108
43

155
58
29
80
58
22
48
565
144
130
67
146
105
44
329

112.65

7


35

67

5

70

99


101

Nhận xét: Kết quả trung bình sau 112.65 thế hệ phương pháp ‘đột biến nút’ đã đạt yêu
cầu, nhỏ hơn nhiều so với phương pháp ‘đột biến trọng số BIASED’ là 152.67 thế hệ.
b. Thử nghiệm giải thuật di truyền với các phương pháp lai ghép khác nhau
So sánh hai phương pháp lai ghép là ‘lai ghép trọng số’ và ‘lai ghép nút’ cả hai phương
pháp này đều sử dụng phương pháp ‘đột biến nút’. Các tham số giống nhau với cả hai phương án:

-

Số lượng quần thể: 100

-

Xác suất lai: 0.3

-

Xác suất đột biến: 0.1

-

Ngưỡng dừng lặp: 0.05

Việc thử nghiệm được tiến hành với 100 lần chạy mỗi phương án. Dưới đây là bảng thống
kê số thế hệ cần thiết trong từng lần chạy để đạt được yêu cầu về sai số là 0.05.

(1) – phương án ‘lai ghép nút’
(2) – phương án ‘lai ghép trọng số’


Bảng 2.3 So sánh các phương pháp lai ghép
STT
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23

(1)
294
202

21
42
50
43
73
108
127
31
46
54
48
68
59
130
61
135
70
77
83
12
66

(2)
100
21
33
15
33
170
593

152
104
116
101
91
647
56
377
515
42
54
118
161
153
96
45

STT
36
37
38
39
40
41
42
43
44
45
46
47

48
49
50
51
52
53
54
55
56
57
58

(1)
176
32
50
114
29
18
179
46
114
21
139
79
82
74
55
35
186

88
32
147
59
131
1268

(2)
50
35
151
231
37
97
48
514
76
163
37
72
44
40
58
59
105
18
67
43
298
369

158

STT
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93

(1)
183
113

120
42
42
57
155
69
488
203
39
25
182
55
32
35
56
145
172
36
32
50
277

(2)
151
157
43
85
20
85
32

55
167
139
101
63
91
108
43
155
58
29
80
58
22
48
565

8


×