129
CHƯƠNG
4
ứng dụng quy hoạch phi tuyến và
quy hoạch động trong hệ thống
nguồn nớc
Những ứng dụng ban đầu các kỹ thuật vận trù học vào các bài toán hệ
thống nguồn nớc chủ yếu dựa vào việc sử dụng các kỹ thuật quy hoạch
tuyến tính và quy hoạch động. Việc sử dụng những kỹ thuật này để giải các
bài toán hệ thống nguồn nớc đã đợc ghi lại trong khá nhiều các tài liệu.
Các đoạn chơng trình quy hoạch tuyến tính đợc phổ biến rộng rãi, tuy
nhiên quy hoạch động đòi hỏi mỗi đoạn chơng trình riêng cho từng ứng
dụng. Việc sử dụng quy hoạch phi tuyến trong giải quyết các bài toán hệ
thống nguồn nớc cha đợc phổ biến mặc dù hầu hết các bài toán yêu cầu
lời giải trong thực tế là những bài toán phi tuyến. Sự phát triển gần đây của
những kỹ thuật quy hoạch phi tuyến mới và các đoạn chơng trình quy
hoạch phi tuyến sẵn có đã lôi cuốn những ứng dụng mới của quy hoạch phi
tuyến vào các bài toán hệ thống nguồn nớc. Hai phần đầu tiên của chơng
này trình bày những cơ sở của quy hoạch động. Sau đó, trình bày các bớc
tính toán tối u hóa phi tuyến không ràng buộc và các bớc tính toán tối u
hóa phi tuyến có ràng buộc.
4.1. Quy hoạch động
Quy hoạch động (DP-Dynamic Programming) biến đổi một bài toán
quyết định nối tiếp hay nhiều giai đoạn có thể có nhiều biến quyết định liên
quan với nhau thành một chuỗi những bài toán từng giai đoạn đơn lẻ, mỗi
bài toán con đơn lẻ này chỉ chứa một hoặc một vài biến. Nói cách khác, kỹ
thuật quy hoạch động phân tách một bài toán N quyết định thành một chuỗi
N bài toán con quyết định riêng lẻ nhng có liên quan với nhau. Sự phân
tách này là rất hữu dụng trong việc giải quyết những bài toán lớn, phức tạp
bằng việc phân tách một bài toán thành một chuỗi các bài toán con nhỏ hơn
130
và sau đó kết hợp các lời giải của các bài toán nhỏ hơn để nhận đợc lời
giải của mô hình tổng thể. Lý do sử dụng sự phân tách này nhằm để giải
một bài toán có hiệu quả hơn mà có thể tiết kiệm đáng kể khối lợng tính
toán. Theo kinh nghiệm, khối lợng tính toán tăng theo hàm mũ cùng với số
biến nhng chỉ tăng tuyến tính theo số các bài toán con. Chơng này chủ
yếu chỉ đề cập đến quy hoạch động. Những cuốn sách đề cập đến quy
hoạch động là Dreyfus and Law (1977), Cooper and Cooper (1981) và
Denardo (1982).
Để diễn tả triết lý chung về kỹ thuật quy hoạch động, xem xét bài toán
phân bổ tài nguyên sau. Giả sử rằng các nguồn vốn đợc phân bổ cho ba dự
án thuỷ lợi A, B và C, nhằm tối đa hóa tổng thu nhập dự tính. Mỗi dự án
gồm có những phơng án xây dựng khác nhau mà đòi hỏi những mức cấp
vốn khác nhau và mang lại những lợi nhuận khác nhau. Do sự hạn chế về
ngân sách, tổng lợng vốn sẵn có cho toàn bộ các dự án là không đổi (đã ấn
định). Nếu số phơng án cho mỗi dự án là không quá lớn, thì có thể liệt kê
đầy đủ tất cả những sự kết hợp có thể những phơng án của dự án để xác
định sự kết hợp các phơng án tối u cho sự phát triển dự án tổng thể. Tất
nhiên, hớng tiếp cận liệt kê đầy đủ này có ba nhợc điểm chính: (1) nó sẽ
trở nên không khả thi nếu số lợng những sự kết hợp các phơng án là lớn;
(2) không thể kiểm định đợc tổ hợp hành động tối u cho tới khi tất cả
phơng án kết hợp đợc kiểm tra, thậm chí tổ hợp này bắt gặp ngay từ
những tính toán ban đầu; và (3) không thể loại trừ ngay từ đầu những tổ hợp
nghiệm không khả thi.
Trong quy hoạch động mỗi phơng án cho mỗi dự án đợc xem xét
riêng mà không bỏ qua sự phụ thuộc lẫn nhau giữa các dự án thông qua
tổng ngân sách hiện có. Vì tổng lợng vốn bị hạn chế, lợng vốn dành cho
mỗi dự án phụ thuộc vào sự phân bổ cho các dự án còn lại. Với bất kỳ
những lợng vốn đợc ấn định cho các dự án A và B, sự phân bổ cho dự án
còn lại, C, phải đợc tiến hành để tối u hóa lợi nhuận của nó đối với khả
năng vốn còn lại đó. Nói cách khác, sự phân bổ tối u cho dự án C phụ
thuộc vào lợng vốn dành cho C sau khi đã phân bổ cho A và B. Vì không
biết những sự phân bổ tối u cho các dự án A và B, sự phân bổ và lợi nhuận
tối u từ dự án C phải đợc xác định cho tất cả các lợng vốn còn lại có thể,
sau khi những sự phân bổ cho các dự án A và B đợc tiến hành. Hơn nữa
với bất cứ lợng vốn nào đợc phân bổ cho dự án A, những sự phân bổ cho
dự án B và C phải đợc làm một cách tối u đối với lợng vốn còn lại sau
khi đã phân bổ cho dự án A. Để tìm đợc sự phân bổ tối u cho dự án B ta
tìm sự phân bổ làm tối đa hóa lợi nhuận từ dự án B cùng với lợi nhuận tối
u từ dự án C. Sự phân bổ này là một hàm của các lợng vốn còn lại từ sự
phân bổ cho dự án B. Cuối cùng, sự phân bổ tối u cho dự án A đợc xác
định để tối đa lợi nhuận từ dự án A cộng với lợi nhuận tối u kết hợp của dự
131
án B và C, nh một hàm của các lợng vốn còn lại sau khi phân bổ cho dự
án A.
Trong thực tế, những lợng vốn đợc phân bổ đồng thời cho cả ba dự án
này. Sự phân bổ theo một chuỗi thứ tự là một động tác về mặt toán học cho
phép ta tiến hành các quyết định kế tiếp nhau. Quy hoạch động có thể khắc
phục đợc những hạn chế của phơng pháp liệt kê đầy đủ bằng việc sử
dụng các khái niệm sau:
1. Bài toán đợc tách ra thành các bài toán con và phơng án tối u
đợc lựa chọn cho mỗi bài toán con theo một chuỗi trình tự để không
bao giờ cần liệt kê tất cả những phơng án về trớc của bài toán.
2. Bởi vì tối u hóa đợc áp dụng cho từng bài toán con, những phơng
án không tối u sẽ tự động bị loại bỏ.
3. Các bài toán con cần đợc kết nối với nhau theo một cách nhất định
để không bao giờ có thể tối u hóa trên những phơng án không khả
thi.
4.1.1. Các thành phần của mô hình quy hoạch động.
Ví dụ phân bổ lợng vốn cho dự án nớc vừa đợc mô tả có thể đợc
mô hình hóa bằng toán học là:
1 1
i
M
N
ij ij
i j
Max r x
(4.1.1a)
với giả thiết là:
1 1
i
M
N
ij ij
i j
c x F
(4.1.1b)
1
1, 1,2,3,
i
M
ij
j
x i N
với
(4.1.1c)
Tất cả x
ij
= 0 hoặc 1 (4.1.1d)
Trong đó
ij
r
là lợi nhuận có thể sinh ra từ phơng án j của dự án i,
ij
c
là
yêu cầu cấp vốn cho phơng án j của dự án i,
ij
x
là một biến quyết định mà
có thể lấy hoặc bằng 0 hoặc bằng 1, bằng 0 khi phơng án j của dự án i
không đợc lựa chọn và bằng 1 khi phơng phơng án j của dự án i đợc
lựa chọn. F là tổng lợng vốn giành cho dự án này, N là tổng số lợng các
dự án đợc xem xét, và M
i
là tổng số các phơng án của dự án i. Tập hợp
thứ hai về các ràng buộc biểu thị rằng không phải tất cả các dự án xét đến
phải đợc cấp vốn. Hơn nữa, các phơng án của mỗi dự án là xung khắc với
nhau, tức là chỉ một phơng án trong mỗi dự án có thể đợc chọn.
132
Hình 4.1.1
Biểu thị thứ tự của chuỗi các bài toán quy hoạch động.
Theo thảo luận chung về hớng tiếp cận giải quyết quy hoạch động, mô
hình quy hoạch toán học trên có thể đợc mô tả nh trong hình 4.1.1.
Theo hình 4.1.1, các phần tử và các ngôn từ cơ bản trong sự thiết lập các
bài toán quy hoạch động nh sau:
1. Các giai đoạn (n) là các điểm của bài toán mà các quyết định đợc
lựa chọn. Trong ví dụ phân bổ lợng vốn, mỗi dự án đặc trng cho
một giai đoạn trong mô hình quy hoạch động. Nếu một bài toán ra
quyết định có thể đợc phân tách thành N bài toán con, khi chuyển
sang bài toán quy hoạch động sẽ có N giai đoạn.
2. Các biến quyết định (d
n
) là các tổ hợp hành động đợc tiến hành
trong mỗi giai đoạn. Quyết định trong ví dụ phân bổ lợng vốn dự án
là phơng án đợc lựa chọn trong dự án. Số các biến quyết định, d
n
,
trong mỗi giai đoạn không nhất thiết bằng 1.
3. Các biến trạng thái (S
n
) là các biến diễn tả trạng thái của một hệ
thống tại giai đoạn n bất kỳ. Một biến trạng thái có thể là rời rạc
hoặc liên tục, hạn định hoặc không hạn định. Trong hình 4.1.1, ở
giai đoạn n bất kỳ, có các trạng thái đầu vào, S
n
, và các trạng thái
đầu ra, S
n+1
. Các biến trạng thái của hệ thống trong một mô hình quy
hoạch động có chức năng liên kết các giai đoạn kế tiếp sao cho khi
mỗi giai đoạn đợc tối u hóa riêng biệt quyết định thu đợc tự động
khả thi cho toàn bộ bài toán. Hơn nữa, nó cho phép ta ra những quyết
định tối u cho các giai đoạn còn lại mà không cần phải kiểm tra ảnh
hởng của các quyết định trong tơng lai tới các quyết định đã ra
trớc đấy.
4. Lợi nhuận giai đoạn (r
n
) là một chỉ số đo tính hiệu quả của quyết
định làm trong mỗi giai đoạn. Nó là một hàm của trạng thái đầu vào,
trạng thái đầu ra và các biến quyết định của một giai đoạn nhất định.
Tức là: r
n
=r(S
n
, S
n+1
, d
n
).
5. Phép biến đổi trạng thái hay phép biến đổi giai đoạn (t
n
) là một
phép biến đổi đơn trị biểu thị mối quan hệ giữa trạng thái đầu vào,
trạng thái đầu ra, và quyết định. Nói chung, thông qua phép biến đổi
trạng thái này, đầu ra tại một
133
Bảng 4.1.1
Chi phí và lợi nhuận của các phơng án trong Ví dụ 4.1.1
Dự án A Dự án B Dự án C
Phơng án
Chi phí
c
A
(triệu đô)
Lợi nhuận
r
A
(triệu đô)
Chi phí
c
A
(triệu đô)
Lợi nhuận
r
A
(triệu đô)
Chi phí
c
A
(triệu đô)
Lợi nhuận
r
A
(triệu đô)
1
2
3
1
2
3
5
6
8
2
3
4
8
9
12
1
3
-
3
5
-
giai đoạn n bất kỳ có thể đợc biểu thị bằng một hàm của trạng thái đầu vào
và biến quyết định nh sau:
S
n+1
=t
n
(S
n
, d
n
) (4.1.2)
Để minh họa thuật giải đại số của hớng tiếp cận quy hoạch động trong
tối u hóa một bài toán, bài toán phân bổ vốn dự án đợc giải trong ví dụ
sau.
Ví dụ 4.1.1. Bảng 4.1.1. gồm vốn cần thiết (triệu đô la) cho mỗi phơng án và r
i
biểu thị lợi nhuận
(triệu đô la) mà có thể đợc sinh ra do mỗi dự án. Tổng ngân sách xây dựng là 7 triệu đô la. Giả sử
rằng tất cả các dự án đang xét phải đợc thực thi. Xác định tổ hợp tối u các phơng án để tối đa hóa
lợi nhuận tổng cộng.
Lời giải. Các yếu tố cơ bản cho mô hình quy hoạch động đợc định nghĩa nh sau:
1. Giai đoạn (n): mỗi dự án biểu thị một giai đoạn với n = A, B và C.
2. Biến trạng thái (S
n
): biến trạng thái tại mỗi giai đoạn là tập hợp các phơng án đợc xét.
3. Biến quyết định (d
n
): biến quyết định là phơng án đợc chọn cho mỗi giai đoạn (dự án).
4. Lợi nhuận giai đoạn (r
n
): lợi nhuận đợc sinh ra từ phơng án đã chọn.
5. Hàm chuyển đổi trạng thái (t
n
): S
n
= d
n
với n = C và S
n+1
= d
n
với n = A và B.
Theo dạng giản đồ, bài toán này có thể đợc miêu tả nh trong hình 4.1.2a dới dạng một bài toán
chuỗi quyết định. Một cách rõ ràng hơn, hệ thống này có thể đợc
Hình 4.1.2a
Sự biểu thị thành
chuỗi của bài toán
ví dụ phân bổ ngân
sách.
134
Hình 4.1.2b
Biểu thị mạng lới của ví dụ phân bổ ngân sách sử dụng các phơng án nh là
các biến trạng thái.
mở rộng cho một sự biểu thị mạng lới nh đợc chỉ ra trong hình 4.1.2b khi chỉ ra trạng thái khả thi
(các phơng án) trong mỗi giai đoạn (dự án). Giả sử rằng chuỗi các quyết định theo thứ tự dự án đợc
chỉ ra trong hình 4.1.2a; phân tích này có thể đợc tiến hành theo trình tự ngợc lại bằng việc bắt đầu
với dự án cuối cùng (tức là dự án C). Thứ tự của các dự án là không quan trọng trong ví dụ này.
Thuật toán đệ quy bắt đầu với giai đoạn n = C, có hai trạng thái (hay phơng án) khả thi nh
đợc chỉ ra trong hình 4.1.2b. Vì đây là trạng thái cuối cùng, không liên quan đến sự tối u hóa nào.
Nói cách khác, quyết định tối u cho dự án C là
**
CC
Sd
bởi vì sự tối u hóa tơng ứng có thể đợc
phát biểu là
Max f
C
(S
C
) = r
C
(d
C
= S
C
)
ở dạng bảng, các tính toán cho giai đoạn này đợc chỉ ra trong Bảng 4.1.2(a).
Lùi lại một giai đoạn để xem xét dự án B. Với mỗi trạng thái khả thi ở giai đoạn n = B, mục đích là
để xác định sự kết nối tốt nhất (dới dạng lợi nhuận đợc tích lũy cho tới dự án B) cho tất cả các
trạng thái khả thi trong các giai đoạn ngay sau (chỉ có giai đoạn C ở thời điểm hiện tại). Bài toán tối
u hóa là
Max
*
( )
B B B B C B
f S r S f d
Những tính toán để xác định các kết nối tối u cho mỗi trạng thái khả thi trong dự án B đợc đa ra
trong Bảng 4.1.2(b). Chú ý rằng bài toán này là một chuỗi lựa chọn các phơng án với ràng buộc về
ngân sách. Cần phải theo dõi và kiểm tra các phí tổn tích lũy khi quá trình tối u hóa chuyển từ một
giai đoạn này sang giai đoạn kế tiếp.
Trong Bảng 4.1.2(b) với mỗi trạng thái khả thi của dự án B, đó là, SB = (phơng án 1, phơng án 2,
phơng án 3), điều đó tơng ứng hai quyết định có thể với các trạng thái trong giai đoạn kế tiếp (dự
án C), dC = SC = (phơng án 1, phơng án 2). Để giải thích những tính toán có liên quan trong Bảng
4.1.2(b) xét dòng cuối cùng tơng ứng với SB = phơng án 3. Lợi nhuận tích lũy gắn liền với dC =
phơng án 1 là 12 triệu đô la + 3 triệu đô la = 15 triệu đô la trong đó số đầu tiên (12 triệu đô la) là lợi
nhuận sinh ra từ sự lựa chọn phơng án 3 cho dự án B và số thứ hai (3 triệu đô la) do sự lựa chọn
phơng án 1 cho dự án C nh đã đợc chỉ ra trong Bảng 4.1.2(a). Chi phí tích lũy tơng ứng với sự
kết nối các trạng thái giữa các dự án B và C này (tức là, SB = phơng án 3 và SC = phơng án 1) là 4
triệu đô + 1 triệu đô = 5 triệu đô, là khả thi trong vòng hạn chế ngân sách là 7 triệu đô. Với chú ý tới
SB = phơng án 3 và dB = SC = phơng án 2, lợi nhuận tích lũy là 17 triệu đô, lớn hơn quyết định
ban đầu là 15 triệu đô; tuy nhiên, chi phí tích lũy là 7 triệu đô sử dụng hết toàn bộ ngân sách và
không còn kinh phí cho dự án A. Điều này vi phạm ràng buộc yêu cầu rằng tất cả các dự án phải
đợc thực thi. Vì vậy, quyết định dB = SC = phơng án 2 là không khả thi và cần phải loại bỏ. Hai
cột cuối cùng của Bảng 4.1.2(b) ghi vào lợi nhuận tích lũy tối u và quyết định tối u ứng với mỗi
trạng thái khả thi cho dự án B. Những sự nối kết tối u cho mỗi trạng thái khả thi trong từng giai
đoạn tới giai đoạn kế tiếp đợc đánh dấu bởi các khung chữ nhật trong Bảng 4.1.2b.
135
Khi đã kết thúc phân bổ dự án B, phân tích đợc tiến hành theo chiểu ngợc lại để xem xét dự án A.
Giải pháp tối u cho dự án A là phơng án 3, có lợi nhuận tổng cộng là 21 triệu đô la cho ba dự án
này. Sử dụng cùng một quá trình tính nh đã dùng cho dự án B, bảng tính toán cho dự án A đợc chỉ
ra trong Bảng 4.1.2(c). Kiểm tra cột cuối cùng trong Bảng 4.1.2(c) tơng ứng với quyết định tối u
*
A
d
, ngời ta thấy rằng tổng lợng vốn bằng 7 triệu đô đợc sử dụng hết khi thực hiện giải pháp tối
u.
Bớc cuối cùng của kỹ thuật quy hoạch động là bớc tìm ngợc qua ba giai đoạn theo thứ tự
ngợc lại, tức là A
B
C dùng bảng tính toán tơng ứng. Chú ý rằng, từ Bảng 4.1.2(c), tổng lợi
nhuận có thể đạt đợc lớn nhất là 21 triệu đô ứng với SA = phơng án 2. Với SA = phơng án 2,
quyết định tối u là
*
A B
d S
= phơng án 3 nh đã đợc khoanh tròn. Tiếp tục tìm ngợc trong
Bảng 4.1.2(b), với SB = phơng án 3, quyết định tối u tơng ứng là
*
B C
d S
= phơng án 1. Đến
đây thì hoàn thành bớc tìm ngợc chỉ ra sự lựa chọn tối u của các phơng án là
* * *
A B C
( d ,d ,d )
(
phơng án 2, phơng án 3, phơng án 1) và tổng lợi nhuận tối u (lớn nhất) là 21 triệu đô la. Bớc
tìm ngợc đợc minh họa trong hình 4.1.2b chỉ ra bởi các đờng nét đậm. Bài toán này cũng có thể
đợc giải bằng việc xác định biến trạng thái là lợng ngân sách sẵn có (Bài toán 4.1.2).
4.1.2. Các đặc trng về thuật giải của quy hoạch động
Từ ví dụ 4.1.1, các đặc tính cơ bản đặc trng cho tất cả các bài toán quy
hoạch động là nh sau:
1. Bài toán đợc chia ra thành các giai đoạn, với các biến quyết định tại
mỗi giai đoạn.
2. Mỗi giai đoạn có một số trạng thái gắn liền với nó.
3. ảnh hởng của quyết định đợc lựa chọn tại mỗi giai đoạn là để tạo
ra một lợi nhuận, dựa trên hàm lợi nhuận của giai đoạn đó, và để
biến đổi biến trạng thái hiện tại thành biến trạng thái cho giai đoạn
kế tiếp, thông qua hàm chuyển đổi trạng thái.
4. Với trạng thái hiện tại, một chính sách tối u cho các giai đoạn còn
lại là độc lập với chính sách đã đợc chấp nhận trong các giai đoạn
trớc. Đây gọi là nguyên lý Bellman về tính tối u, đợc xem nh là
cốt lõi của quy hoạch động.
5. Lời giải bắt đầu bằng việc tìm quyết định tối u cho mỗi trạng thái
có thể trong
Bảng 4.1.2(a)
Tính toán quy hoạch động cho dự án C
S
C
Lợi nhuận tối u
*
C
f
(triệu đô la)
Quyết định tối u
*
C
d
Phơng án 1
3
(1)
+
Phơng án 1 (chi phí = 1 triệu đô la)
Phơng án 2
5
(3)
Phơng án 2 (chi phí = 3 triệu đô la)
Dấu
+
trong () là chi phí tích lũy cho các dự án C.
136
Bảng 4.1.2(b)
Tính toán quy hoạch động cho dự án B
*
B B B B B C B
f (S ,d ) = r (S )+ f (d )
d
B
= S
C
S
B
Phơng án 1 Phơng án 2
*
B
f ()
*
B
d
Phơng án 1
8+3=11
(2+1=3)
+
8+5=13
(2+3=5)
13
PA - 2
($5)
Phơng án 2
9+3=12
(3+1=4)
9+5=14
(3+3=6)
14
PA - 2
($6)
Phơng án 3
12+3=15
(4+1=5)
12+5=17
(4+3=7, không khả thi)
#
15
Dấu
+
trong () là chi phí tích lũy cho các dự án C
#
không khả thi, quyết định này sử dụng tất cả $7 triệu ngân sách không dự trữ cho dự án A.
giai đoạn cuối cùng (gọi là đệ quy lùi) hay trong giai đoạn đầu tiên (gọi
là đệ quy tiến). Một thuật giải tiến bắt đầu tính toán từ giai đoạn đầu
tiên cho tới giai đoạn cuối cùng còn một thuật giải lùi bắt đầu tính toán
từ giai đoạn cuối cùng tới giai đoạn đầu tiên.
6. Một mối quan hệ đệ quy xác định chính sách tối u cho mỗi trạng
thái ở giai đoạn n bất kỳ có thể đợc xây dựng khi cho trớc chính
sách tối u cho mỗi trạng thái ở giai đoạn tiếp theo, n+1. Phơng
trình đệ quy lùi này, theo hình 4.1.1, có thể đợc viết là:
* *
1 1
*
1
( ) . ( . ) ( )
. ( . ) [ ( , )]
n
n
n n n n n
n n
d
n n n n n n
n
d
f S opt r S d f S
opt r S d f t S d
o
o
(4.1.3)
trong đó
o
biểu thị một toán tử đại số mà có thể là +, -,
, hoặc bất
kỳ miễn là phù hợp với bài toán. Phơng trình đệ quy cho một thuật
giải tiến đợc phát biểu là:
* *
1 1
( ) . ( , ) ( )
n
n n n n n
n n
d
f S opt r S d f S
o
(4.1.4)
Chú ý rằng, trong ví dụ này, những tính toán cho giai đoạn 3 (dự án C)
không liên quan đến số hạng f
n+1
(S
n+1
) trong phơng trình đệ quy 4.1.3. Nói
chung đây sẽ là trờng hợp sử dụng tối u hóa quy hoạch động lùi. Do đó,
phơng trình đệ quy cho kỹ thuật quy hoạch động lùi có thể đợc viết là:
*
*
1 1
.[ ( , )],
( )
.[ ( , ) ( )],
n
n
n n n
d
n n
n n n n n
d
opt r S d
S
opt r S d f S
f
o
với = (4.1.5 )
với = 1 đến - 1 (4.1.5 )
n N a
n N b
Bảng 4.1.2(c)
Tính toán quy hoạch động cho dự án A
S
A
*
A A A A A B A
f (S ,d ) = r (S )+ f (d )
*
A
f ()
*
A
d
PA
-
1
($5)
137
d
A
= S
B
Phơng án 1 Phơng án 2 Phơng án 3
PA - 1
5+13=8
(1+5=6)
+
5+14=19
(1+6=7)
5+15=20
(1+5=6)
20 PA - 3
($6)
PA - 2
6+13=19
(2+5=7)
6+14=20
(2+6=8, không khả
thi)
6+15=21
(2+5=7)
21 PA - 3
($7)
PA - 3
8+13=21
(3+5=8, không khả
thi)
8+14=22
(3+6=9, không khả
thi)
*
+15+23
(3+5=8, không khả
thi)
- -
-
Dấu
+
trong () là chi phí tích lũy cho các dự án A, B và C.
Ví dụ 4.1.2. Xác định các phơng trình đệ quy lùi cho Ví dụ 4.1.1.
Lời giải. Với giai đoạn thứ ba (n=3)
*
3 3
C
C
d
f S Max r
; với giai đoạn thứ hai
*
2 2
B
B C
d
f S Max r f
; và với giai đoạn 1
*
1 1
A
A B
d
f S Max r f
.
Ví dụ 4.1.3. Các dòng chảy tới một hồ có tổng dung tích bằng 4 đơn vị nớc là 2, 1, 2 và 1 đơn vị
tơng ứng với bốn mùa trong năm. Để tiện lợi, lợng nớc chỉ đợc tính bằng các đơn vị nguyên.
Do đó, lợng xả ra từ hồ để cung cấp cho một thành phố và nông nghiệp đợc bán với giá là $2000
cho đơn vị đầu tiên, $1500 cho đơn vị thứ hai, $1000 cho đơn vị thứ ba, và $500 cho đơn vị thứ t.
Khi hồ chứa đầy nớc và xả tràn 1 đơn vị nớc, một trận lũ nhỏ sẽ dẫn tới thiệt hại $1500, Khi xả
tràn lên tới 2 đơn vị, một trận lũ lớn sẽ gây thiệt hại $4000, Xác định chính sách vận hành để lợi
nhuận hàng năm lớn nhất bằng quy hoạch động sử dụng thuật giải lùi, xét với bất kỳ lợng dự trữ
nào ở thời điểm cuối năm.
Lời giải. Bớc đầu tiên là giải thích hàm lợi nhuận. Một đơn vị xả ra từ hồ có lợi nhuận là $2000; 2
đơn vị xả có lợi nhuận là $2000+ $1500 = $3500; 3 đơn vị xả có lợi nhuận là $3500 + $1000 =
$4500; 4 đơn vị xả có lợi nhuận là $4500 + $500 = $5000; 5 đơn vị xả (khi mà hồ chứa chỉ có dung
tích là 4 đơn vị thì điều này có nghĩa là hồ chứa bị đầy và 1 đơn vị phải xả tràn); lợi nhuận sẽ là
$5000 (4 đơn vị cấp nớc) - $1500 (1 đơn vị xả tràn) = $3500; và 6 đơn vị xả thì lợi nhuận sẽ là
$5000 -$4000 (2 đơn vị xả tràn) = $1000,
Mỗi mùa thể hiện một giai đoạn nh trên hình 4.1.3. Biến trạng thái cho bài toán vận hành hồ chứa
này chính là lợng trữ trong hồ, là lợng trữ ban đầu hay đầu mùa S
n
= ST
n
và lợng trữ kết thúc
hay cuối mùa
1
~
nn
STS
đối với mùa thứ n. Lợng xả từ hồ chứa là biến quyết định đợc ký hiệu
là d
n
= R
n
đối với mùa thứ n. Hàm chuyển đổi đơn giản chính là phơng trình liên tục liên hệ lợng
trữ đầu thời đoạn với lợng trữ cuối thời đoạn của giai đoạn n:
nnnn
RQFSS
~
trong đó QF
n
là dòng chảy đến cho giai đoạn n. Lợng trữ cuối của một giai đoạn (mùa) nào đó sẽ
là lợng trữ ban đầu cho trạng thái kế tiếp, nghĩa là
1
~
nn
SS
Phơng trình đệ quy lùi quy hoạch động cho ví dụ này là:
[
*
)],([
Max
nnnn
dSrMaxf
Các bớc tính toán quy hoạch động đợc trình bày ở các bảng 4.1.3(a)-(d). Xem bảng 4.1.3(a) để
theo dõi các bớc tính toán cho giai đoạn 4. Cột đầu tiên thể hiện lợng trữ (trạng thái) ban đầu của
mùa (giai đoạn) 4. Cột thứ hai là giá trị lợng trữ ban đầu cộng với lợng dòng chảy tới hồ QF
4
= 1.
Năm cột tiếp theo là linh hồn của tính toán quy hoạch động mà ở đó các phơng trình đệ quy đợc
138
giải. Mỗi cột dành cho các giá trị có thể của lợng trữ cuối thời đoạn
4
~
S
= 0, 1, 2, và 4. Đối với
giai đoạn 4, các tính toán là không cần thiết vì phơng trình đệ quy là
),()(
4444
*
4
dSrSf
. Ví
dụ nh nếu lợng trữ ban đầu S
4
= 0 và lợng trữ cuối
0
4
~
S
cho ta lợng xả R
4
= 1. Lợng xả
này đợc xác định từ việc giải hàm chuyển đổi trạng thái cho R
4
1010
4
~
444
S
QFSR
Với lợng xả là 1 đơn vị thì lợi nhuận là $2000 do đó f
4
(S
4
)=r
4
(S
4
=0, d
4
=R
4
=1) = $2000, Một cách
tơng tự cho S
4
= 1 và
0
4
~
S
, R4 = 1 + 1 - 0 = 2 và khi đó f
4
(S
4
)=r
4
(S
4
=1, d
4
=R
4
=2) = $3500,
Các cột lợi nhuận tối đa
)(
4
*
4
Sf
định nghĩa các giá trị lợi nhuận cực đại cho mỗi lợng trữ ban đầu
có xét đến lợng trữ cuối. Điều này giống nh việc xét mỗi lợng xả (quyết định) có thể đối với
lợng trữ ban đầu. Lợng xả tối u cho mỗi lợng trữ ban đầu đợc liệt kê trong cột kế tiếp và
lợng trữ cuỗi tối u đợc liệt kê ở cột cuối cùng.
Bảng 4.1.3(b) trình bày các tính toán quy hoạch động cho giai đoạn (mùa) thứ 3 với lợng dòng
chảy tới hồ là 2 đơn vị. Để minh hoạ quy trình tính toán xét trờng hợp S
3
= 0 và
0
3
~
S
. Lợng
xả đợc thể hiện thông qua tổ hợp giữa lợng trữ ban đầu và lợng trữ cuối là
2020
3
~
343
S
QFSR
, do vậy lợi nhuận là r
3
(S
3
=0, d
3
=R
3
=2) = $3500, Từ bảng
4.1.3(a) lợi nhuận luỹ tích tối u cho giai đoạn 4 là
2000$)0(
4
*
4
Sf
đối với
4
~
3
S
S
. Các
bớc tính toán đợc lặp theo chiều ngợc lại cho giai đoạn 2 (mùa 2) rồi giai đoạn (mùa) 1 nh
đợc trình bày lần lợt tại các bảng 4.1.3(c) và (d).
139
Hình 4.1.3
Không gian trạng thái và các giai đoạn cho Ví dụ 4.1.3.
Khi các tính toán quy hoạch động cho giai đoạn 1 kết thúc, bớc tìm ngợc đợc tiến hành để tìm
ra tập hợp các lợng xả tối u. Xét các tính toán quy hoạch động cho giai đoạn 1 ở bảng 4.1.3(d),
lợi nhuận lớn nhất thu đợc từ mỗi lợng trữ S
1
là: $11000 với S
1
= 0, $12500 với S
1
= 1, $14000
với S
1
= 2, $15000 với S
1
= 3, và $16000 với S
1
= 4. Lợi nhuận lớn nhất nh vậy là $16000, Một
phép tìm ngợc đợc tiến hành cho mỗi lợng trữ ban đầu. Với mục đích minh hoạ, phép tìm ngợc
đợc tiến hành đối với trờng hợp lợi nhuận cực đại bằng $16000 tơng ứng với S
1
= 4. Trong
trờng hợp này lợng xả tối u
2
*
1
d
hoặc 3 đơn vị và tơng ứng với chúng là lợng trữ cuối thời
đoạn
4
1
~
S
hoặc 3. Xét trong bảng 4.1.3(c) với
4
~
12
SS
hoặc 3 thì lợng xả tối u với S
2
=
3 là
2
*
2
d
hoặc 3 đối với các lợng trữ cuối cùng tơng ứng của giai đoạn 2
2
2
~
S
hoặc 1. Đối
với S
2
= 4, lợng xả tối u
2
*
2
d
hoặc 3 tơng ứng với lợng trữ cuối thời đoạn
3
2
~
S
hoặc 2.
Do vậy
1
~
23
SS
, 2 hoặc 3. Bây giờ đi xét bảng 4.1.3(b) cho giai đoạn 3, các lợng xả tối u
là: với S
3
= 1, d
2
= 2 và
1
*
3
~
S
; với S
3
= 2,
2
*
3
d
hoặc 3 và
2
*
3
~
S
hoặc 3; và với S
3
= 3,
3
*
3
d
và
2
*
3
~
S
. Các lợng trữ cuối tối u của giai đoạn 3 là
1
*
3
~
S
hoặc 2. Quá trình tìm
ngợc lại đợc tiếp tục đến giai đoạn 4 trong bảng 4.1.3(a). Với
1
*
4
~
4
S
S
hoặc 2 thì các quyết
định tối u tơng ứng
2
*
4
d
hoặc 3 để cho
0
*
4
S
trong cả hai trờng hợp.
Tóm lại: lợi nhuận lớn nhất trong bài toán này có thể bắt đầu với hồ chứa là đầy nớc vào thời điểm
bắt đầu của năm và xả hết vào thời điểm cuối năm. Điều này là hiển nhiên trong ví dụ ta đang xét.
Tuy nhiên nếu xét theo quan điểm vận hành một hồ chứa thực tế, chính sách vận hành này không
thể thực thi. Quá trình tìm ngợc tối u đợc minh hoạ cụ thể hơn trong hình 4.1.4 cùng với các
lợng xả tối u.
Mặc dù quy hoạch động mang nhiều u điểm trong việc giải các bài
toán nguồn nớc, đặc biệt là đối với các bài toán phân tích các quá trình
nhiều giai đoạn, nó có hai hạn chế là yêu cầu về bộ nhớ máy tính và thời
gian tính toán lớn. Hai hạn chế này có thể là khá nghiêm trọng trong hai
trờng hợp: (1) khi số các biến trạng thái là lớn; và (2) khi quy hoạch động
đợc áp dụng theo phơng pháp rời rạc để tính toán cho một không gian
trạng thái liên tục. Vấn đề liên quan đến trờng hợp 2 là tồn tại nhiều khó
khăn trong việc tìm kiếm nghiệm tối u thực nếu không tăng một cách đáng
kể số các khoảng rời rạc hoá trong không gian trạng thái. Cùng với những
tiến bộ về công nghệ máy tính, những nhợc điểm này dần trở nên ít
nghiêm trọng.
Một gia số các rời rạc hoá hay số các biến trạng thái có thể làm tăng
theo hàm mũ số các tính toán các công thức đệ quy và bộ nhớ cho mỗi giai
đoạn. Vấn đề tăng nhanh yêu cầu về bộ nhớ và thời gian tính gắn với các
bài toán quy hoạch động đa biến trạng thái này thờng đợc đề cập tới với
tên gọi lời nguyền của số chiều (vấn đề tăng theo quy luật hàm mũ khi
tăng số chiều trên không gian tính).
140
Bảng 4.1.3(a)
Tính toán quy hoạch động cho giai đoạn 4 của Ví dụ 4.1.3
(a) Giai đoạn 4 - Mùa 4
Lợi nhuận f
4
(S
4
)=r
4
(S
4
,d
4
)
Lợng trữ cuối S
4
Lợng
trữ ban
đầu S
4
Tổng
lợng
trữ
S
4
+ QF
4
0 1 2 3 4
Lợi nhuận
lớn nhất
*
4 4
f S
Quyết
định (Xả)
*
4 4
d = R
Lợng
trữ cuối
*
4
S
0 1 2000
0 - - - 2000 1 0
1 2 3500
2000
0 - - 3500 2 0
2 3 4500
3500
2000
0 - 4500 3 0
3 4 5000
4500
3500
2000
0 5000 4 0
4 5 3500
5000
4500
3500
2000
5000 4 1
Nhìn từ khía cạnh giải quyết vấn đề, vấn đề về yêu cầu bộ nhớ là
nghiêm trọng hơn vấn đề về thời gian tính toán. Nếu bộ nhớ tạm bị chiếm
chỗ vợt quá khả năng của một bộ nhớ máy tính thì bài toán sẽ không giải
đợc. Mặt khác, một sự gia tăng về thời gian tính toán chỉ yêu cầu ta có
thêm chút kiên nhẫn để có đợc kết quả. Chính vì vậy mà vấn đề tăng
nhanh về yêu cầu bộ nhớ gắn với các bài toán quy hoạch động đa biến trạng
thái có thể phân biệt các bài toán giải đợc và các bài toán không thể giải
đợc.
Bảng 4.1.3(b)
Tính toán quy hoạch động cho giai đoạn 3 của Ví dụ 4.1.3
(b) Giai đoạn 3 Mùa 3
Lợi nhuận
*
3 3 3 3 3 4 4
f S = r S ,d + f S
Lợng trữ cuối
3
4
S = S
Lợng trữ
ban đầu
S
3
Tổng
lợng trữ
S
3
+ QF
3
0 1 2 3 4
Lợi nhuận
lớn nhất
*
3 3
f S
Quyết
định
(Xả)
*
3 3
d = R
Lợng trữ
cuối cùng
*
3
4
S = S
0 2
3500 + 2000
=
5500
2000 + 3500
=
5500
0 + 4500
=
4500
-
-
5500 2,1 0,1
1 3
4500 + 2000
=
6500
3500 + 3500
=
7000
2000 + 4500
=
6500
0 + 5000 =
5000
-
7000 2 1
2 4
5000 + 2000
=
7000
4500 + 3500
=
8000
3500 + 4500
=
8000
2000 + 5000
=
7000
0 + 5000 =
5000
8000 3,2 1,2
3 5
3500 + 2000
=
5500
5000 + 3500
=
8500
4500 + 4500
=
9000
3500 + 5000
=
8500
2000 + 5000
= 7000
9000 3 2,
4 6
1000 + 2000
=
3000
3500 + 3500
=
7000
5000 + 4500
=
9500
4500 + 5000
=
9500
3500 + 5000
= 8500
9500 4,3 2,3
Bảng 4.1.3(c)
Tính toán quy hoạch động cho giai đoạn 2 của Ví dụ 4.1.3
(c) Giai đoạn 2 Mùa 2
Lợi nhuận
3
*
322222
, SfdSrSf
Lợng trữ cuối
3
2
SS
Lợng trữ
ban đầu
S
2
Tổng lợng
trữ
S
2
+QF
2
0 1 2 3 4
Lợi nhuận
lớn nhất
2
*
2
Sf
Quyết định
(Xả)
*
22
Rd
Lợng trữ
cuối cùng
3
*
2
SS
0
1
2
3
4
1
2
3
4
5
2000+5500=
7500
3500+5500=
9000
4500+5500=
10000
5000+5500=
10500
3500+5500=
9000
0+7000=
7000
2000+7000=
9000
3500+7000=
10500
4500+7000=
11500
5000+7000=
12000
_
0+8000=
8000
2000+8000=
10000
3500+8000=
11500
4500+8000=
12500
_
_
0+9000=
9000
2000+9000=
11000
3500+9000=
12500
_
_
_
0+9500=
9500
2000+9500=
11500
7500
9000
10500
11500
12500
1
2,1
2
3,2
3,2
0
0,1
1
1,2
2,3
Bảng 4.1.3(d)
Tính toán quy hoạch động cho giai đoạn 1 của Ví dụ 4.1.3
(d) Giai đoạn 1 Mùa 1
Lợi nhuận
2
*
211111
, SfdSrSf
Lợng trữ cuối
2
1
SS
Lợng trữ
ban đầu
S
1
Tổng
lợng trữ
S
1
+QF
1
0 1 2 3 4
Lợi nhuận
lớn nhất
1
*
1
Sf
Quyết định
(Xả)
*
11
Rd
Lợng trữ
cuối cùng
2
*
1
SS
0
1
2
3
4
2
3
4
5
6
3500+7500=
11000
4500+7500=
12000
5000+7500=
12500
3500+7500=
11000
1000+7500=
8500
2000+9000=
11000
3500+9000=
12500
4500+9000=
13500
5000+9000=
14000
3500+9000=
12500
0+10500=
10500
2000+10500=
12500
3500+10500=
14000
4500+10500=
15000
5000+10500=
15500
_
0+11500=
11500
2000+11500=
13500
3500+11500=
15000
4500+11500=
16000
_
_
0+12500=
12500
2000+12500=
14500
3500+12500=
16000
11000
12500
14000
15000
16000
2,1
2,1
2
3,2
3,2
0,1
1,2
2
2,3
3,4
118
Hình 4.1.4
Bớc tìm ngợc cho ví dụ 4.1.3.
4.2. Quy hoạch động sai phân rời rạc
Quy hoạch động sai phân rời rạc (DDDP-Discrete Differential Dynamic
Programming) là một thủ tục quy hoạch động lặp, đợc đặc biệt thiết kế để
khắc phục một số khó khăn của cách tiếp cận quy hoạch động đã đợc đề cập
đến ở trớc. Quy hoạch động sai phân rời rạc sử dụng phơng trình đệ quy
giống nh quy hoạch động để tìm kiếm trong số các trạng thái rời rạc thuộc
miền giai đoạn-trạng thái. Thay bằng việc tìm kiếm nghiệm tối u trên toàn
miền giai đoạn-trạng thái nh trong trờng hợp quy hoạch động, quy hoạch
động sai phân rời rạc chỉ kiểm tra một phần của miền giai đoạn-trạng thái và
do đó tiết kiệm thời gian và bộ nhớ máy tính (Chow et al., 1975). Quy trình tối
u hóa này đợc giải thông qua các bớc lặp của các trạng thái và các quyết
định thử nghiệm để tìm kiếm sự tối u cho một hệ thống với những ràng buộc
là các trạng thái và các quyết định thử nghiệm phải nằm trong miền khả thi
tơng ứng, đó là, khả thi trong trong các không gian trạng thái và quyết định.
Trong quy hoạch động sai phân rời rạc, bớc đầu tiên là giả thiết một
chuỗi thử nghiệm của các quyết định có thể chấp nhận đợc gọi là chính sách
thử nghiệm và các vector trạng thái của mỗi giai đoạn đợc tính tơng ứng.
Chuỗi các trạng thái nằm trong miền trạng thái khả thi cho các giai đoạn khác
nhau đợc gọi là quỹ đạo thử nghiệm. Một quy trình khác với thủ tục trên là
đầu tiên đi giả sử một quỹ đạo thử nghiệm và sau đó sử dụng nó để tính ra
chính sách thử nghiệm. Một vài trạng thái ở lân cận một quỹ đạo thử nghiệm,
có thể đợc đa vào hình thành một dải đợc gọi là hành lang quỹ đạo thử
nghiệm (Xem hình 4.2.1).
119
Hình 4.2.1
Sự thiết lập hành lang quanh quỹ đạo thử nghiệm cho một bài toán ba giai đoạn.
Trong thực hành thông thờng không gian trạng thái đợc rời rạc hoá thành
các số gia đều nhau, gọi là các số gia trạng thái, trong đó tổng số các rời rạc
hóa, đợc xem là các điểm lới hay các điểm mắt cáo, cho mỗi biến trạng
thái là nh nhau. Do đó, các quyết định phải đợc lựa chọn tơng ứng với
phơng pháp rời rạc hóa các biến trạng thái. Khoảng số gia của biến quyết
định phụ thuộc vào khoảng số gia của biến trạng thái tơng ứng.
Hớng tiếp cận quy hoạch động truyền thống đợc áp dụng trong một bài
toán quy hoạch động sai phân rời rạc cho các trạng thái trong hành lang đó sử
dụng mối quan hệ đệ quy để tìm ra một quỹ đạo tốt hơn. Quỹ đạo này xác
định một chính sách hay tập hợp của các quyết định trong hành lang đã đợc
đa ra. Quỹ đạo thử nghiệm này sau đó đợc sử dụng nh một quỹ đạo mới để
tạo ra một hành lang mới. Quá trình hình thành và tối u hành lang này xét tới
các trạng thái nằm trong hành lang đó và qua trình tìm ngợc trở lại để nhận
đợc một quỹ đạo tốt hơn cho toàn bộ hệ thống đợc gọi là một bớc lặp.
Quỹ đạo mới, định nghĩa hệ thống thông qua sự tối u của hành lang thử
nghiệm, sau đó đợc sử dụng nh quỹ đạo thử nghiệm mới để thiết lập hành
lang tốt hơn cho bớc lặp tiếp theo. Thủ tục này đợc lặp tới quá một bớc lặp
thứ k nào đó mà ở đó cho ra một hành lang. Hành lang này cung cấp một lợi
nhuận của hệ thống f
k
sao cho các bớc lặp tiếp theo với cùng kích thớc của
hành lang này sẽ tạo ra một chênh lệch trong lợi nhuận hệ thống, f
k
-f
k-1
nhỏ
hơn một dung sai xác định. Tại điểm này trong thủ tục tối u hóa, kích thớc
của số gia trạng thái có thể đợc giảm xuống để thiết lập một hành lang mới
mà trong đó các trạng thái hay các điểm lới xít nhau hơn. Một hành lang nhỏ
hơn đợc hình thành quanh quỹ đạo đã đợc cải thiện từ bớc lặp cuối cùng.
120
Các bớc lặp tiếp tục giảm kích thớc của số gia trạng thái thông qua hệ thống
cho đến khi đạt tới một kích thớc hành lang nhỏ nhất xác định.
Tiêu chuẩn đợc sử dụng để xác định khi nào kích thớc số gia trạng thái
cần đợc giảm là dựa trên sự thay đổi tơng đối của giá trị hàm mục tiêu tối
u của bớc lặp trớc, đó là:
11
/
kkk
fff
(4.2.1)
trong đó
là mức dung sai xác định. hình 4.2.2 là một sơ đồ khối thể hiện
thuật giải chung của thủ tục quy hoạch động sai phân rời rạc.
Mặc dù việc sử dụng quy hoạch động sai phân rời rạc phần nào khắc phục
vấn đề liên quan tới lời nguyền của số chiều của quy hoạch động thông
thờng, nó lại gây ra một số vấn đề cần quan tâm khác liên quan đến việc lựa
chọn quỹ đạo ban đầu, việc thay đổi điểm lới hay không gian trạng thái, và
sự hội tụ tới một tối u địa phơng thay vì một tối u toàn cục. Các nhân tố
chính ảnh hởng tới việc thực hiện quy hoạch động sai phân rời rạc gồm có:
1. Số các điểm lới;
2. Số gia trạng thái ban đầu cùng với số điểm lới xác định độ rộng hành
lang;
3. Quỹ đạo thử nghiệm ban đầu đợc sử dụng để thiết lập vị trí của các
hành lang bên trong không gian trạng thái cho bớc lặp đầu tiên;
4. Tốc độ giảm của kích thớc số gia trạng thái mà xác định độ rộng hành
lang cho các bớc lặp khác nhau.
Những nhân tố này đôi khi phụ thuộc lẫn nhau trong việc sử dụng thích
hợp và hiệu quả quy hoạch động sai phân rời rạc cho các bài toán tài nguyên
nớc. Sự lựa chọn quỹ đạo thử nghiệm ban đầu và độ rộng hành lang ban đầu
là phụ thuộc lẫn nhau. Ví dụ, nếu một độ rộng hành lang nhỏ đợc chọn cùng
với một quỹ đạo thử nghiệm ban đầu cách xa vùng tối u, các bớc lặp không
cần thiết đợc đòi hỏi để di chuyển quỹ đạo đó vào trong vùng tối u hoặc gần
tối u. Có thể trong một số trờng hợp bài toán quy hoạch động sai phân rời
rạc sẽ hội tụ tới một nghiệm khá xa nghiệm tối u. Số các điểm lới và số gia
trạng thái ban đầu cùng xác định độ rộng của hành lang ban đầu. Sử dụng một
sự kết hợp một số lợng nhỏ các điểm lới và một số gia trạng thái ban đầu
nhỏ cũng có thể dẫn tới những lời giải tối u địa phơng cách xa nghiệm tối
u.
ảnh hởng của việc chọn một quỹ đạo ban đầu không tốt có thể đợc
giảm đi nếu một số lợng lớn các điểm lới và/hoặc các số gia trạng thái ban
đầu lớn đợc sử dụng. Thực chất, quỹ đạo ban đầu càng tốt thì yêu cầu số các
điểm lới và các số gia trạng thái ban đầu càng nhỏ, hoặc đơn giản, càng có
thể sử dụng độ rộng hành lang ban đầu nhỏ. Số gia trạng thái rất nhỏ với các
điểm lới nhiều hơn cũng có thể đợc sử dụng để thiết lập một độ rộng hành
lang nhỏ. Điều này có thể dẫn tới sự hội tụ tốt hơn; tuy nhiên, việc tăng số
121
lợng các điểm lới làm tăng thời gian tính toán và nhu cầu lu trữ. Thời gian
tính toán có thể đợc cải thiện bằng việc gia tăng tốc độ giảm của số gia trạng
thái tại mỗi bớc lặp; tuy nhiên, tốc độ suy giảm của số gia trạng thái quá lớn
có thể bỏ qua khu vực tối u vì vậy không cung cấp lời giải tối u. Việc lựa
chọn một số gia trạng thái ban đầu lớn và một tốc độ suy giảm kích thớc số
gia trạng thái lớn có thể là có lợi. Tuy nhiên, khi số gia trạng thái ban đầu quá
lớn, dẫn tới các độ rộng hành lang lớn, những sự tính toán không cần thiết
đợc thực hiện ở các khu vực không gian trạng thái cách xa vùng tối u.
HìNH 4.2.2
Thuật giải tổng quát cho quy hoạch động sai phân rời rạc
4.3. Đại số ma trận cho quy hoạch phi tuyến
122
Để giải thích các khái niệm của qui hoạch phi tuyến, nhiều kỹ thuật về đại
số ma trận và đại số tuyến tính đợc sử dụng. Trong mục này giới thiệu tóm
tắt một số khái niệm đó.
Một đờng là một tập hợp các điểm
x=x
0
+
d (4.3.1)
Hình 4.3.1
Xác định một đờng thẳng trong không gian hai chiều.
trong đó x
0
là một điểm xác định trên đờng thẳng,
là một kích thớc bớc
(bậc) vô hớng, và d là hớng của đờng thẳng. hình 4.3.1 biểu thị một đờng
thẳng trong không gian hai chiều trong đó x
0
là điểm (1,1) và d là vector chỉ
hớng (2,1)
T
đợc biểu thị bằng mũi tên trong đó chữ T ở trên biểu thị chuyển
vị của một vector hay một ma trận.
Một hàm nhiều biến f(x) tại điểm x cũng là một khái niệm quan trọng. Với
một hàm mà là liên tục và đạo hàm liên tục, có một vector của đạo hàm bậc
nhất đợc gọi là gradient hay vector gradient.
1 2
, , ,
T
n
f f f f
f x
x x x x
(4.3.2)
trong đó
là vector của toán tử gradient
1
/ , , /
T
n
x x
. Về mặt hình
học, vector gradient tại một điểm cho trớc biểu thị hớng mà theo đó tốc độ
gia tăng lớn nhất trong giá trị hàm sẽ diễn ra. Với f(x) có đạo hàm liên tục bậc
hai tồn tại một ma trận đạo hàm bậc hai đợc gọi là ma trận Hessian hay
Hessian.
2 2 2
2
1 1 2 1
2 2 2
2
2 2
2 1 2 1
2 2
2
1
( )
n
n n
f f f
x x x x x
f f f
H x f x
x x x x
f f
x x x
(4.3.3)
123
Hessian là một ma trận vuông đối xứng.
Ví dụ 4.3.1. Xét hàm bậc hai sau (Edgar và Himmelblau, 1988)
2 2
1 2 1 2
4 2
f x x x x x
Các đờng đẳng trị của hàm này đợc biểu thị trong hình 4.3.2. Xác định gradient và Hessian cho hàm
này tại điểm x=(1,1).
Hình 4.3.2
Các đờng đẳng trị của hàm bậc hai (
21
2
2
2
1
24 xxxxxf
) trong Ví
dụ 4.3.1 (Edgar và Himmelblau, 1988).
Lời giải Gradient theo phơng trình (4.3.2) là
1 2
2 1
8 2
2 2
x x
f x
x x
và Hessian theo phơng trình (4.3.3) là :
2
8 2
2 2
H x f x
Tại điểm x = (1,1), gradient là:
6
(1,1)
0
f
Trong khi đó Hessian là không đổi với mọi điểm.
Các khái niệm về tính lồi và tính lõm đợc sử dụng để xác định liệu tối
u địa phơng, cực tiểu địa phơng, hay cực đại địa phơng, cũng là tối
u toàn cục, và là tốt nhất trong tất cả các nghiệm. Trong trờng hợp một
124
biến, một hàm f(x) đợc gọi là lồi trên một vùng nếu với mọi x
a
và x
b
, x
a
x
b
,
thỏa mãn nh sau:
1 1 ,0 1
a a
b b
f x x f x f x
(4.3.4)
Hàm đó là lồi thực sự khi biểu thức trên thỏa mãn với dấu <.
Ngợc lại một hàm là lõm trên một vùng nếu với mọi x
a
và x
b
, x
a
x
b
,
thỏa mãn nh sau:
1 1 ,0 1
a a
b b
f x x f x f x
(4.3.5)
Hàm này là lõm thực sự khi quan hệ trên thỏa mãn với dấu >. hình 4.3.3
minh họa thêm các khái niệm trên.
Các phơng trình (4.3.4) và (4.3.5) không tiện lợi để sử dụng trong kiểm
tra tính lồi lõm của một hàm. Để thay thế, sẽ dễ hơn nếu kiểm tra dấu của đạo
hàm bậc hai của nó, d
2
f(x)/dx
2
. Từ phép tính cơ bản, nh đợc chỉ ra trong
hình 4.3.3, nếu
2
2
0
d f
dx
thì hàm f là lõm còn nếu
2
2
0
d f
dx
thì là hàm lồi.
Tính lồi lõm của các hàm nhiều biến f(x) cũng có thể đợc xác định sử
dụng ma trận Hessian. Các định nghĩa về xác định dơng, xác định âm, xác
định, và không xác định đợc sử dụng để xác định loại của ma trận Hessian,
đó là:
H xác định dơng:
x
T
Hx > 0 với mọi x
0
H xác định âm:
x
T
Hx < 0 với mọi x
0
H không xác định:
x
T
Hx < 0 với một số x;
> 0 với một số khác
H bán xác định dơng:
x
T
Hx
0 với mọi x
H bán xác định âm:
x
T
Hx
0 với mọi x
125
Các quy tắc cơ bản cho tính lồi lõm của một hàm nhiều biến f(x) có đạo
hàm bậc hai liên tục là:
1. f(x) là lõm, H(x) là bán xác định âm.
2. f(x) là lõm thực sự, H(x) là xác định âm;
3. f(x) là lồi, H(x) là bán xác định dơng;
4. f(x) là lồi thực sự, H(x) là xác định dơng.
Để kiểm tra trạng thái của H(x) cho tính lồi thực sự, có sẵn hai kiểm tra
(Edgar và Himmelblau, 1988). Kiểm tra thứ nhất là tất cả các phần tử trên
đờng chéo chính của H(x) phải là dơng và định thức của tất cả định thức con
chính, det{M
i
(H)}, và cả của H(x), det(H) là dơng (>0) (xem Bài toán 4.3.2).
Một kiểm tra khác nữa là tất cả các giá trị riêng của H(x) là dơng (>0) (xem
bài toán 4.3.2). Với tính lõm thực sự tất cả các phần tử đờng chéo phải âm và
det (H) và det{M
i
(H)} > 0 nếu i là chẵn (i = 2,4,6, ); det (H) và det{M
i
(H)}
< 0 nêu i là lẻ (i = 1,3,5, ). Bất đẳng thức chặt > hay < trong những kiểm tra
này đợc thay bằng
hay
tơng ứng để kiểm tra cho tính lồi và tính lõm.
Các miền lồi hay các tập hợp đợc sử dụng để phân loại các ràng buộc.
Một miền lồi tồn tại nếu với 2 điểm bất kỳ trong miền đó, x
a
x
b
, tất cả các
điểm nằm trên đờng thẳng nối x
a
và x
b
là
ba
xxx
1
, trong đó
10
,
đều nằm trong tập hợp đó. hình 4.3.4 minh họa các miền lồi và không lồi.
Tính lồi của một miền khả thi và hàm mục tiêu trong tối u hóa phi tuyến
có một sự liên quan cực kỳ quan trọng đối với loại lời giải tối u nhận đợc.
Với các bài toán quy hoạch tuyến tính (trong Chơng 3), hàm mục tiêu và
miền khả thi đều là lồi do đó lời giải tối u là một tối u toàn cục. Mặt khác,
tính lồi của cả hàm mục tiêu và miền khả thi trong một bài toán quy hoạch phi
tuyến không thể đợc đảm bảo, do đó lời giải tối u đạt đợc không thể bảo
đảm cho toàn cục.
Ví dụ 4.3.2. Phân loại hàm sau
2 2
1 1 2 2
( ) 4 4 4
f x x x x x
Lời giải. Xác định ma trận Hessian:
2 2
2
1 1 2
2 2
2
2 1 2
8 4
4 8
f f
x x x
H
f f
x x x
Cả hai phần tử đờng chéo đều dơng. Tiếp theo tính các định thức ma trận con:
M
1
=8 det M
1
=8
M
2
= H det M
2
= (8)(8)-(-4)(-4)=48
Ma trận Hessian là xác định dơng vì cả hai phần tử đờng chéo đều dơng và các ma trận con đều
dơng; do đó f(x) là lồi thực sự.
126
Ví dụ 4.3.3. Phân loại miền đợc xác định bởi tập hợp các ràng buộc sau:
2
1 2
1 2
2
3
x x
x x
Lời giải. hình 4.3.5 biểu thị một đồ thị của hai hàm:
2
1 1 2
2 1 2
( ) 2 0
( ) 3 0
g x x
g x x
x
x
Lời giải phải diễn tả tính lồi của hai hàm sử dụng ma trận Hessian.
1
2
2 0
0 0
0 0
0 0
g
g
H x
H x
Cả g
1
(x) và g
2
(x) đều lõm dẫn đến một miền lồi
127
H×nh 4.3.3
So s¸nh cña c¸c hµm bËc hai låi vµ lâm.