Số hóa bởi trung tâm học liệu
1
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
NGUYỄN CHÍ THANH
KẾT HỢP MỘT SỐ PHƢƠNG PHÁP HEURISTIC
GIẢI BÀI TOÁN TỐI ƢU ĐA MỤC TIÊU
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Thái Nguyên, tháng 11 - 2013
Số hóa bởi trung tâm học liệu
2
ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN & TRUYỀN THÔNG
NGUYỄN CHÍ THANH
KẾT HỢP MỘT SỐ PHƢƠNG PHÁP HEURISTIC
GIẢI BÀI TOÁN TỐI ƢU ĐA MỤC TIÊU
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
NGƯỜI HƯỚNG DẪN KHOA HỌC
TS. Vũ Mạnh Xuân
Thái Nguyên, tháng 11 -2013
Số hóa bởi trung tâm học liệu
3
MỞ ĐẦU
Nhiều vấn đề cần giải quyết trong đời sống hàng ngày dẫn đến bài toán
tối ưu, chẳng hạn như trong sản xuất cần giảm chi phí, tăng giá trị sử dụng,
lập lịch sản xuất, Vì vậy, lớp bài toán tối ưu đã được quan tâm nghiên cứu
từ lâu và đã đạt được nhiều kết quả. Tuy vậy, các kết quả đạt được chủ yếu là
lớp bài toán tối ưu một mục tiêu; đối với lớp bài toán tối ưu đa mục tiêu còn
gặp nhiều khó khăn.
Các bài toán tối ưu đa mục tiêu là những bài toán có ứng dụng thực tiễn
trong rất nhiều lĩnh vực của cuộc sống. Song nhiều khi các mục tiêu cần đạt
được có hàm biểu diễn tương tự nhau mà mục tiêu cần đạt lại ngược nhau.
Một cách tổng quát có thể nói không có lời giải tối ưu cho những bài toán
dạng này, một cách đơn giản vì các lời giải không so sánh được với nhau. Có
thể lời giải này tốt ở mục tiêu này lại kém ở mục tiêu kia. Từ đó xuất hiện
khái niệm “trội” đối với các lời giải và dẫn đến khái niệm “tối ưu Pareto”.
Đề tài này hướng tới việc phát triển những kỹ thuật tính toán, chủ yếu
là tính toán tiến hoá và các thuật toán lai trong tối ưu đa mục tiêu và cố gắng
gắn nó với các mô hình bài toán cụ thể.
Được sự đồng ý của Hội đồng Khoa học trường Đại học Công Nghệ
Thông Tin và Truyền Thông – Đại học Thái Nguyên, cùng sự hướng dẫn
của TS Vũ Mạnh Xuân, em chọn đề tài khóa luận “Kết hợp một số
phương pháp Heuristic giải bài toán tối ưu đa mục tiêu” nhằm nghiên
cứu một phương pháp tiếp cận khác để giải bài toán tối ưu đa mục tiêu đó
là kết hợp một số phương pháp như giải thuật di truyền kết hợp với chiến
lược tiến hoá và giải thuật mô phỏng tôi luyện.
Mục đích nghiên cứu: tìm hiểu bài toán, một số phương pháp giải bài
toán tối ưu đa mục tiêu, tìm hiểu giải thuật di truyền, chiến lược tiến hoá và
Số hóa bởi trung tâm học liệu
4
giải thuật mô phỏng tôi luyện trên cơ sở đó kết hợp các phương pháp này để
giải bài toán tối ưu đa mục tiêu.
Nội dung của đề tài: gồm 3 chương
1) Chương 1. Tổng quan về bài toán tối ưu đa mục tiêu
2) Chương 2. Tìm hiểu một số phương pháp Heuristic
3) Chương 3. Kết hợp các phương pháp Heuristic giải bài toán tối ưu đa
mục tiêu.
Để tiến hành nghiên cứu đề tài này, em đã sử dụng phối hợp một số
phương pháp như: phương pháp nghiên cứu tài liệu (nghiên cứu tài liệu về các
giải thuật di truyền (GA), chiến lược tiến hoá (ES), giải thuật mô phỏng tôi
luyện (SA), bài toán tối ưu đa mục tiêu, ngôn ngữ lập trình matlab 7.0);
phương pháp lấy ý kiến chuyên gia (giáo viên hướng dẫn, tham khảo trên
mạng).
Khi thực hiện đề tài này, bước đầu em đã tìm hiểu được một số phương
pháp giải bài toán tối ưu đa mục tiêu, một số vấn đề về giải thuật di truyền, chiến
lược tiến hoá, giải thuật mô phỏng tôi luyện. Kết quả là đã nghiên cứu một kỹ
thuật kết hợp giữa giải thuật di truyền, chiến lược tiến hoá và giải thuật mô
phong tôi luyện để giải bài toán tối ưu đa mục tiêu và đã lập trình thử nghiệm
trên một số bài toán cụ thể.
Số hóa bởi trung tâm học liệu
5
CHƢƠNG 1. TỔNG QUAN VỀ BÀI TOÁN TỐI ƢU ĐA MỤC TIÊU
Chương này trình bày những nghiên cứu cơ bản về bài toán tối ưu đa
mục tiêu; những khái niệm cần thiết và điểm qua một số phương pháp giải đã
biết làm cơ sở cho những chương sau.
1.1 . Bài toán tối ƣu đa mục tiêu
Trong nhiều ứng dụng thực tế gắn liền với việc thiết kế và kế hoạch
hóa trong các ngành kinh tế - kĩ thuật, điều khiển các hoạt động sản xuất,
chúng ta thường gặp những bài toán liên quan đến việc phân tích, lựa chọn
phương án tốt nhất thoả mãn nhiều mục tiêu khác nhau. Đó là bài toán tối
ưu đa mục tiêu. Có thể mô tả mô hình toán học của bài toán đa mục tiêu là:
Có k hàm mục tiêu ký hiệu là Y
1
, Y
2
, …, Y
k
với Y
i
: D R là những
hàm; mỗi X = (x
1
, …, x
n
) D (D R
n
) gọi là một phương án; D gọi là tập
các phương án chấp nhận được; Vấn đề đặt ra là phải tìm được một X
0
làm
tối ưu hoá (cực đại hoặc cực tiểu) đồng thời các giá trị hàm Y
1
, Y
2
, …, Y
k
.
Nếu tìm được X
0
như vậy thì X
0
gọi là phương án tối ưu. Song khả năng
tồn tại X
0
như vậy là rất hiếm vì các hàm mục tiêu Y
i
thường không hoàn
toàn độc lập với nhau. Chính vì vậy việc nghiên cứu lớp bài toán tối ưu đa
mục tiêu là rất kho khăn mặc dù có ý nghĩa thực tiễn cao.
1.2. Một số khái niệm
Có thể phát biểu bài toán tối ưu đa mục tiêu tổng quát như sau:
Y( x) min(max)
(1.1)
n
RDx
(1.2)
Trong đó:
k
k
RxYxYxY ))(), ,(()(
1
gọi là vectơ mục tiêu.
x gọi là phương án (vectơ quyết định).
D gọi là tập các phương án.
k
YY , ,
1
gọi là các hàm mục tiêu.
Các bài toán tối ưu đa mục tiêu thường có nhiều hàm mục tiêu với các
ràng buộc khác nhau và các lời giải khác nhau. Các lời giải này thường không
so sánh được với nhau. Vì vậy người ta đưa ra tập lời giải tối ưu Pareto.
Số hóa bởi trung tâm học liệu
6
Tập nghiệm tối ưu Pareto
Các bài toán tối ưu đa mục tiêu hầu hết đều liên quan đến tập các lời
giải tối ưu Pareto, nó xuất phát từ việc bài toán đa mục tiêu có nhiều hàm mục
tiêu với các ràng buộc khác nhau, thậm chí các mục tiêu đôi khi đối lập nhau.
Nhiều lời giải không thể so sánh được với nhau, vì có lời giải tốt cho mục tiêu
này nhưng lại xấu cho mục tiêu khác. Có thể minh hoạ điều này trong bài toán
cần cực tiểu tỷ lệ rủi ro và giá trong hình 1.1 sau:
Trong hình trên, với các điểm A và B không thể nói điểm nào tốt hơn,
A có giá trị nhỏ hơn song lại có tỷ lệ rủi ro cao hơn B. Các điểm như vậy tạo
thành tập lời giải tối ưu Pareto. Tuy nhiên cũng có những lời giải mà có thể so
sánh và chọn được lời giải tốt hơn, chẳng hạn như điểm B tốt hơn so với C
trong hình trên. Như vậy trong tối ưu đa mục tiêu thường tồn tại nhiều lời giải
chứ không duy nhất như trường hợp một mục tiêu.
Dễ dàng thấy bài toán tìm max có thể chuyển tương ứng về bài toán tìm
min. Vì vậy sau đây ta chỉ xét bài toán tìm min.
Định nghĩa 1.1
(a) Cho hai phương án quyết định
x,y D
. Khi đó, phương án x được
gọi là trội hơn phương án y ( kí hiệu
xyp
), nếu ta có:
Y( x ) Y( y )
và
Y( x ) Y( y )
, y còn được gọi là bị trội bởi x. Nếu ngược lại, y được gọi là
không bị trội bởi x.
Hình 1.1. Minh hoạ tập Pareto
Số hóa bởi trung tâm học liệu
7
(b) Một phương án
n
x R
được gọi là nghiệm Pareto tối ưu ( hay
điểm Pareto) nếu không có
n
y R
mà y trội hơn x. Tập tất cả các nghiệm
Pareto tối ưu gọi là tập Pareto tối ưu.
(c) Một phương án
n
x R
là nghiệm Pareto tối ưu yếu nếu không tồn
tại
n
y R
mà
Y( y ) Y( x )
.
Nếu bài toán tối ưu đa mục tiêu có nghiệm được gọi là tối ưu theo một
cách định nghĩa nào đó thì không phụ thuộc vào cách định nghĩa đã chọn,
nghiệm tối ưu đó phải là một phương án Pareto tối ưu (tức là, nghiệm đó phải
thuộc tập Pareto tối ưu).
Trên thực tế, việc tìm tập lời giải Pareto của các bài toán tối ưu đa mục
tiêu là khó khăn và thường ít thực hiện được. Vì vậy, một số chiến lược tìm
kiếm ngẫu nhiên (như thuật toán tiến hóa, phương pháp vùng cấm, mô phỏng
luyện kim,…) đã được phát triển. Măc dù các chiến lược này thường không
đảm bảo xác định chính xác tập tối ưu Pareto, nhưng đều cố gắng tìm ra một
tập xấp xỉ tốt, tức là 1 tập các phương án mà vectơ mục tiêu không quá xa
mục tiêu tối ưu Pareto.
Định nghĩa 1.2 Cho
k
k
, , R
(a) Với
n
x,y R
. x được gọi là trội hơn y ( kí hiệu
xyp
)nếu
(i)
i i i
Y x Y y i , ,k
Và (ii)
j j j
Y x Y y
tại ít nhất một
j , ,k
.
(b) Một tập
n
F R
được gọi là một tập xấp xỉ Pareto nếu mọi điểm
n
x R
đều là bị trội bởi ít nhất một
yF
, tức là:
n
x , y F : y xpR
.
(c) Một tập
*n
F R
được gọi là một tập Pareto nếu
*
F
là một tập
xấp xỉ Pareto và mọi điểm thuộc
*
F
đều là điểm Pareto.
Số hóa bởi trung tâm học liệu
8
Nói chung việc giải bài toán tối ưu đa mục tiêu thường hướng đến hai
điều sau:
1) Đưa ra được nhiều phương án tối ưu Pareto
2) Các phương án này càng đa dạng và phủ tương đối đều khắc miền D
càng tốt.
Sau đây ta sẽ trình bày một số phương pháp giải bài toán tối ưu đa mục
tiêu đã biết.
1.3. Một số phƣơng pháp giải
Có nhiều phương pháp để giải bài toán tối ưu đa mục tiêu như: phương
pháp nhượng bộ dần, phương pháp tìm nghiệm có khoảng cách ngắn nhất đến
nghiệm lý tưởng, phương pháp giải theo dãy mục tiêu đã được sắp xếp,
phương pháp trọng số, , nhưng trong phạm vi nghiên cứu của đề tài chỉ trình
bày một số phương pháp giải sau:
1.3.1. Phương pháp nhượng bộ dần
Phương pháp này dẫn đến việc tìm một lời giải thỏa hiệp tốt nhất tức là
tìm nghiệm x* mà theo ý thích của người nhận lời giải thì x D: x*
x
hoặc x* ~ x.
Thuật toán giải:
Bƣớc 0: Giải k bài toán l mục tiêu riêng rẽ . Sau đó lập bảng thưởng phạt
(trong đó x
i
là phương án tối ưu .
0
i
Y
là giá trị tối ưu).
Số hóa bởi trung tâm học liệu
9
Bảng 1.1: Bảng thưởng phạt.
Hàm mục tiêu
Phương án
Y
1
Y
2
…
Y
k
X
1
Y
1
0
Y
2
(X
1
)
Y
k
(X
1
)
X
2
Y
2
0
…
X
k
Y
k
0
Bƣớc 1: Căn cứ vào bảng thưởng phạt và Y
1
0
, người nhận lời giải bắt Y
1
phải nhượng bộ một lượng Y
1
và giải bài toán:
Max Y
2
(x)
x D
Y
1
(x) Y
1
0
- Y
1
Giả sử Y
2
*
là giá trị tối ưu của bài toán, chuyển sang bước 2.
Bƣớc 2: Người nhận lời giải căn cứ vào Y
2
0
và Y
2
*
, bắt Y
2
nhượng bộ 1
lượng Y
2
và giải bài toán:
Max Y
3
(x)
x D
Y
1
(x) Y
1
0
- Y
1
Y
2
(x) Y
2
*
- Y
2
Giả sử Y
3
*
là giá trị tối ưu của bài toán, chuyển sang bước tiếp theo:
Bƣớc k: Căn cứ vào Y
k-1
0
và Y
k-1
*
, bắt Y
k-1
nhượng bộ 1 lượng Y
k-1
và giải:
Max Y
k
(x)
x D
Y
1
(x) Y
1
0
- Y
1
Y
2
(x) Y
2
*
- Y
2
…
Y
k-1
(x) Y
k-1
*
- Y
k-1
Số hóa bởi trung tâm học liệu
10
Nghiệm cuối cùng của bài toán này lấy làm nghiệm cho bài toán xuất phát.
1.3.2. Phương pháp tìm nghiệm có khoảng cách ngắn nhất đến nghiệm lý
tưởng
Ở đây giá trị hàm lợi ích tỉ lệ với khoảng cách từ phương án x D đến
cái gọi là nghiệm lý tưởng. Phương án
21
xx
khi và chi khi x
1
gần nghiệm lý
tưởng hơn x
2
.
Giả sử x
1,
x
2
R
n
.
Khoảng cách giữa hai điểm x
1
, x
2
là một số d
α
xác
định bởi
d
α
=
n
i
i
ixx
1
21
Với x
1
= (x
1
1,…,
x
1
n
); x
2
= (x
2
1,…,
x
2
n
)
α là tham số (α >=1)
Số d
α
có tính chất: d
∞
d
α
d
1
Với d
∞
= lim d
∞
=
max
12
1i
xx
, i = 1, , n.
Bài toán tối ưu đa mục tiêu
max
xD
Y( x )
x
*
là nghiệm lý tưởng ta hiểu ở đây là một nghiệm (nói chung không
nhất thiết là phương án chấp nhận được), mà tại đó giá trị của mỗi hàm mục
tiêu riêng rẽ đều đạt cực đại.
Giả sử Y* là các giá trị tối ưu của từng mục riêng rẽ (Y*
i
= max Y( x )).
Khi đó giá trị của hàm mục tiêu Y tại x* là : (Y*
1
,…,Y*
k
) và khoảng cách từ
một phương án x đến nghiệm lý tưởng xác định bởi:
d =
k
i
ii
YXY
1
*
)(
Bài toán cực tiểu khoảng cách đến nghiệm lý tưởng là:
min
α
k
i
ii
YxY
1
*
)(
(1.3)
x D (1.4)
Số hóa bởi trung tâm học liệu
11
Ở đây vấn đề xác định α nói chung phụ thuộc vào các bài toán cụ thể và
các kết quả về mặt lý thuyết để tìm ra một thuật toán giải bài toán quy hoạch
(1.3) và (1.4).
Với trường hợp α=1 việc cực tiểu hoá :
1
1
min min
k
*
ii
xD
xD
i
d Y x Y
Tương đương với tìm:
1
k
i
xD
i
max Y( x )
Và
21
xx
k
i
i
k
i
i
xYxY
1
2
1
1
)()(
.
Trường hợp α = ∞:
Bài toán :
1
ax
*
ii
x D i k
xD
mind min m Y Y( x )
Còn có thể viết dưới dạng :
min W (1.5)
Y*
1
-Y
i
(x) W i =
1,k
x D (1.6)
Nếu x* là nghiệm của (1.5), (1.6) thì nó là nghiệm thoả hiệp tốt nhất
theo nghĩa x D: x*
x hoặc x* ~ x (trường hợp sau xảy ra khi x cũng là
nghiệm tối ưu).
Ở đây
1
= Y*
1
- W ta hiểu là nhượng bộ của mục tiêu thứ 1, như thế
quan điểm nhượng bộ ở đây là dựa trên nhượng bộ đồng đều theo tất cả các
chỉ tiêu, phương án X* là trội nhất nếu nhượng bộ “đều ” của nó là nhỏ nhất.
Trong trường hợp chung, tập các nghiệm của (1.5), (1.6) là tập các nghiệm
thoả hiệp tốt nhất. Người ta cũng chứng minh được rằng tập các nghiệm thỏa hiệp
tốt nhất là một tập con của tập các nghiệm không cải tiến được.
Zeleny (1974) đã chứng minh: Tập các nghiệm thoả hiệp ứng với
d
α
(1 α ∞) nằm trong khoảng nghiệm ứng với d
1
và d
α
.
Số hóa bởi trung tâm học liệu
12
Còn trong trường hợp α = ∞ Xalucvatde có nêu ra một thuật toán thoả
hiệp. Ở đây các quan hệ
, ~ được dựa trên các metric d
α
:
x
1
x
2
k
i
ii
xYY
1
1
)(*
<
k
i
ii
xYY
1
2
)(*
X
1
~ x
2
k
i
ii
xYY
1
1
)(*
<
k
i
ii
xYY
1
2
)(*
1.3.3. Phương pháp giải theo dãy mục tiêu đã được sắp xếp
Theo phương án này hàm lợi ích được thể hiện dưới dạng ẩn. Còn việc
xác định quan hệ
, ~ dựa trên thứ tự dãy tiêu chuẩn <Y
1
…, Y
k
>
Ở đây thứ tự của dãy thể hiện mức độ quan trọng của dãy tiêu chuẩn, có
sự ưu tiên tuyệt đối cho các mục tiêu đứng trước.
Thuật toán:
Bƣớc 0: Sắp xếp thứ tự các mục tiêu Y
1
,…,Y
k
Bƣớc 1: Giải bài toán:
1
max
xD
Y( x)
Ký hiệu:
1 1 1
11
xD
D x |Y ( x ) maxmaxY ( x )
Ta có D
1
D
Bƣớc 2: Giải bài toán :
2
max
xD
Y ( x)
Ký hiệu:
2 2 2
22
xD
D x |Y ( x ) maxmaxY ( x)
…
Bƣớc k: Giải bài toán :
max
k
xD
Yx
Ký hiệu
k k k
kk
xD
D x |Y ( x ) maxmaxY ( x)
Lúc đó ta có D D
1
… D
k
.
1.3.4. Phương pháp từng bước của Benayoun
Phương pháp có hai biến dạng như sau:
Số hóa bởi trung tâm học liệu
13
- Các độ lệch tương đối của hàm mục tiêu thì được gắn với một bộ trọng
số tương ứng. Trọng số này được xác định dựa trên khoảng biến động của
từng mục tiêu.
- Miền chấp nhận được của nó có thể thay đổi qua các bước giải.
Hàm “lợi ích” và các quan hệ xác định như phương pháp tìm nghiệm có
khoảng cách nhất đến nghiệm lý tưởng.
Bài toán cơ bản mà phương pháp này xét
kIdxYM
III
,1')(
i
Dx
<bài toán I>
Trong đó:
M
I
là giá trị max Y
I
(x)
x D
Ta viết
'd
là metric đã thay đổi.
D
i
là miền chấp nhận được. Khi i = 0 thì D
0
D.
Thuật toán giải như sau:
Bước 1: Xây dựng bảng “thưởng phạt” xác định M
I
và m
I
(giá trị max
và min của Y
I
(x)) ở cột I.
Bước 2: Tìm các trọng số
Xác định
I
để tính
I
:
n
j
I
j
I
II
I
C
M
mM
1
2
)(
1
*
Ở đây
C
I
j
là các hệ số của hàm mục tiêu thứ I. Đặt i = bước sang bước 3.
Bước 3: Tính
I
:
I
I
I
và giải bài toán i.
Bước 4: Giả sử nghiệm của bài toán I là x(i). Đưa cho người nhận lời
giải nghiệm x(i). Người nhận lời giải phân tích kết quả và xảy ra:
Số hóa bởi trung tâm học liệu
14
1) Nếu người nhận lời giải (NNLG) chấp nhận x(i) thì thuật toán kết thúc.
2) Nếu NNLG không chấp nhận x(i) và nếu chỉ số i < k-1 thì sang bước 5.
3) Nếu NNLG không thoả mãn x(i) và i = k – 1 thì chọn cách giải khác.
Bước 5 : NNLG phân tích kết quả và tìm ra mục tiêu I
*
có thể nhượng
bộ. NNLG cho một nhượng bộ I
*
và sang bước 6.
Bước 6 : Xác nhận miền chấp nhận mới D
(i+1)
***
*
|)(|)(
)()(
*
III
I
I
i
YixYxY
IIixYxY
DX
Coi
00
**
II
Còn đối với I I
*
thì tính nhờ giá trị tối ưu của bài toán tìm hướng và
giá trị hàm lợi ích. Tăng i lên một đơn vị và chuyển về bước 3.
Thuật toán kết thúc sau không quá k lần lặp.
1.3.5. Thuật toán thích nghi ổn định tối ưu hoá vectơ
Bài toán quy hoạch đa mục tiêu được hiểu như là bài toán tối ưu hoá
vectơ:
)(), ,(
1
xYxY
RDx
k
n
Các Y
1
(x) biểu hiện độ tốt xấu của x theo nghĩa nào đó.
Ta xét bài toán max.
Giả thiết
Dx
0
là vectơ tối ưu đối với người nhận lời giải. Yêu cầu
người nhận lời giải ước lượng giá trị mà mình thích nhất: Y
0
v
, (
kv ,1
) với
điều kiện:
)(
0
0
xYY
v
v
Vectơ x là lời giải tối ưu của:
kvxYYE
v
v
,1,0)}({
0
Dx
xYYE
v
v
min})({
0
Số hóa bởi trung tâm học liệu
15
Đặt độ lệch:
kvxYYxY
v
vv
v
,1)())((
00
bài toán
Dx
xYE
vv
min)}({{
02
hay
k
v
v
v
v
xYYE
1
20
min}))({(
Ở đây:
k
v
vv
1
1;0
(ký hiệu E là kỳ vọng toán học)
Người ta mở rộng bài toán trên và đưa ra một thuật toán giải nó.
Hàm lợi ích trong trường hợp này không thể hiện một cách tường minh
mà người nhận lời giải ngụ ý rằng trên D có một hàm ý thích. Còn quan hệ
~,
được rút ra thông qua việc so sánh các hàm mục tiêu.
1.3.6. Phương pháp trọng số.
Xét bài toán (1.1), giả sử các hàm mục tiêu f
i
có độ quan trọng lần
lượt là w
i
(i=1 k). Khi đó, bài toán (1.1) có thể chuyển về bài toán một
mục tiêu sau:
k
i
ii
Dx
fw
1
*min
(1.7)
w=(w
1
, ,w
k
) còn được gọi là véc tơ trọng số của các hàm mục tiêu
tương ứng. Thông thường, người ta chọn các trọng số w
i
thoả mãn
k
1i
.1 và10
ii
ww
Bài toán (1.7) là một bài toán tối ưu một mục tiêu, phụ thuộc trọng số.
Đặc biệt nếu mọi f
i
(i=1, ,k) là các hàm tuyến tính thì ta có một bài toán
quy hoạch tuyến tính phụ thuộc tham số ở hàm mục tiêu.
Vấn đề cốt lõi ở đây là làm thế nào để chọn trọng số cho các hàm mục
tiêu. Đã có nhiều nhà nghiên cứu phát triển các cách tiếp cận để lựa chọn
trọng số, như: Eckenrode (1965), Hobbs (1980), Hwang và Yoon (1981), và
Số hóa bởi trung tâm học liệu
16
Voogd (1983). Trong đó đều có tư tưởng chung là gắn trọng số dựa theo độ
quan trọng của mục tiêu. Rato và Roy (1989) đã thảo luận về phương pháp
xác định trọng số dựa trên lý thuyết tập mờ. Về sau, có một số nghiên cứu
đã chỉ ra rằng trọng số có thể được lựa chọn một cách ngẫu nhiên (theo xác
suất) trong quá trình tiến hoá. Sau đây trình bày về hai cách chọn trọng số.
* Chọn trọng số dựa theo độ quan trọng
Với cách này, các trọng số thường được cho trước theo ý đồ của
người quyết định hoặc theo ý kiến chuyên gia. Do vây các trọng số là cố
định trong suốt quá trình thực hiện và bài toán (2.1) được đưa về bài toán tối
ưu môt mục tiêu
k
i
ii
xfW
1
)(*
(cực tiểu W).
Ví dụ: Với bài toán thiết kế hồ chứa nước, theo ý người sử dụng, tổng
giá thành f
1
và dung tích f
3
là quan trọng hơn, có đô quan trọng được cho
cùng là 0.4, còn lượng tổn thất bay hơi f
2
có đô quan trọng được cho là 0.2.
Như vây, véc tơ trọng số ở đây là ( = (0.4,0.2,0.4), các trọng số này là cố
định trong suốt quá trình tiến hóa. Khi đó bài toán đã cho chuyển về bài
toán min{0.4 f
1
+ 0.2f
2
+ 0.4f
3
}.
Số hóa bởi trung tâm học liệu
17
* Trọng số được chọn một cách ngẫu nhiên (theo xác suất)
Các trọng số w
i
của các hàm mục tiêu tương ứng được chọn một cách
ngẫu nhiên. Thường các w
i
cũng là các trọng số không âm và
1
i
w
(i =
1, ,k).
Ở đây quan hệ trội được rút ra thông qua việc so sánh hàm mục tiêu (1.7).
Kết Luận: phần trên giới thiệu những vấn đề tổng quan và một số
phương pháp giải bài toán tối ưu đa mục tiêu.
Số hóa bởi trung tâm học liệu
18
Chƣơng 2: MỘT SỐ PHƢƠNG PHÁP HEURISTIC
Chương này giới thiệu những vấn đề khái quát về giải thuật di truyền
(GA), chiến lược tiến hoá (ES) và giải thuật mô phỏng tôi luyện (SA) làm cơ
sở cho việc ứng dụng giải bài toán tối ưu đa mục tiêu.
2.1. Giải thuật di truyền (GA - Genetic Algorithm)
2.1.1. Khái quát chung
Giải thuật di truyền GA(GENETIC ALGORITHM) do D.E. Goldberg
đề xuất, sau đó được L. Davis và Z. Michalevicz phát triển, đây cũng chính là
một trong các thuật toán tiến hóa. Thuật toán tiến hóa là các chương trình máy
tính có dùng các thuật toán tìm kiếm, tối ưu hóa dựa trên nguyên lý tiến hóa
tự nhiên.
Giải thuật di truyền được hình thành dựa trên quan niệm: quá trình tiến
hóa tự nhiên là quá trình hoàn hảo và hợp lý nhất, tự quá trình này đã mang
tính tối ưu. Quan niệm này là một tiên đề đúng, không chứng minh được
nhưng phù hợp với thực tế khách quan. Tính tối ưu của quá trình tiến hóa thể
hiện ở đặc điểm, thế hệ sau bao giờ cũng tốt hơn (phát triển hơn, hoàn thiện
hơn) thế hệ trước. Tiến hóa tự nhiên được duy trì nhờ hai quá trình cơ bản là
sinh sản và chọn lọc tự nhiên, trong suốt quá trình tiến hóa tự nhiên, các thế
hệ mới luôn được sinh ra để bổ sung thay thế thế hệ cũ. Cá thể nào phát triển
hơn, thích ứng hơn với môi trường sẽ tồn tại, cá thể nào không thích ứng được
với môi trường sẽ bị đào thải. Sự thay đổi của môi trường là động lực thúc
đẩy quá trình tiến hóa, ngược lại tiến hóa cũng tác động trở lại góp phần thay
đổi môi trường.
Giải thuật di truyền (GA-Genetic Algorithms) là giải thuật tìm kiếm,
chọn lựa các giải pháp tối ưu để giải quyết các bài toán thực tế khác nhau, dựa
trên cơ chế chọn lọc của tự nhiên: từ tập lời giải ban đầu, thông qua nhiều
bước tiến hoá, hình thành tập lời giải mới phù hợp hơn, và cuối cùng dẫn đến
lời giải tối ưu toàn cục.
Trong tự nhiên, mỗi cá thể muốn tồn tại và phát triển phải thích nghi
Số hóa bởi trung tâm học liệu
19
với môi trường, cá thể nào thích nghi hơn thì tồn tại, cá thể nào kém thích
nghi thì bị tiêu diệt. Trong mỗi cá thể, các gen liên kết với nhau theo cấu trúc
dạng chuỗi, gọi là nhiễm sắc thể (NST). Mỗi NST đặc trưng cho mỗi loài và
quyết định sự sống còn của cá thể đó. Do môi trường tự nhiên luôn biến đổi
nên cấu trúc NST cũng thay đổi để thích nghi với môi trường và thế hệ sau
luôn thích nghi hơn thế hệ trước. Cấu trúc này có được do sự trao đổi thông
tin có tính ngẫu nhiên với môi trường bên ngoài hoặc giữa các NST với nhau.
2.1.2. Các vấn đề cơ bản của giải thuật di truyền
2.1.2.1. Mã hóa
Việc mô tả di truyền cho lời giải cho bài toán gồm hai phần cơ bản:
+ Xây dựng cấu trúc gen cho mỗi lời giải của bài toán để từ mỗi lời giải
ta có thể mã hoá thành một NST (chuỗi các gen).
+ Giải mã các NST để nhận được lời giải.
Đây là vấn đề cần giải quyết trước khi giải bài toán với GA. Tuỳ thuộc
vào nội dung của mỗi bài toán mà ta có cách mã hoá khác nhau.
Sau đây là phương pháp mã hoá hay được sử dụng:
Mã hoá dạng chuỗi nhị phân: đây là phương pháp thông dụng và cơ
bản nhất được sử dụng ngay từ bước ban đầu khi nghiên cứu GA. Trong
phương pháp này mỗi NST là một chuỗi các bit 0 và 1.
Mã hoá thứ tự: được sử dụng trong bài toán có sắp xếp thứ tự. Ở đây mỗi
NST là một chuỗi các số nguyên thể hiện thứ tự phân bố lời giải của bài toán.
Mã hoá theo giá trị: được sử dụng trong các bài toán mà mỗi lời giải là
tập các giá trị (ví dụ tập số thực). Trong phương pháp này, mỗi NST là một
chuỗi các giá trị có mối quan hệ tương ứng với bài toán.
Mã hoá dạng cây: được sử dụng chủ yếu trong các biểu thức toán học,
trong phương pháp mã hoá này mỗi NST là một cây của một nhóm đối tượng
nào đó.
Ví dụ: Biểu thức sau x+(y / 5) được mã hoá thành:
+
/
x
y
5
Số hóa bởi trung tâm học liệu
20
Mã hoá số thực : Mỗi NST được mã hoá là một véc tơ trong không
gian R
m
chẳng hạn X = (a
1
, a
2
, , a
m
) với các a
i
R. Cách mã hoá này
thường tự nhiên đối với các bài toán tối ưu số và được phát triển rất mạnh
trong thời gian gần đây.
2.1.2.2. Tạo lập lời giải ban đầu (khởi tạo quần thể)
Tập lời giải ban đầu thường được khởi tạo ngẫu nhiên từ miền xác định
của các lời giải. Cách tạo lập tập lời giải ban đầu phụ thuộc rất nhiều vào cách
mã hoá NST.
Với phương pháp mã hoá nhị phân: xây dựng NST bằng cách tạo ngẫu
nhiên chuỗi các bit 0 hoặc 1.
Với phương pháp mã hoá thứ tự: xây dựng NST ban đầu bằng cách
hoán vị ngẫu nhiên các thứ tự.
Với phương pháp mã hoá theo giá trị: tạo ngẫu nhiên từng giá trị trong
miền xác định của lời giải để tạo ra chuỗi NST ban đầu.
Với mã hoá số thực: tạo ngẫu nhiên N véc tơ thực trong R
m
.
2.1.2.3. Xây dựng hàm phù hợp
Hàm phù hợp đánh giá khả năng phù hợp của tập lời giải theo yêu cầu
bài toán. Hàm này được xây dựng cho từng bài toán với yêu cầu cụ thể.
Thông thường trong các bài toán tối ưu hàm này chính là hàm mục tiêu của
bài toán.
2.1.2.4. Các toán tử di truyền
a. Toán tử chọn lọc
Trong quá trình thực hiện của giải thuật di truyền, sau mỗi lần tiến hoá
ta chỉ giữ lại các cá thể có độ phù hợp cao còn các cá thể phù hợp thấp bị loại
bỏ. Toán tử chọn lọc thường giữ lại 50% các cá thể phù hợp nhất. Tuy nhiên
Số hóa bởi trung tâm học liệu
21
người ta cũng phát triển nhiều sơ đồ chọn khác nhau nhằm là tăng tính đa
dạng của quần thể, tránh sự hội tụ sớm.
b. Toán tử lai ghép là toán tử di truyền cơ bản trong GA, tiến trình lai
ghép như sau :
Bƣớc 1: Tạo ra tập NST để tạo sinh từ quần thể bằng cách chọn ngẫu
nhiên N NST từ M NST (M là kích cỡ quần thể).
Có nhiều cách chọn:
Chọn ngẫu nhiên theo thứ tự: lặp N lần việc tạo ngẫu nhiên ra một số
nguyên i thuộc khoảng [1, M] để chọn NST thứ i.
Chọn theo trọng số: tạo trọng số tích luỹ cho M NST theo công thức:
M
k
i
k
i
p
1
(với bài toán tìm min)
M
k
i
k
iM
p
1
1
(với bài toán tìm max)
Sau khi có trọng số tích luỹ cho NST, ta lần lượt tạo các xác suất ngẫu
nhiên r và duyệt từ NST đầu tiên đến khi gặp NST có trọng số tích luỹ lớn
hơn r thì chọn nó.
Bƣớc 2: Sau khi chọn được N NST, lần lượt lấy ra từng cặp NST để lai
ghép tạo ra hai NST mới. Một số dạng toán tử lai ghép hay dùng là :
Lai ghép 1 điểm: chọn ngẫu nhiên một vị trí sau đó hoán vị phần đứng
sau vị trí vừa chọn giữa hai NST cha và mẹ để nhận được hai NST con.
Lai ghép hai điểm: chọn ngẫu nhiên hai vị trí trong một NST, sau đó
hoán vị các giá trị đứng giữa hai điểm đã chọn của hai NST cha mẹ để nhận
được hai NST con.
Lai ghép mặt nạ: tạo một mặt nạ ngẫu nhiên có số bit bằng chiều dài
của NST. Ta sẽ hoán vị các giá trị của hai NST cha và mẹ ở những vị trí
tương ứng với vị trí bit 1 của mặt nạ.
Số hóa bởi trung tâm học liệu
22
c. Toán tử đột biến: Toán tử đột biến được xây dựng để tránh việc nhận
được giá trị tối ưu cục bộ. Đột biến gây ra thay đổi ngẫu nhiên trên từng bit
của NST để tạo ra một NST mới.
d. Tạo sinh: Chọn các cá thể từ quần thể hiện thời làm quần thể mới
cho lần lặp kế tiếp.
2.1.3. Thuật toán di truyền
Giải thuật di truyền giải một bài toán cần có các thành phần sau:
1. Một cấu trúc dữ liệu biểu diễn không gian lời giải của bài toán
2. Cách khởi tạo quần thể ban đầu
3. Hàm định nghĩa độ thích nghi eval(), đóng vai trò môi trường
4. Các phép toán di truyền ( phép lai, phép đột biến, phép tái sinh
và phép chọn)
5. Các tham số được giải thuật di truyền sử dụng (kích thước quần
thể, xác suất lai, đột biến )
Giải thuật di truyền có thể mô tả vắn tắt như sau:
Procedure Giải_thuật_di_truyền;
Begin
t:=0;
Khởi tạo ngẫu nhiên quần thể P(t);
Đánh giá độ phù hợp từng cá thể trong P(t);
Repeat
t:=t+1;
Chọn các cá thể từ P(t - 1);
Lai tạo các cá thể đã chọn tạo ra P(t) mới;
Đột biến các cá thể trong P(t) theo xác suất p
m
;
Đánh giá độ phù hợp các cá thể trong tập P(t);
Until (thoả điều kiện dừng);
End;
Giải thích:
Số hóa bởi trung tâm học liệu
23
Tại lần lặp thứ t, GA xác định một tập hợp các lời giải có thể (các cá
thể hay NST) gọi là quần thể P(t) = { x
t
1,
,x
t
2
, ,x
t
n
}. Mỗi lời giải x
t
i
được
đánh giá nhằm xác định độ phù hợp của nó. Sau đó, một tập hợp các lời giải
được hình thành nhờ sự lựa chọn các lời giải phù hợp hơn. Một số phần tử
của tập hợp này được tái sản xuất thông qua lai ghép và đột biến. Từ đó hình
thành quần thể mới P(t+1) với hy vọng chứa các cá thể phù hợp hơn quần thể
trước đó.
Toán tử “lai ghép” kết hợp các đặc trưng của hai NST cha và mẹ hình
thành hai NST con tương ứng chẳng hạn bằng cách hoán vị các đoạn thích hợp
của hai NST cha và mẹ. Ví dụ, nếu cặp nhiễm sắc thể cha mẹ được biểu diễn
dưới dạng hai véc tơ:
(a
1
, b
1
, c
1
, d
1
, e
1
) và (a
2
, b
2
, c
2
, d
2
, e
2
)
thì cặp véc tơ con cháu nhận được sau khi lai ghép có thể là:
(a
1
, b
1
, c
1
, d
2
, e
2
) và (a
2
, b
2
, c
2
, d
1
, e
1
)
Toán tử “đột biến” thay đổi một hay một số gen của NST được chọn
theo quy tắc thay đổi ngẫu nhiên với xác suất bằng tỷ lệ đột biến.
, mỗi NST được mã hoá là một véc tơ trong không gian R
m
chẳng hạn X
= (a
1
, a
2
, , a
m
) với các a
i
R. Cách mã hoá này thường tự nhiên đối với các
bài toán tối ưu số và được phát triển rất mạnh trong thời gian gần đây.
2.1.4. Giải thuật di truyền mã hóa số thực (RCGA - Real–Code Genetic Algorithm)
2.1.4.1. Mã hóa RCGA
Số hóa bởi trung tâm học liệu
24
Trong phần này ta quan tâm tới giải thuật di truyền mã hóa số thực
(RCGA) để giải các bài toán tối ưu giá trị thực trong không gian R
n
và không
có các ràng buộc đặc biệt.
Một cách tổng quát, bài toán tối ưu số thực có thể xem là một cặp (S,f),
trong đó S R
n
và f : S R là một hàm n biến. Bài toán đặt ra là tìm véctơ
x=(x
1
,x
2
, , x
n
) S sao cho f(x) đạt giá trị cực tiểu trên S. Nghĩa là với mọi
y S phải có f(x) f(y). Hàm f ở đây có thể không liên tục nhưng cần bị chặn
trên S (đối với các bài toán tìm cực đại có thể chuyển về cực tiểu một cách
đơn giản).
Trong GA mã hoá số thực, mỗi cá thể được biểu diễn như một véc tơ
thực n chiều: b = (x
1
, x
2
, , x
n
), x
i
R.
Như vậy một quần thể kích cỡ m là một tập hợp có m véctơ trong R
n
.
Ta cũng có thể xem một quần thể kích cỡ m như một ma trận thực cấp (mxn),
đây là cách mã hoá tự nhiên và thuận tiện trong việc thực hiện các toán tử tiến
hóa. Sau đây ta sẽ xem xét cụ thể hơn các toán tử này trong giải thuật di
truyền mã hoá số thực.
2.1.4.2. Các toán tử của RCGA
a. Toán tử chọn lọc
Trong quá trình thực hiện của giải thuật di truyền, sau mỗi lần tiến hoá
ta chỉ giữ lại các cá thể có độ phù hợp cao còn các cá thể phù hợp thấp bị loại
bỏ. Toán tử chọn lọc thường giữ lại 50% các cá thể phù hợp nhất. Tuy nhiên
người ta cũng phát triển nhiều sơ đồ chọn khác nhau nhằm là tăng tính đa
dạng của quần thể, tránh sự hội tụ sớm.
Sử dụng bánh xe Roulette
Có nhiều cách để thực hiện toán tử chọn lọc, nói chung đều theo tư
tưởng cá thể có độ thích nghi cao hơn thì khả năng được chọn nhiều hơn.
Nhưng có lẽ đơn giản và hiệu quả nhất là sử dụng bánh xe Roulette (roulette
wheel), mỗi cá thể trong quần thể chiếm một khe có độ rộng tỷ lệ thuận với
Số hóa bởi trung tâm học liệu
25
giá trị phù hợp. Độ rộng của khe được tính bằng tỷ lệ % giá trị phù hợp của
một cá thể trên tổng giá trị phù hợp toàn quần thể.
Gọi f
i
là độ phù hợp của cá thể thứ i trong quần thể gồm N cá thể khi đó
cá thể i sẽ được chọn với xác suất
N
i
i
i
i
f
f
p
1
. Trên vòng tròn Roulette mỗi
chuỗi trong quần thể chiếm một khe có độ rộng tỷ lệ với độ phù hợp của
chuỗi. Độ rộng của khe được tính theo tỷ lệ phần trăm độ phù hợp của chuỗi
với tổng độ phù hợp của toàn quần thể là 100%. Ví dụ với quần thể gồm 4 cá
thể cho trong bảng sau chúng ta c 2.1
2.1. Ví dụ về quần thể gồm 4 cá thể
STT
Chuỗi
Sức
khoẻ
Tỷ lệ %
Tổng chạy
1
2
3
4
13
24
8
19
169
576
64
361
14.4
49.2
5.5
30.9
169
745
809
1170
Tổng
1170
100.0
Các bước tiến hành thủ tục quay Roulette :
- Đánh số các cá thể trong quần thể. Tính tổng độ phù hợp của toàn
quần thể sumfitness, và ứng với mỗi cá thể tính một tổng chạy subtotal bằng
tổng độ phù hợp của cá thể đó với độ phù hợp của các cá thể đứng phía trước.
- Sinh một số ngẫu nhiên r trong khoảng từ 0 đến tổng độ phù hợp
sumfitness.
- Cá thể đầu tiên trong quần thể có tổng chạy subtotal lớn hơn hoặc
bằng r sẽ được chọn.
1.1, với số ngẫu nhiên r = 654 thì chuỗi thứ 2 sẽ được
chọn.
Trên thực tế, người ta thường sử dụng toán tử chọn lọc tỷ lệ được mô tả
như sau: