ĐẠI HỌC THÁI NGUYÊN
TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG
NGUYỄN QUANG LẬP
THUẬT TOÁN BẦY ĐÀN PSO, GIẢI THUẬT
DI TRUYỀN VÀ ỨNG DỤNG GIẢI CÁC BÀI TOÁN
TỐI ƢU ĐA MỤC TIÊU
Chuyên ngành: Khoa học máy tính
Mã số: 60 48 01
LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH
Ngƣời hƣớng dẫn khoa học: TS. VŨ VINH QUANG
Thái Nguyên - 2013
Số hóa bởi trung tâm học liệu
i
LỜI CẢM ƠN
Em xin chân thành cảm ơn Trường Đại Học Công Nghệ Thông Tin và truyền
thông đã tạo điều kiện cho em thực hiện luận văn này.
Em cũng xin chân thành cảm ơn tới toàn thể thầy cô giáo ở Viện công nghệ
thông tin và trường Đại học công nghệ thông tin và truyền thông đã tận tình giảng
dạy và hướng dẫn, trang bị cho em những kiến thức cần thiết trong quá trình thực
hiện luận văn được thành công.
Dựa trên sự chỉ bảo tận tình của TS. Vũ Vinh Quang dựa trên những kiến
thức đã học và tìm hiểu được, em đã hoàn thành luận văn theo đúng thời gian quy
định. Tuy nhiên trong quá trình thiết kế và thực hiện luận văn không tránh khỏi sai
sót, do thời gian có hạn và khả năng còn hạn chế. Em mong quý thầy cô và các bạn
thông cảm và có những ý kiến quý báu nhằm hoàn thiện hơn cho sản phẩm.
Em xin chân thành cảm ơn!
Thái nguyên, ngày 15 tháng 9 năm 2013
Học viên
Nguyễn Quang Lập
Số hóa bởi trung tâm học liệu
ii
LỜI CAM ĐOAN
Em xin cam đoan luận văn tốt nghiệp: “Thuật toán bầy đàn PSO, giải thuật di
truyền và ứng dụng giải các bài toán tối ưu đa mục tiêu” do em tự thực hiện dưới sự
hướng dẫn của thầy giáo Vũ Vinh Quang. Các kết quả và số liệu hoàn toàn trung thực.
Ngoài các tài liệu tham khảo đã dẫn ra ở cuối luận văn em đảm bảo rằng
không sao chép các công trình hay luận văn tốt nghiệp của người khác. Nếu phát
hiện có sự sai phạm với điều cam đoan trên, em xin hoàn toàn chịu trách nhiệm.
Số hóa bởi trung tâm học liệu
iii
MỤC LỤC
LỜI CẢM ƠN i
LỜI CAM ĐOAN ii
MỤC LỤC iii
DANH MỤC CÁC BẢNG v
DANH MỤC CÁC HÌNH VẼ vi
MỞ ĐẦU 1
CHƢƠNG 1: MÔ HÌNH BÀI TOÁN TỐI ƢU 3
1.1 Mô hình bài toán tối ưu hóa 3
1.1.1 Mô hình tổng quát 3
1.1.2 Phân loại bài toán tối ưu 4
1.2 Bài toán quy hoạch tuyến tính 4
1.3 Bài toán tối ưu đa mục tiêu 6
1.3.1 Phương pháp ràng buộc 6
1.3.2 Phương pháp tổng trọng số 8
1.3.3 Phương pháp nhượng bộ dần 8
1.3.4 Phương pháp thoả hiệp 9
1.3.5 Phương pháp tìm nghiệm có khoảng cách nhỏ nhất đến nghiệm lý tưởng 9
1.3.6 Phương pháp giải theo dãy mục tiêu đã được sắp 9
1.3.7 Phương pháp từng bước của Benayoun 10
1.3.8 Phương pháp trọng số 11
CHƢƠNG 2: CƠ SỞ THUẬT TOÁN DI TRUYỀN 13
2.1 Các khái niệm cơ bản 14
2.1.1 Cá thể, nhiễm sắc thể 14
2.1.2 Quần thể 14
2.1.3 Chọn lọc (Selection) 14
2.1.4 Lai ghép (Cross-over) 15
2.1.5 Đột biến (Mutation) 15
2.1.6 Mô hình GA 15
Số hóa bởi trung tâm học liệu
iv
2.1.7 Các tham số của GA 16
2.2 Cơ chế thực hiện GA 17
2.2.1 Mã hóa 17
2.2.2 Khởi tạo quần thể ban đầu 18
2.2.3 Xác định hàm thích nghi 19
2.2.4 Cơ chế lựa chọn 19
2.2.5 Các toán tử di truyền 20
2.3. Thuật toán di truyền kinh điển 22
2.3.1. Mã hóa 22
2.3.2. Toán tử chọn lọc 23
2.3.3. Toán tử lai ghép 24
2.3.4. Toán tử đột biến 25
2.3.5. Thuật toán di truyền mã hóa số thực (RCGA) 27
2.4 Thuật toán tối ưu bầy đàn PSO 33
2.4.1 Giới thiệu 33
2.4.2 Khái niệm về bầy đàn thông minh 34
2.4.3 Thuật toán PSO truyền thống 35
2.5 Một số kết quả cải tiến đối với PSO 43
CHƢƠNG 3: ỨNG DỤNG THUẬT TOÁN GA VÀ PSO CHO CÁC BÀI TOÁN
THỰC TẾ 56
3.1 Đặt vấn đề 56
3.2 Mô hình bài toán thức ăn gia súc 58
3.2.1 Yêu cầu của bài toán 58
3.2.2 Dữ liệu đầu vào của bài toán 58
3.3 Bài toán thực tế 61
KẾT LUẬN 68
TÀI LIỆU THAM KHẢO 69
PHỤ LỤC 70
Số hóa bởi trung tâm học liệu
v
DANH MỤC CÁC BẢNG
Bảng 2.1: Phân tích kết quả một vài bài toán tối ưu thông dụng 53
Bảng 2.2: Kích thước quần thể và miền giá trị khởi tạo cho các bài toán tối ưu 53
Bảng 3.1 Giá trị các tham số của bài toán 57
Bảng 3.2 Tiêu chuẩn dinh dưỡng 61
Bảng 3.3 Tỉ lệ chất dinh dưỡng trong các loại nguyên liệu 61
Bảng 3.4: Nghiệm của bài toán với một số bộ dữ liệu 63
Bảng 3.5: Nghiệm của bài toán với một số bộ dữ liệu 66
Số hóa bởi trung tâm học liệu
vi
DANH MỤC CÁC HÌNH VẼ
Hình 2.1: Sơ đồ mô tả GA 15
Hình 2.2: Lai ghép CMX 30
Hình 2.3: Phân bố của
ci
j
x
31
Hình 2.4: Toán tử lai ghép SX 32
Hình 2.5: Mô tả cách thức tìm kiếm thức ăn của bầy kiến 34
Hình 2.6: Mô tả cách thức tìm đường của đàn chim 35
Hình 2.7: Bầy đàn với 10 cá thể trong không gian tìm kiếm 2 chiều 36
Hình 2.8: Quan hệ vị trí – vận tốc trong không gian 2 chiều 37
Hình 2.9: Một bầy đàn toàn cục và lân cận cục bộ 38
Hình 2.10: Các topology lân cận đơn giản 38
Hình 2.11:Chuyển động của cá thể 42
Hình 2.12: Áp dụng kỹ thuật làm lệch cho hàm (2.13) tại điểm
*
4.60095589x
, với λ=1 46
Hình 2.13 Áp dụng kỹ thuật làm lệch cho hàm (2.13) tại điểm
*
4.60095589x
,với λ=10 46
Hình 2.14:Áp dụng kỹ thuật làm lệch cho hàm (2.13) tại điểm
*
4.60095589x
,với λ=0.1. 47
Hình 2.15: Áp dụng kỹ thuật làm lệch cho hàm (2.14) tại điểm
*
()
2
x
, với λ=1 47
Hình 2.16: Áp dụng kỹ thuật làm lệch cho hàm (2.14) tại điểm
*
2
x
,với λ=10 48
Hình 2.17: Áp dụng kỹ thuật làm lệch cho hàm (2.14) tại điểm
*
2
x
, với λ=0.1 48
Hình 2.18: Đồ thị của hàm Levy No.5 trong khối [-2,2]
2
50
Hình 2.19: Giai đoạn đầu G(x) của kỹ thuật kéo giãn cho hàm Levy No.5 trong khối [-2,2]
2
50
Hình 2.20: Hàm Levy No.5 trong khối [-2,2]
2
sau giai đoạn hai H(x) của kỹ thuật kéo giãn 51
Hình 3.1: Kết quả bài toán khi sử dụng thuật toán GA – Test 2 64
Hình 3.2 Kết quả giải bài toán khi sử dụng thuật toán PSO – Test 2 66
Số hóa bởi trung tâm học liệu
1
MỞ ĐẦU
Trong thực tế, rất nhiều ngành khoa học phải giải quyết các bài toán tối ưu
đa mục tiêu đặc biệt là trong ngành kinh tế. Chẳng hạn, người chế tạo sản phẩm
thường phải đưa ra phương án sao cho vừa tiết kiệm vật liệu, chi phí sản xuất thấp
và lại muốn giá trị sản phẩm là cao nhất. Nghiên cứu giải bài toán tối ưu đa mục
tiêu là một vấn đề không đơn giản vì chưa chắc có lời giải thỏa mãn đồng thời các
mục tiêu đặt ra (thường là các mục tiêu đối nghịch như ví dụ trên) mà không vi
phạm các ràng buộc nào đó. Đã có nhiều phương pháp giải bài toán tối ưu đa mục
tiêu được đề xuất, việc nghiên cứu phát triển các phương pháp này và ứng dụng
chúng để giải quyết các bài toán thực tế là một vấn đề đang được quan tâm.
Trong nhiều bài toán tối ưu thực tế, việc trọng tâm là tìm vị trí cực tiểu toàn
cục của hàm mục tiêu giá trị thực f: E R, nghĩa là tìm điểm
*
xE
sao cho
*
( ) ( ),f x f x x E
với tập đóng
d
ER
, trong đó d là số chiều.
Đã có nhiều phương pháp tối ưu toàn cục (Global Optimization - GO) được
phát triển để giải quyết vấn đề như trên như: Mô phỏng việc luyện thép (Simulated
Annealing), Tabu search, Tính toán tiến hóa (Evolutionary computation). Về mặt lý
thuyết tổng quát, các phương pháp GO có tính hội tụ mạnh, hay ít ra về nguyên tắc
cũng dễ hiểu trong việc thực hiện và ứng dụng.
Tính toán tiến hóa (Evolutionary computation) là kỹ thuật đặc biệt trong số
các phương pháp GO. Phương pháp này làm việc trên một tập hợp những lời giải
tiềm năng, được gọi là quần thể (population) và tìm lời giải tối ưu thông qua việc
cộng tác và cạnh tranh giữa các lời giải tiềm năng. Thường được sử dụng nhất là các
thuật toán di truyền (Genetic Algorithms – GA) và Artificial Life, dựa trên sự tiến
hóa tự nhiên và cư xử xã hội. Các phương pháp này thường có thể tìm tốt nhất trong
các bài toán tối ưu phức tạp với các phương pháp tối ưu truyền thống.
Thuật toán tối ưu Particle Swarm Optimization (PSO) được R.C.Eberhat và
J.Kennedy đề nghị năm 1995. Từ lúc ra đời đến nay PSO đã được nhiều nhà khoa
Số hóa bởi trung tâm học liệu
2
học tham gia nghiên cứu, cải tiến và ứng dụng nó để giải nhiều bài toán lý thuyết và
thực tế.
Đề tài “Thuật toán bầy đàn PSO, giải thuật di truyền và ứng dụng giải các
bài toán tối ưu đa mục tiêu” nhằm tìm hiểu khả năng ứng dụng của thuật toán PSO,
GA trong việc giải quyết các bài toán tối ưu đa mục tiêu trong thực tế. Với mục đích
đó, đề tài tập trung trình bày về việc giải bài toán tối ưu bằng giải thuật PSO, GA và
thực nghiệm về khả năng ứng dụng thực tế của hai thuật toán này.
Nội dung đề tài gồm 3 chƣơng:
Chương 1: Mô hình bài toán tối ưu đa mục tiêu.
Chương 2: Cơ sở thuật toán di truyền.
Chương 3: Ứng dụng thuật toán GA, và PSO cho các bài toán thực tế.
Trong luận văn, các kết quả thực nghiệm được thực hiện bằng các chương
trình viết trên nền Matlab version 7.0.
Số hóa bởi trung tâm học liệu
3
CHƢƠNG 1
MÔ HÌNH BÀI TOÁN TỐI ƢU
Trong chương này, luận văn sẽ trình bày một số kiến thức cơ bản về mô hình
tổng quát của bài toán tối ưu hóa, việc phân loại các bài toán tối ưu và một số
phương pháp giải bài toán tối ưu đa mục tiêu, các kiến thức của chương này được
tham khảo từ các tài liệu [1,2].
1.1 Mô hình bài toán tối ƣu hóa
1.1.1 Mô hình tổng quát
Tối ưu hóa là một trong những lĩnh vực quan trọng của toán học có ảnh
hưởng đến hầu hết các lĩnh vực khoa học, công nghệ và kinh tế và xã hội. Việc tìm
giải pháp tối ưu cho một bài toán thực tế nào đó chiếm một vai trò hết sức quan
trọng như việc tiến hành lập kế hoạch sản xuất hay thiết kế hệ thống điều khiển các
quá trình … Nếu sử dụng các kiến thức trên nền tảng của toán học để giải quyết các
bài toán cực trị, người ta sẽ đạt được hiệu quả kinh tế cao. Điều này phù hợp với
mục đích của các vấn đề đặt ra trong thực tế hiện nay.
Bài toán tối ưu tổng quát được phát biểu như sau:
Cực đại hóa (cực tiểu hóa) hàm:
( ) ax(min)f X m
Với các điều kiện:
1
( ) ,
ii
g X b i J
(1.1)
2
( ) ,
jj
g X b j J
(1.2)
3
( ) ,
kk
g X b k J
(1.3)
12
, , , 0.
n
x x x
(1.4)
Trong đó
()fX
được gọi là hàm mục tiêu, Các điều kiện (1.1) được gọi là
ràng buộc đẳng thức. Các điều kiện (1.2), (1.3) được gọi là ràng buộc bất đẳng thức.
Các điều kiện (1.4) được gọi là ràng buộc về dấu.
12
( , , , )
n
X x x x
là véc tơ thuộc
không gian
n
R
. Tập các véc tơ
X
thỏa mãn hệ ràng buộc lập nên một miền
D
được
Số hóa bởi trung tâm học liệu
4
gọi là miền phương án (hay miền chấp nhận được), mỗi điểm
XD
gọi là một
phương án. Một phương án
*
XD
làm cho hàm mục tiêu
()fX
đạt max (min) được
gọi là phương án tối ưu.
1.1.2 Phân loại bài toán tối ưu
Dựa trên mô hình tổng quát, người ta thường phân loại lớp các bài toán tối
ưu như sau:
Qui hoạch tuyến tính: là những bài toán mà hàm mục tiêu
()fX
và tất cả
các hàm ràng buộc
( ), ( ), ( )
i j k
g X g X g X
là tuyến tính.
Qui hoạch phi tuyến: là những bài toán một trong hàm mục tiêu
()fX
hoặc
các hàm ràng buộc
,,
i j k
g X g X g X
là phi tuyến.
Qui hoạch lồi: Là các bài toán qui hoạch mà các hàm mục tiêu
()fX
là lồi
trên tập các ràng buộc
D
lồi.
Qui hoạch lõm: Là các bài toán qui hoạch mà các hàm mục tiêu
()fX
là
lõm trên tập các ràng buộc
D
lõm.
Qui hoạch rời rạc: Bài toán tối ưu được gọi là qui hoạch rời rạc nếu miền
ràng buộc
D
là tập hợp rời rạc. Trong trường hợp riêng khi các biến chỉ nhận
giá trị nguyên thì ta có qui hoạch nguyên.
Qui hoạch đa mục tiêu: Nếu trên cùng một miền ràng buộc ta xét đồng thời
các hàm mục tiêu khác nhau.
Trong các lĩnh vực kinh tế kỹ thuật thì qui hoạch phi tuyến, qui hoạch tuyến tính
là những bài toán thường gặp.
1.2 Bài toán quy hoạch tuyến tính
Từ một số các mô hình trong thực tế, ta có mô hình tổng quát cho bài toán
quy hoạch tuyến tính như sau:
Xác định các biến
( 1,2, , )
j
x j n
sao cho:
j
1
( ) ax( )
n
j
j
F x c x M Min
ij 1
1
n
ji
j
a x b i I M
(1.5)
Số hóa bởi trung tâm học liệu
5
ij 2 1
1
\
n
ji
j
a x b i I M I
(1.6)
0( )
j
x j J N
(1.7)
Với
1,2, ,Mm
,
1,2, ,Nn
Vectơ
12
, , ,
n
X x x x
thỏa mãn các điều kiện (1.5) - (1.7) được gọi là một
phương án của bài toán. Tập các nghiệm thỏa mãn hệ ràng buộc được gọi là miền
phương án ký hiệu là
D
. Phương án thỏa mãn điều kiện để hàm mục tiêu đạt
Max(min) được gọi là phương án tối ưu.
Dạng chính tắc:
j
1
()
n
j
j
F x c x Min
ij
1
n
ji
j
a x b i M
0( )
j
x j N
Dạng chuẩn tắc:
j
1
()
n
j
j
F x c x Min
ij
1
n
ji
j
a x b i M
0( )
j
x j N
Sử dụng các ký hiệu vectơ và ma trận, mô hình bài toán quy hoạch tuyến tính
tổng quát được biểu diễn như sau:
ax(min)
T
f X C X M
AX b
0X
Trong đó:
1 2 1 2
( , , , ), ( , , , )
nn
X x x x C c c c
11 12 1
21 22 2
12
n
n
m m mn
a a a
a a a
A
a a a
,
1
2
n
x
x
X
x
,
1
2
m
b
b
b
b
Số hóa bởi trung tâm học liệu
6
1.3 Bài toán tối ƣu đa mục tiêu
Trong các bài toán kinh tế, kỹ thuật, khoa học công nghệ, nảy sinh từ thực
tế, chúng ta phải xem xét tối ưu hóa đồng thời nhiều mục tiêu. Việc làm tốt hơn
mục tiêu này thường dẫn tới việc làm xấu đi một số mục tiêu khác (nghĩa là không
có lời giải nào tối ưu theo mọi mục tiêu). Như vậy, chúng ta cần phải tối ưu hóa
(cực đại hóa hoặc cực tiểu hóa tùy theo tình huống cụ thể) không phải là chỉ một
mục tiêu nào đó, mà là đồng thời tất cả các mục tiêu đã đặt ra thường là không
tương thích với nhau.
Xét mô hình tổng quát
( )
12
( ) ( ), ( ), , ( ) ( ax),
( ) ( , ) 0.
n
F X f X f X f X Min M
GX
=®
> = = < =
(1.8)
Trong đó
+
()FX
được gọi là hàm mục tiêu
+
()GX
được gọi là các biểu thức ràng buộc
+
X
là phương án của bài toán
Tập tất cả các phương án thỏa mãn hệ điều kiện ràng buộc được gọi là miền
phương án, phương án thỏa mãn điều kiện để
( ) ( ax)F X Min M®
được gọi là
phương án tối ưu.
Rõ ràng so đối với bài toán tối ưu 1 mục tiêu, việc tìm nghiệm của bài toán
tối ưu nhiều mục tiêu khó khăn hơn rất nhiều và đại đa số, chúng ta không thể xác
định được phương án tối ưu thật sự.
Sau đây chúng ta sẽ nghiên cứu một số phương pháp giải bài toán tối ưu đa
mục tiêu.
1.3.1 Phương pháp ràng buộc
Xét bài toán
( )
12
( ) ( ), ( ), , ( ) ,
( ) ( , ) 0.
p
F X f X f X f X Min
GX
=®
> = = < =
Số hóa bởi trung tâm học liệu
7
Ta chuyển bài toán trên về bài toán
( ) ax,
( ) ,
1,2, , 1, , 1, , .
h
kk
f X M
f X L
k h h h p
®
³
= - +
Trong đó mục tiêu thứ h được chọn tùy ý để lấy Max .
Như vậy bài toán đa mục tiêu đã được chuyển về bài toán đơn mục tiêu và có
thể áp dụng các thuật toán thông thường ví dụ như thuật toán đơn hình. Thuật toán
trên được giải bằng phương pháp xây dựng bảng thỏa hiệp các hàm mục tiêu và từ
đó xác định phương án tối ưu.
Thuật toán:
Bước 1: Xây dựng bảng thỏa hiệp
+ Giải lần lượt p các bài toán đơn mục tiêu tương ứng với các ràng buộc. Gọi
nghiệm của mục tiêu thứ k là
( )
1
, , , 1,2, ,
k k k
n
x x x k p==
. Sau đó tính giá trị
của p hàm mục tiêu đạt được tại các
k
x
tương ứng. Kí hiệu là
1 1 2 2
( ), ( ), , ( )
k k k
pp
f x f x f x
.
+ Sắp xếp p giá trị ứng với p mục tiêu vừa tính được ở trên vào bảng thỏa hiệp.
1
()
k
fx
2
()
k
fx
……
()
k
p
fx
1
x
1
1
()fx
1
2
()fx
1
()
p
fx
2
x
2
1
()fx
2
2
()fx
2
()
p
fx
….
….
….
….
p
x
1
()
p
fx
2
()
p
fx
()
p
p
fx
+ Xác định số lớn nhất và nhỏ nhất trọng cột thứ k, kí hiệu lần lượt là
, ,( 1,2, , ).
kk
M m k p=
Bước 2: Quy ước một bài toán đa mục tiêu tương ứng với bài toán một mục tiêu
Bước 3: Chọn giá trị
k
L
với
kh¹
trong đoạn
,
kk
mM
éù
êú
ëû
bằng cách chia
đoạn
,
kk
mM
éù
êú
ëû
ra r phần bằng nhau. Khi đó
k
L
có thể nhận 1 trong r giá trị sau
Số hóa bởi trung tâm học liệu
8
( ), 0,1,2, , 1
1
k k k k
t
L n M m t r
r
= + - = -
-
.
Bước 4: Ứng với mỗi giá trị của
k
L
, ta giải bài toán đơn mục tiêu tương ứng
và mỗi bài toán cho một nghiệm chấp nhận được. Trong những nghiệm này ta sẽ
chọn nghiệm tối ưu nhất.
1.3.2 Phương pháp tổng trọng số
( )
12
( ) ( ), ( ), , ( ) ,
( ) ( , ) 0.
p
F X f X f X f X Min
GX
=®
> = = < =
Ta chuyển bài toán trên thành bài toán
1 1 2 2
( ) w ( ) w ( ) w ( ) ,
( ) ( , ) 0.
pp
F X f X f X f X Min
GX
= + + + ®
> = = < =
Trong đó
1
w 0,( 1,2, , ), w 1.
p
ii
i
ip
=
³ = =
å
1.3.3 Phương pháp nhượng bộ dần
Bước 1: Giải
k
bài toán 1 mục tiêu riêng rẽ, sau đó lập bảng thưởng phạt
Bước 2: Căn cứ vào bảng thưởng phạt, với giá trị
0
1
Y
, ta buộc
1
Y
nhượng bộ một
lượng
1
YD
và giải bài toán:
2
ax ( )M Y X
với
0
1 1 1
; ( )X D Y X Y YÎ ³ - D
Giả sử
*
2
Y
là giá trị tối ưu của bài toán này, chuyển sang bước 3
Bước 3: Căn cứ vào
0
2
Y
và
*
2
Y
buộc
2
Y
nhượng bộ lượng
2
YD
và giải bài toán:
3
ax ( )M Y X
với
0*
1 1 1 2 2 2
; ( ) ; ( ) ;X D Y X Y Y Y X Y YÎ ³ - D ³ - D
Giả sử
*
3
Y
là giá trị tối ưu của bài toán này, chuyển sang bước tiếp
…………
Bước k: Căn cứ vào
0
1k
Y
-
và
*
1k
Y
-
buộc Y
k-1
nhượng bộ lượng
1k
Y
-
D
và giải bài toán:
ax ( )
k
M Y X
với
0 * *
1 1 1 2 2 2 1 1 1
; ( ) ; ( ) ; ; ( ) ;
k k k
X D Y X Y Y Y X Y Y Y X Y Y
- - -
Î ³ - D ³ - D ³ - D
Nghiệm của bài toán cuối cùng này được lấy làm nghiệm của bài toán ban đầu.
Số hóa bởi trung tâm học liệu
9
1.3.4 Phương pháp thoả hiệp
Bước 1: Giải k bài toán 1 mục tiêu riêng rẽ, giả sử nghiệm tối ưu là
( 1,2, . )
i
X i k=
.
Đặt
()
i i i
M Y X=
và đưa vào biến phụ
w
:
()
W
i i i
i
M Y X
M
-
£
với mọi
1,2, , .ik=
Vế trái trong công thức trên gọi là độ lệch tương đối chung
Bước 2: Giải bài toán
(w)Min
với
XDÎ
từ đó tìm được nghiệm tối ưu
opt
X
và
w
opt
Trong trường hợp này, lợi ích tỷ lệ với độ lệch tương đối, phương án
1
X
là tốt
hơn
2
X
nếu độ lệch tương đối chung của
1
X
nhỏ hơn của
2
X
.
1.3.5 Phương pháp tìm nghiệm có khoảng cách nhỏ nhất đến nghiệm lý tưởng
Phương pháp này giả định có một nghiệm lý tưởng,
1
X
là tốt hơn
2
X
nếu
khoảng cách từ
1
X
đến nghiệm lý tưởng nhỏ hơn khoảng cách tương ứng của
2
X
Định nghĩa: Giả sử
1
X
,
2
X
Î
R
n
, khoảng cách giữa
1
X
và
2
X
là số
d
a
xác định bởi
12
ii
d X X
a
a
=-
å
a
là tham số
a
>1
Khi đó bài toán
ax( ( ))M Y X
với
XDÎ
đưa về bài toán
{ }
*
min ( )
ii
Y X Y
a
-
å
Vấn đề xác định tham số
a
phụ thuộc vào từng bài toán.
1.3.6 Phương pháp giải theo dãy mục tiêu đã được sắp
Trong phương pháp này, thứ tự của các hàm mục tiêu thể hiện sự quan trọng
của các tiêu chuẩn, các mục tiêu xếp trước được ưu tiên hơn.
Bước 0: Sắp xếp thứ tự các mục tiêu
12
, , ,
k
Y Y Y
Bước 1: Giải bài toán
1
ax( ( ))M Y X
với
XDÎ
, ký hiệu
{ }
1 1 1
11
( ) axY ( ),D X Y X m X X D D= = Î Í
Số hóa bởi trung tâm học liệu
10
Bước 2: Giải bài toán
2
ax( ( ))M Y X
với
1
XDÎ
, ký hiệu
{ }
2 2 2 1 1
22
( ) axY ( ),D X Y X m X X D D= = Î Í
…
Bước k: Giải bài toán
ax( ( ))
k
M Y X
với
1k
XD
-
Î
, ký hiệu
{ }
11
k
( ) axY ( ),
k k k k k
k
D X Y X m X X D D
= = Î Í
Ta có dãy bao hàm thức:
1
k
D D DÊ Ê Ê
. Khi đó tập các nghiệm thuộc
k
D
sẽ
thỏa mãn tính chất tối ưu của bài toán đa mục tiêu.
1.3.7 Phương pháp từng bước của Benayoun
Phương pháp này gần giống phương pháp tìm nghiệm xấp xỉ nghiệm lý
tưởng. Thường có hai biến dạng sau:
- Các độ lệch tương đối của hàm mục tiêu được gắn với một bộ trọng số.
Trọng số này được xác định dựa trên khoảng biến động của từng mục tiêu.
- Miền chấp nhận được của nó có thể thay đổi qua các bước giải
Hàm lợi ích và các quan hệ xác định như phương pháp tìm nghiệm xấp xỉ
nghiệm lý tưởng.
Bài toán cơ bản mà phương pháp này xét là:
*
()
i i i
M Y X d
a
-£
Õ
i
XDÎ
trong đó
ax( ( ))
ii
M M Y X=
Thuật toán như sau:
Bước 1: Tính thưởng phạt, xác định
,
ii
Mm
ở cột thứ i
ax( ( ))
ii
M M Y X=
,
( ( ))
ii
m Min Y X=
Bước 2: Tìm các trọng số, xác định
i
a
để tính
i
Õ
:
1
12
1
1
*
()
ii
i
n
j
j
Mm
M
C
Với
i
j
C
là các hệ số của hàm mục tiêu thứ i. Đặt i=0 chuyển sang bước 3
Số hóa bởi trung tâm học liệu
11
Bước 3: Tính
1
1
i
Bước 4: Giả sử nghiệm của bài toán thứ i là
()Xi
và
1ik£-
Xét các trường hợp:
1) Nếu chấp nhận
()Xi
thì kết thúc.
2) Nếu không chấp nhận
()Xi
và
1ik£-
thì chuyển Bước 5
3) Nếu không chấp nhận
()Xi
và
ik=
thì tìm phương án giải khác.
Bước 5: Phân tích kết quả và tìm ra mục tiêu
*
i
có thể nhượng bộ, cho nhượng bộ
một lượng
*
i
D
chuyển Bước 6
Bước 6: Xác định miền chấp nhận mới
1i
D
+
1i
XD
( ) ( )
II
Y X Y X i
*
ii¹
*
*
( ) ( )
Ii
I
Y X Y X i
Coi
*
*
00
I
I
Với
*
ii¹
thì tính
i
theo công thức trên.
1.ii=+
Chuyển về Bước 3
Thuật toán kết thúc sau k lần lặp
1.3.8 Phương pháp trọng số
Trong phương pháp này hàm lợi ích U tuyến tính theo các giá trị của phương án
( ( )) ; ( ) ( )
ii
U Y X p Y X pY X
Bài toán quy hoạch đa mục tiêu ở dạng này là: max
()
ii
pY X
với
( 1,2, , )
i
p i k=
là các trọng số; thường xét với
i
p
không âm và
1
i
p
.
Số hóa bởi trung tâm học liệu
12
Về mặt thực tiễn, có thể xem các trọng số
i
p
là
tỷ lệ quy đổi thứ nguyên của
mục tiêu thứ i. Chẳng hạn quy đổi tất cả các mục tiêu về dạng tiền tệ thì
i
p
biểu
hiện cho số đơn vị tiền tệ của mục tiêu thứ i. Đây cũng là phương pháp quy đa mục
tiêu về một mục tiêu phụ thuộc tham số.
Kết luận: Nội dung chương 1 đã trình bày một số kiến thức cơ bản về mô
hình của bài toán tối ưu tổng quát, mô hình của bài toán tối ưu đa mục tiêu cùng
một số phương pháp giải. Các kiến thức này là cơ sở để trình bày các kết quả trong
chương 2 và chương 3 của luận văn.
Số hóa bởi trung tâm học liệu
13
CHƢƠNG 2
CƠ SỞ THUẬT TOÁN DI TRUYỀN
Trong chương 2, luận văn sẽ trình bày các kiến thức cơ bản về lĩnh vực tính
toán mềm bao gồm thuật toán di truyền (GA) và thuật toán bầy đàn (PSO) giải các
bài toán đa mục tiêu. Các kiến thức về các thuật toán này được tham khảo từ các tài
liệu [3, 4, 5, 6, 7, 8, 9, 10].
Mở đầu
Trong công nghệ thông tin, GA là một thành phần của Tính toán tiến
hóa (Evolutionary computation – EC), một lĩnh vực được coi là có tốc độ phát triển
nhanh của trí tuệ nhân tạo. Có thể chia EC thành 5 hướng nghiên cứu như sau :
- GA (Genetic Algorithm - GA): Dựa vào quá trình di truyền trong tự nhiên
để cải tiến lời giải qua các thế hệ bắt nguồn từ một tập các lời giải ban đầu.
- Quy hoạch tiến hoá (Evolutionary Programming - EP): Dựa vào quy luật
tiến hoá, tìm phương pháp kết hợp đủ khả năng giải quyết trọn vẹn một bài toán từ
một lớp các phương pháp giải quyết được một số phần của bài toán.
- Các chiến lƣợc tiến hoá (Evolutionary Strategies - ES): Dựa trên một số
chiến lược ban đầu, tiến hoá để tạo ra những chiến lược mới phù hợp với môi
trường thực tế một cách tốt nhất.
- Lập trình di truyền (Genetic Programming - GP): Mở rộng GA trong lĩnh
vực các chương trình của máy tính. Mục đích của nó là để sinh ra một cách tự động
các chương trình máy tính giải quyết một cách tối ưu một vấn đề cụ thể.
- Các hệ thống phân loại (Classifier Systems- CS): Các GA đặc biệt được
dùng trong việc học máy và việc phát hiện các quy tắc trong các hệ dựa trên các
quy tắc.
GA cũng như các thuật toán tiến hoá đều được hình thành dựa trên một quan
niệm được coi là một tiên đề phù hợp với thực tế khách quan. Đó là quan niệm
"Quá trình tiến hoá tự nhiên là quá trình hoàn hảo nhất, hợp lý nhất và tự nó đã
mang tính tối ưu". Quá trình tiến hoá thể hiện tính tối ưu ở chỗ thế hệ sau bao giờ
cũng tốt hơn thế hệ trước.
Số hóa bởi trung tâm học liệu
14
Sự hình thành và phát triển của GA trên thế giới có thể được điểm qua các
mốc thời gian quan trọng như sau:
Năm 1960, ý tưởng đầu tiên về Tính toán tiến hoá được Rechenberg giới
thiệu trong công trình “Evolution Strategies” (Các chiến lược tiến hoá). Ý tưởng
này sau đó được nhiều nhà nghiên cứu phát triển.
Năm 1975, Giải thuật gen do John Holland phát minh và được phát triển bởi
ông cùng với các đồng nghiệp và những sinh viên. Cuốn sách "Adaption in Natural
and Artificial Systems" (Sự thích nghi trong các hệ tự nhiên và nhân tạo) đã tổng
hợp các kết quả của quá trình nghiên cứu và phát triển đó.
Năm 1992, John Koza đã dùng GA để xây dựng các chương trình giải quyết
một số bài toán và gọi phương pháp này là “lập trình gen”.
Ngày nay GA càng trở nên quan trọng, đặc biệt là trong lĩnh vực tối ưu hoá,
một lĩnh vực có nhiều bài toán thú vị, được ứng dụng nhiều trong thực tiễn nhưng
thường khó và chưa có giải thuật hiệu quả để giải .
2.1 Các khái niệm cơ bản
2.1.1 Cá thể, nhiễm sắc thể
Trong GA, một cá thể biểu diễn một phương án của bài toán. Trong trường
hợp tổng quát, một cá thể có nhiều NST (NST), ở đây ta quan niệm một cá thể chỉ
có một NST. Do đó khái niệm cá thể và NST trong GA coi như là tương đương.
Một NST được tạo thành từ nhiều gen, mỗi gen có thể có các giá trị khác nhau để
quy định một tính trạng nào đó. Trong GA, một gen được coi như một phần tử trong
chuỗi NST.
2.1.2 Quần thể
Quần thể là một tập hợp các cá thể có cùng một số đặc điểm nào đấy. Trong
GA ta quan niệm quần thể là một tập các lời giải của một bài toán.
2.1.3 Chọn lọc (Selection)
Trong tự nhiên, quá trình chọn lọc và đấu tranh sinh tồn đã làm thay đổi các cá
thể trong quần thể. Những cá thể tốt, thích nghi được với điều kiện sống thì có khả
năng đấu tranh lớn hơn, do đó có thể tồn tại và sinh sản. Các cá thể không thích
Số hóa bởi trung tâm học liệu
15
nghi được với điều kiện sống thì dần mất đi. Dựa vào nguyên lý của quá trình chọn
lọc và đấu tranh sinh tồn trong tự nhiên, chọn lựa các cá thể trong GA chính là cách
chọn các cá thể có độ thích nghi tốt để đưa vào thế hệ tiếp theo hoặc để cho lai
ghép, với mục đích là sinh ra các cá thể mới tốt hơn. Có nhiều cách để lựa chọn
nhưng cuối cùng đều nhằm đáp ứng mục tiêu là các cá thể tốt sẽ có khả năng được
chọn cao hơn.
2.1.4 Lai ghép (Cross-over)
Lai ghép trong tự nhiên là sự kết hợp các tính trạng của bố mẹ để sinh ra thế
hệ con. Trong GA, lai ghép được coi là một sự tổ hợp lại các tính chất (thành phần)
trong hai lời giải cha mẹ nào đó để sinh ra một lời giải mới mà có đặc tính mong
muốn là tốt hơn thế hệ cha mẹ. Đây là một quá trình xảy ra chủ yếu trong GA.
2.1.5 Đột biến (Mutation)
Đột biến là một sự biến đổi tại một (hay một số) gen của NST ban đầu để tạo
ra một NST mới. Đột biến có xác suất xảy ra thấp hơn lai ghép. Đột biến có thể tạo
ra một cá thể mới tốt hơn hoặc xấu hơn cá thể ban đầu. Tuy nhiên trong GA thì ta
luôn muốn tạo ra những phép đột biến cho phép cải thiện lời giải qua từng thế hệ.
2.1.6 Mô hình GA
Với các khái niệm được giới thiệu ở trên, GA được mô tả bởi sơ đồ sau đây
Nhận các tham số
của bài toán
Khởi tạo quần thể
ban đầu
Tính giá trị thích nghi
Sinh sản
Lai ghép
Đột biến
Điều kiện
dừng
Kết
thúc
Bắt đầu
Lựa chọn giải pháp tốt
nhất
Hình 2.1: Sơ đồ mô tả GA
Số hóa bởi trung tâm học liệu
16
1. Xác lập các tham số ban đầu của bài toán.
2. Khởi tạo: Sinh ngẫu nhiên một quần thể gồm n cá thể (là n lời giải ban
đầu của bài toán).
3. Xác lập quần thể mới: tạo quần thể mới bằng cách lặp lại các bước sau
cho đến khi quần thể mới hoàn thành, bao gồm:
3.1 Tính độ thích nghi của mỗi cá thể.
3.2 Kiểm tra điều kiện kết thúc giải thuật.
3.3 Chọn lọc các cá thể bố mẹ từ quần thể cũ theo độ thích nghi của chúng
(cá thể có độ thích nghi càng cao thì càng có nhiều khả năng được chọn).
3.4 Tiến hành lai ghép các cặp bố-mẹ với một xác suất lai ghép được chọn để
tạo ra một cá thể mới.
3.5 Tiến hành đột biến với xác suất đột biến được chọn xác định cá thể đột biến.
4. Kiểm tra điều kiện dừng: Nếu điều kiện được thỏa mãn thì thuật toán kết
thúc và trả về lời giải tốt nhất chính là quần thể hiện tại.
2.1.7 Các tham số của GA
1. Kích thƣớc quần thể
Kích thước quần thể cho biết có bao nhiêu cá thể trong một quần thể (trong
một thế hệ). Qua các nghiên cứu cũng như các thử nghiệm đã cho thấy kích thước
quần thể không nên quá bé cũng như không quá lớn. Nếu có quá ít cá thể thì ít có
khả năng thực hiện lai giống và chỉ một phần nhỏ không gian tìm kiếm được dùng.
Như vậy sẽ dễ xảy ra trường hợp bỏ qua các lời giải tốt. Nhưng quá nhiều cá thể
cũng không tốt vì GA sẽ chạy chậm đi, ảnh hưởng đến hiệu quả của giải thuật. Các
nghiên cứu cũng đã chỉ ra không có lợi khi tăng kích thước quần thể lên quá một
giới hạn cho phép.
2. Xác suất lai ghép
Xác suất lai ghép cho biết việc lai ghép tạo ra thế hệ mới được thực hiện
thường xuyên như thế nào. Nếu xác suất lai ghép là p
c
, khi đó khả năng để một cá
thể được lai ghép là p
c
. Nếu không thực hiện lai ghép, con sinh ra sẽ giống hoàn
toàn bố mẹ. Nếu được lai ghép, con sinh ra sẽ có một phần giống bố và một phần
giống mẹ.
Số hóa bởi trung tâm học liệu
17
3. Xác suất đột biến
Xác suất đột biến cho biết các gen của NST thay đổi thường xuyên như thế
nào. Nếu xác suất đột biến là p
m
, khi đó khả năng để mỗi gen của một NST bất kỳ bị
đột biến là p
m
. Toán tử đột biến có tác dụng ngăn ngừa GA rơi vào tình trạng cực trị
địa phương, tuy nhiên nếu thực hiện đột biến với xác suất quá cao sẽ biến GA thành
giải thuật tìm kiếm ngẫu nhiên.
Nhận xét:
Xuất phát từ sơ đồ thực hiện GA, chúng ta có thể có một số nhận xét như sau:
+ GA lập luận mang tính chất ngẫu nhiên để tìm giải pháp tối ưu cho những
vấn đề phức tạp, thay vì xác định như toán học giải tích. Tuy nhiên đây là hình thức
ngẫu nhiên có hướng dẫn bởi trị số thích nghi. Chính hàm thích nghi giúp GA tìm
giải pháp tối ưu trong rất nhiều giải pháp có thể có.
+ GA không để ý đến chi tiết vấn đề, trái lại chỉ chú ý đến giải pháp cho vấn đề,
hay tìm điều kiện tối ưu cho việc điều hành và phân nhóm những giải pháp có được.
+ GA được sử dụng đặc biệt cho những bài toán yêu cầu tìm kiếm tối ưu toàn
cục với không gian tìm kiếm lớn và không thể kiểm soát nhờ khả năng duyệt qua
không gian tìm kiếm đại diện mà không thực sự đi qua từng điểm của toàn bộ
không gian.
2.2 Cơ chế thực hiện GA
2.2.1 Mã hóa
Để có thể thực hiện GA, vấn đề đầu tiên là xuất phát từ bài toán thực tế, ta
cần phải mô tả các phương án của bài toán dưới một dạng nào đó (mô hình toán
học, tin học, …). Vấn đề mô tả đó được gọi là các phương pháp mã hóa. Thông
thường người ta sử dụng một trong các phương pháp như sau:
+ Mã hoá nhị phân
Mã hoá nhị phân là phương pháp mã hoá NST phổ biến nhất. Trong mã hoá
nhị phân, mỗi NST là một chuỗi nhị phân, mỗi bit trong nó có thể biểu diễn một đặc
tính của nghiệm.
Số hóa bởi trung tâm học liệu
18
Mã hoá nhị phân thường hay dùng trong các bài toán tối ưu các hàm một biến
hay nhiều biến. Khi đó, mỗi chuỗi nhị phân sẽ biểu diễn hàm tại một tập giá trị của
các biến. Ngoài ra nó còn được áp dụng trong nhiều loại bài toán khác.
Mã hoá nhị phân tuy là phổ biến nhưng nó có một nhược điểm là có thể tạo ra
không gian mã hoá lớn hơn so với không gian giá trị của NST. Do đó, với nhiều bài
toán thì biểu diễn nhị phân là không hữu hiệu.
+ Mã hoá hoán vị
Trong mã hoá hoán vị, mỗi NST là một chuỗi các số biểu diễn một thứ tự sắp
xếp. Mã hoá hoán vị phù hợp cho các bài toán liên quan đến thứ tự. Đối với các bài
toán này, việc thao tác trên các NST chính là hoán vị các số trong chuỗi đó làm thay
đổi thứ tự của nó. Mã hoá hoán vị có thể được sử dụng trong các bài toán liên quan
đến thứ tự như bài toán du lịch hay bài toán lập lịch.
+ Mã hoá số thực
Mã hoá trực tiếp theo giá trị có thể được dùng trong các bài toán sử dụng giá
trị phức tạp như trong số thực. Trong đó, mỗi NST là một chuỗi các giá trị. Các giá
trị có thể là bất cứ cái gì liên quan đến bài toán, từ số nguyên, số thực, kí tự cho đến
các đối tượng phức tạp hơn.
Mã hoá số thực thường dùng cho các bài toán đặc biệt. Trong cách mã hoá
này ta thường phải phát triển các toán tử đột biến và lai ghép cho phù hợp với từng
bài toán. Thông thường mỗi NST được mã hóa là một véc tơ trong không gian.
Cách mã hóa này thường sử dụng đối với các bài toán tối ưu số và được phát triển
mạnh trong giai đoạn hiện nay.
+ Mã hóa dạng cây
Phương pháp này được sử dụng trong các biểu thức toán học. Mỗi NST là
một cây của một nhóm đối tượng nào đó.
2.2.2 Khởi tạo quần thể ban đầu
Khởi tạo quần thể ban đầu là bước đầu tiên trong GA. Thông thường để khởi
tạo quần thể trong bài toán tối ưu, ta tạo ra một cách ngẫu nhiên các lời giải có thể
(thường là các lời giải thỏa mãn ràng buộc của bài toán nhưng chưa biết là đại