Chương 4.
Các toán tử và kỹ thuật nâng
cao trong thuật giải di truyền
Nhóm 12
Lớp Hệ thống thông tin – K20
GVHD: TS. Lê Hoàng Thái
Thành viên nhóm
Nguyễn Văn Phúc MSHV: 10 20 030
email:
Phan Thị Thanh Nga MSHV: 10 20 021
email:
Nguyễn Tâm Duy MSHV: 10 20 006
email:
Trương Anh Tuấn MSHV: 10 20 057
email:
2
Lý do chọn đề tài
Tìm hiểu một số toán tử và kỹ thuật mới trong
thuật giải di truyền.
Củng cố lại các kiến thức đã học
3
Nội dung chính
Thể lưỡng bội, tính trạng trội, thể đa bội
Các toán tử đảo và tái thiết lập trật tự
•
PMX, OX, CX
Một số toán tử vi mô
•
Chia tách và dịch chuyển
•
Sao chép và xóa
Vùng thích nghi và sự hình thành loài
Các cách biểu diễn NST khác nhị phân
Tối ưu nhiều mục tiêu
Tối ưu tổ hợp
Các kỹ thuật dựa trên tri thức
Minh họa một số bài toán
4
Thể lưỡng bội
Mỗi gen gồm một cặp alen, chứa cùng thông
tin cho một chức năng.
Thể trội: một alen là trội nếu nó được biểu
hiện khi đi cặp với một vài alen khác, nghĩa là
được biểu hiện lên kiểu hình.
Nếu điều kiện môi trường thay đổi, sự trội có
thể thay đổi, do đó một alen khác sẽ là trội.
5
Thể lưỡng bội
Xem xét cấu trúc nhiễm sắc thể lưỡng bội sau
Nếu giả sử tất cả các kí tự hoa là trội và tất cả
các kí tự thường là lặn thì kiểu hình được biểu
thị của nhiễm sắc thể sẽ là:
6
Thể lưỡng bội
Thuận lợi chính của lưỡng bội là nó cho phép
sự đa dạng rộng lớn hơn cuả các alen được
giữ lại trong quần thể.
Lưỡng bội hữu dụng khi xây dựng các ứng
dụng trực tuyến lớn, các hệ thống lớn có thể
chuyển giữa các trạng thái khác nhau.
7
Thể đa bội
Một gen chứa nhiều alen khác nhau.
Sử dụng một vài cơ chế dạng trội để quyết
định gen nào sẽ được biểu hiện lên kiểu hình
Đa bội nâng cao tính đa dạng của quần thể.
Các gen lặn vẫn được giữ lại và sẽ trở nên hữu
dụng khi điều kiện sống thay đổi
8
Thể đa bội
9
Toán tử đảo và tái thiết lập trật tự
Thuật toán lựa chọn hai điểm ngẫu nhiên sau đó đột biến
để tăng số lượng khối kiến trúc trong quần thể.
Một số biến thể của toán tử đảo
•
Đảo tuyến tính
•
Đảo tuyến tính + Đảo cuối
•
Đảo liên tục và đảo khối
10
Một số kiểu lai ghép
Lai PMX (Lai ghép so khớp từng phần)
Xét cặp NST bố mẹ
Con cái
11
Một số kiểu lai ghép
Lai OX (Lai ghép thứ tự)
Xét cặp NST bố mẹ
Con cái
12
Một số kiểu lai ghép
Lai CX (Lai chu trình)
Xét cặp NST bố mẹ
Con cái
13
Một số toán tử vi mô
Chia tách (segregation)
Chuyển dịch (translocation)
Sao chép (duplication)
Xóa (deletion)
Sexual differentiation
14
Chia tách và chuyển dịch
Sử dụng trong lai ghép các cá thể có nhiễm sắc thể đa bội.
Mỗi nhiễm sắc thể đơn được chọn 1 cách ngẫu nhiên, gọi là
chia tách.
Toán tử dịch chuyển có vai trò nối các gen tương ứng trong quá
trình lai ghép
Ví dụ: Cho 2 cặp NST sau:
NST Bố NST Mẹ NST Con
PqrtS pqrTS PqrtS
pQrTSpQRTs pQRTs
15
Sao chép, xóa và xác định giới tính
Sự sao chép trong nội bộ NST thực hiện bằng cách nhân bản
một gen nào đó sang một gen khác trong NST.
Việc xóa được thực hiện bằng cách loại bỏ một gen trùng khỏi
NST.
Xác định giới tính (sex determination) là việc kết cặp bất kỳ hai
cá thể sao cho kết quả di truyền tạo ra bảo đảm một kiểu gen
có khả năng sống được (viable genotype).
Xác định giới tính được xử lý khác nhau trong các loài khác
nhau.
16
Vùng thích nghi và sự hình thành loài
Mục đích
–
Chọn lọc cá thể độ thích nghi cao
–
Cá thể tương đồng hội tụ cùng nhau
–
Đẩy nhanh quá trình tiến hóa quần thể
–
Thực hiện trên các cơ chế song song
17
Crowding và Sharing
trong bài toán đa phương thức
Cố gắng duy trì quần thể cân bằng
Ngăn chặn 1 kiểu gen duy nhất chiếm cả quần thể.
Khuyến khích việc hình thành vùng thích nghi và loài trong
quần thể.
Ngăn chặn cá thể từ vùng thích nghi khác nhau cặp đôi
Sharing tích cực phát triển nên vùng thích nghi mới, và phân
phối các cá thể qua tất cả các đỉnh trong không gian.
Tuy nhiên, chi phí cho việc tính toán và thực hiện Sharing
tương đối tốn kém.
18
Vùng thích nghi và sự hình thành loài trong
bài toán đơn phương thức
Có một số phương pháp thay thế đảm bảo cá thể mới
sinh ra đủ khác so với phần còn lại của quần thể:
•
Ngăn chặn sao chép (clone prevention): trước khi một cá thể
được phép nhập vào quần thể, nó được so sánh với mọi cá
thể khác trong quần thể.
•
Ngăn chặn sự loạn luân (incest prevention): cố mai mối cặp
bố mẹ với ý định các con của chúng sẽ lấy các gen tốt nhất từ
bố mẹ chúng. Đó là kết hợp các bố mẹ khác nhau sao cho
tính đa dạng vẫn được giữ trong quần thể.
19
Vùng thích nghi và sự hình thành loài trong
bài toán đơn phương thức
Cho phép bố mẹ kết đôi khi thỏa điều kiện nhất định
Việc sinh sản cho phép sự tiến hóa của các vùng thích nghi khác nhau
SET THRESHOLD
REPEAT
FOR EACH INDIVIDUAL DO
TEST INDIVIDUAL
ENTER PARENT POPULATION
IF NO-NEW-PARENTS THEN
LOWER THRESHOLD
FOR EACH INDIVIDUAL DO
REPEAT
SELECT PARENTS
UNTIL DIFFERENT ( )
UNTIL END-CRITERION REACHED OR THRESHOLD=0
20
Thuật giải pygmy
Thường dùng trong các bài toán 2 hay nhiều yêu cầu
Dùng 2 hàm thích nghi riêng biệt vì thế tạo ra 2 hình
thái (loài) khác nhau
Không tính độ khác nhau giữa bố mẹ, mà chỉ cần biết
cặp bố mẹ được chọn là khác nhau
Việc sử dụng 2 vùng thích nghi duy trì quần thể cân
bằng và đảm bảo các cá thể phù hợp yêu cầu được
sinh ra
21
Thuật giải pygmy
REPEAT
FOR EACH INDIVIDUAL DO
TEST INDIVIDUALWITH MAIN FITNESS FUNCTION
ENTER PARENT POPULATION #1
IF UNSUCCESSFUL
TEST INDIVIDUALWITH SECONDARY FITNESS FUNCTION
ENTER PARENT POPULATION #2
FOR EACH INDIVIDUAL DO
SELECT PARENT FROM POPULATION #1
SELECT PARENT FROM POPULATION #2
CREATE NEW INDIVIDUALS
UNTIL END-CRITERION REACHED
22
Kết cặp có giới hạn (restricted mating)
Khuyến khích sự hình thành loài và giảm khả năng sinh sản chết.
Một cá thể chết là một con của cặp bố mẹ từ hai vùng thích nghi khác nhau.
Nếu có 2 bố mẹ tương tự nhau (cùng vùng thích nghi) được giao phối thì con
cái tương tự nhau. Tuy nhiên còn phụ thuộc nhiều vào sơ đồ mã hóa đặc
biệt là sự tồn tại của khối kiến trúc.
Các phép lai và đột biến các cặp bố mẹ tương đương kiểu gen sẽ luôn sinh ra
các con có cùng kiểu gen. Nhưng không có gì đảm bảo rằng con cái không có
độ thích nghi thấp => chúng dễ chết.
Sự tương tự về kiểu gen không bảo đảm sự tương tự về kiểu hình.
23
Một số cách biễu diễn NST khác
Biểu diễn số dấu chấm động, ký tự
Các toán tử kết hợp
•
Trung bình: Lấy trung bình số học của hai gen bố mẹ.
•
Nghĩa hình học: lấy căn bậc hai của tích hai giá trị.
•
Mở rộng: Lấy độ khác nhau giữa hai giá trị và cộng nó vào giá trị cao hơn
hoặc trừ nó khỏi giá trị thấp hơn
Các toán tử đột biến
•
Thay thế ngẫu nhiên: Thay thế bởi các giá trị ngẫu nhiên
•
Creep: Cộng hoặc trừ một lượng nhỏ được sinh ngẫu nhiên
•
Geometric creep: Nhân với một số ngẫu nhiên gần với 1.
24
Tối ưu nhiều mục tiêu
Có nhiều mục tiêu cần được tối ưu hóa đồng thời
Không nhất thiết phải có giải pháp tối ưu nhất đối với mọi
mục tiêu
Một giải pháp có thể là tốt nhất đối với mục tiêu này nhưng
lại tệ nhất đối với mục tiêu khác
Muốn cải thiện một hàm mục tiêu thì phải hy sinh ít nhất
một trong các hàm mục tiêu khác.
Vấn đề chính trong việc giải các bài toán tối ưu đa mục tiêu
dùng GA là làm thế nào để xác định giá trị thích nghi của
các cá thể theo nhiều mục tiêu.
25