Chuyên Đề Nghiên Cứu 7 - Tin Sinh Học.
Giảng Viên: Ngô Công Thắng.
Sinh viên thực hiện: Nguyễn Hồng Kiên.
Lớp: Tin học A-K52.
Khoa: Công Nghệ Thông Tin.
Mã Sinh Viên: 521996.
Chuyên Đề Nghiên Cứu 7 - Tin Sinh Học.
Nội Dung:
Nhóm 2:
Nhóm 2: Tìm hiểu bài toán so sánh cặp trình tự:
a. Nội dung và ý nghĩa sinh học của bài toán so sánh cặp
trình tự.
b. Thuật toán ma trận điểm.
d. Thuật toán quy hoạch động Needleman-Wunsch.
Nội dung
Tìm hiểu bài toán so sánh cặp trình tự:
1. Nội dung và ý nghĩa sinh học của bài toán so sánh cặp
trình tự.
2. Thuật toán ma trận điểm.
3. Thuật toán quy hoạch động Needleman-Wunsch.
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự.
-
Định nghĩa: so sánh trình tự là quá trình nghiên cứu sự
giống nhau giữa các chuỗi trình tự(sequence),
-
là cách thức so sánh giữa 2 hay nhiều trình tự dựa trên
việc so sánh một chuỗi các thành phần(ký tự) của trình
tự để tìm ra những điểm tương đồng, giống nhau giữa
các trình tự.
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự.
- Cho 2 chuỗi sinh học S1,S2. Gióng cặp chuỗi này được thực hiện
bằng cách chèn thêm vào hai chuỗi S1 và S2 các dấu cách (kí
hiệu là ”-”) tại các vị trí bất kỳ với số lượng không hạn chế để
tạo ra 2 chuỗi S1’ và S2’ tương ứng, sau đó đặt một chuỗi trên
chuỗi kia sao cho môi kí tự của chuỗi này gióng thẳng với một
kí tự của chuỗi kia và cặp trình tự gióng không đồng thời là dấu
cách.
- Chuỗi sinh học ban đầu không có dấu cách và nếu loại bỏ dấu
khỏi S1’ và S2’ ta sẽ có S1 và S2 ban đầu.
- Yêu cầu đặt ra là thực hiện bài toán sao cho tìm ra cặp chuỗi S1’,
S2’ có sự tương đồng cao nhất.
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự
Dựa trên phương pháp so sánh người ta chia ra làm 2 loại:
- Phép so sánh trình tự theo hướng toàn cục: Phép toán so sánh
được áp dụng trên toàn bộ chuỗi trình tự. Thường được sử
dụng khi các trình tự so sánh có kích thước gần tương
đương và các trình tự này có độ tương đồng, giống nhau
cao.
-
Phép so sánh trình tự theo hướng cục bộ:
+ Phép toán so sánh được sử dụng trên một phần của chuỗi
trình tự.
+ Thường được sử dụng khi các trình tự có chiều dài lớn, độ
tương đồng giống nhau không cao, chỉ có một số ít các gene
giống nhau trên 2 trình tự, hoặc khi 2 trình tự có kích thước
khác biệt lớn.
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự
Tùy thuộc vào số lượng trình tự, bài toán so sánh
trình tự được chia làm 2 mức độ:
- So sánh 2 trình tự
- So sánh nhiều trình tự.
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự.
- Ví dụ về so sánh trình tự theo hướng toàn cục:
Toàn bộ 2 chuỗi trình tự
L G P S S K Q T G K G S − S R I W D N
và L N − I T K S A G K G A I M R L G D A
được so sánh
L G P S S K Q T G K G S − S R I W D N
L N − I T K S A G K G A I M R L G D A
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự
- Ví dụ về so sánh trình tự theo hướng cục bộ:
Chỉ một phần của 2 chuỗi được so sánh: TGKG và AGKG
− − − − − − − T G K G − − − − − − − −
− − − − − − − A G K G − − − − − − − −
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự
- Ví dụ so sánh 2 trình tự:
- Ví dụ so sánh nhiều trình tự
A C – – G C T G
– C A T G – T –
A G T − G T G
A G T A G T G
− G T C G T G
− − T A G T G
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự
•
Ý nghĩa:
- Trên quan điểm sinh học, phép so sánh trình tự thể hiện
quá trình biến đổi chọn lọc tự nhiên của các chuỗi trình
tự, từ đó cho phép các nhà sinh học đưa ra kết luận về
nguồn gốc của các đoạn gene, DNA, RNA, hay protein.
- Mặt khác, cho phép ta xây dựng cây phát sinh chủng
loại, xây dựng cây tiến hóa từ đó đánh giá được mối
quan hệ giữa các loài.
1. Nội dung và ý nghĩa sinh học của bài toán
so sánh cặp trình tự
Nội dung
Tìm hiểu bài toán so sánh cặp trình tự:
1. Nội dung và ý nghĩa sinh học của bài toán so sánh cặp
trình tự.
2. Thuật toán ma trận điểm.
3. Thuật toán quy hoạch động Needleman-Wunsch.