Draft version - Confidential
Giáo trình Nmôn tin sinh
80
5.1.
ADN 5.1.1.
ADN
Hình 5.1.
Hình 5.1ADN
ADN
ADN 5.1.
Draft version - Confidential
Giáo trình Nmôn tin sinh
81
1
2
3
4
5
6
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
5.1: ADN
ADN
dài. ADN và Tinh tinh nuclêôtít, chui ADN ca Kh t
cha 5 nuclêôtít và chui ADN ca Khi nâu ch còn cha 4 nuclêôtít. Tóm li, quá
trình tin hóa s làm cho các chung khác nhau c v ni dung
dài.
Sp 5.1.2.
Sp hàng hai chui và ho chúng ta bit mi quan h gia hai chui
và . khác nhau, chúng ta
hành ADN
ADN.
nuclêôtít
ADN
ADN sau:
1.
2. Các nuclêôtít
nuclêôtít
3. i nào
4.
5.2 ADN
ADN
Draft version - Confidential
Giáo trình Nmôn tin sinh
82
1
2
3
4
5
6
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
5.2ADN h t
và Kh nâu. Ta thy có các bii v trí 1, 5 và 6.
, chúng ta d dàng nhn thy
n (5.3 minh
).
1
2
3
4
5
6
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
5.3ADN
5.1.3.
ng ta s tìm hiu cách nh m ging nhau ca m
chui sp hàng.
nuclêôtítnuclêôtít
Gi
là tp n chui ADN
;
nuclêôtítADN
Gi
ng, .
s.
Draft version - Confidential
Giáo trình Nmôn tin sinh
83
m ging nhau
ca mp hàng
t c các cp chu
pairs)
5.1
t
, và
c tính c th :
5.2
theo 5.1
dng , c th là:
5.3
sau:
5.4
Ví d: Vi ma trn m ging nhau :
nuclêôtít ;
nuclêôtít ;
nuclêôtít ;
tnh ADN
5.4
hàng
-
1
2
3
4
5
6
i
T
G
A
C
G
T
Draft version - Confidential
Giáo trình Nmôn tin sinh
84
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
-6
10
10
10
-6
0
18
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
-2
3
3
3
-9
0
-2
i
T
G
A
C
G
T
Tinh tinh
T
G
A
C
T
T
Kh t
C
G
A
C
T
Kh nâu
G
A
C
G
-6
3
3
3
-2
0
-2
5.4ADN
i 5.1.4.
chui
bt ( sp)
bt cp
sp hàng
bt cp là: , 5.5
(xem 5.5).
Draft version - Confidential
Giáo trình Nmôn tin sinh
85
XY =
AAAATTTT
TTTTGGGG
XYZ =
AAAATTTT
TTTTGGGG
AAAAGGGG
XZ =
AAAATTTT
AAAAGGGG
YZ =
AAAAGGGG
TTTTGGGG
5.5
sp hàng
3 bt cp , 5.6
, .
XY =
AAAATTTT
TTTTGGGG
XYZ = ?
XZ =
AAAATTTT
GGGGAAAA
YZ =
TTTTGGGG
GGGGAAAA
5.6: Ba bt cp
Draft version - Confidential
Giáo trình Nmôn tin sinh
86
5.2.
asp hàng
i.
ng
5.1 bao :
ba
ba là 0.
ba chui, nghim ta bài toán vi ba
chui tin t
và
c xây dng trên nghim t
Nghim ca bài toán vi ba chui tin t
ài toán vi ba chui tin t
Nghim ca bài toán vi ba chui tin t
Nghim ca bài toán vi ba chui tin t
Nghim ca bài toán vi ba chui tin t
Nghim ca bài toán vi ba chui tin t
Nghim ca bài toán vi ba chui tin t
d liu vào.
Draft version - Confidential
Giáo trình Nmôn tin sinh
87
Thut ba chui ADN
D liu vào: Ba chui ADN
; Ma
trn m th hin m ging nhau gia các kí t thuc tp kí t
Yêu cu: Sp hàng ba chui và tm ging nhau là ln nht.
D liu ra: Ba chui , và là kt qu ca vic sp hàng.
ng: Gi
: Chui tin t gm i nuclêôtít u tiên ca ;
: Chui tin t gm j nuclêôtít u tiên ca .
: Chui tin t gm v nuclêôtít u tiên ca .
ba
.
s
ba
Ta thba nuclêôtít
:
nh
5.5
t
m ging nhau khi sp 3 kí t
Draft version - Confidential
Giáo trình Nmôn tin sinh
88
vào cùng mt ct trên ba chui sp hàng.
.
,
theo 5.5.
s là nghim tt nht ca bài toán cho ba chui
. ng thc hin chèn các d chui
c ba chui sp hàng , và
5.1: Thut toán quy hong gii quy
ADN.
5.7.
1
2
3
4
5
6
T
G
A
C
G
T
T
G
A
C
T
T
C
G
A
C
T
0
6
6
6
-5
6
5.7ADN
. Tm ging nhau là 19.
phc tp ca thut toán quy hong cho bài toán sp hàng ba chui
là
.
chui là O(
) vi
Draft version - Confidential
Giáo trình Nmôn tin sinh
89
n Ngôi sao 5.3.
ng ta
.
Ngôi sao
vào
so v
cho mc
vi các chui khác là ln nht.
)
5.6
t
Th5.2.
Thut toán Ngôi sao (Star)
D liu vào: Tp
n chui ADN
Yêu cu: S vi tng
ln nht.
D liu ra: chui
là chui
theo 5.6
gi s chui trung tâm
Gi
là
).
c 2: Lt sp hàng các chui
. Vii
vào c thc hi
Bt cp chui
chuc sp hàng
Draft version - Confidential
Giáo trình Nmôn tin sinh
90
3.1 c bt cp
.
i
thuc
c sp hàng mi
cha chui. Quy tc
chèn các chu
Nu mt du c chèn mi vào chui trung tâm
khi bt cp vi
, thì c ng trên chui
.
.
5.2
5.8ma trn
nuclêôtít .
nuclêôtít .
nuclêôtít .
1
2
3
4
5
6
7
8
A
A
T
T
T
T
T
T
104
T
T
T
T
T
T
G
G
80
G
G
A
A
T
T
T
T
80
5.8ADN
Thuc ti
là:
Draft version - Confidential
Giáo trình Nmôn tin sinh
91
Sp hàng các chui
Sp hàng
1
2
3
4
5
6
7
8
9
10
A
A
T
T
T
T
T
T
T
T
T
T
T
T
G
G
1
2
3
4
5
6
7
8
9
10
11
12
A
A
T
T
T
T
T
T
G
G
A
A
T
T
T
T
trên).
5.9.
1
2
3
4
5
6
7
8
9
10
11
12
A
A
T
T
T
T
T
T
T
T
T
T
T
T
G
G
G
G
A
A
T
T
T
T
5.9
phc t
O(
), v phc tp cc 2 là
.
án Ngôi sao là
.
Draft version - Confidential
Giáo trình Nmôn tin sinh
92
(aggressive alignment) 5.4.
5.4.1.
Hình 5.2
Hình 5.25
. Gi
.
:
.
Draft version - Confidential
Giáo trình Nmôn tin sinh
93
.
B
hai 5.4.2.
,
:
.
:
nuclêôtít .
nuclêôtít .
nuclêôtít
.
1
2
3
4
5
6
7
G
G
A
T
T
G
T
G
G
A
A
G
G
A
A
G
G
T
T
A
G
G
T
Draft version - Confidential
Giáo trình Nmôn tin sinh
94
:
sau:
5.4.3.
p hàng
.
.
; trong ví d trên là sp hàng hai chui
:
1
2
3
4
5
6
7
8
G
G
A
A
G
G
A
A
G
G
T
T
sp hàng
các
.
.
1
2
3
4
5
6
7
8
G
G
A
T
T
G
T
G
G
A
A
G
G
A
A
G
G
T
T
A
G
G
T
5.4.4.
5.3. 5.10.
Draft version - Confidential
Giáo trình Nmôn tin sinh
95
Thut toán sn
D liu vào: Tp
n chui ADN
Yêu cu: S
t.
D liu ra:
t
là chui
c sp hàng.
: t
n
hui.
.
i
cha tt c các chui cp hàng
.
5.3
Xét ví d tp bn chui
:
Quá trình sc minh h
1
2
3
4
5
6
7
8
G
G
A
T
T
G
T
G
G
A
A
G
G
A
A
G
G
T
T
A
G
G
T
G
G
A
T
T
G
T
G
G
A
A
G
G
Draft version - Confidential
Giáo trình Nmôn tin sinh
96
A
A
G
G
T
T
A
G
G
T
Cui cùng, b
G
G
A
T
T
G
T
G
G
A
A
G
G
A
A
G
G
T
T
A
G
G
T
5.10: M
phc tp ca thut toán sn là
n
.
5.5.
ghi
ng là
u ClustalW, và
lip.
5.5.1.
prôtêin hay ADN
1. ; t
.
Draft version - Confidential
Giáo trình Nmôn tin sinh
97
2. Các dòng tip theo s cha thông tin v i sp hàng. Mi
sc chi ra thành nhiu khi d liu. Mi khi d liu có cu trúc
:
dòng cha
thông tin . Các thông tin
sau:
.
.
); dài
Các kí nuclêôtít
có trong file.
nuclêôtít
ADN/axít amin
nuclêôtít hay axít a
IUPAC
(identical)nuclêôtít/axít amin
.
(conserved substitutions): axít
amin -.
-conserved substitutions):
axít amin
Hình 5.3
Draft version - Confidential
Giáo trình Nmôn tin sinh
98
Hình 5.3
lip 5.5.2.
ng
prôtêin ADN
hân loài. nh dng d lic mô t
1. u cha hai s ng chup hàng
dài cp hàng.
2.
chèn thêm các trng
các
3.
leaved).
Draft version - Confidential
Giáo trình Nmôn tin sinh
99
Hình 5.4
.
(interlequential)
Hình 5.4:
5.5.3.
c
Emboss
Maf
Mega
Metafasta
Nexus
Pfam
Stockholm.
Draft version - Confidential
Giáo trình Nmôn tin sinh
100
dùng
Hình 5.5
Hình 5.5
5.6.
Muscle.
5.6.1.
ClustalW Thompson
[4],
. ClustalW
ClustalW
phân
Hình 5.6.
Draft version - Confidential
Giáo trình Nmôn tin sinh
101
Hình 5.6
(Hình 5.7)
Draft version - Confidential
Giáo trình Nmôn tin sinh
102
Hình 5.7
ClustalW trên EBI
h sau:
.
C
Hình 5.8.
Draft version - Confidential
Giáo trình Nmôn tin sinh
103
Hình 5.8 ADN.
le 5.6.2.
Muscle
[5]. Muscle
(xem Hình 5.9)
Muscle nhanh
Hình 5.9).
Draft version - Confidential
Giáo trình Nmôn tin sinh
104
trong Hình 5.9)
Hình 5.9
Hình 5.9
Hình 5.10
www.drive5.com/muscle